@ 2014.08.21 , 11:21
16

芝加哥卫生部门用Twitter机器人查获不卫生饭店

[-]

昨天你在那家法国小饭馆吃的贻贝配炸薯条真是好吃,不过现在你却觉得有点搞笑,不,比搞笑更糟糕。实际上,你已经在厕所好久了,食物中毒的滋味一点都不好受。那么,知道了那家餐馆的食物不卫生,你会向谁道出真相呢?

许多城市都有市民热线电话,可以举报吃了餐馆的菜引起的食物中毒,但不是所有人都会打热线电话。芝加哥当局显然看到了这点,最近他们开始从Twitter上放出机器人,用特殊算法挖掘食物中毒的信息。芝加哥公共健康局通过派出Twitter机器人和在线投诉表,双管齐下下该局向133家餐馆进行了为期10个月的检察,结果其中21家餐馆没有通过检察,33家存在严重违规。结果还不坏。

目前波士顿市和纽约市的卫生管理们正在和芝加哥合作,研究如何将这套系统应用于自己的城市管理中。此外,Twitter不是唯一的可用社交网络平台,今年4月份纽约卫生局就报告通过对Yelp评论进行挖掘,来发现食物中毒的案例。纽约当局通过Yelp项目查获了三家不合格餐馆,结果发现这三家餐馆都有多项违规操作。而且在此之前这三家餐馆都没有被报道出存在此类问题。

芝加哥当局采用的机器人很简单,就是阅读Twitter的计算机程序。程序通过搜寻Twitter上地理位置信息为芝加哥和周边近郊并在其中提到“食物中毒”的帖子。这些帖子被送往人类员工那里进行相关性判断。人类员工会判断相关或者不相关,反过来也能促使算法提升抓取的准确度。下面是一个范例Tweet文回复的例子:

@BillWest5 ,听说你生病了,我们很抱歉。芝加哥卫生局可以帮助你。https://t.co/nVVNYltHj0
— Foodborne Chicago (@foodbornechi) August 15, 2014

链接指向的是一个名为“Foodborne Chicago”的在线表格,芝加哥的居民可以通过表格举报问题餐馆。

从2013年3月到2014年1月,芝加哥的Twitter机器人挑出了2241份Tweet文,其中有270份相关信息,并都给予了回复。有30名Twitter用户直接点击了芝加哥卫生局发送给他们的链接。此外,还有163人向Foodborne Chicago递交了投诉,但是工作人员不清楚这些人到底是从Twitter上还是从其他地方得知这个网站的。总的来说,在研究进行的这段时间内,芝加哥城中因违规而倒闭的餐馆中,Foodborne Chicago发现的数量占到了其中4%。

官方也表示如果没有Twitter机器人,他们可能永远无法截获大部分此类投诉。现在芝加哥的Twitter代码已经公开,可以在Github上查看。

本文译自 Popsci,由译者 王大发财 基于创作共用协议(BY-NC)发布。


给这篇稿打赏,让译者更有动力
支付宝打赏 [x]
您的大名: 打赏金额:

0.0
赞一个 (0)

TOTAL COMMENTS: 16+1

  1. 翠星石
    @3 years ago
    2517435

    微博也可以这样利用,给中国那些废柴一样的食药监部门找点事做

    [78] XX [0] 回复 [0]
  2. 没吃早饭
    @3 years ago
    2517439

    还是不吃饭比较安全,不怕食物中毒

    [10] XX [0] 回复 [0]
  3. 2517442

    目测会有人说“中国怎么不用网络查不卫生的餐馆?”

    [20] XX [1] 回复 [0]
  4. 一丝风度
    @3 years ago
    2517453

    Twitter是什么东西,没听说过的举手

    [2] XX [11] 回复 [0]
  5. 嗚哇~
    @3 years ago
    2517455

    就是明確告訴大家, twitter是有人監控的!

    [23] XX [9] 回复 [0]
  6. 说啥呢
    @3 years ago
    2517461

    被微博水军用来黑别人怎么办?

  7. pandadada
    @3 years ago
    2517466

    中国不能这样做,这会让我们全部饿死。

    [44] XX [1] 回复 [0]
  8. 东方
    @3 years ago
    2517473

    @翠星石: 一个区域性的分布式客户端平摊计算协议,对社交网络进行挖掘,有毒的饭店、有害的食品、恶意排污的工厂,匿名post到一个公布栏上上,要查看列表的人必须参与‘挖矿’的计算任务。设计有防止被恶意攻击或者有意刷分,会有自动检测刷好评的模式识别机制。最后评选出来的列表,有采用人工投票的算法再次过滤。一切都是匿名和分布式的,原理参照Bitcoin的分布式数据贮存,只要程序存在就绝不会被封。

    [13] XX [0] 回复 [0]
  9. chrischen
    @3 years ago
    2517481

    @嗚哇~ 你在Twitter上写东西还指望不被人看?

  10. 风大算吊
    @3 years ago
    2517496

    用微博试试看能不能找到找卫生的饭店

  11. 楚门
    @3 years ago
    2517525

    中国的话,别说指望卫生部门用微博分析大数据了,有时候直接举报都不一定有人鸟你

  12. severus
    @3 years ago
    2517545

    Feel Funny不是觉得有点搞笑的意思,而是感觉不舒服的意思

  13. 向上击打
    @3 years ago
    2517608

    哈,哈,哈,这家餐厅不卫生,求点赞求转载

  14. 2517745

    @说啥呢: 可以预防的,譬如最简单的方法是,给每一个发言计分,同一个用户针对同一个的地区的批评,无论多少条都只能计一分,复杂一点的话,同一个言论被不同转发,也只能计入被另外一个权重去抑制的分数。再复杂的话,时间密集度越高的言论,可以被当作水军的发言抑制函数抑制。最大似然估计选择器。贝叶斯学习。统计的方法模式识别算法太多了,水军也是有特征的,因为水军也要考虑时间和成本,举个例子,一千万个不同用户的言论分散在一年不同时期一天的不同时间不同地点发,这就不会是,假设存在那样规模的水军的话,被提交的网络握手协议限制,那么至少存在着一个运营着千万级别的客户端,然后我们算其中的费用,这个成本超于其假设的运营费用的时候,我们就知道这种数据分布就不是水军了。恰当的设置数学模型,把水军的影响降低没有问题。

  15. 2517903

    看大众点评网就知道了

  16. 呵呵
    @3 years ago
    2518287

    @一丝风度: 呵呵,嘲諷失敗,s逼

发表评论


24H最赞