当酒精撞上朋侪圈,人工智能该怎样主动辨认?-微信头条——每天精选深度的微信头条

Hi,欢迎来访微信头条——每天精选深度的微信头条,手机或平板直接输入fh1832c7.bget.ru也可浏览哦。

当酒精撞上朋侪圈,人工智能该怎样主动辨认?

来自 麻省理工科技评论 发表于 2016年03月26日19:28的微信文章


在临晨一点钟灌下一整瓶酒,然后给前男友或者前女友发往一条泪眼婆娑的Twitter。我们都知道,这么做挽回不了这段情感,就犹如我们知道喝酒和发朋侪圈组合在一路,凡是效果都不会太好一样。

?

然而总有这么一群率性的人,反重复复地做着这些无脑的事儿。面临这群人,来自罗切斯特年夜学(University of Rochester)的纳比尔?侯赛因(Nabil Hossain)和他的同事们萌发了一个有趣的设法。

他们已经教会了电脑怎样往辨认找出这些“酒后Twitter”。而且进一步展现了怎样使用这些数据来检测酒后的相干行动,以及这些行动的漫衍情形。这项事情意义重年夜,由于它可以资助我们明白酒精带来的民众康健题目,以便于我们找出应对之法。

侯赛因小组的事情基于两年夜手艺冲破:起首是经由过程盘算机的新算法让机械实时发明人们酒后发出的朋侪圈。接下来则是准确定位发朋侪圈的人是否是在家中喝酒。

为了建设新算法,研讨组起首网络了纽约市和美国北部疆域上的门罗郡(Monroe County,罗切斯特市也位于此处)停止到2014年7月的所有包罗地舆信息的Twitter。并从中滤出了包罗“酒精”等相干要害词的Twitter,例如“喝醉了”、“啤酒”、“聚首”等。

?

接下来,事情小组乞助了亚马逊土耳其机械人(Amazon’s Mechanical Turk, Mturk)供给的众包(crowdsourcing)办事,他们让三个土耳其机械人一路判定每条Twitter是不是和酒精有关,若是是,那么持续判定发的人是不是喝了酒。最后他们还让机械人判定Twitter的主人在发朋侪圈时是不是还在饮酒。

编者注:众包是一种特别的外包方法,它的界说是从一个群体,而不是传统外包意义上的个别获取设法和办事等,这种方法是基于互联的鼓起和普及之后才泛起的。亚马逊土耳其机械人就是一种由亚马逊公司供给的典范的众包办事,本文中土耳其机械人的办事应当就是把每一条Twitter转给人们,让人们做出自力判定,最后机械人再凭据年夜部门人的判定,而且把终极效果反馈给研讨小组。这是一种相似“网调”的历程,只是此刻完整可以由人工智能来完成了。

?

全部历程一共涉及了约莫11000条和酒精相干,而且带有地舆信息的Twitter,这些信息的数据量已经足以建设起一个新算法,让盘算机学会怎样找出“酒后Twitter”了。(有些遗憾的是,关于这些数据研讨的细节在所揭晓的论文内里没有说起,是以我们无从得知事情量到底有何等重大。)

接下来,事情进进了第二阶段,即回覆这个题目:这些“酒后Twitter”到底是何时何地被发出的?或者越发详细点说,这些人是在家里喝着小酒,发着朋侪圈,照旧在外面?

?

研讨小组一最先想了许多要领,试图经由过程人们发送的朋侪圈中的地舆信息来定位他们的室第。好比说:判断他们Twitter发送最多的所在就是他们寓所;又或者是判断天天发最后一条Twitter的处所为寓所;判断天天从破晓1点到早上6点发朋侪圈的处所是寓所等等。可是每种判断要领几多都有不靠谱的处所,让人难以完整信任。

侯赛因和他的同事们想出了个新措施,他们列出了一系列好比“终于抵家了”、“泡澡”、“沙发”、“电视”等人们最爱好在家里用的要害词。然后过滤出含有这些要害词的Twitter,再交给土耳其机械人判定这些推特是不是在家中发出的。

?

他们最后只保存了那些三个机械人都判定“是”的Twitter,以此作为判定“是否在家”的基准数据库来建设新算法。同时在这个新算法中还参加了其他的判断身分:好比天天发送最后一条Twitter的处所,发送Twitter最多的处所等等。

这种复合判断法要比单身分判断法精准的多。现在研讨组在定位Twitter发送者的寓所(周遭一百米规模)的正确率可以或许到达80%,这和之前比拟较已经强了太多。

有了“喝酒判断”和“寓所定位”这两项手艺,研讨组就可以得知人们何时安在喝酒了。于是他们比力了多数市(纽约)和城郊地域(门罗郡)人们的喝酒习惯。

研讨组把两个地域各划为100x100共计1万个小格子,然后标出“酒后Twitter”的格子,如许就形成了这两个地域的喝酒“热图”(heat map)。家中喝酒和外出喝酒被作了差别的标示。舆图上面还显示了每个地域的酒吧和有酒出售的市肆,如许研讨组就可以着手研讨“酒后Twitter”数目与“酒源”数目之间的关系。

最后的结论很有趣。侯赛因小组起首指出纽约人发的“酒后Twitter”要比门罗郡人多。“此中的一个诠释就是,纽约如许生齿繁密的都会可以买到酒、喝到酒的处所很是多,频仍的社交运动让各人喝了更多的酒。”侯赛因说道,“并且纽约人比拟门罗郡人更爱好在家里(或者说家四周100米规模内)饮酒,门罗郡人饮酒的处所,则凡是都脱离家1公里以上。”

热图上还可以看到有些“格子”里泛起的“酒后Twitter”多达五条甚至更多。“我们信赖这些‘格子’里产生了一些不平常的喝酒运动。”研讨者们这么说道。

喝酒的人数与本地的酒吧和卖酒的市肆数目也是正相干的。可是这激发了两者之间因果关系的疑问:到底是四周酒吧多了,人们就会变得越发爱饮酒,照旧爱饮酒的人群会主动涌到酒吧麋集的处所?固然,这个题目光凭此刻获得的数据自己是无法回覆的。

这项手艺的最年夜上风在于本钱低,速率快。在这两点上它完爆之前所有效来研讨人们喝酒习惯的要领。本来的要领年夜多须要细心的遴选研讨工具,然后让这些的研讨工具填写庞大的调研表,以便做进一步的数据剖析。

而借助了人工智能的新要领甚至可以举行及时监测。“我们的效果讲明,朋侪圈可认为我们研讨人们在都会中的行动供给有力且准确的线索。”研讨者们说道。

然而这里也要特殊阐明一下,在这项研讨中,因为网络的数据都来自于朋侪圈,是以它的代表性会局限于年青人和一些小世人群。这种局限性和误差在数据剖析要领中是很常见的。例如说,种种调研的效果凡是代表不了那些不肯意回覆问卷的人,如一些移平易近。寻找和制止取样造成的误差和局限性,是数据剖析要领中一个相当要害的部门。

侯赛因和他的同事们对这项手艺寄予了厚看。接下来要举行的研讨可以列一张长长的票据:好比酒精耗费量与人们的年事、性别、人种和其它方面的关系;周边情况对“酒后Twitter”的影响,例如说在朋侪家、运动场或者公园等;最后还要研讨喝酒者们在社区间的活动情形。

Twitter的社交功效也会对研讨很有资助。“我们会深刻喝酒者们的社交收集往研讨社交关系以及社交媒体是怎样影响他们的喝酒偏向的。”侯赛因和他的同事们说道。

所有这些研讨效果,终极都可以帮人们更好地舆解酒精带来的康健题目。每年在美国有75000人由于喝酒而殒命,酒精已经成为了美国的第三年夜可预防致逝世缘故原由。事关一条条鲜活的性命,侯赛因和他的研讨小组任重而道远。

投稿及互助请接洽:

anqizhao@techreviewchina.com

MIT Technology Review 中国年夜陆地域独家授权,

未经授权严禁转载及翻译。

存眷即将贸易化的手艺立异,

分享即将资源化的手艺创业。

长按二维码存眷:

上一篇 腾讯“空影YING”国内发布
下一篇 AlphaGo 之后,Google 还能给我们带来什么惊喜?
温馨提示如有转载或引用以上内容之必要,敬请将本文链接作为出处标注,谢谢合作!


欢迎使用手机扫描访问本站,还可以关注微信哦~