查看原文
其他

特别关注前沿科技 2018-05-31
林鳞 编译整理
量子位 出品 | 公众号 QbitAI



这是一个由互联网催生的“杠精”充斥的时代,想必你一定遇到过。

回想一下,你在微博上针对问题提出看法,几小时后发现一队人马@你排队挑衅,他们奉行“只对人不对事”和“以抬杠为己任”的基本原则,试图和你吵架。

前方注意⚠⚠⚠,一大波杠精来袭。



请问客官,预防吵架的特效神器要不要了解一下?

近日,Google旗下的科技孵化器Jigsaw、康奈尔大学和维基媒体基金会合作,联合开发了一个预测谈话走向的AI系统。

这个系统能从一开始就能预测谈话是否会失控,想在对话能被挽救的情况下,尽早预防不必要的争吵,活脱脱一个“吵架预防器”。

检测元件

在今年ACL大会收录的论文Conversations Gone Awry: Detecting Early Signs of Conversational Failure中,Lucas Dixon和Nithum Thain等人通过分析维基百科中的讨论页面,收集了1207次谈话,当做训练数据。



其中,一半对话最终发展成攻击性言论,另一半数据仍然为礼貌交流。研究人员通过使用Jigsaw的Perspective API识别有害言论,并收集人类标注的标签作为数据集。最终,一组对话的平均长度为4.6条。

检测原理

至此,数据集☑。

随后,研究人员开始分析这些对话中的关键词有怎样的特征。

他们通过“表示礼貌的语用手段”将对话分类。这是一系列特征,并且与谈话的感情走向一致。无论是对话中包含友好的礼貌用语(比如“谢谢”、“请”等词语),还是表达了希望继续探讨的积极用语(比如“我认为”“我觉得”),它都能识别出来,并依此分类。

然后,研究人员分析了结果和最初的评论,看看他们的系统是否能学会预测将来是否会产生负面评论。



效果展示

当当当当,杠精预防发生器在一系列努力后终于完工。

研究人员做了一个测试,人类成功预测了大约72%的恶意对话,这个AI系统最终预测准确率达到61.6%。

此外,研究人员还得出了一些统计相关性,可以帮助人类和机器更好地发现那些容易出现攻击评论。“我们粗略发现,言语越直率,遭到个人攻击的可能性越大。”这一效应与我们的直觉一致,即太直接的表达暗示了交谈中潜在的敌意。

为了便于以后的探索,研究人员还将数据和代码整合,作为康奈尔会话分析工具箱的一部分。

附赠说明

对了,关于这个杠精预防发生器的更多说明,可以查看它的原理说明:

https://arxiv.org/abs/1805.05345

康奈尔会话分析工具箱地址:

https://github.com/CornellNLP/Cornell-Conversational-Analysis-Toolkit

对了,文中提到的Perspective API已上线,需要的话自取吧~

https://perspectiveapi.com/#/

虽然有吵架预防器的保护,还是要谨记八字箴言“珍爱生命,远离杠精”呀。



作者系网易新闻·网易号“各有态度”签约作者


诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存