Jack Clark AI前线
译者 | 核子可乐
编辑 | Debra,Natalie
AI 前线导读:

- 康奈尔大学、谷歌与维基媒体的研究人员训练人工智能,预测网上骂战
- 匹兹堡大学与腾讯 AI Lab 用深度学习 + 蒙特卡洛树搜索打赢《王者荣耀》
- 图灵奖得主发言:目前的人工智能只是曲线拟合而已
- 谷歌公司准备推出自动电子邮件服务“Smart Compose”
- 白宫计划建立人工智能专委会
- 民主党代表呼吁建立国家人工智能发展战略
- 宝马利用递归神经网络引导汽车完成变道
- 百度宣布陆奇卸任 COO,将继续担任李彦宏个人顾问
- 特斯拉上海建厂,注资 1 亿
- 微软收购伯克利创业公司 Semantic Machines
- 微软谷歌再曝 CPU 新漏洞,Intel、AMD、Arm 全部遭殃

更多优质内容请关注微信公众号“AI 前线”,(ID:ai-front)

康奈尔大学、谷歌与维基媒体的研究人员训练人工智能,用于预测人类用户何时会在互联网上歇斯底里

网络是一个很容易引发骂战的场所,经常上网的各位很可能已经养成了一种惊人的敏锐嗅觉——能够准确发现一些充满火药味的评论且不予回复,因为直觉告诉我们这家伙纯粹就是为了吵架而来。那么,我们能否训练人工智能系统实现类似的预测能力,并靠它标记出那些有可能最终转变成骂战的对话?康奈尔大学、Jigsaw 以及维基媒体基金会为此进行了最新研究,希望以“Wikipedia Talk”页面的讨论内容数据集为基础,教会人工智能及早发现那些情绪不稳定的家伙。

数据集:为了进行实验,研究人员们共收集了 1270 次对话,其中有一半在交流后期陷入对喷,另一半则始终较为平和。(相关对话由 Jigsaw 方面的“Perspective” API 收集而来,而相关标签则通过 CrowdFlower 以众包形式实现。)这些对话的平均长度为 4.6 条评论。

工作原理:凭借这套数据集,研究人员们通过其构建的“真实设备表意礼貌”机制对对话内容进行描述。该机制属于一组判断准则,用于分析对话内容是否包含友善性特征(例如使用大量‘谢谢’或‘请’等字眼),以及是否包含表示欢迎辩论立场的词语(例如‘我认为’、‘我相信’等短语)。此后,他们开始借此分析真实评论,看自己的系统到底有没有学会预测只言片语中流露出的吵架意向。

结果:在对数据集中的争吵对话进行预测时,人类的判断准确率约为 72%。而研究人员们设计出的人工智能系统(单纯依赖于逻辑回归)可实现约 61.6% 的准确率,且基准判断(即基于词袋模型与情感词典)约占 56%。(此项技术的另一变体获得了 64.9% 的准确性,但其训练数据量更大,所以并不一定能说明问题。此外,考虑到其使用同一套训练语料库,目前也不清楚这一变体是否存在过度拟合。)研究人员还推导出一些统计相关性结论,能够帮助人类与机器更准确地发现容易变成骂战的评论。“我们发现直接的表达与人身攻击之间存在着一种粗略的对应关系。具体来讲,直接加以反问或者以第二人称开头的评论往往更容易把讨论双方的负面情绪激发出来。这种效应与我们的直觉判断保持一致,这意味着双方的直接性对话可能令人感到一些潜在敌意,或者说是加强了争议的客观存在。”

为何值得关注:这类系统展示了如何利用相对较少的数据建立分类系统。只要与正确的特征匹配起来,我们就能够有效对网络上的微妙人际交互进行分类。虽然这样的系统在出发点方面似乎是为了保障社会利益(例如准确识别并积极避免过于激进的对话),但其出现也可能被用于发现持相反政治观点的对象,甚至被用于追踪各类异见者。值得庆幸的是,论文本身也对这一点作出了阐述。

了解更多

https://arxiv.org/abs/1805.05345

中国研究人员利用深度学习 + 蒙特卡洛树打赢《王者荣耀》

现代多人战略游戏正成为强化学习与多代理算法的重要测试平台。继 Facebook 与 DeepMind 利用《星际争霸》两代版本进行 AI 测试,以及 OpenAI 主攻《Dota》之后,匹兹堡大学与腾讯人工智能实验室的研究人员们则发布了其利用腾讯公司开发的一款多人在线竞技场(简称 MOBA)游戏——《王者荣耀》评估人工智能技术的详尽信息。而这套人工智能系统则利用蒙特卡洛树搜索(简称 MCTS,DeepMind 在冲击围棋游戏时同样运用到这一技术),并将 AlphaGo Zero 的强化学习能力与“原有蒙特卡洛树结合起来,以生成更强大的树搜索能力”。在论文中,研究人员们写道,“我们提出的算法是一种可得到明确证明的、AlphagoZero 算法的近最佳变体(专指特定方面,亦拥有一定的泛用性)。”

结果:研究人员们在《王者荣耀》中测试了他们的技术,并对其技术训练出的代理以及游戏内 AI 控制代理进行了直接比较。此外,研究人员们还对相关技术的四种变体作出测试,具体包括:no rollouts; 使用直接策略迭代 ; 实现近似值迭代 ; 通过监督式学习利用 10 万种状态下的人类游戏玩法数据进行训练(亦作为此系统的简化测试方法)。这套系统最终击败了全部竞争对手,而与其差距最小的竞争对手正是 no rollouts——即最接近于 AlphaGo Zero 的方法。

相关思考:在解决此类难题时,研究人员们仍然倾向于利用大量人工选择的特征对 AI 系统进行训练。换言之,算法本身无法自动推断最佳输入内容并从中学习。论文写道,“该系统的状态变量被视为一个包含大量来自游戏引擎的直接信息的 41 维向量,其中包括英雄位置、英雄血量、仆从血量、英雄技能状态以及相对于各类结构的对应位置。”研究人员会将相当一部分精力用于选择输入内容,并尽可能调整超参数以表达任何特定输入内容的重要性。也正因为如此,我们很难确定人类的指引在这类项目当中到底发挥了多大的作用。

为何值得关注:这篇论文再次表明人工智能研究人员将越来越多地利用高级游戏测试及评估人工智能系统。而作为来自中国人工智能实验室的研究项目,这亦表明中国研究机构开始与西方实验室一样尝试解决类似的大规模问题。

了解更多

https://arxiv.org/abs/1805.05935

图灵奖得主发言:目前的人工智能只是曲线拟合而已

…Judea Pearl 对于深度学习获得的成绩表示高度关注,但担心研究人员们放弃探索其中的因果关系…

图灵奖获得者 Judea Pearl 担心人工智能行业对深度学习技术的过分痴迷,终将导致其忽视更为核心的难题——例如真正开发出能够构建真实因果模型的机器。他在采访当中表达了自己的担忧,同时也提到了自己的新书《The Book of Why: The New Science of Cause and Effect》。

具体内容参见 AI 前线之前发布文章:《AI 先驱 Judea Pearl:机器人一定会有自由意志》

了解更多

https://www.quantamagazine.org/to-build-truly-intelligent-machines-teach-them-cause-and-effect-20180515/

谷歌公司准备推出自动电子邮件服务“Smart Compose”

谷歌公司的研究人员们概述了其开发的“Smart Compose(智能撰写)”技术。作为 Gmail 中的一项新服务,用户可以利用其自动撰写邮件内容。Smart Compose 主要基于词袋模型外加递归神经网络语言模型。这套技术组合能够在“略微牺牲模型预测质量的前提下,将系统的速度水平提升到 seq2seq 模型之上”。其组件的简单程度同样令人惊讶,这意味着在可扩展技术与海量数据集的支持之下,简单的组件也能够实现强大的能力。谷歌公司表示,通过将大部分计算任务转移到 TPU 上,系统的延迟水平将降低到数十毫秒水平——这显然能够满足一般用户要求延迟不高于 100 毫秒的常规要求。

了解更多

https://ai.googleblog.com/2018/05/smart-compose-using-neural-networks-to.html

白宫计划建立人工智能专委会

白宫方面最近举办了美国业界人工智能峰会,希望汇集来自业界、学术界以及政府机构的专业人士,共同讨论如何在美国本土支持并推动人工智能技术发展。科学与技术政策办公室在发布的会议纪要当中,着重强调了美国政府在人工智能方面采取的一系列举措——包括提高白宫通信体系中的人工智能战略地位,计划将人工智能技术引入国家防务与国家安全战略范畴,并由管理与预算办公室(简称 OMB)为各机构提供指导等等。

人工智能专委会:白宫将建立人工智能专委会,主要由“联邦政府高层研发官员”组成,负责主办人工智能与行业专家间的高峰会议,同时强化对相关技术的监管工作。该委员会将向白宫提供相关建议,促进与业界及学术界间的合作,加强联邦政府在人工智能研发领域的协调能力,同时确定利用政府数据及计算资源支持人工智能的具体方法。该委员会将与白宫科技政策办公室(简称 OSTP)、国家科学基金会、国防高级研究计划局、IARPA 主任等各方开展协作。根据章程,该委员会亦可与私营部门建立合作关系。

条例:白宫科技政策办公室副首席技术官 Michael Kratsios 表示“我们的政府并不打算树立假想敌,并最大限度地保证科学家和技术专家在美国研究的自由,并表示不会因“潜在负面后果或者负面国际影响的恐惧感而束缚自身在技术领域的发展能力。”

为何值得关注:纵观整个世界,各国都在积极制定与人工智能相关的广泛国家战略。法国目前的人工智能投资数额在国际上一路领先,而中国(这主要是由治理结构决定,中国的政体设计使其在科学与技术发展层面的投入远超西方世界)亦计划额外划拨数十亿美元用于人工智能技术研发。考虑到这一技术当中蕴藏着巨大的机遇,且能够带来明确的投资回报,因此美国目前将人工智能开发工作留给私营部门的战略是否适应时代要求仍然有待观察。此外,美国在人工智能生态系统方面也存在一些问题,且短时间看很难得到解决——例如学术界内的顶尖人才成为各大技术企业的争夺对象,人工智能学科的本科与研究生规模正在激增,博士申请者数量大幅上涨并导致美国的人工智能教育质量快速下滑。

了解更多

https://www.whitehouse.gov/wp-content/uploads/2018/05/Summary-Report-of-White-House-AI-Summit.pdf?latest

美国民主党代表呼吁建立国家人工智能发展战略

美国国会议员 John Delaney(马里兰州)撰写了一篇专栏文章,呼吁美国政府应尽快建立国家人工智能发展战略,参与并发起了一项法案(连同多位共和党与民主党众议员及参议员),要求建立专项委员会以制定战略细则。此项法案被定名为《人工智能未来法案》。

节选内容

– “美国需要全面评估国内的研究与技术状况,同时判断短期与长期内面临的问题与机遇。”

– “无论采取保守抑或进步的态度,人工智能代表的未来终将来临。着眼于整个世界的发展方向,我认为我们需要扩大对研究领域的公共投资、鼓励公共与私营部门间的合作活动,同时确保人工智能的部署方式与我们的价值观以及现有法律保持完全一致。”

–“如果美国不采取行动,将面临着在竞争中落后的危险。”

为何值得关注:无论是为公民提供更好的医疗卫生与无障碍服务,还是利用同样的技术实现监控以及其它国家安全目标,全球各国在社会层面都因人工智能的部署而发生着变化。因此,着眼于整体人工智能领域并建立起一种能够在国家之内整体实施的发展计划,确实是一项直观且具有现实意义的工作。美国国内应该推行一系列补充性举措,从白宫科技政策办公室支持的针对性行动到参议院或政府机构的支持计划,再到其它各方的广泛分析皆在此列。

了解更多: 法国、中国与欧盟皆拥有人工智能战略,为何美国还不行动?(Wired Opinion)。

https://www.wired.com/story/the-us-needs-an-ai-strategy/?mbid=social_twitter

宝马利用递归神经网络引导汽车完成变道

宝马汽车公司与德国慕尼黑技术大学的研究人员们目前正在进行粗略模拟,希望利用 seq2seq 教会汽车安全变换车道。他们选择了具有长期 / 短期记忆的双向递归神经网络(简称 RNN)作为实现手段。该记忆系统能够在任意时间点预测汽车及周边载具的先进速度,而后通过预测功能判断汽车能否安全切换至另一车道。

结果: 这套系统利用 NGSIM 数据集进行评估。NGSIM 数据集是一套于 2000 年初采集自洛杉矶真实交通流量监控结果的详尽数据集。虽然在质量上高于其它基准数据集,但由于适用领域存在严重的局限性,因此目前我们还无法将其与汽车厂商开发出的其它(秘密)系统的效能作出直接比较。此外,由于缺乏与汽车模拟方案的深入整合,因此我们也很难判断其模拟结果是否足以指导真实场景下的驾驶活动。

为何值得关注:无论全自动驾驶汽车技术的整体成熟度如何,必须承认的是如今的汽车产品在自动化程度上已经迎来全面提升。此类论文的出现,再一次强调了由非人工智能社区内非车厂参与方开发组件,从而充实自动化水平日益上升的车载系统的发展理念。

了解更多: 汽车变道行驶规划情景评估:递归模型与预测能力的结合(Arxiv)

https://arxiv.org/abs/1805.06776

百度宣布陆奇卸任 COO,将继续担任李彦宏个人顾问

5 月 18 日,百度宣布集团总裁兼首席运营官陆奇由于个人和家庭原因,无法继续全职在北京工作,将从 7 月起不再担任上述职务,但仍将继续担任集团公司副董事长,王海峰升任高级副总裁。

5 月 21 日,百度召开内部交流会,陆奇首度露面与百度员工进行了沟通,并宣布将担任李彦宏个人顾问。

特斯拉上海建厂,注资 1 亿

5 月 14 日,据国家企业信用信息公示系统消息,特斯拉(上海)有限公司已于 5 月 10 日获上海浦东新区市场监管局核发的营业执照。

特斯拉(上海)有限公司注册资本 1 亿元,股东为特斯拉汽车香港有限公司,公司成立日期为 5 月 10 日。该公司法人代表为特斯拉中国区总裁朱晓彤。特斯拉在中国建成了近 40 座超级充电站,并在全国 60 多个城市建成超过 600 个目的地充电桩,朱晓彤在其中发挥了重要作用。

微软收购伯克利创业公司 Semantic Machines

5 月 21 日,微软宣布收购对话系统创业公司 Semantic Machines。这家公司由 UC Berkeley 教授 Dan Klein 与斯坦福大学教授 Percy Liang 等人共同创立,已开发出用于构建交互式 AI 系统的革命式新方法。他们的研究利用机器学习的力量让用户通过更加自然的方式发现、获取信息与服务并与之互动,而且耗费的资源显著降低。对于微软来说,Semantic Machines 的技术或许将在语音合成、深度学习和自然语言处理等方面帮助其与亚马逊 Alexa、苹果 Siri 和三星 Bixby 进行竞争。

微软谷歌再曝 CPU 新漏洞,Intel、AMD、Arm 全部遭殃

近日,微软和谷歌的研究人员又发现了现代处理器中存在数据泄漏风险的 Meltdown-Spectre 安全漏洞第四种变种 CVE-2018-3639,被称为推测性存储旁路(speculative store bypass)。

在安全系数较低的电脑或设备上,这些推测性执行设计缺陷可能会被恶意软件攻击并利用,或通过非正常登录系统,从内核或应用程序内存慢慢提取隐私信息,如密码等。

目前,英特尔、Arm、AMD 等公司作出回应,称将发布新的微码和软件调整,以更全面地应对利用第四种变体的恶意软件,并给出了相应的缓解措施,参见 《微软谷歌再曝 CPU 新漏洞,Intel、AMD、Arm 全部遭殃》

作者 Jack Clark 有话对 AI 前线读者说:我们对中国的无人机研究非常感兴趣,如果你想要在我们的周报里看到更多有趣的内容,请发送邮件至:jack@jack-clark.net。

原文链接:

https://jack-clark.net/


AI前线
紧跟前沿的AI技术社群

如果你希望看到更多类似优质报道,记得点个赞再走!

┏(^0^)┛明天见!

    Read more