人工智能技术在美国新闻业的应用

中国经济传媒协会

2018-04-12 分享

新闻记者

人工智能技术在美国新闻业的应用 Original

2017年，美联社发布的《人工智能工作手册》将人工智能在新闻业应用最频繁的分支技术进行了归纳，包括机器学习、语言技术、语音技术、机器视觉和机器人技术。此外，人工智能技术和虚拟现实技术的紧密结合（AI＋VR）也是未来新闻报道发展的重要方向之一。通过案例考察，可以看到这些分支技术在日常新闻采编中发挥的具体功能。

（一）机器学习：印证假设和发现线索

机器学习（machine learning）是人工智能体系的核心技术，即让机器自己作出判断而不是得到如何判断的指令后执行判断的技术。机器学习依赖于被称作“深度学习”的过程，这个过程实质上是一种将复杂概念分解为一系列更小的、可执行的任务的方法，这种方法最终将机器导向完成复杂的终级目标。

机器学习涉及两个分支——监督学习（supervised learning）和非监督学习（unsupervised learning）。在新闻采编工作中，监督学习主要用于印证假设，而非监督学习用于发现线索。

1.监督学习：印证记者的报道假设

监督学习是指在记者已有假设的前提下，让算法根据假设来搜索、收集和归纳可以印证假设的信息。2016年，《纽约时报》金融新闻记者怀疑一个企业涉嫌本地贸易欺诈，但他们在怀疑确定之前又不能提供足够的人力来进行调查取证。于是，《纽约时报》成立了一个调查团队，先利用机器来帮助他们完成报道的前期信息搜集工作。这个团队利用监督学习将与怀疑对象相关的一切金融文件加上标签，并将那些可能提示该贸易涉嫌欺诈的信息突出显示。当记者团队把所有涉及这个企业贸易的信息输入系统，系统就可以同步将提示欺诈的信息和不提示欺诈的信息进行区分。同年，《华盛顿邮报》获得普利策新闻奖公共服务类大奖的新闻项目——警察持枪犯罪数据新闻也是通过监督学习系统建立了全美警察持枪犯罪数据库，并通过对数据的提炼和分析印证了该报长期以来的假设——“警察针对儿童和青少年的持枪犯罪率上升过快”。

2.非监督学习——发现潜在的新闻线索

和监督学习不同，非监督学习是将非结构性数据作为输入数据，并得出非目标性的输出结果。非监督学习系统可以自由展示输入和输出数据之间的关系，这种关系往往可以帮助记者在短时间内发现新闻线索。

《洛杉矶时报》体育报道团队在寻找周末棒球赛的报道思路时就成功利用非监督学习来发现线索。报道团队为系统输入所有周末棒球比赛票房数据，很容易发现一些隐藏的关系。系统可能找到“那些姓氏以元音字母开头的经理人负责的球队可能输掉早上的比赛，或者比赛日气温越低则比分越低”。美联社数据新闻团队运用非监督机器学习，从14万条人工输入的关于枪支泛滥的案件记录中找到了枪支滥用最典型的案件，还推算出如果案件涉及孩子或警察，那么犯罪人故意开枪的概率等线索。

（二）语言技术：推动新闻写作自动化

语言技术是人工智能系统的一个重要分支，其中，自然语言生成（natural language generation）和自然语言处理（natural language processing）已经对新闻写作产生深刻影响。

1.自然语言生成：推动报道的自动化和模块化

自然语言生成的报道将结构化数据转化成人们可阅读的叙述性文本。自然语言生成系统可以自己组织一些简单的语言，而且随着技术的升级，它组织语言的数量和规模越来越大。《洛杉矶时报》开发的地震报道机器人——Quakebot就是一款典型的用自然语言生成来报道突发事件的机器人。它可以生成模式化的句子：

一场××级的地震于××（何时）在××（何地）发生，强度××，烈度××，伤亡××，估计财产损失××。

Quakebot可以从美国地震观测局的数据库找到适合的数据来填写空白信息，并在地震发生后第一时间向社交媒体推送消息。

继成功发布机器生产的金融新闻后，美联社和旗下自动化新闻写作公司Automated Insights于2016年再次合作，利用自然语言生成全面报道了Minor League棒球赛。在这个案例里，持续的低水平的专业棒球报道可以完全移交给机器来完成。在这一系列棒球赛的报道中，美联社又迎来了赛事报道数量和精确率的升级。

《华盛顿邮报》的Heliograf也是业界一款著名的写作机器人。它主要通过自然语言生成迅速组织简单信息，只需要提前编辑好相关模板，以及文章中涉及的关键词，写稿机器人就能根据这些关键词自动生成语句。2016年里约奥运会期间，Heliograf开始报道奥运会比分、金牌总数等消息。在美国总统选举期间，Heliograf已经可以作出含有分析、评论等语气的报道了。

2.自然语言处理：探索更高层次的新闻写作

自然语言处理可以理解文本并找出前后文之间的联系。如果说自然语言生成善于“写”，那么自然语言处理就善于“读”。自然语言处理在新闻业务中的应用主要涉及读取大量文件、国际新闻编译和文本摘要提炼。

美联社和国际调查报道记者联盟联合揭露巴拿马造纸业黑幕的报道中，国际调查报道记者联盟必须读取上百万份文件，而每份文件包含众多公司名称、人名以及机构所在地的地名等。自然语言处理技术仅用几天时间就帮助该联盟从上百万份文件中找到不同名字间的联系。而对于一个记者来说可能要花几年时间才能在成千上万份文件中找到人与人或人与事件的隐秘关系。

自然语言处理在国际新闻编译方面也发挥着巨大作用。美联社提供的多国语言新闻服务就引入了自然语言处理技术。“美联社的目标不是要用自然语言处理系统替换人力新闻翻译，而是帮助人工翻译提高他们的产品质量，使得美联社的国际新闻能够更好地服务于中东地区、拉丁美洲和加勒比地区的新闻机构”，美联社国际新闻编辑Farr说，“输出环节毫无疑问仍然需要人工编辑把关，但自然语言处理系统在新闻编译的初稿成形阶段非常有用，它大大提高了美联社编译国际新闻的数量和质量”。

自然语言处理系统还可以理解文本的重点，并将重要的人名、地名和话题突出显示出来，因此它被广泛地运用于提炼文本摘要。上文提到的Agolo公司由哥伦比亚大学研究生创办并由微软资助，它擅长基于全文分析来提炼大型报告的摘要。Agolo首席技术官穆罕默德·安奥坦特威说：“Agolo的自然语言处理算法可以分析非结构化数据，包括新闻报道、报告、新闻通稿，并转换为摘要文本输出。”

（三）语音转换技术：将记者从初级任务中解脱

语音转换技术包括文本转语音（text to speech）或语音转文本（speech to text）两个方面。

1.文本转语音——用虚拟声音做播客节目

目前，亚马逊Echo语音处理机器人的接受度较高，很多新闻机构都加入了Echo支持的平台。Echo的工作就是将新闻机构提供的文本新闻转换为语音，并用虚拟合成声音以播客形式推送给用户。但是，文本转换语音的技术在某些方面还需要进一步改进，比如如何正确读取引号内的直接引语。美联社音频新闻部主任肯·罗马诺表示：“通常写给广播DJ读的新闻稿可以被更好地转化为语音，因为新闻稿本身就考虑到了广播播音的语法要求和声音文本传播的特殊要求，而机器在将文字稿转化为语音时会出现一些小的错误。”

2.语音转文本：用机器誊写采访录音

语音转换文本技术将音频格式作为输入数据，并找到与之匹配的文本数据输出，就像人们听写一样，机器需要将听到的每一个单词转换为准确的文字，最终形成连贯的文本。这项技术将记者从听写采访录音的初级工作中解脱出来。密苏里大学雷诺兹新闻研究所最近一项针对100多名记者的调查显示，记者平均每周花3小时做访谈，但却要花两倍的时间将访谈录音整理为文字。有了这项技术，记者就可以从繁琐的初级劳动中解脱出来了。雷诺兹新闻研究所未来实验室也正在开发一款语音转文本APP——Recordly，它的诞生就源于雷诺兹希望提高采访和写作效率的初衷。Vox也在运用一款叫做AutoEdit的开源软件来进行语音文本转换，包括为音频新闻加入文本说明，以及将音频新闻中的现场录音提炼出来作为吸引读者的链接文字。

（四）计算机视觉（Computer Vision）：捕捉肉眼难以看见的信息

人工智能技术支持下的智能设备还可以像人眼那样记录所见，甚至有时候能够推导出一些肉眼看不见的信息，这就是所谓的“计算机视觉”。在采编工作中，计算机视觉可以在拍摄对象之前就通过卫星定位判断最佳拍摄视角；可以帮助编辑快速分类、组织由图像和视频构成的大规模语料库，提升编辑效率，使记者更高效地从数据库中提取调查性报道所需的线索、证据和信息；还可以通过观察一些肉眼难以判断的表情来推断人物内心活动。

1.从摄影师无法切入的视角拍摄数量巨大的图片

美联社使用Digital Globe公司提供的高解像率图像来印证南亚海底存在大量非法捕捞容器，完成了揭露非法海鲜产业黑幕的报道，获得2016年普利策奖公共服务大奖。Digital Globe的计算机视觉技术依靠卫星摄像机从最佳角度来拍摄必要信息，可以最大限度地根据美联社报道团队的需求来完成拍摄任务。这种图像认知技术通过“神经网络”的机器学习方式来实现。神经网络算法通过模仿人类理解肉眼感知的图像来识别图像，将图像进行区块组合，只保留图像中能被肉眼提取和处理的信息元素，使用数学模型来复制人类视觉的这个过程，并通过算法对图像进行分层处理。

2.高效管理资料图片

Clarifai技术公司利用计算机视觉实现了自动描述图片和视频里的关键信息，比如位置、人物身份、地点和物品。这个技术可以提高编辑部图片管理的效率，并提高记者搜索资料图片的效率。

美联社产品经理本·尼徳勒表示：“计算机视觉可以非常迅速地处理数量巨大的新闻图片，选出最好的，丢弃不好的，同时，它可以为图片自动生成标签和图片说明。这彻底改变了美联社图片和视频的处理与检索，使这项工作的效率极大提高。”

3.从“微表情”中发现信息

计算机视觉识别报道对象的“微表情”功能也非常强大。哥伦比亚大学数据科学家阿米尔·伊曼尼认为：“就像一个孩子慢慢长大，逐渐学会看父母的脸色行事，这种行为实际上就是通过识别父母的不同面部表情来判断父母的心情。可以设想计算机视觉来做同样的事情，但是计算机首先需要三年的时间来学习一个人的面部表情传递何种情绪，之后它可以立即识别成千上万的面部表情，并迅速作出分类。”2017年1月，伊曼尼就运用自己团队设计的计算机视觉系统和Quartz记者一起对美国总统特朗普的就职演讲进行了报道。这个系统可以识别“微表情”，比如睫毛抬起表示惊讶的表情，并能将这些微表情和特定的情绪进行快速配对。他们利用计算机视觉对特朗普的面部表情进行识别，并推测出他发表就职演讲谈及某些敏感问题时的具体情绪。

美联社技术总监罗伯特·法尔认为，尽管美联社在机器学习技术方面取得了很大进展，但它仍然存在缺陷。比如这个系统的判断效果取决于主体的面部方向，证件照的识别效果最好；还取决于识别主体前面有没有遮挡脸部的障碍物，在新闻现场，人物前的障碍物是难免的，这会影响系统对于人物情绪的判断。

（五）新闻机器人（Robotics）：编辑部的新“员工”

机器人本身是硬件，它带有的软件及算法可以具备前述一切人工智能的功能。《纽约时报》和《华盛顿邮报》利用机器人辅助编辑部工作的实践比较丰富。

1.《华盛顿邮报》机器人员工以量取胜

2017年3月，在奥斯汀召开的网络新闻国际研讨会上，《华盛顿邮报》产品总监乔伊·马伯格介绍了该报目前机器人辅助工作的情况：“《华盛顿邮报》已经拥有近100个编辑部机器人，但99%都用于内部。”经典的机器人包括：

感觉机器人（Feel Bot）——用于问卷调查的机器人。2016年，美国大选结果揭晓前最后30天，《华盛顿邮报》将感觉机器人放在Facebook主页上。如果读者在该报Facebook政治页面中选择了这个机器人，它就会在晚上发送信息，询问读者对大选的看法，读者可从五个表情符号中选择一个作为回答。第二天早上，机器人就会把搜集到的人们的感觉和情绪用图表的形式向读者推送。

病毒传播“预测神器”（Virality Oracle）——这是《华盛顿邮报》在Slack平台上推出的一个“新员工”，它可以从报道发布的那一刻开始就对其进行监测，在报道发布后30分钟内，机器人就可以确定这个报道是否会达到病毒传播效果。然后，它就会通知编辑对文章进行修改。它还会创建一个24小时流量模型，让编辑部看清一个报道的生命周期。

催稿机器人（Marty Bot）——这款机器人专治记者“拖延症”。记者通常会设定报道预计完成时间，但截稿日期可能经常有变化。如果进度落后，这个机器人就会私信记者：可能接近或错过截稿日期了，既能提醒记者又不会让其感到被催稿的尴尬。

2.《纽约时报》聊天机器人以情动人

《纽约时报》的新闻机器人研发在重视功能和技术的同时，赋予它们更多人类的情绪化、幽默感、爱犯错、爱撒娇等特点。《纽约时报》的聊天机器人有不同的“人名”，当读者和它在手机上聊天时可能完全感受不到是在和机器说话。在奥斯汀的网络新闻国际研讨会上，《纽约时报》编辑安德鲁·菲尔普斯介绍了该报几款具有聊天功能的机器人：

Sam Manchester——《纽约时报》体育版“副主编”。它跟注册用户进行短信聊天，谈它对于比赛的见闻感受。Sam在奥运会期间发了这样的文字：“嘿！没有人在运动员村里吃饭。他们都去了麦当劳。所有运动员都去了麦当劳！这很疯狂，我很震惊！”这种文字一改《纽约时报》严肃刻板的形象，让读者觉得是和朋友在聊奥运。在里约奥运会期间，Sam向受众发了70条信息，3万人作出了回复。

Nick Confessore——《纽约时报》在大选中投放的“政治记者”（NYT Politic Bot）。为了保持人格魅力，Nick每天早上都需要撰写对话草稿，并以“探险式发问的方式”来反映他对大选的独特见解。这并不是《纽约时报》的声音，也不是所谓的“客观”的体验。大选期间，共有25万人与它互动。

Gilbert Cruz——《纽约时报》“电视编辑”。它的脑子里装着所有电视剧和电影的信息，而且性格友善。它通常并不只提出建议，还会通过提问来进一步了解受众，根据受众的回答，它会在“脑海”中建立受众偏好的元数据，再提出相关建议。

（六）人工智能＋VR报道

人工智能和VR看上去是两个不同的领域，虚拟现实技术的主要研究对象是外部环境，而人工智能技术则主要是人类智慧本质的探索。但Facebook旗下的虚拟现实公司Oculus首席科学家迈克尔·亚伯拉什对VR的定义是：能给我们带来与现实世界相同的视觉、听觉甚至触觉感受，才能算是真正的虚拟世界。而在此基础上，Facebook的CEO马克·扎克伯格则认为，有智慧的世界才是真正的虚拟世界。这提示了未来人工智能辅助VR报道的方向。

一方面，VR技术可以用来“调教”人工智能。微软开源了名为AirSim的高级虚拟现实训练系统——空中信息与机器人平台（Aerial Informatics and Robotics Platform），这个平台的主要目的是帮助开发者训练自己的人工智能适应各种现实环境中的场景。负责这项研究的阿什什·卡浦尔表示，在以往的AI学习中大多数的课题都会事先给定，而这个模拟器让AI去“思考”在一个现实世界中该如何活动。未来在新闻业的应用中则可以期待通过VR训练机器人记者来适应不同的现场报道环境。

另一方面，人工智能可以赋予VR新闻更真实的体验感。哥伦比亚大学Tow数字新闻研究中心研究员艾米丽·贝尔认为，人工智能与VR报道的结合可以让机器人记者成为更“智慧”的报道工具，可以独立思考完成复杂的分析工作，并在VR新闻的虚拟现实中创造具有“智慧”的虚拟世界中的新闻现场。

（本文摘自余婷陈实：《人工智能在美国新闻业的应用及影响》，阅读原文及学术引用，请务必参考《新闻记者》2018年第4期）

在这里，读懂转型中的中国新闻业

在这里，探讨新闻业的未来

在这里，进行深入而严肃的思考

在这里，关心新闻人自己的命运！

帮助

订阅《新闻记者》其实很方便——

您可以在邮局订阅，邮发代号：4-371，全年定价144元。

您也可以通过编辑部直接订阅，享受优惠价。订阅办法私信微信、微博小编，或电话021-62791234转324。

反向激励，在加速这个社会的黑化

2024【公共营养师】报名通道已开启，不限学历，23岁及以上可报!还能领2000补贴

Wealth | 中国成本轮金价涨势的前沿和中心

父亲出轨后，母亲对父亲实施了她的精确打击 | 二湘空间

多人约P大瓜！旧爱怀孕上线开撕，曝聊天记录！小白龙报警，官宣恋情！