查看原文
其他

增强新闻的未来 ——智能机器时代的新闻编辑室指南

2017-11-05 马可尼、西格曼 腾云

弗朗西斯科·马可尼

(Francesco Marconi)

美联社战略规划和发展经理,哥伦比亚大学数字新闻中心创新研究员

 

亚历克斯·西格曼

(Alex Siegman)

哥伦比亚大学新闻学院硕士生

 

“机器记者”(ai)(各种人工智能系统的总称)

 

作者提示

 

“增强新闻的未来”报告是两个人和多个人工智能系统之间的合作的结果。智能机器扩充的部分将用“} ai”符号注释。


这份报告的洞察来自与数十名新闻、技术、学术和创业领域的专家的访谈。所得到的见解使我们能够探索人工智能的方式,并可能用来增强新闻。


我们希望向读者呈现必要的基本工具和专业知识,让读者在未来自己的编辑室实施人工智能时做出明智的决定。

 


2013年夏天,美联社的新闻部门领导人向业界同仁提出了大胆的建议。他们建议与人工智能领域一家令人兴奋的创业公司达成协议,自动生成某些新闻内容。几个月后,与北卡罗来纳州达勒姆的Automated Insights公司的交易达成:首先在体育新闻,此后又在公司财报报道中,直接从数据中自动化生成叙述性文字报道。


是的,你看到的没错。美联社的记者最先建议将一些工作交给计算机程序——机器人(如果你愿意这么叫的话)。或许表面看起来略有些讽刺,这个举动被证明是该机构对抗业务两大趋势的关键所在——要覆盖报道的新闻不断增加,而相应报道这些新闻的人力受限。


理顺流程,精减低层工作,处理更多的数据,挖掘洞察和生产额外的新闻,美联社自从几年前第一次实验将智能机器用于新闻工作以来,以上这些只是所产生的少数巨大成果。


美联社并不孤单。整个新闻行业的创新者正在与技术公司和学术研究人员合作,推动一系列相关领域的发展,影响到新闻价值链的各个方面——从新闻收集到生产和分发。

正如你将在下文中看到的,人工智能可以做的不仅仅是简单的体育简报和企业财报新闻。它可以让记者分析数据,从多个来源识别出模式、趋势和可行的见解,看到肉眼看不见的东西,将数据和言语转成文本,文字转换成音视频,了解情绪,分析对象场景、面孔、文字或颜色,等等。


广泛而言,人工智能有望在未来的岁月里给新闻报道带来许多回报。更强的速度、准确性、规模和覆盖的多样性,只是媒体组织已经看到的一些结果。


当然,这一新的技术创新浪潮与其他任何技术创新无异。成功仍然依赖于人类记者如何实施这些新工具。人工智能是人造的,意味着在制作传统新闻内容时所考虑的所有伦理、编辑的和经济的影响,仍然适用于增强新闻(augmented journalism)的新时代。

为了最有效地利用和负责任地在新闻中使用人工智能,第一步是了解技术本身。这份报告是为了这个目的,以及激发更多关于这场运动将走向何方的讨论。

 

什么是增强新闻?

 

首先,有一些术语要搞清楚。在一个非常基本的意义上,这一切都是关于“自动化”——从新闻记者们为得到新闻和向大众发布消息而必须承担的许多琐事中减少人们的投入和挤出时间。 


但是,新闻行业中的这种新的自动化浪潮,现在包含了许多通常被称为“人工智能”的形式,或者如果你想要比这更令人极客的说法——“认知技术”。


结果是机器在新闻的花园里,而且自己在思考。而这种思考或智能处理对新闻工作的投入和产出都有帮助。


关于人工智能如何影响记者的投入方面的具体例子,想一想ICIJ。在两年里,ICIJ指导一个近400名记者的团队,对大约2.6亿字节的泄露电子邮件、文件和数据库进行分析,得到的成果是“巴拿马文件”。


ICIJ在研究开始时没有使用任何人工智能,但该组织的网页应用程序开发人员马修·卡拉昂·加拉齐亚(Matthew Caruana Galizia)希望他们用了。“我们正在处理大量的文件,而ICIJ没有资源调查这些文件,” 加拉齐亚说,“但是通过使用人工智能,我们将能够使所有涉及的记者的进程更快,并得到相同的结果。”


ICIJ数据和研究部门的朱利安·马丁(Julien Martin)表示,一旦他的团队能够利用人工智能,记者就可以通过扩大现有的技能来做比以往更多的工作。马丁说:“我们不希望人工智能制造证据,我们是在增强记者的工作。”


换句话说,ICIJ正在实践增强新闻。它正在利用人工智能使其记者能更大规模和更准确地报道新闻。


在输出端,美联社一个企业财报报道自动化的项目,提供了一个开创性的研究案例。历史上,投入巨大人力尽可能多地报道上市公司收益报告,美联社的金融新闻报道的记者每三个月都要累得不行。我们稍后将会详细介绍,三年前推出的一个自动化计划,使得该机构能够将其每季度的企业财报报道数量增加一个数量级,实际上实现覆盖整个美国股票市场。


与任何新的、有影响的技术一样,大规模采用会伴随着群众混乱,更多的时间是异议。

希腊哲学家苏格拉底曾经抗议任何允许人们以书面方式表达自己想法的技术,声称“书面文字是记忆的敌人”。


几个世纪以后,德国加密学家约翰内斯·特里米修斯(Johannes Trithemius)大声疾呼,印刷机将对负责誊写宗教文本的僧侣的诚实性造成不利影响。打字机甚至现代文字处理器也有他们的怀疑者。


现在,增强新闻也有类似的争议。

 

苏格拉底会说什么?

 

与增强新闻有关的三个主要问题是:不受约束的算法新闻生成的内在风险,工作流程颠覆的可能,以及管理这个新专业领域所需技能的差距。

 

1.不受约束的算法新闻生成的相关风险

 

想象一下,一组环保记者团队正在追踪石油钻探与森林砍伐之间的相关性。该团队不确定将这个故事重点放在世界哪个地方,所以它使用人工智能来研究在附近钻井活动之后经历了快速森林砍伐的土地。


我们的假设,团队首先通过向其人工智能系统“喂食”一系列卫星图像,系统知道这些图像代表石油钻探造成的森林砍伐,以及一系列它们知道不代表石油钻探导致森林砍伐的卫星图像。使用这个训练数据,机器应该能够看出一张新的卫星图像并确定描绘的土地是否最终令记者感兴趣。


该系统审查训练数据,并输出四个位置的列表,机器证实说肯定表明附近钻井活动造成了快速森林砍伐。但是,后来当团队实际访问每个位置采访新闻时,都发现森林砍伐不是由钻探造成的。在某个情况下是大火,在另一个情况下是一家木材公司的原因。


看来,在审查训练数据时,系统教会自己确认一个快速砍伐森林的地区是否靠近山区,因为记者用作训练数据的每一幅图像在照片中都有山脉。钻井没有被考虑进去。如果团队知道该系统是如何学习的,那么它就能够避免这样的错误。


谷歌创建的技术孵化器Jigsaw的沟通负责人丹·肯瑟琳(Dan Keyserling)解释了最重要的担忧——算法容易产生偏见,就像人类一样。


肯瑟琳说:“我们需要以在新闻报道中处理事实同样的谨慎来对待数字。他们需要被检查,他们需要被确认,他们的背景需要被理解。”


美联社前标准与伦理编辑汤姆·肯特(Tom Kent)甚至发表了使用机器人新闻的一个清单。列在该列表的开头的是要在所有其他问题之前考虑的问题:“底层数据有多准确?”

Jigsaw使用人工智能来解决地缘政治问题,不得不考虑每天用人工智能创作新闻报道所输出的影响。


肯瑟琳说:“Jigsaw思考很多的是,我们如何理解和减轻创建机器学习模型的潜在偏见。”

正如验证消息源的可靠性一样重要,也同样重要的是考虑一个人工系统的可靠性。

 

 2.工作流程颠覆的可能

 

实施任何新系统将破坏传统现有的新闻编辑工作。这些变化并非翻天覆地,但是在新闻编辑室中实施人工智能时,要对这些变化心中有数。


同时,每个工作都由独特的各方面组成,其中一些可以比其他方面更容易自动化。


想想巴拿马文件涉及的新闻工作。筛选数百万个文件是乏味的,可以轻松自动化,但是机器不能看出两个组织之间的联系,并想到“这不正常”,发出适当的警告,与适当的人交谈,进行必要的调查工作,以产生任何实质性产出。


这意味着记者在人工智能辅助的新闻编辑室中,日常工作可能会改变。记者可能会花费更少的时间整理录音和手动流览数据,而是把这些时间用来打电话,跟进从人工智能分析得出的线索。


美联社已经亲身见证了在新闻编辑室中使用人工智能重新定义新闻工作者角色的影响。


美联社在2014年开始使用算法自动来生成财报报道,估计这个做法已经释放出20%的记者时间,让这些记者能够从事更为复杂和定性的工作。


美联社全球商业编辑丽莎·吉布斯(Lisa Gibbs)说:“通过自动化,美联社向客户提供了是以前12倍的公司财报发布报道(超过3700篇),其中包括许多从未受到什么关注的非常小的公司。


“利用这些释放出来的时间,美联社记者可以参与更多的用户生成的内容,制作多媒体报道,追踪调查报道,并专注于更复杂的新闻。” 吉布斯补充说。


同时,自动化程序本身也需要维护和监督。新闻模板由有经验的美联社编辑以自动输出来制作。特别的数据流由第三方提供商设计以提供给模板。


这些组件需要继续维护,因为基本的公司信息将按季度变化,尽管这些新闻是直接在美联社的通讯上生成和发布,而无需人为干预,但记者必须注意任何错误并进行更正。

在这种情况下,最少工作流程变得更好,但是与以前极为不同。

 

3.技能差距越来越大

 

那么,一个人工辅助的新闻工作者应该有什么个人特质呢?


首先也是最重要的是愿意合作。与数据科学家和计算机记者(computational journalists)工作良好的记者,在人工智能辅助的新闻编辑室中立于不败之地。


什么是数据科学家?什么是计算机记者?


数据科学家是具有技术能力,能实施增强新闻必需的人工智能系统的个人。他们主要是科学家,但他们对什么是一则好报道和什么是好的新闻工作有了解,他们知道如何与记者沟通良好。


受过美联社数据小组记者培训的数学家拉里·芬恩(Larry Fenn)表示:“将科学带入新闻编辑室是非常重要的,因为良好科学的标准——透明度和重复性——在新闻工作中十分契合。”


计算机记者主要是记者,但他们对人工智能如何工作,以及如何利用人工智能来增强自己的新闻有一个了解。也许最重要的是,他们知道如何与数据科学家沟通良好。


纽约时报的首席技术官尼克·洛克威尔(Nick Rockwell)表示:“我们已经投入了大量的努力,将更多有编程技能的记者投入新闻编辑室。”


赫斯特(Hearst)是全美最大的多媒体、信息和服务公司之一,最近宣布创立了原生和新兴技术部门。在运营部门确定未来自己的各个业务线将受到影响的领域,该部门将负责推出数据驱动产品,包括人工智能、语音接口以及增强和虚拟现实。


赫斯特新兴技术执行总监克里斯·帕帕里奥(Chris Papaleo)相信,智能机器将在最底层推动变革:“赫斯特认为,人工智能是将帮助我们在个人计算趋势下一波浪潮中行动的共同的主线。除此之外,我们通过扶持这些项目开发的技能和专业知识,可以在其他业务中利用,而不仅仅是在研发实验室里。我们可以开发模型来帮助改善业务运营,如人才招聘和留用,管理预算等。这是我们作为一个行业正在加入的变革浪潮。”


帕帕里奥补充说:“我们正在积极鼓励所有部门的负责人把AI原则牢记于心。在技术的这个早期阶段,建立专业知识和未来能力的最佳方式是将时间和精力用于培训和试验。”


传统记者需要了解多少科学、数学和计算机编程,才能最好地与这些数据科学家和计算机记者进行交流?实际上并不多。


事实上,人工智能辅助新闻编辑室的每个人都很容易合作。记者、数据科学家和计算机记者,都是讲故事的人。他们最终都以一种有吸引力和可消化的形式向读者传递信息。他们之间唯一真正的区别是他们用来讲述这些故事的媒介。

 

这个领域的相关技术有哪些?


每个AI的独特细分领域都为新闻记者增强工作提供了机会。 本报告将涵盖在不久的将来与新闻业最相关的领域。



机器学习

 

几类人工智能系统的核心是机器学习——AI的一个子域,它解释了一个系统如何自动调整,而不用被告知做什么调整。

 

机器学习又依赖一个被称为深度学习的过程。深度学习是一种将复杂思想分解成一系列更小、更容易处理的任务,最终导向指定目标的方法。


哥伦比亚大学的数据科学家阿米尔·艾玛尼(Amir Imani)解释说,要让机器学习,他们需要被训练,“在孩子们长大并学习如何认识和理解父母的面部表情时,他们通过不断地面对父母的脸孔——看他们的脸,识别他们的语气。”


“想象一下算法做同样的事情,只不过不是花三年时间才能了解一个人的面部表情是如何传达某种情绪的,机器学习算法一次可以看完成千上万的图像,并尝试对它们进行分类。”


2017年1月,艾玛尼在利用这种机器学习,和Quartz的记者萨拉·斯洛芬(Sarah Slobin)一起,对关于美国总统唐纳德·特朗普的就职演说性质的传统报道进行增强工作,分析他的面部表情并确定他在就职演讲中表达的情绪。


艾玛尼的算法经过训练后认别局部表情(例如,抬起眉毛表示惊喜),然后将这些微观表情与预先定义的情绪关联。


美联社技术总监罗伯特·法尔(Robert Farr)详细阐述了通过机器学习获得情感认知的方法。


“为了分析情绪,这些机器学习系统需要能够首先准确地识别一张脸,然后在每张脸上标出多个点。基于这些标识点,就有可能计算出某些表情——如微笑或皱眉——的可能性。”


法尔补充说,虽然人工智能有吸引力,但是它还有缺陷。例如,系统取决于受试者脸部的朝向——正面照片(例如红毯照或商务肖像照)是最好的,并且要求视野毫无障碍。


虽然没有系统是完美的,但是人工智能可以为传统的新闻报道提供额外的视角,而且随着人工智能技术不断完善,可以应用于报道的可能视角将会增加。


可能的视角包括,在财报电话会期间关注首席执行官的主导情绪,当政客谈论某个政策或话题时跟踪他或她的语调,为体育报道增加实时的生物指标,甚至自动产生配音。


人工智能音乐作曲项目Amper Music的联合创始人德鲁·席尔瓦斯坦(Drew Silverstein)说:“不论是记者还是音乐家,创意AI可以提高现在创作者的生活和生产力。


在最近一个项目中,美联社的选举开发团队建立了自己的机器学习算法,可以帮助确定政治竞选结果的可能性。这项成果值得关注,因为投票计数需要大量的人力劳动,而通过为计票过程增加机器学习,通讯社能够把这个速度和准确性至关重要的过程简化。人工计票播报专家现在手上能更快拿到更好的信息。


“在2016年的全国初选期间,美联社广泛地对这种做法进行了测试,而在过去的两个月里,从去年11月开始在10个州进行了改选。在这10个州,该系统推荐的计票100%的准确。”美联社的新闻编辑戴卫·佩斯(David Pace)说。


新闻业其他地方,《纽约时报》已经用机器学习来加强其对选举筹款的报道。


《纽约时报》利用竞选筹款数据集完成了大量报道,这些报道通常很难被发现和搞明白。机器学习恰恰能够跟踪这些问题。算法可以识别数据中的特殊模式,而这些模式可能甚至是被故意混淆的。”《纽约时报》的洛克威尔说。


但是,在更基本的任务中,或者新闻编辑部没有自己的CTO、IT部门指望的话,形势怎么样呢?幸运的是,你不需要构建自己专用的机器学习系统来利用人工智能的能力。


例如,Graphiq是一家使用体育、政治、天气和其他来源超过2500亿个数据点的公司,美联社与Graphiq合作,自动生成清晰简洁的可视化产品,能够每天为几十个报道提供交互式图形。


Graphiq副总裁亚历克斯·罗森伯格(Alex Rosenberg)表示:“大多数媒体都渴望利用AI。在某些情况下,这些组织可能会认为,‘哦,让我们快速组建一个团队来建立一个工具,或者利用定制软件来实施AI项目。’”

“至少今天,我相信这种想法有点被误导了。


事实上,像Graphiq这样的供应商正在让AI的一些方面‘私有化’,使得媒体组织内的任何人都能够轻松地快速学习和利用这些工具。”

谷歌出版合作伙伴关系负责人贾斯汀·庞(Justin Pang)阐述了媒体与AI系统提供商之间合作的可能性:“据估计,媒体公司和用户生成的内容每天创造超过20亿的数字图像和超过10亿小时的视频观看时间。这些爆炸性的非结构化数据需要被存储、分析和利用,这是一个越来越重要的领域,媒体公司可以与像谷歌这样在机器学习领域拥有支持性的基础设施和专业知识的技术公司紧密合作。”


深究起来,谷歌、微软、IBM和亚马逊这样的公司可以提供两类机器学习的云服务:监督学习和无监督的机器学习。


监督学习

 

想象一下,一群金融记者怀疑当地的企业正在从事欺诈性活动,但是他们不能在确定新闻前分配大量的人力进行调查。他们如何使用机器学习来帮助他们的报道?


报道团队可以利用监督学习——机器学习的一个分支——轻松地将可能表明属于涉嫌企业的非法行为的财务文件标记出来。


这种监督学习系统采用一组标记的例子作为输入,并将新信息分类作为输出。换句话说,该团队为机器提供属于已经或还没有被判定为非法经营活动的企业的财务文件,然后系统学习对两者之间的差异进行分别。


然后,当团队向系统提供新的信息时——在这个案例中就是可疑公司的文件,系统可以将文档分类为可疑的或可信的。


体育新闻团队可以使用同样的方法来研究运动员是否使用类固醇(利用使用类固醇被定罪运动员的统计数据作为训练数据),甚至是报道队伍用于小镇上调查疑似的非法采矿行为(采用已知为非法矿山的地区的卫星图像作为训练数据)。


这些监督学习系统的准确性当然是重要的。这种机器学习中的两个最常见的错误是类型I(假阴性)和类型II(假阳性)错误——从统计学家借用的术语 。


假阴性意味着系统将恶意的活动标记为合法,而假阳性意味着系统将合法的做法标记为恶意。


团队用来训练系统的数据越多,数据越准确,机器犯错误的可能就越小。不过,没有机器学习算法是100%的准确。

 

无监督学习

 

与监督学习不同,无监督学习将非结构化数据集作为其输入,不给出目标输出。该系统可以自由地得出输入和输出之间的关系。


试想,一个体育记者团队正在寻找周末棒球比赛的报道线索。它可能会指示系统将所有周末的得分数据作为输入,并轻松地发现可能的模式。


系统可能会发现,姓氏以元音开头的经理的球队更有可能在早上输掉比赛,或者冬季比赛越往北方,比赛的得分越低。无论发现什么,电脑并不是在寻找特定的结果,但是它可能会发现值得调查的东西。


例如,在枪支暴力档案(GVA)记录的一个14万件涉人事故的数据集中,美联社的数据新闻团队使用无监督机器学习发现了隐藏的模式。在发现初始数据中的大量错误后,美联社使用无监督的机器学习来简化数据,然后不需要具体指导,标记出某些进一步评估的条目。


利用人工智能,美联社能够获得新的报道想法,不然的话这些线索可能被遗漏。记者能够发现与枪支暴力有关的“最典型”的事故,包括枪击是否偶然,是否涉及到孩子,或者有没有牵涉到警察。

 

语言

 

自动生成语言是人工智能系统的关键输出。自然语言生成(Natural Language Generation, NLG)和自然语言处理(Natural Language Processing, NLP)是两个已经影响到新闻业务的最相关的语言处理领域。


Automated Insights创始人罗宾·艾伦(Robbie Allen)表示:“通过将人与软件配对,你能得到的东西比任何一个单独能做的强得多。”美联社体育和金融报道数据到文本自动化项目背后是Automated Insights。

 

NLG

 

自然语言生成与Mad Libs游戏类似,它将结构化、模板化数据转化为可阅读的书面叙述。


也许最基本的NLG例子是Quakebot。这是洛杉矶时报开发的一个工具,在地震时瞬间它自动生成一个模板化的报道。


看看2017年2月22日上午1:33来自Quakebot的推文:



 “某州某市某公里处发生一次N级地震”,模板立刻自动显现。


Quakebot从美国地质调查局提取相关数据填到这些空白中,然后可以在事件发生瞬间发出一个简单的报道。


美联社生成的更复杂的报道遵循了相同的基本公式。Automated Insights的艾伦说,自然语言生成“使人们能够围绕数据完成一个报道,并且以从前不可能实现的规模去报道。”

在金融报道中成功推出自动化财报新闻后,美联社在2016年再次与Automated Insights合作,使用自然语言生成来生成棒球小联盟比赛的自动化报道。在这个例子中,较低一级水平的职业棒球运动太过分散,无法依靠记者去持续覆盖。但是,有了比赛的可靠数据,能够以前所未有的规模自动化完成简单的比赛回顾消息,这为美联社打开了全新的空间。

 

NLP

 

与自然语言生成不同,自然语言处理是理解和语境化文本。 换句话说,NLG负责写作,而NLP负责读懂。


再以“巴拿马文件”为例子。 ICIJ必须筛选数百万份文件,其中每个文件都包含一系列命名实体(人员、公司、机构和地点的名称)。


自然语言处理可以帮助像ICIJ这样的组织确定这些命名实体之间的联系。例如,如果史密斯先生向琼斯夫人出售房屋,NLP可以识别史密斯先生和琼斯夫人是人,而且他们与某个行动相关——前者卖给了后者一套房屋。这看起来微不足道,但是要把所有文件中包含的个人之间的百万个关系厘清和绘制出来,将耗费一个研究员多年时间。


在翻译服务领域,包括在美联社正在进行的一个测试计划,NLP也很常见。


美联社的法尔说:“目标不是取代AP现有的人工翻译,而是增加他们的产出,以便能更好地服务中东、拉美和加勒比地区的新闻机构。”毫无疑问,终稿仍然需要人工编辑,但是这样可能成为一个有帮助的基础,从而提高效率,带来产量的提高。”


布朗媒体创新研究所执行董事马克·汉森(Mark Hansen)表示:“NLP的研究人员正在教电脑来了解语言的复杂性。这可能从句法或语法问题开始——让计算机识别句子的结构,例如,将句子分解成单词并用发音标记每个单词。”


“这还包括从文本语义或者含义获得的算法——让计算机突出显示重要的‘对象’,如人物和地点,并确定正在讨论的主题,”汉森补充说。


由哥伦比亚大学毕业生开发、并由微软资助的AI公司Agolo正在开发的摘要技术(summarization technologies)广泛应用了NLP。


Agolo的首席技术官穆罕默德·坦塔维(Mohamed Al Tantawy)说:“Agolo的NLP技术并不是从阅读像财务报表那样的结构化数据开始。算法分析非结构化数据,包括新闻文章、报告和新闻稿,并将其转换为非结构化结果。在我们的案例中,我们从所有这些文件中生成摘要。”


Agolo还利用自然语言处理聊天机器人生成新闻摘要,并从直接发布到社交媒体的新闻文章中生成摘要。

 

语音

 

新闻业的大量讨论涉及对话界面及其对新闻消费和发布的影响。 亚马逊Echo、苹果Siri和谷歌Home等个人助理机器人依赖文字转语音,而自动转录等其他工具,则依赖语音转文本的功能。

 

文字转语音

 

包括美联社、华尔街日报、NPR、BBC新闻和《经济学人》等数家新闻机构已经开始尝试使用语音界面。


美联社的业务发展总监汤姆·雅努谢夫斯基(Tom Januszewski)表示:“对语音助理和音频新闻来说,现在是非常令人激动的时刻。 例如,亚马逊Echo的广泛接受度,以及已经参与了这个平台的新闻机构的数量之大,令人惊讶。这表明这些新闻机构认识到这项技术的重要性,并希望早日加入。”


Echo系统通过分析新闻机构提供的文字报道,并利用文本转语音技术,用合成语音来播送新闻内容。


底层文本还需要写成能够让机器读出它的样式,这并不总是很容易。


美联社的文本和多媒体产品总监肯·罗马诺(Ken Romano)表示,某些做法,例如避免直接引用,并在姓名之前而不是之后放上职务,会获是更精确的文本到语音转换。


 “我们已经发现,像给广播DJ写的新闻那样的内容,会带来更好的转换。有一些语法指南可以遵循,使得当智能扬声器大声朗读时听起来更好听。”他说。

 

演讲文字

 

机器怎么能理解口语?这就是语音转文本技术的用武之地。


语音转文字将声音模式作为输入,并将其与输出相匹配。它从声音中得出意义,就像人们倾听别人一样。根据意图和目的,机器把口头单词转换为文本。


这项技术还使得记者们能减少他们每天必须完成的日常任务。例如,据雷诺兹新闻研究所(RJI)最近对美国超过100名记者进行的调查显示,记者每周平均花费三个小时的时间访问采访对象,并花一倍的时间把他们采访的录音整理出来。通过语音转文字技术,AI系统可以处理这顶工作。


RJI未来实验室开发的一个带语音转文字功能的APP“Recordly”希望能够做到这一点。


项目负责人辛蒂亚·拉图(Sintia Radu)表示:“Recordly出自我们自己希望报道和写作过程更加有效的需求。我们把听录音看成浪费时间,我们认为,以这个烦人的工作开始写任何报道都是适得其反。当作者听完录音,再要把报道完成时很已经疲惫了。”


同时,由Knight-Mozilla学者皮特罗·帕萨萨尔利(Pietro Passarelli)在Vox媒体公司开发的开放源代码编辑器AutoEdit,使用语音转文字来自动化一般的后期制作工作,例如给视频配字幕或从视频中选择有意义的引语来吸引读者。

 

视觉

 

在听和抄录之外,其他正在开发中的智能系统可以记录眼睛所看到的内容,或者在某些情况下,甚至超过人眼能看到的视觉内容。所谓“计算机视觉”,可以帮助编辑们快速分类和组织广泛的图像和视频,加快编辑过程,使记者能够为调查报道找到证据。


在一个著名的案例中,美联社使用来自一家名为Digital Globe公司的卫星图像,来锁定东南亚海域轮船的高分辨率图像,以记录一个关于海洋捕捞行业滥捕的调查项目的重要证据,该报道在2016年获得普利策奖公共服务奖。


Digital Globe的计算机视觉算法能够重新调整其卫星摄像头,拍摄最佳和必要的图像,这些图像最终提供了一个超出了美联社报道团队的能力范围之外的一个参考点。


根据图像和视频识别平台Clarifai创始人马特·泽勒(Matt Zeiler)的说法,这种图像识别功能使用一种被称为“神经网络”的机器学习。这些神经网络算法通过模拟人类所理解的感知图像的方式来工作。


泽勒说:“没有人真正知道大脑如何运作,但是我们知道视觉皮层将眼睛所见分成多层次处理。我们的眼睛然后将图像的区域组合在一起,只保留正向要素。计算机视觉算法使用数学模型通过他们的图像分层来复制此过程。”


除了调查新闻之外,这类系统可以用于更多的常规工作。例如,Clarifai使用视觉技术从照片和视频中自动提取描述信息,如位置和可以确认的人物、地点和事物。这可以加快生成有价值的元数据,使图像在新闻编辑部中更容易管理或通过搜索查询。Vidrovr是这一领域的另一家新创公司,谷歌在Cloud Vision API中提供类似的功能,可以自动生成此报告中的图像标签。


在另一个工作场景中,文本转视频平台Wibbitz利用图像识别,自动用编辑的图片和视频脚本生成匹配一段给定文本的视频,生成粗剪的视频供编辑人员进一步精编。


Wibbitz创始人兼首席执行官佐哈尔·达扬(Zohar Dayan)说:“一切都与人和技术之间的合作有关,允许记者更加多关注内容,少关注制作视频的重复部分。我们的平台使更多的个人能够更快、更好和更有效地工作。这也帮助制片人大规模创作有吸引力的视频。”


美联社的产品经理本·纳德勒(Ben Nadler)表示,图像识别和计算机视觉已经在新闻采集和传播方面帮助AP摄影师和编辑们了。


他说:“计算机视觉可以很快地处理大量的照片,通过忽略废片,选择最好的图片来进行文字报道,添加标签甚至字幕。它使照片和视频更加容易搜索,从根本上改变了照片和视频的使用方式。”


使用计算机视觉来增强新闻的另一个例子,是分析现实生活中的事件的可能性。试想一场假设的抗议活动——可能会有催泪瓦斯,群众混乱,和过度的噪音,所有这些都可能使记者迷失方向。但如果记者可以从安全的距离拍摄事件的视频,计算机视觉可以分析镜头,并帮助感知人群的移动,甚至感觉到情绪。

 

机器人

 

机器人摄像机和无人机可以为记者提供前所未有的视野,而机器人传感器可以测量人类对现场活动的反应,并测量自然现象——比如用于通知QuakeBot的设备。


在2016年夏季奥运会上,美联社使用了11台机器人和16台远程摄像机构成的团队,让摄影师能够将摄像机放置在物理上无法进入的地方,并且快速调整设备到预设的拍摄功能。


美联社还用无人机报道中东难民危机,捕获了摩苏尔东南部Dibaga附近流离失所的伊拉克人的空中照片。


按照美联社驻中东视频记者山姆·麦克尼尔(Sam McNeil)的说法,无人机可以做的不仅仅是为新闻记者提供支持的图片。


“无人机不仅仅是用于简单的空中视频或照片,而是可以用来收集关于气候学和其他领域的科学数据,以获得更深入的报道。” 麦克尼尔说。


机器人与机器学习、自然语言、语音和视觉等其他AI技术相结合,可以提高硬件的实用性。


地球电视(Earth TV)是一家位于德国的卫星公司,从世界各地播出实时视频广播,运营着数千台自动摄像机网络,捕获从日落和天际线到拖车和庆典的实时活动。


地球电视还使用AI系统和机器学习来确定何时捕获视频,以及相机指向哪儿以获得最高质量的图像——没有AI和机器人,这项工作将耗费太多人力而无法实现。例如,如果空气质量由于污染而特别地混浊,则相机可以调整其位置,或者如果拍摄对象被投射在阴影中,则调整其亮度设置。


地球电视首席执行官尼古拉·罗曼(Nikolaus Lohmann)表示:“我们发明了一个完全自动化的智能生产系统,其目标是让操作人员免受控制的压力,并将人类的影响引向创造性地训练机器人系统来控制和改善自身。”


机器人还是可以重新编程的——为了改变机器人的行为,需要做的就是将一段新程序写入其控制电脑。


美联社使用Raspberry Pis——一种低成本、小型、易于编程的计算机 ——构建一个实验原型,能够在娱乐和政治会场测量地面振动和噪声水平,间接确定音乐会中最受欢迎的歌曲、一场比赛的最大变数、甚至是在竞选集会期间最强有力的发言。


美联社研究与开发副总裁万斯·特里波迪(Vince Tripodi)说:“AP正在研究智能硬件(通常被称为物联网)如何能够在记者的新闻采访需求上提供帮助。”

 

人工智能对新闻报道的持久影响

 

正如本报告所表明,技术正在开拓新的领域,改变新闻工作,而没有人在几年前能够预见这些。这些技术来临之际,新闻记者和媒体公司正在为数字革命对新闻业所施加的挑战寻找新的解决方案。


在经济转型的时代,不仅节省时间和金钱势在必行,而且还需要找到方法,跟上新闻本身日益扩大的规模和范围。


随着社会网络在新闻生态系统扩展中起到如此巨大的作用,新闻机构需要不断追踪新闻读者的实时趋势。如创业公司NewsWhip提供的专业监控系统,正在为新闻机构提供21世纪的雷达系统,帮助他们发现更多的趋势,并在报道决策中更快地响应。


美联社社交媒体编辑埃里克·卡文(Eric Carvin)表示:“美联社的新闻编辑室使用NewsWhip等工具更好掌握那些抓住和吸引人们关注的报道。”


除了规模、范围和速度,这些技术也正在提高精准度的指针。在AP的财报自动化项目案例中,即使报道产量增加十倍以上,报道的错误率甚至下降了。


美联社的全球商业编辑丽莎·吉布斯(Lisa Gibbs)表示:“错误率更低的原因是算法不会产生拼写错误或数学计算错误。错误通常是因为数据的问题。如果数据不好,你会得到一个坏的报道。”


这个结论真的是对人工智能在新闻业的本质的提炼——使用“垃圾”仍然会产生“垃圾”。如果没有对新闻记者的勤奋管理和关心,让他们学习如何把这些新技术付诸实践,增强新闻这个新时代的希望就无法实现。


作为机器驱动项目在AP日益增长的重要性的应对,贾斯汀·迈尔斯(Justin Myers)被任命为AP第一个自动化新闻编辑,他总结得非常明确:“质量取决于两个主要的内容:解释和测试。编辑利益相关者必须能够解释,他们需要这些系统做什么,以及他们所观察或期待的主要问题。技术实施者必须能够解释他们的系统如何产生特定的结果,以支持编辑透明度和解决错误。这两个组织在项目启动前后都需要经常测试这些系统以及他们的假设。”


纽约大学媒体实验室是一家促进数字媒体与科技公司及大学合作的组织,执行总监贾斯汀·亨德里克斯(Justin Hendrix)表示,人工智能最终代表了媒体运营方式的根本性变化:


“从文本到图像到视频到音频,媒体现在完全是机器可读。从机器和深度学习到人工智能,数据科学的应用正在扫荡产业,改变媒体的生产、分配、消费和变现的方式。从自动化到增强,拥抱机器的媒体公司做到这一点,才能找到经济优势。从内容制作到经营,在新闻业务的每个领域都有可能实现效率和优化。自动化将逐步改变媒体公司的收入和利润。”


亨德里克斯还强调与变化相关的担忧:“挑战也伴随机会。其中主要挑战是组织的挑战,如何吸引可以推进和应用这些技术的新人才。还要考虑很大的外部性—— 从‘假消息’到过滤泡泡,从隐私担忧到网络安全。在机器驱动的未来,个人、企业和社会都面临着深刻的挑战。”


 (本文获作者授权翻译)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存