新时代,新技术,新变革。叩问网络媒体谁主沉浮?且听业内人士谈经论道!技术引领发展,智能重构传播。当媒体发展遇上人工智能,会擦出怎样的火花?《网络传播》杂志微信公众号特设“传媒论道”专栏,近期将围绕“智能传播”话题,邀请专家学者、传媒人士探讨智能传播现象,追问算法伦理风险,展望未来发展之道。持续连载中,敬请期待!
2017年12月26日,新华社在成都发布媒体人工智能平台——“媒体大脑”。2018年两会期间,新华社“媒体大脑”以15秒钟生成发布了全球首条关于两会内容的MGC(机器生产内容)视频新闻,瞬间引爆媒体圈。“媒体大脑”究竟有哪些强大功能?背后采用了哪些算法机制?它将如何重塑传播格局?《网络传播》独家对话新华智云联席CEO傅丕毅、徐常亮,来听关于 “媒体大脑”背后算法的深入解析。
传播君:今年两会报道期间,“媒体大脑”大放异彩,备受业界关注。除了快速生产MGC视频新闻,“媒体大脑”还有哪些我们不知道的功能?
傅丕毅:“两会”向来都是媒体的角力场,今年也不例外,我们首次在全国重大报道中全面使用智能采集、智能语音、人脸识别、版权监测、MGC(机器生产内容)等技术功能,打造系列融合的产品矩阵。MGC视频新闻由“媒体大脑”中的2410(智能媒体生产平台)生成,这是媒体大脑综合能力和技术的运用。
“媒体大脑”(www.shuwen.com)是由新华智云自主研发的国内首个媒体人工智能平台,融合云计算、物联网、大数据、人工智能等多项技术,为媒体机构提供线索发现、素材采集、编辑生产、分发传播、反馈监测等服务,使新闻场景下的应用和服务更加智能化。“媒体大脑”包含八大功能:2410(智能媒体生产平台)、新闻分发、采蜜、版权监测、人脸核查、用户画像、智能会话、语音合成。国内各媒体机构均可在认证后使用“媒体大脑”的各项功能和产品。
“媒体大脑”首先意味着对记者感官的强化和延伸。2410(智能媒体生产平台)通过摄像头、传感器、无人机、行车记录仪等智能采集设备,结合新闻发生地附近的多维数据,实时检测新闻事件,可以帮助记者发现第一手的新闻线索,并给记者提供多维度信息和数据,这样记者写出的报道就会更具有广度和深度。
与此同时,记者的耳朵也得到了新的赋能,专业级录音应用“采蜜”实现了将录音内容自动转写为文字的功能,适用于采访、会议等多类场景,并无缝衔接移动端和PC端,提高了记者的工作效率和内容生产力。
人脸核查功能将为新闻的真实性保驾护航。基于精准的人脸识别系统,可以在海量的图片、视频素材中确认特定人物,大大减轻事实核查环节的工作量,在源头上防止虚假新闻出现。
基于新华智云的大数据能力,用户画像功能可以为媒体提供读者阅读习惯、位置变化、行为偏好等更详细、精确的信息。而智能分发系统则依托国内一流的新闻分发渠道,通过大数据在智能硬件等设备上,为读者精准推送新闻资讯。这两者相辅相成,拉近了媒体与用户间的距离,从而达到媒体影响力扩大、用户体验提升的双赢效果。
版权监测是“媒体大脑”为原创者开辟的一道护城河,各类原创内容都将纳入“媒体大脑”的保护下。通过对全网近300万个站点的监控,各类内容侵权行为将无所遁形,抄袭、洗稿等乱象将受到有效遏制。
“媒体大脑”同时赋予了传统新闻新的呈现方式。新闻会话机器人可通过对新闻大数据的学习,与网友实时进行新闻对话和互动。智能语音合成系统可以将文字生成音频,使文字新闻通过智能家居、汽车音响等各类渠道到达用户,进一步延伸新闻内容的传播路径。
两会MGC视频
传播君:可否介绍一下“媒体大脑”背后的算法机制?
徐常亮:“媒体大脑”的算法机制是一个大话题。这首先包括了2410(智能媒体生产平台)中的场景识别能力、采蜜根据语音转换成文字的能力等。这部分算法是为了从外界发掘信息,需要我们一种一种模式、一个一个场景地去积累,各类别的算法则是相对独立的。目前在火灾、爆炸、碰撞等特定场景中,“媒体大脑”的识别算法已经达到了良好的准确率。
在内容生产智能方面,“媒体大脑”的算法机制体现在MGC引擎,可以概括为一个“业务数据化-数据业务化”的闭环反馈过程:一是让传统的业务资料成为数据,让线下的数据走向线上,和计算相接,这个过程对应的就是业务数据化,二是让数据形成闭环,回到业务的使用场景中,对业务进行改善并让人工智能不断自我进化,这个过程对应的就是数据业务化。
2410(智能媒体生产平台)
传播君:机器算法需要人来调教。“媒体大脑”是否也需要人工审核?机器和人如何配合?
傅丕毅:对目前的“媒体大脑”来说,人工参与和观察的角色是不可避免的,人的智慧+机器的智能,这是一种全量数据+人机协同的工作模式。首先,“媒体大脑”产出的内容以及质量在一定程度上依赖于人工的经验和反馈。其次,在判断黄色、暴力、敏感等内容方面,现有的智能技术可以进行初步筛选和校对,但最终还是需要人的再校对。最后,我们相信随着人工智能技术和计算资源量的提高,人工审核的依赖度会逐渐下降。
传播君:算法是一把双刃剑,其带来的优势与风险并存。为预防算法风险,“媒体大脑”采取了哪些举措?
徐常亮:“媒体大脑”在两个方面做了预防工作:首先从源头上,“媒体大脑”严控数据源。新闻记录的是历史,更沉淀下了数据。“媒体大脑”正在建立一个全球最大的新闻资讯库,包括主流媒体和自媒体,形式上会包含规整的新闻类文字、图文、音频、视频稿件,也会包含微博、短视频等用户产生的看似杂乱无章的各类UGC内容。我们会对这些内容再来做结构化、标签化等各方面的工作,使传统的资料成为与计算相接的、可供大规模使用的数据。维护一个可信的媒资列表,内容生产仅在此范围内取材。这就相当于大量有经验的媒体工作者已经为“媒体大脑”把了第一道关,从而降低了出现不良内容的概率。
其次在出口上,“媒体大脑”拥有一支自己的审核队伍,只有达到一定质量标准的MGC视频才会被发布。其它的MGC视频也并没有浪费,而是作为内容反馈和反向样本促成了下一批MGC视频的改进。
传播君:“媒体大脑”将如何重塑传播格局?记者会被机器取代吗?
傅丕毅:“媒体大脑”和MGC视频新闻的出现,不是要取代记者和编辑,而是要在更高层面上,把人与物的延伸连接起来,更快、更准、更智能地获得新闻线索和新闻素材,赋能记者和编辑,帮助媒体提高生产力。
第一,“媒体大脑”是一个智联的平台,可以将人、物、视频、文本等所有的信息串联在一起,它扮演智能时代新闻生产基础设施的角色,来定义智能媒体时代行业的核心竞争力。智媒的前提就是万物皆媒,万物成为数据采集、产生新闻资源的媒介,成为可传递信息和发布信息的端口。
第二,增加了新闻资源。从摄像头和传感器、无人机来的数据,相当于记者的眼睛、手、脚,让记者可以触达更远、更广、更深的内容,对突发事件报道线索的获取也更快、更准、更强。
第三,存量数据和新增数据都即将被管理起来。媒资库的智能使用,方便记者进行检索和调用生产资料。记者借助智能工具应用,可避免简单枯燥的工作,提升效率。在机器智能的武装下,记者可以探寻背后庞大的新闻资源。这样的人机结合与协同,将带来媒体完全不同的跨界融合。
第四、智能工具的普遍使用,比如采蜜——实时声音转文本的技术,避免了简单枯燥的听录音的工作,解放了记者的劳动力。比如,数据可视化模版,降低了数据新闻门槛,使记者很容易上手。
“媒体大脑”的出现是一次技术革命,意味着内容的生产效率和传播效率进入了一个新时代,这是机器的智能+人的智能的双赢和重生,这将开启一个全新的AI内容生态系统。“媒体大脑”的目标是成为智能媒体时代的基础设施,成为AI内容的定义者和发布者。