知识+数据+算力:算法进化升级的路径是什么?|德外独家
算法融入信息传播,带来了传播的深刻变革。推荐算法基于大数据和人工智能技术,通过算法模型,进行信息与用户的匹配,成为智能传播中的主导力量。
然而,经过算法过滤选择后,匹配给用户的信息对个人认知、判断以及社会性的负面影响,引起了广泛的关注和担忧。
作者从智能传播中算法的缺陷入手,围绕算法优化和升级,与人工智能行业专家、国家广播电视总局广播电视科学研究信息与安全技术研究所王磊博士,展开探讨,以期为算法进化找到可行路径。
以下为两人对谈的详细内容。
推荐算法只能依从用户
个人的偏好、需求吗?
于烜:算法融入信息传播,改变了信息采集、生产、分发和反馈等过程,带来了传播的深刻变革。在移动互联网时代,算法主导信息分发,算法的个性化推荐(简称推荐算法),有效应对了信息超载带来的分发危机,解决了海量信息与用户间的供需匹配问题,优化了生产和消费的资源配置效率,无疑是一种先进的技术和生产力。
但是,推荐算法存在一个明显的缺陷。我们知道在现代社会中,传播的一个重要功能是实现社会整合,以传统媒体为代表的大众传播发挥了社会整合的作用,传媒能够把不同阶层、人群、族群凝聚起来,形成社会共识,这就是媒体公共性的体现。
然而,个性化算法推荐,依据的是网络中用户本人或相似人群的个人兴趣、爱好、习惯、需求,只体现了个性,缺少公共性,公共性缺席是算法主导信息传播的一个明显的缺陷。推荐算法只能依从用户个人的偏好、需求吗?
王磊:从技术上说,算法是一种中介,通过算法模型,将信息与用户进行匹配,本质是要解决信息和用户的精准匹配问题。无论是传统的机器学习算法,还是近年来兴起的深度学习算法,通过用户个人属性和网络应用使用过程中的数据记录,挖掘用户个人兴趣、需求,最终达成个人信息需求的精准匹配,这就是算法的使命。
当算法融入传播,算法主导的短视频平台、资讯平台成为了媒体,作为媒体,需要传播主流价值观,需要承担媒体公共性责任,除了个性化的推荐,在算法中应该体现出公共性,这是从媒体角度、传播角度,对算法的要求。
于烜:目前的智能传播中,算法并没有回应这样的要求。也就是说,从传播角度看,目前普遍应用的个性化推荐算法技术自身是有缺憾的,换句话说,仅仅依靠推荐算法技术进行的传播,是有缺陷的,需要进化。
王磊:对,可以这样理解。
于烜:近年来,智能传播中,经过算法过滤选择后匹配给用户的信息,对个人认知、判断以及社会性的负面影响,引起了传播学研究的关注,比如信息茧房、算法囚徒、圈层化,这些研究都提示了算法带来的风险。所以无论是从算法技术自身的缺憾,还是算法在现实传播中带来的问题两个层面看,算法需要升级。
王磊:确实如此,推荐类算法需要从算法技术路线和网络架构上进一步升级,以尝试解决上述问题。
算法是否能够发现用户更全面多样的内容?
于烜:大众传播时代的信息也是要过经过媒体过滤选择的,但是在新闻专业主义的准则下,信息选择有明确的标准,要求客观、平衡,以尽可能反映社会现实。
但是,算法的根本逻辑是流量,以流量为目的进行信息匹配。研究表明,流量偏向情绪性、故事性、戏剧性内容,客观、平衡这一新闻传播大厦的基石已经被流量冲垮了。
100年后的今天,被算法选择的信息失衡、失真,拟态环境和现实世界不是越来越接近,相反却是越来越偏离了。
算法模型中,是否可以将客观、平衡等专业价值观要素导入进去?也就是说不仅仅找到迎合用户表面的喜好,也能发现他潜在的需要,或者是他愿意了解、也应该了解的更全面的这样一些内容?在实现过程中面临的困难和挑战又是什么?
王磊:我想可以尝试突破信息传播失衡、失真的现状,但是实现起来难度很大。一种办法是算法+规则,即以现有深度学习算法模型为基础,将专业价值观理念设定为相应规则,两者结合形成新的计算模型,进行相应信息匹配。但是,现实中难度很大。
还有一个办法,需要通过技术演进来实现。从人工智能发展历程看,现在正处于弱人工智能时代,即“数据+算法”的时代,这一时期通过大量投喂数据,算法精度较过去提高了很多,但是存在一个难以破解的核心问题——无法解决海量数据之间的深层次语义层面的关联关系,算法的泛化能力比较差,简单说就是在一个数据集中的模型,运用在另一个相似数据集中,其效果会变差。
只有当技术演进到“知识图谱+算法”阶段,能够在数据间找到并建立起相应的关联关系,破解数据语义层面的联系,才有可能挖掘出用户潜在的、多层次的需要,改变目前简单迎合的状况。
清华大学张钹院士提出的第三代人工智能,即知识+数据+算法+算力,或许未来可以从这个方面突破,一定程度上弥补当前信息传播中推荐类算法的缺陷。
第二代人工智能阶段,
如何推动综合评价体系建立?
于烜:算法驱动的内容平台通过组织生产和算法分发,已然成为了智能传播时代的主体,因此说需要通过规则导入,促使算法进化。
目前个性化推荐算法,强调的是迎合用户个人个性化的精度,是不是可以从内容端的广度进行考量,比如说,内容的多样性,让观点多样、信源多样、品类多样的内容达到用户?也就说是否可以通过内容的广度,来体现新闻传播客观、平衡。
王磊:是的,除了精度,算法的广度应该成为一个评价指标,如对内容的非歧视性关联推荐等。现阶段综合评价指标的合理设计将引导算法不断地优化升级。当然,这些评价标准的制定也需要传播学的专家加入,共同探讨。
于烜:如果要对今天的对话做一简短小结,我想说,面对算法技术的缺憾及引发的问题,算法无疑需要进化。而算法进化有赖于算法技术自身的演进,有赖于算法掌控者的伦理培养,有赖于监管部门的标准规范。同时,这需要学界、业界、政府共同努力。
延伸阅读