程思琪、喻国明:人工智能技术路线的洞察与人机传播新范式的构建
作
者
程思琪:北京师范大学教育学部心理学院博士后。
喻国明:北京师范大学新闻传播学院教授。
概
要
【摘 要】当下人工智能产业结构主要呈现出上游基础技术层、中间技术层和下游应用层三条技术路线并驾齐驱的状态。本文通过对上述三条技术路线的梳理,认为现阶段的人工智能都是依赖数据和算法模型的弱人工智能,但是已经极大扩大了人类自由度,尤其在辅助型脑力应用上进步明显,同时也应该关注现阶段人工智能已经造成的道德和伦理困境。在弱人工智能应用逐渐普及的环境下,开始常态化的人机传播借助算法的媒介属性,实现了对人类个体的纵向挖掘。
【关键词】人工智能;技术路线;人机传播
一、引言
达茅斯学院的约翰·麦卡锡(John McCarthy)教授1956年在一次会议上首次用“人工智能”(artificial intelligence,AI)这个词来定义机器的思考能力(thinking machine),一直到1997年IBM的国际象棋电脑“深蓝”战胜国际象棋冠军加里·卡斯帕罗夫(Garry Kasparov),AI才开始逐渐进入大众视野。2016年Google旗下公司开发的AlphaGo在被视为“世界上最复杂的智力游戏”——围棋比赛中击败世界冠军李世石后,人们忽然意识到以机器学习为主要基石的人工智能技术发展迅速,并早已蔓延至各个领域,如面部识别、医疗诊断、聊天机器人、无人驾驶等,随之而来的是人们对未来人机共存时代不断迫近的期待和隐忧。何时可以实现强人工智能或者超人工智能?当下人工智能是否已经超越人类智能?人工智能的应用能否影响人类思维和社会结构?这些都是近年来围绕人工智能讨论火热但难有标准答案的问题。
就目前人工智能的世界发展版图来看,毋庸置疑的是中国和美国在人工智能的全球技术革命中处于引领地位。谷歌、亚马逊、Facebook、微软等美国企业,与百度、阿里巴巴和腾讯三大中国企业,正在主导整个人工智能产业的市场。人工智能的发展离不开数字经济的支持,根据联合国贸易和发展会议(UNCTAD)的数据,在全球70个最大的数字平台中,美国和中国分别占据市值的前两位(数据观,2019)。但中美两国在数字经济方面的格局和差距也直接导致两国人工智能发展模式的大相径庭,最显著的区别是美国在操作系统、云计算等底层核心技术方面一骑绝尘;中国则在人工智能技术的应用端全力投入,领先全球。人工智能作为当下社会各界追捧的“热词”,大量报道与多方言论不由自主地营造了智能社会即将到来的幻景,但对于现阶段人工智能的“智能化”程度以及未来发展趋势,大多数人都处在“雾里看花”的迷茫状态。本文结合中美两国当下人工智能技术的开发与应用实况,从整体层面概述人工智能的发展路线,试图厘清现阶段人工智能技术的全球布局体系,还原目前人工智能发展阶段的“庐山真面目”,进而思考人工智能环境下的人机传播呈现出的新特点及其对人类和社会的影响。
二、当下人工智能的技术路线与基本问题
Kaplan & Haenlein(2019)基于大数据和物联网的现实基础,将人工智能定义为一个系统正确解释外部数据、从外部数据中学习并达到特定目标或者完成具体任务的能力。现阶段人工智能的实现模式是计算机将从物联网或者其他形式的大数据中获得的外部信息作为输入,通过机器学习来识别基本规则和模式。人工智能自20世纪50年代至今,一共经历了三次发展热潮:第一阶段是以命题逻辑等知识表达和启发式搜索算法为代表的起步期,第二阶段是1980年代的深度学习和机器学习系统的前身——专家系统的推广期与日本第五代计算机项目兴盛期,第三阶段是2000年以来基于深度学习算法的语音和视觉识别取得重大突破的阶段(尼克,2017)。从三次热潮背后的理论基础来看,人工智能的开发是一个由以数理逻辑的表达与推理为主,向以概率统计的建模、学习和计算为主转变的过程。
尼克(2017)在《人工智能简史》一书中谈道:“人工智能作为学科,经历了几次大起大落。每一次高潮都是一个旧哲学思想的技术包装,而每一次衰败都源自高潮时期的承诺不能兑现。”如果从技术开发者的角度看是承诺,那么从普通大众的角度来看便是期待,深度学习算法的应用与进步让人工智能在很多领域都超越了人类智能,尤其在游戏领域,比如国际象棋、益智问答、围棋等,最优秀的人类选手都曾被机器对手击败过。另外还有清洁机器人、急救机器人、外科手术机器人等,人工智能短时间内的巨大进步让人类既惊喜又慌张,似乎强人工智能的出现近在眼前。实际上,人工智能在与自然环境交互、自然语言理解等方面进展依旧缓慢,制造一个具备普通人类能力的智能机器人目前还很难实现。但是硬件技术的突破、软件应用的普及、计算机神经系统科学的发展,都成为支撑人工智能技术不断突破的重要基础。前两次发展热潮的起起落落,加上现阶段深度学习算法带来人工智能应用的爆发式增长,从全局角度理解当前人工智能的发展路线和战略图景,是合理判断其“智能水平”、预测其发展态势、把握其未来进路的必要依据。结合中美两国的发展重心,当前人工智能产业链主要呈现出三条技术路线并驾齐驱的状态,对这三条路线进行梳理可以对回答“何时出现人工通用智能/强人工智能”、“人工智能能否影响人类思维和社会结构”、“当前人工智能的应用与困境”等问题上带来一定启发。
(一)路线一之上游基础技术层:强人工智能“任重而道远”
基础技术层主要依托运算平台和数据资源进行海量识别训练和机器学习建模。以传感器和芯片为代表的硬件和以算法模型为代表的软件作为人工智能开发的两大根基,都属于人工智能技术的上游基础技术层。技术层是人工智能发展的核心,对于应用层产品的智能化程度起决定作用。尽管人工智能的核心机制是利用算法/函数去模仿和逼近人脑思维方式,但任何算法/模型都需要以高性能的硬件来实现对于数据的处理。
目前人工智能技术的主流底层硬件包括通用型GPU、半定制化FPGA以及全定制化ASIC等用于性能加速的硬件,这些硬件为整个人工智能的运算提供算力,主要包括数据训练和数据推断两个阶段。美国在算法和芯片、脑科学等领域布局一向超前,芯片行业巨头几乎都在美国,在GPU领域,领头羊英伟达主打超大规模深度网络加速,英特尔则主要围绕FPGA构建产业,推出了模仿人脑的人工智能芯片,主打ASIC的谷歌也推出了第二代芯片。目前的数据训练阶段(云端),CPU和GPU的异构模式是第一选择,因为大数据时代,单凭一种体系架构已无法独自完成大量的数据处理,需要异构计算来提高性能,即CPU和GPU协同运算,CPU可以通过大量的缓存使执行单元能够以很低的延迟获得数据和指令,GPU则通过大量执行单元来实现很强的计算能力和很高的存储器带宽,前者对延迟更敏感,后者侧重于提高整体的数据和吞吐量(许桢,2010)。异构计算的意义在于发挥不同架构处理器的各自优势,从而实现系统整体计算能力的最大化利用。比如英伟达发布的机器人平台Jetson Xavier就包含了GPU、CPU、NVDLA深度学习加速器等六种处理器。在数据推断阶段(终端),FPGA和ASIC凭借远低于GPU和CPU的研发和产出成本脱颖而出,FPGS开发周期短、上市速度快,被大量应用在大型企业的线上数据处理中心和军工单位,ASIC尽管一次性成本高,但是量产成本低,主要应用在移动终端等领域。
从启发式搜索算法(推理期)到专家系统(知识期)再到深度学习(学习期),科学家们同样在软件层面探索实现人工智能的可行方法。机器学习的出发点是让计算机模拟或实现人类的学习行为,进而解决特定任务,主要包括低层次感知、预处理、特征提取、特征选择以及推理/预测/识别的过程,其中特征提取主要依靠人工提取。深度学习在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据。深度学习需要大量的模型和数据,基于统计模型通过大量数据学习并不断改进先前经验,对计算机算力有很高要求。随着硬件的进步,从2008年开始深度学习进入了高速发展和应用的状态,图像传感器在手机上的普及提供了大量原始数据,GPU加速为深度学习的训练和运行提供保障。传统的机器学习在指纹识别、物体检测等方面的应用基本达到了商业化的水准,但是深度学习的出现大大延展了机器的辅助功能,算法推荐、无人驾驶、预防性医疗保健等等。以深度学习为框架的开源平台极大降低了人工智能技术的开发门槛,各行各业将会大规模地应用深度学习技术实施创新,加快产业转型和升级。但深度学习模型往往需要大量的训练数据,遇到小样本问题时反而比较棘手,尽管它是目前实现人工智能的首选工具,但未来依旧很有可能出现更好的选择。
也有研究者另辟蹊径,认为目前人工智能还是以计算和数据处理为主,和图灵机时代的电脑智能没有本质区别,转向模拟自身脑结构来实现智能,即基于认知神经科学的方法论和工具,来理解人工神经网络的功能模块和内部表征。该领域学者认为一个理想的人工智能研究路径是:“通过神经科学发现一个大脑工作的机理(brain inspiration),根据认知科学来对该机理进行建模(cognitive modeling),然后用计算科学来开发一个复杂度适度的算法(physical implementation)以解决一个真实的现实问题。”(青暮,2020)上述类脑计算方向得到了许多国家的重视,也给构建人工通用智能(artificial general intelligence)提供了新方向,但各国研究均处于起步阶段,要实现跨越式发展还有很长一段路要走。
从基础技术层的发展情况来看,目前还处于弱人工智能和窄人工智能阶段,是一种需要满足(1)充足的数据,(2)确定的问题,(3)完备的知识,(4)静态,(5)单一的问题这五个条件才可以作用的人工智能(施路平等,2020),例如图像领域的技术无法直接应用在语言领域。除了局限于解决特定问题,弱人工智能和人类最大的不同在于其很难模仿人类的心智,无法产生爱、恨、骄傲或其他人类情感,习得能力或构建情感认知可能是人工智能从弱走向强、从单一走向通用的巨大挑战。另外,发展人工通用智能不同于若干单一人工智能的简单整合,而是从计算模型和算法、芯片、软件、计算系统等全方位发展集成融合科学和技术(施路平等,2020)。由此,当前基础技术还难以突破弱人工智能的市场应用不断成熟但强人工智能的基础框架还远未搭建完全的瓶颈。
(二)路线二之中间技术层:弱人工智能扩大人类自由度
芯片等基础技术层面的落地带来了人工智能的第二条技术路线——中间技术层的发展,源于基础技术层—芯片和算法的进步以及不断更新库存的海量数据的支撑,中间技术层是面向细分应用开发的技术领域,其中计算机视觉、语音识别和自然语言处理是三大主要技术方向。《全球产业趋势系列研究之人工智能》报告指出,受限于创新难度大、起步较晚、技术和资金壁垒高等特点,在人工智能芯片以及算法理论等领域,中国尚不具备与传统巨头抗衡的实力,但受益于互联网产业发达、大量用户数据的积累,在计算机视觉、语音识别等领域竞争优势较为明显(芦哲,2020)。
计算机视觉(computer vision)是发展最为迅速、应用最为广泛的领域,也是中国人工智能市场最大的组成部分,根据艾瑞咨询的数据,预期2020年中国计算机视觉规模可以增长至725亿元(艾瑞咨询,2020)。计算机视觉原理是通过利用计算机和照相机来代替人眼,完成对图像中相关目标的识别、跟踪和检测,即让计算机具备人类的“眼力”。物体识别和场景理解是实现计算机视觉的两大步骤,通过提取丰富的图像特征描述物体的外观来做识别和分类,在此基础上理解和推断物体之间的关联,判断整体场景,甚至进行决策。计算机视觉的应用领域包括安防(人脸识别)、医疗(影像诊断)、移动互联网(视频监管)等。我国的安防领域通常利用计算机视觉进行车辆识别、人像识别、黑白名单等,金融领域也会利用计算机视觉技术进行刷脸登录与支付、身份鉴定等。另外还有无人驾驶领域,计算机视觉在环境感知(周围有什么)和地图绘制(我在哪儿)中发挥着重要作用。
语音识别(speech recognition)的目的是实现机器与人类的语音对话,让机器明白我们在说什么。技术过程包括语音收集、特征筛选、模拟训练和语音识别等过程,总的来说有训练和识别两个阶段。训练通常是对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘,识别过程即对用户实时语音进行自动识别。语音识别的应用也非常广泛,包括智能语音输入系统、智能语音辅助医疗系统、智能会议系统、智能口语测评系统等等,这些产品利用谈话内容和语言指令,可以完成身份识别、设备控制、文字录入、事务安排等任务,大大精简了工作程序,提高了工作效率。百度推出的小度,小米推出的小爱,阿里的天猫精灵以及亚马逊的Alexa等都是进入用户日常生活的语音助手,主要起到陪伴聊天的作用。语音识别也可能改变搜索方式,语音搜索将逐渐替代原来的文字搜索。就目前语音识别技术的发展阶段来看,语音AI难以完全还原人类的对话过程,还停留在机械完成人类语音指令的阶段,由于缺乏语境理解难以和人类进行个性化交流。
自然语言处理(natural language processing)追求的是人与计算机用自然语言进行有效通信,包括自然语言理解(计算机可以理解自然语言文本的含义)与自然语言生成(计算机可以用自然语言文本表达)两个层面,是人工智能领域中的核心技术,图灵测试就把使用自然语言与人进行对话并且足够“以假乱真”的能力作为判断计算机有无智能的标准。以谷歌翻译为代表的机器翻译的进化过程即印证了自然语言处理技术从浅层到深层的过程,从一开始的生硬的词语排列组合到现在的结合句法分析与语义分析理顺句子结构,逐渐形成了比较严谨的翻译体系。除了机器翻译,自然语言处理的应用还包括文本挖掘(内容推荐、舆情识别)、信息检索(搜索引擎)、问答系统与对话系统(聊天机器人)、语料库(写作机器人)等等,大致可分为分析型、交互型与聊天型三种应用类型。
同样地,由于自然语言文本和对话存在各种各样的多义性,要想让机器能像人类那样自如地运用自然语言,科学家们仍然任重而道远。由此,如果以人类心智(理解能力、沟通能力等)作为机器是否智能的标杆,无论是语音识别还是自然语言处理等现阶段运用广泛的人工智能技术,都难以达到“智能”的标准。但事实上,这些弱人工智能层面的技术在某些专门领域的出色表现早已进入了人类智能难以企及的高度,最显著的是在大数据处理方面,自然语言处理可以对数以亿计人类语言样本进行组织分析,分析结果可以用于监视金融市场活动、分析用户喜好、追踪慢性病传播等方面。数据作为社会发展的“新石油”,人工智能可以释放其巨大的价值,为社会增益。从根本上来看,弱人工智能的发展极大拓展了人类的自由度,尤其是时间自由,一是单调、重复的工作被人工智能代替或者与人工智能合作,“最大可能地增加了人类的自由支配时间,从而为人的自由发展提供了可能性”(刁生富、姚志颖,2018),比如工厂中的协作机器人(cobot)可以帮助工人挑选货物并打包;二是大数据+算法带来的自动化技术,极大提高工作效率,像在制造业领域,采用生成式设计,用户将材料类型、性能标准和成本要求等参数输入到算法中,会得到大量可选择的机器零部件或者家具。
(三)路线三之下游应用层:辅助功能与伦理困境的两面性
人工智能科学家朱松纯教授认为人类研究人工智能的本意是通过智能的机器,延伸和增强人类在改造自然、治理社会的各项任务中的能力和效率,最终进入一个人与机器和谐共生共存的社会(搜狐,2018)。当下一个显而易见的趋势是,人工智能已经进入规模化商用期,正在为实体经济赋能。下游应用层即AI技术与场景深度融合,进入实际应用阶段。中国在应用层的终端产品落地应用十分丰富,技术商业化程度比肩美国,大部分人工智能企业都分布在应用层,比如安防领域、移动互联网领域、金融领域和医疗领域等。具体来说,人工智能的基本功能包括分类、预估、聚类、优化、检测异常、推荐、数据生成等。基于上述功能,如果按工作性质(体力与脑力)和对人类工种的影响(辅助与替代)两个维度对人工智能应用进行分类,可分为四个类型:辅助型体力应用、替代型体力应用、辅助型脑力应用与替代型脑力应用(见图1)。
图1 不同类型的人工智能在不同行业的应用
目前辅助型脑力应用是大多数行业首先采纳的AI“工种”,主要用于安保、数据分析、客户服务和客户关系管理等,通过提高效率、提供经验/专业知识/创新等来优化工作流程。比如迪拜为加强公共交通安全,将在公共交通上引入面部识别系统来识别可疑和通缉人员,这一举措大大提高了抓捕嫌疑犯的效率(TechXplore,2020)。再比如在突如其来的新冠疫情期间,从感染早期的探测和确诊到检测治疗、个体病例跟踪、感染率死亡率预测、药物和疫苗的发展,以及减轻医护人员的工作负荷等等,AI应用对提高医生工作的效率和准确性都起到了重要作用。互联网媒体行业也是AI辅助性脑力应用的典型代表,一方面,谷歌、Facebook等高科技互联网公司对AI技术和应用有天然接近性和亲近性,这对整个媒体行业的AI应用生态都产生巨大影响;另一方面,数据导向时代,用户的个性化需求和情感需求要求媒体公司加大AI应用的投入力度。据此,AI在媒体领域主要有八大应用:内容推荐、受众参与、增强用户体验、信息优化、内容管理、内容创造、用户洞察和操作自动化(如自动生成字幕)。总之,目前人工智能应用最大的作用是帮助人们在不确定的世界中做出合理预测,为最终决定的形成提供依据(Agrawal et al.,2019)。对于AI应用,从排斥到适应再到不可或缺,是一个向人机共存时代迈进的必然进程,比如对智能手机的依赖就是某种意义上人机和谐共存的一个缩影。对于企业来说,AI技术的发展速度及其带来的变革性影响让许多企业领导者不得不思考和重视AI应用对于本企业的效力。有调查发现,企业领导者对于AI的商业应用抱有极大的热情,认为AI技术对优化企业内部业务流程至关重要(Deloitte,2017)。
AI应用的可能性失误与偏差也需要得到重视。一方面是基于统计模型给出的分类或者预测结果可能会存在脱离情景/场景/语境的风险,其实际适配性与可验证性存疑,即AI应用给出的结论可能与实际问题不符。一旦AI应用出现重大失误,责任划分与承担还需要更健全的法律法规作为依据。以自动驾驶为例,谷歌旗下自动驾驶公司Waymo正式面向一般大众开放无人驾驶服务,每辆车同一时间最多接待两位乘客,乘坐人需年满18~60周岁,车内也会有安全员随时保障行车安全,因此自动驾驶的技术成熟度和安全员的注意集中度都对行驶安全有重要影响。但在自动驾驶交通事故的责任划分中,很难判断汽车公司与安全员的责任比重与性质,并且目前大部分国家的法律还无法充分指定风险,没有适用的法律框架来监管机器人或者人工智能引发的责任。
另一方面是AI应用的伦理与道德问题。首先伴随数据不断扩张、算法持续改进的担忧是隐私的泄露与保护,皮尤研究中2017年的AI报告就强调了对企业算法使用的素养、透明度和监督的要求(Rainie & Anderson,2017)。比如效果逼真到真假难辨的DeepFake视频换脸技术一上线就惨遭全网唾弃,因为这一技术存在极大隐患,很容易被不法分子利用,增加了虚假新闻、隐私侵犯、视频诈骗等风险。在隐私保护方面,苹果围绕隐私保护发布了四条核心原则:数据最小化、设备端智能技术、安全保护以及透明度和管控,通过尽可能地本地处理用户信息、帮助用户理解被收集的数据等举措来加强隐私保护。其次是在人类设计的AI程序中,很容易将人类预先存在的倾向或偏见内置在系统的参数中。比如算法,算法模型和输入数据都决定了输出结果,模型和数据都是开发者的主观选择。算法偏见论认为算法中立是一个过于理想化且违背事实的说法,一个人工智能系统如果接受过有偏差或者错误的数据训练,就会将这些错误公式化并放大,因此算法有固化甚至放大社会结构性歧视的趋势,比如与就业相关的算法向男性推荐的职位在薪资方面整体高于女性;美国警方的罪犯识别系统更容易将犯罪、暴力等社会问题与黑人挂钩。另外算法的不透明性也使得人们很难了解算法的内在工作机制,即输入数据和输出答案之间存在着难以理解的“黑箱”,加大了对算法进行纠偏的难度。2018年《经济学人》杂志上有文章提醒道:尽管机器人杀手还未出现,但监管机构需要开始对人工智能有所反应了(Thibault,2018)。
三、人工智能环境下关于人机传播新范式的探讨
对于人工智能的讨论,实质是关于人类自身的讨论,源于外部环境变化给人类内心带来的不确定性。不确定性主要包括两个方面,一是对人工智能的已达到及可达到的“智能”程度的不确定,二是对人与人工智能关系的不确定。
基于对人工智能三条技术路线的整体考量,可以知道现阶段甚至未来很长一段时间人工智能都是依赖数据和算法模型的弱人工智能,主要作用于辅助人类的体力或脑力活动。但对于人工智能最终可达到的智能水平,即使是研究人工智能的专家们,也莫衷一是。因此相较于猜测或者担忧人工智能代替或压制人类智能的可能性,更值得关注的是现阶段人工智能已经造成的道德和伦理困境。而关于人与人工智能的关系问题,更具现实意义的思考路径是,在弱人工智能应用逐渐普及的环境下,开始常态化的人机传播呈现了出哪些特点,这种全新的传播模式对人类个体与社会又有哪些影响。
(一)理解人机传播:与人际传播的异同
传播通常被理解为人类借助某种技术中介进行信息交流和交换,在物联网和人工智能应用的双重催化下,人工智能成为人类信息传播的重要中介,一是人与智能设备的直接互动,二是人工智能技术内嵌于各类媒介中,人机传播已然成为一个典型的传播类型。IBM首席执行官Ginni Rometty认为AI不会导向一个人类与机器对立的世界(man “versus” machine),而是一个人类与机器共存的世界(man “plus” machine)(Carpenter,2015),现阶段人类对智能设备的习以为常以及对隐秘算法的后知后觉在某种程度上已经印证了上述观点。Gunkel在2012年就提出计算机辅助传播范式(computer-mediated paradigm)应该向人机传播范式(human-machine communication)转变,以应对人类与智能设备/机器沟通交流的现象,这些智能设备不仅仅是一种新的交流渠道,更是一个新的交流对象(Gunkel,2012)。
人机传播在某种程度上越来越趋近于人际传播,一是人机传播的常态化趋势,人们花费在人机传播上的时长甚至超越了人际传播,因为网络技术已经渗透到个人社会生活的各个层面。比如在新冠疫情期间,网民间的沟通交流活动越来越多的从线下转移到线上,即时通信成为最主要的沟通渠道。另外,即时通讯应用的公众号、小程序成为疫情信息发布的重要渠道,即时通信企业也通过推出健康码等工具以数字化手段协助社会恢复正常运作,还通过在线会议等多种产品为各行各业提供了便捷、高效的移动办公环境(CNNIC,2020)。二是人机传播会影响人际传播的形态,人作为传播者的功能被机器所辅助,增强现实与虚拟现实带来多感官参与和多通道感知的交流场景,人与机器的同构性使得人与人的传播转变为“人+机器”与人的传播。例如,已经有画家开始尝试一种将人充当机器的笔刷,由机械臂控制人去作画的新方式,在音乐领域也已经出现人类和AI算法共同谱曲的音乐作品。三是媒介等同理论(media equation theory)与计算机是社会行动者(computers are social actors)心理学范式认为,人类会用真实社会中的社交关系看待人与机器的关系,无意识地将人际交流中的一些社交法则运用到人机交流中,比如有研究发现,用户会十分礼貌地对待与之交流的机器人(Reeves & Nass,1996)。
但人机传播并不等同于人际传播。有研究比较了人与聊天机器人以及人与人之间最初互动的差异,发现人在与人进行交互时要更加开放、更外向、更认真且更真诚(Krämer et al.,2012)。上述结论是对媒介等同理论的拓展和补充,证明了计算机需要展示足够的具有人类特质的线索,人们才会无意识地将人际交流的法则运用于人机交流。另外一个区别在于,人与人的对话和互动通常是目标驱动的,比如任务目标、沟通目标和关系目标(Hobbs & Evans,1980),但人机传播实际上还处于一个萌芽阶段,机器作为一种新型交流对象,人类还未找到适当的动机来发展与机器的社会关系,也就是说更倾向于把机器当成一个电脑程序,难以剥离其物理属性。人和机器的不同在某种程度上来说就是生物学和物理学的不同,物理学是硬件,通常是机械的、封闭的,但生物学是软件,是可塑的、开放的。随着机器与人的对话交流更加顺畅,人们会逐渐建立与其和谐共处的社会关系,一个大胆的猜想是,这种社会关系发展方向不一定是机器越来越“类人”或者说机器逐渐具有人格化特质,也有可能是人们开始适应弱人工智能的表达逻辑,人的感性冲动型特质被机器理性算法型特质所影响,人类机器,而非机器类人,这也是值得关注的方向。
(二)人机传播的介质:算法具有媒介属性
计算机硬件和软件技术的发展使人与机器的互动成为可能,技术、应用以及机器理解人类语言并作出回应的动力来源于算法对数据的总结和推断,算法即人机传播的中介。从日常生活场景来看,人工智能首先改变的是个人的媒介使用行为和习惯。媒介用户个性化内容的生成通常有两种方式,一种是算法自动为用户过滤内容,另一种是用户主动定制内容(主动选择自己感兴趣的内容并屏蔽掉不感兴趣的内容)。有实验发现,较大程度避免网站读取个人数据,并主动定制内容的聚合类新闻网站用户通常是能够熟练使用通信技术且经验丰富的用户,大部分普通用户依旧选择开放个人数据读取以被平台获得基于算法的个性化推送(Sundar & Marathe,2010)。因此,算法成为连接用户与内容的主要逻辑,通过影响人们获取哪些信息进一步形塑人们对于世界的认知。除了信息分发场景,算法作为人工智能的底层逻辑,随着人工智能应用的普及与人机传播的常态化开始渗透进社会生活的各个场景:聊天、购物、支付、学习、工作等,“一个日益算法化的数字经济和信息传播社会正在生成”(喻国明、耿晓梦,2020)。在万物互联的环境下,算法成为整理、调度、组合和分配资源的“操盘手”,决定了人与人、人与物是否连接以及如何连接。简言之,算法的媒介属性日益显现,正是通过媒介属性,算法将自身的逻辑与人的逻辑融合,最终影响整个社会的逻辑。
具体来说,算法的媒介属性首先体现在对可见性的影响。丹尼尔·戴扬用“可见性”(visibility)这个概念来探讨被看见的权利、按自己意愿被看见的权利以及看见他人的权利,他认为媒介是赋予事件、个人或者群体等可见性的机构(Dayan,2013),有学者探讨了可见性对舆论的影响,认为“人们在‘看见’的基础上重构人际关系、再造社会议题、新建公共领域”(姜红、开薪悦,2017)。大数据时代可见性更是成为一种稀缺资源,算法在许多场景下成为信息/资源“可见”的关键因素,以个人兴趣和流行度为标准,算法推荐、自动化生产和过滤审查等决策程序不断对各类信息的“可见性”程度进行排序。“可见性”影响的早已不仅仅是舆论,更影响着人如何认知自身和社会。和传统把关人相比,算法把关的优势是提供的信息更具规模、更个性化且更细致,缺点是容易以偏概全,放大社会偏见,比如对个人形象的固化以及对社会阶层的固化。但是随着算法模型计算维度的不断增加,以及相关人员社会责任感的提高,从基础技术层开始,注重公开透明与公平公正,从而通过调节信息/资源“可见性”辅助人和社会的良性发展。
其次,算法加速情感连接的发生。后真相作为社交媒体时代的热词之一,其表征是假新闻的泛滥和群体极化的凸显,实质是情绪的影响力超越事实,“情绪和预设的立场将人们锁在‘过滤气泡’中,丧失了对真相的兴趣,选择性地接触与心理预期相匹配的信息”(陈昌凤、师文,2018)。由此,情感共振在很大程度上成为人们在信息世界中选择停留并建立连接的驱动力,而连接正是群体组织形成与社会关系建构的基础。算法创造了人们随时随地产生情感共振、建立情感连接的机会,也给以情感需求作为社交名片的个体提供了建立社会关系、找到所属社群的机会。比如直播带货就是一场以情绪狂欢为动力机制的商业活动,基于算法的货物品类分析、商品关联度判断、用户偏好和精细化分层等指标,可以增强用户的黏性与圈层属性。此外,算法不仅加深了人与人之间的情感连接,更是通过直接建立人与机器的情感连接日常化人机共处的场景。例如,《纽约时报》等报纸在脸书上推出政治新闻语音机器人,用带有强烈色彩的个人叙事与读者进行“一对一”交流,增加了时政新闻的温度。
从物理媒介到算法媒介,媒介形态“由实转虚”,算法将成为“万物皆媒”发展阶段上的元媒体。在认可算法隐性“把关人”角色的同时,也要加强对算法技术的监管和应用的规制。尽管算法通过社会化迭代,终会克服目前的缺陷,但在算法扭转偏见基因之前,我们需要意识到算法逻辑的存在,并理性判断算法媒介属性对个人和社会的双重影响。
(三)人机传播的结果:对人类个体的纵向挖掘
传播这个概念并不仅仅是关注信息传播过程中的各个角色,更加关注信息如何塑造人与人之间的关系,人类如何认知世界。传播学研究是一个关于我们是谁、我们对于他人来说是谁,以及我们正在创造什么样的现实的研究(Carey,1990)。同样,人机传播的关键点并非人与技术的交互过程,而是这种交互的结果与意义,需要回答诸如机器传达的信息如何影响我们,当技术成为传播者时如何看待人与机器的关系,以及人们如何在与机器交互的过程中了解自己等问题。和其他传播模式相比,人机传播最关注个体层面的传播效果,即格外关注个体的特殊性而非普遍性。无论人工智能发展的程度如何,都难以撼动人的主体地位。以算法为例,尽管对算法不透明、算法权力、算法偏见以及各类伦理问题的担心不断被提及,但不可否认的是,算法运作的重要维度是对个体的纵向了解和深度挖掘,不管出于何种目的,对个体的精细化剖析是算法不断调试和改进的根本方向。
从个体有无意识的角度切入,对于人来说,这种人机传播对自身的纵向剖析可以分为被动和主动两种方式。一方面,在万物互联的大环境、算法的隐秘性、用户在隐私保护层面素养的欠缺以及大数据带来的便利性等各因素共同作用下,个体无意识地、被动地给机器提供了大量分析数据,后知后觉地产生了对机器“窥视”个人隐私的不适与恐惧。比如算法模型的进步让信息分发越来越精准,缩短了个体与目标信息的距离,用户很难意识到快速获取目标信息的代价是个体在算法面前的越来越透明。但以线上商品价格的大数据“杀熟”现象为例,用户在发现同类商品针对新老消费者的差异化定价后,又会对个人数据的泄露和被利用感到愤慨与担忧。因此在个体无意识的情况下,人机传播对个体的深入挖掘可能会是一把双刃剑。
另一方面,如果用可供性(affordance)来理解人机关系,是更强调人在人机传播过程中的主观意愿,即个体在人机交流中有意识地自我披露(self-disclosure),以满足特定需求。可供性作为理解人与机器/技术关系的一种动态解释框架,可以通过人与机器/技术还有场景的互动显现出来,具体是指受众对技术效用的主观感知与改变传播实践的技术客观品质之间的相互作用(喻国明、赵睿,2019)。机器可供性会影响但无法决定人的行为,人的需求差异、知觉差异以及所处场景差异等多因素共同形塑人对于机器的使用行为。借用潘忠党、刘于思(2017)关于媒介可供性的分类可以简单描述人如何通过人机传播完成对自我的纵向挖掘。首先是信息生产可供性,互联网最大的意义就是赋予了用户内容生产自由和传播渠道,但随之而来的信息过载也让绝大多数的UGC石沉大海,尤其是小众的、个性化的内容很难找到目标受众。算法带来了个性化内容聚合的机会,为个体表达寻找所属圈层,极大提高了个体个性化表达的动力。比如Instagram和小红书等社交平台提供的“打标签”功能,让用户主动给UGC分类或定性以增加内容曝光在目标受众页面的概率。其次是社交可供性,算法无疑加速了地缘、趣缘和业缘群体的形成,任何群体形成并稳定的主要原因是它提供了个人情感归属场域。此外,算法也让情感社交成为可能,让个体更愿意面对或者表达自身的情感需求。情感分析是自然语言处理中的热门话题,追求对个体情感/情绪的细致把握,从以技术为中介的个体间情感连接变为人机间直接的情感连接,是人机交互领域的一个发展目标。比如韩国机器人公司RoboCare开发的机器人Mero,就是一款专攻人机情感交互的桌面型面部机器人,具有情感表达和唇形同步功能,搭载为客户定制的图像化身技术,可以用于自闭症患者的治疗。最后是移动可供性,移动互联网让用户随时随地接入网络变为可能,人工智能进一步将空间场景识别变为现实,可以更精准地满足用户的在地性需求,例如,打开定位推送附近的餐厅、酒店、超市等等。无人驾驶同样是人工智能移动可供性被激活的典型代表。
人的主体性是人工智能时代一个关键议题,其中一个担忧是对人工智能和自主智能系统的高度依赖会不会从根本上削弱人在认知和决策上的主导地位,这种担忧主要来源于人在机器面前逐渐透明但人对于机器的智能程度却难以把握的矛盾状态。显然,现阶段的弱人工智能对人的主体性还很难产生根本威胁,算法展开的重要维度,是对个人的纵向了解,通过对个体的深层剖析,形成有效循环,再进行横向扩张。上述逻辑下的智能应用反而是对人类主体性的突出和强调。
四、结语
美剧《西部世界》描绘的景象是强人工智能与人类共存与对抗,是人类对机器获得自适应能力的强人工智能的想象。现阶段的弱人工智能还只能让机器具备简单的观察和感知能力,做到一定程度的理解和推理。强人工智能实际上就是使人工智能达到人类智能的水平,但是智能这个概念本身是模糊的,一是人类智能很难定义,二是人类智能并不一定是唯一的智能形态。图灵测试告诉我们可以用行为来定义智能,即未必基于和人脑一样的内部结构,但也可能产生和人类一样的外部行为,更开阔一点的视角是,智能形态既异于人脑的内部结构,也异于人类的外部行为。一些观点也反对将人际传播的还原程度作为评判人机传播的标准,认为人机传播有其独有的传播特性。
聚焦到现阶段人工智能的发展状态,从实际应用出发,人工智能领域要平衡基础技术层、中间技术层和下游应用层的三条技术路线的投入与产出,加大基础技术层的研发力度,优化中间技术层的算法模型,对技术应用进行合理监管和规制,尤其关注智能应用带来的现实伦理问题,促进人与机器/技术的和谐共处。从理论层面出发,人机传播已经成为内嵌于人们日常生活的传播模式,必然对个体和社会关系产生影响,尽管不必过于担忧人机关系对人类主体性的威胁,但了解人与机器的互动过程与结果可以减少对未来人机关系走向的不确定性,也是理解传播进化趋势的必经之路。
本文系媒体融合与传播国家重点实验室(中国传媒大学)2020年开放课题“基于流媒体的直播内容样态研究”(SKLMCC2020KF011)研究成果之一。
本文参考文献从略,完整版请参看刊物原文
原文刊载于《全球传媒学刊》2021年第1期。
全球传媒学刊
微信号 |
GJMS2014 (←长按复制)
邮 箱 |
gmj2014@tsinghua.edu.cn
唯一指定投稿系统地址 |
http://qqcm.cbpt.cnki.net
*本刊不以任何形式向作者及单位收取版面费、审稿费、中介费等费用。
望学界业界垂青,我们共同助力中国新闻传播学研究。