来源:中国社会科学网 2019-09-23
探寻深层语义理解突破口
“由于机器尚不具备‘背景知识’和‘世界知识’,当人和机器进行交流时,歧义现象就表现得尤为突出。自然语言处理的关键就是如何识别与消解自然语言的歧义。” 复旦大学外国语言文学学院教授毕玉德表示,语言知识的获取及在计算机中的表示是自然语言处理研究的基础,是语言信息处理领域高难度的前沿课题。语言知识库可以为语义理解任务提供宝贵的知识资源,对于自然语言理解具有重要的理论意义和实践意义。
“从20世纪七八十年代开始,自然语言处理的研究方法从以语言学提供的形式理论和计算方法为主,转向以基于统计方法的研究为主。但当前的研究仍然无法处理深层语义理解等问题。” 首都师范大学国家语委中国语言智能研究中心主任周建设介绍称,近年来,计算语言学等学科利用人工智能技术,以语义分析中的指代、隐喻、情感分析等研究方向作为突破口,解释自然语言处理过程中的语义理解等问题。越来越多的学者意识到,要真正解决语义理解问题,还应依靠传统语言学的理论成果,单纯依靠统计方法无法继续取得跨越性的突破。
“怎样让计算机从大规模无标注文本数据中自动学习,得到计算机可以自动识别和处理的文本,成为自然语言处理和机器学习的紧迫任务。” 北京大学中文系教授袁毓林认为,重新思考语言学研究和自然语言处理等人工智能研究的互动关系,既有必要,也很紧迫。语言学理论研究能够为自然语言处理提供哪些观念与方法论上的指导?自然语言处理和相关的人工智能研究,对语言学研究提出了什么要求或挑战?又带来了哪些启发和机遇?当前基于深度学习的自然语言处理面临怎样的发展瓶颈?这些问题都值得我们思考。
从认知角度挖掘研究新领域
在袁毓林看来,随着深度学习等技术的发展与应用,人工智能技术为自然语言处理研究带来的变化主要表现在以下几个方面。第一,在语言单位的表示上,使用统一的具有低维、稠密、连续特性的分布式向量,来表示不同颗粒度的语言单位(比如词、短语、句子和篇章等)。第二,在计算处理的模型上,使用循环神经网络、卷积神经网络等学习模型,对不同的语言单位向量进行组合,以获得更大的语言单位的向量表示,并通过在向量空间中的运算,来实现文本分类、知识推理、句子或篇章生成等各种任务及应用。
教育部语言文字应用研究所研究员冯志伟表示,近年来,在会话智能代理系统的研究中,计算语言学家把以言表意、以言行事、以言取效等言语行为综合在一起,很有创意地提出了“信念—期望—意图模型”,并在此基础上成功开发了用于构建会话智能代理系统的对话管理组件。该模型对于信念、期望和意图等概念进行了形式化的描述,使之具有可计算性,从而更加有效地表达了用户向会话智能代理提出的告知或请求的真实意义。这个模型常常与基于公理化逻辑的行为方案集成在一起,把会话当作计划推理的序列来处理,提高了会话智能代理系统的性能。该模型着重于言语行为形式方面的研究,使得言语行为理论由一种描述性和解释性的理论变成了一种可计算的理论。
“在大规模数据的基础上,语言学研究不但要有数据、模型,还需要充分发挥人工智能技术手段,多学科深入互动,结合人工智能研究热点,从认知角度入手,深入挖掘、探索语言学研究新领域。” 周建设提出,智能时代背景下的语言学研究应该在加强心理学、神经科学、脑科学、认知科学等多学科研究深入互动的前提下,把注意视角从语言本身转向语言的实际使用规律、语言背后的语义及其组合机制等领域。
不断开拓新的学科增长点
“在智能时代,语言资源比以往任何时候都更为丰富,也更容易获得。在强大的计算能力和科学统计模型的双重辅助下,蕴藏在海量鲜活语言样本中的规律便存在被挖掘的可能。” 周建设表示,语言学家既可以沿用传统方式去挖掘有理论价值的语言事实,给出详尽合理的解释;也能够使用大数据技术,挖掘、整理海量语言数据知识,并将这些知识应用到自然语言处理等人工智能领域中。
“人工智能科学的发展有可能推进语言的计算研究,从而使语言知识的表示成为计算机可识别的方式。这将会使语言学成为真正的科学。” 北京大学教授陆俭明表示,语言研究如何跟上形势,在人工智能事业中发挥应有的作用,需要深入研究。在他看来,语言学的发展,必须走与其他学科交叉融合的“语言学+”发展之路。需要深入探究语言学与其他不同学科间的关联性和相互作用,找到语言学与其他学科交叉融合的契合点、着力点和支撑点,逐步形成众多的语言学与其他学科交叉融合的新的分支学科,不断开拓新的学科增长点。
本文转载时略有删节。
来源:中国社会科学网—中国社会科学报
责任编辑:黄琲 排版编辑:黄琲
人工智能技术挑战国家语言安全
作者:曹进 赵宝巾 来源中国学派微信公众号
在互联网、大数据、云计算、机器学习、神经网络、深度学习、语音识别技术的支撑下,人工智能正成为科技创新的“超级宠儿”。人工智能作为一种“颠覆性”和“革命性”技术,正在从根本上变革国际社会的发展进程及方式。作为一项持续变革的新技术,人工智能对国家安全而言,既蕴含着机遇,也存在着风险。2014年,习近平总书记提出的总体国家安全观重大战略思想作为我国新时代国家安全工作的统领性指导思想,是中国处理好人工智能、语言服务与国家安全关系的核心理论基础。人工智能赋能“全新时代”在全球范围内,以人工智能为核心,虚拟空间、现实空间、语言空间与思维空间的高度互联将导致人类社会的话语与社会变迁。随着智能机器人、智能无人机、智能无人车、无人武器系统、机器翻译、面部表情智能识别系统纷纷走向市场,人工智能对人类社会的影响越来越广,在社会领域、政治领域、经济领域、文化领域、军事领域、网络领域大显身手,主要体现在其“赋能”功能上。人们对于人工智能带来更加高效、自由的智能生活满怀期待。尤其是应用领域不断扩大,可以设想,未来人工智能带来的科技产品将会是人类智慧的综合“大脑”。机器学习、智能制造、网上支付、数字楼宇、数字城市、数字教育、数字购物、数字医疗、数字交通已经走进了我们生活中的方方面面。同时,在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术以及经济社会发展强烈需求的共同驱动下,人工智能呈现出深度学习、跨界融合、人机协同、自主操控等新特征,将进一步推动经济社会各领域从数字化、网络化向智能化加速跃升。人工智能带来“全新挑战”在人工智能产业逐渐扩大的同时,其发展的不确定性也带来了新的挑战。其一,深度伪造信息内容。深度伪造技术的兴起带来了重大风险挑战,其具有逼真度高、辨别难、适用范围广等特性,既会侵害个人权益,严重的还会危害社会公共利益和国家安全。在信息搜集过程中,虽然信息源大大丰富了,但是,制造虚假信息的手段也更加便利。随着智能手机及其App的普及,网络传播的大众化和内容分众化,动态虚假信息能够覆盖更多国家和地区更广泛的受众。深度虚假和情绪操控的内容将能够以高精确度向目标受众传递。因此,要警惕伊莱·帕里泽提出的“过滤泡”效应,避免“智能隔离状态”,切实关注自身的隐私保护。其二,情感运算和自然语言处理将更易于操纵人类感情和提取敏感信息。人工智能“依托的算法、数据和网络空间具有虚拟性和开放性,使个人数据更容易收集与分享,极大地便利了身份信息编码、健康状态、信用记录、位置活动总计等信息的存储、分析和交易过程”。人工智能易于合成逼真的视频和音频内容,人们可以在网络视频、网络通信工具上仿冒他人。此类伪造音视频通过互联网和社交媒体快速传播,给社会和经济秩序带来冲击。其三,人工智能作为一种基本技术体现在语音识别、文字识别、机器翻译、搜索引擎等语言产品和语言服务中。在人工智能时代,网络安全威胁可能进一步泛化。以高新技术为代表的大数据、云计算、云存储使国家或个体数据更加集中化,基础设施虚拟化程度越来越高,相关技术门槛不断降低,进而导致网络安全风险越发突出。人工智能向各新兴领域快速蔓延,万物互联的概念深入人心,网络安全边界愈发模糊。最普遍的是信息泄露问题。一旦有黑客入侵,国家信息或个人隐私将面临泄露风险,危害国家安全或个人财产安全甚至人身安全。语言服务具有重要安全价值人工智能影响范围广泛,需要一种综合、系统、全面、辩证、发展的安全理论框架才能够正确把握人工智能带来的机遇与挑战。美国、英国、日本、欧盟等国家均发布了关于发展人工智能技术、应对安全挑战的战略文件。2015年,哈佛大学发布《人工智能与国家安全》报告,2018年,新美国安全中心(CNAS)智库发布《人工智能与国家安全》报告,2019年11月,美国国会研究服务部(CRS)发布《人工智能与国家安全》研究报告,上述报告集中反映了人工智能如何影响和塑造未来美国国家安全问题。面对技术竞争,中国也需要从本国实际情况出发,结合具有纲领性的国家安全理念处理人工智能与国家安全的关系。2015年,国务院发布了《关于积极推进“互联网+”行动的指导意见》;2016年,“人工智能”写入“十三五”规划;2016年,《“互联网+”人工智能三年行动实施方案》发布;2017年,国务院印发《新一代人工智能发展规划》。同年10月,党的十九大报告提出推动人工智能和实体经济深度融合。12月,《促进新一代人工智能产业发展三年行动计划(2018—2020年)》发布;2020年,国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部等五部门联合印发《国家新一代人工智能标准体系建设指南》。在新时期的“新国家安全观”之下,语言服务具有极为重要的安全价值。新冠肺炎疫情发生以来,人工智能“赋能”的应急语言服务在抗疫防疫一线发挥了重要的作用,强大的语言服务保障、全方位的话语传播,为中国在抗击疫情中树立了良好的国际形象。因此,综合国内外人工智能发展现状,需要切实增强人工智能条件下维护国家安全的能力,不断加强人工智能发展顶层设计和核心技术突破;面对人工智能对社会秩序、伦理道德和思想意识等带来的冲击,应加强专题研究,立法管理,确保人工智能良性安全发展;高度重视人工智能人才培养,支持高校开设语言技术、语言服务等专业,打造人工智能“金课”,培养人工智能“金才”,持续加强产学研多维立体合作,增强人才、技术、知识和实验储备;注重人工智能条件下维护国家安全能力,加强研究人工智能技术在军事与民用领域的创新应用,加快智能化建设,提高维护国家安全的能力。(本文系国家社科基金西部项目“基于可比语料库的网络语言生态文明建构策略研究”(18XYY011)阶段性成果)(作者单位:西北师范大学外国语学院;西北师范大学党委宣传部)
来源:《中国社会科学报》 图片来源:CFP
综合编辑:应用语言学研习
微信公众平台审核: 梁国杰
文献延伸阅读(研习人指引)
本平台友情整理相关文献索引链接,
欢迎感兴趣的朋友按需选购。
选题宝 | 教育部人文社科项目申报线上培训——语言学专场
精选推荐
精选 | 应用语言学研习丛书(13种)一览:回顾经典 分析热点
新书 | 文秋芳著《产出导向法:中国外语教育理论创新探索》
KT文库 | 翻译学方向与跨文化研究方向年度书单
扫码关注↑↑↑ 即可获取最新入群二维码!
目前已有 3.42 万语言文学、区域国别学
研习者关注本公众号
欢迎加入交流群,分享学习,共同进步!
亲爱的研习人,
一起来点赞、在看、分享三连吧!