查看原文
其他

《语言战略研究》∣ “语言与智能技术”多人谈(一)

连谊慧 语言战略研究 2023-03-12
《语言战略研究》2016年第6期

 

编者的话:

人工智能近年来的飞速发展离不开自然语言处理技术,即让机器理解人类的语言。自然语言处理技术的发展和应用正在改变着人类的生存方式。它既是语言生活的重要组成部分,也是推动语言发挥社会功能的重要动力。8 月28 日,中国中文信息学会和中国计算机学会联合主办的“首届语言与智能高峰论坛”在北京召开。在论坛的讨论环节中,八位专家就“语言与智能技术的未来发展”发表看法,分别探讨了类人语言理解系统的特点、深度学习的原理及应用、AlphaGo成功的启示、未来五年语言理解领域关键技术和研究方向等问题。本期我们整理了这部分发言,以飨读者。


关注人类学习语言的过程

 


孙 乐(中国科学院软件研究所)

人类智能的演化历经猿脑到人类祖先的进化,灵巧手及简单工具的使用,基因遗传智力的发展,大脑容量持续增加以及语言的出现。其中基因遗传智力、大脑容量的增大以及语言的出现, 是人类智能发展的几个关键节点。

 

人类语言不同于动物语言的地方在于:人类的语言单位是非常明晰的,音义结合具有任意性,语言具有结构性、开放性、可传授性,不受时间、地点的约束,我们可以看到,人类语言的句子可以进行切分,而且可以依据语法把切分得到的成分重新进行组合,生成新的语言片断,从而能够用有限的符号表达出无限的意义。

 

以色列历史学家尤瓦尔·赫拉利在《人类简史》中提到,距今7 万年前智人的认知能力发生了革命性的变化,智人在与其他人类物种的竞争中胜出的原因,最有可能的是智人拥有独特的语言。这本书给出了几个例子,当智人会讲述河边有只狮子的时候,实际上是具有了传达身边环境信息的能力,而进一步能够规划并执行复杂的计划,比如狩猎。此外,智人逐渐具备了另外一个能力,就是八卦,这实际上是人和人之间对社会关系的信息的传递,也意味着人类开始有了能够传达虚构概念信息的能力。有了虚构故事以后,就可以组织更大更有凝聚力的团体,也可以开展陌生人之间的分工合作和协同创新。

 

当代最有影响力的哲学家卡尔波普尔教授提出了三个世界的理论。他把世界分成客观世界、精神世界和知识世界,而这三个世界之间是交互的,进而形成了人类社会与自然界之间错综复杂的关系。自然语言正是对这三个世界的描述。随着语言研究的深入,我们越来越认识到问题并不仅仅在于语言的复杂性,而在于整个世界的复杂性。

 

在人类语言的习得过程中最关键的是出生后五年的时间,从牙牙学语到单个词的发音,到两个词的组合,最后到短语、复杂句子的掌握。对这个过程的论述有两种传统论点:一是乔姆斯基的先天论,语言功能被编码于人类大脑之中;二是斯金纳的后天论,语言通过学习原理获得。

 

如今的AI(Artificial Intelligence,人工智能)大势,涉及从逻辑推理到规则专家系统,到深度学习、机器学习的大数据智能。可以说,大数据时代代表的人工智能系统,不但要有数据、模型,还需要有大规模的知识和强大的计算能力。在这一主题下,我们应重点关注人类学习语言的过程,并研究如何构建一个类人的语言理解系统。未来五年,语言理解领域中需重点突破哪些关键技术、拓展哪些研究方向,还有待学界共同探索。


 ◆  ◆  ◆  ◆  ◆ 


从“迁移学习”反观人类如何学习语言


杨 强(香港科技大学)


人是否能够从少量的样本学习语言,这是关系到人工智能发展的一个核心命题。对此,我们目前还不知道人是怎么学习语言的,而更多的只是知道如何让机器学习语言。但是,我们会从一些现象中看出这一点:我有很多朋友在美国,也在做自然语言处理研究,但是当他们有了小孩子以后,观察自己的孩子学习语言,会发现语言学可能白费了。孩子往往能举一反三,不知道哪一天就学会了语言,他们就觉得非常的惊喜。


从机器智能的角度有几个方面可以作为研究的入口,比如迁移学习。在深度学习强化学习策略的基础上,把模型从一个通用的场景迁移到一个个性化的场景,迁移到小数据以及有冷启动需求的场景,就可以引入迁移学习。我认为人类正是在大脑已经有了很多固定的模型的基础上,再借助其中一些可以改变的地方,通过迁移学习,加上环境影响以及初始几年的观察去学习语言。


脑科学研究也呼应了这一假设。中国科学院外籍院士蒲慕明教授在第二届人工智能大会上表示,人类在一开始确实存在很多神经网络,留给后天学习的空间,但是随着年龄增长,很多又被遗忘,遗忘的速度和人类的疾病又直接相关。如果遗忘得太多就变成老年痴呆,如果遗忘得比较慢就会变成自闭症。这完全是从生物学角度来观察,却给了我们新的启发。


◆  ◆  ◆  ◆  ◆  


语言理解领域未来五年的机遇和挑战 


胡 郁(科大讯飞股份有限公司)


在语言理解领域,研究需要和工业应用紧密结合,但二者却有着各自的特点。

 

首先,是它们关注的领域不同,分工也不一样,而且各自的发展是交错递进的。比如说,做语音识别的黄金时间是20世纪90年代,有大量的文章建立在隐马尔可夫模型基础上,建立在贝叶斯网络的基础上,取得了不少研究成果。然而最终这方面的技术在工业上的应用却比较有限。事实证明,近十年来深度神经网络方面的研究成果却被工业界所广泛使用。

 

其次,对于同样的领域,学术研究和工业应用的出发点和研究路径也不同。以深度神经网络为例,可以通过它很简单地用大数据去凝练一个东西。从工业界的角度来说,这没有问题,因为工业界要看最终结果,只要能够为我所用,整合起来用到产品上并产生效益即可。而研究不是这样的套路,研究需要去了解其背后的模型以及方法,包括其内部的结合规律。学术研究需要“积累一桶水”,而工业生产可能“只取一瓢饮”。从技术发展的角度讲,技术总要从初步研究阶段到达技术爆炸阶段,然后跃过技术爆炸,再到技术普及的阶段。


未来五年,学术界应主要做两方面的事情,一是进行更加前瞻性的研究。比如脑科学领域,它对人工神经网络到底会产生什么影响。二是深度神经网络的应用型研究。在这方面,工业界的广泛应用已经形成了大数据。学术界需要在此基础上深入发掘,看看里面还有没有其他的机器学习规律和需要解决的问题。对于工业界,目前有两大挑战。一是在技术还不完美的情况下将其充分应用,如何扬长避短、取长补短,并通过产品设计和场景设计让技术真正有用。二是对技术本身的拓展,如何充分发挥已有的大数据和人工智能成果,联合学术界进行深入研究。


◆  ◆  ◆  ◆  ◆  


什么是“语言的理解”

 

聂建云(加拿大蒙特利尔大学)

 

什么是语言的理解?在不同的时期谈到的语言理解,意义不一样。过去,某个人对语言的理解就是会用这个语言,比如写一个句子可能没有语法错误等,据此可以认定他已对该语言有一定的理解能力。而现在我们讲的语言理解更多是从语义角度来说的,比如说话人所讲的一些概念、所要说的内容,我们能否完整地理解。

 

此外,语言的理解存在不同的层次。举一个例子,某人写了一篇英语文章,但其英语不是很好,叫一个人去改英语。修改者对文章的内容或许并不理解,但他完全可以从语言的角度进行修改。这时候我们说他对文章有一定的理解,并非意味着对其内容有完整的理解,而是对语言本身有一定的理解。而更深入的层次,应该是对语言本身和文章内容的双重理解。


因此,我们考虑建立一个完整的语言理解体系,必须明确目标,即做到哪一个层次。对于相关领域的企业,有哪些任务,需要用什么手段去完成,这和语言理解到什么程度,针对哪个方向、哪个方面的理解密切相关。某个方面的运用可能并不需要对语言里的每一个层次都去理解,可能只需要某一个方面的理解。比如,我们对英语的改错,可能对内容不需要理解,只需对表面的现象做一些修改即可。

 

另外,在促进语言理解方面,少量样本学习非常重要。目前,我们尚未充分发挥其作用。学界做了很多知识图谱,重点关注如何将其从大数据里挖出来并形成规律,然而对这些知识如何运用却挖掘得比较少。究其原因,我们从文本里挖掘知识的前提是描述知识本身,而要去描述对知识的应用则困难得多。从这个角度上来说,少量样本学习的研究有更加广阔的空间,应引起更多的关注。


◆  ◆  ◆  ◆  ◆  


《语言战略研究》2016年第6期目录


◆  ◆  ◆  ◆  ◆  



《语言战略研究》2017年征订工作已经开始,欢迎各界人士及单位订阅。全年6期114元(微店另收12元快递费)

订阅方式:

1.全国各地邮局订阅,邮发代号:82-104

2.微信订阅:商务印书馆微信号:shangwu1897官方微店(长按识别下方商务印书馆官方微信二维码或点击左下方“阅读原文”)



商务印书馆官方微信


 ◆  ◆  ◆  ◆  ◆  


《语言战略研究》官方微信

微信号:yyzlyj

电话:010-65523102 65523107
传真:010-65523101
电子邮箱:yyzlyj@cp.com.cn
投稿地址:http://yyzlyj.cp.com.cn
地址:北京朝外大街吉庆里14号佳汇国际中心1509
邮编:100020


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存