查看原文
其他

如何评估机器的智商?认知智能可以做什么?| 通往认知智能之路 (下)

周熠 墨子沙龙 2022-09-24



以下报告视频和内容来自墨子沙龙“AI·未来”活动(2020年9月26日)。



 


评测机器认知智能

说到认知智能,一个不可避免的问题是怎么去评测机器的认知智能?这个事情听上去很简单,但事实上相当困难。早在1950年, 人工智能的祖师爷图灵就提出了著名的图灵测试。简而言之,人类评委和事先不知道是机器还是人的对象交谈,如果人类评审不能够区别交谈的对象是机器还是人,那就认为这个机器具有人的智能


但是,图灵测试值得商榷。2014年,有一个叫做Eugene Goostman的程序,号称通过了图灵测试,超过1/3的人类评委觉得它就是一个乌克兰的小孩,不是机器。但是,这在学术界引起广泛争议。为什么?因为某种意义上可以用一些欺骗的方法来做这个事情,比方说可以不回答问题,反过来问问题引导人类评审专家。例如,当面对较难的问题的时候, 可以回答“我不知道”,而反过来问人类评审一些相关的闲话。可能很多时候人类评审就被马马虎虎的应付过去了,尤其在机器设是一个非英语母语的小孩的时候。无论Eugene Goostman是否通过了图灵测试,这至少表明,以图灵测试作为评测机器的标准值得讨论,比如于剑老师在这方面就有过很多深入的思考。


另外的一个候选者是智商测试,估计大家都做过。用机器来做智商测试会怎么样?这是一个挺有意思的事情。自动智商测试没有想象的那么简单,对现在的人工智能技术提出了很大的挑战,既需要涵盖人工智能的诸多方向,也需要融合之前提到的各个流派,而且智商测试本身就有一定的通用性。因此,我们现在正在进行这方面的课题研究,也举办了相应的国际比赛,欢迎大家关注。当然,我们也不认为机器智商测试做得好,就一定代表机器比人强。但我们认为这一定能促进机器在认知智能领域的发展。


数学自动答题


很多人都有这样的感受:所有的学科里面,学的最吃力、最痛苦的莫过于数学。机器到底是不是可以解数学题,跟人比起来,能力到底如何?这也是个挺有意思的问题。我们在这方面也进行了一些尝试。


首先我先问大家一个问题,关于机器和机器之间的交流的问题。中国人和中国人之间用中文;英国人和英国人之间用英语,那机器和机器之间交流到底该用什么?机器语?非常好的回答。对,就是机器语。这就是我们做的工作的出发点。我们定义了一套关于数学的机器语言。这样,机器和机器之间就可以通过这套语言实现所谓的交流和答题。

 


这个机器语言长得就像图中这个样子,主要是基于逻辑学的。细节不重要,重要的是机器确实是可以有一套机器语言的,可以通过这套语言相互交流,表示知识,学习知识,从而解决问题。举个例子(见上图),这是一个很简单的题目,等差数列求通项公式的问题。题目的自然语言对人来说可以轻易理解,但是对于机器而言就是一堆ASCII码,机器是不懂得这个题目在讲些啥的。因此,我们需要把自然语言的题目翻译成机器能理解的机器语言,就是图的中间这一块。因为机器语言是事先定义的,所以机器能够懂这个语言。在把自然语言翻译成机器语言之后,机器就可以调用规则库来解数学题了。


跟人一样,机器解题是通过一步一步调用定理。刚开始的时候,选取一条规则执行,提取结果之后会得到新的知识,新的事实,然后把它加到原来的事实库里面,又可以继续推。一步一步重复这样推演步骤,机器就能解答数学题。


之前我们和讯飞有合作,做高考答题。大概能做得怎么样呢,跟大家汇报一下。我们选取其中比较难的数列来做,基本上在解题部分可以做到90%到。如果工程量足够的话,估计可以做到95%。但也就差不多就能这样了。为什么?下面这张图能够稍微解释这个情况。

 


高考数学题中一大部分的题目可以通过很简单的模板来解决假设知道了数列的几项,求它的通项公式,这就是个模板,以后所有的这种类型的题目都可以完成了。这在数学题里面就是那种特别简单的送分题。如果把所有的题都考虑的话,发现模板越来越困难,因为它是题目和题目之间的组合、形式和形式的组合,它会非常复杂。你写了两千个、一万个都不能穷举所有的情况。


所以下一层就需要用到规则。简而言之,规则就是把数学定理用机器语言写给机器,机器就懂了这些数学定理,然后通过这些数学定理的组合,就可以解决数学题目。这样,大致上就能够搞定高考题目了,因为高考题目通过这些组合也就差不多(大约90%到95%)可以囊括了。


在规则之上是方法,有很多不同的数学的方法,比方说归纳法、反证法、分情况讨论等等。现在我们正在尝试用数学的方法来解数学题。我们也相信,如果方法完全做到位的话,大致能够做竞赛题。但这还不够。因为数学家肯定不是通过这些死的方法来开展研究的。方法都是死的,数学家还有很多灵感和直觉,来发现新的定理和概念、定义新的东西。这个层面就可能需要更深的人工智能理论和技术了。某种意义上,数学自动答题这个事儿,它不是一个事儿,它是很多不同层次的事儿,而且现在的技术做得并不怎么样。


事实上,在解题方面虽然有可能做到95%,但是在题意理解(即把自然语言翻译成机器语言)这一步,反而会做得比较差。对于比较封闭的全是用数学语言来写的题目,大致可以做到整题理解正确率80%-85%,工程做全大致能到90%。但是对于开放的题目,比如应用题或自定义新概念的题目,那题意理解就会相当的差。例如,有一道题目是:毛主席有一句诗词,“坐地日行八万里”,请问地球的周长是多少?后半句机器还能理解,前半句就够呛了,而把前半句和后半句联系在一起,机器基本束手无策。


面临的痛点

认知智能的能做的事情还有很多,比如智慧医疗:怎么用认知智能的方法去帮助抑郁症患者,怎么进行早期诊断等等。


再分享一点:在做这些事情的时候我们遇到的最大的痛点是什么?我的答案是如何真正融合基于神经网络的连接流派和基于逻辑的符号流派。这是人工智能的两个特别主要的流派,但是它们的假设非常不一样。一个是神经元的,是隐式的,一个是显式的,符号的。它们两个到底怎么能够真正的融合在一起,我觉得是通用人工智能,也是强人工智能的一个充要条件。这方面的探索还很不够。


大家都知道,人脑肯定是连接的,生物神经网络有百亿级的神经元。感知某种意义上也是连接的,这也是为什么深度学习在感知智能上能够做得这么好的一个很重要的原因,因为它很适合这个事情。但是计算机的本质,其实是符号的。计算机起源于逻辑学,计算机的几个重要的基础,包括可计算理论、编程语言、数字电路,都基于逻辑和显式符号。所以某种意义上,计算机的本质是符号的。认知和交互,大部分也是符号的。比方说,我们现在通过中文这种符号语言在交流,而机器程序,用C语言也好,Python也好,是通过一种机器的符号语言在交流。机器跟机器之间的交流,也是一种机器符号语言。认知和交互某种意义上主要是基于符号的。


对于人来说,这两个完美的统一到了一起,我们用生物神经网络说着各种符号语言,用的还特别好。但是对于机器来说,这是个特别大的痛点,特别困难的问题。


为什么我要借鉴脑科学与神经科学的方法来做人工智能的问题。我们的大脑,左脑管抽象思维,右脑管形象思维,这两个完美的结合能够做很多事情。如果能够借鉴脑科学和神经科学的一些方法,是不是能够真正让人工神经网络也能够处理结构化的信息,能够自动地获取知识?当然了,这很困难,现在还处在一个特别初级的起步阶段,但是也有一些很有意思的事情或想法在尝试。


认知智能的应用

最后,我稍微讲一讲如果认知智能做得比较好的话,可以应用在什么方面。


人类解决事物的流程,先感知再认知,认知是感知后面的一个阶段。绝大部分事情,真正要把它做好的话,感知和认知都有。踢足球也好,自动驾驶也好,都是先感知再认知的。认知智能跟感知智能不是一个对立的东西,而是认知智能的处理是在感知智能之后的。如果认知智能做得好的话,它的应用场景是非常多的。



比方说智能教育。智能手机相对于手机是个颠覆性的、革命性的创新。教育也是一样,孔子就说过要因材施教。但如果不借助机器的话,因材施教是很困难的——老师没有这么多时间,不太可能真正的去对每个孩子因材施教。如果机器真正能够掌握数学知识,就能够精准的评测学生知识掌握的好坏(这就是“因材”),从而制定精准的学习计划(这就是“施教”)。所以某种意义上,认知智能上的发展可以真正的实现老夫子的宏愿。

 


再比如知识库,企业的知识库以及企业的自动化流程。企业里面有很大一部分事情属于重复性劳动。比如说我特别烦的一个事情就是报销,报销这个事儿有好多规定,我根本就搞不懂,但是机器搞懂这个事情比我要容易,它就是一个流程,一个规章制度。所以像这种重复性的、大量的劳动,以后在认知智能得到一定的发展的时候,都是可以交给机器去做的,可以把人解放出来。


数据库已经是一个万亿美元的市场了,可以想象以后的企业知识库应该也类似。因此,认知智能做得好的话,有很大的商业价值。

 


还有,Google、百度等搜索现在反馈的结果是一个页面,也就是很多网站的排序,但是我们真正想要的是那些网站的排序吗?不是的,人很懒。懒当然是个缺点,但是某种意上,懒也是促进人类进步的一个很大的动力。


搜索一个东西,我们真正想要的就是答案,直接的答案。现在搜索技术能够提供的跟人类真正想要的还有一段的距离。“知识”可以某种意义上来做这个事情。现在Google、百度等也开始这样的尝试了,比方说用一些包括知识图谱的工具。当搜索“姚明”的时候,关于姚明的身高体重以及他的一些亲戚关系就自动出来了,这就是知识的功效。


但这还不够,因为很多时候我们就是懒到想直接要答案。这也是为什么现在很多行业搜索、基于推荐的搜索变成特别大的一个商业领域的原因,因为人永远是想节省时间的,永远是懒的。而认知智能或者知识上面的突破,可以帮助我们做多很多事情。


在应用方面,我先举这三个例子。当然了,它们还稍微有一点远,但是我相信随着认知智能和知识科学的进一步发展,它们确实可以实现。因此,认知智能可以做很多的事情,有很大的潜在商业价值,并不光停留在理论方面,而是可以真正切切实实地给社会带来进步,带来变革。谢谢大家!

演讲者 | 周熠
文字整理 | 猫撸火锅、王佳
排版 | John

由于微信公众号试行乱序推送,您可能不再能准时收到墨子沙龙的推送。为了不与小墨失散, 请将“墨子沙龙”设为星标账号,以及常点文末右下角的“在看”。


授权或合作请联系微信号MICIUS-SALON或mozi@ustc.edu.cn,转载微信原创文章可直接后台回复“转载”查看转载说明

墨子沙龙是以中国先贤“墨子”命名的大型公益性科普论坛,由中国科学技术大学上海研究院主办,中国科大新创校友基金会、中国科学技术大学教育基金会、浦东新区科学技术协会、中国科学技术协会及浦东新区科技和经济委员会等协办。


墨子是我国古代著名的思想家、科学家,其思想和成就是我国早期科学萌芽的体现,“墨子沙龙”的建立,旨在传承、发扬科学传统,建设崇尚科学的社会氛围,提升公民科学素养,倡导、弘扬科学精神。科普对象为热爱科学、有探索精神和好奇心的普通公众,我们希望能让具有中学同等学力及以上的公众了解、欣赏到当下全球最尖端的科学进展、科学思想。

关于“墨子沙龙”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存