通向人工智能产业落地化的道路在哪?
世事浮云,白云苍狗,转眼间关于人工智能的研究已历经两个世纪。
在研究者和践行者的不懈努力之下,如今人工智能应用已遍地可见,无论是繁华都市还是偏远小镇,街头巷尾偶遇可称为人工智能的应用并不算稀奇。
然而,人们并不满足于碎片式的点状应用,更想要早日实现先驱们最初设定的宏愿——通用人工智能。但攀上这座高峰还遥遥无期。
要如何攀上通用人工智能的顶峰,专家们指出了不算很多的道路,但每条道路目前来说都不好走。
比如,最为人们青睐且最有前途的,当属深度学习这条“康庄大道”无疑。许多人以为,深度学习能够解决一切问题,放之所有领域皆为准,但事实证明,深度神经网络的确能够被训练下围棋,也能流水线上做钉铆,但同一个网络不能同时做这两件事,时至今日,尚没有一个用深度学习实现通用人工智能的完整路线图。不仅如此,深度学习与生俱来的弱点也日益暴露出来,如不可解释性、大量依赖数据、成本高昂等,所以,这条路能否通向通用人工智能要被打上一个大大的问号。
又有人提出,可以整合各种专用“模块”于一个“构架”之中,让它们分工协作,这样就能拼成一个通用系统。但这个思路理论上可行,但实施起来却难如登天,比如算法或设计本身的功能可能就是复杂且矛盾的,要协调好不计其数的“模块”,就是一个浩繁的工程。
除此之外,还有人试图通过构造更像人脑的模型,来模仿人类各认知功能的统一再现,这就是所谓的“全脑模拟”。
“全脑模拟”的概念基于一个原理,即生命的主题是大脑,于是,20 世纪初,谷歌的科学家们提出一个大胆的想法——将人脑原封不动地移植到以神经网络为架构的 AI 上,这样人脑就可以永生,人也就能永生。然而,这个想法虽然让人兴奋,但实行起来难度更大,因为人的大脑共有约860 亿个神经细胞,如果用神经回路来模拟大脑,即使用当代速度最快内存最大的超级计算机,也只能模拟大脑的百分之一。这让大脑移植似乎变得不可能。
但是,这阻挡不了科学家的研究热情。2018 年,日本理化学研究所和德国的 Jurich 研究所联手,通过对网络算法进行改善,使得神经网络的性能提高到了原来的将近 100 倍,新的算法通过概率预测,删除了很多不必要的信号通信。改善后的算法在性能上完全有可能对全脑进行模拟。
全球还有无数人在进行着类似的研究,美国的脑计划、欧洲的脑计划和中国的脑计划就是这一理论的积极倡导者,为项目投资也逐年提高。2018年,美国对脑计划的支持总额超过 4 亿美元,同比增长 50%;经过近 3 年的酝酿,中国的脑计划也于 2018 年正式挂牌,作为重大科技项目被列入国家“十三五”规划,仅招聘顶级专家就投入 1.8 亿元人民币真金白银。
然而,这些本来被视为“人类之光”的计划似乎并没有预期进行得那么顺利。2013 年,欧盟大手一挥拨了 13 亿欧元(目前汇率约合 99 亿元人民币)成立了欧盟“人类脑计划”,但如今实施周期已过半,距离模拟出人脑却还很遥远,至今没能拿出像样的成果出来。于是这一计划开始遭到科学界的质疑,欧盟也已经决定不再“将所有的鸡蛋放在一个篮子里”,减小对欧盟“人类脑计划”的投资,这让后者的前途未卜。
既然此路难走,那就再想其他办法。
科大讯飞在人工智能领域可算得上是先行者之一,因为早年预判语音技术将成为人工智能技术应用突破口的独到眼光,开辟出一条语音之路,如今已跻身这一领域的第一方阵。
这家科技公司对于通用人工智能的实现途径也有自己的看法,并提出了一个概念——智能动力学,并将之视为实现通用人工智能的三条途径之一。
机缘巧合,笔者有幸采访到科大讯飞联合创始人、轮值总裁胡郁,探讨了“智能动力学”究竟是何解。
智能动力学:实现AI的第三条途径
在胡郁的解释下,笔者大致明白了“智能动力学”其实是一个相对“空气动力学”而来的概念,通俗来讲,就是像人类研究鸟类飞行一样,最后研究出“空气动力学”,造出了比鸟更好的飞机,它不用像鸟一样吃喝拉撒,但比鸟还快,因为飞机遵循鸟类羽毛空气动力学的基础理论。相应地,随着我们对人类大脑理解越来越深入,对人类大脑拓扑结构和学习机制理解更深,我们完全有可能发明一种“智能动力学”的东西,它可以在学习人脑的学习机理、人脑结构后,与计算机的速度快、存得多的特点完美结合在一起,产生强人工智能甚至超人工智能。
这是胡郁认为的实现人工智能的三条途径之一,而其他两条是英雄所见略同,就是上文提到的深度神经网络和全脑模拟。
关于人工智能的实现路径,相信很多人和笔者一样,了解更多的是深度神经网络。为什么全脑模拟和智能动力学少被提及呢?后两者和深度神经网络相比有何异同点?为什么深度神经网络比后两者的概念更火?
胡郁回答了笔者这个疑问。他说道,“现在利用大数据加上深度学习的方式是主流的方法。但是从研究的角度来讲,我认为深度学习只是研究中的一种路径而已,而从工业化的角度来说,深度学习的可操作性、稳定性和目前跨过实用门槛的能力目前还是最强的。但是它也有一些问题,比如需要的数据量巨大,而且对于人类的某些智能,例如认知智能,用现在深度神经网络的方法来做,就会面临一些挑战,因为没有足够的大数据来支撑。人类在学习过程中其实不依赖大数据,而是小样本,它依赖少量的案例或数据就能够学习,这导致现在的大数据系统其实有一些不足。”
所以,这也是讯飞提出“智能动力学”的一个主要原因,讯飞要学习人脑的学习机理,神经元的连接方式和神经元类型,希望得到更好的基于类似于人类学习方式的组合。
所以,他认为,当前正在使用的还是大数据、人工智能,即基于大数据的机器学习的人工智能。但是将来,讯飞想要发展智能动力学,这是他们的目标之一。
用一两句话概括,后两者相比于深度神经网络最大的不同点和优势在于,采用智能动力学的方法能够更好地将人脑的思维方式和学习方法与电子计算机进行结合,从而实现小样本学习和迁移学习,后两者在这些方面会比较强一点。
既然全脑模拟和智能动力学有这么多优点,它们是否有望克服深度神经网络的缺点,实现通用人工智能呢?
胡郁给出的答案在预料之中,但仍不免让笔者感到一丝惋惜。
他说道:“全脑模拟是从现代脑科学研究的一个分支,我并不认为脑科学就是全脑模拟,并在将来能带来一个好的人工智能的前景,我更相信的是智能动力学可能会给我们带来智能动力学研究脑工作的原理,并把这种原理放到人工智能系统中,比如与深度神经网络相结合。所以,它的优势是能够真正地探索人脑的奥秘,并在我们现在还不太擅长的领域取得突破性的进展。特别是我在报告中(链接)提到的在认知智能方面,我认为会产生非常好的作用。”
现在,智能动力学还是一个讯飞提出的设想,想要将人工智能和脑科学研究的最新成果结合在一起,但还没有得到应用。
但胡郁说道,将来智能动力学的应用方向和领域与人工智能、大数据一样广阔,并有望在认知智能,比如更好地理解人的意图,学习专家系统知识这些方面发挥更大的作用。
既然本文想要探索的那条通向通用人工智能的正确道路还没有绝对答案,那不妨来看一看,在当下的相关研究中有哪些最新的研究动向和趋势吧。
知识图谱将是大户数据平台的核心技术
大数据中台的概念近来很受关注,科大讯飞也有自己的大数据平台 Odeon。Odeon大数据平台与讯飞的人工智能算法和应用紧密结合在一起,通过底层硬件、大数据存储和管理平台和人工智能学习和运算算法这三层,Odeon 大数据平台将讯飞正在做的感知智能,即语音和图像技术和认知智能(语言理解、知识表达、逻辑推理和最终决策等)紧密地结合在一起,达到更好的处理效果。
有人认为,因为知识图谱具有探索式分析的能力,将成为下一代大数据平台的核心技术。知识图谱真的具有如此大的潜力吗?它的作用是否被夸了?
对此,胡郁认为,知识图谱是认知智能取得突破的一个非常重要的方面,因为人的大脑就是按照知识图谱的方式来组织知识的,但是人与计算机相比的存储能力较小,图谱确实作为数据的中台,是人工智能感知、认知智能方面的一个必不可少的突破方向。它其实是将原来的知识全部结构化,并在它们之间生成逻辑的关联结构。
“我认为,知识图谱在很多领域,特别是专家系统领域会有非常广泛的应用,比如现在讲的专家系统主要用于教育、医疗、司法和智慧城市等方面。在医疗方面,讯飞做了智能助理,它能够根据建立的病症和表现之间的知识图谱。通过知识图谱推理预测用户可能得病的概率,更好地帮助医生进行病情判断。另外,知识图谱在推理上具有优势,在逻辑推理方面非常实用,因此,知识图谱在自然语言理解,知识表达和逻辑推理方面都将有非常重要的作用。”
机器翻译要“达”、“雅”,需要理解和常识
下一个疑问转移到讯飞凭之起家,同时非常擅长的机器翻译上。
有专家认为,近两年来机器翻译有了很大的进展,但实际上都是靠大数据驱动的,大数据驱动的带来的好处是机器翻译性能得到飞速提升。然而问题是,因为大数据驱动深度学习是典型的“黑盒子”,虽然翻译效果不错,但其实机器对句子没有任何理解。这样的系统在处理复杂语义时非常脆弱,即使是非常简单的日常词汇,目前最先进的机器翻译系统也无法做到准确翻译。
面对这个略尖锐的问题,胡郁给出了自己的看法,“我认为这应该从两个方面来看,我们都知道AlphaGo 战胜李世石 9 段柯杰 9 段,凭的是算得快、存得多的优势,但这并不妨碍它打败李世石和柯杰。所以,一方面我认为在大部分翻译领域,机器翻译已经做得不错了。现在,机器翻译做得不好的地方,可能是占比非常小的俚语,机器翻译的特点是没看到过就不会翻,对于一些非常复杂的特殊情况,翻译的效果可能会打折扣。所以,从另外一个角度来看,翻译要求“信达雅”,人类在“达”和“雅”这两个方面还具有一定的优势。我不认为机器翻译将来就要完全取代人类,它只是帮大家解决大部分的比较简单的工作,而不是让人类最后都没饭吃。 ”
归根结底,机器翻译效果有时差强人意,也有一个重要的原因——机器不懂人的常识。问题存在就要想办法解决,机器难以具备常识已经不是个新鲜问题,从机器翻译概念提出伊始这个问题就纠缠了研究者很久,却至今未得到解决。打造常识知识库是解决这个问题的基础。
清华大学计算机科学与技术系教授孙茂松曾说过,打造好的知识库,有两个可行的办法,一个是把现有世界各方面的知识库都拿来先做整合,从中汲取养分。另一个办法是从文本中挖掘知识库,从文本中找到知识并进行形式化。为此,清华大学正在联合各方研究机构打造这样一个知识库。
胡郁认为,常识知识库非常重要,但它有一个特点是很难通过大数据获得,因为人类的常识不是以文字形式被记录的。但是科大讯飞有尝试构建这样的常识知识库,但是却没有一个好的系统构建的方法。他提到在 Winograd 的常识比赛测评中,科大讯飞获得了第 1 名,但分数仅有 60分,相比之下,一个人类的小孩却可以很容易地达到 90 分,所以,胡郁并不认为现在的常识技术已经达到了应用的门槛。
然而,他对于为机器翻译的未来充满希望,相信随着数据量越来越大,机器犯错误的可能性会变得越来越小。机器翻译要想达到“信达雅”,它不仅要翻译,还要理解句子的内容。“现在机器翻译不用理解句子的内容,只需要考虑两种语言之间的词对和句对之间的关系,要做到“达”和”雅”,就必须理解句子内容,所以就必须要做知识图谱。所以,我认为人和机器是各有所长的。”
AI+教育,实现几千年“因材施教”的教育梦
讯飞被大家熟知的是语音技术,但实际上它不仅关注自然语言理解,在计算机视觉/图像领域也有很深的研究,比如图文识别。
胡郁介绍道,讯飞计算机视觉的研究方向围绕着应用集成的角度,比如在教育领域做基础的自动批改,可以识别手写公式,手写英文/中文作文,以及识别答题结果,并用机器判断结果和中间步骤是否正确,利用了大量的图像识别技术,如 CNN等。图像相关技术,讯飞应用得最多的还是在教育领域。
在教育领域,人工智能的应用近年来已经很常见,做 AI+教育的企业遍地开花,但很多企业推出的产品都有同质化的倾向,真正推动教育发生革命性变化的产品似乎很少。
胡郁并不认同这个观点,他解释道,很多产品其实表面上看起来差不多,但“里子”还是有差别的。比如讯飞正在做的所有教学内容的知识图谱,全国没有几家能做出来。
而对于 AI+教育的未来,胡郁认为应该围绕学校、老师、家长这三点,满足这三类人的需求。与传统教育相比,AI+教育能够实现因材施教的个性化教学,实现教育界几千年来的追求。
最后,总结起来,实现通用人工智能的道路还不甚明朗。在浩瀚宇宙中,人类不过是沧海一粟,如果把宇宙的历史比作一条线,人类历史充其量算得上是组成这条线的一个小点,而人工智能技术发展史,在这小点上又是一个小到甚至肉眼都看不到的存在。但和世间万物一样,人工智能每时每刻都在发生着微不可查的变化,孕育着一场将要改变人类命运的革命。
实现通用人工智能也许只是人类迈向更高文明的一道门槛,而找到通向峰顶的道路,还需要更多像讯飞一样的先行者,推动 AI 技术不断实现突破。
采访嘉宾:
胡郁,科大讯飞联合创始人、轮值总裁,中国科学技术大学信号与信息处理专业工学博士,教授级高工;国务院特殊津贴专家;科技部新一代人工智能战略咨询委员会委员;科技部863类人智能重点项目首席专家;语音及语言信息处理国家工程实验室执行主任;中科院人工智能产学研创新联盟应用规划组组长;中国科学技术大学兼职教授、博士生导师;中国人工智能学会副理事长,会士;中文信息学会的常务理事;湖畔大学二期学员。
◆
精彩公开课
◆