中国脑计划颠覆性创新之路（下）

2016-12-14 战略前沿技术

中国脑计划颠覆性创新之路（下）

刘锋

人工智能学家（ID：AItists）

七、用互联网与脑科学构建新AI系统模型

在中国脑计划颠覆性创新之路系列文章中，提到通过互联网与脑科学的交叉研究，为预测互联网未来建立了互联网大脑架构体系。这个体系一方面可以表现未来互联网的成熟架构，同时如果将这个结构缩小在计算机软件系统中或芯片中，可以作为一种新的人工智能应用系统模型。

1.用神经元芯片堆积复制人脑的方法和问题

在2009年以色列魏茨曼科学研究所马克拉姆教授第一次向大众描述了他的美好愿景——用超级计算机模拟大脑中860亿个神经元以及100万亿个突触的活动。他向听众许诺，“我们可以在10年内实现这个目标”，还暗示说，这样的数学模型甚至可能拥有意识。马克拉姆还在很多演讲、采访和文章中提到，这样的大脑数学模型将给脑科学研究带来很多突破性进展——如数值模拟可以启发药物研制，取代一些动物实验，或是帮助人们对阿尔茨海默病等神经疾病有更清晰的理解。不仅如此，大脑模型还可以衍生出新的技术，使电脑的计算速度得到提升，或是制造出可以执行复杂任务甚至具备智能的机器人。

尽管很多科学家对马克拉姆的梦想充满怀疑，2013年1月，欧盟还是决定拨给马克拉姆13亿美元，让他用10年时间，模拟出人脑——他的梦想似乎就要成真了。在欧洲，神经科学家对“人类大脑计划”的态度也有着巨大的分歧。2014年7月，一封指责HBP的科学研究和管理方式的公开信很快获得了八百多位科学家的签名。这些科学家还威胁要抵制大脑计划。

除了欧洲脑计划，2014年IBM研发出了名为“TrueNorth”的神经元芯片，它希望从从底层开始模仿人脑的结构，从X光透视图上看，TrueNorth和普通的处理器没有太多区别，TrueNorth的4096个核心之间就使用了类似于人脑的结构，每个核心包含了约120万个晶体管，其中负责数据处理和调度的部分只占掉少量晶体管，而大多数晶体管都被用作了数据存储、以及与其它核心沟通方面。

在这4096个核心中，每个核心都有自己的本地内存，它们还能通过一种特殊的通讯模式与其它核心快速沟通，其工作方式非常类似于人脑神经元与突触之间的协同，只不过，化学信号在这里变成了电流脉冲。IBM把这种结构称为“神经突触内核架构”（neurosynaptic cores）。

从原理上看IBM的神经突触内核架构模拟人工的方式与欧洲脑计划提出的思路原理基本一致。主流科学家认为，即使如马克拉姆梦想的那样，欧洲脑计划通过模拟重现了大脑的细节，这些结果也无法帮助人们理解知觉、记忆、情绪等问题，打个比方，即使我们把一个个原子堆积成了一台电脑，我们对软件的运行原理依然是毫无头绪。

2.类大脑互联网架构为建立新人工智能系统提供新启示

上世纪诞生的互联网对人类社会的影响越来越大，种种迹象表明互联网与脑科学具有紧密的关系。从2005年开始，相关研究提出“互联网将向着与人类大脑高度相似的方向进化，互联网将具备自己的视觉、听觉、触觉、运动神经系统，也会拥有自己的记忆神经系统、中枢神经系统、自主神经系统。另一方面，人脑至少在数万年以前就已经进化出所有的互联网功能，不断发展的互联网将帮助神经学科学家揭开大脑的秘密。“

上述研究启发我们以互联网功能和架构作为参考，能否在超级计算机中构建仿互联网大脑的人工智能系统模型。在构建的过程中，也可以根据互联网的最新发展增加和减少相关功能和架构。这种模型的软件系统也可以集成在芯片中使用。

3.类互联网大脑的人工智能系统模型的实施方法和路径

类互联网大脑的人工智能系统模型的理论基础就是将上述互联网整体类脑模型在超级计算机中实现出来，将目前互联网稳定下来的典型应用和架构有机的结合，用程序和数据库进行模拟，并通过可视化的方法呈现出来。

作为一个庞大的系统，互联网经过近45年的发展，已经包含了成千上万的应用和子系统，而且由于发展迅速，互联网每天也都在出现新的应用，在进行仿互联网大脑模型时，如果把所有的互联网应用和子系统都囊括进去，在实践中很难实现。

因此我们提出选取普及率高，相对成熟的互联网应用建立类互联网大脑的人工智能系统模型应用库（IBML)进行测试，类互联网大脑的人工智能系统模型应用库根据互联网的发展定期进行增加或删减。这样可以规避互联网应用过于繁多，同时消失和出现过于频繁的问题。譬如我们可以建立如下类似的类互联网大脑的人工智能系统模型应用库，示例如下：

IBML={Google，Facebook，Blogger，Amazon，Yahoo，Youtube，Quora，Wikipedia，Twitter，IPv4/IPv6.......}

通过类互联网大脑的人工智能系统模型应用库的建立，在超级计算机中仿造互联网功能和架构就成建立新的人工智能系统模型就成为可能。类互联网大脑的人工智能系统模型的具体建立有一下三个步骤。

步骤一，类互联网大脑的人工智能系统模型的硬件基础 1）大型计算机 2）实验室级别的传感器网络传感器网络将在仿互联网大脑模型中的”神经元“社交网络账号与大脑模型中的其他部分进行进行交互。

步骤二，类互联网大脑的人工智能系统模型的功能实现

1.在该类互联网大脑的人工智能系统模型中建立微型社交网络，维基百科，搜索引擎等功能

2.将微型物联网构建虚拟视觉，听觉，感觉和运动系统关联到该类互联网大脑的人工智能系统模型中

3.运转该类互联网大脑的人工智能系统模型中建立微型社交网络，维基百科，搜索引擎以及微信物联网系统产生大数据

4.将机器学习，深度学习等人工智能算法应用到类互联网大脑的人工智能系统模型中。

步骤三，用数据可视化技术作为交互界面，将服务器中的类互联网大脑的人工智能系统模型运转情况用可视化方式呈现出来，实验人员通过仿社交网络神经元账号进行操控。

研究方法：

对类互联网大脑的人工智能系统模型进行持续改进更新和研究，将互联网和脑科学中的新功能加入到模型中进行检验，对类互联网大脑的人工智能系统模型中的信息和知识库系统进行持续增加，对每个仿社交网络神经元进行人工智能处理和实验人员主动操控处理，观察类互联网大脑的人工智能系统模型的智能特征。

八、建立互联网，AI和大脑的联合智商

一，图灵测试的局限性

测试人工智能系统是否具有智能最著名的方法是“图灵测试”。1950年，图灵发表论文《Computing Machinery and Intelligence》提出了“机器思维”的概念[27,28]，提出一位测试者在与被测试者相互隔离不能进行直接交流的情况下，通过信息传输，和被测试者进行一系列的问答，在经过一段时间后，测试者如果无法根据获取的信息判断对方是人还是计算机系统，那么就可以认为这个系统具有同人类相当的智力能力，也就是说这台计算机是有思维能力的，这就是著名的“图灵测试”（Turing Testing）。

图灵测试并没有定义智能的范畴，而只能作为一个人工智能的充分条件，关于这一点，图灵在论文中写道：

“机器能否拥有智能，为了回答这个问题我们应该首先定义‘机器’和‘智能’。一种可能性是根据大多数普通人的日常理解去定义这两个概念，但这样做是危险的。在这里我并不打算定义这两个概念，可能有人会说这项测试对机器而言过于严格，毕竟人类也无法反过来成功伪装成机器，这只需检查算术的速度和正确度即可辨别。难道被认为拥有智能的机器就不能表现出和人类不同的行为么？这是一个很有力的反对意见，但至少不管怎样，假如我们有能力制造出一个可以成功通过测试的机器的话，也就无需为这个反对意见烦恼了。”

作为被广泛应用的人工智能测试方法，图灵测试经常用来检验机器是否具备人的智能，但总体看，图灵测试的方法受人为因素干扰太多，严重依赖于裁判者和被测试者的主观判断，因此往往有人在没有得到严格验证的情况下宣称其程序通过图灵测试，例如2014年6月英国雷丁大学客座教授凯文•沃维克宣称一款名为“尤金•古特曼（Eugene Goostman）”的计算机软件通过了测试，但是测试结果充满争议，例如机器人只要能够通过30%的评判标准即可被判定通过图灵测试，另外这个计算机软件通过扮演一名年仅13岁，且第二外语为英语的男孩让参与测试的裁判大幅度降低了测试难度。

中国科学院自动化所研究员王飞跃在“关于人工智能九个问题”中也对图灵测试存在的问题进行了讨论，他的意见主要有以下两点：

（1）第一点是人类的智能并不是一个单一的对象，而是有多个类别组成，同样人工智能对应也是多类别组成。图灵测试究竟测试的那些类别并不明确，从实践上看，目前图灵测试仅仅局限在语言智能等特定小领域里，不具备代表性。

（2）图灵测试并不是考官对一台计算机测试后就可以宣布其是否拥有智能，图灵测试的本意是指一个广义的人类做个为整体的考官，其测试的时间段也不是具体的一段时间而是广义的时间段，即所有的人类在所有时间都分辨不出人与机器之后，才算其人类智能与人工智能等价。

从上述讨论可以看出，图灵测试只对人工智能系统是否具有人类智能回答“是”或“否”，并不对人工智能系统的发展水平进行定量分析，而且测试的智能或智力种类还过于单一；在测试方法上存在漏洞，容易被测试者找到漏洞从而产生作弊行为，从上述存在的问题看，图灵测试目前还无法承担定量分析智能系统智力发展水平的需求。

二.图灵测试的局限性导致的争论和误导

因为图灵测试的局限性，导致后来关于人工智能是否超越人类的问题产生了巨大的争议。谷歌技术总监《奇点临近》作者雷·库兹韦尔（Ray Kurzweil）预言人工智能将超过人类智慧。他在书中写道”由于技术发展呈现指数式的增长，机器能模拟大脑的新皮质，到2029年机器将达到人类的智能水平；到2045年人与机器将深度融合，那将标志着奇点时刻的到来[4]” 。

物理学家霍金患有肌萎缩侧索硬化症（ALS），使用英特尔公司开发的一套通信系统和外界交流。这套系统涉及基本的人工智能技术，可以接收霍金的想法，从而提出词语供他选用。当被问到如何改进这套系统的时候，霍金提出了人工智能可以毁灭人类的想法。

霍金表示，截至目前，基础性的人工智能技术已经取得一定成果，很有实用价值。不过，霍金担心，人工智能也许会在将来的某一天赶上甚至超过人类。霍金说：“它自己就动起来了，还能以前所未有的超快速度重新设计自己。人类呢，就要受到缓慢的生物进化的限制，根本没有竞争力，会被超越的。”

特斯拉CEO马斯克对待人工智能的态度比较极端，2014年8月，他在Twitter推荐尼克-伯斯特罗姆的著作《超级智能：方法、危险和策略》时写到：“我们需要超级关注人工智能，它的潜在危险性超过核武器”。

微软创始人比尔·盖茨2015年1月29日在Reddit的“Ask Me Anything”论坛上表示人类应该敬畏人工智能的崛起，它可能将最终构成一个现实性的威胁，但它在此之前会使我们的生活更轻松，他的原话是“我正在关注超级智能。首先在开始的时候机器会为我们做很多工作，这些机器并不是超级智能。如果我们处理得很好的话，这应该是具有积极意义的。那之后的几十年，人工智能会强大到足以引起人们的关注。我同意伊隆·马斯克和其他一些人的说法，不明白为什么有些人并不关心。”

在人工智能威胁论热度日益高涨的情况下，人工智能领域科学家对人工智能威胁论也提出了反驳意见。Facebook人工智能实验室主任，NYU计算机科学教授Yann LeCun 2014年4月在接受IEEE 《Spectrum》采访时发表了对人工智能威胁论的看法，他认为人工智能研究者在之前很长的一段时间都低估了制造智能机器的难度。人工智能的每一个新浪潮，都会带来这么一段从盲目乐观到不理智最后到沮丧的阶段。

Yann LeCun 提出了与威胁论支持者不同的人工智能未来发展路径，他提到大部分人觉得人工智能的进展是个指数曲线，其实它是个S型曲线，S型曲线刚开始的时候跟指数曲线很像，而且奇点理论比指数曲线还夸张，它假设的是渐进曲线，线性、多项式、指数和渐进以及S曲线的动态演变，都跟阻尼和摩擦因子有关系，而未来学家却假设这些因子是不存在的。未来学家生来就愿意做出盲目的预测，尤其是他们特别渴望这个预测成真的时候，可能是为了实现个人抱负。

除了Facebook人工智能实验室主任Yann LeCun，百度首席科学家，斯坦福大学计算机科学系和电子工程系副教授吴恩达，中国科学院自动化所教授，人工智能领域专家王飞跃等也在不同场合对人工智能威胁论提出了反对意见。应该说人工智能威胁论引发争论背后，本质上是人工智能的智力发展水平能不能定量评测的问题。

三.互联网，人工智能和人类大脑的联合智商的提出背景

我们在中国脑计划颠覆性创新之路系列文章中已经阐述，“互联网正在向着与人类大脑高度相似的方向进化，它将具备自己的视觉、听觉、触觉、运动神经系统，也会拥有自己的记忆神经系统、中枢神经系统、自主神经系统。"

于此同时随着博客、社交网络、以及云计算、物联网等技术的兴起，互联网上数据信息正以前所未有的速度增长。互联网用户的互动、企业和政府的信息发布、物联网传感器感应的实时信息每时每刻都在产生大量结构化和非结构化数据，这些数据分散在整个互联网网络体系内，体量极其巨大。这些数据中蕴含了对经济、科技、教育等等领域非常宝贵的信息。这就是互联网大数据兴起的根源和背景。

与此同时，深度学习为代表的机器学习算法在互联网领域的广泛使用，使得互联网大数据开始与人工智能进行更为深入的结合，这其中就包括在大数据和人工智能领域领先的世界级公司，如百度、谷歌、微软等。2011年谷歌开始将“深度学习”运用在自己的大数据处理上，提出了“谷歌大脑”计划[53]。此后百度推出了百度大脑计划，科大讯飞提出讯飞超脑计划。2015年百度创始人李彦宏提出了“中国大脑”计划。

从上述研究和技术趋势看，互联网将形成一个与人类大脑高度相似的互联网大脑结构。既然大脑最显著的特征是具有智力，那么我们有可能借鉴对人类智力的研究方法对互联网大脑和因为互联网而崛起的人工智能的智力问题进行研究，从而形成互联网，人工智能和人类大脑的联合智商 Giq　General intelligence　quotient 。

进行互联网，人工智能和大脑的联合智商问题研究，也将有非常重要的现实意义，这些意义包括帮助基于互联网大数据的人工智能系统提高智能发展水平，发现进一步优化和改良的方法；定量分析人工智能系统与人类测试对照组的智力发展差异等。

四.关于互联网大脑智商的定义

在互联网诞生早期，人们只能通过互联网进行简单的Email通讯，或利用ftp工具上传和下载文件。到2013年，以谷歌为代表的搜索引擎能够高效率的识别自然语言文字，并将搜索结果反馈给用户；苹果公司的Sari系统可以以较高的识别率理解用户的语音指令，并执行相应的操作如拨打电话，报告天气等。

这些现象说明互联网已经开始具备初步的智能并不断增长。由于互联网是由互联网诸多系统或应用组成，譬如电子公告牌、搜索引擎、社交网络、电子邮箱、即时通讯软件（IM）等，这些互联网应用具备或高或低的智力水平，它们的智力水平共同决定了互联网智力水平的高低。

衡量互联网智力水平高低的方式主要有两种，第一种是智力水平最高的那个应用决定互联网智力水平；第二种是各互联网应用联合起来，相互弥补对方不足，共同决定互联网智力水平，从实践看，第二种方式更能客观的反应互联网的智力水平，因此本文将根据第二种方法对互联网的智力水平衡量进行研究。

作为一个庞大的系统，互联网经过近45年的发展，已经包含了成千上万的应用和子系统，由于发展迅速，互联网每天也都在出现新的应用。在进行互联网的智商测试时，如果把所有的互联网应用和子系统都囊括进去，在实践中很难实现。

学习股票指数选取样本企业的方法，我们可以选取普及率高、相对成熟的互联网应用建立互联网智商标准评测库进行测试，互联网智商标准评测库根据互联网的发展定期进行增加或删减。这样可以规避互联网应用过于繁多，同时消失和出现过于频繁的问题。譬如我们可以建立如下类似的互联网智商标准评测库（IA），示例如下：

IA={Google，Facebook，Blogger，Amazon，Yahoo，Youtube，sina，Quora，Wikipedia，Twitter，Baidu}

通过互联网智商标准评测库（IA）的建立，测试整个互联网在某一时间点的智商也就成为可能。进行测试时，一个测试题如果评测库中有一个应用能够通过。则认为整个互联网能够通过该题测试；如果所有应用都无法通过该题测试，则认为整个互联网目前无法通过该测试题。根据以上研究思路，参考前人关于智商的研究成果，本文提出互联网和互联网应用系统的智商定义：

定义一：互联网应用智商IQ，是通过一系列标准测试，测量某一个互联网应用（如电子公告牌、搜索引擎、社交网络、电子邮箱、即时通讯软件等）在测试时间点的智力发展水平，也就是该实时间点该应用的互联网应用智商。

定义二：互联网智商IQ，是通过一系列标准测试对互联网智商标准评测库（IA）进行测量，将测试结果加权平均后，得出互联网在被测试时间点的智力发展水平，也就是该时间点的互联网智商。

五.互联网，AI和大脑的联合智商的模型建立和测试方法

人工智能定量评测目前面临两个重要挑战：第一，人工智能系统目前没有形成统一的模型；第二，人工智能系统与以人类为代表的生命体之间目前没有形成统一的模型。

这两个挑战都指向了同一个问题，即对于所有的人工智能系统和所有生命体（特别是以人类为代表的生命体）需要有一个统一的模型进行描述，只有这样才能在这个模型上建立智力测量方法并进行测试，从而形成统一的、可进行相互比较的智力发展水平评价结果。

从2014年开始，中国科学院虚拟经济与数据科学研究中心，北京交通大学研究团队针对如何定量分析互联网，AI和大脑的联合智商进行了研究，研究参考了冯·诺伊曼结构、戴维·韦克斯勒人类智力模型、知识管理领域DIKW（Data, Information, Knowledge, Wisdom，数据、信息、知识、智慧）模型体系等。我们分别在2014年和2015年发表论文提出建立“标准智能模型”，统一描述人工智能系统和人类的特征和属性。

其中，冯·诺伊曼结构的启发是：标准智能系统模型应包含输入/输出系统，能够从外界获取信息，能够将内部产生的结果反馈给外部世界。只有这样，标准智能系统才能成为“活”的系统。

戴维·韦克斯勒关于人类智能的定义给我们的启发是：智力能力由多个要素组成，而非图灵测试或视觉图灵测试那样只关注智力能力的一个方面。

DIKW模型体系的启发是：智慧是一种解决问题、积累知识的能力；而知识是人类不断与外界交互后沉淀下来结构化的数据和信息。一个智能系统不仅仅要掌握知识，更重要的是还要有解决问题的创新能力。这种对知识的掌握能力、解决问题的创新能力与戴维·韦克斯勒理论、冯·诺伊曼架构相结合，就可以形成智能系统智力能力的多层次结构“标准智能模型”，这个模型对于建立互联网，AI和大脑的联合智商奠定了理论基础。如下图所示。

根据上述研究，可提出标准智能系统的判定标准：任何系统（包括互联网大脑，人工智能系统、人类等生命系统），如果符合如下特征，就可以认为这个系统属于标准智能系统。

● 特征1：能通过声音、图像、文字等方式（包括但不限于这三种方式）从外界获取数据、信息和知识的能力。

● 特征2：能够将从外界获取的数据、信息和知识转化为系统掌握的知识。

● 特征3：能根据外界数据、信息和知识所产生的需求，通过运用所掌握的知识进行创新的能力。这些能力包括但不限于联想、创作、猜测、发现规律等，这种能力运用的结果可以形成自身掌握的新知识。

● 特征4：能够通过声音、图像、文字等方式（包括但不仅限于这三种方式）将系统产生的数据、信息和知识反馈给外界或对外界进行改造。

2014年，中国科学院虚拟经济与数据科学研究中心，北京交通大学研究团队在标准智能模型的基础上构建了互联网，AI和大脑智商评测量表。从信息或知识的输入、输出、掌握和创新等四大方面建立人工智能智商评价体系，并在此基础上建立图像、文字、声音识别、常识、计算、翻译、创作、挑选、猜测、发现等十五个小类，形成互联网，AI和大脑评测量表。用这个对世界50个搜索引擎和3类不同年龄段人群进行了“互联网，AI和大脑联合智商测试”，测试结果发现目前人工智能系统的智商远远低于人类智商，评测最高的谷歌系统尚不及6岁儿童智商的一半，见表1。

2016年2月，中国科学院大学刘颖团队开展“2016年互联网，AI和大脑智商测试”，目前已对谷歌、百度、搜狗等人工智能系统以及苹果Siri、微软小冰等进行了测试，工作还在进行中。不过从已完成的工作看，谷歌、百度等人工智能系统的性能比两年前已有大幅提高，但仍与6岁儿童有较大差距。

九、从AI、互联网到大脑的7个智能分级

中国脑计划颠覆性创新之路八，扩展冯诺依曼架构，从AI，互联网到大脑的7个智能分级

我们在中国脑计划颠覆性创新之路七中，提出建立人工智能，互联网和人类大脑的联合智商问题，并建立描述人工智能，互联网和人类大脑共同特征的标准智能模型，根据这个模型，我们在本文将对冯诺依曼架构进行扩充，以此为基础，对人工智能，互联网和人类大脑等诸多智能系统进行分级处理，这个研究对于探讨智能系统的未来发展方向起到引导作用，并为中国脑计划颠覆性创新之路第九章关于生命进化方向问题研究奠定基础。

2015年以来，“人工智能”成为科技界和产业界最热门的词语。智能冰箱、智能空调、智能手表和智能机器人，还有谷歌、百度各自的人工智能大脑等新产品不断涌现。但与此同时，人工智能威胁论也甚嚣尘上。我们能否通过研究人工智能产品和系统的智商发展水平并与人类智商进行对比，从而为解决人工智能威胁论问题寻找定量的分析方法呢？

标准智能模型和人工智能智商测试

从2014年开始，中国科学院虚拟经济与数据科学研究中心和北京交通大学团队针对如何定量分析人工智能与人类智慧的关系进行了研究，研究参考了冯·诺伊曼结构、戴维·韦克斯勒人类智力模型、知识管理领域DIKW（Data, Information, Knowledge, Wisdom，数据、信息、知识、智慧）模型体系等。分别在2014年和2015年发表论文提出建立“标准智能模型”，统一描述人工智能系统和人类的特征和属性。

其中，冯·诺伊曼结构给我们的启发是：标准智能系统模型应包含输入/输出系统，能够从外界获取信息，能够将内部产生的结果反馈给外部世界。只有这样，标准智能系统才能成为“活”的系统。

戴维·韦克斯勒关于人类智能的定义给我们的启发是：智力能力由多个要素组成，而非图灵测试或视觉图灵测试那样只关注智力能力的一个方面。

DIKW模型体系给我们的启发是：智慧是一种解决问题、积累知识的能力；而知识是人类不断与外界交互后沉淀下来结构化的数据和信息。一个智能系统不仅仅要掌握知识，更重要的是还要有解决问题的创新能力。这种对知识的掌握能力、解决问题的创新能力与戴维·韦克斯勒理论、冯·诺伊曼架构相结合，就可以形成智能系统智力能力的多层次结构“标准智能模型”，如图1所示。

根据上述研究，可提出标准智能系统的判定标准：任何系统（包括人工智能系统、人类等生命系统），如果符合如下特征，就可以认为这个系统属于标准智能系统。

● 特征1：能通过声音、图像、文字等方式（包括但不限于这三种方式）从外界获取数据、信息和知识的能力。

● 特征2：能够将从外界获取的数据、信息和知识转化为系统掌握的知识。

● 特征4：能够通过声音、图像、文字等方式（包括但不仅限于这三种方式）将系统产生的数据、信息和知识反馈给外界或对外界进行改造。

2014年，我们在标准智能模型的基础上构建了人工智能智商评测量表。从信息或知识的输入、输出、掌握和创新等四大方面建立人工智能智商评价体系，并在此基础上建立图像、文字、声音识别、常识、计算、翻译、创作、挑选、猜测、发现等十五个小类，形成人工智能智商评测量表。我们对世界50个搜索引擎和3类不同年龄段人群进行了“人工智能智商测试”，测试结果发现目前人工智能系统的智商远远低于人类智商，评测最高的谷歌系统尚不及6岁儿童智商的一半，见表1。

2016年2月，我们和中国科学院大学刘颖团队开展“2016年人工智能智商测试”，目前已对谷歌、百度、搜狗等人工智能系统以及苹果Siri、微软小冰等进行了测试，工作还在进行中。不过从已完成的工作看，谷歌、百度等人工智能系统的性能比两年前已有大幅提高，但仍与6岁儿童有较大差距。

扩展的冯·诺伊曼架构

标准智能模型的建立参考了冯·诺伊曼架构。冯·诺伊曼架构由计算器、逻辑控制装置、存储器、输入系统和输出系统五个部分构成。通过对比图1和图2的差别能够发现，冯·诺伊曼架构可以补充两个部分。通过这种补充，我们得以将人、机器以及人工智能系统用一个更为明晰的方式表示出来。

第一个补充是创新创造功能，即能够根据已有的知识，发现新的知识元素和新的规律，使之进入到存储器，供计算机和控制器使用，并通过输入/输出系统与外部进行知识交互。第二个补充是能够进行知识共享的外部知识库或云存储器，而冯·诺伊曼架构的外部存储只为单一系统服务。因此，对冯·诺伊曼架构进行扩展，可形成新的架构（见图3）。

人工智能系统智能等级分级标准

在研究的过程中还发现，无论在自然界还是人类社会，即使是智商相同的人工智能系统，因其所在关键领域仍然存在巨大差异，也都存在智能和知识的分级现象。譬如，蚂蚁、鱼、猴子和人类，虽然都属于生命系统，但其种群个体都存在智能的差异。人类的教育体系也存在分级，例如本科、硕士、博士的分级。等级内部进行考核区分优劣，但在不同等级间，需要在知识、能力、资历上有明显提升和考核才能升级。

回到人工智能系统的智商测试上，应如何区分智能系统因在关键领域功能不同而产生的巨大差异呢？上述研究中提到的“标准智能模型”（扩展的冯·诺伊曼架构）给了我们启发，判断标准如下：

● 能不能和测试者（人类）进行信息交互，也就是有没有输入/输出系统；

● 系统内部有没有能够存储信息和知识的知识库；

● 这个系统的知识库能不能不断更新和增长；

● 这个系统的知识库能不能与其他人工智能系统进行知识共享；

● 这个系统除了从外部学习并更新自己的知识库之外，能不能主动产生出新的知识并分享给其他人工智能系统。

人工智能系统的7个智能等级分级

对于人工智能系统的第0级系统，其基本特征在理论上存在，但现实中并不存在这样的人工智能系统。在扩展的冯·诺伊曼架构延伸出来的分级规则中，可以做一些组合，例如可以信息输入，但不能信息输出；或者可以信息输出，但不能信息输入；或者可以创新创造，但知识库不能增长。对于这些在现实中不能或无法找到对应系统范例的案例，我们将其统一划归到“人工智能系统的第0级系统”，也可以叫“人工智能系统的特异类系统”。

对于人工智能系统的第1级系统，其基本特征是无法与人类测试者进行信息交互。例如有一种被称为泛灵论的思想认为天下万物皆有灵魂或自然精神，一棵树和一块石头都和人类一样，具有同样的价值与权利。当然，这种观点从科学的角度看，只能算作猜想或哲学思考。从“能不能和测试者（人类）进行信息交互”的分级规则看，因为石头等物体不能与人类进行信息交互，也许它内部有知识库，能够创新知识，或者能够与其他石头进行信息交互，但对人类测试者来说则是黑箱，不能让人了解。因此不能与测试者（人类）进行信息交互的物体和系统可以定义为“人工智能系统的第1级系统”，符合第1级分类的范例有石头、木棍、铁块以及水滴等等不能与人类进行信息交互的物体或系统。

对于人工智能系统的第2级系统，其基本特征是能够与人类测试者进行交互，存在控制器和存储器，即冯·诺伊曼架构描述的系统，因此很多家用电器被称作智能家电，如智能冰箱、智能电视、智能微波炉和智能扫地机。这些系统大多有一个特点，即虽然它们内部或多或少有控制程序信息，但一旦出厂，就无法再更新它们的控制程序，不能进行升级，更不会自动地学习或产生新的知识。譬如智能洗衣机，人们按什么键，洗衣机就启动什么功能。从购买到损坏，其功能都不会发生变化（故障除外）。这种系统能够与人类测试者和使用者进行信息交互，符合冯·诺伊曼架构描述的特征，而且它的控制程序或知识库从诞生时起就不再发生变化，这种系统可以定义为“人工智能系统的第2级系统”，范例包括日常见到的扫地机器人、老式的家用电冰箱、空调、洗衣机等等。

对于人工智能系统的第3级系统，其基本特征是除具备2级系统的特征外，其控制器、存储器中包含的程序或数据可不联网进行升级或增加。例如家用电脑和手机是我们常用的智能设备，它们的操作系统往往可以定期升级。例如，电脑的操作系统可从Windows1.0升级到Windows10.0，手机的操作系统可从Android1.0升级到Android5.0，这些设备的内部应用程序也可以根据不同的需要不断更新升级。这样，家用电脑、手机等设备的功能会变得越来越强大，可以应对的场景也越来越多。除了家用电脑，很多家用电器、机器人也都开始留有接口，可以通过外接设备进行系统升级。这一类系统明显比第2级智能系统适应性更强。这种系统能够与人类测试者、使用者进行信息交互，但不能与其他系统通过“云端”进行信息交互，其控制程序或知识库只能接受USB、光盘等外接设备进行程序或信息升级的系统，可以定义为“人工智能系统的第3级系统”，范例包括智能手机、家用电脑、单机版的办公软件等。

对于人工智能系统的第4级系统，其基本特征除了包含3级系统的特征外，最重要的是可以通过网络与其他智能系统共享信息和知识。2011年欧盟资助了一个叫作RoboEarth的项目，该项目旨在让机器人可以通过互联网分享知识。帮助机器人相互学习、共享知识，不仅能够降低成本，还会帮助机器人提高自学能力、适应能力，推动其更快、更大规模地普及。云机器人的这些能力提高了其对复杂环境的适应性。这类系统除了具备3级系统的功能，还多了一个重要的功能，即信息可以通过云端进行共享，因此这种系统能够与人类测试者、使用者进行信息交互，可以通过“云端”进行信息交互，进行程序或信息升级。但这类系统所有的信息都是直接从外部获得，其内部无法自主地、创新创造性地产生新的知识。这种系统可以定义为“人工智能系统的第4级系统”，范例包括谷歌大脑、百度大脑、RoboEarth云机器人、B/S（Browser/Server，浏览器/服务器）架构的网站等。

对于人工智能系统的第5级系统，最基本的特征就是能够创新创造，识别和鉴定创新创造对人类的价值，以及将创新创造产生的成果应用在人类的发展过程中。我们在扩展的冯·诺伊曼架构时，对原来的冯·诺伊曼架构增加了创新知识模块，就是试图把人纳入到扩展的人工智能系统概念中，人类可以看作是大自然构建的特殊“人工智能系统”。与前四个等级不同，人类等生命体最大的特征就是可以不断地创新创造，如发现万有引力、元素周期表，撰写出新小说，创造新的音乐、画作等等，然后通过文章、信件、电报，甚至互联网进行传播和分享。不断地进行创新创造，并能够识别创新创造对自身的用处，这让人类占据了地球生态环境下的智力制高点。因此，这种系统能够与人类测试者使用者进行信息交互，可以创新创造出新的知识，并可以通过文章、信件、电报甚至互联网这样的“云端”进行信息交互，这种系统可以定义为“人工智能系统的第5级系统”。人类是第5级人工智能系统最突出的范例。

对于人工智能系统的第6级系统，最基本的特征就是随着时间的向前推进，并趋向于无穷点时，不断创新创造产生新知识的智能系统其输入输出能力，知识的掌握和运用能力也将趋近于无穷大，按照基督教对于上帝的定义“全知和全能”，可以看出智能系统在不断创新创造和不断积累知识的情况下，在足够的时间里以人类为代表的智能系统将最终实现“全知全能”的状态，从这个角度看，无论是东方文化的”神“，或西方文化中的“上帝”概念，从智能系统发展的角度看，可以看作是智能系统（包括人类）在未来时间点的进化状态。

谷歌AlphaGo属于智能的第几等级

2016年3月，谷歌AlphaGo（阿尔法狗）与韩国围棋世界冠军李世石进行了举世瞩目的围棋比赛，并以大比分获得胜利。那么AlphaGo属于人工智能系统的第几级？我们可以根据上述规则进行评定。

因为AlphaGo可以与棋手进行比赛，具有庞大的运算系统和数据存储系统，因此具备第2级系统的条件。在谷歌的研发过程中，AlphaGo的策略训练模型版本通过不断进行大量数据训练而不断升级，从2016年1月与欧洲冠军对战，到2016年3月与韩国围棋世界冠军李世石比赛，AlphaGo的软硬件系统也获得很大提升，因此AlphaGo具备了第3级系统的条件。

从公开的资料看，AlphaGo虽然可以通过网络实现大量CPU和GPU协同工作，但由于保密性或阶段性问题，谷歌目前还没有在互联网上开放AlphaGo程序接受用户的在线挑战，因此AlphaGo不具备第4级智能系统条件。

关于AlphaGo是否具备创新创造性问题，我们认为它依然是依托人工支持的大数据训练形成的策略模型，同时在比赛中结合比赛对手的落点数据，根据其内部的运算规则，来不断形成自己的落点数据，这些落点数据最终形成比赛数据集合。AlphaGo根据围棋规则与对手的比赛数据集合进行计算和比较，判断输赢，整个过程完全在人类设定的规则下运行，无法体现其自身的创造性，如图4所示。

即使AlphaGo形成的落点数据集合很可能是人类历史上没有出现过的，也不能说明AlphaGo具备了独立的创新创造功能。例如，我们用计算机程序实现下述过程：从1万到100万的自然数中随机选取两个数进行相乘，记录相乘结果，重复此过程361次，即使得出的自然数集合很大，并且可能是人类历史上没有出现过的，我们也不能认定该计算机程序具有创新创造性。

如果AlphaGo在没有人类提供数据的情况下，能够主动获取棋谱，自动设计程序进行模拟对战，学习经验，并用于改变自己的训练模型，用于实战比赛，战胜对手，那么在这种情况下，我们才可能认为AlphaGo具备创新性。但从人工智能的发展过程看，AlphaGo还完全无法实现这一点。因此，综合来看，AlphaGo的智能等级被评定为3级，与人类相差两个级别。

工作意义和后续工作

对人工智能系统进行智商测试和智能等级分级，有助于我们更好地对这些智能系统进行分类和评判，同时为低等级智能系统的发展方向提供支持。

根据上述研究我们可以每年利用人工智能智商测试方法对相关智能系统进行测试，以此为基础分析不同测试对象的人工智能智商的发展状况，从而发现这些同类产品在人工智能领域的发展差异，测试数据对于这些产品研究竞争对手发展趋势将具有实用价值。另一方面，每年根据测试结果，选取智商最高的人工智能系统和人类测试者智商作为代表，标注在图6.1上。以此作为判断人工智能与人类智慧未来发展关系的基础，从而作为判断前文提到的两条人工智能发展曲线究竟那一条更符合客观事实。

进化的方向，突破达尔文进化论局限

前言：本文是中国脑计划颠覆性创新之路的第九篇文章，本文从脑科学，互联网和人工智能三个角度探讨了生命进化的方向和目标问题。本文是中国脑计划颠覆性创新之路最后一篇文章，但不是结束。相反，这篇文章提出生命进化的方向性问题是一个新的重要课题。它将可以延伸出更为广阔的空间。某种意义上，这篇文章也可以算作新研究的开篇

一.达尔文进化论关于生物进化没有方向的观点

19世纪中叶，达尔文创立了科学的生物进化学说，以自然选择为核心的达尔文进化论作为人类科学史最伟大的理论之一。统一了生物学的各个学科。达尔文进化论的影响不仅仅局限在生物学领域，也提供了一种全新的世界观、生命观、宇宙观和方法论，对几乎所有的科学和人文领域产生影响。

达尔文的进化论排斥了目的论（这被迈尔赞誉为其伟大的贡献之一），达尔文主张变异是随机的，用比上帝一点也不逊色的“自然”一词来解释其所精心构建的进化理论的核心。但是，达尔文也有其困惑和无奈，他感叹道“这广阔无垠、奇妙无比的宇宙……竟然是盲目的机遇或必然的产物感到非常难于甚至无法理解”(2-谢平. 2014. 生命的起源—进化理论之扬弃与革新.北京：科学出版社)

达尔文进化论认为生物进化并不是从低级到高级的进化，人类并不比其他生物高级，达尔文把生物进化过程设想成一棵不断地生长、分支的大树，现存的所有生物都位于这棵树的某个小分支的顶端，很难说哪一种更高级，在同时存在的生物种类之间作高低级的比较是没有意义的。进化没有预定的方向，进化树不存在一个以人类为顶端的主干，人类只是进化树上一个普普通通的分支。从达尔文进化论的角度看，人并不比老鼠，蚂蚁更为高级，人类并不能代表生物的发展方向。

二.从脑科学，互联网和人工智能分别阐述生命的进化方向问题

达尔文进化论关于生命没有方向的观点在新的科技进展下会不会有新的进展和突破。我们下面分别从脑科学，互联网和人工智能的研究进展探讨这个问题。提出脑科学，互联网和人工智能的进展将联合从不同角度展示出生命进化的方向和目标。

1.从脑的结构进化看生命的进化方向问题

诺贝尔奖获得者澳大利亚科学家John.C.Eccles在其著作《脑的进化》中就提到“生物的大脑是从鱼的大脑进化到爬行动物的大脑，再进化到哺乳动物的大脑，最后进化到人类的大脑。如果解剖人脑，我们可以清晰的看到类鱼、类爬行动物、类哺乳动物的结构在人脑中泾渭分明。“。

虽然生物的表现形式千差万别，但生物的核心-大脑确表现出明显的方向性，从单细胞到人类，大脑越来越复杂，智慧程度越来越高。到达人类这个最高点之后，生物的的进化出现新的形式，人通过互联网联合在一起共同进化。

2.从互联网的结构进化看生命的进化方向问题

在前面的系列文章中，提到关于互联网进化研究有这样的结论“互联网将向着与人类大脑高度相似的方向进化，它将具备自己的视觉、听觉、触觉、运动神经系统，也会拥有自己的记忆神经系统、中枢神经系统、自主神经系统。

另一方面，人脑至少在数万年以前就已经进化出所有的互联网功能，不断发展的互联网将帮助神经学科学家揭开大脑的秘密。科学实验将证明大脑中也经拥有Google一样的搜索引擎，Facebook一样的SNS系统，IPv4一样的地址编码系统，思科一样的路由系统。。。”

当生物进化到人这个程度之后，人类通过互联网联合在一起共同进化。而这种共同进化的结果是。连接了人类的互联网，在结构上与大脑一步步走向高度相似，在空间上随着人类的扩张不断向外太空蔓延，如果有足够的时间，可以预见到在无穷时间点，宇宙，大脑，和互联网三者将合为一体，进化成为宇宙大脑或智慧宇宙。

达尔文进化论的结论是向前推导的，即生物有共同的祖先，通过自然选择，人这种物种出现了。互联网进化论的结论是向后推导的，认为人通过自己创造的技术和工具互联网向着宇宙大脑或智慧宇宙的方向进化。“人“这个要素将互联网的进化和生物的进化连接起来。

3.从人工智能发展的智力等级看生命的进化方向问题

在中国脑计划颠覆性创新之路第八章中提到，基于对冯诺依曼架构的扩展，人工智能发展的智力等级可以分为7个等级，分别是：

1.人工智能系统的第0级系统，其基本特征在理论上存在，但现实中并不存在这样的人工智能系统。

2.人工智能系统的第1级系统，其基本特征是无法与人类测试者进行信息交互。

3.人工智能系统的第2级系统，其基本特征是能够与人类测试者进行交互，存在控制器和存储器，即标准的冯·诺伊曼架构描述的系统

4.人工智能系统的第3级系统，其基本特征是除具备2级系统的特征外，其控制器、存储器中包含的程序或数据可不联网进行升级或增加。

5.人工智能系统的第4级系统，其基本特征除了包含3级系统的特征外，最重要的是可以通过网络与其他智能系统共享信息和知识。

6.人工智能系统的第5级系统，最基本的特征就是能够创新创造，识别和鉴定创新创造对人类的价值，以及将创新创造产生的成果应用在人类的发展过程中。

7.人工智能系统的第6级系统，最基本的特征就是随着时间的向前推进，并趋向于无穷点时，不断创新创造产生新知识的智能系统其输入输出能力，知识的掌握和运用能力也将趋近于无穷大。

对于第六级智能系统，按照西方对于上帝的定义“全知和全能”，可以看出智能系统在不断创新创造和不断积累知识的情况下，在足够的时间里以人类为代表的智能系统将最终实现“全知全能”的状态，从这个角度看，无论是东方文化的”神“，或西方文化中的“上帝”概念，从智能系统发展的角度看，可以看作是智能系统（包括人类）在未来时间点的进化状态。

三.知识和智慧的提升是生物进化的方向，全知全能是生物进化的目标

从上面的阐述看，无论是脑的架构进化，互联网的架构进化，人工智能系统的智力等级进化都表现出明显的方向性。对于这三个领域，他们的共同点都是承载着生命的知识和智慧，并不断进化和提升，达尔文进化论认为生物进化并不是从低级到高级的进化，人类并不比其他生物高级，正是因为没有注意到知识和智慧的提升和进化才是生物进化的本质，只有从知识和智慧的角度才能发现生物进化的方向和生物等级的高低之分。

生物种群知识库的膨胀速度是生物进化的焦点，其它生物的知识库停滞，走向死胡同，因此在千万年里没有进一步的变化，在地球的生命圈中也处在越来越低的地位。而人类在进1万年里，恰恰在知识和智慧的领域不断扩展和加速，并因为互联网和人工智能的发明而得到进一步巨大飞跃，从而获得了地球自然竞争的统治地位。

生物进化的方向就是用不断扩大种群的知识库和改造自然的能力，目标是实现对整个自然（生命圈，宇宙）的全知全能。本文研究并不是认为生物进化的这个方向和目的是神有意识的推动，而是另有原因。包括如何定量分析生物进化的方向和目标，突破达尔文进化论这一局限会对其他科学和社会领域产生什么样的影响。我们将在后续的文章不断提出和阐述。

一网打尽系列文章，请回复以下关键词查看：

热点专题：军民融合 | 民参军 | 工业4.0 | 商业航天 | 智库 | 国家重点研发计划 | 基金 | 装备采办 | 博士 | 摩尔定律 | 诺贝尔奖 | 国家实验室 | 国防工业 | 十三五

预见未来：预见2016 | 预见2020 | 预见2025 | 预见2030 | 预见2035 | 预见2045 | 预见2050 |

前沿科技：颠覆性技术 | 生物 | 仿生 | 脑科学 | 精准医学 | 基因 | 基因编辑 | 虚拟现实 | 增强现实 | 纳米 | 人工智能 | 机器人 | 3D打印 | 4D打印 | 太赫兹 | 云计算 | 物联网 | 互联网+ | 大数据 | 石墨烯 | 能源 | 电池 | 量子 | 超材料 | 超级计算机 | 卫星 | 北斗 | 智能制造 | 不依赖GPS导航 | 通信 | MIT技术评论 | 航空发动机 | 可穿戴 | 氮化镓 | 隐身 | 半导体 | 脑机接口

先进武器：中国武器 | 无人机 | 轰炸机 | 预警机 | 运输机 | 战斗机 | 六代机 | 网络武器 | 激光武器 | 电磁炮 | 高超声速武器 | 反无人机 | 防空反导 | 潜航器 |

领先国家：俄罗斯 | 英国 | 日本 | 以色列 | 印度

前沿人物：钱学森 | 马斯克 | 凯文凯利 | 任正非 | 马云

专家专栏：黄志澄 | 许得君 | 施一公 | 王喜文 | 贺飞 | 李萍 | 刘锋 | 王煜全 | 易本胜 | 李德毅 | 游光荣 | 刘亚威 | 赵文银 | 廖孟豪

全文收录：2016文章全收录 | 2015文章全收录 | 2014文章全收录

其他主题系列陆续整理中，敬请期待……

法明传[2024]173号：1月1日起，未用示范文本提交起诉状，部分法院将不予立案

突然意外坠落！2人身亡！

中美友好合作故事——十万名中国弃婴长大了

中美友好合作故事——十万名中国弃婴长大了

中美友好合作故事——十万名中国弃婴长大了