查看原文
其他

可深了 | 科学将人工智能拖下神坛【二】AlphaGo的失败

2017-09-21 李可 吹IP



引子


人工智能是科学的产物,是当今炙手可热面向未来的技术,它承载着人们对技术颠覆生活的下一个期盼和恐惧。本咨询师充分肯定人工智能技术将超乎我们想象的巨大价值和威力;同时,否定公众对之神化的不科学认识。

本咨询师注意到公众中的很多人已经将人工智能的能力大大的神化,超出了其在科学范畴内可能的能力,很多从事思想、智能性工作的人因此对职业前途产生了极大的不安全感。客观上,尽管人工智确实也会给不少思想、智能性工作岗位带来不同程度的冲击,这当中的很大一部分确属杞人忧天。

本咨询师籍此系列文章发表管见以抛砖引玉,希望我们能对人工智能这一科学的产物持有客观的认识,褪去神光,还其本来而面目。这样,有助于我们对人工智能给各行业带来的可能变革有一个更科学的预期,至少减少一些不科学的误判和烦扰。本咨询师将以最熟悉的专利代理行业为主要分析实例。本咨询师相信,这也是对人工智能健康发展的支持和爱护。

系列文章的第一篇可深了 | 科学将人工智能拖下神坛【一】智能的本来面目,已经提出了一些主要观点,并对其中的一部分进行了阐释。本篇开始继续进行必要的阐释和发展,以首先能对人工智能的能力边界有更清楚的定性认识。

后续篇章在此基础上继续尝试主要以专利代理行业中的翻译、撰写、答复审查意见、侵权判定等专业工作为例进行讨论,争取就人工智能在可预见的未来对专利代理行业可能造成的冲击提出自己的认识。期望对其他行业也有启示。

 

 观点总结 

 

关于真正的(人工)智能

  • 智能并不排斥利用算法、程序、规则、逻辑,但智能的精粹在于不依照这些来解决问题的能力。(本篇中阐释)

  • 智能所必须的自主意识,意味着自我选择是否执行指令的能力。

  • 智能,意味着在涉及智能、思想、创造性的工作中走完最后一公里的能力。当工作中涉及的智能、思想、创造性的程度比较深时,可能任务的全程只有1.5公里,或者更短。

 

关于当今的二进制“人工智能”或伪人工智能

  • 不具备真正的自主意识、从而也不具备真正的自学习能力。(阐释于第一篇:“智能的本来面目”,本篇中继续阐释)

  • 所谓智能决策仅只是众多输入项加权得到输出。经过再复杂的算法包装依然如此。(阐释于第一篇:“智能的本来面目”,本篇中继续阐释)

  • 能力止步于思想之外。(本篇中阐释)

  • 没有棋谱作为答案的问题,阿狗所代表的深度学习解决不了。(本篇中阐释)

  • “人工智能”机器所交付的工作结果,仅是有时看起来与人智能工作得出的结果类似,但机器实际所用的操作流程与人的智能解决思路完全不一样。(本篇中阐释)

  • 机器没有智能或创造性,只能按步骤完成体力工作。设计这些精妙的步骤需要智能,这项工作只能由人完成的。机器的能力更强大,仅是因为计算技术的进步使机器可以执行更复杂的套路。(本篇中阐释)

 

为什么二进制“人工智能”不能与智能同日而语

  • 算法和程序有其局限性,只能解决一部分问题。而将思想、智能以算法、程序、套路来穷尽的想法是不切实际的,哪怕只将任务限定在仅涉及思想和智能灵动之魂的一个小领域。(本篇中阐释)

 

我们的误区

  • 对人工智能不科学的朴素认识,加上人对它的拟人化想象,是公众对人工智能产生不科学认识和想象的主要根源。对技术了解不全面也起了推波助澜的重要作用。(本篇中阐释)

  • 世间大量问题牵扯的因素太过复杂,与19X19小格子中的单纯算法规则下的问题有质的区别,即使我们看来依靠智能很简单就可解决的问题,也常常难以实现有效的算法或套路转化,这其中的难度通常被人大大的低估。(本篇中阐释)

  • 我们看低了智能的威力,看高了计算机的计算能力:智能的简单决策是每秒多少亿次计算能力下的穷举计算所望尘莫及的。(本篇中阐释)

 

人工智能的出路

  • 真正的人工智能终将实现,但须在二进制计算技术之外另辟革命性的新智能决策技术路径。

 

 谁的胜利 

 

AlphaGo,阿尔法狗,呢称阿狗。

阿狗已经载入史册,它是掀起当今人工智能大潮的发令枪。顶着人工神经网络和深度学习的神光环,阿狗立于神坛之顶,召唤着新科技时代的到来。

本咨询师要说的恰恰相反:阿狗其实很笨。它在证明了人的智能有多么强大之外,只能证明人工智能技术的脆弱。

一年前,人类的冠军在围棋上输给了阿狗;四十年前,人在口算上输给了计算器;二百多年前,人在跑步和载重上输给了汽车。今天,本咨询师将告诉大家,它们其实没有质的区别,从阿狗到汽车,它们都不具备智能,所以从来还没有人在智能上败给机器。相反,它们都是人的智能的成果,是帮助人类的有力工具,是人的智能的胜利。

 

 最有利战场上迟来的胜利 

 

棋类博弈,对计算技术及其支持下的人工智能而言是最有利的战场:因为棋类规则可以简单地100%无损转化为清晰的数学问题或者算法问题,完全落入计算技术和人工智能的强势能力范围之内。

提示:世间的大量问题因为牵扯的因素太过复杂,是无法在不损失信息的情况下清晰转化为数学问题或者算法问题的。当强行对这种问题进行算法转化以数学模型来表示时,必然因认知不足和不可行,导致数学模型不同程度地丢失原有信息和因素,甚至丢失关键信息和因素。这其中的难度通常被人大大的低估,即使我们看来很简单的问题,也常常难以实现有效的算法转化。

与阿狗下棋,根本上是在数学问题或者算法问题上,由人的智能与超级计算机来对战。你还觉得计算机很强吗?不过阿狗不会脸红。

在棋类问题上,计算机凭借着其超级计算能力,有一种简单粗暴的计算策略:穷举。也就是将规则之下所有可能的应手都算下去,然后从中选出结果最好的那步。我们已经有了运算速度达到12.5亿亿次/秒的超级计算机,而围棋的棋盘只是19X19的小格子,三百多个交叉点而已。二十年前,计算机“深蓝”打败了国际象棋世界冠军,而一年前,阿狗才征服了围棋。这个不值得骄傲的胜利来得太晚了吧?不过阿狗不会脸红。

等一下,其实有一个小小的认识误区:19X19小格子穷举的计算量太大,并不是阿狗不想采取这种简单粗暴、大巧似掘的计算策略,而是现在超级计算机的运算能力还搞不定。

阿狗之父杰米斯·哈萨比斯曾讲到:围棋只有两个非常简单的规则,而其复杂性却是难以想象的,一共有10170(10的170次方)种可能性,这个数字比整个宇宙中的原子数1080(10的80次方)都多的去了,是没有办法穷举出围棋所有的可能结果的。我们需要一种更加聪明的方法。

提示:

  • 看似简单的问题转化成算法、计算问题后所需要的计算量常常被我们大大的低估。

  • 我们看低了智能的威力,看高了计算机的计算能力:简单智能决策的威力是每秒多少亿次计算能力下的穷举计算所望尘莫及的。

  • 我们对机器常有的不科学的拟人化想象,会使我们以上的错误认识大大加剧:其中的关键是我们误以为并不具备真正智能的机器有了智能,尽管它们看起来满聪明。

 

 阿狗 “智能”策略介绍 

 

如阅读此节内容有困难,建议直接跳至下节:阿狗“智能”策略解读。

以下内容主要引自:“AlphaGo之父:关于围棋,人类3000年来犯了一个大错”(http://tech.qq.com/a/20170414/011359.htm)

关于阿狗的算法策略,阿狗之父讲到:

采用决策网络和数值网络这两个神经网络结合的策略。使用这两个神经网络树,通过蒙特卡洛算法,以解决本来不能解决的问题。

我们通过用加强学习的方式来提高人工神经网络算法,希望能够解决这一问题。我们试图通过深度神经网络模仿人类的这种直觉行为,在这里,需要训练两个神经网络,一种是决策网络,我们从网上下载了成百万的业余围棋游戏,通过监督学习,我们让阿尔法狗模拟人类下围棋的行为;我们从棋盘上任意选择一个落子点,训练系统去预测下一步人类将作出的决定;系统的输入是在那个特殊位置最有可能发生的前五或者前十的位置移动;这样,你只需看那5-10种可能性,而不用分析所有的200种可能性了。

我们对系统进行几百万次的训练,通过误差加强学习,对于赢了的情况,让系统意识到,下次出现类似的情形时,更有可能做相似的决定。相反,如果系统输了,那么下次再出现类似的情况,就不会选择这种走法。我们建立了自己的游戏数据库,通过百万次的游戏,对系统进行训练,得到第二种神经网络。选择不同的落子点,经过置信区间进行学习,选出能够赢的情况,这个几率介于0-1之间,0是根本不可能赢,1是百分之百赢。

 

以下内容主要引自“百度百科”:

(https://baike.baidu.com/item/%E9%98%BF%E5%B0%94%E6%B3%95%E5%9B%B4%E6%A3%8B/19319610?fr=aladdin&fromid=19315265&fromtitle=AlphaGo)

阿尔法围棋其主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。

阿尔法围棋用到了很多新技术,如神经网络、深度学习、蒙特卡洛树搜索法等,使其实力有了实质性飞跃。美国脸书公司“黑暗森林”围棋软件的开发者田渊栋在网上发表分析文章说,阿尔法围棋系统主要由几个部分组成:一、策略网络(Policy Network),给定当前局面,预测并采样下一步的走棋;二、快速走子(Fastrollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍;三、价值网络(Value Network),给定当前局面,估计是白胜概率大还是黑胜概率大;四、蒙特卡洛树搜索(Monte Carlo Tree Search),把以上这三个部分连起来,形成一个完整的系统。

阿尔法围棋(AlphaGo)是通过两个不同神经网络“大脑”合作来改进下棋。这些“大脑”是多层神经网络,跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。

第一大脑:落子选择器(Move Picker)

阿尔法围棋(AlphaGo)的第一个神经网络大脑是“监督学习的策略网络(Policy Network)”,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。

第二大脑:棋局评估器(Position Evaluator)

阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题,它不是去猜测具体下一步,而是在给定棋子位置情况下,预测每一个棋手赢棋的概率。这“局面评估器”就是“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分析归类潜在的未来局面的“好”与“坏”,阿尔法围棋能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读。

这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。

阿尔法围棋(AlphaGo)为了应对围棋的复杂性,结合了监督学习和强化学习的优势。它通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。这两个网络自身都十分强大,而阿尔法围棋将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。新版的阿尔法围棋产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

在获取棋局信息后,阿尔法围棋会根据策略网络(policy network)探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为阿尔法围棋的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,阿尔法围棋的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

2017年1月,谷歌Deep Mind公司CEO哈萨比斯在德国慕尼黑DLD(数字、生活、设计)创新大会上宣布推出真正2.0版本的阿尔法围棋。其特点是摈弃了人类棋谱,只靠深度学习的方式成长起来挑战围棋的极限。

 

 阿狗“智能”策略解读 

 

阿狗的高大上智能策略,本咨询师并未能从技术角度充分理解,但本咨询师自觉足以提出以下管见,抛砖引玉:

阿狗采用了复杂的决策算法结构,决策所依据的数据很多,但归根结底仍是多输入加权得到输出。

阿狗基于深度学习的核心决策体系可分成两大步骤:

第一步:粗筛。指通过粗线条的规则将明显不靠谱的应手筛掉。

第二步:背棋谱。指大量学习第一步筛下来的棋谱,并进行加权优化。主要是以结果为导向,在类似棋局的应手中,加权筛选出最佳应手。

 

 粗筛之殇 

 

阿狗之父说,围棋手靠直觉下棋,而不是计算。本咨询师认同。少量情况下,围棋手会依靠定式或固定的套路。大多数情况下,靠直觉得到可供选择的几个点,然后加以权衡,一般还会预计一下对手的应手。很遗憾,这些没有办法依据计算规则总结出来。

阿狗之父不是不想,而是没有能力将围棋手的决策都用数学规则总结出来。智能并不排斥利用算法、程序、规则、逻辑,但智能的精粹在于不依照这些来解决问题的能力。所以,阿狗之父仅能总结出若干基本规则来排除掉明显不靠谱的应手,以节省下一步的计算量。

提示:“人工智能”机器所交付的工作结果,仅是有时看起来与人智能工作得出的结果类似,但机器的实际操作流程与人的智能解决思路完全不一样。

然而,仅只是用以排除“明显不靠谱的应手”的基本规则,也不能确保可靠。而我们应当知道,本咨询师点评起来如此轻松,而实际要设计好粗筛规则也是难度巨大、复杂度极高、成本高昂的。

“不过,李世石先生在第四场的时候,回来了,也许压力缓解了许多,他做出了一步非常创新性的举动,我认为这是历史上的创新之举。这一步迷惑了阿尔法狗,使他的决策树进行了错误估计,一些中国的专家甚至称之为“黄金之举”。通过这个例子,我们可以看到多少的哲理蕴含于围棋中。这些顶级专家,用尽必生的精力,去找出这种黄金之举。其实,在这步里,阿尔法狗知道这是非常不寻常的一步,他当时估计李世石通过这步赢的可能性是0.007%,阿尔法狗之前没有见过这样的落子方式,在那2分钟里,他需要重新搜索决策计算……       

第四局里,李世石第78步的创新之举。

我刚才谈到了直觉和创新,直觉是一种含蓄的表达,它是基于人类的经历和本能的一种思维形式,不需要精确计算。这一决策的准确性可以通过行为进行评判。在围棋里很简单,我们给系统输入棋子的位置,来评估其重要性。阿尔法狗就是在模拟人类这种直觉行为。创新,我认为就是在已有知识和经验的基础上,产生一种原始的,创新的观点。阿尔法狗很明显的示范了这两种能力。”

以上引自:“AlphaGo之父:关于围棋,人类3000年来犯了一个大错”(http://tech.qq.com/a/20170414/011359.htm)

“阿尔法狗之前没有见过这样的落子方式”,因为这种落子方式早在粗筛过程中就因为明显不靠谱而被筛掉了,所以阿狗没见过它,也不知道如何应对,只好不理它。从李世石的第78手开始,直至第87手,也就是又落了9粒籽,第78手引发的局势变化才被阿狗识别出来,此时阿狗的败局已定了。

本咨询师的认识是:仅只是用以排除“明显不靠谱的应手”的基本规则,也不能确保可靠。那么,有可能将棋手整个决策的逻辑梳理出来,算法化规则化吗?

提示:在一个数学规则为基础的19X19的小格游戏中,棋手的智能决策也尚不可能被天才团队参透来完成算法化规则化。而当我们面对的不是数学规则下的游戏,而是生活、工作中的涉及思想性的复杂问题时呢?尝试将智能不依照逻辑、算法、规则形成决策的过程来算法化规则化的难度和复杂性常常为我们所低估。我们对机器常有的不科学的拟人化想象,会使我们以上的错误认识大大加剧:其中的关键是我们误以为并不具备真正智能的机器有了智能,尽管它们看起来满聪明。

李世石输给了阿狗,如同人跑不过汽车,需要见怪吗?李世石赢了阿狗一局,这回人跑过汽车了!这是人的智能的胜利!聪明人可以找到办法并创造条件,创造出跑过汽车的个别案例。不是吗?阿狗不会脸红。

 

 背棋谱之殇 

 

说简单了,所谓高大上的深度学习,就是大量的背棋谱。因为天才团队也没有能力将围棋手的智能决策完全总结成计算机可执行的规则,而即使粗筛过程都不能保证没有漏洞。所以,依靠计算机的超级计算和存储能力,背数以百万计的棋谱是阿狗之父为它设计的最明智和现实的策略。

当然,背棋谱到决定应手,还有复杂的过程。本咨询师以为,本质上就是靠相似局势之下的应手,在以结果为导向的情况下,加权计算而筛得。这要靠至少几百万局棋,积累出来。即阿狗不知道赢棋背后的规律,不知道为什么这样下会赢,只会见样学样,类似局势下,如果这样下赢了,是正面教材,权重加分;如果这样下输了,是反面教材,权重减分。最后加权算出最佳应手。

李世石的胜局,既是粗筛之殇,也是背棋谱之殇。从李世石的第78手开始,直至第87手,也就是又落了9粒籽,第78手引发的局势变化才被阿狗识别出来,即阿狗终于在自己的存储器里找到了类似的棋谱,此时阿狗所计算的自己的胜率开始突降。阿狗已经翻盘无望了。因为阿狗只会按见过的棋谱下棋,不会思考,没见过的,不认识,不会应对,就输了。阿狗不脸红。

提示:

  • 没有棋谱作为答案的问题,阿狗所代表的深度学习解决不了。

  • 棋盘之外的复杂问题,尤其是涉及思想的,我们恐怕很难或者不可能备足棋谱以供电脑学习。对于解决19X19小格子内的数学算法问题,几百万的棋谱仅只是起步。

  • 阿狗所代表的深度学习,本质上是“背棋谱”,没有思考和创新,因而不会自主突破规则,所以不是具备自主意识才能进行的真正的智能性的自学习。

  • 机器没有智能或创造性,能完成按步骤的体力工作。设计这些精妙的步骤需要智能,这项工作只能由人完成的。机器的能力更强大,仅是因为计算技术的进步使机器可以执行更复杂的套路。


 对阿狗的科学总结 

 

阿狗已经载入史册,它是掀起当今人工智能大潮的发令枪。顶着人工神经网络和深度学习的神光环,阿狗立于神坛之顶,召唤着新科技朝代的到来。

在本咨询师扒了扒阿狗之后,还这么想吗?除了褪去神光,拖下神坛,其他还是对的。阿狗为代表的人工智能技术将给社会发展带来巨大推动,这是确定的。

阿狗为代表的当今人工智能技术也有局限。它是科学的产物,也承袭了科学的局限。科学对于中国,是舶来品。科学诞生于西方并不偶然,根本原因在于中西方思想文化的差异。首先决定和塑造中西方思想文化之个性差异的,便是语言。汉语以象形文字为源头,单音节,不重规则,语法灵动。西文是由重语法规则的多音节拼音文字发展而来。中国人灵活融通,模糊化地讲天人合一。西方人坚守规则,讲简单化的切分。西方所做的最大切分,便是将形而上的思想与形而下的物质进行了切分,前者交给神来解决,后者交给科学来研究。这就是科学的起源。这也就是科学的能力止步于思想之外的根本原因。而当今的人工智能作为科学的产物,它的能力也止步于思想之外。

从事知识产权的人常接触到与技术有关的诉讼,对“技术无罪论”并不陌生。“技术无罪”是因为它其中不包含思想,它只是为有思想的人所用的工具。有思想的人,可以利用科学技术、人工智能造福社会,也可以利用它为害天下,也才有了功或罪。科学技术、人工智能本身是无功无罪的,因为它们止步于思想之外。

科学技术、人工智能是我们所用的工具,思想为人所独有,至少目前仍然如此。勿将信仰置于无思想之物,反为之所制。科学技术、人工智能统统不应在尊奉信仰的神台上有位置。

后续篇章中,本咨询师将尝试主要以专利代理行业中的翻译、撰写、答复审查意见、侵权判定等专业工作为例逐步加以讨论,争取就人工智能在可预见的未来对专利代理行业可能造成的冲击提出自己的认识。期望对其他行业也有启示。

(待续)

推荐阅读

开源智慧 | React 许可证的五宗罪

可深了 | 科学将人工智能拖下神坛【一】智能的本来面目

硬见 | 技术与专利布局,iPhone X让苹果成为AI大赢家

在线等 | 女友最爱的美妆号死了,作为商标咨询师我能怎么办?

可深了 | 苹果手段数不胜数,西电捷通只是小菜一碟


用知识产权的眼光

看世界

欢迎原创投稿,稿件一经采用,支付稿费

投稿邮箱:iptree@iptalent.com


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存