查看原文
其他

刚刚,阿尔法狗再升级,100:0碾压旧版,三天走完了人类三千年的路

2017-10-19 谷子 INSIGHT CHINA


去年,围棋程序阿法狗(AlphaGo)连续击败多名人类围棋大师,最终夺得世界围棋冠军宝座。而就在前不久,谷歌 DeepMind 公司宣布阿法狗的妹妹,“史上最强人工智能” 阿法零(AlphaGo Zero)诞生。人工智能真的迎来了技术爆炸吗?这对我们又是福是祸呢?


在2016年击败柯洁,李世石,成功在围棋领域战胜人类的人工智能阿尔法狗,最近又传来了新的大新闻。



10月19日凌晨,阿法狗的开发公司 DeepMind 在知名期刊 Nature 上发表了一篇论文,宣布他们已于前不久研发成功了最新一代人工智能程序:阿法零(AlphaGo Zero)。 按照 DeepMind 开发团队的说法,阿法零不仅战胜了此前开发过的所有版本的阿法狗,且首次在人工智能领域实现了完全脱离人类的自我学习。


一个崭新的时代的曙光可能已经出现在地平线上了。



北京时间今天凌晨,DeepMind 公司发表了一篇名为《Mastering the game of Go without human knowledge》 的论文,瞬间引爆了从学术界到媒体和民间的广泛讨论。



这篇文章详细介绍了从去年到今年,DeepMind 公司在人工智能领域的最新成果,而其中最引人瞩目的,就是阿法狗的下一代—阿法零。


“这是全世界迄今为止最强大的人工智能”,团队主要负责人David Silver 教授在采访中说。



在测试中,阿法零以100场全胜0负的绝对碾压优势战胜了她的姐姐—曾经在2016年击败韩国棋手李世石的阿法狗,此外,在和阿法狗强化版 Master 的对战中,阿法零也取得了89胜11负,接近90%的优胜率。而 Master 就是曾经3:0击败柯洁的那个人工智能。 但这还不是最让人震惊的地方。要知道,在早期开发阶段,DeepMind 公司为阿法狗输入了大量人类顶尖围棋棋谱,供其研习人类下围棋的套路。无论是阿法狗还是 Master,她们的围棋技能提升很大程度上依赖于对人类的模仿。



而阿法零则完全没有得到任何“指点”,她对围棋的所有了解仅限于规则而已。开发者没有为阿法零提供任何帮助,而只是设计了一套“自我博弈”的学习机制。阿法零和一个自身分裂出来的“陪练”进行对弈。每一次,对手的水平都和自己旗鼓相当,在博弈中慢慢成长,总结和学习。 换句话说,阿法零的围棋技能完全是从零开始无师自通的,Zero 之名,即由此而来。


让科研人员自己都没有预料到的是,这种自我学习的成长速度可以用恐怖来形容。在论文中,DeepMind 详细记载了阿法零在短短72小时内,如何实现了从猴子扔石头一般的菜鸟水平到纵横捭阖整个棋局的一代宗师的飞升。 开始训练3小时,还是毫无章法,12小时,看起来摸到门路了,72小时,她达到了多少人类棋手终其一生都无法抵达的围棋九段水平。



就好像一个对武功一无所知的小白,只被人教了怎么握剑怎么劈刺砍,没学过任何剑法就闭门修炼,却练成了吊打武林一众高手的最强武功。


“她用了三天时间走完了人类三千年的路。”一位知乎网友如此评价。柯洁在微博上转发相关报道时感叹“对于alphago的自我进步来讲...人类太多余了”。



“我可以代表我们团队说,她的表现让我们都感到惊喜”,David 教授在镜头前难掩兴奋,仿佛一个看着自己孩子长大的父亲。“她的表现已经超过了所有人的预期,她的能力一直在增长,胜率一直在增加。40天后,她已经打败了我们所制造过的所有阿法狗。”


阿法零在ELO等级分制度(一个博弈游戏评价体系)名列第一


数据显示,学习人类技法的围棋 AI 虽然可以学习前期成长迅速,但最终只能达到与阿法狗相仿的能力水平,且这个过程长达几个月。而放弃人类自成体系的阿法零却在几天时间里取得了超过人类的成就。 “阿法零证明了人类很多时候总是只能限于局部最优(local optima)而不自知。”杜克大学人工智能专家陈怡然教授如是说,“人类实际上‘误导’了阿法狗。” 也就是说,阿法零在一个更高的层面发现了人类之前的思维缺陷,并证明了自己可以做的更好。


这项突破在人工智能领域的意义可用里程碑级来形容。DeepMind 团队在过去的三年时间里一直致力于研发围棋人工智能,而阿法零的诞生标志着他们距离开发“通用型人工智能”近了一大步。



另一方面,由于阿法零不依赖于大数据计算,也降低了它的成本。此前的阿法狗需要48个 TPU(谷歌开发的深度学习芯片,类似手机电脑的 CPU),而阿法零只需要4个就可以运行。


低成本,简洁算法,不依赖于人类经验,阿法零的原理很有可能有非常广阔的应用前景。“阿法零的成果完全可以迁移到其他领域,” DeepMind联合创始人和CEO Demis Hassabis 如此说,“例如新能源,新材料和蛋白质折叠研究中。”



人工智能自进入大众视野那一天起,几乎就伴随着对它的忧虑。强人工智能毁灭世界也一直是各路科幻小说和电影中的热门题材。


科幻电影《终结者》中,人工智能“天网”觉醒自我意识,发射核弹毁灭了全世界,之后制造出大量“终结者”机器人和人类展开旷日持久的战争。


科技圈内的名人对此也有类似看法,霍金,比尔盖茨和马斯克在不同的场合都发出过警告,认为人类不应低估人工智能发展可能带来的严重后果。马斯克在麻省理工学院参加研讨会时表示,研究人工智能如同在召唤一个恶魔,“如果让我猜人类最大生存威胁,我认为可能是人工智能。”



在去年阿法狗战胜柯洁后,关于人工智能会不会反而统治人类的讨论也一直在网上进行。


一篇写于2015年的文章认为,人工智能会在我们的有生之年导致人类永生,或灭绝。




文章作者认为,一旦强人工智能研发成功,其进化能力将以指数倍计算,它也许用了几十年才达到人类弱智的水平,但此后它会以近乎垂直的速度向上增长并远远赶超任何生命体。


“当这个节点发生的时候,电脑对于世界的感知大概和一个四岁小孩一般;而在这节点后一个小时,电脑立马推导出了统一广义相对论和量子力学的物理学理论;而在这之后一个半小时,这个强人工智能变成了超人工智能,智能达到了普通人类的17万倍。”



想象一下,爱因斯坦和霍金的智商仅仅是正常人类的1.3倍到1.5倍,那么比人类智商高17万倍的电脑是什么样子?对于这样一个超级大脑,攻克所有绝症,发现宇宙的终极定律,破解能源危机乃至让人类永生,都不会是什么困难的事。


但反过来说,这样一个人工智能究竟是怎么看待人类?我们不知道。正如蝼蚁无法想象人类的想法(更不用提我们和超级 AI 之间的差距比蚂蚁大得多了),人类很可能完全无法理解人工智能的思路,而在如此天壤之别的智力差距下,任何试图阻止 AI 的行为都会很可笑。一如蚂蚁无法阻止人类一样。


如果你设定一个人工智能的目标是让你笑,那它可能会把你脸部肌肉弄瘫痪,来让你永远保持笑脸。如果你把目标设定成保护你的安全,它可能会把你永远关在家里。如果你让他终结所有饥荒,它可能会想:“太容易了,把人类都杀了就好了。”如果你把目标设定成尽量保护地球上的生命,那它会很快把人类都杀了,因为人类对其它物种是很大的威胁。


不过,上文这 49 30962 49 15288 0 0 3295 0 0:00:09 0:00:04 0:00:05 3294观点更多的还是停留在哲学或科幻层面的讨论。多数人工智能学者不认为目前的人工智能研究水平达到了应该担心的程度,即使是最强大的阿法零,根本上也仅仅是在一个新领域有所突破,目前为止她除了下围棋还是什么都不会做的……


当然,这也不是说对人工智能的怀疑完全是杞人忧天。事实上在深度学习领域,强人工智能伴随着风险是业内常识,科学家对此有过充分的讨论和准备。作为阿法零的研发公司,DeepMind 在2014年被谷歌收购时就要求谷歌成立一个人工智能伦理委员会,以应对未来可能的相关道德问题。



但人工智能在近几年的发展,确实可以用飞速来形容,在2012年左右的时候,围棋程序在让4或5子的基础上才能勉强击败九段围棋选手。仅仅五年后,它们就已经可以藐视一切人类对手了。 几年后又会有什么新的变化?是就此止步,还是引发如同工业革命一般的又一轮技术爆发,乃至真的如上文所说,将带领我们走向死亡或永生? 或许我们已经站在了一个崭新时代的门槛上,又或许我们只是目睹了一场即将落幕的科技大戏的终场。无论如何,就像《银河系漫游指南》中说的那样,“不要慌(Don't panic)”。




科技一直都是一把双刃剑,用得好可以为人类披荆斩棘开拓新的旅程,使用不当,也会伤到自己。大胆探索,但不要忽视风险,就好了。

本文系原创稿件,欢迎更多有想法的出国党小伙伴们向主页君的邮箱:weinsight@163.com 投稿,主页君每天都会查看的哦!欢迎分享到朋友圈INSIGHT CHINA 诚意推荐



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存