查看原文
其他

AlphaGo 击败柯洁,人机大战机器先胜一局 | 现场报道

2017-05-23 科研圈

《环球科学》首席记者 刘洋


北京时间5月23日15:00,人机大战首局落下帷幕,柯洁执黑1/4子负于AlphaGo。


尽管从传播的角度看,AlphaGo与柯洁的对战不如前者与李世石的激战那么具有传播性;但从难度上看,与柯洁的对战才是检验人工智能成色的最好标准。所以,柯洁和AlphaGo5月23日在乌镇的对弈,仍然吸引到了全球围棋界的一干名将和多位公司高层。


作为一个20岁的棋手,柯洁已经4次赢得世界冠军。与同年龄段的他相比,曾经的世界名将——曹薰铉、李世石、古力、聂卫平都没有任何优势,尽管他们的整个职业生涯都非常成功。柯洁最后的惜败,也让人们意识到人类最后的堡垒已经被攻破。


柯洁也从不掩饰自己对围棋技艺的自信,这和一贯强调中正平和的传统中国棋手形成了鲜明的对比。在和日本围棋第一人井山裕太对战前,柯洁针对后者要借中日对抗让日本围棋转运的说法回敬到“我要让他血溅五步”;在和韩国围棋第一人李世石交手前,柯洁又针对后者自认有五成胜算的说法告诉记者“如果一共是一百成的话,他确实有五成胜算”;在告诉李世石“传奇应该谢幕”之后,他又说“我的传奇在我的呼吸停止之前,永不停止”。


惟一让他辗转的对手就是AlphaGo。2017年新年前半小时,柯洁在微博发文称:“昨夜辗转反侧,不想竟一夜难眠,人类数千年的实战演练进化,计算机却告诉我们人类全是错的。我觉得,甚至没有一个人沾到围棋真理的边。但我想说,从现在开始,我们棋手将会结合计算机,迈进全新的领域达到全新的境界。新的风暴即将来袭,我将尽我所有的智慧终极一战!”


终极一战开始前,人工智能已经在其他领域取得成绩。例如,在将DeepMind开发的算法应用在数据中心的制冷系统之后,其公司的数据中心制冷耗电量就降低了40%;此外,DeepMind还和伦敦医院合作,通过调用视网膜扫描数据寻找退行性疾病的早期症状,并开始利用人工智能技术探索蛋白质折叠领域的前沿知识,这在以前都是最高深的科研领域。


终极一战将进行三场,每场都采用中国围棋规则,黑棋让三又四分之三子,对战双方各有三小时和五次一分钟的读秒。但对AlphaGo来说,时间是一个没价值的概念,它不疲劳、不困顿也不迷惘,只是按照每40秒一步棋的速度完成工作。相比之下,柯洁每步棋的耗时大约为两分钟。再棋局开始不到一个小时,柯洁还去了两次洗手间,这也耗费了几分钟。


比赛开始仅仅几分钟后,柯洁就开始玩扇子、皱眉毛和抓头发。现场解说、中国围棋协会的秘书长华以刚说:“抓头发是柯洁的标志性动作,不论比赛顺利还是不顺,他都愿意抓头发。”结果,差不多两个小时过后,随着长考的次数越来越多,时间越来越长,柯洁本来梳理得很顺的头发竟然已经有点凌乱了。


但问题是,人类的进化相比于计算能力的提升和算法的完善而言太慢了,柯洁还是很难在变化的棋局中迅速找到漏洞,他不断尝试希望可以赢得这个挑战。他很享受这种对战的难度,但似乎没办法享受其中。对战开始之前,他在微博上告诉人们:无论胜败,这都是他和人工智能的最后三局棋。如无意外,这也许也将是人类和人工智能的最后三局。





延伸阅读:AlphaGo是怎样战胜人类世界冠军的


一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。


为了应对围棋的巨大复杂性,AlphaGo 采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo 产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。



在获取棋局信息后,AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。


阅读更多



▽ 故事

· “40%的论文存在学术不端!”这份结论惊人的调研,到底说了什么?

· 你被骗过吗?7种操纵数据的方式,第7种让无数人中招

· 独家 | 还原宇宙起源“诺奖级”论战,特邀学界大咖深度解读

· 每周减一斤!新型减肥药公布临床结果

▽ 论文推荐

· 长期记忆和短期记忆竟在同时形成 | Science 论文推荐

· 白凡、谢晓亮团队与张宁团队揭示循环肿瘤细胞基因组特征与癌症转移机制 | Genome Research  论文推荐

· 导入细胞表面抗体,对抗艾滋病 | PNAS 论文推荐

▽ 论文导读

· Nature 一周论文导读 | 2017 年 5 月 11 日

· Science 一周论文导读 | 2017 年 5 月 12 日



内容合作请联系

keyanquan@huanqiukexue.com


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存