查看原文
其他

科普两个著名人工智能思想实验:图灵测试和中文房间

道格·罗斯 华章计算机 2022-10-26

导读:人工智能的字典定义是机器模仿人类智能行为的能力。那么如何定义智能?


作者:道格·罗斯(Doug Rose)
来源:大数据DT(ID:hzdashuju)



01 图灵测试

艾伦·图灵是一位英国计算机科学家,他曾参与解密二战期间德国人用来通信的神秘机器(密码机),这件事情让他声名显赫。战后,他把目光投向了早期的计算机,并对机器如何思考十分感兴趣。

在1951年的一篇论文中,他提出了一个名为模仿游戏的测试,这个测试是基于维多利亚时期的一个室内游戏。在游戏中,一男一女坐在一个房间里,提问者在另一个房间里(见图1.1)。

▲图1.1 模仿游戏

提问者会问这对男女一个问题。然后团队会把他们的答案以书面形式传回来。由提问者来猜测每一个书面答案是来自男人还是女人。而同时,男人试图愚弄提问者,而女人则试图帮助他。

对于现代人来说,这个游戏听起来并不有趣,但对图灵来说,这是测试机器智能的一个很好的基础。他设想了一个更新的模仿游戏,在这个游戏中,这个男人被一台机器取代了(见图1.2)。

▲图1.2 图灵测试

然后提问者会问这个女人和机器一个问题,并以书面形式收回答案。如果提问者以同样的可能性选择其中一个(即提问者分不清到底是人作答的还是机器作答的),那么这台机器被认为是智能的。这个游戏后来称为图灵测试。

这项测试引发了人们对“有思想的机器”(imaginable machine)的好奇,尽管它比McCarthy发明人工智能这个词早了几年。即使过了近70年,这个测试听起来仍然很有趣。想象一下,如果你用自己的语言向一台机器提出一个问题,而从得到的回答中无法区分是不是另外一个人的回答会怎么样?

尽管如此,大多数专家都赞同图灵测试不一定是衡量智能的最佳方法。首先,这在很大程度上取决于提问者,有些人可能很容易上当,以为自己在和另外一个人说话。它还假设人工智能将与人类智能相似。你可能会假设一台机器在开始执行诸如寻找新药或准确预测全球气候模式等高级任务之前,能够与人进行一次像样的对话。

然而图灵测试仍然激发了许多创新。一些公司仍在尝试创建智能聊天机器人,还有一些NLP竞赛试图通过图灵测试。人们似乎觉得现代机器再过几年就能通过图灵测试了。许多现代NLP应用可以准确地理解你的大多数请求,现在它们只需要提高反应能力。

然而,即使一台机器能够通过测试,这台机器也不太可能被视为智能的。即使你的智能手机能骗过你,让你以为在和人说话,但这并不意味着它能提供真正有意义的对话。


02 中文房间实验

人们关于人工智能的第一次尝试是在1956年。Allen Newell和Herbert A. Simon(见图1.3)创建了一个称为“通用问题求解器”的计算机程序。这个程序被设计用来解决任何可以用数学公式表示的问题。

▲图1.3 Newell和Simon(于卡内基梅隆大学图书馆)

这个通用问题求解器程序中最关键的部分之一被Newell和Simon称为物理符号系统假说(PSSH)。他们认为符号是通用智能的关键。如果你能让一个程序连接足够多的符号,你就会拥有一台行为方式与人类智能相似的机器。

符号在我们与世界的互动中扮演着重要的角色。当我们看到一个停车标志时,我们知道停车并查看交通情况。当我们看到“猫”这个词时,我们知道它代表一种会喵喵叫的毛茸茸的小型猫科动物。如果我们看到一把椅子,我们就知道它是一个可以坐的东西。当我们看到一个三明治,我们知道这是能吃的东西,甚至会感到饥饿。

Newell和Simon认为,创造足够多的这类联系将使机器的行为更像人类。他们认为人类推理的关键部分就是连接的符号,即我们的语言、思想和概念只是由相互连接的符号组成的混合体(见图1.4)。

▲图1.4 互相连接的符号

但并不是每个人都认同这个想法。1980年,哲学家 John Searle 认为,仅仅连接符号不能被视为智能。为了支持他的观点——不认同计算机会思考或至少有一天能够思考,他创建了一个名为“中文房间”的实验(见图1.5)。

▲图1.5 中文房间实验

在这个实验中,想象你自己是一个只会说英语的人,被锁在一个没有窗户的房间里,门下有一个狭窄的缝隙,你可以通过它传递信息。你有一本书,上面有一长串的中文陈述,地板上放满了汉字,还有一些指示,如果给你一系列汉字,你就要用书中相应的陈述来回应。

房间外面有人能说一口流利的中文,他写了一个便条,然后从门下的缝隙递给你。你不知道上面写了什么,需要经历一个翻阅书的枯燥过程,根据便条上的汉字找到对应的回复。使用地板上的字符,将语句粘贴到一张纸上,然后把它从门缝里递给给你原始信息的人。

把纸条递给你的这个人认为你们两人在交谈,而且你很聪明。然而,Searle 认为这还远远不够智能,因为你不会说中文,而且你并不理解自己刚刚收到或发出的信息是什么意思。

你可以用智能手机做一个类似的实验。如果你问Siri或Cortana感觉如何,它很可能会说它感觉很好,但这并不意味着它感觉很好,也可以说它什么都感觉不到。它甚至不明白这个问题。她只是把你的问题和被认为可以接受的答案相匹配,然后选择一个作答。

符号匹配的一个关键缺点是所谓的组合爆炸——符号组合的快速增长使得匹配越来越困难。人们可以问各种各样的问题,针对一个问题有不同的回答,想象一下就知道匹配有多少组合了。在刚才那个中文房间的例子中,你会有一本不断增长可能的输入和输出的书,这会花费你越来越长的时间来找到正确的答案。

即使面临这些挑战,多年来符号匹配仍作为人工智能的基石。然而,符号匹配已经无法跟上人工智能应用日益复杂的步伐。早期的机器很难匹配所有的可能性,即使它们可以,这个过程也花费了太多的时间。

关于作者:道格·罗斯(Doug Rose),有超过25年为各种组织提供技术、培训和流程优化变革的经验。他是美国项目管理协会(PMI)关于敏捷框架的第一本主要出版物Leading Agile Teams的作者,还是Data Science: Create Teams That Ask the Right Questions and Deliver Real Value和Enterprise Agility for Dummies两本书的作者。
本文摘编自《认识AI:人工智能如何赋能商业(原书第2版)》,经出版方授权发布。(ISBN:9787111691778
延伸阅读《认识AI:人工智能如何赋能商业》
点击上图了解及购买转载请联系微信:DoctorData
推荐语:抢占AI时代红利!智能时代不可不读的AI趣味概述,海量漫画帮你轻松搞懂AI。



扫码关注【CSAPP】视频号



更多精彩回顾



书讯 | 12月书讯(上) | 冬夜寒冷,读书暖心,华章科技上新啦!书讯 | 12月书讯(下) | 冬夜寒冷,读书暖心,华章科技上新啦!
资讯 | IEEE发布2022年科技趋势全球调研:人工智能和机器学习、云计算及5G将成为下一年最重要的技术书单 | 8本书助你零基础转行数据分析岗干货 | 周志明论架构之道:后微服务时代与无服务时代收藏 | 盘点云原生的5大特征上新 | 【新书速递】Django3.0应用开发详解赠书 | 【第84期】对话智能风控


点击阅读全文购买

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存