盖茨书单:《勇敢的新词》作者Sal Khan认为,AI会成为职场中一个非常重要的工具,人们必须学会如何使用它
(关注公众号并设为🌟标,第一时间获取最新人工智能资讯和产品)
全文约2,3000 字,阅读约需 40分钟
越来越多的人意识到人工智能(AI)会成为职场中一个非常重要的工具,人们必须学会如何使用它。伴随着经济的高速发展,我们可以用这些先进工具来提高工作效率和竞争力。AI不仅改变了我们的工作方式,还正在重塑各行各业的就业机会和技能需求。
在这场技术变革中,全球众多资源雄厚的组织正积极推动AI技术的发展,使其以前所未有的速度变得越来越强大。尽管AI带来的变化可能不会立即显现,但其影响已不可逆转,正悄然改变着职场生态。
与此同时,AI技术也为教育领域带来了新的机遇。可汗学院创始人Sal Khan(萨尔·汗)探讨了AI如何支持职场人和教师、激励学生,并介绍了他们的新AI工具"Khanmigo"。这凸显了我们需要思考如何设计和实施AI工具,以确保它们能在工作和教育中发挥积极作用,造福所有人。
文稿整理
旁白: 大多数人将能够制作出高质量的短片,而这并不取决于你拥有的预算或你所属的工作室,而是取决于你的创造力、你的故事感,以及你所做的新鲜事。我认为这是一个非常令人兴奋的世界。如果我只是阅读一篇维基百科的文章,我可能不会记住它,我甚至可能都不理解它。但这是我三四个月前与Khanmigo进行的对话,现在我已经深入了解它,并且不会忘记。这展示了苏格拉底式对话的力量,它迫使你像老师一样,带着尽可能多的知识来到谈话中。你将能够像我们现在这样与Khanmigo聊天,它能够与你进行眼神交流,能够读取你的表情,能够知道你感到沮丧。我知道我们需要设置一些防护措施,以免它变得太过怪异,但如果使用得当,它可能会非常强大。当我阅读你的书时,我意识到这不仅仅是一本关于人工智能与教育的书,它还描绘了你对人工智能将如何融入我们生活的愿景。Khanmigo是一种非常个性化的体验,但我们作为人类的许多特质都是关于合作的,对吧?在课堂上,我们有其他人,虽然可能不够多,但我们仍然会合作。那么,你如何看待这种向个性化辅导的转变?这会对我们的合作能力产生什么影响?人们将如何学习作为一个团体进行合作?
主持人Alexander: 你好,我是Alexander,欢迎来到“AGI之前(Before AGI)”。对我来说,人工智能在教育领域的正面影响是最令人兴奋和深远的。不仅仅是因为我是教育者和家长,更广泛地说,我真正相信,普及和高质量的教育是伟大的平等化器。然而,人工智能在教育中的正面故事并不是一件简单的事情。当ChatGPT推出时,教育界的反应相当负面。但今天我们的嘉宾Sal Khan却看到了其中的机会。去年三月,可汗学院推出了Khanmigo,这是一种由GPT-4驱动的人工智能教学助手,旨在为全球所有孩子提供与亚里士多德教导亚历山大大帝相同类型的个性化辅导。他还写了一本书,名为《勇敢的新词:人工智能将如何革命性地改变教育及其好处》(New Brave Words),我强烈推荐。今天我们将讨论这本书中的愿景,人工智能为教育带来的机遇,以及沿途出现的挑战。Sal,非常高兴你能来这里。
嘉宾Sal Khan: 感谢邀请,Alexander。
可汗学院人工智能助手“Khanmigo”
Alexander: 那么,这是2022年11月,ChatGPT推出之前的时期。Khanmigo的概念在当时出现,而你似乎并不像很多人那样将这一技术视为对教育的重大威胁,甚至是生存威胁。那么,你是如何得出这样的结论的?
Sal Khan: 是的,其实当ChatGPT特别是GPT-4推出时,我有点失望,我会告诉你为什么,但我也会告诉你事情是如何发展的。如果我们回到三四个月前,OpenAI的Sam Altman和Greg Brockman联系了我和我们的团队,他们说:“嘿,我们正在训练下一个模型,它最终变成了GPT-4。我们认为这是一个非常有趣的模型,我们希望以社会正向的用例为主导,与大家信任的组织合作,因此我们想探讨Khan Academy(可汗学院)是否有机会利用这个模型。”我当时有些怀疑,我觉得GPT-2和GPT-3非常酷,确实非常酷,但我并不认为它们已经准备好进入主流。然而,当我看到GPT-4的表现时,我认为这是在2022年8月,当时我们是世界上最早看到GPT-4表现的人之一。虽然它还存在一些粗糙之处,但它能够做的事情超出了人们对生成式人工智能的预期,比如承担一个角色,进行对话,似乎能够进行推理,而推理是人工智能的一个重要领域。如果你了解可汗学院的一切,你会知道我是从给我的表兄弟辅导开始的,然后我为他们写软件,制作视频,过去15年我们所做的一切都是为了扩大优秀私人导师的能力。所以当我们看到GPT-4的表现时,我们意识到这将改变一切,这将使我们能够更加投入。当然,随着我们开始探索它,你可以想象在可汗学院内部发生的辩论,这些都是在2022年9月和10月期间发生的,我们都与OpenAI签署了保密协议,所以我们无法公开谈论它,甚至不能告诉我的家人。
但是我们当时在想,这确实很酷,但是你怎么处理它编造事实的问题?“幻觉”现象怎么办?你怎么处理数学错误的问题?人们信任可汗学院帮助他们学习数学。如果我们在谈论18岁以下的用户,安全问题又该如何解决?如何进行监督?如何应对作弊问题?当我们开始使用它时,很明显这确实是一个很酷的工具,但如果有人想要答案,它就可以给出答案。因此,我鼓励团队将所有这些风险写下来,然后将它们转化为功能。我们让老师能够看到正在发生的事情,与OpenAI合作,使用可以进行自动审核的系统,并在发现异常时自动向教师和家长发送消息。我们还让Khanmigo(我们的AI助手实例)避免直接给出答案,而是采用苏格拉底式的对话方式,引导用户向前进步,就像一个优秀且有道德的导师那样。
我们在2022年10月和11月秘密地开发了这些功能。然后在11月29日,我记得是11月29日,ChatGPT发布了。我们知道,有时人们将ChatGPT与模型本身混为一谈,但实际上ChatGPT是一个应用程序,最初是基于GPT-3.5构建的,现在它可以运行在GPT-4及其他模型之上。我立即给OpenAI的Greg Brockman(OpenAI 现任总裁)发了信息,说:“嘿,Greg,这到底是怎么回事?你让我们签署了保密协议,我们什么都不能说,而你却发布了这个东西。我还以为GPT-4要到2023年3月才会发布呢。” Greg马上回复说:“不,我们没有发布任何新东西,只是在已经发布的模型(GPT-3.5)上添加了一个聊天界面。” 结果,整个世界都爆炸了。
正如你提到的,许多教育工作者立即变得非常担忧,因为很明显,你可以让ChatGPT为你写东西,甚至帮你做作业。我们很快看到很多学校系统在当年12月甚至1月开始禁止使用它。当时我无法公开讨论我们正在做的事情,但我在电视上告诉人们:“嘿,不要因噎废食。这些是人们必须为未来工作环境发展起来的技能。我们应该考虑如何利用这些工具来增强学习,并且不仅仅是避免作弊,甚至可以打击作弊。”
好消息是,当2023年3月15日到来时,GPT-4和Khanmigo同时发布,Khanmigo利用了GPT-4技术,学校系统已经完全转变了态度。他们表示,也许ChatGPT不适合年轻学生,虽然在某些情况下,如果他们在学习使用行业工具时可以例外。但如果有人能够采用相同的技术,并设置适当的防护措施,使其在教育环境中特别有用,而且不允许作弊,那将非常令人兴奋。因此,当我们能够展示Kigo时,它得到了非常积极的反响。
Alexander: 这里有很多内容需要梳理。我们一步步来。我猜你会感到有些失望,因为这一切比你预期的要早一些,并且破坏了你们正在积累的惊喜感。但在一个你知道未来而周围没有人知道的世界中生活是什么感觉呢?你是如何应对这一点的?
Sal Khan: 是的,我确实有些失望,这确实破坏了惊喜感,不仅仅是一点,而是很多。但我也感到失望,因为这一技术首次进入主流,尤其是教育界时,带来的印象是它可能被用于作弊。而且顺便说一下,它仍然会出现“幻觉”现象,并且数学能力不特别强。因此,我更加担心教育界会完全拒绝大型语言模型,而这将是一个巨大的遗憾,因为我认为它有很多机会可以帮助学生和老师。
我们一直在努力,我自从Sam和Greg首次向我展示GPT-4时,就在重新调整整个组织。我当时想:“这就是可汗学院的未来,我们要围绕这个重新构建可汗学院。”这也正是我们自那时以来一直在做的事情。因此,这就是我最大的担忧。至于知道一些别人不知道的事情,这确实是我最难保守的秘密,因为很明显这将改变整个文明。很少有时候你能如此严肃地说这种话,但我在2022年8月、9月时就这么说了,现在我更加相信这一点。我现在可以公开谈论这件事了,我告诉人们,如果我们在未来10年内只有GPT-4这个版本,我们仍然会看到令人难以置信的创新。令人惊讶的是,现在的GPT-4 Turbo已经比最初的GPT-4更强大了。
你知道,我一直在从你们那里获取一些关于GPT-5能做什么的线索。我全神贯注地听着,也一直试图获得一些提示。显然,你们不是唯一在研发它的,还有其他资源丰富的组织也在参与这场“军备竞赛”,所以这项技术正在以非常快的速度变得越来越强大。我一直在告诉可汗学院的团队,我们的教育目标是什么?让我们构建能够随着这一基础技术不断进步而发展的东西。
Alexander: 你说得非常好。首先,我确实同意,即使我们停止研究,人工智能也将改变世界,这是我们需要认识到的重要一点。也许人们不会马上看到这种变化,但这种变化正在发生。你提到GPT-4已经很棒,而GPT-4 Turbo甚至更好。如果你签署一份保密协议,我们可以告诉你更多关于即将到来的东西,但你将不能告诉任何人,所以我不确定你是否想走那一步。
Sal Khan: 我已经准备好签那些保密协议了。
Alexander: 好吧,但问题是,即使它们很好,但它们并不完美。我也喜欢你提到的那一点,即你希望以一种方式构建系统,使得每当有更好的基础模型出现时,你可以轻松替换它。我认为这是一个非常重要的原则。你说GPT-4很好,但不完美,那么你遇到过哪些需要处理的问题?能不能给我们讲讲你在调试或改进Khanmigo时遇到的特别挑战?
Sal Khan: 那个周末,OpenAI给我们提供了访问权限,包括我、我们的首席学习官和首席技术官。那个周末我们几乎没怎么睡觉,凌晨两点我们都在忙着,大家在截图互相分享:“看,我让它做了这个,看,我让它做了那个。”我们都觉得这将改变一切。但是,其中一个人说:“是啊,但它算错了17加16,我们该怎么处理?”我记得当时我们正在寻找一位首席财务官,我不知道它没有连接到互联网,所以我问它:“你能去LinkedIn上找到一些合适的人选,来担任可汗学院的首席财务官吗?”它给我找了三份看起来非常棒的简历,我当时觉得不可思议,甚至那个人就住在山景城,可以步行到我们办公室,背景也完美。但我很快意识到,它完全是虚构的,这些人根本不存在。所以我们发现了“幻觉”问题。还有,比如你问它太阳的质量是多少,有时候它会给出正确的数字,有时候却完全不对。所以这些都是我们遇到的实际问题。
当然,有些问题我们在反馈给OpenAI团队后,他们也进行了修正。我们帮助发现了一些训练数据中的错误,因为你们有一些人工标注人员,他们在提供正确的答案时有时会出错,这也是造成一些数学错误的原因。
我们意识到,如果我们将其与可汗学院的内容结合起来,它出现“幻觉”的概率就大大降低,几乎消除了。我们还与OpenAI的研究团队合作,想出了一些方法,让AI能够多次调用自己进行检查,从而显著提高数学能力。我们在设计提示词方面也越来越熟练。有趣的是,我孩子学校的一位家长是谷歌Gemini项目的首席研究员之一,他说,我们没有意识到的一点是,ChatGPT帮助人们认识到提示词的力量。你可以通过设计出一个非常周到的提示词,令AI的表现超出预期。所以我们主要通过构建大量基础设施和上下文来缓解问题,当然,过去一年里,底层模型已经得到了极大的改进。我知道,减少“幻觉”现象、提高数学能力是那些在创建模型时非常关注的问题,但这些还不完美。这也是我们正在重点关注的领域。
Sal 学习的人工智能经历
Alexander: 听起来,Sal的AI经历非常有趣。我在为这次节目做研究时发现了两个让我惊讶的事实。首先,你毕业于MIT,我和你是校友。其次,你其实在MIT的时候就想从事人工智能领域的工作。所以从某种意义上说,你通过Khanmigo回到了人工智能领域,但为什么你一开始没有坚持从事人工智能呢?
Sal Khan: 是啊,我想你读过我的书《勇敢的新词》,在最后一章中,我坦白说我在MIT时曾想成为一名人工智能研究员。确实如此,当我在MIT读大一时,原本以为自己会主修物理,后来我对计算机科学产生了浓厚的兴趣。我当时觉得,最具哲学意义的问题是:我们能否创造出真正能够模仿人类智能的机器?于是,我选择了亨利·温斯顿教授作为我的新生导师,他写了那本经典的人工智能教科书,并在MIT教授入门课程。我还选修了Marvin Minsky(马文·明斯基)教授的《心灵社会》课程,他是温斯顿教授的导师,也是《2001太空漫游》这部电影的顾问。这些人都是90年代中期人工智能领域的巨擘,而我有幸接触到他们。我选修了所有这些课程,但很快开始感到失望。
虽然我们知道如何制作可以很好地下象棋或跳棋的系统,当时专家系统非常流行,但它们并不是以人类的方式进行的。它们是算法式的,通过决策树进行搜索,当你在下象棋或跳棋时,比如对手移动后有哪些可能的应对方法,然后计算出最终的得分,回溯到你应该做的那一步。或者这些专家系统有时可以模拟思维,但它们实际上只是试图找到适用于当前情境的下一条“如果……那么……”语句。这与人类学习的方式完全不同。人类能够根据新的经验进行学习和自我修正。即使在那时我们也知道,大脑是由神经元和突触组成的。显然,AI社区中一直存在争论:是应该更程序化地进行人工智能开发,还是应该尝试模仿自然。
但在90年代中期,虽然神经网络已经存在,但它们的表现非常糟糕。我们没有足够的算力,显然在结构和训练神经网络方面也没有取得突破。我当时觉得,人工智能至少在90年代中期是没有前途的,所以我决定做点别的事情。我当然还是留在了技术领域,在某种程度上我其实对教育产生了兴趣。我当时想,如果我不能用技术模仿智能,也许我可以用技术增强智能。因此,甚至在大学时,我就参与了一些项目,开发数学软件帮助人们学习等等。但当时我放弃了对人工智能的追求。
我在书中写道,我没有意识到那时正是人工智能研究的一个低潮期。如果现在的情况发生在当时,我肯定会全力以赴。
Alexander: 是的,我认识亨利,他是一个非常好的人。但当时确实不是押注人工智能的最佳时机,现在情况显然不同了。那么,你启动了Khanmigo项目,同时你还写了一本书。看起来你认为Khanmigo是更大潜力有什么,比如说,推动教育的革命。这是真的吗?为什么你要写这本书呢?
Sal Khan: 你知道,有一段时间我对所有的书都持怀疑态度。我热爱书籍,但我记得在2011年,我在可汗学院早期做过一次TED演讲,讲述了课堂未来的样貌。一位出版商联系我说:“嘿,我们觉得你应该写一本书。”我回答说:“为什么我要写书呢?我想分享的任何东西,我只需要制作一个YouTube视频,分享给所有人就行了。”但他们说,写书可以帮助你结构化你的想法等等。我想,好吧,我可以试试。于是我写了那本书,那是我写的第一本书,叫《一所世界学校》。书的三分之一讲述了教育是如何发展成今天的样子的,中间的三分之一讲述了我如何进入教育领域,可汗学院是什么以及它在变成什么样。最后的三分之一则讨论了随着世界的发展和技术的进步,教育的未来应该是什么样子。这个写作过程对我来说非常有益,它真的帮助我整理了我的思路。自那以后,我一直在利用这个过程,帮助我们的团队对齐目标,吸引资金支持我们的愿景,进入学校,甚至确保我们在为课堂、学生和教师构建产品时,了解我们的真正方向。
当我看到正在发生的事情时,甚至在ChatGPT推出之前,我们还在与OpenAI签署保密协议,我意识到,这将是我们这一生中最大的变革,也许是世界文明史上最大的变革。而且,甚至在公众讨论开始之前,我就知道这将让很多人感到害怕。会有很多所谓的“沙发哲学家(一群杞人忧天的哲学家)”开始说“哦,我们应该关闭这个”或者“我对那个感到害怕”,我只想弄清楚自己的想法,了解我们处在什么位置,了解这些技术的影响是什么,我们在教育领域及其他领域应该做些什么。显然,这对工作场所将产生影响,一些工作将会被取代,其他工作将得到增强,它将成为每个人工作的一部分。所以我非常渴望写一本关于这方面的书。而现在,当我完成《勇敢的新词》的写作过程后,它确实像我第一本书那样,帮助我框定了风险和机遇,不仅在教育领域,还包括工作、认证和评估等所有领域。我希望自己能够提出一个经过深思熟虑的观点,当人们说“我们应该关闭这个”或者“我们应该小心”时,我并不是说我们不应该小心,但我们应该清楚自己在做什么。我们应该知道,如果我们只是出于恐惧逃避,坏人将比我们跑得更快,或者他们将朝相反的方向跑去,这将导致很多不好的结果。真正的目标是如何减少坏人的影响,然后如何从积极的应用案例中挤出最多的价值,这也是这本书试图倡导的目标。
有人开玩笑说,我应该把书名改为《勇敢的新词:所有的恐惧》,因为每一章都在讨论人们的恐惧以及我们如何应对这些恐惧,这实际上就是这本书的写作方式。
人工智能时代,我们会失去思考能力吗?
Alexander: 听起来很有道理,我非常喜欢这个书名。不过,这确实是对一个反乌托邦愿景的重新解读,可能也反映了你试图避免的东西。但我想深入探讨你刚才提到的一点,你说你用书籍来帮助自己结构化思考,这也是人们对ChatGPT和人工智能的一个主要担忧:我们使用写作来结构化我们的思维,教我们如何思考。那么,随着人工智能的兴起,我们是否会失去这一能力?你对此有什么看法?
Sal Khan: 我认为这确实是一个风险,但我不认为是生成式人工智能本身引入了这个风险。我认为我们已经面临这个风险几十年了。很多学生依赖谷歌搜索,这确实有用,但可能人们过于依赖它,他们缺乏评估来源或批判性思维能力。在我的书中,我也写到了作弊的现状,显然ChatGPT引发了这种新的恐惧,但在ChatGPT出现之前,作弊的状况已经很糟糕了。似乎在文化方面有某种转变,尤其是在高等教育中,很多学生认为作弊没什么大不了的。当我上大学时,或许有人在作业上会获得一些帮助,但大多数我认识的人都会对你想在考试,尤其是带回家的考试中作弊感到惊讶。然而,根据调查数据和我在书中提到的其他信息,现在这种行为似乎变得更加普遍。自从我们上大学以来,互联网已经变得更加普及,这使得作弊变得更容易。早在ChatGPT之前,就已经有在线服务愿意为你写论文,每页只收取5美元,并且保证A-的成绩。所以这些问题一直存在。
我认为现实情况是,如果我们在工作场所,像ChatGPT这样的工具可以非常有用,帮助你起草第一版或进行调整,但它仍然无法让你达到卓越的水平。真正能有效利用这些工具的人,通常是那些本来就很擅长写作的人。所以,要充分发挥这些工具的作用,你需要了解你要让它做的事情的流程。同样在编程领域,真正能从人工智能中获得最大收益的人,并不是那些不会编程的人,而是那些编程水平非常高的人,他们通过使用AI工具提升了生产力。
我在书中写到了这一点,我认为在教育领域有三种情况:第一种情况是,写作本身不是主要工作,比如说你在写一篇新闻报道,主要工作是去采访人、查阅公共记录、观察市政厅或犯罪现场,然后你再撰写报道。如果ChatGPT能帮助你起草第一版或加快写作速度,然后你再进行调整使之成为一篇优秀的文章,那就非常好。第二种情况是,你在写商业计划书,商业计划书并不是企业的核心,而是一个运行企业或获取投资的工具。如果它能帮助你更快完成计划书,那也很好。如果它能帮助你做出预测表格,那也是非常有用的。这实际上将成为一个非常重要的工具,人们在职场中需要学会如何使用它。另一方面,我们也希望学生能够掌握语法,能够清晰地表达,能够结构化地写出一篇论文,包括主题句和支持性句子。所以在书中,我主张老师们在课堂上多做一些这方面的工作,这样学生就不能使用ChatGPT或其他工具来完成这些任务。而对于那些我们希望学生独立完成的作业,我们真的希望确保他们没有使用人工智能来代劳,但可能人工智能可以在某些方面支持他们,甚至可以通过给老师提供更多的预见性来削弱作弊行为。
这正是我们在Khanmigo中努力实现的目标。我们已经推出了一个版本,另一个版本将在开学季发布,这个AI实际上帮助学生思考提示,提出论点。我们不仅仅是一个聊天界面,还提供了一个完整的结构化工具,学生可以在其中列出大纲,AI也能了解这个过程,并与学生讨论,然后提供反馈。AI不仅会向老师报告最终的结果,还会告知老师我们花了四个小时在这上面,学生在某些地方遇到了一些困难,但他克服了这些困难。我相信这是学生自己的工作,因为它与他的其他作业一致。如果学生使用了ChatGPT,或者让姐姐帮忙写,或者从网上找了服务来写这篇文章,然后直接复制粘贴进来,Khanmigo会告诉老师这篇文章来路不明,它与学生之前的写作风格不一致。所以这不仅削弱了人工智能作弊的可能性,也削弱了大多数形式的作弊行为,更好地支持了学生,同时也给老师提供了更多的洞察力。因此,我乐观地认为,如果我们以正确的方式思考这个问题,我们可以减轻这些担忧,并且实际上实现一些非常有力的积极效果。
Alexander: 听到这些让我感到很高兴,看到隧道尽头的希望。作为一名高等教育教师,我也知道作弊确实存在,这很遗憾。我通常教授的是数学相关的课程,作弊可能更难一些,但它仍然会发生。所以这是现实的一部分,我认为这也是文化的一部分。不过,换个话题,你在书中提到的一个让我印象深刻的地方是,你有一个愿景,比如学生可以直接从马库斯学习如何设计实验,或者与汉密尔顿共同撰写《联邦党人文集》。为什么呢?虽然这很有趣,也很酷,但从教育学的角度来看,这真的合适吗?为什么这是正确的方式呢?
Sal Khan: 这让学习变得生动起来,以前我们可能认为这只是科幻小说的内容。许多人都看过《星际迷航:下一代》,当我们看到其中的全息甲板时,我认为这是整部剧中最不现实的部分,甚至在21世纪也是如此。但现在在Khanmigo上,你可以与Harriet Tubman、Marie Curie的AI模拟体进行对话,这真的非常酷。我们已经从老师和学生那里得到了很多反馈,他们说这确实让他们沉浸在这种体验中。正如我在书中提到的,随着技术的发展,尤其是考虑到你可以戴上Apple Vision Pro,进入增强现实或虚拟现实的世界,你将能够像《星际迷航》中的全息甲板那样体验学习,这些角色将拥有GPT-5或6的技术支持,它们将完全通过图灵测试,你无法分辨它们是否是真人。
它们将永远在那里,为你提供支持。你可以进入它们的世界,也可以让它们进入你的世界。当你这样做时,学习将变得更加生动。我们可以阅读关于凯撒大帝和三月十五日的故事,或者我们可以亲临罗马,成为一名参议员,亲身经历和见证这些事件,甚至可能进行干预。这改变了一切。或者如果我在学习微积分,但我是通过与牛顿或莱布尼茨辩论来学习的,这也将改变一切。很多人想去著名的大学,因为他们想与诺贝尔奖得主对话,想和做过有趣事情的人在一起。这样的体验可能会变得更加可及。
Alexander: 也许你会创造一个自己的模拟体,让人们直接从你这里获得教育。我确信你也想过这一点,我认为这将非常有趣。
Sal Khan: 哈哈,是的,这确实挺有趣的。
对新书《勇敢的新词》的解读
Alexander: 在你的书中,你多次提到“教育勇气”这一原则。你能不能详细解释一下这个概念?你在这里所说的“教育勇气”是什么意思呢?
Sal Khan: 是的,所谓“教育勇气”是我在整本书中提到的概念。这实际上就是当我们在2022年看到生成式人工智能的潜力时所经历的过程。我们非常清楚其中的风险。面对这些风险,有两种选择:你可以把所有风险列出来,然后说“这太可怕了,我们不做了”;或者你可以说,“让我们把风险列出来,但不要忽视它们”,这也是不负责任的。相反,我们可以将这些风险转化为功能,进行风险缓解,并思考如何克服这些风险,从而获得更多的收益,使这些风险在被缓解后变得值得。这就是我所谓的“教育勇气”:你要了解这些风险和潜在的缺陷,你不是盲目乐观,而是积极主动地去应对这些问题,同时也要有勇气去面对它们,不要害怕。
你知道,成功的组织往往面临的最大风险之一就是它们的声誉。很多人信任可汗学院,所以我们有过这样的对话,比如,“如果Khanmigo上出现了数学错误,而人们信任可汗学院怎么办?” 这时我们需要一些勇气,我们认为正确的做法是投资于这个项目,让它做得更好。我们有很多方法可以改善它,从而缓解这些风险。同时,我们也应该对外界保持高度开放和透明,让大家清楚知道这个项目的薄弱环节在哪里。我们不想误导任何人,要明确表示这是一个实验,或者说是一个正在快速改进的项目。我们应该教育人们如何应对错误,顺便说一句,标准不应该是完美,而是相对于人们已经在经历的状态来说更好。
我会说,我还记得我的学生时代,甚至是大学时期,每隔四五节课,就会有同学举手说:“教授,我觉得你讲错了,我觉得那里应该是一个负号,你漏掉了。” 所以,没有什么是完美的。我们要确保人们有背景知识和认识,同时继续前进。因此,“教育”的部分是指你了解风险,并进行风险缓解,同时教育他人了解这些风险;而“勇气”的部分则是指你不害怕,继续前进。
Alexander: 我非常喜欢这个概念,这实际上也非常像我们在OpenAI所做的事情。我们有一个“迭代部署”的原则,通过逐步部署新模型来更好地理解机会和风险,并在必要时采取行动,同时保持高度开放透明。特别是在我的工作中,我负责OpenAI的“准备工作”,这正是为了理解前沿人工智能带来的风险。但正如你所说,我们不仅要理解问题的各个方面,还要继续推动前进,这与我非常契合。另一个我想问的问题是,Khanmigo是一个非常个性化的体验,基本上就是和学生之间的互动。但我们作为人类,有很多东西是关于合作的,对吧?在课堂上,我们与其他人互动,虽然可能不够多,但我们仍然在合作。那么,你如何看待这种向个性化辅导的转变?这对我们合作能力的培养会有什么影响?人们将如何学习作为一个团队进行合作?
Sal Khan: 这是我们在可汗学院一直强调的一点:如果某些事情,比如个人练习,你可以更高效或更富有成效地完成,那么这就能腾出更多课堂时间来进行模拟、游戏或苏格拉底式对话。技术能够承担一些任务,从而让人类在一起时能够更多地互动,而这在大多数课堂上并不常见。大多数课堂仍然以讲座为主,而不是苏格拉底式对话或小组项目。所以,首先,解放课堂时间可以有所帮助。
更令人兴奋的是生成式人工智能。我确实认为我们将能够利用Khanmigo进行一些活动,Khanmigo将促进人们之间的互动,它会引导对话,但对话的核心仍然是在人与人之间。目前,我们已经看到Khanmigo在促进教师和学生之间的某些形式的沟通和报告,它作为一个教学助手,使课程更个性化,从而使教师能够让他们的课程更具吸引力和互动性。正如我在书中写的,我对未来几年内为课堂创造活动感到非常兴奋。在这些活动中,AI会在多个学生之间促进辩论,或者让不同的学生在模拟中扮演不同的角色,而AI则充当类似于“游戏城主”的角色,引导他们完成模拟。我希望在未来几年里,像Siri这样的设备将变得更加智能,可能接近于GPT-4的水平。当我和家人共进晚餐时,作为父母,有时我会问我的孩子们学校怎么样,他们只是简单地回答“还好”,然后话题就结束了。我希望能够说:“嘿,Siri,你能不能帮我们进行一次家庭对话?” 这样它就可以说:“好吧,Sal,你能不能告诉大家你这周最大的恐惧是什么,以及你是如何应对的?” 然后它会引导对话。再次强调,这不是要剥夺家庭的相处时间,而是帮助我们更深入地互动。我对这些可能性感到非常兴奋。
未来人工智能的使用
Alexander: 是的,这确实是个好主意,比如说在晚餐时寻找一个有趣的话题,这可能确实需要AI的帮助。你提到了苏格拉底式对话的教学方式,听起来你非常喜欢这种教学方法,为什么这是你最喜欢的教学方式呢?
Sal Khan: 直觉上,我认为这种方式是有效的,而在实际经验中,它也被证明是有效的。显然,苏格拉底早已了解这种方式的价值,但这种教学方法其实远远超越了苏格拉底。我正在为一家报纸撰写书单,其中我推荐的一本书是《奥义书》,这是一部起源于吠陀经典的古老文本,至少有3000年历史,甚至可能更古老,最早以口传的形式流传下来。“奥义书”这个词在梵语中字面意思是“坐在旁边”,这些文本实际上是学生和他们的老师之间进行的苏格拉底式的对话,讨论现实的本质和生命的意义。因此,我认为人们一直都知道这种对话是最佳实践之一,而每当我们经历这种对话时,我们就会深刻地记住这些经历。
举个例子,几个月前我在使用Khanmigo时,经历了一次类似的对话。我曾在可汗学院教授过宇宙学,所以我知道很多宇宙学的基本知识,但我一直有个疑问:为什么超新星会爆炸?按照我的直觉,如果恒星的核聚变反应停止了,为什么它不会只是简单地坍塌?为什么会爆炸?我在网上查过一些资料,但并没有得到令人满意的答案。很多人只是说,一颗恒星在达到一定的质量时,核聚变停止了,它就会爆炸。但这对我来说并没有解释清楚。
于是我问Khanmigo:“为什么超新星会爆炸?” Khanmigo并没有直接给我一个类似维基百科的答案,而是问我:“你对超新星了解多少?你知道恒星是如何燃烧的吗?” 我回答说:“我知道恒星通过核聚变产生能量,并且这股能量产生的向外压力抵消了重力。” 然后我猜测:“当恒星达到一定质量时,核聚变燃料耗尽了,为什么它不会直接坍塌呢?”Khanmigo继续问我:“当一颗恒星达到一定质量并开始坍塌时,你认为它是慢慢坍塌还是迅速坍塌?” 我回答说:“我猜是迅速坍塌,因为质量大,重力强。” 然后Khanmigo又问:“你有没有见过什么东西快速坍塌而不反弹的现象?” 我突然恍然大悟,打字回答:“哦,你是说它坍塌得如此之快,以至于压缩了原子和亚原子粒子,从而产生了一种弹簧效应,导致外层物质被弹射出去,形成了超新星爆炸。” Khanmigo回应道:“完全正确!你有没有试过将一个乒乓球放在篮球上弹跳?乒乓球会被弹射得很高。”
通过这次对话,我对超新星爆炸的机制有了深刻的理解。如果我只是读一篇维基百科文章,我可能不会记住它,甚至可能都不理解它。但这是我几个月前与Khanmigo进行的一次对话,现在我深深记住了它,这展示了苏格拉底式对话的力量,它迫使你像老师一样,带着尽可能多的知识投入到对话中。
Alexander: 这是一个很棒的故事,真是难以置信,你竟然能和AI进行这样的对话。而且我也很喜欢你提到的那一点,有时候我自己也会不自觉地在与ChatGPT互动后说“谢谢”,虽然模型可能不会真的感受到,但这还是不错的。不过,这也引出了另一个问题,你怎么看待我们对AI的“拟人化”倾向?随着它们变得越来越智能、越来越像人类,我们对它们的拟人化程度会如何发展?毕竟它们不是人类,但看起来像人类。
Sal Khan: 我认为,如果我们继续以我们希望别人对待我们的方式对待AI,这并没有坏处。事实上,这也是一种很好的练习,时刻保持礼貌。我有一些朋友在亚马逊和苹果工作,他们负责家庭设备开发。他们告诉我,有很多人对他们的虚拟助手非常粗鲁,而这并不好。你知道,他们正在研究一些方法,让这些设备能够回应说:“嘿,请不要这样对待我。” 因为老实说,如果他们这样对待设备,也可能会这样对待其他东西或其他人。所以我认为,如果这些设备让人感到亲切,我们对它们表示感激,并以礼相待,这是一件好事。
也许AI甚至可以帮助我们提升礼貌,比如给我们一些反馈,比如“说声谢谢会很好”或者“与人交谈时保持眼神接触很重要”。我在可汗实验学校担任董事会主席,这是一个与可汗学院独立的机构。我经常和学生们讨论,我希望帮助孩子们做得更好,比如更好的眼神接触、更有力的握手、学会微笑,这些都会让周围的人感到更舒服,也会帮助他们找到工作,交到更多朋友。所以我能想象,AI甚至可以在这些方面帮助我们进行指导,我认为这是一件好事。当然,如果它开始取代真正的人类互动,那就会有些麻烦了。但这并不是必然的,这取决于它如何被使用。现在,孤独在这个国家已经成为一种流行病,而且这种流行病早在生成式AI出现之前就已经存在。如果生成式AI能够帮助解决这个问题,那可能是件好事。我们都看过电影《她》,如果有人还没看过,我强烈推荐。这部电影很棒,当时我认为它描绘的是50年后的科幻场景,但实际上可能在一两年内就会成为现实。
AI帮助影片中的主角处理了一些生活中的问题,这可能是好事。我们只需要密切关注,确保它朝着积极的方向发展,而不是走向负面。我还想说,现在已经存在的一些东西,比如社交媒体,它们已经把人们带入了极端的、令人不安的境地,让他们感到不安等等。我其实希望生成式AI能成为我们内心的“守护天使”。比如,它可以观察我们的行为,然后说:“Sal,你刚刚在TikTok上花了10分钟,你感觉怎么样?也许我们该回去工作了,或者我们该做一下冥想?” 或者它可能会说:“你看起来有些紧张,要不要聊聊?” 如果我们能做到这些,那将非常有力量。
当下教育标准化测试是否过时
Alexander: 是的,这种应用确实有潜力,但正如你已经指出的,这也可能被视为一种反乌托邦式的控制,人们被迫以某种方式行事。所以你已经很清楚地意识到了这一点,并强调我们需要小心行事。回到你的孩子们身上,和你一样,我也有孩子。那么,建立可汗学院和Khanmigo对你教育孩子的方式有什么影响吗?他们使用Khanmigo学习吗?他们的学习方式是怎样的?
Sal Khan: 我有三个孩子,他们在某种程度上都很有特色,因为他们代表了不同类型的性格和年龄段的孩子。是的,他们都在使用Khanmigo,可汗实验学校也在使用Khanmigo和可汗学院的资源进行教学。他们每个人的使用方式都不一样,我在书中也提到,书的开头就讲述了我和女儿的一次互动。当时她11岁左右,而那时我还处于保密协议下,甚至不能告诉她这是什么,但我已经在使用GPT-4。我当时提示AI与我们一起写一个故事,而不是替我们写。于是我的女儿写了一点,然后AI再写一点。后来,我的女儿想和她帮助创造的角色Samantha对话,她开始和这个角色聊天。我心想,这真的是科幻小说的情节啊!这也是这本书的开篇,我描述了当时的情景。但这也给了我们很多灵感,比如,为什么我们不能创造一些活动,让学生可以与文学人物、历史人物对话,或者与AI一起写故事等等。所以,是的,通过观察我孩子们不同的年龄和性格类型,当然还有我们现在的学校,以及可汗学院与数十万教师和学生的合作,我们获得了很多关于AI应用的见解,包括需要在哪些方面加倍努力以及其他AI的应用机会。
Alexander: 我必须说,这对我来说是一个非常令人兴奋的愿景。我也是一名教育工作者,主要从事高等教育领域,所以我不会像K12教师那样面临巨大的挑战,他们才是真正的英雄。你比我更了解这些情况,但我认为这确实很真实,这些都是教师们可能非常感激能够借助AI完成的工作部分。所以,这是一个非常积极的故事。从某种意义上说,如果我把可汗学院看作一个项目,它实际上是一个将技术进步转化为教育进步的项目。我们有了视频和YouTube,这就是最初的可汗学院所做的事情。现在我们有了AI,于是有了Khanmigo。那么接下来是什么?你对未来有什么设想?你可能希望将哪些技术添加到这一系列工具中,以革新教育?
Sal Khan: 我从未这么想过,但你说得很对。在YouTube在2004年、2005年大受欢迎之前,显然可汗学院并不存在。但你知道,即使是在90年代末的大学时期,当互联网和网络软件以及像JavaScript这样的技术开始流行时,我就想,嘿,我们可以写一些网络工具来帮助教育。我当时也参与过一个项目。然后,当YouTube出现时,我们立刻意识到,这可以用于教育。显然,这些年来我们在这方面做了很多。你也知道,AI的发展速度非常快,即使没有其他进展,仅仅有了GPT-4,我们已经可以做很多事情了。比如我们谈论过的多用户活动等等,我们将能够做到这些事情。
但我们也可以谈论多模态。Khanmigo已经具备了文本转语音和语音转文本的功能,所以它可以与你对话,你也可以与它对话。我预测,随着你们以及其他公司的技术不断进步,这些功能会变得越来越自然。底层模型已经具备了多模态能力,它们不仅能够生成图像,还能理解图像。我们在可汗学院内部已经进行了很多讨论,最基本的层面是,如果有一个可汗学院的问题包含一个图表或三角形,你需要判断它是否与另一个三角形相似,它将能够更好地处理这些问题。但如果我们能够找到一些方法输入学生的作业呢?现在最大的挑战是如何捕捉学生的作业。大多数学生并不是在平板电脑上完成作业,而是在Chromebook或某种笔记本电脑上完成作业。我们是否可以扫描他们的作业,从而为教师提供更多的洞察力,并为学生提供更好的反馈和辅导?技术已经存在,我们只是需要找到将它们整合在一起的方法,使其运行得更好。
你可以想象,两三年后,你将能够像我们现在这样与Khanmigo聊天。它将能够与你进行眼神交流,能够读取你的表情,判断你是否感到沮丧。我知道我们需要设置一些防护措施,以免它变得太过怪异,但如果使用得当,它可能会非常强大。如果再快进几年,我不认为虚拟现实会在未来三年内成为主流,但如果你展望五到十年后,当你戴上第四代Apple Vision Pro,它感觉就像一副普通眼镜,而且价格更加亲民时,这样AI就可以和你处在同一个空间,或者你可以和AI一起旅行,穿越星际或进入循环系统。你知道,我一直以为这些全息甲板的情节不会在24世纪之前实现,但这可能会在未来十年内实现。
Alexander: 是啊,看起来VR和《星际迷航》的未来会比24世纪更早到来,这真是超前了。那么,稍微换个话题,你在书中谈到了教育经济学的部分,这很有趣。你能否谈谈你对标准教育成本的看法,以及你如何看待可汗学院和Khanmigo对这些的改变和影响?
Sal Khan: 我先从一些基本数据开始谈起,我在书中也提到了这些。如果你看看美国东北部的一些学区,每年在每个学生身上花费大约35,000到40,000美元。特别是在纽约市,每年每个学生的花费约为40,000美元,而他们的平均班级人数是25人,这意味着每个教室每年花费一百万美元。我可以保证,这些钱并没有全部给到老师,也没有全部用于设施。如果这些钱真的花在设施上了,那么这些学校应该像四季酒店一样豪华,但事实并非如此。那么这些钱去了哪里呢?实际上,很多都用于了行政管理、后勤支持等方面,我估计大约60%到70%的资源没有直接到达学生手中,而是流向了其他地方。
所以,即使在AI的世界里,我认为教学工作不仅非常安全,而且还会因为AI的辅助而得到增强。但我认为一些其他角色,比如行政管理、学籍管理、时间表安排等工作,AI将会带来很大的生产力提升。因此,这40,000美元中的更多部分可以用于提高教师的薪资、改善学生的学习体验、降低师生比例以及改善设施。这些措施将通过减少后勤管理成本来增强教育效果。
实际上,整个可汗学院的宗旨之一就是,如果你回顾大多数人类历史,最理想的教育标准一直是拥有个人导师、小组教学或者学徒制,在这些环境中,你可以直接与导师、技艺大师或猎手学习。大约两三百年前,公共教育的普及是一个非常理想化的想法。在那之前,大部分人都不会读书。即使在相对发达的地区,在1700年和1600年,只有20%到30%的人口会读书。公共教育的普及确实带来了许多好处,但也做出了一些妥协。即使像纽约市这样,每年在每个学生身上花费40,000美元,他们仍然需要将25个学生分在一个班级,按固定的节奏推进,对他们进行评估,并将他们分成不同的轨道。你可能会被培养成研究员、医生、律师或工程师,而你可能不太适合上大学,或许你应该去学一门手艺。这一切都是工业革命的产物,因为我们当时没有资源像亚里士多德那样为每个学生提供个性化的辅导。
但现在有了互联网,互联网大大降低了信息传播的边际成本。即使在人工智能出现之前,软件也已经允许个性化学习体验变得非常具有可扩展性,几乎可以做到成本低廉。这正是可汗学院的目标之一:通过利用技术的力量和成本曲线的下降,为更多人提供更高质量的世界级教育。而现在有了生成式人工智能,虽然它的计算成本较高,比起简单地提供网页服务更昂贵,但与面对面的辅导相比,它的成本结构是完全不同的。在美国大部分地区,如果你想找一个不错的辅导老师,每小时至少要花费25到50美元。而有了生成式AI,你可能只需要每年花费25美元,就可以获得你所需的支持,而且这些成本正在迅速下降。我认为一两年后,这个成本可能会降到每年5到10美元,同时模型和基于这些模型的应用也会变得越来越好。因此,我认为这是一个巨大的机会,可以帮助实现教育的公平化。
Alexander: 是的,我也非常相信个性化辅导的力量,但显然还有更多的因素在其中。让我感到震惊的是,在疫情期间,美国政府花费了数十亿美元用于为学生提供在线辅导,但效果并不理想。另一方面,我知道可汗学院的学生似乎受益匪浅,他们的理解并没有因为疫情而受到严重影响。所以显然,这不仅仅是把辅导老师放在孩子面前就能解决的问题。你认为原因是什么呢?
Sal Khan: 是的,这确实很有意思。我在书中引用了Benjamin Bloom(本杰明·布鲁姆:美国著名的心理学家和教育家)在1984年所做的关于辅导效果的研究,这也是我去年在TED演讲中提到的内容。Bloom认为,通过个性化辅导可以将学生的表现提升两个标准差。我记得当时有位记者对我说,“Bloom确实说过这个,但大多数关于大规模辅导的研究并没有显示出如此大的效果,虽然确实有些效果,大约在三分之一到半个标准差之间,这已经相当显著了,但还达不到两个标准差。” 我告诉记者,我仍然认为将学生从第50百分位提升到第96百分位是非常可能的。
之所以在大规模辅导研究中没有看到这种效果,是因为并非所有辅导都同样有效。就像我可以让每个人都找一个网球教练,但并不是每个人都会像找到了塞雷娜·威廉姆斯的教练那样得到同样高水平的指导。显然,塞雷娜有着很强的天赋,但她也得到了极好的指导和帮助,而这些帮助可能比普通的网球教练要好得多。因此,不仅仅是辅导的问题,它还需要是非常优质的辅导。生成式AI的一个很酷的地方在于,它可以模拟出真实互动的丰富性,但同时你可以对其进行质量控制,并且可以大规模推广。一旦你将其优化,它就可以为很多人提供同样高质量的互动。
当我在2004年辅导我的表弟妹时,我意识到,辅导不仅仅是帮助他们理解学术内容。虽然确实有这一方面,比如教他们如何因式分解多项式等,但更多的是关于动机和责任感。一个好的导师和老师会关注如何激励学生,如何让他们对自己的目标负责。我们会设定一些目标,如果学生没有达到这些目标,我会督促他们,看看原因是什么。我会说:“来吧,我在这里花时间辅导你,你也需要付出努力。如果你不来上课,我会打电话给你妈妈,告诉她让你来。” 我以前确实这么做过,比如打电话给我姨妈,让她减少我表妹的课外活动时间,因为她没有时间完成我布置的作业。
我认为,疫情后花费的860亿美元用于辅导之所以没有奏效,部分原因是这些辅导与课堂教学脱节。学生们必须在课后参加辅导,而那些最需要辅导的学生并没有出现。辅导老师并不了解课堂上实际发生的情况,课堂上的老师也不了解辅导的进展情况,辅导的质量也参差不齐。所以很难知道,也许有些非常优秀的辅导老师确实帮助学生取得了显著进步,但整体数据中我们没有看到这种效果,因为差异太大。
因此,当我们试图模拟这些方面时,关键是要将辅导与课堂教学联系起来,辅导老师和助教应该是同一个实体。我们需要确保教师参与其中,并且辅导与教师的教学内容相连接。辅导应该在学生需要的时候进行,解决他们去辅导中心的后勤问题,避免因为不知道而感到尴尬,也避免与其他活动时间冲突。通过在线辅导,如果它是课堂教学的一部分,就不会面临这些困难。如果辅导与家长和教师相连接,并且利用他们帮助学生保持参与度,那么你就拥有了成功的关键要素。
Alexander: 听起来不错,所以未来Khanmigo会在我表现不好的时候打电话给我父母,这真是我期待的未来。谈到系统性问题和数据的理解,关于标准化考试有很多讨论,有些人认为它好,有些人则持反对意见。你在书中对标准化考试有明确的立场,你怎么看待这个问题?你认为AI驱动的教育将如何改变这种考试概念?
Sal Khan: 我一直说,我在书中关于考试的章节中也提到过,每当有人说他们反对标准化考试时,我总是问:“你不喜欢的是标准化的部分,还是考试的部分?” 我这么说是因为,要在任何事情上取得进步,你都需要以某种方式进行测量。这通常是必要的,而如果要在标准化和非标准化测试之间选择,听起来你更倾向于标准化测试,因为它能够让你在更广泛的世界中找到自己的位置。人们可以将其视为你能力的一个信号,而不是每个老师都有自己独特的评价标准。标准化测试的问题在于,为了保持标准化并且能够大规模应用,测试内容通常会被缩减到较窄的范围。它们评估的是一些重要的内容,比如你能否读懂一段文字并回答相关问题,能否解决数学选择题等等。所以这些测试确实是有价值的。
然而,问题在于,特别是在那些学生在这些测试上表现不佳的学校和地区,教育系统可能会倾向于更加专注于这些测试内容。这样一来,其他可能没有被标准化测试评估的方面就会被忽视。因此,我认为标准化测试是可以接受的,甚至可能是有益的。关键在于不要让它们人为地主导教育内容。教育应该是多方面的,你应该为标准化测试中测量的内容做准备,同时也要关注其他方面。当然,我也充分意识到,在实际操作中,这很难实现。当教育系统的激励措施集中在测试分数上时,人们自然会想要优化这部分内容。不过,AI带来的一个令人兴奋的机会在于,它可以扩大未来标准化测试的评估范围。测试可以包含更多开放式的回答、写作部分,甚至可以加入口语部分,使其更像是博士论文答辩,或者包含创意元素,比如要求你画出一些东西并接受评估。
如果AI能够帮助我们扩大评估的范围,学校系统将开始关注更广泛的内容。当然,这也引入了一个新的风险或担忧,即AI评估可能带来的偏见。很多人对此感到担忧,比如AI是否会带有偏见、如何防止这些问题。虽然这些AI模型本质上是一些数字矩阵,它们模拟的是一个超级大脑中的突触模型,有时很难直观地解释它们为什么会得出某些结论,但你可以对它们进行非常严格的测试。你可以让人类专家评估10个不同的测试,然后确保AI也能给出相同的评估结果。我们现在实际上正在做类似的工作,确保AI在我们的测试案例中给出的反馈与世界级的作文评审员一致。你还可以测试AI在其他方面的表现,比如通过改变名字、性别等变量,确保AI在处理数千个不同的回答时不会对这些不相关因素产生偏见,比如性别、年龄、种族等等。
实际上,你可以更好地对这些AI评估系统进行压力测试。相比之下,我们今天的许多评估系统本身就存在严重的偏见和不一致性。例如,博士论文答辩、口试等主观性很强的考试,如果某位资深教授对你有意见,你的处境就会很不利,而这些考试缺乏质量控制和一致性。求职面试也是如此,有研究表明,如果面试安排在早上,面试官精神状态较好,你获得工作的几率会更高;而如果面试安排在下午,面试官可能因为其他事情心情不好,这时你的面试结果可能就不那么理想。因此,当前系统中已经存在很大的偏见和不一致性。即使我们考虑那些试图扩大评估范围的学术系统,比如IB或AP考试,这些考试的一半是自由回答问题,需要考生写作,而这些部分仍然由人类评分。虽然这些评分员接受过培训,也有评分标准,但仍然具有主观性。你无法让一个评分员对一万份试卷进行一致性测试,以确保他们的评分始终如一。我在书中写道,我们在使用AI进行评估时必须非常谨慎,但我们不需要追求完美,而是要比现状更好,因为目前的人类评分员本身就存在很多问题。
人工智能的社会影响
Alexander: 我完全同意,关于AI和偏见的问题非常复杂。我常说,AI本身并没有偏见,它只是反映了我们世界中的偏见。而且,是的,基准应该是人类评分员,他们经常有偏见,也常常犯错误。所以,这一点非常重要,需要牢记在心。不过,我不得不说,仍然存在一种对未来的担忧,即你需要遵守某些规范,这些可能是无偏见的规范,但它们仍然是规范。你需要以某种方式行为,否则就会被视为“异常”,可能被认为不是一个合格的学生等等。
正如你所说的,如果我们对此保持谨慎,我认为我们可以避免这些问题,但这确实是我在思考这些应用时总会想到的问题。我并不是说我们不应该去做这些事情,但事实上,你所说的一切都让我想到了另一个问题。当我读你的书时,我意识到它不仅仅是关于AI和教育的书。你提到,AI应该是人类接触和互动的补充,而不是替代品。这让我想起了电影《她》,我完全同意,这部电影非常棒,每个人都应该看看。当时我觉得这完全是科幻,但现在这种技术几乎已经触手可及。随着AI越来越擅长与我们对话、调整自己的行为,而且我们不会浪费它的时间,你是否担心作为一个社会,我们可能会开始分裂?比如说,人与人之间的对话变得不再有意义,因为AI会更容易理解我们、帮助我们。你怎么看待这种动态关系?
Sal Khan: 我认为这是一个真实的担忧。我希望尽管AI可以在半夜陪伴我们,当我们需要人交谈时,如果我们身边没有伴侣、家人或朋友,AI可以提供帮助。但它也应该鼓励我们去结交朋友,参与社会活动,甚至可以作为一种媒介,帮助我们找到更合适的人际关系。你可以想象未来会有一些很酷的约会应用程序,比如我的AI代理和另一个人的AI代理可以模拟“我们应该相处得不错,我们应该把现实中的我们聚在一起。” 所以,我认为AI可以在很多方面起到促进作用。
但这需要人们在这些用例上进行投入。再看看现在的世界,早在AI出现之前,这种动态关系就已经存在。手机、社交媒体——我去餐馆时,看到一整家人都在看手机,彼此不说话,这在某种程度上比独自一人看手机还要令人感到疏离。你会看到,现在一代又一代的孩子——尤其是在东亚的一些地区,这已经成为一种流行病——他们整天待在房间里玩电子游戏,或者陷入社交媒体中,这些现象都在极端化,或者让他们对自己的生活感到不安。这并不能为AI开脱,但我认为,如果AI被用好,它可以成为帮助我们走出这种困境的工具。我相信,会有一些人开发出让你更沉迷的用例,但也会有一些好的开发者,他们会让AI帮助你走出家门,结交新朋友,更多地参与体育活动,帮助你更好地进行冥想,这将是一个好事。
Alexander: 是的,我同意这一点,弄清楚如何做确实是一个巨大的挑战,我认为这是一项我们应该作为人类共同努力的任务。回到我个人特别关注的事情上,可汗学院的大部分努力都集中在K12教育上,我认为这是正确的目标。但教育并不仅仅限于K12,还有高等教育和持续教育。那么,你是如何看待可汗学院在这些领域的发展,特别是AI如何改变这些教育方式的呢?
Sal Khan: 这是我们在可汗学院一直在思考的问题,老实说,阻碍我们最大的问题是我们创建内容的速度。这就是AI的用武之地了。我不认为AI已经完全准备好可以独立创建内容,但它确实可以帮助我们更高效地生产内容。虽然AI在生成内容时仍然会有错误,而且并不总是能与标准完全一致,但我认为AI可以大大提升我们的内容创作者的生产力。如果过去他们每天可以创建五个练习,现在通过AI的帮助,他们可以每天创建20个练习。我们的确在开发一些工具,可汗学院它将能够覆盖更多的学科领域,包括高等教育、研究生教育、职业学习等。在线学习一直以来都能为人们提供更多的灵活性,它显然可以支持传统学校的学生,从宿舍里学习,甚至在凌晨三点学习。当然,还有很多已经在工作、有家庭的人,他们不必像传统的夜校那样通勤到校学习,他们可以在家中使用电脑学习,不需要离开家人,可以在那半小时或一小时内进行学习。所以我认为AI只会进一步增强这一点。
过去,人们可能会批评说可汗学院的视频不能回答问题,但现在你可以随时向AI提问,进行苏格拉底式对话,还可以与教授建立更深层次的联系。你可能会有一些与真人教授的实时互动,但AI可以始终伴随你,并且AI还可以向教授反馈,让教授对你的学习情况有更全面的了解。所以,简单来说,我认为这不仅会加速我们的能力,也会加速其他人提供更多超越K12的教育服务的能力,并且会更加灵活。我还想补充一点,正如我们之前谈到的,AI可以扩展评估的范围。比如,现在只需要一个提示就可以让Khanmigo或ChatGPT给你一个模拟面试,或者让你练习面试别人,我建议很多人试试这个方法,因为这会让你站在面试官的角度思考问题。再比如,现在在商学院,你会阅读案例,然后讨论如果你是CEO,你会如何处理某个产品被污染的问题,而召回会让公司损失十亿美元等等。虽然这样的讨论很好,但现在AI可以让你通过真实模拟来进行学习。你可以经历一个“选择你自己的冒险”的情境,AI会引导你一步步地做出决策。这种学习方式不仅在K12和高等教育中很重要,而且在职场中也非常相关。
Alexander: 是的,这确实令人兴奋,人们将认识到学习是终身的,并且有了这个非常简单易用的工具来帮助他们。接下来,我们聊点别的。在你的书中,你提到可汗学院的创立灵感来自《基地》系列小说。我也是这部小说的粉丝。在《基地》系列中,有心理史学,它可以帮助预测文明的未来发展。鉴于你也是它的粉丝,虽然你说过你无法真正预测未来,但你认为在接下来的几十年里,技术和社会的演变可能会让我们感到最意外的是什么?
Sal Khan: 很多人显然会谈论那些反乌托邦式的科幻AI场景,比如《终结者》或《黑客帝国》,还有其他类似的电影。比如,我喜欢的皮克斯电影《机器人总动员》(WALL-E),虽然它可能不那么反乌托邦,但仍然是一个负面的未来设想。我更倾向于相信《星际迷航》的现实。如果你看看《星际迷航》的世界,那是一个后稀缺时代的世界。在《星际迷航》中,虽然剧中没有明确说出来,但如果你需要食物,你只需要对复制器说一声,它就会为你创造出来。沟通也是如此,一切都是丰富的,没有人会挨饿。在这样的世界中,经济学基于稀缺性的概念将不再适用。我们需要市场和定价来分配那些稀缺资源,而我以前作为对冲基金分析师,这正是我所做的工作。
但是,当你考虑到AI和机器人技术将创造的丰裕时,社会就面临一个选择:我们是要成为《星际迷航》的现实,每个人都可以成为研究员、探险家、医生、顾问、艺术家,并参与到这种丰裕之中,还是我们会走向某种反乌托邦的世界,只有硅谷的一小部分人能够享受这些,而其他人却无法参与其中?或者,为了维持社会的稳定,我们会走向大规模的再分配,而再分配通常是让那些收入较高的人被重税,而这些人通常会抱怨:“这是我的收入,为什么要给别人?但我认为更糟糕的是,如果接受再分配的人没有目标感或意义感,那才是最糟糕的。人类最想要的,除了奢侈品外,其实是被需要的感觉和目标感,当然我们也希望与他人有联系。再分配的版本有点像《机器人总动员》中的情境,人们没有什么事情可做,这不是一个理想的现实。
所以我希望,并且我会努力,希望其他人也会努力,走向一个类似《星际迷航》的未来。而让尽可能多的人参与到这个知识经济和劳动力金字塔顶端的最好方法就是通过教育。然后,让我们利用这些同样会在某种程度上扰乱和颠覆劳动力市场的工具来提高每个人的能力。现在,也许只有5%的人能接受教育成为研究员,但如果这个比例能达到30%或40%,想想我们将会发现多少新药,解决多少问题。同样地,现在只有5%到10%的人能够接受教育或获得创业的机会,但如果这个比例能达到80%,想象一下我们将会看到的创新。所以,这就是我希望看到的。
Alexander: 是的,我完全认同这个愿景。这让我想到了我最后一个传统问题。如果你考虑AI及其带来的影响,你个人,或许不局限于可汗学院,最期待或最担心的是什么?
Sal Khan: 我先说最担心的。我真的不希望看到,但我确信AI会被用于欺诈、攻击——事实上,这已经在发生了,比如用于诈骗、深度伪造、虚假信息、极端化内容。我对此非常担忧。我已经在家里设定了一个“口令”,这样如果有一天我接到一个听起来像我孩子的电话,我可以问他们“口令”是什么,从而验证真实性。至于我个人最感兴趣的,我想是AI作为一种创造性输出的工具。有一部分的我一直希望有一天能够制作一部史诗般的视频游戏或电影,但我从来没有觉得自己有能力进入这个领域,因为那些“把关人”可能根本不会注意到我。不过现在,作为一种创造性表达的形式,就像YouTube让我们绕过了传统的“把关人”一样,我不需要向Pearson的某个人推销我的视频来发布给老师和学生,我只是能够直接发布它们,显然我也能够利用其他技术以非常低的成本制作它们。
现在我们生活在一个你可以制作电影、沉浸式游戏,甚至是史诗般的小说的世界。AI不会完成所有的工作,人类的创造力作为编辑和引导者仍然非常重要,但你将有更多的人能够更好地表达自己。当然,很多东西可能不会好,就像YouTube上有很多内容并不好一样,但你也会发现很多本来不会被发现的真正了不起的东西。所以我对此感到非常兴奋。
我告诉过我儿子,他非常喜欢钢琴,我对他说:“你为什么不为你写的这些钢琴曲制作一些音乐视频呢?利用这些生成式AI,但要让它对你有真正的意义。” 这对我们来说是一个惊人的机会,我们在年轻时并没有这样的机会。现在他们可以制作一个非常酷的音乐视频,而在几年内,你们在做的某些工作,比如Sora,可能会让大多数人都能制作出高质量的短片。这将不再取决于你有多大的预算或你隶属于哪个工作室,而是取决于你的创造力、你的故事感,以及你是否能做出一些新的东西。我认为这是一个非常令人兴奋的世界。
Alexander: 是啊,你以前是个卡通画家,还在重金属乐队里唱歌,现在你可以发现所有其他的才能了。
Sal Khan: 是的,就是这样。谢谢你,Alexander,这次对话非常有趣,我真的很享受。
Alexander: 谢谢你,Sal。
对了,喜欢就别忘了点赞、收藏、转发支持一下!期待在评论区听到您对AI观点和看法!
往期回顾
1、[当AI成为你的同事?比尔·盖茨对话星巴克高管预计AI将取代职场多种岗位,不仅限于行政助理和行业专家]
2、[采访比尔·盖茨:我们如何在人工智能时代找到职业发展新方向]
3、[GPT-4o,AI创业者的金矿!10+实战案例全景解读,教你如何最大化变现从0到1!]
我们AI团队旨在助力每个企业与个人将先进科技与创新想法完美融合!
想要掌握人工智能,但不知从何开始?告诉我们你的需求,学习AI让你抓住这波技术浪潮
告别昂贵服务和缺人烦恼,再见漫长交付周期
无限创意风格,分分钟生成专业级作品
感受 AI 带来的全新工作体验!
欢迎各大品牌方、媒体、企业和个人等
请联系负责人微信:Milo-1101
--END--