查看原文
其他

独家视频:泰国大学演讲中,吴恩达教授再次强调:AI不会取代人类,但掌握AI的人会取代那些不掌握的人

AI工作坊 AI深度研究员
2024-11-09

(关注公众号并设为🌟标,第一时间获取最新人工智能资讯和产品)

文章14,700 字,阅读约需 35分钟 

人工智能是否会取代人类?这个问题似乎已被讨论得有些疲乏。然而,在泰国最负盛名的朱拉隆功大学(Chulalongkorn University),这个老生常谈的话题再次被搬上了台面,而且还引发了新的思考。

近日,斯坦福大学的吴恩达教授在这所大学进行了一场题为"AI与未来变革"的演讲。讲堂内座无虚席,显示出人们对这个"老话题"的持续关注。然而,吴教授并没有延续那些陈词滥调的讨论,而是抛出了一个更具争议性的观点。

"以安全为幌子对人工智能进行监管的努力,是出于那些在受到开源威胁的人工智能模型上投资了数千万美元的公司的利益。"吴教授的这番言论,无疑为AI发展的讨论增添了新的维度。他指出,某些看似为公众利益着想的监管措施,实则可能是为了保护特定公司的商业利益。

紧接着,吴教授重申了他的一贯观点:"AI不会取代人,但使用AI的人一定会取代不使用的人。"这句话虽然我们已经听过无数遍,但在当前AI技术飞速发展的背景下,似乎有了更深层的含义。演讲不仅再次点燃了人们对AI未来的讨论热情,更将这个话题引向了一个新的方向:我们是否应该重新审视AI发展中的发现,以及个人和企业如何在这场技术变革中保持竞争力?


演讲文字整理

今天,非常感谢有机会在这里发言。当我有机会访问泰国时,我特别想来朱拉隆功大学,因为每当出现新的、具有颠覆性的技术时,领先的大学总是在帮助国家理解技术、吸引全球研究社区的知识,并找到将这些技术应用于本地的途径中起到关键作用。上周,我访问了多家企业,并与一些政府领导人会面,我对在泰国见到的关于人工智能的热情和活动感到非常兴奋。人们不仅仅是谈论人工智能,实际上比我预想的还要多的人正在开发人工智能应用。看到泰国和朱拉隆功大学在支持这一切方面所扮演的独特角色,对我来说是非常激动人心的。因此,我希望借此机会讨论我看到的人工智能的一些机遇,并且希望这次会议只是我们长期合作的开始,共同促进泰国人工智能的发展。

人工智能,我常说它是新时代的电力。因为人工智能是一种广泛应用的通用技术,它不仅仅适用于一个或两个场景,而是可以广泛应用于许多不同的场合,就像电力一样。如果问电力有什么用处,这几乎是无法回答的,因为电力几乎无所不用。人工智能也是如此。今天,我想简要介绍一下技术环境,然后探讨一些机遇,特别是大学如何能为我们自己、我们的学生和整个社会做出更多贡献。

AI核心是一套工具,不是魔法

关于人工智能的讨论,一个很好的方式是把它看作是一套工具,其中最重要的两个工具是监督学习(或称预测性人工智能)和生成性人工智能。监督学习在过去10到15年开始发挥巨大作用,它非常擅长将输入转化为输出。例如,通过输入一封电子邮件并判断其是否为垃圾邮件,这就是监督学习的应用。我参与过的最有利可图的应用之一是在大型广告技术平台上,这些平台的人工智能会分析关于广告的信息和用户的信息,预测用户是否会点击广告,因为更精准的广告直接影响到平台的收入。在自动驾驶汽车中,我们通过分析车前的图像来判断其他车辆的位置。我们还在航运路线优化、制造业质量控制等多个领域应用了监督学习。

以声誉监控为例,构建一个使用监督学习的人工智能系统的工作流程通常是从收集大量数据开始,例如餐厅评论及其积极或消极的情感标签。通过这些数据训练人工智能模型后,我们可以部署在云服务上,以实时分析新的评论。过去十年,我们发现通过在强大的计算平台上训练大型模型,可以显著提高模型的表现,这也是我在谷歌大脑团队时强调的重点——构建大型、强大的人工智能模型。

幸运的是,这种方法证明是有效的,并且在过去十年中推动了大量的人工智能进步。如果上一个十年是大规模监督学习的十年,那么这个十年似乎将成为生成性人工智能的十年。我知道你们中的许多人已经使用过如 ChatGPT、Claude 或 Gemini 等工具,这些工具可以根据你的提示生成不同的内容。我非常喜欢吃芒果糯米饭(ข้าวเหนียวมะม่วง)。鉴于围绕这一技术的热议,我想花一点时间来解释生成性人工智能的工作原理。核心是使用监督学习从输入 A 预测输出 B,通过不断预测下一个词来实现。例如,如果人工智能团队从网上找到一句话“我最喜欢的食物是芒果糯米饭”,这句话就被转化为多个数据点,用来预测下一个词。比如,给定“我最喜欢的食物是”,下一个词就是“芒果”,“最喜欢的食物是芒果”,下一个词则是“糯米”,依此类推。研究表明,当在超过一万亿甚至十万亿词的庞大数据集上训练一个大型人工智能系统时,就能创建出像ChatGPT这样的大型语言模型。虽然我省略了一些重要细节,例如我们实际上是预测下一个词的片段或词的一部分,我们还采取了一些措施来确保系统的有用性、指令遵循性和安全性。但撇开这些细节,生成性人工智能的核心在于反复预测下一个词。

除了生成文本外,生成性人工智能还能生成图像和音频。我将展示一些图像生成的示例和一个有趣的音频剪辑。商业可用的语音克隆技术正在变得非常先进,这里有一个克隆我的声音的示例:“亲爱的朋友们,人工智能的发展速度比以往任何时候都快,这既令人兴奋又带来挑战。即便人工智能世界每周都在取得突破,拥有朋友的帮助来辨别真伪将使你处于更有利的位置。”这段克隆声音的效果相当不错,我甚至让我的父母听了这个声音克隆,它成功地让其中一位相信是我,但我永远不会透露是哪一位,以避免麻烦。

随着这些激动人心的技术的出现,我们也看到了许多新的应用场景的可能性。例如,你可能已经在使用大型英语模型来回答问题、作为头脑风暴的伙伴、帮助修改文字或撰写总结等。我相信,随着这些通用的应用场景的发展,每位知识工作者今天都能通过使用生成性人工智能来显著提高自己的生产力。此外,除了通过像 Open AI、Anthropic 或 Google 等网站的用户界面外,

AI开发软件应用

存在另一种重要的利用生成性人工智能的方式,即通过生成性人工智能开发软件应用。这种方式与我们通过浏览器直接使用人工智能不同,许多开发者正在编写代码,通过API调用生成性人工智能,这极大地简化了某些应用的开发过程。例如,如果我们使用监督学习来构建餐厅声誉监控系统,整个流程可能包括收集数十万个数据点,这一过程可能需要一个月,之后找到人工智能团队进行训练和调整可能需要三个月,最后部署并确保系统稳定可能还需要三个月。这一流程虽然有效,但许多团队需要花费六到十二个月来构建这类人工智能应用,这是一项价值很高的投入。然而,对于某些类型的人工智能应用,使用基于提示的生成性人工智能可能只需几分钟或几小时来设定提示,然后几小时或几天就可以部署,这意味着现在许多原本需要优秀团队六到十二个月才能完成的人工智能应用,如今可能有成千上万的开发者能在不到一周的时间内完成,这种从数月到不到一周的时间缩短,极大地促进了多种人工智能应用的快速发展。

举一个具体的例子,如果我想构建一个声誉监控系统,我所需要的代码非常简单:导入必要的工具库,编写一个辅助函数,然后定义一个用于分类的提示,这些就足以完成一个情感分类器的构建。这种方式使得开发这些应用比以往任何时候都要简单。

在目前人们正在构建的应用中,一些常见的企业级人工智能应用包括企业问答系统,这种系统通过使用公司的文档来回答内部员工或外部客户的问题;因为生成性人工智能工具的简易性,许多公司也在建设客户服务聊天机器人。此外,许多公司利用人工智能进行文本摘要,帮助管理过量的信息,优化内部通信;还有一些专门的聊天机器人在健康、旅游、烹饪、法律以及个人关系等方面为用户提供建议。然而,也有一些较为特殊的应用,如假女友或假男友产业,这些应用在伦理上存在争议。

这些新的应用可能性为我们所有人提供了构建新事物的机会。几年前,我意识到许多以前不可能的有价值的人工智能项目现在已成为可能,我想找出如何实现它们。尽管我曾在Google和BYU等大公司领导过人工智能团队,我无法想象如何在一个大型科技公司内部操作一个团队来追求现在可能的广泛的人工智能应用。因此,我认为创办许多新公司是追求这些项目的一个有效方法。现有的公司也有机会将人工智能整合到现有业务中,但具体到机会所在,我认为人工智能的层次从硬件层、云层到工具层,所有这些层次都可能需要较大的资本投入。

构建半导体或云服务需要大量资源,且这些领域相对集中,使得新入场者难以在这些层面竞争。对于人工智能工具,我通常只在我们拥有独特技术时才考虑组建团队。尽管媒体、新闻和社交媒体倾向于关注这些技术层面,这是可以理解的,因为媒体喜欢讨论新技术。然而,事实证明,要想让这些团队成功,几乎可以肯定还需要一个更成功的层面,即应用层。因为不论是云服务的构建者还是半导体制造商,要想成功,我们实际上需要应用层产生更多的收入,以支付底层基础设施的费用。

初创AI企业:Bearing AI

在泰国四处走动,与众多商业、学术和初创团队交流时,我看到了构建多样化应用的激动人心的机会,这些应用既适用于多种商业模式,也适用于非营利性应用,具有独特的泰国特色。在我的 AI 基金团队,我们制定了一套构建初创企业的流程。我知道你们商学院的很多人都非常感兴趣于创业,我想通过一个我们实际操作的例子来说明这一点。我们的团队一直与众多合作伙伴保持沟通,试图识别各种项目和初创企业的想法。几年前,一个名为三井公司的大型日本企业集团找到我们,建议我们:“嘿,Andrew,你应该创建一家利用人工智能提高船只燃油效率的初创公司。”这就是 Bearing AI 的起源,我们按照常规流程评估了这个项目,判断其市场需求和技术可行性。确认无误后,我们招募了 Dylan Kyle —— 一位经验丰富的连续创业者作为CEO,与我们合作建立这家公司。我们与CEO共同花费三个月时间开发了一个原型,如果后续展望仍然乐观,我们便为这家初创公司提供资金,支持其聘请关键高管、开发最小可行产品并获得早期客户。随后,公司可以继续筹资并扩大规模。

因此,Bearing AI 现在利用全球天气模式和海洋流数据等信息,为船只提供航行建议,帮助它们安全、准时地到达目的地,同时减少约10%的燃油消耗。对于船长来说,是否应以20节或22节的速度航行常常难以抉择,他们通常会根据直觉或经验做出决策。但通过数据分析,我们能提供具体的方向和速度建议,不仅确保按时到达,还能显著减少燃油使用。

目前,Bearing AI 正在高海拨地带引导着6700艘船舶,每艘船每年节省约50万美元,并且更重要的是,减少了约10%的二氧化碳排放。作为一名人工智能专家,我对全球海运知之甚少。我发现,如果我能找到一个真正了解应用领域的专家合作,往往能发挥出最好的效果。在这种情况下,我的团队的人工智能专业知识与在全球航运领域的专业知识相结合,共同开展了一个我从未想到过的项目。

这周在泰国的一件激动人心的事情是,希望我的团队能提供人工智能帮助,与泰国的多个领域合作解决问题。我认为人工智能有很多机会,我也想简要触及一些风险和社会影响。我知道人们常常担心生成性人工智能是否会导致失业。这是我在宾夕法尼亚大学的一位朋友和一些在OpenAI工作的人进行的分析,研究了不同工作对人工智能自动化的暴露程度。这张图的横轴是美元薪资,纵轴是工作对人工智能增强自动化的暴露程度。图表显示,薪资较高的工作实际上更容易受到生成性人工智能自动化的影响,这与早期的自动化方式不同,如工厂自动化,那时更低工资、更常规重复的工作更易受到自动化的威胁。这也是为什么我认为所有知识工作者今天都可以使用生成性人工智能来提高生产力,虽然需要一点培训来更有效地使用它。

此外,我了解到一些很好的工作,例如在Trula Muk的校园内及更广泛的泰国范围内提供教育,这对帮助更多人有效使用人工智能非常有意义。除了在网上个人使用生成性人工智能外,它还创造了许多构建新软件应用的机会,这些以前是不可能的。我们从麦肯锡获取数据并重新分析,这显示了生成性人工智能在不同行业自动化的增量影响。事实证明,受生成性人工智能影响最大的行业包括教育和劳动力培训、商业、法律专业人士等。我认为,对于大学来说,如同你们的Chula AI计划中所述,生成性人工智能对教学和学习以及大学运营的影响将是重大的。因此,我们这些来自学术系统的人有责任找出如何利用人工智能更好地进行教学和学习,以及改善大学运营的效率或服务。

AI与工作

如果你想知道这些都是一些想法,但不知道从哪里找到具体项目来实施,我想分享一个我多次使用并发现非常有成效的识别人工智能项目机会的方法。这是一个叫做工作任务分析的框架,由我的同事埃里克·布林森(Eric Brinelson)在斯坦福大学和他的一些合作伙伴首创。许多人担心人工智能将自动化工作,这是一个重要的讨论,但从执行、商业或计算机科学产品的角度来看,我发现将人工智能视为自动化任务而不是工作更有用,因为工作是由许多不同的任务组成的,人工智能自动化的是个别任务而不是整个工作。所以我实际上和许多团队合作,查看人们正在进行的任务,在任务层面分析它们的人工智能潜力,这通常会引出我们可以构建的项目想法。例如,客服代表是受人工智能影响最大的工作类别之一,事实证明,客服代表实际上执行许多不同的任务,其中一些任务,如回答客户的文本聊天查询或记录交互,具有较高的人工智能自动化潜力,而其他任务的自动化潜力较低。这种分析几乎总是能给出项目的想法。我们发现,对于许多工作,可能有20%到30%的部分可以被自动化,好消息是,如果20%到30%的工作被自动化,那么仍有70%到80%的工作需要人来完成,所以工作不会消失,我们仍然需要人来完成这些工作。我并不是说人工智能不会导致任何工作流失,有一小部分工作人工智能可以自动化近100%,对于这些工作,我认为我们有责任确保人们得到妥善照顾,并且公平分享我们创造的财富。

例如,为受影响的工作人员建立一个安全网,确保他们有机会继续学习和更新技能,从而重新进入劳动力市场,我认为这是非常重要的。但对于绝大多数职位,如果20%到30%的工作被自动化,这意味着这些职位依然会存在。这也意味着,使用人工智能的人可能会取代那些不使用人工智能的人,我认为这为我们提出了强烈的责任和挑战,即需要提供技能提升培训,确保每个人都能学会使用这些工具并跟上自动化的步伐。

我想与您分享一个更为乐观的观点,这可能看起来像是一个节约成本的策略:找出人们的工作内容并自动化其中的一部分。在公司实施这一策略时,有时如果您能将某个任务的成本降低千倍,公司可能会选择这种成本节约方式,这是可以理解的。但通常情况下,您会惊讶地发现,公司会选择将这一任务扩大一万倍,因为这样他们可以更好地服务于客户并推动业务增长。从我的经验看,节省资金固然重要,但节省的金额是有限的,而增长的潜力则是无限的,没有上限。因此,虽然这看起来是一个节约成本的方法,但当你开始实施时,很多公司实际上更倾向于追求增长而非仅仅节约成本。这也意味着,工作的影响可能会小于人们最初的担忧。

在讨论人工智能的不同选择和追求这些方向时,我想以分享一个我非常看好的人工智能技术趋势来结束,希望正在开发应用的你们能考虑到这一点:人工智能代理工作流。我认为这将对当今许多应用产生巨大影响。我们大多数人今天使用大型语言模型或生成性人工智能的方式是所谓的零次提示,这就像是要求它为我们就某个话题写一篇文章,就像对人或AI说:“我想你从头到尾写一篇文章,一气呵成,过程中不能使用退格键。”作为一个人,我不能这样写出好文章,人工智能虽然能做得出奇的好,但这并非撰写文章或编程的最佳方式。这就像对一个程序员说:“我想你从头到尾写一个程序,写完后我直接运行,你不能回头修改任何内容。”

你知道,我无法像那样编写代码。与传统方法不同,代理工作流允许AI进行思考和修正。在这种工作流中,我们首先要求AI为特定主题撰写一个概要,然后询问它是否需要进行网络搜索。如果需要,它会进行搜索,然后撰写第一份草稿。接下来,我们会让它回顾自己的草稿,思考哪些部分需要修改,然后进行相应的修订。这个过程一直持续,更像是让大型语言模型进行思考、修订再思考的循环。这种迭代的工作流使得生成型AI在许多应用中能产生比单次直接生成(零次提示)更优质的输出。

我的团队收集了一些数据,这些数据涉及不同人在OpenAI发布的编程基准测试“Human Eval”上的工作。结果显示,使用GPT-3.5进行零次提示编程,即我们请求它直接输出代码,它在这个基准测试中的通过率为48%。而GPT-4的表现有显著提高,通过率从48%提升到67%。但是,从GPT-3.5到GPT-4的提升,还不如将GPT-3.5纳入代理工作流中,让它对自己的工作进行思考所带来的提升大。同样,将GPT-4纳入代理工作流中,表现也有显著提升。这只是编程基准测试的一部分,从我和我的团队的经验来看,我们一次又一次地发现,使用代理工作流可以产生更高质量的结果。

我之前非常感兴趣地了解了“Demine”项目,这个项目利用代理工作流与抑郁症患者进行更有效的对话。现在,我想给你举一个简单的代理工作流的实例,让这个概念不那么神秘。这个简单的代理工作流是这样运作的:我可能会向一个大型语言模型提出请求,称之为代码代理,只是简单地提示它写代码来完成一个任务。它可能会写出一些代码。接下来,我们会创建一个提示,说“这是为特定任务编写的代码”,然后将我们刚从AI那里得到的代码粘贴回到提示中。我们取出输出,将其反馈到输入中,然后要求它仔细阅读代码,检查其正确性、风格和效率,并给出建设性的批评。结果表明,语言模型可能会发现第五行有一个错误,并提出修正方法。然后,我们可以将其自己的批评反馈给语言模型,要求它再次编写代码,它将改进代码。如果我们允许它进行一些测试,比如对代码进行测试,然后我们可能会发现它没有通过第三个单元测试,我们会取出单元测试的结果,再次反馈给语言模型,让它重新编写代码以进一步改进。这是一个简单的代理工作流的示例,通过反思,让语言模型生成输出,然后利用它对自己输出的反思和批评来尝试进行改进。

实际上,这种方式使得工作效果更佳。另一种设计模式是,我们常发现构建多代理语言模型系统非常有用。在这种系统中,你不仅仅构建一个AI代理,而是可以设想有一个编码代理和一个批评代理。我们促使批评代理对编码代理进行评价,提供反馈,这些反馈随后用来改善编码代理的工作,从而获得更优的结果。因此,代理工作流有多种设计模式,这只是其中一种。我发现这种方式非常激动人心,因为这项技术显著扩展了我们现在可以用生成性人工智能完成的任务范围,让我们能够解决更多问题。随着这项技术的持续快速改进,我希望大家继续利用这些工具,为自己和周围的人开发激动人心的应用。

泰国的AI技术发展

最后,我在泰国的几天让我对泰国人工智能的未来感到非常兴奋和乐观。人工智能本身完全无用,只有当你找到有意义的应用场景去应用它时,它才变得有用。泰国在旅游、医疗保健、农业等重要应用领域具有关键优势。过去一周,我与许多团队进行了头脑风暴,探讨如何在这些关键领域应用人工智能。我认为,未来几年,泰国在其擅长的领域将有很多项目机会。例如,在旅游领域,你在泰国进行的项目比我在硅谷能做的要有更好的机会,因为旅游业集中在泰国。因此,这里的应用机会非常大且非常有趣。

同时,我有幸会见了很多从事教育工作的人,包括教育部长和高等教育部长等,我感觉这是一个非常重视教育的国家。在这种技术颠覆性的时刻,教育和培训比以往任何时候都更为重要,因为我们需要资源来培训现有工人掌握新技术,以及教育未来的学生学习新技术。我对尝试教育每一个学校的孩子学习一些计算或计算机科学感到兴奋,希望有一天他们长大后,每个人都将了解这些技能,这将是一个非常强大的力量。此外,我真正享受的是了解到泰国在人工智能领域,包括学术界和更广泛的创业生态系统中的巨大动力。我知道,现在泰国在人工智能方面可能还不如美国或中国那么先进,但作为一个在多家初创公司和小企业工作过的人,我认为比起现在的规模和成功,更重要的是它们的发展势头。事实上,当我看到小型初创公司时,它们可能很小,但如果它们有动力,那比你现在的规模更重要。我可能比你们更能清楚地看到,但当我在这个国家各地会见许多团队时,无论是政府还是私营部门,我都感受到了这种势头。

今天我有幸花了几个小时与你们的教职工讨论了一些项目,比如深度学习胃肠病学(Deep GI)、Dine和许多其他项目。总的来说,我觉得泰国在这些领域拥有巨大的动力,这对我们展望未来至关重要。在泰国度过了这一周后,我真正相信泰国人工智能的未来,并希望你们也能对未来充满信心。目前,我已经与泰国的一些合作伙伴开始合作,我们宣布了与Kasikornbank(‌泰国开泰银行)的合作,但希望将来还会有更多。我认为未来我们在学术界、工业界以及政府合作伙伴之间将有大量的合作机会,继续推动泰国人工智能的发展。我期待能继续为这项伟大的工作发挥一点小小的作用,我认为泰国的许多人都在做这些工作。所以,期待与大家的交流,但让我先说声非常感谢,非常感谢你,安德鲁博士。

观众提问环节

主持人: 现在我们可能处于大家期待已久的环节,即问答时间。我们将开放给现场观众和在座各位提问。有问题的请举手,工作人员会给您送上麦克风。

观众 1: 嗨,教授,人工智能的普及也引发了一些新的社会问题,尤其是在数据隐私和网络安全方面。我想了解您对机器学习技术的看法,特别是联邦学习、去中心化机器学习以及完全同态加密等隐私保护技术。这些技术是否符合您的投资方针,或者您对此有何看法?我们是否接近于可以真正看到数据保护处于良好状态的理想时期?

主持人: 请您先自我介绍一下,谢谢!

观众 1:  对不起,我叫Miranda,我在2017年是您的学生。我经营着一家基金,同时也经营一家软件公司,我们通过将学习技术与区块链结合,建立了基础设施技术,用于数据免疫和联邦学习的群体智能。这是我的兴趣和热情所在,因为我相信随着人工智能的日益炒作,不幸的是,我们看到很多人的私人信息被盗或泄露。

主持人:  Miranda,你能再重复一下你的问题吗?

观众 1:  我的问题是关于我刚才提到的主题,您对隐私保护技术有何看法?

吴恩达教授: 是的,我认为隐私非常重要。有几种不同的隐私保护技术。我不知道你是否还记得,当差分隐私最初出现时,感觉有点像是公关噱头,但严肃的学术研究人员正在研究它,如今差分隐私已成为一种非常重要的机制,真正帮助保护人们的隐私。所以,差分隐私是指我们向数据添加一点噪声来保护你的个人身份,比如保护你的GPS位置或添加一些噪声到你的文本中,使人们无法恢复你的身份证号或信用卡号,这种技术是有效的,确实在保护人们的隐私。你提到的联邦学习,我知道,实际上,这是特拉的一个优势,有多个研究小组在联邦学习上发表了非常有趣的研究。我认为这是一个重要的技术,我们还在慢慢接近,我不认为联邦学习已经真正起飞。在许多医院开始认真考虑联邦学习之前,我记得在大流行之前的最后一个神经科学会议上,我参加了一个医疗保健研讨会,有很多关于联邦学习在医疗保健领域的论文,但几乎没有实际部署。不过我认为我们最终会实现这一点。实际上,这还没有公开,deeplearning.ai一直在开发一些关于联邦学习的短期课程,希望不久后能发布。我希望差分隐私、联邦学习和其他技术能够继续发现新的机制来保护隐私。谢谢您。关于同态加密,您怎么看?同态加密是一种加密技术,可以在不解密的情况下在加密数据上训练人工智能模型。我认为这是一个很好的想法,但考虑到计算成本,我还没有看到任何大规模部署。但我们在学术界经常看到,我们必须多年研究一项技术才能弄清楚细节,然后才能取得成功。因此,从学术角度来看,我们绝对应该继续研究这一技术,但就实际部署而言,可能还需要进行更多基础研究才能取得进展。非常感谢您。


主持人: 接下来有问题的,我看到后面有位先生在摄像机旁,请问您的问题。非常感谢您选择我,

观众 2: 我是一名硕士生,目前我正在为泰国本地公司的业务转型项目工作,人工智能可能在这些转型中发挥重要作用。我们知道关于工作影响的风险,但我想知道如果我们过度依赖人工智能,比如今天CrowdStrike的系统更新后出现问题,一切都停摆了,您对这种风险有何看法?

吴恩达教授: 是的,我真为微软的人感到难过。就在一两个月前,Azure遭到黑客攻击,一旦黑客进入系统……我希望这个问题能够迅速得到解决。关于依赖人工智能的风险,这些风险通常不是技术本身的问题,而是应用的问题。我发现,如果我用人工智能模型用于医疗设备,那么医疗设备的风险包括错误标签等;如果我用它于电动车,电动车的风险与医疗设备完全不同;如果用于贷款申请的审批,那么偏见、歧视或贷款错误的风险与电动车或医疗设备的风险也大不相同。在我构建应用时,我经常使用的一种技术是……还有一些人工智能应用,例如我们在工厂检查设备,如果你在工厂检查手机是否有划痕,我认为这不会对某些人群造成重大的歧视风险,但风险轮廓是非常不同的。在我的团队中,我们经常使用一种名为FMEA分析的技术来提前预判可能发生的问题。例如在银行业,我们会针对人工智能在贷款审批等方面可能带来的风险进行讨论,已经有一些标准化的风险评估方法。通过团队的认真讨论,我们能够预见到大部分可能出错的情况。这并不意味着问题绝对不会发生,但通过这种方法,出现未预见问题的可能性非常低。通过提前识别潜在问题,我们能更好地采取预防措施,或者在问题初现迹象时迅速响应,并制定相应的缓解措施。例如,对于许多我负责的人工智能系统,我们都设有预案,一旦部署出现问题,我们会迅速回滚到之前的版本或立即下线。这些策略虽然不能百分之百消除风险,但可以在很大程度上减少潜在问题。


主持人: 下一个问题,请。

观众 2: 嗨,我是朱拉隆功大学的新生P。您提到了关于代理人工智能的新趋势,我想知道您是否认为这种代理人工智能是最终的人工智能形态,还是未来还有其他的发展?

吴恩达教授: 我认为人工智能的发展永远不会停止,总会有新的进展。考虑到现在有如此多的研究人员在全球范围内研究人工智能,这个领域在多个方向上都在快速进展。每年都会有新的突破。虽然我对代理人工智能工作流技术感到兴奋,但也有其他令人激动的发展方向。例如,设备上的人工智能(AI on device)正在迅速发展。现在我可以在笔记本电脑上运行大型语言模型,这使得我在没有网络连接的情况下也能使用AI。小型模型也在迅速提升性能,变得越来越有效。此外,尽管我们已经见证了大型语言模型彻底改变文本处理方式,但图像处理革命也正在进行中,这在文本处理革命后约一到两年开始显现。图像分析——不仅仅是生成图像,还包括识别图像内容的能力——正在显著改善,这将对我们检查工厂产品、处理医疗图像或无人机影像以及自动驾驶汽车等方面产生深远影响,使我们能更精准地识别周围的环境。我认为,这些都是除了代理人工智能之外的趋势。我们看到了设备上的人工智能和视觉处理的大型视觉模型或多模态模型的突破,还有许多其他领域的人们正在努力研究。我相信我们将看到多个突破。安德鲁教授,也许您可以稍作休息。在下一个问题之前,我想说,在过去几天与安德鲁博士相处的时间里,我意识到这是他多年来第一次来泰国,希望这将是他未来许多次访问的开始。


主持人: 好的,下一个问题,请副校长提问。

观众3: 你好,我们之前见过。您谈到了人工智能技术与应用之间的二分法以及对人工智能的监管。您对人工智能的道德使用规范有何看法,我们应该如何进行规范?

吴恩达教授: 谢谢您的问题。让我分享一个幻灯片来更深入地探讨这个重要话题。负责任的人工智能非常重要。在考虑规范时,我喜欢区分技术和应用。电动马达是一种技术,当你将它用于搅拌机、电动车、透析机或制导炸弹时,它就变成了应用。技术指的是可以用多种不同方式解决问题的工具,而应用是满足特定客户需求的具体实现。人工智能也是类似的情形,大型语言模型是一种技术,当我们将其用于医疗设备、社交媒体动态、聊天机器人或政治深伪视频时,它就变成了应用。事实证明,风险更多地是应用的功能,而不是技术本身。

我看到一些政府不幸地试图对通用技术进行监管,不是泰国政府,而是其他政府。想象一下,如果你去一个电动马达制造商那里说,我希望你保证你的电动马达永远不会被用于有害目的。我们不希望电动马达被用于有害目的,但我不知道电动马达制造商如何能保证没有人会将这种马达用于制导炸弹。对于人工智能而言,今天的技术也是如此。我不知道有任何技术可以让某人发布一个大型语言模型,比如开源,并保证没有人会将其用于负面或有害的目的。如果我们通过这样的法律,电动马达制造商唯一能做的就是说,让我们不再制造电动马达。同样,不存在能让某人发布一个开源的大型语言模型并阻止任何人对其进行微调或训练以用于负面目的的技术。

当然,我认为正面用例的数量远远超过负面用例的数量。在保护人们方面,通过审查特定的应用,让我们确定在医疗设备或社交媒体等方面我们希望实现什么,不希望实现什么,这将使我们能够通过法律促进正面用例并抑制负面用例。

令我感到意外的一件事是,关于开源的强烈反对声。开源是人工智能供应链的关键部分,也是学术界获取和研究大型语言模型的重要方式。研究人员能够研究这些技术对于理解风险和提高安全性是非常重要的一环。去年,我们看到一些大公司在训练大型语言模型上投入了大量资金,如果别人发布了一个类似的模型作为开源,那显然会削弱他们的投资价值,这对他们的业务并不利。

去年,令我惊讶的是反开源的游说活动有多么激烈,试图说服政府通过以安全为幌子的限制性法律来关闭开源。幸运的是,我们击退了许多针对开源的攻击,但战斗还没有结束,仍有一些非常令人担忧的法规提议。如果这些法律通过,只有极少数公司会受益,几乎所有其他人,包括泰国在内的几乎所有国家,都会发现获取开源大型语言模型变得更加困难。

有趣的是,我看到一些游说团体不幸地在说服欧盟制定对欧盟自身利益不利的法规方面非常有效。在美国,我和许多朋友花了很多时间在华盛顿特区尝试与监管机构对话。我认为美国国会还算可以,尽管现在在加利福尼亚州还有一场关于开源的斗争,那里提出了一项非常限制开源的糟糕法规(SB 1047)。我希望这场讨论能继续下去,如果你们有机会,我希望你们能帮助保护开源,因为它真的是研究、创新和这项技术传播的最宝贵机制之一。


主持人: 谢谢你,吴教授。这就是技术与应用之间的区别,我们应该关注应用层面的威胁和危险,而不是技术层面。好的,请下一个问题。

观众4: 嗨,非常感谢您提到我们的DGI项目,我也是DGI开发团队的一部分,同时负责创新。我的问题与您的回答相似,但从另一个角度考虑——关于责任归属。假设我的DGI系统用于检测结肠癌和息肉,如果系统出了问题,责任应由谁承担?是使用者、购买者、医院还是开发者我,或是其他人?另一方面,我对自己的诊断非常自信,没有依赖AI,但如果将来出现错误,比如患者发现我没有很好地使用这个高级AI系统,那么这是我的错吗?

吴恩达教授: 这确实是监管机构可以发挥重要作用的领域之一。医疗AI的责任问题在美国还有些混乱。通常,如果通过了FDA(食品药品监督管理局)的批准,可能会提供某种保护。在美国,通常是开发者起草的服务条款,使用户同意特定的责任安排,这通常有利于开发者。但有时会有诉讼,争论服务条款是否公平。我不是律师,也不提供法律建议,但我认为如果监管机构介入并明确表示他们希望医疗领域有更多AI应用,同时规定这些规则,如果你这样做,就有安全港保护,你不会承担责任;如果你那样做,则会承担责任,不同的人在不同的位置可能承担不同的责任。我认为引入这种监管清晰度将是政府能为创新者创建明确规则、决定他们想要推出什么产品的一个良好切入点。

现在,从Maan和Jula研究团队,我们有机会分享称为DGI的最新技术,这项技术帮助医生和外科医生检测结肠癌。这项技术可以穿过结肠,帮助护士和外科医生检测是否有潜在的癌细胞。但如果我的AI没有检测到,患者被送回家后,这种癌症未被发现,那么责任应由谁承担?根据安德鲁博士的说法,这就是政府可以介入的地方,帮助保护在AI领域开拓的人们,因为没有什么是100%正确的。应当有明确的指导方针来帮助创新社区。这是一个非常了不起的项目,祝贺整个团队的卓越成就。


主持人: 好的,下一个问题。

观众5: 嗨,非常感谢您精彩的演讲。我是Kore,一名机器学习研究者。我大部分时间都在研究机器学习。我对您的ProMed AI演示很感兴趣,因为它展示了我们如何真正地民主化人工智能。但同时,它也基于一个假设,即需要有一个良好的预训练模型。这就赋予了能够创建这些优质预训练模型的少数公司很大的权力。您认为这种情况将来会改变吗?人们是否会有更多能力来创建这些预训练模型,从而不将太多权力集中在少数手中?

吴恩达教授: 投资公司ARK的Kathy Wood曾估计,训练一个大型语言模型的成本每年下降75%。虽然她倾向于乐观,我不确定这是否完全准确,但可以引用她的估计。这意味着,如果某个模型去年训练成本是1000万美元,一年后可能只需250万美元,再过一年可能只需约75万美元。这实际上是非常令人鼓舞的,我们看到现在有很多团队已经能够训练出与GBT 3.5相当的模型,甚至有多个团队正在训练相当于GPT-4级别的模型。

尽管成本下降了约75%,人们在这些模型上的投资却增加了四倍以上,这也是为什么最大的模型仍然非常昂贵的原因。但如果这种趋势持续下去,我认为访问这些模型将会更加容易。此外,开源也是推动这一进程的一个非常强大的力量。例如,艾伦人工智能研究院(Allen Institute for AI)是培训真正开源模型的领先团队之一,他们不仅公开了模型的权重,还公开了训练配方和代码。

随着这些资源变得可用,我们即使是在学术预算下也能做的事情虽然可能总是比最大的企业预算要少,但我认为事情实际上正在变得更加容易获取。这也是为什么我认为捍卫开源非常重要的原因,因为唯一不让它变得更容易获取的方式是,如果有人设法通过法律关闭开源。谢谢您。


主持人: 我们还可以进行一到两个问题,以便有时间进行个人交流。此外,我需要提醒大家,吴恩达教授还没有吃晚饭,我们必须好好招待他,以免他对泰国有不好的印象。晚餐后我们还会请他吃美味的泰国菜,所以我们将在大约晚上8点结束提问环节,然后进行一些社交活动。好的,还有问题吗?请那位穿白衬衫、站在摄像机旁边的先生提问。

观众6: 嗨,我是Tanin,来自工程学院。迄今为止,作为一个小国,我想了解您认为泰国在人工智能领域可能面临的挑战和机遇,以及政府可能采取的政策,使人工智能在我们国家实用,与美国或中国相比,因为他们已经拥有了许多先进的资金和技术。您怎么看?

吴恩达教授: 谢谢您的问题。我知道泰国的规模比美国小,但对我来说,泰国并不真的感觉像是一个小国。我认为中国足够大,可以同时做很多事情,但泰国的很多机会可能会集中在应用层。这并不意味着你不应该培训基础模型——这是值得做的,可能还需要培训一些泰语模型。但我认为,绝大多数机会可能在于在开源或闭源的基础上,开发更多独特于泰国、并能强化泰国已有优势的激动人心的应用。

在政府政策方面,我认为政府继续投资于研究和对所有公民的培训是重要的投资。我们常常认为政府的作用是制定法律来禁止某些事情,但政府制定法律来使某些事情合法,提供清晰的指导原则,就像我们之前讨论的深度学习胃肠病学(Deep GI)一样,对许多不同的应用领域都非常重要。

我从硅谷和中国观察人工智能的崛起中学到的另一个教训是,这些技术有些复杂,这些挑战足够大,以至于没有人能单独成功。在硅谷初创Coursera的早期,许多人无缘无故地帮助了我,我永远无法回报他们,只能尝试将这种帮助传递下去。我认为,当你建立一个社区,许多人出于无私的目的相互帮助,不期望得到回报,当有一个可以分享成功、失败、教训的社区时,这个社区比任何个人都要强大。

因此,在接下来的时期内,朱拉隆功大学可能会发挥非常重要的、几乎是中心的作用,应该是建设泰国的人工智能社区,因为这是一个没有人能单独成功的情况,而有了社区,我们所有人都更有可能一起成功。我希望我们能继续投资于培训、研究以及社区建设。

谢谢!


对了,喜欢就别忘了点赞、收藏、转发支持一下!期待在评论区听到您对AI观点和看法!

在AI方面任何需求和困惑,别犹豫,随时欢迎咨询我们

往期回顾

1、[在摩根大通中国峰会上,阿里巴巴主席蔡崇信强调:AI技术已达大学生水平,为我们带来前所未有的机遇]

2、[老黄对话Databricks CEO:生成式AI将无处不在,如果你的行业没有涉及AI,或面临淘汰风险]

3、[耶鲁大学首席执行官峰会:200位财富500强CEO透露AI如何转变他们工作模式,开创全新增长机遇!]


我们的AI团队现向外界开放服务,旨在助力每个企业与个人引领时代潮流,将先进科技与创新想法完美融合!

告别昂贵服务费和缺人烦恼,再见漫长交付周期

无限创意风格,分分钟生成专业级作品

感受 AI 带来的全新工作体验!

欢迎各大品牌方、媒体、科技企业、知名IP等合作

合作请联系负责人微信:Milo-1101

--END--

修改于
继续滑动看下一个
AI深度研究员
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存