欢迎大家,今晚很荣幸邀请到了安德鲁·吴博士。
安德鲁是AI Fund的管理总合伙人,DeepLearning.AI和Landing AI的创始人,Coursera的主席和联合创始人,以及斯坦福大学的兼职教授。
之前,他曾创办并领导了谷歌大脑团队,帮助谷歌采用现代人工智能技术。
他还曾担任斯坦福人工智能实验室的主任。
全球约有800万人,占地球上千分之一的人口,参加过他的人工智能课程。
通过他的教育和人工智能工作,他改变了许多人的生活。
请大家热烈欢迎安德鲁·吴博士。
谢谢,丽莎。
很高兴见到大家。
今天我想和大家聊一聊人工智能的一些机会。
我一直说人工智能是一种新的电力。
关于人工智能,一个难以理解的事情是它是一种通用技术,意味着它不仅对一件事有用,而是对许多不同的应用有用,有点像电力。
如果我问你,电力有什么用?它不是一件事,而是很多事情。
所以我想先和大家分享一下我对技术领域的看法,这将引出一系列的机会。
人工智能引起了很多炒作和兴奋。
我认为,一个好的方式来思考人工智能是将其看作是一系列工具。
这包括一种叫做监督学习的技术,非常擅长识别事物或标记事物,以及生成式人工智能,这是一种相对较新的令人兴奋的发展。
如果你对人工智能比较熟悉,可能听说过其他工具。
但我今天将少谈论这些额外的工具,而是专注于我认为目前最重要的两个工具,即监督学习和生成式人工智能。
监督学习非常擅长标记事物或计算输入到输出或A到B的映射,给定一个输入A,给我一个输出。
例如,给定一封电子邮件,我们可以使用监督学习将其标记为垃圾邮件或非垃圾邮件。
我曾经从事过的最有利可图的应用可能是在线广告,给定一则广告,我们可以标记用户是否有可能点击它,从而显示更相关的广告。
对于自动驾驶汽车,给定汽车的传感器读数,我们可以标记其他车辆的位置。
我所在的AI基金团队曾经从事过一项船舶航线优化的项目。
给定船舶正在采取或考虑采取的航线,我们可以标记它将消耗多少燃料,并利用这一点使船舶更加节能。
在工厂的自动视觉检测方面做了很多工作。
你可以拍一张刚刚制造的智能手机的照片,并标记是否有划痕或其他缺陷。
或者如果你想建立一个餐厅评论声誉监测系统,你可以有一个小软件来查看在线餐厅评论,并将其标记为积极或消极情感。
监督学习的一个好处是它不仅对一件事有用,而是对所有这些不同的应用以及其他许多应用都有用。让我具体地介绍一下监督学习标记事物项目的工作流程。如果你想建立一个标记餐厅评论的系统,你需要收集一些数据点或数据集。这里我展示了三个数据点,但在构建这个系统时,你可能会得到成千上万个类似的数据点或训练样本。机器学习项目、人工智能项目的工作流程是,你获得标记数据,可能有成千上万个数据点。然后你的AI团队训练一个AI模型来从这些数据中学习。然后你可以输入“这是我喝过的最好的珍珠奶茶”,这是积极的情感。所以,我认为过去的十年可能是大规模监督学习的十年。我们发现,大约在10到15年前,如果你训练一个小型人工智能模型,比如一个小型神经网络或小型深度学习算法,基本上是一个小型人工智能模型,可能不是在一台非常强大的计算机上,然后随着你给它提供更多的数据,它的性能会有所提高,但是然后会趋于平缓。但是如果你训练一个非常大的人工智能模型,使用大量的计算资源,比如强大的GPU,那么随着我们增加给机器学习模型的数据量,它的性能会不断提高。所以这就是为什么当我开始并领导Google Brain团队时,我指导团队解决的主要任务是让我们构建非常大的神经网络,然后给它们提供大量的数据。我认为大规模计算和大规模数据的想法,这个方法在过去的十年中帮助我们取得了很多人工智能的进展。所以如果说上一个十年是人工智能的十年,我认为这个十年也在继续做我们在监督学习中所做的一切,但是还加入了令人兴奋的生成式人工智能工具。所以你们中的许多人,也许是所有人,都玩过ChatGPT和Bard等工具。只要给出一段文本,你称之为prompt,比如我喜欢吃,如果你多次运行这个模型,可能会得到像百吉饼奶油芝士或者和朋友一起外出这样的输出。鉴于生成式人工智能引起了很多关注和兴奋,我想花半张幻灯片的时间来介绍一下它的工作原理。事实证明,生成式人工智能,至少是文本生成的这种类型,其核心是使用监督学习来输入输出映射,反复预测下一个词。所以,如果你的系统在互联网上读到一句话,比如我最喜欢的食物是百吉饼奶油芝士和鲑鱼,那么这句话会被转化为几个数据点,如果它看到我最喜欢的食物是A,那么它会尝试猜测下一个词是百吉饼,或者如果它看到我最喜欢的食物是百吉饼,它会尝试猜测下一个词是with,类似地,如果它看到在这种情况下,下一个词的正确猜测应该是cream。所以通过使用从互联网或其他来源找到的文本,并使用这种输入输出的监督学习来反复预测下一个词,如果你在数百亿个词上训练一个非常大的人工智能系统,或者在最大的模型中,现在超过一万亿个词,那么你就会得到一个像ChatGPT这样的大型语言模型。从技术上讲,这些系统预测的是下一个子词或词的一部分,称为标记,然后还有其他技术,比如RLHF,用于进一步调整人工智能的输出,使其更有帮助、诚实和无害。这正是使得大型语言模型取得令人兴奋、非常出色的进展的关键。所以虽然很多人将大型语言模型视为一种很棒的消费者工具。你可以访问像ChatGPT的网站、Bard的网站或其他大型语言模型的网站,并将其用作一个很棒的工具。还有另一个趋势,我认为仍然被低估,那就是大型语言模型的力量,不仅仅是作为一个消费者工具,而且作为一个开发者工具。事实证明,有一些应用以前需要我花几个月的时间来构建,现在很多人可以通过使用大型语言模型来更快地构建。具体来说,构建餐厅评论系统的监督学习工作流程是,你需要获取一堆标记数据,可能需要一个月的时间,我们得到了几千个数据点。然后,AI团队进行训练、调整,并在你的AI模型上获得优化性能。因此,构建商业级机器学习系统的时间表是6到12个月。所以我领导的团队通常需要大约6到12个月来构建和部署这些系统。相比之下,使用基于提示的AI,你只需编写一个提示。然后,你可以将其部署到云端,可能需要几小时或几天的时间。现在有一些AI应用以前可能需要我几个月,甚至一年的时间来构建,而现在世界各地的许多团队可能只需要一周就能构建。所以我认为很多人仍然低估了我认为即将到来的大量定制AI应用的规模。现在,我知道你可能没有预料到我会在这个演讲中写代码,但这就是我要做的。所以我要——你们中的一些人可能会知道Python,我猜。从OpenAI导入一些工具,然后添加这个提示,它说,将下面由三个破折号分隔的文本分类为具有积极或消极情感。所以我真的希望——谢天谢地,它得到了正确的答案。(AI给出了积极情绪的答案)所以,今天,世界各地的开发者可能只需要10分钟左右来构建这样的系统。所以我一直在努力教授关于如何使用提示的在线课程,不仅仅是作为一个消费者工具,而且作为一个开发者工具。所以在谈论技术景观之后,让我现在分享一下我对一些AI机遇的看法。这显示了我认为今天不同AI技术的价值,我将谈论三年后的情况。但我认为AI今天的绝大部分财务价值来自于监督学习,对于像谷歌这样的单个公司来说,它的价值可能超过每年1000亿美元。因此,它已经具有巨大的价值,并且由于寻找应用程序和构建应用程序的巨大努力,它也具有巨大的动力。然后,生成式人工智能是真正令人兴奋的新进入者,目前规模较小。如果这些圆圈的大小代表今天的价值,我认为它在三年内可能会增长到这个程度。因此,监督学习已经非常庞大,可能在未来三年内翻一番,从非常庞大变得更加庞大。而生成式人工智能,目前规模较小,我认为在未来三年内将增长超过一倍,因为有大量的开发者兴趣、风险投资和大公司探索应用程序的数量。如果它以接近这个速度继续复合增长,那么在六年内,它将变得更加庞大。但是,这个浅绿色或橙色的浅色区域,就是机会所在,无论是新创企业还是大公司,都可以创造和享受价值捕获。但我希望你从这张幻灯片中得出一个结论,即所有这些技术都是通用技术。因此,在监督学习的情况下,过去十年必须完成的大部分工作,但在未来十年仍将继续进行,是识别和执行具体用例。因此,在这部分演示中,我希望你能从中得出一个结论,即通用技术对于许多不同的任务都是有用的,使用监督学习仍然有很多价值有待创造。尽管我们远未完成监督学习的令人兴奋的用例,但我们还有这个令人兴奋的生成式人工智能工具,它进一步扩展了我们现在可以使用人工智能做的事情的范围。但是有一个警告,即在这个过程中会有短期的时尚潮流。所以我不知道你们中是否有人还记得一个叫做Lensa的应用程序。这个应用程序可以让你上传自己的照片,然后将你的照片渲染成宇航员或科学家之类的酷照片。这是因为Lensa是一个相对薄的软件层,建立在其他人非常强大的API之上。因此,尽管它是一个有用的产品,但它并不是一个可防御的业务。当我想到像Lensa这样的应用程序时,我实际上想起了史蒂夫·乔布斯给我们带来的iPhone。不久之后,有人开发了一个我花了1.99美元购买的应用程序,用于打开LED灯,将手机变成手电筒。这也是一个好主意,但它也不是一个可持续的长期防御性业务,因为它很容易被复制,价格过低,并最终被纳入iOS。但随着iOS的崛起,随着iPhone的崛起,有人还发现如何构建像Uber、Airbnb和Tinder这样的东西。这些是非常长期、非常可防御的业务,创造了持续的价值。我认为,随着生成式人工智能或新型人工智能工具的兴起,我认为真正让我兴奋的是有机会创造那些非常深入、非常困难的应用,希望能够创造出非常长期的价值。所以我想要分享的第一个趋势是人工智能是一种通用技术。我们面临的很多工作是找到非常多样化的用例并构建它们。我想要与大家分享的第二个趋势与为什么人工智能还没有被广泛采用有关。感觉上我们中的一些人已经谈论人工智能15年左右了。但是如果你看一下人工智能的价值现在在哪里,很多仍然非常集中在消费软件互联网领域。一旦你离开科技或消费软件互联网领域,虽然也有一些人工智能的应用,但感觉上还处于非常早期阶段。那为什么会这样呢?事实证明,如果你将所有当前和潜在的人工智能项目按照价值递减的顺序排序,那么在这条曲线的左侧,也就是曲线的头部,是像广告、网络搜索、电子商务产品推荐或亚马逊这样的数十亿美元项目。事实证明,大约10到15年前,我和我的朋友们找到了一种方法,可以雇佣100名工程师编写一段软件,为十亿用户提供更相关的广告,并产生巨大的财务价值。但是一旦你离开消费软件互联网领域,几乎没有人拥有1亿或10亿用户,可以为之编写和应用一段软件。所以一旦你进入其他行业,从曲线左侧的头部到长尾部分,这些是我看到的一些项目,我对它们感到兴奋。我曾经与一家披萨制造商合作,他们拍摄制作的披萨照片,因为他们需要确保奶酪均匀分布。但是雇佣一百名工程师或几十名工程师来完成一个价值500万美元的项目的方法是不合理的。与一家农业公司合作,我们发现如果我们使用摄像头来测量小麦的高度,小麦经常因为风或雨等原因弯曲,如果我们能够在正确的高度割掉小麦,那么农民可以获得更多的粮食销售,并且对环境也更有益。但这又是一个价值500万美元的项目,那种雇佣一大群高技能工程师来完成这个项目的方法是不合理的。同样的材料分级、布料分级、钢板分级等许多类似的项目。所以在曲线的头部,有一小部分,比如说数十亿美元的项目,我们知道如何执行并创造价值。在其他行业中,我看到了数以万计的长尾部分,我们称之为500万美元项目,直到现在,由于定制的高成本,这些项目一直很难执行。我认为令人兴奋的趋势是,人工智能社区一直在构建更好的工具,让我们能够聚合这些用例,并使最终用户能够轻松进行定制。具体来说,我看到了很多令人兴奋的低代码和无代码工具,可以让用户自定义人工智能系统。这意味着,与其我需要过多担心披萨的图片,我们有了工具 - 我们开始看到可以让披萨制造工厂的IT部门自己训练AI系统的工具,以实现价值500万美元。因此,我们需要工具,可以由披萨工厂自己使用,构建、部署和维护适用于他们自己披萨图片的定制AI系统。广义上,实现这一目标的技术包括提示文本、视觉提示,以及大型语言模型和类似的工具,例如数据中心AI技术,通过这种技术,我们可以要求披萨工厂提供数据,而不是让他们编写大量代码,这更加可行。我认为第二个趋势很重要,因为我认为这是将AI的价值从技术世界和消费软件互联网世界扩展到所有行业的关键部分,而且往往容易忘记的是,其他行业的规模要比技术世界大得多。所以我分享的两个趋势是,AI作为一种通用技术,有很多具体的用例可以实现,以及低代码、无代码、易于使用的工具,使AI能够在更多行业中部署。大约五年前,我想要解决一个难题,那就是我觉得现在有很多有价值的AI项目是可能的。在谷歌、百度等大型科技公司领导团队后,我很难想象如何在大型科技公司中运营一个团队,去追求从海运到教育、金融服务到医疗保健等各个领域的机会。这些都是非常多样化的用例,多样化的市场进入方式,以及多样化的客户群体和应用。我觉得最有效的方式是,如果我们能够创办很多不同的公司来追求这些非常多样化的机会。这就是为什么我最终创办了AI Fund,这是一个创业工作室,建立起一系列追求多样化AI机会的初创公司。当然,除了大量的初创公司,现有公司也有很多机会将AI整合到现有业务中。事实上,我看到现有企业的一个模式是,如果他们玩得好,分销往往是现有公司的重要优势之一,可以让他们相当高效地将AI整合到他们的产品中。但是具体来说,机会在哪里呢?我认为这是一个AI堆栈。我刚才展示的是,我实际上是使用OpenAI的API作为开发工具。我有时在这里玩,但主要是当我考虑到有意义的技术优势时,因为我认为这会使你有机会成为超级赢家之一。最后,尽管很多媒体关注和热议都集中在基础设施和开发工具层面,但事实证明,只有应用层更成功,这一层才能成功。很多关注和兴奋都集中在技术和工具层面,这没什么问题。但这只有在应用层更成功的情况下才能成功,这样他们才能产生足够的收入来支付基础设施和工具层。但Amorai是我们建立的一家利用人工智能进行浪漫关系辅导的公司。如果你不相信我,你可以问问我的妻子,她会证实我对浪漫一无所知。但当我们开始建立这个项目时,我们想要与Tinder的前任CEO Renate Nyborg合作。凭借我的团队在人工智能方面的专业知识,以及她在关系方面的专业知识,因为她曾经经营过Tinder,她对关系的了解比我认识的任何人都多,我们能够利用人工智能来进行浪漫关系辅导。而这类应用的有趣之处在于,当我们环顾四周时,有多少团队同时精通人工智能和关系呢?因此,在应用层面上,我看到了很多令人兴奋的机会,这些机会似乎有着很大的市场,但相对于机会的规模来说,竞争程度却很低。并不是说没有竞争对手,只是相对于开发工具或基础设施层面来说,竞争程度要低得多。因此,因为我花了很多时间在建立初创企业的过程中进行迭代,我现在要做的就是非常透明地告诉你我们为建立初创企业开发的配方。经过多年的迭代和改进,这就是我们现在建立初创企业的方式。我的团队一直有很多不同的想法,既有内部生成的想法,也有合作伙伴提供的想法。我想通过一个我们做过的事例来详细说明这一点,这个事例是一家名为Bearing AI的公司,他们利用人工智能使船只更加节能。这个想法是几年前一个叫做三井的大型日本企业提出的,他们是主要股东并经营主要航运线路。他们找到我并说,嘿,安德鲁,你应该建立一个利用人工智能使船只更加节能的业务。我们可以建议一艘船或告诉一艘船如何操纵,以便您仍然能够按时到达目的地,但使用的燃料要少约10%。所以我们会进行双重检查,这个想法是否在技术上可行,然后与潜在客户进行交流,确保有市场需求。如果通过了这个阶段,我们就会去招募一位CEO与我们一起开展这个项目。当我刚开始的时候,我会花很长时间自己做项目,然后再找一个CEO。但是在迭代之后,我们意识到在一开始就引入一位领导者与我们合作,可以减轻很多知识传递的负担,也不需要CEO进来重新验证我们所发现的东西。所以我们的流程是,我们在一开始就找到了一位出色的CEO Dylan Keil,他是一位有声望的企业家,之前有成功的退出。然后我们花了三个月的时间,进行了六个两周的冲刺,与他们一起建立了一个原型,并进行了深入的客户验证。如果它在这个阶段存活下来,我们有大约66%的存活率,我们会写第一张支票,这样公司就有资源来雇佣一支执行团队,建立关键团队,使MVP(最小可行产品)运行起来,并获得一些真正的客户。然后,希望在此之后,成功地筹集到额外的外部融资,并继续增长和扩展。所以我为我的团队能够支持三井的想法和CEO Dylan Keil的工作感到非常自豪。今天,因为Bearing AI的存在,有数百艘船只正在高海上以不同的方式航行。10%的燃料节省相当于每艘船每年节省大约45万美元的燃料费用。我认为如果不是Dylan的出色工作,以及三井将这个想法带给我,这个创业公司可能不会存在。我喜欢这个例子,因为这是另一个例子,我自己永远不会想出这个创业点子。但是三井在这个领域有深入的专业知识,加上Dylan和我的团队在人工智能方面的专业知识,才使这一切成为可能。所以在从事人工智能的过程中,我学到的一件事就是,我的领域只是人工智能,仅此而已。因为我没有时间,或者说很难成为海运、浪漫关系、医疗保健、金融服务等领域的专家。我学到的是,如果我能够提供准确的技术验证,并利用人工智能资源快速而好地构建人工智能技术,我认为我们总是能够帮助公司建立一个强大的技术团队,与专业领域的专家合作往往会带来令人兴奋的新机会。我还想与大家分享我对于创业的另一个奇怪的认识,那就是我只喜欢在有具体想法的时候才参与进来。这与设计思维方法论中常听到的建议相反,它经常说,在解决方案之前不要急于解决问题,要先探索很多替代方案。我们学到的是,在构思阶段,如果有人来找我说,嘿,安德鲁,你应该将人工智能应用于金融服务。因为我不是金融服务的专家,我需要花很长时间去学习足够的金融服务知识,才能弄清楚该怎么做。我的意思是,最终,你可能会得到一个好的结果,但这是一个非常费力、非常缓慢、非常昂贵的过程,对我来说,尝试学习一个又一个行业。相比之下,我的一个合作伙伴把这个想法写成了一个玩笑,不是真的认真的。但是,假设我们通过GPT消除广告,通过自动购买每个广告中宣传的产品来交换,这不是一个好主意,但它是一个具体的主意。我发现,在今天的世界中,尤其是在人们对人工智能的兴奋、嗡嗡声和暴露的情况下,今天的世界有很多专业领域的专家,他们深入思考一个问题,有时甚至一两年。当我们与他们一起工作,听到他们与我们分享的想法时,我们可以与他们一起快速进行验证和建设。我发现这样做是有效的,因为有很多人已经进行了设计思维的探索和筛选出真正好的想法。找到那些已经有的好想法,并希望与我们分享并成为合作伙伴,这事实上是一个更高效的引擎。在我结束之前,我们将在几秒钟内回答问题,只是几张幻灯片来谈谈风险和社会影响。我们多次因道德原因终止了我们认为在财务上可行的项目。事实证明,我对人们提出好主意的创造力感到惊讶,有时也感到沮丧。为了提出看似有利可图但实际上不应该建立的真正糟糕的主意,我们终止了一些项目。此外,我认为必须承认,当今的人工智能确实存在偏见、公平性和准确性的问题。我认为,与六个月前相比,今天的人工智能系统更少有偏见,更加公平,这并不是为了忽视这些问题的重要性。但我也对致力于解决这些问题的团队数量感到满意,他们正在努力使这些问题得到很大的改善。当我考虑人工智能的最大风险时,我认为最大的风险之一是对就业的破坏。这是来自宾夕法尼亚大学的一篇论文的图表,以及OpenAI的一些人对不同工作岗位对人工智能自动化的暴露进行了分析。结果发现,尽管以前的自动化浪潮主要是低工资工作岗位,比如我们将机器人投入工厂。但是在当前的自动化浪潮中,实际上是更高工资的工作岗位,即这个坐标轴右侧的工作岗位,更多地暴露于自动化。因此,尽管我们使用人工智能创造了巨大的价值,但我觉得作为公民、我们的公司、我们的政府和我们的社会,我有责任确保那些受到生计干扰的人们得到妥善照顾,得到良好对待。最后,每当人工智能取得重大进展时,总会有一波关于人工通用智能的炒作浪潮。当深度学习在10年前开始取得很好的效果时,关于人工通用智能的炒作很多。现在,生成式人工智能也取得了很好的效果,关于人工通用智能又出现了一波炒作。但我认为,能够像人类一样做任何事情的人工通用智能仍然需要几十年,也许是30到50年,甚至更久。我希望我们能在有生之年见到它,但我不认为这会很快实现。其中一个挑战是生物通向智能的路径,如人类,和数字通向智能的路径,人工智能,它们走的是非常不同的道路。关于人工通用智能的定义有趣的地方在于,你正在用非常不同的数字通向智能来衡量这个与生物通向智能的路径。所以我认为,大型语言模型在某些关键维度上比我们任何人都聪明,但在其他维度上比我们任何人都愚蠢。所以强迫它做任何人类能做的事情就像是一个有趣的比较。然后,我认为关于人工智能对人类造成灭绝风险的炒作也太夸张了。我只是看不到人工智能如何对人类造成任何有意义的灭绝风险。但通过大量的经验,我们可以引导非常强大的实体,如公司或国家,它们比任何单个人都更强大,并确保它们在很大程度上造福人类。所谓的快速起飞情景,即今天并没有真正发挥作用,然后突然有一天,一夜之间,它变得非常出色,我们实现了超级智能,接管了世界。我认为人工智能技术将慢慢发展,就像所有其他技术一样,这给了我们足够的时间来确保我们提供监督并确保其安全。最后,如果我们看一下对人类的真正灭绝风险,比如,希望不会发生的下一次大流行病或气候变化,导致某些地区人口大规模减少,或者可能有一天,一颗小行星对我们所做的与恐龙一样的事情。我认为,如果我们看一下对人类真正的灭绝风险,即使是世界上拥有更多智能的人工智能,甚至是人工智能,也将是解决方案的关键部分。所以我觉得,如果你希望人类在未来1000年内生存和繁荣,而不是减缓人工智能的发展,这是一些人提出的,我宁愿让人工智能尽可能快地发展。我认为人工智能作为一种通用技术为每个人创造了许多新机会。我们所有人未来的激动人心和重要的工作就是去构建那些具体的用例,并希望在未来,我也有机会与更多人一起参与这些机会。