ChatGPT只是前菜,2023要来更大的!
点击上方蓝字
关注我们
继前不久ChatGPT接连祭出大招让无数人为之兴奋后,我们又通过与微软首席技术官凯文·斯科特进行对话来展望2023,他所预见和描绘的智能技术变革前景,既让人倍感振奋和引人入胜,同时也让小编有一丝小小的犹疑,这份工作会被人工智能取代?还是能实现“一切皆有副驾驶”,从此为大家提供更好的内容呢?
如今,从为软件开发人员生成一行行代码到为图形设计师绘制草图,由大型语言模型驱动的智能技术系统正在改变人们的工作和创作方式。
微软首席技术官凯文·斯科特认为,从帮助应对气候变化与儿童教育等全球挑战,到彻底改变医疗、法律、材料科学及科幻小说等领域,这些智能技术系统的复杂度和规模未来都将继续增长。
近期,凯文·斯科特就智能技术对知识工作者的影响以及智能技术未来发展等话题分享了他的看法。要点如下:
智能技术大模型和生成式智能技术的进步将继续提高生产力、创造力和满意度。
智能技术将促成科学突破的实现,并帮助世界解决一些重大挑战。
随着智能技术模型的平台化,以及微软继续以负责任的方式为客户推动智能技术的进步,云、基础设施投资和高度负责的智能技术方法成为关键。
在您心目中,
今年智能技术领域有哪些最重要的进展?
当我们即将迈入2022年时,我想智能技术领域的几乎每个人都期待未来12个月左右的时间里能发生令人印象深刻的事。如今,这一年已经结束束,即便之前期待颇高,回顾我们在智能技术领域各方面取得的创新规模仍旧有点令人兴奋。科研人员和其他同行们为推进最先进技术所做的事,在短短数年之前,还如同光年一般,超乎我们的想象。而几乎所有这些都是智能技术大模型飞速发展的结果。
今年有三项成果令我印象最为深刻。首先是GitHub Copilot1的发布,这是一个基于大型语言模型的系统,能将自然语言提示词转化为代码,对开发人员的工作效率产生了巨大的积极影响。未来发展将在很大程度上取决于我们编写软件的能力,因此GitHub Copilot首开先河让更广泛的群体可以拥有编码技能,这一点非常了不起。
第二项成果是DALL∙E 22等生成式图像模型变得非常受欢迎且更易使用。素描、绘画以及掌握所有的平面设计、插图和艺术工具都需要相当高超的技巧。虽然DALL∙E 2之类的智能技术系统不能把普通人变成专业艺术家,但能给许多人提供视觉语汇,一种他们从未想过自己会拥有的全新超能力。
(编者注:此帖中所有图片,除凯文·斯科特的照片外,均由制作者利用DALL∙E 2生成。)
同时,我们也看到智能技术模型变得越来越强大,并为其所要解决的问题带来了更多实质性的收益。纵观整个科技行业,我认为2022年蛋白质折叠方面的研究做得非常好,包括微软与华盛顿大学蛋白质设计研究所大卫·贝克实验室3利用 RoseTTAFold所做的研究,以及利用一系列先进的智能技术技术推动研究。
这一切非常激动人心。任何使科学和医学效力倍增的事情对世界都是有益的,因为我们面临的一些最大、最棘手的问题就在这些领域中。
2022年是令人难忘的科技大年。我认为2023年会更好。
您认为未来几年智能技术技术
在哪些方面会产生最大的影响?
我想可以很自信地说2023年将会是智能技术领域有史以来最振奋人心的一年。之前我也曾从心底相信2022年是有史以来令我们最为激动的一年。创新的车轮滚滚向前。
前面我已经谈到了 GitHub Copilot,但这也只是智能技术大模型未来潜力的冰山一角,把同样的理念外推到各种不同的场景中,智能技术大模型也可助推编程以外的其他脑力劳动。整个知识经济将会见证一场变革4,即智能技术如何帮助人们摆脱重复性工作,让工作更愉快、更有成就感。这将适用于几乎所有工作,比如设计新分子来制造药物5、根据3D模型设计制造“配方”,亦或单纯的写作和编辑。
我想可以很自信地说2023年将会是智能技术领域有史以来最振奋人心的一年。
例如,我一直在摆弄自己基于 GPT-3 构建的实验系统,以在其助力下完成一件从十几岁起就想做的事情——写一本科幻小说。我的笔记本上写满了为设想中的书编写的概要,描述了书的相关内容以及将发生在什么样的宇宙。有了这个实验性工具,我就可以打破僵局。如果我用传统方式写书6,一天能写2000个字,我就觉得自己做得很不错了。而用上这个工具,我曾经一天写出6000个字,就会觉得写得真多。与之前相比,这从性质上看是一个更加充满活力的过程。
这就是“一切皆有副驾驶”的梦想——当你做任何类型的认知工作时,旁边都会有一个副驾驶,它不仅可以帮助你完成更多的工作,而且还能以新颖且激动人心的方式增强你的创造力。
这种生产力的提高显然也会提升满意度,
为什么这些工具能给工作带来更多乐趣?
我们所有人都需要使用工具来完成工作。一些人非常喜欢购买工具,掌握其用法,并弄清如何以超级有效的方式让工作事半功倍。我觉得这就是这里正在发生的事情之一。在很多情况下,人们已经有了全新、有趣且从根本上比以前更有效的工具。我们做过一项研究7,发现使用无代码或低代码工具对用户的工作满意度、总体工作量和士气产生了80%以上的积极影响。特别是对处于相对早期阶段的工具来说,就会获得巨大利益。
对于一些员工来说,这实际上是在强化工作的核心流程,提高了你的速度。就像穿着一双更好的跑鞋去跑步或参加马拉松。我们发现这正是开发人员使用 Copilot 时的体验,据他们说8,Copilot 可以帮助他们保持心流状态,并且在面对过去枯燥重复的任务时依然头脑清醒。当智能技术工具可以帮助人们消除工作的苦差,即那些重复的、令人生厌的或妨碍他们做真正喜欢的事情的差事,他们的满意度肯定会提高。
就我个人而言,这些工具让我可以比以前更长久地处于心流状态。创意流的天敌是分心和思维停滞。举例来说,当我不太清楚该如何解决下一个问题,或者下一个问题是“我得去查一下这个问题。我不得不从正在做的工作中切换出来,去解决一个次要问题。”这些工具越来越多地为我解决了次要问题,使我可以一直保持在心流状态中。
除了GitHub Copilot和DALL∙E 2之外,智能技术还以其他方式出现在了微软的产品和服务中。那么下一代智能技术如何改进Teams和Word等现有产品?
这是智能技术不为人知的重要历史。迄今为止,智能技术带来的大部分益处都分散在上千个不同事物上,你甚至可能都无法完全了解你获得的产品体验中有多少来自机器学习系统。
例如,在Teams9视频通话功能的系统中,所有这些参数都通过机器学习算法学习。音频系统有抖动缓冲器使沟通顺畅;屏幕上显示的模糊背景效果也是机器学习算法在起作用。有十几个机器学习系统协同工作,才让我们的交流体验变得更加愉快。所有微软公司产品都是如此。
我们已经将用于少数领域的机器学习应用扩展到遍布不同产品的上千个场景,从 Outlook 电子邮件用户端的运作、Word 中的文本预测、必应搜索体验,到用户在 Xbox Cloud Gaming 和 LinkedIn 中看到的信息流样式,无处不在的智能技术正在让这些产品变得更好。
过去两年发生的巨大变化之一,就是曾经我们需要为所有产品针对每项任务专门定制一个模型,而现在一个模型可以用在很多地方,因为这些模型具备广泛用途。能够投资于这些随着规模扩展而变得更强大的模型,然后让所有构建在模型之上的东西同时从改进中受益,这是很了不起的。
微软通过AI4Science10和AI for Good11等倡议持续推进智能技术的研发。智能技术领域哪方面最令您激动?
全社会现在面临的最具挑战性的问题都在科学领域。如何治愈顽固复杂的疾病12?如何为下一场大流行病做好准备13?如何为逐渐老龄化的人口提供负担得起的高品质医疗14?如何使更多孩子接受未来所需技能的教育15?如何开发技术来抵消碳排放产生的一些负面影响16?我们正在探索如何将智能技术中一些激动人心的发展成果用于解决这些问题。
这些基础科学应用中的模型具有与大型语言模型相同的扩展特性。当你建立一个模型,让它进入某种自监督模式,它就可以在模拟中学习,或者通过自身观察特定领域的能力来学习,然后得到的模型可以让你显著改变应用的表现,无论你是在做计算流体力学模拟,还是药物设计的分子动力学17研究。
这其中蕴含着巨大的机遇。这意味着我们能找到更好的药物,意味着也许我们可以找到解决碳排放问题的全新催化剂18,也意味着全面加快科学家和其他理想远大者努力解决全社会最重大挑战的速度。
运算技术和硬件方面的突破
是如何促进智能技术进步的?
在智能技术领域所见的几乎所有最新进展背后,根源是已经证实的模型规模的重要性。事实证明,基于更多数据和更多计算能力训练出来的模型具有更加丰富全面的能力。如果想继续推动这一进步——更确切地说,目前我们还看不到扩大规模的收益边界,而我们要做的就是尽可能优化和扩展运算能力。
两年前,微软推出了第一台 Azure智能技术超级计算机19,在2022年的 Build 开发者大会上,我曾说我们现在拥有多个超级运算系统,并且非常确信这些系统是当今全球规模最大、功能最强的智能技术超级计算机。我们和OpenAI使用这些基础设施来训练几乎所有我们最先进的大模型,包括微软的Turing20、Z-code21和Florence22模型,以及OpenAI23的GPT、DALL∙E 和Codex 模型。最近,我们还宣布与英伟达的合作24,打造一台由Azure基础设施结合英伟达图形处理器驱动的超级计算机。
这一进步一定程度上就是通过使用越来越大的图形处理器集群进行大规模强力运算而取得的。不过,更大的突破或许在于软件层优化了模型和数据在这些巨型系统中的分散方式,既可以训练模型,又可以让这些模型为客户提供服务。如果我们打算提出将这些大模型作为人们的创作平台,那么其使用权就不能只掌握在世界上极少数拥有足够资源来建造巨型超级计算机的科技公司手中。
因此,微软大量投资软件领域,比如用于提高训练效率的DeepSpeed25以及用于推理的ONNX Runtime26。这些软件优化了成本和延迟,通常可以帮助我们让这些智能技术大模型更容易为人们所用,也更有价值。我们的这些技术团队令我感到超级自豪,因为微软在这一领域确实处于行业领先地位,而且我们所有这些成果都是开源的,以便其他人也能够不断提升。
与这些进步相伴而生的人们对智能技术将影响就业的担忧。您如何看待智能技术和就业的问题?
我们生活在一个特别复杂和宏观经济历史性变革的时代,展望未来5到10年,即便是为了让全世界达到网络中性平衡,我们也需要全新的生产力形式,以便让所有人都能够继续享受进步。我们希望将这些智能技术工具打造成平台,人们可以使用这些平台来构建业务和解决问题。我们相信,这些平台可以智能技术在更多人口中普及。利用这些平台,人们将解决更多的问题,可以让背景更加多元的群体参与到技术创造中来。
此前,人们需要大量的专业知识才能开始智能技术实例化。但现在你可以调用微软Azure认知服务27和微软Azure OpenAI服务28,并在这些服务的基础上构建复杂的产品,而不必成为AI方面的专家,也不需要从零开始训练自己的大模型。
对于一些员工来说,这实际上是在强化工作的核心流程,提高了你的速度。就像穿着一双更好的跑鞋去跑步或参加马拉松。
随着所有这些巨型智能技术系统的持续增长和演化,我想我们可以预期,这些进步将从根本上改变工作的性质,在不同程度上影响到每个领域,在某些情况下甚至还会创造出大量前所未有的新工作岗位。回顾过去,我们发现历史上各种知名技术范式转变都伴随着相同的情况:如电话、汽车、互联网。我认为就像这些实例一样,我们需要用新的方式思考工作和技能29,并超级关注确保我们有足够的人才且接受过培训,能够承担起真正至关重要的工作30。
与智能技术技术相关的另一个担忧是技术可能被滥用和误用。微软会采取哪些具体措施确保以负责任的方式开发和使用智能技术工具和服务?
我们极为严肃地对待这一问题。微软的智能技术系统必须通过负责任的智能技术流程31,而且我们还在不断改进这一流程。我们会与由多学科专家组成的团队一起仔细审查正在进行的工作,确保我们充分了解可能发生的所有潜在危害,并尽可能降低其负面影响。我们还为智能技术系统制定好了计划,在发布后能尽快发现并减轻任何预料之外的危害。
另一个非常重要的保护措施是有意识的迭代部署。我们的大部分工作都是关于具有广泛能力的模型。我们将这些模型存储在云上,并通过API或我们的产品提供给公众。任何开发者都可以访问API,但必须遵守服务条款才能使用,一旦违反服务条款,访问权限将被取消。对于其他产品,我们可能会精选一些有明确用例设想的客户提供有限预览。与这些早期客户的合作将帮助我们确保负责任的智能技术保障措施能够在实践中发挥作用,从而实现大范围推广应用。
我们坚信安全和责任的重要性,希望能为整个行业提供一些激励。为此,微软将通过负责的智能技术标准32与原则33,与广大社会同行共享在开发某些解决方案时应用的全部资源和专业知识。