绿洲对话杨小康教授：凡能理解，皆可创造

Original 参赞生命力緑洲资本 Vitalbridge 2023-09-12

“科技”有“生命力”吗？如果有，是怎么生长的？
带着这个问题，过去 3 年绿洲访谈了全球近百位教授学者。他们有的来自生物实验室，赞叹于生命的“无常”；有的深耕于基础物理，觉悟于万物的“常在”。
今年，我们会陆续整理、分类、分享，也欢迎更多朋友联系我们，和绿洲一起探索“科技”的生命力。
那么首先，我们就缘起于“ ChatGPT ”吧。

杨小康教授任上海交通大学 AI 研究所常务副院长、AI 教育部重点实验室主任；国家杰出青年获得者，IEEE Fellow。以下是整理的精选内容，Enjoy。

绿洲：ChatGPT 是否能理解语言逻辑本身？

杨教授：我们先来看一下 ChatGPT 是什么。首先，你知道 ChatGPT 这个聊天机器人为什么叫这个名字吗？英文单词中 Chat 的意思是聊天。这部分好理解，而 GPT 这部分是指聊天机器人依赖的核心技术，也就是 OpenAI 公司的人工智能模型。GPT 这个古怪的名字其实是英文 Generative Pre-trained Transformer 的缩写，直接翻译成中文是生成式预训练转换器。其中最关键的概念是 Transformer，这个词是新一代人工智能模型的共同核心技术，它也是一个新型深度人工神经网络系统结构。正是 Transformer 技术推动人工智能领域进入了一个新境界，也包括 GPT 快速迭代。

以前人工智能主要通过机器学习，从人类为某个特殊目的处理过的数据中，学一个专门的技能，比如翻译的能力，处理语言的能力等等。Transformer 技术形成一种叫“自注意”的机制，比如在“我是小康” 这个例子中，它能够自己学习到“小康”是一个名字，而“我”指代的就是“小康”这个人。这是一个简单句子，这种“自注意”的机制，还能够做更复杂的完形填空、句子接龙。如此这般，就给了人工智能系统自学“不用人工标识”的原始数据的能力。

Transformer 这个技术还能让越复杂的系统，越有效地学习和包容更多的数据。GPT、BERT 等语言大模型都基于 Transformer。这些语言大模型 LLM，再通过微调推广到下游任务。ChatGPT 使用一种叫人类反馈强化学习（Reinforcement Learning from Human Feedback，RLHF）的技术来实现微调，校正语言模型，更好地理解人的指示，加速 ChatGPT 的迭代。

因此，从 ChatGPT 的原理来看，它对语言逻辑本身有一定的理解，并可通过人的指示不断纠正原有的错误理解。

绿洲：为什么谷歌没能做出 ChatGPT？

杨教授：谷歌为了应对 ChatGPT，2 月初就推出了智能聊天机器人 Bard。谷歌的官方推特还出了一个宣传 Bard 的视频，视频中显示了一个和 Bard 的问答，问题是“詹姆斯韦伯太空望远镜的哪些新发现？我可以告诉我 9 岁的孩子”，谷歌视频中的 Bard 给出了三个答案，前两个韦伯太空望远镜的新发现没有问题；第三个说韦伯太空望远镜是第一个拍摄到太阳系以外行星照片的望远镜。2 月 7 日星期二下午，有人发现这个说法和美国宇航局的官方记录并不相符。换句话说，第三个说法是谷歌的 Bard 脑洞大开、张冠李戴编造的假事实。从 2 月 8 日开始，谷歌市值连续两天暴跌 1,500 亿美元。谷歌小编在选择例子上的疏漏，成为人类历史上最昂贵的一个编辑失误，代价是 1,500 亿美元的谷歌市值在两天中蒸发无踪。目前，谷歌的高管们仍在处理 Bard 带来的负面影响。

绿洲：ChatGPT 广泛使用后，人的认知能力会下降吗？

杨教授：目前来讲，ChatGPT 只是一个工具，辅助人类更快、更精准地找到所需要的信息。人的认知能力不会受 ChatGPT 影响，相反，人可以通过使用 ChatGPT 来帮助自己快速学习，提升工作效率。

首先，ChatGPT 可作为助教，帮助我们学习理工科、文科的知识。以理工科为例，比如让 ChatGPT 做一道求导的题，它不但能给出正确的答案，还可以把做题过程的思路也清晰地表达出来。如果给它一个简单的编程问题，它不但能够生成程序，还可以告诉我，这段程序是基于什么辅助程序的设计，要先安装辅助程序，才能使用它生成的程序。

其次，ChatGPT 可作为助手帮助我们搜集资料、撰写或润色文字稿，辅助文字创作。

但 ChatGPT 有个问题，它会瞎编故事，撒谎时不打任何磕绊，回答问题的语气平和而坚定。比如让 ChatGPT 讲一个刘备三顾茅庐的故事，结果它洋洋洒洒地给我讲了一堆刘备向诸葛亮、刘表、张飞分别请教了三次的内容。这不是 ChatGPT 的独特问题，这是目前基于类似的人工智能系统的一个通病。因此，当 ChatGPT 给出回答时，我们需要慎重地核实后，才使用其回答，而不能照搬，这反而考验了人的认知能力。

图片由 Tiamat 生成

绿洲：这波新的 AI（GC）浪潮里，你看好新的 2C 应用的机会吗？如果看好，您看好哪类呢？

杨教授：语言大模型是 2C 应用的好机会。作为强大的新的生产力，语言大模型蕴含了巨大的商业价值，这里的前提是对它进行有效的治理，防止被滥用。在治理规范没有出来之前，近期，我们可以扬长避短，推动通用语言大模型的商用。微软最近推出了 New Bing 的试用版，集成了 ChatGPT，在搜索基础上，新功能能够连续聊天，从事实来源中总结归纳出答案，并且反馈你可能进一步关心的问题。微软市值一夜暴涨 800 亿美元，微软还准备将类似 ChatGPT 的 AI 添加在 Word、Outlook 等产品。近期通用语言大模型的主要商业应用至少可以是基于事实的归纳、交互、翻译等 AI 助手。除了 ChatGPT，GPT 还可以用于生成代码、语音识别、图像生成等等。

绿洲：LLM 的突破对您自己现在的研究领域有什么启示或帮助吗？

杨教授：ChatGPT 是典型的生成式人工智能，它生成语言。Gartner 去年的报告将生成式人工智能列为加速成长的未来战略技术。生成式人工智能，通过机器学习，生成全新的、原创的数据。预计到 2025年，生成式人工智能产生的数据将占据人类全部数据的 10%。生成式人工智能将带来深刻变革，推动内容开发、视觉艺术创作、数字孪生。GPT-3 大模型已经初步实现自动编程，为科学研究提供 AI 直觉，产生新的数学猜想，帮助证明数学猜想，加速新药物发现、新物质合成，等等。

此外，生成式人工智能将推动元宇宙的发展。元宇宙的核心功能是物理世界的模拟和人的虚拟化，生成式人工智能实现这样的人和物的虚拟化，促进虚实高度融合，实现效率的提升、体验的提升、精神的提升。因此，我们认为生成式人工智能是元宇宙的内容生成器、虚实连接器、效率加速器，世界模型是元宇宙中的可交互物理引擎，虚拟数字人是元宇宙的原住民、生产力。

生成式人工智能为构建基于视觉直觉的物理世界模型和虚拟数字人提供了可行的途径。展望未来，我们需要借助数学、物理、信息论、认知科学，进一步夯实生成式人工智能的基础理论。“物理+数据”联合驱动，“虚拟+现实”深度融合，生成式的AI直觉有望加速科学发现、物质合成和元宇宙构建。

图片由 Tiamat 生成

费曼曾经说过，“凡是我不能创造的，我就不能理解。”

生成式人工智能认为，“凡是我能够理解的，我就能创造。”

参赞生命力

你觉得什么是科技生命力？

科技的生命力在于进化发展、融入人类生活。如今当人工智能具备创造力的时候，它造就其它生命。
—— 杨小康教授，IEEE Fellow
上海交通大学 AI 研究所常务副院长

绿洲资本是中国新一代风险投资机构，致力于发现中国未来十年最有生命力的企业家，并与他们共同成长，创造长期价值。 “参赞生命力”是绿洲的愿景和使命。这种生命力（Vitality），既是时代结构性变革的方向，亦是企业家坚韧和进化的力量。

绿洲资本专注于早期和成长期投资，单笔投资300万到3000万美金，重点投资机器人、人工智能、科技服务等领域，助力中国科技驱动的新服务升级。

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

为了这部描述从“反右”到“文革”的禁片，田壮壮付出了十年不能拍片的代价

关于字节基建

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

绿洲对话杨小康教授：凡能理解，皆可创造

您可能也对以下帖子感兴趣

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

为了这部描述从“反右”到“文革”的禁片，田壮壮付出了十年不能拍片的代价

关于字节基建

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

生成图片，分享到微信朋友圈

绿洲对话杨小康教授：凡能理解，皆可创造

您可能也对以下帖子感兴趣