查看原文
其他

绿洲对谈蓝振忠教授:时不我待,拥抱变化

参赞生命力 緑洲资本 Vitalbridge 2023-09-12

LLM 的迭代速度之快,让技术亮相到产品落地只需一夜之间,在新的生产力革命中,学界和业界何去何从?

本期分享我们与西湖心辰创始人蓝振忠教授的访谈,Enjoy

蓝振忠教授为西湖大学博士生导师,深度学习实验室创办人及负责人;西湖心辰创始人;前谷歌人工智能研究院科学家;NLP轻量级预训练语言模型 ALBERT 第一作者;亚太地区“35岁以下科技创新35人”。

绿洲:GPT-4 带来了什么惊喜?

蓝教授:我觉得最大的惊喜就是图片阅读能力,能够对 GRE 卷子里的题目,精准地阅读图片里面的文字和示意图,并给出准确的解题方案。OpenAI 应该给模型喂了大量此类数据,才能让GPT-4 的读图理解能力这么强。

另外,它通过拟合一个函数,可以用小模型的能力来预测大模型的能力,这使得很多的实验都可以在比较小规模的模型里面做。这也是一个非常有用的功能。

除此之外,它的论文也提到在工程方面做了大量的工作。这可能是我们目前所欠缺的,也是主要需要提升的点。

绿洲:如何看待 GPT-4 引入多模态?GPT-4 的中文能力表现如何?要适用于国内的场景路径会有什么不同吗?比如中国文化和数据元素特色大模型的路径会是什么样的?

蓝教授:GPT-4 里面的多模态主要是 Image Captioning 和 Image QA。这两类工作其实比较早就有了。特别是去年 2 月份 Salesforce 出的一个叫 BLIP 的工作,效果非常不错。但这次 GPT-4 的效果实在非常惊艳,要明显比 BLIP 的效果好不少,特别是在读文字方面。

作为中国的企业肯定会比较关注中文,GPT-4 的中文能力还是提升很明显。中国的企业肯定都感到很紧迫,一定都会很快去复制。

关于中国文化和数据元素特色这块,我们还是得先把通用做好。通用是第一步,先达到比 ChatGPT 更好的效果,再在我们的数据上去做适配。现在有了 GPT-4,相当于有一个很好的老师在教我们,我们得先跟他好好学习。

绿洲:国内做大模型,GPT-4 让大家动力和压力并存,这点您怎么看?

蓝教授:我觉得跟之前的策略还是一样的,因为现在基本的做法都是“跟随者”的策略,所以 GPT-4 对于提升肯定会非常有帮助,相当于我们有了一个更好的老师模型,对我们达到 ChatGPT 的效果有很大帮助。所以我认为大家接下来的预期跟 OpenAI 的距离会再缩短。之前大家都是懵的,但现在基本上大家都知道怎么去跟了。另外,整个研究领域也给了我们不少启发。

绿洲:您之前在 Google 工作,Google 继 GPT-4 也立刻发布,把 AI 能力集成到 Gmail 和 Google 的 workspace 里,对 Google 的危机时刻您怎么看?

蓝教授:我觉得 Google 在大模型上的积累还是非常深厚,所以肯定会去结合。但是有一点我不是特别理解,他们现在对大模型都是闭源的,Google 之前是很开放的。抛开这一点来讲, Google 的算力还是非常强,而大模型很多时候拼的就是算力。

绿洲:您觉得做大模型的上限会是什么?

蓝教授:很难说,我只能说我们远远没有达到模型的上限。无论是模型的大小还是模型的智能程度,我们都有不少提升的空间。

绿洲:AGI 时代什么时候可以到来?之前您给过一个10 年的预期,这个时间按现在速度,心理预期是否有变化呢? 您心目中 AGI 时代应该是什么样子的?

蓝教授:我认为大模型技术在未来的 10 年还是会持续提升,并不是说 AGI 的到来是 10 年后,更多的是说它能够持续不断迭代。ChatGPT 或者 GPT-4 已经超越人类很多,比如它在看某张图为什么好笑的时候,人类都未必能看得出笑点。

至于 AGI 时代会是什么样子,我们真的可以用图灵测试来测一下。现在 GPT-4还是会一直出现错误。当数据量很少,对于一些很低概率的事情发生时,它做得还不是特别好。但是我们人类,对于很低概率的事情,还是能够做得非常好的。当然我并不是说现在 GPT-4 的能力不令人震撼,而是相当震撼,只是从原理上来说它还是有这个问题。所以,我认为我们要真正通过图灵测试,还是需要比较久的时间。

绿洲:您也看到一个趋势,以前机器学术不同的分支都在被融合,相当于以后这一个模型又能做自然语言,又能做 CV,又能做算法,以后就没有分支了?

蓝教授:还是有分支的,虽然很多的研究领域会消失,比如语法分析;但是新的神经网络算法还是会不断出现。

绿洲:如果研究领域消失了,怎么从中去找出一条出路?

蓝教授:只能拥抱变化。GPT-3,GPT-4 结果都已经做好了,这个研究怎么做?怎么办?你的创新性在哪儿?可能会产生很多其他方向的研究,比如 GPT 系列怎么跟某个领域的结合,跟 GPT 系列相关的研究会很多。

绿洲:惊人的迭代速度,对科技创新的创业者来说,他们的创业模式是否会发生变化?

蓝教授:做模型应该会产生很多机会。对创业者来说,这就好比互联网刚开始的时候,做网页也有技术难度,后来也就容易了。应用层面也有很多机会,很多的应用都可以在对话的框架下重新做一遍。

绿洲:您怎么看待大模型的这两种方式走开源还是闭源?西湖心辰的思路是怎么样的?可以为这些合作生态提供一些什么样的能力?

蓝教授:作为跟随者来说,开源会更好一些。但是我觉得开源和闭源总会有一个比较大的 gap,原因是闭源的拥有很多用户数据,所以能够更好地去调优,这个 gap 就在于有没有用户数据。心辰科技也会开源,我们很早就意识到这点,但当时还是更追求创新性,所以没有开源一些我们认为没有特别大的创新性的模型。后续会有更多的开源。

我们现在已经有模型,可以对接企业做私有化部署,在某些领域内甚至可以做到比 OpenAI 更好。举个例子,像一些需要精确数字的营销文案或者报告,我们就可以做到极高的精确度。场景来说,营销、设计是我们目前最主要的方向。

绿洲:从GPT-4 发布开始,相关领域的迭代速度几乎在以天为单位进行。对此您能否做一些点评?

蓝教授:从这些变化我们可以看到大家在模型迭代和应用上都会有很多的创新,而且这种创新是越来越开放的,时不我待啊。


参赞生命力

你觉得什么是科技生命力? 

我们的生态是非常蓬勃发展的,整个技术发展迭代、整个产品行业都在急速发展。我们要很努力地去拥抱这一变化。
—— 蓝振忠教授
西湖大学深度学习实验室负责人
西湖心辰创始人

绿洲资本是中国新一代风险投资机构,致力于发现中国未来十年最有生命力的企业家,并与他们共同成长,创造长期价值。 “参赞生命力”是绿洲的愿景和使命。这种生命力(Vitality),既是时代结构性变革的方向,亦是企业家坚韧和进化的力量。

绿洲资本专注于早期和成长期投资,单笔投资300万到3000万美金,重点投资机器人、人工智能、科技服务等领域,助力中国科技驱动的新服务升级。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存