查看原文
其他

大模型的正确用法:利用涌现能力控制专用模型

能力涌现的 昆仑万维集团 2023-08-26
由中国科技产业智库「甲子光年」主办的「共赴山海·2023甲子引力X智能新世代峰会」于4月25日重磅开启。峰会层层剖析中国科技产业新风向和趋势判断,共同探寻智能新世代的过去、现在和未来。

昆仑万维CEO方汉出席本次峰会,与现场嘉宾共襄盛举,并分享主题为“「天工」大模型之路及商业化前景”的演讲。



以下为演讲的精华部分

昆仑万维是一家A股上市公司,在海外已发展了将近十几年,业务覆盖信息分发、社交、元宇宙、游戏以及AIGC等多个领域。目前旗下包括通用人工智能AGI与AIGC、海外信息分发与元宇宙、科技股权投资三大业务板块,市场遍及中国、东南亚、非洲、中东、北美、南美、欧洲等地。全球月活用户近4亿,海外收入占比78%。


作为一家偏内容的公司,昆仑万维为何会介入到大模型领域,说来巧合。2020年6月GPT-3发布,我们第一时间就注意到了。当时我担任昆仑万维集团CTO,在试用GPT-3后我认为这是AIGC的一个极大的里程碑,它会促进内容生成领域产生极大的变革。在很多人都没有意识到它会成为通用人工智能的一个敲门砖的时候,我们成立了团队去跟踪GPT-3大模型,也就是与奇点智源合作。2022年12月底我们发布了AIGC全系列算法与模型,开源了文本AI、编程AI、绘画AI。今年4月17日,我们正式发布了「天工」大语言模型。


2023年2月9日,我们正式开始大模型的训练工作,鉴于两年多的训练投入,所以在大模型的训练之路上的工程经验很丰富,进展顺利。今年4月17日,我们正式发布了「天工」大语言模型。「天工」支持1万字以上的文本对话、能够实现20轮以上的问答交互、擅长语义理解,在已经发布的模型当中质量相对较高。




大模型实现了人类有史以来

最大的一次知识迁移


国内大模型已经成为热门赛道。大家可以看到有垂直应用、初创型企业、互联网大厂和科研机构。对于大模型的生态而言,除了国内赛道以外,在全球仍然有很大的空间。


这次大模型实现了人类有史以来最大的一次知识迁移


何为知识迁移?GPT-4的训练文本里大概有92%是英文文本,中文文本占比较低,因为人类近代史上200年的现代文明,大多数的科研技术成果以及人类的智慧都是以英文方式书写。这对于其他所有语种来说是一个非常不公平的现象,大模型的出现解决了这种不公平。无论是使用国内的大模型还是使用国外的大模型,其知识来源是以全球各种语种的知识为源泉,这就真正打破了英文的知识垄断,从而使全球任何语种的用户都能使用大模型来学习进行知识迁移。我觉得这一点其实在海外会涌现出特别大的商业机会,这也是我们在海外耕耘多年的一个心得。


同时,由于大模型天然的倾向性,每个国家、每种语言都需要训练出自己专有的语言模型。在这场军备竞赛中,除了美国,可能就是中国参与的公司最多。这对于中国公司而言也是很好的机遇。


▲AIGC产业图谱(来自:甲子光年)▲


从大模型的产业图谱可以看到,中国的创业公司在数量上、在质量上并不比美国同行差多少,我们的长处很多。首先,我们的工程师更加努力,在跟随上做的很快;其次,我们在商业模式创新上更有创造力。我也很期待在「天工」大模型底座的基础上,能够涌现出更多的创业公司,基于大模型的底座来做各种商业模式的创新。


我认为在AIGC领域,其上限受到预训练大模型的能力影响非常大。无论是文生图、文生视频或是文生音乐,都会受到大模型底座能力的影响。因此选择更好的底座大模型,才能保证作品的质量。




大模型的正确用法

利用涌现能力控制专用模型


对于「天工」大模型的能力扩展,昆仑万维有细致的规划。


首先,「天工」大模型或者说其他的大模型本质上是类似于CPU或者是操作系统,现在很多人将大模型当做个人助手来使用的,这其实只发挥了大模型一小部分功能。大模型最大的功能其实是利用它涌现出来的逻辑推理能力,去控制其他的专用模型来增强它的能力范围。目前的大模型在很多专用任务上,能力不及一些专用模型,但通过类似于Huggin GPT这样的方法,我们可以让一个大模型去控制多个专用模型来增强它的能力范围。以后的大模型一定会自动化的去生成,甚至说在run time的时候去生成各种各样的小模型来处理任务,不同的是试验范围。


▲「天工」大模型的能力扩展 ▲


其次,类似于最近比较火的AutoGPT,我们要接入多种API来实现多种功能,这也是大模型向各行各业渗透的必经之路之一。


第三,比较老生常谈,通过开放plugin商店来建立开放生态。


第四,各行各业其实都在找我们询问,如何把自己行业专有数据接入进来、同时能够保护它的专有数据。像联邦计算、隐私计算这些也一定会应用到大模型领域来实现数据隐私的保护以及在各行各业的应用。


最后,其实是比较容易忽视的,大模型接入搜索引擎都有一个问题,它的即时性、时效性以及准确性如何保证。NewBing为何得到更多人的青睐?因为只有拥有搜索引擎,才能利用到人类整个互联网上即时更新的各种知识以及信息实现知识迁移。以上五点,是我们对「天工」大模型能力扩展的介绍。




通过应用场景容错率

判断大模型应用是否受欢迎


「天工」大模型的应用场景也经历了一段时间的演进。之前我认为,大模型更容易帮助人类完成在电脑上闭环的工作,但现在我有了新的认知——要通过应用场景的容错率来判断大模型应用是否受欢


目前,用户使用大模型最常见的行为是进行内容创作。包括写作、设计、动漫、短视频、影视、游戏、广告、翻译等。这些行业的容错率非常高,它不需要人工干预,可以直接使用结果。比如文生图领域,画手曾是个痛点。画六根手指还是七根手指,其实对结果的影响不大,大众是可以容忍的。


▲「天工」大模型 应用场景演进 ▲


在科学研究、商业和教育、互联网这些领域,容忍度就相对较低,需要持续的人工干预结果才可以使用。


在金融、医疗、通讯、能源、法律这些领域,除了人工干预之外,还需要更多的伦理监督和验证,以保证它的结果不会损害人类的利益。


在工业制造、航空航天以及国防军工这些领域,容错率极低,且制作成本非常高昂。在这些领域,大模型还要经历一段时间的发展,才能够介入进去发挥效用。


对于全世界所有的大模型来说,都是从容错率高的行业切入,逐渐向容错率低的行业渗透。这亦是「天工」大模型应用场景的演进过程,我们也会遵循这个规律进行后续的工作。


在目前的实践过程中,我们已测试过比较成熟的「天工」大模型的应用场景,主要还是在容错率较高的营销传媒、内容创作、教育与咨询、游戏文娱、人力资源、数据服务,以及行业研究等方面。欢迎各界B端用户与我们一起协作,把大模型在中国的应用之路走得更宽、更顺。最后也希望大家能够抓住大模型带来的商业机会。奇点已到,共赴山海。


END



重磅预告


4月26日(周三)晚19:30-21:00昆仑万维CEO方汉将做客CSDN“开谈”直播间畅聊昆仑万维AIGC产业布局,探索大模型的“应用征途”在哪里?扫码预约直播,更多精彩敬请期待




你好,我是「天工」

大模型的下一步发展,是解决准确性和时效性的问题

●昆仑万维与阿里云达成战略合作 将新建智算中心支撑大模型创新

中国的大模型机会在何处?

昆仑万维入选《巴伦周刊》2023市值增长榜单TOP10

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存