昆仑万维方汉：大模型的下一步发展，是解决准确性和时效性的问题

Original 努力开拓创新的昆仑万维集团 2023-08-26

收录于合集 #AIGC 26个

近日，2023阿里云峰会上，昆仑万维与阿里云共同发布战略合作，双方将在智算中心建设、大模型训练等领域展开合作。昆仑万维CEO方汉出席本次峰会，并分享主题为“国内AI赛道如何加速实现AIGC商业模式创新”的演讲。

▲昆仑万维CEO方汉发表演讲▲

以下为演讲的精华部分

昆仑万维致力于AIGC应用落地发布「天工」大语言模型
昆仑万维是中国领先的互联网平台出海企业，于2008年成立，2015年登陆创业板，目前业务和子公司已经拓展到全球，包括美国、日本、韩国、印度以及欧洲、非洲、东南亚等国家。昆仑万维也是国内全身心投入AIGC开源社区的企业，成为国内AIGC布局最为全面的企业之一。基于公司在全球的4亿月活用户，以及在C端和B端的丰富经验，有效地助力AIGC应用落地。
2020年GPT-3大模型发布，昆仑万维敏锐的捕捉到这是内容生成领域的里程碑。于是，昆仑万维联合奇点智源开始做中文预训练大模型的研发。2022年12月15日选择开源类GPT-3大模型，近期昆仑万维宣布「天工」3.5大语言模型将于4月17日启动邀请测试。严格来说，昆仑万维在AIGC领域耕耘有三年的时间。

▲「天工」3.5将于4月17日启动邀请测试▲

目前，昆仑万维旗下有图像AI、音乐AI、文本AI以及编程AI，其中音乐AI目前已经取得了一定的成绩。昆仑万维的愿景是致力于推进开源AIGC算法和模型社区的发展壮大，也基于全球月均4亿活跃用户来提供服务。我们一直认为开源大模型是商业闭源大模型的有力补充和替代。只有开源模式可以满足用户的长尾需求，只有开源模式可以满足中小企业的增长需求。

创新商业模式不断涌现算法演进解决大模型部署难题
Stability·Ai是文生图领域的开源模型，发展非常迅速。国内大多数文生图产品也都是基于Stable Diffusion研发的。许多电商企业对技术的了解程度有限，更倾向使用专业SaaS类产品如Midjourney来完成电商图的制作。国内游戏研发团队则不然，更多的是选择Stable Diffusion去训练自己的LORA模型，之后用自己的专有模型去进行游戏研发后续的流程。所以说Stable Diffusion这种开源模式非常利于中小企业进行改装来满足自己的长尾需求。
目前AIGC涌现出的三种商业化路径，有以Stability·Ai为代表的开源生态，以Midjourney为代表的专业SaaS生态，还有以Adobe Firefly为代表的传统工具生态。观察这三种路径，在文生图领域的发展以及商业前景，可以预测我们的文本大模型将来的发展生态，这是非常有借鉴意义的。
国内的AIGC赛道的发展也逐渐明朗，最先出现的是底座大模型，如GPT-3、类GPT-3.5为主的底层。如何利用文本大模型去炼自己的小模型，针对自己的行业做专属训练以及做商业模式的创新，对于大多数的中小企业来说，这是比较大的商业机会。

▲AIGC产业全景图（来自：量子位）▲

预训练大模型的能力其实决定了AIGC能力的上限。国内外在这方面差异明显，国外大模型是从底座开始，上层的应用基本上形成了一定的生态。国内其实是模型和应用的同步研发。中国商业模式的创新永远是不亚于国外的。中国的大模型何时能出来一个可用和好用的，这场军备竞赛在分出结果之后，对于国内产业生态会有比较大的促进作用。大模型的下一步发展是接入搜索来解决准确性和时效性的问题。

▲模态应用的分类（来自：量子位）▲

有观点认为模型越大部署越难。诚然，模型规模越大，所消耗的算力也越来越大。为此，工程师会不断蒸馏出更小的模型。NewBing在线使用的模型规模很可能已经小于ChatGPT了，而ChatGPT最近也关闭了Plus版的用户服务，这些都与模型大小相关。解决模型部署的难题，要依靠算法的演进以及芯片工程师的共同努力，才能够降低成本，从而让各行各业能够更好的使用预训练大模型，把能力发挥到最佳。

直面AIGC引发的四类问题呼吁行业监管及企业自律
AIGC发展迅速，相应也带来了一些社会问题。国家在这方面的审核和法规已经跟上了，要给我们的监管部门点个赞。首先是版权保护，训练中的语料、图片到底有没有版权问题，这是目前急需去解决的。在这波大模型出现之后，人类的文化史可能会分为两个阶段：第一个阶段是没有受AI生成内容污染的原始语料；第二阶段从2023年开始，人类所有生产出来的内容都可能会受到AIGC的“污染”。
ChatGPT能取得成功，而Meta和谷歌此前推出的大模型都失败了，很重要的原因是后两者在倾向性上做的不如前者。在大模型里面解决算法歧视、社会偏见和刻板印象等问题，需要监管部门以及企业共同努力。
此外，信息的真实性、安全性同样值得注意。比如海外企业有员工把内部核心资料放到ChatGPT上去进行问答，这属于数据泄露。意大利也关闭了ChatGPT的访问。在大模型的使用上，数据安全性和隐私保护依旧任重道远。
对于所有的云厂商以及芯片厂来说，这是最好的时代。现在最紧俏的商品应该就是A100训练卡。整个AIGC的高速发展以及人类对AI算力的需求，对于能源消耗来说也是一个很沉重的负担。上述的四个问题值得我们去关注。

昆仑万维携手阿里云智算中心支撑大模型创新
昆仑万维与阿里云从2015年开始合作，其中包括很多海外的项目，多年以来合作非常愉快。昆仑万维作为一家软件公司，与硬件厂商携手，才能把事情做得更好。
文本大模型类GPT-3.5只是一个起步。未来所有人都要争夺的是类GPT-4多模态大模型的训练。图像、视频理解所消耗的资源更多，它所需要的训练卡以及训练资源也会更多。
昆仑万维愿意与阿里云继续精诚合作，共创构建万卡大模型训练集群。在核心业务线上推理工作中，也希望与阿里云一起打造一个大规模的推理集群，为尽可能多的用户提供更多更好的服务。
昆仑万维作为阿里云的核心合作伙伴，将携手为我们的客户提供更多的商业化落地场景，也欢迎大家参与4月17日「天工」大模型的测试。

END

●官宣｜「天工」大模型4月17日启动邀测

●中国的大模型机会在何处？

●大模型的底座是这一轮AI革命的基石

●昆仑万维入选『中国AIGC领域最值得关注的50家公司』榜单

●昆仑万维方汉：预训练大模型能力决定AIGC能力上限

●昆仑万维与阿里云达成战略合作将新建智算中心支撑大模型创新