查看原文
其他

昆仑万维方汉:大模型的下一步发展,是解决准确性和时效性的问题

努力开拓创新的 昆仑万维集团 2023-08-26

近日,2023阿里云峰会上,昆仑万维与阿里云共同发布战略合作,双方将在智算中心建设、大模型训练等领域展开合作。昆仑万维CEO方汉出席本次峰会,并分享主题为“国内AI赛道如何加速实现AIGC商业模式创新”的演讲。 


▲昆仑万维CEO方汉发表演讲▲


以下为演讲的精华部分
昆仑万维致力于AIGC应用落地发布「天工」大语言模型
昆仑万维是中国领先的互联网平台出海企业,于2008年成立,2015年登陆创业板,目前业务和子公司已经拓展到全球,包括美国、日本、韩国、印度以及欧洲、非洲、东南亚等国家。昆仑万维也是国内全身心投入AIGC开源社区的企业,成为国内AIGC布局最为全面的企业之一。基于公司在全球的4亿月活用户,以及在C端和B端的丰富经验,有效地助力AIGC应用落地。
2020年GPT-3大模型发布,昆仑万维敏锐的捕捉到这是内容生成领域的里程碑。于是,昆仑万维联合奇点智源开始做中文预训练大模型的研发。2022年12月15日选择开源类GPT-3大模型,近期昆仑万维宣布「天工」3.5大语言模型将于4月17日启动邀请测试。严格来说,昆仑万维在AIGC领域耕耘有三年的时间。

▲「天工」3.5将于4月17日启动邀请测试▲


目前,昆仑万维旗下有图像AI、音乐AI、文本AI以及编程AI,其中音乐AI目前已经取得了一定的成绩。昆仑万维的愿景是致力于推进开源AIGC算法和模型社区的发展壮大,也基于全球月均4亿活跃用户来提供服务。我们一直认为开源大模型是商业闭源大模型的有力补充和替代。只有开源模式可以满足用户的长尾需求,只有开源模式可以满足中小企业的增长需求。

创新商业模式不断涌现算法演进解决大模型部署难题
Stability·Ai是文生图领域的开源模型,发展非常迅速。国内大多数文生图产品也都是基于Stable Diffusion研发的。许多电商企业对技术的了解程度有限,更倾向使用专业SaaS类产品如Midjourney来完成电商图的制作。国内游戏研发团队则不然,更多的是选择Stable Diffusion去训练自己的LORA模型,之后用自己的专有模型去进行游戏研发后续的流程。所以说Stable Diffusion这种开源模式非常利于中小企业进行改装来满足自己的长尾需求
目前AIGC涌现出的三种商业化路径,有以Stability·Ai为代表的开源生态,以Midjourney为代表的专业SaaS生态,还有以Adobe Firefly为代表的传统工具生态。观察这三种路径,在文生图领域的发展以及商业前景,可以预测我们的文本大模型将来的发展生态,这是非常有借鉴意义的。
国内的AIGC赛道的发展也逐渐明朗,最先出现的是底座大模型,如GPT-3、类GPT-3.5为主的底层。如何利用文本大模型去炼自己的小模型,针对自己的行业做专属训练以及做商业模式的创新,对于大多数的中小企业来说,这是比较大的商业机会。

▲AIGC产业全景图 (来自:量子位)▲


预训练大模型的能力其实决定了AIGC能力的上限。国内外在这方面差异明显,国外大模型是从底座开始,上层的应用基本上形成了一定的生态。国内其实是模型和应用的同步研发。中国商业模式的创新永远是不亚于国外的。中国的大模型何时能出来一个可用和好用的,这场军备竞赛在分出结果之后,对于国内产业生态会有比较大的促进作用。大模型的下一步发展是接入搜索来解决准确性和时效性的问题。

▲模态应用的分类 (来自:量子位)▲


有观点认为模型越大部署越难。诚然,模型规模越大,所消耗的算力也越来越大。为此,工程师会不断蒸馏出更小的模型。NewBing在线使用的模型规模很可能已经小于ChatGPT了,而ChatGPT最近也关闭了Plus版的用户服务,这些都与模型大小相关。解决模型部署的难题,要依靠算法的演进以及芯片工程师的共同努力,才能够降低成本,从而让各行各业能够更好的使用预训练大模型,把能力发挥到最佳。

直面AIGC引发的四类问题呼吁行业监管及企业自律
AIGC发展迅速,相应也带来了一些社会问题。国家在这方面的审核和法规已经跟上了,要给我们的监管部门点个赞。首先是版权保护,训练中的语料、图片到底有没有版权问题,这是目前急需去解决的。在这波大模型出现之后,人类的文化史可能会分为两个阶段:第一个阶段是没有受AI生成内容污染的原始语料;第二阶段从2023年开始,人类所有生产出来的内容都可能会受到AIGC的“污染”。
ChatGPT能取得成功,而Meta和谷歌此前推出的大模型都失败了,很重要的原因是后两者在倾向性上做的不如前者。在大模型里面解决算法歧视、社会偏见和刻板印象等问题,需要监管部门以及企业共同努力。
此外,信息的真实性、安全性同样值得注意。比如海外企业有员工把内部核心资料放到ChatGPT上去进行问答,这属于数据泄露。意大利也关闭了ChatGPT的访问。在大模型的使用上,数据安全性和隐私保护依旧任重道远。
对于所有的云厂商以及芯片厂来说,这是最好的时代。现在最紧俏的商品应该就是A100训练卡。整个AIGC的高速发展以及人类对AI算力的需求,对于能源消耗来说也是一个很沉重的负担。上述的四个问题值得我们去关注。

昆仑万维携手阿里云智算中心支撑大模型创新
昆仑万维与阿里云从2015年开始合作,其中包括很多海外的项目,多年以来合作非常愉快。昆仑万维作为一家软件公司,与硬件厂商携手,才能把事情做得更好。
文本大模型类GPT-3.5只是一个起步。未来所有人都要争夺的是类GPT-4多模态大模型的训练。图像、视频理解所消耗的资源更多,它所需要的训练卡以及训练资源也会更多。
昆仑万维愿意与阿里云继续精诚合作,共创构建万卡大模型训练集群。在核心业务线上推理工作中,也希望与阿里云一起打造一个大规模的推理集群,为尽可能多的用户提供更多更好的服务。
昆仑万维作为阿里云的核心合作伙伴,将携手为我们的客户提供更多的商业化落地场景,也欢迎大家参与4月17日「天工」大模型的测试


END



官宣|「天工」大模型4月17日启动邀测

中国的大模型机会在何处?

大模型的底座是这一轮AI革命的基石

昆仑万维入选『中国AIGC领域最值得关注的50家公司』榜单

昆仑万维方汉:预训练大模型能力决定AIGC能力上限

●昆仑万维与阿里云达成战略合作 将新建智算中心支撑大模型创新

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存