「谁将成为中国的OpenAI」系列开篇 | 九合对话彩云科技袁行远
“
新年伊始,人工智能实验室OpenAI发布的ChatGPT掀起了一阵狂热之风。上线5天注册用户破百万,上线两个月,月活用户破亿。在ChatGPT来势汹汹的压力之下,谷歌宣布推出一款实验性的对话AI服务Bard,微软则更快一步地推出了应用 ChatGPT 的 Bing 搜索引擎和 Edge 浏览器。
Bing 搜索引擎
九合认为,ChatGPT依托大算力、大数据体量的超大参数模型,效果远远超出人们对对话机器人的预期,迅速爆火出圈,这背后显示了人们对于AIGC(AI-Generated Content)的期待和热情。
如果说AlphaGo战胜李胜石,开启了AI爆发的上半场,那么AIGC则接棒了AI下半场,全胜归来。
2022年,AIGC备受资本市场认可,Jasper. AI和Stability AI均获得了超 1 亿美元的融资;另一方面,一名游戏设计师凭借AI模型Midjourney画出来的一幅画《空间歌剧院》,也在2022年夺取知名艺术大奖。
在AI发展的漫长曲线中,这一波的突破究竟意味着什么?ChatGPT的风潮能带来什么?AIGC的下一步是什么?
我们邀请了国内AIGC先行者彩云科技创始人袁行远和九合投资人一起聊了聊ChatGPT,AIGC的现在和未来,以及对于彩云小梦的想法。
九合创投于2017年投资了彩云科技。彩云科技是国内AI产品的先行者,旗下有彩云天气、彩云小译和彩云小梦三款产品。从AI模拟地球运转、把降雨预报精确到分钟的彩云天气,到Chrome Web Store下载量第一的网页翻译插件彩云小译,再到彩云小梦通过AI续写,构建平行世界,背后都是袁行远坚持的AGI(通用人工智能)梦想。
”
在彩云办公室,我们和袁行远主要聊了以下话题:
ChatGPT是GPT3到GPT4之间的过渡版本,生成式AI是长期趋势所在,大模型正在成为现实;
这一波AIGC浪潮的兴起原因:底层技术进展叠加C端破圈效应,共同推动了这波浪潮;
AIGC将给内容生产领域带来生产力的变革,降低内容的创作门槛,推动大量优质内容产生;
技术拐点已至,AIGC也开始有了强劲的商业化苗头,未来应用场景非常广阔;
袁行远和彩云小梦的梦想:打开AI的开放世界。
视频来源:2022年彩云科技新品发布会
AIGC行至“中途”:从分析式AI到生成式AI
2022年9月,在Gartner公布的2022年人工智能技术成熟度曲线中,生成式AI正处于上升期。其技术本质是人工智能的算法和机器学习方式的进化,使AI获得了更强大的创作能力。
从GAN只能模仿现有作品,到OpenAI开源的深度学习模型CLIP能将文字和图像进行关联,到Diffusion 模型生成图片精度和艺术风格模仿能力更高,再到以ChatGPT为代表的接近人类水平的对话机器人,技术的发展奠定了AIGC发展的基础,其强大的内容生成能力也不断给人们带来巨大的震撼。
这一切似乎表明AI正在摆脱工具人的身份,向一个“大脑”迈进了。
而且在AI大模型不断迭代之下,AI生成内容的效率逐渐由1个小时缩短至十几秒。
袁行远表示,技术进展叠加C端破圈效应,共同推动了这波浪潮。
在AIGC领域,存在着不同的应用场景,也对应着不同的技术难度和规模化应用的时间。图片AIGC目前停留在生成单一图片;视频和3D素材的生成具有更高的技术难度,挑战更大;文字AIGC发展则起步较早,AI对于文字的理解已经能够支持续写。例如2021年发布的彩云小梦1.0能根据用户提供的文章开头,进行小说和网文风格的情节续写。
选择文字AIGC不仅源于彩云对文字有着深厚的技术积累,袁行远也认为,文字作为人类表述情节、传递信息最长远和重要的方式,会成为人类未来与AI对话的主要途径,AI对文字的理解是AI生成各种形态的基础。
一张图片和一句话都可以被转换到高维向量空间的一个点,从而可以以数字的方式进行理解。传统AI对图片、文字、数据的分析更侧重于“理解”这些表述的深层意义。
假设我们构建一个“意义坐标系”,之前的AI技术更关注如何将文本准确的投射到意义坐标点。如今,AI走向更具创造力的生成轨道,意味着在这个坐标系中,AI将有能力自行判断文本逻辑的走向,并将这种走向映射回人类传统的媒介形式。
单张图片、单句话等较短的信息可以看作跨模态的高维意义空间所在的一个点,视频和长文本的剧情通过 AI的投射,可以看作这个高维意义空间上勾勒了多个点的运行轨迹。要理解更长的语句、多张连续图片,需要AI完成从高维单点位置到高维曲线运动状态的跨越,这需要新的技术。
以彩云科技为例。彩云天气对气象信息进行分析,得出未来天气的判断,属于短期预测的 AI。人类对AI技术的掌握达到了飞机可以飞离地面的阶段,并在一些领域超越了人类的分析高度。而彩云小梦当前已经可以完成对小说等文章的续写与编辑,正向AI应用领域的更长更复杂的理解迈进,从简单 AI向复杂 AI更广泛的应用领域探索。
彩云小梦在2022年推出了2.0版本,用NLP技术驱动对话场景,在情节续写的基础上实现用户与AI虚拟人物的对话,提供更多互动性和情感陪伴。这和ChatGPT 异曲同工,但更符合“小梦”的世界,根据设定的不同角色,之间进行主题对话,可以文字也可以语音。
彩云小梦的对话
彩云小梦和ChatGPT都是大规模语言模型的应用,都基于Transformer模型。在大规模语料上,用上千张卡的高算力进行的训练。“但小梦在文学创作上更为侧重,有一些针对人物关系,故事背景以及超长上下文的模型结构优化。相比ChatGPT更注重逻辑性,小梦在趣味性、文学性以及想象力都更有特点。”
因此袁行远也一直认为对话本质不难,关键在于能否做到个性化,符合用户对人物的设定。
ChatGPT和彩云小梦对同一段文字的续写:
从彩云小梦1.0到2.0,续写场景到对话场景的渐进就是文本生成式AI扩展性的体现。将文本作为AI的理解基础,背后的目的也是AGI的核心:让AI像人一样思考。
从技术到商业化的跨越
技术拐点已至, AIGC也开始有了强劲的商业化苗头。Jasper2022年底宣布,全年收入预计近亿美元。
目前文字到文字已经实现规模化应用,文字到图像、图像到视频领域的AIGC技术基本成熟,预计将在未来几年内实现规模化应用。
当下彩云小梦也已经开始尝试商业化,在袁行远看来,“这并没有想象中的那么难,疫情让公司更加认识到回归商业本质的重要性,盈利本身也会给创业者本身更大的动力和安全感。”
九合认为,AIGC将给内容生产领域带来生产力的变革,降低内容的创作门槛,以更低成本、更快的生产速度,与用户共同创造出有质量的内容。更多用户可以与AI合作,消费AI生产内容的同时,也可以作为内容生产者发布共创内容,AIGC在内容的产出和分发端都能提供更个性化的体验。
短期来看,图片AIGC仍存在着一些问题。例如媒介形态受限于模型,主要以图片为主;商业化模式面向垂直行业,除了替代人工的变现模式,还需要开发更多留存广大用户的玩法与功能;生成图片准确度相对较差,需精挑细选等。
诸如此种短期瓶颈,既给AIGC领域创业者带来挑战,也提供了新的机遇。
如何提高人与AI的协作效率,让AI通过用户的反馈,改善生成内容,提高可控性,是AIGC后续发展的重要命题。
在存量市场,AIGC未来的应用场景非常广阔,除了当前的图片应用在对应的画风垂类生产作品,未来将有可能出现可以服务品牌营销需求的工具,为商家生成千人千面的营销广告。
在对应的细分领域,AI创作替代基础人工的可能性逐渐明确,而更大的想象空间可能在AIGC的完整开放世界上,给用户带来视频/3D场景形态的消费级内容,以及糅合电影、游戏的内容消费体验,这将是AIGC领域诞生下一代平台级应用的机会。
打开AI开放世界
在袁行远的设想里,打开彩云小梦,就是打开了一个原初的世界。在小梦里,你可以阅读基督山伯爵,也可以扮演基督山伯爵。
“技术是骨头,内容生产是肌肉,AIGC是血液”,高质量内容生产的关键在于强肌壮骨,而AIGC作为血液,不断地为高质量内容生产造血、输血,在内容生产数字化升级中起重要作用。
虽然大多数公司都是用的GPT-3开放模型,但彩云还是自主研发了自然语言处理模型。在袁行远看来,GPT-3虽然规模庞大,但对中国文化并不了解,中文写作较为晦涩,在中文场景的落地中存在不少问题。彩云科技凭借多年积累的技术创新能力,基于大规模语言模型,在技术方面实现了快速突破,彩云小梦于2022年底上线了全新文字模型小梦V2。
小梦V2续写朱自清《春》:
在中国,网文是一个有5亿网络作家用户、上亿日活的大行业。目前,彩云小梦的用户共创作了480多万个不同的世界,背后有1300多万个人物和词条,可以与用户进行对话。通过创作激励,氛围引导,缤纷多彩的世界广场成功运行,彩云小梦走出了社区化坚实的一步。
这意味着彩云小梦有足够的早期用户来积累数据、训练模型。袁行远表示,彩云小梦将通过技术领先的时间窗口,吸引足够多的用户,建立丰富的内容生态,这将成为难以复制的壁垒。
彩云小梦的世界广场:
袁行远认为,掌握了文字AIGC这把钥匙,再开启其他形态的锁会越来越顺利。
未来,彩云计划推出世界模拟器,用户将能够在彩云的游戏平台上,自由构建世界,并与灵动的3D虚拟人物进行对话和深度交互,获得沉浸式体验。这个AI驱动的开放世界是袁行远期待奔赴的星辰大海,计划3-5年实现。
带有技术极客气质的袁行远谈到,物理学上定义第一宇宙速度为7.9km/s,是物体能够脱离地球引力的第一道速度屏障,脱离第一宇宙速度的物体可以不再只做单纯的绕地圆周运动,而是在更广阔的宇宙空间里飞行,探索更深邃的浩瀚银河。
AIGC正在寻找突破第一宇宙速度的技术驱动力和点位,未来有希望去解决更大范围的问题,带来生产力的进一步提升。踏着AI突破应用领域“第一宇宙速度”的机会,在开放世界游戏、对话、场景搭建领域,在AI领域长久深耕的彩云科技将有机会成为这个方向上的重要玩家。