Z Potentials | 宋亚宸,97年华人少年,想做3D时代的“字节跳动”(VAST-下期)
继VAST-上期,Z Potentials(以下简称“ZP”)和VAST创始人宋亚宸Simon对创业和产品做了更深度的讨论和交流。宋亚宸出生于1997年,从小展现出独立和多面性格,将玩心与学识完美融合,他认为自己不是典型的年轻创业者,但我们依然在其身上看到了年轻创业者的特质——敢想敢干,不畏权威的气质。
宋亚宸:大家好,我是VAST的创始人和CEO宋亚宸。
我从小在杭州长大,所以受了不少中国传统文化的熏陶,小学一二年级的时候从父亲的书橱里翻到《道德经》、《坛经》之类的经典,激发了我这方面的兴趣,甚至在初中去径山寺坐过一段时间的禅,这些经历也点燃了我对宗教哲学的热情。
高中时我申请了三十多所大学,基本都跟神学相关,最后我去了约翰霍普金斯大学学习中东地区的政治,因为这个专业有机会接触并钻研世界各地的宗教和人文知识。为了更好地学习和理解这个领域,我学习了希伯来语和阿拉伯语,大二的时候去以色列待了一年,还有很多格鲁吉亚、百慕大、摩洛哥、古巴这些比较小众的地方,见识到了各式各样特点的文化,学会了如何去拥抱世界的复杂性(embrace complexity)。
再有就是游戏也对我有巨大的影响,好像我这个年纪的男生很难有不热爱游戏的(笑)。我对游戏的热情不低于对宗教哲学的热情,在霍普金斯上学的时候一度玩游戏玩到导师把我父母请到美国来解决这个问题,我在宿舍的席梦思中间有个巨大的凹陷,就是长期在床上看书打游戏压出来的。
所以我的经历可能在很多人看起来会有些矛盾,有点类似一个跑过很多地方的宗教哲学游戏宅?
宋亚宸:还没毕业我就加入了商汤,当时有个业务方向是3D动画。我花了很多时间跟国内3D动画行业的各种人交流,因为我们做AIGC,所以对3D内容生产效率这块比较关注。
我发现国内这个领域最优秀的内容人才,比如清华、央美这种顶尖学校毕业的专业人士,也得花相当多的时间在非常繁重的“手工活儿”上,极大限制了内容创造力。
其实行业很早就认识到了这个问题,但当时只能依赖更好的软件工具来优化效率。然而我发现内容创作者跟软件工程师之间的鸿沟是非常大的,所以我们用AIGC工具服务了国内很多头部的动画公司。与此同时,我们自己用AIGC工具尝试做了一些动画内容,后来在短视频平台上做出了拥有上百万粉丝的账号。
在这个过程中我也得到一些启发:
第一是,人只会消费10分的内容,而不会消费9分的内容。所以完全用AI生成大量内容占据平台是没有任何意义的——因为它不是好内容。真正好内容的充分不必要条件是被人设计过:它有审美、剧情,可控。如果是这样,那它具体的执行和实现是可以用 AI 来完成的。第二是,动画行业是个劳动力密集的行业。当时的技术水平能让加班到十点的动画从业者变成加班到九点,但不能激发更多创意。不管是从内容产出的质量和效率上来都完全没达到PMF的阶段。
因此,这部分我认为真正要得到根本性解决,核心还是解放3D内容生产力,需要的是革命性的3D内容打字机——也就是3D大模型,这是最根本的第一性原理的诉求,创作者应该更多时间花在动脑这件事上,动手的事情就交给3D大模型。
宋亚宸:之前我没有想过要自己创业,在工作的过程里我接触到了很多对3D内容以及AIGC有丰富经验跟感触的朋友,然后在交流的过程里发现我们对3D内容的想象和愿景出奇地一致,而我又是个行动力很强的人,当我们看见了同一个未来之后,好像创业就变成了一件水到渠成的事情,然后VAST就出发了。
宋亚宸:这里面涉及到一个比较关键的认知:3D是一个多模态场景的内容基石,所以必须在应用场景里才能充分发挥价值。这个跟图文以及视频内容非常不一样,图文视频内容是信息载体,当被看到的那一刻就完成了体验闭环,但是3D内容需要在具体应用场景里才能出现更好的内容和体验价值。
VAST的愿景是解放3D内容生产力,这个生产力除了我们通过3D大模型解决基础建设问题外,也需要更多的开发者一道来发挥创造力。而且我们团队也了解到行业以及很多独立开发者渴求这方面的应用很久了,3D这个领域门槛很高,所以“饱和式创新”很重要,这就很需要开源模型来支持,我们责无旁贷地要推动大家一起朝着这方向努力。
宋亚宸:现在产品可以分为两大块:
第一大块,就是为了迭代我们的技术提供的ToBToC业务,我们现在已经有大概几十家战略合作伙伴,覆盖了几乎整个3D行业的各种管线,从工业、3D打印到游戏和动画公司等等都有。我们通过服务这些合作伙伴来获得更加具体且落地的场景反馈来迭代优化我们的技术能力,甚至会帮助我们优化技术策略,这个也是我们很不一样的地方,我们从第一天就坚持技术要应用到场景,要跟市场形成良性的迭代飞轮。
第二大块,是 Tripo的品牌,12月21号上线的Tripo 1.0,它可以用文字和图片来生成带完整贴图以及mesh的高精3D模型,这个目前分为两个生成阶段,一阶段大概5到10秒就能生成,主要让用户对生成结果进行粗筛,然后进入一个二阶段的高精度生成,第二步目前我们的1.0版本生成速度是5分钟。它的核心就是展现我们的技术实力,并且让更多人上手用起来,同时回收使用数据帮助我们的大模型优化算法策略。同时我们这个大模型能力后续也会做针对行业的通用版本提供给一些战略合作伙伴的。
而且一些核心第三方开发者已经开始使用我们的内测版本设计小游戏,月底我们的开发者社区会有一款叫做Tripo GO的AIGC小游戏发布。因为我们的内测用户里有资深的宝可梦玩家,拿到我们的内测大模型后,就想用我们的模型能力圆一个自己的游戏梦,就像我们的开源策略一样,我们会鼓励跟推动更多这样的内容尝试,期待能出现一些3D大模型时代的全新内容品类。
宋亚宸:我们相信 3D 内容的爆发有三个关键变量:1、发行门槛的降低。2、生产门槛的降低 3、体验门槛的降低。内容生产门槛的降低就是通过3D大模型来实现,也是限制整个行业内容爆发最关键的一个点。发行门槛的降低是通过出现一个能够去为3D内容提供更原生体验的hosting来实现,这个hosting不是XR这种硬件,而是更贴近用户体验场景的软件平台。体验门槛的降低,是通过运营来推动,有些类似抖音快手们诞生之初,硬件及软件平台都已经齐备的情况下,大家需要一个更具体的内容范式来理解跟体验短视频,这块我们会在开发者生态这块重点发力。
这三件事情看上去很复杂,其实它就是一件事情,就是说我们相信最终会出现一个3D内容平台,会承载绝大部分 3D 内容,它有极低的创作门槛,内容更加短、平、快并且爽,甚至在一定程度上会打破传统管线里DCC软件+引擎的分工,这是我们看到的未来。
宋亚宸:我们认为内容范式需要在变跟不变两个要素上寻找内容场景。
变的部分就是生产工具带来的效率跟方法革命,这必然会解放出很多之前因为各种效率资源限制做不到的内容空间。我举个例子,一个大型里有上百个BOSS,上万件物品,这个资产的生产时间以年计,而基础资产的生产现在可能以月计甚至周,这还只是纯资源生产的变化,由此产生的场景设计创意解放就更让人期待了。
而不变的部分是内容体验的部分,一旦生产效率的瓶颈被解决,更平更快更爽这条被走通过无数次的内容路线也会在3D内容领域再次涌现,根据过去内容行业的演进,每次这种涌现都意味着行业的爆发。
宋亚宸:我们团队成员本身都有很丰富的项目经验,结合我们针对行业的大量交流跟调研,目前我们有一个用户的认知模型,我们把整个3D行业的用户分成了四个层级:
第一层是专业管线的用户,也是传统DCC软件跟部分工业引擎的用户,这些人是整个行业中最精英的生产者,但这个人群规模本身不大,国内的话在十万人这个量级。
第二层是非专业的3D创作者,他们会使用blender等3D专业软件,但不是专门从事这类工作。他可能就是做个毕业设计或者做画这类纯爱好者。这类用户对生产力工具非常敏感也有很迫切的需求,目前他们生产的这种内容质量总体是不如第一层的,绝大部分也没有到可以被消费的地步,但他们也是实打实的生产者,这个人群最近几年的增长非常快,国内早已经突破百万人规模,全球也有大几千万这个量级。
第三层是游戏用户,像我一样:对3D内容及体验敏感、觉得这个事情是好玩的事情、但没有3D内容制作的能力、也不知道如何系统学习。比如,你让我去生成一个宝可梦,那我觉得很有意思,但是请你不要让我去K模型,我是很难短时间学会的,这些人也就是我们常说的主流人群。
第四层就是尝鲜用户,就是想玩玩看AI能生成什么,什么都愿意去试一试看一看,但没有比较明确的内容目的。
宋亚宸:第一层用户我们想通过2B2C的方式服务,但是重心会聚焦在二、三层用户上。第三层他是在未来3D 大模型生态里面的主力消费者,第二层就是会使用Blender的那些人,是3D大模型生态里的生产者、有些类似UP主、主播这些角色,他们需要内容范式来引领他们生产。
宋亚宸:3D是生成式AI领域技术难度最大的赛道之一,目前无论是巨头还是我们这样的创业公司身位都差不多都在比较早期的技术落地阶段。
我们也能明显看到,全球的智力资源和算力资源都在往这个方向涌入,相关的论文工作得到飞速提升。
在目前这个阶段,我们的人才储备跟技术能力都是全球领先的,相信大家会持续看到我们的成果。
从最终愿景来看,我们会和其他内容平台竞争,本质最后还是竞争用户的时间。
宋亚宸:首先关于竞争力我的感觉是不存在短期和长期的分别,竞争力本身一旦出现,就会积累成长期竞争力,核心在于形成竞争力这件事情,竞争力这件事比长期要难得多,起码对于创业公司来说是这样。而在竞争力这件事上我觉得有几个事情是非常重要的:
第一,技术最重要的。因为它真正的降低了用户创造的门槛,就是门口二大爷,它也能够去创造3D内容,这是核心。就说没有手机摄像头,它是没有抖音的。那我们的3D生成可以理解为就是手机摄像头。这个事情是很重要的,这是打字法,这是活字印刷,任何我们能够体验到的内容追溯下去基本都是一个关键技术突破催生出来的。
第二就是要找到合适的内容范式。这个内容范式你要对用户需求有敏感度,只有内容范式被验证了,才会诞生一个新的内容品类,一个内容品类被点燃,后续的生产力会更高效的涌入这个赛道,更多的内容品类出现的速度会呈现数量级的变化,有点寒武纪生物大爆发的感觉。
当然还有很多其他的,比如工程的能力等等,这些能力很重要必不可少但是很难形成竞争力,对真实用户的理解,和对于这个事情的信仰,我觉得也是非常关键,在创新的领域“愿景即能力”。
宋亚宸:我们公司的愿景叫做:为世界进文明,为人类造幸福。这句话是李大钊说的。
宋亚宸:内容平台的核心就是为用户提供极致的体验。生而为人,一天24小时,就是选择不同的体验的过程,睡觉、运动、看书、看电影等等。
我希望未来3D内容无限扩大,然后每个人都可以成为超级创作者,人就像神一样创造新的世界,有自己新的规则,有全新的社会评价体系,有新的世界观,形成新的社会关系,最终创造出来一个全新的世界。而且你的目标、你的信仰、你的成就感都会完全发生变化。
在这个情况下,很多现在的社会问题就迎刃而解了,每个人的生活就是极致的心流体验,人们不断地遇到一些小困难,然后不断地通过成长去解决自己的问题,形成了一个王道动漫主人公的心流体验过程。
宋亚宸:极乐迪斯科。
宋亚宸:我觉得我们公司的团队分为两拨人:第一拨人就是曾经从 0 到1,有创业成功经验的老炮,第二拨人是非常有生命力的,非常年轻的一群小天才。
年轻小天才们初生牛犊不怕虎,因为热爱所以事事往死里干,很容易快速出好的成果,说不定能大力出奇迹。老炮做事更稳,有韧性且见过世面,他不会慌,失败了就失败了,那下一步该怎么做,不会觉得是很大的事。同时老炮们之前找到过绿洲,所以他知道什么方向可以大概率再次找到绿洲。我觉得不是说团队只能要么全部都是年轻人,要么全部都是老炮,可能两者相结合才可以组成成熟且有战斗力的团队。老炮帮助年轻人找到方向和节奏,年轻人可以大力出奇迹,两者互相成就。
以上访谈内容有删减和整理,如果想了解VAST的更多信息,欢迎前往tripo3d.ai免费试用和后台留言。
后续我们会进行更多AI/出海/机器人等领域的创业者访谈,如果你也心中有梦、眼中有光,欢迎加入Z Potentials社群,联系我们任何一位主理人。
-------------------------------
扫码获取社群二维码,加入社群
关于Z Potentials