上来就对标SD&MJ,图文视频3D!这家公司是何方神圣?
一个网站,能实现文生图、文生视频、文生3D、图片编辑、视频编辑。。。你信么?
昨晚看到一个AI产品经理的JD列表,一开始就映入眼帘的有一个北京,一线AIGC/LLM公司,在招产品总监,于是好奇宝宝就去了解了一下,顿时觉得这家公司野心有点大的!
这篇文章中,我会以Pixeling为例,剖析一个AI创业公司在高速成长中面临的种种困境与挑战。它的失败或成功,都将成为无数AI创业者的启示。
让我们一起用时间来见证这个创业故事!
Take Away:
1. 创业公司应深耕单一领域,而非过早扩张业务
2. 社区运营和产品定位对公司成败至关重要
3. 资源规划要聚焦,不能分散开来
4. 商业模式应考量场景契合度
5. 渐进式路线更容易突破PMF
01 无所不能的AIGC产品?
打开看了一眼界面,我都惊呆了,这几乎是上个世纪的UI,不信你再看看这个注册界面:
不说我以为是打开了Axure原型图界面,这。。。在这个界面我就判断说,这家公司的产品/UI肯定不强,或者是最近刚开始招,还没来得及优化UI。
接着看具体的功能:
左侧功能列表惊呆:文生图、文生视频、视频编辑、图生3D!无所不能啊!再往下,还有几个目前没上线的功能,也很炸裂:图片编辑、图生视频、视频制作
也就是说,Pixeling=生成式AI(图、视频、3D)
OK,那我们继续来看一下,内容生成的质量(以下不做严格测试):
1.文生图:
还挺好的也,画面构图能够表达出一些韵味,细节也还是OK的。
2.文生视频:
使用官方的Prompt,生成的老人皮肤细节还是很丰富的,然后我换了一组提示词,重新生成了一段:
看得出来整体还凑合,但是细节肯定是有很多问题的,比如说手部出错了:
3.视频编辑
让老人变得更年轻,确实,老人变得更加年轻了一点,这个有点神奇。
然后换了刚才飞在空中的女生,发现还是手部细节出问题,手一会变成鸟,一会又变成了手:
4.图生3D
这块很明显离可用还有很长的距离:
我上传了几张图,基本是背面的模型是无法生成的比较好的,全是非常诡异的形状。
搜了一下新闻,发现它在9月20日,发布了「智象视觉多模态生成式大模型」:
瞧这意思是说,图像、视频、3D这个赛道,我全吃了!
再加上还没上线的多种功能,看起来这个团队想做的东西还挺多的,这引起了我的好奇,我还第一次见什么产品说要通吃的,疑问是:它怎么敢的?
02 看看团队和融资
根据其官方公众号发布的文章,创始人梅涛,02年底进入微软,12年后才离开微软亚洲研究院,然后在京东呆了5年,Title还是比较扎眼的:
曾任京东集团副总裁,京东探索研究院副院长。
加拿大工程院外籍院士
多媒体分析和计算机视觉一直是梅涛的研究重点。他在该领域发表的论文引用率超过三万余次,曾先后获得五十多项美国和国际专利,多次荣获国际最佳论文奖。梅涛在京东期间,领导了多项计算机视觉技术的研发,如拍照买东西、多模式内容审查生成、多模式数字化人、视觉多算法平台、智能机械臂等,为京东在人工智能方面有了重要的突破。
非常符合这一波AIGC创业浪潮的明星创始人背景。
为什么要上来直接挑战多模态呢?
大模型已经从单一模态迅速进入到多模态,也就是说从原来的单一语言模态进化到文本、图片、视频、3D的多种模态的生成和生产。但是在这个领域里仍然没有形成一个标准化的工业框架。大家也许听说过在图片生产领域用得比较多的是Diffusion Model(扩散模型),3D用得比较多的是NeRF(一种基于神经网络的3D 重建技术),但我们还没有一个统一的框架能把所有的多模态内容形成工业化标准。因为这其中有很多技术上的不确定性,正因如此,才给到我们初创企业更多的机会。
目标说出来更是吓人:HiDream.ai的目标,是要在基础模型上超越Stable Diffusion最新版本,在产品上则要赶超Midjourney。
在技术层面,他们目前的进度是这样的:
视觉AIGC的天花板其实也蛮高的,今天相当于GPT-2的时代,Stable Diffusion的模型参数是在30-50亿。HiDream.ai虽然成立只有3个月的时间,但是我们已经做到60亿的数据量级,我们希望探索一个基于视觉的多模态底层大模型。
香港中文大学有一个数据集评测标准,有3200个prompt在四个风格中进行评测,可以看到我们HiDream.ai跟目前最好的Midjourney v5的差距已经很小。
查了下,今年3月份开始成立的,那半年时间搞成这样,还是挺牛逼的,毕竟算力和融资也得花时间去搞定,算法和模型也得花时间冲。
梅涛:短期内会保持在 25 - 30 个核心人员左右。从现在开始到明年年底,初步估计核心员工也不会超过 50 个人。我们不是 ToB 的公司,做 ToC 不需要那么多人。
现在主要缺的是产品经理、工程师、运营人员等。尤其是产品经理,一定得是一个很多元化的选手,产品方向不对会把大部队带偏。
其实看完产品后,我的第一判断也是这个公司还没有产品高手:)在AI时代,好的产品经理特别重要,也是稀缺的,有关这一点,最近我和头部一些大模型公司的产品负责人也有交流,后面有时间也会在单独聊聊这一话题。
看下来,这家公司是这么想的:
“我们想做的比较大,要做就做难的,一旦成功,就是行业内首款集多种创作功能于一体的模型。”
03 野心背后是挑战
卷LLM,确实不如卷SD和MJ。
前者竞争太多,全是高手,倒是玩家少了一个量级。
结合梅涛在上面的积累,确实也更加符合创业的方向。
那另外一方面,要实现商业化,也还是有超级多的挑战的。
首先就是构建社区:
我们都知道Midjourney很牛,因为除了效果很不错,很重要一点就是它吸了全世界的流量,具体可以看《AI系列06:Midjourney和Discord互相成就》里面的介绍。
最新的数据,已经有1546万人加入空间,去年11月这一数据是381万。
Discord和Midjourney是互相成就的,Midjourney选择在Discord上面直接搭建社区,而国内还没有成型的Discord,对于Pixeling搭建社区就会带来很大的挑战。
为什么必须有社区呢?很简单,个体的想象力是有限的,不信你自己去玩文生图,大部分人很快脑子就被抽干了,没有多少人能够一直天马行空。
其次是,融入工作流:
《AI系列22:ChatGPT日活狂掉的背后》里面我也写到了,AI工具必须要结合到工作流,才能创造长期价值。
目前看Pixeling的产品形态,还是通用toC端的产品,这肯定是有问题的,必须要能够很好的做出toP(专业人士)的产品才OK。
前段时间我走访了几十家电商,他们的设计师非常痛苦,因为生成图片的流程非常繁琐,痛点非常多
梅涛在分享中也提到了电商方向,这个是对的,在我刷Product Hunt的过程中,也发现了非常多的产品是针对E-commerce的,即电商。
再加上游戏、营销、家装设计等行业,这样的产品才能持续获得用户的付费。
嵌入工作流,意味着产品本身能够创造价值了,用户/客户才愿意从节省/多赚的钱里掏出一部分来支付。
之前有Top的AIGC公司和我咨询时,我也提了这一思路,解决的好了,就意味着找到了好的场景。
抽象出来,就可以寻找到更多好的场景。但它的第一步是,找到有商业化价值的好场景。
接着是,多产品线并行的资源挑战:
All in One的理念,作为长期来说是好的,在短期来看,就会面临资源非常短缺的情况,不光是产研,更在于找到目标市场。
啥都能做,也可能是啥都没做好。
目前来看,文/图生3D领域,整体的流量不大,根据AI产品榜,3D领域的流量很低,目前还进不了AI产品流量Top100。
从减法角度来说,暂时停止相关的投入是一种可选项。
毕竟任何公司在任何时点,资源总是稀缺的。
04 一些建议
这里提出几个当下能想到的建议:
一. 明确产品定位,选择垂直领域深耕
底层大模型可以持续研发,在应用层就需要做一些抉择了,因为现在看起来Pixeling的定位非常宽泛,想要成为全能型的生成式内容工具,这可不是个好的路子。
建议选择一个垂直领域,例如电商设计、游戏概念设计等,进行明确定位和深度定制,先聚焦一个领域做优做强。
从首页也完全看不出任何toP的内容思路。
二. 改进用户体验,优化产品工作流
我觉得既然想明白了产品要结合进P端的工作流,当务之急就是找到一群人开始进行针对性的冷启动(包括随后社区的构建),以及模型调优,重构整个产品设计思路。
现在的网页版本产品,还是去年底AIGC文生图领域火爆时的传统结构,完全没有针对工作流做定制。
既然说了已经调研了设计师的痛点,那可以优化一下交互设计。
三. 强化社区建设,吸引用户互动
可以选择一个当前流行的社交平台来做社区运营,比如QQ频道。
toB产品私密是没问题的,但开放出来的产品就需要用社区来承载了。
社区除了激发用户的创意之外,逐渐塑造产品的社区文化及增强用户粘性,也是非常重要的一环。当前AI时代,产研或许不是壁垒,我们要有意识的开始寻找可能性。
四. 关注商业化,寻找变现模式
用户付费订阅、私有化部署、API等模式,都是可能的。
重点是要将产品嵌入商业场景,创造直接价值,而不仅是消费类工具。
五. 采用渐进式路线,找到产品适配点
不用一次性推出太多功能,你放出那么多功能,吓不着用户,别吓着自己了。
可以采用渐进式路线,先做好一个模块,再迭代加功能。最重要的,不在于多,在于能找到与用户和场景对接的产品与市场的适配点。
六. 加强资源规划,聚焦最重要的产品线
资源有限情况下,建议规划优先级,集中资源做最重要的一两件事,其他功能可以暂缓推进。
光从表面看到的信息来判断,Pixeling并没有很好的Roadmap,一窝蜂大干快上,不是一个好的选择,通用的渣渣产品,一文不值。
建议,先打透一个领域后,再找临近领域滚雪球。为什么要打透呢?只有创造足够的价值,才能获得稳定的收益,才能支撑起较高的未来想象力。
七. AIGC产品需要传播力
然后,对于toC/P端的产品,如何做好传播也特别重要,如何与行业从业者一起共建一个产品内容生态,也会非常有意思。
这里面产生的涟漪效应在于,AIGC是创造力和生产力的化身,如何用作品说话,如何让人做嘴替,对于构建内容增长/用户壁垒,也会有很大的差异化竞争优势。
总结
目前没有和Pixeling的产品/公司有任何联系,仅从个人感兴趣的角度做了一些初步的观察。
Pixeling在短短几个月的时间里,已经实现了从0到1的产品打造。它也许还需经历种种折磨,才能真正成为一个可持续发展的公司。然而,梦想在每个AI创业者的心中燃烧,火光不容小觑。
今天我们见证了一个创业故事的开端。它的未来在时间轴上蔓延,等待每一个有志者续写。你,愿意成为这个传奇的一部分吗?如果你也怀揣一个AI梦,就请开始行动,一步一个脚印地走下去;坚持你的使命,继续点亮心中的那盏灯。
最近我也会看一些国内外好的产品,欢迎大家自荐推荐,国庆后也会去和一些创业的朋友做深度交流:)
参考
人物专访|HiDream.ai 梅涛:做一家对标 MJ 和 SD 的公司,比扎堆做 LLM 机会更大 https://mp.weixin.qq.com/s/51qWpg08FeP7w9ciBPe0qQ
专访HiDream.ai梅涛:视觉模型还未智能涌现,现在还有机会打造一家超越Midjourney的公司|年度AI对话 https://baijiahao.baidu.com/s?id=1769639438608190165&wfr=spider&for=pc
AI创投周报|HiDream.ai发布“智象视觉多模态生成式大模型” https://new.qq.com/rain/a/20230923A048OZ00
微软全球合伙人姜大昕被曝大模型创业 https://new.qq.com/rain/a/20230723A06QJ800/
梅涛离职京东后, 创立了这家生成式AI公司 https://www.163.com/dy/article/I6D6V1V505534KZB.html
HiDream.ai 正式启程,以梦为马,砥砺前行|阿尔法family http://news.sohu.com/a/712199950_490443