为什么会对文心一言的发布会失望?
我说的倒不是自己对发布会失望,因为我没有什么预期,就是放空大脑地看,看完也没有什么感觉。打开雪球,百度股价已经跌惨了,还在转折,刚写到这,又跌下去了。
微信群、朋友圈乃至微博和即刻,也是负面的声音居多,各种梗图又都出来了。这是市场的整体情绪:很失望。
为什么失望呢?我观察了一下,大概有几方面。
第一,没有新东西。
这次文心一言(文心大模型基础上的对话产品是文心一言,图片产品是文心一格)的对话方式甚至包括 UI 界面,就是完全复制的 ChatGPT,这个当然不好诟病什么,毕竟大家都差不多。
但这里面演示的内容,都是旧的,别人已经做过的。
比如多模态,输入图片或者输出声音,本是挺亮眼的,可惜昨天 GPT-4 发布的内容里,也有了多模态。本来微软那篇多模态的论文在小范围已经火了,GPT-4 的发布会上的演示让人有更直接的冲击(可以参考这篇:GPT-4 有哪些进步,以及问了它 6 个关心的话题)。
发布会中也有文字转语音的部分,这当然也是在内容平台上早就玩剩下的。短视频里那种「注意眼前这个男人,他没有手」的语音生成,大都是 AI 制作的了。
对于一键转视频的,确实让人眼前一亮。不过这也是成熟技术,有的平台支持这样的功能(如 aigc.yizhentv.com)。
而作为搜索引擎公司,没有 New Bing 这样的功能介绍,更没有新的与现有业务结合的新产品出现,就难免让人的高预期落空了。
相当于百度总结了一句:他们有的,我们也都有。他们没有的,我们也没有。
第二,没有显著的亮点。
亮点指的是,哪怕是同样的功能,或者同样的服务,是不是能有格外出色的表现?目前看,也没有。
假如说 ChatGPT 只能使用英文,或者说中文特别拉胯,那也就罢了。重要的是,GPT-4 的多语言加强之后,语言之间几乎没有壁垒了。这样百度的中文优势就不存在了,且他们自己都讲过,模型在英文领域还比较缺乏数据。
所以中文没有优势,在回答的水平上就很难比较了。再者,在 demo 里呈现的效果,由于是录制好的,是否能真实给出好的结果,这也是存疑的。这也就来到了第三点。
第三,没有诚意。
发布会的演示最重点的就是实际使用的演示,从乔布斯的年代开始都是如此。老罗的李姐万岁言犹在耳。百度这次选择了全录制,很难不让人联想到是担心出现老罗一样的事故,也就代表着有很强烈的不自信;也可能是被 Google 演示的小错误事故吓怕了。
对话里的答案是不是专挑出好的那些,这是不好证实的;但一键生成视频只要几秒钟,这绝对是让人信任度大打折扣的。哪怕你把实际生成的时间放在屏幕上,让人看到也可以。明显是忽悠不懂行的观众,以为有了黑科技,这就有点 PPT 画饼的意思了。
整体的时间很短,而且在讲产品不久后,立马就开始聊商业合作了。就像手机发布会刚开一会儿,就说在哪能买到了,而手机的实机还没给大家伙看过。
第四,姿态有些急。
在发布会之前,就听身边很多朋友讲,百度的市场来联系,期待能接入。当然实际上是在队列里,相当于有了很多潜在合作对象撑场子。
这次发布会,也很明显是背着很重的销售 KPI 的(虽然不知道是谁,以及为什么要背这么重),在聊后面的部分,都是 toB 销售的话术,讲技术的抽象概念和商业合作的价值。
听不出一丁点对产品的自豪感,和对真实需求的兴奋表述,这跟 OpenAI 的总裁 Greg Brockman 在 GPT-4 发布会上很兴奋地说它可以画网页、可以帮自己解决某些生活上的问题,形成了鲜明的对比。(再次推荐这个发布会:www.bilibili.com/video/BV1gv4y177rX)
总的来说,还是没有真正的让大家用上的产品(目前文心一言的 toC 都还没有开放),难免会让人往负面去猜测。就像 ChatGPT 也不是在捧得很高,自称是全球最吊的对话机器人之后才给大家用的,而是开放后,被惊讶到的用户人传人推到如今的热度的。
文心一言还没有开放,不过基于文心大模型的文心一格,这个画图的工具是可以用的。正好 Midjourney 在今晨提供了全新的 v5 版本,这个对比就更加强烈了。
需要说在前面的是,文心一格是在去年 8 月就发布的绘图工具,很可能中间没有任何迭代,用的还是旧的模型。不过它也自称是当时很先进的模型了:
「当前该领域世界最好效果。在语义可控性、图像清晰度、中国文化理解等方面展现出了显著优势。」
这是我用这个模型画的一批图:
我的绘画群的群友分享了移动端的这张图,不太确定是不是最新的文心大模型:
同样的提示词,在最新的 Web 端是这样的,效果略好一些:
那我们看 Midjourney v5 的效果:
说到 Midjourney V5,他们的新版本已经可以消除所谓的「AI 感」了,写实方面有很大的提升。这里有几张示意 ,都是我自己刚画的:
话题扯得有点儿远了。还是想表达,作为用户,我们期待真正落地的、效果好的产品出来。
我不是旗帜鲜明要反对百度,更不是觉得国内做不出大模型。我作为用户和潜在的创业者视角,当然很期待国内有自己的大模型。从更善意的视角出发,也许百度这次是发布会准备失当,也许产品本身是质量过硬的,都说不好。我们也期待最新的产品效果的体现,也期待国内有更好的大模型出现。
祝各位周五愉快。
题图由 Midjourney v5 绘制。