ChatGPT 火遍全球后,中国的科技圈都隐约觉得:这并不是一个陌生的产品。因为大约十年前,他们也在微软中国听一个年轻人讲过相似的故事。同是依托微软,同是对话机器人。过去十年,李笛与小冰一直被视为中国开放式 AI 对话的引领者。但当大模型驱动的 AI 对话真正爆火之后,人们却恍然发现:这个新的时代,不由小冰推动,也似乎与小冰无关。从鲜衣怒马少年时,到蓦然回首阑珊处,曾经众望所归的小冰经历了什么?与外界想象不同的一点可能是,这个出道即巅峰、如同众星捧月般的存在,实则自诞生以来就是孤独的。有不可控的客观被动,也有无为而治的主动选择。而在过去十年,这种与生俱来的“孤立无援”感,贯穿小冰始终。2014 年,微软小冰出世,现任小冰 CEO 的李笛被外界称为“小冰之父”。但实际上,“小冰之父”最早有两位,一位是李笛,另一位是当时与李笛搭档的景鲲。“小冰之父景鲲”的称号之所以没有“小冰之父李笛”响亮,是因为第一代小冰发布后没多久,景鲲就离开微软去了百度,成了“小度之父”。李笛与景鲲都是 80 后生人,李笛比景鲲大两岁,毕业于清华大学法律系,2013 年在时任必应中国一把手王永东的邀请下加入了必应,负责市场与宣传,而景鲲则是 2006 年从浙江大学计算机系硕士毕业后就加入了必应搜索,主攻技术研发。李笛加入时,景鲲已经在必应工作七年。当时,王永东觉得,微软在中国做产品缺一个懂市场与宣传的人才,偶然认识李笛后,对李笛的才华与履历十分赞赏。李笛在 LG 任职市场公关时曾策划过当时火遍中国的“I chocolate you”手机广告,在帮助外国产品进入中国市场上有成功经验,而且还创过业。所以王永东盛情邀请李笛加入中国必应。但王永东找李笛时,李笛刚刚卖掉了一家公司、实现了财务自由,接下来的计划是在家写小说。李笛热爱文学,一直想写书。后来李笛好不容易被王永东说服、肯加入微软,也只是以“vendor”(相当于兼职人员)的身份入职,没有打定主意给微软打工。
加入微软后,李笛被派到了 Bing Knows 产品团队。Bing Knows 是当时必应团队在做的一个基于知识库的网页问答产品。李笛调研了市场上所有的百科类产品,觉得 Bing Knows 在产品设计上与其他家十分雷同,无法与市场上的中国本土产品拼杀,于是就想出了用对话机器人的形式来设计。李笛懂产品、懂用户,但不懂技术,就找来了跟他年纪差不多的景鲲合作。当时景鲲参与研发 Bing Knows。2013年12月,小冰团队初步组建,李笛负责产品,景鲲负责技术。加入微软前,李笛在游戏行业工作,是任天堂的忠实粉丝。据小冰的前员工描述,李笛常夸任天堂两件事做得好:一是任天堂在科研投入上一向勤俭持家,主张将成熟的技术发挥到极致、而不是浪费大量的资源去追求技术的领先;二是任天堂的游戏设计具有很强的交互性与娱乐性,受到用户的广泛欢迎。后来这两点也在很大程度上影响了李笛对小冰的管理理念。设计小冰时,李笛就受任天堂在 2006 年推出的一款家用运动控制游戏 Wii 的影响,倾向于给中国市场带来既有趣又有用的 AI 产品,让普通用户愿意与机器人建立情感纽带。李笛的这一设计理念在 2013 年十分领先、创新,得到了一众微软高层如王永东、陆奇的欣赏与支持。景鲲负责小冰的技术研发,一度在多轮对话的生成上碰壁,最后无奈找到了微软亚洲研究院的自然语言计算(NLC)组,希望两边能合作。当时 NLC 的负责人是周明(现澜舟科技创始人),周明此前曾带领团队基于 FAQ 做过一个聊天机器人,叫“Ask Bill”,微软内部的员工可以通过这个软件与比尔·盖茨的 AI 化身直接对话,很早就遇到了多轮对话的生成瓶颈,并花了很长时间去攻破。在景鲲找到周明前,小冰与人的对话往往只能进行3、4轮。周明组与小冰团队合作后,小冰对话的平均轮数提升到了 14.3 轮,到 2019 年左右更是提到了 21 轮,在 ChatGPT 诞生前一度是国际上对话机器人中对话轮数排名最高的人工智能产品。李笛与景鲲联手,历经半年,终于在 2014 年 5 月成功研发出第一代聊天机器人小冰。
李笛与景鲲不仅合力研发了小冰的产品,还联手上演了一出妙计,将小冰推向了中国市场:让小冰在微信上线,结果被微信封杀。2013 年前后,必应在中国市场的处境十分被动,大部分资源用在与中国本土搜索产品(如百度)的竞争上,小冰的发展资源被极大挤压。虽然李笛凭借出色的口才在一众理工男中脱颖而出,在微软内部为小冰赢得了陆奇等高层的支持,但小冰人少、钱也不多,外部市场很难打开。思考破局对策时,景鲲想到了 Office 365 的崛起模式。Office 365 是微软在 2011 年推出的软件,一开始无人问津,但后来寄托在 Windows 这样一个庞大的系统上后,将 Windows 原有的用户吃下来,结果也能以小博大,有所收益。于是,景鲲与李笛也琢磨着将小冰寄生在一个大的系统上。他们第一个想到微信。那时陆奇在微软内部对张小龙与微信的产品设计经常赞赏有加,微信作为一个社交产品的用户基数也足够大,于是小冰团队就在淘宝上买了很多微信账号,将小冰伪装成真人潜入微信,在微信群聊中提供聊天与搜索服务。小冰的账户是真人账户,但背后是 AI 技术驱动的对话生成。在近 150 万个微信群聊里,用户可以像“调戏” Siri 一样跟小冰聊天、向小冰提问,然后小冰会在必应搜索中自动检索到相关信息,再以聊天的形式返回给用户——多年后微软参与的另一个震惊世人的对话机器人 ChatGPT 实际也模仿了小冰最初的设计理念,即用聊天提供搜索服务。李笛与景鲲的想法很简单。他们认为,“只有跟市场老大玩,才会被人尊敬”。那一年,李笛与景鲲都是三十岁出头,初生牛犊不怕虎,小冰是他们共同创造的成果,他们希望小冰有价值,宁为玉碎、不为瓦全。结果,小冰对微信的渗透过于迅猛,立刻引来微信的警觉,仅上线三天就被微信以“可能侵犯用户隐私”的理由封杀了。被微信封杀一事成了大新闻,小冰相当于免费做了一次浩大的宣传,在中国科技圈迅速走红。之后,小冰果然在中国市场上打开了一片天地,被微信封杀没多久,转头就与新浪微博、触宝等大批中国企业宣布了合作关系。经此一战,小冰在微软内部的地位也意外地直线上升。原先,由于小冰与微软的其他产品形态有较大差异,小冰在微软内部是一个“异类”,并没有太多拥趸。但小冰被微信封杀后,陆奇在内部连发三封邮件安抚小冰团队的情绪;沈向洋从美国回来,也邀请李笛、景鲲与彭爽在微软大厦的 13 楼做了一次汇报,讲小冰是如何诞生的。那场汇报吸引了微软中国的很多员工前去观看。大家都觉得小冰很好玩、很有产品思路。从 2009 年必应团队成立以来,必应历任纳德拉·萨提拉(现微软 CEO)、沈向洋与陆奇的带领,在陆奇上任后,微软提出的战略是“中国为先”,希望必应在中国能有更多的本土创新。但直到小冰的出现,大家才有了眼前一亮的惊喜:“微软终于做出了一个有人用的产品。”那是李笛的高光时刻。小冰的成功让他产生了留在微软的想法。但正当李笛为小冰高兴万分时,与他一同打造小冰的景鲲却向微软递交了辞呈,转身去了百度。小冰原是李笛与景鲲并肩作战的产品,结果才刚现雏形,原先说好一起打江山、歃血同盟的战友就驶离了赛道。景鲲去了百度后,没多久,陆奇也加入了百度,并将景鲲提拔起来。而陆奇提拔景鲲的一大原因,就是景鲲之前在小冰项目中立下的功劳。景鲲的离开让李笛感到意外,也改变了小冰的人力格局。没人知道李笛对景鲲的真实想法,但在旁人看来,李笛一直在暗中与景鲲较劲。景鲲去了百度后也是负责百度的人工智能助手研发,先后参与了度秘、小度等项目。一位小冰前员工记得,有段时间李笛经常在内部说,景鲲负责的小度虽然人不多,但团队很强、很努力,产品节奏也很快,但尝试的方向很多、没有聚焦。为此,李笛跟小冰团队说,我们要朝着一个方向一直推,不要老是换方向。(中国 AI 赛道的数个周期之下,和小冰同时代成长的AI公司,也家家都有难念的经。欢迎添加作者微信:william_dong 交流八卦。)
当时李笛也没想到,多年后,他与景鲲的行业命运还会再发生一次奇妙的共振:2020 年,李笛与小冰从微软分拆独立,景鲲与小度也从百度分拆成子公司。他们都将失去原母公司的强大依托,要将人工智能助手的梦想建立在有限的资源上。不同的是,两人从曾经的战友,转为各自为战;景鲲带领的小度探索软硬结合,李笛则坚持不让小冰走软硬一体化路线。毫无疑问,李笛是一位出色的产品天才,许多微软旧部下都向雷峰网评价,李笛十分擅长从用户的角度去思考小冰的产品设计,小冰当年的爆火也验证了李笛天才的产品能力。但李笛不是计算机出身,对技术的底层逻辑了解不深,所以小冰的技术团队需要寻找新的带头人。在小娜时,周力负责技术开发与研发团队的管理,加入小冰后对小冰的情感计算框架做出了重要贡献,在接下来的两年又带领团队以“周”为单位对小冰进行了 130 余次的技术升级,是一位十分勤快的首席架构师。
在周力的推动下,小冰迭代到第四代时,已经能通过文字、语音、图像等模态与人类用户进行交互,并成为了历史上首个能打电话的人工智能产品。因此,周力深得李笛信任,一直被李笛委以重任。景鲲走后,对话的技术交给周力,由当时周力的下级曾敏负责。曾敏年轻能干,也很受李笛重视,后来被李笛提拔、升了上去,与周力成为同级。此外,小冰被微信封杀后,在微软内部受到的关注度大幅提升,也吸引了很多优秀的人才从微软的其他部门调到小冰团队。到 2017 年第四代小冰推出时,小冰的技术团队还出现了“三足鼎立”的局面:栾剑、宋睿华、武威同时担任小冰首席科学家。那时小冰还不是一个独立的公司,栾剑等人之所以被称为小冰的“首席科学家”,是因为三人的级别在微软内部的技术评价体系都达到了“Principle”(首席)的职级。2017 年 2 月,由于小冰的成功,李笛升职为微软(亚洲)互联网工程院副院长。同年 3 月,微软将“大冰”(必应搜索)与“小冰”(李笛带领的人工智能聊天机器人团队)进行了整合,合体为一个大的小冰团队,李笛担任团队负责人。于是,2017 年,小冰出现了一个金字塔的人才体系:李笛在金字塔的尖端,旗下有周力与曾敏两名技术带头人,周力与曾敏下面又有栾剑、宋睿华与武威三名首席科学家,上下三层之间形成虚线与实线同时进行的汇报关系。
在这样的组织架构中,不难想象,李笛对技术一知半解,要领导五名技术大将,需要极高的智商与情商。但李笛的管理天赋却不如他的产品能力出色,没多久,“李笛或不擅管理”的一面也显现了出来。据多位 2017 年至分拆前任职于小冰团队的技术人员描述,当时,在面对底下的一群技术大将时,李笛采取了一种自我防御式的应对方式。人才管理上,他倾向于采取强力管制的手段,经常否定底下技术人才所提出的创意,只有他认可的方向才允许研发推进。久而久之,就造成了底下的人总是被他钳制住,技术人才的创造力无法被释放出来。例如,小冰曾招进一个北大的实习生,当时还没有 ChatGPT,这个实习生训练了一个仿 GPT-3 的小说创作模型,创意得到团队一众研究员的赞许,但李笛却看不上。再比如,宋睿华负责的团队研究多模态,基于检索技术将一个文字故事转化为了一系列插图,这项工作在多模态领域十分具有开创性。但李笛看完这个工作后,却是第一时间嘲讽了这个工作,说水平跟豆瓣上一部评分不到 4 分的烂片不相上下。但如今,用 AI 技术辅助短剧生成的前景已是行业共识。于是,逐渐地,技术人员在小冰的生存法则就变成了:谁能获得李笛的更多信任,就能获得更多的资源。一群优秀人才聚集在一起的好处是能够通过竞争激发彼此的创造力,但坏处则是不容易团结,加上在小冰“唯李笛独尊”的技术氛围中,李笛底下的几员大将也被迫争夺有限的资源,谁也不服谁,团队与团队之间彼此防备,相互独立、没有开展有效的合作。以对话为例。小冰的对话产品研发一度由曾敏主抓,其他科学家也想参与其中,但曾敏的团队成员十分排斥“其他小冰成员的干预”,最后就变成了三个首席科学家各跑一块:栾剑专注语音合成,武威研究自然语言处理,宋睿华研究“三不管”的多模态。李笛下面的技术管理层也不热衷于团队管理,无法起到协调与缓冲作用。小冰前员工告诉雷峰网,周力曾将几个高层气走。多位与小冰合作紧密的技术骨干在加入小冰前,了解小冰的人员体系,去了小冰后无论如何也不肯向周力汇报,因为“担心去到周力手下待不长”;负责对话的曾敏也不擅管理,2020 年小冰独立时,曾敏底下负责对话的技术人员没有一个人跟着小冰出来。李笛、周力、彭爽三人是高管的核心圈;而因为商务难以交付,徐元春和袁晶两人执意在小冰自成一派,独领一个团队做事;产品侧,主做 To C 的彭爽和做 To B 的条线常有竞争,另外也有几个不服彭爽的 PM 抱团与她作对;而几个首席科学家,又因为汇报关系难以统合实力。
自一开始,小冰的快速扩张,就离不开人。但产品、营收都做不起来,谁愿意来?为此,小冰有一个独特的方式——加快人员升职的周期。
如果说,在微软升一级,需要在公司2年的工作经历,那么在小冰,同样的经历一年就足够升级。一开始,每个加入小冰的人都满怀壮志,认为自己走在了时代的前沿,这在多位前小冰核心技术人员的个人选择中可见一斑:宋睿华在 2003 年就加入了微软,一开始跟着马维英、文继荣等人研究信息检索。2016年,宋睿华在谢幸团队,同组的袁晶从谢幸组转到了微软苏州必应的本地化团队,在姚麟手下做事。袁晶与宋睿华商量,用 NLP 技术给必应搜索的底图配诗。当时文字生成一块的主流技术还是 RNN,宋睿华觉得很有意思,就跟袁晶合作。2016 年,姚麟离职,微软苏州的本地化团队转交给了李笛,袁晶也转去向李笛汇报。李笛在盘点姚麟团队之前的工作时发现了宋睿华与袁晶合作的人工智能写诗项目,袁晶等人努力争取,李笛便让他们继续研发。这个项目进展不错,小冰的市场负责人徐元春出马与湛庐谈合作,说要给小冰出一版书,宋睿华等人很惊喜,对项目更加上心。他们抽出大量时间查找了所有的诗人年鉴,使小冰的训练数据全部来自于去世 50 年以上的诗人作品,以避免版权冲突。徐元春
2017 年 5 月,全球第一本人工智能创作诗集《阳光失了玻璃窗》在湛庐出版,小冰愈加名气大增,宋睿华也对小冰产生了更大的兴趣。在采写《中国人工智能简史》一书时,宋睿华曾向雷峰网讲过她如何从微软亚洲研究院转到工程院:
那一年宋睿华正年近不惑,经济上已无压力,开始思考要不要一辈子为了钱工作。正好她有一个师弟去了美团,想邀请宋睿华去美团担任一条产品线的技术负责人,但宋睿华不确定,就去找她的实习生聊,因为她觉得年轻人能看到更未来的、更让人兴奋的事情。一个实习生跟她说:“宋老师,你应该去小冰当首席科学家,这个岗位听起来比美团的技术 leader 酷多了。”于是宋睿华就去了小冰。负责语音的栾剑也是清华子弟,毕业后在东京大学读环境与海洋工学方向的博士,读博期间主要用音频探测识别海洋生物,由此进入语音领域。栾剑刚毕业回国时,亲戚朋友问他是做什么的,栾剑说语音合成,亲朋好友都是一脸茫然,直到 Siri 出现,栾剑再说、大家才心领神会。于是,栾剑对语音合成走向中国大众一直有热忱。微软想打造一个全球最强的人工智能助理,在美国与中国都设立了团队,中国的叫小冰,美国的叫小娜,其中“娜”字就源自微软最早的语音助手项目 Cortana 后缀(Na)。一段少为人知的故事是:最早 Cortana 和 Microsoft 没有中文名, 微软在北京两栋大楼中间的天桥下挂了一个布帘,上面写着“Here Comes Cortana”,但大家都不知道 Microsoft 与 Cortana 是什么。于是时任 Cortana 带头人的黄美玉建议要给 Cortana 取一个中文名,王永东采取了黄美玉的提议,才有了“小娜”的诞生。小娜与小冰同属一个组,使用同一个底层模型,但小冰作为中国本土崛起的品牌,名声显然超过小娜。栾剑在微软工程院一直从事语音研究,原先在小娜的团队,2017 年小冰扩张、在微软内部四处挖人时,因为小冰没有语音团队,李笛就极力邀请栾剑加入小冰。栾剑觉得从 0 到 1 建立一个团队很有挑战,就去了小冰,很快组了一个 20 人左右的团队。栾剑先是向周力汇报,后来也有一段时间直接向李笛汇报。栾剑在语音合成领域的造诣很深,在小冰内部颇有口碑,也深受李笛的器重。李笛会弹钢琴,热爱音乐,在声音合成的产品上投入了很多心血。栾剑也很早带领团队推出了免费试用的歌声合成软件,曾在小冰发布会上独领风骚,是后来小冰与网易云在 2021 年合作推出的 X-Studio 前身,也是目前小冰在 AIGC 领域收入最大的一块,年入数千万。(有关小冰的故事与八卦,篇幅原因仍有大量并未在文中呈现。欢迎添加作者微信 william_dong,交流第一手信息)
但随着小冰的名气越来越大,原先满怀理想主义加入小冰的技术人员开始觉得“不对劲”。小冰每年召开一个发布会,或是受发布会的影响,小冰的风格变得越来越重宣传、轻技术,逐渐形成了一种“包装技术大过做实技术”的文化氛围。在发布会上,李笛等人常喜欢将小冰的技术与产品能力吹得天花乱坠,但实际上,当小冰的市场人员去外面与客户谈合作时,大家却发现小冰做的产品却很难交付。例如,小冰十分擅长闲聊,但在回答行业问题时,却一问三不知。2020 年,小冰曾尝试将对话技术卖给屈臣氏,但屈臣氏用着用着后发现,小冰只能闲聊,不能围绕屈臣氏货架上所销售的美容护肤产品回答客人有关美妆知识的问题。这个问题的根源在于,从一开始设计小冰时,李笛等人就赢在数据上,导致李笛在技术上重数据、不重算法。2014 年第一代小冰研发时,李笛为了产品能力的“完美”呈现,会让团队将数据清洗地很干净,当发现用户问到超出小冰知识范畴的问题时,就去网上找语料做一个索引库兜底,逐个垂类补足,甚至发挥了产品的设计天赋,让小冰“嘴硬”,遇到超出知识范畴的问题时反问诸如“你自己有手,为什么不去查一下”,既避开了小冰的知识短板,又让小冰有了人的个性。此外,李笛还预先设想了用户的提问,比如询问小冰的身份。李笛专门建立了一个语料库,用来回答小冰的名字、家庭关系、父母姓名等等,十分巧妙。在李笛的产品创新下,小冰的流量从不足 5% 一下上升到 95%。这些在产品上取得的成功经验让李笛相信,创新的产品形态、巧妙的数据标注比领先的技术更重要,久而久之,这个信条就演变成了小冰发展的路径依赖。加上一贯勤俭节约的管理风格,李笛逐渐表现出宁愿花小钱做数据编辑、也不愿意花大钱养一群资深科学家的姿态。这让早期在小冰做技术的人心生危机感。小冰每年都开技术发布会,但内部又不追求技术的扎实。一些早期在小冰从事研发的人员告诉雷峰网,他们曾与周力提过,在支撑产品功能的技术做实之前、能不能先别对外宣传产品的创新,但周力的回应却是,“我能说出你们要做的效果”。在小冰,相比技术的扎实度,能在宣传侧产生噱头的新闻似乎更受重视。尽管这是更利于商业的角度,但对于工程师们来说,小冰的产品在技术上并没有那么快的进步、基本靠包装,大家自然也就越来越没信心,觉得即使自己开辟了一个领先的方向,也没有机会将技术做深,护城河很浅,对手一个大浪上来就可能翻船。今年 ChatGPT 与大模型的浪潮证明了他们当初的预言:同是做对话,ChatGPT 与小冰俨然两个物种,且小冰的技术路线已被对手远远甩开。(今年年初,在 ChatGPT 的影响下,中国的 AI 赛道在短短几个月里,涌现了百余个大模型,第四范式的“式说”也是其中之一。对于第四范式,“式说”是他们下个曲线的增长机会,还是追高从众的牵强附会?欢迎添加作者微信 william_dong 交流认知心得。)
但李笛非技术出身,与技术团队的认知始终不在同一个层面上,导致微软小冰虽然聚集了大批优秀的技术人才,却没有发挥出与该阵容相匹配的威力。与起步阶段相比,小冰表面上多了很多个“景鲲”负责技术,但实际上唱的仍是李笛的独角戏。小冰高层与一众技术人员的冲突在 2020 年小冰分拆时爆发。2020 年 7 月,GPT-3 发布后不久,微软宣布小冰分拆,以独立公司运营,李笛担任 CEO。小冰独立前是微软在全球范围内最大的人工智能团队。2020 年分拆时,小冰无法将原来团队的全部人员带出去,原有人员有三种安置方式:一是拿补偿走人,二是在微软内部转岗,三是跟着小冰独立。但在制定不同方案下的人员名单时,李笛与人事没有与小冰团队的几个技术负责人商量。等大家拿到最终名单时,一切已成定局。李笛对外称,是否跟着小冰独立是每个员工的自由,但当栾剑、宋睿华与武威等人拿到名单时,却发现自己底下一些很能干、深受自己信赖的人才被划了出去,还有一些人被优化掉。为此,宋睿华与李笛产生了一些不愉快。没多久,栾剑、宋睿华与武威都陆续离开了小冰。除了更习惯大公司的工作节奏外,另一个原因是,过去的工作经历让他们内心感觉,“李笛不会真正信任这帮做技术的人”。栾剑被崔宝秋招去了小米,宋睿华去了中国人民大学当教授,武威去了美团。三位顶尖科学家出走后,小冰原有技术团队的实力也被极大削减。失去了微软这个强大的靠山,技术人才又大幅流失,当时独立的小冰表面是获得了“第二次生命”,实际上是丢失了两块对科技公司来说至关重要的城池:人才与资源。事实上,还没分拆前,小冰在微软内部一直是一个“特别”的存在。小冰有独立的产品发布权力,有独立的市场团队,对小冰的产品更新与上线有绝对的决策权,还可以独立发表声明。微软在全球范围内,只有小冰独有这份“特权”。因为小冰象征着中国技术的快速崛起,得到了多位微软华人高管的保护。但在主外难分的处境下,诞生于微软中国的小冰又始终笼罩在微软美国的影子下。生于微软、长于中国的基因使小冰始终受限于身份认同的困境。李笛曾坦诚其无奈。比如,一方面,小冰诞生于必应(Bing)时,必应在中国市场举步维艰、没有广告收入,李笛在微软美国被称为“爱国者”;另一方面,Bing 的发展又要同时符合中美两国的合规要求,单单为了说服微软总部让必应接受中国政府的监督,微软中国就出动了多位高层去微软总部游说。小冰也不例外。一位曾就职于微软的华人科学家跟雷峰网分享过一个细节:每年年底,萨提亚都会在微软内部组织一次闭门会,邀请六、七个在那年取得颠覆性技术成果的团队作分享。萨提亚看起来为人温和,但实际分享中却总向技术人员提出十分犀利的问题,如这项技术在未来会产生多大的商业价值、对微软参与全球竞争有什么帮助。谈话间,萨提亚常向研究员强调,技术创新要有回报产品部门的意识,因为技术人员开展研究的资金是各个产品部门像交税一样上交到微软总部后再作二次分配的。换言之,萨提亚时代,无论技术多强,商业变现能力差、只会讲故事的产品团队在微软是无法长久生存的。
萨提亚上台后,将云计算、人工智能与量子计算作为微软未来的三大科技方向,其中人工智能领域的目标就是研发出一个能从生产力角度造福人类的人工智能助手,所以微软在小冰出世前就成立了人工智能助手 Cortana 项目组。2014 年继第一代小冰后发布的小娜在宣传时也着重强调其在提升生产力上的进步。但李笛走了一条不一样的路:自 2014 年第一代小冰发布起,李笛对外对内都强调打造有情感的聊天机器人,强调人与机器的趣味互动,从一开始与萨提亚的预期方向就有了本质分歧。微软想要的是 ChatGPT,而李笛想要的是拟人化的小冰。在李笛的带领下,小冰“成长”为了一个长于唱歌、画画、作诗的网红,是行业眼里一个不急于盈利的“富二代”。据公开信息,直到 2019 年第七代小冰发布,对外推出 Avatar Framework 的第一个工具包版本,小冰才开始商业化。据多位微软旧部下的可信推断,小冰在 2020 年 7 月被分拆独立,一大原因是微软在 OpenAI 的投资中看到了一条更可靠的技术路线——大模型。相比小冰在微软内部实践了七年的、基于 RNN 与检索等传统技术的情感计算路线,OpenAI 的 GPT-3 显示出了更大的潜力,能帮助微软更快地打造出全球最强人工智能助理。ChatGPT 出来前,开放域对话一直是小冰的看家本领,小冰在这块一骑绝尘。但实际上,很早之前,小冰的对话就体现出了缺乏知识的局限性。曾有行业客户问小冰团队能不能为他们开发美妆类的对话机器人,结果发现开发不了,因为小冰在开放对话中的表现主要基于有限索引库的数据兜底,不具备“世界知识”,也就很难落地商用。而大模型技术路线却能突破这一瓶颈。一位前微软华人高管告诉雷峰网,微软内部很早就比拼过谁能更早训练出大模型。微软总部有一个图灵组,与微软亚研的一个团队合作训练出了一个 175 亿参数的语言模型,是当时世界上第一大语言模型,但微软中国的研究部门并没有意识到这件事的革命性,重产品、轻技术的小冰团队自然也没有重视这条新路线。因此,不少看着小冰“长大”的前微软华人科学家都向雷峰网感慨,“如果小冰一开始走大模型路线就好了。”从技术栈的重建来看,多位技术人员向雷峰网分析,如果小冰在 GPT 出来后能迅速转向大模型路线研发,以小冰当时的技术实力也是能驾驭的——小冰的三大首席科学家都是语音与语言处理出身,栾剑是如今小米大模型的核心骨干、宋睿华是中国第一批大模型“文澜”的核心参与者。对大模型的早期投入至关重要,例如,智谱最早是数据检索技术起家,但因为洞识过人、及早转向,也顺利抢了大模型的先发优势。(大模型的竞逐,已经快速经过了第一个赛段,而一个回合过去,谁更领先,而谁又暂落下风?欢迎添加作者微信 william_dong 来聊。)
遗憾的是,李笛非技术出身,也未能果敢地认识到技术变革带来的产业颠覆。加之李笛在人才管理上经验不足、导致人才的流失,小冰作为最早的以“语言智能”为核心的 AI 公司,终究没能成功跻身引领语言智能时代爆发的领头羊。小冰从微软拆分独立后,带了七八十人的团队出来,新办公室设立在距离微软中国办公楼的不远处。由于有技术、有团队、有名望,还有多位人工智能行业大佬的背书,小冰一开始的融资也很顺利,第一轮融资估值就高达 10 亿,大有一番广阔天地皆可为的气势。但独立后的小冰在商业化的短板也愈加显现。原先慕名而来的小冰投资人慢慢发现,小冰的商业化能力低于他们的预期。与小冰同期的几乎所有对话类产品,如 Cortana、Siri、Google Assistant、Alexa,都选择了软硬一体的道路。软硬一体的缺点是难度高、交付重,但优势是“卖一单赚一单”。李笛放弃软硬一体的模式后,剩下卖 API 或 SaaS 等几个主要的传统软件变现方式,但李笛又反对卖 API Code。李笛的理由有两个:一是 API Code 会迅速地裂变为一系列细小的 API,最终导致 A 公司、B 公司与 C 公司的技术差异不大;二是 API 的定价往往非常低,AI 公司销售 API 无法获得与其技术实际创造价值同等的收入。以微软认知服务的 API Code 为例,B 站上许多视频的配音是由微软的语音技术支持,不同 Up 主基于同一项技术所做的视频会产生完全不同的商收,但在 API 模式下,微软却无法从这两种截然不同的商收中获得不同的收益。小冰一度选择了一条区分于 Cortana 的发展路径:基于第三方生态系统,在系统中扮演类似中间件的角色,提升第三方互联网产品(如微博)的活跃度。这是小冰诞生初寄生于微信的实践经验沿袭。在这条路径的指导下,小冰创造了一个个“AI Being”,如夏语冰、华智冰、崔筱盼等等,虚拟 AI 开始成为小冰的主要对外标签。原先小冰的对话产品是基于小模型,早期被行业人士评价为像“一个个 Demo”,难以落地。李笛将小冰的产品定位从对话转向虚拟 AI 后能在一定程度上弥补技术的短板,2021 年元宇宙大火时,小冰凭借虚拟 AI 也经历了一段高光时刻,在拥有 800 万用户的虚拟男女友市场以及 B 端政企 2D 数字人领域独据鳌头,2022 年获得了红杉等知名资本的过亿投资。小冰的 B 端市场一把手是徐元春。徐元春是个能人,最早负责小冰的市场开拓,从行业客户反馈中得知小冰的产品难以直接交付后,与袁晶单独成立了一个组,专门给 B 端客户做产品交付,将 B 端的营收做到了占小冰整体营收的 90% 左右。但随着数字人领域的开源技术越来越多,小冰原先选择的技术门槛最低的 2D 数字人也逐渐失去了技术的壁垒,市场进入一片红海。小冰的竞争对手不仅有新兴的 2D 数字人公司,还有 3D 数字人公司以及提供一整套数字人解决方案的各大云厂商,使得小冰在获客与交付上的压力进一步加大。2021 年下半年,小冰也曾尝试做更难的 3D 数字人,但技术栈一直没有搭建起来。今年上半年小冰的 3D 数字人部门更是已经解散。今年,ChatGPT 带火 AI 后,所有的热钱都涌向了大模型,去年讲元宇宙故事的公司也开始往 AIGC 靠拢,微软与 OpenAI 拔得头筹,连谷歌都被摁在地上摩擦。但最早讲开放式对话、人工智能目标最接近 OpenAI 的公司小冰,却不再是今天中国市场最被看好的 AI 公司。技术上没站稳,商业上没壁垒,时代的一个大浪打来,再强大的巨人也会被打倒。(雷峰网 AI 独角兽冰与火之歌系列,将持续关注中国人工智能赛道上独角兽公司们的沉浮于起落,第四范式篇当下正在写作当中,欢迎感兴趣的读者添加作者微信 william_dong 交流信息,分享八卦。)
如今,小冰的营收能达到数亿规模(不超过 10 亿),但仍处于巨大的亏损中。而被李笛嘲讽的 OpenAI 虽然在 GPT-3 时凭借 API 仅创收 2800 万美元,但在 ChatGPT 与 GPT-4 火起来后,OpenAI 在 2023 年的API业务收入预计能够超过 2 亿,最新估值也飙升到了近 900 亿美元。无论是先前小冰的拥趸者,还是反对者,大家都对李笛今年在公开场合的多次“反大模型”言论感到疑惑。甚至连小冰的投资人都再也按捺不住,在今年年中找到李笛,问李笛:小冰究竟有没有大模型?小冰为什么不研究大模型?今年中国市场上留给科技的钱都涌向了大模型,但小冰没有分到一杯羹。对于大模型,李笛一改过去拥抱行业前沿和热点的姿态,多次唱衰中国大模型公司的商业模式,公开称“10 个中国大模型公司会死 9 个活 1 个、或死 8 个活 2 个”,强调小模型在部分语言任务上也不比大模型逊色。李笛有言论自由,其观点也或有一定的合理之处,但从豺狼丛生的商业世界来看,李笛的行为却是“吃力不讨好”。李笛已带领小冰多年,却像多数刚创业的企业管理者一样,忽略了一条致命的创业生存法则:融资是有特定时机的。市场上的资源有限。创业公司一旦错过了最佳融资时机,再想拿钱、无论想拿多少也拿不到了。小冰官方消息称,小冰在 2022 年 11 月完成的 A+轮融资共 1.38 亿美元(约 10 亿人民币),估值 23.08 亿美元。但据雷峰网多方了解,在这一轮融资中,主要资方红杉资本只投了小数千万美金。知情人士估算,当前小冰账上的资金如不做大规模的研发投入与市场宣发,也仅够小冰维持一年左右。第三轮融资完成时,小冰曾进入一个短暂的快速膨胀阶段,人员规模扩张到约 600 人,但今年年初,小冰就开始为最坏的情况做打算,进行了一波裁员,裁了大约 200 人。目前小冰的人员规模在 300 人左右,其中超 80% 是产品研发人员。如果李笛能在今年 5 月前拥抱大模型,基于小冰过去的坚持讲一个好故事,小冰拿到融资的机会非常高。相比中国许多新崛起的 NLP 公司,小冰的先发优势与积累在许多投资人眼里仍有领先价值,这也能帮助小冰的账面回血、存活更长时间。但当投资人觉得小冰的战略部署太久、决胜局太晚,跑去找李笛,让李笛讲讲大模型的故事时,李笛给投资人的回复却是,“小冰在今年 12 月之后才会考虑发布一个百亿参数级别的大模型”,理由是李笛认为,“今年 12 月市面上很可能会出现一个不需要模型迁移的新技术范式”。投资人无法判断李笛这一观点的依据是什么,“因为李笛很少往深度解析”。多位投资人告诉雷峰网,李笛并非平庸之人,但总喜欢讲一连串概念、时常前后矛盾。比如,李笛一会说,小冰从做对话开始就没有拒绝过新方法、包括大模型;一会又说小冰是被骂大的,即使小冰的方向得不到行业认可也要坚持,NLP 领域都做大模型、但小冰就要做小模型。这让投资人“不敢下手”。为了坚持自己的观点,李笛有时也不惜破坏与投资人的关系。ChatGPT 火起来后,有对小冰感兴趣的投资人主动与李笛接洽,但都被李笛气走了。曾与李笛接触的投资人向雷峰网这样评价:“小冰已经不再是微软时候的小冰,但李笛还是微软时候的李笛。”李笛不拥抱大模型,有成本的考虑。2021 年大模型大火时,李笛自然也关注到了这一进展,但当时小冰的用户月活度“只有” 1.4 亿,李笛认为在小冰如此有限的用户基础上布局一个大模型成本太高,“不划算”。从微软分拆后,小冰在名义上成为了“中国的小冰”,但实际上又与微软还保持着千丝万缕的关系。微软是小冰最大的股东,小冰的一些订单来自微软的 TTS。小冰与微软的这层关系,是小冰的保护壳,也是小冰的紧箍咒。如果小冰研究大模型,就是与老东家正面竞争。微软向小冰提供大模型的技术支持,也只是“授鱼不授渔”。今年 9 月,小冰与微软联合发布了基于微软国际版 Azure 的新一代数字员工解决方案。此次小冰的数字人迭代就是基于微软的大模型,小冰能获得独特授权。另一层是,小冰当前的估值过高,研发大模型对估值打击有风险。小冰在去年的第三轮融资中估值 23.08 亿美元,站位本就高于中国大部分的 NLP 公司。如果小冰的大模型实力能超越其他公司,市场反应自然更好,但小冰需要投入高昂的成本去追赶;但如果超不过,小冰就会沦为第二梯队的 NLP 公司,现有的估值也保不住。目前市场也认为,小冰的估值过高,反而限制了它的发展。如果将小冰定位成一家“2D 数字人公司”,小冰超 20 亿美元的估值已经超过当前的大多数数字人公司,大多投资人望尘莫及;但如果将小冰定位为一家“NLP公司”,小冰的小模型技术路线又已经大幅落后。高估值科技公司融资的良性循环往往建立在两个基础上,要么是技术的快速进步,要么是营收的快速增长,但小冰与这两个条件都不匹配。(中国的 AI 独角兽走到今天,也大多面临着转型的生死难题。欢迎添加作者微信 william_dong,讨论前沿行业认知。)
今天,小冰的业务分为三条线:一条是 Nobody,即“没有人注意到的虚拟人”,如虚拟男友、女友或虚拟亲属朋友等陪伴型数字人,只对专属用户有意义、对其他人没有意义;一条是 Somebody,即具有某项技能的数字专家或虚拟员工,要求具有足够深的行业知识,能够替代人去工作;还有一条是 Super AI Being,复刻或孵化虚拟 IP。李笛也认识到小冰在 B 端交付过重的弊端,很早开始尝试 To C 的探索,比如小冰岛。这个项目始于 2021 年,由曾敏负责。李笛对这个项目很重视,投入了大量的人力与资金。李笛在小冰岛的项目上投入了 100 多号人,但研发数月都没有取得里程碑式的成效。虽然小冰岛还在运营,但据雷峰网了解,小冰内部已经不再投入研发,目前该项目处于停止更新的状态。目前,小冰在 C 端主要有两块,一块是 X Eva,即“网红克隆人”,提供聊天和陪伴的服务,另一块则是虚拟偶像孵化。当前数字人克隆的主流模式是定制数字人资产,资产属于个人,但小冰的 X Eva 则是搭建一个平台,让克隆的网红在平台上与粉丝开放交互。这个思路是典型的“李笛风格”,与李笛反对卖 API Code、坚持打造第三方平台、防止软件价值被稀释的思维一脉相承。而虚拟偶像孵化的思路则是,小冰希望让每一个普通的 C 端用户都能更简单地创造内容,拥有自己的虚拟 IP,本质是想做类似于字节剪映的生态,需要让 AI being 拥有唱歌作曲的能力,以及驱动 AI 形象与动作的技术,这些都是小冰擅长的技术模块。X Eva 上线后,几乎每个月会迭代一个大的版本,4 个月内吸引了超 200 名网红入驻,网红的平均粉丝数超过 100 万。由于网红自带流量,并且会主动推广,小冰在流量造势上不需要下很多功夫。虚拟偶像这块,小冰与遥望科技等企业签署了战略合作,在虚拟人直播带货上也探出了一条新路。如果放弃从大模型的角度评价李笛,没有拥抱大模型的小冰似乎也在虚拟 AI 上找到了新的战场。李笛主动选择被投资人孤立,是“嘴硬”、还是道高一尺,标准或许只在于小冰能否活到梦想成真的那一天。“很多人创业的目的是为了财富自由,我们没有这个目的。”谈到创业初心时,李笛如是说。在李笛心中,小冰是中国最有人工智能信仰的一家公司。不仅李笛,曾经关注过小冰、甚至为小冰付出过时间与金钱的技术人员或投资者都曾这样相信过。即使到今天,中国的 AI 圈仍有很多人关注小冰的动态。但渐渐地,一些人开始对曾经的信仰噤若寒蝉,根源是“成王败寇”的朴素价值观:十年过去了,小冰还没有成功。或者说,人们一开始对小冰抱有太大的期望,而小冰没有实现这些期望。比如人类与人工智能产品的智趣交互,比如每个人都有一个兼具 IQ 与 EQ 的 AI 助手。雷峰网了解到,其实小冰在一年前就开始有所反思,不再坚持 EQ 高于 IQ 的产品路线。一年前,小冰就期望研发出具有智慧属性的、能集合多种能力的数字人,为此小冰覆盖了多个技术路线,包括交互型 NLP、神经网络渲染、视觉与动态表现、TTS、AIGC、大模型等等。尽管李笛上半年嘴硬,但据雷峰网近日获悉,随着大模型的局势渐渐明朗,李笛也在小冰设立了一个大约 20 人的大模型团队,希望赋予数字人调用不同模型的能力。目前用大模型技术驱动数字人也是一个高门槛、具有广泛应用场景的新方向,如小冰能在该领域有所建树,也有扭转局势的机会。此外,多位行业人士也向雷峰网表示,小冰目前在数字人领域的政企印象分还是高于大多数初创企业。一位与小冰在数字人领域有紧密合作的国企数字化负责人就告诉雷峰网,小冰在数字人交付中提供一揽子的服务,不仅在细分垂直领域有行业 know-how,能满足更高要求的定制化服务,还包揽宣传工作,大大节省了 B 端客户的时间与精力,客户满意度很高。小冰在日本、印尼等海外片区的 SaaS 也取得了不错的成绩。小冰日本版的 Rinna 在日本应用商店的 AIGC 类产品中长年排名前十,在印尼的 AI 虚拟人产品“Account Manager”(账户经理)帮企业做文档分发与售后处理,上线三天就超过 600 家企业部署。这些是由于发展早,探索早,踩过的坑也更多,小冰虽不能说经验老道,但也身经百战。所以,对于小冰的未来,大家也还是不可遏制内心的情怀,对小冰抱有一丝希望。小冰历经了戏剧性的十年,如同笼罩在罗生门的重重迷雾之中,众说纷纭下,谁对谁错早已不再关键。唯一重要的是,在技术和市场两端急遽变化的激流直下,小冰是否能成为最后的赢家之一,扭亏为盈、成功上市,成为一家为社会创造价值的 AI 企业。留给小冰还有多少时间?这个问题,恐怕要由多个因素共同决定,但首先要改变的,也许是李笛等小冰高层能认清形势,勇于革新,一步一个脚印,打下一片真正的江山。美丽的梦想谁都会说,但只有当梦想成为现实,骄傲才有了放纵的底气。(未来,AI 赛道来到2.0阶段,一半是资本追捧的火焰,一半是生存困难的海水。雷峰网将持续关注AI独角兽的起伏与跌宕,欢迎添加作者微信 william_dong 交流认知,分享八卦。)