Kimi大模型:就汤姆你叫文心一言啊?
“
希望是屠龙少年。
初次听到Kimi这个名字,可能多数人还以为林志颖家的大公子正式出道了。
这家不起眼的公司,在这个月成为AI大模型的当红炸子鸡,点燃了A股资本市场。
这家公司是什么来头?真的那么牛吗?
有点东西
Kimi大模型到底好不好,还是得实际用过才知道。
这里主要跟目前声量比较大的“文心一言”“讯飞星火”“阿里通义千问”比较一下。注意,文心一言还是3.5版本,不是李彦宏说的那个中文超越GhatGPT-4的版本。
首先是文本总结归纳能力:
因为最近财报季,所以简简单单吃个拼多多的财报。内容来自公告,为了客观,提问采用了统一的话术。结果如下:
Kimi大模型条理清晰,重点突出,格式很美观,精准度很高,很多小问题追问一下就能修补。
美中不足的有两点:一个是数据保留了原来的格式需要追问一下才能换算成中文习惯的“万”和“亿”。另外,看得出来Kimi对数字还是有些混乱,误打误撞对上了。
另一个是,没有概括费用开支数据,也需要追问。有一点很惊喜,再次追问后,自动换算成中文常用的单位,不过最终还是出错了。
看起来有瑕疵,但是同行一衬托,Kimi还是非常强的。
文心一言、讯飞星火有字数限制,无奈只能制作成word给它,结果文心一言玩你问我答,星火直接罢工。坦白来说,通义千问的内容还算不错,但Kimi有的毛病,通义千问一样有。
除了财报,还尝试了研报,得出的结论相差不大,此处不过多赘述。
接下来是“创造”能力。这里让四个大模型以“小互真好看”为主题作诗,文心一言文学性不错、夸的力度却不够,诚意不足,扣大分。比较显眼包的是讯飞星火,做了一首现代诗。综合下来,Kimi分高一点。
最后是数学能力,这里选了一道中考数学题(别问为啥不选高考的,因为忘干净了)。
这道题是一元二次方程,十字相乘可以判断出选C。题不难,就是看大模型的图像识别和数学能力。一开始Kimi识别出错,说这道题无解,说明图片识别有些问题,但在告知题干后,Kimi算出了正确答案,而且解答也比较清晰。
百度也出现了类似的问题,追问后给出了正确答案。通义千问的答案也准确,不过过程太简单了。
讯飞星火是最让人满意的答案,毕竟教育业务占据了很大比例,解答过程特别辅导教材的答案。
基础题型相差不大,为了测试极限,我又找了国考真题来测试,看了答案,这题选A,解题过程用到了等差数列。
从结果来看,这几个大模型都主打一个已读乱回。Kimi和通义千问都对了,但其实就跟多数人在考场一样,稀里糊涂蒙对了。实际过程最接近的是讯飞星火,至少在第一步它真的跟答案一致,但合并求解的时候出了错。当然,这里还是要日常拷打百度,行测做出了申论的感觉。
Kimi大模型
文心一言
讯飞星火
通义千问
因为不是专业的大模型测评,只能做个简单总结评价:Kimi目前在翻译能力、长文归纳总结、文字能力上非常强,但是在图片识别、数学能力上暂时相差不大,文生图、文生视频等的功能暂时不支持。现阶段,文字工作者、研究员、律师等职业大概率会对Kimi的这项能力有明显感知。
何方神圣?
Kimi大模型背后的公司叫月之暗面,2023年4月注册成立,是一家非常新的公司,创始团队来自清华计算机系。
根据公开信息,创始人杨植麟本科毕业于清华大学计算机系,博士毕业于卡内基梅隆大学计算机学院。Transformer-XL和XLNet两篇论文的第一作者——两者均为大语言模型领域的核心技术。
CTO张宇韬是清华大学计算机博士,曾作为核心开发者研发了科技大数据分析平台AMiner。另外两位联合创始人周昕宇和吴育昕,则有超过10000+的Google Scholar引用。
这个团队创立不到一年,已经拿到了两轮融资。天使轮又是老朋友真格基金,以及红杉中国。今年2月,月之暗面完成了A轮超10亿美金融资,资方是阿里、红杉中国、小红书、美团,以及砺思资本等老股东。
从发展历史和规模来讲,Kimi只能算是个小学生。
在国内大公司接连不断推出大模型后,Kimi去年10月才刚刚发布初代版本,彼时百度已经发布文心大模型4.0,李彦宏高调宣布,综合水平与GPT 4相比毫不逊色。
月之暗面选择了“长文本(Long Context)”作为主打技术之一称之为大模型“登月计划”的第一步。支持更长的上下文意味着大模型拥有更大的“内存”,使大模型的应用更加深入和广泛。
推出大模型之初,Kimi就支持支持20万汉字无损级别上下文输入,这次更新,已经能支持200万字。Token量已经超越了Gemini 1.5 pro、Claude 3和GPT-4 Turbo,并且生成速度较去年 10 月份提升了三倍。
创始人周昕宇表示,在Sora发布之前月之暗面就已经有多模态方面的研发,目前正在按照固有节奏推进,预计在今年将会有相关产品发布。短短时间内,有这样的进化速度很让人惊喜。
不少券商都对Kimi大模型表示了看好。银河证券表示,Kimi智能助手宣布大模型进入“长文本时代”,长文本能力也将是通往AGI进程中的关键之一,Kimi智能助手将是又一里程碑。
华福证券直接将Kimi和OpenAI放在了一起,“AI应用的拐点:Kimi崛起,OpenAI加速”。开源证券点评道,“Kimi 等AI产品持续迭代,AI应用商业化或加速。”
中国版OpenAI?
目前,Kimi大有当初ChatGPT的势头。根据 SimilarWeb 数据显示,去年12月 Kimi 的周访问量还在10万次上下,到了1月下旬才突破40万,但是从春节开始访问量疾速攀升,到现在周访问量已经超过160万次,2月访问量增长107.6%,仅次于百度文心一言与阿里通义千问(访问量均下降超30%)。也就是说,用户开始用脚投票了。
舆论喜欢造神,资本喜欢提前释放情绪。
Kimi大模型的火爆,直接引发了资本市场的猛烈追捧。有消息称,掌阅科技与国内大模型创业公司月之暗面达成合作,接入后者AI对话助手Kimi。掌阅科技股价一路飞涨,最近两个周股价涨了60%。华策影视、海天瑞声直接20cm涨停,中广天泽连续两天涨停。另外,九安医疗、深信服参投了月之暗面,股价也有明显上涨。
这样疯狂的势头,俨然已经把月之暗面看成了中国版OpenAI。
但月之暗面成立才不到一年,还需要时间。Kimi大模型的长板凸显,现阶段对于财报、法务、长篇小说等归纳总结有比较清晰的应用前景,但其他优势并不算明显,而且按照时间看,新一轮大模型的迭代也即将开始,技术优势可能还会打折扣。
月之暗面体现出了不少优秀的特质。首先Kimi大模型的产品界面简洁,其他功能不喧宾夺主,生成内容有清晰条理。其次效率高,公司规模仍在80人左右,奉行“招的每一个人都要提高团队平均水平。”第三低调务实,接受采访时,团队大多数聊的都是技术问题,杨植麟认为,简单的捷径无法达到理想的产品化效果。
希望Kimi的爆火不是昙花一现,而是真正的屠龙少年。