Kimi大模型：就汤姆你叫文心一言啊？

Original 可怜的小互互联网的那点事 2024-04-18

“

希望是屠龙少年。

初次听到Kimi这个名字，可能多数人还以为林志颖家的大公子正式出道了。

这家不起眼的公司，在这个月成为AI大模型的当红炸子鸡，点燃了A股资本市场。

这家公司是什么来头？真的那么牛吗？

有点东西

Kimi大模型到底好不好，还是得实际用过才知道。

这里主要跟目前声量比较大的“文心一言”“讯飞星火”“阿里通义千问”比较一下。注意，文心一言还是3.5版本，不是李彦宏说的那个中文超越GhatGPT-4的版本。

首先是文本总结归纳能力：

因为最近财报季，所以简简单单吃个拼多多的财报。内容来自公告，为了客观，提问采用了统一的话术。结果如下：

Kimi大模型条理清晰，重点突出，格式很美观，精准度很高，很多小问题追问一下就能修补。

美中不足的有两点：一个是数据保留了原来的格式需要追问一下才能换算成中文习惯的“万”和“亿”。另外，看得出来Kimi对数字还是有些混乱，误打误撞对上了。

另一个是，没有概括费用开支数据，也需要追问。有一点很惊喜，再次追问后，自动换算成中文常用的单位，不过最终还是出错了。

看起来有瑕疵，但是同行一衬托，Kimi还是非常强的。

文心一言、讯飞星火有字数限制，无奈只能制作成word给它，结果文心一言玩你问我答，星火直接罢工。坦白来说，通义千问的内容还算不错，但Kimi有的毛病，通义千问一样有。

除了财报，还尝试了研报，得出的结论相差不大，此处不过多赘述。

接下来是“创造”能力。这里让四个大模型以“小互真好看”为主题作诗，文心一言文学性不错、夸的力度却不够，诚意不足，扣大分。比较显眼包的是讯飞星火，做了一首现代诗。综合下来，Kimi分高一点。

最后是数学能力，这里选了一道中考数学题（别问为啥不选高考的，因为忘干净了）。

这道题是一元二次方程，十字相乘可以判断出选C。题不难，就是看大模型的图像识别和数学能力。一开始Kimi识别出错，说这道题无解，说明图片识别有些问题，但在告知题干后，Kimi算出了正确答案，而且解答也比较清晰。

百度也出现了类似的问题，追问后给出了正确答案。通义千问的答案也准确，不过过程太简单了。

讯飞星火是最让人满意的答案，毕竟教育业务占据了很大比例，解答过程特别辅导教材的答案。

基础题型相差不大，为了测试极限，我又找了国考真题来测试，看了答案，这题选A，解题过程用到了等差数列。

从结果来看，这几个大模型都主打一个已读乱回。Kimi和通义千问都对了，但其实就跟多数人在考场一样，稀里糊涂蒙对了。实际过程最接近的是讯飞星火，至少在第一步它真的跟答案一致，但合并求解的时候出了错。当然，这里还是要日常拷打百度，行测做出了申论的感觉。

Kimi大模型

文心一言

讯飞星火

通义千问

因为不是专业的大模型测评，只能做个简单总结评价：Kimi目前在翻译能力、长文归纳总结、文字能力上非常强，但是在图片识别、数学能力上暂时相差不大，文生图、文生视频等的功能暂时不支持。现阶段，文字工作者、研究员、律师等职业大概率会对Kimi的这项能力有明显感知。

何方神圣？

Kimi大模型背后的公司叫月之暗面，2023年4月注册成立，是一家非常新的公司，创始团队来自清华计算机系。

根据公开信息，创始人杨植麟本科毕业于清华大学计算机系，博士毕业于卡内基梅隆大学计算机学院。Transformer-XL和XLNet两篇论文的第一作者——两者均为大语言模型领域的核心技术。

CTO张宇韬是清华大学计算机博士，曾作为核心开发者研发了科技大数据分析平台AMiner。另外两位联合创始人周昕宇和吴育昕，则有超过10000+的Google Scholar引用。

这个团队创立不到一年，已经拿到了两轮融资。天使轮又是老朋友真格基金，以及红杉中国。今年2月，月之暗面完成了A轮超10亿美金融资，资方是阿里、红杉中国、小红书、美团，以及砺思资本等老股东。

从发展历史和规模来讲，Kimi只能算是个小学生。

在国内大公司接连不断推出大模型后，Kimi去年10月才刚刚发布初代版本，彼时百度已经发布文心大模型4.0，李彦宏高调宣布，综合水平与GPT 4相比毫不逊色。

月之暗面选择了“长文本（Long Context）”作为主打技术之一称之为大模型“登月计划”的第一步。支持更长的上下文意味着大模型拥有更大的“内存”，使大模型的应用更加深入和广泛。

推出大模型之初，Kimi就支持支持20万汉字无损级别上下文输入，这次更新，已经能支持200万字。Token量已经超越了Gemini 1.5 pro、Claude 3和GPT-4 Turbo，并且生成速度较去年 10 月份提升了三倍。

创始人周昕宇表示，在Sora发布之前月之暗面就已经有多模态方面的研发，目前正在按照固有节奏推进，预计在今年将会有相关产品发布。短短时间内，有这样的进化速度很让人惊喜。

不少券商都对Kimi大模型表示了看好。银河证券表示，Kimi智能助手宣布大模型进入“长文本时代”，长文本能力也将是通往AGI进程中的关键之一，Kimi智能助手将是又一里程碑。

华福证券直接将Kimi和OpenAI放在了一起，“AI应用的拐点：Kimi崛起，OpenAI加速”。开源证券点评道，“Kimi 等AI产品持续迭代，AI应用商业化或加速。”

中国版OpenAI？

目前，Kimi大有当初ChatGPT的势头。根据 SimilarWeb 数据显示，去年12月 Kimi 的周访问量还在10万次上下，到了1月下旬才突破40万，但是从春节开始访问量疾速攀升，到现在周访问量已经超过160万次，2月访问量增长107.6%，仅次于百度文心一言与阿里通义千问（访问量均下降超30%）。也就是说，用户开始用脚投票了。

舆论喜欢造神，资本喜欢提前释放情绪。

Kimi大模型的火爆，直接引发了资本市场的猛烈追捧。有消息称，掌阅科技与国内大模型创业公司月之暗面达成合作，接入后者AI对话助手Kimi。掌阅科技股价一路飞涨，最近两个周股价涨了60%。华策影视、海天瑞声直接20cm涨停，中广天泽连续两天涨停。另外，九安医疗、深信服参投了月之暗面，股价也有明显上涨。

这样疯狂的势头，俨然已经把月之暗面看成了中国版OpenAI。

但月之暗面成立才不到一年，还需要时间。Kimi大模型的长板凸显，现阶段对于财报、法务、长篇小说等归纳总结有比较清晰的应用前景，但其他优势并不算明显，而且按照时间看，新一轮大模型的迭代也即将开始，技术优势可能还会打折扣。

月之暗面体现出了不少优秀的特质。首先Kimi大模型的产品界面简洁，其他功能不喧宾夺主，生成内容有清晰条理。其次效率高，公司规模仍在80人左右，奉行“招的每一个人都要提高团队平均水平。”第三低调务实，接受采访时，团队大多数聊的都是技术问题，杨植麟认为，简单的捷径无法达到理想的产品化效果。

希望Kimi的爆火不是昙花一现，而是真正的屠龙少年。

*图片均为自己截图、自行制作

*撰文：互联网的那点事，欢迎沟通交流

继续滑动看下一个

互联网的那点事

向上滑动看下一个

常德悲剧：让谴责无差别杀戮之声更加响亮一点

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

泪目！8死17伤！江苏一职校持刀伤人案，背后隐情令人心惊！

阿哲点名爆瓜抖音好友！VIc上线喊话！夏可可被扒抵押资产！

Kimi大模型：就汤姆你叫文心一言啊？

您可能也对以下帖子感兴趣

常德悲剧：让谴责无差别杀戮之声更加响亮一点

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

泪目！8死17伤！江苏一职校持刀伤人案，背后隐情令人心惊！

阿哲点名爆瓜抖音好友！VIc上线喊话！夏可可被扒抵押资产！

生成图片，分享到微信朋友圈

Kimi大模型：就汤姆你叫文心一言啊？

您可能也对以下帖子感兴趣