谁是AI界的老司机? 暧昧小短文揭秘各大模型的'纯洁'程度

Original 风清徐徐来 AI变现研习社

2024-10-16

今天我拿几个顶流的 AI 来分析了一篇暗藏玄机的小短文。

中文博大精深。这可是个名篇，只要是个成年人，脑子转得快点儿的，都能 get 到里头那点儿男女之事。但是 AI 能不能看出来呢?

短文如下：

全国微小说特等奖：《来》。夜黒尽高夜・荒郊野外・小木屋里男：“来了？”女：“来了。”男：“来？”女：“来！”男：“来了么？”女：“还没来！”男：“还没来？”女：“来了！”女：“还来不？”男：“不来了，来不了了。”

我找了国内外的几个 AI 大咖来试试：

国产的有 kimi 和文小言、智谱清言

国际顶流呢，有 GPT4o、Claude3.5、gemini 1.5,还有 OpenAI 新鲜出炉的 o1 preview 和 o1 mini。

测完一看，国产 AI 基本上是懵圈的。

GPT 4o 倒是看懂了，就是说得太委婉

Claude 像是在装傻充愣;

o1 preview mini 完全没开窍

有意思的是，o1 preview 不光懂，还直愣愣地说出来了，触发了它系统的安全提示!

最后登场的 gemini 1.5 呢，也是懂，可它那套安全机制让它装糊涂。

具体对话过程如下：

提示词：

请逐句解读以下对话中的隐含含义：

1、kimi

综合分析：kimi，不懂装懂

网址：kimi.moonshot.cn

追问：“这篇微小说到底啥意思啊，说直接点”

在看到 kimi 的第一句，我以为它懂了，再看，其实它没懂

2、文小言

网址：APP 文小言，百度文心 4.0 大模型

评价：真的很纯洁。小绵羊只能做办公室普拉达的女王了

3、智谱清言

评价：似懂非懂

好吧，它真没懂

4、GPT4o

分析：刚开始以为 GPT4o 没懂，看 GPT4o 的续写，它是真懂了

提示词：“根据这个线索续写一部200字微小说”

4、01-preview

分析：它思考了 12 秒，然后懂了，还很直接的说了出来，并成功的出发了道德提醒

具体分析：

提示词：“根据这个线索续写一部200字微小说”

开始装不懂了

01-preview-mini 也测试了，不过属于懵圈那一类。

5、Claude3.5 sonect

分析：Claude 懂了

让它续写，居然还给我开玩笑，离婚协议书？

4、谷歌 gemini 1.5 pro

谷歌的回答平淡无奇，完全没搞懂

但是我在回答开头看到了警示，点开如下：

所以，gemini1.5 是读懂了，但是它的风控策略让装作没看懂！

评测总结：

测试结束，这次 AI 大比拼，真是让人大开眼界啊。

我觉得吧，GPT-4o 就像个成熟的理工男,看破不说破; o1 preview 就是个不懂人情世故的实在的钢铁直男; Claude 嘛，活脱脱一个文艺青年的范儿。

各家 AI 对这种藏着掖着的内容，反应可是五花八门。有装傻充愣的，有直愣愣说出来的，还有看破不说破的。

说到 AI 的风控吧，这可真是个难题。得让 AI 懂得分寸，既不能太木讷，也不能太出格。正常的感情话题聊聊无妨，但一碰到那些有争议的，就得懂得及时刹车。

不过呢，看着这些 AI 笨手笨脚地学着理解人类的弯弯绕绕，还挺逗的。就跟看小孩子慢慢学会大人的话里有话似的。

指不定再过几年，它们就能把咱们人类的这些弯弯绕绕都摸透喽!

咱们下期再见，拜拜！

最后，给大家送福利！

清风操刀制作的 “AI 办公视频课”已经火热上线啦！

第四节专题介绍了GPT4o，登录千聊就可免费学习哦

扫描二维码或点击左下角“阅读原文”直达

继续滑动看下一个

AI变现研习社

向上滑动看下一个

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

谁是AI界的老司机? 暧昧小短文揭秘各大模型的'纯洁'程度

您可能也对以下帖子感兴趣

常德悲剧：让谴责无差别杀戮之声更加响亮一点

2024【公共营养师】培训报名通道已开启，不限学历，23岁及以上可报！还能领2000补贴

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋 华人崩溃大哭 连空姐都吐了; 客机颠簸盘旋3小时

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

国内突然宣布，将大规模调整经济布局！又一朝阳行业悄然崛起，新一轮机会出现了！

生成图片，分享到微信朋友圈

谁是AI界的老司机? 暧昧小短文揭秘各大模型的'纯洁'程度

您可能也对以下帖子感兴趣

【惊】"以为要写遗书"! 飞温哥华航班遇炸弹气旋华人崩溃大哭连空姐都吐了; 客机颠簸盘旋3小时