查看原文
其他

字节跳动“扣子”引入 kimi 做AI引擎,实测效果杠杠的!

风清徐徐来 AI变现研习社 2024-06-01


你好,我是清风

kimi 最近成了国产AI当红炸子鸡

不但访问量冲到了 2024 年 3 月第二名

更是以 320%月环比增长率,位列增长榜首,最新周访问已经位列第一

如果你还没用过或者不了解kimi,参看这篇:

kimi入门到精通[常识篇]

4 月 17 日,kimi 再传喜讯

与两大互联网豪门开启战略合作

一是小红书,一是字节跳动

上午和小红书联合营销,即日起,只需简单地在小红书上分享你与 Kimi 的对话,就有机会获得 kimi 提供的 100 个 200 万长文内测资格。

下午字节跳动官宣,引入kimi 作为“扣子”底层大模型之一,启动了内测

字节跳动的“扣子”是AI聊天机器人开发平台,无代码快速创建,支持插件、知识库、记忆功能。

扣子放出了 100 个测试名额,笔者有幸抢到了一个

下面为你分析分析,再用实际案例跑一跑

看看在不同的AI模型驱动下,扣子平台有什么不同的表现

unset一、强强联合,战略互补unset

两家的合作,半月前就有消息流出

想想也算强强联合,各取所需

1、“扣子”平台引擎乏力

字节跳动目前拥有四款 AI Bot 产品,详情可参考文章《Coze or 扣子?字节系 GPTs 商店一览!》。

“扣子”是一款面向中国市场的新一代 AI Bot 开发工具,它通过集成的插件和自定义开发功能,使用户能够迅速构建个性化的 Chatbot。

与扣子相对应,国外市场上的 Coze 是其国际版。两者的主要区别在于使用的 AI“大脑”、插件以及发布渠道。Coze 具备定时功能,而扣子则没有,但它们的界面和基本功能是一致的。

底层大模型,也就是 AI 的“大脑”,对于 AI Bot 的性能至关重要。Coze 使用的是 GPT-4 模型,而扣子则采用了字节跳动自主研发的云雀大模型。

扣子自 2024 年 2 月 1 日上线以来,以其低门槛和高灵活性的特点受到关注,允许用户将 Bot 轻松发布到豆包、飞书、微信客服等多个平台。

尽管扣子的框架设计赢得了好评,但其背后的云雀大模型在实际应用中的表现却未能完全满足用户的期待。

一些用户反映,在处理复杂任务,尤其是在联网搜索和上下文记忆方面,云雀的能力有所不足。

正如我之前所强调的,要获得良好的 AI 使用体验,选择正确的模型至关重要。

一个“天生丽质”的 AI 模型,其先天的优势远比依赖于提示词或工作流程的后天优化更为重要。

2、kimi 短板明显 

kimi 定位在长文分析,不能画图,不能可视化数据分析,连个智能体商店都没有,使用了一个“常用词”功能代替,但是无法实现复杂的工作流,无法承载更复杂的工作

功能上有需求,商业上互补,强强联手!

unset二、 kimi 扣子平台实测unset

引入 kimi 后,扣子是否表现得好一些呢?

我们来实测下

1、扣子基本操作

扣子的基本操作,看这篇《试用初体验:框架不错,基座不给力!字节跳动 AI Bot 平台“扣子” 今日上线》

2、登录内测平台

登陆扣子,有内测资格,会在左侧看到一个团队空间 “kimi 模型抢先体验”

100 个内测账号创建的 BOT 都在这里

注意,所有 bot,对于团队来讲,都是“透明”的

除了对话记录不共享,其他提示词、知识库等等都是共享的!

3、提示词

我们使用同一段提示词,同一个合同,分别使用“云雀”和 kimi 作为底层模型来测试

为了减少干扰,除了一个 pdf 阅读插件,我们没有外挂任何知识库,来看看对话质量

提示词对合同审阅流程如下:

注意几个关键字:概述合同、分析合同问题、提供具体的修改意见

完整的提示词我已经放到知识星球,加入方式见文末

4、测试

(1)云雀的表现

模型默认是云雀

① 测试合同 1:电脑采购合同

启动审核

审核结果:

`这份合同是关于成都宏达实业有限责任公司(甲方)和成都洋道科技公司(乙方)之间的电脑设备采购协议。

甲方责任义务包括:

  • 优先考虑与乙方合作。
  • 遵守本合同第四条规定,按时将购买电脑设备款项支付给乙方。

乙方责任义务包括:

  • 保证以最优惠的价格为甲方提供电脑设备。
  • 按国家颁布的《微型计算机商品修理更换退货责任规定》相关规定为甲方提供服务。
  • 甲方在乙方所购设备,三环路以内,乙方免费送货上门安装。
  • 一年内,甲方在乙方所购设备有硬件故障,乙方免费上门服务。甲方在乙方购买电脑设备后,即成为洋道会员,无条件享受乙方所有会员优惠。货款的支付方式为甲方在收到乙方电脑设备后,在使用正常的情况下,15 天内,按乙方提供的发票付给乙方货款。

违约责任:甲乙双方应善意履行本协议,遵守各自承担的责任义务;一方违约,另一方有权依照国家有关法规、保护条例、合同法的有关规定追究另一方的违约责任。

争议的解决方式:在合同履行过程中发生争议,双方应当协商解决;调解不成时,可依法向有管辖权的人民法院提起诉讼。

协议的生效:本协议有效期为 1 年,合同期满,乙方具有优先续约权。本协议一式四份,双方各执二份,自双方签字盖章之日起生效。`

很明显,云雀驱动的bot,完全没有按照剧本走,既没有很好的概述合同,也没有提出具体修改意见。

我再次给出提示,ai回答质量才好了一点

② 测试合同 2 装修合同

回答如下:

“这是一份关于禹州江湾汇一期样板房及会所软装工程的施工合同。以下是对该合同的概述:

合同名称:江湾汇一期样板房及会所软装工程施工合同。

建设单位:天地房产房地产开发有限公司。

工程地点:禹州市。

签订日期:2012 年 8 月 日。

工程内容:包括一期样板房软装采购、安装,会所软装设计、采购、安装,总面积约为 688 平方米。

承包方式:合同含税包干总造价为 807 万元,总价包括软装饰配置设计费、家具制作费、人工费、机械费、配件费、辅材费、采管费、包装运输费、上下车费、二次搬运费、安装费、配合费、管理费、清洁保洁费、税金等一切费用。

付款方式:本合同分两批次供货,合同签订后十个工作日内,甲方支付该批次货款总价的 50%作为预付款;乙方备货完毕经甲方确认后支付至该批货款的 50%;安装完毕后,经甲方验收合格并办理结算完毕后最迟 10 月 31 日前支付至结算金额的 95%,剩余 5%作为质保金。

工程期限:2012 年 8 月 日至 2012 年 10 月 31 日。

质量标准:按照附件一的内容要求,至交付甲方使用前的一切费用。

合同变更:乙方专业人员在勘测现场以后,可根据现场实际情况对软装方案进行优化和微调,但需跟甲方进行沟通后双方签字确认,保证在数量、品质和效果上满足要求并有所提升,同时充分实现原软装方案的意图,费用不变。如修改后的设计方案内容有所减少,费用按相应的清单单价扣减。方案签字确认后,数量的增加和减少,费用不变。

质保期:两年。

请注意,以上是对合同内容的概述,具体细节和条款可能因合同的具体情况而有所不同。如果你对合同中的任何条款有疑问或需要进一步的解释,请咨询专业法律顾问。”

这次,云雀对合同的概述勉强可以接受,但是对提示词中给出具体修改意见的要求,完全没响应

(2)kimi 的表现

把模型切换到 kimi。实测结果,非常好的响应了提示词

① 合同 1:电脑采购合同

启动审核

可能是测试模型,豆包上不能上传文件,我直接复制的全文给 AI,以下是回答全文:

“欢迎上传合同文本。我将按照合同审核的流程,对合同进行审查,并提供相关的审核意见。

根据您提供的合同文本,我将:

  1. 概述合同内容。
  2. 根据合同审核要点审查合同,并概述存在的问题。
  3. 提供具体的合同修改意见。

以下是合同的概述和审查意见:

一、合同概述:

合同名称为《电脑设备采购协议》,由成都宏达实业有限责任公司(甲方)和成都洋道科技公司(乙方)签订。合同主要内容包括乙方为甲方提供电脑设备及耗材,甲方通过购买方式取得产品,并对合作内容、甲乙双方的责任义务、货款支付、违约责任、争议解决以及协议的生效等进行了约定。

二、该份合同存在的问题及撰写质量打分:

撰写质量打分:7/10

  • 合同条款较为清晰,但存在一些需要明确和补充的地方。
三、对甲方(付款方)不利的条款:
  • 第四条货款的支付:甲方在收到乙方电脑设备后,在使用正常的情况下,15 天内,按乙方提供的发票付给乙方货款。解释原因:未明确约定验收标准和质量保证期限,可能导致验收时产生争议。
四、对合同的修改建议:
  1. 修改建议编号:1修改原因:明确验收标准和质量保证期限。条款原文编号:第四条原文全文:甲方在收到乙方电脑设备后,在使用正常的情况下,15 天内,按乙方提供的发票付给乙方货款。修改后全文:甲方在收到乙方电脑设备后,应在 5 天内进行验收。验收合格的前提下,甲方在使用正常的情况下,15 天内,按乙方提供的发票付给乙方货款。若验收不合格,甲方有权要求乙方更换设备或解除合同。

  2. 修改建议编号:2修改原因:增加质保期限明确性。条款原文编号:第三条乙方责任义务第 4 点原文全文:一年内,甲方在乙方所购设备有硬件故障,乙方免费上门服务。修改后全文:一年内,甲方在乙方所购设备有硬件故障,乙方应免费上门服务,并负责更换或修理故障硬件。质保期限自设备交付之日起计算。

请根据上述建议对合同进行修改,以降低潜在的风险。如果您还有任何疑问或需要进一步的审核,请随时告知。”

可以看到,切换到 kimi 的合同审查助手,很好的响应了提示词,不但有概述、合同风险分析,还直接给出了修改意见。

② 合同 2 装修合同

unset三、结论unset

扣子的底层模型切换为 kimi 后,回答质量的提高非常明显!

云雀,这个模型目前的版本能力无法发挥扣子平台的优势,更无法撑起扣子的战略定位

底层AI是整个Bot平台的心脏和引擎,挑选一个天生聪明,天生丽质的基座AI,非常重要!

unset四、后继unset

今天只是初步测试,后面还会引用更多的功能进行测试。

一个合格的合同审查助理AI,应该能做到类似 gpts+zapier 功能,如下:

  • 用户上传合同后,先调动企微宝查主体资格
  • 然后根据知识库(合同模板库和制度;合格供方库)审查合同
  • 将审查结果保存为文件,发送到指定邮箱。
  • 结合工作流,实现更多功能


好学如你,请关注本公众号,以便及时收到推送。

付费加入知识星球“浩瀚的 AI 苍穹”后,即可取得 VIP 学习群加入方式!

加入星球,价格每隔 1-2 周适当上调,希望大家尽早入群,懂的都懂!

下是新人优惠券

也可以进入新手群,跟着大家,每天分享最新 ChatGPT ,Sora等实用干货

不懂就问,言多必得!

kimi入门到精通[常识篇]
那是烟花吗?不,那是铁穹!实测 Gemini 1.5 Pro 视频分析功能
AI写公文,看这一篇就够了
音乐 AI 大战开始!Suno 最强对手 Udio 来袭!
爽文AI神器Midreal AI 更新了
kimi打造合同审查助理
Kimi实操案例,如何利用 I 去快速了解一个行业?
音乐 AI Suno 赚钱的九个方法!附入门教程+提示上词

免费使用ChatGPT4 的六个方法!亲测有效!
发型AI,适用大波浪的女生!
炸裂!我用 Suno 音乐 AI 给网飞三体写了首中文主题歌!
GPT-5 2024年夏天发布!期待王者归来
绘画新时代:AI绘图工具全指南
平替GPT?谷歌Gemini 本地化部署教程,轻松实现国内直联!
Esheep,一站式 SD 在线绘图神器,平替 C 站!
今年最炸裂视频AI“Pika”已对所有人开放!附:保姆级教程
万物皆可穿!阿里换衣AI上线
开源!免费!可商用!超过 LLAMA2,媲美 GPT3.5,Mixtral-8x7B 横空出世好用到哭!学会这个技巧,让 ChatGPT 问答质量直线飙升
翻译危险了!国内直联 GPT 新增“科技翻译大师”角色,新增GPT-3.5 16k 长文模型ChatGPT4 最新开通+ API 白嫖大法:免费使用,无需手机验证,无需等待,国内直联
5分钟搞定!AI 写工作总结+ 自动生成 PPT
月之暗面 AI ,1秒搞定20 万字贵州茅台年报
通义听悟:免费!语音视频转文字 AI 利器
保姆级教程!手把手教你支付宝开通 ChatGPT plus!
可视化!用 GPT4 十分钟内完成泰坦尼克号生存分析



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存