查看原文
其他

ChatGPT 「AI搜索」 体验与对比

SuperCLUE CLUE中文语言理解测评基准
2024-12-08

本测评结果仅用于学术研究。

10月31日,OpenAI为ChatGPT添加一组新的名为「ChatGPT search」搜索功能。

据OpenAI官方介绍,ChatGPT可以通过聊天,以更自然的对话方式,让用户快速获取最新的网络搜索结果,并附上相关网络资源的链接,无需再切换至其它的搜索引擎。

同时还与新闻和数据提供商合作,为天气、股票、体育、新闻和地图等类别都添加了最新信息和新的视觉设计。

官方表明,搜索模型是GPT-4o的微调版本,使用新颖的合成数据生成技术进行后期训练,包括提取OpenAI o1-preview 的输出。也会利用第三方搜索提供商以及合作伙伴直接提供的内容来提供用户正在寻找的信息。目前,ChatGPT 会根据用户的需求选择搜索网页,也可以手动点击搜索图标。

针对公众关注的「ChatGPT search」功能,我们结合了「AI搜索」基准测评方案,通过SuperCLUE-AISearch 测评体系,对该功能从能力任务和场景应用两大方面进行了考察。

附文章地址,点击即可跳转:「AI搜索」基准测评方案发布

体验环境
体验模型:GPT-4o(官网)、GPT-4o(POE非联网)体验功能:「ChatGPT search」
示例对比
示例1 生活百科

联网回答(官网):

非联网(POE)回答:

示例2 市场分析

联网(官网)回答:

非联网(POE)回答:

示例3 文化与历史解读
联网(官网)回答:

非联网(POE)回答:

小结

总体而言,ChatGPT Search相较于传统的非联网GPT-4o模型,具有以下优势:
1.回答更详尽具体:ChatGPT Search提供的回答深入细致,包含实际案例,均附有引用标注,增强了回答的可信度。
2.图文并茂的回复:对于一些问题,ChatGPT Search会提供相关图片,使回复更加生动形象,提升用户的理解体验。
3.提供具体数据并深入分析:在需要具体数据的问题上,ChatGPT Search会先进行联网搜索,获取最新数据,然后进行深入分析。相比之下,传统的非联网GPT-4o模型通常只提供宏观分析,缺乏具体数据支持。
4.强大的数据收集与整合能力:ChatGPT Search能够收集并整合与问题相关的多方面信息,最终提供全面且准确的答案。

这些特性使ChatGPT Search在信息准确性、丰富性和实用性方面优于传统的非联网GPT-4o模型。

# 加入社群
更多详细「ChatGPT search」测评详情,可加入SuperCLUE GPT-4o和SuperCLUE「AI搜索」交流群。

# 联系我们


「AI搜索」测评申请方式:

邮件标题:SuperCLUE-AISearch「AI搜索」基准测评申请,发送到contact@superclue.ai
请使用单位邮箱,邮件内容包括:单位信息、AI搜索产品/模型简介、联系人和所属部门、联系方式

扩展阅读

[1] CLUE官网:www.CLUEBenchmarks.com

[2] SuperCLUE排行榜网站:www.superclueai.com

[3] Github地址:https://github.com/CLUEbenchmark/SuperCLUE


   点击阅读原文,查看SuperCLUE排行榜
继续滑动看下一个
CLUE中文语言理解测评基准
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存