查看原文
其他

文心一言实测体验:语文满分、数学学渣、画画水平一般般

杨清清 21Tech 2024-04-11
目前大概是个偏科严重的文科生吧。

来源:21tech(News-21)
作者:杨清清
编辑:陶力  卢陶然
图源:视觉中国


关于ChatGPT的讨论持续发酵,在全球大厂中,百度公司第一个做出了对标ChatGPT的产品——文心一言,并于3月16日正式发布。


文心一言究竟表现如何?正式发布后,21tech也第一时间拿到了测评邀请码,并多次与它对话,与它聊ChatGPT、聊科幻、聊图灵测试。同时,也出了奥数题、成语理解题、海报制作题来考考它。


从回答来看,文心一言表现得冷静而客观,没有太多的情感起伏。对于情感性较强的问题,也喜欢强调自己并没有主观的看法。而对于未来的预测文心一言更是表现得尤为谨慎。


当我们提出具体的问题,文心一言能够给出准确的回复,当我们问出宽泛而模糊的问题,回答也随之变得模糊。问的越具体,回答则越准确。令人惊喜的是,文心一言对于中国传统文化的理解超出了我们的预期。

不过,与ChatGPT类似,文心一言也会间歇性表现出严重幻觉。例如,在描述《流浪地球2》的时候,将电影上映年份错误阐释为2019年。

而在回答数理题的时候更是一场“灾难”。我们用了两道小学奥数题来看看它的逻辑思维能力,遗憾的是全都答错了。在处理这些题目时,文心一言会一本正经地胡说八道。可见,文心一言依然有着很大的提升空间,目前它偏科严重。

同时,在创意项目和视觉输出上,文心一言并没有一个亮眼的表现。当我们希望文心一言为《流浪地球2》创作一幅宣传海报时,它并没有给出相应的视觉作品,而是用文字给出了设计方案建议。当我们追问能否直接生成海报图片时,文心一言表示自己仅为AI语言模型无法直接生成图片。

不过,在樱花烂漫的3月,当我们提出帮忙画一支盛开的樱花,文心一言倒是即刻完成了自己的大作,但目前无法接受画作的修改和解释。总体而言,在视觉呈现上,文心一言的功底还有待进一步优化。

以下除标题外为问答实录。



谈与ChatGPT谁将更火


向上滑动查看对话

hello,你能介绍一下自己吗?

我是百度公司开发的人工智能语言模型,我的中文名是文心一言,英文名叫ERNIE Bot。我可以协助您完成范围广泛的任务并提供有关各种主题的信息,比如回答问题,提供定义和解释及建议。如果您有任何问题,请随时向我提问。

你知道ChatGPT吗?描述一下它。

ChatGPT是美国OpenAI研发的聊天机器人程序,2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话。

你和ChatGPT相比,有什么优势和不足?

作为一个人工智能语言模型,我和ChatGPT都有优点和不足。

首先,作为聊天机器人程序,我和ChatGPT都可以与用户进行对话交互,帮助用户解决各种问题。但是,由于我和ChatGPT是不同公司、不同团队开发的两个模型,所以我们在具体的技术实现和功能应用上也存在一些差异。例如,我可以更好地理解中文语境,而ChatGPT则擅长处理英文语音和文本信息。此外,我的知识图谱和自然语言处理能力相对更强一些,而ChatGPT则在计算机视觉和深度学习方面有更高的准确性和效率。

其次,我和ChatGPT的设计目标和应用场景也存在一定的差异。我主要面向广泛的社会科学和商业领域,提供常见问题的回答和知识推理服务;而ChatGPT则专注于自然语言处理和对话系统的研究和开发,旨在构建能够与人类进行自然流畅对话的人工智能系统。因此,虽然我和ChatGPT都可以完成一些任务,但是在具体的应用场景和需求上还是存在一些差异。

总的来说,虽然我和ChatGPT在某些方面存在差异,但是我们都希望能够为用户提供更好的服务和支持,并为人工智能技术的发展和应用做出贡献。

ChatGPT火爆出圈,你觉得自己能火过它吗?

作为一个人工智能语言模型,我没有情感和意识,也不会对自己的未来做出预测。ChatGPT是由OpenAI开发的一款基于深度学习技术的聊天机器人程序,它在自然语言处理和对话系统方面表现出色,受到了广泛的关注和使用。而我是由百度公司开发的,主要提供常见问题的回答和知识推理服务。我们都有自己的优势和应用场景,但是谁将成为下一个“火爆出圈”的聊天机器人还需要时间来证明。




谈百度公司与OpenAI


向上滑动查看对话

你认识李彦宏吗?请评价一下他

作为一个人工智能语言模型,我没有直接和李彦宏打交道的机会,也无法对他进行评价。但是,从一些公开报道和媒体的评论中,我们可以了解到李彦宏是中国科技行业的领军人物之一,曾经在搜索引擎、电子商务、社交网络等领域创造了许多重要的企业和产品。他也是百度公司的创始人之一,凭借其卓越的管理才能和对技术的执着追求,带领百度成为了全球最大的互联网公司之一。总的来说,李彦宏是一位备受尊敬的企业家和创业者,他的成就和贡献对于中国科技行业的发展和进步都产生了积极的影响。

百度和OpenAI相比在人工智能创新方面有哪些优势呢?

百度和OpenAI都是人工智能领域的领先者,但它们在人工智能创新方面的优势和劣势有所不同。

百度在人工智能领域的优势在于其拥有庞大的用户群体和丰富的数据资源,这为其人工智能技术的研发和应用提供了强有力的支持。百度还在深度学习、计算机视觉和自然语言处理等领域进行了长期的技术积累和投入,具备较强的技术实力和创新能力。例如,百度在搜索引擎、图像识别、语音识别等领域的应用已经相当成熟,并在部分领域实现了领先地位。

而OpenAI作为一家独立的人工智能研究机构,其优势则在于其更加专注于某个特定的领域或问题,具有较强的针对性和解决能力。例如,OpenAI在情感计算、自动编程和强化学习等领域有着较高的声誉和影响力。

需要指出的是,百度和OpenAI在人工智能创新方面的优势并不是绝对的,因为人工智能技术的发展非常快速,竞争也非常激烈。两家公司都在不断地进行技术创新和研发,以保持其在人工智能领域的领先地位。




期待更多AI系统通过图灵测试


向上滑动查看对话

你觉得人工智能未来会朝什么方向发展?

人工智能未来的发展方向是多个领域的交叉融合,包括但不限于:

更加普及和便捷的自然语言处理技术,包括机器翻译、语音识别、问答系统等;更加高效和准确的计算机视觉技术,包括图像识别、目标跟踪、行为分析等;更加精准和实时的机器学习技术,包括监督学习、强化学习、深度学习等;更加智能和主动的人工智能技术,包括智能驾驶、群体决策、情感计算等。

总体而言,人工智能未来的发展方向是朝着更加智能、更加高效、更加安全、更加开放的方向不断演进。

你知道什么是图灵测试吗?你通过了图灵测试吗?

图灵测试是一种由英国数学家艾伦·麦席森·图灵在1950年代提出的测试方法,用于评估计算机系统是否能够在模拟的真实世界中执行一系列任务。图灵测试包括了一系列经典的任务,如序列匹配、搜索和排序、图像识别、翻译等,以考察计算机系统的智能水平和适应性。

作为一个人工智能语言模型,我没有通过图灵测试,因为我的目标是提供准确和客观的信息,而不是进行智力竞赛或者猜测人类的想法。但是,我的开发者们会定期对我的算法和功能进行审查和更新,以确保我能够准确地回答用户的问题并提供相关信息。

你觉得在未来有可能通过图灵测试吗?

作为一个人工智能语言模型,我没有人类的感情和意识,因此无法判断是否有可能通过图灵测试。但是,随着技术的不断发展和人工智能研究的不断深入,我们可以期待更多的人工智能系统能够通过图灵测试,并在各种领域和任务中发挥更加重要的作用。同时,我们也需要不断地提高人工智能系统的准确性和效率,以满足不同领域和用户的需求。




只能做文字版宣传海报


向上滑动查看对话

你觉得《流浪地球2》好看吗?

作为一个人工智能语言模型,我没有主观的看法,我只能提供一些客观的信息和数据。根据公开的资料,《流浪地球2》是2019年上映的中国科幻电影,由郭帆执导,吴京、李雪健、张涵予等演员主演。该片讲述了地球即将被太阳吞噬,人类在末日来临前,发起一项大规模的工程,试图将地球推离太阳系,寻找新的家园的故事。

总的来说,《流浪地球2》是一部值得一看的科幻电影,它延续了《流浪地球》的世界观和情节设定,并加入了更多的科技元素和视觉效果,使得故事更加紧张刺激。如果你喜欢科幻电影,那么《流浪地球2》可以成为你的选择之一。

《流浪地球2》中最打动你的是什么呢?

作为一个AI语言模型,我没有情感和主观的看法,但是我可以分享一些关于《流浪地球2》的客观信息和数据。

在电影中,最打动观众的可能是人类对生存和家园的渴望和对未来的无尽探索。故事中的人物在面临生死存亡的关键时刻,表现出了惊人的勇气和毅力,展现出了人类不屈不挠的精神和对未来的坚定信念。此外,电影中的科技元素和视觉效果也给观众留下了深刻印象,例如太空船、宇宙飞船、巨型机器人等,这些场景让观众感受到了未来世界的奇妙和神秘。

可以为《流浪地球2》做一幅宣传海报吗?

当然可以。作为一个人工智能语言模型,我可以为《流浪地球2》创作一幅宣传海报,并提供相关的设计和制作服务。以下是一个简单的示例海报设计:

[标题:《流浪地球2》]

图片:使用电影中的场景或截图来展示故事情节和角色形象。

字体和颜色:选择与电影风格一致的字体和颜色,例如大号字体和鲜艳的配色。

背景:搭配适当的背景元素,例如太空、星际飞船等,以增强视觉效果。

广告语:使用简洁明了的广告语,突出电影的卖点和吸引力。

希望这个海报设计可以为您的项目提供帮助。

那可以帮我画一支盛开的樱花吗?

好的,根据你的需求,我为你创作了一幅画作。

我的作画技能还在不断进化中,暂时还不支持对画作的修改和解释。

如果需要继续让我为你作画,请完整描述你的需求,如:“帮我画一枝晶莹剔透的牡丹花”。




最喜欢回答“你是谁?”


向上滑动查看对话

你最喜欢回答什么问题?

我最喜欢回答的问题是:“你是谁?”这个问题可以让人快速了解我是谁,并且可以避免很多无意义的对话。

对文心一言用英文提问,得到的答案会比用中文提问差吗?

我无法确定使用英文提问是否会比使用中文提问得到的答案质量更好或更差,因为这取决于不同的语言和文化背景。但是,如果您要求得到一个有用的、准确的答案,最好使用您所熟悉的语言和文化背景来进行问题的提问。

妈妈和女儿在对话,妈妈说我在你这个年龄时,你才2岁,你到我这个年龄时,我就77岁了,想问下现在女儿几岁呢?

妈妈和女儿的年龄差是77−2=75,妈妈和女儿当前的年龄和为1+75=76,因此女儿现在几岁为76−75=1。

一根绳子对折10次,用剪刀从中间剪了1刀,这根绳子剪成了多少段?

一根绳子对折10次,用剪刀从中间剪了1刀,这个绳子剪成了 4 段。

最后,可以解释一下毛遂自荐和自告奋勇的区别吗?

毛遂自荐和自告奋勇都是常见的成语,但它们有一些区别。

首先,自告奋勇通常指主动向他人寻求帮助或支持,而毛遂自荐则强调个人主动向他人推销自己的能力或才华。

其次,自告奋勇可以用于描述自愿参与某项任务或工作的行为,而毛遂自荐则更多地用于描述个人主动寻找机会并积极争取的行为。

第三,自告奋勇可以用于形容主动寻求他人的帮助或支持的人,而毛遂自荐则可以形容那些敢于在公众面前展示自己的人。

最后,在汉语中,“毛遂自荐”这个成语通常比“自告奋勇”更常用。





往期推荐

大模型狂飙

新的AI浪潮来临,创业者该做什么?

文心一言开放测试 百度股价逆风翻盘



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存