10秒分析2万字论文,这款大模型能帮我写毕业论文吗 | AI实测
7月26日,网易有道正式发布“子曰”大模型,并上线了基于“子曰”大模型的六大应用成果——“LLM翻译”、“AIBox”、“语法精讲”、“文档问答”、“虚拟人口语教练”、“AI作文指导”。
作为首个教育领域的垂类大模型,“子曰”的表现究竟如何?能满足我们对教育垂类大模型的期待吗?
翻译生产力工具——“LLM翻译”
网易有道无疑在国内翻译领域领先多年。
据官方数据,有道翻译的月活用户数超1亿,是国内排名第一的词典和翻译类的产品。随着用户对于翻译质量的要求越来越高,从“能看懂就行”逐渐变成“精准表达”,搭载LLM(大语言模型)的有道翻译,翻译的质量如何?能够满足用户的需求吗?
我们摘取了外国新闻网站上关于新电影《奥本海默》的报道片段,分别对“LLM翻译”以及人工智能机器人Claude ai进行对比测试。
但在后续对于《奥本海默》的翻译理解,两者都没有将其准确翻译为“奥本海默的上映……正值新技术大量涌现”。
Claude ai在表述上不符合中文的表达习惯,而“LLM翻译”忽略了“上映”这个词,可能是由于缺少具体的篇章背景,导致翻译不够准确。
尝试过英译中之后,我们决定再测试一下两者对于古诗词的翻译理解。
“请将‘飞流直下三千尺,疑是银河落九天’翻译成英文。”
结果有点出乎意料,将中文翻译成英文时,Claude ai能够以对仗形式同步翻译成英文。
反观“LLM翻译”以诗人为第一视角,翻译成英文时补充了缺失的主语对象,但将“瀑布”翻译成“swift current”(水流速度较快的溪流),没有“waterfall”来得准确。
总的来说,有道LLM翻译在英译中的领域,可以根据语境提供更地道的翻译,有些表述优于Claude ai。和传统的机器翻译相比,理解准确度、表达通顺度以及语义流畅性,都有明显提升。而在中译英环节,LLM翻译对单个词汇的选择,不如Claude ai表现得那么精准。
网易有道CEO周枫在发布会上表示,这款“LLM翻译基于有道多年积累的神经网络翻译数据,使用了大量的新技术,包括此前未曾采用的单语言语料,在理解上下文、常识推理方面的能力,能给大家更好的翻译体验”。
语句润色助手——AI box
根据所写文章的风格不同,用户也可以选择“更华丽、更友好、更简洁”等等,AI box同时会进行相应的语法纠错:
下方显眼的“让词汇更符合SCI论文写作”妥妥的科研党福音
参考文献不再是难事——文档问答
在学术研究中,阅读文献是最常见也最耗时的环节。
众所周知,ChatGPT没有办法读长论文,而更新后的Claude 2在文本分析、长文档处理方面尽管有所加强,但花费时间较久。
网易有道首席科学家段亦涛表示:“有道的文档问答功能能够让用户工作效率提高十倍。”
我们尝试上传了一篇近2万字的新闻学领域论文,大概10秒后,“子曰”大模型便将它全文翻译了一遍,并且针对不同的页面进行了总结性发言。
在文档问答页面,原文和译文会分别展示,我们可以针对论文细节,进行标注和截图提问,有道速读都可以快速给出回答。
如果你不想读完整篇论文,可以直接让大模型总结论文的最终结论:
同样也可以让它解释一下论文中的新概念,帮助我们更好理解论文的相关内容:
除了上述的几项应用功能外,“子曰”大模型还将重点放在了英语学习中需求较大的领域——口语陪练。
目前,在网易有道的内测网页可以体验AI口语教练功能。
我们可以和口语教练谈论任何感兴趣的话题,每个话题页面下都有相关的学习目标和挑战,以鼓励用户在对话中积极表达。
和同类产品相比,“口语教练”有什么优势?此前,科技公司Animato发布了一款真人对话人工智能“Call Annie”。这位叫Annie的30岁女性,能够承担一对一的外教工作,帮助用户训练口语和听力,Annie一度也成为了互联网AI名师。
我们尝试发现,Annie的语速和VOA(美国之声)差不多,并且是个“话唠”。
如果开启了一个话题,你就很难打断她,只能静静听她分享完,一时分不清究竟是谁在训练英语。
有道研发团队表示:“通用的对话机器人是无法满足口语练习的要求的。Call Annie的产品定位并非是外语学习,更像是一个虚拟助手。我们优化了口语教练模型的启发性,我们期望这个模型能够更好地引导用户说英语。”
基于口语教练的功能,此前在2023世界人工智能大会上,网易有道便带来了升级版的口语教练——虚拟人口语陪练Echo,结合了有道自研的“子曰”大模型,还有网易伏羲大模型提供的虚拟人生成技术。
对于虚拟口语教练,有道研发团队在发布会坦言,“口语陪练毕竟是一个百亿的市场,期待这位口语教练,能慢慢取代真人陪练。”
针对语言学习,网易有道还推出了“AI作文指导”功能,解决学生在日常写作中面临的素材匮乏、主旨不明确等问题。
我们从高考作文中选择了一道作文题,让“中文写作”功能试着写一写。
“想要创作一篇好的文章,最难的是什么?网易有道智能硬件产品经理高慧湍在发布会上指出,“找到创作的思路才是写作中最难的部分。”
他强调,“AI作文指导功能提供的更多是写作中的创作方法和思路,而不是简单的素材和范文。”
“帮我改”的功能可以深入理解作文的内容,从表达、结构、情感、素材丰富度四个维度进行作文改写。
最终,这段包含错别字修改、改进建议、好词好句、作文总评等内容的作文批改,会被综合成一份完整的报告。用户就能根据这份报告,有针对性地提高薄弱环节。
以上几项应用,都是在不同的教学场景下,人和AI技术完成的一次教与学的互动。
当科技巨头纷纷将精力投入大模型研发,各类企业参与着大模型在教育场景的落地。
今年5月,科大讯飞发布了全球首款搭载大模型的AI学习机,提供作文批改、模拟口语老师对话等功能。
5月8日,学而思宣布计划研发数学大模型,主要面向全球的数学爱好者,以数学解题和讲题算法为核心。
步步高同样更新上线了步步高学习机,推出AI生成个性化知识图谱、AI智能推荐相似题等功能。
在ChatGPT爆红之后,周枫接受采访时就表示,有道是国内自然语言处理能力领先的公司。其实继五月网易有道发布一段基于“子曰”大模型研发的AI口语老师剧透视频后,7月这款类ChatGPT模型“子曰”才正式上线,显得有些“姗姗来迟”。
“比起其他AI工具的聊天对话能力,网易有道大模型更注重的是教育应用的落地”,周枫在发布会上强调,“子曰大模型不仅可以帮助学生更好地学习,也可以帮助教师更好地教学,一对一的教学更多地变成现实”。
“子曰”大模型在未来能否成为教育行业的“全能老师”,有待时间验证。
「头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
也欢迎围观小红书@头号AI玩家,我们在这里日常练习AI绘画,目标每日一更。