查看原文
其他

站在搜索肩膀上的夸克大模型,让AI“幻觉”无处可逃

记录数字化创新的 至顶头条
2024-11-02
站在搜索肩膀上的夸克大模型让AI“幻觉”无处可逃

怎么通俗理解AI幻觉呢,就像“秦始皇骑摩托车”,说白了是驴唇不对马嘴的感觉。

作者 | 任新勃

编辑 | 舞春秋

来源 | 至顶网

AI幻觉指的是人工智能系统在处理信息时产生的错误或歪曲现象,尤其是在解释和生成数据时出现的非现实性结果。

怎么通俗理解AI幻觉呢,就像“秦始皇骑摩托车”,说白了是驴唇不对马嘴的感觉。

在AI领域,虽然AI模型的训练和优化在不断增强,但是基于数据的不断增加,算法的局限性以及复杂系统的不可预测等因素,势必出现训练数据的不足或偏差,从而产生AI幻觉。

比如,文本生成模型编造出的虚假新闻或文章,语音识别系统误解指令或生成不合逻辑的回应,如果这些错误出现在自动驾驶、医疗诊断上,造成的就不仅仅是经济损失,有可能对人的生命造成威胁。

近期,在CMMLU权威大模型性能评测中,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型成绩位列榜首。评测显示,夸克大模型整体能力已经超过GPT-3.5,在写作、考试等部分场景中优于GPT-4。可以说凭借过硬的研发能力及数据、行业、平台等优势成为新晋“学霸”。

夸克技术负责人蒋冠军

那么如何解决大模型幻觉问题,夸克技术负责人蒋冠军给出自己的思考和实践。

夸克技术负责人蒋冠军表示要解决大模型幻觉问题,一方面要先解决知识正确性,另一方面是算法的优化。

算法优化方面,凭借语义理解、逻辑推理、内容生成等技术优势,夸克大模型在CMMLU权威榜单的最新评测结果中,取得排名第一的优异成绩。在国内专业考试测试中,夸克大模型高考成绩接近满分,并以486分的高水平通过临床执业医师资格考试,是名副其实的“学霸”。

知识能力方面,夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。夸克大模型拥有广泛的知识覆盖、上下文理解、创造性表达、信息搜集和整合、多语言支持等,同时具备外接专业知识增强、检索增强能力,进一步提升跨领域、时效性的知识和语言理解能力。此外,夸克大模型还具有撰写各类文本的强大文学创作能力,以及准确、合理、连贯的对话回复能力。

大模型站在搜索引擎上,让AI“幻觉”无处可逃

清华大学新闻学院教授、博士生导师沈阳认为人工智能的基本原理是概率模型,概率模型一定会犯错误。

如大模型无法解决的“幻觉”问题,就无法保证结果的准确性和事实性。比如你问他美国电影的007的男主角和女主角是谁?AI说,男主角是小帅,女主角是小美。这个信息怎么来的?可能是大量短视频里的信息,误导了大模型。

如何确保收集更全面、多样化的数据,从而减少大模型的错误率和知识的正确性,一个重要的措施就是要跟搜索引擎进行连接。

搜索引擎跟大模型的结合是天然之配。包括大模型中最重要的玩家像谷歌、百度,最核心的技术就是搜索。

沈阳教授谈到,未来将会没有搜索引擎的概念,只会有大模型的概念。搜索引擎和大模型之间的逻辑关系如下:

搜索引擎的数据量很大,天然具有各种网络公开数据。

搜索引擎在内容安全上,已经经历了长时间的考验。

搜索引擎中用户提供了大量的查询需求,这些查询需求和用户的点击、返回的结果,本身就是一种交互,对这些交互做一些改造。那么结合大模型的话,可以把搜到的结果做聚合和整合,就可以实现信息理解和交互。

蒋冠军谈到夸克结合搜索,对于大模型错误率的降低有很大的帮助。

对于夸克而言,基于搜索技术能力的积累,在解决幻觉问题时,也就是模型输出错误问题时,还是相对有优势的。

“我们现在的夸克大模型在科普问答,我们纯模型的幻觉率是25%。这个值在国内相对是比较领先的,很多大模型公司宣传时,从来不会讲它的错误率,因为错误率比较高。” 蒋冠军谈到。

夸克基于搜索知识体系的整体积累,结合知识图谱、搜索内容和在医疗、教育、法律行业上的数据积累,通过知识外化的方式,能够把通用知识的错误率降到15%以下。像医疗、法律等行业,现在的搜索结果都是医生三审三校的内容,内容质量很高,夸克也做了很多知识图谱和知识数据的积累和建设。像优质内容行业的知识错误率,能降到5%以下。5%基本上达到较高的可用性。

同时夸克本身就具备强大的搜索引擎,搜索引擎本身就是海量的网页数据,夸克的数据库里就有千亿级网页。这意味着需要有一个非常好的离线系统或工程系统,去处理大规模的网页数据,去做对齐、去重、分析等工作。这个能力的话,跟大模型所需要的能力是非常匹配的,因为大模型就是要大算力,传统搜索引擎就具备大算力。

这样实现了夸克大模型能力在数据、行业、知识正确性、平台等四方面优势。首先,夸克大模型拥有最全面的中文数据库,能更好地理解、评估、提炼中文知识体系;第二,夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料,沉淀了非常丰富的数据及用户场景;第三,在通用知识、写作增强等方面,夸克建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系。第四,夸克组建了数百人的研发团队,在搜索、教育、医疗等垂直领域中进行大模型的预训练与精调。

蒋冠军认为,在解决幻觉问题的过程中,垂直模型比通用模型会优先发展。这是因为通用模型遇到的问题非常多,包括幻觉问题、安全问题、准备性问题。但是进入到垂直模型,垂直到B端,进入到具体的公司,就会有一个垂直业务的具体行业需求,那么很多问题可以解决。比如医疗行业中的大模型应用,既可以通过医学相关的知识推理和医学知识的具体信息来得到相对准确的答案,也可以拒绝回答而让医生来给出更合理的建议。

大模型应用夸克搜索,健康内容更精准

12月25日,夸克App推出健康大模型应用“夸克健康助手”,融合医学知识图谱和生成式对话能力,用户可以在部分搜索结果中,看到由夸克健康助手回答的AIGC内容。与传统搜索结果相比,提供了更加全面和准确的健康信息。

针对AIGC等全新搜索内容形态,夸克成立了夸克健康专家团,与全国顶级公立三甲医院的专家共建大模型内容生态,确保内容层面的专业性、正确性和科学性。此外,夸克还会招募健康大模型精调师,持续地结合用户需求和热门病症,提供最新的健康知识。

基于夸克大模型和全网权威观点汇总,用户在夸克App中搜索健康内容的正确率超过行业平均水平。为了给用户提供更加精准的专业知识,经过精调和知识增强的夸克大模型,以486分的高分通过临床执业医师资格考试。同时在健康内容上的幻觉率已经降低至5%以内,成为国产大模型中的“学霸”。

实现了用户在夸克中搜索健康信息的正确率超过行业平均水平,多样化的信息呈现方式和优质搜索内容将更加便捷和实用。

面向未来,夸克大模型应用于搜索、智能工具和资产管理助手等场景,一系列AI原生应用将为年轻人工作、学习、生活提供更全面的服务。

投稿、合作邮箱:

fu.lin@zhiding.cn

SAP绘制的可持续深水区航线图

《数字经济洞察周报》2023年第31期 | 全国工业和信息化工作会议在京召开



继续滑动看下一个
至顶头条
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存