查看原文
其他

大语言模型与语言研究的双向赋能与融合发展(杨尔弘 胡韧奋)

The following article is from 语言战略研究 Author 杨尔弘,胡韧奋

共享学习,信息时代的生活方式。知识传播摆渡人,专注推荐好文好书好资源——加油,研习人!

欢迎关注我们,一站式分享海量语言学术资源

来源编辑:语言战略研究、语言监测与智能学习公众号

转载编辑:研习君

我们的宗旨:助研助学,促进交流



敬请星标应用语言学研习,喜欢请点赞,分享请转发




敬请关注并星标,欢迎点赞、在看、转发!

大语言模型与语言研究的双向赋能与融合发展

杨尔弘   胡韧奋

2024年第5期



专题研究一

大语言模型


 主持人语 


本期嘉宾

杨尔弘

北京语言大学教授

胡韧奋

北京师范大学副教授


大语言模型与语言研究的双向赋能与融合发展

大语言模型(以下简称“大模型”[1])是当前生成式人工智能最主流的技术,具有强大的生成、迁移与交互能力。简单地说,该技术通过训练模型阅读海量文本,使其在语言表达、即时对话、任务规划、逻辑推衍等许多方面具备了与人类媲美的能力。目前,学界业界主要围绕3个方面开展大模型的研究:(1)倾尽所有算力,通过提高数据质量、优化模型架构和训练策略等各种手段来研发基础、通用大模型,提升模型能力;(2)深入探索大模型的机理,拓展其性能,将最初仅能处理文本的模型,推向兼具文本、语音、图片、视频处理能力的多模态大模型;(3)开发专用或领域大模型、多智能体框架,以满足特定目标,拓展其应用场景。这些研究为大模型应用奠定了物质基础,为大模型的使用者提供了模型选择空间。

大模型的评测研究是伴随其研发同时开展的。为了探究大模型各种能力的天花板,对比不同大模型对特定任务的适配性,引导模型不断地改进优化,满足应用需求,研究者开发了公共的评测平台,设计评测任务和测试试题,从语法、语义、语用、逻辑、知识、计算、推理、规划等各个维度开展大模型的能力评测。在所有评测任务中,语言能力的测试是其中最重要、最基础的内容。深入挖掘语言研究成果,精准地设计探测、激发大模型深层语言能力的测试试题,是利用语言学研究成果引导大模型技术推进的一种方式,同时也向语言学研究提出了挑战。

大模型超强的智能表现,不但大跨步地推进了人工智能的发展,改变了其研究范式,同时也深刻影响着社会生活,为各个领域的研究带来新的契机。就语言研究领域而言,大模型为语言研究带来了新的研究对象和工具。首先,大模型是通过海量阅读、自注意力机制、强大的神经网络、反馈学习等技术学到了与人类比肩的语言能力,这些技术与人类获得语言能力的过程是否一样?与已经存在的语言学理论是否一致?其次,大模型使自然语言不再是人类独有独用的产物与工具,机器生成的与人类产出的语言及其内容各自有什么特点?第三,大模型作为分析语言数据的强大工具,促进了大规模、深层次的语料加工,既可以辅助语言现象的系统描写和语言规律的挖掘,也可以为模型训练提供高质量的数据。因而,大模型与语言研究是双向赋能、融合发展。

将大语言模型与语言研究相结合,首先要了解模型的“能”与“不能”。前期研究表明,大模型擅长解决答问、闲聊(含角色扮演)、翻译、文本摘要、改写、创作、信息抽取、代码分析与生成等类别的任务,但在以下能力上存在缺陷:(1)大模型往往生成流畅但不准确的内容,即产生“幻觉”现象,表现为语义理解、逻辑关联、基本常识、领域知识等方面的错误。由于大模型的工作机制目前仍处于“黑箱”状态,解决幻觉问题还需要时日。(2)由于预训练模型的成本极高、微调数据规模有限,对于时效性、专业性较强的问题,大模型几乎没有能力处理。[2](3)大模型强依赖于预训练数据中的先验知识,生成文本极易受其影响,例如在修正语法错误时,模型往往存在过度修改润色的情况。(4)模型目前还无法准确理解、区分不同数字的含义。因而人们以试探、引导的方式应用大模型辅助人类提高效率。

利用大模型开展语言研究,有3种访问大模型的方式:(1)通过网页或者APP对话;如文心一言、ChatGPT、智谱清言等;(2)通过API调用,如GPT4、Qwen-turbo,智谱AI等都提供了API接口;(3)使用开源模型,如Llama系列、Qwen系列、ChatGLM系列等,还可对它们进行微调或二次开发。无论哪种方式,其本质主要是利用大模型强大的上下文学习能力和迁移能力,引导其适应具体的语言研究任务。因而先测试模型对应的能力,然后有目标地开展引导,诱发出大模型潜在的知识和能力,已经成为大模型应用的一种主要模式。

“提示”是当前最通用、最便捷的引导大模型的方式。“提示”有不包含任务样例(零样本),包含少量样例(少样本),以及附加额外知识等形式,而提示词的设计直接影响对模型引导的效果。设计提示词的常用策略包括:

第一,为模型设定角色,如“擅长分析语言现象和总结规律的语言学家”“经验丰富的国际中文教师”等。

第二,给出清晰具体的任务说明和解决方案,包括:(1)提供必要的背景信息和具体的任务说明;(2)给出问题和答案示例;(3)针对复杂任务设定分步骤解决思路;(4)提供外部知识库或工具检索等必要的专业知识作为参考;(5)设置限制和要求;等等。

第三,在提示词的格式方面,建议:(1)用换行符和###、"""等分隔符来区分提示的不同部分(如指令、背景信息、输入数据等),让模型更容易区分和理解;(2)可要求模型以特定格式输出,如列表、JSON等,以便在批量调用时获得结构化、易解析的结果。

第四,通过API调用模型或使用开源模型时,宜参考文档设置合理的参数值,例如,当追求模型输出的一致性和稳定性时,可将temperature参数设为接近0的数值。[3]

综上,利用大模型开展语言研究时,人的判断、决策与引导扮演着极为关键的角色。人工智能时代的语言研究亟需深入诊断模型机理,充分挖掘模型潜力,使得大语言模型和语言研究实现双向赋能。在这一探索过程中,或会引发诸多值得探讨的新问题,例如,语言学知识如何赋能语言智能技术发展,实现知识与技术的双向迭代?如何高效地为模型注入专门领域知识,以减轻幻觉现象,并促进解决专业性问题?人类社会存在高度多样性和复杂性,如何探究模型与人类价值观对齐的方法论?多模态大模型与多智能体等技术的发展又会为语言研究带来哪些新的挑战和机遇?为此,《语言战略研究》期刊专门组织了“大语言模型”专题,邀请语言学与计算机领域的研究者们共同探讨相关问题,围绕领域模型的研发、模型的特定语言能力测试任务设计与分析,利用大模型辅助具体语言问题的研究,交流他们的研究成果;同时,就语言知识的研究与利用、语言数据与人类知识的相互融合来为大模型提供资源,大模型及智能体对研究和应用产生的影响,以及大模型带来的安全、价值取向和伦理问题,交叉学科人才培养,等等,给出了研究者的观点,期待通过上述交流,推动语言学与人工智能技术的创新融合发展。

[1] 本应简称为“大语模”,但现在业界普遍使用“大模型”。

[2] 为缓解这一不足,研发团队往往会借助联网搜索等方式为模型提供额外参考信息,使其支持较好的实时反馈,但对于互联网无法检索到有效信息的专业性问题,模型仍难以提供理想回复。

[3] temperature和top_p等参数影响模型输出结果的多样性和随机性,网页或APP端产品往往会设置较高的参数值,因此同一个问题多次提问会收到不同结果。


该文发表于《语言战略研究》2024年第5期,引用请以期刊版为准,转发请注明来源。


编排:逯琳琳

审稿:王   飙 余桂林

综合编辑:应用语言学研习

微信公众平台审核:研习君

《区域国别与跨文化研究》征稿启事
(入选“高盟学术刊物发展专门委员会”观察员)
点击图片查看“高盟”简介

欢迎关注“高盟”微信公众号↓↓↓


语料库入门十讲 + 给文科生的Python编程课(卫乃兴 管新潮 甄凤超 庞双子等主讲)

平均立项率达27%!国家社科基金后期资助项目——从规划到结项


推荐阅读


欢迎点击下方关注公众号,获取最新交流群二维码


技能提升

国家社科基金后期资助项目——从规划到结项

推荐 | 肖桐、朱靖波著《机器翻译:基础与模型》

国家社科中华学术外译项目申报:要点、重点和关键点

研习指南

国内外常见语料工具一览

收藏 | 国内外好用的语料库资源汇总
科研工具 | 46款免费机器翻译平台大集合
讲座回看 | 文献综述如何催生论文、专著和项目
翻译必备术语库和语料库合集(附网址)!
书单 | 41种语言学好书推荐,值得收藏!


新书推荐

专题讲座


基础文献荐读

推荐阅读:
给文科生的Python编程课(上海交大外院管新潮教授 主讲)
语料库入门十讲(卫乃兴 甄凤超 庞双子 等主讲)
《区域国别与跨文化研究》征稿启事
完整版南大核心(2021-2022)期刊目录
乔姆斯基其人其事丨“语言学那些事”系列
文库又上新啦!外国语言学及应用语言学专业的小硕小博们都在学些啥?
研究方法专栏讲座 | 三大研究范式:定量、定性、混合研究
书单 | 语言学好书50种,强烈推荐!
收藏!MTI 翻硕研究生必读书目(2022年版)
147所双一流高校博士毕业发表学术成果要求汇总
刚刚,2022软科世界一流学科排名发布
语言学CSSCI 集刊集锦(附投稿信息)
语言文学八大刊物选题征集汇总
重磅丛书 | 语言学及应用语言学名著译丛书目
请查收全网最全的论文搜索下载渠道
北京外国语大学英语学院本科生推荐阅读书单
上海外国语大学英语学院推荐必读书目
书单 | 北京大学中文系及英语专业推荐阅读书目
138页PPT | 划重点、打七寸:毛浩然教授分享国家社科项目申报的器与道
乔姆斯基晚年学术思想的集中展示丨《语言的科学》(汉译世界学术名著丛书)面世
第五届中国语料库语言学大会:思想与技术(1号通知)
书单 | 语言学好书50种,强烈推荐!
书讯 |《认知语言学》中译本出版!
《外语教学》2022年第4期目录
《现代外语》2022年第5期 目录及摘要
讲座回看 | 黄忠廉教授:国家社科后期资助项目申报书的设计与书稿的打磨
重点栏目介绍 | 中国外语教育变革大讨论
重磅|2022年中国人文社会科学集刊评价名单(语言学)
Chomsky最新讲座回放:“语言学创新”系列讲座(二)
访谈Noam Chomsky:语言学研究的回顾与展望
英语学习 | 可汗学院 英语语法 全121讲
重磅|2022软科中国大学专业排名(语言学)
访谈视频 | 乔姆斯基:语言最大的用途并不是交流
收藏|15个国外主流免费学术论文数据库(国内直接打开)
语言学家David Crystal 访谈:母语者神话
中国英语教学的十大神话(Myths)
视频回放 | 2022年版义务教育英语课程标准解读(王蔷)
重磅!《义务教育英语课程标准(2022年版)》全面解读(PPT分享)
重磅新书 | 乔姆斯基《句法结构》(第2版)汉译本
陆谷孙:中国学生应该如何学英语?
“当代国外语言学与应用语言学文库(升级版)”又上新啦!
科研工具 | 46款免费机器翻译平台大集合
南大核心CSSCI全学科期刊目录(含扩展版)
教育部发布:第1~13批外语词中文译名,建议收藏!
【名家论坛】姜望琪 / 好翻译的标准
纠正对“以学生为中心教育”的误解
大家观点 | 邢福义:“复制”与“抄袭”
重磅资源丨新冠疫情英语语料库
人工智能时代下语言学研究的理念与取径
文献综述高分模板:引言、主题+结论
近五年国际中文教育领域高层次立项清单
首部对标《等级标准》的《国际中文学习词典》
全国翻译硕士专业学位点详情表(截至2022年4月12日)
福利 | 273款答辩PPT模板送给辛勤写论文的你(附答辩攻略)
《外语教学与研究》2022年第3期目录
《外语教学》2022年第3期目录
讲座回放 | 程晓堂:义务教育英语课程发展的新方向
【学术前沿与动态】国外课堂二语习得研究动态(2010—2019)
王守仁 | 从语言能力到核心素养:新课标的课程目标及其变化(论坛发言最新修改稿)
生成语法学的研究内容及研究方法(徐烈炯著《生成语法理论》选读)
资源分享 | 语言学、文学公开课精选
重磅丨2022软科中国语言类大学排名出炉(附中国大学完整排名)
负面清单!研究生千万别在这些刊物上发文章!
广东外语外贸大学开放33门精品在线课程!
西安外国语大学开放25门精品课程,附课程链接
上海外国语大学开放50门精品课程!(内含链接)
北京语言大学开放45门在线课程
学位授予单位外国语言文学一级学科下自设交叉学科名单(不含军队单位)
推荐10本最适合学英语的外刊
争鸣 | 语料库语言研究的“器”与“道”
讲座 | David Crystal: The future of Englishes (回放链接+笔记)
吴岩司长近5年(2018-2022年)报告汇总(35篇)可下载
快收藏!第94届奥斯卡10部获奖大片高清完整版【在线观看】
学术前沿 | 外语学习无聊情绪研究: 综述与展望
Noam Chomsky | Mind Your Language
陆俭明 |“学好语文是学好一切的根本”
翻译常用的22个语料库
100部必看的高分英文电影,千万别错过!(资源合集)
陈平:语言学的一个核心概念“指称”问题研究
CSSCI来源期刊最新总目录(含扩展版,2021-2022),建议收藏!

扫码关注↑↑↑ 即可获取最新入群二维码!

目前已有 10.6 万语言文学、区域国别与

跨文化传播学研习者关注本公号

欢迎加入交流群,分享学习,共同进步!

欢迎点赞、在看、分享三连!

一个,点亮在看
继续滑动看下一个
应用语言学研习与区域国别学
向上滑动看下一个
选择留言身份

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存