《语言战略研究》2024年第5期目录与提要
2024年第5期
目 录
卷首语
数智时代语言规划须顺势而为 / 刘海涛
专题研究一 大语言模型
主持人语 大语言模型与语言研究的双向赋能与融合发展 / 杨尔弘,胡韧奋
语言学知识驱动的空间语义理解能力评测数据集研究 / 詹卫东,孙春晖,肖力铭
古汉语大语言模型的构建及应用研究 / 李绅,胡韧奋,王立军
大语言模型的中文文本简化能力研究 / 杨尔弘,朱君辉,朱浩楠,宗绪泉,杨麟儿
“大语言模型”多人谈 / 韩先培,李涓子,刘鹏远,刘知远,王斌,宗成庆
专题研究二 国际中文教育
主持人语 中文二语教学大时代的几点小思考 / 李 泉
论“人群特征”对国际中文教育的学科支撑 / 王汉卫,张馨月
清华大学东欧交换生中国语文专修班建班考 / 施正宇,赵美
国际中文教育工程化的内涵、特征和原则 / 施春宏,马瑞祾
从汉英语作为外语教学的差异试议智能时代的汉语教学 / 陆俭明
“国际中文教育”多人谈 / 崔希亮,崔永华,王海峰,吴勇毅,张旺熹,郑艳群,周小兵
语言战略与话语修辞国际学术研讨会在南京大学召开 / 封二
暴风雨中悼孙公 / 李宇明 封三
《语言战略研究》2025年第2期“边境语言能力”专题约稿启事 / 封四
提 要
语言学知识驱动的空间语义理解能力评测数据集研究
詹卫东,孙春晖,肖力铭
(北京大学 中文系 北京 100871)
提 要 近20年来,深度学习技术显著提升了机器的自然语言处理能力,使之在诸多任务上接近甚至超过人类水平。机器学习的对象不再是直接来自人类语言学研究成果(知识),而是人类语言材料(数据)。在靠数据和算力驱动的大语言模型几近建成巴别塔的当下,语言学家通过深挖语言现象总结的语言学知识价值何在?本文提出从知识到数据的研究思路,设计了空间语义理解的6 项任务:空间信息正误判别、异常空间信息识别、缺失参照成分补回、空间语义角色标注、空间表达异形同义判别、空间方位关系推理,以构建中文空间语义理解能力评测数据集为例,介绍从SpaCE2021到SpaCE2024数据集的设计思想、数据集制作概况以及机器在空间语义理解任务上的表现。总的来看,参加SpaCE赛事的大语言模型,在依赖表面分布特征(形式线索)的任务上容易获得好成绩,在依赖深层语义理解(认知能力)的任务上容易表现不好。因此,在人工智能高速发展使得语言学知识在计算机信息处理领域被动边缘化的当下,语言学知识的价值需要拓展,即用于指导小而精的高品质语言数据,以提升机器学习的效果和效率。为了计算应用的目的,语法研究应该在观察充分、描写充分、解释充分之上,追求更具挑战性的目标——生成充分。
关键词人工智能;大语言模型;语言学知识;空间语义理解;数据合成
古汉语大语言模型的构建及应用研究
李 绅1,胡韧奋2,王立军1
(1. 北京师范大学 文学院 北京 100875;2. 北京师范大学 国际中文教育学院 北京 100875)
提 要 通用大语言模型在古汉语语言信息处理任务上的效果往往不够理想,因此,我们从领域知识学习需求出发,针对古汉语信息处理任务“低资源”“富知识”的特点,从头构建了专门适用于古代汉语理解与生成的大语言模型“AI 太炎”。通过合理的模型设计、数据处理、基座训练及微调,仅使用1.8B参数量即可取得较好效果。该模型具有较强的古典文献释读能力,支持句读标点、典故识别、词义解释及文白翻译等多种具有挑战性的文言文理解任务,兼容简体字和繁体字文本。实验显示,与大型通用模型和其他领域模型相比,“AI 太炎”在多项古汉语信息处理关键任务上表现出明显优势,且达到了接近或超过人类基线的水平。此外,在辅助古籍整理、辞书编纂和语言研究等方面,该模型也表现出了很大的应用潜力。
关键词 大语言模型;古汉语信息处理;人工智能
大语言模型的中文文本简化能力研究
杨尔弘,朱君辉,朱浩楠,宗绪泉,杨麟儿
(北京语言大学 国家语言资源监测与研究平面媒体中心/ 信息科学学院 北京 100083)
提 要 大语言模型为自动文本简化提供了新思路。为了探究大语言模型的中文文本简化能力,本研究构建了中文篇章级文本简化数据集,对其中的平行文本对进行了特征分析;在此基础上,设计大语言模型自动文本简化实验,采用零样本、少样本、少样本+ 词表和少样本+ 规则这4 种提示策略,综合已有的和本研究特有的语言特征评估指标,测评了6 种国内外常用大语言模型在不同提示策略下的中文文本简化能力。研究发现,少样本提示策略在文本特征上表现最佳,显著提高了信息保存度;在提示中加入外部词表,有助于大语言模型使用相对简单的词语;在提示中融入简化规则,能使大语言模型使用更简洁的句法结构。不同的大语言模型在难度控制和语义保留程度上各有优势与局限,但在语篇衔接与连贯和段落划分上与人类专家存在明显差距,且均出现了不同程度的幻觉现象。未来仍需构建较大规模的高质量中文简化数据集,多角度诱导语言大模型的文本简化能力。
关键词 中文文本简化;大语言模型;语言特征分析
论“人群特征”对国际中文教育的学科支撑
王汉卫,张馨月
(暨南大学 华文学院 广东 广州 510610)
提 要 国际中文教育中的“国际”,其实质内涵是“国际人群”,分为海外华人和非华人两大异质性群体。国际中文教育的发展,必然要立足于对其“人群特征”尽可能细致的分析性认识。海外华人是国际中文教育的核心人群,非华人则是潜在的主体人群,面向这两大人群的中文教育分别对应“中文祖语传承”和“中文二语传播”。鉴于新老华人社会祖语保持的现状,“中文祖语传承”的对象人群可细分为“有较好家庭语言环境”“有一定家庭语言环境”“没有或基本没有家庭语言环境”3类,并据此设计不同的核心课程、教材、教法。根据母语文情况,可对“中文二语传播”的对象人群再分类,按文字划分为“汉字文化圈”和“非汉字文化圈”,后者按与中国的地理关系再分为“周边”与“非周边”。根据中文与其他国家语言文字的远近亲疏展开理论探究和教学实践,才能校正与印欧语对比的中文本体观。对象人群的步步细化,相应研究的步步深化,正是国际中文教育的发展之路。进一步丰富对象人群的下位构成,才能实现学术和社会资源上更加合理的分工、配置,以达到精准服务的目的。
关键词 国际中文教育;人群特征;华人/ 非华人;中文祖语传承/ 中文二语传播
清华大学东欧交换生中国语文专修班建班考
施正宇1,赵 美2
(1. 北京大学 对外汉语教育学院 北京 100870;2. 北京师范大学 国际中文教育学院 北京 100875)
提 要 清华大学东欧交换生中国语文专修班是中华人民共和国成立之初,在毛泽东等中央领导人直接参与下,由周恩来主持,并经外交部、文化教育委员会和教育部等多部门协同运作,委托清华大学建立的当代中国第一个对外汉语教学机构。该班发端于中国和东欧五国交换留学生的动议,中外双方就学习内容与期限、生源资质、生活待遇等问题进行了充分的协商,形成了建国初期留学生教学与管理的雏形。1950年9月,清华专修班正式成立,至1952年秋季转入北京大学之前,实有教职员工17人,学生36名。其行政管理分为3个层面:政府层面为东欧来华留学生工作组,由相关部委人员组成;学校层面为外籍学生指导委员会,由校内知名学者组成;机构层面即清华大学东欧交换生中国语文专修班,在行政级别上与“系”平级,由邓懿主持具体教学工作。清华专修班的工作原则有二,一为“分工合作”,二为“民主集中”。回首望去,清华专修班的建立不仅培养了一批知华友华的外国学生,而且为中国对外汉语教学的发展奠定了稳固的基石,在中国乃至世界汉语教育史上占有重要的一席。
关键词 清华大学;东欧交换生;中国语文专修班;组织架构;国际中文教育
国际中文教育工程化的内涵、特征和原则
施春宏1,马瑞祾2
(1. 北京语言大学 语言科学院 北京 100083;2. 北京语言大学 信息科学学院 北京 100083)
提 要 国际中文教育工程化就是用工程思维来解决国际中文教育过程中的相关问题,大体可以理解为运用相关知识和技术去配置教育资源和教学手段,按照一定的规范和标准通过集成化的方式来构造可用于国际中文教育领域的产品。其基本特征可以从目标层面和操作层面两方面进行概括。前者包括需求驱动性、产品导向性、功能助推性,后者包括要素集成化、结构模块化、规程条理化、运行平台化。从本体论、认识论、方法论和价值论出发,可以提出国际中文教育工程化应遵循的4条基本原则:整体思维和组块思维相结合、工具性和人文性相结合、数据驱动和人机协同相结合、规模化和个性化相结合。可以说,工程化实践已经成为推动国际中文教育新生态出现和发展重要而基础的路径。
关键词 国际中文教育;工程化;工程思维;特征;原则
从汉英语作为外语教学的差异试议智能时代的汉语教学
陆俭明
(北京大学 中国语言学研究中心/ 中文系 北京 100871)
提 要 汉语和英语作为外语教学的相异之处突出体现在:中国人学英语,口语与书面语的学习几乎是同步的;而英语区学生学习汉语,口语与书面语的学习无法同步,从口语学习进入书面语学习,必须在汉字学习上再下功夫、花时间,过好汉字关。智能时代,可以用拼音击键或语音输出汉字,这为破除“汉语难学”的迷信带来机遇。国外学者使用“电写为主,笔写为辅”教学模式,取得了良好的教学效果。本文进一步提出“电打汉字开路,笔写汉字跟进”的新思路:在汉语学习的开始阶段,先教授、引导学生“电打汉字”,让学生破除对汉字学习的畏难情绪;再在教学过程中适度穿插“笔写汉字”的练习,引导学生逐步由“电打”过渡到“笔写”,因为“笔写”有助于对汉字的记忆、体会和认识,确保学好汉语书面语。
关键词 汉语作为外语教学;智能时代;汉字教学模式;电打汉字
编 排:韩 畅
审 稿:王 飙 余桂林
相关推荐
《语言战略研究》入选为CSSCI(2023—2024)来源期刊
《语言战略研究》入编《中文核心期刊要目总览》2023年版语言学类核心期刊
本刊从未与任何第三方合作从事征稿、审稿及发稿活动
从不以任何形式收取版面费、审稿费
请认准本刊官方网站界面→
编辑部联系方式
电话:010-65219062,010-65219060
电子邮箱:yyzlyj@cp.com.cn
地址:北京市东城区王府井大街36号
投稿网址:yyzlyj.cp.com.cn
订阅方式
1.全国各地邮局订阅,邮发代号:82-104.
2.网店订阅:
(1)商务印书馆官方微店 (关注商务印书馆微信公众号;点击公众号页面底部的“官方微店”;在微店中搜索“语言战略研究”即可下单)
(2)商务印书馆京东旗舰店 (登录旗舰店,搜索“语言战略研究”即可下单)
3.中国邮政—微商城(微商城中搜索“语言战略研究”,即可预订全年)
↓↓↓点击“阅读原文”可访问本刊官网