汉语复句句法语义关系判定研究
人类进入信息化时代,语言愈益成为一种重要的信息资源和载体。有关语言信息处理的研究已成为人工智能领域和自然语言机器理解的热点议题。为了顺应时代发展和科技进步的需求,著名语言学家邢福义(2004)在学界率先倡导了“汉语复句信息工程”的学术理念并启动相关研究。
汉语复句(compound sentence,CS)句法语义关系判定,是从中文信息处理的角度提出的论题,它是复句本体研究和应用研究的有机结合,亦对“汉语复句信息工程”理念的一次探索性尝试。进行汉语复句句法语义关系判定研究,是中文信息处理领域“句处理”面临的攻坚任务,也是推进复句信息工程的重要内容之一,同时还有利于深化对汉语复句联结机制的认识,对汉语研究、对外汉语教学及词典编撰亦有借鉴价值。
中文信息处理领域在实现了字、词处理后,迫切需要解决“句处理”的问题。因为计算机真正要实现自然语言的处理与理解,必须解决“句处理”这一关键性难题。根据陆俭明的观点,所谓句处理,就是怎样让计算机处理、理解自然语言中一个句子的意义,怎样让计算机生成一个符合自然语言规则的句子。为实现“句处理”的目标,需要计算机和语言学领域专家、学者的联合攻关,这愈来愈成为学界共识。
事实上,中文信息处理领域的有关研究一直对单句的自动句法分析关注较多,而对复句的句法分析则关注得很不够,有关复句的信息处理研究目前还很薄弱。但是,汉语复句是连接小句与篇章的中间桥梁,其数量在语言表达和使用上远比单句多,因而汉语复句理应成为“句处理”战略目标实施的重要试验战场。从这个角度来说,以复句的应用研究为突破口,开展复句信息工程是满足这一要求的重要途径,而复句层次关系的自动识别作为复句信息工程的重要内容之一,也是实施“句处理”战略目标的题中之义。
从机器理解的角度研究汉语复句层次关系的识别,既需要语言学领域复句研究成果的支撑,也需要关注复句应用研究在计算语言学领域的发展态势。
作者:吴锋文
书号:9787030715296
出版社:科学出版社
出版时间:2022-5
内容简介
进入信息化时代,语言愈益成为一种重要的信息资源和载体。语言信息处理及智能理解成为学界的焦点议题。
本书以小句中枢说、复句三分理论及模式识别思想为指导,以“关系标记为主,句法语义特征为辅”为原则,以复句语料库为基础,以汉语复句句法语义关系的判定为核心内容,综合运用关联词搭配思想和特征描写方法,规则和特征相结合、归纳与验证相结合的方法,区分有标复句的充盈态和非充盈态,梳理汉语复句句法语义关系判定的影响因素,研究复句知识库的构建与应用问题,挖掘复句标记序列及其层构模式,探求分句句法语义关联规律及复句知识表示问题,系统研究汉语三句式、四句式复句的句法语义关系判定问题。
本书目录
第一章 导论 1
第一节 本书论题的阐释 1
一、选题的依据 1
二、术语的界定 1
第二节 本书的研究背景 5
一、语言学界的研究 6
二、应用层面的研究 10
三、相关研究评述 12
第三节 本书的研究基础 14
一、理论基础 14
二、研究方法 15
三、语料资源 16
第二章 汉语复句句法语义判定的影响因素 17
第一节 非分句层面的影响 18
一、非分句的界定 18
二、分句的认定标准 19
三、非分句语段的类型 20
第二节 关系标记层面的影响 24
一、与同形异类词的区分 24
二、与同形异构词的区分 25
三、关系标记不同用法的影响 26
四、关系标记隐现形式的影响 29
第三节 句法结构层面的影响 31
一、相同句法结构的归并 31
二、句法成分的共享 33
第四节 语用因素层面的影响 34
一、回指形式的理解 34
二、句首话题语段的确认 35
三、独立语的处理 36
四、分句句序逆置的处理 37
第三章 复句关系标记库的构建与应用 40
第一节 复句关系标记库的构建 40
一、复句关系标记的标志作用 40
二、复句关系词库的构建路径 41
三、关系标记信息的表征及运算 48
第二节 复句关系标记库的应用 49
一、搭配形式的自动判断 50
二、连用形式的自动判断 51
三、单用形式的自动判断 53
第四章 三句式复句的句法语义关系判定研究 55
第一节 关系标记与复句句法语义判定疑难 55
第二节 三句式复句关系标记联列分析 57
一、复句标记序列分析的必要性 57
二、1-2型句法关联的标记序列分析 60
三、2-1型关联模式标记隐现形式分析 65
第三节 三句式标记充盈态复句的句法语义判定规则 71
一、三句式有标复句标记充盈态模式 71
二、三句式充盈态有标复句的句法语义关系判定 73
第四节 三句式复句“果-因”配置的层构关联分析 79
一、三句式复句“果-因”配置的句法表现 79
二、三句式复句“果-因”配置的语义类型分布 82
第五章 四句式复句的句法语义关系判定(上) 88
第一节 汉语四句式复句标记序列联列分析 88
第二节 基于模式识别的四句式复句句法语义关系判定 96
一、模式匹配思想句法 96
二、四句式复句层构关联模式 97
三、基于模式匹配的四句式复句句法语义关系判定 97
四、实例分析及说明 112
第三节 “二标四句式”复句的句法语义关系判定 113
一、“二标四句式”复句的知识表示及其分类 114
二、充盈态“二标四句式”复句的句法语义关系判定 116
三、非充盈态“二标四句式”复句的句法语义关系判定 119
第四节 “三标四句式”复句的句法语义关系判定 125
一、“三标四句式”复句的知识表示及其分类 126
二、充盈态“三标四句式”复句的表里映射关系 128
三、充盈态“三标四句式”复句的句法语义关系判定 130
四、研究余论 137
第六章 四句式复句的句法语义关系判定(下) 138
第一节 “四标四句式”复句的句法语义关系判定 138
一、“四标四句式”复句标记序列及层构关联 138
二、“四标四句式”复句的句法语义关联的判定规则 140
第二节 “五标四句式”复句的句法语义关系判定 146
一、“五标四句式”复句界定 146
二、“五标四句式”复句标记序列及层构关联 147
三、充盈态“五标四句式”复句的句法语义关系判定 149
第三节 “六标四句式”复句的句法语义关系判定 156
一、“六标四句式”复句及其标记序列 156
二、“六标四句式”复句的句法语义关联的判定规则 157
第四节 “搭配标+搭配标”四句式复句的句法层构与语义关联 158
一、“搭配标+搭配标”四句式复句的句法层构 159
二、“搭配标+搭配标”四句式复句的语义关联 160
第七章 汉语复句句法语义关系判定的知识表示 170
第一节 基于分句语义关联度思想的复句句法分析 170
一、分句语义关联度 170
二、紧邻分句谓语语义相关性问题 173
第二节 汉语复句层构中主语一致性的表现及其制约 179
一、分句主语一致性界定 179
二、主语一致性在复句中的表征 180
三、主语一致性对分句聚层关联的制约 187
第三节 基于特征权值的无标分句层次归属判定 190
一、基于特征权值的无标分句层次归属识别流程 190
二、分句关联特征的选取 193
三、特征权值的计算 196
四、分句关联可信度计算 198
五、实验分析 199
第四节 关系标记对汉语复句层构关联的制约规则挖掘 200
一、标记连用对分句组合顺序的制约 200
二、标记单用对分句组合顺序的制约 202
三、标记复现对分句组合顺序的制约 205
四、不同标记显现方式中分句组合的优先序 207
第五节 汉语复句本体知识的形式化初探 211
一、汉语复句本体的语义关系表示 211
二、汉语复句的形式化函数 213
三、汉语复句句法知识表示 215
附录 220
附录一 词性代码表 220
附录二 复句知识标记集 221
附录三 常见典型四句式复句格式表 222
后记 239
作者简介
吴锋文:博士、硕士生导师。主要研究兴趣为认知地名学、汉语语法学、中文信息处理、理论语言学、词汇语义学等。
长按二维码
即刻购买本书
科学出版社
心理语言学线上论坛| Xingcheng Ma 博士、Cynthia Siew 教授讲座