查看原文
其他

书讯 | 《词汇与句法计量研究》

qler 计量语言学
2024-09-03
计量语言学是以真实语言材料为基础,用精确的数学方法研究语言结构模式与发展规律的现代语言学分支学科。近年来,越来越多的国内学者对计量语言学产生了浓厚兴趣,学习计量语言学的理论与方法并开展了大量研究实践,在国际上发表了不少研究成果。总体来看,我国的计量语言学在科学研究、人才培养、学术交流等方面都取得了一定的成绩。由于种种原因,国内暂时还没有专门的计量语言学学术刊物,但已经出版了一些相关著作。2017年,《计量语言学导论》作为商务印书馆语言学教材书系的首本书出版(见这个星球上的第一本《计量语言学导论》即将上市。这本导论书从历史、理论、方法、问题和资源等角度介绍了计量语言学的基础知识,上市后获得了读者的一致好评,并于2020年加印(见《计量语言学导论》终于上新货了!2018年,《计量语言学研究进展》出版(见计量语言学研究进展《计量语言学研究进展》前言节选)。该书收录了当时国内计量语言学研究的部分前沿成果,成为国内学者了解计量语言学研究的一项重要的中文文献来源。受此启发,北京语言大学计量语言学研究中心于2020年年底开始策划出版一本汇聚国内计量语言学最新研究成果的书,也就是读者看到的这本《词汇与句法计量研究》。在本书即将出版之际,我们萌生了做一套计量语言学系列丛书的想法,于是考虑将“计量语言学研究进展”作为丛书名保留下来,并邀请刘海涛教授担任丛书总主编。以上就是《词汇与句法计量研究》以及丛书的由来。令人欣喜的是,经过作者们和出版社的共同努力,这本书已经由浙江大学出版社正式出版。


国际计量语言学领域的知名学者莱茵哈德·科勒(Reinhard Köhler)教授曾在《计量语言学导论》的序言中说,“无论是理论探索,还是在语言科技的实用性方面,计量语言学均属于最具发展潜力的语言学分支学科之一”。计量语言学之所以有此魅力,原因在于,从真实语言材料挖掘语言规律的学科特征与当前数据驱动的智能时代对语言研究的要求相匹配。现代计量语言学的根本任务是,从真实语言材料中挖掘语言的结构模式与演化规律,从而建立一套科学的语言学理论。构建科学的语言学理论是所有语言学分支学科的共同目标,计量语言学采取的是一种偏向系统科学与协同学的研究路向。然而,现代计量语言学研究似乎越来越偏向系统科学与数学,距离语言学特别是传统语言研究中普遍关心的问题越来越远。当前欧洲的计量语言学研究在一定程度上表现出了这种趋势。我国的计量语言学研究在继承现代计量语言学研究传统的同时,注意到并牢牢把握数智时代语言研究的挑战与机遇,更加注重从真实语言数据即语言的使用中发现语言系统的运作规律。从语言使用中发现语言规律,既是当前基于深度学习的自然语言处理领域取得成功的原因之一,也是语言学一直以来坚守的研究传统。将这一研究传统与数据驱动的方法相结合,有助于更好地发现语言规律,从而让语言学更好地服务于人类社会。


《词汇与句法计量研究》采用计量语言学的理论与方法,对语体风格、语言演化、翻译、配价、语言认知、语言习得、语言类型学、语言复杂网络、语言资源建设,以及句法标注体系与方法等问题进行了探索。这些研究都立足于真实的语言材料,运用数据驱动的方法去发现语言结构模式与运作规律,涉及领域广泛,展现了计量语言学理论与方法在语言研究中的广阔前景,也预示了数据驱动型语言研究在数智时代的旺盛生命力。

在本书前言中,有关于各项研究的简要介绍。这里尽可能用一两句话概括一下每项研究的主要发现。


  • 《齐普夫定律的网络观初探——以词汇的局部语境为例》

发现于语言系统整体上的齐普夫定律同样适用于语言子系统。

  • 《汉语小说作品中字词使用频率研究》

汉语的词汇使用从古至今具有一种幂律分布不断加强的演化趋势。
  • 《基于语料库的汉语兼类词计量研究》

汉语词汇虽然缺乏形态变化,但词类句法功能的计量特征与印欧语相同或相似。
  • 《壮语常用词的计量特征研究》

壮语与汉语、英语等其他自然语言一样具有名词占比高、常用词普遍较短等特征。
  • 《英语名词短语的定量特征研究》

英语文本中名词短语的分布特征与语体因素密切相关。
  • 《中英媒体英语社论的词汇计量特征比较研究——以<中国日报>和<经济学人>为例》

中英媒体的英语社论具有若干相同的词汇分布特征,但《中国日报》的词汇丰富度与变化程度偏低。
  • 《金庸与古龙武侠小说词汇风格比较研究》

两位武侠小说作家在词汇丰富程度、用词均衡程度以及口语化程度方面具有明显不同的风格特点。
  • 《不同类型中文网络小说的语言特征量化研究》

现代汉语网络小说的语言具有同质化倾向。
  • 《传统小说与网络小说的计量风格分析》

相比较而言,网络小说在使用动词性结构、语气词、情感词方面更为突出。
  • 《现代汉语新诗音高规律的计量分析》

现代汉语新诗的声调使用具有不均衡性,表现出多样化进程特点。
  • 《苗族古歌的语言特征计量研究》

苗族古歌用词与韵律风格接近近体诗,且具有民谣化特征。
  • 《中国的“花儿”到了英语世界还是“花儿”吗?——民歌翻译风格的忠实与变异》

英译本“花儿”的语体风格接近英语民歌,同时译者因素导致了风格变异。
  • 《英文歌词词汇特征计量研究》

词汇计量特征能够区分不同的音乐风格。
  • 《基于语料库的蒙古语词类句法功能语体差异分析》

蒙古语的词类句法功能同样具有其他自然语言在句法层面的普遍性与多样性。
  • 《英语从句及其类型对句法复杂性的影响》

从句增加了英语复句的句法复杂性,嵌入名词性从句的影响大于嵌入关系从句与状语从句。
  • 《英语谓语省略句与替代句的依存句法结构分析》

省略与替代机制作用下的词间依存距离与非省略或替代结构具有相同的概率分布,省略与替代机制是受省力原则支配的重要句法手段。
  • 《汉英形容词广义配价功能模式与对比研究》

汉语与英语的形容词主动配价与被动配价均符合相同的分布规律,形容词的配价功能模式是语言属性多样化进程的结果。
  • 《依存距离最小化与英语状语的使用》

英语状语的位置分布与长度分布具有一定的模式与规律,均与由省力原则和人类认知机制导致的依存距离最小化倾向有关。
  • 《两种依存方向的处理难度是一样的吗?——基于英语树库的计算认知研究》

英语中存在一种支配词居前的语序倾向,这种倾向是语言系统降低复杂结构句法复杂性一种自适应机制。
  • 《依存语法视角下聋生与健听生汉语书面语句法发展对比研究》

学语前聋生汉语书面语产出的句法复杂度与健听生具有相似的分布规律与发展模式,但具有明显的滞后特点。
  • 《基于多语平行依存树库的目标语对翻译过程的影响研究》

翻译过程在受人类认知机制约束的同时,还受目标语类型特征的影响。
  • 《基于依存距离概率分布的网络与传统语体对比研究》

网络语体与传统语体文本的依存距离分布遵循相同规律的同时,依存距离概率分布模型的参数能够有效区分不同语体。
  • 《基于通用依存树库的语言分类研究》

依存关系类型能够较好地区分印欧语系与非印欧语系语言,且能够对印欧语系语言进行更为细致的分类。
  • 《基于线性与垂直依存距离的汉语句法复杂性研究》

平均线性依存距离与平均垂直依存距离具有较强的相关性,二者结合起来能够更好地表征汉语的句法复杂性。
  • 《标注方式与语体对依存指标测量结果的影响——基于英国国家语料库各语体文本的回归分析》

相邻依存关系占比与标注方式及语体因素相关,依存方向与依存距离受标注方式与语体因素影响较小,依存距离最小化倾向不受标注体系影响。
  • 《依存关系与构式的结合——基于构式的通用依存标注框架》

提出了基于构式的通用依存标注框架(CUD),并证明了这一标注框架比通用依存标注(UD)和斯坦福依存标注(SUD)在精细化程度方面更具优势,从而更适合作为语言学研究资源。
  • 《语言网络中心节点词的扩散层级》

语言网络的邻节点层级特征反映出语言网络具有择优增长的趋势和自组织特性。


以上是这本书的主要内容。此外,这本书还收录了刘海涛教授发表在本公众号的两篇文章以及刘老师的论著目录。《我的世界语研究之路》回顾了刘老师成为一位掌握多种外语的世界语学院院士的学习与研究经历。《浙大10年》简要总结了他自2010年起在浙江大学开展的人才培养、科学研究与学科建设工作。《刘海涛教授语言研究论著要目》收集整理了刘老师自1992年起至这本书出版前在国内外公开发表的350余篇(部)论著的文献信息。

目前这本书已经上架预售,点击文末的“阅读原文”可以直达销售页面,新书7折哟 写到此时,小编不禁又想起了某网友的那句广告语,“要想知道这本书有多……,买一本看看就知道了”






修改于
继续滑动看下一个
计量语言学
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存