声音 | 陆俭明:汉语研究的未来走向
陆俭明
北京大学中文系教授
博士生导师
1935年11月生,江苏吴县人。1960年7月北京大学中文系汉语专业本科毕业并留校任教,1985年晋升为教授。现任国家语委咨询委员会委员、以及南京大学、武汉大学、北京师范大学、北京语言大学等18所高校兼职教授。曾任国际中国语言学学会会长、世界汉语教学学会会长、中国语言学会副会长、北京大学汉语语言学研究中心主任、北京大学计算语言学研究所副所长、新加坡教育部课程发展署华文顾问等职。曾主持和参与多个省部级以上的科研项目,独立完成、出版的著作和教材共13部,主编或与他人合作编写论文集和教材12部;发表学术论文、译文、序文等450余篇。在学界被誉为20世纪中国现代汉语语法研究八大家之一。
汉语研究的未来走向
提 要
本文讨论汉语研究的未来走向问题。文章首先分析了古今汉语研究的目的;然后探讨汉语研究与别的学科融合交叉问题,提出了第一步走“语言学+”之路、第二步走“+语言学”之路的思路;接着论述了汉语研究的数字化问题;最后指出汉语研究要重视语言的信息结构。关键词
汉语研究 融合交叉 数字化 信息结构研究
汉语研究既古老又年轻
汉语研究要走与别的学科融合交叉之路
人工智能已成为当今社会的“大明星”。现在许多发达国家和发展中国家都已经制定或正在制定人工智能发展计划,都把发展人工智能作为提升国家竞争力、维护国家安全的重大战略。而人工智能事业得依靠众多学科的合作,这是谁都承认的。不知大家注意到没有,目前众多谈论人工智能的,无论是各级领导人员还是有关专家,都谈到人工智能研究与事业需要由众多学科参与和支持,提了十来个学科,唯独没有提及语言学。事实也是如此,目前的语言研究成果对人工智能似没有太大的贡献。目前唯一能挤进人工智能的是语音处理(包括识别与合成)和语义理解,然而其有效性靠的也还是计算机自身的“深度学习+计算”,而非我们给出的所谓语音、语义规则。哈尔滨工业大学计算机学院刘挺教授专门从事自然语言处理,他在谈到今后自然语言处理的发展趋势时指出,今后语义表示将“从符号表示到分布表示”(趋势之一),语言知识表示将“从人工构建到自动构建”(趋势之四),文本理解与推理,则“从浅层分析向深度理解迈进”(趋势之六)(刘挺2017)。完全不是走我们汉语学界那种孜孜不倦从事规则探究的路子。显然,在人工智能研究与发展中,语言学有被边缘化的趋势。这不能不引起我们反思与自问:“为什么?”
要回答“为什么”,这需要了解科技发展的大趋势!科技发展的事实表明,如今各个学科的发展,不再仅仅是单纯的本学科知识的发展,而是要逐步形成你中有我、我中有你的发展局面。换句话说,各种学科的研究不再局限于单纯的本领域的研究,而需要跨学科、跨领域的研究,而且是要跨多个学科、跨多个领域。“问题导向、应用导向引领多学科、跨学科合作,渐渐成为当代大学和研究机构的主流模式”(陈平2008)。人工智能研究走的就是跨学科研究的路子。可是回过头来看看我们的汉语研究,虽然近30年来有较大的发展,也有所开拓,但研究基本还是局限于本领域。应该看到,国外已走在我们前面。据我自己在网上搜索,国外已有将近40种交叉性语言学科。国外甚至提出了宇宙语言学,又名“外星语言学”(Xeno- linguistics),主要研究外星族群的宇宙语言(周海中1999、2003);它涉及许多其他学科,诸如语言学、数学、天文学、符号学、逻辑学、心理学和音乐,等等。
我国虽也开始注意了,譬如上海交通大学就成立了“上海交通大学语言、智能与神经科学研究基地”。但总体还比较落后!我们汉语研究也得走与别的学科融合交叉之路。走什么样的融合交叉之路?这当然还需探究。现在亟需思考、探究语言学与其他不同学科间的关联性和相互作用,要找到语言学与其他学科交叉融合的切入点、支撑点和着力点。我初步设想是分两步走:第一步,逐步走上“语言学+”之路;第二步,希望能出现“+语言学”的可喜情况。所谓“语言学+”,是说以语言学为母体,吸收、运用其他学科对推进语言研究有效的理论方法。诸如现在已有的神经语言学、计算语言学、病理语言学等。所谓“+语言学”,是说能吸引别的学科对语言学研究成果的注意,能运用语言研究的理论方法,或运用语言研究的成果,来推进其本学科的发展。具体情况我现在还难以设想。真走到了那一步,语言学会让人刮目相看了。
3
今后汉语研究要走数字化之路
语言学要走上融合交叉之路,前提是语言研究本身还需深化。很重要的一个方面是语言研究要逐步走上数字化之路。我们汉语研究也不例外。数字化,简单地说就是,将信息内容用数字形式表示;复杂地说就是,将任何复杂多变的信息,包括物体形象、影像、语言、文字、声音、色彩、热量、速度或气味等我们所能感觉到的、意识到的信息/信号,转化为一串分离的单元,然后将其引入计算机内部,运用模数转换器转换成以0和1表示的一系列可量度的二进制数值(包括数字、数据),再以这些数字、数据建立起适当的数字化模型,进行统一计算处理。这可以说是信息数字化及其应用的基本过程。在这过程中将运用到多种高科技技术,譬如计算机软件技术、微电子技术、光纤技术、超大规模数据库技术、网络技术、分布式处理技术,等等。如今,数字化不仅是计算机的基础,不仅是软件技术的基础,不仅是多媒体技术、智能技术的基础,也不仅是信息社会各种自动化技术的基础,而且是各行各业都在实施数字化,特别是关系到技术创新、应用开发和商业、金融模式创新等。因此,如今整个世界,特别是发达国家和一些发展中国家,诸如美国、欧盟各国、英国、加拿大、澳大利亚、以色列、日本、俄罗斯、韩国、印度等,都在向数字化方向转型。我国也比较早地重视数字化问题。特别是2017年12月8日中共中央政治局专门就实施国家大数据战略进行集体学习,习近平同志在发言中强调,大数据是信息化发展的新阶段,我们要推动大数据技术产业创新发展,要构建以数据为关键要素的数字经济,要运用大数据提升国家治理现代化水平,要运用大数据促进保障和改善民生。总之,“要实施国家大数据战略加快建设数字中国”。2018年12月召开的中央经济工作会议上提出个新词语“新基建”,即“新型基础设施建设”的简称。2019年7月30日中央再次强调,要加快推进信息网络等新型基础设施建设。2020年国务院常务会议、中央深改委会议、中央政治局会议等顶层会议先后提及“新基建”建设。“新基建”主要指5G网络、人工智能、工业互联网、物联网、数据中心等信息基础设施。2020年5月举行的第十三届全国人民代表大会上,“新基建”写入了《2020年国务院政府工作报告》。显然,如今“数字经济”已成为继农业经济、工业经济之后的新型经济形态。数字技术的发展和应用显然已经成为驱动当今社会经济和文化发展的新动能。数字化将引发一场范围更为广泛的产品革命、生活革命。日前央行已证实,数字货币将在苏州、深圳、雄安、成都试行。这种时代变化要求各个学科领域的学者、研究者都要有“跟上数字化时代”的思想准备,否则很难在学术研究上产出重大研究成果。语言学、汉语研究也不例外。目前,广大语言研究者和语言教学工作者虽然不一定都已经明确树立起了“数字化”这一概念和意识,但实际上也已经起步。这表现在一一电脑、手机这些数字化工具人人离不开手了,都已成为语言研究必不可少的工具;无论哪一方面的语言研究,都不同程度地建立了相关的语料库(包括少数民族语言或方言的语音音档)、资源库、为适应某种需要而建的不同类型的数据库及其相应的检索系统;已有海量的图书、报纸、期刊、照片、绘本、乐曲、视频等人文语言资料加以数字化,并已经在Web上提供给大众获取和使用;成立了规模不等、用途不一的语言数字化研究机构,建设各种可供语言研究的资源库;而语言教学特别是汉语二语教学与外语教学的广大教师,更是针对学生学习特点的变化(习惯于“碎片化”学习,习惯于从网上找学习资源)大多都运用了数字化教学手段,而在这次新冠疫情下,更是积极开展远程网上(线上)教学。这一切无不是通过数字化手段实施的。值得注意的是,跑在前头的大多是语言应用研究方面,汉语本体研究大多还只是运用和借助于语料库、语言资源库来开展语言研究。现在看来,汉语本体研究离“融合交叉”、离“数字化”距离还很大。这有主观因素,也有客观因素。主观因素是,汉语语言学人对“融合交叉”、对“数字化”还没树立起必要的意识与理念。这也反映了汉语语言学人乃至中国语言学学人,在语言研究上虽然努力了、尽力了,但还缺乏世界眼光、国际视野。这里所说的“世界眼光、国际视野”还不是指当代前沿语言学,而是指对时代的发展、对人类社会的发展及其对语言研究的需求,还缺乏全面、足够的认识。就客观因素而言,语言学在中国至今并未真正受到重视,也缺乏有效机制!在中国,语言学至今未能上升为一级学科。而这对语言学的发展,对汉语研究跨学科融合交叉(无论是“语言学+”还是“+语言学”),对汉语研究走上“数字化”之路,都是一个极大的负能量影响。为此,我们必须向两方面进行呼吁方面是向语言学人呼吁:尽快树立“融合交叉”和“数字化”的意识与理念,为了国家,为了人类;另一方面是向中央有关部门呼呼:要重视语言学,重视汉语研究,尽快将语言学升格为一级学科,为了国家,为了人类。
4
要重视语言信息结构研究
无论是韩礼德原先提出的“系统功能语言学”,还是后来2006年提出的“适用语言学”,都提到了语言信息结构的问题。就汉语语法研究来说,真正需要“摆脱印欧语的干扰,用朴素的眼光看汉语”(朱德熙1984),真要将汉语语法研究大大向前推进一步,使汉语研究走上“融合交叉”之路、走上“数字化”之路,还必须结合汉语加强语言信息结构的研究。所谓“语言信息结构”是指:在人与人之间进行言语交际时,凭借语言这一载体传递信息所形成的、由不在一个层面上的种种信息元素所组合成的、以信息流形态呈现的一种信息结构。在汉语语法研究中,最早注意信息结构问题的,是吕叔湘(1946);而第一次较为具体地谈论这个问题的,是张伯江、方梅(1996),他们在韩礼德“主位结构理论”影响下对汉语的信息结构做了一定的具体说明。关于语言信息结构问题,我已发表多篇文章(陆俭明2014、2016、2017、2018)。这里只想再强调以下几点:第一,语言最本质的功能是传递信息,其他方面的功能都是这一本质功能的延伸。第二,信息传递得遵守以下四个原则:一是清晰性原则;二是连贯性原则;三是顺畅性原则;四是稳定性原则。第三,汉语是注重“意合”的语言,其句子的词语序列乃至篇章的安排,更多地直接受信息传递规则的制约。第四,目前有关语言信息结构的研究大都还停留在新旧信息、信息焦点、焦点标记、主次话题等方面,现在亟需如适用语言学所说的深入进行语义发生系统和多模态信息分析方面的研究,进行信息结构与句法结构接口的研究。第五,需要提醒大家注意的是:句子表示的意义≠句子所传递的信息。
5
结束语——寄希望于年青一代
我毕竟已是耄耋之人,已心有余而力不足了。汉语研究真要从原有的窠臼中走出来而有较大的创新,得寄希望于年青一代。我在《顺应科技发展的大趋势语言研究必须逐步走上数字化之路》(陆俭明2020)中曾寄语于年轻语言学学人,在这里不避重复,不妨再说一遍:
年青一代的语言学工作者,必须要有两种思考:一是开拓性思考,二是深层次思考;必须要树立两种意识:一是“问题意识”,二是面向未来的创新意识。所谓开拓性思考,就是既要在本学科领域不断思考和开拓新的分支领域,同时要跨学科不断思考和开拓新的交叉性的新型学科。所谓深层次思考,就是不要满足于已有的认识与结论,要不断追究,不断探索,特别是要不断思考“怎么样”“行不行”“是否有例外”“研究已到了头了吗”“语言学如何能跟上时代发展的步伐”“语言研究怎么更好地为中国、为世界、为人类服务”等问题。所谓“要有问题意识”,就是我们要不断地发现问题,探究问题,提出新问题——“发现问题”是我们在科学研究上能获得成果的起点;“探究问题”是科学研究能获得成果的唯一途径;“提出新问题”是确保一个学科的理论方法对该学科知识的增长能做出持久的贡献。所谓“要有面向未来的创新意识”,也就是“前瞻意识+创新意识”,就是要求我们一定要看到学科研究的发展趋势,要有预见性,要超前谋划,同时要培养自己创新性思维能力。有创新才有发展!
此外,还要加一句:搞研究必须考虑“如何与未来接轨”!我们坚信,年青一代一定会勇于挑起这副重担,为了事业,为了国家,为了人类!
推荐阅读
声音 | 陆俭明:汉语教师应有的语言素养(视频回放+PPT)
北大讲堂 | 陆俭明:现代汉语语法研究(第1~75集汇总,附下载方法)
陆俭明教授著作推荐
语言服务资源共享
学术资讯分享
学术资源共享
学术交流共进
还有实用干货和更多福利
尽在语言服务资源共享群
欢迎加入
在【语言服务】公众号对话框
回复“资源共享”
获取进群方式
11万+语言学人已关注
微信号:Language-service
投稿邮箱:yuyanfuwu@yeah.net
投稿交流、商务合作、著作出版
欢迎后台留言
点击“阅读原文”聆听更多学者声音