查看原文
其他

科普 | 凡尔赛一下语言学那些“不明觉厉”的用处

语言服务 2022-07-01

The following article is from 语标 Author 珩珩 丸子张


点击上方“语言服务” 可以订阅



这一天,小语同学收到了来自老同学们的聚餐邀请,他们聊起了各自的专业:



小语皱了皱眉,掐指一算,今日宜正名!比起实用性,我们语言学专业可真没怕过谁!生活中处处都有语言学,咱用处可大着呢!



ZERO
什么是语言学


语言学linguistics)是以人类所有语言为研究对象的学科,探索范围包括语言的性质、功能、结构、运用和历史发展,以及其他与语言有关的问题。


研究成果主要运用在语音词汇语法语用四个方面,并与其他学科交叉发展出社会语言学、心理语言学、计算语言学、神经语言学等学科方向,且随着当今科技的发展,语言学在人工智能上的应用也越来越突出。具体内容往下看~


ONE语音造福人类


一位心理学家曾做过一项关于人类每天平均说多少个字的调查统计,调查后发现,普通男性平均一天会说2000字至4000字,而普通女性每天会说8000字至10000字,少数女性每天会超过20000个字。



好家伙,又get一个冷知识!


平平无奇的语言文字,对普通人而言,除了理解文字内容和一些表征信息,貌似并无他用。但对于高段位听者——司法语言学家来说,那就不简单了!他们若能分析并运用好这批语料,很有可能成为警方侦查破案的关键证据!



语言学家们主要运用司法语音学(Forensic Phonetics)的相关知识做身份鉴定。从语音比对(voice comparison)、语音画像(voice profiling)和受害人与证人进行的说话人鉴定(speaker identification by victims and witnesses)三个部分,利用人本身的生物特征进行身份鉴别,为警方的侦察破案提供帮助或为法庭提供相关证据。



举个栗子


美国杰出的社会语言学家——威廉·拉波夫(William Labov)曾经三次出庭为被告辩护。有一回,司法机关仅凭声音听起来是否与恐吓电话录音相似,便判定犯罪嫌疑人入狱。拉波夫对此深表怀疑,运用声学手段分析了录音中的单词bombthereoffon中的元音,向法庭证明被告的纽约市口音和恐吓者的波士顿口音并不相符。在专业证据面前,法官的主观评判就弱爆了,最终当事人被无罪释放。



“法证之父”埃德蒙•罗卡(Edmond Locard)曾说:“凡两个物体接触,必会带走一些东西,亦会留下一些东西。”司法语音学所做的,便是在这茫茫语音中,寻找一切有用的信息,用专业的语音学知识和手段,维持社会的公平和正义。


TWO
以小见大的词汇


在开始之前,咱先唠唠词汇的定义。词汇,又称语汇,是一种语言里所有的(或特定范围的)词和固定短语的总和。作为语言中最小的能够独立运用的单位,学界对词的研究成果可谓数不胜数,但研究它究竟有什么用呢?



以词典编撰为例,每一部词典都是各民族语言文化的结晶,如:《现代汉语词典》《宋元语言词典》《四川方言词典》《汉语外来语词典》……甚至还有专门的电影来记录词典的编撰过程呢!比较有名的如:《教授与疯子》(《牛津英语词典》)、《编舟记》(日本《大渡海》词典)、《词典》(韩国语言文化)等等~词典一般都有很高的权威性,在词汇使用方面发挥着示范和引领的作用。



除此之外,最能直观呈现词汇研究价值的,还有网络用语。网络热词就像是当代中国社会发展的碎片化镜像,小小的词实则蕴含着巨大的能量,折射出新闻事件、娱乐内容和社会现象给网民带来的直观冲击。


细心的小伙伴会发现,近年的网络用语大致可分为以下三类:


01

时事


尽管疫情已经得到控制,但正如“硬核”标语所说——“道路千万条,安全第一条”,无数“逆行者”誓死捍卫的生命安全我们不能忽视。抗疫期间,无数网民自发居家“云监工”,自制美食落实“光盘行动”。



同年,电影《夺冠》的上映,也向世人传达着“14亿护旗手”的“中国精神”!现在,即便顶着“996”的高压工作环境,大家也依旧不忘通过“带货”等方式为恢复经济助力。



02

娱乐


每每看到朋友圈的甜蜜互动,心想:“好嗨哟,kswl”再看看单身的自己,立马酸成一颗“柠檬精”!瞅到情人节分手的动态,嘀咕:“好家伙!真是个狼人。”即便“雨女无瓜”,但“集美”们吃瓜的热情依旧“奥利给”!



03

情感


越来越多的年轻人“不约而同”地选择了“躺平”。

穷+单身??——“xswl秋天的第一杯奶茶”还是买得起的;

熬夜+秃头??——是时候做出“断舍离”了;

累觉不爱??——那就继续“不忘初心”地走下去。



通过研究这些形形色色的网络词汇,我们不仅可以将特定时间、地点、人物、事件等信息超浓缩,还可以把握大众的情感走向,更可以对社会的动态发展产生最基本的了解。就像布莱克所说的“一粒沙里见世界”,网络词汇的研究魅力莫过于此。


THREE
用规则说话的语法


提起语法你首先想到的是不是语文课和英语课上,老师经常念叨的“同学们啊,你看这个谓语它是支配后面那个宾语的”“第一个补语和第二个补语的中心语是不一样的啊……”



“主谓宾定状补”是句子的基本组成成分,这些成分之间的排列规则就是语法。从传递信息的角度来看,语法规定着人们怎么用词造句。举个最简单的栗子小牛想吃草。如果没有语法规则的限制,我们可以说:


1*草想吃小牛。

2?草,小牛想吃。

3*小牛,草想吃。




但只有“小牛想吃草”是常态的,而“草,小牛想吃”的出现是有条件的,是变式。其余两种排列方式都是不合法的。而这种排列顺序上的规则正是汉语语法规则的一个重要体现,可见,语法的规则在无形中制约了语言的使用。


从接收信息的角度来看,语法指示人们怎样正确理解汉语的意义。句子的意义是词按照一定的语法规则组合起来所表达的,而不是词所表达的概念的简单相加之和。因而,要正确理解句子的意思,除了要懂得句子中的词语的意思之外,还要懂得词语组合的语法手段对于句子语义内容表达的影响。如:


4)他喜欢我。

     我喜欢他。

5)这本书看了三天。

     这本书看了三天了。



在很多情况下,词语组合的语法手段左右着句子语义内容的表述。语序和虚词是汉语重要的语法手段,直接影响句子的表意。例(4)中“我”和“他”的顺序一旦改变,喜欢的对象就不同了。例(5)里“了”的出现直接决定说话人到底有没有看完这本书。


来无影去无踪的语法,看似简单,实则发挥着“红绿灯”的规范作用。我们日常交流很容易,但所说所写的内容是否正确合理是需要用语法去衡量滴~很多外国小伙伴常吐槽汉语语法最难学,你觉得呢?



FOUR
喜闻乐见的语用


在日常对话中你是不是经常用到颜文字、表情包和弹幕呢?它们也都是语言学的研究对象哦,在日常交际中发挥着重要作用!



以弹幕语言为例,视频是动态的、持续播放的,弹幕以一种零散、碎片化的方式穿插于任意情节和画面所在的时间节点上,以简洁生动的文本表达着发送者即时的感知,一旦错过某一节点,弹幕的阅读乐趣也会大幅度下降,甚至令人不明所以。



弹幕一发,单调的文字形式立马变得诙谐幽默、生动立体了呢!举个栗子当视频观赏者看到高质量的新视频发布时,发表弹幕“大佬!又是你!我来啦”“虔诚地戴好耳机”,不仅能准确表意,语言更有感染力,还有一种生动活泼的画面感~


对于视频弹幕的受众而言,对弹幕来源、生成机制以及语用功能和效果的分析阐释,不仅使他们对弹幕的功能有更深入的了解,更能提高他们创造弹幕的积极性。



对于视频网站的运营者来说,视频弹幕能够使其加深对视频的了解,更有效地进行弹幕文本的筛选,更好地发挥弹幕独特的娱乐效果。同时,也能引导视频网站更好地规范和净化视频弹幕的语言使用,对淫秽、粗俗、暴力的弹幕表达进行筛选剔除。



对于教育工作者来说,通过研究这些喜闻乐见的弹幕文字,不仅能拉近与青年群体的距离,还能更好地了解他们的心理状态和情感诉求,从而寻找最佳的教育和引导方式。



语言不仅是交际工具,更体现着人们的思维方式和心理状态。作为青年文化的典型符号,弹幕语言用生动立体的表达方式诠释青年的心理状态和情感诉求,对于家长和教育工作者来说,是一个很好的话语共鸣场。


FIVE
语言学与人工智能的结合


如果还把语言学当作一门文科那你就落伍啦!语言学早已紧跟时代潮流和计算机、人工智能等领域结合,发挥着越来越大的实际作用,让我们一起来看看吧!


1
语音情感分析


语音情感的分析和识别是实现人工智能的关键问题之一。在医学研究中,语音情感分析可以辅助进行孤独症、抑郁症、压力识别等研究,在指导自闭症儿童对情感理解和表达能力的学习方面也有一定作用,可对研究对象的情感变化进行跟踪,并作为后续疾病诊断和治疗的依据。



在汽车驾驶中,语音情感识别系统能够根据司机的语速、音量等信息实时监控其情绪状况,并提醒司机保持冷静、安全驾驶,能够有效解决“路怒症”等问题!有了语音助手的陪伴,行车路上更安全啦~



2
文本风格分析


《红楼梦》后40回到底是不是曹雪芹写的呢?语言学家从多个角度进行了花式推理,我们来看个栗子——基于深度学习的文本风格分界点识别方法。简单来说,就是通过建立并训练模型,比较不同训练分界点处(横轴)前后的差异显著性,据此确定文本风格的实际分界点位置。


图1 《水浒传》训练分界点位置


图2 《红楼梦》训练分界点位置


由图1可以看出,单一作者的著作(《水浒传》)在不同训练分界点处的测试准确度变化不大,而且没有出现明显的变化趋势;而在图2红楼梦的两个鉴别样本中却都出现了在80回处明显的准确度提升现象,且在后续的深入分析中出现了更为明显的趋势。由此得出,红楼梦在80回前后确实出现了文本风格的明显变化,并有较高的可信度。



我们语言学真是太棒了呢!小语同学微微一笑,深藏功与名ヽ(〃∀〃)


今天就介绍到这里啦,如果还有想补充的小伙伴,欢迎在留言板里一起聊聊你心目中的语言学还有哪些用处吧!


本文参考或引用了以下文献:

[1]  鑫(2019)基于日常会话的司法话者非语音学识别特征挖掘研究,《中国司法鉴定》第2期。

[2]何  铠(2020)基于自然语言处理的文本分类研究与应用,南京邮电大学硕士学位论文。

[3]黄  杰(2021)自然语言处理在文本审核中的应用,《网络安全技术与应用》第3期。

[4]李茹欣(2018)视频弹幕的语言学研究,陕西师范大学硕士学位论文。

[5]刘振焘等(2018)语音情感特征提取及其降维方法综述,《计算机学报》第12期。

[6]陆俭明(2021)汉语研究的未来走向,《汉语学报》第1期。

[7]宋  晖(2013)基于多问题意识的社会语言学单学期教学模式构建,《中国大学教学》第8期。

[8]沈爱国,王晓晡,钟璐佳(2021)网络热词:生成本质与意义流变,《观察》第2期。

[9]吴锦雯等(2021)社会语言学视域下近 10 年网络热词的历时研究,《学术论坛》第10期。

[10]张翠琳,谭铁君(2018)司法语音学国内外研究现状与发展,《南开语言学刊》第2期。

[11]朱旭东,严广乐(2020)基于LSTM的《红楼梦》文本风格分界点识别方法,《智能计算机与应用》第8期。



本文来源:语标

老规矩

觉得长知识的

点赞、在看、分享为敬


科普


科普 | 男导师的妻子叫“师母”,那么女导师的丈夫怎么称呼?

科普 | “爸爸”称谓的演变史:不是每一个父亲都叫“爸爸”

科普 | “躺平”是什么梗?如何看待年轻人“躺平”的现象?

科普 | “拿来吧你”是什么梗?让我们用语言学知识分析一下

科普 | 北京野生动物园的声明为啥火了?我们用语言学知识分析一下

科普 | 潮流语言的终级迷惑:“yyds”为什么从去年火到今年?

科普 | 谌龙、谌利军、施廷懋、谢思埸……这些奥运健儿的名字,你读对了吗?

科普 | 为什么奥运会裁判报分时把1∶0称为one love?

科普 | 思聪真的是舔狗吗?让我们用语言学分析一下

科普 | 乔姆斯基:语言学的“当时”和“现在”经典 | 乔姆斯基谈语言、认知、深度学习和人工智能经典 | 乔姆斯基:语言学的基本问题(上)经典 | 乔姆斯基:语言学的基本问题(下)经典 | 乔姆斯基在2020巴西语言学会的讲座科普 | 乔姆斯基:最简方案的形成背景、现状及未来发展科普 | 什么是语言学?语言学就是学语文的?语言学有何用武之地?科普 | 语言学等于学语言吗?为什么要学语言学?科普 | 为什么有的人更擅长学习多种语言?科普 | 如何向理工科男朋友介绍语言学专业是干啥的?科普 | 语言学是一门科学吗?

科普 | 为什么要学语言学?

科普 | 如何阅读语言学论文?

科普 | Hilpert:为什么要学习语言学?

科普 | 世界语言谱系及语种全览

科普 | 汉语在世界上到底有多少“亲戚”?

科普 | 索绪尔语言观:现代语言学的开端

科普 | 布拉格学派:语言的结构、功能与诗性

科普 | 哥本哈根学派:关于“语言是什么”及其追问

科普 | 语言学发展历程及学派

科普 | 语言学专业学生心碎的十六个瞬间

科普 | 语言学专业学生的25种“怪癖”,哪一个戳中了你?

科普 | 25个让你意想不到的语言小知识

科普 | 只有语言学内行人才能看懂的11张图

科普 | 哪种语言最难学?外媒做了个排名,高居榜首的是……

科普 | 为什么其他国家大多用拼音文字而非方块字?

科普 | 为什么可以说“我爸爸”“我妈妈”,却不能说“我狗”?

科普 | “牛轧糖”的“轧”到底读“gᔓzhá”还是“yà”?

科普 | “No.”并不是Number的缩写,而是这个词

科普 | “别cue我”的cue在英语里到底是什么意思?

科普 | “钱钟书” 还是 “钱锺书”?

科普 | “百年诞辰”还是“诞辰百年”?

科普 | 想要表达真正开心地笑,得用几个“哈”?

科普 | 张雨绮、鞠婧祎、阚清子……这些人名和姓氏,90%的人都读错了

科普 | “蛋挞”“怼人”“撒贝宁”……这些词90%的人都读错了,不服进来看!

科普 | 我们分析了3447个地铁站,发现了中国城市地名的秘密

科普 | 除了“六安”,还有哪些一读就错的地名?

科普 | 中国古代才女班昭的尊称“曹大家”,你真的会读吗?

科普 | 中国最难懂的十大方言排行,有你的家乡话吗?

科普 | 全国各地普通话标准程度排行榜,你的家乡属于第几档?

科普 | 王伟:“字母词”是什么,该怎么管?

科普 | 汉字到底有多少个?

科普 | 为什么有些语言这么难学?科学家发现关键基因

科普 | 儿童语言中的可爱语法

科普 | 婴儿是天才的语言学习者

科普 | 语言学家的迷惑例句:关于性别问题的严肃讨论

科普 | 语言进化编年史:我们的语言如何进化,将来如何发展?

科普 | 我们为什么要学习一门外语?

科普 | 英语专八相当于什么水平?

科普 | 学习双语有什么好处?能让大脑更健康,更持久年轻!

科普 | 脑洞大开!古汉语原来是这样发音的

科普 | Mojito译成“莫吉托”是标准的中式翻译错误

科普 | 惨绿少年、酒店猛狗……这些“令人喷饭”的词,居然都是成语

科普 | 万万没想到,这些词居然来自方言

科普 | 〇、丨、丅、彐、亖……这些真的是汉字,不是乱码!

科普 | 《三十而已》《二十不惑》爆火!剧名为何这样翻译?

科普 | 乘风破浪的姐姐们A爆了!这里的“A”是什么意思?

科普 | 《红楼梦》中的生僻字词,你认识几个?

科普 | 7-ELEVEn,n 为什么是小写?

科普 | “PK”“VS”“K.O”分别是哪些单词的缩写


语言服务资源共享



学术资讯分享

学术资源共享

学术交流共进

还有实用干货和更多福利

尽在语言服务资源共享群

欢迎加入


在【语言服务】公众号对话框

回复“资源共享

获取进群方式


语言服务

12万+语言学人已关注

微信号:Language-service

投稿邮箱:yuyanfuwu@yeah.net

投稿交流、商务合作、著作出版

欢迎后台留言

点击“阅读原文”获取更多科普趣文


大家都“在看”,就差你啦~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存