查看原文
其他

科研助力|这次升级必可拯救你脱离论文苦海:BCC对比与词云功能墙裂上线!

2017-02-10 汉语堂 语言学通讯

微博:厉害了word人工智能,吃瓜群众大呼过瘾啊!

新闻:人工智能技术取得重大突破,广大群众喜闻乐见。

文学:人工智能所创造的辉煌,触动着每一颗跳跃的心灵!

科技:人工智能取得了社会不可忽视的进步。【高冷的令人胆寒……】


……

喂喂喂,飞熊君,你玩儿够了没有?快写论文


但是语域确实改变了语言现象的分布

带来了可接受度的差异

甚至可以激进地说

不同语体和语域有着

不同的句法语义规则!




这不都是写论文的套路么

因此BCC语料库向来重视语域的区分


不断成长的BCC新近添加了“学生作文”频道。原有的“综合”频道更名为“多领域”(你看,这样就不造成误解了吧:这个频道是多领域语料的平衡采样,而不是各领域的加和!)


然而最大的改进还是搜索按钮旁边的“对比”功能!按下它……开启意外之旅!




我们以文学为例,让我们来看看单语域对比的功能。选择单一来源,再选择一种语域,如文学。在后面照常输入检索式。图中的检索式的意思是“可爱的+名词”和“帅气的+名词”。关于检索式,请关注汉语堂后,回复“BCC”或点击BCC按钮。



神奇的事情发生了!对,你看到的是词云!大的字符表示频次高的,鼠标悬浮可以显示具体次数。原来在文学语料中“可爱的”孩子最多,女孩次之;而“帅气的”脸最多,男人次之……


如果你想获得所有搭配的具体频次,可以从左上角点击列表显示


我突然觉得按一下按钮,我的论文一章就写完了……




辣么,飞熊君,多语域呢?答:更加精彩!


选择“两个来源中”,然后点选需要对比的语域,比如“文学”和“科技”,让我们看看“帅气的n”这个搭配(好吧,构式……)有怎样的分布!




微博君:帅气的靓仔、帅气的男士、帅气肩章、帅气的牛仔……(微博上看来有不少卖货的……)


文学君:帅气的脸(果然是个看脸的领域)、帅气的男人、帅气的小伙子、帅气的男子……(真没创意……)



比帅气的男子更帅的是……还有柱状图显示!天呐!我这不是又写完了一章么!




使用BCC数据的同学记得引用这两篇文献哈

我知道你们都在凑文献数量

飞熊君送上


荀恩东, 饶高琦, 谢佳莉,等. 现代汉语词汇历时检索系统的建设与应用[J]. 中文信息学报, 2015, 29(3):169-176. 
荀恩东, 饶高琦, 肖晓悦, 臧娇娇. 大数据背景下BCC语料库的研制[J],语料库语言学,2016(1).


本文来源:汉语堂

相关文章推荐阅读:

科研助力| New release of BFSU PowerConc August 2016

读书小札| 语料库翻译学视角下术语翻译策略的历史文化解读:读黄立波、朱志瑜”严复译《原富》中经济术语译名的平行语料库考察“

科研助力| 国内出版及引进的语料库语言学著作一览

学界新闻| DEAP学术英语语料库建设项目启动

实用工具|美国当代英语语料库 COCA

新书推荐| 英语修辞复合词释义的结构基础

【新书推荐】基于语料库的中国学习者英语口语中语用标记语研究

科研助力| 上海语言学通讯博士文库书稿征集

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存