查看原文
其他

科研助力|BCC语料库·汉语颠覆升级!通配符与自定义~

2017-02-18 汉语堂 语言学通讯


通配符~


在宣传新通配符“~”之前,咱们先来复习一下“.”的使用。


在BCC中,“.”是代表一个字符的符号。如“.美丽”就是“美丽”前面出现一个字符(包括标点、字母和阿拉伯数字),那么这个检索式就包含了“我美丽”(好羞涩~),“常美丽”(异常美丽)和“康美丽”(健康美丽)等等。由于我们不知道有一个词可能有多少个字,因此通常会挨个儿尝试“.”“..”“...”乃至“....”



现在这样的日子一去不复返啦!


如果你需要替代完整的一个词,那么直接用“~”来替代“.”就可以了!


如"~美丽",乍看起来没有什么不一样……



然而按下“统计”按钮,就大不一样啦



“如此美丽”“欣赏美丽”等都完整出现啦!




通配符@


更加给力的通配符是@,它不仅仅代表一个完整的词,而且还具有词性归类的功能。如“@美丽”


乍看起来,没有任何区别……



但是只要点击一下“统计”按钮……


讲真,我真是太爱这个结果了……小孩子们的课程论文,直销一个检索,就能解决一章额。



妈妈再也不用担心我论据不充分啦!

============================

**以上两种通配符在字符串中出现的位置是随意的,如“面包@”“自由~”“逻辑~思维”都是可以的。但是一次只能用一个哦!

而代表字符的“.”则可以出现多个,几个点就是几个字符。


自定义/受限检索


我们默默的推出了一个自定义按钮:正如诸多信息检索引擎所提供的一样(虽然我深知99%的人不会去用)!



自定义本身不是一个新的语料频道,而是受限检索的入口。它大概长这样……



在这里你按照语料的分类结构来点选语料范围,从而获得比频道分类更加细致的分类检索。比如,我想查找1949年的报纸中找“美丽.”模式。




或者在“儒藏”(它包含有好几百本书)中搜索“.所以”。这样就可以啦!

注意,检索式要输入页面下面的检索框哦……



这样选定后,再在页面下方的检索框中输入检索式就可以了。对于分支特别多的频道,如文学(作者序),你可以直接在上方的“搜索路径”中输入待搜索语料的范 围如“鲁迅”“张小娴”。


另外一个贴心设计就是“搜索路径”上方的字数统计,这告诉你你所选择的语料范围总共有多少字。这样你就可以用检索到的实例数轻松算出频率。是不是很方便写作和论证呢?


BCC·汉语,奋力前行中!愿在2016年伴随你挖掘更多有趣的语言现象!


如果你有什么新发现,欢迎和我们互动!

http://bcc.blcu.edu.cn

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存