其他
“汉语助研”操作指南与案例二:例句检索
PART.1
例句检索功能
在自建语料库或其他大型语料库中,想要进行单个词或多个词的具体例句检索,就需要借助到例句检索功能。
汉语助研的例句检索功能,可以对任意语料库进行“单个词检索”或“多词组合检索”,并将检索结果清晰地展示出来,以辅助汉语研究与汉语教学。
PART.2
例句检索功能的使用
下面详细介绍如何使用汉语助研软件的例句检索功能。
PART.3
例句检索功能的步骤
也可以直接将语料库文件夹路径复制粘贴到后面的文本框中
语料库是以文本文件形式(txt格式)存储的自建语料,一篇文章保存为一个文件,可以层级文件夹存放,语料一般只包含标题和正文,格式、编码不限。
注意:软件打开语料库时,会按照“。?!…”对语料进行分句。因此,所有检索都应限定在句内进行。
步骤三:选择检索模式
1.单个词检索
对于“单个词检索”,我们既可以检索单个词,例如,输入“高兴”,点击“检索并保存例句”,会检索出语料库中所有出现“高兴”的例句。
单个词检索“高兴”的例句检索结果如下:
也可以一次性检索多个词,多个检索词之间用“|”(隔页符)隔开。检索出的多个词的例句,会存放在不同的文本文件中。
例如,输入“高兴|开心|兴奋”,点击“检索并保存例句”,会检索出语料库中所有出现“高兴”或“开心”或“兴奋”的例句。
多个词检索“高兴|开心|兴奋”的结果如下:
2.多词组合检索
如果要检索多个词语,我们可以选择“双词组合检索”。
例如,输入“不但”“而且”,间距输入“12”,并选择“同出现”,可检索出“不但”后面12字之内同时出现“而且”的例句(“间距”表示两个词语之间的距离,即二者之间相隔的字数)。最后点击“检索并保存例句”。
多词组合检索,以“不但”“而且”为例,检索“不但”后面12字之内同时出现“而且”的例句,检索结果如下:
若间距输入“12”,并选择“不出现”,可检索出“不但”后面12字之内不出现“而且”的例句。
多词组合检索,以“不但”“而且”为例,检索“不但”后面12字之内不出现“而且”的例句,检索结果如下:
如果想检索出只出现“不但”不出现“而且”的例句,建议将间距设大一点,如50。最后点击“检索并保存例句”。
将间距设置为50后,检索结果如下:
PART.4
检索小技巧
当我们需要研究特定成分或词类时,例如,“要命”,我们只想要“要命”做补语的例句,但是在语料库检索时,会出现大量如“不要命、真要命、更要命”等作实词的例句。
这时候,我们可以输入“得要命”来检索,返回的例句就都是“要命”做补语的例句了。
同理,当需要检索“不堪”做补语的例句时,可以用“不堪+标点符号”或“不堪的/不堪地”来检索。
该您来试试例句检索了
后台回复“汉语助研”,免费获取正式版软件。
3 后台发送“例句检索”免费获取资源
后台发送“例句检索”,免费获取例句检索的大规模武侠小说语料库压缩包。4 操作指南和研究案例分享
关注公众号推文,我们将陆续推出软件的使用操作视频以及典型案例。图文/ 吕展
视频/ 任德玲排版/ 陈伊彤初审/ 陈凯艺
审核/ 刘华
· END ·