查看原文
其他

技术与工具|WantWords反向词典,内含开发团队公开文档

孙伊丽 语言服务行业
2024-09-09



前言

不论是在翻译中还是在日常表达时,你是否也会遇到这些情况:突然找不到准确的词表达此刻想法;知道有那么一句习语却话到嘴边说不出来;翻译时需要打磨语言却没有头绪……


时间充足的情况下,遇到以上类似情况时,我们可以直接通过互联网顺藤摸瓜地检索到自己想要使用的那个词或谚语,但通常需要耗费很多时间和精力,最后也不一定会有结果。


接下来我们将介绍一款可以反向查词的工具,轻松解决上面各种问题,一起学习一下吧~


工具简介




WantWords反向词典由清华大学计算机系自然语言处理实验室(THUNLP)的WantWords研发团队开发,是一款开源在线的反向查词词典,目前已有网页版和小程序版,APP版也在设计和开发中。网页端网址为https://wantwords.net。


反向词典的主要功能是:用户可以通过输入描述来查找符合相关描述的词语、成语或习语。当然工具内部还有许多好用的隐藏功能,后边介绍中我们将一一说明。


本次图文教程图片来自WantWords反向词典网页版,先来看下首页截图:



可以看到反向词典主要支持汉语、汉英、英语、英汉四种类型查词功能,接下来我们按顺序以及网站相关指引来具体看下使用方法。




图文教程




1

汉语


首先,我们在汉语词典选项下直接点击🔍搜索图标来看下网页示范案例:



案例中输入的描述是“大声叫嚷”,在没有进行筛选的情况下,一共检索出100条符合描述的词语,词语背景颜色的深浅代表模型计算得到的相关度大小,颜色越深表明相关度越大,颜色越浅表明相关度越小。(开发团队小帖士:相关度由AI模型计算而得,可能存在谬误;一般而言,排序越靠后的词和输入描述越不相关,但排序靠前的词也可能意思相反或无关。)


检索时配合筛选器使用效果更佳。筛选器一共包含以下四个方面。



1. 词性。可筛选的词性有名词、动词、形容词、副词、成语及其他。


2. 字数。例如,输入4可筛选4字词;输入>2可筛选2个字以上的词;输入<4可筛选4个字以内的词。


3. 韵脚。可输入韵母、韵母+声调、完整拼音。例如,输入“ao”可筛选“熬”“好”等尾字韵母为“ao”的词;输入“a12”可筛选“巴”“达”等尾字韵母为“a”且为一或二声的词。多个筛选条件可用“+”连接,如“ao+a12”可筛选上述两种词。


4. 词形。需包含的字或词。例如,输入“爱”可筛选含有“爱”的词。



接下来,点击想要查看的词(上图以“叫喊”一词为例),即可显示详情,在弹出框顶部可直接点击复制图标复制该词,也可点👍或👎,帮助模型在今后有更好的表现。此外还有蓝色搜索符号、查看义原、汉典、百度汉语、查看同义词和报告错误几个选项。


其中,点击蓝色搜索符号,即可按照该定义进行查询。比如在上图案例中点击搜索图标,就会自动以“高声呼喊”作为描述检索符合此描述的词语,如下图。



点击“查看义原”,即可直接跳转OpenHowNet网页查看该词义原。OpenHowNet是一款基于义原的语言知识库,同样是由清华大学计算机系自然语言处理实验室(THUNLP)开发的,网页首页如下图所示。



点击“汉典”,即可跳转查看该词在网页汉典中的解释和国语辞典中的含义。汉典是一个有着巨大容量的字、词、词组、成语及其他中文语言文字形式的免费在线辞典,该网页首页如下图所示。



点击“百度汉语”,即可跳转查看该词在百度汉语中的含义。


点击“查同义词”,即可以该词作为描述进行检索,得到该词的同义词。


汉语反向词典的使用方法就到这里了,其他三类检索以及内部小功能都相似,接下来就将展示每一类的特殊功能。


2

汉英


汉英反向词典选项下的筛选器可以筛选英语的短语或习语,如下图。



另外,进行汉英反向查词时,每个词的详情里可以直接点击跳转该词或短语在维基词典或剑桥词典中的解释,如下图。



3

英语


英语反向词典选项下的筛选器可以筛选单词或短语中需包含的英文字母,例如,输入“fast”可筛选含有“fast”的词。



进行英语反向查词时,每个词的详情里同样可以直接点击跳转该词或短语的义原、同义词以及维基词典或剑桥词典中的解释,如下图。



4

英汉


英汉反向词典的查词功能结合了前面几种的相应功能,具体可在官网或小程序端尝试。




常见问题




该工具还在不断更新升级中,开发团队已将他们的更新历史、迭代进展和规划(包括WantWords反向词典以及其他项目)以公开文档的形式分享给用户,点击文末“阅读原文”即可查看。


目前开发团队收集到以下一些常见问题。

Q1:XX词结果不对,和输入的描述没关系/意思相反
A1:因为反向查词模型训练数据以及性能所限,很难避免查出不太相关甚至特别离谱的词。一方面需要大家多多对查词结果点赞或踩来帮助更好地训练模型,另一方面开发团队也会考虑优化模型和词表,提高查词精确度。
Q2:XX词的定义/字形/拼音等有错误
A2:现有的词语信息均来自于网络词典,如果你发现某个词的基本信息存在错误,请点击“报告错误”来进行反馈,开发团队会收集一波反馈后集中修正。

Q3:想为此项目做贡献?

A3:你可以(1)经常在词语弹出的详情浮窗中点👍或👎;(2)在工具页面最下方“反馈推荐词”或“反馈意见建议”。


-END-


来源:WantWords网页、OpenHowNet网页、汉典网页

编辑:孙伊丽

排版:孙伊丽

审核:朱华 冯春霈



▶ 技术与工具
常见翻译质量保证工具一览国内外常见语料工具一览国内外常见术语管理工具翻译必备术语库和语料库合集(附网址)翻译必备的计算机翻译辅助软件(附网址)计算机辅助翻译工具-memoQ 核心功能概览
小牛翻译 Trados 插件新增术语词典功能
▶ 专访王华树:机器翻译将要取代人工翻译吗?崔启亮:机器翻译对语言服务企业有多大作用?韩林涛:文科生如何学习机器翻译?魏勇鹏:机器翻译质量评估为什么重要?徐彬:熟练掌握翻译技术,就能做出漂亮的活儿曹首光:如何打造一款受欢迎的机器翻译产品? 李梅:机器翻译对未来翻译教育有何影响?
周兴华:高校翻译教师如何学习翻译技术?丁丽:译后编辑人员与译者身份是否对等?
▶ 实践答疑一文读懂本地化如何高效地将机器翻译结果进行译后编辑?Trados扫盲贴:90%计算机辅助翻译初学者都会陷入的误区你的多数困惑在《翻译技术100问》中都能找到答案如何进入全球顶尖翻译大厂:谈谈简历投递雷区
▶ 行业洞察2021年语言服务行业回顾与展望
2022年翻译行业将迎来哪些新变化中国电影对外译介的现状与思考
冯志伟:关于机器翻译行业发展的三点建议

▶ 教育创新王华树 刘世界:人工智能时代翻译技术转向研究崔启亮:翻译技术教学案例资源建设和应用研究
曹达钦 戴钰涵:人工智能时代高校翻译技术实践环境建设研究
李梅:如何给“技术小白” 开设计算机辅助翻译课程?张慧玉 崔启亮 徐开:实践导向的MTI人才培养模式——以对外经济贸易大学为例李长栓:MTI论文千篇一律,如何破局?

继续滑动看下一个
语言服务行业
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存