查看原文
其他

已开源!清华大学开源了一项神器,在 GitHub 爆了!

推荐大家关注一个公众号
点击上方 "Linux中文社区关注,星标或者置顶
21点00分准时推送,第一时间送达

责编:中文妹 | 来源:开源最前线猿妹 整编  整理自:http://985.so/xg3s

上一篇:什么叫 SSH ?原理详解,看这一篇就够了!
大家好,我是中文妹。
今天,推荐一个神器。我第一次使用就有点上头,爱不释手,必须要推荐给大家。

上次是谁要的神器啊,我帮你找到了。

这是我目前见过最好的神器。功能完整,代码结构清晰。值得推荐。

📚 项目介绍

清华大学在 GitHub 开源了一项神器叫万词王(Want Wrong),不是你们想的那个万磁王,号称是首个支持中文及跨语言查询的开源在线反向词典。

给大家普及一下,什么叫反向词典?扩展:接私活

普通的词典告诉你某个词语的定义,而反向词典恰好相反,可以告诉你哪些词语符合你输入描述的意思。上图为万词王在线反向词典的页面截图,其中演示了反向查词的一个示例输入 “山非常高”,系统将返回一系列模型认为表达 “山非常高” 意思的词语,例如 “高峻”、“巍峨” 等。

01 反向词典可以用来做什么?

  • 解决“舌尖现象”(tip-of-the-tongue,又称话到嘴边说不出来),即暂时性忘词的问题

  • 帮助语言学习者学习、巩固词汇

  • 改善选词性失语者患者的生活质量,该病的症状是可以识别并描述一个物体,但是无法记起该物体的名字

简单来说,就是现在的年轻人都会有词穷的时候,当你词穷的时候,这个工具就可以派上用场了,比如你心慌意乱拿不定主意的时候,不知道用哪个词,你就可以将它输进去,就会得到犹豫不决、不意乱心慌等100个词语。而且词性和韵脚也是可以自定义选择。

牛逼啊!接私活必备的 N 个开源项目!


除此之外,它还支持汉语、英语、汉英、英汉等多种不同转化方式。

整体的系统架构也很简单:

万词王的核心模型是之前清华大学计算机系自然语言处理实验室(THUNLP)发表在AAAI-20上的一篇论文提出的多通道反向词典模型:Multi-channel Reverse Dictionary Model [论文] [代码],其模型架构如下所示:


02 关于清华大学自然语言处理与社会人文计算实验室


清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)成立于20世纪70年代末,最初在黄昌宁教授的带领下从事中文信息处理方面的研究工作,是国内开展自然语言处理研究最早、深具影响力的科研单位,同时也是中国中文信息学会(全国一级学会)计算语言学专业委员会的挂靠单位。实验室学术带头人为孙茂松教授,实验室教师队伍还包括刘洋教授和刘知远副教授。另外,搜索公众号Linux中文社区后台回复“命令行”,获取一份惊喜礼包。


实验室面向以中文为核心的自然语言处理前沿基础课题开展系统深入的研究工作,研究领域涵盖计算语言学的核心问题以及社会计算和人文计算,近年来在973、863、国家自然科学基金等项目的支持下,实验室师生在IJCAI、AAAI、ACL、EMNLP等国际顶级会议和期刊上发表多篇高水平学术论文,与CMU、NUS、Google等国际名校和企业有长期良好的合作关系,培养的优秀毕业生大多到清华大学、谷歌、百度、阿里、微软等著名高校和企业工作。

WantWords由THUNLP开发和维护,项目指导教师为孙茂松教授和刘知远副教授,开发团队成员包括岂凡超,张磊,杨延辉。

目前,Wantwords已经在GitHub上标星 5K,累计分支 464 个。

项目源码,怎么领取?

源码获取

牛逼啊!接私活必备的 N 个开源项目!

扫码下方二维码,后台回复【万词王】即可获取所有系统

欢迎有需要的同学试试,如果本文对您有帮助,也请帮忙点个 赞 + 在看 啦!❤️

在 GitHub猿 还有更多优质项目系统学习资源,欢迎分享给其他同学吧!


  声明:本文部分素材转载自互联网,如有侵权立即删除 。


往期精彩


喜欢本文的朋友们,欢迎长按下图,关注订阅号Linux中文社区


收看更多精彩内容

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存