查看原文
其他

资源|100+开源干货助你成为Python专家(自然语言 ①)

2017-03-19 全球人工智能 全球人工智能

全球人工智能


来源:Github   编辑: 王健


Natural Language Processing


NLTK  - 用于构建Python程序以处理人类语言数据的领先平台。

http://www.nltk.org/


模式 - 用于Python编程语言的Web挖掘模块。它具有自然语言处理,机器学习等工具。

www.clips.ua.ac.be/pattern


Quepy  - 一个python框架,用于将自然语言问题转换为数据库查询语言中的查询

https://github.com/machinalis/quepy


TextBlob  - 提供一致的API,用于潜入到常见的自然语言处理(NLP)任务。站在NLTK和模式的巨型肩膀上,并与两者发挥得很好。

textblob.readthedocs.io/en/dev/


YAlign  - 一个句子对齐器,一个友好的工具,用于从可比语料库提取并行句子。

https://github.com/machinalis/yalign


jieba  - 中文字分割工具。

https://github.com/fxsjy/jieba#jieba-1


SnowNLP  - 用于处理中文文本的库。

https://github.com/isnowfy/snownlp


spammy  - 用于电子邮件垃圾邮件过滤的库,构建于nltk之上

https://github.com/prodicus/spammy


loso  - 另一个中文分段库。

https://github.com/victorlin/loso


genius- 条件随机场的中文分段基础。

https://github.com/duanhongyi/genius


热门文章推荐

最新|世界人工智能概念第一股?即将在美国上市的Veritone是怎样一家公司

重磅|Google发布新开源图像算法工具Guetzli:压缩35%的图片大小仍保证高质量

重磅|3.15曝光的“人脸识别”技术真的那么脆弱吗?!

重磅|谷歌DeepMind将“记忆”植入机器学习,从而提高机器持续的自适应学习!

资源|28本必读的经典机器学习/数据挖掘书籍(免费下载)

活动|12位AI大佬齐聚ACM TURC 2017-中国(已开始报名)

恐怖|50 亿条用户隐私信息泄露,嫌犯竟是互联网名企工程

干货|周志华揭开机器学习本质的57张PPT

重磅|百度PaddlePaddle发布最新API 从三大方面优化了性能

重磅|NVIDIA发布两款"深度神经网络训练"开发者产品:DIGITS 5 和 TensorRT

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存