查看原文
其他

大邓github汇总, 觉得有用记得star

大邓 大邓和他的Python 2022-07-09

今天整理了下自己的github,自己封装了9个python包,主要是爬虫包和文本分析包。其实今年才学会python包的封装,把常用的一些分析需求封装成包,可以简化后续代码量。截止今天,得到284个star,近一半star来自cnsenti包。

爬虫包

  • bsite  B站爬虫库  https://github.com/hidadeng/cnsenti
  • weibo_crawler  微博爬虫库  https://github.com/hidadeng/weibo_cralwer
  • shreport  上证交易所定期报告下载库  https://github.com/hidadeng/shreport

文本分析包

  • pdfdocx pdf、docx读取库 https://github.com/hidadeng/pdfdocx
  • multistop 多语言停用词库 https://github.com/hidadeng/multistop
  • simtext 文本相似度计算库 https://github.com/hidadeng/simtext
  • cnsenti 中文情感分析库 https://github.com/hidadeng/cnsenti
  • wordexpansion 领域情感词典构建库 https://github.com/hidadeng/wordexpansion
  • cntopic LDA话题模型库 https://github.com/hidadeng/cntopic

资源汇总

  • Tool_Kits_Of_Python Python资源大全 https://github.com/hidadeng/Tool_Kits_Of_Python
  • hidadeng.github.io 博客仓库 https://github.com/hidadeng/hidadeng.github.io
  • ChineseTextAnalysisResouce 中文文本分析资源汇总贴 https://github.com/hidadeng/ChineseTextAnalysisResouce
  • DaDengAndHisPython 公众号文章代码(部分)汇总 https://github.com/hidadeng/DaDengAndHisPython
  • hiResearch 学术浏览器首页定制 https://github.com/hiResearch/hiResearch

觉得有用的朋友们,赶快star一下; 大家如果有比较好的代码或好的想法,想封装成包,也可踊跃留言,我会选择比较有可行性的进行封装。

扫码免费领1万代理IP,高并发不限制,稳定速度快,快去薅羊毛吧!

精选文章

系列视频|Python网络爬虫与文本数据分析
语法最简单的微博通用爬虫weibo_crawler
hiResearch 定义自己的科研首页
Jaal 库 轻松绘制动态社交网络关系图
来自kaggle最佳数据分析实践
B站视频 | Python自动化办公
SciencePlots | 科研样式绘图库
使用streamlit上线中文文本分析网站
bsite库 | 采集B站视频信息、评论数据
texthero包 | 支持dataframe的文本分析包
爬虫实战 | 采集&可视化知乎问题的回答
reticulate包 | 在Rmarkdown中调用Python代码
plydata库 | 数据操作管道操作符>>
plotnine: Python版的ggplot2作图库
读完本文你就了解什么是文本分析
文本分析在经管领域中的应用概述  
综述:文本分析在市场营销研究中的应用
plotnine: Python版的ggplot2作图库
Wow~70G上市公司定期报告数据集
漂亮~pandas可以无缝衔接Bokeh  
YelpDaset: 酒店管理类数据集10+G  

    分享”和“在看”是更好的支持

点击阅读原文,进入github

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存