查看原文
其他

这个开源文本识别系统我粉了(附源码)

GitHub猿 2021-12-16

来自:开源最前线(ID:OpenSourceTop) 猿妹整编


往期文章:又一个免费的开源商城系统(附源码)


正文


大家好,我是GitHub猿。今天,推荐一个文本识别系统。


上次是谁要文本识别系统的项目啊,猿哥帮你找到了。


这是我目前见过的最好的文本识别系统。功能完整,代码结构清晰。值得推荐。


说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,猿哥要和大家分享一个可以识别文本背后含义的工具——pyWhat。

当你不知道特定一串文本代表什么时,它能快速判断它是否是 email、油管视频编号、手机号 或者是其他信息格式。你给它一个 .pcap 文件或者一段文本,它能告诉你这个文件或是文本代表了什么。


目前,pyWhat已经在Github上标星3.9K,累计分支 127 个。

搜索公众号GitHub猿回复“打飞机”,送你一份惊喜礼包。



同搜索不同,pyWhat 会自动进行文本分断,例如 5f4dcc3b5aa765d61d8327deb882cf99 如果没有完全匹配的信息格式,pyWhat 会切断文本进行多个不同字符串长度的完全匹配

示例



比如当你遇到了一个名为 WantToCry的新恶意软件,你回想起 Wannacry 并记得它被停止是因为研究人员在代码中发现了一个终止开关。

当一个硬编码到 Wannacry 的域被注册时,病毒就会停止。你可以通过这个工具识别恶意软件中的所有域,并使用域注册器 API 来注册所有域。如果 Wannacry 再次发生,你就可以在几分钟内阻止它,而不是几周。

更快地分析 Pcap 文件



假设你有一个.pcap来自网络攻击的文件。What可以识别并快速找到以下内容:
  • 所有哈希

  • 信用卡号码

  • 加密货币地址

  • 联系方式等


简而言之,只要你想要在一个文件中找出所有有用的结构化数据,pywhat都适合你。

源码获取

扫码下方二维码,后台回复【文本识别】即可获取


版权申明:内容来源网络,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!

往日文章:
热搜第一,快手宣布取消“大小周”,互联网公司“996风气”松动?

用了那么多个开源博客系统,还是最喜欢这个(附文档)

火爆Github!这个号称后现代编辑能超越Vim么?(附源码)

Windows 11 预览版镜像提前出世(附下载)!

如何实现一个权限管理系统?(附源码)


最近,GitHub猿建了一个「GitHub猿交流群」,欢迎大家一起交流优秀开源项目,也可以宣传自己的开源项目,在 「GitHub猿」公众号后台回复【加群】邀请你入群。

你点的每个赞,我都认真当成了喜欢
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存