查看原文
其他

看看人家那文本识别系统,那叫一个优雅!

点击关注 👉 Java架构师技术 2023-09-18
以下文章来源Java架构师技术,回复”Spring“获惊喜礼包
上一篇推文:最全SQL 语句大全,值得收藏!

大家好,我是Java架构师


今天,推荐一个文本识别系统项目。我第一次使用就有点上头,爱不释手,必须要推荐给大家。

上次是谁要的文本识别系统项目啊,我帮你找到了。

这是我目前见过最好的文本识别系统项目。功能完整,代码结构清晰。值得推荐。

📚 项目介绍

最近我在逛网站的时候发现一个不错的开源项目,这个项目目前收获了 5.4K Star,猿哥觉得不错,值得拿出来和大家分享下。


说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,猿哥要和大家分享一个可以识别文本背后含义的工具——pyWhat。


当你不知道特定一串文本代表什么时,它能快速判断它是否是 email、油管视频编号、手机号 或者是其他信息格式。你给它一个 .pcap 文件或者一段文本,它能告诉你这个文件或是文本代表了什么。扩展:接私活儿


目前,pyWhat已经在Github上标星5.4K,累计分支 273 个。另外,搜索公众号GitHub猿回复“打飞机”,送你一份惊喜礼包。



同搜索不同,pyWhat 会自动进行文本分断,例如 5f4dcc3b5aa765d61d8327deb882cf99 如果没有完全匹配的信息格式,pyWhat 会切断文本进行多个不同字符串长度的完全匹配。

示例



比如当你遇到了一个名为 WantToCry的新恶意软件,你回想起 Wannacry 并记得它被停止是因为研究人员在代码中发现了一个终止开关。

当一个硬编码到 Wannacry 的域被注册时,病毒就会停止。你可以通过这个工具识别恶意软件中的所有域,并使用域注册器 API 来注册所有域。如果 Wannacry 再次发生,你就可以在几分钟内阻止它,而不是几周。扩展:接私活神器!

更快地分析 Pcap 文件



假设你有一个.pcap来自网络攻击的文件。What可以识别并快速找到以下内容:
  • 所有哈希

  • 信用卡号码

  • 加密货币地址

  • 联系方式等


简而言之,只要你想要在一个文件中找出所有有用的结构化数据,pywhat都适合你。

最后,想学习这个项目的可以查看项目地址:

项目源码,怎么领取?

源码获取

牛逼啊!接私活必备的 N 个开源项目!赶快收藏

扫码下方二维码,后台回复【文本识别】即可获取所有系统

欢迎有需要的同学试试,如果本文对您有帮助,也请帮忙点个 赞 + 在看 啦!❤️

在 程序员小乐 还有更多优质项目系统学习资源,欢迎分享给其他同学吧!

最后,整理了400多套项目,赠送读者。扫码下方二维码,后台回复赚钱即可获取。

--END--

来源:开源最前线(ID:OpenSourceTop) 猿妹整编

版权申明:内容来源网络,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!

往期惊喜:

何谓架构?

一个很酷的后台权限管理系统

一个很酷的博客系统

一个很酷的快速开发代码生成器系统

看看人家那 IM 即时通讯系统,那叫一个优雅(附源码)

掌握Git命令的本质,开发时才会得心应手!

高并发场景下基于 Spring Boot 框架来实现 MySQL 读写分离(附源码)

API开放接⼝设计之appId,appSecret,accessToken!

这是我见过最好的 SaaS 快速开发平台!

史上最污技术解读,我竟然秒懂了!

比 Redis 还快,更省内存,惊爆了!

增加了一行代码,让我们提高了3000%的性能

看看人家那短链接系统,那叫一个优雅!


扫码关注我们的Java架构师技术

带你全面深入Java

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存