查看原文
其他

使用Python读取图片中的文本数据

Dario Radečić 大邓和他的Python 2022-07-09

CoolAuthor:Dario Radečić Title: Read Text from Image with One Line of Python Code Site https://towardsdatascience.com/read-text-from-image-with-one-line-of-python-code-c22ede074cac

Python爬虫与Stata应用能力提升与实证前沿  寒假工作坊开始报名了~

通过pytesseract和opencv-python我们可以读取图片中的文本,

安装

  • opencv-python

  • pytesseract

  1. !pip3 install opencv-python

  1. !pip3 install pytesseract

mac经过上面两个步骤就解决了安装问题,windows鼓捣了一晚上我还是没有解决,惭愧。

各位可以参考原文 https://towardsdatascience.com/read-text-from-image-with-one-line-of-python-code-c22ede074cac

发扬艰苦奋斗自力更生精神,询问下百度谷歌两位大神

实战

  1. import pytesseract

  2. import cv2


  3. img = cv2.imread('img/breakingnews.png')

  4. text = pytesseract.image_to_string(img)

  5. print(text)

  1. ((( BREAKING NEWS )))

  1. import pytesseract

  2. import cv2


  3. img = cv2.imread('img/bitcoin.jpeg')

  4. text = pytesseract.image_to_string(img)

  5. print(text)

  1. IS BITCOIN

  2. GOING TO

  3. $20.000

  4. BY CHRISTMAS?

真的太cool了~

近期文章

精选课程 | Python数据分析实战(学术)

Python爬虫与Stata应用能力提升与实证前沿  寒假工作坊

Loughran&McDonald金融文本情感分析库

股评师分析报告文本情感分析预测股价

如何使用seaborn绘制组合图

代码不到40行的超燃动态排序图

使用Python自动生成事件分析图谱

使用分析师报告中含有的情感信息预测上市公司股价变动

日期数据操作第1期 datetime库

日期数据操作第2期 pandas库

史上最大规模1.4亿中文知识图谱开源下载

【公开视频课】Python语法快速入门

【公开视频课】Python爬虫快速入门

文本数据分析文章汇总(2016-至今)

当文本分析遇到乱码(ง'⌣')ง怎么办?

当pandas遇上数据类型问题

如何理解pandas中的transform函数

一行pandas代码生成哑变量

Python最被低估的库,用好了效率提升10倍!


课件获取方式,请在公众号后台回复关键词“20191213


觉得本文有用,请不吝点赞评论转发~谢谢支持~



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存