小妙招:让图像会说话,字字清晰
人对图像的感知能力很强,所以图文很多,但是我们的认知却更多的用文字去传达;所以我们常常苦恼:
如何将pdf文字转成Word文本
如何快速破解验证码
如何从图片中找到自己想要的关键信息
今天我们一起用一个简单的小程序,破解我们日常中的小难题;天不助人,人自助。
1,工欲善其事,必先利其器
import pytesseractfrom PIL import Imageimg_str = 'test.png'img = Image.open(img_str)a = pytesseract.image_to_string(img)for w in a.split('\n'): #格式化输出 if w.strip(): print(w)import pytesseractfrom PIL import Imageimg_str = 'test.png'img = Image.open(img_str)a = pytesseract.image_to_string((img), lang='chi_sim') for w in a.split('\n'): #格式化输出 if w.strip(): print(w)import pytesseractfrom PIL import Imageimport numpy as npdef
deal_img(img_str): img = Image.open(img_str) im = img.convert('RGBA') data = np.array(im) print(data) # RGBA 数据矩阵 r1,g1, b1 = [220, 58, 21] rw, gw, bw, aw = [255, 255, 255, 255] red, green, blue, alpha = data[:, :, 0], data[:, :, 1], data[:, :, 2], data[:, :, 3] mask = ((red <= r1) & (green <= g1) & (blue == b1)) data[:, :, :4][mask] = [rw, gw, bw, aw] new_im = Image.fromarray(data) new_im.save('new_file.png') return new_im
img_str = 'test_red.png'img=deal_img(img_str)a = pytesseract.image_to_string((img), lang='chi_sim')for w in a.split('\n'): #格式化输出 if w.strip(): print(w)推荐阅读: