四行Python代码,你也能从图片上识别文字!

系统 1958 0
阅读更多

图像识别、文字识别,这些都是现在比较火的东西,现在大部分的AI都有在做这些东西,那我们就过来了解一下吧!

只需要四行代码,完成从图片中读取图片中的文字!

准备工作:  

我们需要两个安装包,先来安装一下:

pip install pillow

640?wx_fmt=png

pip install pytesseract

640?wx_fmt=png

安装完之后,我们需要下载Tesseract-OCR这个软件,这里我已经将东西都打包好了放在百度云中,大家可以直接下载:

链接

https://pan.baidu.com/s/1osNf95ScZJYhtzsGFLtxaA

密码

npmn

打开安装包,一路next

四行Python代码,你也能从图片上识别文字!_第1张图片

记录好自己的安装路径

四行Python代码,你也能从图片上识别文字!_第2张图片

安装完之后找到tessdata目录下,将下载的chi_sim.traineddata文件放到该目录下。这样它就能识别中文了。

四行Python代码,你也能从图片上识别文字!_第3张图片

之后,我们只剩下一个东西要配一下了,在 pytesseract模块中 pytesseract.py 文件中去配置一下 Tesseract-OCR 的工作目录,这个时候我们可以通过刚刚pip安装的位置找到 pytesseract.py 文件,如下图:

640?wx_fmt=png

进入目录找到 pytesseract.py 文件并且打开它:

四行Python代码,你也能从图片上识别文字!_第4张图片

将tesseract_cmd这个变量的值改成Tesseract-OCR的安装目录即可。

现在,我们在准备一张图片,用来识别,小编就用微信截图好了,放置在桌面文件夹上:

640?wx_fmt=png

开始代码:

到这里,我们所有的预备环境以及全部搭建好了,下面我们就开始来敲代码咯:

640?wx_fmt=png

from PIL import Image

import pytesseract

pic_content=pytesseract.image_to_string(Image.open( 'C: \\ Users \\ yuqing.wu \\ Desktop \\ all \\ 3.png' ), lang = 'chi_sim' )

print (pic_content)

我们来看看运行结果:

640?wx_fmt=png

结果还是比较准的。

大家也来试试吧!

像这样的图像识别还是挺重要、挺常用的,例如图片验证码等等,都是可以去完成的,就看大家怎么去用了!

四行Python代码,你也能从图片上识别文字!_第5张图片

感兴趣的扫个二维码吧!


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论