windows环境 Tesserocr 的安装及一些失败处理

是的一个 OCR 识别库,但其实是对做的一层API 封装,所以它的核心是,所以在安装之前我们需要先安装,本文用来记录安装流程以及安装过程中遇到的一些问题和处理方式 。
第一步,下载
为提供了支持,下载链接为: 。这里我直接下载的最新版:(注意其中文件名中带有 dev 的为开发版本,不带 dev 的为稳定版本,可以选择下载不带 dev 的版本 。)
下载完成后双击运行,按照提示一步步next就行,如果想要提前多下载一些语言,则需要勾选data(),但是如果勾选了该选项也会增加安装耗时,自己根据需要选择(笔者因为要用到多国语言识别,所以勾选了该选项):
之后就是漫长的等待安装下载过程~
第二步:添加环境变量
1,下载完成后,复制安装路径,我的安装路径是D:\\\-OCR,打开电脑系统属性→高级→环境变量,在path下新建-OCR的环境变量,添加之后,记得所有确定都点击!
【windows环境Tesserocr 的安装及一些失败处理】2,增加一个变量名,变量值为我的语言字库文件夹安装路径F:\-OCR\ 添加到变量中;如下图:

windows环境  Tesserocr 的安装及一些失败处理

文章插图
如果没有添加的变量,执行命令会出现如下错误:
windows环境  Tesserocr 的安装及一些失败处理

文章插图
第三步:安装
这里在直接使用pip安装时,总是出错:
于是采取镜像安装的方法:先在whl下载地址()下载和自己版本以及电脑操作系统对应的whl文件,比如笔者是.7,64位操作系统,就应该下载如下版本:
然后再pip镜像文件地址,镜像文件可以直接拖入后面,即可迅速安装成功:
第四步,代码验证安装成功
我随便截了张图作为样例图片进行测试:
代码如下:
import tesserocrfrom PIL import Imageimage = Image.open('test.jpg')print(tesserocr.image_to_text(image))
结果出现如下报错:
解决方法:打开报错的位置,D:\\.7,没有文件才报错,于是将原本D:\\\-OCR\路径下的文件复制到改路径下:
然后再次运行代码,就可以成功识别到文字啦:
参考链接: