python 调用 百度ocr_文字识别接口,识别图片上的文字

今天试用了一下 百度ocr_文字识别 功能。

我的想法是用python编程的方式调用 百度ocr_文字识别 ,上传一幅图片,识别图片上的文字

整个过程不难,这里将一些关键点记录下来。

第一步 注册或登陆百度云账号,创建百度应用

在这里插入图片描述

进入“百度云”的控制台,如下所示:
在这里插入图片描述
点击左侧导航栏中的“文字识别” 然后“创建应用”
在这里插入图片描述
创建应用的目的是为了生成三个字符串: appId, apiKey, secretKey 。这三个串在后面的python编程中需要用到

当应用创建完成后,可以看到与应用对应的这三个字符串:
在这里插入图片描述
把上面这三个字符串的内容复制下来,以后在python编程中要使用。

接下来点击左侧的SDK下载
在这里插入图片描述

第二步,下载SDK

我选择了python SDK进行下载
在这里插入图片描述

下载得到压缩包文件: aip-python-sdk-2.2.15.zip

将该包解压到本地:
在这里插入图片描述

打开CMD命令窗口,进入到以上setup.py文件所在目录。执行命令
python setup.py install

这一命令将 “aip”包安装到了 python的安装目录中的Lib\site-packages 子目录。

第三步 编写测试代码

下面就可以编写一个测试程序,测试一下是否可以调用接口,识别图片上的文字
test.py


#测试百度在线图片文本识别包
#导入百度的OCR包

from aip import AipOcr

if __name__ == "__main__":
    
    #此处填入在百度云控制台处获得的appId, apiKey, secretKey的实际值
    appId, apiKey, secretKey =['12345678','xxxxxxxxxxx','yyyyyyyyyyyyyyy'] 
    #创建ocr对象
    ocr = AipOcr(appId, apiKey, secretKey)
    with open('pic/piece0.png', 'rb') as fin:
        img = fin.read()    
        res = ocr.basicGeneral(img)
        print(res)

用前面提到的appId, apiKey, secretKey 三个字符串的值替换源码中相应的内容
并且在源码文件test.py所在的目录下有一个字目录pic,其中存放有一张图片
piece0.png
在这里插入图片描述
我故意选择了一张有些歪斜,有些杂点的图片,看看识别效果如何。

识别结果如下:

在这里插入图片描述
可以看到,图片上的文字 :“连长” 被正确地识别了出来。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章