python 调用百度ocr_文字识别接口，识别图片上的文字

原創

littleZhuHui

2020-06-20 01:51

今天试用了一下百度ocr_文字识别功能。

我的想法是用python编程的方式调用百度ocr_文字识别，上传一幅图片，识别图片上的文字

整个过程不难，这里将一些关键点记录下来。

第一步注册或登陆百度云账号，创建百度应用

进入“百度云”的控制台，如下所示：

点击左侧导航栏中的“文字识别” 然后“创建应用”

创建应用的目的是为了生成三个字符串: appId, apiKey, secretKey 。这三个串在后面的python编程中需要用到

当应用创建完成后，可以看到与应用对应的这三个字符串：

把上面这三个字符串的内容复制下来，以后在python编程中要使用。

接下来点击左侧的SDK下载

第二步，下载SDK

我选择了python SDK进行下载

下载得到压缩包文件： aip-python-sdk-2.2.15.zip

将该包解压到本地：

打开CMD命令窗口，进入到以上setup.py文件所在目录。执行命令
python setup.py install

这一命令将 “aip”包安装到了 python的安装目录中的Lib\site-packages 子目录。

第三步编写测试代码

下面就可以编写一个测试程序，测试一下是否可以调用接口，识别图片上的文字
test.py


#测试百度在线图片文本识别包
#导入百度的OCR包

from aip import AipOcr

if __name__ == "__main__":
    
    #此处填入在百度云控制台处获得的appId, apiKey, secretKey的实际值
    appId, apiKey, secretKey =['12345678','xxxxxxxxxxx','yyyyyyyyyyyyyyy'] 
    #创建ocr对象
    ocr = AipOcr(appId, apiKey, secretKey)
    with open('pic/piece0.png', 'rb') as fin:
        img = fin.read()    
        res = ocr.basicGeneral(img)
        print(res)

用前面提到的appId, apiKey, secretKey 三个字符串的值替换源码中相应的内容
并且在源码文件test.py所在的目录下有一个字目录pic,其中存放有一张图片
piece0.png

我故意选择了一张有些歪斜，有些杂点的图片，看看识别效果如何。

识别结果如下：

可以看到，图片上的文字：“连长” 被正确地识别了出来。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

python 调用百度ocr_文字识别接口，识别图片上的文字

第一步注册或登陆百度云账号，创建百度应用

第二步，下载SDK

第三步编写测试代码

识别结果如下：

一键自动化博客发布工具,用过的人都说好(掘金篇)

「Pygors跨平台GUI」2：安装MinGW-w64、MSYS2还是WSL2

[转帖]

python列出centos7内存使用前50的进程信息

「Pygors跨平台GUI」1：Pygors跨平台GUI应用研究

nodejs学习06——小案例

评估统计算法在银行伪造钞票检测中的价值

C# Xmlserializer 程序集内存泄露

Java ThreadPoolShutdown

5月21日相聚上海张江！与文心大模型一起共建大模型产业应用生态圈

python 調用百度ocr_文字識別接口，識別圖片上的文字

freeCAD學習筆記一：嘗試一個最簡單的例子

在word中用vba爲選中區域自動添加行號或刪除行號

關於鼠害智能監控的一個設想

python開發的軍棋自動裁判軟件

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

python 调用 百度ocr_文字识别接口，识别图片上的文字

第一步 注册或登陆百度云账号，创建百度应用

第二步，下载SDK

第三步 编写测试代码

识别结果如下：

python 调用百度ocr_文字识别接口，识别图片上的文字

第一步注册或登陆百度云账号，创建百度应用

第三步编写测试代码