百度AI開放平臺:圖像中的文字識別入門demo(Python)

0. 環境

Win Xp,Python2.7,百度雲賬號

1. 目標

體驗百度AI開放平臺的文字識別。效果還可以,不少服務對個人用戶每天都有免費使用次數。

2. 百度智能雲配置

需要有一個百度賬號。百度雲、百度文庫等的賬號其實是通用的。在這裏https://ai.baidu.com/直接登錄。在文字識別中,新建應用如下圖所示。

以下需要用到的是AppID、API KEY、Secret Key這三個。

3. 安裝Python版SDK

cmd中使用以下指令安裝sdk:

python -m pip install baidu-aip

我之前已經安裝過了。

4. 通用文字識別(高精度版)代碼

這裏我們體驗一下通用文字識別(高精度版)。

新建一個文件:main.py並將以下代碼複製進去。

# coding=utf-8

# 通用文字識別(高精度版)

from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '11019520'
API_KEY = '5yc5VWEpChFRlKq0ROZma4kj'
SECRET_KEY = '********'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

""" 讀取圖片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example3.png')

""" 調用通用文字識別(高精度版) """
result = client.basicAccurate(image);
print str(result).decode('unicode_escape')  

""" 如果有可選參數 """
options = {}
options["detect_direction"] = "true"
options["probability"] = "true"

""" 帶參數調用通用文字識別(高精度版) """
result = client.basicAccurate(image, options)
print str(result).decode('unicode_escape')  

5. 試驗

隨便把一張帶有文字的圖片與main.py放在同一個目錄下,並命名爲example3.png

example3.png

命令行中運行:

python main.py

得到:

圖中的文字基本都識別出來的。順序是從上到下,英文和中文都可以。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章