0. 環境
Win Xp,Python2.7,百度雲賬號
1. 目標
體驗百度AI開放平臺的文字識別。效果還可以,不少服務對個人用戶每天都有免費使用次數。
2. 百度智能雲配置
需要有一個百度賬號。百度雲、百度文庫等的賬號其實是通用的。在這裏https://ai.baidu.com/直接登錄。在文字識別中,新建應用如下圖所示。
以下需要用到的是AppID、API KEY、Secret Key這三個。
3. 安裝Python版SDK
cmd中使用以下指令安裝sdk:
python -m pip install baidu-aip
我之前已經安裝過了。
4. 通用文字識別(高精度版)代碼
這裏我們體驗一下通用文字識別(高精度版)。
新建一個文件:main.py並將以下代碼複製進去。
# coding=utf-8
# 通用文字識別(高精度版)
from aip import AipOcr
""" 你的 APPID AK SK """
APP_ID = '11019520'
API_KEY = '5yc5VWEpChFRlKq0ROZma4kj'
SECRET_KEY = '********'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
""" 讀取圖片 """
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
image = get_file_content('example3.png')
""" 調用通用文字識別(高精度版) """
result = client.basicAccurate(image);
print str(result).decode('unicode_escape')
""" 如果有可選參數 """
options = {}
options["detect_direction"] = "true"
options["probability"] = "true"
""" 帶參數調用通用文字識別(高精度版) """
result = client.basicAccurate(image, options)
print str(result).decode('unicode_escape')
5. 試驗
隨便把一張帶有文字的圖片與main.py放在同一個目錄下,並命名爲example3.png
example3.png
命令行中運行:
python main.py
得到:
圖中的文字基本都識別出來的。順序是從上到下,英文和中文都可以。