Python基於百度雲文字識別API

這篇文章主要介紹了Python基於百度雲文字識別API,用Python實現最簡單的文字識別,具有一定的參考價值,感興趣的小夥伴們可以參考一下

本文實例爲大家分享了Python實現最簡單的文字識別的具體代碼,供大家參考,具體內容如下

Python版本:3.6.5

百度雲提供的文字識別技術,準確率還是非常高的,而且每天還有5w次免費的調用量,對於用來學習或者偶爾拿來用用,已經完全足夠了。文章提供一個模板,稍加修改就可以直接套用。註釋中提到必須輸入的地方,你都正確地輸入了的話,就可以完成一次簡單的文字識別了。

# -*- coding: utf-8 -*-
 
import requests
import base64
 
class Orc_main():
  def orc_look(self, path):
    access_token = "" # 自行註冊百度雲賬號,即可獲取自己專屬的access_token,必須輸入!
    with open(path, 'rb') as f:
      image_data = f.read()
      base64_ima = base64.b64encode(image_data)
      data = {
        'image': base64_ima
      }
      headers = {
        'Content-Type': 'application/x-www-form-urlencoded'
      }
      url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + str(access_token)
      r = requests.post(url, params=headers, data=data).json()
      for word in r['words_result']:
        yield word['words']
      # 返回一個生成器,可自行修改
 
if __name__ == '__main__':
  om = Orc_main()
  path = "" # 圖片文件路徑,必須輸入!
  words = om.orc_look(path) 
  # 輸出文字(返回結果)
  for word in words:
    print(word)

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持神馬文庫。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章