◆ ◆ ◆ ◆ ◆
背景
今天週六,閒來無事打開百度搜索了一下——渣男語錄。
萬萬沒想到,百度文庫竟然不讓我複製這些語句。
這我不能忍!!!!我可是會Python的男孩紙~
我可是嚴小樣兒啊!於是,我成功複製了渣男語錄!
今天,我就用五行Python代碼輕鬆教你實現OCR,秒變渣男~ 嘿嘿嘿
五行代碼
首先,說個大前提,我這種方法是用來識別圖片上的文字的。也就是說,你想把圖片上的文字扒下來,用我的方法肯定沒錯!
# 第一步:導包
from aip import Aipocr as ocr
# 第二步:讀取
with open(path,'rb') as f:
img = f.read()
# 第三步:調用
cli = ocr(appId, apiKey, secretKey)
# 第四步:識別
rlt = cli.general(img)
# 第五步:輸出
for line in rlt['words_result']:
print(line.get('words'))
此時,可能會有些槓精會說:你這是楷書,識別起來肯定很容易啊!有本事識別手寫體,還有連筆的行書啊。
安排~
還有那些年抄過的歌詞~
最後,再來幾句詩~
雖說可能些許有點瑕疵,但是如果是正式文件或者是楷體字,對於那些想要把圖片上的文字扒下來的需求已經足夠了。我不會告訴你,我曾經有一份工作真的需要把圖片的文字轉換成word文檔,那時候廢了老勁了~
打包爲exe
爲了方便其他人員使用,我們可以用pyinstaller庫進行封裝生成exe可執行文件。
怎麼樣?學會了嗎!如果對本文章感興趣,可以在公衆號後臺發送“微信”,即可添加作者微信,諮詢代碼、答疑解惑,還可加羣。
<以下內容,點擊跳轉>
“在看”的永遠18歲~