如何快速將百度大腦AI技術內置智能小程序中

實現效果:

該AI智能小程序目前集成了百度AI開放平臺數十個AI服務產品功能,包括人臉識別、文字識別、表格識別、紅酒識別、貨幣識別、地標識別、手勢識別、商標識別、果蔬識別、菜品識別等圖片識別功能,以及黑白圖像上色、圖片風格變換等圖像處理的功能。

1 系統框架

小程序將常用功能按Ai技術分爲五大類:文字識別、語音技術、圖像技術、視頻技術和自然語言處理(NLP),然後根據具體功能再進行細分。本文主要介紹百度AI開放平臺計算機視覺方面服務產品的測試過程及效果。通過微信小程序實現API調用。小程序將用戶上傳的圖片提交給百度AI服務,返回識別結果。全部功能都在小程序客戶端完成,不需要服務器,適合個人開發者學習調試使用,同時也爲商業應用提供相應解決方案。

開發平臺:微信開發者工具 V1.02

開發語言:java script

測試環境:Andriod 9.0

2 微信小程序開發過程

2.1註冊微信小程序

註冊地址:https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CN

註冊成功後在開發->開發者ID裏找到AppID,這是開發微信小程序所需要的身份標識。然後填寫服務器域名,需要用到的均要填上,如下圖。

2.2 小程序的配置已基本完成,下一步需要下載開發工具了,微信自己開發的IDE,下載地址是:
https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html

2.3小程序開發文檔:https://developers.weixin.qq.com/miniprogram/dev/framework/

2.4小程序開發界面

如下圖,標紅處需要填入註冊時獲得的APPID。

2.5程序總體結構

Pages下的每個文件夾對應實現一種AI功能。添加新的AI功能,比如添加駕駛證識別功能,在根目錄的全局配置文件app.json中增加:"pages/ driving_license/ driving_license" ,會自動創建相關頁面文件夾,其內部結構如下:

driving_license.js:功能邏輯模塊

driving_license.wxss:頁面樣式文件

driving_license.wxml:頁面佈局文件

driving_license.json:頁面配置文件

3 程序功能實現說明

想了解微信小程序中百度API接口的調用過程,請參看我之前的帖子:

營業執照識別:https://ai.baidu.com/forum/topic/show/956171

增值稅發票識別:https://ai.baidu.com/forum/topic/show/956168

車牌識別:https://ai.baidu.com/forum/topic/show/956167

手寫文字識別:https://ai.baidu.com/forum/topic/show/956153

圖像風格轉換:https://ai.baidu.com/forum/topic/show/956135

文字識別:https://ai.baidu.com/forum/topic/show/954152

iOCR財會版:https://ai.baidu.com/forum/topic/show/956136

當然,還有更多百度AI服務功能可以陸續添加,按照以上文章鏈接所提供的方法稍作修改即可。有興趣的同學可以試試。

4 測試效果

以下選取了部分圖片識別的測試效果:

4.1菜品識別

4.2 車型識別

4.3地標識別

4.4動物識別

4.5紅酒識別

4.6 貨幣識別

4.7 植物識別

4.8 黑白圖像上色

4.9 清點人數

4.10 通用物體與場景識別

5 測試結論

5.1識別能力

根據拍攝照片,識別圖片內容,廣泛應用於娛樂類APP,自助結算等業務場景中。目前圖像識別具備的識別能力如下:

品牌logo識別 :識別4萬種商品logo,支持定製logo圖庫

植物識別 :識別2萬多種通用植物和近8千種花卉

動物識別 :識別近8千種動物

菜品識別 :識別超過近九千種菜品,支持定製菜品圖庫

地標識別 :識別5萬中外著名地標、景點

果蔬識別 :識別近千種水果和蔬菜

紅酒識別 :識別數十萬中外紅酒名稱及詳細介紹

貨幣識別 :識別國內外常見貨幣,支持正反面、紀念鈔

車型識別 :識別3千款常見車型,可返回車型百科信息

營業執照識別 :識別各版式營業執照所有關鍵字段

增值稅發票識別 :識別增值稅普票或專票所有30個字段

駕駛證識別 :識別機動車駕駛證正本所有9個字段

車牌識別 :識別藍牌、綠牌、單/雙行黃牌等類型車牌

手寫文字識別 :識別圖片中的手寫數字、手寫中文

表格文字識別 :識別表頭、表尾及每個單元格的文字內容

人臉檢測 :返回人臉框與關鍵點,識別多種人臉屬性

手勢識別 :識別24種常見手勢,支持自拍、他人拍攝

5.2 特色優勢

1)圖像識別功能豐富

支持多種垂類業務場景的細粒度圖像識別,精準識別超過十萬種物體和場景,基於百度海量數據,持續豐富接口返回內容信息。

2)識別準確性高

基於百度豐富的海量數據,利用深度學習技術及精準的算法迭代模型,不斷提高準確性。

3)工作穩定性好

提供24小時雲端高穩定服務,宕機率低,故障恢復快,單圖毫秒級響應,服務可用性高達99.95%。

4)支持定製化識圖

支持根據不同的業務場景定製客戶專屬的AI識圖能力,滿足非通用場景下的業務需求。例如品牌logo,菜品識別均可自定義庫。

5)支持獲取百科信息

支持識別結果中返回百度百科的內容,讓客戶業務功能更完善、內容更豐富。

作者:wangwei8638

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章