如何快速將百度大腦AI技術內置智能小程序中

原創

2019-11-27 14:24

實現效果：

該AI智能小程序目前集成了百度AI開放平臺數十個AI服務產品功能，包括人臉識別、文字識別、表格識別、紅酒識別、貨幣識別、地標識別、手勢識別、商標識別、果蔬識別、菜品識別等圖片識別功能，以及黑白圖像上色、圖片風格變換等圖像處理的功能。

1 系統框架

小程序將常用功能按Ai技術分爲五大類：文字識別、語音技術、圖像技術、視頻技術和自然語言處理（NLP）,然後根據具體功能再進行細分。本文主要介紹百度AI開放平臺計算機視覺方面服務產品的測試過程及效果。通過微信小程序實現API調用。小程序將用戶上傳的圖片提交給百度AI服務，返回識別結果。全部功能都在小程序客戶端完成，不需要服務器，適合個人開發者學習調試使用，同時也爲商業應用提供相應解決方案。

開發平臺：微信開發者工具 V1.02

開發語言：java script

測試環境：Andriod 9.0

2 微信小程序開發過程

2.1註冊微信小程序

註冊地址：https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CN

註冊成功後在開發->開發者ID裏找到AppID，這是開發微信小程序所需要的身份標識。然後填寫服務器域名，需要用到的均要填上，如下圖。

2.2 小程序的配置已基本完成，下一步需要下載開發工具了，微信自己開發的IDE，下載地址是：
https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html

2.3小程序開發文檔：https://developers.weixin.qq.com/miniprogram/dev/framework/

2.4小程序開發界面

如下圖，標紅處需要填入註冊時獲得的APPID。

2.5程序總體結構

Pages下的每個文件夾對應實現一種AI功能。添加新的AI功能，比如添加駕駛證識別功能，在根目錄的全局配置文件app.json中增加："pages/ driving_license/ driving_license" ，會自動創建相關頁面文件夾，其內部結構如下：

driving_license.js：功能邏輯模塊

driving_license.wxss：頁面樣式文件

driving_license.wxml：頁面佈局文件

driving_license.json：頁面配置文件

3 程序功能實現說明

想了解微信小程序中百度API接口的調用過程，請參看我之前的帖子：

營業執照識別：https://ai.baidu.com/forum/topic/show/956171

增值稅發票識別：https://ai.baidu.com/forum/topic/show/956168

車牌識別：https://ai.baidu.com/forum/topic/show/956167

手寫文字識別：https://ai.baidu.com/forum/topic/show/956153

圖像風格轉換：https://ai.baidu.com/forum/topic/show/956135

文字識別：https://ai.baidu.com/forum/topic/show/954152

iOCR財會版：https://ai.baidu.com/forum/topic/show/956136

當然，還有更多百度AI服務功能可以陸續添加，按照以上文章鏈接所提供的方法稍作修改即可。有興趣的同學可以試試。

4 測試效果

以下選取了部分圖片識別的測試效果：

4.1菜品識別

4.2 車型識別

4.3地標識別

4.4動物識別

4.5紅酒識別

4.6 貨幣識別

4.7 植物識別

4.8 黑白圖像上色

4.9 清點人數

4.10 通用物體與場景識別

5 測試結論

5.1識別能力

根據拍攝照片，識別圖片內容，廣泛應用於娛樂類APP，自助結算等業務場景中。目前圖像識別具備的識別能力如下：

品牌logo識別：識別4萬種商品logo，支持定製logo圖庫

植物識別：識別2萬多種通用植物和近8千種花卉

動物識別：識別近8千種動物

菜品識別：識別超過近九千種菜品，支持定製菜品圖庫

地標識別：識別5萬中外著名地標、景點

果蔬識別：識別近千種水果和蔬菜

紅酒識別：識別數十萬中外紅酒名稱及詳細介紹

貨幣識別：識別國內外常見貨幣，支持正反面、紀念鈔

車型識別：識別3千款常見車型，可返回車型百科信息

營業執照識別：識別各版式營業執照所有關鍵字段

增值稅發票識別：識別增值稅普票或專票所有30個字段

駕駛證識別：識別機動車駕駛證正本所有9個字段

車牌識別：識別藍牌、綠牌、單/雙行黃牌等類型車牌

手寫文字識別：識別圖片中的手寫數字、手寫中文

表格文字識別：識別表頭、表尾及每個單元格的文字內容

人臉檢測：返回人臉框與關鍵點，識別多種人臉屬性

手勢識別：識別24種常見手勢，支持自拍、他人拍攝

5.2 特色優勢

1）圖像識別功能豐富

支持多種垂類業務場景的細粒度圖像識別，精準識別超過十萬種物體和場景，基於百度海量數據，持續豐富接口返回內容信息。

2）識別準確性高

基於百度豐富的海量數據，利用深度學習技術及精準的算法迭代模型，不斷提高準確性。

3）工作穩定性好

提供24小時雲端高穩定服務，宕機率低，故障恢復快，單圖毫秒級響應，服務可用性高達99.95%。

4）支持定製化識圖

支持根據不同的業務場景定製客戶專屬的AI識圖能力，滿足非通用場景下的業務需求。例如品牌logo，菜品識別均可自定義庫。

5）支持獲取百科信息

支持識別結果中返回百度百科的內容，讓客戶業務功能更完善、內容更豐富。

作者：wangwei8638

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

C#開源的兩款功能強大的錄屏神器

ScreenToGif ScreenToGif是一款由C#語言開發且開源的操作簡單、免費的屏幕錄製和GIF動畫製作神器。它可以幫助用戶捕捉計算機屏幕上的實時動畫，並將其保存爲高質量的 GIF 圖像格式。該工具不僅適用於技術支持、軟件演示和教

2024-05-03 14:28:27

前端 Vue yarn.lock文件：詳解和使用指南

yarn.lock文件：詳解和使用指南 https://www.python100.com/html/38KF796X6BHM.html 一、什麼是yarn.lock文件 yarn.lock文件是一個產生於Yarn 0.22及以後版

2024-05-03 14:15:26

前端 Vue webpack配置之 webpack.config.js 文件配置

Webpack 在執行的時候，除了在命令行傳入參數，還可以通過指定的配置文件來執行。默認情況下，會搜索當前目錄的 webpack.config.js 文件，這個文件是一個 node.js 模塊，返回一個 json 格式的配置信息對象，或

2024-05-03 14:15:26

Vue package-lock.json的作用

package-lock.json的作用 "node_modules/@aashutoshrathi/word-wrap": { "version": "1.2.6", "resolved": "h

2024-05-03 14:15:26

前端 Vue-cli中 vue.config.js 的配置詳解

Vue-cli 3 / Vue-cli 4 目錄結構 ├── README.md # 說明 |-- dist # 打包後文件夾 ├── babel.config.js

2024-05-03 14:15:26

druid數據源 xml配置

https://blog.csdn.net/h273979586/article/details/87932220 pom依賴 <dependency> <groupId>com.alibaba</groupId>

2024-05-03 14:14:55

Windows中Redis怎麼設置密碼

Windows中Redis怎麼設置密碼

2024-05-03 14:11:15

JDK8和JDK17共存以及切換的方法

1、先安裝"jdk-8u381-windows-x64.exe"，再安裝"jdk-17_windows-x64_bin.exe" 2、"系統屬性"-"高級"-"環境變量"-"系統變量"-"Path"-"編輯"，刪除以下2條 C:\Progr

2024-05-03 14:11:15

centos7修改redis密碼

檢查Redis配置文件首先，我們需要確保Redis的配置文件中包含了設置密碼的選項。打開Redis的配置文件/etc/redis.conf，查找以下行並確保取消註釋（去掉行首的#）： requirepass your_password 啓

2024-05-03 14:11:15

基於SSM的在線外賣訂餐系統畢業設計論文【範文】

摘要隨着互聯網技術的迅猛發展和人們生活節奏的加快，在線外賣訂餐系統因其便捷性和高效率而受到廣泛歡迎。本文圍繞《基於SSM框架的在線外賣訂餐系統》這一課題展開研究，旨在設計並實現一個功能全面、操作簡便且安全可靠的在線外賣訂餐平臺。首先，文

2024-05-03 14:08:24

基於CodeMirror開發在線編輯器時遇到的問題及解決方案

需求：實現json在線編輯並支持校驗，基於此使用了 CodeMirror在線編輯，jsonlint校驗輸入數據 // package.json: "dependencies": { "codemirror": "^5.53.2"

2024-05-03 14:04:44

《軟件性能測試、分析與調優實踐之路》(第2版) PPT課件流出

掃描圖書前言中的如下圖所示的二維碼，即可進入到下載頁面。如下圖所示即爲課件的下載頁面，免費提供下載

2024-05-03 14:01:24

2024年感想

　　看了一眼之前到博客，最近的一次博客還在一年之前，時間如白駒過隙，飛快流逝。這兩年生活和工作都經歷裏很多，想想是應該在這裏好好梳理總結下。我總是感慨，自己從二十六七歲到現在三十多的年紀，好像經歷別人的半輩子，感悟衆多。　　我以前是個朋友

兜兜有糖的博客

2024-05-03 13:57:53

AWS S3 Lambda Python腳本函數實現圖片自動轉換爲webp並上傳至s3

Amazon S3 自動轉換圖片格式 Amazon S3 存儲桶新增文件自動觸發 AWS Lambda。Lambda 取 S3 文件做轉換並存回去 S3 同一個目錄下，並增加相應的後綴名。並且支持通過API Gateway的方式觸發對

2024-05-03 13:51:42

Eclipse Memory Analyzer (MAT)的安裝後提示JDK版本不對要升級到jdk_17

背景在啓動MAT分析內存時報錯：Version1.8.0 of the jvm is not suitable for this product，Version17 or greater isrequired。問題原因很明顯，我電腦的J

2024-05-03 13:51:42

24小時熱門文章

最新文章

最新評論文章