這篇文章主要爲大家詳細介紹了Node+OCR實現圖像文字識別功能,具有一定的參考價值,感興趣的小夥伴們可以參考一下
開發目的
這算是node應用的第二個小應用吧,主要目的是熟悉node和express框架。原理很簡單:在node搭建的環境下引用第三方包處理圖片數據並返回給前臺信息。
實現效果,百度提供的圖片識別,經過測試識別車牌號等規範文字數字還是比較準確的
環境需求
1.Express 是一個非常流行的node.js的web框架。基於connect(node中間件框架)。提供了很多便於處理http請求等web開發相關的擴展。
2.OCR:
通用文字識別 Node SDK目錄結構:
├── src
│ ├── auth //授權相關類
│ ├── http //Http通信相關類
│ ├── client //公用類
│ ├── util //工具類
│ └── const //常量類
├── AipOcr.js //通用文字識別交互類
├── index.js //入口文件
└── package.json //npm包描述文件
支持 node 版本 4.0+
直接使用node開發包步驟如下:
1.在官方網站下載node SDK壓縮包。
2.將下載的aip-node-sdk-version.zip解壓後,複製到工程文件夾中。
3.進入目錄,運行npm install安裝sdk依賴庫
4.把目錄當做模塊依賴
其中,version爲版本號,添加完成後,用戶就可以在工程中使用通用文字識別 Node SDK。
直接使用npm安裝依賴:
npm install baidu-aip-sdk(嘗試沒有成功)
AipOcrClient是Optical Character Recognition的node客戶端,爲使用Optical Character Recognition的開發人員提供了一系列的交互方法。
用戶可以參考如下代碼新建一個AipOcrClient:
var AipOcrClient = require("baidu-aip-sdk").ocr; // 設置APPID/AK/SK var APP_ID = "你的 App ID"; var API_KEY = "你的 Api Key"; var SECRET_KEY = "你的 Secret Key"; var client = new AipOcrClient(APP_ID, API_KEY, SECRET_KEY);
express搭建就不再做詳細介紹了,上一篇博客已有哦~~
功能實現
前端上傳圖片後端處理:
router.route("/uploadPhoto").get(function(req,res){ // 到達此路徑則渲染register文件,並傳出title值供 register.html使用 res.render("uploadPhoto",{title:'圖片文字識別',message:""}); }).post(function(req,res){ // 跨域 res.header("Access-Control-Allow-Origin", "*"); res.header("Access-Control-Allow-Methods","PUT,POST,GET,DELETE,OPTIONS"); res.header("Access-Control-Allow-Headers", "Content-Type,Content-Length, Authorization, Accept,X-Requested-With"); let form = new formidable.IncomingForm(); form.encoding = 'utf-8'; // 編碼 form.keepExtensions = true; // 保留擴展名 form.maxFieldsSize = 2 * 1024 * 1024; // 文件大小 form.uploadDir = 'F:/nodejs/ocrCheck/assets/OCR' // 存儲路徑 form.parse(req,function(err,fileds,files){ // 解析 formData數據 if(err){ return console.log(err) } let imgPath = files.img.path // 獲取文件路徑 let imgName = "F:/nodejs/ocrCheck/assets/OCR/test." + files.img.type.split("/")[1] // 修改之後的名字 let data = fs.readFileSync(imgPath) // 同步讀取文件 fs.writeFile(imgName,data,function(err){ // 存儲文件 if(err){ return console.log(err) } fs.unlink(imgPath,function(){}) // 刪除文件 //上傳圖片成功返回code:1 //res.json({code:1}) global.nodeServer.getResult(res,imgName); }) }); });
圖片處理核心模塊:
module.exports = { getResult : function(res,imgName){ var image = fs.readFileSync(imgName); var base64Img = new Buffer(image).toString('base64'); client.generalBasic(base64Img).then(function(result) { console.log(JSON.stringify(result)); res.json(result); }); } }
獲取到的base64圖片數據和res對象作爲闡述傳遞給ocr提供好的方法, 回調產生的數據將作爲結果返回給前端。
####小彩蛋:
nodeJs中commonJs規範如何實現的?
1.Node程序由許多個模塊組成,每個模塊就是一個文件。Node模塊採用了CommonJS規範。
2.module對象,Node內部提供一個Module構建函數。所有模塊都是Module的實例。每個模塊內部,都有一個module對象,代表當前模塊。它有以下屬性。
module.id 模塊的識別符,通常是帶有絕對路徑的模塊文件名。 module.filename 模塊的文件名,帶有絕對路徑。 module.loaded 返回一個布爾值,表示模塊是否已經完成加載。 module.parent 返回一個對象,表示調用該模塊的模塊。 module.children 返回一個數組,表示該模塊要用到的其他模塊。 module.exports 表示模塊對外輸出的值。
3.調用:根據模塊名稱作爲對象調用其內自定義的方法即可。
global.nodeServer.getResult(res,imgName);
前端js代碼就不貼了 so~easy
效果展示
源碼:Node_OCR
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持神馬文庫。