Node+OCR實現圖像文字識別功能

這篇文章主要爲大家詳細介紹了Node+OCR實現圖像文字識別功能,具有一定的參考價值,感興趣的小夥伴們可以參考一下

開發目的

這算是node應用的第二個小應用吧,主要目的是熟悉node和express框架。原理很簡單:在node搭建的環境下引用第三方包處理圖片數據並返回給前臺信息。

實現效果,百度提供的圖片識別,經過測試識別車牌號等規範文字數字還是比較準確的

環境需求

1.Express 是一個非常流行的node.js的web框架。基於connect(node中間件框架)。提供了很多便於處理http請求等web開發相關的擴展。

2.OCR:

通用文字識別 Node SDK目錄結構:

├── src
    │  ├── auth                                //授權相關類
    │  ├── http                                //Http通信相關類
    │  ├── client                              //公用類
    │  ├── util                                //工具類
    │  └── const                               //常量類
    ├── AipOcr.js                      //通用文字識別交互類
    ├── index.js                               //入口文件
    └── package.json                           //npm包描述文件 

支持 node 版本 4.0+
直接使用node開發包步驟如下:

1.在官方網站下載node SDK壓縮包。
2.將下載的aip-node-sdk-version.zip解壓後,複製到工程文件夾中。
3.進入目錄,運行npm install安裝sdk依賴庫
4.把目錄當做模塊依賴

其中,version爲版本號,添加完成後,用戶就可以在工程中使用通用文字識別 Node SDK。

直接使用npm安裝依賴:

npm install baidu-aip-sdk(嘗試沒有成功

AipOcrClient是Optical Character Recognition的node客戶端,爲使用Optical Character Recognition的開發人員提供了一系列的交互方法。

用戶可以參考如下代碼新建一個AipOcrClient:

var AipOcrClient = require("baidu-aip-sdk").ocr; 
// 設置APPID/AK/SK 
var APP_ID = "你的 App ID"; 
var API_KEY = "你的 Api Key"; 
var SECRET_KEY = "你的 Secret Key"; 
var client = new AipOcrClient(APP_ID, API_KEY, SECRET_KEY); 

express搭建就不再做詳細介紹了,上一篇博客已有哦~~

功能實現

前端上傳圖片後端處理:

router.route("/uploadPhoto").get(function(req,res){ // 到達此路徑則渲染register文件,並傳出title值供 register.html使用
 res.render("uploadPhoto",{title:'圖片文字識別',message:""});
}).post(function(req,res){
 // 跨域
 res.header("Access-Control-Allow-Origin", "*");
 res.header("Access-Control-Allow-Methods","PUT,POST,GET,DELETE,OPTIONS");
 res.header("Access-Control-Allow-Headers", "Content-Type,Content-Length, Authorization, Accept,X-Requested-With");

 let form = new formidable.IncomingForm();
 form.encoding = 'utf-8'; // 編碼
 form.keepExtensions = true; // 保留擴展名
 form.maxFieldsSize = 2 * 1024 * 1024; // 文件大小
 form.uploadDir = 'F:/nodejs/ocrCheck/assets/OCR' // 存儲路徑
 form.parse(req,function(err,fileds,files){ // 解析 formData數據
  if(err){ return console.log(err) }

  let imgPath = files.img.path // 獲取文件路徑
  let imgName = "F:/nodejs/ocrCheck/assets/OCR/test." + files.img.type.split("/")[1] // 修改之後的名字
  let data = fs.readFileSync(imgPath) // 同步讀取文件

  fs.writeFile(imgName,data,function(err){ // 存儲文件
   if(err){ return console.log(err) }

   fs.unlink(imgPath,function(){}) // 刪除文件
   //上傳圖片成功返回code:1
   //res.json({code:1})
   global.nodeServer.getResult(res,imgName);
  })
 });
});

圖片處理核心模塊:

module.exports = { 
 getResult : function(res,imgName){
  var image = fs.readFileSync(imgName);
  var base64Img = new Buffer(image).toString('base64');
  client.generalBasic(base64Img).then(function(result) {
   console.log(JSON.stringify(result));
   res.json(result);
  });
 }
}

獲取到的base64圖片數據和res對象作爲闡述傳遞給ocr提供好的方法, 回調產生的數據將作爲結果返回給前端。

####小彩蛋:

nodeJs中commonJs規範如何實現的?

1.Node程序由許多個模塊組成,每個模塊就是一個文件。Node模塊採用了CommonJS規範。
2.module對象,Node內部提供一個Module構建函數。所有模塊都是Module的實例。每個模塊內部,都有一個module對象,代表當前模塊。它有以下屬性。

module.id 模塊的識別符,通常是帶有絕對路徑的模塊文件名。
module.filename 模塊的文件名,帶有絕對路徑。
module.loaded 返回一個布爾值,表示模塊是否已經完成加載。
module.parent 返回一個對象,表示調用該模塊的模塊。
module.children 返回一個數組,表示該模塊要用到的其他模塊。
module.exports 表示模塊對外輸出的值。

3.調用:根據模塊名稱作爲對象調用其內自定義的方法即可。

global.nodeServer.getResult(res,imgName);

前端js代碼就不貼了 so~easy

效果展示

源碼:Node_OCR

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持神馬文庫。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章