Node+OCR實現圖像文字識別功能

這篇文章主要爲大家詳細介紹了Node+OCR實現圖像文字識別功能，具有一定的參考價值，感興趣的小夥伴們可以參考一下

開發目的

這算是node應用的第二個小應用吧，主要目的是熟悉node和express框架。原理很簡單：在node搭建的環境下引用第三方包處理圖片數據並返回給前臺信息。

實現效果，百度提供的圖片識別，經過測試識別車牌號等規範文字數字還是比較準確的

環境需求

1.Express 是一個非常流行的node.js的web框架。基於connect(node中間件框架)。提供了很多便於處理http請求等web開發相關的擴展。

2.OCR：

通用文字識別 Node SDK目錄結構：

├── src
    │ ├── auth                                //授權相關類
    │ ├── http                                //Http通信相關類
    │ ├── client                              //公用類
    │ ├── util                                //工具類
    │ └── const                               //常量類
    ├── AipOcr.js                      //通用文字識別交互類
    ├── index.js                               //入口文件
    └── package.json                           //npm包描述文件

支持 node 版本 4.0+
直接使用node開發包步驟如下：

1.在官方網站下載node SDK壓縮包。
2.將下載的aip-node-sdk-version.zip解壓後，複製到工程文件夾中。
3.進入目錄，運行npm install安裝sdk依賴庫
4.把目錄當做模塊依賴

其中，version爲版本號，添加完成後，用戶就可以在工程中使用通用文字識別 Node SDK。

直接使用npm安裝依賴：

npm install baidu-aip-sdk（嘗試沒有成功）

AipOcrClient是Optical Character Recognition的node客戶端，爲使用Optical Character Recognition的開發人員提供了一系列的交互方法。

用戶可以參考如下代碼新建一個AipOcrClient：

var AipOcrClient = require("baidu-aip-sdk").ocr; 
// 設置APPID/AK/SK 
var APP_ID = "你的 App ID"; 
var API_KEY = "你的 Api Key"; 
var SECRET_KEY = "你的 Secret Key"; 
var client = new AipOcrClient(APP_ID, API_KEY, SECRET_KEY);

express搭建就不再做詳細介紹了，上一篇博客已有哦~~

功能實現

前端上傳圖片後端處理：

router.route("/uploadPhoto").get(function(req,res){ // 到達此路徑則渲染register文件，並傳出title值供 register.html使用
 res.render("uploadPhoto",{title:'圖片文字識別',message:""});
}).post(function(req,res){
 // 跨域
 res.header("Access-Control-Allow-Origin", "*");
 res.header("Access-Control-Allow-Methods","PUT,POST,GET,DELETE,OPTIONS");
 res.header("Access-Control-Allow-Headers", "Content-Type,Content-Length, Authorization, Accept,X-Requested-With");

 let form = new formidable.IncomingForm();
 form.encoding = 'utf-8'; // 編碼
 form.keepExtensions = true; // 保留擴展名
 form.maxFieldsSize = 2 * 1024 * 1024; // 文件大小
 form.uploadDir = 'F:/nodejs/ocrCheck/assets/OCR' // 存儲路徑
 form.parse(req,function(err,fileds,files){ // 解析 formData數據
  if(err){ return console.log(err) }

  let imgPath = files.img.path // 獲取文件路徑
  let imgName = "F:/nodejs/ocrCheck/assets/OCR/test." + files.img.type.split("/")[1] // 修改之後的名字
  let data = fs.readFileSync(imgPath) // 同步讀取文件

  fs.writeFile(imgName,data,function(err){ // 存儲文件
   if(err){ return console.log(err) }

   fs.unlink(imgPath,function(){}) // 刪除文件
   //上傳圖片成功返回code:1
   //res.json({code:1})
   global.nodeServer.getResult(res,imgName);
  })
 });
});

圖片處理核心模塊:

module.exports = { 
 getResult : function(res,imgName){
  var image = fs.readFileSync(imgName);
  var base64Img = new Buffer(image).toString('base64');
  client.generalBasic(base64Img).then(function(result) {
   console.log(JSON.stringify(result));
   res.json(result);
  });
 }
}

獲取到的base64圖片數據和res對象作爲闡述傳遞給ocr提供好的方法，回調產生的數據將作爲結果返回給前端。

####小彩蛋：

nodeJs中commonJs規範如何實現的？

1.Node程序由許多個模塊組成，每個模塊就是一個文件。Node模塊採用了CommonJS規範。
2.module對象，Node內部提供一個Module構建函數。所有模塊都是Module的實例。每個模塊內部，都有一個module對象，代表當前模塊。它有以下屬性。

module.id 模塊的識別符，通常是帶有絕對路徑的模塊文件名。
module.filename 模塊的文件名，帶有絕對路徑。
module.loaded 返回一個布爾值，表示模塊是否已經完成加載。
module.parent 返回一個對象，表示調用該模塊的模塊。
module.children 返回一個數組，表示該模塊要用到的其他模塊。
module.exports 表示模塊對外輸出的值。

3.調用：根據模塊名稱作爲對象調用其內自定義的方法即可。

global.nodeServer.getResult(res,imgName);

前端js代碼就不貼了 so~easy

效果展示

源碼：Node_OCR

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持神馬文庫。

Node+OCR實現圖像文字識別功能

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

Node+OCR實現圖像文字識別功能

Node+OCR（圖像文字識別）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結