原创 從波的角度理解圖像處理的本質

圖像其實是一種波,可以用波的算法處理圖像。一、爲什麼圖像是波?我們知道,圖像由像素組成。下圖是一張 400 x 400 的圖片,一共包含了 16 萬個像素點。每個像素的顏色,可以用紅、綠、藍、透明度四個值描述,大小範圍都是0 ~ 255,

原创 HOG特徵(Histogram of Gradient)學習總結

參考資料: HOG的經典論文:Dalal N, Triggs B. Histograms of oriented gradients for human detection[C]//Computer Vision and Pattern

原创 概率密度估計--參數估計與非參數估計

我們觀測世界,得到了一些數據,我們要從這些數據裏面去找出規律來認識世界,一般來說,在概率上我們有一個一般性的操作步驟 1. 觀測樣本的存在2. 每個樣本之間是獨立的3. 所有樣本符合一個概率模型 我們最終想要得到的是一個概率密度的模型,有

原创 numpy.r_與numpy.c_理解

numpy.r_和numpy.c_都是用來對多個片段進行連接,組成一個數組Translates slice objects to concatenation 兩者連接的方式稍有差異,r_表示將片段沿着第一維

原创 tesseract 4.0在windows10 MSVC 15 2017下編譯

第一步,準備工作包括安裝Git,CMake以及下載cppan命令工具、從git上獲取tesseract源碼第二步,生成MSVC解決方案本文爲64位編譯器(32直接cmake ..即可),編譯完成後,在build目錄下出現tesseract

原创 圖形圖像處理庫大全

Google三維API O3D  O3D 是一個開源的 Web API 用來在瀏覽器上創建界面豐富的交互式的 3D 應用程序。這是一種基於網頁的可控3D標準。此格式期望真正的基於瀏覽器,獨立於操作系統之外,並且支持主流的3D顯卡,這樣就可

原创 圖像卷積與濾波

一、線性濾波與卷積的基本概念線性濾波可以說是圖像處理最基本的方法,它可以允許我們對圖像進行處理,產生很多不同的效果。做法很簡單。首先,我們有一個二維的濾波器矩陣(有個高大上的名字叫卷積核)和一個要處理的二維圖像。然後,對於圖像的每一個像素

原创 關於位結構體及位操作總結

c語言中 關於位結構體 及 位操作總結:  位結構體 (參考網址) 位域 有些信息在存儲時,並不需要佔用一個完整的字節, 而只需佔幾個或一個二進制位。例如在存放一個開關量時,只有0和1 兩種狀態, 用一位二進位即可。 爲了節省存儲

原创 OCR技術淺探四: 語言模型和綜合評估

語言模型由於圖像質量等原因,性能再好的識別模型,都會有識別錯誤的可能性,爲了減少識別錯誤率,可以將識別問題跟統計語言模型結合起來,通過動態規劃的方法給出最優的識別結果。這是改進OCR識別效果的重要方法之一。 轉移概率在我們分析實驗結果的過

原创 OCR技術淺探三: 光學識別

經過前面的文字定位和文本切割,我們已經能夠找出圖像中單個文字的區域,接下來可以建立相應的模型對單字進行識別。 模型選擇在模型方面,我們選擇了深度學習中的卷積神經網絡模型,通過多層卷積神經網絡,構建了單字的識別模型。 卷積神經網絡是人工神經

原创 如何正確獲得mysql,access的ADO連接字符串,並使用該連接字符串連接數據庫

如何正確獲得mysql的ADO連接字符串,摘自網頁http://blog.csdn.net/zyq5945/article/details/5486393 首先你正確安裝了MYSQL的數據庫驅動程序(mysql-connector-odb

原创 OCR技術淺探二: 文字定位和文本切割

文字定位經過前面的特徵提取,我們已經較好地提取了圖像的文本特徵,下面進行文字定位。 主要過程分兩步:1、鄰近搜索,目的是圈出單行文字;2、文本切割,目的是將單行文本切割爲單字。 鄰近搜索我們可以對提取的特徵圖進行連通區域搜索,得到的每個連

原创 關於win7中VS2013配置opencv2.4.13 時報CPACK_PACKAGE_VERSION錯

在win7中配置opencv2.4.13 時報錯  ,錯誤信息是:CMake Warning at cmake/OpenCVPackaging.cmake:23 (message): CPACK_PACKAGE_VERSION does