Opencv自帶的HOG進行行人檢測-QT例程

原創

TRTK

2020-06-14 11:42

本文主要介紹下opencv中怎樣使用hog算法，因爲在opencv中已經集成了hog這個類。其實使用起來是很簡單的，從後面的代碼就可以看出來。本文參考的資料爲opencv自帶的sample。

　關於opencv中hog的源碼分析，可以參考本人的另一篇博客：opencv源碼解析之(6)：hog源碼分析

　　開發環境：opencv2.4.2+Qt4.8.2+ubuntu12.04+QtCreator2.5.

　　實驗功能：

　　單擊Open Image按鈕，選擇需要進行人檢測的一張圖片，確定後自動顯示出來。該圖片的大小沒限制。

　　單擊People Detect按鈕，則程序會自動對該圖片進行行人檢測，且將檢測到的效果顯示出來，即用1個矩形框將行人框出來。

　　單擊Close按鈕，退出程序。

　　實驗說明：

　　1. hog描述子在opencv中爲HOGDescriptor。

　　2. 可以調用該描述子setSVMDetector方法給用於對hog特徵進行分類的svm模型的係數賦值，這裏的參數爲HOGDescriptor::getDefaultPeopleDetector()時表示採用系統默認的參數，因爲這些參數是用很多圖片訓練而來的。　　

　　3.對輸入圖片進行行人檢測時由於圖片的大小不一樣，所以要用到多尺度檢測。這裏是用hog類的方法detectMultiScale。參數解釋如下：

HOGDescriptor::detectMultiScale(const GpuMat& img, vector<Rect>& found_locations, doublehit_threshold=0, Size win_stride=Size(), Size padding=Size(), double scale0=1.05, int group_threshold=2)

　　該函數表示對輸入的圖片img進行多尺度行人檢測 img爲輸入待檢測的圖片；found_locations爲檢測到目標區域列表；參數3爲程序內部計算爲行人目標的閾值，也就是檢測到的特徵到SVM分類超平面的距離;參數4爲滑動窗口每次移動的距離。它必須是塊移動的整數倍；參數5爲圖像擴充的大小；參數6爲比例係數，即滑動窗口每次增加的比例；參數7爲組閾值，即校正係數，當一個目標被多個窗口檢測出來時，該參數此時就起了調節作用，爲0時表示不起調節作用。

   4.  最後對檢測出來的目標矩形框，要採用一些方法處理，比如說2個目標框嵌套着，則選擇最外面的那個框。
   5.  因爲hog檢測出的矩形框比實際人體框要稍微大些,所以需要對這些矩形框大小尺寸做一些調整。


實驗結果：
圖片1效果：


圖片2效果：


圖片3效果：


圖片4效果：



實驗主要部分代碼(附錄有工程code下載鏈接)：

#include "dialog.h"
#include "ui_dialog.h"
#include <QtCore>
#include <QtGui>



Dialog::Dialog(QWidget *parent) :
    QDialog(parent),
    ui(new Ui::Dialog)
{
    ui->setupUi(this);
}

Dialog::~Dialog()
{
    delete ui;
}

void Dialog::on_openButton_clicked()
{
    QString img_mame = QFileDialog::getOpenFileName(this, "Open img", "../people", tr("Image Files(*.png *.jpg *.bmp *.jpeg)"));
    img = imread( img_mame.toAscii().data() );
    imwrite("../hog_test.jpg", img);
    ui->textBrowser->setFixedSize(img.cols, img.rows);
    ui->textBrowser->append("<img src=../hog_test.jpg>");
}

void Dialog::on_detectButton_clicked()
{
    vector<Rect> found, found_filtered;
    cv::HOGDescriptor people_dectect_hog;
    //採用默認的已經訓練好了的svm係數作爲此次檢測的模型
    people_dectect_hog.setSVMDetector(cv::HOGDescriptor::getDefaultPeopleDetector());
    //對輸入的圖片img進行多尺度行人檢測
    //img爲輸入待檢測的圖片；found爲檢測到目標區域列表；參數3爲程序內部計算爲行人目標的閾值，也就是檢測到的特徵到SVM分類超平面的距離;
    //參數4爲滑動窗口每次移動的距離。它必須是塊移動的整數倍；參數5爲圖像擴充的大小；參數6爲比例係數，即測試圖片每次尺寸縮放增加的比例；
    //參數7爲組閾值，即校正係數，當一個目標被多個窗口檢測出來時，該參數此時就起了調節作用，爲0時表示不起調節作用。
    people_dectect_hog.detectMultiScale(img, found, 0, Size(8, 8), Size(32, 32), 1.05, 2);

    //從源碼中可以看出:
    //#define __SIZE_TYPE__ long unsigned int
    //typedef __SIZE_TYPE__ size_t;
    //因此,size_t是一個long unsigned int類型
    size_t i, j;
    for (i = 0; i < found.size(); i++ )
        {
            Rect r = found[i];

            //下面的這個for語句是找出所有沒有嵌套的矩形框r,並放入found_filtered中,如果有嵌套的
           //話,則取外面最大的那個矩形框放入found_filtered中
            for(j = 0; j <found.size(); j++)
                if(j != i && (r&found[j])==r)
                    break;
            if(j == found.size())
               found_filtered.push_back(r);
        }

    //在圖片img上畫出矩形框,因爲hog檢測出的矩形框比實際人體框要稍微大些,所以這裏需要
    //做一些調整
    for(i = 0; i <found_filtered.size(); i++)
        {
            Rect r = found_filtered[i];
            r.x += cvRound(r.width*0.1);
            r.width = cvRound(r.width*0.8);
            r.y += cvRound(r.height*0.07);
            r.height = cvRound(r.height*0.8);
            rectangle(img, r.tl(), r.br(), Scalar(0, 255, 0), 3);
        }
    imwrite("../hog_test_result.jpg", img);
    ui->textBrowser->clear();
    ui->textBrowser->append("<img src=../hog_test_result.jpg>");

}

void Dialog::on_closeButton_clicked()
{
    close();
}



實驗總結：
從實驗的結果來看，圖片檢測的準確率一般，當人體遮擋情況比較嚴重，且背景比較複雜時，有些誤檢和漏檢。不過程序的檢查速度還行，因爲源碼中用做了些優化處理。

作者：tornadomeet 出處：http://www.cnblogs.com/tornadomeet

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Opencv自帶的HOG進行行人檢測-QT例程

Opencv自帶的HOG進行行人檢測-QT例程

DPM模型學習1

行人檢測(Pedestrian Detection)資源

將K-means算法應用到圖像分割的一個嘗試

初識壓縮感知Compressive Sensing

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結