darknet(YOLO)源碼解析--測試(一)

代碼小白,第一次認真看大段大段的代碼,基礎知識嚴重欠缺,如有錯誤望指正。

進入正題:
測試命令示例:

$./darknet detector test cfg/voc.data cfg/tiny-yolo-voc.cfg results/tiny-yolo-voc_6000.weights data/images.jpg

一、main函數

目前最新版本的darknet中,darknet.c和detector.c都在examples文件夾中。
首先,從主函數開始解析命令行參數,然後根據不同的命令行參數進入不同的調用方法。(本文不考慮GPU部分代碼)

//darknet.c

int main(int argc, char **argv)
{
    //test_resize("data/bad.jpg");
    //test_box();
    //test_convolutional_layer();
    //如果沒有任何命令行參數,則打印一句提示信息:Usage: [應用程序名稱] <function>,即告訴你要指定一個命令行參數。
    if(argc < 2){
        fprintf(stderr, "usage: %s <function>\n", argv[0]);
        return 0;
    }

    if (0 == strcmp(argv[1], "average")){
        average(argc, argv);
    }  else if (0 == strcmp(argv[1], "detector")){
        run_detector(argc, argv);
    }//第一個參數是detector,跳轉到run_detector函數
    return 0;
}

附:1、fprintf函數
作用:格式化輸出到一個流/文件中;
函數原型:

int fprintf( FILE *stream, const char *format, [ argument ]...)

fprintf()函數根據指定的格式(format)向輸出流(stream)寫入數據(argument)。

2、stderr – 標準錯誤輸出流
作爲程序運行過程中的錯誤顯示出來的,默認像屏幕輸出,具體看程序執行時stderr重定向到哪。

3、if(argc < 2)語句
argv[0]:第一個命令行參數darknet就是應用程序的名稱,因此如果指定了一個命令行參數,那argc就爲2。

二、run_detector函數

//detector.c

void run_detector(int argc, char **argv)
{
     //檢查是否有參數prefix,默認值是0
    char *prefix = find_char_arg(argc, argv, "-prefix", 0);
    //檢查是否有參數thresh參數,thresh爲輸出的閾值,默認值是0.24
    float thresh = find_float_arg(argc, argv, "-thresh", .24);
    //檢查是否有參數hier_thresh,默認爲0.5
    float hier_thresh = find_float_arg(argc, argv, "-hier", .5);
    //檢查是否有參數cam_index,默認爲0
    int cam_index = find_int_arg(argc, argv, "-c", 0);
    //檢查是否有參數frame_skip,默認爲0
    int frame_skip = find_int_arg(argc, argv, "-s", 0);
    //檢查是否有參數avg,默認爲3
    int avg = find_int_arg(argc, argv, "-avg", 3);
    //如果輸入參數小於4個,輸出正確的命令格式:[應用程序名稱][yolo/detector...][train/test/valid][cfg][weights (optional)]
    if(argc < 4){
        fprintf(stderr, "usage: %s %s [train/test/valid] [cfg] [weights (optional)]\n", argv[0], argv[1]);
        return;
    }

    //檢查是否指定GPU運算
    char *gpu_list = find_char_arg(argc, argv, "-gpus", 0);
    char *outfile = find_char_arg(argc, argv, "-out", 0);
    int *gpus = 0;
    int gpu = 0;
    int ngpus = 0;
    if(gpu_list){
        printf("%s\n", gpu_list);
        int len = strlen(gpu_list);
        ngpus = 1;
        int i;
        for(i = 0; i < len; ++i){
            if (gpu_list[i] == ',') ++ngpus;
        }
        gpus = calloc(ngpus, sizeof(int));
        for(i = 0; i < ngpus; ++i){
            gpus[i] = atoi(gpu_list);
            gpu_list = strchr(gpu_list, ',')+1;
        }
    } else {
        gpu = gpu_index;
        gpus = &gpu;
        ngpus = 1;
    }

    //檢查clear參數
    int clear = find_arg(argc, argv, "-clear");
    int fullscreen = find_arg(argc, argv, "-fullscreen");
    int width = find_int_arg(argc, argv, "-w", 0);
    int height = find_int_arg(argc, argv, "-h", 0);
    int fps = find_int_arg(argc, argv, "-fps", 0);

    //data文件的路徑存爲argv數組的第四個元素
    char *datacfg = argv[3];
    //cfg文件的路徑存爲argv數組的第五個元素
    char *cfg = argv[4];
    //當參數大於5個時,權重爲argv數組的第六個元素的內容
    char *weights = (argc > 5) ? argv[5] : 0;
    //當參數大於6個時,權重爲argv數組的第七個元素的內容,即示例中需檢測圖片的路徑
    char *filename = (argc > 6) ? argv[6]: 0;
    //根據第三個參數(即argv[2])的內容,調用不同的函數,並傳入datacfg,cfg等參數
    //示例中第三個參數是test,進入test_detector參數
    if(0==strcmp(argv[2], "test")) test_detector(datacfg, cfg, weights, filename, thresh, hier_thresh, outfile, fullscreen);
    else if(0==strcmp(argv[2], "train")) train_detector(datacfg, cfg, weights, gpus, ngpus, clear);
    else if(0==strcmp(argv[2], "valid")) validate_detector(datacfg, cfg, weights, outfile);
    else if(0==strcmp(argv[2], "valid2")) validate_detector_flip(datacfg, cfg, weights, outfile);
    else if(0==strcmp(argv[2], "recall")) validate_detector_recall(cfg, weights);
    else if(0==strcmp(argv[2], "demo")) {
        list *options = read_data_cfg(datacfg);
        int classes = option_find_int(options, "classes", 20);
        char *name_list = option_find_str(options, "names", "data/names.list");
        char **names = get_labels(name_list);
        demo(cfg, weights, thresh, cam_index, filename, names, classes, frame_skip, prefix, avg, hier_thresh, width, height, fps, fullscreen);
    }
}

三、test_detector函數

//detector.c

void test_detector(char *datacfg, char *cfgfile, char *weightfile, char *filename, float thresh, float hier_thresh, char *outfile, int fullscreen)
{
    //options讀取data文件的內容,其中包含類別文件(.names)所在路徑,兩個txt文件(分別記錄訓練集、測試集圖片的絕對路徑)所在路徑等。
    list *options = read_data_cfg(datacfg);
     //從option中查找names對應的value,如沒有,使用默認值“data/names.list”
     char *name_list = option_find_str(options, "names", "data/names.list");
    //從.names文件中得到標籤(即xml文件中的類別)名稱
    char **names = get_labels(name_list);

    //加載位於data/labels下ASCII碼爲32-127的8種尺寸的圖片,用於顯示標籤用的字符圖片
    image **alphabet = load_alphabet();
    //用netweork.h中自定義的network結構體存儲yolo模型文件(cfg文件),parse_network_cfg函數位於parser.c
    network net = parse_network_cfg(cfgfile);
    ///讀取yolo模型訓練得到的權重文件
    if(weightfile){
        load_weights(&net, weightfile);
    }
    //每層batch設置爲1,表示一張一張地去檢測圖片
    set_batch_network(&net, 1);
    //隨機數種子
    srand(2222222);
    double time;
    //定義input指針指向buff數組,用於存放需檢測圖片的路徑
    char buff[256];
    char *input = buff;   
    int j;
    float nms=.3;
    while(1){
        if(filename){
            strncpy(input, filename, 256);
        } else {       //命令行參數中沒有指定檢測圖片的路徑
            printf("Enter Image Path: ");
            fflush(stdout);
            input = fgets(input, 256, stdin);
            if(!input) return;
            strtok(input, "\n");
        }

        //加載圖片,默認當做彩色處理
        image im = load_image_color(input,0,0);
        //調整輸入圖片尺寸
        image sized = letterbox_image(im, net.w, net.h);
        //image sized = resize_image(im, net.w, net.h);
        //image sized2 = resize_max(im, net.w);
        //image sized = crop_image(sized2, -((net.w - sized2.w)/2), -((net.h - sized2.h)/2), net.w, net.h);
        //resize_network(&net, sized.w, sized.h);
        layer l = net.layers[net.n-1];

        box *boxes = calloc(l.w*l.h*l.n, sizeof(box));
        float **probs = calloc(l.w*l.h*l.n, sizeof(float *));
        for(j = 0; j < l.w*l.h*l.n; ++j) probs[j] = calloc(l.classes + 1, sizeof(float *));
        float **masks = 0;
        if (l.coords > 4){
            masks = calloc(l.w*l.h*l.n, sizeof(float*));
            for(j = 0; j < l.w*l.h*l.n; ++j) masks[j] = calloc(l.coords-4, sizeof(float *));
        }

        float *X = sized.data;
        time=what_time_is_it_now();
        //預測
        network_predict(net, X);
        printf("%s: Predicted in %f seconds.\n", input, what_time_is_it_now()-time);
        get_region_boxes(l, im.w, im.h, net.w, net.h, thresh, probs, boxes, masks, 0, 0, hier_thresh, 1);
        if (nms) do_nms_obj(boxes, probs, l.w*l.h*l.n, l.classes, nms);
        //else if (nms) do_nms_sort(boxes, probs, l.w*l.h*l.n, l.classes, nms);
         //畫預測結果
        draw_detections(im, l.w*l.h*l.n, thresh, boxes, probs, masks, names, alphabet, l.classes);
        //保存標記了預測標籤的圖片
        if(outfile){
            save_image(im, outfile);
        }
        else{
            save_image(im, "predictions");
#ifdef OPENCV
            cvNamedWindow("predictions", CV_WINDOW_NORMAL); 
            if(fullscreen){
                cvSetWindowProperty("predictions", CV_WND_PROP_FULLSCREEN, CV_WINDOW_FULLSCREEN);
            }
            show_image(im, "predictions");
            cvWaitKey(0);
            cvDestroyAllWindows();
#endif
        }

        free_image(im);
        free_image(sized);
        free(boxes);
        free_ptrs((void **)probs, l.w*l.h*l.n);
        if (filename) break;
    }
}

其中重要的函數下一篇詳解。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章