原创 數值優化方法筆記

數值優化方法筆記 本文對常見的數值優化方法進行總結,重點關注優化方法的原理、迭代過程和計算複雜度。常見的數值優化方法包括梯度下降法(最速梯度下降法)、牛頓法、共軛梯度下降法等。本筆記的算法思路只是便於對各種優化方法進行理解,並不是

原创 yolo v2文件結構和源碼的簡單梳理

前言 在2017年6月30日,yolo在github上的源碼進行了一次更新,有許多文件的位置都改變了。導致我在使用yolo v2訓練自己的數據的時候遇到了許多麻煩(網上給的許多解決方案都不太完美)。在這次經歷中,我充分認識到了瞭解源碼對於

原创 DCT變換和JPEG量化對圖像質量的影響

a)框架:  圖一 基於塊變換編碼的系統框架 本實驗在此係統框架的基礎上,刪除了二進制編解碼的過程,僅通過DCT變換和JPEG量化表進行量化,並進行恢復,以對比恢復圖和原圖之間的質量差距。 b)原理分析 首先將圖像分爲8X8大小的非重疊

原创 ssd訓練kiiti數據集和測試過程

訓練過程 訓練過程可以參考http://blog.csdn.net/Jesse_Mx/article/details/65634482,這篇博客從kitti數據集的轉化到訓練文件的修改,訓練過程,乃至訓練的結果都寫的十分詳細,很有參考價值

原创 SLAM中的一些知識點記錄

相機內參:像素座標(u,v)到相機座標(x, y, z)變換,fx和fy爲焦距在x,y上投影,u0和v0爲偏移量u = x/z*fx+u0v = y/z*fy+v0相機外參:相機座標(x, y, z)到世界座標(X,Y,Z)變換,包括{R

原创 在cuda8.0+faster-rcnn(python版)下使用kitti數據集進行訓練

前言 本人是萌新一枚,第一次寫博客感覺鴨梨山大。最近因爲在做車輛檢測問題,於是想測試了一下faster-rcnn使用kitti數據會有什麼樣的效果。結果不用不知道,裏面出現了無數的坑(主要是因爲環境的不同),爲了避免大家遇到同樣了問題,