項目實訓日記(1)

    首先我們團隊這個項目的主題是在採用嵌入式系統實現基於神經網絡的無人機對象檢測,目標是在大疆無人機上搭載的嵌入式硬件上通過無人機攝像頭進行物體識別和追蹤。

    我們的項目題目及實現的具體目標基於Design Automation Conference的2018系統設計大賽,該比賽於2017年10月份正式開始,由DJI,XILINX,NVIDIA三家公司贊助,分爲FPGA組和GPU組兩個類別並分別在不同的目標平臺上進行。總共成功註冊報名了114支團隊(其中FPGA組61隊,GPU組53隊)。我們將收到由行業贊助商DJI提供的訓練數據集,並將通過使用隱藏的數據集來被評估在精度和功率方面的性能。

    目標跟蹤是在分類識別或選定一個物體以後,持續跟蹤其運動狀態。視頻目標跟蹤是計算機視覺領域的重要研究課題,其主要任務是獲取視頻序列中感興趣的目標的位置與運動信息,爲進一步的語義層分析 (動作識別、場景識別等)提供基礎.其定義是:給定視頻序列初始幀中目標的位置框 (一般爲矩形框),在接下來的視頻序列中自動給出該目標的位置框或者在目標離開視域時給出提示.我們將參考各種有關於深度學習及對象跟蹤等方向的論文文獻,實驗如Caffe,Caffe2等各個開源軟件庫訓練結果進行比對選擇和使用及優化。我們會使用1080Ti服務器以及NVIDIA Jetson TX2上使用給出的及自己蒐集的數據進行模型的訓練檢測。

    在加入項目組之後,我一直在進行機器學習和深度學習方面的內容的學習,也參考學習了很多博客,比如龍心塵博客裏的機器學習系列http://blog.csdn.net/longxinchen_ml/article/category/5895411/2。深度學習也就是一種多隱層的神經網絡。通過網上的網易機器學習公開課,blog裏的對機器學習和深度學習的知識的介紹,我學到了深度學習的大體的架構和流程,也瞭解到許多運用在深度學習與計算機視覺中用到的方法和思想,比如圖像分類、梯度下降、反向傳播、神經網絡結構和數據的預處理以及尤其在圖像中運用普遍的卷積神經網絡等等。

    除了進行這些知識的學習,也通過Python寫了一些深度學習的小例子來更好的進行理解。

    (這個自己跑的代碼沒有截全,例子是在http://blog.csdn.net/longxinchen_ml/article/details/50521933深度學習與計算機視覺系列9中學習的)

    在最近這些天的討論裏,通過知道了我們的目標是用一些深度學習的算法如goturn和ssd等算法來實現我們項目裏的物體識別和追蹤目標。自己最近還了解了caffe架構的大體結構和運行的方法。在討論班裏還學習了一些近似計算的思想。

    接下來自己將會對caffe框架進行學習,研讀caffe的底層代碼,同時會研究goturn算法的結構,爲將來的優化做準備。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章