NVIDIA研究人員提出新型深度學習架構，提高標識定位速度

原創

2020-07-02 22:05

內容來源：ATYUN AI平臺

NVIDIA的研究人員與學術界的合作者共同開發了一種新的基於深度學習的標識定位（landmark localization）架構，該架構用於尋找圖像特定部分的精確位置。此外，他們還提出了一種基於半監督學習的新型訓練程序，該程序允許探索沒有實際標記的圖像以提高模型的準確性。

對於準確可靠的手勢識別，面部表情識別，面部身份驗證，眼睛注視跟蹤等，標識定位是一項必要的任務。不幸的是，標記圖像是一項需要大量人工的任務，因此，很少有圖像到標識成對的數據集，足以可靠地訓練深層神經網絡。

研究人員在他們的論文中指出，“我們的貢獻是雙重的，首先我們提出了一種無監督技術，該技術利用等變換標誌變換而不需要標記標識。另外，我們開發了一種架構來改進使用輔助屬性的標識評估。我們方法的一個關鍵是可以通過完整的標識定位模型將錯誤傳回。”此外，任何現有的基於深度學習的架構都可以從研究結果中受益，因爲方法用到的架構不是特定的。

“結果表明，這些技術大大改善了標識預測，即使只有一小部分數據集具有標記，也可以學習，進行有效的探測。”該團隊能夠在面部標識定位方面實現最先進的性能，使用的標記數據減少了20倍。

精彩視頻點擊鏈接：NVIDIA研究人員提出新型深度學習架構，提高標識定位速度

團隊使用NVIDIA Tesla V100 GPU和cuDNN加速的Theano深度學習框架，在多個數據集上訓練卷積神經網絡，以滿足各種應用，包括面部標識定位和手勢估計。此外，他們研究了幾項關於合成數據的對照實驗來研究貢獻。

與其他兩種領先架構相比，使用半監督學習的神經網絡速度分別提高了136倍和6.5倍。該系統還在公共基準數據集上實現了最先進的性能。

論文網址：arxiv.org/abs/1709.01591

本文轉自ATYUN人工智能媒體平臺，原文鏈接：NVIDIA研究人員提出新型深度學習架構，提高標識定位速度

更多推薦

三門課程循序漸進學習Node.js

Babylon：建立AI醫生的數據挑戰（4/5）：理解非結構化數據

研究人員試圖用魔術來挑戰AI，讓AI系統推斷硬幣的位置

標籤：

人臉識別計算機視覺