普適性的視覺感知與運動感知

轉自:http://www.toutiao.com/i6456928733306552846/


一、什麼是普適性視覺

視覺感知的內涵:對每一幀3D視頻,直接地能夠分析清楚幀內都有什麼、在什麼位置、姿態是什麼,間接地瞭解幀內各物體的相互關係;對幀間3D視頻序列,直接地能夠分析幀間相同物體的運動情況,這裏的運動包含非剛體&非線性運動,間接地瞭解各物體的相互運動影響。

從這樣的內涵出發,針對普適性的視覺目標,有兩點需要做到:

  1. 穩定地、無歧義地、同胚地對場景&物體的覆蓋性視覺表達——普適性視覺;

  2. 普適性視覺基礎上的精確配準。

先看我們的算法,如下圖,對每一幀3D視頻,做出普適性視覺表達,幀間對物體的各局部的非剛體非線性運動,都能很好的捕捉(所使用的數據集均是行業公開的代表性數據)。

普適性的視覺感知與運動感知

普適性視覺感知&運動感知

我們的視覺算法與當前相關算法的對比,如下圖:

普適性的視覺感知與運動感知

相關算法的對比效果

注:對比性的相關算法,需要詳細瞭解,可以網絡搜索查看。

二、視覺感知與運動感知的應用

視覺技術的應用比較廣泛,典型應用如下:

  • 智能電視上的手勢操控

  • 體感遊戲

  • AR眼鏡

  • AR遊戲

  • (語義)SLAM

  • 機器人跟蹤

  • 高精地圖

  • 視覺導航


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章