轉自:http://www.toutiao.com/i6456928733306552846/
一、什麼是普適性視覺
視覺感知的內涵:對每一幀3D視頻,直接地能夠分析清楚幀內都有什麼、在什麼位置、姿態是什麼,間接地瞭解幀內各物體的相互關係;對幀間3D視頻序列,直接地能夠分析幀間相同物體的運動情況,這裏的運動包含非剛體&非線性運動,間接地瞭解各物體的相互運動影響。
從這樣的內涵出發,針對普適性的視覺目標,有兩點需要做到:
-
穩定地、無歧義地、同胚地對場景&物體的覆蓋性視覺表達——普適性視覺;
-
普適性視覺基礎上的精確配準。
先看我們的算法,如下圖,對每一幀3D視頻,做出普適性視覺表達,幀間對物體的各局部的非剛體非線性運動,都能很好的捕捉(所使用的數據集均是行業公開的代表性數據)。
我們的視覺算法與當前相關算法的對比,如下圖:
注:對比性的相關算法,需要詳細瞭解,可以網絡搜索查看。
二、視覺感知與運動感知的應用
視覺技術的應用比較廣泛,典型應用如下:
-
智能電視上的手勢操控
-
體感遊戲
-
AR眼鏡
-
AR遊戲
-
(語義)SLAM
-
機器人跟蹤
-
高精地圖
-
視覺導航