增強現實技術漫談(續)——研究內容全面解析

前言

經過上一篇略帶詼諧的《增強現實技術漫談》介紹之後,相信大家已經完全瞭解了增強現實技術的相關特徵和應用領域,並且已經對概念有了清晰的理解了。本文將會針對增強現實(Augmented Reality,AR)技術的研究內容進行分析,希望能夠給還沒有入門或剛剛入門的朋友一個總體的認知,明確自己在AR領域可以開展哪些方面的研究,找準自己的最佳切入點。

 

1 增強現實技術初探

增強現實技術主要包括圖示的研究內容,當然還有一些比較生僻的內容沒有列出來。本文介紹的增強現實相關的研究內容,包括但不限於介紹到的這些內容。增強現實是一個多學科交叉的研究領域,內容紛繁複雜,選取其中某個點深入下去都可以作爲長久的研究課題。

                       

2 增強現實研究內容分解

2.1 顯示技術

2.1.1 近眼式顯示設備

近眼顯示設備主要是指頭盔顯示器。頭盔顯示器主要分爲兩種:光學透射式頭盔顯示器和視頻透射式頭盔顯示器。當然如果按照顯示器件數量,也可以劃分爲單目頭盔顯示器和雙目頭盔顯示器。這裏主要討論光學式(左)和視頻式(右)的區別。

 

光學透射式頭盔顯示器是直接透射外界的光線,並且反射微投影器件產生的虛擬圖像到人眼中,達到虛實融合的效果。優點是可以保證正確的視點和清晰的背景,缺點是虛擬信息和真實信息融合度低,且人眼標定比較複雜。目前市面上典型的光學透射式頭盔顯示器有Hololens和Meta2等。


而視頻透射式頭盔顯示器,是將固定在頭盔上的攝像頭所捕獲的圖像,通過視點偏移來顯示到眼前的顯示器上。優點是虛實融合效果好,無需標定人眼,缺點是視點難以完全補償到正確的位置,且與鏡片範圍外的環境不能完美銜接。將上面的光學透射式頭盔顯示器,加上攝像頭,並且把帶有增強信息的視頻直接全屏顯示,就成爲了視頻透射式設備了。很巧的是,很多光學透射式設備,確實在其上加裝了這種攝像頭,但是它們的本意是用攝像頭來作爲跟蹤模塊的。

 

2.1.2 手持式顯示設備

手持式顯示設備,顧名思義就是拿在手上的顯示設備。最常見的就是我們的智能手機和平板電腦。這類設備具有很好的便攜性,是一種天然的AR設備。它們有攝像頭作爲圖像輸入設備,有自帶的處理器,有顯示單元,具備了進行AR開發的所有條件。在目前市面上,很多增強現實APP都是圍繞這類設備開發的。

  

2.1.3 固定式顯示設備

桌面級顯示器,這是我們日常生活中最常見的一類顯示器了。給它添加一個網絡攝像頭,就可以完成AR任務了。該攝像頭可以捕捉空間中的圖像,然後估計攝像頭的位置和姿態,最後計算生成虛擬信息,並進行虛實融合,輸出到桌面顯示器上。這類設備適合做一些科研類的開發,對於商業應用顯得有些笨重,比起手機和平板來說稍遜一籌。

虛擬鏡子,這是利用攝像頭對着人進行拍攝,然後輸出到一個類似於鏡子的大型顯示器上,給人一種照鏡子的感覺。同時,還可以進行虛擬換裝,或者添加一些虛擬物件,達到AR效果。

還有一些固定顯示器,類似於霧幕、水幕、全息膜等,在上面投影出增強信息,可以實現AR效果。

    

 

2.1.4 投影式顯示設備

投影機是一種重要的虛擬現實和增強現實設備。最常見的基於投影的增強現實系統是在展會上的各種絢麗的投影展品,包括虛擬地球、汽車表面投影等。這類系統屬於空間增強現實系統。另外,柱幕、球幕、環幕投影也可以歸爲基於投影的空間增強現實。

投影機還可以用於構建CAVE系統。手持式投影機結合圖像捕捉設備,還可以建立動態的空間增強現實系統。

  

2.1.5 小結與分析

增強現實中主要的顯示設備就是以上這些。如果要開展關於顯示技術的研究,從硬件方面來講,就是顯示材料、器件的研發。當然這與增強現實並沒有高度相關性,只能說顯示設備參數的提升,可以間接促進增強現實系統性能提升。但是顯示方面,軟件還是可以有些值得做的東西,並且與增強現實體驗息息相關。那就是頭盔顯示器的顯示畸變校正和投影機畫面拼接融合,這些技術都直接影響着增強現實系統虛實融合精度和整體可用性。

研究增強現實技術的人,很多是側重於系統集成和應用測評,或者是直接將AR系統應用在其他的研究領域。因此,這些人一般不會研究顯示元器件的細節,而更加關注如何拿現有的材料或者設備來構建新型顯示系統。如果能夠做出新的AR系統,並且具有實用意義,也是非常有研究價值的。

 

2.2 跟蹤技術

跟蹤理論會涉及到一些空間座標轉換的基礎知識,以攝像機跟蹤爲例,分爲模型座標空間、世界座標空間、攝像機座標空間和圖像座標空間。由於比較細節,這裏不展開討論,相關知識可以查閱計算機視覺書籍即可。這裏以不同種類的跟蹤系統爲例來討論跟蹤技術。

2.2.1 固定式跟蹤系統

機械跟蹤器通過控制機械臂各個關節的轉動來跟蹤機械臂末端的空間位置,屬於比較老的跟蹤方式,但是精度可以控制得比較高。

                              

電磁跟蹤器是通過一個固定的發射源發射出三維正交的電磁場,接收端通過檢測接收到的電磁場的方向和強度來確定位姿。

超聲波跟蹤器則是通過測量一個聲音脈衝從發射源到傳感器的飛行時間來測量距離。

2.2.2 移動式傳感器

GPS,全稱是全球定位系統。這個系統在智能手機上應用很普遍。它通過接收多顆衛星信號來確定當前所處的位置。對於戶外大範圍增強現實有着重要意義。


無線網是通過檢測移動設備接入點信息來粗略確定移動設備所處位置的。它可以配合GPS使用。


磁力計,也稱電子羅盤,通過檢測地球的磁場來確定方向。

 

陀螺儀和線性加速度計都是依靠慣性來進行測量的。陀螺儀測量三軸角度變化,線性加速度計測量位置變化。它們通常會配合使用,並且常以微機電系統(MEMS, Micro-Electro-Mechanical System)的形式存在。

                          

里程計是通過輪式或者光電編碼器來測量所走過路程的一種傳感器,常用在機器人或者交通工具中。

2.2.3 光學跟蹤技術

(1)跟蹤模式

有些跟蹤需要對被跟蹤的目標預先建模,例如一些圖像跟蹤工具箱。有的則不需要提前建模,例如同步定位與跟蹤技術(SLAM)。多數跟蹤是需要提前建立一個待跟蹤模型數據庫的,然後在運行中實時提取特徵並且與數據庫中的數據進行比對。而SLAM則可以實時根據獲得的特徵,自主建立空間地圖,並且確定攝像頭相對於環境的位置。

目前研究的比較火熱的是SLAM。因此,可以研究SLAM中的各個環節,從跟蹤、建圖、迴環檢測等角度研究如何提升SLAM系統的精度,以及面對複雜環境的穩定性問題。

  

(2)照明種類

跟蹤的穩定性與環境光有關,尤其是基於視覺的跟蹤。有些跟蹤系統不需要自主添加光源,只是利用環境光,稱爲被動照明;有些跟蹤需要主動發射某種照明光線,來實現其跟蹤,稱爲主動照明。被動照明是比較常見的,例如平面標誌跟蹤就是在普通的環境照明下實現的。主動照明最典型的就是結構光照明,例如Kinect。還有一種主動發射紅外光的OptiTrack系統,做姿態跟蹤效果很好。

      


(3)人工標誌與自然特徵

人工標誌指的是人造的用於跟蹤的圖像標誌等。例如二維碼、棋盤格等。自然特徵指的是自然環境中本身就有的特徵,不是人爲放置用來跟蹤的特徵。普通的室內環境、街邊的樓宇都可以認爲是自然特徵。人工標誌根據其種類不同,需要特定針對性算法進行檢測和跟蹤,自然特徵通常使用SIFT、SURF、ORB等特徵描述子來進行特徵提取和跟蹤。

   

 

 

2.2.4 傳感器融合

互補式融合:不同的傳感器測量的是不同種類的參數,可以互相補充。

競爭式融合:不同傳感器測量的是同一個種類的參數,則使用某種方式將它們結合起來,產生一個更好的測量結果。

協作式融合:不同傳感器之間是協作關係,其中某個傳感器可能依賴於其他的傳感器才能得出結果。

2.2.5 小結與分析

筆者認爲,純粹的跟蹤技術研究,不僅可以服務於增強現實,也可以服務於虛擬現實,以及其他需要用到該技術的領域。研究跟蹤技術,可以從多視圖幾何方向入手,通過幾何的方式來估計位姿。也可以從特徵角度入手,針對特定的問題,設計不同的特徵表述方式,解決問題。

SLAM研究者們通常會考慮怎樣建立更加穩健的SLAM系統,怎樣對抗真實環境中的噪聲,怎樣進行更好的迴環檢測等。研究慣性測量單元(IMU)與視覺融合進行SLAM的也大有人在,多傳感器數據融合對於SLAM來講有重要的意義。

在研究基於視覺的跟蹤技術時,會用到很多計算機視覺算法。計算機視覺本身就是一個很龐大的學科,感興趣的讀者可以根據自己的興趣,選擇相應的書籍進行展開閱讀。這裏推薦兩本書,一本是《計算機視覺——算法與應用》,另一本是《計算機視覺中的多視圖幾何》。

 

2.3 標定和註冊

跟蹤、標定和註冊是AR系統研究的三個核心問題。前面我們已經講了跟蹤技術,這裏將對標定和註冊進行敘述。

                           

2.3.1 攝像機標定

(1)標定內參數

攝像頭是基於視覺的AR系統的重要組件。所以在使用中必須先標定攝像頭的內參數。對於普通的攝像頭,可以採用matlab自帶的攝像頭標定工具箱來標定。不僅可以標定出攝像頭的內參數,還能標定出鏡頭畸變。該工具箱採用的是棋盤格標定法。


(2)校正鏡頭畸變

鏡頭畸變可以分爲徑向畸變和切向畸變兩種。它們也都可以通過標定來確定畸變參數。鏡頭畸變是普遍存在的,所以在使用之前要記得先進行標定。

2.3.2 顯示器標定

(1)單點主動對準法

對於光學透射式頭盔顯示器,要進行AR開發的話,必須加上一個攝像頭。攝像頭與頭盔顯示器之間的位置關係需要標定。最常用的一種方法是單點主動對準法(SPAAM)。這個方法要求用戶佩戴頭盔顯示器,並且將屏幕上的一些十字光標與真實世界中的物體進行多次對齊,多次對齊需要通過頭部轉動完成。數據獲取後,通過DLT方法構建方程組求解投影矩陣。


(2)使用瞄準轉置

該方法需要將瞄準裝置與顯示器上的十字叉絲對準,而不是使用在SPAAM中用到的靜止標定點。這種瞄準裝置經常是作爲AR設備的一部分,並且包括一個觸發器來確認對準完成。瞄準裝置有一個優勢,用戶不必再移動頭部來完成對準,取而代之的是,可以通過移動手臂來完成。

2.3.3 註冊

跟蹤系統在進行測量的時候,會存在測量誤差,導致位置估計不準。這種誤差會導致註冊的虛擬物體與真實物體之間會存在不匹配的情況。所以,在每一個步驟要嚴格控制誤差,不要讓誤差在後面的環節中傳播。

對於光學透射式增強現實來說,還有另一個非常重要的問題,那就是延遲。由於真實的環境背景是直接透射進人眼的,可以認爲是零延遲的。但是虛擬信息是通過攝像頭捕捉環境,建立跟蹤註冊信息,然後渲染輸出到頭盔顯示器上。這個迴路的處理時間導致虛擬信息的渲染比頭部轉動會有延遲。一個比較有效的方法是在視覺跟蹤的基礎上,加入高反應速度的IMU,對這種延遲進行補償。頭部的快速運動可以根據IMU的反饋來渲染圖像。

 

2.3.4 小結與分析

攝像頭標定本身已經是一個很成熟的領域了,除非有什麼新的攝像頭類型推出。光學透射式頭盔顯示器的標定也比較成熟,但是還是存在問題。比如標定程序複雜,不同用戶之間通用性低。所以可以根據人眼與HMD之間的特殊性,研究提升標定效果的方法。另外,還可以考慮減小延遲,比如考慮視覺-IMU融合。這種方法已經在Hololens上獲得成功應用。減小延遲的方法除了使用視覺-IMU融合,應當還有別的途徑,這些都是值得研究的地方。

 

2.4 視覺一致性

2.4.1 幾何一致性

增強現實系統呈現的效果應該是虛實高度融合的,讓人分不清哪裏是虛的,哪裏是實的。高度融合體現在虛擬物體被放置在正確的位置上,沒有與真實物體產生錯誤的重疊。幾何一致性還要求在時間變化中保證幾何一致。例如,在光學透射式頭盔顯示器中,快速的頭部運動會導致虛擬圖像的渲染落後於真實的環境,導致圖像延遲現象。這就違反了幾何一致性要求。

另外,虛實遮擋也要保持一致。有的時候虛擬的物體在空間上應該被渲染到真實物體的後面。但是默認情況下,虛擬的物體總會擋在真實物體的前面。因此,必須使用額外的傳感器,探測出真實物體的空間位置,然後決定哪些虛擬圖像是應該被遮擋起來的。

還有一些研究人員對增強現實頭戴式顯示器的深度感知一致性做了研究。他們分析了使用雙目頭盔顯示器看到的虛擬物體與真實物體在深度感知上的一致性。


2.4.2 光照一致性

虛擬世界的光線往往是認爲設定的,但是真實世界的光線是非常複雜的。因此渲染的虛擬物體怎樣保持與真實環境一致的光照效果,也是需要注意的。光照效果如果不一致,尤其是陰影的渲染不一致的話,會導致非常糟糕的效果。解決這個問題的途徑是,通過某個方式獲得真實環境中的光源分佈,然後在虛擬世界中模擬這個光照效果。


2.4.3 小結與分析

視覺一致性分析實際上主要是對增強現實系統的表現進行評價。一旦涉及到用戶研究,就有很多值得研究的工作。比如研究AR系統的幾何一致性對用戶使用頭盔效率的影響,以及圖像呈現與環境配合關係。尤其是光照研究,自然光照是非常複雜的,要想完全模擬自然光是非常難的。所以這個點上還是有很多值得研究的東西的。

2.5 交互技術

交互聽起來有些陌生有些抽象,但是確是一個非常常見的過程。比如,我們日常使用鼠標鍵盤就是在與計算機進行交互。人機交互就是人與機器之間進行信息溝通的過程。按照交互方式的不同,增強現實中的人機交互技術可以分爲多種,下面一一介紹。

2.5.1 設備交互

傳統的交互最被大衆熟知。鼠標鍵盤的幾十年發展證明這種人機交互方式非常有效。但是對於增強現實應用,卻不一定是最好的結果。一些被廣泛用於虛擬現實的設備,例如數據手套、力反饋裝置、數據衣等,也可以應用在增強現實中,但是加入這些裝置後,會明顯覺得環境不協調,對增強現實應用的效果有影響。


2.5.2 肢體交互

隨着Kinect等設備的推出,肢體交互在投影式增強現實中獲得廣泛應用。肢體交互不僅解放了雙手,而且促進了全身的均衡運動,可以理解爲一種非常健康時尚的交互方式。因此,肢體交互在遊戲娛樂領域獲得了廣泛的應用。


2.5.3 手勢交互

很多桌面級的應用,也可以選擇手勢交互作爲一種交互方式。手勢交互依賴於手勢檢測設備,現有的手勢檢測設備有LeapMotion和RealSense等。這類設備極大地促進了手勢在人機交互中的推廣。


2.5.4 語音交互

隨着人工智能技術的發展,語音識別準確度和效率明顯提升。因此,語音交互也變得越來越普遍。


2.5.5 觸摸交互

觸摸交互是針對專門的觸摸設備來的。其實觸摸交互也算是比較早發展起來的了。大部分智能手機手勢觸摸屏,而且有些智能眼鏡也在鏡框上設置了觸摸區域。


2.5.6 眼動交互

通過圖像設備捕捉人眼運動,也可以實現人機交互。只不過這種方式僅僅適用於非常特殊的情況下,長時間的眼動交互會比較疲憊。


2.5.7 腦機接口

最新的人機交互方式莫過於腦機接口。它通過讀取人大腦的活動,來產生控制信號,對外界的設備進行控制。目前還只能實現比較初級的控制,完全解讀人腦意念信息還是任重而道遠。


2.5.8 小結與分析

人機交互是一個非常大的研究領域,在增強現實中涉及到的人機交互技術也有很多。我們可以針對某種交互形式展開研究,無論是建立人機交互接口,還是評測交互性能,都是一個不錯的切入點。相信很多讀者都會有興趣構建一套屬於自己的人機交互系統吧。

2.6可視化

增強現實中的可視化,主要是對場景中的物體進行標註和解釋。對於標註和解釋的合理性和正確性,需要經過仔細探究。一個場景中可能有很多東西可以標註,也有很多來自數據庫的信息可以呈現。但是如果不加選擇全部顯示出來,還是會發成數據冗餘、屏幕混亂的情況。因此需要對數據進行過濾,考慮兩個方面的問題:第一,標註的合理性;第二,數據推送智能性。

  

2.7 典型應用方式

2.7.1 創作

增強現實可以用於創作小故事,運用該技術可以盡情發揮個人想象力,構建出自己的各種物品、房間乃至城市。


2.7.2 導航

增強現實技術可以應用於導航。將虛擬的導航信息疊加在真實的道路信息上,甚至可以將信息投影在汽車的玻璃上,最大程度爲用戶提供方便。

  

2.7.3 協作

增強現實技術可以爲多個用戶創建一個統一的協作平臺,構建出一個虛擬的共享空間。多個用戶不論是否在同一地點,都可以通過增強現實的方式實現資源和信息共享。



3 增強現實技術展望

增強現實技術已經發展了幾十年,但是還沒有達到巔峯。增強現實的推廣,還必須依賴於幾個方面的進步:(1)傳感器技術的進步(2)顯示技術的進步(3)計算能力的提高(4)社會信息網絡的完善。

可以預期,在五到十年的時間裏,增強現實技術將會取得重大進步。各大科技巨頭也將會重點佈局這個新興領域,隨之極大推動該產業的發展。增強現實技術與虛擬現實技術、人工智能技術將會緊密結合,形成下一代科技革命的發力點,極大革新人類的生活方式與生產方式。也許十年、二十年後,增強現實設備就會完全取代智能手機,成爲下一代智能計算平臺、社交平臺和支付平臺,帶領人類進入全新的發展階段。


生產力的發展如此迅速,增強現實普及之日並不遙遠——然而,當一切構想全部實現,進入“增強現實”時代,等待我們的下一個神奇又會是什麼呢?

 

參考文獻

《Augmented Reality——Principles and Practice》作者:DieterSchmalstieg, Tobias Hollerer.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章