在受限環境中優化無人機集羣的蜂擁行爲

引用

本文來自文章《Optimized flocking of autonomous drones in confined environments》,

Vásárhelyi Gábor, Virágh Csaba, Gerg? S , et al. Optimized flocking of autonomous drones in confined environments[J]. Science Robotics, 2018, 3(20):eaat3536-.

摘要

  我們解決了空中機器人集體運動的一個基本問題:如何確保大羣自動無人機在狹窄空間內無縫導航。許多現有的蜂擁模型很少在實際硬件上進行測試,因爲它們通常忽略了多機器人系統的一些關鍵方面。受限制的運動和通信能力,延遲,擾動或障礙的存在應該被明確地建模和處理,因爲它們在真實代理人的合作期間對集體行爲具有很大影響。正確處理這些問題會導致額外的模型複雜性和可調參數數量的自然增加,這需要將適當的優化方法緊密耦合到模型開發。在本文中,我們提出了一種真實無人機的蜂擁模型,其中包含一個具有精心選擇的順序參數和適應度函數的進化優化框架。我們在數值上證明了誘導羣體行爲在實際條件下對於大的羣體大小並且特別是對於大的速度而言保持穩定。我們表明,即使在擾動的障礙物周圍,仍然存在連貫和現實的集體運動模式。此外,我們在真實硬件上驗證了我們的模型,使用自組織的30個無人機組進行了現場實驗。這是迄今爲止報告的沒有中央控制的這種空中戶外系統中最大的,表現出集體碰撞和物體避免的蜂擁。結果證實了我們的方法是否充分。成功控制數十個quadcopters將在涉及無人機的各種環境中實現更有效的任務管理。

  羣體的羣居動物經常展示出一種有趣而壯觀的集體模式(1):它們在有限的時間內建立有序的結構而不會發生碰撞(2,3)。它們也可以對環境變化做出極快反應,例如突然出現捕食者或障礙物(4,5)。儘管這些系統非常複雜,但它們也得到了完美的優化,因此,它們表達的運動模式保持了優雅自然(6)。當這些系統建模時,人們傾向於通過制定理想主義假設來關注平滑最佳運動模式的複製。潛在的複雜性。這種“輸入”和“輸出”的同時簡化解釋了爲什麼許多不同的羣體行爲統計物理模型可以有效地用抽象的數學形式再現相同的自然集體運動模式。

  根據早期基於微觀Agents的模型(7),建立和維持無碰撞的粘性蜂擁只需要理想主義Agents之間的三種簡單相互作用:短程排斥,中間範圍內的速度排列和長程吸引。在這些一般規則的基礎上,出現了數百種模型來描述動物,人類甚至遷移細胞的同步集體運動(8-10)。我們將這些系統稱爲自組織系統,因爲它們之間的交互是本地的,並且由Agent自己做出決策。

  自組織蜂擁模型的最近應用之一是集體機器人技術(11,12),其中可以基於這些相互作用開發用於自主無人機組的分散控制算法,作爲安全操作的先決條件。將這種系統的行爲推向某種理想的模式是非常重要的。首先,Agent(機器人和無人機)是自主的和不完美的。也就是說,每個Agent具有(i)其自己的機載計算機,用於執行控制其自身動作所需的計算,(ii)其自己的用於測量相對位置和速度的傳感器系統,以及(iii)其自己的用於與臨近Agents交換數據的通信設備。這些特徵反映了(13)中描述的感覺和反應自主的當前定義。其次,這些系統應該在沒有中央控制的情也就是說,儘管Agent可以相互觀察並且可以交換信息,但是它們不發送和接收直接控制命令,因爲組內沒有領導者,也沒有外部監督者,例如基站或人工監督者。

  在通信中斷和延遲很常見的隨機環境中開發用於飛行機器人羣的分散控制算法時,很快就會面臨一系列嚴重的挑戰,這些挑戰很少被先前基於理想化Agent的模型所瞄準。作爲一個例子,選擇了32個代表性的顯微蜂擁模型,並且比較了超過100個(9)。 Fine和Shell聲稱“在真實傳感模型,驅動和動力學約束下,在生成豐富的蜂擁動作所需的運動的精確細節上沒有達成共識”;大多數作品在可重複建模和驗證方面缺乏完整性和精確性;只有少數包括運動約束和避免碰撞[例如,(7,14,15)];並且沒有明確處理運動約束。最後,只有一個研究了帶障礙物的有界空間(16)。

  旨在爲真正的飛行機器人提供穩定且可擴展的蜂擁模型,需要解決一些嚴峻的設計挑戰:
(1)現實差距。在理想條件下模擬的蜂擁模型較穩定但是在現實中則存在延遲、迅速振盪並、不穩定,同時也存在不確定性和運動學約束(17-21)。
(2)適應性。爲開放空間或週期性邊界條件開發的蜂擁模型不一定在有限的空間內工作,並且在路上有障礙物(9,22)。
(3)可擴展性。爲特定速度或組大小開發的蜂擁模型可能無法擴展;也就是說,對於更高的速度或更大的組,運動模式可能變得不穩定(16,23,24)。
(4)高維度。在現實生活中工作的蜂擁模型通常具有大量具有複雜非線性相互作用的參數,需要在合理的時間內針對各種條件進行調整(6)。

  到目前爲止,最大的無人機羣是由英特爾(25)和Ehang(26)開發的,每個都有超過1000架無人機;然而,這些無人機是針對預定軌跡單獨編程的,或者是集中控制的,並且不滿足上述自治標準。音樂樂隊Metallica最近在其音樂會中收錄了數十架無人機,這些無人機似乎通過使用專用的室內定位系統和中央控制機制展現出某種部分自主的蜂擁而至(27)。美國軍方也正在試驗稱爲Perdix(28)的固定翼無人機羣。新聞稿稱,103架自動無人機系統進行了自適應編隊飛行。已發佈的視頻表明,無人機收到了一組預定目標,選擇了一個集體決策,並單獨跟蹤。儘管處於不同的高度,無人機也在一個共同點上閒逛。遺憾的是,對於可靠的工作評估,沒有關於控制機制,通信方案或可能的防撞行爲的公開細節。

  自主無人機羣也出現在科學文獻中,使用基於室內運動捕捉(29,30),室外全球定位系統(GPS)(24,31-33),甚至視覺輔助(34,35)導航。這些系統通常具有比預編程無人機羣小得多的羣體尺寸。雖然基於動作捕捉的室內系統(在上述引文中有20個minidrones和49個nanodrones)非常精確和動態,但它們代表了一種非常不同類型的系統,因爲它們不必容忍諸如儀表級定位,外部等嚴重缺陷風湍流,或遠程通信衰變。上述基於GPS的室外羣由不超過10架無人機組成,除了(32),其中50架固定翼無人機(UAV)在不同高度飛行,沒有任何明確的防撞機制。基於視覺的解決方案僅使用少數無人機作爲現有技術。

  在本文中,我們基於我們之前的結果(24),其中一個由10個Agent組成的室外無人機羣作爲概念驗證,具有蜂擁和編隊飛行能力。雖然之前的工作包括封閉區域蜂擁的初步結果,但是即使它們是在最簡單的場地中執行的,軌跡仍然非常振盪:實際上有助於形成平滑轉彎的圓形軌跡。此外,由於加速度限制的不當處理,系統不能擴展到高於4米/秒的速度。

  在有界區域中使用自動碰撞和物體避免創建具有同步蜂擁行爲的大型分散式室外無人機羣是尚未解決的任務。我們通過展示30個自動飛行的四旋翼填補了這一空白,這些四旋翼在有界和雜亂的環境中進行緊密而穩定的蜂擁。爲了實現這一目標,我們使用了一個可擴展的優化控制框架,該框架基於真實的動態建模和蜂擁方程中運動約束的顯式處理。

  我們系統的一個給定設置是無人機的數量和預定義的羣集速度。期望的羣體行爲被定義爲無碰撞且相互一致的(coherent),即,具有各個無人機的較強的相關速度,並且表現出接近蜂擁速度的速度。此外,我們的目標是穩定的羣體行爲,持久的全局集體運動模式類似於具有集體智慧的自然系統。

  運動約束的顯式處理基於速度對準相互作用的特殊概念。關鍵的想法是放棄本地交互的常用固定空間邊界。相反,基於距離和速度差之間的預期最佳關係動態確定對準相互作用範圍(和幅度)。由於Agent的加速是有限的,它們需要時間和空間來制動並避免碰撞。因此,允許的速度差異量必須與距離有關:近距離內的Agents應該完全對齊,而遠距離物體允許具有更大的速度差異達到一定限度。爲了找到給定距離的速度差的上限,我們使用了加速度限制的制動曲線。因此,對準的目標是將速度差減小到低於該距離相關的閾值。該工作流程易於計算,併爲速度域中的可擴展性提供了最佳基礎,因爲它考慮了Agent的有限加速度,這是許多不希望的振盪的來源。

  該模型具有許多獨立參數,可以生成廣泛的新興行爲和視覺上令人愉悅的集體模式。然而,我們對穩定性和一致性的要求爲具有合適參數值的一般模型的實例化提供了可量化的標準。由於大量參數,它們複雜的非線性相互作用以及參數值和集體運動模式之間的噪聲關係,這意味着非常重要的優化問題。

  我們方法的一個重要元素是關注模型實例,即模型及其參數的特定值。理由基於我們對系統行爲的興趣。擁有模型不足以生成和研究運動模式;要使模型可執行,必須通過參數值進行實例化。公然無視模型的理論效益,我們可以說任何模型都是最好的實例。因此,我們考慮將參數設置優化爲模型生成的重要部分。

  目前的蜂擁模型和相應的機器人羣的實現缺少這種觀點,儘管有理由認爲自然系統在其“可調”參數的最佳值下運行(在達爾文理論的精神中)。隨着人工智能的複雜性增加,我們將被迫在模型設計中包含越來越多的優化。

  爲了解決優化問題,我們使用了進化算法,基於人口的隨機搜索方法,這些方法受到自然進化的啓發,在面對諸如不可區分性,不連續性,多個局部最優,噪聲和非線性相互作用等具有挑戰性的特徵時,已經證明在解決難題方面具有競爭性(36)。進化算法包含幾個主要原則的變體,包括遺傳算法,進化策略,差分進化和粒子羣優化(37)。演化策略,特別是協方差矩陣自適應演化策略(CMA-ES)(38),被認爲是連續參數空間中的優秀優化器;因此,我們使用此算法爲我們的模型找到了良好的設置。

  本文的主要貢獻是(i)蜂擁模型,通過保持距離和速度差異之間的改善平衡來明確地處理運動約束; (ii)通過在複雜、嘈雜、真實世界的系統中優化自組織的組級行爲來設計單個無人機控制器的方法; (iii)模擬該系統,以顯示其寬速度範圍和組大小的可擴展性; (iv)該框架的演示由30個四旋翼組成,在密閉空間內進行全面自主,同步的室外飛行,集體碰撞和避障。

結果

通過進化優化進行蜂擁模型實例化

  我們的通用蜂擁模型包括適當的評估指標,即訂單參數和適應度函數(有關詳細方程,請參閱材料和方法)。在模擬中首先使用適當的參數值實例化模型。已經使用進化優化來找到最大化羣體相干性和速度的參數值,同時最小化碰撞。首先,我們在適合實際實驗的條件下優化參數:使用邊長爲Larena=250mL^{arena} = 250 m的方形無障礙競技場和三種不同的蜂擁速度(v flock)值:4,6和8 m/sm / s。最大允許速度(vmaxv^{max})的相應值分別爲6,8和10m/sm / s。我們在所有情況下檢查了100個模擬Agent的行爲。對於每個vflockv^{flock}值,我們至少執行了三個獨立的,隨機初始化的優化過程,以識別參數空間中可能的多個局部最優,但在替代進化運行中發現了非常相似的解和收斂。因此,在下文中,我們將僅針對每個蜂擁速度參考最佳(最高適應度)進化運行。

  我們的進化算法中的種羣由參數向量組成,其適應性通過對系統進行10分鐘長的真實模擬來確定。在所有運行中,我們使用的人口規模爲100,並在150代後終止。在所有情況下,15,000次健身評估證明是足夠的。優化是在匈牙利布達佩斯Eötvös大學的Atlasz超級計算機集羣上進行的(39);單次進化運行的總執行時間在2到6天之間變化。

  評估基於單個適應度值,其被創建爲六個獨立的歸一化部分適應度值的乘積(對應於最小化的碰撞風險,最小化的與牆壁的碰撞,最大化的速度相關性,儘可能接近蜂擁速度的速度大小,最大化羣集大小,並最小化斷開連接的Agent數量)。每個部分適合度以及最終適合度值取0(最差情況)和1(理想情況)之間的值。

  對於vflock=4,6v^{flock} = 4,68m/s8 m / s,優化後最佳解的最終適應度分別收斂到0.92,0.87和0.8。在這些最佳隨機模擬實例中,六個部分擬閤中的四個恰好爲1(對應於完全無碰撞且完全連接的羣),並且僅速度相關性和平均速度降低了整體適應度。這是一種自然且不可避免的趨勢,因爲在有界區域撞擊牆需要羊羣改變方向,而這不能在不暫時降低速度和速度相關性的情況下進行。值得注意的是,這些高適應值已經在惡劣的實際條件下達到,具有1秒的通信延遲和大量噪聲,這通常會妨礙完美同步。表S1中給出了優化的參數值。

  接下來通過對每個速度執行100個並行隨機模擬來研究優化模型的穩定性。關於統計評估的詳細結果可以在表S2中找到。對於vflock=4,6v^{flock} = 4,68m/s8 m / s,平均擬合度自然變得略低於最大值:0.812±0.101(SD),0.776±0.086和0.728±0.075,偶爾出現碰撞。注意,在模擬中,碰撞的部分適應性必須是連續且不太陡峭的函數;否則,優化器無法從次優解決方案中找到梯度方向。這意味着只有在有限的適應性降低的情況下才能禁止發生一些碰撞,並且優化器不會特別優先考慮完全無碰撞的解決方案;它將隱含地致力於最大密集的羣體以增加連通性和速度相關性,這縮小了關於碰撞的穩定性範圍。另一方面,實際上,作爲第一條規則,必須始終完全消除碰撞。這個問題存在幾種解決方法:(i)運行具有較大碰撞半徑的優化器或較大的通信延遲,以優化最小干擾距離變大的解決方案,以及(ii)在無害化優化後手動增加通風距離(排斥)在擴大的雞羣中降低整體速度相關性的妥協。這一次,我們選擇了第二種方法,因爲在實際飛行中,無論如何都需要啓動過度參數設置,與最佳可能適應性但穩定性較低相比。

  進化優化產生了大量的隨機適應度評估,其中還包含關於合理參數範圍的寶貴信息,其中適應性預期很高。表S1總結了這些工作範圍,以便爲真正的無人機提供調諧信息。我們還列出了表S3中的所有模型參數,並詳細說明了含義和用法。

  最後,讓我們注意一下進化參數設置的一個驚人的好處。進化算法在Agent之間的排斥和對齊交互中發現了意外的參數設置:
(1)根據進化優化,優選在空間上更長和更平滑的排斥,而不是強烈的硬核排斥(如直觀地預期的那樣)。
(2)附近Agents之間的速度對齊應該是最大的並且大部分是與距離無關的,僅允許一定的,相對小的速度差鬆弛,主要是爲了加速集體轉向過程。

  總的來說,我們實現了我們的第一個目標:通用模型可以在模擬中用適當的參數值很好地實例化;優化後的設置在所研究的速度範圍內顯示出穩定有效的羣,可作爲實際現場實驗的基礎。將我們的新結果與之前的工作(40)進行比較,我們可以看到雞羣穩定性和一致性的顯着增加(見圖1)。電影S1和S2以4米/秒的速度顯示新舊模擬的相應運動。

在這裏插入圖片描述
圖1. 將先前的模擬工作與當前研究進行比較。我們以前的工作(40)(算法A)和我們的新型蜂擁模型(算法B)的兩個階次參數(右,頂部的速度相關和底部的歸一化速度幅度)的樣本時間線。對於左側的兩個模型,顯示與時間線的灰色部分對應的軌跡,顏色映射到時間。在電影S1和S2中可以看到相應的動作。算法B執行得更好,瞬態時間更短。我們對算法A使用以下交互參數集:Cfrict=30m2C^{frict} = 30 m^2rminfrict=5mr^{frict}_{min} = 5 mr0rep=20mr^{rep}_{0} = 20 mprep=1s1p^{rep} = 1 s^{-1} (有關參數的詳細信息,請參閱(40))。對於算法B,我們使用vflock=4m/sv^{flock} = 4 m / s的優化參數集。使用具有相同參數設置的10次模擬的平均值,對於算法A和fcorrB¼,對於時間平均的階數參數是ϕAcorr=0.63±0.07\phi^{corr}_{A} = 0.63±0.07ϕAvel=3.37±0.15m/s\phi^{vel}_A = 3.37±0.15 m / s算法B的ϕBcorr=0.92±0.002\phi^{corr}_{B}=0.92±0.002ϕBvel=3.83±0.005m/s\phi^{vel}_{B} = 3.83±0.005 m / s.

速度的可伸縮性

  加速限制速度對準的最重要特徵是Agent - Agent 和牆壁 - Agent 相互作用終止其在速度方案中的固有可擴展性。爲了證明這一點,我們進行了更高的蜂擁速度值進一步優化:16和32m / s,超過大多數鳥類遷移速度(41)。我們在環境設置中改變了兩個參數:我們將通信範圍從80增加到160和320米,競技場的大小分別從250到500和1000米增加到兩個速度值。需要進行第一次改變,因爲通信延遲保持在1秒,這在更高的速度下產生了更大的位置不確定性和制動距離。只有當Agent在更遠的距離上擁有彼此的信息時,才能對此進行補償。第二個變化是第一個變化的結果:由於如此大的通信延遲和速度,潛在的距離變得更大,因此,集羣無法適應較小的競技場,並且有足夠的自由來獲得良好的蜂擁行爲。

  優化的解決方案再次獲得高適應度,最大值分別爲0.91和0.89,統計平均值分別爲0.79±0.12和0.63±0.23(分別爲16和32 m / s)。統計評估的詳細適應值總結在表S2中。注意,對於32m / s的最高速度,適應度的較低平均值通常是略微增加的碰撞次數(3.53±3.61)的結果。我們研究了通信範圍和延遲在這種情況下的作用,發現當我們將延遲減小到1秒以下時,碰撞就消失了,假設通信範圍足夠大(詳見圖2)。電影S3的第一部分顯示了100個試劑在16 m / s模擬中的優化和穩定的蜂擁行爲。

集羣個體數量的可擴展性與集體避障

  由於通信的局部性和交互,所提出的蜂擁模型爲Agent數量的可擴展性提供了基礎。然而,當更多的藥劑在這種非平衡系統中同步時,集羣的整體動量也隨着集羣的大小而變化,這會在集羣撞到牆壁時產生增加的Agent的“壓力”。在類似的情況下,人羣在恐慌事件中很容易受傷或甚至死亡(16),或者,例如,在重金屬音樂會上的mosh坑(42)。爲了提供具有更多數Agent數量的無碰撞解決方案,需要防止代理的累積壓力,例如,使用競技場內增加障礙物。可以使用與圍牆相同類型的相互作用引入障礙(詳見材料和方法)。

  在沒有進入統計細節的情況下,電影S3顯示了一些真實模擬的例子,其中集羣大小在30到1000之間,蜂擁速度在4到32米/秒之間,不同類型的障礙物在路上。總的來說,我們看到所提出的蜂擁模型可以作爲一個通用框架來處理在狹窄區域內的蜂擁型運動,具有大量的Agent,大的蜂擁速度和障礙物。

在這裏插入圖片描述
圖2.作爲通信範圍和延遲的函數的碰撞次數和平均最近鄰距離的分佈。 每個箱子是20次模擬的平均值,優化的參數設置爲32 m / s的蜂擁速度。 可以看出,對於這種設置,可以通過足夠小的延遲(<1 s)和足夠大的通信範圍(> 240 m)實現安全蜂擁。

室外飛行的實驗結果

  我們在定製的多無人機框架中實現了所描述的模型作爲控制算法。無人機設置的詳細信息在材料和方法中給出。

  我們進行了二維實驗,其中30架無人機在同一高度蜂擁,水平速度爲vflock=4,6v^{flock} = 4,68m/s8m / sLarena=200L^{arena} = 200260260米。參數值主要在相應的進化優化結果的工作範圍內初始化(表S1),基於以下預防性和預防性安全性考慮,模擬最佳值有一些顯着變化:(i)排斥強度稍微增加(增益更大)以最小化碰撞的機會(妥協:稀疏的集羣); (ii)增加對準係數以減少可能的振盪(妥協:更緩慢的運動); (iii)shill相互作用強度降低(較小的shill速度),但範圍擴大(較大的距離偏移),以避免牆壁上的非常高的相互作用項,同時保持整體強度。實驗中使用的最終參數值及其可能的詳細評論模擬最佳值的變化總結在表S4中。

  爲了評估飛行的質量,我們計算了一組評估參數來描述不同的運動。我們計算了與簇有關的速度相關性(ϕcorr\phi^{corr}),平均速度(ϕvel\phi^{vel}),乘員距離的平均值和最小值(minrijminr_{ij}rijminr^{min}_{ij}),以及局部角度極座標(LAP)座標表示的平均歸一化速度(43) ):
aa

  其中rxr_xryr_y表示Agent在水平面內相對於競技場中心的平均位置,而vxv_xvyv_y是Agent在水平面上的平均速度分量。 ϕLAP\phi^{LAP}是旋轉行爲的簡單描述符:瞬時值零意味着沒有相關切向運動,而值1或-1分別表示逆時針和順時針方向的相關圓形飛行。

  圖3顯示了作爲時間函數的訂單參數,用於選擇完整的10到15分鐘的穩定航班(飛行時間取決於電池和風力條件,最大容許風速約爲40 km / h)。選擇飛行代表最常見的新興集體模式,即無障礙競技場中的重複圓形和對角飛行以及帶障礙物的生動隨機集體飛行。注意,出現的旋轉模式是通用的旋轉模式(44),出現在從細長杆(45)到蝗蟲(2)和魚(5)到人類(46,47)的各種植絨系統中。在圖4中可以看到來自相同飛行的軌跡的10分鐘部分,圖5中示出了較短部分的長曝光照片,而電影S4至S6示出了相應的動態飛行日誌可視化。三個選定的航班。最後,電影S7顯示了結果的摘要,包括航班的實際鏡頭。

  從實驗中可以看出,真正的無人機在整個測試的蜂擁速度範圍內表現良好。也就是說,彼此之間,牆壁或障礙物沒有臨界振盪或碰撞。此外,當羣體撞擊牆壁,飛入競技場的直角角落時,運動是平穩而活潑的,或者當障礙物擋住時,運動是分開的。在圖3的基礎上,我們可以看到,對於蜂擁速度爲4 ~ 8m / s,平均最近鄰距離在12 ~ 30 m之間變化,最小有效距離在5~15 m之間。由於全球導航衛星系統(GNSS)定位誤差在2和3的範圍內,並且可能的通信中斷大約爲1秒,我們認爲這些結果顯示出緊密且穩定的羣。
在這裏插入圖片描述
圖3.在30個無人機的實際實驗中,對於不同vflockv^{flock}的參數作爲時間的函數。 fcorr是與簇相關的速度相關性,ϕvel\phi^{vel} / vflockv^{flock}是平均歸一化速度,rijminr^{min}_{ij}表示最近鄰居的平均值,而min(rij)min(r_{ij})是最近鄰居的最小值。所描繪的區域對應於圖4的中間5分鐘。在沒有障礙物的方形場地中存在兩種典型的,大部分穩定的行爲:(A)主要示出沿主要對角線的線性運動,隨着集羣的循環膨脹和收縮以及角落的突然轉彎。(循環紅色和橙色曲線)和拐角處的突然轉彎(藍色和綠色曲線下降到零),而(C)顯示邊界內的圓周運動(始終幾乎恆定的順序參數)。 (B)由於道路上的障礙,重複的,微不足道的模式被打破並變得更加活躍。相應地,速度相關性和平均速度大小下降,而最小的潛在距離保持不變,即使在這種受阻的情況下也顯示出飛行的穩定性。

在這裏插入圖片描述
圖4.多無人機飛行軌跡和相應的順序參數。在水平面上的30個無人機的10分鐘軌跡部分,用於(A)4米/秒,(B)6米/秒和(C)8米/秒的飛行,代表典型飛行模式的選擇。藍色方塊顯示虛擬競技場的邊界。 (A)軌跡顯示了雞羣的對角線性運動,從直角角落反彈回來。軌跡顏色表示水平平面中的速度,而隨機單個軌跡以灰度突出顯示。 (B)運動仍然是局部相關的,但障礙物(紅色形狀)會產生非常豐富的動態模式,類似於活潑的鳥羣或其他動物。 (C)軌跡顯示高度相關的近圓形飛行。顏色和線條樣式在這裏映射到各個無人機;黑點顯示無人機的終端位置。 (D)(A)至(C)的三個定性不同行爲與專用順序參數的時間線的比較:平均歸一化速度,以局部角度極座標(fLAP)表示。

討論

  我們已經爲一大批自主飛行機器人提出了一種可調分佈式蜂擁模型,它們能夠在一個大的速度範圍內在有或沒有障礙物的封閉空間中保持穩定,無碰撞的集體運動。該解決方案基於最早的自推進粒子模型,排斥和對齊所呈現的最簡單的基於力的規則,但使用考慮到所需的加速劑加速方式的對齊形式。該模型在嘈雜的環境中工作,具有不準確的傳感器和短距離通信設備,並且存在大量通信延遲和可能的本地通信中斷 - 這些是當前的超級實驗設備的通常特徵。該模型產生非常豐富的運動動態,特別是在受阻的空間中,具有各種緊急的集體運動模式,類似於活潑的天然集羣。

  該模型具有11個可調參數,需要自動化和高效的優化方法,例如CMA-ES。通過引入的單目標適應度函數考慮了幾個重要的階次參數,我們可以實例化我們的模型,以找到適用於各種速度的工作範圍和最佳參數設置。我們的優化模擬結果均爲30至1000架無人機和4至32米/秒的蜂擁速度,我們對30架無人機和4至8米/秒蜂擁速度的真實實驗表明,Agent的蜂擁行爲穩定。

  由於新的對齊術語背後的概念,我們認爲如果需要,可以使用相同的方法針對更高的速度制度。爲此,需要具有更大的有效距離,更大的相互作用半徑,從而需要適當的大距離通信方法。


圖5.具有多個無人機的飛行的長曝光照片。 [來源:ZsoltBézsenyi]

  模型的一般使用的限制可能源於速度機制和無人機數量的進一步縮放。使用30架無人機,我們展示了相對於僅有少數Agent的最小無人機羣的數量級可擴展性;然而,數量的進一步擴大還意味着面對牆壁和障礙物的正面Agent的緊急壓力增加,例如人羣中的緊急壓力,導致較小的,可能危險的潛在距離。這個問題必須在具有非常多Agent的系統中得到解決。相關的限制因素是需要針對每個系統單獨優化的大量必要參數。儘管我們特別注意選擇參數具有獨立的意義和重要性,但在這樣一個複雜的系統中,在將結果安全地應用於具有不同特徵的其他車輛之前,需要深入瞭解豐富的動態行爲和豐富的經驗。本研究的最後一個缺點是缺乏對穩定性的嚴格定量分析,因爲在這樣的高維參數空間中不能直接進行。我們通過統計分析適應度評估來避免這種情況,並給出了預期適應度高的參數的近似獨立範圍。但是,對於某些應用,更復雜的分析會更合適。儘管有這些限制,我們相信所呈現的速度對準概念,通常的模型以及適應性評估方法,可以在需要複雜合作和/或協作的各種多種場景中被最佳地使用。

材料和方法

可調式自組織蜂擁模型

  在統計 - 物理方法的基礎上,在(40)和(24)中引入了基本蜂擁模型。這是蜂擁行爲的最小現實方法,已被證明可與多達10個飛行機器人一起使用,最大蜂擁速度爲4米/秒。在該模型中,三個相互作用項產生瞬時期望速度矢量vdv^d,其必須由Agent實現。當然,由於一些特定於機器人的缺陷,例如通信延遲和反應時間,車載傳感器的不準確性,風的影響,傳感器信號中斷,慣性等,保持所需的速度通常很難。我們在這裏檢查的問題是,是否存在在這些條件下,對於較大的蜂擁速度以及在狹窄的空間中,相互作用可以保證比以前發表的嘗試更穩定的行爲。在下面的小節中,我們提出了我們新穎的通用蜂擁模型的精確數學公式,考慮到自主飛行Agent的現實侷限性,並明確處理方程中的運動約束。

排斥(Repulsion)

  對於局部排斥,我們選擇一個簡單的半彈簧模型,即線性距離相關的中心速度項,在最大相互作用範圍r0repr^{rep}_0處具有截止值,在此範圍內,Agent開始相互排斥:

vijrep={prep(r0reprij)rirjrijrij<r0rep0otherwisev_{ij}^{rep}=\left\{ \begin{matrix} {{p}^{rep}}\cdot (r_{0}^{rep}-{{r}_{ij}})\cdot \frac{{{r}_{i}}-{{r}_{j}}}{{{r}_{ij}}} & {{r}_{ij}}<r_{0}^{rep} \\ 0 & otherwise \\ \end{matrix} \right.
在上面的等式中,p^{rep}是成對排斥的線性增益,rij=rirjrij=|r_i - r_j|iijj之間的距離。 則Agent ii的總排斥可以由下面公式計算

virep=jivijrepv_{i}^{rep}=\sum\limits_{j\ne i}{v_{ij}^{rep}}

其中jj是所有其他Agents。 請注意,我們已經在v(r)v(r)平面(40,48)中嘗試了更復雜的排斥函數,但根據我們的經驗,半彈簧模型同時足夠簡單有效。

速度對齊(Velocity alignment)

  可以使用取決於附近試劑的速度矢量的差異的速度項來獲得成對速度對準。 以前的工作通常使用在空間中衰減的相互作用的Agent的速度差的冪律漸近爲零(49,50)。 這些模型在較低速度範圍內的某些特定條件下工作正常。 但是,我們關於速度對齊的目標很複雜。 這是使運動同步以實現集體植絨行爲的術語,但它也必須用作阻尼介質,減少由於對例如排斥的延遲和噪聲響應而出現的自激振盪。 它必須是局部的,但它也必須同時適應大速度(因此可能存在大的速度差異)。 最後一個條件意味着如果Agent的加速度受到限制,則應在較大距離處放寬大的速度差以避免碰撞。

  爲了滿足上述所有要求,作爲速度對準項的理論基礎,我們選擇了理想的制動曲線,即空間中的平滑速度衰減函數[用D(.)D(.)表示),高速時恆定加速 和低速時的指數方法(51):

D(r,a,p)={0r<0rp0<rp<a/p2ara2/p2otherwiseD(r,a,p)=\left\{ \begin{matrix} 0 & r<0 \\ rp & 0<rp<a/p \\ \sqrt{2ar-{{a}^{2}}/{{p}^{2}}} & otherwise \\ \end{matrix} \right.
其中rr是Agent與預期停止點之間的距離,aa是優選的加速度,pp是線性增益,也決定了兩個減速階段之間的交叉點。

  我們的速度對齊項背後的基本原理是禁止兩個Agent在給定的距離上有比這個理想的制動曲線所允許的更大的速度差,因此,在其他基於瞬時力的方程中充當一種運動規劃項(視覺表示見圖6):

vijfrictmax=max(vfrict,D(rijr0frict,africt,pfrict))v_{ij}^{frict\max }=\max \left( {{v}^{frict}},D({{r}_{ij}}-r_{0}^{frict},{{a}^{frict}},{{p}^{frict}}) \right)
vijfrict={Cfrict(vijvijfrictmax)vivjvijvij>vijfrictmax0otherwisev_{ij}^{frict}=\left\{ \begin{matrix} {{C}^{frict}}({{v}_{ij}}-v_{ij}^{frict\max })\cdot \frac{{{v}_{i}}-{{v}_{j}}}{{{v}_{ij}}} & {{v}_{ij}}>v_{ij}^{frict\max } \\ 0 & otherwise \\ \end{matrix} \right.
在上面的等式中,CfrictC^{frict}是速度對準誤差減小的線性係數,vfrictv^{frict}是速度鬆弛允許誤差,其與集羣內部的Agents之間的速度差無關,r0frictr^{frict}_0是Agent ii的停止點相對於和的距離。 在Agent jj前面,pfrictp^{frict}africta^{frict}是成對對齊的線性增益和加速度參數,並且vij=vivjv_{ij} = | v_i - v_j |是Agent iijj之間的速度差的幅度。 對於Agent ii相對於其他Agents計算的總速度對準項 - 類似於排斥項是

vifrict=jivijfrictv_{i}^{frict}=\sum\limits_{j\ne i}{v_{ij}^{frict}}
其中j被迭代爲所有其他代理。 請注意,上標“frict”來自速度對齊應該是強局部速度阻尼項的概念,類似於粘性摩擦(24)。
在這裏插入圖片描述
圖6.交互術語的可視化解釋。 藍線表示Agent 之間的排斥作爲Agent 距離的函數。 綠線是Agent 之間允許的最大速度差,作爲乘員距離的函數。 速度對齊項與此與Agent 之間的實際速度差(紅色虛線)之間的差值成比例。 所有示例性參數值都是SI單位。

  此外,僅隱含地包括這種形式的速度對準的局部條件:相互作用範圍上限由D(.)=2vmaxD(.)= 2v^{max}的距離限定。 另一方面,該解決方案允許速度域中的靈活可擴展性。 如果蜂擁速度高得多,那麼顯然最好在更大的距離處開始減小速度差(作爲類比,比較玩具無人機對物體和到達目的地的大型有人駕駛飛機的減速行爲和制動距離)。

牆壁和障礙物的作用

  遠程吸引力(7)並不是我們蜂擁系統的明確組成部分。 爲了將Agent 保持在一起,我們爲具有軟排斥虛擬牆的Agent 定義了一個有界飛行競技場。 定義這種排斥的理想方法之一是在競技場牆壁(52)附近定義虛擬“shill”代理。 這些虛擬代理正以一定的速度前往競技場,即vshillv^{shill}。 靠近牆壁的真正的Agent 應該將他們的速度放寬到shill agent的速度。 我們在此處使用之前介紹的速度對齊項執行此操作:
在這裏插入圖片描述
這些方程式與方程式非常相似。 在圖5和圖6中,有兩個簡化:我們不允許壁面速度鬆弛,並保持誤差正比項(CshillC^{shill})保持在1以使得有最強的shill對齊可能。 在上面的等式中,ss指的是分別爲所有牆多邊形邊定義的shill agent; ris=rirsr_{is} = | r_i - r_s |,其中rsr_s是shill agent的位置,位於任意形狀的凸壁多邊形的給定邊緣相對於Agent ii的最近點; vis=vivsv_{is} = | v_i - v_s |,其中vsv_s是shill agent的速度,垂直於牆體多邊形邊緣向內指向競技場,幅度爲vshillv^{shill}

  使用相同的概念可以避免競技場內部的凸起障礙物,但是如上面針對競技場所描述的那樣,從障礙物向外移動,而不是向內移動。 另一個不同之處在於,雖然所有的牆多邊形邊緣都會在競技場內生成一個單獨的shill agent,但是障礙物是由位於障礙物多邊形相對於agent最近位置的單個shill agent表示的。因此,對於每一個agent ii和障礙物ss,我們都可以定義一個與Eq. 9相似的速度分量visobstaclev^{obstacle}_{is},使用與壁面相同的shill參數。

自我推進項(Self-propelling term)

  除了上面介紹的agent-agent和agent-wall相互作用外,還爲agent的期望速度增加了一個簡單的自推進項。對於第i個agent,這一項與實際速度矢量viv_i平行,並且具有一定的常數大小vflockv^{flock}

期望速度的最終方程(Final equation of desired velocity)

  爲了計算所需的速度,我們採用之前引入的所有交互項的矢量和:

在這裏插入圖片描述
在這個疊加之後,我們還引入了vmaxv^{max}的截止值,保持了所需速度的方向,但是如果超過極限則減小其幅度:
在這裏插入圖片描述
  在上面的蜂擁模型中,我們引入了大量的參數來爲一般模型提供必要的自由度。 爲了幫助讀者理解複雜的模型行爲,我們提供了參數的概述,並詳細描述了含義和用法(表S3)。 調整上述模型意味着我們爲具有特徵尺寸Larena的給定場地的固定蜂擁速度vflockv^{flock}和最大速度vmaxv^{max}選擇一組最佳參數。 必須優化其他參數(即r0repr^{rep}_0prepp^{rep}r0frictr^{frict}_0CfrictC^{frict}vfrictv^{frict}pfrictp^{frict}africta^{frict}r0shillr^{shill}_0vshillv^{shill}pshillp^{shill}ashilla^{shill})。 注意參數空間是11維的; 因此,手動調整,全局優化方法或參數掃描通常太耗時。

飛行機器人的一般模型(General model of a flying robot)

  爲了在實際飛行之前在現實環境中測試任何蜂擁算法,我們使用了一個模擬框架,該框架最初是爲基於二階常微分方程建模飛行機器人的特徵而開發的。 在本小節中,我們僅提供此框架的主要功能,而不提供詳細信息。 有關更多詳細信息,請參閱(40)或從https://github.com/csviragh/robotsim下載模擬框架。 我們的框架可以考慮飛行機器人的以下一般特徵:
(1)通信延遲。由於數據傳輸和處理所需的時間,代理從鄰近代理接收的位置和速度數據是舊的。在最簡單的情況下,我們用恆定的時間延遲tdel建模這種效果。
(2)慣性。飛行機器人由於其質量,空氣動力學效應和低水平控制算法的特定特徵,不能立即改變其速度。我們假設實際速度vi以特徵時間tCTRL指數地收斂到期望速度vdi。還假設單位的最大加速度(amax)。
(3)傳感器的刷新率。代理人不能連續更新他們的感官數據,只有非零時間段ts。爲簡單起見,在模擬框架中,此參數對於所有代理程序都是常量且一致的。
(4)溝通的地點。如果兩個代理人相距太遠,他們就無法交換消息;也就是說,他們沒有看到對方。這是任何分散的,基於無線電的通信設備的共同特徵。爲了對此效果進行建模,我們的方法中定義了最大通信範圍rc。
(5)車載傳感器不準確。我們還必須模擬測量位置和速度的波動行爲。這種行爲可以描述爲隨機過程。對於第i個代理,可以選擇該過程作爲具有高斯噪聲項和以ri爲中心的拋物線勢的虛構Langevin方程。噪聲可以通過其SD s來表徵。
(6)外部噪音。爲了考慮諸如低水平控制算法的風補償之類的環境影響,我們在機器人的加速度中添加了具有SD s的Δ相關高斯噪聲項。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章