經典蜂擁模型穩定性分析

運動模型

  考慮一個包含NN個智能體的羣體,其中每個節點的運動方程均形同,如下:
{q˙i(t)=pi(t)p˙i(t)=ui(t)\left\{ \begin{matrix} {{{\dot{q}}}_{i}}(t)={{p}_{i}}(t) \\ {{{\dot{p}}}_{i}}(t)={{u}_{i}}(t) \\ \end{matrix} \right.
其中i=1,2,,Ni=1,2,\cdots ,Npi(t)p_i(t)qi(t)q_i(t)分別代表節點ii在時間時tt的速度和位置,uiu_i代表該節點的控制輸入向量。

輸入向量

  移動節點的輸入控制量爲:
ui=jNiϕ(qjqiσ)nij+jNi(pjpi)aij+β1(qkqi)+β2(pkpi)(1){{u}_{i}}=\sum\limits_{j\in {{N}_{i}}}{\phi ({{\left\| {{q}_{j}}-{{q}_{i}} \right\|}_{\sigma }}){{n}_{ij}}}+\sum\limits_{j\in {{N}_{i}}}{({{p}_{j}}-{{p}_{i}}){{a}_{ij}}}+{{\beta }_{1}}({{q}_{k}}-{{q}_{i}})+{{\beta }_{2}}({{p}_{k}}-{{p}_{i}}) \text {(1)}
其中σ{{\left\| \cdot \right\|}_{\sigma }}是一種新的範數,其定義如下:
zσ=[1+εz21]/ε{{\left\| z \right\|}_{\sigma }}=\left[ \sqrt{1+\varepsilon {{\left\| z \right\|}^{2}}}-1 \right]/\varepsilon
其倒數σε(z)=zσ{{\sigma }_{\varepsilon }}(z)=\nabla {{\left\| z \right\|}_{\sigma }}可以表示爲:
σε(z)=z1+εz2=z1+εzσ{{\sigma }_{\varepsilon }}(z)=\frac{z}{\sqrt{1+\varepsilon {{\left\| z \right\|}^{2}}}}=\frac{z}{1+\varepsilon {{\left\| z \right\|}_{\sigma }}}
aij{{a}_{ij}}是空間鄰接矩陣A(q)A(q)中的元素aij{{a}_{ij}},其可以表示爲:
aij(q)=ρh(qjqi/rα)[0,1], ji{{a}_{ij}}(q)={{\rho }_{h}}(\left\| {{q}_{j}}-{{q}_{i}} \right\|/{{r}_{\alpha }})\in \left[ 0,1 \right],\text{ }j\ne i
其中rα=rσ{{r}_{\alpha }}={{\left\| r \right\|}_{\sigma }}ϕα(z){{\phi }_{\alpha }}(z)是勢場函數(a smooth pairwise attractive/repulsive potential),其定義爲:
ϕα(z)=ρh(z/rα)ϕ(zdα)ϕ(z)=12[(a+b)σ1(z+c)+(ab)]\begin{aligned} & {{\phi }_{\alpha }}(z)={{\rho }_{h}}(z/{{r}_{\alpha }})\phi (z-{{d}_{\alpha }}) \\ & \phi (z)=\frac{1}{2}\left[ (a+b){{\sigma }_{1}}(z+c)+(a-b) \right] \\ \end{aligned}
其中σ1(z)=z/1+z2{{\sigma }_{1}}(z)=z/\sqrt{1+{{z}^{2}}},[\phi (z)]是一個不均勻的s形函數,參數0<ab0<a\le bc=ab/4abc=a-b/\sqrt{4ab},以確保ϕ(0)=0\phi (0)=0nij{{n}_{ij}}表示從qi{{q}_{i}}指向qj{{q}_{j}}的方向向量,其計算方式爲:
nij=(qjqi)/1+εqjqi2{{n}_{ij}}=({{q}_{j}}-{{q}_{i}})/\sqrt{1+\varepsilon {{\left\| {{q}_{j}}-{{q}_{i}} \right\|}^{2}}}

系統性能證明

定理1:考慮一個運行在指定區域內包含NN個移動節點的智能羣體,移動節點的輸入控制量如公式(1.1)所示。假設該區域內只有一個運動速度爲pk{{p}_{k}}的目標kk並且系統的初始結構能量滿足Q0<(m+1)ψα(0){{Q}_{0}}<(m+1){{\psi }_{\alpha }}(0),其中mZ+m\in {{Z}^{+}}。那麼一下三條規則均可以成立:

  1. 每個移動節點ii和目標kk之間的距離都不大於2Qo/β1\sqrt{2{{Q}_{o}}/{{\beta }_{1}}}
  2. 每個節點最終速度都接近目標速度pk{{p}_{k}}
  3. 該羣體中最多有mm對智能體可能發生碰撞。

證明:

根據Olfati-Saber等人在文章"Flocking for multi-agent dynamic systems: Algorithms and theory"和Su 等人在文章"Flocking of multi-agents with a virtual leader"文中給出的動力學分析,羣體控制的輸入量可以改寫爲:
u=Γ(q)L^(q)p+ft(q,p,q,p)u=-\nabla \Gamma (q)-\hat{L}(q)p+{{f}^{t}}(q,p,q,p)
這裏Γ(q)\Gamma (q)是一個平滑的勢函數:
Γ(q)=12ij,jiψα(qjqiσ)\Gamma (q)=\frac{1}{2}\sum\limits_{i}{\sum\limits_{j,j\ne i}{\nabla {{\psi }_{\alpha }}({{\left\| {{q}_{j}}-{{q}_{i}} \right\|}_{\sigma }})}}
其中ψα(z)=dαzϕα(s)ds{{\psi }_{\alpha }}(z)=\int_{{{d}_{\alpha }}}^{z}{{{\phi }_{\alpha }}(s)ds}L^(q)\hat{L}(q)是無向圖GG的正半定拉普拉斯算子,其定義爲:
L^(q)=L(q)IN=(Δ(A(G))A(G))IN\hat{L}(q)=L(q)\otimes {{I}_{N}}=\left( \Delta \left( A(G) \right)-A(G) \right)\otimes {{I}_{N}}
其中ft(q,p,q,p){{f}^{t}}(q,p,q,p)是羣體中所有節點和目標kk之間的羣體導航反饋量。使用哈密頓函數定義節點和目標kk之間的勢能函數和動能之和:
Q(q,p)=i=1N[Ui(q)+Ki(q)]Q(q,p)=\sum\limits_{i=1}^{N}{\left[ {{U}_{i}}(q)+{{K}_{i}}(q) \right]}
其中
Ui(q)=12j=1,jiNψα(qjqiσ)+12β1(qkqi)T(qkqi)Ki(q)=12(pkpi)T(pkpi)\begin{aligned} & {{U}_{i}}(q)=\frac{1}{2}\sum\limits_{j=1,j\ne i}^{N}{{{\psi }_{\alpha }}({{\left\| {{q}_{j}}-{{q}_{i}} \right\|}_{\sigma }})}+\frac{1}{2}{{\beta }_{1}}{{({{q}_{k}}-{{q}_{i}})}^{T}}({{q}_{k}}-{{q}_{i}}) \\ & {{K}_{i}}(q)=\frac{1}{2}{{({{p}_{k}}-{{p}_{i}})}^{T}}({{p}_{k}}-{{p}_{i}}) \\ \end{aligned}
沿着節點到目標kk方向上Q(q,p)Q(q,p)的導數爲:
Q˙(q,p)=pT[(L^(q)+β2I2)IN]p\dot{Q}(q,p)=-{{p}^{T}}\left[ \left( \hat{L}(q)+{{\beta }_{2}}{{I}_{2}} \right)\otimes {{I}_{N}} \right]p
因爲其中L^(q)\hat{L}(q)是一個半正定矩陣,因此有:
Q˙(q,p)<0,0\dot{Q}(q,p)<0,\forall \ge 0
由此可知Q(q,p)Q(q,p)函數是一個遞減函數,,即Q(q,p)Q0,t0Q(q,p)\le {{Q}_{0}},\forall t\ge 0
對於追蹤目標kk的任意一節點,根據公式(1.10)以及β1>0{{\beta }_{1}}>0可得:
12β1(qkqi)T(qkqi)Q0\frac{1}{2}{{\beta }_{1}}{{({{q}_{k}}-{{q}_{i}})}^{T}}({{q}_{k}}-{{q}_{i}})\le {{Q}_{0}}
因此每個節點與目標之間的距離都不大於2Q0/β1\sqrt{2{{Q}_{0}}/{{\beta }_{1}}},即證明了第一條規則。

根據拉塞爾不變性原理,即當Q˙(q,p)=0\dot{Q}(q,p)=0時,系統中的每個運算解都漸進收斂於最大的速度不變量。對於羣體中任意追蹤目標kk的節點,基於公式(1.11)後一個公式以及Q˙(q,p)=0\dot{Q}(q,p)=0,則有pipk0{{p}_{i}}-{{p}_{k}}\equiv 0。因此可以得到:
p1p2pNpk{{p}_{1}}\equiv {{p}_{2}}\equiv \cdots {{p}_{N}}\equiv {{p}_{k}}
則第二條規則得證。
假設Q0<(m+1)ψα(0){{Q}_{0}}<(m+1){{\psi }_{\alpha }}(0),並且有超過mm個不同的移動節點在時間t0{t}'\ge 0時發生碰撞。由於在時間t{t}'時,至少有m+1m+1個移動節點對發生碰撞,這表示羣體的總勢能至少是(m+1)ψα(0)(m+1){{\psi }_{\alpha }}(0)
根據公式(1.13)且函數Q(q,p)Q(q,p)不是遞減函數,則有:
Q0=Q(q(0),p(0))Q(q(t),p(t))(m+1)ψα(0){{Q}_{0}}=Q\left( q(0),p(0) \right)\ge Q\left( q({t}'),p({t}') \right)\ge (m+1){{\psi }_{\alpha }}(0)
顯然這與Q0<(m+1)ψα(0){{Q}_{0}}<(m+1){{\psi }_{\alpha }}(0)的假設矛盾。因此,在t>0t>0時,該網絡中最多有mm個不同的移動節點可能會發生碰撞。尤其是當m=0m=0時,任意兩個節點之間都不會發生碰撞。第三條準則得證。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章