11.双无人机实现安全通信的联合轨迹和用户调度优化

论文题目:Joint Trajectory and User Scheduling Optimization for Dual-UAV Enabled Secure Communications

I. INTRODUCTION
  在这项工作中,我们研究了一种支持双无人机的安全通信系统。如图1所示,UAV 1移动以时分多址(TDMA)模式与地面上的多个用户通信,而该地区的无人机2飞行以堵塞地面的窃听者,以保护无人机1的传输信息。我们考虑对UAV轨迹和用户通信调度进行联合优化,以便在一些实际约束下最大化每个时段内用户的最小平均保密率。
  由于其高度非凸的目标函数和约束,由此产生的优化问题很难得到全局解决方案。通过引入一组辅助变量和等式约束,我们首先将此问题重新转换为等效但更易处理的形式,其中特别地,我们等效地将离散二元约束转换为具有连续变量的多个等式约束。然后,我们提出了一种基于创新的凹凸补偿程序(CCCP)技术[10]的新算法来处理等效转换的非凸问题并联合优化无人机轨迹和用户调度变量。在补偿-CCCP优化方法的辅助下,我们将新引入的平等约束作为补偿条件补偿为目标函数。然后通过新提出的双环迭代算法优化所得到的补偿问题。在内循环中,我们采用CCCP方法[13],[14]更新优化变量,同时调整外循环中补偿成本函数的补偿参数。
  在这里插入图片描述
II. SYSTEM MODEL AND PROBLEM FORMULATION(系统模型和问题公式化)
  在本节中,我们首先介绍支持双无人机的安全通信系统模型,然后在数学上将我们关注的优化问题公式化。
A. System Model(系统模型)
  我们考虑使用双无人机安全通信系统,这里的两个UAV被用于在存在N个地面窃听者的情况下服务K个用户。UAV 1以TDMA模式(该模式的一个周期内包含T>K个时隙,在这里的每个时隙,UAV 1最多只能服务一个地面用户,注意,在该工作中,必须基于所提出的算法来优化用户调度,这与传统TDMA模式的预设用户调度策略不同)向这些𝐾用户发送信号,同时UAV2发送阻塞信号去保护UAV 1的传输。由于UAV移动性,UAV 1倾向于靠近每个用户,以便实现更好的通信信道并因此实现更高的传输速率。UAV 2旨在在窃听者上方移动以获得更好的干扰性能。
  在不失一般性的情况下,我们考虑三维(3D)笛卡尔座标系,用户k的水平座标由wkw_k表示,wkw_k \in R21R^{2*1},k \in {1,2,3…K},窃听者n被表示为fnf_n \in R21R^{2*1},n \in {1,2,3…N}。UAV1 和UAV2被假定以固定的高度dhd_h飞行,并且它们的时变水平座标被分别表示为:q1(i)R21q_1(i)\in R^{2*1}q2(i)R21q_2(i)\in R^{2*1},这里i\in {1,2,3…T},(我们假设元素时隙长度被选择为足够小,使得即使在最大速度下UAV的位置也被认为在每个时隙内近似不变。 此外,请注意,无人机上配备的合成孔径雷达可以检测并获得地面上的窃听者的位置)。实际中,UAV轨迹需要满足下面的限制:
  在这里插入图片描述
  在这里插入图片描述
(1)表示UAV最大的速度限制,ϵ\epsilon表示UAV在一个时隙内的最大的水平距离,UmaxU_{max}表示UAV最大的速度,δt\delta_t表示时隙的长度。(2)表示如果对用户的安全传输是周期性的,UAV在每个周期T结束时需要返回初始位置。
  对于用户k在时隙i的接收信号可以表示为:
在这里插入图片描述
这里的bk(i)b_k(i)表示从UAV1 发送数据到用户k的标志,它被建模为具有方差的独立零均值圆形复高斯随机变量,即E{bk(i)2|b_k(i)|^2},P1P_1表示UAV1 对于每个时隙的传输功率,s(i)表示UAV 2发送的拥堵信号,它被建模为具有单位方差的独立零均值圆形复高斯随机变量,P2P_2表示UAV2 对于每个时隙的传输功率。nd(i)n_d(i)表示在每个用户加性噪声,建模为一个独立的零平均循环复杂的高斯噪声,具有方差E{nd(i)2|n_d(i)|^2} = σd2\sigma_d^2。为简单起见,我们假设从无人机到地面用户和窃听者的链路由LoS链路占主导,其中信道质量仅取决于距离。如果ρ0\rho_0表示参考距离为1 m的情况下的信道增益,然后用户k在时隙i上的信道增益可以被表示为:
在这里插入图片描述
其中我们还假设路径损耗指数为2,因为环境几乎是自由空间。注意,在实践中,干扰信号𝑠(𝑖)对于用户是已知的,并且可以从(3)中的接收信号中消除干扰信号𝑠(𝑖)。因此,用户k在时隙i的信噪比(SNR)可以被表示为:
在这里插入图片描述
  对应于用户k,窃听者n \in {1,2,…N}在时隙i的接收信号可以被表示为:
在这里插入图片描述
这里ne(i)n_e(i)表示窃听者的加性噪声,建模为具有方差的独立零均值圆形复杂高斯噪声E{ne(i)2|n_e(i)|^2} = σe2\sigma_e^2。类似于公式(5),在时隙i,从UAV m到窃听者n的信道增益可以表示为:
在这里插入图片描述
窃听者n的信噪比(SNR)也类似于公式(5),如公式(8),
在这里插入图片描述

B. Problem Formulation(问题公式化)
  基于上面的论述,在一个周期内存在N个窃听者(所有窃听者都可以被视为执行联合处理的虚拟多天线窃听者, 我们假设采用最优最大比组合方案。)的用户k的平均安全传输速率表示为:
在这里插入图片描述
这里的ak(i)a_k(i)\in{0,1}表示用户k在时隙i的调度变量,为了保证安全传输,我们的目标是在一个周期内联合优化UAV1 和UAV2的轨迹,例如qm(i)q_m(i),m \in {1,2},与二进制用户调度变量{ak(i)a_k(i)}一样,为了最大化全部地面用户中最小的安全传输速率。这个问题可以被公式化为:
  在这里插入图片描述
其中(10d)和(10e)强加TDMA约束,在每个时隙中,即最多一个用户被安排与UAV 1通信。

III. PROPOSED OPTIMIZATION ALGORITHM(提出的优化算法)
  在本节中,我们首先介绍补偿-CCCP优化框架,以处理高度非凸的约束。然后我们将原始问题转换为更易处理但等效的问题,并开发一种有效的补偿 - 基于CCCP的算法来解决它。
A. Penalty-CCCP optimization framework(补偿的CCCP优化框架)
  在本小节中,我们在一般框架中提出我们提出的补偿CCCP方法。我先考虑一个一般的问题:
  在这里插入图片描述
这里,XRn\in R^n表示一个封闭的凸集合,f(x)是一个标量连续可微的函数,h(x)Rp\in R^p是p维矢量连续可微的函数,g(x)Rq\in R^q是可微的矢量,但是可能是非凸的。当等式约束非常难以处理时,可以使用惩罚方法通过解决惩罚问题来解决问题(11):
在这里插入图片描述
这里,ρ\rho > 0 是一个标量的惩罚参数,规定了违背等式约束的高成本。特别的,当ρ\rho 趋于无穷时,问题(12)与问题(11)有统一的解。
然而,当问题(PρP_{\rho})是一个非凸问题时,要想全局地解决它依然很困难,因此我们在Table 1总结了一个解决问题(11)所提出的惩罚CCCP方法,问题(PρP_{\rho})可以被近似解决在每次迭代使用CCCP方法,得到的解可以简单地表示为Xr+1=CCCP(Pρ,Xr)X^{r+1} = CCCP(P_{\rho},X^r)。注意,惩罚-CCCP技术采用双循环算法的形式,其中内环用于通过块座标下降方法优化非凸的惩罚问题,而外环用于更新惩罚参数。此外,我们注意到惩罚-CCCP框架产生的序列收敛于问题的固定点(11),详细见参考文献【10】。

B. Problem transformation(问题转换)
通过引入辅助变量,如下:
在这里插入图片描述
我们可以把问题(10)转化为下面的 等价形式:
在这里插入图片描述
在这里插入图片描述
然后引入辅助变量{πk(i)\pi_k(i)},在(13f)中乘以左右两边得到:
在这里插入图片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章