地下空间异构无人系统分布式协同搜索路径规划方法
doi: 10.11918/202508079
詹浩 , 周同乐 , 陈谋 , 杨家文
南京航空航天大学自动化学院,南京 211106
基金项目: 智能机器人专项(2023YFB4704400) ; 国家自然科学基金(62203217) ; 江苏省基础研究计划自然科学基金(BK20220885)
Distributed collaborative search path planning method for heterogeneous unmanned systems in underground space
ZHAN Hao , ZHOU Tongle , CHEN Mou , YANG Jiawen
College of Automation Engineering, Nanjing University of Aeronautics & Astronautics, Nanjing 211106 , China
摘要
为解决地下空间中空地异构无人系统协同区域搜索效率低下的问题,本文综合考虑空中与地面障碍物的双重约束,构建了三维栅格地下空间模型。基于此,利用自适应高度的无人系统三维传感器模型,量化分析了探测距离对探测性能的影响,并采用信息素图机制,通过信息素的扩散与挥发动态更新环境信息。在分布式模型预测控制(distributed model predictive control,DMPC)框架下,融合差分变异、三角形游走、高斯扰动和t分布自适应扰动策略,提出了一种融合信息素图机制的改进人工旅鼠算法(improved artificial lemming algorithm-pheromone map,IDALA-PM),以实现多空地异构无人系统的分布式实时路径规划。仿真结果表明,所提出的IDALA-PM算法能够有效完成地下空间搜索任务,相比传统算法,搜索效率提高了54.2%。
Abstract
To address the problem of inefficient collaborative area search by heterogeneous unmanned systems in underground spaces, this paper comprehensively considers both aerial and ground obstacles and constructs a three-dimensional grid model of the underground space. Based on this, using a three-dimensional sensor model for unmanned systems with adaptive height, the impact of detection distance on detection performance is quantitatively analyzed. Furthermore, by using the pheromone map mechanism, the environmental information is dynamically updated through the diffusion and evaporation of pheromones. Within the framework of distributed model predictive control (DMPC), an improved artificial lemming algorithm-pheromone map (IDALA-PM) is proposed, which integrates differential variation, triangular walk, Gaussian perturbation, and t-distribution adaptive perturbation strategies, to achieve distributed real-time path planning for heterogeneous unmanned aerial and ground systems. Simulation results indicate that the proposed IDALA-PM algorithm can effectively accomplish underground space search tasks and improves search efficiency by more than 54.2% compared to traditional algorithms.
随着人工智能技术的快速发展,无人系统凭借其自主决策和智能协同能力,在无人运输[1]、灾区救援[2]以及目标搜索[3]等领域展现出显著的应用价值。近年来,矿井、隧道与地下设施等地下空间的勘探与巡查需求日益增长,但受地下空间复杂地形与通信受限等因素影响,人工作业风险高、效率低,无人系统因而成为更为可行的替代方案[4-5]。单一平台易受环境约束而导致探测效率受限,空地异构无人系统的协同作业遂成为提升搜索任务效能的研究重点[6]。高效的异构无人系统协同搜索路径规划算法[7]是决定无人系统搜索效率的关键因素,其优化水平直接影响任务执行的效果和整体效率。
针对协同区域搜索问题,国内外学者开展了深入研究。马闫等[8]提出了一种基于平行间隔形式的无人机集群协同覆盖搜索策略,有效提升了大尺度海域潜艇搜索的覆盖速度。对于大规模复杂环境下的快速搜索需求,林海等[9]设计了一种分层搜索方法,通过结合全局粗搜索和局部精细化轨迹优化,显著提高了计算效率和搜索性能。针对未知环境下的目标探测问题,Amin等[10]提出了一种基于引力搜索算法的无人机群智能优化方法,以减少算法迭代次数并扩大覆盖区域。而对于通信受限场景中的多无人机协同搜索问题,Senthilnath等[11]设计了一种受类人元认知启发的元认知决策框架,用于实现无人机的分布式随机搜索部署,该框架无需依赖机间通信即可在未知环境中高效探测并确认目标。
然而,在复杂地下空间等特殊场景中,相较于传统多无人系统,空地异构无人系统能够结合不同平台的动力学特性,在非结构化环境中实现更高效的搜索[12]。在城市环境持续监视任务中,吴宇等[13]提出了一种基于分布估计算法和遗传算法的混合算法,有效解决了无人机-无人车异构系统的协同路径规划问题。
在复杂地下空间中,基于预定义轨迹的搜索策略因缺乏适应性,使得当前研究重心正转向实时搜索路径规划方法[14-15]。郑继斌等[16]针对现有研究中无人机间协同不足导致的搜索效率低下问题,提出了一种基于增强遗传算法的分布式随机算法,提升了搜索效率。此类方法在每个决策周期内,无人系统通过环境感知和系统间通信构建优化问题模型,并通过求解该模型生成未来时域的搜索轨迹。模型预测控制(model predictive control,MPC)方法因其滚动优化特性,在该领域获得了广泛应用[17]。但在地下空间搜索任务中,单一或集中式无人系统难以适应复杂多变的环境特征。同时,传统优化方法[18-19]在求解分布式实时路径规划问题时,面对大规模多维动态环境,往往难以兼顾全局最优性与收敛效率。
本文考虑复杂地下空间的特点,综合空中障碍物、地面障碍物和无人系统传感器的3类约束,构建了三维地下空间模型。在此基础上,建立了基于传感器高度自适应的无人系统三维传感器模型,量化分析了无人系统探测距离对探测精度的影响。在无人车系统中,引入了信息素图机制,通过信息素的扩散与挥发实现环境信息的动态更新。基于DMPC框架,构建了空地异构无人系统分布式实时路径规划模型。虽然传统的人工旅鼠优化算法(artificial lemming algorithm,ALA)[20]具有较强的全局搜索能力与较快的收敛速度,但在求解该路径规划模型时存在一定局限性。为此,本文提出了一种融合信息素图机制的改进型分布式人工旅鼠算法(improved distributed artificial lemming algorithm-pheromone map,IDALA-PM),通过融合差分变异、三角形游走、高斯扰动以及t分布自适应扰动策略,提升算法的种群多样性、全局搜索能力、局部搜索精度以及收敛速度。
1 问题描述
本文针对未知地下空间环境中空地异构无人系统的协同搜索路径规划任务,重点解决分布式框架下实时路径规划问题,即在考虑地下空间三维障碍物约束及无人系统运动学模型的基础上,研究异构无人系统的协同路径规划方法。
异构无人系统协同搜索框架如图1所示。首先构建三维地下空间环境模型及空地异构无人系统动力学模型;在DMPC框架下,基于传感器实时感知环境信息并动态更新不确定性地图;以能量消耗和搜索收益为优化目标,采用IDALA-PM算法进行分布式路径规划;通过多无人系统协同决策与实时重规划迭代优化,最终完成未知环境下的搜索任务。
1地下空间异构无人系统协同搜索路径规划框架
Fig.1Underground space heterogeneous unmanned system collaborative search path planning framework
2 路径规划系统模型
2.1 地下空间模型
本文考虑NUGV辆无人车和NUAV架无人机组成的无人系统编队,协同对未知的地下空间区域Ω中的地面目标进行搜索。面向真实地下空间环境,在搜索区域内考虑两类障碍物:一种为位于地面上的障碍物,另一种则是悬挂于地下空间顶部附近的障碍物。这些障碍物不仅限制了无人车和无人机的运动范围,也对其感知能力产生影响。
传统二维栅格地图难以刻画这些因素,存在一定局限。为此,本文构建三维栅格地下空间模型,如图2所示。假设该区域的长和宽分别为DLDW,并将其按Δd进行栅格划分;高度为DH,则按高度Δh进行栅格划分。在图2中,蓝色长方体表示悬挂于地下空间顶部附近的障碍物,灰色长方体表示地面上的障碍物。根据障碍物类型,每个栅格Rxyz)定义为不同的状态,具体如下:
R ( x , y , z ) = 0 , R ( x , y , z )  可达区域  1 , R ( x , y , z )  地面障碍物  2 , R ( x , y , z )  空中障碍物 
(1)
式中(xyz)为栅格在地图中的编号索引。
2区域Ω的栅格地图
Fig.2Grid map of the region Ω
2.2 无人系统运动模型
在复杂的地下空间中,传统的二维无人系统运动模型已难以满足应用需求。为更准确地刻画无人系统的运动特性,本文采用三维无人系统Ui的运动模型,可描述为[16]
φ i ( k + 1 ) = φ i ( k ) + Δ φ i ( k ) x i ( k + 1 ) = x i ( k ) + v x i ( k ) cos φ i ( k + 1 ) y i ( k + 1 ) = y i ( k ) + v y i ( k ) sin φ i ( k + 1 ) z i ( k + 1 ) = z i ( k ) + v z i ( k )
(2)
式中:φik)和φik+1)分别为在k时刻和k+1时刻无人系统Ui的航向角;Δφik)为在k时刻无人系统Ui的航向角的增量;xik)、yik)、zik)和xik+1)、yik+1)、zik+1)分别为在k时刻和k+1时刻无人系统UiXYZ三个方向上的位置;vxikvyikvzik分别为在k时刻无人系统UiXYZ三个方向上的速度(当Ui为无人车时,vzik=0)。
2.3 传感器模型和地图更新机制
无人系统配备激光雷达传感器,用于环境感知中的探测与避障。其中,无人车搭载前视传感器以实现探测和避障,无人机则配备下视传感器完成对地探测,并辅以前视传感器进行避障。系统在对地面目标进行探测时,将传感器的探测区域简化为二维栅格地图。无人系统的传感器对地面探测区域如图3所示。黄色栅格为无人车的探测区域,橙色栅格为无人机的探测区域。在k时刻,无人系统Ui的探测区域Tik)为[16]
Ti(k)=R~(x,y)(k)R~(x,y)(k)-RUi(k)2DR
(3)
式中:R~xykk时刻无人系统Ui在地面上的投影位置,即Rxy,1)。当Ui为无人车时,RUikk时刻无人车传感器投影到地面的中心点位置,无人车的探测半径为DR=hGtan(αG)/sin(βG),其中,hG为无人车探测传感器的高度,αG为无人车探测传感器视角,βG为无人车传感器投影到地面的角度;当Ui为无人机时,RUikk时刻无人机在地面上的投影位置,无人机的探测半径为DR=hAtan(αA),其中,hA为无人机的高度,αA为无人机探测传感器视角。
3无人系统的传感器探测区域
Fig.3Sensor detection area of unmanned systems
本文主要关注距离对传感器探测结果的影响。为此,引入两个探测因子γDγF作为修正参数,分别对无人系统传感器的探测概率PD和虚警概率PF进行建模,其中γD<0,且γF>0。无人系统传感器的探测概率和虚警概率[19]分别为:
PD=PD0uav +γDhA-hmin hmax -hmin ,PD0uav (0,1)PD0ugv +γDdG-dmin dmax -dmin ,PD0ugv (0,1)
(4)
PF=PF0uav+γFhA-hmin hmax -hmin ,PF0uav(0,1)PF0ugv+γFdG-dmin dmax -dmin ,PF0ugv(0,1)
(5)
式中:PDPF∈(0,1),hmaxhmin为无人机的最大飞行高度和最小飞行高度,PD0uav PF0uav 为无人机飞行高度在hmin时,传感器的最大探测概率和最小虚警概率;dmaxdmin分别为无人车在探测区域内某一栅格中心点到传感器的最大与最小距离,dG为无人车探测区域内某一栅格中心点到传感器的实际距离,PD0ugvPF0ugv 分别为无人车传感器的最大探测概率和最小虚警概率。
在无人系统中,无人车和无人机都根据自身探测到的信息和邻居共享的信息来维护对环境的感知,并以指导自身的行动。为了更好地体现无人系统对环境的感知能力,本文引入目标存在概率地图对其认知信息进行描述。其中Pxyik[0,1]表示在时刻k,无人系统Ui判断栅格R~xy处目标存在的概率。当PxyiPminPxyiPmax时,可以判断栅格R~xy是否存在目标,其中PmaxPmin为常数,且0<PminPmax<1。
进一步通过贝叶斯规则[21]来更新传感器观测的概率地图,如下式所示:
P ( x , y ) i ( k ) = P D P ( x , y ) i ( k 1 ) P F 1 P ( x , y ) i ( k 1 ) + P D P ( x , y ) i ( k 1 ) , R ~ ( x , y ) T i ( k ) , O ( x , y ) i ( k ) = 1 1 P D P ( x , y ) i ( k 1 ) 1 P F 1 P ( x , y ) i ( k 1 ) + 1 P D P ( x , y ) i ( k 1 ) , R ~ ( x , y ) T i ( k ) , O ( x , y ) i ( k ) = 0 P ( x , y ) i ( k 1 ) , R ~ ( x , y ) T i ( k )
(6)
式中:Oxyik{0,1}Oxyik=1表示在k时刻,无人系统在栅格R~xy中探测到目标;Oxyik=0表示在k时刻,无人系统在栅格R~xy中未探测到目标。
为了降低计算的复杂度,采用非线性变换[22]
P^(x,y)i(k)ln1-P(x,y)i(k)P(x,y)i(k)
(7)
将式(7)转换为线性更新,如式(8)所示:
P ^ ( x , y ) i ( k ) = P ^ ( x , y ) i ( k 1 ) + ln P F P D , R ~ ( x , y ) T i ( k ) , O ( x , y ) i ( k ) = 1 P ^ ( x , y ) i ( k 1 ) + ln 1 P F 1 P D , R ~ ( x , y ) T i ( k ) , O ( x , y ) i ( k ) = 0 P ^ ( x , y ) i ( k 1 ) , R ~ ( x , y ) T i ( k )
(8)
每次观测后,无人系统将自身的观测结果与邻近平台共享的信息进行融合,从而更新其地图信息。为确保信息的一致性,引入式(9)所示的一致性协议[23]
Q(x,y)i(k)=j=1NU wi,j,kP^(x,y)i(k)
(9)
式中:Qxyik为时刻k信息融合后无人系统Ui对栅格R~xy的认知信息,NU=NUGV+NUAVwijk为无人系统UiUjk时刻进行信息融合时所分配的权重值,其定义为
w i , j , k = 1 t N i ( k ) ( t i ) w i , t , k , U j N i ( k ) ( j = i ) 1 1 + Q ~ ( k ) , U j N i ( k ) ( j i ) 0 , U j N i ( k )
(10)
式中:Q~k=maxNikNjkijNik)和Njk)分别为时刻k无人系统UiUj的邻居集合。
初始时刻,无人系统对整个区域的情况完全未知,因此假设每个栅格中可能存在目标的概率均为0.5。在初始化完成后,无人系统开始执行协同搜索任务,并基于DMPC框架生成协同搜索策略。
3 基于IDALA-PM的分布式协同搜索路径规划
为实现空地异构无人系统在复杂地下空间的高效协同搜索,本文提出了一种结合IDALA与信息素的分布式路径规划方法,其整体流程如图4所示。算法首先对任务环境进行建模,并完成相关参数的初始化。随后,各无人系统通过传感器感知环境信息,并与邻居共享局部地图和状态数据,从而实现全局不确定性地图的动态更新。在此基础上,每个无人系统基于DMPC框架进行滚动预测,生成各约束下的可行轨迹。
在路径更新过程中,引入IDALA的能量因子E作为探索与开发的调控机制。当E>1时,系统偏向探索,通过随机因子选择不同的迁徙策略以实现全局搜索;当E≤1时,系统偏向开发,利用局部信息素与历史最优解进行精细化搜索。通过这种方式,算法能够在搜索过程中实现全局探索与局部开发的动态平衡。最终为每个无人系统确定当前时刻的最优候选路径。
4空地异构无人系统协同搜索整体流程图
Fig.4Overall flow chart of air-ground heterogeneous unmanned system collaborative search
3.1 空地异构无人系统分布式实时路径规划模型
在执行协同区域搜索任务时,无人系统通过将自身的探测结果与邻近系统传输的信息进行融合,从而形成对环境的综合感知。基于感知结果,系统实时做出搜索决策,并采取相应行动以获取新的环境信息。该过程将不断迭代,直至任务完成。3架无人机和两辆无人车组成的无人系统协同搜索示意图,如图5所示。
5无人系统协同搜索示意图
Fig.5Schematic diagram of unmanned system collaborative search
在DMPC框架下,系统中的各子系统独立求解各自的优化问题,并通过信息交换实现全局最优控制策略。基于DMPC的规划过程[22]描述如下:
在时间k时,基于无人系统Ui当前的状态mik)和邻居集合的信息Nik定义未来H个时间步的输入,
U~i (k) =ui (k) , ui (k+1) , , ui (k+H-1) ,
ui(k+j)γiui(k+j),Ni(k+j)
(11)
式中:γ(·)为由系统自身状态与邻居信息共同决定的可行输入集,uik)=(xik),yik),zik))。
预测出无人系统Uik)在未来H个时间步的状态Mik)为
Mi(k)=mi(k+1),mi(k+2),,mi(k+H)
(12)
式中:mik+j+1=fimik+juik+jNik+ j)),fi为状态转移函数。
在决策阶段,U~ik)通过求解局部路径规划问题获得最优输入序列,
U~i*(k)=ui*(k),ui*(k+1),,ui*(k+H-1)
(13)
随后,执行最优序列的第一步ui*k),无人系统前往对应的区域探测并更新环境信息。在下一时间步k+1,重复上述过程。
无人系统搜索的目标,是在降低能耗的同时,增强对区域态势的感知能力。鉴于此,以平台能耗和搜索收益构建目标函数。
1)平台能耗
由于电池能耗的限制,降低能耗成本是空地无人系统执行任务的首要目标之一。在优化过程中,主要考虑了无人系统的行进成本。平台能耗定义如下:
UE(k)=i=1NU k'=kk+H-1 μilik'+1-μilik'2
(14)
式中:li为无人系统Ui可选的路径;μilik为无人系统Uik时刻的位置。
2)搜索收益
环境搜索收益表示为无人系统预测覆盖区域内栅格的不确定性。为了提高搜索效率,无人系统应尽可能搜索具有高不确定性的区域。当Pxyik接近0.5时,很难判断栅格R~xy中是否存在目标。因此定义k时刻无人系统Ui在栅格R~xy的不确定性ηxyik,如式(15)所示:
η(x,y)i(k)=e-KvQi(x,y)(k)
(15)
其中Kv∈(0,1)为正增益参数。
当无人机在某一时刻k发现某一区域存在靠近地下空间顶部的障碍物时,由于障碍物的遮挡,导致无人机无法有效观测该区域。此时,需要通过无人车对该区域进行进一步的搜索,引入动态数字信息素来确保全面覆盖和信息获取。
每个栅格初始的信息素为0,某一时刻k,无人系统Uik)探测到靠近地下空间顶部的障碍物Ogxyi时,周围栅格的信息素增量Δφx′y表达式为
Δϕx',y'=Δϕ0exp-dx',y'2/2δ2
(16)
式中:Δφ0为一个常数;δ为标准差;dx′y)为当前单元格到障碍物Obxyi的欧几里得距离。
在时刻k,对于栅格R~xy,信息素量sxyik定义为:
s ( x , y ) i ( k ) = 1 E s 1 G s s ( x , y ) i ( k 1 ) + q ( x , y ) i ( k ) d s + g ( x , y ) i ( k ) ,  Flag  = 0 1 E s 1 G s s ( x , y ) i ( k 1 ) + q ( x , y ) i ( k ) d s + Δ ϕ ( x , y ) + g ( x , y ) i ( k ) ,  Flag  = 1
(17)
式中:Es∈(0,1)、Gs∈(0,1)分别为挥发系数和传播系数;qxyik)∈{0,1}为信息素释放开关;ds为栅格R~xy在一个时间步自发释放的信息素量;Flag=1表示无人系统探测到新的空中障碍物Obxyigxyk)为在[kk+1]时间段内从周围栅格传播到R~xy 的信息素量,其定义为
g(x,y)(k)=R-(x,y)'N(x,y)' GsZsN(x,y)'
(18)
式中:Zs=sxy'ik-1+qxy'ikdsNxy'为栅格R~xy'的周围栅格集合;Nxy'R~xy'周围栅格的个数。
结合上述内容,环境搜索收益Uηk)表达式为
Uη(k)=i=1NU R~(x,y)S~i(k) η(x,y)i(k)N~(x,y)(k)
(19)
式中:S~ik为无人系统Ui预测覆盖区域内的栅格;N~xyk为在 {k+1,k+2,···,k+H}内,覆盖R~xy的无人系统数量。
综合考虑上述两种优化指标,无人系统协同搜索的最优路径序列优化函数为
U*(k)=argminl(k) γ1UE(k)+γ2Uη(k)
(20)
式中γ1γ2为权重系数,且γ1+γ2=1。
为了避免无人系统在任务执行过程中发生损毁或通信中断,需要考虑多无人系统探测过程中无人系统的3项约束。
1)防碰撞约束
在空地协同任务执行中,为防止同域平台之间发生碰撞,需要对多无人机和多无人车之间的距离施加一定的限制。对于无人机,其安全约束定义为
xi(k)-xj(k)2+yi(k)-yj(k)2+zi(k)-zj(k)2DUAVmin
(21)
式中DUAVmin为无人机之间的最小安全距离。其中,i=1,2,···,NUAV-1;j=i+1,i+2,···,NUAV
对于无人车,其安全约束定义为
xi(k)-xj(k)2+yi(k)-yj(k)2DUGVmin
(22)
式中DUGVmin为无人车之间的最小安全距离。其中,i=1,2,···,NUGV-1;j=i+1,i+2,···,NUGV
2)不可达区域约束
在地下空间中,存在许多不可达的障碍物区域。本文中,无人机设定的不可达区域为靠近地下空间顶部的障碍物,无人车设定的不可达区域为地面上的障碍物。因此,不可达区域的定义为
xi(k)-xjOg2+yi(k)-yjOg2+zi(k)-zjOg2DOgmin
(23)
式中:NOg为探测到的地面障碍物数量;DOgmin为无人机离障碍物的安全距离。其中,i=1,2,···,NUAVj=i+1,i+2,···,NOg
xi(k)-xjOb2+yi(k)-yjOb2DObmin
(24)
式中:NOb为探测到的空中障碍物数量;DObmin为无人车离障碍物的安全距离。其中,i=1,2,···,NUGVj=i+1,i+2,···,NOb
3)通讯连通约束
为了实现无人系统之间的信息交互,维持通信网络的连通性至关重要。在k时刻,无人系统Ui和其邻居Uj之间的距离不能超过最大通讯距离,其表达式为
μilm(k)-μjln(k)2RT
(25)
式中:μilmk为无人系统Ui选择路径lmk时刻的位置;RT为最大通讯距离。
3.2 基于IDALA的空地异构无人系统实时路径规划
针对空地异构无人系统实时路径规划问题,本文对DALA算法中的3种策略进行了优化,从而提升了种群的多样性、全局搜索能力、局部搜索精度以及收敛速度。以下是对DALA算法改进后的4种策略。
策略1 差分变异策略的长距离探索策略[24]。在这一过程中,各无人系统基于当前路径及种群中随机个体的路径信息,在搜索空间内进行探索。为进一步增强全局搜索能力,引入差分变异机制,通过路径信息的差分组合生成新的候选解,其表达式为:
Li (t+1) =F×BM×R×Lbest (t) -Li (t) +
(1-R) ×Li (t) -La (t) +Lbest (t) +
κLb(t)-Lc(t)
(26)
式中:LitLit+1表示第i个无人系统分别在第t次和第t+1次迭代时选择的路径,Lbest t表示当前的最优路径;κ为差分变异的缩放因子;LatLbtLct表示种群中随机选择的路径,且abc为介于1和N之间的整数索引;BM为描述布朗运动的向量,其步长由均值为0、方差为1的正态分布概率密度函数决定;R为大小为1×H的随机向量,其元素均服从区间[-1,1]上的均匀分布;F为一个用于改变搜索方向的标志,其定义为
F=-1,grand 0.51,grand >0.5
(27)
式中grand为区间(0,1)内的随机值。
为增强全局探索能力并维持种群多样性,式(26)引入差分变异项,利用个体间路径差构造差分向量,并由缩放因子调节步长,从而扩大群体在解空间中的可达范围。该机制既可提升群体的多样性,又可促使个体沿具有结构差异的信息方向实现跨域跃迁,降低陷入局部极值的概率,避免早熟收敛。
策略2 高斯扰动和t分布自适应扰动的短距离探索策略[25]。在此策略中,各无人系统基于当前的路径和种群中随机个体的路径信息,随机选择新的路径。为了增强探索能力,引入了高斯扰动和分布自适应扰动,其表达式为
Li(t+1)=Li(t)+η(t)×tv(t)(0,1)+F×J×Lbest (t)-Ld(t)+N0,σ2
(28)
式中:Ldt表示种群中随机选择的个体;N(0,σ2)为高斯游走扰动项,J=grand×(1+sin(t/2))为与迭代次数t相关的随机数;ηt)为扰动步长的控制因子;tvt(0,1)表示自由度为vt)的t分布;vt)=v0+(vmax-v0t/Tmax,其中Tmax为最大迭代次数,v0为初始速度,vmax为最大速度。
式(28)采用自适应分布与高斯扰动的联合策略,实现“先粗后细”的动态扰动调度。算法初期施加大方差、重尾扰动,以增强远域搜索与跳跃性,降低被局部最优吸附的风险;随迭代推进,自由度单调增加、扰动方差逐步收敛至较小水平,使扰动分布渐近高斯,从而提升后期的收敛精度与稳定性。
策略3 三角形游走策略。为提高路径空间探索的多样性,本策略引入一种基于三角形游走的自适应机制,其具体表达式为:
Li(t+1)=F× spiral × grand ×Li(t)+Lbest (t)+λ1Li(t-1)-Li(t-2)+1-λ1Li(t-2)-Li(t-3)
(29)
式中:spiral表示随机搜索的螺旋形状,spiral=radius×(sin(2×π×grand)+cos(2×π×grand));其中,radius表示探索范围的半径,即当前路径与最优解之间的欧几里得距离。
式(29)引入三角形游走策略,以“当前解-历史最优-邻域引导解”三点合成的方向进行阻尼型更新。该方向在期望意义上对震荡具有抑制作用,可有效缓解因大步长往返而引起的收敛迟滞,保持沿优良方向的单调推进。结合递减的加速/阻尼系数设置,更新映射逐步具备收缩性,从而实现更快且更平稳的收敛。
策略4 躲避天敌策略。沿用传统ALA算法[20]的躲避天敌策略,当无人系统发现最优路径解时,会在其附近路径区域继续搜索,以寻求更优解,其表达式为
Li(t+1)=Lbest (t)+F×I×Levy(H)×Lbest (t)-Li(t)
(30)
式中:I为无人系统的搜索系数,随着迭代次数的增加而逐渐减小,I=2×(1-t/Tmax);Levy(x)=0.01×ζ×ξ/|v|1v为莱维飞行函数,其中ξ定义为
ξ=Γ(1+v)×sinπv2/Γ1+v2×v×2v-121β
(31)
式中:ζξ是区间[0,1]内的随机值,υ为常数。
在DALA中,4种搜索策略与无人系统的能量状态密切相关。为保持探索与开发之间的动态平衡,本文设计了一个随迭代次数单调递减的能量因子。能量因子Et)的计算公式为
E(t)=4×arctan1-tTmax×ln1grand
(32)
式中Et)为平衡探索与开发的能量因子。各无人系统通过传感器感知环境信息,并接收邻近无人系统共享的信息以更新环境地图。在DMPC框架下,各无人系统预测其轨迹,并利用IDALA-PM算法求解最优路径。在算法初期,当arctan(1-t/Tmax)×ln(1/grand)>0.25时,Et)>1,算法倾向于探索,并通过随机因子选择不同的搜索策略;在算法后期,当arctan(1-t/Tmax)×ln(1/grand)≤0.25时,Et)≤1,算法更倾向于开发,并通过随机因子选择不同的开发策略。当满足最大迭代条件时,算法停止迭代,得到未来H个时刻的最优路径。各无人系统依次移动至最优路径上的第一个位置,并通过传感器感知环境信息以及接收邻居系统共享的信息以更新认知地图。上述过程不断循环,直至无人系统到达最大时间步为止。
4 结果与分析
为体现本文所提出的算法的有效性,构建如图6所示三维地下空间区域Ω,经栅格化处理,共有40×40×12个栅格,每个栅格的长、宽、高分别为2、2和0.25 m,空中和地面障碍物随机分布。
6三维地下空间区域示意图
Fig.6Schematic diagram of the3D underground space area
设定无人车和无人机探测传感器视角αG=αA=60°。无人车探测传感器投影到地面的角度βG=30°。无人车探测传感器的高度hG=0.4 m。两个探测因子分别为γD=0.4和γF=-0.4。无人机的最大高度和最小高度分别为hmax=3 m和hmin=1 m。无人机传感器的最大探测概率和最小虚警概率分别为PD0uav=0.9和PD0uav=0.15,无人车传感器的最大探测概率和最小虚警概率分别为 PD0ugv=0.95和PD0ugv=0.15。此外,数字信息素和IDALA-PM算法的参数见表1
当无人系统在搜索过程中发现新的靠近地下空间顶部的障碍物区域时,将重新构建信息素地图,如图7所示。
图8为引入信息素机制的IDALA算法(IDALA-PM)在2架无人机和1辆无人车协同搜索任务中的轨迹,仿真时长设置为200个时间步。
1算法参数
Tab.1Simulation parameters
7信息素地图
Fig.7Pheromone map
8基于IDALA-PM算法的多无人系统轨迹
Fig.8Trajectories of multi-unmanned systems based on IDALA-PM algorithm
图8结果可以看出,采用本文算法的搜索轨迹具有较优的空间覆盖性,无人车对蓝色区域(空间障碍物下方)的搜索效率较高。
为了评估算法性能,图9给出了5种算法的全局不确定性随时间变化的对比曲线。表2列出了5种算法在不同时间下的全局不确定性。
图9可见,在相同环境与参数设置下,IDALA-PM的全局不确定性曲线整体最低:早期阶段下降更快,中期平台期更短且波动更小,后期稳态值最低,综合体现出更高的搜索覆盖效率与更强的全局寻优能力。该结果与其“差分驱动的全局探索-自适应扰动的阶段化搜索-三角游走的稳态抑振-优先级地图引导”的协同机制一致。进一步结合表2所列的5个代表性采样时刻,IDALA-PM在各时刻的全局不确定性均低于其余4种算法;尤其在第170步,该指标降至0.0110,较DPSO(0.060 6)、DGA(0.044 9)、DALA(0.038 8)和IDALA(0.024 0)分别相对降低81.8%、75.5%、71.6%和54.2%。
9多种算法的全局不确定性对比曲线
Fig.9Global uncertainty comparison curves of various algorithms
为验证算法的扩展性,本文将搜索区域Ω扩展至60×60×12的三维栅格环境,分别开展以下两组仿真实验。
1)第1组实验采用两架无人机与一辆无人车的异构协同配置,其搜索轨迹如图10所示。图11给出了在400步内,全局不确定性指标随时间的变化曲线。
2在不同时刻不同算法的全局不确定性表
Tab.2Global uncertainty table for different algorithms at different times
10第1组多无人系统轨迹图
Fig.10The first group of multi-unmanned system trajectory diagrams
11第1组全局不确定性曲线
Fig.11The first group of global uncertainty curves
由第1组实验结果可以看出,在不改变无人机和无人车的数量情况下,将搜索空间扩大后,在300步时,全局不确定性下降到0.03。
2)第2组实验增加至3架无人机与两辆无人车的多无人系统配置,对应轨迹分布如图12所示。图13给出了在400步内,全局不确定性指标随时间步的变化曲线。
由第2组实验结果可以看出,在增加无人机和无人车的数量和扩大搜索空间后,在200步时,全局不确定性下降至0.04。
12第2组多无人系统轨迹图
Fig.12The second group of multi-unmanned system trajectory diagrams
13第2组全局不确定性曲线
Fig.13The second group of global uncertainty curves
两组实验表明,无论是扩大搜索空间规模,还是增加无人系统数量,IDALA-PM算法均展现出良好的适应性。特别是在系统规模扩展的情况下,算法仍能够保持较高的搜索效率,验证了其优异的可扩展性能。
5 结论
本文针对复杂三维地下空间异构无人系统协同搜索问题,建立了高度自适应的三维传感器模型,有效提升了环境感知能力;在无人车系统中引入信息素机制,优化了空地协同搜索策略,从而显著提高了搜索效率;在此基础上,基于DMPC框架,融合多策略优化方法,提出了IDALA-PM算法以提升协同搜索的整体性能。仿真结果表明,所提出的IDALA-PM算法能够有效提高异构无人系统的协同搜索效率;同时,扩展性实验验证了该算法在不同规模的无人系统配置下具有良好的可扩展性,能够适应复杂三维地下空间的协同搜索任务。
1地下空间异构无人系统协同搜索路径规划框架
Fig.1Underground space heterogeneous unmanned system collaborative search path planning framework
2区域Ω的栅格地图
Fig.2Grid map of the region Ω
3无人系统的传感器探测区域
Fig.3Sensor detection area of unmanned systems
4空地异构无人系统协同搜索整体流程图
Fig.4Overall flow chart of air-ground heterogeneous unmanned system collaborative search
5无人系统协同搜索示意图
Fig.5Schematic diagram of unmanned system collaborative search
6三维地下空间区域示意图
Fig.6Schematic diagram of the3D underground space area
7信息素地图
Fig.7Pheromone map
8基于IDALA-PM算法的多无人系统轨迹
Fig.8Trajectories of multi-unmanned systems based on IDALA-PM algorithm
9多种算法的全局不确定性对比曲线
Fig.9Global uncertainty comparison curves of various algorithms
10第1组多无人系统轨迹图
Fig.10The first group of multi-unmanned system trajectory diagrams
11第1组全局不确定性曲线
Fig.11The first group of global uncertainty curves
12第2组多无人系统轨迹图
Fig.12The second group of multi-unmanned system trajectory diagrams
13第2组全局不确定性曲线
Fig.13The second group of global uncertainty curves
1算法参数
Tab.1Simulation parameters
2在不同时刻不同算法的全局不确定性表
Tab.2Global uncertainty table for different algorithms at different times
PENG Chaoda, WU Zexiong, HUANG Xumin,et al. Joint energy and completion time difference minimization for UAV-enabled intelligent transportation systems: A constrained multi-objective optimization approach[J]. IEEE Transactions on Intelligent Transportation Systems,2024,25(10):14040. DOI:10.1109/TITS.2024.3395993
RIBEIRO R G, COTA L P, EUZEBIO T A,et al. Unmanned-aerial-vehicle routing problem with mobile charging stations for assisting search and rescue missions in post disaster scenarios[J]. IEEE Transactions on Systems, Man,and Cybernetics: Systems,2022,52(11):6682. DOI:10.1109/TSMC.2021.3088776
MEMON A R, IQBAL M, ALMAKHLES D J. DisView: A semantic visual IoT mixed data feature extractor for enhanced loop closure detection for UGVs during rescue operations[J]. IEEE Internet of Things Journal,2024,11(22):36214. DOI:10.1109/JIOT.2024.3471799
WANG Xiaofen, WANG Peng, ZHANG Xiaotong,et al. Target electromagnetic detection method in underground environment: A review[J]. IEEE Sensors Journal,2022,22(14):13835. DOI:10.1109/JSEN.2022.3175502
ZHANG Xizheng, CAO Xu, ZHANG Hui,et al. An intelligent obstacle detection for autonomous mining transportation with electric locomotive via cellular vehicle-to-everything and vehicular edge computing[J]. IEEE Transactions on Intelligent Transportation Systems,2024,25(3):3177. DOI:10.1109/TITS.2023.3324145
LI Jianqiang, DENG Genqiang, LUO Chengwen,et al. A hybrid path planning method in unmanned air/ground vehicle(UAV/UGV)cooperative systems[J]. IEEE Transactions on Vehicular Technology,2016,65(12):9585. DOI:10.1109/TVT.2016.2623666
于振中, 闫继宏, 赵杰, 等. 改进人工势场法的移动机器人路径规划[J]. 哈尔滨工业大学学报,2011,43(1):50. YU Zhenzhong, YAN Jihong, ZHAO Jie,et al. Mobile robot path planning based on improved artificial potential field method[J].2011,43(1):50. DOI:0367-6234(2011)01-0050-06
MA Yan, LUO Rong, MENG Xiangyao,et al. Path planning for searching submarine with cooperative coverage of fixed-wing UAVs cluster in complex boundary sea area[J]. IEEE Sensors Journal,2023,23(24):30070. DOI:10.1109/JSEN.2023.3271352
LIN Hai, YANG Xinsong, WEN Guanghui,et al. Fast UAV object-searching in large-scale and complex environments[J]. IEEE Transactions on Cybernetics,2025,55(6):2993. DOI:10.1109/TCYB.2025.3556744
AIAMIN A, AZAM Irfan, MASUDUZZAMAN M,et al. Gravitational search algorithm swarm-based UAV reconnaissance for multiple targets detection in unknown environment[J]. IEEE Access,2025,13:36897. DOI:10.1109/ACCESS.2025.3545733
SENTHILNATH J, HARIKUMAR K, SUNDARAM S. Metacognitive decision-making framework for multi-UAV target search without communication[J]. IEEE Transactions on Systems, Man,and Cybernetics: Systems,2024,54(5):3195. DOI:10.1109/TSMC.2024.3358060
LI Jianqiang, SUN Tao, HUANG Xiaopeng,et al. A memetic path planning algorithm for unmanned air/ground vehicle cooperative detection systems[J]. IEEE Transactions on Automation Science and Engineering,2022,19(4):2724. DOI:10.1109/TASE.2021.3061870
WU Yu, WU Shaobo, HU Xinting. Cooperative path planning of UAVs & UGVs for a persistent surveillance task in urban environments[J]. IEEE Internet of Things Journal,2021,8(6):4906. DOI:10.1109/JIOT.2020.3030240
LI Yuxiang, CHEN Kun, WANG Yifei,et al. Real-time multilevel terrain-aware path planning for ground mobile robots in large-scale rough terrains[J]. IEEE Transactions on Robotics,2025,41:4159. DOI:10.1109/TRO.2025.3577015
SCHMID L, PANTIC M, KHANNA R,et al. An efficient sampling-based method for online informative path planning in unknown environments[J]. IEEE Robotics and Automation Letters,2020,5(2):1500. DOI:10.1109/LRA.2020.2969191
ZHENG Jibin, DING Minghui, SUN Lu,et al. Distributed stochastic algorithm based on enhanced genetic algorithm for path planning of multi-UAV cooperative area search[J]. IEEE Transactions on Intelligent Transportation Systems,2023,24(8):8290. DOI:10.1109/TITS.2023.3258482
DERAJIC B, BOUZIDI M-K, BERNHARD S,et al. Learning maximal safe sets using hypernetworks for MPC-based local trajectory planning in unknown environments[J]. IEEE Robotics and Automation Letters,2025,10(9):8842. DOI:10.1109/LRA.2025.3589151
WANG Ning, LIANG Xiaolong, LI Zhe,et al. PSE-D model-based cooperative path planning for UAV and USV systems in antisubmarine search missions[J]. IEEE Transactions on Aerospace and Electronic Systems,2024,60(5):6224. DOI:10.1109/TAES.2024.3400923
DUAN Haibin, ZHAO Jianxia, DENG Yimin,et al. Dynamic discrete pigeon-inspired optimization for multi-UAV cooperative search-attack mission planning[J]. IEEE Transactions on Aerospace and Electronic Systems,2021,57(1):706. DOI:10.1109/TAES.2020.3029624
XIAO Yaning, CUI Hao, ABU KHURMA Ruba,et al. Artificial lemming algorithm: A novel bionic meta-heuristic technique for solving real-world engineering optimization problems[J]. The Artificial Intelligence Review,2025,58(3):84. DOI:10.1007/s10462-024-11023-7
XU Shufang, ZHOU Ziyun, LI Jianni,et al. Communication-constrained UAVs′ coverage search method in uncertain scenarios[J]. IEEE Sensors Journal,2024,24(10):17092. DOI:10.1109/JSEN.2024.3384261
HU Jinwen, XIE Lihua, LUM K Y,et al. Multiagent information fusion and cooperative control in target search[J]. IEEE Transactions on Control Systems Technology,2013,21(4):1223. DOI:10.1109/TCST.2012.2198650
XIAO L, BOYD S, LALL S. A scheme for robust distributed sensor fusion based on average consensus[C]//Fourth International Symposium on Information Processing in Sensor Networks. Boise, ID, USA: IEEE,2005:63. DOI:10.1109/IPSN.2005.1440896
李尧, 黄大庆, 殷奇缘, 等. 基于改进冠豪猪算法山地环境无人机航迹规划[J/OL].[2025-11-24].http://link.cnki.net/urlid/11.2175. TN.20250725.1614.014. LI Yao, HUANG Daqing, YIN Qiyuan,et al. UAV trajectory planning in mountainous environment based on improved crowned porcupine algorithm[J/OL].[2025-11-24].http://link.cnki.net/urlid/11.2175. TN.20250725.1614.014
韩守飞, 李席广, 拱长青. 基于模拟退火与高斯扰动的烟花优化算法[J]. 计算机科学,2017,44(5):257. HAN Shoufei, Ll Xiguang, GONG Changqing. Fireworks optimization algorithm based on simulated annealing and gaussian perturbations[J]. Computer Science,2017,44(5):257. DOI:10.11896/j.issn.1002-137X.2017.05.046