摘要
为解决传统Radau伪谱法在轨迹优化求解效率与轨迹解可行性之间存在的矛盾,本文提出一种基于自适应阈值的分段升阶伪谱法,用于提升非线性优化问题的求解精度,加快收敛速度。该方法通过动态比较迭代过程中的误差矩阵极大值与标准时间步长,在误差超过自适应阈值的区间设置新分段点,并在误差小于偏差阈值的分段内增加配点数,这种策略对轨迹解的平滑/非平滑区间进行针对性优化,从而以较少的分段数和配点数达成轨迹规划目标。相比于传统Radau伪谱法,自适应分段升阶方法能够以较少迭代轮次收敛到期望结果,实现数值精度与求解效率的有效平衡。为验证算法性能,本研究基于自由飞行空间机器人非合作目标捕获场景进行了对比仿真实验。实验结果表明,本文提出的自适应分段升阶方法,在求解耗时和轨迹解的末端精度方面均优于对比方法,显示出更好的综合表现。
Abstract
To address the trade-off between solution efficiency and trajectory feasibility in traditional Radau Pseudo-spectral Method (RPM) for trajectory optimization, this paper proposes an adaptive threshold-based segmented polynomial-degree elevation pseudo-spectral method (AT-RPM). This approach aims to enhance nonlinear optimization accuracy and accelerate convergence. By dynamically comparing the maximum value of the error matrix with a standard time step during iterative process, the method establishes new segment points in intervals where the error exceeds an adaptive threshold. Furthermore, the number of collocation points within segments is also increased when the error falls below a deviation threshold. This strategy selectively optimizes both smooth and non-smooth regions of the trajectory solution, thereby enabling achievement of trajectory planning goals with fewer segments and collocation points. Compared with the traditional Radau Pseudo-spectral Method, AT-RPM can converge to the desired result in fewer iteration rounds, effectively balancing numerical accuracy and solution efficiency. To validate performance, comparative simulation experiments have been conducted in a non-cooperative target capture scenario involving a free-flying space robot. The results indicate that the proposed method outperforms the existing approaches in both computation time and terminal accuracy, demonstrating superior overall performance.
随着太空探索的规模扩大、复杂性提升,传统依赖人工操作的执行方式已难以满足高频次、高精度的在轨服务需求,空间机器人作为一种替代方案而日益受到重视[1]。自由飞行空间机器人(free-flying space robot,FFSR)可通过推进器和动量轮对基座、机械臂的位姿进行同步控制,如图1所示。FFSR具备高度灵活性,可替代宇航员完成危险性工作,在目标捕获、碎片清理等任务中具有广阔应用前景[2-3]。
然而,保障FFSR正常工作面临诸多挑战,其中轨迹优化策略直接影响机器人太空操作的稳定性、快速性和精确度[4-5]。本质上,空间机器人轨迹优化是有约束条件下的指标最优问题,机器人需要在视角受限、规避障碍等前提下完成任务[6]。解决此类问题有直接法和间接法两种思路[7]。间接法利用极小值原理将问题转化为两点边值问题,通过求解微分代数方程获得最优轨迹。采用间接法有助于深入理解系统行为,但其数学推导过程常十分复杂,求解速度也非常缓慢,实际应用中更多采用直接法求解。直接法采用配点思想对问题作离散化并求数值解,通常求解速度快但数值精度低。国内外大量研究人员致力于改进直接法求解轨迹优化问题[8-9]。
伪谱法是直接法中的一种经典思路,其采用正交多项式作为基函数,利用积分在离散点上实现微分或代数方程近似,将最优控制问题转化为非线性规划(non-linear programing,NLP)问题进行求解[10],具有较高的收敛阶数,利用少量配点即可逼近最优解。2011年Grag等[11]最早将Radau伪谱法应用于求解有限时间和无限时间下的一般轨迹优化问题。2012年Li等[12]利用伪谱法完成了漂浮基座空间机器人的轨迹优化求解,轨迹解同时兼顾了时间消耗和能量积分。2023年Zhang等[13]提出依据误差曲率密度积分计算合理分段位置,在FFSR轨迹优化任务中取得了良好表现,其以更少配点取得了几乎相同的数值精度。尽管已有一些研究工作对伪谱法作出改进[14-15],但其在推广应用中始终面临矛盾:若全程采用高阶多项式,计算量将显著增加并引发数值稳定性问题; 若仅采用低阶多项式,则难以保证解的精度。增加拟合多项式阶数可提高数值精度,但将显著增加求解时间; 增加分段数能够加快收敛速度,但常导致精度下降较多。
为了解决上述矛盾,在分析现有伪谱法改进思路的基础上,本文提出了一种计算阈值自适应更新离散网格迭代的改进Radau伪谱法,该方法通过优化分段区间配置和段内配点数,兼顾求解精度提升、计算效率提高。该方法将在FFSR目标捕获轨迹优化问题中通过仿真实验进行验证。
1 FFSR系统建模
FFSR工作于太空微重力环境,其动力学应符合如下假设[13]:
1)FFSR是由刚性基座和刚性多连杆组成的多刚体系统,且基座和连杆质量均匀分布;
2)考虑均由旋转关节组成的FFSR构型;
3)接近-绕飞阶段运动过程中FFSR与目标之间相互作用力几乎无变化,且不相互影响运动;
4)忽略地心引力对FFSR系统的影响。
基于上述预设,可在惯性系{I}下描述FFSR基座、机械臂的位置与姿态。FFSR系统示意图如图2所示,其整体由基座与多连杆串联组成,{b}为基座系,{i}为连杆i系,Ji为关节i,惯性系原点指向关节i和连杆i质心的矢量分别为pi,ri,惯性系原点指向基座和末端的矢量分别为rb,re,基座指向关节J1的矢量为b0,关节Ji指向连杆i质心Ci的矢量为ai,连杆i质心Ci指向关节Ji+1的矢量为bi。
图2自由飞行空间机器人结构示意图
Fig.2Schematic diagram of the free-flying space robot
根据图2可推导得到{I}系下连杆i质心的位置矢量和末端e的位置矢量满足:
(1)
(2)
对位置矢量求时间导数可得到连杆 i 质心速和末端 e 速度:
(3)
(4)
式中: 为{I}系下基座角速度,I zj 为关节 Ji 轴线方向的单位矢量, 为关节 Ji 角速度。连杆 i 质心角速度Iwi、末端 e 的角速度Iwe 可通过下式求得:
(5)
(6)
将式(3)~式(6)整理为矩阵方程:
(7)
式中: 为向量的叉乘操作数,即Irib与任意向量 a 作叉乘运算,可以等效为作点乘运算关节量导数矩阵满足:
(8)
定义 FFSR 系统拉格朗日函数 L 为
(9)
式中:W,P分别为系统动能和势能。考虑假设4),势能近似为零,总能量可近似为动能。满足如下表达式:
(10)
式中:Wv,Ww分别描述系统的平动动能和转动动能,m为质量,I为转动惯量,下标i=0代表基座的质量、速度、角速度。
(11)
故可将FFSR系统的拉格朗日函数L整理为
(12)
式中:为广义坐标,包含基座位置、基座转角和关节转角信息。对其求导可得到运动信息D为惯性矩阵,具体形式为:
(13)
其中,矩阵各项为
(14)
惯性矩阵D是一个正定矩阵,描述了机器人的质量分布和几何特性。将式(12)代入拉格朗日方程可得:
(15)
式中:控制输入分别为施加到基座上的力、力矩效果,以及施加在关节上的力矩效果,为科里奥利和离心力矩阵,其形式不唯一,对应科氏力项,满足如下等式:
(16)
2 轨迹规划任务分析
2.1 最优控制问题一般数学表述
FFSR的轨迹规划问题实际是一个非线性连续时变系统的最优控制问题。Bolza型最优控制问题的性能指标一般形式为[16]
(17)
式中:Φ(·)为边值性能指标映射,L(·)为积分性能指标映射,两者共同评估解的表现。
系统迭代更新应满足状态方程:
(18)
运动中始终满足等式、不等式约束:
(19)
系统的边界条件为:
(20)
联立式(17)~(20)可得到轨迹规划问题的一般数学描述。具体到目标捕获任务,约束包括运动过程中的视角跟随、动态避障、状态方程约束和边界条件限制,性能指标通常选择最小化末端距离和电机能量消耗。
2.2 面向目标捕获任务的约束条件与性能指标
将式(15)FFSR动力学方程改写为如下形式:
(21)
令则系统矩阵A和输入矩阵B分别为:
(22)
即得到状态方程一般形式,并可进一步写作:
(23)
状态方程反映了系统的动力学特性,直接与控制输入相关联,也是状态解所需满足的最基本约束。FFSR在捕获目标时,还需要保证目视目标,而传感器工作范围有限,故需定义视场约束,如图3所示。
图3视场约束示意图
Fig.3Illustration of the field-of-view constraint
图中各参数上标I,b,t分别表示惯性系、基座系、目标系,rb,rt分别表示FFSR基座和目标在惯性系中的位置,rct为空间机器人传感器中心指向目标质心的矢量,vc,vg分别表示传感器和目标捕获点的主轴方向。视场约束包括目视和跟随两方面,分别用目视角和跟随角进行描述。
定义目视角θfov为矢量rct,vc所成夹角,跟随角θrot为矢量 rtc,vg 所成夹角。在捕获过程中,两角度需要保证在一定范围内:
(24)
FFSR捕获目标时,不能对目标本体造成碰撞破坏。通常目标构型包括细长的太阳能板等设备。若仅使用一个包络圆包裹所有设备,障碍区会非常冗余,导致规划的约束条件非常严格,最终可能无法求解得到可行解。本研究中采用多个相交圆来设置避障约束,如图4所示。
图4避障约束示意图
Fig.4Illustration of the obstacle avoidance constraint
当两种障碍区圆不相交,可认为约束被满足。将自身障碍区圆个数记作NobsR,第i个圆的圆心位置记作robsRi,直径记作dobsRi(i=1,2,···,NobsR)。将目标障碍区圆个数记作NobsT,第i个圆的圆心位置记作robsTi,直径记作dobsTi(i=1,2,···,NobsT)。对于第i个目标障碍区圆,其圆心指向第j个自身障碍区圆的位矢rdis(i,j)为:
(25)
位矢模长将大于两圆半径之和,确保两障碍区无交点:
(26)
障碍圆的设置基于机器人与目标的实际几何外接圆与关键特征点(如太阳能板端点、基座角点),通过四等分或等间距投影方式确定圆心位置,半径则根据实际构件尺寸和安全裕度确定。
FFSR由电机进行驱动,所能产生的驱动力、力矩的大小有限,故运动过程中的控制律U应始终满足:
(27)
式中:Umin=[U1min,U2min,···,Ukmin]T,Umax=[U1max,U2max,···,Ukmax]T分别对应各关节电机驱动力/力矩的输出最小值和最大值,k为电机个数。
FFSR由给定初位置运动到期望末位置,自然形成状态量的边界条件约束:
(28)
式中:t0,tf分别为运动始末时刻,,分别为基座的位置和线速度,,分别为基座的转角和角速度,,分别为关节的角位置和角速度。
对于目标捕获任务,通常有初始时刻推进器开机和终止时刻推进器关机的操作,因此控制律U的边界条件为:
(29)
轨迹规划需设定优化方向,评估求解改进效果。在目标捕获任务中,末端捕获误差、推进电机耗能是重要的优化对象,因而可写出性能指标:
(30)
式中:和分别为期望到达和最终实际位置,可分别由关节量解算得到;为输入权重矩阵,衡量了不同控制输入的耗能权重;k1,k2分别为边值性能和积分性能的关注度,其数值选取基于任务优先级(如均衡考虑末端精度、能量消耗)与指标实际值。
综上分析,可给出FFSR目标捕获任务轨迹优化问题的完整描述:
(31)
3 Radau伪谱法改进
3.1 全过程离散化
式(31)给出的非线性连续时变系统最优控制问题,直接求解析解过于复杂,考虑将其转化为有限离散点的规划问题求数值解。Radau伪谱法采用勒让德-高斯-拉道(legendre-gauss-radau,LGR)正交配点对状态量和控制律同步离散化,再调用优化器求解。
首先将原始问题的时间区间t∈[t0,tf]通过下述方式映射到标准时间区间τ∈[-1,1]:
(32)
在标准时间区间τ∈[-1,1]内,将LGR函数零点作为配点:
(33)
式中Pn(τ)为n阶Legendre多项式,其表达式为:
(34)
式中参数M满足:
(35)
式(33)方程有N个根,将其记作τ1,τ2,···,τN,这些点的范围是τi∈(-1,1]。补充定义一个起点τ0=-1,这N+1个点共同构成规划问题的求解目标点。由N+1个点可写出i配点处的N阶Lagrange插值多项式为:
(36)
系统状态序列可近似离散为:
(37)
式中Xi=X(τi),表示在时间τi处采样状态量。
系统的控制序列可近似离散为:
(38)
式中Lagrange插值多项式不使用初始时刻τ0=-1节点,写作:
(39)
系统性能指标积分可用求和形式表示:
(40)
式中wi为高斯积分权重,衡量了离散点处性能指标对规划全过程的贡献,计算公式为:
(41)
系统状态方程可改写为离散形式:
(42)
式中Wji为N×(N+1)的微分权重矩阵,每一行代表一个时刻,每一列代表所有配点的状态。
综上所述,式(17)~式(20)描述的连续Bolza形式最优控制问题,经离散化可转化为如下NLP问题:
(43)
全局Radau伪谱法转化后,优化器待求解的变量包括:标准离散时间τ1,τ2,···,τN、离散状态量X1,X2,···,XN、离散控制量U1,U2,···,UN。
3.2 自适应分段升阶策略
全局伪谱法缺乏局部适应性,对于具有非平滑特性(如控制量饱和、非线性约束)的轨迹,全局高阶近似效率低下,易产生吉布斯现象。在全局方法的背景下,增加配点能够提高拟合多项式的阶数,可行性误差往往减小,但求解耗时也相应变长。已有研究[17]指出:增加配点可以使轨迹平滑处呈现指数级收敛趋势; 在轨迹不平滑位置添加分段点可以构造平滑区间。当前应用较多的分段伪谱法依赖曲率和积分运算确定分段位置,计算代价较大。本研究提出一种基于阈值的自适应策略,旨在通过阈值判断实现更高效的分段和升阶决策,提升优化问题求解精度、加快求解速度。
在问题时间区间[t0,tf]之间插入P-1个分段点,将时间域整体细分为[t0t1···ti-1ti···tf]的P个小段,第i段时间区间为[ti-1,ti],结合式(34),可将第i段时间区间变换到标准时间区间:
(44)
设第i段内有Ni个LGR配点,并补充初始节点即共有Ni+1个LGR节点:。第i段内的状态量、控制律分别用X(i),U(i)进行表示:
(45)
(46)
子段i内的性能指标为:
(47)
子段i内的状态方程约束为:
(48)
分段伪谱法通过引入分段点,将各段分别映射到标准时间区间进行规划,需要保证相邻两子段的状态量和控制量连续。分段伪谱法离散化过程如图5所示。
考虑第i个子段的LGR节点,τj节点处的状态导数误差可以写作:
(49)
式中:行向量,Nx为FFSR系统的状态维度,分别表示节点处的状态量和其导数值,表示节点处的控制律。绝对值中的第一项由插值得到,第二项根据自身动力学方程计算得到,两者之差衡量了轨迹规划的精度水平和可优化位置。直接根据LGR节点计算偏差,作用于插值多项式的导数进一步引入节点中间时刻的插值状态及其导数偏差,可将插值多项式自身也纳入到最优化网格加细过程。LGR节点中间时刻为:
(50)
中点处偏差计算方式同式(48)。统计段内所有节点偏差可堆叠得到形状为2Ni×Nx的矩阵:
(51)
式中e(i)矩阵每一行代表同一时刻下不同分量的偏差,每一列代表不同时刻状态分量变化。从任一状态分量的视角去看,误差的数值分布可能呈现出阶段性平缓或陡峭的特征,如图6所示。
图5分段伪谱法示意图
Fig.5Illustration of the segmented pseudo-spectral method
图6自适应分段升阶改进策略示意图
Fig.6Illustration of the adaptive segmented upgrading strategy
记录偏差矩阵e(i)中的最大元素,将其与偏差阈值ε作比较,如果有<ε,且Ni>Nmin(图6中粉色P1区域),则认为该分段内精度达到要求,无需对网格继续加细优化,Nmin表示段内配点下限。如果<ε,而Ni<Nmin(图6粉色P2圆形区域),则说明该段呈现平滑特征,且提升段内配点数可以提高收敛速度,分段点位置无需变动,该段内配点数增加为:
(52)
式中:M1为一个固定值,表示光滑情况下的新增配点数,k为数值迭代进入第k轮,Nmax为段内配点上限,min{·}函数取两者较小值,实现上限截断,避免单段内配点过多、拟合多项式阶数过高导致计算效率低下。
如果>ε,说明轨迹出现了较大偏差,应插入分段点构造分段光滑区域进行优化。记录 出现的列数为m,代表状态量X的第m个分量,图6即可被理解为在一系列配点处计算得出的状态导数偏差。记录的2Ni-1个偏差点中超过阈值的极大值位置,设这些点对应标准时间为对应偏差值为。
定义伪谱标准时间自适应阈值η:
(53)
式中自适应阈值增益λ可调,用于控制分段策略的敏感程度,较大的λ值会更倾向于采用分段方式优化迭代过程。α记录了上一分段点的设置位置,一定有。对于第一个猜测分段点,设置的设计基于相邻分段点的误差超限量之和,其目的是将局部误差映射为时间间隔上的分段需求,选择执行分段的判定条件为:
(54)
即当前点 与上一分段点 的自适应阈值 η 超过自身标准时间间隔,才执行分段。 分段数和新段内配点数的选择策略为:
(55)
式中:表示在第k轮迭代中i分段内的配点数,M2为固定值,表示新增分段数的下限,ceil(·)表示向上取整数,为下轮迭代中i分段拆分出的新分段数,新段内均设置配点数为下限值Nmin。完成i段内新分段和配点数设置后,更新上一分段位置α。完整的自适应分段升阶Radau伪谱法的求解示意如图7所示。
图7自适应阈值分段升阶伪谱法求解示意图
Fig.7Schematic diagram of the adaptive threshold segmented upgrading pseudo-spectral method
4 仿真实验
本文以平面二连杆FFSR作为实验对象,应用自适应阈值分段升阶伪谱法规划目标捕获轨迹,并与全局Radau伪谱法、自适应曲率分段Radau伪谱法[14]的求解结果进行比较。FFSR构型参数如表1所示。
表1FFSR构型系数
Tab.1Configuration parameters of the FFSR
表1中基座的转动惯量相对于基座质心转轴,连杆的转动惯量相对于关节转轴。
捕获任务设定如下。
1)仿真开始时间t0=0.0 s,结束时间tf=60.0 s。
2)非合作目标初始位置[3.5,2.0]T,自转角速度π/60 rad/s,逆时针方向旋转。
3)FFSR初始状态rb(t0)=[1.0,2.0]T,qb(t0)=0.0,qm(t0)=[π/2,π/2]T,(t0)=[0.0,0.0]T,(t0)=0.0,(t0)=[0.0,0.0]T。
4)FFSR结束状态
5)视场约束目视角 θfovMax = 15°,跟随角 θrotMax = 25°。
6)目标障碍区圆圆心在目标系中向两侧太阳能板间隔 0.2 m 处设置,中心障碍圆半径为 0.14 m,太阳能板上障碍圆半径为 0.1 m。自身障碍区依据基座外接圆和连杆的四等分点设置。
7)电机输入 U 满足:U≤Umax = [1. 0,1. 0,0.1,1.5,1.5] T,U≥Umin = [-1. 0,-1. 0,-0.1,-1.5,-1.5] T。
8)输入权重矩阵 Qu = diag( 1,1,300,300,300),边值性能指标 k1 = 100,积分性能指标 k2 = 1。
应用本文方法求解上述优化问题,可得轨迹可行解如图8所示。
图8FFSR目标捕获运动可行解
Fig.8Feasible trajectory solution for the FFSR target capture maneuver
图8展示了FFSR的目标捕获过程,红色目标星进行非合作自旋运动,黑色虚线圆为优化问题设置的障碍区,蓝色机器人为平面二连杆FFSR,蓝色虚线代表机器人的末端轨迹。FFSR的末端执行器不直接进行控制,而是由基座和连杆传递运动。由图8可见,FFSR运动曲线平滑,有效遵循了视场、避障等约束,展现出接近-绕飞的过程特征,最终实现目标点位重合,顺利完成捕获任务,验证了改进策略求解的有效性。为进一步体现改进策略的优越性,与全局Radau伪满法、自适应曲率分段Radau伪谱法进行对比实验。不同算法规划FFSR轨迹,运动过程中各状态量与控制律变化如图9所示。
图9中的不同线型代表不同的状态量/控制律,黄色、紫色、绿色线分别代表全局方法、曲率方法和本文提出的阈值方法。由图9可见,基座和关节运动均展现出良好的平滑性,而提出的改进策略倾向于使用更少的配点完成规划任务,因而表现更优。本文方法与全局Radau伪谱法、自适应曲率分段Radau伪谱法的定量对比结果如表2所示。
由表2结果可见,本文提出的阈值法在优化轨迹时使用的配点数最少、求解时间最短,并成功保留了轨迹解的核心变化趋势,展现出最小的末端捕获误差,相比全局法和曲率法更优越。在约束违反方面,本文方法的约束违反量处于10-13量级,虽略高于曲率方法,但此数量级已可视为数值计算误差的范畴,远低于实际物理系统的容错范围,因此对解的可行性、最优性影响可忽略不计。实际系统在对指令轨迹进行跟踪时,可通过设计控制律抑制微小的约束违反与未知的扰动噪声,该结论已在多个空间机器人轨迹优化研究中得到验证[16]。
为进一步明确自适应阈值策略的应用方法,本研究对其参数选择原则进行如下阐述:
1)偏差阈值ε,根据系统动力学精度要求设定,通常取10-5~10-3数量级,过大易导致优化求解精度降低,过小则使优化问题求解困难;
2)自适应阈值增益λ是自适应分段策略的核心,本研究对其进行了参数分析实验,结果见表3。
表3结果表明,较小的λ值倾向于通过增加段内配点数实现轨迹优化,较大的λ值则更容易越过时间步长限制,采用分段策略优化。选取合适的增益λ,可实现更小的末端误差、约束违反量与更快的计算速度。
3)分段内配点数上限Nmax,下限Nmin,根据伪谱法多项式拟合经验值设定,通常单段内配点数取3~10之间的整数。配点数过少会倾向于过度分段,引入不必要的边界条件; 配点数过多,则可能导致数值病态(插值矩阵条件数恶化),计算代价也会急剧上升。
图9FFSR运动过程状态量与控制律变化
Fig.9Variation of FFSR states and control laws during motion
表2FFSR轨迹优化求解效果对比
Tab.2Comparison of trajectory optimization performance for the FFSR
表3自适应阈值增益λ实验分析
Tab.3Experimental analysis of adaptive threshold gain λ
4)M1为光滑区间追求加速收敛增加的配点数。由文献[17]可知,增加配点可以使轨迹平滑处呈现指数级收敛趋势,因而M1取较小值即可显著加速收敛,通常取1~3之间的整数。M2为新增分段下限数,本文中取M2=2,即激活分段策略后,至少将原区间分为两段。
5 结论
1)本文基于FFSR目标捕获任务背景,针对Radau伪谱法求解轨迹优化问题的均衡矛盾,提出了一种基于阈值的自适应分段升阶改进策略。通过在迭代过程中计算偏差矩阵、比较时间阈值,实现了对分段位置、配点数的有效分级决策,为机器人快速规划行动路径提供了支撑。
2)与全局伪谱法不同,阈值法充分发挥了分段策略的优势,避免了单一区间配点过多的问题,从而显著减少计算耗时。 与自适应曲率分段伪谱法相比,阈值法采用相对保守的分段策略,最大限度地利用了解曲线在光滑区域的特点,通过提升多项式阶数实现了更快的收敛速度和更小的末端误差。
3)将本文提出的AT-RPM方法应用于平面二连杆FFSR目标捕获任务,仿真结果表明AT-RPM方法相比全局方法和曲率方法,计算耗时缩短至13.19 s,末端误差减小至3 mm,具有最好的性能表现。未来将考虑研究受到外部扰动下的FFSR路径优化问题,进一步提升算法的鲁棒性和适用性。

