基于自适应阈值伪谱法的空间机器人轨迹优化
doi: 10.11918/202508063
倪浩1 , 刘壮1 , 马晓龙2,3 , 张欧阳1 , 陈萌2,3 , 刘健行1 , 吴立刚1
1. 哈尔滨工业大学航天学院,哈尔滨 150090
2. 上海宇航系统工程研究所,上海 201109
3. 宇航空间机构全国重点实验室,上海 201109
基金项目: 国家自然科学基金(62373127,62033005,62503137) ; 国家资助博士后研究人员计划(GZB20250957) ; 中国博士后科学基金(2024M764189) ; 中国航天科技集团公司第八研究院产学研合作基金(SAST2024-018,SAST2024-019)
Adaptive threshold pseudo-spectral method for space robot trajectory optimization
NI Hao1 , LIU Zhuang1 , MA Xiaolong2,3 , ZHANG Ouyang1 , CHEN Meng2,3 , LIU Jianxing1 , WU Ligang1
1. School of Astronautics, Harbin Institute of Technology, Harbin 150090 , China
2. Aerospace System Engineering Shanghai, Shanghai 201109 , China
3. National Key Laboratory of Aerospace Mechanism, Shanghai 201109 , China
摘要
为解决传统Radau伪谱法在轨迹优化求解效率与轨迹解可行性之间存在的矛盾,本文提出一种基于自适应阈值的分段升阶伪谱法,用于提升非线性优化问题的求解精度,加快收敛速度。该方法通过动态比较迭代过程中的误差矩阵极大值与标准时间步长,在误差超过自适应阈值的区间设置新分段点,并在误差小于偏差阈值的分段内增加配点数,这种策略对轨迹解的平滑/非平滑区间进行针对性优化,从而以较少的分段数和配点数达成轨迹规划目标。相比于传统Radau伪谱法,自适应分段升阶方法能够以较少迭代轮次收敛到期望结果,实现数值精度与求解效率的有效平衡。为验证算法性能,本研究基于自由飞行空间机器人非合作目标捕获场景进行了对比仿真实验。实验结果表明,本文提出的自适应分段升阶方法,在求解耗时和轨迹解的末端精度方面均优于对比方法,显示出更好的综合表现。
Abstract
To address the trade-off between solution efficiency and trajectory feasibility in traditional Radau Pseudo-spectral Method (RPM) for trajectory optimization, this paper proposes an adaptive threshold-based segmented polynomial-degree elevation pseudo-spectral method (AT-RPM). This approach aims to enhance nonlinear optimization accuracy and accelerate convergence. By dynamically comparing the maximum value of the error matrix with a standard time step during iterative process, the method establishes new segment points in intervals where the error exceeds an adaptive threshold. Furthermore, the number of collocation points within segments is also increased when the error falls below a deviation threshold. This strategy selectively optimizes both smooth and non-smooth regions of the trajectory solution, thereby enabling achievement of trajectory planning goals with fewer segments and collocation points. Compared with the traditional Radau Pseudo-spectral Method, AT-RPM can converge to the desired result in fewer iteration rounds, effectively balancing numerical accuracy and solution efficiency. To validate performance, comparative simulation experiments have been conducted in a non-cooperative target capture scenario involving a free-flying space robot. The results indicate that the proposed method outperforms the existing approaches in both computation time and terminal accuracy, demonstrating superior overall performance.
随着太空探索的规模扩大、复杂性提升,传统依赖人工操作的执行方式已难以满足高频次、高精度的在轨服务需求,空间机器人作为一种替代方案而日益受到重视[1]。自由飞行空间机器人(free-flying space robot,FFSR)可通过推进器和动量轮对基座、机械臂的位姿进行同步控制,如图1所示。FFSR具备高度灵活性,可替代宇航员完成危险性工作,在目标捕获、碎片清理等任务中具有广阔应用前景[2-3]
1自由飞行空间机器人在轨服务[1]
Fig.1A free-flying space robot performing on-orbit servicing[1]
然而,保障FFSR正常工作面临诸多挑战,其中轨迹优化策略直接影响机器人太空操作的稳定性、快速性和精确度[4-5]。本质上,空间机器人轨迹优化是有约束条件下的指标最优问题,机器人需要在视角受限、规避障碍等前提下完成任务[6]。解决此类问题有直接法和间接法两种思路[7]。间接法利用极小值原理将问题转化为两点边值问题,通过求解微分代数方程获得最优轨迹。采用间接法有助于深入理解系统行为,但其数学推导过程常十分复杂,求解速度也非常缓慢,实际应用中更多采用直接法求解。直接法采用配点思想对问题作离散化并求数值解,通常求解速度快但数值精度低。国内外大量研究人员致力于改进直接法求解轨迹优化问题[8-9]
伪谱法是直接法中的一种经典思路,其采用正交多项式作为基函数,利用积分在离散点上实现微分或代数方程近似,将最优控制问题转化为非线性规划(non-linear programing,NLP)问题进行求解[10],具有较高的收敛阶数,利用少量配点即可逼近最优解。2011年Grag等[11]最早将Radau伪谱法应用于求解有限时间和无限时间下的一般轨迹优化问题。2012年Li等[12]利用伪谱法完成了漂浮基座空间机器人的轨迹优化求解,轨迹解同时兼顾了时间消耗和能量积分。2023年Zhang等[13]提出依据误差曲率密度积分计算合理分段位置,在FFSR轨迹优化任务中取得了良好表现,其以更少配点取得了几乎相同的数值精度。尽管已有一些研究工作对伪谱法作出改进[14-15],但其在推广应用中始终面临矛盾:若全程采用高阶多项式,计算量将显著增加并引发数值稳定性问题; 若仅采用低阶多项式,则难以保证解的精度。增加拟合多项式阶数可提高数值精度,但将显著增加求解时间; 增加分段数能够加快收敛速度,但常导致精度下降较多。
为了解决上述矛盾,在分析现有伪谱法改进思路的基础上,本文提出了一种计算阈值自适应更新离散网格迭代的改进Radau伪谱法,该方法通过优化分段区间配置和段内配点数,兼顾求解精度提升、计算效率提高。该方法将在FFSR目标捕获轨迹优化问题中通过仿真实验进行验证。
1 FFSR系统建模
FFSR工作于太空微重力环境,其动力学应符合如下假设[13]:
1)FFSR是由刚性基座和刚性多连杆组成的多刚体系统,且基座和连杆质量均匀分布;
2)考虑均由旋转关节组成的FFSR构型;
3)接近-绕飞阶段运动过程中FFSR与目标之间相互作用力几乎无变化,且不相互影响运动;
4)忽略地心引力对FFSR系统的影响。
基于上述预设,可在惯性系{I}下描述FFSR基座、机械臂的位置与姿态。FFSR系统示意图如图2所示,其整体由基座与多连杆串联组成,{b}为基座系,{i}为连杆i系,Ji为关节i,惯性系原点指向关节i和连杆i质心的矢量分别为piri,惯性系原点指向基座和末端的矢量分别为rbre,基座指向关节J1的矢量为b0,关节Ji指向连杆i质心Ci的矢量为ai,连杆i质心Ci指向关节Ji+1的矢量为bi
2自由飞行空间机器人结构示意图
Fig.2Schematic diagram of the free-flying space robot
根据图2可推导得到{I}系下连杆i质心的位置矢量Iri和末端e的位置矢量Ire满足:
Iri=Irb+Ib0+j=1i Iaj+j=1i-1 Ibj
(1)
Ire=Irb+Ib0+j=1i Iaj+j=1i Ibj
(2)
对位置矢量求时间导数可得到连杆 i 质心速Ivi和末端 e 速度Ive:
Ivi=Ivb+Iwb×Iri-Irb+j=1i Izj×θ˙jIri-Ipj
(3)
Ive=Ivb+Iwb×Ire-Irb+j=1n Izj×θ˙jIre-Ipj
(4)
式中: Iwb为{I}系下基座角速度,I zj 为关节 Ji 轴线方向的单位矢量,θ˙j 为关节 Ji 角速度。连杆 i 质心角速度Iwi、末端 e 的角速度Iwe 可通过下式求得:
Iwi=Iwb+bwi=Iwb+j=1 θ˙jIzj
(5)
Iwe=Iwb+bwe=Iwb+j=1n θ˙jIzj
(6)
将式(3)~式(6)整理为矩阵方程:
IviIwi=E3×3Irib×03×3E3×3IvbIwb+JTiJRiq˙m
IveIwe=E3×3Ireb×03×3E3×3IvbIwb+JTnJRnq˙m
(7)
式中: Irib×为向量Irib×的叉乘操作数,即Irib与任意向量 a 作叉乘运算,可以等效为作点乘运算:Irib×a=Irib×a关节量导数q˙m=θ˙1 θ˙2 θ˙nT矩阵JTiR3×nJRiR3×nJTnR3×nJRnR3×n满足:
JTi=Iz1×Iri-Ip1 Izi×Iri-Ipi 03×1 03×1
JRi=Iz1 Izi 03×1 03×1
JTn=Iz1×Iri-Ip1 Izn×Iri-Ipn
JRn=Iz1 Iz2 Izn
(8)
定义 FFSR 系统拉格朗日函数 L 为
L=W-P
(9)
式中:WP分别为系统动能和势能。考虑假设4),势能近似为零,总能量可近似为动能。满足如下表达式:
W=Wv+Ww=12i=0n miIviTIvi+12i=0n IwiTIiIwi
(10)
式中:WvWw分别描述系统的平动动能和转动动能,m为质量,I为转动惯量,下标i=0代表基座的质量、速度、角速度。
Wv=12i=0n Iwb+JRiq˙mTIiIwb+JRiq˙m
Ww=12i=0n E3 Irib×IvbIwb+JTiq˙mT.
IiE3 Irib×IvbIwb+JTiq˙m
(11)
故可将FFSR系统的拉格朗日函数L整理为
L=W=12q˙TDq˙
(12)
式中:q=rbT qbT qmT为广义坐标,包含基座位置、基座转角和关节转角信息。对其求导可得到运动信息q˙=vbT wbT wmTD为惯性矩阵,具体形式为:
D=D11 D12 D13D21 D22 D23D31 D32 D33
(13)
其中,矩阵各项为
D11=i=0n miE3D12=i=0n mirib×D13=i=0n miJTi
D21=i=0n mirbi×D22=i=0n Ii-mirbi×rbi×
D23=i=0n IiJRi+mirbi×JTiD31=i=0n miJTiT
D32=i=0n JRiTIi+miJTiTrib×
D33=i=0n JRiTIiJRi+miJTiTJTi
(14)
惯性矩阵D是一个正定矩阵,描述了机器人的质量分布和几何特性。将式(12)代入拉格朗日方程可得:
D(q)q¨+C(q,q˙)q˙=u
(15)
式中:控制输入u=FbT τbT τmTTFbτbτm分别为施加到基座上的力、力矩效果,以及施加在关节上的力矩效果,Cqq˙为科里奥利和离心力矩阵,其形式不唯一,Cqq˙q˙对应科氏力项,满足如下等式:
C(q,q˙)q˙=dD(q)dtq˙-Lq
(16)
2 轨迹规划任务分析
2.1 最优控制问题一般数学表述
FFSR的轨迹规划问题实际是一个非线性连续时变系统的最优控制问题。Bolza型最优控制问题的性能指标一般形式为[16]
minJb=Φxt0,xtf,t0,tf+t0tf L(x(t),u(t),t)dt
(17)
式中:Φ(·)为边值性能指标映射,L(·)为积分性能指标映射,两者共同评估解的表现。
系统迭代更新应满足状态方程:
x˙(t)=f(x(t),u(t),t)
(18)
运动中始终满足等式、不等式约束:
C1(x(t),u(t),t)=0C2(x(t),u(t),t)0
(19)
系统的边界条件为:
C3xt0,xtf,t0,tf=0
(20)
联立式(17)~(20)可得到轨迹规划问题的一般数学描述。具体到目标捕获任务,约束包括运动过程中的视角跟随、动态避障、状态方程约束和边界条件限制,性能指标通常选择最小化末端距离和电机能量消耗。
2.2 面向目标捕获任务的约束条件与性能指标
将式(15)FFSR动力学方程改写为如下形式:
q˙q¨=0E0-D(q)-1C(q,q˙)qq˙+0D(q)-1u
(21)
X=q q˙TU=uX˙=q˙ q¨T则系统矩阵A和输入矩阵B分别为:
A=0E0-D(q)-1C(q,q˙),B=0D(q)-1
(22)
即得到状态方程一般形式,并可进一步写作:
X˙=AX+BU=f(X(t),U(t),t)
(23)
状态方程反映了系统的动力学特性,直接与控制输入相关联,也是状态解所需满足的最基本约束。FFSR在捕获目标时,还需要保证目视目标,而传感器工作范围有限,故需定义视场约束,如图3所示。
3视场约束示意图
Fig.3Illustration of the field-of-view constraint
图中各参数上标I,b,t分别表示惯性系、基座系、目标系,rbrt分别表示FFSR基座和目标在惯性系中的位置,rct为空间机器人传感器中心指向目标质心的矢量,vcvg分别表示传感器和目标捕获点的主轴方向。视场约束包括目视和跟随两方面,分别用目视角和跟随角进行描述。
定义目视角θfov为矢量rctvc所成夹角,跟随角θrot为矢量 rtcvg 所成夹角。在捕获过程中,两角度需要保证在一定范围内:
cosθfovcosθfovMaxcosθrotcosθrotMax
(24)
FFSR捕获目标时,不能对目标本体造成碰撞破坏。通常目标构型包括细长的太阳能板等设备。若仅使用一个包络圆包裹所有设备,障碍区会非常冗余,导致规划的约束条件非常严格,最终可能无法求解得到可行解。本研究中采用多个相交圆来设置避障约束,如图4所示。
4避障约束示意图
Fig.4Illustration of the obstacle avoidance constraint
当两种障碍区圆不相交,可认为约束被满足。将自身障碍区圆个数记作NobsR,第i个圆的圆心位置记作robsRi,直径记作dobsRii=1,2,···,NobsR)。将目标障碍区圆个数记作NobsT,第i个圆的圆心位置记作robsTi,直径记作dobsTii=1,2,···,NobsT)。对于第i个目标障碍区圆,其圆心指向第j个自身障碍区圆的位矢rdisij)为:
rdis(i,j)=robsTi-robsRj
(25)
位矢模长将大于两圆半径之和,确保两障碍区无交点:
rdis (i, j) 12dobsRj+dobsTi,
i=1,2,,NobsT,j=1,2,,NobsR
(26)
障碍圆的设置基于机器人与目标的实际几何外接圆与关键特征点(如太阳能板端点、基座角点),通过四等分或等间距投影方式确定圆心位置,半径则根据实际构件尺寸和安全裕度确定。
FFSR由电机进行驱动,所能产生的驱动力、力矩的大小有限,故运动过程中的控制律U应始终满足:
UminUUmax
(27)
式中:Umin=[U1minU2min,···,Ukmin]TUmax=[U1maxU2max,···,Ukmax]T分别对应各关节电机驱动力/力矩的输出最小值和最大值,k为电机个数。
FFSR由给定初位置运动到期望末位置,自然形成状态量的边界条件约束:
Xt0=rbt0 qbt0 qmt0r˙bt0q˙bt0q˙mt0T
Xtf=rbtfqbtfqmtfr˙btfq˙btfq˙mtfT
(28)
式中:t0tf分别为运动始末时刻,rbr˙b分别为基座的位置和线速度,qbq˙b分别为基座的转角和角速度,qmq˙m分别为关节的角位置和角速度。
对于目标捕获任务,通常有初始时刻推进器开机和终止时刻推进器关机的操作,因此控制律U的边界条件为:
Ut0=Fbt0 τbt0 τmt0T
Utf=Fbtf τbtf τmtfT
(29)
轨迹规划需设定优化方向,评估求解改进效果。在目标捕获任务中,末端捕获误差、推进电机耗能是重要的优化对象,因而可写出性能指标:
Jb=k1ref -reg +k2t0tf U(t)TQuU(t)dt
(30)
式中:reg ref 分别为期望到达和最终实际位置,可分别由关节量解算得到;Qu为输入权重矩阵,衡量了不同控制输入的耗能权重;k1k2分别为边值性能和积分性能的关注度,其数值选取基于任务优先级(如均衡考虑末端精度、能量消耗)与指标实际值。
综上分析,可给出FFSR目标捕获任务轨迹优化问题的完整描述:
minJb=k1ref -reg +k2t0tf U (t) TQuU (t) dt
s. t. X˙=AX+BU=f (X (t) , U (t) , t)
Xt0=rbt0 qbt0 qmt0r˙bt0q˙bt0q˙mt0T
Xtf=rbtf qbtf qmtfr˙btfq˙btfq˙mtfT
Ut0=Fbt0 τbt0 τmt0T
Utf=Fbtf τbtf τmtfT
cosθfovcosθfovMax
cosθrotcosθrotMax
rdis (i, j) 12dobsRj+dobsTi,
i=1, 2, , NobsT, j=1, 2, , NobsR
UminUUmax
(31)
3 Radau伪谱法改进
3.1 全过程离散化
式(31)给出的非线性连续时变系统最优控制问题,直接求解析解过于复杂,考虑将其转化为有限离散点的规划问题求数值解。Radau伪谱法采用勒让德-高斯-拉道(legendre-gauss-radau,LGR)正交配点对状态量和控制律同步离散化,再调用优化器求解。
首先将原始问题的时间区间t∈[t0tf]通过下述方式映射到标准时间区间τ[-1,1]:
τ=2tf-t0t-tf+t0tf-t0
t=tf-t02τ+tf+t02
(32)
在标准时间区间τ[-1,1]内,将LGR函数零点作为配点:
Pn-1(τ)-Pn(τ)=0
(33)
式中Pnτ)为n阶Legendre多项式,其表达式为:
Pn(x)=m=0M (-1)m(2n-2m)!2nm!(n-m)!(n-2m)!xn-2m
(34)
式中参数M满足:
M=n2,n=2k,kZn-12,n=2k-1,kZ
(35)
式(33)方程有N个根,将其记作τ1τ2,···,τN,这些点的范围是τi∈(-1,1]。补充定义一个起点τ0=-1,这N+1个点共同构成规划问题的求解目标点。由N+1个点可写出i配点处的N阶Lagrange插值多项式为:
Li(τ)=j=0,jiN τ-τjτi-τj,(i=0,1,,N)
(36)
系统状态序列可近似离散为:
X(τ)i=0N XiLi(τ)
(37)
式中Xi=Xτi),表示在时间τi处采样状态量。
系统的控制序列可近似离散为:
U(τ)i=1N UiL^i(τ)
(38)
式中Lagrange插值多项式L^iτ不使用初始时刻τ0=-1节点,L^iτ写作:
L^i(τ)=j=1,jiN τ-τjτi-τj,(i=0,1,,N)
(39)
系统性能指标积分可用求和形式表示:
-11 L(X(τ),U(τ),τ)dτ=i=1N wiLXi,Ui,τi
(40)
式中wi为高斯积分权重,衡量了离散点处性能指标对规划全过程的贡献,计算公式为:
wi=-11 L^i(τ)dτ
(41)
系统状态方程可改写为离散形式:
X˙τji=0N L˙iτjXi=i=0N WjiXi,(j=1,2,,N)
(42)
式中WjiN×(N+1)的微分权重矩阵,每一行代表一个时刻,每一列代表所有配点的状态。
综上所述,式(17)~式(20)描述的连续Bolza形式最优控制问题,经离散化可转化为如下NLP问题:
minJb=Φ(X(-1),X(1),-1,1)+tf-t02i=1N wiLXi,Ui,τi s.t. i=0N WjiXi-tf-t02fXτj,Uτj,τj=0,(j=1,2,,N)C1(X(τ),U(τ),τ)=0C2(X(τ),U(τ),τ)0C3(X(-1),X(1),-1,1)=0
(43)
全局Radau伪谱法转化后,优化器待求解的变量包括:标准离散时间τ1τ2,···,τN、离散状态量X1X2,···,XN、离散控制量U1U2,···,UN
3.2 自适应分段升阶策略
全局伪谱法缺乏局部适应性,对于具有非平滑特性(如控制量饱和、非线性约束)的轨迹,全局高阶近似效率低下,易产生吉布斯现象。在全局方法的背景下,增加配点能够提高拟合多项式的阶数,可行性误差往往减小,但求解耗时也相应变长。已有研究[17]指出:增加配点可以使轨迹平滑处呈现指数级收敛趋势; 在轨迹不平滑位置添加分段点可以构造平滑区间。当前应用较多的分段伪谱法依赖曲率和积分运算确定分段位置,计算代价较大。本研究提出一种基于阈值的自适应策略,旨在通过阈值判断实现更高效的分段和升阶决策,提升优化问题求解精度、加快求解速度。
在问题时间区间[t0tf]之间插入P-1个分段点,将时间域整体细分为[t0t1···ti-1ti···tf]的P个小段,第i段时间区间为[ti-1ti],结合式(34),可将第i段时间区间变换到标准时间区间:
τ=2ti-ti-1t-ti+ti-1ti-ti-1,tti-1,ti
(44)
设第i段内有Ni个LGR配点,并补充初始节点τ0i=-1即共有Ni+1个LGR节点:τ0iτ1iτNi。第i段内的状态量、控制律分别用XiUi进行表示:
X(i)(τ)j=0Ni Xj(i)Lj(i)(τ)Lj(i)(τ)=k=0,kjNi τ-τk(i)τj(i)-τk(i),j=0,1,,Ni
(45)
U(i)(τ)j=0Ni Uj(i)L^j(i)(τ)L^j(i)(τ)=k=1,kjNi τ-τk(i)τj(i)-τk(i),j=1,2,Ni
(46)
子段i内的性能指标为:
Jb(i)=ΦX0(i),XNi(i),τ0(i),τNi(i)+ti-ti-12j=1Ni wj(i)LXj(i),Uj(i),τj(i)
(47)
子段i内的状态方程约束为:
j=0Ni Wkj(i)Xj(i)-ti-ti-12fXk(i),Uk(i),τk(i)=0,k=1,2,,NiWkj(i)=L˙j(i)τk(i),k=1,2,,Ni
(48)
分段伪谱法通过引入分段点,将各段分别映射到标准时间区间进行规划,需要保证相邻两子段的状态量和控制量连续。分段伪谱法离散化过程如图5所示。
考虑第i个子段的LGR节点τ0iτ1iτNiiτj节点处的状态导数误差可以写作:
eτj(i)=X˙(i)τj(i)-ti-ti-12fX(i)τj(i),U(i)τj(i),τj(i),j=1,2,,Ni
(49)
式中:eτji1×Nx行向量,Nx为FFSR系统的状态维度,XiτjiX˙iτji分别表示τji节点处的状态量和其导数值,Uiτji表示τji节点处的控制律。绝对值中的第一项由插值得到,第二项根据自身动力学方程计算得到,两者之差衡量了轨迹规划的精度水平和可优化位置。直接根据LGR节点计算偏差,作用于插值多项式的导数L˙jiτ进一步引入节点中间时刻的插值状态及其导数偏差,可将插值多项式Ljiτ自身也纳入到最优化网格加细过程。LGR节点中间时刻为:
τ-j(i)=τj-1(i)+τj(i)2,j=1,2,,Ni
(50)
中点处偏差计算方式同式(48)。统计段内所有节点偏差可堆叠得到形状为2Ni×Nx的矩阵:
e(i)=eτ~1(i)T eτ1(i)T eτ-2(i)T eτ2(i)T eτ~Ni(i)TeτNi(i)TT
(51)
式中ei矩阵每一行代表同一时刻下不同分量的偏差,每一列代表不同时刻状态分量变化。从任一状态分量的视角去看,误差的数值分布可能呈现出阶段性平缓或陡峭的特征,如图6所示。
5分段伪谱法示意图
Fig.5Illustration of the segmented pseudo-spectral method
6自适应分段升阶改进策略示意图
Fig.6Illustration of the adaptive segmented upgrading strategy
记录偏差矩阵ei中的最大元素emaxi,将其与偏差阈值ε作比较,如果有emaxiε,且NiNmin图6中粉色P1区域),则认为该分段内精度达到要求,无需对网格继续加细优化,Nmin表示段内配点下限。如果emaxiε,而NiNmin图6粉色P2圆形区域),则说明该段呈现平滑特征,且提升段内配点数可以提高收敛速度,分段点位置无需变动,该段内配点数增加为:
Nik+1=minNik+M1,Nmax
(52)
式中:M1为一个固定值,表示光滑情况下的新增配点数,k为数值迭代进入第k轮,Nmax为段内配点上限,min{·}函数取两者较小值,实现上限截断,避免单段内配点过多、拟合多项式阶数过高导致计算效率低下。
如果emaxiε,说明轨迹出现了较大偏差,应插入分段点构造分段光滑区域进行优化。记录 emaxi出现的列数为m,代表状态量X的第m个分量Xmi图6即可被理解为Xmi在一系列配点处计算得出的状态导数偏差。记录Xmi的2Ni-1个偏差点中超过阈值的极大值位置,设这些点对应标准时间为τm1iτm2iτmninNim1<m2<<mn对应偏差值为emiτm1iemiτm2iemiτmni
定义伪谱标准时间自适应阈值η:
ηma=λlogem(i)τma(i)ε+logem(i)τα(i)ε,a=1,2,,Ni
(53)
式中自适应阈值增益λ可调,用于控制分段策略的敏感程度,较大的λ值会更倾向于采用分段方式优化迭代过程。α记录了上一分段点的设置位置,一定有ταi<τmai。对于第一个猜测分段点τm1i,设置ταi=τ0i=-1ηma的设计基于相邻分段点的误差超限量之和,其目的是将局部误差映射为时间间隔上的分段需求,选择执行分段的判定条件为:
ηma>τmai-ταi,a=1,2,,Ni
(54)
即当前点τmai 与上一分段点ταi 的自适应阈值 η 超过自身标准时间间隔,才执行分段。 分段数和新段内配点数的选择策略为:
NBik+1=maxceilη+NikNmin,M2Njk+1=Nmin,j=1,,NBik+1
(55)
式中:Nik表示在第k轮迭代中i分段内的配点数,M2为固定值,表示新增分段数的下限,ceil(·)表示向上取整数,NBik+1为下轮迭代中i分段拆分出的新分段数,新段内均设置配点数为下限值Nmin。完成i段内新分段和配点数设置后,更新上一分段位置α。完整的自适应分段升阶Radau伪谱法的求解示意如图7所示。
7自适应阈值分段升阶伪谱法求解示意图
Fig.7Schematic diagram of the adaptive threshold segmented upgrading pseudo-spectral method
4 仿真实验
本文以平面二连杆FFSR作为实验对象,应用自适应阈值分段升阶伪谱法规划目标捕获轨迹,并与全局Radau伪谱法、自适应曲率分段Radau伪谱法[14]的求解结果进行比较。FFSR构型参数如表1所示。
1FFSR构型系数
Tab.1Configuration parameters of the FFSR
表1中基座的转动惯量相对于基座质心转轴,连杆的转动惯量相对于关节转轴。
捕获任务设定如下。
1)仿真开始时间t0=0.0 s,结束时间tf=60.0 s。
2)非合作目标初始位置[3.5,2.0]T,自转角速度π/60 rad/s,逆时针方向旋转。
3)FFSR初始状态rbt0)=[1.0,2.0]Tqbt0)=0.0,qmt0)=[π/2,π/2]Tr˙bt0)=[0.0,0.0]Tq˙bt0)=0.0,q˙mt0)=[0.0,0.0]T
4)FFSR结束状态rbtf=4 15 2. 0Tqbtf=πqmtf=[0.8-1.87]Tr˙btf=[0.0,0.0]Tq˙btf=0.0q˙mtf=[0.0,0.0]T
5)视场约束目视角 θfovMax = 15°,跟随角 θrotMax = 25°。
6)目标障碍区圆圆心在目标系中向两侧太阳能板间隔 0.2 m 处设置,中心障碍圆半径为 0.14 m,太阳能板上障碍圆半径为 0.1 m。自身障碍区依据基座外接圆和连杆的四等分点设置。
7)电机输入 U 满足:UUmax = [1. 0,1. 0,0.1,1.5,1.5] TUUmin = [-1. 0,-1. 0,-0.1,-1.5,-1.5] T
8)输入权重矩阵 Qu = diag( 1,1,300,300,300),边值性能指标 k1 = 100,积分性能指标 k2 = 1。
应用本文方法求解上述优化问题,可得轨迹可行解如图8所示。
8FFSR目标捕获运动可行解
Fig.8Feasible trajectory solution for the FFSR target capture maneuver
图8展示了FFSR的目标捕获过程,红色目标星进行非合作自旋运动,黑色虚线圆为优化问题设置的障碍区,蓝色机器人为平面二连杆FFSR,蓝色虚线代表机器人的末端轨迹。FFSR的末端执行器不直接进行控制,而是由基座和连杆传递运动。由图8可见,FFSR运动曲线平滑,有效遵循了视场、避障等约束,展现出接近-绕飞的过程特征,最终实现目标点位重合,顺利完成捕获任务,验证了改进策略求解的有效性。为进一步体现改进策略的优越性,与全局Radau伪满法、自适应曲率分段Radau伪谱法进行对比实验。不同算法规划FFSR轨迹,运动过程中各状态量与控制律变化如图9所示。
图9中的不同线型代表不同的状态量/控制律,黄色、紫色、绿色线分别代表全局方法、曲率方法和本文提出的阈值方法。由图9可见,基座和关节运动均展现出良好的平滑性,而提出的改进策略倾向于使用更少的配点完成规划任务,因而表现更优。本文方法与全局Radau伪谱法、自适应曲率分段Radau伪谱法的定量对比结果如表2所示。
表2结果可见,本文提出的阈值法在优化轨迹时使用的配点数最少、求解时间最短,并成功保留了轨迹解的核心变化趋势,展现出最小的末端捕获误差,相比全局法和曲率法更优越。在约束违反方面,本文方法的约束违反量处于10-13量级,虽略高于曲率方法,但此数量级已可视为数值计算误差的范畴,远低于实际物理系统的容错范围,因此对解的可行性、最优性影响可忽略不计。实际系统在对指令轨迹进行跟踪时,可通过设计控制律抑制微小的约束违反与未知的扰动噪声,该结论已在多个空间机器人轨迹优化研究中得到验证[16]
为进一步明确自适应阈值策略的应用方法,本研究对其参数选择原则进行如下阐述:
1)偏差阈值ε,根据系统动力学精度要求设定,通常取10-5~10-3数量级,过大易导致优化求解精度降低,过小则使优化问题求解困难;
2)自适应阈值增益λ是自适应分段策略的核心,本研究对其进行了参数分析实验,结果见表3
表3结果表明,较小的λ值倾向于通过增加段内配点数实现轨迹优化,较大的λ值则更容易越过时间步长限制,采用分段策略优化。选取合适的增益λ,可实现更小的末端误差、约束违反量与更快的计算速度。
3)分段内配点数上限Nmax,下限Nmin,根据伪谱法多项式拟合经验值设定,通常单段内配点数取3~10之间的整数。配点数过少会倾向于过度分段,引入不必要的边界条件; 配点数过多,则可能导致数值病态(插值矩阵条件数恶化),计算代价也会急剧上升。
9FFSR运动过程状态量与控制律变化
Fig.9Variation of FFSR states and control laws during motion
2FFSR轨迹优化求解效果对比
Tab.2Comparison of trajectory optimization performance for the FFSR
3自适应阈值增益λ实验分析
Tab.3Experimental analysis of adaptive threshold gain λ
4)M1为光滑区间追求加速收敛增加的配点数。由文献[17]可知,增加配点可以使轨迹平滑处呈现指数级收敛趋势,因而M1取较小值即可显著加速收敛,通常取1~3之间的整数。M2为新增分段下限数,本文中取M2=2,即激活分段策略后,至少将原区间分为两段。
5 结论
1)本文基于FFSR目标捕获任务背景,针对Radau伪谱法求解轨迹优化问题的均衡矛盾,提出了一种基于阈值的自适应分段升阶改进策略。通过在迭代过程中计算偏差矩阵、比较时间阈值,实现了对分段位置、配点数的有效分级决策,为机器人快速规划行动路径提供了支撑。
2)与全局伪谱法不同,阈值法充分发挥了分段策略的优势,避免了单一区间配点过多的问题,从而显著减少计算耗时。 与自适应曲率分段伪谱法相比,阈值法采用相对保守的分段策略,最大限度地利用了解曲线在光滑区域的特点,通过提升多项式阶数实现了更快的收敛速度和更小的末端误差。
3)将本文提出的AT-RPM方法应用于平面二连杆FFSR目标捕获任务,仿真结果表明AT-RPM方法相比全局方法和曲率方法,计算耗时缩短至13.19 s,末端误差减小至3 mm,具有最好的性能表现。未来将考虑研究受到外部扰动下的FFSR路径优化问题,进一步提升算法的鲁棒性和适用性。
1自由飞行空间机器人在轨服务[1]
Fig.1A free-flying space robot performing on-orbit servicing[1]
2自由飞行空间机器人结构示意图
Fig.2Schematic diagram of the free-flying space robot
3视场约束示意图
Fig.3Illustration of the field-of-view constraint
4避障约束示意图
Fig.4Illustration of the obstacle avoidance constraint
5分段伪谱法示意图
Fig.5Illustration of the segmented pseudo-spectral method
6自适应分段升阶改进策略示意图
Fig.6Illustration of the adaptive segmented upgrading strategy
7自适应阈值分段升阶伪谱法求解示意图
Fig.7Schematic diagram of the adaptive threshold segmented upgrading pseudo-spectral method
8FFSR目标捕获运动可行解
Fig.8Feasible trajectory solution for the FFSR target capture maneuver
9FFSR运动过程状态量与控制律变化
Fig.9Variation of FFSR states and control laws during motion
1FFSR构型系数
Tab.1Configuration parameters of the FFSR
2FFSR轨迹优化求解效果对比
Tab.2Comparison of trajectory optimization performance for the FFSR
3自适应阈值增益λ实验分析
Tab.3Experimental analysis of adaptive threshold gain λ
赵亮亮, 李雪皑, 赵京东, 等. 面向航天器自主维护的空间机器人发展战略研究[J]. 中国工程科学.2024,26(1):149.ZHAO Liangliang, LI Xuekai, ZHAO Jingdong,et al. Development strategy of space robots for autonomous repair and maintenance of spacecraft[J]. Strategic Study of CAE,2024,26(1):149. DOI:10.15302/J-SSCAE-2024.01.014.
GAO Y, CHIEN S. Review on space robotics: Toward top-level science through space exploration[J]. Science Robotics,2017,2(7):eaan5074. DOI:10.1126/scirobotics.aan5074.
闫弘旭. 面向空间抓捕任务的机械臂运动规划算法设计[D]. 成都: 电子科技大学,2024.YAN Hongxu. Motion planning algorithm design for space capture tasks using robotic arms[D]. Chengdu: University of Electronic Science and Technology of China,2024.
AL A A, SHI J, ZHU Z H. Path planning of 6-dof free-floating space robotic manipulators using reinforcement learning[J]. Acta Astronautica,2024,224:367. DOI:10.1016/j.actaastro.2024.08.015.
HONG M, WANG L, LIU L,et al. Trajectory planning of a free-floating dual-arm space robot with minimal base disturbance in obstacle environments[J]. Advances in Space Research,2024,74(3):1410. DOI:10.1016/j.asr.2024.04.050.
TANG Xiaojun, CHEN Jie. Direct trajectory optimization and costate estimation of infinite-horizon optimal control problems using collocation at the flipped legendre-gauss-radau points[J]. IEEE/CAA Journal of Automatica Sinica,2016,3(2):174. DOI:10.1109/JAS.2016.7451105.
崔乃刚, 郭冬子, 李坤原, 等. 飞行器轨迹优化数值解法综述[J]. 战术导弹技术,2020(5):37.CUI Naigang, GUO Dongzi, LI Kunyuan,et al. A review of numerical methods for flight vehicle trajectory optimization[J]. Tactical Missile Technology,2020(5):37. DOI:10.16358/j.issn.1009-1300.2020.1.536.
ADU C E, CHUQUIURE C E R, ZHANG B,et al. Bring the heat: Rapid trajectory optimization with pseudospectral techniques and the affine geometric heat flow equation[J]. IEEE Robotics and Automation Letters,2025,10(4):4148. DOI:10.1109/LRA.2025.3547299.
梅杰, 马广富, 杨博. 基于Legendre伪谱法的卫星轨道转移燃料最优控制[J]. 哈尔滨工业大学学报,2010,42(3):352.MEI Jie, MA Guangfu, YANG Bo. Optimal fuel control for satellite orbit transfer based on legendre pseudospectral method[J]. Journal of Harbin Institute of Technology,2010,42(3):352. DOI:10.11918/j.issn.0367-6234.2010.03.004.
REDDIEN G W. Collocation at gauss points as a discretization in optimal control[J]. SIAM Journal on Control and Optimization,1979,17(2):298. DOI:10.1137/031702.
GARG D, PATTERSON M A, FRANCOLIN C,et al. Direct trajectory optimization and costate estimation of finite-horizon and infinite-horizon optimal control problems using a radau pseudospectral method[J]. Computational Optimization and Applications,2011,49(2):335. DOI:10.1007/s10589-009-9291-0.
LI Shi, DUAN Guangren. A pseudospectral method for trajectory optimization of free-floating space manipulator[C]//Proceedings of the 31st Chinese Control Conference. Heifei, China: IEEE,2012:2395.
ZHANG Ouyang, YAO Weiran, DU Desong,et al. Trajectory optimization and tracking control of free-flying space robots for capturing non-cooperative tumbling objects[J]. Aerospace Science and Technology,2023,143:108718. DOI:10.1016/j.ast.2023.108718.
仲小清, 邵翔宇, 许林杨, 等. 自适应Radau伪谱法自由漂浮空间机器人轨迹规划[J]. 哈尔滨工业大学学报,2018,50(4):49.ZHONG Xiaoqing, SHAO Xiangyu, XU Linyang,et al. Trajectory planning for free-floating space robots using adaptive radau pseudospectral method[J]. Journal of Harbin Institute of Technology,2018,50(4):49. DOI:10.11918/j.issn.0367-6234.201708114.
ZHANG O, LIU Z, SHAO X,et al. Learning-based task space trajectory planning framework with preplanning and postprocessing for uncertain free-floating space robots[J]. IEEE Transactions on Aerospace and Electronic Systems,2025,61(3):6325. DOI:10.1109/TAES.2025.3527428.
SHAO X, YAO W, LI X,et al. Direct trajectory optimization of free-floating space manipulator for reducing spacecraft variation[J]. IEEE Robotics and Automation Letters,2022,7(2):2795. DOI:10.1109/LRA.2022.3143586.
DARBY C L, HAGER W W, RAO A V. An hp-adaptive pseudospectral method for solving optimal control problems[J]. Optimal Control Applications and Methods,2011,32(4):476. DOI:10.1002/oca.957.