还剩2页未读,继续阅读
文本内容:
软着陆轨道优化问题的广义乘子法求解最优软着陆轨道求解0在月球表面进行温和的土地开发是月球勘探的重要前提由于月球表面没有大气,着陆器的速度必须完全由制动发动机抵消,所以,减少燃料消耗是增加有效载荷的关键所在月球最优软着陆问题是一类终端时间自由型最优控制问题,其求解方法分间接法和直接法本文以探月器环绕月心的旋转角速度为中间变量,通过积分变换,将月球最优软着陆问题转化为终端积分变量固定型最优控制问题在此基础上,通过优化变量的离散化,并采用四阶Admas预测-校正数值积分方法,将软着陆轨道优化问题转化为有约束非线性规划问题Nonlinear Programming,NLP,采用广义乘子法Generalized LagrangeMultiplier,GLM和拟牛顿法求解非线性规划问题,得出最优软着陆轨道仿真结果表明,该方法收敛速度快、优化精度高,对初始控制量不敏感、鲁棒性好,可以用于探月器机载计算机实时生成软着陆轨道着陆器东南角1ID月球软着陆方案式中,r为着陆器距月心矢径;v为着陆器在r方向上的速度;0为着陆器环绕月球表面的航程角;3是航程角的角速度;m为着陆器质量;u为月球引力常数;F为制动推力器的推力,0FF最优软着陆轨道设计的目的是寻找最优控制F取最小值,并且满足软着陆条件式中,t根据Pontryagin最大值原理最优、最软的地球轨迹快速解2积分变量单调递增
2.1月球最优软着陆问题是一类终端时间自由型且受终端约束的最优控制问题对于这类问题,一种方法是将终端时间作为设计变量进行优化本文选择状态量3作为积分变量这样只要推力方向角在(-90,90°)范围内,3的单调性就有保证,且其变化较为均匀为了使得积分变量单调递增,引入变量3则将方程组
(1)两边同时除以d3‘/dt,则转换为对3,积分,转化后的方程组为式中,二dco/dt=((F/m)cos2+23)/rV0为了得到各状态量随时间的变化,需增加微分方程如下式
(5)和式
(6)组成新的状态方程,因3=-3,所以实际计算时方程
(5)中第4式可以删去变换后的目标函数为变换后的约束条件为式中,3,至此,原终端积分变量不确定型最优控制问题转化为终端积分变量固定型最优控制问题转化后的问题一方面更适合于优化数值算法求解;另一方面终端约束条件减少了一个,终端约束更容易满足,收敛速度更快并且,转换过程也较为简单计算误差系数大,模型正演判识
2.2对于上述终端积分变量固定型最优控制问题,本文将其转化为非线性规划问题求解对于由最优控制问题转化成的非线性规划问题,从优化变量得出目标函数和约束条件时,需要借助于数值积分常用的经典四阶Runge-Kutta积分方法计算量偏大,不利于快速优化;四步四阶Admas外推方法计算量小,但其截断误差系数过大,精度偏低;四阶Admas预测-校正方法,其精度与四阶Runge-Kutta方法不相上下,但计算量只有后者的一半,可用于本文的快速优化直接离散化方法将整个最优控制过程根据积分变量分成若干个段,段的端点称为节点;选择节点处的控制变量作为优化参数,通过插值得到整个最优控制过程的控制变量;根据这些控制变量积分状态方程形成目标函数和约束条件,得到数学规划问题,具体如下1)将整个飞行过程分为N段,形成N+1个节点3,2)整个飞行过程的控制量可以通过在各个节点处线性插值得到,即3)采用四阶Admas预测-校正方法,从川经过上述处理,月球最优软着陆问题转化为非线性规划问题基于古典乘子法的约束优化方法
2.3lagrange求解有约束非线性规划问题时,罚函数法是一种比较常用的方法但从几何直观上看,罚因子越大,目标函数在约束集外部的几何形状也就越陡,这会给无约束最优化带来困难另一种理论上较好的方法是古典Lagrange乘子法该方法通过引入乘子项处理约束条件,然后求解无约束最优化问题但是对于稍复杂的实际问题,确定出合适的乘子比较困难广义乘子法则是把罚函数外点法与古典的Lagrange乘子法有机地结合起来,试图在罚因子适当大的情况下,借助于调节乘子逐次逼近原非线性规划问题的最优解,这样就避免了单纯使用外点法或古典Lagrange乘子法的缺点优化算法中,通常基于梯度信息的优化方法比非梯度法的计算量小基于上述分析,本文采用广义乘子法和拟牛顿法求解有约束非线性规划问题求解式的修正
2.
3.1具有等式约束的非线性规划问题的标准形式为式中,f,h定义增广Lagrange函数式中,入二[入采用广义乘子法求解式10的计算步骤如下1给定初始点x2以x得到解x3若I|h x4若置二QO,转步骤5;否则,直接进行步骤5o5采用下式修正乘子置k=k+1,转步骤2o对于步骤2中的无约束最优化问题式12,本文采用拟牛顿法求解牛顿法的制定
2.
3.2拟牛顿法是无约束最优化方法中最有效的一类算法BFGS算法的基本思想是,在x式中,p广义乘子法的稳定性3假设月球软着陆初始条件为:r优化过程中,对状态方程
(5),
(6)共积分3643次,在Visual C++
6.0平台下,工作站HP XW9300(CPU AMD
2.59GHz)耗时
0.641s图1图4为部分最优参数的变化曲线,〜h为高度,其他参数含义同前述为了方便对比,图中给出了由Pon让yagin最大值原理得出的理论最优解,相应的目标函数值J为了研究本文方法的稳定性,在(-20,40°)范围内随机选取初值,结果都能收敛其中,初值在(-10,30°)范围内时,计算量变化不大,耗时都小于1s由此说明,广义乘子法具有较强的鲁棒性和快速收敛性此外,仿真结果表明,减小罚因子的初值,能够增大收敛区间如初值取
0.2时,收敛区间可扩展至约(-30,75);初值减小为
0.02时,收敛区间可扩展至约(-50,80)但是,减小罚因子,会使收敛速度变慢,计算量增加广义乘子法41)通过积分变换,可以将对时间的积分转化为对状态变量的积分,使得终端积分变量得以确定转化后的问题更利于优化求解,且转化过程较为简单2)广义乘子法作为一种直接法,可以对最优控制问题进行快速求解,其得到的数值结果具有较高的精度同间接法相比,不需要猜测协态变量的初值,对初始控制量不敏感、鲁棒性好;同遗传算法等其他直接法相比,可以节省大量的计算时间,可用于快速优化3)采用广义乘子法求解最优控制问题时,减小罚因子的初值,可以增大收敛区间,但会使收敛速度变慢,计算量增加4)采用积分变换法和广义乘子法,可求解其他终端时间不确定型的轨道优化问题。