基于间接型迭代学习控制的四旋翼轨迹跟踪

2022.07.22

焦金彦+薛建平+董新民+刘娇龙
摘要：针对反推控制方法在四旋翼飞行器轨迹跟踪中存在动态误差的问题，提出改善轨迹跟踪性能的间接迭代学习控制算法。首先将飞行器分为姿态和高度全驱动控制通道和水平轨迹欠驱动控制通道；然后基于反推控制方法分别设计了全驱动和欠驱动通道的稳定控制器，进而采用PID型迭代学习算法对反推控制器参考输入信号进行更新优化；最后，采用压缩映射原理和[λ]范数理论证明了算法的收敛性。仿真实验结果表明，PID型迭代学习律能够有效改善反推控制器的控制效果，实现对期望轨迹的完全跟踪。
关键词：四旋翼飞行器；反推控制；迭代学习控制；姿态控制；轨迹跟踪
中图分类号： TN876?34； TP273 文献标识码： A 文章编号： 1004?373X（2017）23?0113?06
Abstract： The backstepping control method has dynamic error in the trajectory tracking of the quadrotors， so an indirect iterative learning control （ILC） algorithm is proposed to improve the performance of trajectory tracking. The control of the aircraft involves the attitude and height full?drive control channel， and horizontal trajectory underdrive control channel. A stable controller of the full?drive and underdrive control channels was designed on the basis of backstepping control method. The PID iterative learning algorithm is used to perform the update optimization for the reference input signal of the backstepping controller. The contracting mapping principle and λ?norm theory are adopted to verify the convergence of the algorithm. The simulation results show that the PID iterative learning law can improve the control effect of the backstepping controller effectively， and realize the full tracking for the expected trajectory.
Keywords： quadrotor； backstepping control； iterative learning control； attitude control； trajectory tracking
0 引言
四旋翼飞行器具有简易灵活、体积小、稳定性高等特点，广泛应用于航拍、救援、货物投送等领域，适合于室内和城市飞行，同时也是开展科学实验的良好平台。因此，得到了广泛关注和研究。
目前关于四旋翼飞行器的控制方法主要有反推控制[1]、PID控制[2]、LQR控制[3]、滑模控制[4]等，这些方法都可以实现四旋翼无人飞行器的姿态控制与轨迹跟踪控制。当飞行器进行固定轨迹或周期运动时，比如，在执行输电线路巡检[5]、公路巡查、快递投送的任务时，虽然上述控制律均可实现飞行器的稳定与控制，但也存在瞬态响应过程跟踪误差较大的问题。因此，如何使得四旋翼飞行器能够精确跟踪预定轨迹是本文研究的主要内容。
迭代学习控制（ILC）思想最早是由日本学者Uchiyama提出[6]，但直到1984年Arimoto等人提出D型学习算法并证明其收敛性[7]，才开启了迭代学习控制的研究热潮。迭代学习控制主要针对具有固定运动轨迹特点的对象，通过不断地重复同一动作或过程，不断修正控制输入，最终实现期望的控制目标。随着研究的深入，迭代学习控制应用领域越来越广泛，如抛射体控制[8]、列车控制[9]、机器人控制[10]、间歇式过程控制[11]等。
目前，基于迭代学习控制方法的四旋翼飞行器轨迹跟踪控制已引起了学者的关注和研究。ETH Zurich团队利用高精度的实验平台开展了一系列四旋翼飞行器自主飞行研究，提出了采用历史数据优化四旋翼飞行器轨迹控制精度的方法，通过设计干扰信号估计器估计系统干扰，并采用优化性能函数的方法设计控制律[12]；文献[13]提出了四旋翼飞行器的在线迭代学习控制，基于直接型PD学习算法设计更新律，有效提高了学习速度，并通过仿真实验探讨了参数选择对收敛速度的影响规律；文献[14]提出了PID控制与迭代学习控制相结合的四旋翼飞行器控制方法，并基于线性离散模型和堆积方法（lifted technique）分析设计控制律，取得了较高的控制精度。
以上研究表明，迭代学习控制方法对于提高四旋翼飞行器轨迹跟踪精度效果明显，然而上述算法基本都是基于线性模型展开研究，算法仅在工作点附近有效；另外，文献[13]研究的是直接型学习控制律，在学习初始时刻，轨迹跟踪误差比较大：一方面是由于选取的初始控制输入不合适；另一方面是因为直接型ILC算法没有镇定回路。
为解决上述问题，本文研究如何基于间接型ILC算法设计四旋翼的姿态与轨迹跟踪控制器，实现对期望轨迹的高精度控制。基本思路是在反推控制器的外部增加一个ILC迭代修正回路，用于修正内部反推控制器的参考输入指令，从而提高反推控制方法的控制精度。该方法不会改变现有的控制器结构，仅仅增加了一个前馈修正回路，既不影响飞行器的稳定性，又能提高轨迹跟蹤的精度。
1 四旋翼飞行器模型
四旋翼飞行器依靠四个旋翼产生升力和力矩，从而实现升降、偏航、滚转、俯仰、侧向和横向的运动，按照其运动的方式可以分为“+”型和“×”型，本文基于“+”型结构的四旋翼飞行器进行研究。
2 控制器设计
传统的反推控制器基本能够实现四旋翼飞行器的轨迹跟踪任务，但存在相角滞后、时间延迟等因素制约控制精度，因此，本文主要研究如何基于ILC方法改善四旋翼飞行器反推控制器的轨迹跟踪精度。基本思路为：以反推控制方法设计四旋翼飞行器的姿态与轨迹跟踪控制律，实现基本的稳定控制；其次，设计外环迭代更新回路以修正反推控制器的输入参考值[Us，k，]经过多次迭代学习更新，寻找到合适的反推控制器输入指令，从而实现对期望轨迹的完全跟踪。控制器基本结构如图1所示。
2.1 内环反推控制器设计
四旋翼飞行器具有欠驱动性，主要表现在水平位移无法通过输入直接进行控制，必须通过控制滚转和俯仰运动间接实现，而飞行器的偏航、升降、滚转、俯仰运动可以通过输入直接进行控制，因此可以将反推控制器分为欠驱动通道和全驱动通道进行设计。
式（18）即为水平轨迹跟踪时，所对应的内环反推控制器的期望滚转角[φ]和期望俯仰角[θ]。通过以上设计即可由水平轨迹的期望值得到与之对应的期望姿态角信号，结合全驱动通道的姿态稳定与跟踪控制器，即可完成对期望水平轨迹的跟踪控制任务。
2.2 外环ILC控制器设计
在2.1节中设计了基于反推控制方法的四旋翼飞行器姿态与轨迹控制器，并基于Lyapunov稳定性理论分析了算法的稳定性。前人研究表明，反推控制在四旋翼飞行器轨迹跟踪控制中虽然可以完成对目标轨迹的跟踪任务，但同时也存在输出位置响应相角滞后、超调等现象。接下来将研究设计基于ILC方法的更新律，对反推控制精度进行改善，首先建立反推控制下的四旋翼飞行器闭环数学模型，而后采用ILC方法设计外部迭代修正回路，通过采用历史数据修正内部反馈控制的偏航角和三轴位置的参考信号，提高飞行器轨迹跟踪精度，改善控制效果，最终实现运动周期上轨迹的完全跟踪。
2.2.1 闭环系统建模
將反推控制律式（9）～式（12）以及水平轨迹控制律式（15）～式（18）代入到四旋翼飞行器数学模型式（3）和式（4）中，可以得到在反推控制作用下，系统闭环数学模型为式（19）所示的线性系统。
2.2.2 ILC控制器设计
对模型式（19）而言，输出量即为四旋翼飞行器的偏航角和三轴位置，输入量为期望的偏航角和三轴位置，在反推控制器作用下，该输入指令会造成跟踪误差，因此需要对该输入指令进行修正，以实现对期望姿态角和三轴位置的完全跟踪。本文采用PID型迭代学习更新律修正内部反推控制器的输入指令。
3 仿真与分析
为了验证上述算法的可行性和有效性，本节设计了数值仿真实验，对算法的收敛性进行验证。在仿真中，四旋翼飞行器在反推控制器和间接型ILC控制器控制时的偏航角及三轴位置期望值均相同，其中期望轨迹水平横向位移为[y=cos t]，水平纵向位移为[x=sin t，]竖向位移为[z=1-e-10t，]单位为m；期望的偏航角为[ψ=t，]单位为rad，仿真时间为0～6.28 s。沿三坐标轴、三维空间轨迹跟踪误差分别定义为式（33）和式（34），式（33）中，“[?]”表示四个跟踪量[x，][y，][z，][ψ]沿迭代轴误差变化采用误差函数的[L1]范数度量。
3.1 反推控制仿真与分析
四旋翼无人飞行器轨迹跟踪的反推控制仿真结果如图2所示。从图中可以看出，反推控制器基本实现了对期望轨迹和偏航角的跟踪控制，但也存在明显的跟踪误差：对偏航角的控制存在0.6 rad左右的稳态误差；对高度[z]的跟踪有较大的时间延迟，并且存在超调现象；水平轨迹的跟踪也存在明显的稳态误差，接近0.2 m。
3.2 间接型ILC仿真与分析
图3是在反推控制器基础上引入外环间接型ILC的仿真图。图3（a）中[k=d]蓝色曲线为期望轨迹，其余3条曲线分别为迭代第1次、第5次、第10次的仿真结果。从仿真图可以看到，随着ILC外环修正回路对参考值的不断修正，飞行器逐渐跟踪上了期望的偏航角与轨迹，三轴位置误差也随之减小。图3（b）是偏航角控制的稳态误差在10次迭代过程中的变化情况，在经过1次学习后，即[k=2]时，误差明显减小，而后逐渐减小至0 rad。图3（c）是三轴位置跟踪误差随迭代次数的变化规律，可以看到三轴位置跟踪误差在ILC学习律作用下迅速减小，在经过6次学习后跟踪误差已经趋于0。
4 结语
本文主要完成了四旋翼无人飞行器的间接型迭代学习轨迹跟踪控制器设计，控制器由内部反推控制器和外部迭代修正控制器两部分构成。首先设计了四旋翼欠驱动通道和全驱动通道的反推控制器，并基于Lyapunov稳定性理论分析算法稳定性；其次设计了外部迭代更新算法，更新内部反推控制器的参考输入，并基于压缩映射原理和[λ]范数理论证明了算法的收敛性。为验证算法的有效性，设计了数值仿真实验，仿真结果表明，迭代算法对反推控制器的控制效果具有显著改善作用，可以有效解决反推控制律在四旋翼飞行器轨迹控制中存在相位滞后和瞬态响应误差较大的问题。本文是基于零初始状态误差设计的迭代更新律，由于实际环境下会存在初始位置误差、系统建模误差、外界扰动等因素，这些都有可能造成算法失效，因此下一步需要对算法的鲁棒性做进一步深入研究。
参考文献
[1] 田聪玲.基于反步法的四旋翼飞行器非线性控制[D].哈尔滨：哈尔滨工业大学，2014.
[2] DONG W， GU G Y， ZHU X Y， et al. Development of a quadrotor test bed?modelling， parameter identification， controller design and trajectory generation [J]. International journal of advanced robotic systems， 2015， 12： 1?14.
[3] HOW J P， BETHKE B， FRANK A， et al. Real?time indoor autonomous vehicle test environment [J]. IEEE control systems magazine， 2008， 28（2）： 51?64.
[4] DERAFA L， BENALLEGUE A， FRIDMAN L. Super twisting control algorithm for the attitude tracking of a four rotors UAV [J]. Journal of the Franklin institute?engineering and applied mathematics， 2012， 349（2）： 685?699.
[5] 赵晨，杜勇.四旋翼无人机在输电线路巡视中的应用[J].湖北电力，2012，36（6）：35?36.
[6] UCHIYAMA M. Formation of high?speed motion pattern of mechanical arm by trial [J]. Transactions of the society of instrumentation and control engineers， 1978， 19（5）： 706?712.
[7] ARIMOTO S， KAWAMURA S， MIYAZAKI F. Bettering operation of robots by learning [J]. Journal of robotic systems， 1984， 1（2）： 123?140.
[8] LIU Jiaolong， DONG Xinmin， XUE Jianping， et al. Initial states iterative learning for three?dimensional ballistic endpoint control [J]. Memetic computing， 2017， 9（1）： 1?11.
[9] LIU Jiaolong， DONG Xinmin， XUE Jianping， et al. Spatial iterative learning control for motion systems with state?dependent parametric uncertainties [C]// Proceedings of the 35th Chinese Control Conference. Chengdu， China： IEEE， 2016： 3157?3161.
[10] BONDI P， CASALINO G， GAMBARDELLA L. On the iterative earning control theory for robotic manipulators [J]. Journal of robotics and automation， 1988， 4（1）： 14?22.
[11] 贾立，施继平，邱铭森.一种间歇过程产品质量迭代学习控制策略[J].化工学报，2009，60（8）：35?40.
[12] SCHOELLIG A P. Improving tracking performance by lear?ning from past data [D]. Zurich， Switzerland： ETH Zurich， 2012.
[13] PIPATPAIBUL P， OUYANG P R. Application of online iterative learning tracking control for quadrotor UAVs [J]. ISRN robotics， 2013（4）： 1?20.
[14] MA Zhaowei， HU Tianjiang， SHEN Lincheng， et al. An iterative learning controller for quadrotor UAV path following at a constant altitude [C]// Proceedings of the 34th Chinese Control Conference. Hangzhou， China： IEEE， 2015： 4406?4411.
[15] 杨立本，章卫国，黄得刚.基于ADRC姿态解耦的四旋翼飞行器鲁棒轨迹跟踪[J].北京航空航天大学学报，2015，41（6）：1026?1033.