面向空间机器人在轨操控的任务规划模型研究

2022.10.11

阎慧+吴止锾+高永明+马凯航

摘要：任务规划技术是空间机器人实现自主在轨操控的核心，要进行规划问题的求解，必须要将实际的规划问题变为计算机可理解语义的数据模型。虽然目前在人工智能规划领域有多个成熟模型，且描述能力已经较为完备，但是由于空间机器人在轨工作的特殊性，还没有一种规划模型可以直接应用。根据空间机器人任务规划的要素和关系特性，在规划领域定义语言（PDDL）的基础上拓展了对资源和活动实例的定义，活动的持续时间和活动效果属性，提高了描述的准确性。
关键词：空间机器人；任务规划；自主在轨操控；成熟模型
中图分类号： TN911?34 文献标识码： A 文章编号： 1004?373X（2017）04?0004?05
Research on mission planning model for on?orbit control of space robot
YAN Hui1， WU Zhihuan1，2， GAO Yongming1， MA Kaihang1
（1. The Academy of Equipment， Beijing 100416， China； 2. Unit 63883 of PLA， Luoyang 471000， China）
Abstract： Mission planning is the core of autonomous manipulation of space robot. There is no any planning model applied to space robot directly because of the operation particularity of space robot on orbit. Based on the planning domain definition language （PDDL）， the resource definition， activity effect attribute and duration time are extended， and descriptive accuracy is improved according to the mission planning factors and relation characteristics of space robot.
Keywords： space robot； mission planning； autonomous on?orbit control； mature model
0 引言
空间机器人任务规划在任务确立到最终执行过程中起到重要的作用。任务规划过程是由空间机器人的状态和规划目标确定的规划问题作为输入，经过一定的决策方式（自主或非自主）得到规划结果。规划的结果是空间机器人执行的行动序列集合，空间机器人按照这个序列执行行动能够达到任务的规划目标。在解决规划问题之前，必须要对其进行合理的形式化描述。任务规划模型的意义在于将规划问题转化为计算机可理解语义的数据。目前常用的规划模型有STRIPS，ADL，PDDL，NDDL等。
STRIPS是经典的规划建模语言，也是其他规划建模语言的原始模型。ADL在STRIPS的基础上进行了扩展：状态中引入了“”符号、开放世界假设、目标中具有量化变量、目标允许析取式、变量可以有类型、允许条件效果、增加了等式谓词。通过这些扩展丰富了表述能力，使之更接近实际问题。PDDL是国际智能规划竞赛（IPC）的比赛语言，具有较完备的建模能力，将规划问题描述为对象、谓词、初始状态、目标说明和活动的集合。PDDL至今已经发展到3.1版本，其表达能力也不断提升。许多领域中实际应用的规划模型在PDDL的基础上进行扩展产生，如NASA把在PDDL的基础上扩展研究的NDDL作为其EUROPA框架的输入语言。
1 规划要素和关系
任务规划由空间机器人任务目标驱动，任务目标通常用目标状态、目标活动、任务周期等描述和限定规划过程和结果的相关信息。空间机器人的规划结果是一个选择的行动集合，每个行动代表空间机器人的一个工作事件，行动有时间、资源等信息，每个选择的行动都要满足关系限制。
1.1 规划要素
（1）行动（Action）：行动由组成空间机器人载荷和操作能力决定，决定了系统的任务能力，例如规划目标为，则系统必须具有能够将状态变为的Action。
（2）资源（Resource）：空间操作过程对资源的消耗非常敏感。空间机器人的资源除燃料、电能等传统意义上的资源外，还包括并发执行动作数量有限的执行设备等。
（3）状态（State）：状态主要包括空间机器人载荷分系统的工作模式和对传感器感知信息的抽象定义等信息。系统运行中状态可以由行动或一些突发事件改变。
1.2 要素关系
要素关系对任务规划起到约束和指导作用。
（1） “Action?Resource”关系：表现了活动对资源产生的影响。空间机器人的活动可能依赖某些特定的资源，活动的执行可能消耗一定量的资源。
（2） “Action?State”关系：表现活动对状态的影响，空间机器人的活动可能以某些特定的状态为限制条件，活动的执行可能改变状态的取值。
（3） “Action?Action”关系：由于主体的增多，各空间机器人操作行为之间可能存在一些无法用上述关系表示的逻辑关系，这时，就需要直接定义两个行为之间的逻辑关系，主要的“Action?Action”有时序关系等。
2 空间机器人任务规划模型
基于PDDL的建模规范，将规划问题分为规划域和规划任务两个部分，。其中，。规划域体现了规划要素及相互关系，规划任务体现了问题的输入（初始和目标）和输出（规划结果）。模型中元素定义为：表示对象空间、表示状态空间、表示资源空间、表示活动空间、表示约束空间、表示初始条件、表示任务目标、表示规划结果。下面对各種元素的定义进行详细描述。
2.1 对象
对象（Objcet）包括空间机器人和分系统。，为任务可调动空间机器人的总数，其中每个对象包括4个属性：。属性中表示空间机器人的惟一身份标识，为空间机器人的名称，为空间机器人的类型，表示该对象特有的属性。
2.2 状态
状态（State）表示空间机器人各分系统和设备的工作模式和状态，操作目标的状态等。STRIPS中的状态、PDDL中的谓词都包含了系统的状态信息。Domain中为状态集合。其中每个资源包含状态名称、默认状态值和取值范围。本文将状态定义为多值离散的，例如存储器的状态有记录、重放、空闲、备份4种离散状态。任务规划的核心是与规划目标有关的空间机器人状态以及可以改变和维持这些状态的空间机器人活动，比如“”，“”可以改变机械臂的状态。
2.3 资源
空间机器人上携带的燃料、电源的电量、存储设备的存储空间以及各类设备、装置均可以用资源（Resource）的形式进行描述。领域模型中资源包括。下面对资源定义中各属性进行描述：
（1）：表示资源的代号。
（2）：表示资源的名称。
（3）：表示资源类型，模型支持两种类型的资源表示：可恢复资源、不可恢复资源。资源在活动开始时消耗，活动结束后会释放掉部分可恢复型资源。有些活动也会增加可恢复型资源（比如下行数据可释放存储空间），不可恢复资源在消耗后不能恢复（比如燃料、供一次性使用的设备等）。
（4）：表示资源容量，资源的容量用整数表示，对于取值可能为连续的资源，也以离散的整数表示，即资源的消耗必须为整数个单位。对于独占设备认为其取值范围为，被占用时为，空闲时为。
2.4 活动
规划域中的活动指的是活动类型（Activitytype），描述的是空间机器人的能力，不包含其执行特性。Activitytype是任务规划的核心要素，一个活动类型对应一个或多个控制指令的集合，完成一个具体功能操作，具有可理解的实际意义。Activitytype包含属性为。Activitytype在PDDL中活动的基础上增加了表示活动类型的持续时间。下面详细描述各属性的作用：
（1）：属性保证了Activitytype在规划域中的惟一性。任务规划的结果是给Activitytype赋予了时间属性的活动实例，一个Activitytype可产生多个活动实例，活动类型和活动实例之间的关系与面向对象类与对象之间关系相似。
（2）：传统的规划模型不具有表示时间的能力，属性的加入解决了这一问题。空间机器人执行任何一个活动都需要耗费时间。可以是具体的数值，也可以用时间函数表示。
（3）：表示活动执行的前提条件，也即活动执行的约束条件。表示活动在实例化时必须满足约束条件，关于约束的性质在后面进行详细描述。
（4）：表示活动产生的影响，主要包括状态变化和资源变化两种影响。影响的生效时间既可能是活动执行前，也可能发生在活动执行后。通过和进行标记。对于资源变化，为避免共享资源带来的冲突，通常发生在活动执行前。可恢复型资源需要在活动执行后或活动执行意外终止时释放所占用的资源。而活动带来的状态改变，通常发生在活动完成后。例如表示活动结束后将一个状态从转变成，表示活动开始前占用数量为的资源，表示活动结束后释放数量的，活动对资源产生的影响如图1所示。
规划的过程要把活动类型进行实例化产生活动实例（）。一个活动类型可以多次实例化，比如活动类型为，而根据操作的需要，可以在不同时刻执行多次该活动，即生成多个具有不同时间属性的活动实例。活动实例可表示为，其中为活动的一个活动实例的开始时间。和共同决定了活动实例的执行特征。
2.5 约束
约束（Constraint）描述了空间机器人的“Action?State”，“Action?Resource”和“Action?Action”三种关系。STRIPS和PDDL中动作的，体现了约束的性质。约束的表现能力，决定了任务规划是否能够与现实世界很好的衔接。约束主要表现两种情况：一是活动的可行条件，二是活动的规律。可行条件即活动类型实例化中状态的条件限制和资源限制，是活动类型实例化符合现实的必然要求。另外，在执行任务时，有些活动之间存在一定的固定时序关系，通过约束定义可以大大缩减规划空间。
约束关系可以分为资源约束（Resource Constraint）、状态约束（State Constraint）和时间约束（Time Constraint）三类：
（1）资源约束。资源约束定义了活动类型实例化所需的最小资源余量。资源的时间窗口特点限制了活动实例在时间轴上的部署。活动实例只能部署在资源余量满足资源约束的时间窗口内，即活动实例的。为一个时间区间集合，该集合内的时间上资源余量满足活动的要求。
（2）状态约束。状态约束描述空间机器人活动类型实例化的状态前提。活动类型实例化除了受必要的资源限制，还应满足逻辑上的合理性。例如空间机器人执行机动活动，除了满足必要的燃料条件，还应保证基座处于开启状态且基座工作模式处于自由飞行模式。
（3）时间约束。时间约束描述了活动类型的执行时间限制和两个活动时间属性之间的关系。活动类型在实例化时按照时间约束确定其绝对时间属性（开始时间和结束时间）。时间约束有相对约束和绝对约束两类。相对时间约束表示两个活动类型执行时间之间的关系，最典型的相对时间约束是时序约束，即一个活动只能在另一个活动完成之后开始。绝对时间约束表示活动的时间属性和某个绝对的时间值之间的关系。
3 规划任务描述
MSR的系统组成和任务执行环境特点决定了任务规划的规划域，然而由于MSR系统完成任务的多样性和重复完成任务的能力，每个MSR系统可能完成多类任务，或者重复完成多次同类任务。通过任务模型可以对任务进行统一的抽象描述，每次任务开始后规划域是固定不变的（不发生异常事件的情况下），通过任务建模定义不同的任务，MSR自主协同任务规划系统根据任务模型引导任务规划的完成。每个任务独特的属性主要有初始條件、目标和规划结果。
（1）初始条件。初始条件定义了任务开始前状态条件集合和资源条件集合。对规划过程起到重要作用，决定了规划和协商的起点。基于不同的初始状态和资源条件完成相同目标所需的操作过程是不同的。
（2）目标。任务规划过程有目标驱动，规划的目标可以表示为。和分别定义了规划目标的两种表现形式，以一组状态取值的集合定义目标；以一组活动类型的集合定义目标。
（3）规划结果。规划的结果是一个可行的行动方案，模型建立时任务规划结束后为任务的全局规划方案，包含一组活动实例的集合。MSR中每个空间机器人的规划方案，其中。该活动实例中每个都满足其对应的，每个活动实例的执行都会产生的影响。系统在的作用下可以完成由到的转变。
4 基于GTL的模型表示
NASA在其多个航天器规划系统中采用了通用时间轴（Generalized Timelines，GTL）技术表示任务规划。本文将规划用Timeline的集合来表示，每个Timeline对应航天器的状态和资源的记录或映射值。Timeline能够直观地描述任务规划，活动的实例分布于Timeline上，且同一时间同一活动类型仅有一个活动实例。规划的结果也可以用Timeline进行正确性和安全性验证。时间轴的横向为时间，记录了活动、资源和状态随时间变化的动态性，纵向为状态、资源和活动类型。
（1）状态Timeline。状态Timeline表现了状态随时间的变化过程，如图2所示。任务规划结果的执行将导致状态变量从初始状态到目标状态的变化。状态的取值可能由活动改变，也可能随时间发生变化。
（2）资源Timeline。资源Timeline表现了资源随时间变化的过程，如图3所示。
从图3中可以看出，不可恢复型资源总是随时间递减的（如燃料），可恢复型资源在消耗后有可能得到补充继续使用。可恢复型资源有的在占用该资源的活动实例完成后会自动释放（如功率），有的需要其他具有补充该资源的效果的活动实例执行后才可恢复（如存储）。
（3）活动Timeline。活动Timeline可表示为每个活动类型的活动实例在时间上的分布Gantt图，如图4所示。任务规划过程是活动Timeline不断变化的过程，每个在Timeline中的活动实例都必须与状态和资源Timeline相对应，活动Timeline的变化也会导致状态和资源时间轴的动态变化。
5 模型应用实例
以一个想定任务的任务规划脚本为例说明模型的应用。想定任务的活动实例如表1所示。表中为每个活动实例对应的活动类型名称、编码，活动类型的开始时间和持续时间。
表1 空间机器人活动实例序列
模型表现方法如图5所示。图中用Gantt图表现了该任务的Timeline，任务管理人员可以直观地在Gantt图上观察活动实例的执行开始和持续时间，以及资源和状态随时间的变化情况。
6 结语
空间机器人任务规划模型是用建模语言对空间机器人执行任务过程进行语义的描述，从而使计算机能够很好的理解。本文通过对现有规划建模语言的研究分析，以PDDL语言设计基本原理为基础，拓展了对规划过程中资源和活动实例的定义，以及对活动的持续时间和活动效果属性。经过模型应用实例验证，本文研究的模型具备描述空间机器人任务过程的能力。能够支撑进一步任务规划研究工作。
参考文献
[1] 饶东宁，蒋志华，姜云飞.规划领域定义语言的演进综述[J].计算机工程与应用，2010，46（22）：23?25.
[2] 陈治科，熊伟，刘德生，等.在轨操作技术及国外发展分析[J].装备学院学报，2014，25（6）：63?68.
[3] 姜维，庞秀丽.提高卫星服务寿命的任务规划方法研究[J].自動化学报，2014（5）：13.
[4] CHIEN S， JOHNSTON M， FRANK J， et al. A generalized timeline representation， services， and interface for automating space mission operations [C]// Proceedings of Space Operations Symposium. Stockholm， Sweden： [s.n.]， 2012： 11?17.
[5] STROBEL V， KIRSCH A. Planning in the wild： modeling tools for PDDL [C]// Proceedings of Advances in Artificial Intelligence. Germany： Springer International Publishing， 2015： 273?284.
[6] FIKES R E， NILSSON N J. STRIPS： A new approach to the application of theorem proving to problem solving [J]. Artificial intelligence， 1972， 2（3）： 189?208.
[7] KOEHLER J， NEBEL B， HOFFMANN J， et al. Extendingplanning graphs to an ADL subset [J]. Recent advances in AI planning， 1999， 35： 273?285.
[8] LIANG Nannan. A description model of multi?step attack planning domain based on knowledge representation [J]. Acta electronica Sinica， 2013， 22（3）： 437?441.