第1章绪论
1.1引言
随着计算机技术、网络通信技术和控制科学的日益发展与交叉渗透,控制系统的结构变得越来越复杂,空间分布越来越广,对系统控制性能的要求也越来越高。控制系统已由封闭集中体系逐渐向开放分布式体系发展。集中式控制系统和集散式控制系统都有一些共同的缺点,即随着现场设备的增加,系统的布线十分复杂、成本大大提高、抗干扰性较差、灵活性不够、扩展不方便等。为了从根本上解决这些问题,必须采用分布式控制系统来取代*立控制系统。分布式控制系统将控制功能下放到现场节点,不需要中央控制单元集中控制和操作,而是通过智能现场设备来完成控制和通信任务。将计算机网络系统应用于控制系统中,其可以代替传统的点对点式的连线,使得众多的传感器、执行器和控制器等主要功能部件通过网络相连接,相关的信号与数据通过通信网络进行传输和交换,避免了彼此间专线的敷设,可有效地减少系统的重量和体积,方便系统的安装与维护,提高系统的诊断能力,可以实现资源共享、远程操作和控制。这种传感器、控制器、执行器等通过实时网络构成的闭环反馈控制系统称为网络化控制系统(networked control systems,NCS),是目前控制科学与飞速发展的计算机网络、通信技术相结合的产物W。而且,网络作为各个应用领域中不可缺少的互联媒介,正潜移默化地改变着人们传统的生产和生活方式。图1-1展示了网络化控制系统的典型结构和信息流[2]。
网络化控制系统主要分为网络控制(control ofnetworks)、基于网络的控制(control over networks)和多智能体系统(multi-agent systems)三个研究领域。
(1)网络控制主要是对通信网络的网络路由、网络流量等的调度与控制,是针对网络自身的控制,可以利用运筹学和控制理论等方法来实现[3]。
(2)基于网络的控制是对被控系统的控制,网络只是作为一种传输通道,考虑网络自身存在的问题对系统的影响[4,5]。目前,很多复杂的控制系统如无线网络机器人、运输工具、远程遥控操作、基于Internet的远程教学和实验、远程医疗、制造业设备、兵器系统,以及现场总线(fieldbus)和工业以太网(industrial ethernet)技术等,本质上都可归结为基于网络的控制系统。
(3)多智能体系统主要是研究网络的拓扑结构与多智能体之间的相互作用对整个系统行为的影响。
20世纪70年代,智能体(agent)的思想起源于人工智能领域,对智能任务的推理进程和物理符号的内部表示构成了智能体的*初轮廓[61。此后,众多领域的学者开展了智能体方面的相关研究和探讨,他们针对不同的研究对智能体的含义给出了不同的界定。迄今为止,智能体的概念还不存在一个统一的定义。在大多数文献中,智能体的定义常被引用为以下两种形式。
(1)MaesW将智能体定义为试图在复杂的动态环境中实现一组目标的计算机系统。
(2)根据智能体的特性,Wooldridge和JenningsM给出了智能体弱定义和强定义的概念。智能体的弱定义指该实体具有自治性(autonomy)、社会性丨social-ability)、反应性(reactivity)和主动性(pro-activity)等基本特性;智能体的强定义指该实体不仅具有弱定义中的基本特性,而且还具有移动性、通信能力、协同性、理性或其他特性。一般认为智能体的典型特性就是弱定义中提及的几种性能,自治性是智能体的一个核心概念。
受到社会性昆虫的启发,研究者提出了多智能体系统的概念。Durfee等将多智能体系统定义为多个智能体组成松散的耦合结构,智能体之间通过相互作用、相互合作,从而解决单个智能体由于能力、知识或资源上的不足而无法解决的问题,或者即使能解决但效率很低的问题。在多智能体系统中,各个智能体的行为既具有局部效应也具有全局效应。多智能体系统的协作能力超过了单个智能体,这是多智能体系统产生的一个主要原因。多智能体系统在现实生活中随处可见,如多机器人系统、多卫星系统、空中飞行器编队,水下航行器队列等。此外,控制-物理系统(cyber-physical system)也可以抽象为多智能体系统。近年来,多智能体系统已经发展为一门新兴的复杂系统科学,同时它也是一门涉及生物、数学、物理、控制、计算机、通信及人工智能的综合性交叉学科。图1-2展示了多智能体系统的结构[1°]。
多智能体系统的主要特点表现在如下几个方面[11]。
(1)协作性:多智能体系统中的智能体可以相互协作,解决单个智能体无法解决的问题。
(2)并行性:多智能体系统可以通过智能体间的异步并行活动,提高处理复杂问题的质量和效率。
(3)易扩展性:多智能体系统松散稱合的特征,保证了其组件的可重用性和可扩充性(scalability)。
(4)分布性:多智能体系统的数据、资源分散保存在系统环境的各个智能体中,表达了系统描述问题的分布性。
当被研究的复杂系统包含中等个数的个体,并且个体在空间上分布时,每个个体利用局部的信息进行决策,个体具有一定的学习能力,当个体之间存在灵活的交互时,采用多智能体系统的建模方法进行研究可以获得很好的效果[12]。因此,基于多智能体系统的建模方法已成为研究复杂系统的重要方法之一。近年来,多智能体系统的研究已经成为复杂系统研究的一个热点。
研究多智能体系统的主要目的就是通过大量智能体(简单的个体)之间的相互协作取代单个的昂贵系统去完成一些复杂的任务。对多智能体系统的研究重点可以分为以下三个方面[1Q]。
(1)从人工智能的角度进行规划决策研究。
(2)根据多智能体系统交互性的特点进行网络结构的配置设计。
(3)从控制理论出发对多智能体系统进行控制律设计以达到相应的控制性能要求。
可见,从控制的角度出发对多智能体系统进行研究具有必然的发展趋势。目前,多智能体系统的协作控制(cooperative control)问题引起了不同领域(如生物学、物理学、计算机科学、系统与控制科学,以及控制工程方面)科研工作者的广泛关
注。例如,生物学家研究生物体通过内部合作涌现出各种群体现象的一些规则;物理学家则通过建立模型模拟群集现象并通过仿真进一步解释这些有趣的现象;而控制领域的研究人员则通过设计控制律来实现这些群体行为,并将其用于真实的群集智能体以完成预定的目标[13-29]。多智能体系统已经逐步渗入到社会生活的各个领域。例如,随着交通领域运输压力的增大,单个交通工具已无法满足日益增长的运输要求。为了增加实际运力、提高系统可靠性,多车辆系统应运而生。通过将多个车辆编队运行,不但有效地避免了交通事故,增加了运输密度,更重要的是通过智能型车辆的应用,减轻了驾驶员的负担,进而保证了运输系统在恶劣气候环境下的正常运行。在军事领域,通过无人战斗机的协调控制有效地加强了部队的作战能力、攻击性和防御力。通过采用不同功能的、成本低廉的军用多智能体系统代替士兵从事对未知区域的侦察、排雷、搜救或区域性防卫等任务,大大降低了执行军事任务过程中存在的危险性和成本,提髙了效率和成功率。在航天领域,通过采用卫星群代替单个卫星对星体表面进行成像,有效地提高了系统的灵活性、成像精度和质量。所以,通过对智能体群的协调控制与协作运行,多智能体系统所能达到的效果远远超过其个体性能的累加和。在多智能体的协调协作控制中,为了完成一些复杂的任务或者达到共同的目标,智能体之间需要相互作用、相互影响,关于某些感兴趣的量*终达到一致。通常,称该问题为一致性问题(consensus or agreement problem)131,32]。而一致性算法(或协议(protocol))则表征了智能体之间信息传递的规则。一致性问题是智能体之间协调协作的基础。因此,研究网络化多智能体系统的一致性问题具有重要的理论意义和应用价值。
预测控制是近年来发展起来的一类新型的计算机控制算法。由于它采用多步测试、滚动优化和反馈校正等控制策略,因而控制效果好,适用于控制不易建立精确数字模型且比较复杂的工业生产过程,所以它一出现就受到国内外工程界的重视,并已在石油、化工、电力、冶金、机械等工业部门的控制系统中得到了成功的应用。现在比较流行的算法包括:模型算法控制(model algorithm control,MAC)、动态矩阵控制(dynamic matrix control,DMC)、广义预测控制(generalized predictive control,GPC)、广义预测极点(generalized predictive pole-assignment,GPP)控制、内模控制(internal model control,IMC)、推理控制(inferential control,IC)等。本书将单个网络化系统的网络化预测控制方法推广到网络化多智能体系统的研究中。与传统的预测控制方法不同,网络化预测控制系统主要由预测控制发生器和网络时延(时滞)补偿器构成(图1-3)。预测控制发生器主要用来产生一系列预测控制信号,网络时延补偿器主要用来补偿时延。在信号传输策略上充分地利用了网络能够同时传输一系列数据包的特征,可将t时刻所有的预测信息放到一个包中,通过网络传输到被控对象。在接收到该包后,网络时延补偿器可以从被控对象可用的预测序列中选择*新的预测控制信号对系统进行控制。
1.2多智能体系统一致性问题的发展概况
一致性问题的研究始于20世纪60年代的管理科学及统计学其中,极具影响力的文献是DeGroot于1974年撰写的Reaching a consensus。20世纪80年代,Borkar和Varaiya与Titsiklis等[35]将同步渐近一致性应用于分布式决策系统的研究中。1987年,Reynold按照自然界中鸟群、鱼群等群体的特点对系统建立了计算机模型,并提出了著名的类鸟群(Boid)模型(也称为人工鸟群模型)。Boid模型要求群体行为满足三条规则:①避免碰撞(collision avoidance):与邻域内的智能体避免发生碰撞;②速度匹配(velocity matching):与邻域内的智能体速度保持一致;③聚合(cohesion):与邻域内的智能体保持紧凑。1992年,Benediktsson和Swain[371将统计学中一致性的思想运用于多传感器的信息融合问题。从此,一致性问题在系统与控制理论领域中的研究拉开了序幕。1995年,Vicsek等[29]从统计力学的角度提出了描述自驱动粒子相位移动的**模型一维塞克(Vicsek)模型。研究表明,当个体密度较大且系统噪声较小时,所有个体的运动方向趋于一致。实际上,Vicsek模型是Boid模型的一个特例,它只保留了Boid模型中的速度匹配规则。Jadbabaie等[38]应用图论和矩阵论方法对Vicsek模型的一致性行为给出了理论解释,分析了图的连通性对系统一致性的影响,证明了如果这些图在邻接的有限时间区间内是联合连通(jointly connected)的,那么系统中所有个体的运动方向将趋向一致。2003年,Tanner等,《1从理论方面解释了Boid模型。基于文献[41]和[42],Olfati-Saber和Murray[43]利用图的拉普拉斯矩阵的性质研究了一阶积分器多智能体系统的一致性问题,正式给出了一致性问题的可解性概念和协议概念,提出了一致性问题的理论框架,揭示了图的代数连通度与系统收敛速度和时滞容忍上界的关系,给出了算法达到平均一致的充要条件。文献[44]介绍了一致性问题综述。2005年,Ren等分析了二阶积分器多智能体系统的一致性问题,指出通信拓扑包含有向生成树对于系统达到渐近一致的重要性。拉普拉斯矩阵的引入使一致性问题的研究得到质的飞跃,即从仿真模拟阶段进入到理论分析阶段。从此,图论成为一
展开