《《人工智能控制技术》_高学辉 习题及解答.docx》由会员分享,可在线阅读,更多相关《《人工智能控制技术》_高学辉 习题及解答.docx(16页珍藏版)》请在优知文库上搜索。
1、第一章1-1什么是人工智能?什么是智能控制?人工智能(AnifiCia1.Inte1.1.igence),英文缩写为AI它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。智能控制是研究怎么样利用机器模仿人脑从事推理规划、设计、思考、学习等思维活动,自动或智能的解决传统认为需要由专家才能处理的发杂问题。1-2主要的学习算法有哪些?请详细说明各种学习算法.(1)无监督
2、学习应用于神经网络、智能控制、模式识别等多个方面。神经网络中最典型的无监督学习是Hebb学习,其在神经网络中根据神经元连接间的激活水平调节神经网络的权值,类似乎控制系统的开环控制.在模式识别中如果缺乏足够的先验知识,难以人工标注类别,希望通过计算机完成或至少提供一些帮助,因此根据类别未知(没仃被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。(2)监督学习在1960年代的神经网络权值更新算法中就已经提出,有代表性的是6学习规则.同样在分类中监督学习是指利用一组己知类别的样本调整分类泯的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。S学习规则属于监笆学习规则,要根据神经
3、元的输出情况指导权值的更新,与无监督的Hebb学习规则相比,共进化方向更加明确,或者说优化目标和当前输出确定了进化方向。(3)强化学习(Reinforcement1.earning,RD,又称再励学习、评价学习或增强学习,是机器学习的位式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习也是神经网络重要的学习规则之一。强化学习的常见模型是标准的马尔可夫决策过程。强化学习可分为基于模式强化学习和无模式强化学习,或并从另外的角度可以分为主动强化学习和被动强化学习。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求
4、解强化学习问题所使用的算法可分为策略搜索算法和值函数搜索算法两类。深度学习模型可以在强化学习中得到使用,形成深度强化学习。1-3控制系统模型有哪些?请详细说明各种控制系统模型.I.时域卜状态方程微分方程或微分方程组(状态方程)是描述系统动力学或运动规律的基本模型形式,目前绝大多数系统模型都用状态方程描述。研究系统的动力学模型或运动方程的步骤可简要归纳如下:(1)、分析系统工作原理与结构组成,确定系统的输入址和输出量(2)、依据所遵循的科学规律,列写相应的微分方程或微分方程组。(3)、如有必要,消去中间变盘,求出仅含输入输出变量的系统微分方程。一般来说,大多数的实际系统都存在一定的非线性,但大部
5、分非线性系统的微分方程度以求的解析解,因此将非线性方程线性化时于解决实际问题具有十分重要的意义。进行线性化的主吸思想是:在预期工作点(通常是稔定状态点)附近,用通过该点的切线代替近似代替原来的曲线。常用到的数学方法是在该工作点附近进行泰勒级数展开。值得注意的是,并不是所有的非线性微分方程都能线性化,如像继电器特性这种本质非线性系统,在数学上不连续,也就不可导,即不满足泰勒展开条件。线性化的条件有以F两点:(1)、信号在工作点附近变化微量.(2)、信号在工作点附近能满足泰勒屣开条件。控制系统的状态方程是时域动态数学模型,求解状态方程可得系统在输入量和初始条件作用下的输出响应。随若计算机技术的进步
6、和发展,很多无法求得解析解的状态方程可以用数值解法通过计算机容易实现。因此用状态方程描述的时域下的动力学方程或运动方程模型越来越重要。2.夏领城下传递函数模型拉普拉斯变换法(简称拉氏变换法)求解线性微分方程,是将微分方程的求解转化为代数方程的求解,使计算大为简便,由此引入发频域的数学模型一传递函数“传递函数符系统的输入量、输出量与系统分隔开来,仅仪与系统的结构和参数有关,这样非常便于研究结构或参数变化对系统性能的影响。经典控制理论中广泛应用的频率法和根轨迹法,就是以传递函数为基础建立起来的,传递函数是经典控制理论中圾基本和最重要的概念。线性定常系统的传递函数,定义为零初始条件下,系统输出量的拉
7、氏变换与输入量的拉氏变换之比.设线性定常系统由卜述n阶线性格微分方程描述:Qn今C(C)+n1.Tc(O+a1.c(i)+a0c(t)=%今f(C)+ftm-r(t)+b1r(t)+h0r(t)式中C(I)是系统的输出量J(C)是系统的输入量.ao,1.t及时,瓦,九是与系统结构和参数有关的常数系数。输入输出量的各阶导数在1=时的值均为零,即零初始条件,则对上式两边分别求拉氏变换,并令C(三)=&c)1.RG)=8r(t)1.可得(OWSn+an_isn-i+ais+Oo)C(三)=(bmsm+bm.1.sm-i+b1.s+bo)R(三)于是,由定义得系统传递函数为G(三)=%=n.。+如HM
8、R(三)ts+-4n1+-+*+式中的分母称为系统的特征多项式。传递函数具有以卜性质:(1),传递函数是经过拉氏变换得到的,拉氏变换是一种线性运尊,因此传递函数只适用于线性定常系统。它是复变量S的有理其分式函数,具有复变函数的所有性质.之,且所有系数均为实数。(2)、传递函数只取决下系统或元件的结构和参数,而与输入圻的形式无关,也不反映系统内部的任何信息。它仪仅表达系统输出量与输入量之间的关系。(3)、传递函数只表达特定的两个量(输入员和输出员)之间的关系,当系统的输入量或输出量的选取发生改变时,其传递函数也将发生变化,但分母保持不变。(4)、传递函数是在零初始条件卜.得到的,因此得到的响应是
9、冬状态响应,当系统的初始状态不为零时,要另外考虑.(5)、传递函数与状态方程有相通性。可以容易在状态方程和传递函数之间转换。3.动态结构图控制系统一般由多个环节组合而成,每一个环节都有自己的输入量、输出量以及传递函数,由方程组求系统的传递函数,相当于线性方程组联立求解,如果系统组成环节较多,中间变员也较纵计算将较为现杂。控制系统的结构图是描述系统各部分之间或各子系统之间信号传递关系的数学图形,它表示了系统中各变量之间的因果关系以及对各变量所进行的运算,是控制理论中描述狂杂系统的一种简捷方法,也是控制系统数学模型的图形表达方式.从结构图能够直观的看出每一个环节在系统中的功能以及各环节输入量、输出
10、址之间的定量关系。控制系统结构图的基本组成单元有以下4种。(1)、信号线.信号线是带有箭头的直线,箭头表示信号的流向,在直线旁标记信号的时间函数或象函数,见图1.-1.(八)。(2)、引出点(或测量点)。引出点表示信号引出或测量的位置,从同一位置引出的信号在数值和物理性质方面完全相同,见图I-Kb),(3)、比较点(或综合点)。比较点表示对两个及以上的信号进行加减运算,“+”号表示信号相加,号表示相减,“+”号可以省略不写,见图IT(c).力、方框(或环节)。方框表示对前后两个信号进行的数学变换,方框中写入环节或系统的传递函数,见图17(d)。显然,方框的输出量等于方框的输入量与传递函数的乘积
11、。Kity1.M图1-1结构图的基本组成单位控制系统结构图的建立步骤如下:(1)、分析系统的工作原理与结构组成,幽定系统的输入量和输出量。(2)、建立系统各元件的微分方程并进行拉氏变换,求取件环节的传递函数并绘制各环节方框图。(3)、从输入量开始,按照信号的传递方向(输入在左边,输出在右边)用信号线依次将各方框连接起来,就得到系统的结构图。4.信号流图信号流图是另种表示控制系统结构图形形式数学模型,与结构图不同的是,信号流图基本符号少,便于绘制,而且可以利用梅逊公式直接求出系统的传递函数。但是信号流图只适用于线性系统,而结构图不仅适用于线性系统,还可用于非线性系统。信号流图是由节点和支路组成的
12、一种信号传递网络图,可以由微分方程组绘制,也可以由结构图转化而来。如图1-2所示为简球的结构图与信号流图之间的转换,变换中将结构图中的输入任、输出量变为节点,以小圆圈表示连接两个节点的定向线段,称为支路:将结构图中的方框去掉,传递函数标在支路的旁边表示支路增益:支路增益表示结构图中两个变量的因果关系,因此支路相当于乘法器,即有C=GR.图1-2信号流图由此可见结构图转换为信号流图的规则:将系统的输入量、输出量以及中间变量转化为节点;引出点转化为节点:综合点后的变量转化为节点方框去掉,将方框的输入量和输出量连起来形成支路。方框中的传递函数标在支路旁边,即为支路增益。在信号流图中,常使用以下名词术
13、语:(1)、源节点(或输入节点).只有输出支路的节点称为源节点,如图1-2中的R(三)和N(三)。它一般表示系统的输入量。(2),阱节点(或输出节点)。只有输入支路的节点称为阱节点,如图卜2中的C(三)。它一般表示系统的输出量。(3)、混合节点.既有输入支路又有输出支路的节点称为混合节点,如图1-2中的、Xa、X1.它一般表示系统的中间变量。(4)、前向通道.信号从源节点到阱节点传递时,每一个节点只通过一次的通道,称为前向通道。前向通道上各支路增益之乘积,称为前向通道总增益,一般用H表示。在图1-2中,对于源节点A)和阱节点C(三),有条前向通道,是R(三)TX1.X2-XC(三),其前向通路
14、总增益为4=。加;对于源节点MM和阱节点C(三),前向通道是MS)TXX,-as),其前向通路总增益为PN=K.(5)、单向路.如果回路的起点和终点在同一节点,而且信号通过每一个节点不多于一次的闭合通路称为单独回路,筒称回路。如果从一个节点开始,只经过一个支路乂回到该节点的,称为自回路,回路中所有支路增益之乘积叫回路增益,用4表示。在图卜2中共有两个回路,=栈,1.2=d.(6)、不接触回路。如果一信号流图有多个回路,而回路之间没有公共节点,这种同路叫不接触回路.在信号流图中可以有两个或两个以上不接触同路.在12中,有一对不接触回路,0%=bed。1-4学习和控制有哪些异同?学习和控制是在特殊
15、历史时期不同的体系下形成的不同术语,学习类的术语主要是以贝尔曼的动态规划为基础,主要术语有学习、状态、动作、奖励策略等,控制主要以庞特里亚金的极小值原理为基础,主要术语有控制、状态、控制器、成本函数等。1.学习:在人工智能术好体系中经常见到“学习”这个词,在控制术语体系中对应的是“控制”,当然由于控制和学习在实现方式上存在不同,不能完全等同,但是其作用基本类似。2 .状态:状态在学习的术语体系中般用表示,在控制体系中用表示,都是指系统模型的状态变量,比如电机中的电潦、电压等都可以作为状态变量。3 .动作:动作是学习术语体系的用语,一般用表示,在控制体系一般叫做控制器,用表示。其实质是控制模型达到期望的输出轨迹,或者说在动作下能够实现期望的策略。4 .环境:环境是学习术语体系的用语,在控制体系中叫做模型。5 .奖励函数:奖励函数是学习术语体系用语,一般用表示,在控制体系下通常用成本函数表示:它们的关系是:。例如在最优控制中,目标是找到最优的控制器U使得成本函数最小,那么在学习中的描述就是找到最优策略下的动作使得奖励函数最大。第二章2-1.神经网络的发展分为几个阶段?解:神经网络的发展大致可分为四个阶段。第一阶段属启蒙阶段。由心理学家麦克洛克(W.SJIcCuI1.och)和数理逻辑学家皮兹(KPittS)首先提出了第一个神经元网络模型一一H-P模型,开创了人工神经元