Text
                    В.И.Козлов
СИСТЕМЫ
АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ
ЛЕТАТЕЛЬНЫМИ
АППАРАТАМИ


В. И. Козлов СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ЛЕТАТЕЛЬНЫМИ АППАРАТАМИ Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студентов авиационных специальностей высших учебных заведений МОСКВА «МАШИНОСТРОЕНИЕ» 19 79
ББК 39.57 К59 УДК 629.7.05 (075;8) Рецензент д-р техн, наук, проф. А. М. Батков Козлов В. И. К.59 Системы автоматического управления летательными аппаратами. — М.: Машиностроение, 1979.— 216 с., ил. В пер.: 65 к. В учебном пособии изложены принципы построения, схемы и особенности различных типов систем управления. Описана работа гироскопических уст¬ ройств. Рассмотрены принцип максимума Понтрягина, аналитическое конст¬ руирование регуляторов, дискретный и непрерывный фильтры Калмана— Бьюси. Описаны вопросы управляемости, наблюдаемости и модального управ¬ ления. Даны теоретические основы оптимального управления в игровой ситу¬ ации. Изложение традиционных вопросов систем управления построено на принципе последовательного усложнения математических моделей. 31808—202 К 202—79 3606040000 038(01)—79 ББК 39.57 6Т5.1 ИБ № 1760 Василий Иванович Козлов СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ЛЕТАТЕЛЬНЫМИ АППАРАТАМИ Редактор Л. Ф. Ермилова Технический редактор Л. Т. Зубко и И. Н. Раченкова Корректор А. И. Карамыликина Переплет художника Л. С. Вендрова Сдано в набор 27.12.79. Подписано в печать 16.07.79. Т-13227 Формат 60X90716. Бумага типографская № 2. Гарнитура литературная. Печать высокая. Уел. печ. л. 13,5. Уч.-изд. л. 14,5. Тираж 4300 экз. Заказ 1996. Цена 65 к. Издательство «Машиностроение», 107885; Москва, ГСП-6, 1-й Басманный пер., д. 3. Московская типография № 8 Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. Хохловский пер., 7. © Издательство «Машиностроение», 1979 г.
ПРЕДИСЛОВИЕ Управление полетом летательного аппарата (ЛА) заключается к выдерживании заданной траектории движения его центра масс, ори¬ ентации и стабилизации относительно центра масс. Решение этих задач обеспечивается автоматической или полуавтоматической сис* темами управления, в которых летательный аппарат является объ¬ ектом управления. В системы автоматического управления ЛА входят автопилоты и гироскопы, системы самонаведения и телеуправления, инерциаль¬ ные и другие системы. Все это рассмотрено в настоящем учебном пособии. Одна из существенных особенностей изложения этого ма¬ териала заключается в ориентации на современные методы анали¬ за и синтеза систем управления, таких как принцип максимума Понтрягина, метод динамического программирования Веллмана, фильтр Калмана—Бьюси и др. Основное внимание в книге уделено системному подходу к про¬ ектированию системы «летательный аппараг + система управления» (ЛА + СУ). Так, в задаче наведения предложена система соподчи¬ ненных функционалов, позволяющая выяснить, какое звено конст^- руируемой системы ЛА + СУ в большей степени ответственно за погрешности в точности наведения. Построена система усложняю¬ щихся математических моделей бортового контура и системы наве¬ дения в целом, которые могут быть использованы при автоматизи¬ рованном проектировании. Важной особенностью излагаемых в учебном пособии методов является их ориентация на применение цифровой вычислительной техники как в процессе проектирования системы ЛА + СУ, так и в процессе реализации алгоритмов управления на борту ЛА. В част¬ ности, дискретный фильтр Калмана, оптимальное управление в кон¬ фликтной ситуации не могут быть реализованы без применения Цифровых вычислителей. Фундаментальными свойствами системы ЛА + СУ являются уп¬ равляемость и наблюдаемость. В учебном пособии выявлено значе¬ ние этих свойств для задач модального управления, оптимальной стационарной фильтрации, аналитического конструирования авто¬ пилотов. Подробно освещена взаимосвязь управляемости и наб¬ 3
людаемости. Понятие наблюдаемости системы связывается с зада¬ чей восстановления состояния системы путем конструирования наблюдающего устройства в виде модели исходной системы с об¬ ратной связью по ошибке восстановления. Методологическим преимуществом принятого в данном учебном пособии способа изложения дискретного и непрерывного фильтров Калмана—Бьюси является привлечение минимального математиче¬ ского аппарата: математические ожидания и ковариации случай¬ ных сигналов. Это позволяет отчетливо уяснить принцип оптималь¬ ной фильтрации как наилучшей линейной несмещенной оценки состояния. Особенностью построения фильтра Калмана—Бьюси яв¬ ляется учет инерционности измерителя. Такой подход, с одной сто¬ роны, больше отвечает реальной обстановке, с другой, — позволяет «обоснованно перейти к идеальному безынерционному измерителю. Методически четко проведено построение стационарного фильтра Калмана—Бьюси для стационарной системы, рассматриваемой на бесконечном промежутке времени. Аналитическое конструирование автопилотов рассматривается как задача синтеза автопилота, в которой выбор оптимальных об¬ ратных связей осуществляется путем минимизации интегрального квадратичного критерия качества, что связывает данную задачу с модальным управлением, где система обратных связей в автопило¬ те формирует заданный «оптимальный» закон распределения кор¬ ней замкнутой системы. Для стационарных систем задача аналити¬ ческого конструирования рассматривается па бесконечном интервале времени. Показано, что при определенных допущениях, обычно выполняемых в системах управления ЛА, оптимальное уп¬ равление оказывается стационарным, а замкнутая система асимп¬ тотически устойчивой. Приводится метод аналитического констру¬ ирования в условиях случайных возмущающих воздействий. В книге освещены общие вопросы проектирования систем уп¬ равления в конфликтной ситуации и решены частные задачи прес¬ ледования — уклонения. Автор выражает искреннюю благодарность академику Б. Н. Петрову за рекомендации по структуре и содержанию книги и профессору А. М. Баткову за ряд ценных замечаний, сделанных им при рецензировании рукописи. Автор весьма признателен доцентам В. М. Стромилову, В. И. Зайцеву, В. Д. Елисееву, Л. А. Дмитроченко, С. Л. Амираго- гву, старшему научному сотруднику А. И. Вострову за помощь и со¬ веты при подготовке рукописи к изданию.
Глава 1 ЛЕТАТЕЛЬНЫЙ АППАРАТ КАК ОБЪЕКТ УПРАВЛЕНИЯ 1.1. ПРОДОЛЬНОЕ ДВИЖЕНИЕ ЛА .Движение летательного аппарата как твердого тела постоянной массы описывается сложной системой дифференциальных уравне¬ ний, порядок которой не ниже 12. При незначительных допущениях эта система уравнений распадается на две системы. Одна из сис¬ тем описывает продольное движение ЛА, другая — боковое. Боко¬ вое движение — это движение по курсу и крену. Рассмотрим сна¬ чала продольное движение ЛА. Вывод уравнений продольного движения ЛА Продольное движение есть движение ЛА в вертикальной плоско¬ сти, содержащей вектор скорости центра масс ЛА и его продоль¬ ную ось X (рис. 1.1). За неподвижную систему координат примем нормальную земную систему O0XgYgZg, начало которой совпадаете точкой старта ЛА, ось O0Yg направлена по местной вертикали вверх, а оси OQXg, O0Zg лежат в горизонтальной плоскости. В каче¬ стве подвижной системы координат при изучении движения центра масс ЛА примем скоростную систему координат OXaYaZa, начало которой совпадает с центром масс ЛА. Ось ОХа направлена по вектору воздушной скорости V центра масс ЛА; ось OYa — ось подъемной силы лежит в плоскости симметрии ЛА и направлена вверх, перпендикулярно V; ось OZa — боковая — направлена так, чтобы образовать правую прямоугольную систему координат. Уравнения продольного движения центра масс ЛА в проекции на оси ОХа и OYa запишем в виде mV = —Ха±Т cosa — mg sin 6; (1. 1) тУЪ=ГУа-\-Т sin a —/ng cos 0, (1-2) где m — масса; V — воздушная скорость ЛА; a — угол атаки; 0 — угол наклона вектора скорости к горизонту; g — ускорение свобод¬ ного падения; Ха — сила лобового сопротивления; Ya — аэродина¬ мическая подъемная сила; Т — сила тяги двигателя. 5
Рис. 1.1. Траектория продольного движения ЛА Уравнения движения ЛА относительно центра масс будем рассматривать в свя¬ занной ортогональной систе¬ ме координат OXYZ, начало которой совпадает с центром масс ЛА, продольная ось ОХ направлена вперед по продольной оси ЛА, нор¬ мальная ось OY лежит в вертикальной плоскости симметрии ЛА и направлена вверх, поперечная ось OZ направлена так, чтобы обра- Уравнение движения ЛА отно- зовать правую систему координат. сительно центра масс относительно оси OZ можно представить в виде (1.3) где Jz — момент инерции ЛА относительно оси Z; Ф — угол танга¬ жа; Mz — аэродинамический момент относительно оси Z. Выражения для аэродинамических сил и моментов, входящих в уравнения движения (1.1), (1.2), (1.3), обычно представляют в сле¬ дующем виде: ^а=СхаЯ^\ Ya=CyaqS\ Mz — tnzqSb, (1.4) где <7 = qV2/2 — скоростной напор; q — плотность воздуха; , СУа, mz — соответственно коэффициенты силы лобового соп¬ ротивления, подъемной силы, момента тангажа. Под S понимается обычно площадь крыла или миделя корпуса ЛА, а b — средняя аэродинамическая хорда крыла (или длина ЛА). Коэффициент подъемной силы СУа можно представить в виде c,a=qa«+^4, где С*уа=дСyjdv, Су3=дСуа/дЬв; 6В — угол отклонения руля высоты. Подставляя значение СУа в выражение для подъемной силы (1.4), получим С учетом последней формулы уравнение (1.2) представим в виде fnye = y^JrY^3JrT sin a — mg cos 6. Здесь Yla и — подъемные силы, соответственно создава¬ емые ЛА и рулем высоты. При рассмотрении многих вопросов ди¬ 6
намики полета можно пренебречь подъемной силой руля высоты. В этом случае последнее уравнение примет вид mV Ь — Yaa^T sina — mg cos 9. (1-5) Коэффициент момента тангажа mz можно представить в виде mz = mza + /njB8B -ф m^wz -ф Д/иг, где т“, т[в, т“г — соответствующие частные производные от коэф¬ фициента mz по a, 8В, u)z=(uzZ>y-1; при этом «>г = & —угловая ско¬ рость продольной оси ЛА. Подставляя mz в выражение (1.4) для Mz, получим Mz = Mza -ф М[ВЪВ + + Д/Иг, где Maz = m*qSb-, M^ — tn^qSb', М**=ma/qSb2V~K Подставив полученное выражение для Мг в уравнение (1.3), по¬ лучим Угй = Л^а4-ЛГ4 + М^8в + ДЛф. (1.6) Если /Пг<^0, то ЛА обладает продольной статической устойчиво¬ стью, момент у|4’а направлен на уменьшение угла атаки.. На этом основании этот момент называется восстанавливающим. Если же имеет место неравенство то ЛА статически неустойчив. В этом случае момент называется опрокидывающим. Опро¬ кидывающий момент увеличивает угол атаки. Если /7^ = 0, то ЛА является нейтральным. К полученным выше динамическим уравнениям (1.1), (1.5), (1.6) необходимо добавить уравнения кинематики. Непосредствен¬ но из рассмотрения рис. 1.1 имеем x^=I/cos9; ys=V sin 6; ft = 6-La. (1-7) Полученная система уравнений (1.1), (1.5), (1.6), (1.7) описы¬ вает продольное движение ЛА. Эта система уравнений является сложной нелинейной системой дифференциальных уравнений шес¬ того порядка. Кроме явных нелинейностей, в этих уравнениях име¬ ются скрытые нелинейности, а именно: аэродинамические коэффи¬ циенты изменяются в функции скорости полета, чисел динамическо¬ го подобия М, Re, St, Fr. Рассматриваемая система уравнений не является замкнутой, так как число уравнений (шесть) меньше чис¬ ла неизвестных V, 0, a, xg, yg, 6В- Задавая закон изменения отк¬ лонения руля высоты 6в = 6в(^), получим замкнутую систему урав¬ нений, описывающую движение управляемого ЛА в вертикальной плоскости. Задача специалиста по системам управления заключа¬ ется в формировании закона управления — в данном случае закона отклонения руля высоты. 7
Линеаризация уравнений продольного движения ЛА Полученные ранее уравнения не могут быть использованы при фор¬ мировании бортовой системы управления, так как для подавляю¬ щего большинства ЛА она слишком сложна. Обычно используются уравнения в вариациях, получающиеся из рассматриваемой систе¬ мы путем их линеаризации. Линеаризация проводится в окрестно¬ сти некоторого режима полета: полета в вертикальной плоскости по заданной траектории, прямолинейного полета в вертикальной плоскости, прямолинейного горизонтального полета и т. п. Для конкретности изложения за расчетный режим примем ре¬ жим горизонтального прямолинейного полета, который характери¬ зуется следующими значениями координат: У = У0; 9-—0о=О; а=а0; &=%=а0; &=&0; 6 = 6О=°; xg=xga\ yg=ygo; 8B=8Bo. (1.8) Значения этих координат должны удовлетворять следующей системе уравнений (1.1), (1.5), (1.6), (1.7): mV0 = — Ха„-\-Т cos а0 —zngsin 90, ^Уо9’о=Коао-|-Г sin а0 —zngcos 0О, <«о + = ygo = ^o sin eo5 xg0 = Vocos eo- Разложив каждый член этой системы уравнений в ряд Тейлора в окрестности, соответствующей режиму (1.8), и учитывая только члены первого порядка малости, получим md (V0 + bV)/dt=-Xaa - х£0Д^ - cos «о- — Т sin а0Да — mg sin 90 — mg cos 9ОД9; /пУ0904-яг1/0д9 = ^аоао + ^аоДа+7' sin ао+^ cc>sа0Да — — mg cos 9-[-/ng sin 9Д9; Jz (So + Д&) = < (а0 + ДаН (»o+А»)+(8в. + Д8В) + ДМг; “т = ®o “h ao 4" Aa; №о4~а^=1/о sin % + Vq cos 0oaq; xg0 4- kxg = Vо cos 90 — IZ0 sin 6OA9. Производя почленное вычитание уравнений последних двух сис¬ тем, получаем линейные уравнения, часто называемые уравнения¬ ми в вариациях: 8
(1-9) (1.11) тду = — X^V — Хла^а — T sin а0Да — mg cos 0ОД0; тп1/0Дё=ГаоДа4-7 cos a0Aa-f-7ng sin 0ОД0; Jz Д&=M Да + -j- АГ" Д8В; Д& = Да + д0; Ayg-=Vr0 cos 9ОД9; Axg==— Vo sin 9одб- Уравнения (1.9) описывают движение ЛА в окрестности, соот¬ ветствующей режиму (1.8). В процессе полета будут изменяться коэффициенты уравнений (1.9). Для фиксированного режима гори¬ зонтального полета коэффициенты уравнений (1.9) являются пос¬ тоянными величинами. Разделив все члены первого уравнения на т, второго — на mV0 и третьего — на Jz и введя соответствующие обозначения для коэффициентов уравнений с учетом (1.8), получим Д9:-|-а1Д& -|-а2Аа = азДВв; Д6 —а4Да=0; Д&=Да-}-Д0; ДУ + <26Да + а7Д1/ + а8Д9=0; (1- Ю) Дг/г=а5Д0, а^=М^-, а4=(Гг + ^соза0)МУо; а5=1/0; /2-6=(Ха0 -|-7’ sina0)/n_1; a1=XVaam~J; a8=g. Коэффициенты щ называются динамическими коэффициентами. Как видно из изложенного, они определяют исходный режим и по¬ этому являются постоянными величинами. Однако, если линеариза¬ ция производится относительно траектории, вдоль которой изменя¬ ются некоторые параметры (скорость, высота полета и т. п.), то эти коэффициенты будут переменными. Система уравнений (1.10) яв¬ ляется линейной, неоднородной и незамкнутой. Задавая закон из¬ менения управляющего воздействия Дбв, получим замкнутую систе¬ му уравнений. Исключив из системы уравнений (1.10) угол Да и опустив Д ра¬ ди краткости записи, получим & --J- 0 —«4&+а49=0; (1-12) V -\-аъУ -\-a-jV+(а8~ аб)9=О- Здесь опущено последнее уравнение, которое часто более удоб- но рассматривать раздельно от остальных. В теории управления часто системы уравнений записываются в нормальной форме, в которой каждое уравнение разрешено относи¬ тельно производной и имеет первый порядок. Вводя новые обозна¬ 9
чения для независимых переменных: Xi = ft; х2 — 4; %з = 0; *4 = К запишем систему уравнений (1.12) в нормальной форме: %1 —#12^2? ^2— #21*^1 4“ #22-^2 “Р #23-^3 •^3 = ЛзЛ 4" #33*3; *4“ #41*1 4" #43*3 4" #44*4? где #12=1; #21— —#2? #22— —#1» #23— #2» #31— #4; #33——#4; #4Т — —#б; (1.13) (1.14) #4з — —(#8 #6); #44 — —#7. Систему уравнений (1.13) можно записать в матричной форме х — Ах -р ВВв, (1.15) где х — вектор-столбец, т. е. матрица размерности 4X1: хт = ==(*ь х2, *з, *4); В — вектор; Вт=(0, #3, 0, 0); А — матрица раз¬ мерности 4X4, характеризующая собственное движение ЛА: 0 «12 0 0 «21 «22 «23 0 «31 0 «33 0 _ «41 0 «43 «44 В общем случае вариация угла руля высоты 6В не равна нулю и представляет собой управляющее воздействие, формирование ко¬ торого входит в задачу управления полетом ЛА. В рассматривае¬ мом случае управление бв является скалярным. Однако, как будет видно из изложенного, при описании бокового движения ЛА участ¬ вуют два скалярных управления — угол руля направления и элеронов бэ. В этом случае ит=(6в, 6Н) есть вектор управления. Если рассматривать движение ЛА с жестко закрепленным ру¬ лем, то в уравнении (1.15) вариация угла отклонения руля будет равна нулю, т. е. бв = 0. В этом случае собственное движение ЛА описывается однородным уравнением х = Ах. (1. 16) Матрица А полностью задает динамические свойства ЛА, зна¬ чения ее элементов однозначно определяют корни характеристиче¬ ского уравнения системы (1.16). Характеристическое уравнение системы (1.13) можно предста¬ вить в виде —Р #41 #12 О О #22“ Р #23 0 О #зз—р О 0 #43 #44—^ (1.17) Корни уравнения (1.17) рицы А. Если собственные называют собственными числами мат- числа матрицы имеют отрицательные 10
действительные части, то система (1.13) асимптотически устойчи¬ ва* а о матрице А в таком случае говорят, что она устойчива. "в фиксированные моменты времени состояние объекта задается вектором хт= (%i, %2, *з, х4), где (z=l, 2, 3, 4) — фазовые коор¬ динаты. Потенциально каждая упорядоченная четверка действи¬ тельных чисел (хь х2, х3, х4) может описывать состояние объекта в некоторый момент времени. Поэтому удобно ввести множество всех таких наборов (%i, х2, х3, х4), которые назовем фазовым простран¬ ством рассматриваемой системы. В общем случае, если объект опи¬ сывается системой уравнений n-го порядка: i = п, (1-18) 7 = 1 соответствующее фазовое пространство будем обозначать Rn. Та¬ ким образом, Rn представляет собой множество всех упорядочен¬ ных наборов действительных чисел (хь х2,...,хп). Изменение во времени состояния системы определяется вектор-функцией х(0 = = (%1(/), . . ., xn(t)), являющейся решением системы (1.16), а в каждый фиксированный момент времени x(Z) представляет собой точку фазового пространства Rn. Анализ продольного возмущенного движения Если в системе уравнений (1.12) или ей эквивалентном матричном уравнении (1.15) положить 6в = 0 (руль жестко закреплен), то по¬ лучим уравнения, описывающие соответствующее свободное (1.16) движение ЛА. Решая характеристическое уравнение (1.17), найдем четыре корня pi (Z== 1, 2, 3, 4), позволяющие записать решение системы (1.12) в общепринятой форме. Корни pi (z=l, 2, 3, 4) мо¬ гут быть как действительными, так и комплексными, однако неиз¬ менно наблюдается, что два корня, например рь р2, по абсолютной величине существенно больше двух других корней, например р3, р4. Это имеет место практически для всех летательных аппаратов. Приведем их значения для гипотетического ЛА: Pi,2 = —19 + 16/j Рз = —0,7; р4=0,05. Движение, описываемое большими по абсолютной величине кор¬ нями рь р2, называется короткопериодическим движением, а дви¬ жение, описываемое малыми по абсолютной величине корнями р3, р4, называется длиннопериодическим, или фугоидмым движением. На рис. 1.2 и 1.3 представлены переходные процессы вариаций скорости и углов (V, а, Ф, 0) для рассматриваемого ЛА при возму¬ щении в виде единичного скачка Аа = Д0 = 5°. Эти графики отчет¬ ливо иллюстрируют короткопериодическое движение, которое про¬ должается 1—2 с, и фугоидное движение, которое длится де¬ сятки секунд. В короткопериодическом движении очень резкие из¬ менения претерпевают параметры a, ft, характеризующие движение самолета относительно центра масс. В фугоидном движении изме- 11
л 5 4 3 2 1 О -1 -2 -3 -4 -5 Рис. 1.2. Кривые изменения параметров ЛА за первые две-три секунды полета aV,m/c , ait". at)° 25 О -2,5 Рис. 1.3. Кривые изменения параметров ЛА в фугоидном движении няются параметры 0, К характеризующие положение центра масс ЛА. Из сравнения характера протекания переходных процессов видно, насколько более медленно протекает изменение координат 0 и V, чем а, Действительно, за время, в течение которого совер¬ шается переходный процесс по координате о, скорость V изменяет¬ ся только на 1—2 м/с. Так как корень р4>0 характеризует длинно¬ периодическое движение, то говорят, что самолет обладает фугоид- ной неустойчивостью. При рассмотрении автоматизированного полета, т. е. при иссле¬ довании движения ЛА с автопилотом, в дальнейшем будем пользо¬ ваться «усеченным» уравнением продольного возмущенного дви¬ жения ^ + #ift + a2a"“^3BB = 0; 6 = #4а; $ = а-]-0- (1- 19) Исключая угол атаки а из последней системы уравнений, получим систему — «2^ — «З^в’ 9 — «4&-|-а46=0 (1. 20} или в нормальной векторной форме х = Ах + В8в, '0 #12 0 где хг=(Х1, х2, л3); Вт = (0, а3, 0); А = «21 а22 #23 _«31 0 #33 _ Значения коэффициентов ац задаются формулами (1.14). При¬ веденная система уравнений отличается от системы (1.15) тем, что здесь вариация скорости равна нулю. Если учесть, что время сра¬ батывания автопилота в несколько раз меньше времени переходно¬ го процесса в фугоидном движении, то указанное пренебрежение 12
изменением скорости окажется вполне оправданным. Система урав¬ нений типа (1.19) используется при изучении движения ЛА относи¬ тельно центра масс. При изучении движения центра масс ЛА обычно пользуются' полной системой уравнений в вариациях (1.10). Однако при пред¬ варительном рассмотрении иногда пренебрегают инерционностью движения ЛА относительно центра масс. В этом случае система уравнений (1.10) примет вид а2а — а3Вв=0; 6 —а4а=0; 1/'-|-а6а-|-Я7У-|-С8в=0; &=9Ц-а; Уе=^. 1.2. БОКОВОЕ ДВИЖЕНИЕ ЛА Боковое движение ЛА — движение по курсу и крену, которые меж¬ ду собой тесно связаны. Движение по курсу Если ЛА имеет две плоскости симметрии, то уравнения движения ЛА по курсу отличаются от соответствующих уравнений (1.5), (1.6) и третьего уравнения системы (1.7) движения ЛА по тангажу от¬ сутствием силы тяжести: (1 21) mV.Qd'f/dt^Z^ + P sin Р; + где /у — момент инерции ЛА относительно оси У; ш =(0ЬУ~1, Мшу, М?у,_ 7И^Н, Za — соответствующие производные от момента Му по (ov, р, бн и боковой силы Za по р; гр — угол курса; р — угол скольжения; ф— угол, характеризующий направление вектора ско¬ рости в горизонте. Поэтому уравнения в вариациях по курсу иден¬ тичны уравнениям в вариациях для продольного движения (1.9). Не приводя выкладок, аналогичных тем, которые имели место при выводе уравнений в вариациях для продольного движения, из сис¬ темы (1.19) получим уравнения в вариациях для движения по кур¬ су, для чего достаточно угол тангажа '& заменить на угол курса гр,, угол атаки а на угол скольжения р, а угол 0 на угол ф: где Ф + + — ^з&н"Ь M3yJу\ (р— b$=Z3lrnV^ Ф=ср4_р, ьх=-м\}-г- ь2=-му-\ ^=(Z9a<, + Pcos%-)/mV0. 13
Здесь /^ — момент инерции ЛА относительно оси X; 7ИВ^, ZB—ьоз- мущения; Л1У, Z^ — соответствующие производные от моментов по о>^, 8, 8Н и боковой силы Za по 8 . Исключая из системы уравнений (1.22) угол скольжения ₽, получим (слагаемые МзуЦ\ Z3lmV$ опущены) Ф4~ &2Ф—= = (1.23) По аналогии с понятием продольной статической устойчивости вводится понятие путевой статической устойчивости (/И^<^0) и не¬ устойчивости (^>-0). При Му=0 ЛА нейтрален. Движение по крену Запишем уравнение движения по крену, т. е. уравнение движения относительно продольной оси ОХЬ в виде Jxy = + М>8Э + м? + Мвх, (1. 24) где Y —угол крена; —момент инерции ЛА относительно оси X; A1“^Y —демпфирующий момент; Mfy- момент, создаваемый эле¬ ронами; Л/х? —момент, возникающий из-за несимметричности обте¬ кания ЛА воздушным потоком; 7И&э; М**; М*— соответствующие производные от момента крена по углу отклонения элеронов бэ, угловой скорости крена <ох и углу скольжения |3; Мв х — возмуща¬ ющий момент. Если 714^ <^0, то ЛА обладает поперечной статиче¬ ской устойчивостью. При выполнении этого условия с появлением угла крена возникает момент, направленный на его уменьшение. При Мх^> 0 ЛА не будет обладать поперечной статической устой¬ чивостью, а при М?х=0 ЛА нейтрален. Таким образом, движение по крену существенно зависит от движения по курсу. Разделив уравнение (1.24) на Jx, получим (1.25) где с1 = -Л1>/Г1; c2=<V?1; с3=Ж^71; (1.26) Система уравнений для бокового движения Вводя новые переменные: Х1=яр, ^2=4>, x3=ip, х4 = у, х5 = у, запи¬ шем систему уравнений бокового движения (1.23), (1.25) в нор¬ мальной форме: *1 = a12%2 j *2 = #21*1 4" а22Х2 “4 #23*3 4" ^1&н> *з = $31X14~#33x3; Х4=^45Х5; (1.27) *5 = #51*1 "Г #53*3 + #55*5 4" ^2^э 4" х 1 э 14
где <Z12=1; #21 =—^2> #22 =—^li #23 = ^2> #31 = ^4» #33 =—^4> #45=1; #51 = С3> #53 =—C3i #55~—Ci', bi = bz, Ь2 = С2. Уравнения (1.27) в матричной форме примут вид x = Ax + Bu+Cz, (1.28) где о о о О Я12 #21 #22 #31 О О О О о о о #51 О О #45 #55 _ "0 0" "0 “ bl 0 0 0 0 ; с= 0 0 0 0 0 ь2 1 ■ Фазовое пространство системы (1.27) является пятимерным /?5. В рассматриваемом случае первые три уравнения системы (1.27) при заданном бв образуют замкнутую систему: координаты х4, х$ не входят в правые части этих уравнений. Отсюда следует, что пер¬ вые три уравнения (1.27) могут быть проинтегрированы независи¬ мо, тем самым движение по направлению, характеризующееся ко¬ ординатами х2, независимо от движения по крену, описыва¬ емого координатами х4, х5. Но движение по крену зависит от дви¬ жения по курсу: при интегрировании двух последних уравнений системы (1.27) необходимо иметь определенными координаты Xi и х3. Управление в системе (1.28) представляет собой двухмер¬ ный вектор ит= (бн, бэ). При рассмотрении других режимов полета, таких как, например, координированный разворот самолета (см. гл. 3), число скалярных управляющих воздействий расширяется до трех. Так что вектор управления ит=(бв, бн, бэ) оказывается трехмерным. Если объект описывается уравнением /г-го порядка, а управление осуществляется при помощи т независимых управля¬ ющих органов, то входящие в уравнение (1.28) неизвестные и ко¬ эффициенты имеют значения: хт= (хь ..., хп) — вектор фазового состояния; uT= (wb . . ., um) — вектор управления; z — возмущение; А=||агЛ— матрица действительных чисел размерности /?Х^, оп¬ ределяющая собственное движение объекта; В=||6^Ц, С=||сг-Л — матричные коэффициенты усиления соответственно по управляю¬ щему воздействию размерности nXm и по возмущению размерно¬ сти пх/, определяемые конструктивными особенностями ЛА. Важно иметь в виду, что в реальных задачах управления управ¬ ляющее воздействие и всегда ограничено по величине. Например, 15
величина углов бв, бн, бэ управляющих поверхностей ограничена механическими упорами; если управление осуществляется тягой двигателя, то ограничение обусловлено конечной мощностью дви¬ гателя и т. п. Поэтому целесообразно при формулировке задачи управления в явном виде указать совокупность возможных значе¬ ний управления. Математически это достигается введением множе¬ ства U всех допустимых значений вектора управления ит = = (щ,..uw). Множество U является подмножеством /?т, пред¬ ставляющего собой множество всех упорядоченных наборов т дей¬ ствительных чисел. В задачах оптимального управления принципи¬ альным является вопрос о том, может ли достигать управление своих предельных значений или нет, так как часто оказывается, что оптимальным является управление, использующее граничные зна¬ чения. Поэтому, если, к примеру, ограничение на управление имеет ВИД Цщт <u<Umax, т. е. граничные значения области управления U не являются допустимыми значениями управления (U — открытая область), то может оказаться, что оптимальный режим, управления не реализуется при открытой области U. Если же область U замк¬ нута: Т. е. ГраНИЧНЫе значения U = Umin, w = ^max являются допустимыми значениями управления, то отмеченных вы¬ ше затруднений не возникает. С другой стороны, имеются задачи, в которых оказывается несущественна ограниченность области возможных значе¬ ний управления. Так, в задачах стабилизации ЛА отно¬ сительно центра масс закон управления может формироваться в виде где ^—коэффициенты усиления соответ¬ ственно по угловой скорости тангажа $ и углу тангажа Ф, т. е. тео¬ ретически понимается, что управление бв может принимать любое значение в зависимости от величин $ и О. Конструирование всей системы управления осуществляется при этом так, что выход уп¬ равления на 1'Раничные значения битах, бв тт случа- ется редко и не приводит к существенным осложнениям в управле¬ нии полетом. Конечно, если бы закон В = был в каком-ли¬ бо смысле оптимальным, то при выходе управления на ограниче¬ ния его оптимальность, естественно, нарушалась бы. При формировании закона управления возможны два подхода. Если управление и задается как функция времени, то говорят о программном управлении (см. гл. 7). Если же управление и зада¬ ется как функция фазовых координат, например, и= —Lx, где L — матрица тХ«, то в каждый момент времени управление формиру¬ ется в зависимости от фазового состояния (позиции) системы в рассматриваемый момент времени. Следует иметь в виду, что по какому бы принципу ни формиро¬ вался закон управления, в конечном счете управление оказывает¬ ся функцией времени u(t) при каждом конкретном движении ЛА. Управление может быть как непрерывной функцией времени, так и кусочно-непрерывной, т. е. претерпевать разныв в отдельных точ¬ 16
ках на конечное значение. Поэтому при теоретическом отыскании оптимальных управлений необходимо указывать, к какому классу функций принадлежит u(t). Шарнирный момент Шарнирный момент — суммарный момент аэродинамических сил, действующих на руль (элерон) относительно его оси вращения. При отклонении руля этот момент должен быть преодолен момен¬ том, развиваемым рулевой машиной. Выражение для шарнирного момента можно представить в виде Mm=maiSb^, здесь тш — коэффициент шарнирного момента, который соответст¬ венно для продольного канала, канала курса и крена можно пред¬ ставить в. виде лгшг=/п2хга + ^»г8в; тшх = т^ха-^т^хЪэ, тд£ при углах а, £, 6В, бэ, бн стоят соответствующие производные от шарнирного момента по этим углам. Шарнирный момент во время полета, как и другие аэродинами¬ ческие моменты, может изменяться в десятки раз. Однако он может быть существенно уменьшен вплоть до нуля за счет компенсации, обычно аэродинамической. Аэродинамическая компенсация дости¬ гается, как правило, путем смещения оси вращения управляющего органа. Перегрузки По определению вектор перегрузки n = (SRz — G)O_1, где главный вектор всех сил, действующих на ЛА, G — вектор силы тяжести. Умножая выражение для п на единичный вектор соответствую¬ щей оси, найдем проекцию перегрузки на эту ось. При изучении ди¬ намики полета обычно интересуются проекциями перегрузки на скоростную и реже связанную системы координат. Воспользовав¬ шись уже имеющимися проекциями сил на оси скоростной системы •координат [см. правые части уравнений (1.1), (1.2), (1.21)], найдем выражения для соответствующих перегрузок: пХа=(—ха 4- Р cos a) G-1; пУа = + Р sin а) G-1; nZe=(Z₽?+Psinp)G-i. Учет влияния ветра и турбулентности атмосферы Полет ЛА совершается в возмущенной атмосфере: имеются гори¬ зонтальные ветры, вертикальные перемещения воздуха, локальные завихр.жиЯлМЯсаг воздуха. При решении задач динамики полета в 17
воздушной атмосфере существуют различные подходы, создаются соответствующие математические модели воздействия воздуха на динамику полета ЛА. При рассмотрении движения центра масс ЛА ветер может быть учтен следующим образом: l/n=lF+V, где Vu— вектор путевой скорости, W — вектор скорости ветра и V — вектор воздушной ско¬ рости ЛА. Учет воздействия ветра на ЛА приведет к изменению уравнений его движения. При решении ряда задач динамики полета оказывается необхо¬ димым учесть турбулентное движение атмосферы. В этом случае в правые части приведенных выше уравнений добавляются случай¬ ные функции, а в остальном уравнения остаются неизменными. 1.3. ПЕРЕДАТОЧНЫЕ ФУНКЦИИ ЛА Запишем уравнения (1.19) в операторной форме: (Р2+йцР) &(/>)+я2а (р)=а£в(р); р9(р)—а4а(р)=О;Ь(р)—9(р)—а(р)=О. Вычисляя главный определитель А системы (1.29), найдем а2 -а4 -1 — Р [Р1 Н- (ai 4* ai) Р 4" ^1^4 T > О 1 О Р — 1 Подставляя в главный определитель вместо первого столбца стол¬ бец правых частей (1.29), получим +я38в О О ^2 О -а4 р -1 -1 Воспользовавшись полученными выражениями для Д, Да, найдем передаточную функцию ЛА (p)=$(p)l§*(p)'- W^(p)=k§( \-\-1\3^р) р 1 1) где Ла = ^4 (^2 + Т'а —(^2 Вя = 0,5 (#i~|-^4) (^2 ^i^)-0,5 — — соответственно коэффициент усиления, постоянная времени и от¬ носительный коэффициент демпфирования ЛА. Аэродинамическая постоянная времени Гаэра = ^Г1- Аналогич¬ но получаются передаточные функции W^n(p\ W^e8B(p) • ^68В (jtf) = #3#4//(ai<24“l_a2) 4~ 2$аГа/?1] р. Разделив передаточную функцию UZ6Sr на W^asB, получим выра¬ жение для передаточной функции Ww(py. ^оИрЖ^эр^+1)-1. 18
Поделив 1Га8в на W'asjp), найдем 1Г»а(р)=(ГаЭр»^+1)/ГаЭр»Р- Воспользовавшись определением нормальной кинематической перегрузки n=VQg~ii найдем передаточную функцию Wn<i (р)=п(р)/6 (p) = Vpg-1. На рис. 1.4 представлена структурная схема ЛА для канала тангажа. Атмосферные возмущения можно учесть путем введения соот¬ ветствующих воздействий Мъ 2, Ув в правые части уравнений (1.29): (р2 + Д1Р)&(/?)+^а(/2) = а3М/’) + ^вг(Р); 30) р0(/?) —а4а(р) = Гв(^); & — 0 — а = 0, где MBZ=MBZJ^\ У'в=¥вт~1Уо'1. Учитывая справедливость принципа суперпозиции для линейных систем, при нахождении передаточных функций по возмущению №^кв и других вектор правых частей можно считать пооче¬ редно равным (а3, 0, 0), (AfBZ, 0, 0), (О, Ув, 0). Суммарный эф¬ фект от всех возмущений получается путем сложения реакций сис¬ темы на каждое возмущение. Ввиду совпадения по форме уравнений в вариациях для движе¬ ния по курсу с уравнениями продольного движения передаточные функции для курса будут иметь тот же вид с точностью до приня¬ тых обозначений. Передаточные функции для изолированного (без учета члена — с3|3) канала крена (1.25) будут следующие: = [р(Лр + I)]”1; — I)”1, (1. 31) где Г1 = гГ1, ^T = c2cf1— соответственно постоянная времени и ко¬ эффициент усиления для канала крена ЛА. Если возмущающий момент Мвх привести к эквивалентному значению угла отклонения элеронов 8Э>В: Мвх = Д4р*Вэ.в, то переда¬ точную функцию по возмущению 8 (/?) можно представить в виде IFtb83-b(p) = 'УД/’Жв (р)=М’э I)]-1- На рис. 1.5 представлена структурная схема канала крена ЛА. Рис. 1.4. Структурная схема канала тангажа ЛА Рис. 1.5. Структурная схема канала крена ЛА
Глава 2 ГИРОСКОПЫ и гироскопические УСТРОЙСТВА КАК ЭЛЕМЕНТЫ СИСТЕМ УПРАВЛЕНИЯ ЛА 2.1. УРАВНЕНИЯ ГИРОСКОПА Векторное уравнение прецессии гироскопа Гироскопы и гироскопические устройства являются необходимой составной частью автопилотов и навигационных устройств. Самым существенным элементом гироскопа является ротор — собственно гироскоп, имеющий обычно форму диска, полярный момент инер¬ ции которого существенно больше экваториального. При сообще¬ нии ротору значительной угловой скорости г относительно поляр¬ ной оси Z (рис. 2.1) он приобретает свойство сохранять положение относительно неподвижной системы координат. Вращение ротора осуществляется обычно за счет электроэнергии, реже — энергии сжатого газа до скоростей 20 ... 60 тыс. об/мин. Кинетический момент гироскопа Н выразим формулой /I=CQ-\-Jw, где С и J — соответственно полярный и экватори¬ альный моменты инерции ротора гироскопа, т. е. в данном случае при рассмотрении прецессии гироскопа будем пренебрегать инерци¬ онностью рамок карданова подвеса; со — вектор абсолютной угло¬ вой скорости оси Z гироскопа; 2 = проекция на ось Z абсо¬ лютной угловой скорости ротора гироскопа; г—собственная угло¬ вая скорость ротора относительно внутренней рамки; Ф — угловая скорость ротора, обусловленная движением рамок гироскопа и его основания вследствие перемещения ЛА, вращения Земли. Так как |г| то обычно пренебрегают скоростью Ф и полагают Q = r, следовательно /7=Сг + Ао. Так как слагаемое Ао ничтожно по ве¬ личине по сравнению с Сг, то направление вектора кинетического момента Н ротора близко к направлению оси Z (вектор г). Поэто¬ му обычно полагают, что Н = Сгу и считают, что Н направлен по оси Z. Применительно к гироскопу имеет место следующее важное ут¬ верждение, называемое теоремой ^Резаля. Пусть к гироскопу при¬ ложен вектор внешнего момента А. Тогда в силу теоремы о кине¬ тическом моменте можно записать -^-=L (2. 1) 20
илИ u_ = L, где it-fi—линейная скорость конца вектора Я. Таким образом, вектор линейной скорости кинетического момента равен вектору внешнего момента, В этом и заключается содержание теоремы Резаля. Выразим линейную скорость в виде произведения: х Н, где со — вектор угло¬ вой скорости изменения направле¬ ния кинетического момента Я. Со¬ поставляя две последние формулы, получим векторное уравнение дви¬ жения гироскопа Л = xHzO, (2.2) где z° — единичный вектор оси Z; приложенного к гироскопу. со — вектор угловой скорости пре- Рис-2Л- Оси Резаля XYZ цессии гироскопа, а уравнение (2.2) называется уравнением прецессии гироскопа. Под действием внеш¬ него момента L ось гироскопа Z в_соответствии с уравнением (2.2) будет прецессировать к вектору L по кратчайшему пути (см. рис. 2. 1). Определение гироскопического момента При приложении к гироскопу внешнего момента L ось гироскопа в соответствии с уравнением (2.2) теоретически мгновенно начнет прецессировать под действием этого момента с угловой скоростью прецессии со, модуль которой |оэ| =£///. Для простоты рассужде¬ ния здесь положено, что вектор внешнего момента L перпендикуля¬ рен вектору кинетического момента Я. Перепишем уравнение со = = L!H в виде уравнения равновесия (статики): L—соЯ = 0 или £ + £г = 0, где величина £г= —соЯ называется гироскопическим мо¬ ментом, который согласно принципу Даламбера является инерци¬ онным моментом. Этот момент возникает вследствие приложения внешнего момента L, что приводит к возникновению ускорения час¬ тиц, составляющих ротор гироскопа. Уравнение прецессии гироско¬ па (2.2) с учетом последнего соотношения может быть представле¬ но в виде £г =—G)X//z°. В некоторых задачах удобно вводить в- рассмотрение гироскопический момент, что будет показано при изу¬ чении двухстепенных гироскопов и силовых гирорам. Скалярные уравнения прецессии гироскопа В большинстве случаев конструктивно трехстепенной (свободный) гироскоп представляет собой ротор 3, обычно размещенный в кар- Дановом подвесе (рис. 2.2). Ротор вращается с собственной угловой скоростью г относительно кожуха (внутренней рамки) 2 за счет подвода трехфазного тока частотой 400 Гц (1000 Гц). Внутренняя 21
Рис. 2.2. Конструктивная схема трехстепенного гироскопа: /-^наружная рамка карданова подвеса; 2—внутренняя рамка карданова подвеса; 3—ротор гироскопа; 4—статор гиромотсхра; 5—потенциометр угла у; 6—щетка потенциометра угла у; 7—вывод средней точки потенциометра угла у; 8—корпус гироскопа; 9—щетка потенциомет¬ ра; 10—потенциометр ymia ft; 11—поводок рамка 2 карданова подвеса вместе с ротором может вращаться от¬ носительно наружной рамки 1. Наружная рамка вместе с внут¬ ренней вращаются относительно корпуса гироскопа S, который жестко укреплен на ЛА, перемещающемся в пространстве. При из¬ менении углового положения ЛА ось гироскопа Z остается непод¬ вижной, что приводит к перемещению щеток 6 и 9 по виткам по¬ тенциометров 5 и 10, с которых снимаются напряжения, соответст¬ венно пропорциональные углам крена у и тангажа Ф при малых значениях у и О. Введем в рассмотрение оси Резаля X, У, Z, начало которых раз¬ местим в центре масс ротора, ось Z направим по оси симметрии ро¬ тора. Оси Резаля участвуют во всех движениях гироскопа, кроме собственного вращения ротора. Вектор со представим в виде щ=^х°+^у°, (2.3) где р, q — соответственно проекции вектора абсолютной угловой скорости гироскопа на оси вращения внутренней и внешней рамок. Подставляя выражение (2.3) для со в уравнение движения (2.2), получим Z = [(px° + ?y°) X Н\ = [рх°+?у°) X Яг0]. (2.4) 22
Умножая уравнение (2.4) скалярно на единичный вектор х°, най¬ дем уравнение движения гироскопа в проекции на ось X: Ах = (х°, [(рх° + ?у°) x//z°]) = //(x°, (—ру° — qx°)]=qH. Проектируя то же уравнение (2.4) на ось У, после проведения аналогичных выкладок получим £!/ = —pH. Объединяя последние два уравнения Lx=qH} Ly — —pH, (2.5} получим скалярные уравнения прецессии гироскопа. ГТ д! Рис. 2.3. К пояснению инерционности гироскопа Сделаем одно добавление, поясняющее с физической точки зре¬ ния инерционность гироскопов. Пояснение (нестрогое) построим на соответствующей аналогии с поступательным движением (рис. 2.3). Изменить направление движения тела (ЛА, автомобиль), имеющего большую скорость, не так легко. Для изменения направления дви¬ жения на некоторый угол e = arctg (AV/V) нужно, чтобы сила F действовала продолжительное время. Аналогично обстоит дело и с гироскопом. Чтобы отклонить кинетический момент Я, нужно при¬ ложить момент L в течение некоторого времени А/, что приведет к приращению кинетического момента на вектор АЯ = LXt и откло¬ нению его на угол е. В гироскопических устройствах удается пу¬ тем совершенства конструкции и технологии изготовления возму¬ щающие моменты (трение, дисбаланс и т. п.) сделать очень малы¬ ми, близкими к нулю, поэтому скорость их ухода (дрейфа) не пре¬ вышает 0,5 ... 5 град/ч, а в более совершенных гироскопических: устройствах она снижена до 0,05 град/ч и менее. Такая незначи¬ тельная скорость дрейфа позволяет использовать их в качестве датчиков углового положения ЛА. 2.2. ТРЕХСТЕПЕННЫЕ ГИРОСКОПЫ Общая характеристика Трехстепенные гироскопы разнообразны по своей конструкции и назначению. В авиации широкое использование находят позици¬ онные гироскопы, ось которых удерживается в заданном направле¬ нии: по вертикали места, по заданному азимуту и т. п. При откло¬ нении ЛА от заданной ориентации (например, вертикали места) с соответствующих датчиков, расположенных по осям карданова под¬ веса гироскопа (см. поз. 10 и 5 на рис. 2.2), снимаются сигналы, пропорциональные углу тангажа и крена, и посылаются в автопи¬ 2&
лот (в случае автоматического режима полета ЛА). Сигнал, про¬ порциональный отклонению ЛА от заданного курса, снимается с курсового гироскопа. Если позиционные гироскопы выполнены для визуального наблюдения, то отклонения ЛА по тангажу и крену кинематически преобразуются в соответствующие перемещения «самолетика» в визуальном приборе, называемом авиагоризонтом: при кабрировании или пикировании «самолетик» соответственно пе¬ ремещается вверх или вниз, а при накренении ЛА «самолетик» кре¬ нится в соответствующую сторону. По показаниям авиагоризонта летчик управляет угловым положением самолета в пространстве. Системы коррекции Ось свободного гироскопа в результате трения в подшипниках кар- данова подвеса, дисбаланса и других возмущающих моментов с течением времени будет уходить от заданного направления. Иног¬ да гироскопические устройства снабжены специальными устройст¬ вами, называемыми системами коррекции, которые непрерывно или дискретно возвращают ось гироскопа в заданное положение. Часто системы коррекции работают как следящие системы. В качестве чувствительных элементов систем коррекции обычно используются маятники различной конструкции и магнитные компасы. Рассмотрим работу системы коррекции одного из авиагоризон¬ тов. Маятник жидкостного типа (рис. 2.4) укреплен жестко на внут¬ ренней рамке карданова подвеса. Конструктивно маятник выпол¬ нен в виде чаши с четырьмя периферийными электродами 1 и од¬ ним центральным 2. Чаша частично заполнена токопроводящей жидкостью 3 так, что имеется пузырь воздуха 4. Если ось гироско¬ па не отклонена от вертикали, то воздушный пузырь 4 будет в центре чаши и сопротивление между каждым из четырех электро¬ дов и центральным электродом 2 будет одинаково (см. рис. 2.4, а). Отклонение оси гироскопа Z вместе с внутренней рамкой и маятни¬ ком от вертикали приводит к перераспределению токов между центральным и периферийными электродами, и маятник выдает сигнал рассогласования, пропорциональной его отклонению. При отклонении маятника от вертикали более чем, например, на 0,5° один из электродов полностью покрывается жидкостью, а второй, ему парный, — воздухом, прибор выходит на ограничение (см. рис. 2.4, б). Сигнал рассогласования поступает в соответствующий дат¬ чик для создания момента коррекции. На рис. 2.5 изображена нор¬ мальная земная система координат O0XgYgZg. Ось гироскопа Z отк¬ лонена от заданного направления OQYg, вертикали места, на углы а и (3, лежащие во взаимно ортогональных плоскостях XgO0Yg и Z'OqY. Оси XY направлены по осям вращения внутренней и внеш¬ ней рамок карданова подвеса, на которых размещены датчики мо¬ ментов. Эти датчики создают моменты Lx и Ly, направленные на уменьшение углов аир. Дадим математическое описание работы системы коррекции. В линейной зоне характеристик жидкостных маятников моменты 24
Рис. 2.4. Жидкостные поплавковые маятники сис¬ темы коррекции гироскопов: /—периферийные электроды; 2—центральный элек¬ трод; 3—токопроводящая жидкость; 4—пузырь воздуха Рис. 2.5. Неподвижная система O0XgYgZg и оси Резаля XYZ коррекции будут пропорциональны углам аир: Lx= —ka, Ly = = —fep, где k — коэффициент усиления. Будем считать, что основа* ние гироскопа неподвижно. В этом случае выражения для угловых скоростей р и q, очевидно, будут (см. рис. 2.5) р=—р, q = = acos р—a. С учетом найденных выражений для моментов кор¬ рекции и составляющих угловых скоростей оси фигуры гироскопа Z уравнения прецессии гироскопа (2.5) примут вид: На = —ka\ Я|3 = —/гр, или a + ea = 0; p-j-'8p = O, где z = kfH, При начальных ус¬ ловиях a=a0 и р=ipo интегралы последней системы примут вид a=aoexp(—е/); Р = Ро ехр(—е/) и ось гироскопа Z будет прецесси¬ ровать к вертикали места OQYg. Исключая время t из последних ре¬ шений, получим уравнение фазовых траекторий прецессии оси ги¬ роскопа Z: a = aoP/Po, которые представляют собой при различных начальных условиях (ао, ’Ро) прямые линии, входящие в начало ко¬ ординат. Поэтому рассмотренный вид коррекции называется ра¬ диальным. Вибрация чувствительных элементов (маятников) системы кор¬ рекции относительно своего равновесного положения (вертикали места) не приводит к существенным ошибкам в показаниях авиаго¬ ризонта, так как он, являясь фильтром низких частот, не пропуска¬ ет высокочастотные колебания маятника. Девиации авиагоризонта Рассмотренная выше система в установившемся состоянии не име¬ ет статической ошибки: соответствующая система уравнений а = = —еа; р =—ер является однородной, частное решение которой равно нулю. Однако в реальных гироскопических устройствах име¬ ют место ошибки и в установившемся состоянии. Ошибки происхо¬ дят, в частности, из-за подвижности основания, — эти ошибки назы¬ 25
ваются девиацией гироскопов. В зависимости от характера движе¬ ния основания различают: виражную девиацию, девиацию вслед¬ ствие вращения Земли и перемещения ЛА относительно Земли; баллистическую девиацию, вызванную перемещением платформы с некоторым линейным ускорением. Приведем качественное описание процесса возникновения деви¬ ации на примере правильного виража ЛА. При полете самолета по некоторому радиусу виража создаются ускорения, отклоняющие маятник системы коррекции от вертикали места. В результате ма¬ ятник выдает ложные сигналы в моментный датчик, и ось гироско¬ па Z начинает прецессировать в направлении к кажущейся верти¬ кали. В выражениях для угловых скоростей р и q появляются до¬ полнительные слагаемые, в результате уравнения прецессии гиро¬ скопа (2.5) из однородных станут неоднородными, частные реше¬ ния которых отличны от нулевых. Эти частные решения определя¬ ют девиацию авиагоризонта. Приведем математическое описание системы коррекции. Нетрудно установить, что маятник системы кор¬ рекции отклоняется от истинной вертикали на угол ув^ = arctgcoB V/9, при этом выражения для угловых скоростей р и q при левом вираже принимают вид р^—0—сова; 9~а—сов|3, а урав¬ нения (2.5) прецессии оказываются неоднородными а+'.&а—еа-р = = —syB; P + eP+ieaa = 0, где <ов — угловая скорость виража; а = = ^Hjk. Интегрируя последнюю систему, найдем а = Аехр(—е/) sin (“^-рВ)—-^(l-pa2)-1, р=A exp (—е/) cos (сов/ + s) + 1 + я2)”1- После завершения переходного процесса первые слагаемые бу¬ дут равны нулю и положение оси гироскопа Z в установившемся состоянии будет определяться вторыми слагаемыми. Так как за время виража система коррекции может значительно увести гиро¬ скоп от вертикали места, то при глубоких виражах (ув>5°) систе¬ ма коррекции автоматически отключается и подключается снова, когда угол крена ув уменьшится. В промежутке времени между отключением и подключением системы коррекции гироскоп работа¬ ет как некорректируемый и несколько уходит из заданного положе¬ ния. Однако этот уход существенно меньше, чем то отклонение, ко¬ торое было бы под действием системы коррекции при движении оси гироскопа Z к кажущейся вертикали. В последнее время систе¬ ма коррекции отключается по сигналу датчика угловых скоростей. Можно показать, что при учете подвижности основания вслед¬ ствие вращения Земли и перемещения ЛА относительно Земли уравнения прецессии (2.5) в первом приближении примут вид а ~Рset = (0]. cos р-р= sin /С-р VK//?. Их решения можно представить в виде a = Cjexp( —cos/C/e; р = С2ехр(—£^)~p^i sin /£~рVK/s/?, 26
где Ci, С2 — постоянные интегрирования; coi — горизонтальная сос¬ тавляющая угловой скорости Земли; 7? — радиус Земли; VK— ско¬ рость полета ЛА относительно Земли; 7<— курс. Здесь вторые сла¬ гаемые определяют отклонение оси гироскопа Z, вызванные вра¬ щением Земли. Третье слагаемое обусловлено скоростью VK. При наличии ускорения центра масс ЛА вдоль направления дви¬ жения маятник системы коррекции устанавливается в положение ложной вертикали, что приводит к девиации авиагоризонта, назы¬ ваемой баллистической. При этом уравнения прецессии гироскопа (2.5) приобретают следующий вид:а-(-£«=0; р-|-ер=—е(Ук//?е — __l/K/g), решение которых будет а=С\ ехр(—е/); ^=С2ехр(—е/) — —VJRz-\-VK/g. Третий член во втором выражении — баллистичес¬ кая девиация. Курсовой ^гироскоп В пилотируемых ЛА в качестве курсового гироскопа обычно ис¬ пользуется гирополукомпас. Гирополукомпас является трехстепен¬ ным гироскопом, внешняя рамка которого является рабочей. На оси внешней рамки укрепляется визуальный приборный датчик, а внешняя рамка курсового гироскопа может иметь постоянную пре¬ цессию для компенсации влияния вращения Земли. Подробное рассмотрение работы курсового гироскопа показыва¬ ет, что он обладает девиациями, которые порождаются подвижно¬ стью основания (виражом, вращением Земли, перемещением ЛА относительно поверхности Земли). Кроме того, iирополукомпасы имеют специфические ошибки. В пилотируемых ЛА в показания гирополукомпаса каждые 10 ... 15 мин вносятся соответствующие поправки (коррекции) в заданный курс. 2.3. ДВУХСТЕПЕННЫЕ ГИРОСКОПЫ Двухстепенной дифференцирующий гироскоп Двухстепенные гироскопы бывают дифференцирующие и интегри¬ рующие. Принципиальное их отличие обусловлено наличием (в дифференцирующем) или отсут¬ ствием (в интегрирующем) пру¬ жины 3 (рис. 2.6, 2.7), которая при отклонении рамки 2 гироско¬ па от нейтрального положения развивает момент, пропорцио¬ нальный этому отклонению. Рам¬ ка гироскопа 2 может вращаться относительно корпуса 5, а для га¬ шения колебаний рамки имеется Демпфер 4. Внутри рамки разме¬ шается ротор 7, которому сооб¬ щается угловая скорость до 20 ... 30 тыс. об/мин. 1-подш Рис. 2.6. Принципиальная схема работы дифференцирующего гироскопа: /—ротор гироскопа; 2—рамка гироскопа; 3—пружина; 4—демпфер; 5—корпус гиро¬ скопа 27
Рис. 2.7. Конструктивная схема дифференцирующего гироскопа: 7—ротор гироскопа; 2—рамка гироскопа; 3—-пружина; 4—демпфер; 5—корпус гироскопа; 6— щетка потенциометра; 7—потенциометр; 8—вывод средней точки потенциометра Сначала дадим качественное (нестрогое) описание принципа работы дифференцирующего гироскопа. Пусть вектор угловой ско¬ рости соЛА направлен перпендикулярно плоскости рамки гироскопа в ее нейтральном положении. В начале маневра ЛА с угловой ско¬ ростью соЛА (см. рис. 2.6) на гироскоп через подшипники рамки действует момент ГПодш, совпадающий по направлению с <оЛА. Ось Z начинает прецессировать с угловой скоростью соподш к вектору £подш, стараясь с ним совместиться. В результате этой прецессии рамка будет поворачиваться на угол Р= соподш(г)dx. Поворот рам- o' ки на угол р приведет к деформации пружины и возникновению момента пружины Lnp, пропорционального углу (3: «7^1=^^ Угол (3 будет увеличиваться до тех пор, пока не разгрузятся под¬ шипники. При разгруженных подшипниках угол |3 примет такое значение [3*, при котором <опр = L*JH = будет равна угло¬ вой скорости <оЛА разворота ЛА, т. е. (оЛА=(опр=&пр(3*/Н = k$*, где k = knylH\ таким образом, ось Z как бы прецессирует под дейст¬ вием момента Lnp=&iip(3* и тем самым разгружает подшипники (см. рис. 2.6). Следовательно, в установившемся состоянии угол отклонения рамки гироскопа пропорционален угловой скорости разворота ЛА. Дадим математическое описание работы дифференцирующего гироскопа. Воспользовавшись принципом Даламбера, запишем рав¬ 28
новесие суммы инерционных и активных моментов относительно оси вращения рамки гироскопа (оси прецессии) X: (2. 6) где Лг =—о)Ла Н— гироскопический момент, возникающий вслед¬ ствие вращения ротора гироскопа вместе с ЛА с угловой скоро¬ стью соЛА; /П'|3 — момент, создаваемый демпфирующим устройст¬ вом; ATpsign р — момент трения в подшипниках, величина которо¬ го постоянна, а направление определяется знаком р; J — экватори¬ альный момент инерции гироскопа относительно оси прецессии (оси вращения рамки); &пр — жесткость пружины. Пренебрегая моментом трения, представим уравнение дифферен¬ цирующего гироскопа в виде 8Ц-2^3-(-а)2^ = //соЛА/У, (2.7) где <3^=ku9IJ\ t=m/2VJknp. Общее решение представим в виде Р=С ехр (—£о>/) sin ~г^шла/^пр? (2. 8) где v=o)]/l — ^2 —частота собственных колебаний гироскопа; С и ср — постоянные интегрирования. Из уравнения (2.7) и его общего решения (2.8) следует, что ра¬ бота дифференцирующего гироскопа описывается колебательным звеном с постоянной времени Т= 1/<х> и коэффициентом относитель¬ ного демпфирования По окончании переходного процесса пер¬ вый член в решении (2.8) становится равным нулю, и при этом имеем Р* = //(ола/^пр=^д.г<Ола, т- е- в установившемся состоянии угол отклонения рамки гироскопа пропорционален соЛА. Если учитывать момент трения, то из уравнения (2.6) найдем установившееся значение угла поворота рамки гироскопа Кр=?* — AssignР, где = Ар = Атр/Лпр — угол застоя (ошибка в показании дифференцирующего гироскопа). К описанному типу дифференцирующего гироскопа относится прибор, называемый указателем поворота, или индикатором угло¬ вой скорости разворота самолета, который входит во все пилотаж¬ но-навигационные комплексы. В этом приборе наклон рамки гиро¬ скопа наблюдается визуально. Дифференцирующий гироскоп часто называют скоростным или датчиком угловой скорости (ДУС). В ДУСах обязательно уста¬ навливают датчик угла поворота рамки, обычно выполняемый в виде потенциометра, жестко укрепленного на корпусе прибора 5 (см. рис. 2.7). По виткам потенциометра 7 скользит щетка 6, ук¬ репленная на рамке гироскопа. Напряжение, снимаемое с потенци¬ ометра, пропорционально угловой скорости ЛА. Обычно на ЛА ус¬ танавливается блок ДУСов, состоящий из трех гироскопов соот¬ ветственно для каналов тангажа, курса и крена. Каждый ДУС из¬ меряет составляющую вектора угловой скорости, перпендикуляр¬ 29
ную рамке гироскопа. Составляющие угловой скорости ЛА, направ¬ ленные вдоль оси прецессии и параллельно оси гироскопа Z, оче¬ видно, не могут быть измерены. Путем усложнения конструкции двухстепенного дифференцирующего гироскопа можно измерять одновременно первую и вторую производные угловой скорости ЛА, например, с помощью установки потенциометрического и индукци¬ онного датчиков одновременно. Двухстепенной интегрирующий гироскоп Дифференциальное уравнение, описывающее работу * интегрирую¬ щего гироскопа (без пружины 3 на рис. 2.6), очевидно, получится из уравнения (2.6), если опустить член fenp₽- /р4-7пр=Я<оЛл + 4^пр. (2.9) Общее решение уравнения (2.9) можно представить в виде (без. учета члена Лтр sign р) р=С ехр(— После завершения переходного процесса в установившемся сос- t тоянии будем иметь — или $*=Нт~1 [ соЛА (г) dx-\-Сг о т. е. угловая скорость (3* рамки пропорциональна угловой скоро¬ сти соЛА, а угол поворота рамки пропорционален углу разворота ЛА. Таким образом, интегрирующий гироскоп может быть исполь¬ зован как датчик угла поворота ЛА относительно неподвижного пространства. При учете момента трения £тр на участке (3>0 будем иметь следующее частное решение уравнения (2.9) в установившемся сос- t тоянии: b$=L.s?lm и = j dx~т. е. ошибка в по- о казании прибора от Ттр будет возрастать пропорционально време¬ ни. Для увеличения точности гироскопических устройств жела¬ тельно избавиться от трения в подшипниках. Эта цель практически достигается в поплавковых гироскопах (см. стр. 34). 2.4. ГИРОРАМЫ Одноосная некорректируемая силовая гирорама Приложение внешнего момента к одной из рамок трехстепенного гироскопа теоретически не вызывает никакого вращения относи¬ тельно этой рамки, но в соответствии с правилом прецессии (2.2) вы¬ зывает прецессионное движение относительно другой суш (см. рис. 2.1). Поэтому возникновение возмущающего момента £в вдоль оси измерения Ур не вызывает вращения внешней рамки, а приводит к прецессии внутренней рамки относительно оси Хр, называемой в 30
теории силовой стабилизации осью прецессии, с угловой скоростью со = = (рис. 2.8). Вследствие пре¬ цессии возникает гироскопический момент £г=—(о//=—Ав, равный по величине и противоположный по на¬ правлению моменту LB. В результате возникновения £г система разгру¬ жается относительно оси измерения Ур, т. е. вдоль оси измерения сумм_а активно действующего момента LB и реактивного Lr равна нулю. Это состояние равновесия относительно оси измерения будет иметь место, пока совершается прецессия гиро¬ скопа относительно оси прецессии. Однако, если не принять соответст¬ вующих мер, кинетический момент Н вскоре совместится с моментом ZB, прецессия прекратится и внеш¬ Рис. 2.8. Одноосная силовая гирорама: I— контакт на раме; 2 и 3—контакты; 4—исполнительное устройство; 5—-сель¬ синная передача; 6—компас; 7—датчик момента коррекции; 8—редуктор; 9— разгрузочный двигатель: 10—усилитель; II— вариометр (вариометр //), выдающий няя рамка начнет вращаться относи¬ тельно оси измерения Ур как неги¬ роскопическое тело ввиду совпаде¬ ния направления векторов Н и. LB. Следовательно, ось гироскопа Z не будет удерживаться в заданном на¬ правлении. Чтобы этого избежать, устанавливается специальный датчик 'Сигнал, пропорциональный углу р (р характеризует неперпендику- лярность внешней и внутренней рамок). Сигнал с вариометра че¬ рез промежуточный усилитель 10 поступает на стабилизирующий (разгрузочный) двигатель Р, который создает момент_стабилиза- ции £ст, пропорциональный углу р: £ст=Ар. Момент ZCT направ¬ лен в сторону, противоположную возмущающему моменту LB. При некотором значении р=р* стабилизирующий момент равен возму¬ щающему: LB=ACT = fep*. Внутренняя рамка останется отклонен¬ ной на_ угол р* до тех пор, пока не будет снят возмущающий мо¬ мент LB. При исчезновении возмущающего момента внутренняя рамка под действием момента £Ст стабилизации вернется в исход¬ ное положение р = 0. Повышение точности гирорамы достигается вследствие разгруз¬ ки оси измерения, при этом усложняется конструкция гироприбора. Описанный прибор обеспечивает неизменность положения рамы только относительно одной оси — оси Ур, которая используется для измерения; на оси измерения Ур размещается потенциометрический Датчик. Чтобы иметь возможность определять положение ЛА отно¬ сительно двух и трех координат, используются двухосные и трех¬ осные гирорамы, принцип работы которых аналогичен рассмотрен¬ ной одноосной гирораме. 31
Трехосная силовая гирорама На рис. 2.9 приведена конструктивная схема трехосной гирорамы. В трехосной гирораме гироскопы А, В, С начинают прецессировать относительно своих осей прецессии при возникновении моментов соответственно вдоль осей измерения г, v, и. Разгрузочные двига¬ тели Ml, М2, М.3 вступают в работу по сигналам, снимаемым с ин¬ дукционных датчиков ИД, размещенных соответственно на осях прецессии гироскопов В, С, А. Корректируемые гирорамы Описанные гирорамы при использовании их в качестве датчиков уг¬ ловых положений ЛА на порядок точнее обычных авиагоризонтов и курсовых гироскопов. Чтобы удержать ось измерения в задан¬ ном положении более точно и более продолжительное время, соз¬ даются корректируемые гирорамы. Принципы построения коррек¬ тируемых гирорам достаточно разнообразны, они могут выполнять¬ ся в дискретной или аналоговой форме. Здесь будет рассмотрена непрерывная система коррекции, чувствительным элементом кото¬ рой является магнитный компас (см. рис. 2.8). Положение магнит¬ ной стрелки с помощью сельсинной связи 5 и исполнительного уст¬ ройства 4 преобразуется в соответствующее положение, контактов 2 и 3. При отклонении внешней рамки гироскопа из заданного по¬ ложения контакт /, жестко укрепленный на внешней рамке гиро¬ рамы, замкнет один из контактов 2 или 3. При замыкании одного из контактов подключается коррекционный двигатель 7, создаю¬ щий момент коррекции. Пусть для определенности внешняя рама отклонилась на угол Дф от заданного направления и контакт 1 замкнулся на контакт 2. В этом случае коррекционный двигатель 7 создает момент, направленный, как указано на рисунке. Под дей¬ ствием момента коррекции Z/KOp гироскоп Н вместе с внешней рам¬ кой начнет прецессировать относительно оси измерения с угловой скоростью (оКОр=^кор/^- После_ выбора люфта в редукторе 8 воз¬ никает момент сопротивления L\ в разгрузочном двигателе 9 и пре¬ цессия с угловой скоростью (Окор=^кор/^ прекратится. Под дейст¬ вием этого момента внутренняя рамка начнет прецессировать отно¬ сительно оси прецессии Хр, что приведет к повороту гироскопа на угол р и появлению момента LCT = &p и разгрузке оси измерения. Система сможет свободно прецессировать со скоростью (окор = = £кор/Я относительно оси измерения Ур до размыкания контакта 2. При размыкании контакта 2 датчик момента Z будет отключен и внутренняя рамка под действием момента LCT вернется в исход¬ ное положение. В авиагоризонте с силовой стабилизацией в качестве чувстви¬ тельных элементов системы коррекции обычно используются жид¬ костные маятники. В схеме универсального позиционного прибора с силовой ста¬ билизацией (например, трехосная гироплатформа автопилота АП- 15) чувствительными элементами системы коррекции являются 32
1996 2 33
жидкостные маятники П1 и П2. Сигналы маятников ГТ 1 и П2 при выходе гироплатформы Р из горизонта подаются соответственно на датчики моментов ДМ.1 и ДМ2 продольного В и поперечного С гироскопов. Коррекция в азимуте осуществляется по сигналу, сни¬ маемому с магнитного компаса, путем создания момента в коррек¬ ционном двигателе ДМ3 курсового гироскопа А. Дрейф позиционных силовых гироплатформ равен примерно 0,5 град/'ч. Поплавковые двухстепенные гироскопы Существенным элементом поплавковых, как и обычных гироско¬ пов, является быстро вращающийся ротор 8 (рис. 2.10), который вместе с рамкой 9 гироскопа образует гироузел 7, погруженный в жидкость, плотность которой равна плотности гироузла. Гироузел находится во взвешенном состоянии, и момент трения в его опорах 4 отсутствует. Рис. 2.10. Поплавковый интегри¬ рующий гироскоп: 1—корпус: 2—стато.р микро-сина- задатчика; 3—статор гиромото- ра; 4—опоры рамки; 5—статор микросипа-датч.ика выходного сигнала; 6—ротор микросина- датчика выходного сигнала; 7— кожух (гироузел); 8—ротор ги¬ роскопа; 9—рамка гироскопа (вилка); 10—ротор микросина- задатчика На борту ЛА поплавковые гироскопы размещаются в камерах, где поддерживается постоянная температура, что обеспечивает по¬ стоянство плотности жидкости и ее вязкость. В рабочем состоянии гироузел имеет нулевую плавучесть, подшипники практически пол¬ ностью разгружены, это позволило перейти от шариковых подшип¬ ников к подшипникам скольжения — каменным втулкам. Роль демпфера здесь играет жидкость, в которую погружен гироузел; путем выбора величины зазора между гироузлОхМ и корпусом при¬ бора можно добиться необходимой величины демпфирующего мо¬ мента. При неподвижном основании ось гироскопа Z совпадает с за¬ данным направлением Zo, угол (3 = 0 (см. рис. 2.10). Осью измере¬ ния гироскопа является ось Уо, перпендикулярная плоскости, со¬ держащей оси X и Zo. При возникновении составляющей со^о угло¬ вой скорости корпуса приборов, перпендикулярной плоскости, со¬ держащей оси X и Zo, гироузел начинает вращаться относительно своей оси вращения X и ось гироузла Z отклоняется на некоторый угол р от заданного направления Zo. В качестве датчика угла р используется микросин, действующий по принципу дифференцирую¬ 34
щего трансформатора, статор 5 микроспна крепится на корпусе, а ротор 6 — на оси гироузла (см. рис. 2. 10). В мнкросипе-датчике от¬ сутствуют скользящие контакты, что является важным преимуще¬ ством по сравнению с потенциометрическим датчиком. Микросины работают в жидкой среде. Работа интегрирующего гироскопа как датчика угла поворота ЛА относительно инерциального пространства принципиально не отличается от работы обычного интегрирующего гироскопа, рас¬ смотренного выше. Но поплавковый интегрирующий гироскоп бла¬ годаря высокой точности может работать как задатчик разворота ЛА относительно центра масс. Для этих целей на оси вращения ги¬ роузла устанавливается микросин-задатчик, ротор 10 которого кре¬ пится на оси гироузла, а статор 2 па корпусе прибора. Конструк¬ тивно микросин-задатчик не отличается от микросина-датчика. В упрощенном виде движение поплавкового, инте! рирующего гиро¬ скопа можно описать уравнением, аналогичным уравнению обыч¬ ного интегрирующего гироскопа (2.9): ТиД-и— (2.10) где и — выходное напряжение; кш-и— коэффициент усиления гиро¬ скопа, пропорциональный его кинетическому моменту Я; юУо — составляющая угловой скорости корпуса прибора, перпендикуляр¬ ная плоскости (Z0X); Т — постоянная времени интегрирующего ги¬ роскопа; /3— величина тока микросина-задатчика; kj; — коэффи¬ циент усиления микросина-задатчика. В уравнении (2. 10) опущен член LTpsignp ввиду ничтожности силы трения в поплавковых гироскопах. При отсутствии тока в за¬ датчике в установившемся состоянии из последнего уравнения бу¬ дем иметь и = к^Уо, откуда находим U=kmu (2.П) о т. е. напряжение на выходе микросина-задатчика пропорциональна углу поворота а летательного аппарата относительно оси Уо. При наличии команды управления /3=#0 в установившемся состоянии будем иметь ^ = к(а-и^Уо-[-к113. Если в соответствии с командой /3 корпус гироскопа разворачивается с угловой скоро¬ стью о)3, вызванной только током /3, то й = 0, и из последнего выра¬ жения получим + —0- Решая уравнение (2.12) относительно со3, найдем % = -V3/^- (2. 12) (2. 13) 2* 35
Интегрируя (2.13), получим a = j»(t)</t = — f/3(T)rfr, (2.14) о b т. e. угол поворота корпуса гироскопа пропорционален интегралу от тока микросина-задатчика. Таким образом, интегрирующий ги¬ роскоп может быть использован как задатчик разворота ЛА. Дифференцирующий поплавковый гироскоп отличается от рас¬ смотренного интегрирующего гироскопа установкой в нем какого- либо элемента, предназначенного для наложения момента, пропор¬ ционального углу отклонения гироузла от исходного положения, т. е. отличие то же, что и в обычных двухстепенных гироскопах. Во многих конструкциях поплавковых гироскопов этот момент созда¬ ется путем жесткого закрепления одной из опор поплавкового ги¬ роузла при помощи упругого стержня — торсиона, который подвер¬ гается деформации кручения при повороте гироузла. Принцип ра¬ боты поплавкового дифференцирующего гироскопа идентичен ра¬ боте обычного ДУСа. Гироплатформы со следящим приводом Высокая точность интегрирующих поплавковых гироскопов позво¬ ляет использовать их для построения гироплатформ, где они выпол¬ няют функции чувствительных элементов. На рис. 2.11 представле¬ на принципиальная схема одноосной гирорамы со следящим при¬ водом, удерживающим ее в заданном положении относительно оси Рис. 2.11. Одноосная следящая платформа: 4—основание стабилизатора; 2—щетки и контактные кольца для съема выходного напряже¬ ния t/BbIX потенциометра интегрирующего гироскопа; 3—щетки и контактные кольца для -подачи на задатчик интегрирующего гироскопа тока J3; 4—платформа одноосная; 5—цапфы оси платформы; 6—интегрирующий гироскоп; 7—усилитель; 8—стабилизирующий двигатель; 9—редуктор 36
измерения Упл по сигналу, снимаемому с интегрирующего гироско¬ па 6. Гироскоп 6 жестко закреплен на платформе 4. Ось измерения У интегрирующего гироскопа 6 должна совпадать с осью платфор¬ мы Уил (см. рис. 2.10, 2.11). Разгрузка оси измерения, т. е. компен¬ сация нежелательного момента Л^пл, осуществляется следующим образом. Возникновение момента /И^пл приведет к развороту кор¬ пуса гироскопа вместе с платформой относительно оси Уо (см. рис. 2.10, 2.11). Вследствие вращения гироскопа гироузел начнет вра¬ щаться относительно своей оси X, как это описано выше [см. фор¬ мулу (2. И)] и на выходе сельсина-датчика в соответствии с форму¬ лой (2.11) появится напряжение, пропорциональное повороту плат¬ формы относительно ее оси. Этот сигнал после усиления и преобра¬ зования поступает на стабилизирующий двигатель 5, который через редуктор 9 создаст момент стабилизации Л1СТ —направленный в сторону, противоположную моменту При некотором значе¬ нии сс = а* момент Л4СТ достигнет значения Л4Упл и отклонение плат¬ формы относительно оси Упл прекратится. Г1рп этом значение а = а* будет статической ошибкой гироплатформы. При исчезнове¬ нии момента А4Уил система вернется в исходное положение а = 0. Если момент стабилизирующего двигателя формировать по закону а(т)д?т, то статическая ошибка может быть сделана о равной нулю при Л^пл —const. Если поворот платформы осуществляется вследствие вращения ЛА относительно оси Упл, то в соответствии с описанной выше ра¬ ботой интегрирующего гироскопа с микросина-задатчика будет сниматься сигнал, пропорциональный углу поворота ЛА [см. фор¬ мулу (2.11)]. В соответствии с этим сигналом следящая система будет разворачивать платформу до тех пор, пока она не вернется в исходное положение относительно неподвижной системы коорди¬ нат, но при этом она окажется равернутой относительно ЛА на угол, равный углу разворота ЛА относительно инерциального про¬ странства. Таким образом, положение платформы относительно ЛА соответствует углу разворота ЛА относительно неподвижного пространства. Выше описана работа платформы в режиме стабилизации отно¬ сительно инерциального пространства. В режиме управления на микросин-задатчик гироскопа подается сигнал /3. А1икросин созда¬ ст момент M3 = kII3, под действием которого гироузел начинает вращаться относительно своей оси X. Из уравнения (2.10) для ус¬ тановившегося состояния приходим к соотношениям (2.13), (2.14), т- с.: а) платформа будет разворачиваться с угловой скоростью Чь пропорциональной величине тока в микросине-задатчике; б) угол разворота платформы пропорционален интегралу от вели¬ чины тока микросина-задатчика. В описываемом режиме управле- НИя платформу можно использовать для двух целей: 1) разворота платформы в желаемое положение, например, доворот ее в гори¬ 37
зонт места; 2) для программного разворота ЛА; в этом случае вра¬ щение платформы относительно ЛА [см. формулу (2.14) j использу¬ ется как сигнал рассогласования между фактическим положением ЛА и требуемым. По этому сигналу формируется команда управле¬ ния и ЛА вместе с платформой разворачивается так, чтобы свести сигнал рассогласования (2.14) к нулю. Таким образом, здесь плат¬ форма используется как задатчик программного разворота ЛА. Можно построить двух- и трехосные платформы. Трехосная платформа размещается в кардановом подвесе и на ней устанавли¬ ваются три интегрирующих гироскопа. Ось измерения каждого из них совпадает с одной из осей платформы. Таким образом, каждый из гироскопов контролирует положение платформы относительно одной оси. Работа каждого гироскопа идентична описанной выше работе гироскопа с одноосной платформой. Трехосная (двухосная) платформа может работать в описанных выше режимах работы од¬ ноосной платформы и может быть использована как задатчик про¬ странственного разворота ЛА. На платформе можно разместить ак¬ селерометры линейных ускорений для построения инерциальных систем управления ЛА.
Глава 3 СТРУКТУРНЫЕ СХЕМЫ АВТОПИЛОТОВ 3.1. АВТОПИЛОТЫ ИХ НАЗНАЧЕНИЕ, СОСТАВ, ФУНКЦИОНАЛЬНАЯ СХЕМА Автопилот представляет собой совокупность технических средств, обеспечивающих стабилизацию и управление угловым положением летательного аппарата. На автопилот возложены две основные за¬ дачи. Первая задача заключается в стабилизации движения ЛА от¬ носительно центра масс. При этом стабилизация осуществляется обычно относительно трех его связанных осей OZ, ОУ, ОХ. Техни¬ ческие средства, обеспечивающие стабилизацию относительно этих осей, называются соответственно автопилотами тангажа (продоль¬ ного движения), курса и.крена. Каждый из этих каналов обычно в значительной степени работает автономно, однако имеются некото¬ рые перекрестные связи, которые будут рассмотрены ниже. Урав¬ нения движения ЛА относительно разных осей взаимосвязаны [см. уравнения (1.22), (1.27)]. Все же имеет смысл рассматривать ка¬ налы крена, курса и тангажа как самостоятельные автоматические системы. Вторая задача заключается в управлении движением центра масс ЛА. Для ориентации ЛА относительно вектора скорости путем отклонения рулей высоты и курса, а также элеронов создаются уп¬ равляющие силы для перемещения центра масс ЛА. В летательных аппаратах с поворотным крылом исполнительное устройство авто¬ пилота непосредственно отклоняет крыло, которое создает управля¬ ющую силу. В космосе или в очень высоких слоях атмосферы уп¬ равляющие силы создаются реактивными двигателями. Автомати¬ ческая бортовая система управления современных воздушных лай¬ неров является очень сложной разветвленной системой и включает автоматическую стабилизацию ЛА относительно центра масс (соб¬ ственно автопилот), систему траекторного управления, автомат тя¬ ги и различные вычислители. В состав автопилотов входят следующие группы устройств и приборов: датчики первичной информации; рулевые машины (при- в°Ды); вычислители, усилители мощности, преобразующие и за¬ дающие устройства. Гироскопы и гироскопические устройства,'яв¬ ляющиеся основными чувствительными элементами автопилота, 39
Рис. 3.1. Функциональная схема автопилота рассмотрены в гл. 2. Ос¬ тальные части автопилота. изучаются в специальных курсах. В состав автопилота вхо¬ дят: 1) функционально необ¬ ходимые элементы: рулевая машина, гироскопические чувствительные элементы, акселерометры, датчик скоростного напора и т. п.; 2) элементы, которые не являются функционально необходимы¬ ми: всевозможные корректирующие цепи, вычислители, преобразу¬ ющие, запоминающие, программные устройства. Элементы второй группы включаются в состав автопилота в процессе его констру¬ ирования, отработки и испытания. Функциональная схема автопилота приведена на рис. 3.1. ЛА является объектом управления, а технические средства: датчики первичной информации (ДПИ), суммирующий усилитель (СУ), за¬ дающее устройство (ЗУ) и привод — исполнительный механизм (ИМ) —в совокупности представляют собой автопилот (АП). Обычно ЛА подвержен со стороны атмосферы или космического пространства различным силовым воздействиям, которые имеют как детерминированный, так и случайный характер. 3.2. АВТОПИЛОТЫ КРЕНА Система уравнений движения ЛА с автопилотом крена Автопилот крена предназначен для стабилизации и переориента¬ ции ЛА относительно продольной оси X. Приведем систему диф¬ ференциальных уравнений, описывающих движение ЛА по крену с АП. Будем считать, что движение ЛА по крену описывается урав¬ нением (1.31). Уравнения свободного гироскопа (СГ) и дифференцирующего гироскопа (ДУС) имеют соответственно вид = (3. 1) (72i^ + 2^-p4-l)«-=ATY) (3.2) где fecr, — коэффициенты усиления соответственно свободного гироскопа и ДУСа; и- —напряжения, снимаемые соответствен¬ но с потенциометров СГ и ДУСа; Т- —постоянная времени ДУСа. Рулевая машина с усилителем мощности, входным суммирующим усилителем и обратной связью образуют рулевой тракт (рис. 3.2, контур III). Запишем систему уравнений, описывающих его работу. 40
Рис. 3.2. Структурная схема статического автопилота угла крена Работу входного суммирующего усилителя, в качестве которого часто используется магнитный усилитель, можно описать уравнени¬ ем первого порядка (^СМУ^Ч" 1) ^СМУ ~^СМу^вх> (3.3) где Тему, Лему —постоянная времени и коэффициент усиления суммирующего магнитного усилителя (СМУ); rzBX, исму —сигна¬ лы соответственно на входе и выходе усилителя. После входного суммирующего усилителя обычно размещается усилитель мощно¬ сти. В пневмоэлектрических автопилотах обычно используется струйное реле (или золотниковое устройство), являющееся усили¬ телем мощности. Его работу можно описать уравнением второго порядка ТумЯУМ + 2$ГуМя Ум + ^УМ — ^УМ^СМУ’ (3-4) где Тум, ^ум, £ — соответственно постоянная времени, коэффи¬ циент усиления и коэффициент относительного демпфирования уси¬ лителя мощности (УМ); и ум —сигнал на выходе усилителя мощ¬ ности. Привод часто может быть описан следующим уравнением второ¬ го порядка: ^РМ^э ^э = ^РМ^УМ’ (3*5) где ТРМ, &РМ — постоянная времени и коэффициент усиления ру¬ левой машины (РМ). Работа рулевой машины обычно описывается Уравнением более высокого порядка. Отрицательную обратную связь опишем усилительным звеном «о.с = *о.Л- (3.6) Уравнение замыкания автопилота имеет вид (см. рис. 3.2) ^вх ^о.с ^вх ^о.с» (3. 7) где Uf — управляющий сигнал на входе автопилота; —щ + + uf=авх — суммарный сигнал на входе автопилота. 41
Система уравнений (1.31), (3.1) — (3.7) описывает динамику ЛА с автопилотом. При цу=цу(/) система ЛА + АП работает в ре¬ жиме управления, а при W/ = const, в частности, при U/=0,— в ре¬ жиме стабилизации. В режиме стабилизации автопилот удержива¬ ет ЛА на заданном режиме полета (в данном случае АП стабили¬ зирует угол крена у), парируя всевозможные возмущения, дейст¬ вующие на ЛА,’в частности, атмосферные. Уравнение (1.31) с уче¬ том атмосферных возмущений можно записать в следующем виде [см. уравнения (1.24), (1.25)]: (Т,р+ 1) У=^8э + Л1Х.в/^?- (3- 8) Система уравнений (3.1) — (3.8) описывает режим стабилизации системы ЛА + АП с учетом атмосферных возмущений. Контур //, замыкаемый через ДУС, называется контуром демп¬ фирования (демпфером). Его основное назначение состоит в том, чтобы демпфировать колебания ЛА относительно продольной оси, создавая момент искусственного демпфирования. Демпферы канала крена Для некоторых типов ЛА оказывается возможным ограничиться стабилизацией параметра у, не прибегая к стабилизации у, так как выработка команды управления и ее исполнение осуществля¬ ется в одной и той же системе координат — в связанной. Однако- необходимо иметь в виду, что возникновение угловой скорости кре¬ на приводит к взаимозависимости систем уравнений, описывающих движение ЛА относительно осей X, Y, Z, что затрудняет создание систем стабилизации. Динамика ЛА без автопилота. Предварительно рассмотрим дви¬ жение по крену ЛА с закрепленным рулем (вариация 6э = 0) без автопилота [см. формулу (3.8)]: (7'^+1)Т = Ж>8э.в,Ш7. (3.9) Переходный процесс будет описываться экспонентой с постоян¬ ной времени 7^, а установившееся значение у найдем из последне¬ го уравнения, полагая в нем р = 0: (3. 10) т. е. возникшая угловая скорость крена под воздействием возмуща¬ ющего момента А7ВХ—-7ИМЭ.В будет возрастать до такой величи¬ ны у*, чтобы момент естественного демпфирования компен¬ сировал возмущающий момент 7ИВ х. Чем больше возмущающий момент, тем большего значения достигнет угловая скорость крена у*. Однако из-за значительной величины у* произойдет сильная взаимозависимость каналов ЛА, при этом уравнение (3.8) услож¬ нится, а ЛА может потерять устойчивость движения. Для умень-
тения угловой скорости крена необходимо элероны ЛА отклонять по определенному закону при помощи АП или летчика. Динамика ЛА с идеальным автопилотом. В этом случае все звенья автопилота, описываемые уравнениями (3.2) — (3.7), будем считать усилительными, т. е. пренебрегаем их инерционностью, и динамика системы ЛА + АП будет описываться двумя уравнениями 1) Y = + V— — (3. И) где &ап — коэффициент усиления идеального автопилота. Из системы уравнений (3.11) найдем передаточную функцию U73’T (р) замкнутой системы ЛА + АП: ^3T^) = Y(P)KB(P) = W3^+1), (3. 12) где ^3 = /И^э/(1+^ап)^хх’ 5г3 = Л/(1 + ^ап)—соответственно ко¬ эффициент усиления и постоянная времени системы ЛА-(-АП. Из системы (3.11) находим значение угловой скорости крена у* в установившемся состоянии (р = 0): ^* = ^.в=^Хв/(1+^ап)<А. (3. 13) Сравнивая (3.13) с (3.10), замечаем, что за счет достижения достаточно большого значения коэффициента усиления системы в разомкнутом состоянии &р = &т£ап можно в несколько раз умень¬ шить требуемое значение установившейся скорости крега для соз¬ дания демпфирующего момента с целью компенсации возмущения. Выбирать величину &р достаточно сложно: необходимо учитывать устойчивость системы, случайные шумы и помехи, циркулирующие в системе и воздействующие на систему со стороны окружающей среды. Постоянная времени Т3 уменьшается в (1+&р) раз, т. е. за счет выбора достаточно большого коэффициента усиления системы в разомкнутом состоянии можно в несколько раз уменьшить дли¬ тельность переходного процесса. Так как установившееся значение Y* [см. формулу (3.13)] отлично от нуля, то рассматриваемый ав¬ топилот является статическим по отношению к координате и возмущению Л4^Э8Э.В = const. Момент МХ = М*ЭЪ9==— АфЛАпу называется моментом искус¬ ственного демпфирования. Он создается путем отклонения элерона на угол Вэ = —&Апу и направлен на уменьшение угловой скорости крена. Аналогично создается момент искусственного демпфирова¬ ния в каналах курса и тангажа. Момент естественного демпфиро¬ вания (см. гл. 1) также направлен на уменьшение угловой скоро¬ сти крена, но он создается ЛА в целом. 43
Статический и астатический автопилоты Понятие о статическом и астатическом автопилотах рассмотрим на примере контура демпфирования (демпфера) канала крена. Най¬ дем передаточную функцию рулевого тракта (РТ) в предположе¬ нии безынерционное™ суммирующего усилителя и усилителя мощ¬ ности (контур III на рис. 3.2): где U7pT (р) = Вэ (р)/авх (/?)=^РТ (71т/>2 + 2^ РТр + 1) ^РТ = ^СМУ^УМ^Рм/( 1 Н“^СМУ^УМ^РМ^о.с);’ 7"рт = [7"рм/( 1 Н~^СМУ^УМ^РМ^о.с)]1/2> ^ = [27прм (1-ф-^сму^ум^рм^о.с)]- 1 1 (3. 14) — соответственно коэффициент усиления, постоянная времени и относительный коэффициент демпфирования рулевого тракта. Из передаточной функции (3.14) для установившегося состояния (р = = 0) найдем (3. 15) или 8д = —£рт£уу при авх = — Луу, т. е. угол отклонения элеронов в установившемся состоянии пропорционален входному сигналу. Система уравнений (3.8), (3.14) при авх= — k^y описывает ра¬ боту системы ЛА + АП в режиме стабилизации заданной угловой скорости крена, равной нулю. Полагая в этой системе р = 0, най¬ дем установившееся значение угловой скорости крена (3. 16) которое отлично от нуля и, следовательно, рассматриваемая систе¬ ма ЛА + АП является статической по отношению к координате у и возмущению Л4ВХ=const; автопилот в этом случае называется ста¬ тическим. Установившееся нулевое значение угловой скорости крена можно получить путем формирования астатической системы. В частности, астатизм в автопилотах создается путем введения Рис. 3.3. Структурная схема астатического авто¬ пилота демпфера угловой скорости крена гибкой отрицательной об¬ ратной связи (рис. 3. 3) в ру¬ левом тракте автопилота: ^о.с = Мо.с6э. При этом пере¬ даточная функция рулевого тракта будет (см. рис. 3.3? контур II) ^Рт(Р) = 8э^)Мх(М = = ^СМУ^УМ^Р м/Р (ТрмР~\~ + 1 4~^СМУ^УМ^РМ^о.с)* (3- 17) 44
Если рулевой привод (3.5) не охватывать отрицательной обрат* ной связью, то автопилот также будет астатическим (без учета шарнирных моментов, которые выполняют частично роль жесткой отрицательной обратной связи). Но быстродействие его будет не- достаточным. Скорость отклонения элеронов в установившемся состоянии1? 6Э* в соответствии с (3.17) будет 5э = ^рТ°вх, (3- 18) т. е. при охвате рулевого тракта гибкой отрицательной обратной связью скорость отклонения элеронов (руля) пропорциональна суммарному сигналу овх на входе рулевого тракта. Выше было по¬ казано, что при жесткой отрицательной обратной связи в рулевом тракте угол отклонения элеронов пропорционален сигналу на его входе [см. формулу (3.15)]. При овх = — ^у — k^k-У [см. формулу (3.7)] из формулы (3.18) получим (см. рис. 3.3) В* = — АРТ^у — (3. 19) Первое слагаемое в формуле (3.19) вводится в АП для астатизма системы, а второе — для замыкания системы и создания момента искусственного демпфирования без которого совре^ менный ЛА не обладал бы достаточным демпфированием. В аста- тических автопилотах для каналов тангажа и курса необходимо вводить в закон управления соответственно <>, ф для создания мо-> ментов искусственного демпфирования. Для доказательства астатизма системы, представленной на рис. 3. 3, достаточно составить передаточную функцию в замкнутом со¬ стоянии W3(p)=y (р)/Мвх(р) = у и положить в ней /7=0. При этом получим у* = 0 при AJ^383 = const, т. е. система является астатической, а соответствующий автопилот является ас¬ татическим по отношению к координате у и возмущающему момен¬ ту AlBX = const. Если бы момент был возрастающей фун.кцией вре¬ мени, например уИвх = я/, то установившееся значение угловой ско^ рости крена было бы отлично от нуля. Рассматриваемая система является статической по отношению к координате у и возмущению MbX = at. Таким образом, понятие «статизм» и «астатизм» системы нужно относить к конкретным возмущениям и координатам. В рулевом тракте автопилота часто используется изодромная обратная связь uQ,c = k0^Tp(Tp+ 1)_1бэ. Непосредственно из рис. 3.3 при wo.c = ^o.cTp(Tp+1)-1бв найдем выражение для передаточ¬ ной функции рулевого тракта: V7 (п) = М/0 _ ^сму^ум^рм ₽ 'М (Т^р + ЩТр 1)+VWPM*o.cr ’ 45
из которой для установившегося состояния найдем ^э~ ^СМУ^УМ^РМ [1 “I" ^СМУ^У M^P'lA) сП 1 aBX’ т. е. в установившемся состоянии автопилот с изодромпой связью в рулевом тракте ведет себя как астатический [сравнить с форму¬ лой (3.18)]. Представим передаточную функцию изодромпой обратной свя¬ зи в виде /А).с = &о.сР(р + Г_1)“16э, которая при 7->оо преобразуется в жесткую отрицательную обратную связь ио.с = ^о.сбэ. таким обра¬ зом, в переходном режиме автопилот будет вести себя почти как статический. По мере уменьшения постоянной времени Т свойства автопилота все более будут отличаться от свойств статического ав¬ топилота. Итак, автопилот с изодромпой обратной связью обладает как свойствами астатического, так и статического автопилота. Все же автопилот с изодромпой обратной связью называют астатиче¬ ским. Автопилоты стабилизации угла крена ЛА Для большинства типов ЛА необходима стабилизация угла крена. К стабилизации крена прибегают, в частности, когда команда уп¬ равления вырабатывается в несвязанной системе координат, а ис¬ полняется в связанной (см. рис. 3.2). Можно, конечно, осуществить пересчет команды управления из одной системы координат в дру¬ гую; в этом случае можно отказаться от стабилизации угла крена. Система уравнений (3.1) — (3.8) описывает работу статического автопилота угла крена. Астатический автопилот крена можно пост¬ роить путем осуществления гибкой отрицательной обра1ной связи в рулевом тракте «о.с=Р^о.сбэ. Для создания момента искусствен¬ ного демпфирования введем в закон управления у. При этом урав¬ нение замыкания автопилота (3.7) примет вид «вх=—«о.с —«7—и;—«y + «z. (3.20) Система уравнений (3.1) — (3.5), (3.8), (3.20) и ыо.с=Мо.с6э опи- сывает работу астатического автопилота угла крена. Работа иде¬ ального астатического автопилота с учетом (3.20) может быть опи¬ сана уравнением &э = — /г^рт^сгТ — ^pt^Y — kp^k-fay. (3.21) Часто уравнение работы идеального автопилота называют законом управления. Закон управления (3.21) обеспечивает регулирование по интегралу (первое слагаемое), по отклонению (второе слагае¬ мое) и по производной (последнее слагаемое). На разных этапах проектирования автопилота используется со¬ ответствующая идеализация схемы, приведенной на рис. 3.2. 46
3.3. АВТОПИЛОТЫ ДЛЯ ПРОДОЛЬНОГО и КУРСОВОГО КАНАЛОВ Автопилоты каналов тангажа и курса предназначены для стабили¬ зации и переориентации ЛА соответственно относительно связан¬ ных осей Z и У. Запишем систему уравнений, описывающих курсовое движение ЛА с автопилотом: (р2 4" ^1/4 ф 4“ ^2? = 4" ^зу!Jуч p^ — b^=ZJmV^ ф=?4-Р; _ (TcNWP 4~ 1) ^СМУ = ^СМУ^вх5 (7"умР24"^7"уМ^4“ 1) %М — ^УМ^СМУ’ I + /4 = ЛРМЙУМ» #0.с Первые два уравнения описывают движение ЛА по курсу (1.22), все остальные, написанные по аналогии с уравнениями (3.1) — (3.7), отражают динамику курсового автопилота. Используя уравнения движения ЛА (1.30), по аналогии с (3.22) запишем систему уравнений, описывающую продсл-ьное движение системы ЛА + АП: (р2 а1Р) & -|- а2а = &зВв -|- MBZjJ2; /?0 — a^ = YJmV^ & —0 —ct = O; (Г^ + 2^ + 1)^ = ^; (ТСМУ/?4" 1) #СМУ — ^СМУйвх5 (7"умА*24’2В7’ум/2 4" 1) %м~^ум^сму» (Тр1лР2 4~ /4 ^В~^РМЙУМ’ йо.с = АЛ fZBx ^о.с 4- Сигнал ц0.с в предпоследнем уравнении в системах (3.22), (3.23) осуществляет жесткую отрицательную обратную связь. Следова¬ тельно, эти системы являются статическими по отношению к коор¬ динатам соответственно ip и $ и возмущениям, постоянным по ве¬ личине. Моменты Мв у, Мв z и силы Ув и 2В отражают воздействие ат¬ мосферы на ЛА. ' На рис. 3.4 приведена структурная схема системы ЛА + АП ка¬ нала курса. Идентичная схема имеет место и для канала тангажа. Эта схема без звена k^p соответствует системе уравнений (3.22). Астатизм в каналах курса и тангажа вводится за счет гибкой отрицательной обратной связи в рулевом тракте. При этом пред¬ последнее уравнение в системе (3.22) примет вид и0.с=р£0.с6н. Для создания момента искусственного демпфирования введена в (3. 23) 47
Рис. 3.4. Структурная схема системы ЛА + АП канала курса закон регулирования вторая производная яр от угловой ко¬ ординаты (см. рис. 3.4). Вто¬ рая производная яр обычно по¬ лучается путем дифференциро¬ вания сигнала с ДУСа -или снятия сигнала с его индукци¬ онного датчика. Если в руле¬ вых трактах осуществляется гибкая отрицательная связь, то работа идеального автопилота соответственно для руля высо¬ ты и направления имеет вид 8В = — k$/p — kfl — 8„=- ад/ p-k:^- k*k$. Здесь первые слагаемые характеризуют астатизм в системе, вто- рые — замыкание системы по соответствующим координатам, а третьи — дополнительное отклонение руля для создания момента искусственного демпфирования. Если же в рулевых трактах осуществляется жесткая отрицав тельная обратная связь, то работа идеального автомата продоль¬ ного канала и канала руля направления может быть описана уравнениями 8В=— М—8Н=—ад— здесь первые слагаемые введены для замыкания системы, вторые — для создания момента искусственного демпфирования. Если канал руля направления формируется как демпфер, то сиг¬ нал не вводится в закон управления. Работа статического идеального автопилота в режиме стабили¬ зации высоты полета может быть описана уравнением Возможная структурная схема стабилизации высоты полета ЛА показана на рис. 3.5. Сигнал предназначен для стабилизации движения ЛА относительно центра масс, при этом свободный гироскоп может отключаться в режиме стабилизации высоты полета. Сигнал Н обеспечивает стабилизацию высоты полета: сигнал kHH осуществляет замыкание системы по координате Я, сигнал k^H—демпфирование системы по координате /7, а сигнал кнкН1р придает системе астатические свойства. Для некоторых типов ЛА необходимо на определенных участ¬ ках траектории стабилизировать скорость полета, число М и т. п. Маневрирование самолета в горизонтальной плоскости обычно осуществляется путем создания угла крена. Если разворот жела- 48
Рис. 3.5. Структурная схема автопилота тангажа со стабилизацией высоты полета подъемной силы до такого значения, тельно совершить без поте¬ ри высоты полета, то это осуществляется следующим образом. Из канала курса поступает сигнал у3 в канал крена для создания требуе¬ мого угла крена и в канал тангажа а3 для увеличения угла атаки. Таким образом, осуществляется взаимосвязь всех трех каналов через ав¬ топилот. Увеличение угла атаки приводит к увеличению при котором вертикальная Ув составляющая подъемной силы Ya достаточна для поддержания горизонтального полета: G=KB = = yacosy. Величина горизонтальной Уг составляющей подъемной силы при этом будет равна yr=yrtsiny. Из последних двух соот¬ ношений найдем величину управляющей силы ЛА в горизонталь¬ ной плоскости yr=Gtgy, выраженную через силу тяжести. Из этой формулы следует, что маневры в горизонтальной плоскости могут осуществляться столь же стремительно, что и в вертикаль¬ ной плоскости. Например, при у=45° величина управляющей си¬ лы в горизонтальной плоскости Уг достигает силы тяжести. При эксплуатации ЛА, когда крен недопустим, например, при геодезических съемках разворот вектора скорости ЛА в горизон¬ тальной плоскости приходится осуществлять за счет создания угла скольжения путем отклонения руля направления (см. пример 2 в гл. 7). 3.4. ОБЩИЕ ВОПРОСЫ ПОСТРОЕНИЯ АВТОПИЛОТОВ Понятие о расширенном объекте управления При некоторых методах синтеза оптимальных систем управления приходится вводить понятие «расширенный» объект управления. В частности, расширение объекта управления осуществляется за счет включения исполнительного устройства, некоторых измеритель¬ ных систем, инерционность которых желательно учесть, в объект управления. При этом оптимальное управление отыскивается как безынерционное, например, в виде системы отрицательных обрат¬ ных связей; ивх=—Lx, где х — вектор состояния расширенного объекта, a L — матричный коэффициент усиления (см. гл. 4). Построим расширенный объект управления для продольного канала, описываемого системой (3.23). Исключая промежуточные переменные в группе уравнений сис¬ темы (3.23), описывающих работу рулевого тракта [сравнить с 49
уравнением (3.14)], представим (3.23) в предположении безынерци¬ онное™ суммирующего усилителя и усилителя мощности в виде (р2 -Hl/?) & + я2а = Яз&в + MKZUZ; рЬ — а4а = Ук1тУй-, и»=Лсг&; & —6 —а=0; (4р2 + 2^р+1)М4>=^4; (7"рт/?2 + 2^РТР 4“ 1) — ^РТСвх» овх == 4~ Ilf. В системе (3.24) предпоследнее уравнение описывает рулевого тракта автопилота. Представим уравнение (3.24) в виде (р24~^1Р) &-|-#2а — ^З^в4“^вг/А» ^9 —a4a = KB/mIZ0; & — 9 — а = 0; (7^>тР22£7Vr/H“ 1) &в = ^ртЯвх; ^вх= —£х; - (3.24) работу (3. 24а) и$ — ^cr^j ^.0.— Первые четыре уравнения системы (3.24а) описывают расши¬ ренный объект управления, а последнее уравнение задает закон управления в функции вектора фазового состояния расширенного объекта х. Уравнения (3.246) описывают работу безынерционного измерителя. Пример синтеза автопилота методом модального уп¬ равления и аналитического конструирования приведем в гл. 4 и 5. Передаточные числа. Ограничение величины сигналов Значения, характеризующие отношение в установившемся состоя¬ нии величины угла отклонения управляющей поверхности к величи¬ не координат, например, у, ф, О, у, Ф> Н/Р и ДР-, называются передаточными числами автопилота. При заданной структуре рас¬ чет автопилота сводится в значительной степени к выбору величин передаточных чисел. При этом важны не только величины коэффи¬ циентов, но и их взаимное соотношение. Поясним последнее ут¬ верждение. Пусть для некоторого автопилота в установившемся состоянии имеем бв= ——k-^&. Если коэффициент слишком большой, тогда при некотором возможном значении Ф = -th величина k- будет настолько велика, что руль ляжет на упор (канал «за¬ бит» сигналом /^th), то хотя демпфирование будет хорошее, но реагировать автопилот на сигнал А^О не будет. Аналогично, если при возможном значении 0' = <01 сигнал будет настолько велик, что под действием только этого сигнала руль ляжет на упор, то не будет создаваться момент искусственного демпфирования, что мо¬ жет привести к колебательности и даже неустойчивости системы. Весь диапазон возможного отклонения руля нужно разумно рас¬ пределить между позиционным сигналом ЛяФ и сигналом ко¬ 50
торый используется для создания момента искусственного демпфи¬ рования. Правильное распределение может быть достигнуто путем рационального выбора соотношения k^/k&. Если в закон управле¬ ния входят не два, а три и более слагаемый {см., например, форму¬ лу (3.21)], то располагаемый угол отклонения руля высоты соот¬ ветствующим образом распределяется между всеми составляющи¬ ми сигнала, которые могут поступить одновременно на вход руле¬ вого тракта автопилота. Необходимо иметь в виду, что рулевой привод может войти в автоколебательный режим при большшх ко¬ эффициентах усиления из-за нелинейности в нем. Однако не всегда возможно и целесообразно выбирать коэффи¬ циенты, руководствуясь изложенным. Иногда желательно, чтобы коэффициенты и k& были достаточно велики, важно, например, чтобы при малом отклонении угла О сигнал был бы уже дос¬ таточно большим для парирования возникающего возмущения. В таком случае ограничение максимального значения сигнала по каждой составляющей kHIi и другим можно достигнуть путем введения линейного звена с насыщением в этих каналах: при малых отклонениях координаты хД/ = ф, у, ф, Н и т. д.) за счет выбора достаточно большого коэффициента автопилота ki можно быстро свести рассогласование по координате Х{ к нулю. С дру¬ гой стороны, при больших отклонениях по координате Xi руле¬ вой тракт не будет «забит» сигналом /г^, так как его величина ог¬ раничена значением (^Х;)тах путем введения нелинейности типа насыщения. Таким образом, линейный автопилот, одна или не¬ сколько координат которого вышли на ограничение, становится не¬ линейным. Для удовлетворения техническим требованиям неиз¬ бежно приходят к той или иной схеме автопилота и, в частности, к величине максимального значения сигнала ^хг- по каждой коорди¬ нате. При этом, разумеется, будут проведены соответствующие рас¬ четы системы на устойчивость,, качество переходного процесса, быстродействие и т. п. с последующим математическим и натурным моделированием. В процессе функционирования описанные выше линейные автопилоты могут выходить на ограничения по углу д отклонения руля и его производной S. Выход по координате 6 на ограничение происходит из-за ограниченной мощности рулевой ма¬ шины. Из конструктивных и аэродинамических соображений прихо¬ дится также ограничивать и угол отклонения управляющей поверх¬ ности. Имеют ограничения и другие элементы автопилота: усилите¬ ли, преобразователи мощности и др. Поэтому автопилоты можно считать линейными только при некоторых значениях сигналов управ¬ ления и величин возмущающих сил. При превышении этих значений некоторые координаты автопилота выходят на ограничения и авто¬ пилот становится нелинейным. Автопилот можно проектировать и как нелинейный путем введе¬ ния нелинейных элементов. Нелинейные элементы, в частности, ре¬ лейные звенья в контуре АП, могут существенно улучшить некото¬ рые показатели его работы, сделать его адаптивным. 51
О переходе к адаптивным .автопилотам Современные ЛА летают в широком диапазоне скоростей и высот, от которых в явном и неявном виде зависят все динамические коэф¬ фициенты. В процессе полета изменяются также моменты инерции,, геометрия ЛА, отделяются элементы конструкции ЛА, существенно изменяется масса и расположение центра масс ЛА. Могу г, наконец, отделяться целые ступени ЛА, но в этом случае обычно управление переходит на другие управляющие поверхности и исполнительные двигатели; переход на работу другой ступени можно рассматривать и как переход на работу другого автопилота. Оказывается, невоз¬ можно не только удовлетворить все технические требования, но даже обеспечить устойчивость системы в рамках рассматривае¬ мых выше структур, если параметры автопилота считать постоянны¬ ми. Чтобы автопилоты работали удовлетворительно на всех режи¬ мах полета, необходимо коэффициенты и даже структуру приведен¬ ных выше схем изменять в процессе полета или создавать специаль¬ ные схемы, способные придавать системе ЛА + АП адаптивные свой¬ ства в рамках жесткой структуры. Впервые процесс перенастройки автопилота в полете был осуществлен путем изменения коэффици¬ ента усиления отрицательной обратной связи /г0.с в рулевом тракте по сигналу с датчика скоростного напора. Перенастройка ko c при¬ водит к изменению коэффициента усиления рулевого тракта £рТ = £сму £ум£рм/(1 + #сму £ум&рм£о.с) [см. формулу (3.14)] и коэффициента усиления автопилота в разомкнутом состоянии. Если коэффициент усиления рулевого тракта в разомкнутом сос¬ тоянии ^сму £ум &рм £0.с 1» то ^рт~£^с, т. е. при изменении ^о.с в несколько раз практически во столько же раз изменяется ко¬ эффициент йрТ, а следовательно, коэффициент усиления всей сис¬ темы ЛА + АП в разомкнутом состоянии. Этим методом удается су¬ щественно улучшить работу автопилота на «вялых» режимах (q = = 0,5qV2 — мало) путем уменьшения &0.с, что приводит к увеличе¬ нию и коэффициента усиления автопилота в разомкнутом состоянии. Наоборот, при больших скоростных напора) коэффи¬ циент усиления ЛА резко возрастает. Чтобы система осталась ус¬ тойчивой, необходимо коэффициент автопилота уменьшить, для че¬ го необходимо коэффициент /г0..с увеличить. Этот метод позволяет значительно стабилизировать динамические характеристики сис¬ темы ЛА + АП. Однако при изменении коэффициента &рТ одновре¬ менно и равномерно изменяются все передаточные числа автопило¬ та, т. е. отношение коэффициентов автопилота на различных ре¬ жимах остается неизменным. Кроме того, постоянная времени всей системы ЛА + АП вследствие изменения постоянной времени ЛА также изменяется в процессе полета, а подстройкой коэффициента усиления невозможно повлиять на значение постоянных времени. Все это привело к необходимости синтеза автопилотов, которые бы одинаково хорошо работали на всех режимах полета ЛА. Такие схемы автопилотов были разработаны и они получили название адаптивных, самонастраивающихся. 52
3.5. РАБОТА АВТОПИЛОТА В качестве примера рассмотрим работу автопилота АП-15. Автопи¬ лот АП-15 предназначен для автоматического пилотирования тя¬ желых самолетов и выполняет следующие задачи: 1) стабилиза¬ цию самолета относительно трех связанных осей; 2) стабилизацию высоты полета; 3) выдерживание заданного компасного курса; 4) осуществление координированного разворота, набора высоты, планирования и некоторых других операций. Функциональная схема автопилота представлена на рис. 3.6. Автопилот является полностью электрическим и состоит из следую¬ щих устройств: гироскопической платформы (ГП) (см. также рис.. 2.9), блока демпфирующих гироскопов (ДУС), корректора высоты (КВ), усилителя (У) рулевых машин (РМ) и пульта управления с комплектом устройств для визуальных наблюдений за правильно¬ стью работы автопилота и за ориентацией самолета в пространстве. Автопилот является астатическим вследствие введения гибкой отрицательной обратной связи в рулевом тракте, а потому в устано¬ вившемся состоянии будем иметь 8 = kxx+kxX-\-k'xX, где х — одна из угловых координат (Ф, ф, у). Сигналы, пропорциональные угло¬ вому отклонению самолета (й, ф, у), снимаются с гироагрегата — трехстепенной силовой корректируемой гирорамы (см. рис. 2.9). Сигналы, пропорциональные угловым скоростям, снимаются с по¬ тенциометрических, а сигналы, пропорциональные угловым ускоре¬ ниям, — с индукционных датчиков демпфирующих гироскопов (ДУСов). Корректор высоты выдает сигнал, пропорциональный отклонению высоты полета самолета от заданной. Рис. 3.6. Функциональная схема АП-15 в режиме стабилизации прямолинейного горизонталь¬ ного полета: РМ—.рулевая машина: ГООС—гибкая отрицательная обратная связь; КВ—-корректор высоты; ИД—индукционный датчик; У—усилитель рулевого тракта; ГП—гироплатформа 53
В соответствии со структурной схемой, помещенной на рис. З.б, закон отклонения управляющих поверхностей самолета в режиме стабилизации прямолинейного горизонтального полета запишем в виде 8в=(р) (» - »з) + V + {Н - Я3)]; ч SH=W* (р) (ф - ф3)+Ф + ф]; = (р~) Y где 1Э3, ф3 и Я3 — заданные значения величин соответствующих ко¬ ординат; IF^(p), (р), Wf (р) —передаточные функции рулевых трактов соответственно каналов тангажа, курса, крена; ki (1= = КВ, 'О*, ф ф и др.) —коэффициенты усиления (передаточные чис¬ ла) автопилота. Из приведенных уравнений автопилота видно, что при прямо¬ линейном горизонтальном полете каналы не имеют • связи между собой и работают автономно. Управление самолетом по курсу осуществляется путем создания угла крена у. При осуществлении разворота без скольжения и по¬ терь высоты в канал тангажа посылается сигнал с корректора вы¬ соты на увеличение подъемной силы Ya до такой величины, чтобы вертикальная составляющая подъемной силы YB-Ya cos у уравнр- вешивала силу тяжести Ув — Ya cos у= G=mg, а горизонтальная — центробежную силу Уг= Ya sin у = mVnM. Разделив последнее соот¬ ношение на предыдущее, найдем tgY = IZn<o/g=V2n//?g, (3.25) где 17п — путевая скорость ЛА; R — радиус виража. Последняя формула устанавливает связи между требуемым углом крена для совершения виража'с угловой скоростью оэ и заданной скоростью полета. При крене самолета системы уравнений, описывающие про¬ дольное и боковое движение ЛА, становятся взаимно зависимыми: k=W^(p)[^^ + kMi) cosY + ^ (<% — %) + ^-%J; 8н=^ф(р) IA s*n Ч; (3- 26) Y3)+*i t+MJ. где YH, co^, <D^, (d^, YH —значения угловой скорости и ускоре¬ ний, снимаемые с ДУСов, а (о^з, Y3 —заданные угловые ско¬ рости и угол. При этом со^з = со cos Y, (dZ3=(d sin Y, где <о— заданная угловая скорость разворота ЛА, а у3 — соответствующее (требуе¬ мое) значение угла крена, которые связаны функциональной зави¬ симостью (3.25), т. е. при крене разворот с угловой скоростью <о приводит к возникновению угловых скоростей относительно осей У и Z. 54
рис. 3.7. Функциональ¬ ная схема тангенсного счислителя: С—рукоятка скорости; р__.рукоятка разворота; ТС—тангенсный счисли¬ те ль Уравнения (3.26) описывают координированный разворот при некоторых дополнительных условиях. Управление координирован¬ ным разворотом осуществляется расположенным в гироагрегате виражным механизмом, состоящим из тангенсного счислителя, ко¬ ординатного преобразователя, маятника скольжения и двух перек¬ лючателей. Тангенсный счислитель — это вращающийся трансформатор,, статор которого закреплен неподвижно на виражном механизме,, а ротор на внешней рамке гироплатформы (см. рис. 2.9) и имеет одну обмотку (рис. 3.7). На обмотку I статора подается сигнал с ру¬ коятки разворота Р, пропорциональный требуемой угловой скорости виража о, а на обмотку II подается сигнал с рукоятки скорости С, пропорциональный g/Vn- При этом в обмотке ротора трансформи¬ руется напряжение, которое поступает в рулевой тракт канала кре¬ на. Самолет начинает крениться, значение индукционного тока в роторе определяется формулой: / = £(cocosy—g sin у/Vn), где- fecocosy — значение тока, индуцированного первой, a kg sin y/Vn— второй обмоткой статора. Очевидно, в установившемся состоянии будем иметь со cos у—g sin y/Vn = 0, откуда находим, что tgy = = VnG)/.o’, т. е. тангенсный счислитель реализует зависимость (3.25). Во время разворота отключается курсовой гироскоп и сис¬ тема коррекции гирорамы. Отключение системы коррекции вызва¬ но тем, что уход гироскопа за время осуществления виража из-за дисбаланса и трения меньше ее ухода под действием системы кор¬ рекции к ложной вертикали. При неточном измерении величины истинной скорости полета будет возникать скольжение, что вызовет отклонение якоря маят¬ ника скольжения в соответствующую сторону (см. рис. 2.9, поз. ВМ). Снимаемый с маятника сигнал поступает в канал крена для: отклонения элеронов, чтобы избавиться от скольжения. Гироплатформа является трехстепенной корректируемой сило¬ вой. Оси гироплатформы и, z, v являются осями измерения. Собст¬ венно платформа устанавливается горизонтально и ее ось враще¬ ния укреплена во внутренней рамке и совпадает с вертикалью места- (см. рис. 2.9). Ось внутренней рамки и расположена горизонталь¬ но и направлена перпендикулярно плоскости симметрии самолета (по связанной оси OZ самолета), ось внешней рамки v параллель¬ 55
на продольной оси самолета и крепится в корпусе гироагрегата, На гироплатформе установлено три гироскопа А, В, С, которые имеют две степени свободы относительно платформы и вместе с платформой могут вращаться относительно осей измерения z, v, и. Оси вращения роторов всех гироскопов расположены горизонталь¬ но, при этом оси гироскопов В и С взаимно перпендикулярны, а ось гироскопа А расположена под углом 135° к каждой из осей гироско¬ пов В и С. Оси прецессии гироскопов В и С расположены верти¬ кально, а гироскопа А — горизонтально. Гироскоп А обеспечивает разгрузку оси измерения z и коррекцию гирорамы в азимуте по сигналу с компаса. Гироскопы В и С стабилизируют платформу в горизонте. На осях прецессии гироскопов укреплены чувствительные эле¬ менты, которые выдают сигнал при неперпендикулярности оси вра¬ щения ротора к собственной рамке для разгрузки осей измерения разгрузочными двигателями Ml, М2, М3. Под действием моментов, возникающих в моментных датчиках по сигналам, поступающим с жидкостных переключателей П1 и П2 и компаса, гирорама удержи¬ вается в горизонтальном положении и заданном азимуте: гироскоп А стабилизирует платформу в азимуте, т. е. стабилизирует относи¬ тельно оси 2, а гироскопы В и С стабилизируют в горизонтальной плоскости, при этом гироскоп В стабилизирует платформу относи¬ тельно оси v, а гироскоп С — оси и. Процессы стабилизации плат¬ формы относительно каждой из осей идентичны и в сущности сов¬ падают с описанием работы одноосной силовой корректируемой гирорамы (см. разд. 2.8). Но при вираже работа каждого канала зависит от других каналов [см. систему (3.26)]. Преобразователь координат ПК осуществляет перераспределение сигналов от гиро¬ скопов В и Сна разгрузочные двигатели Ml и М2. Датчики ДП1, ДП2, ДПЗ, укрепленные на осях измерения V, и, z, выдают сигналы, пропорциональные угловым отклонениям само¬ лета соответственно по крену у, тангажу и курсу ф.
Глава 4 УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ СИСТЕМ. МОДАЛЬНОЕ УПРАВЛЕНИЕ 4.1. УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ СИСТЕМ Понятия управляемости и наблюдаемости системы введены срав¬ нительно недавно, однако они получают все большее распростране¬ ние. Ниже эти понятия будут рассмотрены для системы ЛА+АП. Рассмотрим систему х = Ах-]-Ви, (4.1) где хт = (хь . . хп) — вектор состояния; ит= (и^ . . ., ит) — век¬ тор управления; А и В — постоянные матрицы размерности пХп и пХт соответственно. Система (4.1) полностью управляема, если для любых точек х°, х1 фазового пространства Rn существует ограниченное управление u=u(/), переводящее систему (4.1) за конечное время из состояния х(0)=х° в состояние х(^) = = х1, т. е. решение х(/), системы (4.1) при u=u(/), и начальном условии х(0)=х° таково, что х(£1)=х1. Име¬ ет место следующий критерий управляемости: система (4.1) явля¬ ется полностью управляемой тогда и только тогда, когда матрица [В, АВ, А2В,..., А^В] (4.2) размерности пХпт имеет ранг п. Рассмотрим пример полностью управляемой системы ЛА + АП, которая может быть описана линейным стационарным уравнением n-го порядка |--\-anXi = Ui, (4.3) гДе Ui^Ry — скалярное управление. Запишем систему, эквивалентную уравнению (4.3), в следующем виде: хп_г = хп\ хп= — апхг —...— а1хп^-и1. (4.4) 57
Покажем, что матрица (4.2) в данном случае имеет ранг п, а значит, система (4.4) полностью управляемая. Запишем матрицы А и В для системы (4.4) 1 о о 1 0 0 1 0 - 0 1 о о А = ; в= 0 0 0 1 0 -~ап ап-\ ап-1 ■■ • —«1- Вычислим матрицы АВ, . . ., AftB, входящие в (4.2): о о “О" О 1 А2В = А(АВ) = -«1 — ^2 &1. О 1 где в выражении для А/гВ единица стоит на (п—£)-ом месте, а «крестиками» отмечены элементы матрицы, точные выражения ко¬ торых для целей определения ранга матрицы (4.2) не существен¬ ны. Составляя матрицу (4.2), найдем, что она имеет вид ‘0 0 0 .. . 1" 0 0 0 .. 1 . X 0 1 X .. . X _1 X X .. . х^. так что ее ранг, очевидно, равен п. Свойство полной управляемости сохраняется при линейном не¬ вырожденном преобразовании переменных. Введем^ювые перемен¬ ные (£, . . ., хп) =хт по формуле x = Gx или x=G~1x, где G — про¬ извольная невырожденная матрица пХп. Если x = x(t) —решение системы (4.1), то для х(/) =Gx(t) имеем 4^=^-(Gx)=G^-=G(Ax + Bu)=G(AG-ix + Bu). at at at Таким образом, в переменных х система (4.1) имеет вид x = Ax4-Bu, A = GAG-i, B = GB. (4.5) Системы (4.1) и (4.5) описывают одну и ту же физическую систему в разных координатах в пространстве Rn и потому одновременно 58
обладают или не обладают свойством полной управляемости. Это утверждение можно проверить и чисто формально, применив крите¬ рий управляемости (4.2). А именно, AkB= (GAG_1)kGB= LgAG^GAG1 . . . GAG^GB^GAIGAI, . . IAIB = GA;B, где ис¬ пользовано свойство обратной матрицы: G1G = I — единичная матрица пууп. Поэтому [В, АВ, . . ., An-1B]==G.[B, АВ, . . ., An_1B], Но так как матрица G — невырожденная, то из полученного равенства следует, что матрицы [В, АВ, . . ., АП-4В] и .[В, АВ, . . ., А"~1В] имеют одинаковый ранг, а значит, системы (4.1) и (4.5) одновременно полностью управляемы или нет. 4.2. МОДАЛЬНОЕ УПРАВЛЕНИЕ ПРИ ПОЛНОЙ ИНФОРМАЦИИ о СОСТОЯНИИ СИСТЕМЫ Принцип управления по обратной связи лежит в основе всей авто¬ матики. Рассмотрим линейное управление и=—Lx системы (4.1), где матрица L выбирается исходя из задачи управления — созда¬ ния необходимого запаса устойчивости, выполнения определенных требований к качеству переходного процесса и т. п. Замкнув систе¬ му (4.1) с помощью обратной связи и=—Lx, придем к системе вида (рис. 4.1). х = (А —BL)x. (4.6) В задачу синтеза управления входит выбор такой матрицы L, которая обеспечила бы нужные свойства замкнутой системы. Один из методов синтеза системы управления заключается в подходя¬ щем расположении корней характеристического уравнения системы (4.6), т. е. собственных значений матрицы А — BL. Рассмотрим в качестве примера систему (4.4), эквивалентную уравнению (4.3): = ^п-1 = ^п; %п =—ЯпХ\— ... —diXn + Щ, и ПОЛОЖИМ, ЧТО закон управления имеет следующий вид: u1 = dnxl-\-dn_1x2-\- -\-d1xn. Найдем характеристический многочлен замкнутой систе¬ мы. Представляя управление в виде u^d^^d^x^... и подставляя в уравнение (4.3), найдем уравнение, описывающее движение системы ЛА+АП в замкнутом состоянии: / Рис. 4.1. Структурная схема объ¬ екта 1 с регулятором 2 xi } + (а1— di)xi )4"••• “Ь(ал — ^п)Х1—О- Следовательно, характеристический многочлен уравнения (4.3), а также и системы (4.4) равен Хл-|- (ах —+ (ал — dn). Поскольку значения ..., dn можно вы¬ брать произвольно, то коэффициентам характеристического многочлена можно придать любые предписанные значения. Поэтому корни характеристического Уравнения могут быть расположены про¬ извольно на комплексной плоскости (с очевидным ограничением, что каждо¬ му комплексному корню должен соответ¬ ствовать комплексно-сопряженный ко-
рень). Отмеченное свойство системы (4.4) при одном ограниче¬ нии сохраняется и для системы (4. 1) общего вида. Справедлива следующая теорема. Теорема. Предположим, что система х=Ах + Ви полностью управляемая, а управление и берется в виде цепи обратной связи: и=—Lx, где L — постоянная матрица. Тогда характеристические корни замкнутой системы: х= (А — BL)x могут быть произвольно размещены на комплексной плоскости при подходящем выборе матрицы L (при ограничении, что комплексные корни должны встречаться комплексно-сопряженными парами). Эта теорема служит основой для так называемого- модального управления: методов формирования цепей обратных связей, прида¬ ющих замкнутой системе заранее выбранное расположение корней характеристического уравнения. В данном разделе речь идет о мо¬ дальном управлении при полной информации о векторе х состоя¬ ния системы, поскольку реализация закона управления в виде u=Lx возможна, когда все координаты вектора состояния могут быть точно измерены. Хотя теоретически корни замкнутой системы можно разместить произвольно на комплексной плоскости, т. е. обеспечить любое быстродействие системы, однако это неизбежно приведет к увеличе¬ нию амплитуды управляющего воздействия. Однако в любой прак¬ тической задаче амплитуда управляющего воздействия ограниче¬ на, поэтому ограничено и размещение полюсов. В следующей гла¬ ве будет рассмотрен метод построения обратных связей, оптими¬ зирующий интегральный квадратичный критерий качества, кото¬ рый учитывает одновременно и скорость переходного процесса, и величину амплитуды управляющего воздействия. В книгах по модальному управлению, например, [12, 16], пред¬ лагаются различные типы «оптимального» размещения полюсов замкнутой системы, исследуется качество соответствующих пере¬ ходных процессов. В качестве примера отметим распределние Бат¬ терворта, при котором корни системы лежат на окружности в левой половине комплексной плоскости и находятся на одинаковом угло¬ вом расстоянии друг от друга Пример. Синтезировать закон управления для продольного канала самоле¬ та (3. 24а). Полагая в (3. 24а) Мв 2 = У в = 0, исключая 6 и аппроксимируя уравнение рулевого тракта (Гртр2 2^Тр + 1) бв = £рт0вХ апериодическим звеном ТЪВ + + Ьв = £ртивх, получим 4 + 014 + 02а — лз&в = 0; 4 — а — 04« = 0; &в + ^в = 7,—1#рТ0вх. (4* 7) Вводя обозначения Xi = 'O’; х2 = 14; *з = бв; Х4 = а, приведем (4.7) к нормальной форме Х1 — -^2» -*-2 — #1-^2 4~ ^3*3 ^2-^4, Х3 = — Т Ч- ^р'рТ' 10Ц Х^ = Х2 04X4» (4. 8) 60
В матричной форме система (4. 8) имеет вид х = Ах + Ви, 1 (4.9) О Дз — Г-1 О 0 0 — #2 ; в = 0 0 ^ртг—1 — <24 0 . (4.10) — О 1 где Координаты вектора х могут быть измерены: 0*, О— гироскопическими дат¬ чиками, б — потенциометрическим; угол атаки — приближенно пропорционален сигналу, снимаемому с датчика поперечных ускорений. В таком случае для уп¬ равления системой через обратную связь можно использовать значения полного вектора состояния x(Z): u = — Lx, L = (Zb Z2, Z3, Z4). (4.12) Используя (4.10), (4.11) и критерий (4.2), легко показать, что система (4.9) полностью управляема. Таким образом, за счет выбора вектора L= (Zi, /2, Z3, Z4) можно обеспечить желаемое значение корней характеристического уравнения замкнутой системы х= (А— BL)x. С точки зрения вычислительной процедуры удобно характеристический многочлен замкнутой системы приравнять желаемо¬ му характеристическому многочлену //(pj — р4 + Л1р34-Л2р24-йзр+^4. В результа¬ те получим уравнение det (р I — А + BL) = Н (р). (4. 13) Проводя вычисление детерминанта и приравнивая коэффициенты при одинако¬ вых степенях р в (4. 13), найдем Л = Й47’^рТ1/а4«з; h = Т [Л2 — /2— (Ai — Л) («1 + <z4)] /3 = (й1 — — д4 — T 1) T'Ap'p j Z4 = Tйр-р [ — д4 (Л2 f 2) “Ь ^4 + ^4) X X (Л1 — /1) + (ЙЗ + /з) — hilfi— (aitz4 + a2)(^i — /1)] a3 где /i = + #4 4- Г i; /2 — a2 4- #i#4 4“ (#i 4- #4) T i; /3 — (#i#4 4- #2) T 1. Если в качестве желаемого полинома взять полином Баттерворта н (р) = + 2,613о>оР3 + 3,414(0^2 + 2,613^/7 4- <4, (4.14) который отвечает четырем корням, равномерно расположенным на полуокруж¬ ности радиуса со0 в левой половине комплексной плоскости, и положить (о0 = 4, то вектор L примет значение L= (Zb Z2, 1з, h) ~ (—1,3545; 0,0708; —0,1177; 2,6831). Полученные значения коэффициентов Zi = l, 2, 3, 4 обеспечивают качест¬ во переходного процесса в соответствии со взятыми коэффициентами желаемого полинома Баттерворта. 4.3. НАБЛЮДАЕМОСТЬ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ СИСТЕМ В задачах управления при формировании закона управления u(Z) используют ту или иную информацию о состоянии системы. Если текущее состояние системы х(/) в каждый момент времени до¬ ступно непосредственному измерению, то считают, что имеется пол- Ная информация о состоянии системы. Обычно, однако, доступны измерению не все координаты, а лишь некоторая их часть или не¬ 61
которые их линейные комбинации. Положим, что измеряются ве¬ личины (z/i, . . ., ут)—у'?, связанные с состоянием системы линей¬ ным алгебраическим соотношением У = Ех, (4. 15) где Е— некоторая постоянная матрица пгХп; хт= (хь . .хп) — вектор состояния объекта; У/Т=(^ъ • • •> Ут) — наблюдаемый век¬ тор. В частном случае, когда Е=! — единичная матрица /гХщ из¬ меряется каждая координата системы порознь. В другом частном случае, когда Е — невырожденная матрица пХп, из (4. 15) полу¬ чим х—Е"!у, т. е. фактически измеряется полностью вектор состоя¬ ния системы. Таким образом, в этих случаях имеется полная ин¬ формация о текущем состоянии системы. При m<Zn недостающие координаты подлежат восстановлению. Собственное движение системы зададим уравнением [см. урав¬ нение (4. 1)] х = Ах. (4. 16) Система (4. 16) совместно с уравнением наблюдения (4. 15) назы¬ вается полностью наблюдаемой, если все координаты текущего век¬ тора состояния х(/) могут быть восстановлены по результатам из¬ мерения y(s), s^Xt. Принципиальная возможность восстановления вектора состояния системы по наблюдениям за вектором у(/) обу¬ словлена следующим свойством (требованием): для любых двух различных решений х*(/), х2(/) системы (4. 16) соответствующие наблюдения у1 (О, У2(0 не совпадают ни на каком интервале. Учтем, что каждая компонента хД/) решения х(/) системы (4. 16) есть аналитическая функция, которая представляет собой линей¬ ную комбинацию функций вида tk exp at, где k — целое неотрица¬ тельное число, а а — комплексное. Следовательно, аналитическими являются и компоненты yj(t) вектора наблюдения у(/). Посколь¬ ку различные аналитические функции не могут совпадать ни на каком интервале, то требование несовпадения наблюдений у1 (/) и у2(/) ни на каком интервале эквивалентно требованию уД/)^ 5^у2(/). Заметив, что x(t)=xl(t) —x2(Z) есть решение системы (4. 16) с вектором наблюдения y(t)=yl(t) —у2(/), можно утвер¬ ждать следующее. Система (4. 15), (4. 16) полностью наблюдаема тогда и только тогда, когда каждому нетривиальному решению х(/) системы (4. 16) отвечает ненулевой вектор наблюдения у ЧМО. Если Е — невырожденная матрица пХп, то система (4.15), (4. 16) полностью наблюдаема. Следующий пример показывает, что если наблюдается только часть координат вектора состояния, система может быть полностью наблюдаема. Возьмем систему я1 = х2,. . xn-i = xn, хп = —^пХ1 — .. . — а{хп, эквивалентную урав¬ нению а уравнение наблюдения возьмем в виде y = xi. Если y(s)=Xi(s) известна на отрезке [/ — в, /], е>0, 62
то можно найти последовательно производные от Xi (/) и получить весь вектор состояния для момента t: *2 (/) =-£- Х1 (0> Х3 (0=-^г -Vi W,- • •. хп (/) = Xi (/). dt d& dt Согласно теореме единственности для линейных дифференци¬ альных систем свободное решение системы (4. 16) определяется значением для какого-либо одного момента времени. Поэтому за¬ дача восстановления текущего состояния х(/) однородной системы (4.16) эквивалентна восстановлению начального состояния систе¬ мы х(/0) • Рассмотрим теперь неоднородную систему (4. 1). вместе с урав¬ нением наблюдения (4. 15). Система (4. 1), (4. 15) называется пол¬ ностью наблюдаемой, если текущее состояние х(/) может быть восстановлено по результатам измерения y(s), s^t и вектору уп¬ равления u(s), s^Zt. Проверим, что система (4. 1), (4. 15) х = Ах-|-Ви, у = Ех (4.17) полностью наблюдаема тогда и только тогда, когда полностью на¬ блюдаема система (4. 15), (4. 16) х = Ах, у=^Ех. (4. 18) Если система (4. 17) полностью наблюдаема, то и в частном случае, когда u=u(t)=o, можно восстановить вектор состояния. Но при и=о система (4. 17) переходит в систему (4. 18), значит система (4. 18) полностью наблюдаема. Докажем обратное утвер¬ ждение. Пусть система (4. 18) полностью наблюдаема и х(/) —ре¬ шение системы (4. 17), отвечающее некоторому управлению u(Z) и некоторому начальному условию х(0)=х° x(/)=Ax(f)-J-Bii(f), у(/) = Ех(/). (4.19) Покажем, что по наблюдению y(s), зная u(s), s^t, можно восстановить текущее состояние х(/). Обозначим через х(/) реше¬ ние системы (4. 17), отвечающее тому же управлению и(/), но ну¬ левым начальным условиям х(/) = Ах(/)4-Ви(/), х(0) = о. (4.20) Значения в любой момент времени t в принципе известны (они выражаются через матрицу импульсных переходных функ¬ ций — см. Приложение). Следовательно, для каждого момента вре¬ мени t можно считать известным вектор Ех(/)=у(/). Вычитая (4.20) из (4. 19) и полагая x(Z)=x(/) —x(Z), y(Z)=y(Z) —y(Z), получим х = Ах(/), у(/) = Ех(/), (4.21) т. е. x(Z) является решением однородной системы (4. 18), а вектор У (Z) = Ex(Z) =E(x(Z)—x’(Z))—наблюдается, так как наблюдает- 63
ся вектор х(/), а х(/) —известная функция времени. Из предполо¬ жения полной наблюдаемости системы (4. 18) вытекает, что х(0 восстанавливается по значениям y(s), s^t. Восстановив вектор х(/), вектор х(/) найдем по следующей формуле: х(/) =х(/)+х(/), т. е. найден алгоритм восстановления состояния х(/) системы (4. 17), следовательно, система (4. 17) полностью наблюдаема. Имеет место следующий критерий наблюдаемости систем (4.17), (4.18): системы (4.17), (4.18) полностью наблюдаемы тогда и только тогда, когда матрица [Ет, А'' Ет, (АТ)2ЕТ,.._., (АТ)Я~1ЕТ] (4.22) имеет ранг п. Этот критерий вытекает из критерия (4. 2) и следую¬ щей теоремы, связывающей понятия полной управляемости и пол¬ ной наблюдаемости. Теорема. Рассмотрим две управляемые и наблюдаемые си¬ стемы: x = Ax-4-Bu; у = Ех; . (4.23) x = A'rx + ETu; у = Вгх. (4.24) Система (4. 23) полностью наблюдаема тогда и только тогда, когда система (4. 24) полностью управляема. Система (4.24) называется двойственной к системе (4.23). Очевидно, что понятие двойственной системы симметрично: систе¬ ма (4. 23) является двойственной к системе (4. 24). Поэтому из тео¬ ремы вытекает, что система (4.24) полностью наблюдаема тогда и только тогда, когда система (4. 23) полностью управляема. Сформулированная теорема будет доказана ниже в разд. 4. 8, а сейчас выведем из нее важное следствие. Допустим, что система (4. 23) полностью наблюдаема. Тогда си¬ стема (4.24) полностью управляема. Как отмечалось выше (см. теорему разд. 4.2), это гарантирует существование такой матрицы Кт, что характеристические корни матрицы Ат—ЕТКТ занимают любое наперед заданное положение на комплексной плоскости; в частности, они могут быть все помещены в левую полуплоскость. Поскольку матрица А — КЕ, как транспонированная к матрице Ат—ЕТКТ, имеет тот же самый характеристический многочлен, то. отсюда вытекает следующее утверждение. Если система (4. 23) полностью наблюдаема, то выбором матрицы К можно добиться любого размещения характеристических корней матрицы А — КЕ на комплексной плоскости. 4.4. ПРИНЦИП ПОСТРОЕНИЯ НАБЛЮДАЮЩЕГО УСТРОЙСТВА В ВИДЕ МОДЕЛИ СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ ПО ОШИБКЕ ВОССТАНОВЛЕНИЯ Построим электронную модель объекта (4. 1) х = Ах + Ви, (4.25) на вход которой подадим то же управление u=u(Z), что и на объект (4. 1). Если начальное состояние х(/0) модели (4.25) сов¬ 64
падает с начальным состоянием х(/0) системы (4. 1), то теоретиче¬ ски вектор состояния х(/) совпадает с x(Z) при всех значениях I. Однако практически начальное значение невозможно установить в точности, а в некоторых случаях его и вообще невозможно устано¬ вить. Тем не менее, если система (4. 1) асимптотически устойчива, т. е. собственные значения матрицы А имеют отрицательные дейст¬ вительные части, то ошибка восстановления х = х—х, удовлетво¬ ряющая, очевидно, однородному уравнению х = Ах, (4.26) стремится к нулю при возрастании t. Положим, что часть координат системы (4. 1) или их линейные комбинации доступны непосредственному измерению У = Ех; УТ=(У1,...,У„Л т^п. (4-27) Эти измеренные значения можно использовать для корректировки восстанавливаемого полного вектора состояния х(/). В результате получаем наблюдающее устройство в виде (рис. 4. 2) следующей модели системы (4. 1): х = Ах + Ви + К (Ех (/) - Ех (/)) (4. 28) с обратной связью по ошибке восстановления К(Ех(/)—Ех(/)). Вычитая уравнение (4.28) из уравнения (4. 1), получим, что ошиб¬ ка восстановления для модели (4. 28) удовлетворяет системе (4. 29) Таким образом, если даже управляемый объект, задаваемый мат¬ рицей А, неустойчив, но возможно подобрать матрицу К, так что¬ бы характеристические корни матрицы А — КЕ имели отрицатель¬ ные действительные части, то ошиб¬ ка восстановления х в силу устой¬ чивости системы (4. 29) будет стре¬ миться к нулю при возрастании t. Как было отмечено в разделе 4. 3, матрицу К можно подобрать, если система (4.1), (4.27) полностью наблюдаема. В гл. 6 будет построе¬ но оптимальное наблюдающее Устройство Калмана, когда матрица К выбирается из условия оптималь¬ ной фильтрации случайных помех в измерителе. При этом матрица А-—КЕ также оказывается асимп¬ тотически устойчивой. Рис. 4.2. Структурная схема объекта 1, измерителя 2 и наблюдающего устройства 3 3 1996 65
4.5. МОДАЛЬНОЕ УПРАВЛЕНИЕ ПРИ НЕПОЛНОЙ ИНФОРМАЦИИ О СОСТОЯНИИ СИСТЕМЫ Выше рассматривалось модальное управление линейной системой (4. 1) в предположении, что вектор состояния x(t) полностью из¬ меряется. Как правило, измерению подлежит лишь часть коорди¬ нат состояния или некоторые их линейные комбинации, поэтому в общем случае к уравнению (4.1) добавляется уравнение наблю¬ дения у —Ех. Естественно теперь закон управления формировать по оценке х состояния системы, даваемой наблюдающим устройст¬ вом (4.28). Добавим к системе (4. 1) уравнение - наблюдающего устройства (4.28) и выберем управление и=—Lx. Исключая пере¬ менную у из уравнений (4. 1), (4.28), получим следующую замк¬ нутую систему (рис. 4. 3): х = Ах —BLx; х = [А —BL —КЕ] х-[-КЕх. (4.30) Интересно проследить, как изменяется динамика процесса (4. 30) по сравнению с системой (4. 6) для управления при полной информации. Для этого заменим переменные х, х на х, х, где х=х — х — вектор ошибки, х = (А —BL) x + BLx, х = (А —КЕ)х. Матрица системы (4. 31) имеет вид ГА-BL BL [ О А-КЕ ’ (4.31) (4.32) и, следовательно, характеристический многочлен равен произведе¬ нию характеристических многочленов матриц А — BL, А — КЕ. Так как невырожденное преобразова¬ Ряс. 4.3. Структурная схема управляе¬ мого объекта /, измерителя 2 и наблю¬ дающего устройства 3 ние переменных не изменяет ха¬ рактеристического многочлена, не считая постоянного множите¬ ля, то этот же вывод относится и к системе (4.30). Таким образом, совокупность характеристических корней системы (4. 30) получает¬ ся объединением характеристиче¬ ских корней матриц А — BL и А — КЕ. Можно сказать, что ди¬ намические свойства процесса (4. 30) складываются из функци¬ онирования контура регулирова¬ ния, определяемого матрицей А — BL, и контура оценки состоя¬ ния, определяемого матрицей А — КЕ. Поэтому при синтезе замкнутой системы управления матрицу L обратной связи и мат¬ 66
рицу К наблюдающего устройства в определенном смысле можно подбирать независимо друг от друга. Предположим, что исходная система полностью наблюдаема. Тогда, как отмечено выше, матрицу К можно выбрать так, чтобы матрица А — КЕ была устойчивой. Более того, характеристические числа матрицы А — КЕ могут быть размещены в комплексной пло¬ скости произвольно. Обычно матрица К выбирается так, чтобы кор¬ ни характеристического уравнения |р1— А + КЕ| =0 располага¬ лись левее корней характеристического уравнения системы |pl — A+BL| =0. Пример. Синтезировать закон управления для продольного канала самоле¬ та (4. 7) в предположении, что а не измеряется, а $, б измеряются (см. при¬ мер в разд. 4.2). При этом матрица Е в уравнении у=Ех будет следующей: [1 0 0 0“ 0 10 0. 0 0 10 Легко убедиться, что ранг матрицы [Ег, АТЕГ, (А^Е1*, (АТ)3ЕТ] равен 4, сле¬ довательно, система будет вполне наблюдаемой. В законе управления и = — Lx положим L=(—1,3545; 0,0708; —0,1177; 2,6831) (см. пример в разд. 4.2). Мат¬ ричный коэффициент усиления К в наблюдающем устройстве подберем таким, чтобы переходные процессы в контуре наблюдения в 2—3 раза протекали быст¬ рее, чем в основном контуре. В этом случае следует ожидать, что системы, син¬ тезированные при полной и неполной информации о векторе состояния, будут об¬ ладать примерно одинаковыми динамическими показателями по фазовым коор¬ динатам ЛА -О’, О’, б, а. Синтез контура наблюдающего устройства, т. е. нахож¬ дение матричного коэффициента усиления К, проведем методом модального уп¬ равления, взяв в качестве желаемого полинома полином Баттерворта 4-го по¬ рядка. В соответствии с системой уравнений (4.31) синтез контура наблюдателя можно проводить независимо от синтеза основного контура. Для обеспечения надлежащего быстродействия наблюдающего устройства возьмем в полиноме Баттерворта w0=12. Характеристический полином | р!—А--}-КЕ| приравняем полиному Баттерворта (4. 14): |p I — А + КЕ| = /М + 2,613ч3Р3 + 3,414шд/?2 + 2,613<о^ + «о- Полипом Баттерворта (4. 14) определяется, четырьмя коэффициентами, а в ле¬ вой части последнего уравнения матрица К размерности 4X3 содержит 12 эле¬ ментов и потому имеется определенный произвол в выборе коэффициентов мат¬ рицы К. Будем искать матрицу К в виде 0 0 “ к= 0 k22 0 0 0 &зз ^41 0 0 Подставляя матрицу К в последнее уравнение и приравнивая коэффициенты при одинаковых степенях р, найдем следующую систему четырех нелинейных алгеб¬ раических уравнений: *11 + *22 + *зз 4- 01 + а4 4- Г-1 = Ль а4 (#i -4 *22) 4- а2 + (*и 4~ *зз 4- Т™1) (#i 4- а4 4-- k22) -4 (#33 4- Т~i) = h2\ (*11 4- *33 4- Г-i) [04 (а\ 4- *22) 4~ 02] 4- *п (*зз 4- Г—1) (а4 -4 а\ 4- *22) — — 02*41 = *31 *п (*зз + Г—1) а2 — (*зз 4- Г-1) -4 (£33 4- Г—Б (01 4- *22) 04 = *4, 3* 67
где. h{ = 2.613'о0:■ 3,414со02; /ъ 2,61.%)пА /z4 = coo4; со0=12; <21 = 0,737; а2 = 55; а4=-0,84; 7 = 0,1. Решая полученную систему, найдем &n; /г2г; &зз; &41. Если бы оказалось, что система действительного решения не имеет, то пришлось бы за¬ даться другим видом матрицы К. 4.6. СТРУКТУРА СИСТЕМ, НЕ ОБЛАДАЮЩИХ СВОЙСТВОМ ПОЛНОЙ УПРАВЛЯЕМОСТИ Рассмотрим произвольную линейную систему вида (4. 1), не обла¬ дающую свойством полной управляемости. Покажем, что множе¬ ство L чех точек фазового пространства 7?п, в которые система мо¬ жет быть переведена из начала координат за конечный промежу¬ ток времени с помощью ограниченного управления u(Z), представ¬ ляет собой некоторую плоскость (подпространство) в пространстве Rn. Это значит, что для любых двух векторов х1, х2 из множества L их линейная комбинация ах[-\-Ьх2 при любых значениях а и Ь также принадлежит множеству L. Пусть uJ(Z), u2(Z) —некоторые управления и x!(Z), х2(/) —со¬ ответствующие им решения системы (4. 1) с нулевыми начальны¬ ми условиями. Покажем, что при любых значениях /2, я, Ь нача¬ ло координат может быть переведено в точку ax(t\) + bx(Z2)• Сна¬ чала рассмотрим- случай, когда Zi = /2. В силу (4. 1) будем иметь — {а х1 (/) + b х2 (t])=a х1 (/) + b х2 (/) = а (Ах1 (/) + Ви1 (/)) -|- dt . + Ь (Ах2 (/) + Ви2 (/)) = А (а х1 (/) J- Ь х2 (/)) + В (а и1 (/) + b и2 (/)), т. е. ах1 (/•)+&х2(/) является решением системы (4. 1), отвечающим управлению au1 (Z)+bu2(Z). Таким образом, при любых значениях t=t[ = t2 начало координат может быть переведено в точку ах1 (t) + bx2(Z). Рассмотрим случай, когда ti=^t2i пусть для опре¬ деленности ti<zt2 (при ti>t2 рассмотрение аналогично). Обозна¬ чим h=i2 — ti. Построим управление и1(/)=о при — h) при и обозначим через х1 (£) решение системы (4. 1) с нулевым условием и управлением и1^). Ясно, что х1 (/) =о при Покажем, что при t>h (4.33) В силу (4. 1) —Ах1^ — Л)-|-Вц(/ — /г), dt и при t = h имеем х1 (/г — /г)=о. Следовательно, х1 (t — h) при Z;> ^/г является решением системы (4.1), соответствующим управле¬ нию ul(t.— h) и нулевому начальному условию хЦ/г — /г)=о. Но из определения x'(t) вытекает, что при t^h решение xx(t) Также является решением (4.1) с управлением и1^'—h) и начальным условием х1 (/г) =о. Значит эти решения совпадают (теорема един¬ ственности для линейных систем дифференциальных уравнений). Применив к управлениям u1(Z), u2(Z) и решениям x!(Z), x2(Z) по¬ 6В
лученный ранее результат, получим, что при любом значении t на¬ чало координат может быть переведено в точку + (4.34) Полагая в (4.34) t—t2 и применяя (4.33), получим ах!(/2) + +&х2(/2) = (t2—h)\-\-bx2(t2)=ax} (^—(h—ti))+bx2(t2) = = axl(ti) +6x2(/2). Таким образом, начало координат может быть переведено в точку ахх(11)-\-Ьх2(12), т. е. множество L фазовых то¬ чек, в которые может быть переведено начало координат, представ¬ ляет собой линейное подпространство (плоскость) в пространстве Rn, так как любая линейная комбинация векторов из множества L является также вектором из множества L. Обозначим через г размерность множества L. Если г<п, то множество L не совпадает с Rn, т. е. множество точек, куда может быть переведено начало координат, не совпадает со всем простран¬ ством. Это значит, что система не является полностью управляемой. Если г=п, т. е. L=Rn, то начало координат может быть переве¬ дено в любую точку пространства, т. е. существует ограниченное управление и(^), переводящее систему из точки о в любую напе¬ ред заданную точку x<=Rn. Можно доказать, что в этом случае и произвольную точку x°^Rn можно перевести в любое заданное по¬ ложение, т. е. система при L=Rn является полностью управ¬ ляемой. Предположим, что система (4. 1) не является полностью уп¬ равляемой. При этом размерность г плоскости L меньше п. Выбе¬ рем в пространстве Rn новую систему координат xh ..хп так, что¬ бы плоскость L являлась координатной и задавалась в новых ко¬ ординатах уравнениями хг+1=0, хг+2=0,...,л„-1 = 0, х„=0. (4.35) Запишем систему (4. 1) в новых координатах х в виде х=Ах + + Ви, где связь матриц А и А, В и В выражается формулами (4.5). Разобьем новый_вектор х состояния системы на два вектора хт = ==£хТ, Хп), где Xi = (хь ..., xr); x[i = (хг+ь ..хп), а матрицы А и В на блоки д Г АцА12 , В= В1 [_А21А22_ _В2 где Ац, Ai2, А21, А22. Вп В2 — некоторые матрицы соответственно размерностей rXr, rX(n — г), (n-r)Xr, (п — г) X (п — г), гХт, (п— r)Xm. С учетом введенных обозначений запишем систему (4. 1) в виде хх = AiiXx + А12Х114- В!и; (4. 36а) Хц = A21X1-J- А22Хц-|-В2и. (4.366) 69
По определению плоскости L система (4.1) или эквивалентная ей система (4.36а, б) при любом допустимом управлении и(/) и нулевом начальном условии не может быть выведена за пределы плоскости L. Если u(Z)—произвольное управление, х(/)—соот¬ ветствующее ему решение системы (4.36а, б) с нулевым начальным условием х(0)=о, то хп(0 —°> а следовательно, и хц(7)=о. Тогда из уравнений (4.36а, б) получим, что XI (/)=АцХ1 (/) + BtU (/); 4 37) o = A2iXi(/) + B2u(/). Допустим, что В2 — ненулевая матрица. Выберем вектор управле¬ ния и(^) постоянным и таким, чтобы постоянный вектор В2и(/) не равнялся нулю. Но если />0 и выбрано достаточно близким к ну¬ лю, то поскольку х(0)=о, то и вектор хД/) может быть сделан сколь угодно близким к нулю, что противоречит второму соотноше¬ нию в (4. 37): слагаемое A21Xi(Z) бесконечно мало при t—>0, а сла¬ гаемое В2и(/) —постоянное. Полученное противоречие показывает, что В2=О. Таким образом, второе соотношение в (4.37) приобре¬ тает вид A2iXi (/) = о. (4. 38) Выведем отсюда, что А21 = О. Действительно, по определению плоскости L система может быть переведена из начала координат в любую точку х плоскости L, т. е. найдется управление и(/) и мо¬ мент при котором х(/1)=х, xeL. Учитывая, что произвольная точка х на плоскости L имеет вид хт= (хь . . ., хт, 0, ..., 0) [см. уравнение (4.35)], где хт — произвольные, из (4.38) по¬ лучаем, что A2iXi = o, где XiT=(xb .. ., хг) — произвольный век¬ тор. Но тогда очевидно, что A2i = O. Итак, если система не обладает свойством управляемости, то в соответствующей системе координат ее можно представить в фор¬ ме (рис. 4. 4) Xi = AhXi-рА12Хцgg^ Хц = А22Хц с непустой подсистемой координат II. Из вида системы (4. 39) заключаем, что при любом начальном состоянии и при лю¬ бом допустимом управлении группа коор¬ динат хп изменяется независимо от управ¬ ления. Можно сказать, что подсистема II в системе (4.39) полностью неуправляемая. Наоборот, если ограничиться частью фазо¬ вого пространства /?п, характеризуемого условием хп=0, то подсистема I является полностью управляемой. Рис. 4.4. Структурная схема объекта, не являющегося полностью управляемым в системе координат, выявляю¬ щей это свойство 70
4.7. СТРУКТУРА СИСТЕМ, НЕ ОБЛАДАЮЩИХ СВОЙСТВОМ ПОЛНОЙ НАБЛЮДАЕМОСТИ Покажем, что если система х = Ах, у = Ех (4.40) не является полностью наблюдаемой, то существует такое преобра¬ зование координат, в которых систему (4. 40) можно записать в следующем виде (рис. 4. 5): Xi = AhXi + Ai2Xii; Хц = А22хп, у=Ё2хц, (4.41) где (xTi, Хц)—некоторое разбиение вектора состояния. Система вида (4.41) характеризуется тем, что в формирова¬ нии наблюдаемого вектора у участвует только группа координат Хц, которая, как видно из (4.41), изменяется независимо от груп¬ пы координат хь Это значит, что по наблюдению у невозможно восстановить состояние этой системы. Действительно, возьмем на¬ чальные значения координат хп=о. Тогда, очевидно, из второго уравнения системы (4.41) получим xn(f)=o, а из третьего уравне¬ ния этой системы — y(f)=o. Таким образом, при различных на¬ чальных значениях вектора xz при хп=0 получим у(/)=о. Итак, пусть система (4. 40) не является вполне наблюдаемой. Это значит, что найдется решение x(f)^o, для которого у(/)=о. Рассмотрим совокупность М. всех таких решений (x(f)}, при кото¬ рых x(f) нетривиально, а у (f) = Ex(f) =о, а также множество Q всех фазовых точек пространства Rn, через которое проходят тра¬ ектории совокупности М. Поскольку через каждую фазовую точку проходит единственное решение (теорема единственности для ли¬ нейных систем дифференциальных уравнений), то всякое решение, которое проходит через какую-либо точку из множества Q, принад¬ лежит совокупности М, а следовательно, выполнено условие у(/)=о. Покажем, что Q есть некоторая плоскость в пространстве Rn, т. е. вместе с любыми двумя фазовыми точками х1, x2^Q их линейные комбинации ш^ + йх2 также принадлежат Q при любых скалярах а и Ь. Действительно, если точки х1, x2^Q, то найдутся траектории {х1^)}, {х2(^)}(=Л4, которые в некоторые моменты t\ и t2 проходят соответственно через точки х1 и х2: x1(/i)=x1; х2(/2)=х2. Так как си¬ стема (4. 40) стационарна, то вместе с лю¬ бым ее решением х(/) вектор x(t — т) так¬ же является ее решением при любом посто¬ янном т. Это значит, что в равенствах x^jJ^x1; х2(/2)=х2 можно положить t{ = z=zt2. Теперь учтем, что если траектории {х1^)}, {x2(/)}^Af, то также и {axIfZ>+ + &х2(7)} Отсюда следует, что точка ах1 + 6х2=ах1 (fi) + 6x2(/2)gQ. Рис. 4.5. Структурная схема системы «объект 1 и измери¬ тель 2», не являющейся пол¬ ностью наблюдаемой, в сис¬ теме координат, выявляющей это свойство 71
По аналогии с разд. 4. 6 выберем новую систему координат (хь *п), в которой плоскость Q является координатной и описыва¬ ется уравнением хп=о. Запишем систему (4.40) в новых коорди¬ натах: Xi = AhXi+A12Xii, Xii=A21Xi+A22Xii, 4 42) y = EiXi + E2Xn, и покажем, что A2i = O; Е2=О. В самом деле, как было показано выше, если траектория хт(7)= *iiT(t)) такова, что у (t) = o, то она целиком лежит в^плоскости Q, т. е. хп(0=°- Тогда хп(/)=о, а следовательно, A2iXi(7)==o; из уравнения наблюдения заключа¬ ем, что Eix1(t)=o. Поскольку траектории системы (4.42) с Хц(7)=о заполняют целиком плоскость Q, получаем отсюда, что для любого вектора хт будет A2iXi = o, т. е. A2i = o, Ё1 = О. Тем самым доказано, что система, не являющаяся полно¬ стью наблюдаемой, имеет в подходящих координатах вид (4.41). Для дальнейшего будет полезно иметь в виду, что система (4.41), рассматриваемая на части фазового пространства, задаваемого уравнением хт=о: хп=А22Хп, у=Ё2Хп. (4.43) полностью наблюдаема. Действительно, если Хц(/) —нетривиаль¬ ное решение системы (4.43), a xj(/)=o, то предположение, что Е2Хц(7) = о, приводит к тому, что у(/) =Ё1Х1 + Ё2ХП(0 =0’ а эт0 дает, что хп(0—°- Полученное противоречие доказывает утверж¬ дение. 4.8. СВЯЗЬ ПОНЯТИЙ УПРАВЛЯЕМОСТИ И НАБЛЮДАЕМОСТИ В этом разделе докажем сформулированное ранее утверждение, что система (4. 23) полностью управляема в том и только том слу¬ чае, когда двойственная система (4. 24) полностью наблюдаема. Для доказательства предположим, что система (4. 23) не явля¬ ется полностью наблюдаемой. Тогда после некоторого невырожден¬ ного преобразования x=Gx она приобретает вид (4.41) Xi = AnXj-]-А^Хц-J-Biti; хп = А22хп4-В2и; у = Е2хп. Запишем в явном виде формулу перехода (4. 5): E=EG-i=[O, Е2]; A = GAG-i = Ап А12 О А22 (4.44) Произведем теперь преобразование координат фазового простран¬ ства по формуле x=(G-1)Tx. Аналогично предыдущему найдем 72
матричные коэффициенты системы (4. 24) в новых координа¬ тах х: Br [(G-1)T]-1 = (GB)T; (G->)TAT [(G"i)T] = (G~i) ATGT=[GAG-i]T; (G-i)TET=(EG-i)T. (4.45) Подставляя (4. 44) в (4. 45), найдем, что система (4. 24) в коор¬ динатах х имеет вид Xj = АпХь Хц=А12Х1у = B[Xj -(-ВгХц. (4.46) Система (4.46), линейно эквивалентная системе (4.24), очевидно, не обладает свойством полной управляемости, так как группа коор¬ динат Xj изменяется автономно, независимо от управления. Значит, и система (4. 24) не обладает свойством управляемости. Совершен¬ но аналогично доказывается, что если система (4. 24) не является полностью управляемой, то система (4. 23) не является полностью наблюдаемой; при этом нужно воспользоваться установленным в разд. 4.6 свойством, что система, не являющаяся полностью управ¬ ляемой, приводится к виду (4.39). Установленная двойственность позволяет перевести критерий управляемости (4.2) на свойство наблюдаемости: система (4. 23) является полностью наблюдаемой тогда и только тогда, когда ранг матрицы [Ет, АтЕт, (Ат)2Ет,..., (Ат)п_1Ет] равен п. 4.9. МОДАЛЬНОЕ УПРАВЛЕНИЕ ДЛЯ НЕПОЛНОСТЬЮ НАБЛЮДАЕМОЙ СИСТЕМЫ Предположим, что система (4. 23) полностью управляема, но не полностью наблюдаема. Поэтому невозможно восстановить полно¬ стью вектор состояния системы (4.23), а следовательно, можно управлять через обратную связь только по неполному вектору со¬ стояния. Как указывалось ранее, при неполной наблюдаемости си¬ стема (4. 23) может быть преобразована к виду (4. 41) х^Ап^+^х^йи; хн=А22хи4-В2и; у=Ё2хп> причем подсистема из двух последних уравнений, рассматриваемая на плоскости xi = o, является полностью наблюдаемой. Это зна¬ чит, что возможно восстановить часть вектора состояния х2 [срав¬ нить формулу (4.28)]: xii = A22xii-|-B2u4-K2 (Е2хп — Ёпхп) и осу¬ ществлять управление только по этой части фазовых координат си¬ стемы и=—Ь2хп (рис. 4.6). Вводя ошибку хп=хц — хц, при и= = —Ь2хп получим аналогично (4.31) замкнутую систему xi =A11xI (А12 BiL2) х11-рВ1Ь2хп; (4.47) хи = (^22 — B2L2) хп 4-B2L2xh; Хц = (А22 КгЕг) хи. 73
Рис. 4.6. Структурная схема управляемой и и наблюдаемой системы /, не являющейся полностью наблюдаемой, с наблюдающим устройством 2 и регулятором 3 Матрица системы (4.47) вид имеет Ап (А12—B1L2) О (А22—B2L2) О О и, следовательно, ее характери¬ стический многочлен равен произ¬ ведению характеристических мно¬ гочленов, соответствующих матри- цамАп, (А22— B2L2), (А22—К2Е2) • Ввиду полной наблюдаемости подсистемы, которой отвечает группа координат хп [ (см. форму¬ лу (4.43)], характеристические числа матрицы (А22 — К2Е2) мо¬ гут быть размещены произвольно на комплексной плоскости путем выбора матрицы К2. Далее харак¬ теристические числа матрицы (А22 — B2L2) также могут быть произвольно помещены на комп¬ лексной плоскости. В самом деле, система x^AnX^A^Xn + BjU, (4.48) Xn = A22Xn + B2U по условию вполне управляема, т. е. путем выбора управления фа¬ зовая точка может быть переведена из одного произвольного поло¬ жения в другое за конечное время. Поскольку вторая подсистема в (4. 48) не зависит от первой, то подходящим управлением можно перевести часть Хц фазового вектора х из одного произвольного положения в другое. Значит подсистема хп=А22хп-|-В2и полностью управляема, следовательно, характеристические числа матрицы (А22 — B2L2) можно сделать любыми наперед заданными. Таким образом, если предположить, что система не полностью наблюдае¬ мая, но матрица Ап, отвечающая ненаблюдаемой части фазовых координат, асимптотически устойчива, то системой с успехом мож¬ но управлять по наблюдаемой части фазовых координат.
Глава 5 ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДЕТЕРМИНИРОВАННЫМИ СИСТЕМАМИ 5.1. АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ АВТОПИЛОТОВ Постановка задачи и основные результаты Качество процесса регулирования удобно оценивать интегральной t1 квадратичной ошибкой J xT(/)Qi (/) х где Qi(/)—некото- рая неотрицательно определенная матричная функция, которая оп¬ ределяет ошибку, вносимую отдельными фазовыми координатами. При построении закона управления, обеспечивающего заданную ин¬ тегральную квадратичную ошибку, целесообразно учесть ограниче¬ ние на управляющее воздействие. С этой целью введем интеграль¬ ное квадратичное значение управляющей переменной, т. е. tt j* uT (/) Q2 (/) u (/) dt, где весовая матрица Q2(/) предполагается *0 положительно определенной. Таким образом, можно было бы поста¬ вить задачу о нахождении закона управления, минимизирующего интегральную квадратичную ошибку при заданном интегральном квадратичном значении управляющей переменной. Такая задача на условный экстремум методом множителей Лагранжа сводится, как известно, к задаче на безусловный экстремум для функциона¬ ла хт(/) Qi (/) х (/) dt-\-k С ит (/) Q2 (/) и (/) dt (5. 1) t0 t0 с неопределенным множителем X, значение которого находится в процессе решения задачи. Несколько иная постановка задачи бу¬ дет, если на величину интеграла j uT(/)Q2 (/) u (t)dt не наклады¬ вать ограничений, а определить ее отношение к интегральной квад- Z, ратичной ошибке J xT(?)Qi(/) х (t)dt. Это можно сделать, выбрав заранее определенное значение множителя X в функционале (5. 1), а затем решать задачу на минимизацию этого функционала. Ввиду того, что значение Л можно учесть при выборе матрицы Q2I/), то можно поставить следующую задачу оптимального регулирования. 75
Пусть задана линейная система [см. пояснение к уравнению (4.1)] x = A(/)x + B(f)u. (5.2) Требуется найти такой закон управления и(/), который минимизи¬ рует критерий /1 t j хг (Л) Q0x(/i) + Jx47)Qi(/)x (t)dt+ f uT (/) Q2 (/) u (/) dt, (5.3) /о ^0 где в отличие от (5.1) добавлен член xT(7i)Q0x(7i), Qo — неотрица¬ тельно определенная матрица, определяющая взвешенную квадра¬ тичную терминальную ошибку регулирования. Теорема. Закон управления u(f) системой (5.2), минимизи¬ рующий критерий (5.3), есть и (/) = — L (/) х (/), L (/)=ог! (/) Вт (/) S (/), (5.4) где S(Z)—решение матричного дифференциального уравнения Риккати - S = Аг (/) S + SA (/)+Qi (Z) - SB (/) Q2_1 (/) Вт (/) S (5.5) с конечным условием в точке t\: S(t^) =Qo. Эта теорема выражает основной результат задачи аналитическо¬ го конструирования регуляторов, решение которой дано в работах А. М. Летова и Р. Калмана. Практическое значение этой теоремы состоит в синтезе оптимального управления в виде линейной обрат¬ ной связи. Другим важным свойством оптимального управления является то, что для стационарных систем при некоторых ограни¬ чениях коэффициент оптимальной обратной связи при t—>оо стре¬ мится к некоторому установившемуся значению. Сформулируем те¬ орему для стационарных систем. Теорема. Предположим, что линейная система с постоянны¬ ми коэффициентами [см. пояснение к уравнению (4. 1)] х=Ах + Ви (5.6) полностью управляема, а критерий качества имеет вид [хт (/) QiX (/) + uT (/) Q2u (/)] dt, (5.7) б где Qi, Q2 — постоянные положительно определенные матрицы. Тогда управление и = —Lx, L = Q2_1BTS, где S — положительно оп¬ ределенное решение матричного алгебраического уравнения Рик- катп A'S + SA + Qi- SBQFBS—О, (5. 8) решает задачу об управлении системой (5.6), минимизирующее критерий (5.7). Уравнение (5.8) имеет единственное положительно 76
определенное решение. Замкнутая система х= (А — BL)x асимпто¬ тически устойчива. Замечание. Требование положительной определенности мат¬ рицы Qi можно заменить менее ограничительным. Каждую неот¬ рицательно определенную матрицу ранга г можно представить в виде Qi = ETE, где Е — матрица ранга г размерности гХп. Зададим заранее матрицу Qi в виде ЕТЕ. Тогда все результаты теоремы ос¬ таются в силе, если требование положительной определенности матрицы Qi заменить условием: система x=Ax-j-Bu, у = Ех полно¬ стью наблюдаема. Пример. Привод управляющих поверхностей может быть описан следующим уравнением второго порядка [см. уравнение (3.5)]: 1 • ^РМ & + & =- аум* (5.9) 1 рм 1 РМ Вводя фазовые координаты Xi = 6; х2 = 6, запишем уравнение управляемого объекта в виде 1 — а где ради краткости записи положено а — b =- &рМГрА}, иум. Д°ПУ" стим, что необходимо обеспечить постоянное значение угла отклонения руля Xi = = Xi°. Вводя новые переменные, поместим начало координат в точку (х«°, 0): x/ = xi—Xi0; х2' = х2. Переменные х? удовлетворяют той же системе уравнений (5.9). Поэтому, если = /iX]+ /2х2 определяет оптимальный закон регулирова¬ ния системой (5.9), т. е. поддерживает состояние системы вблизи положения Xi==x2 = 0, то управление Wi = /i(xi—Xi°) Н-/2х2 обеспечивает поддерживание со¬ стояния системы вблизи положения (xi°, 0). Выберем критерий качества в виде ( [xj (/) + Xwf (/)] dt, т. е. положим в b L Г1 °1 (о. 7) Qi = I , Q2 = X. В данном случае матрица Qi вырождена. Очевидно, что в представлении Qi = ETE можно положить Е=(1, 0). Система (5.9) вместе с уравнением y=Ex = xt полностью наблюдаема: координата х2 восстанавливает¬ ся по формуле x2 = xi. Уравнение Риккати (5.8) приобретает вид (5. 10) Пусть Sij, i, j=l, 2, обозначает элементы матрицы S; учитывая, что s12 = s2i, по¬ лучаем из (5. 10) следующие алгебраические уравнения: 1 — Ь2\-1$12 = 0; — ЬЧ~ 1Si2S22 + $и — Я512 “ 0; — Ь^\ ^22 2^12 —2$$22 = 9. (5. 11) Положительно определенное решение системы (5.11) будет следующее: X0’5 , /• 2Ь 511 - Ь У а + х0’5 X0’5 b s12 = 521 77
Соответствующая матрица коэффициентов обратной связи равна L =. [Х~0-5, 6-1 ( — а 4- (а2 + 26/~0'5)0’5]. Оптимальная замкнутая система описывается уравнением *"[ <5'12> Характеристические числа замкнутой системы (5. 12) будут — -у (а2 4 26л""0,5)0'5 ± у (а2 _ 26Х-°'5)0,5. Если Х->0, то асимптотическое значение корней определяется выражением ОД (6Х-0-5)0,5 /2 ( — 1±0, Т. е. получено расположение корней Баттерворта для второго порядка. Вывод оптимального управления для нестационарной системы Дадим очень краткий вывод оптимального закона управления (5.4) для конечного интервала управления. Пусть S(/)—решение матричного уравнения (5.5) с условием S(7i) = Q0. Покажем, что функционал (5.3) можно преобразовать к виду / =х* (/q) $ (^о) х (/q)-j~ J [u (/)-|-Q2 (/) В (/)S(/)x(/)] X X Q2 (/) [и (/) + Q2_1 (/) Вт (f) S (/) X (/)] dt. (5.13) Для этого вычислим производную от хт 4 (хт (/) S (/) X (/)) = S (/) X (/) + х’ (/) S (/) + at at clt + V(/)^xW. (5.14) dt Используя уравнения (5.2) и (5.5), запишем правую часть (5.14) в виде (А (/) х (/) + В (/) u (/))rS (/) х (/) + хг (/) S (/) (А (/) х (/) + В (/) и (/)) - -хт (/) (Ат (/) S (/) + S (/) А (/) + Q1 (/) - s (/) В (/) Q2-!Bt (/) s (/)) X (/). Приводя здесь подобные члены и подставляя в (5.14), получим 4 (хт w S (/) X (/)) = ит (/) В1 (/) S (/) X (/) + хт(/) S (/) В (/) и (/) - dt —xT(/)Q1(/)x(/) + xT(/)S(z‘)B(/)Qr1(/)BT(/)S(/)x(/). (5. 15) Проведем тождественные преобразования с учетом, 4ToQr1Q2= = I и что Q2 и S — симметричные матрицы: (и (Х)н-аг1 (/) вт (/) S (/) X « Q2 (7) (u (/)+QF1 (/) Br (/) ST (/) x (/)) = =uT (/) Q2 (Z) u (/) + x1 (/) S (/) В (/) Qr1 (/) BT (/) S (/) x (/) -L- + uT (/) BT (/) S (/) x (/) + x1 (/) S (/) В (/) u (6). (5.16) 78
С учетом (5.16) соотношение (5.15) принимает вид — (хт (/) S (?) х (/)) = — uг (/) Q2 (/) и (/) — хт (/) Qt (t) х (/) + dt + (u (/) + Q-r1 (/) В (7) S (t) X (/))TQ2 (/) (u (/) + Q2 ‘ (/) В1 (/) ST (/) x (/)).. (5. 17) Проинтегрировав обе части (5.17) в пределах от to до Л и учиты¬ вая, что \ — (хт(./) S (/) х (ty)dt = хт(Л) S(/J х (/J — хт (/0) S (/о) х (/0) ? dt f0 и что S(Zi) =Q0, а также используя выражение для критерия ка¬ чества (5.3), получим требуемое соотношение (5.13). Подынтегральное выражение в (5.13) имеет форму vT(/)X XQ2(7)v(7), где v(/) = u(/.) + Q2-,(/)Bt(/)S(7)x(/). Посколь- ку матрица Q2f0—положительно определенная, то для любого вектора v квадратичная форма vTQ2(0v неотрицательна. Таким образом., интегральный член в (5. 13) всегда неотрицателен и, сле¬ довательно, при любом управлении и функционал / > X1(/,,) S (/0) X ХХ(/0). Положив и (/)= — Qr1BT(z,)S (/) х (/), получим v(t)=o, а следовательно, интегральный член в (5.13) обратится в нуль. Это означает, что управление (5.4) оптимально, а отвечающее ему зна¬ чение критерия качества равно хт (/o)S(/o)x(/o), что и требовалось установить. Вывод оптимального управления для стационарной системы Чтобы решить задачу оптимального управления на интервале [О, 4-оо), естественно рассмотреть последовательности задач управ¬ ления на интервале[О, Т) с критерием 7' f [хт (/) Q1X (/) + uг (/) Q2u (/)] dt, (5. 18) .) о когда параметр Т—> +оо. Обозначим через ST(t) решение урав¬ нения -S = AtS + SA+Q1-SBQ2_1BtS (5.19) с нулевым условием в конечной точке интервала управления: ST(T)=O. В соответствии с изложенным оптимальное управление на интервале [О, Т) имеет вид u(Z)= — Qr1BTSr(/)x(/). Основным моментом всего последующего доказательства является вывод сле¬ дующего предельного соотношения: limSr(/) = S при Т —>4-оо, (5.20) где S — стационарное решение уравнения (5.19). Сходимость в (5.20), как нетрудно показать, эквивалентна сходимости квадра¬ тичных форм bTST(7)b при любом векторе Ь. Докажем вначале, что эта сходимость имеет место при / = 0. 79
Сходимость bTST(O)b при Т—^Ц-оо. Проверим, что выражение bTSr(0)b есть монотонно возрастающая и ограниченная функция от Т при каждом фиксированном значении Ь, откуда по известной теореме математического анализа будет следовать существование предела bTSr(O)b при Т—Как показано выше, оптимальное значение критерия качества при условии, что система в начальный момент находится в состоянии Ь = х(0), равно bTST(O)b. Используя свойство полной управляемости системы (5.4), построим управле¬ ние u(t), переводящее систему из состояния b в нулевое состояние к некоторому конечному моменту Л, и положим и(7)=о при Обозначим через I соответствующее этому управлению значение функционала (5.18). Очевидно, что оптимальное значение функци¬ онала (5.18) при любом не может превосходить значения Z, т. е. bTSr(O)b<Z при достаточно больших значениях Т. Докажем теперь монотонность последовательности ЬТ8Г.(О)Ь: bTS71(O) b < bTS7-a (0) b, Л<Л, (5.21) т. е. с увеличением интервала управления оптимальное значение критерия качества может только увеличиваться. Обозначим через Ui(/), хД^) и u2(/), хг(0 оптимальные управления и траектории со¬ ответственно на интервалах [0, 7\) и [0, Т2). Поскольку Ti<T2, то имеем очевидное неравенство т bTSr, (0) b = у X2(/)Q1X2 (/)+U2(/)Q2U2(/)] Л > о Тг j х2 (/) Q1X2 (/) и2 (/) Q2u2 (/)] dt. (5.22) о Рассмотрим управление и2(Т) на интервале [0, Л). Правая часть (5.22), очевидно, представляет значение критерия качества, отве¬ чающее этому управлению. Но для интервала [0, Т{) оптимальным является управление Ui(/) со значением критерия качества brS7\(0)b. Следовательно,-Ь’1^ (0) b не превосходит правой части (5.22), а значит и его левой части, что доказывает (5.21). Сходимость матричных функций ST(/) при каждом значении t к некоторой предельной матричной функции S* (/): lim Sr (/) = S* (/). Т—>оо Матричные функции ST(t) при каждом значении Т удовлетворяют одному и тому же дифференциальному матричному уравнению (5.19). Поясним, что матричное уравнение (5.19) есть не что иное, как нормальная система /г2 нелинейных дифференциальных уравне¬ ний относительно функций Sij(t), i, и поэтому к матрич¬ ному уравнению (5.19) применимы известные теоремы теории диф¬ ференциальных уравнений. В частности, по теореме единственности, всякое решение уравнения (5.19) однозначно определяется своим значением в любой момент времени t. Возьмем решение ST(0, 0=^ Г, определенное условием прохождения через нуль в точке t—T и вычислим его значение в точке f=0: ST = ST(O). Вейлу из¬ 80
ложенного ST (0 можно определить, как такое решение уравнения (5.19), которое в момент 1 = 0 принимает значение ST('O) (рис. 5.1). Введем решение S*(7) уравнения (5.19), удовлетворяющее началь¬ ному условию S*(0)=S, где S = lim ST(0) при Т—>■ 4-оо. Тогда, по¬ скольку последовательность начальных значений ST(0) сходится при Т—>- +оо к пределу S, используя теорему о непрерывной зави¬ симости решения дифференциального уравнения от начальных дан¬ ных, выводим, что при каждом значении I limSr(/) = S*(/) при Т—»-[-оо. (5. 23) Постоянство матричной функции S*(/): S*(/)=S при всех зна¬ чениях t. Покажем, что при каждом h>0 и t^h Рис. 5.1. Кривые сходимости матричных функций Sf- (О к предельной 5 S*(/)==S*(f—й). (5.24) Из (5.23) имеем при Т—> —)-4-оо limST(7—/г) = = S*(t— h). С другой стороны, заметим, что ST(t — h) как функция t при фиксированном h яв¬ ляется решением уравне¬ ния (5.19), поскольку Sr(Z— h) отличается от ST(/) сдвигом времени, а уравнение (5. 19) автономно — правые части не зависят явно от t. Решение ST(t— h) при t = T-\-h обращается в нуль: ST((T + /i) — — h) =ST(71) =О. Но решение уравнения (5.19), обращающееся в момент t = T-\-h в нуль, есть ST+/i(Z), т. е. ST(/ — h) =ST+h(t) при всех значениях t. Переходя в последнем соотношении к преде¬ лу при Т—>оо и учитывая, что при этом и T + h,—ню, с учетом (5. 23) получим limSr(/ — /z) = limSr+A(/) = S*(/) при Т —>4~оо. (5.25) Сравнивая формулу (5. 25) с полученным результатом limSr(/ —й) = Г—>оо = S*(/—й), получим (5.24). Полагая в (5.24) t=h,. получим, что при всех t имеем S* (/) =S* (0) =S. Итак, доказано, что S*(/)—S, являющееся решением матричного уравнения (5.19), постоянно. При подстановке S*(/)sS в уравнение (5.19) левая часть обра¬ тится в нуль и, следовательно, матрица S удовлетворяет уравнению (5.8). Оптимальность управления и=—Lx, где L=Q2 1^TS. Покажем, что если управление имеет вид u= —Lx, L = Q2 BtS, (5. 26) 81
то значение критерия качества будет равно bTSb, где b — вектор начального положения. Подынтегральное выражение в (5.7), с уче¬ том (5.26), приобретает вид хт (/) [Qi + Lг Q2L] х (/) = хт (/) [Qi + SBL] х (/). (5. 27) Выразив Qi из уравнения (5.8) и учитывая, что матрицы Q2 и S — симметричные, с использованием (5.26) найдем Qi = - ATS - SA + SBQ2_iB S= - ATS - SA + LTBTS. Подставляя Qi в (5.27), получим хт (/) [ - ATS - SA + LTBTS SBL] x (/) = - xT (/) S [(A — BL) x (/)] - — [xT (/) [AT — LTBr)] Sx (7) = — xT (/) Sx (/) — xT (f) Sx (/) = = ~^[xT(/)Sx(/)]. (5.28) at При выводе соотношения (5.28) использовано уравнение замкнутой системы х= (А—BL)x (или хт = хт(Ат—LTBT), которое получается подстановкой (5.26) в (5.6). Таким образом, подынтегральное вы¬ ражение в (5.7) равно правой части (5.28). Произведем интегриро¬ вание этого выражения в конечных пределах от 0 до некоторого значения Т>0 с учетом х(0) =6: т т [хт(/) QiX( /) + uT(7) Q2u(/)]rf/ = — -А- [хт (/) Sx (/)] dt= о о =[—хт(/) Sx (/)]$■ = - хг (Г)Sx (Г) 4- bTSb. (5. 29) В силу доказанной ранее неотрицательной определенности матри¬ цы S выражение xT(7)Sx(7) неотрицательно при любом векторе х(Т). Поэтому интеграл в левой части (5.29) не превосходит bTSb. Переходя к пределу в (5.29) при Т—>оо, найдем, что 1= [ [xT(7)Q1x(/) + u' (7)Q2u(/)]rf/< brSb, (5.30) б т. е. значение критерия качества /, отвечающее управлению (5.26), не превосходит bTSb. Теперь положим, что и(/), 0^7<оо— произвольное управление и x(t), x(0)=b — отвечающая ему траектория. Обозначим через / значение критерия. Возьмем произвольный интервал управления (0, Т). Оптимальное значение критерия качества для этого интер¬ вала в соответствии с принятыми обозначениями равно bTST(O)b. Следовательно, т b Sy- (0) b j* [хг (/) Qi (/) х (/) -|- и (/) Q2 (/) и (/)] dt I„ (5.31) б7 82
Переходя к пределу в (5.31) при Т—^Ч-оо, получим bTSb<7. (5.32) Таким образом, ни для какого управления и(/) значение критерия качества не может быть меньше bTSb. С другой стороны, для управ¬ ления и(/), задаваемого формулой (5.26), доказано неравенство (5.30). Значит, на самом деле в (5.30) имеет место знак равенства, т. е. значение критерия качества для управления (5.26) равно bTSb. Из формулы (5.30) теперь следует, что bTSb является мини¬ мально возможным значением критерия качества, т. е. закон управ¬ ления (5.26) оптимален. Используя доказанное только что утверждение, что предел ле¬ вой части в (5.29) при Т—>оо равен bTSb, заключаем из (5.29), что limxT(r)Sx(r) = 0. (5.33) 7 —>оо Этот результат будет использован при доказательстве асимпто¬ тической устойчивости системы (5.6), замкнутой оптимальным уп¬ равлением (5.26): х = (А —BL)x. (5.34) Условия асимптотической устойчивости стационарной замкнутой системы Сведения из линейной алгебры о приведении квадратичной формы к канонической. Рассмотрим квадратичную форму с неотрицатель¬ но определенной матрицей х^х^О. Обозначим через г^/г ранг матрицы Qj. Известно, что существует линейное преобразова¬ ние переменных 1/1=^1Л + • • • + е1пхя,г/г = Л + ... + егпхп, или у = Ех, где yT=(t/i,..., у г), E=]|eJ- матрица ранга г размерности гХп, что в координатах у\,...,уг квад¬ ратичная форма xTQiX приводится к сумме квадратов: х QiX = f/i-|- • • • Н-Уг- (5.35) С другой стороны: у\ + • • • + Уг = уту=(Ех)т Ех=хтЕтЕх. (5. 36) Сравнивая соотношения (5.35) и (5.36), находим, что Qj = ETE. (5.37) Условия невырожденности матрицы S. Используя матрицу Е, определенную формулой (5.37), построим наблюдаемую и управля¬ емую систему х = Ах-)-Ви; у = Ех. (5.38) 83
Подынтегральное выражение в критерии (5.7) с учетом (5.37) и у.= Ех представим в виде У1 W У W + ит (/) Q2u (/). (5. 39) Предположим, что матрица S — вырожденная. Это значит, что найдется некоторый ненулевой вектор ат= (ди,..., дп), что квадра- тичная форма aTSa = 0. Поскольку aTSa представляет собой опти¬ мальное значение функционала (5.7), соответствующее начальному состоянию вектора а системы (5.6), то для оптимального управле¬ ния u(Z) и траектории х(/), х(0)=а, с учетом (5.39.), получим оо f [y'r(/)y(7) + urWQ2u(/)]^=aTSa=0. (5.40) б Так как подынтегральное выражение в (5.40) состоит из двух не¬ отрицательных слагаемых, то получим (1) ут(Оу(О—0, т. е. у(/)=о и (2) ut(/)Q2u(0 =0, т. е. и(/)н=о, так как Q2 — положи¬ тельно определенная матрица. Итак, имеем нетривиальное свобод¬ ное (и(/)=о) решение уравнения (5.38), для которого наблюдае¬ мый вектор у тождественно равен нулю. Такое положение может иметь место только в том случае, когда система (5.38) не является полностью наблюдаемой (см. гл. 4). Если матрица S вырождена, то система (5.38) не является полностью наблюдаемой. Сделаем те¬ перь допущение, что система (5.38) является полностью наблюдае¬ мой. Поскольку предположение, что матрица S вырождена, приво¬ дит к неполной наблюдаемости системы (5.38), то получим, что матрица S — кевырождена, т. е. с учетом ее неотрицательной опре¬ деленности она будет положительно определенной. В частности, если ранг матрицы Qt равен /г, то ранг матрицы Е также равен п, и следовательно, система (5.38) будет полностью наблюдаемой. Асимптотическая устойчивость замкнутой системы. Допустим, что система (5.38) полностью наблюдаема. Тогда из соотношения (5.33) и положительной определенности матрицы S вытекает, что при любом начальном состоянии системы (5.6) и оптимальном за¬ коне управления (5.26) оптимальная траектория х(/) обладает свойством х(Т)—при Т—>-оо, что и означает асимптотическую устойчивость системы (5.6), замкнутую оптимальным законом уп¬ равления (5.26). Действительно, при положительной определенно¬ сти матрицы S уравнение xTSx=e, е>0 описывает эллипсоидную поверхность вокруг точки 0. При е—>0 эти поверхности стягивают¬ ся в точку х = о. Поэтому, поскольку верно (5.33), фазовая точка х(Т) также сходится к нулю при Т—юо. Это же утверждение мож¬ но проверить и аналитически. Если S = CTC, где С — невырожден¬ ная матрица размерности пХп [сравнить с формулой (5.37)] и z = = Сх, то [сравнить с формулой (5.35)] xT(7’)Sx(7') = ZT (Г)г (7') = г?(Г)-|-...-J-Zn(r). Из (5.33) вытекает, что гДГ)—*0, /=1,м, а отсюда очевидно, что Xj(T)—И), / = 84
5.2. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА Постановка задачи Автономные системы (правые части не зависят от времени). Пусть объект управления описывается системой обыкновенных дифферен¬ циальных уравнений первого порядка, разрешенных относительно производных хп, um), Z=l, 2,..., п, (5.41) или в векторной форме x=rfx/t//=f (х, и), (5.41а) где хт= (хь хп) ^Rn— вектор фазового состояния системы; ит = = (ub ..., Um) <=Rm — вектор управления; fT (х, и) = (Д (х, и), fn (х, и)) —вектор правых частей. Приведенная форма записи дифферен¬ циальных уравнений называется нормальной. Путем введения до¬ полнительных неизвестных обыкновенные дифференциальные урав¬ нения любого порядка могут быть приведены к нормальной форме. Будем предполагать, что управление и задается как функция времени u=-u(/), и наложим ограничение, что функция и(/) кусоч¬ но непрерывна. Кроме того, потребуем, чтобы при каждом значе¬ нии t управление u=u(/) принадлежало некоторому подмножеству U пространства Rm. В задачах управления наиболее важным ока¬ зывается случай, когда множество U ограничено и замкнуто (вы¬ ход рулей на упор, ограниченная мощность приводов и т. п.). При этом часто оказывается, что оптимальное управление и(£) прини¬ мает значения на Гранине области U. Целью управления будем счи¬ тать перевод системы из начального состояния в некоторое заранее определенное конечное состояние х1, либо в некоторое множество конечных состояний S'czR71; при этом все состояния из 51 считают¬ ся равнозначными с точки зрения цели управления. Естественно ограничиться той частью фазового пространства Gcz7?n, для кото¬ рой цель управления выполнима: для любого вектора х° из области G(x°^G) существует допустимое управление и(/), при котором решение х(/) системы (5.41а), отвечающее u=u(/), про¬ ходит в начальный момент to через точку х(/0)=х°, а в конечный t\ — через точку x(G)=x1eS1. Положим, что вектор-функция f определена для любого значения xgG и ugG и что функция f(x, и) непрерывна по х и и и непрерывно дифференцируема по х. Качество процесса управления выразим количественно в виде значения некоторого интегрального функционала вдоль траектории /=j/0(x(Z), и (/))<//, (5.42) ^0 гДе /0(х, и)—непрерывная функция, которая выбирается из усло- вия обеспечения определенных требований, предъявляемых к про- 85
ueccy управления (минимум расхода энергии на управление, мак¬ симум быстродействия системы и т. гг). Функция /0(х, и) принадле¬ жит к тому же классу функций, что и функции Д- (х, и) в уравнени¬ ях (5.41); время i\ не фиксировано. Управление u = u*(/) будем считать оптимальным, если функ¬ ционал (5.42), вычисленный вдоль соответствующей управлению и*(/) траектории х*(/), принимает наименьшее возможное значе¬ ние. Выведем принцип максимума Понтрягина, дающий необходи¬ мые условия экстремума. Управление, удовлетворяющее этим ус¬ ловиям, называется иногда экстремальным. Когда оптимальное управление существует и найдены все экстремальные управления, то отобрать средн них оптимальное не представляет трудно¬ стей. Выделим в множестве G ту часть G*<G, для которой существу¬ ет оптимальное управление. Всюду в дальнейшем, не оговаривая это особо, не будем выходить из области G*. Неавтономные системы (правые части явно зависят от времени). Более общий вид системы (5.41), когда правые части системы явно зависят от времени t, легко свести к рассматриваемому, принимая I за новую фазовую координату. Добавляя к системе (5.41) уравне¬ ние dxn+\!dt=\, получим систему типа (5.41), порядок которой на единицу выше. Задача с фиксированным временем управления. В некоторых задачах управления, например, при стабилизации, не накладывает¬ ся непосредственно ограничение на конечное состояние системы, а эти ограничения проявляются косвенно через функционал качества. В таких случаях может быть задано время, в течение которого ве¬ дется процесс управления. Тот же прием введения дополнительной координаты dxn+\!dt=\ сводит задачу к системе типа (5.41). Переход к расширенному фазовому пространству. Дополним сис¬ тему (5.41) уравнением х0 = /0(х, и), (5.43) выражающим скорость изменения функционала (5.42) вдоль траек¬ тории х(/), где /0(х, и) —подынтегральное выражение в (5.42). Так как правые части (5.41), (5.43) не зависят от координаты Хо, то ре¬ шение хо(О уравнения (5.43) становится известным, как только фиксировано управление u(/), и найдена траектория х(/) системы (5.41), отвечающая этому управлению. Подставляя най¬ денные значения х(/) и и(/) в уравнение (5.43), найдем ti J /о(х(т), u(t))<Zt. ^0 (5.44) 86
Тем не менее оказывается удобным объединить уравнения (5.41) и (5. 43) в одну систему и рассматривать ее поведение в расширен¬ ном фазовом пространстве Rn+i размерности п+1: X =f (X, и), (5.45) где хт=(х0, хт)=(х0, хг,..., хп); fT=(70, fT)=(/0(x,и),/^х, и)),... .. }п(*, и)) — (п+1)-мерные векторы соответственно состояния си¬ стемы (5.45) и ее правых частей. Всюду в дальнейшем (п+1)- мерные векторы будем отмечать чертой над символом: х, f, ф, . . и т. п., а n-мерные векторы — без черты: х, f, ф, . Рие. 5.2. Траектории в расши¬ ренном фазовом пространстве Рис. 5.3. Оптимальная траек¬ тория Представление траектории в фазовом пространстве. Каждой траектории х(/) системы (5.41) соответствует целая совокупность траекторий х(/) системы (5.45), отвечающая различным началь¬ ным значениям Хю(^о) [см. формулу (5.44) и рис. 5.2]. Геометри¬ чески все эти траектории получаются одна из другой параллель¬ ным переносом вдоль оси х0. Приращение (см. рис. 5.2) коор¬ динаты х0 равно %о(^1) —хо(/о) вдоль всех этих траекторий одно и то же и равняется значению функционала (5. 42) на траектории х(^). В частности, для траектории х(/) с х0(/о)=0 значение xQ(t) равно накопленному значению функционала (5. 42) к моменту вре¬ мени t. Принцип оптимальности. Так называемый принцип оптимально¬ сти гласит, что любой отрезок оптимальной траектории x*(f) при вместе с управлением и*(7), является опти¬ мальной траекторией. Действительно, если бы было возможно на участке движения системы после точки x*(f) выбрать «лучшее» управление (рис. 5. 3) где j/0(x**(/), и** (/))<#< i' 1 1 i' 87
то G t' u*(t))dt=\f0(x*(t\ u*(ty)dt+ to t q tl t' + (Д0(х*(7), u*(/))r//> j* /0(X*(7), U*(/))fif/ + t ' t Q + j/o(x**(/), u** (/))<//. t' Таким образом, оптимальное управление u*(/), перево¬ дящее систему из начального положения х(/0) в некоторое конеч¬ ное, дает большее значение функционала (5.42), чем некоторое другое — составное управление, равное и* (/) при и и** (/) при Полученное противоречие доказывает принцип оп¬ тимальности. Вывод основных результатов Уравнение поверхности Sc одинаковой платы. Рассмотрим совокупность L оптимальных траекторий х*(/), в расши¬ ренном фазовом пространстве /?п+1, £читая, что начальная точка х*(70) пробегает область G*, т. е. Т= {х*(/)> x*(Z0)^G*}. Во всех последующих .построениях важное значение приобретают подмножества 2с всех точек траекторий из совокупности L, правыэ концы которых!имеют одинаковые координаты х0, равные какой- либо постоянной с (рис. 5. 4): 2с=(х*(/); 4(Л)=с). Обозначим IF(x) оптимальное значение функционала (5.42) вдоль траектории, начинающейся из х: р/(х) = у /0(х*(/), и*(/))д7, х = х*(/0). ^0 Покажем, что все точки из 2с удовлетворяют уравнению Ло + \Г(х) = г. (5.46) Пусть точка (%о, х) принадлежит 2с- По. определению 2с на^' дется оптимальная траектория х*(/), такая, что в правом конце она принимает значение c = %o*(^i) и ПРИ некотором значении /х (^o^/'^i) Проходит через точку (х0, х): хо(/') = хо; х*(/') = х. 38 (5.47)
Согласно принципу оптимальности отрезок оптимальной траекто¬ рии х*(7Д сам является оптимальной траекторией для начальной точки х* (/') =х. Отсюда получим W (х)=Г (х* (/'))=J /о(х*(А u*(/)) dt = J /0(х*(/), Г 'to ( /0(х*(/), u*(/))rt7=[xo(/i) — /о(4)] — to с уп- место — [хо(/') —Хо(/о)] =Хо(/1) — Хо(/') = с — х0, что и дает уравнение (5.46). Утверждение доказано. Поскольку над каждой точкой xeG*cz/?n в силу уравнения (5.46) строится единственная точка х0=с— 1^(х), то уравнение (5.46) при каж¬ дом значении с описывает поверхность в пространстве Rn+i. По¬ верхности при разных значениях с отличаются друг от друга па¬ раллельным сдвигом вдоль оси Хо. Свойства поверхности одинаковой платы. Поверхности име¬ ют два важных свойства. Первое, непосредственно вытекающее из определения: поверхность является геометрическим местом оп¬ тимальных траекторий в расширенном пространстве Rn+1 с одина¬ ковым значением функционала (5.42). Второе состоит в том, что любая траектория в расширенном пространстве х(/) (х(/) не дол¬ жно выходить за пределы области G*) может пересекать поверх¬ ности (ПРИ любом значении с) только в направлении «снизу вверх» по отношению к координате х0, т. е. фазовая точка х(/) при возрастании t не может переходить с одной поверхности на другую ^c~h' ^>0, с меньшим значением платы. Действительно, предположим противное: траектория х(/) равлением u(Z) такова, что в некоторой точке Xo(t') +U7(x(?))=c, а в не¬ которой точке t">tf будет х0(Г)+ДГ(х(Г)=с-/1, h> >0. Таким образом, точка х(/") лежит на поверхности и значит, если двигать¬ ся из точки х(/") по опти¬ мальной траектории под действием оптимального уп¬ равления и*(/), то траекто¬ рия будет лежать на поверх¬ ности и за время от t” до попадания фазовой точки x(Z) на S1 функ¬ ционал (5.42) получит приращение с — h — х0 (/"). На интервале движе- имеет Г Поверхность одинаковой платы
ния [/z, t"] под действием управления u(f) функционал (5.42) имеет приращение x0(/zz)—х0(О- Отсюда для составного управ¬ ления и(/) при ZZ^/^ZZZ и и*(/) при t>t" приращение функцио¬ нала начиная от точки x(/z) и до конца равно [х0(^)”“хо(^)1+ (с — — й — х0 (/")] = с — й — x0(/') = (f — Л) — -f-UZ (x(f)) = lT(x(f)) — й. Но этого не может быть, так как минимально возможное прира¬ щение функционала для точки x(f) по определению функции F(x) равно Полученное противоречие доказывает ут¬ верждение. Геометрическое содержание принципа максимума. Отмеченные свойства поверхностей позволяют сформулировать принцип мак¬ симума. Введем обозначение п(х) для вектора нормали к поверх¬ ности 2с в точке х= (%о, х), направленного в сторону меньших значений координаты xQ (см. рис. 5.4). Пусть х*(^), — оптимальная траектория, целиком лежащая внутри (а не на гра¬ нице) области G*, в каждой точке которой траектория х* (t) по¬ верхности 2с регулярна: существует касательная плоскость и нормаль. Возьмем произвольное значение f, и бесконеч¬ но малое 6>0 и проварьируем управление u*(Z), положив его по¬ стоянным и равным произвольному u^U на интервале [f, t' + 6]. Из уравнения (5.45) имеем х (/'Ц-8) = х*(/')“Н (х*(^)> и(&))“Ьо (&)• Согласно второму свойству поверхности 2с точка x(Zz+6) долж¬ на быть выше или в крайнем случае лежать на поверхности 2с, а _ значит, скалярное произведение ( п (х* (/')), х(/'-Н)~ — х*(/') ) 0, т. е. при всех и<=[/ имеем < n (х*(/')), f(x*(/z), u)))<0. (5.48) Так как сама оптимальная траектория лежит на поверхности 2с, то ее касательный вектор f(x*(^z), u*(f)) лежит в касательной плоскости к2с и значит, перпендикулярен к вектору n(x*(f)): <iT(x*O, Чх*(/'), u*(f)))=0. (5.49) Сопоставляя результаты (5.48), (5.49), получим, что для опти¬ мальной траектории и управления max ( п(х* (/')), f(x*(/'), и) ) = ( n(x*(/')), f(x*(/'), u*(f))) =0. Соотношение (5.50) выражает собой сущность принципа макси¬ мума. Однако в форме (5. 50) он еще не пригоден для практиче¬ ского использования, поскольку неизвестным является направление вектора п(х*(^')) вдоль оптимальной траектории. Аналитическая форма принципа максимума. Введем однород¬ ную систему дифференциальных уравнений 90
d^j dt n dfi(**(t), u* (0) dxj Ф/, 7 = 0, 1,..., n, (5.51) рассматриваемую на интервале Как будет показано ни¬ же, если направление вектора ф(/) = (фо(О, ф1(/),..., фп(0) ВЬ1_ брать в начальный момент /0 совпадающим с направлением векто¬ ра п(х*(/0))> то и на всем интервале вектор ф(£) будет коллинеарен вектору п(х*(/)). Тем самым неопределенность в от¬ ношении вектора п(х*(/)) в (5.50) уменьшается: он становится полностью известен, как только определится его начальное значе¬ ние или его значение в какой-нибудь момент времени t, Следовательно, принцип максимума может быть выражен следу¬ ющим образом. Если u*(/), x*(/j —оптимальное управление и траектория, то существует ненулевая непрерывная вектор-функция ф(/), являю¬ щаяся решением системы (5.51), для которой при всех значениях Z, справедливо соотношение max < ф(/),Т(х*(/), и) > = < ф(/), Г(х*(/), и*(/)) ) =0. (5.52) uf (/ Приведем доказательство коллинеарности вектора ф(/) векто¬ ру нормали п(х*(/)) к поверхности 2с в точке х*(^). Введем обо¬ значения: 7\(х) — касательная плоскость к поверхности 2с в точке х, которую будем представлять себе как пространство век¬ торов £= (go, £1, • • fen), откладываемых от точки х и лежащих в плоскости Те(х); /7(ф(0) —плоскость, перпендикулярная вектору ф(/) и проходящая через точку х* (Z). Допустим,_что вектор ф(/0) коллинеарен вектору п(х*(/0)), так что 7^(х* (/0))=/7 (ф (/0)). Требуется доказать, что при всех значениях /, 7\(х*(/)) = /7(ф(/)), (5.53) так как совпадение плоскостей повлечет коллинеарность векторов нормалей. Это соотношение будет доказано в несколько этапов. Переход от системы (5.51) к ей сопряженной. Рассмотрим ли¬ нейную однородную систему dt п и* (О) dxi (5. 54) 7 = 0, 1,..., П, сопряженную с (5.51). В силу известного свойства сопряженных систем [см. формулу (П17) Приложения] (ф(/), £(/)>= const, (5.55) гДе ф(/), ?(/) —произвольные решения систем (5.51) и (5.54) со¬ ответственно. Предположим, что вектор начального состояния £(М 91
системы (5. 54) лежит в касательной плоскости Тв (х* (/0))> а век¬ тор начального состояния 1|>(/о) системы (5.51) выбран по направ¬ лению п(х(/0)). Тогда их скалярное произведение, очевидно, будет равно нулю не только при t=to (см. рис. 5. 4 и 5. 5) Рис. 5.5. Вектор нормали к поверхности Sc <ф(/о). i(/o)> =0, (5.56) но и при всех значениях t, (Ш 1Ш=0. (5.57) Предположим, что вектор начальных значений £(/0) пробегает всю плоскость Г2(х*(/0)). Если фиксиро¬ вать любой момент времени t>tQ, то значения соот¬ ветствующих решений систе¬ мы (5.54) будут лежать в силу соотношения (5.57) в плоскости, перпендикуляр¬ ной вектору ф(£), и при этом будут заполнять целиком эту плоскость Таким образом, /7ф(/)) целиком состоит из векторов ^(1), которые являются решениями системы (5.54) и соответствуют всевозможным начальным значе¬ ниям §(/о), пробегающим плоскость 7\(х*(/0)). __ Введение бесконечно малой поверхности А(х*(/)). Введем в рассмотрение бесконечно малый кусок Д(х*(/0)) поверхности 2с» содержащий точку х*(/0) (см. рис. 5.5). Очевидно 7\(х*(/0)) яв¬ ляется касательной плоскостью к поверхности Д(х*(А>)) в точке х*(/0). Таким образом, вектор т], соединяющий начало координат с произвольной точкой поверхности Д(х*(А>)), можно представить в виде и—х* (/0)+(АО 4"0 (е)> (5. 58) где |(/с)—соответствующий элемент касательной плоскости ГЕ(х*(/)). Обозначим через х (/, *9 траектории системы (5.45), вы¬ ходящие из произвольных точек Д(х*(/0)), но все отвечающие одному и тому же управлению и* (/)д оптимальному для траектории, выходящей из точки т] = х*(/0): х(/, T])=f(x(f, т]), и* (/)), х(/0, Й)=Й- (5. 59) (5. 60) В силу теоремы о непрерывно дифференцируемой зависимости ре¬ шения системы дифференциальных уравнений от начальных . дан- 92
окрестности точки Преобразование A(x*(/0)) в пространстве /?п + 1 ных функция х(£, т]) при каждом фиксированном t = = f является непрерывно дифференцируемой функци¬ ей параметра т] и в то время, как параметр т| пробегает гладкую поверхность Д(х*(^0)), точки х(/', 1]) опи¬ сывают также некоторую гладкую поверхность, кото¬ рую обозначим А (х* (/')). Отметим, что точка x*(Zz)<= ее А (х* (f)), поскольку х*(/)=х(/,' х*(/0)). Это поясняется на рис. 5.6, где для большей ясности я-мерные поверхности А(х*(/0)) и A(x*(Zz)) пред¬ ставлены кусками гладких поверхностей в трехмерном пространст¬ ве. Заметим, что поверхность Д(х*(/0)) составляет часть поверх¬ ности 2с» а поверхность A(x*(f)) при t'>tQ не составляет. Оказы¬ вается, что поверхности A(x*(/Z)) и ^\с имеют общую касательную плоскость в их общей точке x*(/z). В самом деле, концы траекто¬ рии х*(/, т]) в момент t=tQ лежат на поверхности 2с» но тогда по описанному ранее свойству поверхности 2с ни в какой последую¬ щий момент t>tQ траектории х*(/, ц) не могут оказаться ниже по¬ верхности 2с- Следовательно, поверхность А (х* (Zz)) при каждом значении f>i0 лежит выше или касается поверхности 2с- Но две гладкие поверхности, одна из которых целиком лежит по одну сторону от другой, имеют, очевидно, общую касательную в этой об¬ щей точке х* (Zz): П(^(^))(х*О=П(х*О. (5.61) Таким образом, теперь необходимо вместо (5.53) доказать сле¬ дующее: _ __ W*U0)(x*O=WO- _ (5.62) Общий вид вектора, касательного к поверхности А(х* (/)) в точке х*(/). Найдем общий вид касательного вектора к поверхно¬ сти А(х*(/)) в точке х*(/). Формула Тейлора с учетом (5.59), (5. 58) дает, что х(Л i]) —х*(/)=х(/, л)— х(А х*(/0))=У г<) - rf=x*(/0) п X <4/ п х 0v-x}(/o)) + 0(e)=e У ^(/,^(0 .,.(/о) + о(е/ (5 63) ___ Соотношение (5.63) выражает следующий факт: при бесконечно малом смещении по поверхности А(х*(/))-из точки x*(f) вектор 93
(5. 65) (5. 66) смещения с точностью до малых высшего порядка коллинеарен вектору " (5.64) dfij Но это означает, что вектор (5.64) лежит в касательной плоскости (х*(< и при переменных £o(W, ММ, • • •, Ь(М, таких что £(/0) £7\(х*(/0)), выражение (5.64) дает общий вид касатель¬ ного вектора из 7\(Г*(/))(х* (/)). Доказательство справедливости соотношения (5,62). Вектор- функции dx(t, х* (/о) )/dT]j из представления (5.64) являются при каждом / решениями системы (5. 54). Действительно, соотношения (5.59), (5.60) являются тождественными по ц; возьмем частные производные по т]о, ту,.. ., г|п; изменяя порядок дифференцирова¬ ния по t и по г]ь, получим d Г= yi df(x(/, g), u*(O) dxj (/,q) . dt L J JU dxi дт\ь i=~-0 о>х(/0, nWnft = (0, 0,..., 0, 1, 0,..., 0) = 8Л. Все координаты вектора равны нулю, кроме &-й, которая равна единице. Полагая в (5.65), (5.66) т] = х*(/0), легко заметить, что при каждом фиксированном значении k вектор dx (^, х* (Щ) = / дху (t, х* (Zo)) дхп (t, х* (/0)) является решением уравнения (5. 54) с вектором начального со¬ стояния Вектор-функция (5.64) является решением системы (5.54). Действительно, ввиду линейности и однородности системы (5. 54) линейные комбинации решений (5.67), выражаемые формулой (5.64), будут решениями системы (5.54) с вектором начальных условий, представляющих собой ту же линейную комбинацию век- п торов начальных условий: (/0)=|(/0). Приведем ход изложенных выше рассуждений. (1). Если век¬ тор Мо) пробегает плоскость 7\(х*(/0))» то решение §(/) системы (5.54) с начальным условием_ £(/0) при фиксированном значении t=t' пробегает плоскость Лг(ф(//)- (2). Если вектор £(f0) пробе¬ гает плоскость 7\(х*(/0)), то вектор-функция (5.64) при t=t' про¬ бегает плоскость7\(х*(Г))(х* (/')). (3). Вектор-функция (5.64) явля¬ ется решением системы (5.54) с начальным условием §т(/0) = = (£о(М, ММ,--, ММ). Из (2) и (3) вытекает следующее. (4) Если вектор Мо) пробегает плоскость Гг(х*(М), то решение (5. 67) 94
системы (5.54) с начальным условием £(/0) при фиксированном значении t=tf пробегает плоскость 7\(х*(г л (х* (/')). Из сопостав¬ ления (1) и (4) следует справедливость (5.62). Задача с незакрепленными концами. Условие трансверсально¬ сти. Прежде чем приводить окончательную формулировку принци¬ па максимума, надо сделать некоторые дополнения. Введем обо¬ значение Я(х, ф, и)=(ф, f (х, u))=2<p;/y(x,u) (5.68) /..0 и рассмотрим максимум функции Н по переменной U. Обозна¬ чим u* = g,(x, ф) оптимальное значение управления, максимизирую¬ щее гамильтониан Н: шах/7(х, ф, и) = Я(х, ф, g(x, ф))- В соответствии с принципом максимума (см. стр. 91), чтобы найти оптимальное управление, надо разрешить относительно х(Л), ФбО> и(0 систему соотношений х. = /.(х, u), f=0, 1,..., п\ (5.69) ъ=-У^(*’--иЧ.у=0' 1>-’(5-70) dxj i~0 max//(x(/), ф(/), и) = Л/(х(/), ф(/), g(x, ф))=0. (5.71) Из соотношения (5. 71) вытекает, что u(/) = g(x(/), ф(/)). (5.72) Подставляя соотношение (5.72) в (5.69), (5.70), получим */=Л(х, g(x, ф)), Z=0,l, ..., га; (5.73) Ъ = - У /=0,1 п. (5. 74) Соотношения (5.73), (5.74) образуют нормальную систему дифференциальных уравнений, и ее решение х(/), ф(^) зависит от 2 (п+1) констант, подлежащих определению. Число этих констант уменьшается на единицу, если учесть, что поскольку функция /7(х, ф, и.) однородна по ф, то g(x, ф)=§‘(х? kty) при любом значе¬ нии &>0, а значит, вектор-функцию ф(^) достаточно взять с точно¬ стью до множителя. Уменьшение числа констант на единицу про¬ исходит также за счет справедливости соотношения ^(х^о). ф(4))> и*(/0)) = 7/[х(/0)> ф_(/о). g(x(/0)> Ш1=0- (5.75) 95
Вначале рассмотрим, как определяется 2/г констант в задаче с закрепленными концами. В этом случае задано начальное состоя¬ ние системы х° и ее конечное состояние х1, т. е. конечное много¬ образие S1 вырождается в фиксированную точку х1. Но это как раз и есть 2п условий: х(70)=х°; недостающие для опре¬ деления решения системы уравнений (5.73), (5.74). Как прави¬ ло, оптимальное управление находится в результате совмест¬ ного решения соотношений (5. 69), (5. 70), (5. 71). Если же удается получить явную зависимость u* = g(x, ф), то в этом случае реша¬ ется система уравнений (5.73), (5.74), а экстремальное управле¬ ние получается по формуле (5. 72). Полученное решение в общем случае будет неоднозначно из- за неоднозначности g(x, ф), и потому необходимым условиям экс¬ тремума будут удовлетворять несколько отдельных траекторий х(/) и соответствующих им управлений и(/), подобно тому как условие обращения в нуль производной скалярной функции еще не¬ однозначно определяет положение экстремума. Как правило, это не является препятствием для отыскания среди экстремальных уп¬ равлений того, которое решает задачу оптимального управления, если это решение существует. Предположим, что конечное многообразие S1 есть гладкое мно¬ гообразие размерности р<п и и*(/), — оптимальное уп¬ равление, решающее задачу о переводе системы из некоторого на¬ чального состояния на конечное многообразие S1, а х*(/), — соответствующая оптимальная траектория. Легко понять, что управление и* (/) одновременно решает оптимальную задачу с закрепленным правым концом о переводе системы из начального состояния в фиксированное конечное х*(Л). Поэтому сохраняются прежние условия оптимальности, выражаемые соотношениями (5.69) — (5.71). Как было показано выше, в случае закреплен¬ ных концов соотношения (5.69) — (5.71) позволяют в принципе определить оптимальное решение. Но теперь знание того, что x^OeS1, сокращает число степеней свободы решения системы уравнений (5.73), (5.74) до п—р вместо прежних п для закреп¬ ленного правого конца. Выведем так называемое условие транс¬ версальности в конечной точке, добавляющее недостающие р усло¬ вий. Обозначим 51 цилиндрическое множество над многообразием S1 вдоль оси х0 (рис. 5.7): 51 = {(x0, *ь . .., хп); (0, %i, . . ., xn) eS1}. Оптимальная траектория х*(/) лежит на поверхности 2с ПРИ не¬ котором с. Рассмотрим пересечение 2с A S1 поверхностей 2с и S1, т. е. найдем линию пересечения указанных поверхностей. Так как х0 — координаты всех точек из 2с П 51 и они одинаковы и равны с, то многообразие 2с A S1 можно получить параллельным пере¬ носом многообразия S1 вдоль оси xQ на величину с. Однако полу¬ ченное при этом переносе многообразие, вообще говоря, не совпа¬ дает целиком с 2с A S1, так как не каждая точка конечного много¬ образия может служить концом оптимальной траектории. Во вся- 96
ком случае, если x*(/i) —конец оптимально^ траектории, то, ис¬ пользуя указанное соответствие между 2с A S1 и S1, получим, что касательная р-мерная плоскость Ts* (x*(Zj)) к многообразию S1 в точке x*(/i), будучи параллельно перенесенной вдоль оси х0_на величину с, оказывается касательной к многообразию 2с A S1 в точке х*(/А, а значит, входит в касательную /г-мерную плоскость к поверхности 2с в точках* (ZJ. Так как вектор ф(Л) нормален к поверхности 2с в точке x*(/i), то вектор ip(/i) ортогонален р-мер- ной плоскости (x*(^i)): <Ф0т)> П/=0> (5.76) Поскольку плоскость получается параллельным переносом плоскости Ts*> а любой вектор из Ts^ имеет координату т]о = О, то условие трансверсальности можно записать в виде <Ф(Л), П>=0, n&Ts’(х*(О. (5.77) Выбирая в р-мерной плоскости Г^х*^)) линейно независимые векторы т]1, . . ., и записывая для них соотношения (5.77), полу¬ чим недостающие р соотношений, называемые условиями трансвер¬ сальности в конце оптимальной траектории. Перейдем к случаю, когда начальная точка траектории не фик¬ сирована, а лежит на некотором ^-мерном многообразии S0 (рис. 5.8). Пусть х*(/)—оптимальная траектория рассматриваемой задачи с подвижным левым концом траектории. Положим, что оп¬ тимальное значение функционала (5.42) равно с: х*(/)С2с- По¬ кажем, что многообразия 3° и 2с А {-^0=0} в общей точке х* (/0) имеют общую касательную. Для этого достаточно проверить, что многообразие S0 лежит по одну сторону, от многообразия Рис. 5.7. Трансверсальность в правом кон- Це траектории 4 1996 97
2с П {^о=О}- Допустив противное, получим, что на 5° найдется точка х°, лежащая ниже поверхности 2с, т- е- х°(:2с-л при некотором й>0 (см. рис. 5.8). Траектория х*(/), оптимальная для задачи с закрепленным левым концом (х*(/0) =x°^S°), лежит на поверхности 2с-л, и, следовательно, функционал (5.42) прини¬ мает значение с — h<Zc. Но это противоречит предположению, что среди всех траекторий, начинающихся на поверхности S0, опти¬ мальная траектория приводит к значению функционала (5.42), равному с. Значит, S0 и 2с П {хо = О} имеют общую касательную плоскость. По аналогии со случаем незакрепленного правого кон¬ ца выводим отсюда q условий трансверсальности в левом конце траектории: П;)=0 / = 1, 2, (5.78) где t]i, i]2, • •— линейно независимые векторы из 7\о(х*(/0)). Сформулируем принцип максимума в окончательной форме. Теорема. Если u*(t), — управление, переводящее систему (5.41) с начального многообразия S0 на конечное S1 и ми¬ нимизирующее значение функционала (5. 42) вдоль соответствую¬ щей траектории х*(/), то существует ненулевая непрерывная век¬ тор-функция ф(/), являющаяся решением уравнений (5.51), и та¬ кая, что для всех значений t, 1) max//(x*(/), ф(/),и) = Я(х*(/), ф(/), и*(/)); ие^ __ 2) Я(х*(/), ф(/), и*(/)) = 0; 3) фо(Т) = const 4) вектор (ф1 (Z), . . ., фп(0) в концевых точках t = tQ и / = на¬ правлен по нормали к концевым многообразиям S0 и S1 соответст¬ венно [см. условия трансверсальности (5.77), (5.78)]. В приведенном доказательстве теоремы не обосновано лишь утверждение 3. Но уравнение системы (5.51) для ф0(/) имеет, оче¬ видно, вид dA>o/dt = O, а так как вектор ф(/) направлен в сторону отрицательной оси х0, то его первая координата фо(О ^0, что и тре¬ бовалось доказать. Принцип максимума Понтрягина находит широкое применение при проектировании систем управления ЛА и следящих систем. Ни¬ же приводится несколько примеров, в которых оптимальное управ¬ ление и траектория отыскиваются в конечном виде. Синтез оптимальных управлений ЛА (примеры) Пример 1. Синтез алгоритма управления, обеспечивающего переориентацию КА за минимальное время. Для выполнения КА различных заданий часто воз¬ никает необходимость его переориентации, например, для осуществления сбора информации с заданного объекта, для наблюдения за избранным небесным све¬ тилом, для передачи и приема целенаправленной информации, для придания им¬ пульса тяги в заданном направлении и т. п. Таким образом, режим переориен¬ тации КА относится к числу важнейших. В ряде случаев важно выполнить ма¬ невр ориентации за минимальное время, например, при оказании помощи КА; 98
терпящему аварию. В таком случае маневр ориентации и перелета необходимо совершить за минимальное время, экономия горючего отходит на второй план. Рассмотрим задачу быстрейшей переориентации КА относительно одной из осей. Пусть уравнение, описывающее движение КА относительно центра масс, бу¬ дет У-О^Му + Мв, где J — момент инерции КА; Ф — угловая координата. Так как обычно управляющий момент на один — два порядка больше возмущающего (Му>Л1в), то моментом можно пренебречь. Управляющий момент можно представить в виде My = Jau, где | и| 1—управление; а — некоторая констан¬ та. Таким образом, уравнение движения КА относительно центра масс будет $=аи. Вводя новые переменные Xi = ft, х2 = ft, представим последнее уравнение в нормальной форме xi = х2; х2 = аи. (5.79) Поставим задачу о быстрейшем переводе точки (хь х2) (5.79) из исходного положения (Х1(/о), x2(Z0)) в начало координат (0, 0),.т. е. в положение, при ко¬ тором '0' = '0’ = 0. Функционал (5.42) при этом примет вид t 1 I = f \dv = tx — /0, (5.80) to откуда находим дополнительное уравнение для координаты х0 х0=1. (5-81) Система уравнений (5.79), (5.81) описывает движение КА в расширенном фа¬ зовом пространстве размерности п+1 =2+1=3. Записав выражение для гамильтониана (5. 68) 2 ■,Н = У, Ф</< (X, и) = Фо-1 + Ф1-*2 + фг<г“- (5- 82) <=о найдем вспомогательную систему уравнений (5.51) ф0 = — дН]дх$ = 0; фх = - дН]дх\ = 0; ф2 = — дН1дх2 = — фь (5. 83) Ее решение при начальных условиях [фо(^о), ф1(М, фг(^о)] Фо = Фо (*о); Ф1 — Ф1 (^о)» Фг = — Ф1 (*о) — ^о) + Ф2 (*о) (5- 84) подставим в гамильтониан (5. 82) н = Фо (<о) + Ф1 (4.) *2 + [Фг (*о) - Ф1 (<о) (* - 4))] «• (5- 85) В соответствии с принципом максимума оптимальное управление u*(t) на¬ ходится из условия максимума по и гамильтониану (5.85). Поскольку первые два слагаемых в (5.85) не зависят от и, to-w*(Q определяется из условия мак¬ симума третьего слагаемого в (5. 85) “*(O= sign^2(^o) -Ф1(<о)а-4)) = { + 1 при Фг(4))—Ф1(4))(^—4))>°: — 1 при ф2(^о)—Ф1(4))(*—4))<0, (5.86) т. е. оптимальное управление u*(t) соответствует работе двигателя на макси¬ мальной мощности. Так как функция ф2(^о)—Ф1 (М G—М является линейной, то за время переориентации КА знак управления изменится не более одного раза: с и= + 1 на и = — 1 или с и = — 1 на п= + 1. Интегрируя систему (5.79) при и= + 1, а затем при и=—1, соответственно получим х2 = at + С2\ xi = 0,5at2 + с2^ + х2 = — at +- d2; xi = — 0,5а/2 + + d\. (5. 87) (5.88) 4* 99
Исключая в интегралах (5.87) и (5.88) время t, запишем уравнения фазо¬ вых траекторий Xi — 0,5а~1х2 + с, Xi = — 0,5а-1х2 + d. (5. 89) Для управлений #= + 1 и и = — 1 (рис. 5.9) направление движения по параболам определяется вторым уравнением (5.79): при #= + 1 координата х2 возрастает, а при и =— 1 координата х2 убывает. В общем случае оптимальные траектории состоят из двух частей, представляющих собой отрезки парабол из разных семейств (5.89). Переход с одной параболы на другую отвечает пере¬ ключению управления с +1 на —1 или с —1 на +1. Выделим из семейства (5. 89) параболы, проходящие через начало координат: xj = 0,5#—ix^’ Х1 ~ —0,5а~ 1х|, (5.90) по которым осуществляется движение фазовой точки на заключительном участ¬ ке. Учитывая направление движения по фазовым траекториям (5.89), (5.90), от¬ бросим в (5.90) те половины парабол, движение по которым идет от начала координат (пунктирные кривые на рис. 5.9). Оставшиеся половины парабол МО и NO назовем попадающими траекториями. Их можно описать с помощью од¬ ного уравнения Xi = —0,5#—]Х2 \х%\ . (5.91) Если фазовая точка (хь х2) находится на кривой M0N (5.91), то далее оптимальное движение происходит без перемены знака управления, описывая участок кривой от точки (хь х2) до точки (0, 0). Если фазовая точка не лежит на кривой (5.91), то по необходимости оптимальная траектория состоит из двух участков со сменой знака управления. При этом для точек (хь х2), лежащих вы¬ ше кривой (5.91), А = Xi + 0,5#_1x2|x2| >0, оптимальное управление равно —1, а для точек, лежащих левее кривой (5.91), А = Xi + 0,5#_1x2|x2| <0, оптимальное управление равно + 1. Итак, оптимальный алгоритм управления имеет вид */ Ч f — 1 при А > 0; #* (хЬ Хъ) = < ( + 1 ири Д < 0; а исходную систему (5.79), замкнутую оптимальным алгоритмом управления, представим в виде Xi = x2, x2 = #u*(xi, х2). Пример 2. Задача сближения двух КА за минимальное время. Сближе¬ ние— один из этапов встречи двух КА на орбите. Начинается сближение с мо¬ мента обнаружения КА координатором или космонавтом и заканчивается, когда относительное расстояние и скорости КА настолько малы, что можно перейти к этапу причаливания и стыковки. Динамика КА на этапе сближения описывается сложной системой дифференциальных уравнений, решение которых возможно только на ЦВМ. Рассмотрим сближение двух КА в безгравитационном поле. Примем, что один из космических аппаратов пассивен, а другой — активен. Пусть относительное движение активного КА можно описать уравнением mz = T, где т — масса КА, а Т — тя¬ га двигателя. Будем считать, что мас¬ са КА постоянна, а тяга Т—таи, где а — константа; u = dm!dt. Запи¬ шем систему дифференциальных уравнений, определяющих относитель¬ ное движение активного КА, в нор¬ мальной форме Xi = x2; х2 = аи. Если учесть, что конечные значения коор¬ динат Xi и х2 должны быть равны нулю, то тем самым одномерная за¬ Рис. 5.9. Фазовые траектории «2 = +1 100
дача сближения двух КА за минимальное время сводится к задаче, рассматри¬ ваемой в примере 1. По изложенному там алгоритму КА за время Л—/0 = niin с одним переключением реверса тяги с w2= + l на —1 или с и2 = — 1 на +1 при¬ ближается к другому КА, имея в конечный момент нулевые значения относитель¬ ной дальности z и относительной скорости z\ x2(/i) =z(fi) =0; Xi (Л) = = 2Г(Л) =0. Пример 3. Задача сближения двух КА за минимальное время при отсутст¬ вии ограничений скорости. Предположим, что из условий предыдущего приме¬ ра исключено требование обращения в нуль относительной скорости активного КА, т. е. ставится задача1 о переводе фазовой точки (xi, х2) на координатную ось х2. Это — задача с подвижнььм концом, так что необходимо использовать условие трансверсальности (5.77). Конечное многообразие является в данном случае прямой, а касательный вектор к этой прямой имеет вид (0, т]2), т]2=#=0. Таким образом, (5.77) дает, что (Zi)0 + i|)2(^i)t]2 = 0, т. е. ф2(^1) =0. Посколь¬ ку [см. формулу (5.84)] ф2(7) =—Ф1(*о)(^—M+WW обращается в нуль только в одной точке и эта точка, как только что показано, есть th то ф2(/) сохраняет знак во все время движения вплоть до момента встречи, т. е. оптимальное по быстродействию управление КА осуществляется без реверса тяги при максималь¬ ной ее мощности. Пример 4. Синтез алгоритма управления движением ЛА на активном уча¬ стке, обеспечивающего максимальную дальность. Пренебрегая аэродинамически¬ ми силами, представим уравнения продольного движения центра масс ЛА в про¬ екции на оси Xgy Yg земной системы координат (см. рис. 1. 1) в виде mxg = Т cos ft; m.yg = Т sin ft— mg', — m = ц3, (5. 92) где m — масса ЛА; T=cu3\ c>0 — константа; T—сила тяги реактивного двига¬ теля, действующая вдоль продольной оси ЛА; О— угол тангажа. Поставим зада¬ чу об отыскании оптимального закона управления величиной тяги Т и направ¬ лением О’ тяги двигателя, обеспечивающего максимум горизонтальной дально¬ сти полета ЛА при заданном расходе топлива Ат и ограниченной величине тя¬ ги. Вводя новые переменные Xt = xg; х2 = уё\ x3 = xt; х4 = х2; х5 = т и обозна¬ чив Ui = cosil>; w2 = sinO, запишем систему уравнений (5.92) в нормальной форме лд = х3; х2 = х4; х3 сцц/3/х5; х4 = си2и3/х5 — g; х5 = — и3. (5. 93) Система уравнений (5.93) является нелинейной как относительно фазовых координат, так и управлений. Ограниченность тяги двигателя и топлива выра¬ зим неравенствами: 0 <и3 0<х“ — х*<Д/я. Вектор управления u=(ui, ц2, ц3) принимает значения из области U, представляющей собой цилиндр и\ + и\— = 1, 0<ц3<а™ах, радиуса 1 и высоты Представляется очевидным, что для ‘-обеспечения максимальной дальности полета необходимо израсходовать весь за¬ пас топлива Ат. Задаваясь высотой х2(^) в конечной точке полета, найдем урав¬ нения конечного многообразия: *2 = *2 (*1); -*-5 = *5 (*1) = *5 (*о) — Ат. (5. 94) Таким образом, требуется найти допустимое управление u*(Z)e£/, переводя¬ щее ЛА из начального состояния х(/0) в конечное многообразие и придающее функционалу I = —j x3(t)dt (5.95) to минимальное значение. На значения координат хь х3, х4 в конечной точке ни¬ каких ограничений не накладывается. В принципе каждая из них в конце полета может принимать любое значение. В соответствии с методологией принципа максимума введем вспомогатель¬ ную координату xQ [см формулу (5.43)] х0= — х3, (5. 96) 101 4* 1996
составим гамильтониан [см.формулу (5.68)] Н (ф, X, и) = а3 (Фз«1 + Ф4“г) — Фб— Фо-*з + физ + Фг*4 — Ф4£ (5. 97) и запишем вспомогательную систему уравнений [см. уравнения (5.51)] Фо = 0; Ф1 = 0; ф2 = 0; фз = Фо — Ф1! Ф4 = — фг; Фб = с (ф3И1 + Ф4“2) “3*Г2. (5.98) Интегрируя первые пять уравнений системы (5.98) и выражая произволь¬ ные постоянные интегрирования через значение вектора ф в конечной точке, по¬ лучим Фо (0 = Фо (G); Ф1 (О = Ф1 (^i); Ф2 (О = Ф2 (^1); Фз V) = - (фо (*i) - Ф1 (^1)) (*i - О + Фз (^1); ф4 (*1) = (5. 99) = Ф2(*1)(71 — О + ф4(*1). Запишем условие трансверсальности (5.77) в конечной точке траектории. Касательный вектор к конечному многообразию (5.94) представим в виде vj = (Ль 9» Лз, Ль 0), гДе Ль Лз, Л4 — произвольные действительные числа. Дей¬ ствительно, уравнение (5.94) задает трехмерную плоскость в пространстве (хь х2, х3, х^, х5), которая проходит через точку x2(^i) на оси х2 и точку х5(^) на оси х5 и параллельна осям хь х3, х4. Учитывая, что в рассматриваемом случае каса¬ тельная плоскость к многообразию в любой его точке совпадает с самим много¬ образием, получаем требуемое утверждение. Таким образом, условие трансвер¬ сальности (5. 77) дает < Ф (*1), 1 > = Ф1 (*1) 11 + Фз (*1) 13 + Ф4 (А) 14 ~ 0, (5.100) откуда, используя произвольность значений Ль Лз, Ль находим Ф1(<1) = Фз(6) = Ф4(<1) = 0; (5.101) соотношения (5.99) с учетом (5. 101) примут вид Фо (О = Фо (*i); Ф1 (О = 0; ф2 (О - ф2 (<1); Фз (О = - Фо (<i) (*i - О; ф4 (О = Ф2(^1) (*1-г)- (5.102) Выделим в гамильтониане (5.97), члены, зависящие от управления и: Л = и3[с(фз«1 + Ф4“2)^Г1— Фб1- (5.103) Максимум гамильтониана (5.97) и выражения (5. 103) достигается при одних и тех же значениях управления и. Найдем значения и, придающие максимум выра¬ жению (5. 103). Очевидно, если max [с (фз^1 + ф4^2)-г5~1— Фз] >0 и *4— зна" И1, «2 * шах чения, при которых максимум достигается, то эти значения вместе с и3 = дают максимум выражения (5. 103). Если же оказывается, что max [с (фз^1 + + Ф^)-*^1— Фб] < 9, то максимум выражения (5. 103) достигается при = 0 и равен нулю. В этом случае тяга двигателя равна нулю и вопрос об определе¬ нии направления вектора тяги, т. е. значений щ, и2, отпадает. Таким образом, задача определения оптимальных управлений и4*(/), u2*(t), u3*(t) сводится к задаче исследования знака величины а (1) = max [с (ф3 (t) + ф4 (/) а2) хг1 (1) — ф5 (/)] (5.104) «1,«2 вдоль оптимальной траектории х* (/). Выражение фз (О ^1 + Ф4 (О ^2 можно пред¬ ставить как скалярное произведение векторов (фз (О, Ф4(^)) и (rzj, Вектор (zzi, U2) имеет единичную длину = 1.и произвольное направление. Чтобы придать максимум скалярному произведению < (фз (/), ф4(^)), (^ь ^2) > , необходи¬ 102
мо выбрать вектор (и у zz2) коллинеарным вектору (фз (О, Ф4 (О): «I = фз (О(Ф1 (0 + Ф1 (О)-0,5; «2 (0 = Ф< (О (Ф1 (О + 4-4 (О)-0,5- Используя соотношения (5.102), преобразуем последние две формулы к виду (0 = - Фо (О) (Фо (о) + Ф1 (О)г°’5; «2 (о = ф2 (о) (Ф1 (О) + ф22 (о)г°15- (5.105) Подставляя (5. 105) в (5. 104), получим а (О = С (Ф1 (О) + Ф2 (ч))+0,5 (О (О — 0 — Фб (О> (5-106) т. е. направление вектора тяги постоянно. Для исследования знака а(0, найдем его производную по t: «(О= — с(Фо(0) + Ф2(0))°’5-*Г1(0 — с(Фо(0) + + Ф22(О))°’5хГ2(О^5(О(О-О-Ф5(О- (5-107) Преобразуем последнее слагаемое—ф5 в (5.107), последовательно используя пя¬ тое уравнение системы (5. 98) и последнее уравнение системы (5. 93): — ф5 = — — с (фз^1 + ^4^2) ^з-^i”2 = с (Фз^1 4- ^4^2) ' Далее, с помощью соотношений (5. 102), (5. 105), получим — ф5 = с — t) (фд(/1) 4- ф2 (^1))°?5 xs"2x5- Таким образом, последние два слагаемых в (5. 107) взаимно уничтожаются и в результате полу¬ чаем а (О = - с (ф? (6) + ф22 (Н))0’5 *з1 (О- (5. Ю8) Ввиду неотрицательности всех функций, входящих в (5. 108), будем иметь а(/)^ ^0. Покажем, что для оптимальной траектории а(/)<0 при Для это¬ го достаточно показать, что предположение а(^)=0 приведет к противоречию. Итак, пусть а(/)=0, тогда из (5.108) имеем фо(6) =^2(^1) =0, следовательно, из (5. 101), (5. 102), найдем фДО = 0; /=0, 1, 2, 3, 4. Подставляя эти значения фД/) в гамильтониан (5.97), получим = —фб(/)). Поскольку не¬ обходимое условие оптимальности включает требование H(t) = 0, и учиты¬ вая, что и3*(/)^0, выводим, что ф5(0 обращается в нуль во все те моменты, когда тяга отличается от нуля. Взяв любой момент t' (где /'=#0), имеем фД/')=0 ПРИ / = 0, 1, 2, 3, 4, 5, но это противоречит основной теореме принци¬ па максимума, что ф (/) — ненулевая непрерывная функция. Итак, доказано, что функция а(0 монотонно убывает на отрезке |40, /J. Если допустить, что а(^о)=О, то отсюда будет вытекать, что а(/)<0 при всех значениях в силу а(г)-<0. Но это означало бы, что ц3*(/)=0 при всех значениях что невозможно. Таким образом, a(Zo)>O. Используя монотонное убывание функции а(/), приходим к выводу, что либо а(Д>0 при всех значениях либо а(/)>0 при tQ t& и a(Z)<0 при где момент ta находится из условия полного сгорания горючего ta—10--= = Am/ufax. В первом случае весь полет происходит при включенном на полную мощность двигателе. В последнем случае траектория рабивается на два участ¬ ка: активный, на котором двигатель работает на полную мощность вплоть до сгорания всего горючего, и пассивный — с неработающим двигателем. Направление тяги двигателя на активном участке постоянно и выражается формулами (5. 105), в которых фоД1), фг(Л) еще подлежат определению. В пред¬ положении, что полет состоит из двух участков, опишем методику нахождения оптимального направления тяги. Выпишем значение гамильтониана в конечной точке, используя соотношения (5. 101) и u3(/i)=0: н (ф* №), х* (^), и* (^)) = - Фо (*1) хз (^1) + ф2 (*1) х4 №) = 0. (5. 109) Заметим, что % (Л) =^=0, ибо в противном случае в силу ф0(t) = const придем к заключению, что фо(О = 0. Это приводит в силу формул (5. 105) к явно не оп¬ Я» Я* 103
тимальному управлению Ui*(/) = 0, означающему, что тяга вертикальна. В пред¬ положении, что фо(М=И=О, уравнение (5. 109) с учетом (5. 105) дает *з(6) Ы*1) “2<zi) . х *з(/1) (5. 110) При заданном Ф, интегрируя уравнения движения (5.93), нетрудно получить значения х3(/1) =ф(^) и х4(^)=£(ф) в функции Ф. Оптимальное значение удовлетворяет уравнению (5. ПО): $* = arctg[—Ф ($*)/£ (^*)1- Это уравнение луч¬ ше всего решать методом последовательного приближения. В нулевом прибли¬ жении можно положить 0 = 45°. 5.3. СВЯЗЬ ПРИНЦИПА МАКСИМУМА С МЕТОДОМ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ ВЕЛЛМАНА Вывод основного функционального уравнения Веллмана. Рассмот¬ рим задачу о переводе системы (5.41) из произвольного началь¬ ного состояния на некоторое конечное многообразие Si, так что функционал (5.42) принимает минимальное значение. Введем функцию IF(x) —оптимальное значение функционала (5.42) для начального состояния х: Ц7(х) = J /0(х*(/), и*(/))Л, х*(/0) = х. t о Покажем сначала, что функция IF(x) в предположении дважды непрерывной дифференцируемости удовлетворяет основному функ¬ циональному уравнению Веллмана O = minl/o(x, u)+ У д^(х) /г(х, и)|. (5. 111) »еи dxi V i =■-1 ) Действительно, пусть траектория выходит из точки х и в течение малого промежутка времени At управление и(/) выбрано посто¬ янным и равным произвольному u^t7. За время At траектория сместится на вектор Ax=f(x, u)A/ + 0(AQ. Предположим, что из положения х+Дх система движется оптимально. Тогда при описан¬ ном суммарном перемещении функционал (5.42) примет следую¬ щее значение: /0+ J /0(х(/), u)dt-\-W (х-]-Дх) = /0(х, и)Д/+1Г (х) + +£^u,+o(i/, Z«1 Поскольку W (х) имеет минимальное значение функционала (5. 42) для траектории, выходящей из точки х, то п W (х) < f о (х, и) д/ + W (X) + у dWd^;- + 0 (д/)
Поделив последнее неравенство на AZ и переходя к пределу при я Д/—>0, получим /о (х, ц)-]- ■ dWd^~ fl (х’ и)>°> где учтена Z =» 1 dx' —l- = fi (х, и). Если же и переход на начальном участке за время dt St осуществляется с оптимальным управлением и*(/), то проводя аналогичные рассуждения, получим равенство /0(х, и*)-|- п + Л(х, u*)=0, u*=u*(0). Объединяя последние два dxt i = 1 соотношения, придем к функциональному уравнению Веллмана (5.111). Вывод из уравнения Веллмана принципа максимума Понтря¬ гина. Перейдем от функции №(х) к функции (о(х): со(х)=—W(х). Умножая выражение, стоящее в фигурных скобках уравнения (5. 111) на —1, с учетом ю (х) = — W(x), получим -/о(х, u)+и) dxi Из сопоставления (5. 112) с уравнением (5. 111) вытекает, что выражение в скобках в (5.112) достигает максимума, равного ну¬ лю, в точках оптимальной траектории x*(t) и оптимального управ¬ ления u* (7). Но тогда частные производные от последнего выра¬ жения по Xj должны обращаться в нуль: [ d/o(x, и) dxj Hxjol =0> дх} x=x*(o -»u=u*(/) или +s Z = 1 дх[ последнего соотношения использовано уравнение* Вводя обозначение Фу(/)=?ш(х-^; /=1, ..п; dxj При написании dx/dt=t(x, u). %(/)=— 1 и производя тождественные преобразования, приведем: последнее уравнение к виду z = 0 d^j(t) dt ., П, dxj 105
т. е. получили вспомогательную систему (5.51) для определения вектора ф(/)- Уравнение Веллмана (5.112) для оптимального уп¬ равления и траектории (и*(/), х*(0) будет п -/0(х*, u*)=0, Ь=1 1 п или шах//(х, ф(/), u) = maxV /z(x*, u)<pz(/)=O, т. е. приходим к основному результату теоремы Понтрягина. Требования дважды дифференцируемой функции IF(x) обычно не выполняются, и потому принцип максимума остается более уни¬ версальным средством решения детерминированных оптимальных задач.
Глава 6 СИНТЕЗ ЛИНЕЙНЫХ СИСТЕМ В СТОХАСТИЧЕСКОЙ ПОСТАНОВКЕ 6.1. ОСНОВНЫЕ РЕЗУЛЬТАТЫ ПО ОПТИМАЛЬНОМУ ВОССТАНОВЛЕНИЮ И УПРАВЛЕНИЮ Автопилот работает в условиях, когда, наряду с полезными воздей¬ ствиями, имеются помехи. Помехи случайного характера имеет смысл разделить с рассматриваемой здесь точки зрения на два класса: 1) случайные сигналы, от которых либо в принципе нельзя избавиться, либо сделать это технически сложно; 2) случайные сигналы, влияние которых можно ослабить специальными фильт¬ рами. Примером сигналов первого класса могут служить случай¬ ные неоднородности и турбулентность атмосферы. Ко второму классу можно отнести шумы измерительных устройств и усилите¬ лей, шумы на входе информационных систем и т. п. Сигналы первого класса, воздействуя на ЛА, участвуют в фор¬ мировании состояния системы. На основе измерения состояния си¬ стемы бортовая аппаратура формирует команду управления так, что эти сигналы воспринимаются автопилотом как «полезные». Сигналы второго класса путем фильтрации могут быть существен¬ но юслаблены, но полностью избавиться от них не удается. Даже после фильтрации шумы остаются достаточно мощными, и прихо¬ дится отрабатывать шумы, поступающие на исполнительное уст¬ ройство автопилота. Обычно полезные сигналы являются низкочастотными, а шу¬ мы — высокочастотными или всечастотными. Фильтром низких ча¬ стот удается существенно ослабить шумы, циркулирующие в кон¬ туре автопилота. Выбор структуры и параметров фильтра опреде¬ ляется условием задачи и зачастую выбирается эмпирически. Тео¬ ретические; основы выбора оптимального фильтра для условий, когда и полезный сигнал s(/) и помеха п(/) представляют собой стационарные процессы, а время t дискретно, были изложены в работах А. Н. Колмогорова. Н. Винер распространил эти резуль¬ таты на случай с непрерывным временем. Изложение этих вопросов можно найти в любом учебнике по статистической динамике. Рас¬ смотрим важный для практики случай, когда оба процесса s(t) и имеют дробно-рациональный спектр (такие процессы образу¬ ются на выходе стационарной линейной системы, когда на ее вход Поступает стационарный белый шум). В этом случае устройство, реализующее оптимальную фильтрацию, математически описыва¬ ется системой линейных дифференциальных уравнений, на вход его 107
подается суммарный сигнал s(/) +п(/), а на выходе получают от¬ фильтрованный сигнал s(/). Коэффициенты линейного оптимального фильтра находятся из решения некоторой линейной системы алгеб¬ раических уравнений, которые, в свою очередь, строятся исходя из спектральных функций сигналов s(/) и п(/). Оптимальность оценки заключается в том, что функционал I = E(s(t)—s(/))2 = min при¬ нимает минимальное значение в классе всех линейных устройств, оценивающих сигнал s(Z) по значениям сигнала s(t)+ii(t) при Обобщение последнего результата для нестационарных про¬ цессов было сделано в работах Калмана и Бьюси как для дискрет¬ ного, так и для непрерывного времени. Фильтр Калмана как оптимальное наблюдающее устройство в нестационарной системе. Уравнения линейной нестационарной си¬ стемы и измерителя имеют следующий вид: x = A(/)x + B(/)u-HW; у = Е(/)х + п(/). (6. 1) В соответствии с уравнениями (6. 1) в формировании состояния х системы помимо управляющего воздействия u=u(Z) участвует случайный входной сигнал |(/), а измеритель подвержен влиянию шума т)(0- Примем, что £(/), т](^) —не коррелированные между собой центрированные векторные случайные процессы типа бело¬ го шума интенсивностей Ri(/) и R2(/): tT (5i (/),..., in W); T W=(П1 (/),-••, nmW); Е& (0 = (££1 (*)» • • • > £in W)=0; £4' (/) = (fiii £r|m (/))=0; /Mi ж («)... Mi (/)in(s)\ (6.2) \£^)5i(s)..-£5„(/)Us)/ £■ [n W T (s)] = 8 (^ - s) R2 W; E (/) rf ($)] = О, где 6(/ — s) —дельта-функция; Ri(0, R2G) —неотрицательно оп¬ ределенные матрицы размерности и mXm соответственно; Е — символ математического ожидания, означающий применение операции математического ожидания к каждому элементу матриц l’^WtT(«)L hWnr(s)], liWnr(5)J- Замечание. Процессы типа белого шума характеризуются свойством, что их значения от точки к точке не коррелированы. Та¬ кие процессы физически нереализуемы, так как должны были бьг заключать в себе бесконечно большую энергию. Они не являются обычными случайными процессами и с точки зрения математики, хотя вопрос о реакции линейной системы на входной сигнал типа белого шума имеет реальный физический смысл. Смысл принятых обозначений §(/), будет разъяснен ниже. Реакция x(Z) системы на входные воздействия, содержащие случайные составляющие, будет представлять случайный процесс. Задача восстановления текущего состояния x(f) по результатам 108
измерений y(s), t0^Zs^:t, в присутствии шумов tj(/) называется задачей фильтрации. Для решения этой задачи естественно приме¬ нить нестационарное наблюдающее устройство в виде, аналогич¬ ном рассматриваемому в гл. 4: х = А (/) х + В (/) и + К (/) [у - Е (/) х]. (6. 3} В детерминированной постановке выбор коэффициента К допу¬ скает значительный произвол. В стохастической задаче восстанов¬ ления коэффициент К оптимизируют. Поставим задачу такого вы¬ бора коэффициента К (0, который обеспечивает несмещенность оценки х(/) и минимум средней квадратичной ошибки: Ех^) = Ех^ = f=l, 2,...,п. (6.4} Теорема. Рассмотрим задачу построения оптимального наблю¬ дающего устройства (6.3) для системы (6.1), обеспечивающего несмещенность оценки и минимум средней квадратичной ошибки (6.4). Положим, что начальное состояние х(/0) системы (6. 1) — случайный вектор с математическим ожиданием т°=Е[х(/0)] и ковариационной матрицей R0=E[(х(/0) —т°)(х(/0) —т°)т] и со¬ стояние х(/0) не коррелировано с процессами |(/), т](/). Допустим, что процессы |(/), т](/) не коррелированы и что матрица интенсив¬ ностей шума Ra(Ъ измерителя не вырождена при каждом значении t^tQ. Тогда решение задачи получается путем выбора матрично¬ го коэффициента усиления K(/) = P(/)Er(/)R2-1(/), t>t0, (6.5) где Р(/) удовлетворяет матричному дифференциальному уравнению Риккати, которое можно записать в следующем виде: Р = А (/) Р + РАТ (/) + Rj (/) - РЕГ (/) R2_1 (/) Е (/) Р (6.6) с начальным условием P(/o)=R0. Оценка x(Z), удовлетворя¬ ет уравнению (6.3) при начальном условии x(/0)=ni0. При этом матрица ковариации вектора ошибки х(/)=х(/)—х(/) рав¬ на Р(0- Рассмотренную задачу можно считать задачей оптимальной фильтрации при известной структуре фильтра. Действительно, фильтрующее устройство было заранее выбрано в виде модели си¬ стемы с обратной связью по ошибке восстановления (6.3), а уже затем решалась задача об оптимальном выборе матричного коэф¬ фициента усиления К (0- Более общая постановка задачи возника¬ ет, если не считать структуру фильтра заранее заданной, а огра¬ ничиться лишь требованием, что оценка х(/) является линейной функцией наблюдения y(s), В этой постановке приходим к тому же решению. Именно оптимальный фильтр имеет структу¬ ру (6.3), а коэффициент К(0 определен формулой (6.5). Точная по¬ становка этой задачи выглядит более наглядно для дискретных процессов. 109
Иллюстративный пример. Рассмотрим скалярное уравнение xi = 0 и положим, что начальное состояние Xi(0) есть случайная величина со средним значением mi0 и дисперсией Dxi(O) = /?0. Это означает, что /?1 = 0, т. е. фазовое состояние формируется лишь за счет случайного начального положения, а во все остальное время остается неизменным. Пусть f/1 = x1 + r]i, где r|i — стационарный белый шухМ с дисперсией Фильтр Калмана в данном случае приобретает вид Xi = K(t)[yi — xj, xi(0) =miQ. Скалярный коэффициент усиления К (О=Р (О а уравнение Риккати для P(t) принимает вид Р (t) ~ — Р% (t) R^1, Р (0) = R$. Это уравнение легко можно решить и в результате получим P(t) = RoR2 (Rz + 4-/?оО-1, так что K(t) =R0(R2-{-RQt)-i. Таким образом, при t—>Н-оо коэффици¬ ент K(t) _>0 и дисперсия ошибки P(t) стремятся к нулю, т. е. в пределе оценка Xi(t) сколь угодно точно приближает значение состояния. Xi(/)=Xi(0). И для системы (6. 1) общего вида, когда случайный характер текущего состоя¬ ния х(/) определяется только разбросом начальных данных, а £(/)=0, роль фильтра Калмана сводится к восстановлению начального состояния. Учитывая, что замкнутые системы обычно асимптотически устойчивы, т. е. роль начального со¬ стояния в формировании вектора состояния x(t) через некоторое время практиче¬ ски исчезает, делаем вывод, что применять в данном случае фильтр Калмана не имеет смысла. Дискретный фильтр Калмана как устройство, выдающее наи¬ лучшую линейную несмещенную оценку состояния. Рассмотрим ди¬ скретный аналог системы (6. 1) X(/+l)=a(/)X(/)+₽WuW+g(/); y(/+l)-e(/)x(/) + iiW, (6.7) где полагаем время t изменяющимся дискретно: t= ..., —1, 0, 1, 2, . . . Системы типа (6.7) называют разностными. Они появляются, в частности, когда управление полетом ЛА осуществляется БЦВМ, так что текущее состояние системы х(/) выступает лишь в моменты времени вида t=Kh, где К — целое число. Выбор в (6.7) шага h=l имеет чисто условное значение: этого всегда можно добиться изменением масштаба времени. Полагаем в (6.7), что a(Z), ₽(/), e(t)—матричные функции соответствующих размерностей, §(/), т](/)—некоррелированные векторные дискретные процессы типа белого шума интенсивностей Ri (t), R2■(/) соответственно: Wl=o; Е [n(/)] = o; Е (/)Г W]=Ri(/); Е [n W nr (01=R2 (/); E [I (/) if (s)] =o; (6. 8) £[£№(«)]=<>; E [n (/) r|T (s)] =o при t£s. Обозначим YzT=(yT(/0), yT(^o+1), • •ут(^)) — вектор, составлен¬ ный из векторов наблюдений вплоть до момента t. Поставим зада¬ чу построения такой оценки х(/), каждая координата которой хг-(/), г=1,..., и, является линейной функцией от координат вектора NtT и при этом выполняются условия несмещенности и минимальности средней квадратичной ошибки (6. 4). Теорема. Предположим, что процессы ^(/), т](/) не корре- лированы между собой и с х(/0) и что ковариационная матрица шума измерителя R2(/) не вырождена при всех значениях Тогда оценка х(£), обладающая минимальной средней квадратич¬ ной ошибкой в классе линейных несмещенных оценок текущего со- 110
•стояния x(t) по результатам предшествующих измерений Nt, удов¬ летворяет следующей разностной системе: 2 (/ + 1)=а (/) J (/) + ₽ (/) и (/) 4_ К (/) (у (/ Ч- 1) — е (f) £ (/)) (6.9) с начальным условием х(/0) = m0=E[x(t0)]) где К(0 определяется из следующих рекуррентных соотношений: K(/)=a(f)P(/)e‘'(/)[e(/)P(/)e‘^)+R2W]“1; (б 10) Р (/+ 1 ) = [а (/)- К W г (/)] Р (/)«■■(/) + Ri (/) при начальном условии P(/0)=R0= £[(х(4) —т°)(х(/0) —т°)т]. При этом Р(£) является матрицей ковариаций вектора ошибок: Р (/) = Е [X (/) Хт (/)], X (/) = X (/) — X (/): Фильтр Калмана как оптимальное наблюдающее устройство в стационарной системе. Предположим, что матрицы А, В и Е в (6. 1) не зависят от Л а §(/), т](/) —стационарны, т. е. RihR2 не зависят от t. Предположим также, что интервал наблюдения бесконечен в левую сторону (/0=—°°)« В этом случае можно ожидать, что оп¬ тимальный матричный коэффициент усиления К(7) в фильтре (6.3) также постоянен. Для упрощения записи положим далее, что и = = о, т. е. состояние системы x(t) формируется только под влияни¬ ем шума ^(t). В свою очередь, шум ^(t) представим как j(7) = = Cw(7), где w(t)— векторный белый шум единичной интенсивно¬ сти; E[w(t)wT(t)] = l— единичная матрица; С — некоторая матри¬ ца. Возможность такого представления вытекает из сформулиро¬ ванного ранее результата (см. гл. 5), что всякую неотрицательно определенную матрицу Ri можно представить в форме Ri = CCT. Действительно, если матрица С определена последней формулой, то Е[§«)|т(7)] = Е[Cw(0 (Cw(0)T] =E[Cw(0wT(0CT]=CEi[w(0 X X wT(7)]CT = CCT = Ri. С учетом этого рассмотрим систему x = Ax-^Cw, у = ЕхЦ-т] (6. 11) и поставим задачу оптимальной фильтрации по наблюдению всего бесконечного прошлого. Теорема. Пусть процессы |(/) =Cw(Z) ит|(/) некоррелирова- ны и ковариационная матрица R2 шума x\(t) невырождена. Обозна¬ чим x(t) линейную оценку состояния x(t) системы (6.11) по ре¬ зультатам измерения y(s), s^t, являющуюся несмещенной и опти¬ мальной в смысле среднего квадратичного отклонения [см. форму¬ лу (6.4)]. Предположим, что система х = Ах j-Cv, у = Ех (6.12) полностью управляема (по v) и полностью наблюдаема. Тогда (1) х(/) удовлетворяет уравнению х = Ах + К(у —Ех), (6. 13) 111
Рис. 6.1. Структурная схема объекта /, безынер¬ ционного измерителя 2 и фильтра Калмана— Бьюси 3 где K = PEtR2 , р — единст¬ венное положительно опре¬ деленное решение матрич¬ ного алгебраического урав¬ нения Риккати • ^ap_lPAt + Ri_ _ РЕ КГ ЕР = О, (6.14) (которое получается из соот¬ ношения (6.6), если поло¬ жить Р = О); (2) наблюда¬ ющее устройство (6. 13) асимптотически устойчиво: характеристические числа матрицы А — КЕ имеют от¬ рицательные действитель¬ ные части. Аналогичный ре¬ зультат справедлив также и для стационарной системы (6. 7) с дискретным време¬ нем.. Иллюстративный пример. Пусть xi = Wj, = Уравнение фильтра (6.13) в данном случае принимает вид xi = k — хр. Для определе¬ ния k решим уравнение —P^R^X = О, откуда Р — так чт0 — = = ^i°’5^2~°’5- Таким образом, передаточная функция оптимального фильтра равна 7?J’5/?^"0,5 (р 4- /?J’5/?^"0,5)—1. Фильтр Калмана в замкнутой системе. Допустим, что сигнал управления u(t) в системе (6.1) формируется по оценке состояния x(t) в виде и(7)=—L(t)x(t). В этом случае уравнение оптималь¬ ного фильтра (рис. 6.1) имеет форму (6.3) с заменой и на —L(/)x, т. е. х = А (/) х — В (/) L (/) х К (/) [у — Е (/) х], где коэффициент K(t) определяется соотношениями (6.5), (6.6). Допустим, что оценка х используется для замыкания стационар¬ ной системы х = Ax+Bu+Cw в виде и = —Lx, где L — постоянная матрица. Учитывая, что фильтр Калмана х=(А—BL)x+KE(x—х) представляет собой частный случай наблюдающего устройства и применяя результаты разд. 4.5, можно утверждать следующее: ес¬ ли соблюдены условия предыдущей теоремы, а матрица L выбра¬ на так, что система х=(А—BLJx асимптотически устойчива, то фильтр Калмана (для замкнутой системы) также асимптотически устойчив. Пример. Уравнение привода управляющих поверхностей с учетом шумов можно записать в виде следующей системы (см. разд. 5. 1): * = [о —а] Х /2)Х +[ V У1 = (1,0)х+^1’ 112
где Wi — скалярный белый шум единичной интенсивности; — скалярный бе¬ лый шум с дисперсией R2- Уравнение Риккати (6. 6) примет вид или, с учетом Pi2 = P2i, в развернутом виде получим Р11 = 2^12 — Р12 = Р22 — арп — РиРи^г1; Р22 = —2сСР22 + Y2 — Р12#2 1 • Легко проверить, что система х = [о-«] х + [° ]v; ?/ = (1’0)х полностью управляема и полностью наблюдаема, а следовательно, решение P(Z) системы дифференциальных уравнений сходится при t—^ + 00 к решению систе¬ мы алгебраических уравнений 2р 12 — 1 = Р22 — UPl2 — РиР12^2 1 = °; —2а/?22 + V2 — Р212%21 = °- Коэффициент К можно найти по формуле Решая уравнение (6. 15), найдем рп, Pi2=P2i, Р22, а затем получим К1 = (*1, *2) = (-а + ■|/cc2+ 2Y^2-0’5. а2 + тЯ2-°’5 - а ]/ а2 + 2у^05) ■ Фильтр Калмана в задаче аналитического конструирования ре¬ гуляторов при случайном входном воздействии. В гл. 4 рассмат¬ ривалась задача оптимального управления системой х = А(7)х-|- -f-B(7)u при помощи закона управления u = —L(/)x. (6. 16) Оптимальное управление формально обеспечивает лишь то, что для однородной замкнутой системы x(t) = (A(t)—B(t)L(t))x(t), под¬ вергнутой начальным возмущениям в виде 6-функции (что эквива¬ лентно некоторому начальному ненулевому состоянию системы), процесс стабилизации протекает оптимально с точки зрения интег¬ рального квадратичного критерия качества (5.3). Так как в реаль¬ ной обстановке возмущения, как правило, действуют непрерывно, то фактическое значение закона управления (6.16) выясняется лишь лри учете влияния непрерывно действующих внешних воздействий. В связи с этим рассмотрим систему x = A(/)x + B(/)u-hi(/), (6.17) на которую воздействует случайное возмущение |(/) типа белого шума с интенсивностью Ri(7). Поставим задачу построения про¬ граммного управления u = u(7J, обеспечивающего минимум матема¬ 113
тического ожидания интегрального квадратичного критерия каче¬ ства: где Qo, Qi(O — неотрицательно определенные матрицы; Q260— положительно определенная матрица. Для этого случая оптималь¬ ное управление достигается введением такой же обратной связи,, что и в задаче детерминированного управления: u(/) = -L(/)x(/); L(/)=Q2-iBt(/)S(/), (6. 19) где S(/) —соответствующее решение уравнения (5.5). Интенсив¬ ность входного воздействия £60 не входит в формирование закона управления (6.19), а влияние входного сигнала на величину управ¬ ления u = uf£) проявляется только через посредство состояния x(t) системы (6.17). Хотя задача управления ставится как програм¬ мная, ее решение приводит к позиционному закону управления. Закон управления (6.19) фактически предполагает, что может быть измерен точно полный вектор состояния системы x(t), т. е. решается задача оптимального управления при полной информа¬ ции о состоянии системы. Обычно измеритель выдает лишь неко¬ торые фазовые координаты или их линейные комбинации при на-, личин шумов. Поэтому примем уравнение измерителя в следующем виде: у = Е(/)х-|-т|(/), (6.20) где т\(1)— процесс типа белого шума с невырожденной интенсив¬ ностью R260- Поставим задачу позиционного оптимального управления си¬ стемой (6.17) с критерием (6.18) и с законом, управления, форми¬ руемым по информации, содержащейся в выходном сигнале изме¬ рителя. В этом случае оптимальный закон управления имеет вид обратной связи (6.19) при использовании наилучшей линейной не¬ смещенной оценки xf/) вместо значения вектора состояния х(1) u = —L(/)x(/), L(/)=Q2-1(/)Bt(Z)S(/). (6.21) Оценка получается на выходе фильтра Калмана х = А (/) х — В (/) L (/) х + К (/) [у — Е (/) х], (6. 22) где КбО определяется из соотношений (6.5), (6.6). Таким образом, задача управления разбивается на две независимые задачи: 1) оп¬ тимальную фильтрацию — восстановление состояния системы x(t) и 2) оптимальное управление по оценке x(t), которая является как бы истинным значением фазового состояния x(t). Это называется теоремой разделения. 114
6.2. ПОСТРОЕНИЕ ДИСКРЕТНОГО ФИЛЬТРА КАЛМАНА Наилучшая линейная несмещенная оценка. Первый шаг на пути вывода уравнения дискретного фильтра (6.9)—это получение формулы, выражающей наилучшую линейную несмещенную оцен¬ ку x(t) состояния системы x(t) через координаты вектора YZT = = (УТ(М> ут(/о+1), • • •> yT(t))=(yl(t0), ym(to), У1(А)+1), .... У?п(^о+1), . • //1(0, • • •, Ут(О)- Для краткости записи введем сле¬ дующие обозначения: xT(t)=xT= (хь ..., Хп)\ хт(*()=хт= (хь ..., xn), YzT = yT= (r/i,.. ., г/р), р= (t — tQ+ l)m. Выведем вначале фор¬ мулу для оценки Xi координаты ац. Согласно постановке задачи оценка должна представлять собой линейную функцию коорди¬ нат //1,..., ур вектора у: Хх = С\у.\-[-.. .-\-Срур-\-Ь\; а коэффициенты Ci,..., Ср, Ь{ должны быть выбраны из условия несмещенности и минимума средней квадратичной ошибки (6.4). Положив = (ci,..., Ср), запишем эти условия в виде £* [стУ+ &i] = £’x1; Е [cTy-]-&i — Л!]2 = тт. (6.23) Из первого условия (6.23) находим Ь\ = Ех^—сТЕу. Исключая Ь\ из второго условия (6.23), получим Е [стУ+(^1 — ст£у) — х$=Е [сг (у — Еу) — (Xi — Ех^}2 = min. (6. 24) Для нахождения значений сг-, i= 1,..р, минимизирующих выра¬ жение (6.24), продифференцируем его по cit z=l, ..., р, и прирав¬ няем нулю производные =2Е / р \ (2Ck (yk ~ Eyk} ~ _ Ех^) ~ Еу^ = 2 2 скЕ{Ук-ЕУк}{У1-ЕУ1'}]-‘2Е[<х1-Ех^(у1-Еу1)\=0, £=1 /=1,..., р. (6. 25) Введем обозначение R^ = E[(y—Еу)(у—Ey)T]=cov (у, у) для мат¬ рицы ковариаций вектора у и RX1^ = E [(%i — Ехг} (у — Ey)'r] = = cov(%i, у) для вектора взаимных ковариаций xi и у. Тогда систе¬ му р скалярных уравнений (6.25) можно записать в матричной форме cTRw-R.^=o, ИЛИ 115
при условии, что матрица Ryy невырождена. Используя найденное выше выражение для Ъ\, получим следующую формулу наилучшей несмещенной оценки координаты %ц: xi = с1У + = с 1У + Exi — с гЕу=ст (у - Еу) + Ехх = = ^уКу{у~ЕУ) + Ехх. (6.26) Аналогичные выражения получаются для оценок х2,..хп. Состав¬ ляя из вектор-строк R^,..., Rxny матрицу Rxy = = Е[(х—Ex) (у—Ey)T] = cov (х, у) взаимных ковариаций векторов хи у, запишем исходя из (6.26) формулу для оценки х *=RxA^ (У~^У) + ^х. (6. 27) Обозначение х для оценки не всегда удобно, так как в нем явно не отражена зависимость оценки от у. Поэтому наряду с обозначе¬ нием х будем употреблять обозначение £(х|у) E(x|y) = x = Ex-j-RXi/R^1 (у — Еу). (6.28) Обозначение £(х|у) имеет более глубокий вероятностный смысл, если предположить, что величины х, r/ц,..., ут имеют сов-; местное нормальное распределение. При этом £(х|у) является ус¬ ловным математическим ожиданием величины х относительно ве¬ личины у, т. е. является средним значением величины х, вычислен¬ ным по ее условному распределению относительно величины у. Важнейшие свойства наилучшей линейной несмещенной оценки. Положим, что b и с — постоянные векторы, а А — постоянная мат¬ рица. При выводе уравнения фильтра Калмана используем следую¬ щие свойства операции £(х|у): (1) Е (с|у)=с; справедливость этого соотношения непосредственно вытекает из (6.28); (2) £(cTx|y) = c'F (х|у); это свойство можно трактовать следующим образом: наилуч¬ шая несмещенная линейная оценка линейной комбинации CiXi + + •. .+cnxn = cTx равна линейной комбинации с,\Е(хх |у) + . • •+ +спЕ(хп\у) наилучших несмещенных оценок. Доказательство: Е (cTx|y) = EcTx-{-RcT г (у — Еу), замечая, что Естх = стЕх, cov(cTx, y)=cTcov(x, у), получим свойство (2); (3) ^((х + г)|у)=^(Х|у) + £(21у); доказательство: поскольку E(x-\-i) = Ex-\-Ez, cov(x-|-z, у) = = cov(x, y)+cov(z, у), то применяя (6.28), получим свойство (3); (4) Е (х|у + Ь) = Е (х|у); 116
доказательство: применив формулу (6.28), получим £(х|у + Ь) = £х+£[(х-Ех)(у + Ь-£ (у + Ь))'] {Е [(у + Ь- -£’(y+b))(y+b-Je(y+b)r]}->(y+b-f(y+b))= =£x+RJ.yR7!/1(y-£y)=£(x|y); (5) Е (х|Ау)=£ (х|у), где А — квадратная невырожденная матрица. Доказательство: при¬ меняя формулу (6.28) к£(х|АуД получим Е (x|Ay)=£x-]-cov (х, Ay) [cov (Ay, Ay)]"1 (Ay — ЕАу). (6. 29) По определению ковариации имеем cov(x, Ау)=£[(х—£х) (Ау— — £Ау) т] = Е[ (х—Ех) (у—Еу) т Ат]=cov (х, у) Ат=RXWAT; ан ал огич- но можем получить cov(Ay, Ay) — Acov(y?y)AT = AR2/yAT. Подстав¬ ляя полученные выражения для ковариационных матриц в форму¬ лу (6.29), убедимся в справедливости свойства (5): Е (х|Ау)=£х+RxyAT [AR^A'P А (У~ У)= =Е х + R^A1' (АГ1 R^A-’A (У - Еу) = =Ех + RJVf (У ~ Еу)=Е (х|у); (6) £(Ау|у)=Ау; (7) £(х]у)=£х, если х и у некоррелированы (R^ = O); (8) Е [£(х|у)]=£х; это свойство несмещенности оценки (6. 28). Действительно, в преж¬ них обозначениях имеем Е[Е(х\у)] = Ех=Ех; (9) cov (х—£(х|у), у) = О, следовательно, случайные величины х — £(х|у) и у некоррелиро¬ ваны. В силу свойства (8) имеем £(х—Е(х|у))=О, т. е. случай¬ ная величина х — £(х|у) является центрированной. Учитывая это и формулу (6. 28), получим cov (X-Е (х|у), у)=Е [(X-Е (х|у))(у-ВД]= =£’{[x-£x-R^R-1(y-£’y)](y-£’yn= =Е [(х - £х) (у - Еу)‘] - Е [R^R-1 (у- £у)] (у- £у)*] = =- ^ууЕ [(у- Еу) (у - £ у)']=R^- Rxy = О; (10) ^(х|у, z) = £(x|y)+£(x|z), где у и z некоррелированы и £х=о. Доказательство: рассматри¬ вая совокупность величин у и z как некоторый вектор wT = 117
= (yT, zv) и положив у = у—Еу, z=z—Ez, w = w—Ew, получим при применении формулы (6.28) (при £х=о) к левой части (10) Е (х|у, z)=E (x|w)=f (xwT) [f (ww')]_1 w= =£[х(Г, zr)] О о о Ezz? = [£(xf), £-(xzO‘)][^°y^ ’ ° L O (Ezz'O-1 При выводе последней формулы учтена некоррелированность z и у: £yzT = EzyT~0. Производя перемножения матриц в последней формуле и используя (6.28), получим свойство (10); (10а) Е (х|у, z)= — £x+£(x|y)+£'(x|z), если отбросить требование Ех=о в свойстве (10). Действительно, подставляя в свойство (10) х—Ех вместо х, получим Е (х —Ех|у, z)=E (х —Ех|у)-[-Е(х —Ex|z) или, используя свойства (3) и (1), получим Е (x|y,z) — Ех=Е(х|у)_ Ex4-E(x]z) — Ex, откуда следует свойство (10а). В формуле (6.28) предполагалось, что матрица ковариации невырождена. Однако это предположение не является сущест¬ венным ни для определения наилучшей несмещенной оценки Е(х|у), ни для выполнения свойств (1) — (10). Нетрудно проверить, что если матрица ковариации вектора у является вырожденной, то можно выделить часть его координат, которые составляют случай¬ ный вектор (меньшей размерности) с невырожденной матрицей ко¬ вариации и через которые выражаются остальные координаты вектора у. Тем самым при построении оценки х по вектору у сле¬ дует ограничиться только выделенной группой координат, матрица ковариаций которых невырождена и, следовательно, справедливы формулы (6.28) и свойства (1) — (10). Методология подхода к построению фильтра. Основная идея построения фильтра заключается в том, чтобы сделать про¬ цедуру определения оценок x(i) = E(x(t) | Y*) рекуррентной, т. е. при вычислении последовательности оценок x(tQ), х(70+1), • • x(t), x(i/|+1) не проводить вычисления каждый раз заново по фор¬ муле (6.28), а использовать при нахождении оценки xfi-j-l) уже найденное значение оценки х(/). Принципиальная возможность та¬ кого сведения кроется в природе исходного процесса: зависимость последующего состояния системы х(7+1) от всей предыстории по¬ 118
ведения системы в прошлом заключена в величине ее предшеству¬ ющего состояния x(t) и в значениях вновь поступающих входных воздействий. Примем более общую форму уравнений (6.7); х (/ + 1)=а (/) X (/) - Р (/) X (/) х (/) + V (0 z (/) 4-1 (/); 3Q) у 4+1)—^ 4) у 4)4“е 4) х 4) 4-л (/), полагая тем самым, что объект управляется при помощи линейной обратной связи и = —1(/)х(/) по восстановленному значению со¬ стояния и что на него воздействует детерминированный сигнал z(/), а измерительное устройство обладает инерционностью. Это обобщение не осложняет проводимых ниже выкладок, однако удоб¬ но для применения. Формула связи Е(х(7+1) I Y/+i) и E(x(7-f-l) | Yz). Выражение Е(х(/+1) |YZ) представляет собой наилучшую линейную несмещен¬ ную оценку состояния х(/+1) по результатам измерений сигнала Yf=(y(/0), У(^о+1), . . ., у(/))> не включающим информации, со¬ держащейся в последнем измерении сигнала у (Н“1) • Выразим в явном виде ту дополнительную информацию о состоянии х(^+1), которая заключается в сигнале у(/+1). Определим дополнитель¬ ную информацию в сигнале у(/-{-1). Имея в распоряжении сигнал Yf, можно оценить сигнал у(/+ 1): у (/+ 1) = E(y(Z+l) | Y^). Положив У = У (/+ 1)-У (/+1), (6.31) получим, что сигнал y(/-f-l) равен сумме сигнала у (/+1), являю¬ щегося линейной функцией от предшествующих сигналов Yz и вели¬ чины у. Отсюда естественно предположить, что дополнительная информация о состоянии х(/+1) в сигнале у(/+1) заключается в величине у. Перейдем от системы величин Yz+i=(Yz, y(^-f-l)) к системе величин (Yz, у). Легко увидеть, что обе эти ^системы связаны ли¬ нейно: соотношение (6.31) выражает зависимость у и у(/+1) Друг через друга и через систему величин Yz, так как оценка у(/-Н) есть линейная функция сигнала Yz. Таким образом, эти системы связаны друг с другом некоторым линейным невырожденным пре¬ образованием и поэтому можно применить свойство (5). £(/4-1) = £(x(/+ 1)|Yz+1)=£4x(/4-1)|Ym у). Далее, по свойству (9) величины Y( и y—y(t+1)—у(/+1) некор- релированы: cov(Y(, у)=О, а применяя свойство ('10а), получим х (/+ 1)=£ (х 4 + l)|Yf, у)=Е (х (/+ 1)|YJ + 4-Е(х(/4-1)|у)-£х(/+1). (6.32) Два последних слагаемых в (6.32) преобразуем при помощи формулы (6.28): Д(х(/4-1)|у)-£’(х^4-1))=^~ц^у> 1 1.Q
где учтено, что Еу = о [см. свойство (8) в разд. 6.2]. Окончательно получаем х (/+ l) = f (х(Я- l)|Y/)+R^R~~ у. (6. 33) Формула связи £(х(У-|-1) |Yj) и x(t). Учитывая выражение (6.30) для х(/+1), преобразуем первое слагаемое в (6.33), поль¬ зуясь свойствами (3) и (4): £[(x(/+l)|YJ = £[^^ =«(/)£’ [х (/)]¥,] -₽(/)! (/) Е [£ (/)]¥,] + у (/) z (/) = =«(/) х (/)- р (/) X (/) х (/) + у (/) z (/),' (6. 34) где учтено, что £(/) —центрированная случайная величина, некор¬ релированная с сигналом Nt, а потому £(£(/) | Nt) =о, и принято во внимание также, что х(/) линейно выражается через Nt) поэтому в силу свойства (6) Е (x(t) \Nt) . Тем самым формула (6.33) преобразуется к виду х (г+ 1)=а (/) х (/)-₽(/) X (/) х (/) 4- Y (/) Z (/) +Rx7 R~~ у, (6.35) и остается лишь найти явное выражение для матриц ковариаций Rx~, R~~, для чего необходимо вывести сначала удобное выражение для у. Выразим у через вектор ошибки x(Z)=x(Z)—x(Z). В соот¬ ветствии с определением у и уравнением (6.30) будем иметь у=у(/+1)-£(у(Н-1)|¥,)=ут)-£ [(б(/)у(/)+ + в (/) х (/)+п (/)) ] YJ = у (/ + 1) - 6 (/) Е [у (01 ¥Д - -t(t)E [x(/)|YJ-f [nWlU Так как в силу определения величина t)(Z) центрированная и не- коррелирована с сигналом Y(, то, применяя свойство (7), найдем, что £[-q(i) | Yt] =о. Учитывая также, что у(/) выражается линейно через Y( = (у (/о), • •у (0) > в силу свойства (6) будем иметь Е (у (/) | |Y<) =у(/). С учетом всех приведенных соотношений, получим ( -кУ = У(/+1)-б(/)у(/)-£(/)х(/) = е(/)х(г!)+11(/), (6.36) где при последнем переходе в формуле (6.36) учтено значение (6.30) для у(^+1). Формула для матрицы ковариации R~~. Воспользовавшись вы¬ ражением (6.36) для у(0 и учитывая некоррелированность х(/) и к] (/), найдем матрицу R~~[(£ (/) £ (/)+п (/)) (е (/) £(/)+п «] = =e(f)P(/)eTW+R2W- (6-37) где R2(/) = Eil(0nT(0. а Р(0=£*(0хт(0 —ковариационная мат¬ рица ошибки. 120
Формула для матрицы ковариации Rx~. Учитывая, что £у = о и принимая во внимание уравнения (6.36), (6.30), вычислим матри¬ цу [(х(/+1)-£х(/+1))Г] = ^ [х(/+1)?] = = Е [(а (/) х (/) - ₽ (/) X (/) х (/) + у (/) z (/) + |(/)) (в (/) J (/) + п (/))Ч = =а(/)£’[х (/)хг(/)] в1 (/), где было учтено, что следующие пары величин: x(t) и ^(О, х(0 и -ц(0, ^(0 и т)(/), x(Z) и x(Z), ?(0 и х(7) —некоррелированы между собой и что ^(t), т)(0, х(0 центрированы. Следовательно, получим Rx~=а (/) £ {[х (/) - х (/) + х (/)] хг (/)} 8'г (/) = = а(/) Е [х (/) хт(/)]] 8'г(/) = а (/) Р (/) 8Т(/), . (.6, 38) где также учтена некоррелированность сигналов x(t) и x(t) и цент¬ рированность x(t). Уравнение дискретного фильтра Калмана. Подставляя значения (6.36), (6.37), (6.38) в формулу (6.35), придем к разностному урав¬ нению: X (/ + 1) = а (/) £(/)-? (/) 1 (/) х (/) + Y (/) z (/) + + « W Р W W [е (/) Р (/) & (/)+R2 х х [у (/.-}- 1) - 6 И у (/) - 8 (/) X (/)], (6. 39) являющемуся уравнением дискретного фильтра Калмана. Вводя обозначение для матричного коэффициента усиления К(0 К (/)=« (/) Р (/) 8Г (/) [8 (/) Р (/) & (/)+R2 (/)]-!, (6. 40) перепишем уравнение (6.39) фильтра Калмана в виде £(/+1)=а (/)£(/)-₽ (Z) X (Z) £ (/)+Y (/) z (/) + + К (/) [у (/ + 1) - 6 (/) у (/) - 8 (/) £ (/)]. (6.41) Вывод уравнения (6.41) остается справедливым при t=to, если считать, что начальное значение х(/0) некоррелировано с {!(/)}. (т](/)}. При этом начальные условия задаются выражением х (t0)=E [х (/о)1уо (/о)]=Ех (/о), (6.42) где последнее равенство использует предположение, что x(t0) и У(7о) некоррелированы [см. свойство (7)]. Вывод рекуррентного соотношения для ковариационной матри¬ цы ошибки Р. Выведем рекуррентное соотношение для вычисления ковариационной матрицы ошибки Р(/), входящей в определение 5 1996 121
матричного коэффициента усиления (6.40). Вычитая уравнение фильтра (6.41) из уравнения системы (6.30), получим х(/+ 1)-х (Л-Н 1)=<х (/)(х (*)-х + — К(/)[у(/+1) —6(/)у(/) —е(/)х(/)]. Замечая, что выражение в квадратных скобках в последнем соот¬ ношении в силу (6.36) равно е(0х(0+г)(0, найдем х +1)=а Wх W ~ К (/) [е (/) х (/) -р п W] = = [«(/) — К (/) е (/)] х (/) +1 (/) + К (/) V (/). (6.43) Умножая уравнение (6.43) на транспонированное к нему и приме¬ няя операцию математического ожидания к обеим частям получен¬ ного равенства, с учетом некоррелированности между собой вели¬ чин х(/),§(/), т](/) получим Р (/ + 1)=Ех (/ +1) хт (/ + 1)=(а (/) - К W е (/)) Р (/) (а (/)) - - К (/) е « + Ri (/) + К (/) R2 W К1 (/). Раскрывая скобки в последнем уравнении, получим р (/-]- 1)=а (/) Р (/) «т (/) _ К (/) в (/) Р (/) а* (/)+Rj (/) - - а (/) Р (/) е1 (/) Кт (/) + К (/) е (/) Р (/) (/) Кт (/) + К (/) R2 (/) Кт (/). (6.44) С учетом формулы (6.40) для К(0 легко показать, что сумма последних трех слагаемых в уравнении (6.44) равна нулю: —а (/) Р (/) & (/) Кт (/) + К (/) е (/) Р (/) 8Т (/) Кт (/) + К (/) R2 (/) Кг (/) = = -а (/) Р (/) & (/) Кг (/) + К (/) [в (/) Р (/) & (/) + R2 (/)] Кт (/) - = -а (/) Р (/) (/) Кт (/) + а (/) Р (/) е'г (/) Кт (/) = О. Таким образом, уравнение (6.44) приобретает окончательный вид р (f 1) = а (/) Р (/) ат (/) — К (Z) е (/) Р (/) а1 (/) + ^ (/). (6.45) Из выражения (6.42) найдем начальные условия для рекуррент¬ ного соотношения (6.45): Р (/0) = COV (X (/о) — X (/о), X (/о) — X О =Ro, (6.46) чем и завершается построение дискретного фильтра Калмана. 6.3. ПОСТРОЕНИЕ НЕПРЕРЫВНОГО ФИЛЬТРА КАЛМАНА-БЬЮСИ Линейные дифференциальные системы со случайными входными сигналами. Рассмотрим систему х = А(/)х + |(/), (6.47) тде ж7= (хь ..., хп)—вектор фазового состояния; А(/)—матрица размерности пХл; ^т((/) =£i(0„ • • •» — вектор случайных 122
входных воздействий. Обозначив <р(/, т) матрицу импульсных переходных функций системы (6.47), можно формально записать ее решение в виде интеграла (см. Приложение) t х(/) = ф (/, /0)X(г'о) + Jф(/, т)|(т)^т. (6.48) /о Формула (6.48) представляет собой стандартное выражение реак¬ ции линейной системы на входное воздействие и применима, когда входное воздействие есть интегрируемая функция времени. При вы¬ полнении этого условия для каждой реализации процесса £(/) фор¬ мула (6.48) будет, очевидно, справедлива и для случайных вход¬ ных сигналов. Однако формула (6.48) не является справедливой, когда, входное воздействие есть процесс типа белого шума, т. е. такой процесс, у которого значения от точки к точке некоррелиро- ваны или даже независимы. Траектории таких процессов перестают быть функциями в обычном смысле слова, и интеграл в правой час¬ ти (6.48) требует уточнения. Более того, эти процессы физически нереализуемы, так как должны были бы заключать в себе беско¬ нечно большую энергию. Тем не менее реакция линейной системы на входной сигнал типа белого шума имеет вполне реальный физи¬ ческий смысл. Преобразуем формулу (6.48) так, чтобы она приоб¬ рела точный математический смысл. Процессы типа белых шумов имеют важное теоретическое зна¬ чение: пропуская их через линейные системы (формирующие фильт¬ ры), можно получить широкий класс процессов, достаточных для рассмотрения задач автоматического управления и в то же время имеющих наглядную математическую структуру, что существенно упрощает анализ прохождения этих сигналов через динамические системы. Многие реальные входные воздействия, рассматриваемые толь¬ ко в пределах полосы пропускания линейной системы, мало отлича¬ ются от соответствующих белых шумов. Поэтому при их исследова¬ нии можно предполагать, что входные воздействия представляют собой белые шумы. При этом теоретические исследования оказыва¬ ются гораздо более простыми, а их результаты более наглядными. Представление о входном сигнале системы (6.47) как о про¬ цессе типа белого шума основано на представлении о последова¬ тельности непрерывно следующих друг за другом некоррелирован¬ ных импульсов, вызывающих в соответствии со структурой уравне¬ ния (6.47) процесс непрерывного изменения состояния системы. В соответствии с этим более удобной оказывается форма записи уравнения (6.47) в дифференциалах. Для этого введем процесс wj/) с некоррелированными однородными приращениями (/3> >/2>6): E [®Ш) — «ДД] [«ДД — ®Д/1)]}=0- ( ' •* При предположении, что процесс ггД/) является гауссовским, онна- 5* 123
зывается винеровским процессом или процессом броуновского дви¬ жении. Однако не будем делать никаких предположений о распре¬ делениях процессов, помимо совокупности условий (6.49). Это воз¬ можно, так как данные рассуждения не выходят за рамки корреля¬ ционной теории, т. е. теории, охватывающей вторые моменты рас¬ пределений и не использующей моменты более высокого порядка. Рассмотрим сначала скалярное уравнение в дифференциалах dxl=-a{f)xxdt-\-b{t')d4S)i(t). (6.50) Его смысл состоит в том, что бесконечно малые изменения состоя¬ ния системы за промежуток времени dt происходят под воздействи¬ ем бесконечно малых и некоррелированных для разных моментов времени импульсов dw\(t)\ E(dw\(t)dw\(s))=Q при t=£s, Е(dwi(t))2=dt [см. формулу (6.49)]. Уравнение (6.50) приобретает строгий смысл, если определить его решение. Если сопоставить уравнения (6.47) и (6.50), то видно, что для входного сигнала типа белого шума в (6.47) следовало бы положить %i = b(t)Wi(t). Но так как процесс wx(t) не имеет произ¬ водной, то такая запись является чисто формальной. Однако она показывает, как нужно определить решение %i(/) уравнения (6.50). Используя формальное равенство (t)dt = b(i)w1 {t)dt = b{t)dewi (/), перепишем (6.48) для одной координаты Xi t Х1(/)=<р(Л /о)-«1 (^о) + J ?(Л г)&(т)(т). (6. 51) ^0 Интеграл в (6.51) следует понимать как предел в среднеква дратичном смысле* интегральных сумм — Wi^)] при стремлении к нулю максимума длин интервалов раз¬ биения; тем самым формуле (6.51), выражающей решение уравне¬ ния (6.50), дан строго математический смысл. Все изложенное сохраняет силу и для векторного уравнения dx = А (/) xdt ф- В (/) rfw (/), (6. 52) где хт = (х!,..., хп) — вектор; А(/), В(/) — матрицы размерности пхп, a w(t)=(wx(t), w2(t),..., wrt(r)) — процесс, каждая компонента ко¬ торого является процессом с некоррелированными однородными при¬ ращениями, и эти компоненты некоррелированы между собой £7/w(/) = o, Е (rfw(/)rfwT(s)) = O при t ф s, E(dw(t)dvE{ty==\dt, где I — единичная матрица размерности пХп. Решение уравнения (6.52) имеет вид t х(Ю = <₽(Л4))х(А)) +J v(/,T)B(r)dw(r), (6. 53) to * Последовательность случайных величин сходится в среднеквадратич¬ ном смысле к величине g, если Е(£п—£)2—при п—>.оо. 124
Если определить процесс £(/) формулой = J B(s)rfw(s), то ^0 ^g(/)=B(/)rfw(Z), и уравнение (6.52) можно записать в виде dx = А (/) xdt + d^ (/). (6. 54) Заметим, что Е^(/)=о, Е [^|(/)^т (/)]=£’ [B(/)rfw(/)rfwT(f)BT(/)]= = В(/)ВТ(/) Е [d|(/)d|T(s)] = O при t ^s. Ковариационная матрица реакции линейной системы на белый шум. Рассмотрим линейную систему (6.54), где d|(i) =B(/)^w(0, и ее решение (6.53) при начальном условии х(А>), некоррелирован¬ ном с процессом §(/). Положим R0-=cov (х(/0), х(/0)), Ri(0^ = В(/)ВТ(/), так что £(d§(0rfr§T(0)=Ri(0^- Ковариационная матричная функция процесса х(/) определяется как cov(x(/), х(т)) при всевозможных значениях /, т, однако рассмотрим ее значение при /=т: Р(/) =cov(x(Z), х(/)). Применив операцию математичес¬ кого ожидания к обеим частям уравнения (6.53) и воспользовав¬ шись тем, что Edw(x) =о, получим Ех(/) = ф(/, /0)^х(/0). (6.55) Вычитая (6.55) из (6.53) и учитывая d^(t) = B(t)dw(t), за¬ пишем х (/) — Ex (/) = ф (/, /0) (х (4) — Ех (/0)) + J Ф (Л -V) dl (t). (6.56) ^0 Умножая уравнение (6.56) на уравнение, транспонированное ему, и применяя операцию математического ожидания к полученному выражению с учетом некоррелированности х(/0) и §(/) получим Р (/) = ф (/, /0) Е [(х (4) — Ех (/0)) (X (/0) — Ех (/0))г] фт (/, /0) + У Ф (Л t) Е (Т) (а)] фг (Л а) = ф (/, /0) Я0фТ (/, Zo) 4- to t0 + У<Р(Л t)Ri СОФ1'(Л x)dr. (6.57) to Дифференцируя соотношение (6.57) по t, получим Р = ф(/, /0) R0(pl (Л /о) Н~Ф (Л 4>)W (ЛА))Н~ф(Л Ki W Фг (A / t Ф (Л т) Ri (т) Фт (Л т) dx 4- С ф (/, т) Rj (т) фт (/, т) dx. (6. 58) to to 125
Используя уравнение а(/)<р(/, т), <р(т, т)=1 (см. При- dt ложение), перепишем выражение (6. 58) в виде —=А (/) <р (/, 4) RoT1' (/, /0)+q) (Л /0) Ro<PT (Л 4>) А'г W+ В правой части уравнения (6.59) первый и третий члены с учетом выражения (6.57) для Р(/) дают А(/)Р(/), аналогично второй и четвертый дают Р(/)АТ(/), следовательно, уравнение (6.59) прини¬ мает окончательный вид Р = А (/) Р + РА1 (/)+R! (/) (6. 60) при начальном условии P(/0)=R0. Оптимальная оценка при непрерывном времени. С учетом вве¬ денных в предыдущих разделах понятий и обозначений и по анало¬ гии с дискретным временем [см. формулу (6.30)] введем уравнения системы и измерителя в следующей форме (рис. 6.2): dx = А (/) xdt— В (/) L (/) х (t)dt^C[t^t)dt^d^{t)\ g dy = D (/) у dt Ц- E (/) x dt ф dv\ (/). Для входящих в (6.61) случайных вектор-функций предположено, что £^(/) = о; ед(/) = о; Е (/)rf|T(/)]=Ri {t}dt\ Е [dx\ (/)б/4г (/)]== R2(/)^/; Е [</g(/)'7gT(t)] = 0 при/фт; (6.62) Е \dv\ (/)^tit(t)] = O при /фт; Е [rf*] (/) (т)] = О npnj всех значениях /иг; 126
а А(/), В(/), С(/), D(/), L(Z) —матричные функции соответствую¬ щих размерностей; х(/0) имеет известное математическое ожида¬ ние и известную ковариационную матрицу R0 = cov(x(/0), х(/0)) и некоррелировано с процессами |(/), т](0. Определим х=х(/) как наилучшую несмещенную линейную сценку состояния х=х(/) по результатам наблюдения за процес¬ сом у (г), полагая, что при каждом фиксированном значе¬ нии оценка x(/j) может быть представлена в виде x(/i)=J v(/i,t)</yW+m(/i), (6. 63) ^0 где матричная функция v(Z'i, т) выбирается из условия минимума средней квадратичной ошибки; m(/i)—вектор, обеспечивающий несмещенность оценки х(Л), а интеграл понимается как средний квадратичный предел интегральных сумм £vM[y (W- у (**)], k [сравнить с формулой (6.51)]. Если сигнал y(t)=dy!dt подать на вход линейной нестацио¬ нарной системы с фундаментальной матрицей Т(/, т), то выходной сигнал х(/) такой системы можно представить в следующей форме: _ t 2 (/) = j Т (Л т) у (т) dx + Т (Л /0) х (/0) = ^0 = У'Г(/,т)^у(т) + Ч*-(Л/0)х(/0), которая имеет вид (6.63) с v(/, т)=Чг(/, т). Таким образом, пред¬ ставление оценки сигнала в виде (6.63) указывает на то, что по существу в системе уравнений (6.61) сигналом измерителя, исполь- зумым для построения оценки, является не у, а у. Выберем v(/, s) и m(/) из условий Е (&тх(/) — b'rx(/))2 = min; Ex (t) = Ex (/), (6.64) где b — любой вектор. Первое условие (6.64), в частности, означает, что £(xz(/)-xz(/))2 = min; i= 1, 2,..., п. (6.65) Чтобы убедиться в этом, достаточно в (6.64) положить Ьт=(0,...» 1,..., 0) с единицей на /-ом месте. Уравнение непрерывного фильтра Калмана — Бьюси. Перейдем ст непрерывной системы (6.61) к дискретной путем замены диффе- 127
ренциалов rfx, rfy, d^, dv\ конечными приращениями х(/Ц-Л) —x(7), у(^ + й)-у(/), |(У+й)-£(/), П(/+й)-т](/): х (t й) = х (/) 4- А (/) х (/) h — В (/) L (/) х(/)й4- +С(/)х(/)й4-1(/4-й)-ш (6.66) У ^ + ^) = У W + ® W У W (/) х (/) Л —|— т| (/ --1— Ze) т] (/). Рассматривая систему (6.66) при t, кратном h, получим дискрет¬ ную систему типа (6.30). Так как d^{t) = B(Z)rfw(Z), то ^(t-^-h) — t+h — |(/) = J B(/)dw(Z), откуда видно, что случайные функции W + t +/г) —£(Z), когда t кратно /г, образуют дискретный процесс типа белого шума интенсивности t -j-h t+h £[(5(ЖНШЖ)-да]=( В(/)ВДО=| RiW^- t t Аналогичное утверждение верно для процесса T\(t + h)—t](Z). Сле¬ довательно, можно применить изложенную для дискретного време¬ ни теорию оптимальной фильтрации, при этом получим уравнение фильтра в виде х (/ -р Л) = х (/) -|- А (/) х (/) h — В (/) L (/) х (/) Л -|- С (/) z (/) h, 4~ 4- Кл W [у V 4- Й) - у (/) - D (/) у (/) й - Е (/) х (/) й]. (б: 67) Одна из возможностей получения уравнения фильтра для непре¬ рывного времени состоит в переходе в уравнении (6.67) к пределу при h—>0. В результате получим уравнение оптимального фильтра Калмана—Бьюси (см. рис. 6.2). dx = А (/) х (/) di — В (/) L (/) xdt ^C(t}z(t)dt-\- + К (/) [dy — D (/) у (/) dt - Е (/) х (/) dt\ (6. 68) при начальном условии x(Z0) = £х(/0). Коэффициент усиления К(/)< Найдем оптимальный матричный коэффициент усиления К(0 фильтра в предположении, что струк¬ тура его известна. Вычитая уравнение (6.68) из первого уравнения системы (6.61), получим уравнение для ошибки х=х—х: rfx = А (/) xdt + dl, (/) — К (/) [dy — D (/) ydt — E (/) xdt\ = = (A (/) - К (/) E (/)) x (/) dt - К (/) dx\ (/)(/), (6. 69) где при последнем переходе использовано уравнение измерителя в (6.61). Применив операцию математического ожидания к урав¬ нению (6.69) и обозначив Ex(/)=m(Z), найдем dm (/) = [А (/) — К (/) Е (/)] m (/) dt. (6. 70) Учитывая, что уравнение (6. 70) линейное, однородное и что началь¬ ное значение ввиду несмещенности оценки равно нулю (tn(/0) = 128
==£x(/0) = 7?x(/0) — ZTx(/0) = c>), получим, что m(/)=o. Таким обра¬ зом, £[(b'rx(7) — brx (/))2] = £(brx(/))2 = b'rZ?[x(Z) x'r (/)] b = b P (/) b, где P(/) обозначает матрицу ковариации вектора ошибки. С учетом последней формулы, представим условие оптимальности (6.64) в виде brP(/)b = min (6.71) при любом векторе Ьт= (&ь..., Ьп) и каждом значении Л Уравнение (6.69) подобно уравнению (6.52), если в последнем А(/) и B(/)dw(/) заменить соответственно наА(1)—К (/’)E(Z) и К 00^(0 + + d§(Z). Используя (6.60), получим следующее уравнение для ко¬ вариационной матрицы ошибки P(0=cov(x(Z), х(/)): Р = [А (/) - К W Е (/)] Р + Р [А (/) - К (/) Е (/)р+ВД + + K(/)R2(/)KtW (6.72) при начальном условии P(/0)=cov(x(/0), х (/0))=R0=cov (х (/0). х (/<>))• Следующее тождество легко проверить, раскрыв в правой части скобки и использовав симметрию матрицы R2(Z): KR2K - КЕР - РЕТКГ=(К - PE Rr1) R2 (К - PErRr!)r - PETR2EP. С учетом этого тождества приведем уравнение (6.72) к виду Р = АР + РАТ+RI - РЕРГ’ЕР + (К - PERF1) R2 (К - PETRFl)T. (6.73) Умножая обе части уравнения (6.73) слева на Ьт и справа на Ь, в левой части получим производную d(bTP (/)b) Idt от функционала (6.71). В правой части (6.73) от коэффициента К (0 будет зависеть лишь последнее слагаемое Ьт (К - PERrj R2 (К - PE’RF1)’ b, причем это выражение ввиду положительной определенности мат¬ рицы R2 всегда неотрицательно. Очевидно, для минимизации про¬ изводной d (ЬТР (/)b) Idt нужно выбрать К(/) в следующем виде: K(/) = PWE'(/)R2-!(/). (6.74) При этом последний член в уравнении (6.73) обращается в нуль и уравнение приобретает вид P^APi-PA'+Ri + PERoTP. (6.75) При таком выборе K(t) производная от функционала (6.71) в мо- мент t принимает минимальное значение, следовательно, имеем ми¬ нимум интеграла от производной Дьтр_(оь) Л=Ьтр ь _ Ьтр ь *0 129
Поскольку P(/o)=Ro фиксировано и не зависит от выбора К(/)> то значение (6.74) коэффициента К (0 придает функционалу (6.71) минимальное значение. Фильтр Калмана для безынерционного измерителя. Положим, что в уравнении измерителя (6.61) коэффициент D(Z)=O, тогда ^у = Е(/)х(/)^/Ц-^т](/). (6.76) Полагая соответственно и в уравнении фильтра (6.68) D(Z)=O, получим rfx = А (/) х (/) dt — В (/) L (/) х (/) dt 4- С (/) z (/) d,t 4- + К (/) [dy— Е (/) х (/) dt]. (6. 77) Поделив формально уравнения (6.76) и (6.77) на dt, запишем урав¬ нения измерителя и фильтра в следующем виде: у=Е (£) х (/)-|-т] (/); (6.78) х = А (/) х (/) — В (/) L (/) х (/) -(-С (/) z (/) + К (/) [у - Е (/) £(/)] (6. 79) или, заменяя у на у, приведем уравнения измерителя и фильтра к виду y^EWx + rj; (6.80) х = А (/) х (/) — В (/) L (/) х (/) + С (/) zr (/) + К (/) [у - Е (/) X (/)]. (6. 81) Форма записи уравнения измерителя (6.76) и уравнения фильтра (6.77) предпочтительней соответственно формы (6.80), (6.81) как с точки зрения математической строгости, так и физического смыс¬ ла, поскольку процесс т](0, а следовательно, и у(/) физически не- реализуемы. Итак, задача фильтрации решена при действии на систему бе¬ лых шумов. Если на объект действуют случайные сигналы, отлич¬ ные от белых шумов, но которые могут быть получены как резуль¬ тат прохождения белого шума через линейную систему, то дополнив Рис. 6.3. Преобразованная структур¬ ная схема фильтра Калмана — Бьюси, позволяющая избежать диф¬ ференцирования сигнала в цепи об¬ ратной связи нестационарную (расширив) уравнение объекта уравнением формирующего фильтра, можно свести задачу к рассмотренной. Структурное преобразование фильтра Калмана — Бьюси, позволя¬ ющее избежать дифференцирования сигнала в цепи обратной связи. Если измеритель безынерционный, то, как показано в предыдущем разделе, сиг¬ нал рассогласования в фильтре (6.81) выражается непосредственно через сиг¬ нал измерителя. Если же измеритель инерционный, то для образования сиг¬ нала рассогл асов а ни я н е о б х о ди м о 130
предварительно продифференцировать сигнал измерителя [см. уравнение (6.68)]. Операция дифференцирования нежелательна ввиду возрастания интенсивности шумов. Дифференцирования сиг¬ нала измерителя можно избежать, проводя простые структурные преобразования фильтра (6.68) (рис. 6.3). Опуская в уравнении (6. 68) для краткости записи член C(/)z(/)dZ, получим dx. = [А (/) — В (/) L (/) — К (/) Е (/)] х (/) dt + К (/) dy — К (/) D (/) у (/) dt. Вводя новую переменную v(/)=x(/) — К(/)у (/), где x(/)=v(/)4- + К(/)у(/), rfx(/)=</v(/)+K(/) у (/)d/+K(/)dy (/), из последнего уравнения получим dv = [А (/) — В (/) L (/) - К (/) Е (/)] v (/) dt + [А (/) — В (/) L (/) — - К (/) Е (/)] К (/) у (/) dt - К (/) у (/) dt - К (/) D (/) у (/) dt, или dv — [А (/) — В (/) L (/) — К (/) Е (/)] v (/) dt-\- [(А (/) — В (/) L (/) — — К (/) Е (/)) К (/) - К (/) - К (/) D (/)] у (/) dt. (6. 82) Величина v(/) является выходным сигналом системы (6.82), на вход которой подается с некоторым коэффициентом усиления сиг¬ нал измерителя у (г). Оценка х(/) связана с сигналом v(Z) соотно¬ шением х(/) =v(/) +К(/)У (О- 6.4. ПРИМЕРЫ ПОСТРОЕНИЯ ФИЛЬТРА КАЛМАНА Пример 1. Синтез непрерывного фильтра Калмана — Бьюси для автопилота тангажа. Уравнения движения ЛА в продольной плоскости возьмем в виде [см. (3. 14), (3.23)] 4 + + Я2а = #3?>В — ^2awj ft — а — Я4а = <24Clw, где aw — приведенное к углу атаки возмущающее воздействие турбулентной ат¬ мосферы. Для простоты выкладок будем считать aw белым стационарным шумом с интенсивностью сн2, так что процесс aw(t) =GiWi(t), где Wi(/)—стационар¬ ный белый шум единичной интенсивности. Пусть измеряются координаты О и О соответственно трехстепенным гироскопом и ДУСом, которые будем считать безы¬ нерционными: <У)2 = ft + .УЗ = ft + Т)3, где т]2, Лз — некоррелированные белые стационарные шумы измерения интенсив¬ ностей <3^, соответственно. Вводя новые переменные %i = a, х2='О', = представим уравнения объекта в нормальной форме *1 = —a4xi + х2 — (/); х2 — —a2xi — агх2 + яз&в — д2а1^1 (0; хз = х2. Запишем уравнения объекта и измерителя в векторной форме х = Ах + Ви 4- Cwi; (6. 83) у = Ех (6. 84) [ Л11 г — а4 1 0 ] Г 0 1 г—а4 <?г 1 где Х= Х2 ; А = — а2 —ах 0 ; В = 1 a3 1 ; с = I —а2 ci L ХЗ 1 L 0 1 0 J LO J L о 1 ai = 1,76 с—1; ^2 = 4,2 с-2; а3 = —7,4 с~2; а4 = 0,77 с~1. 131
Интенсивности Ri, R2 шумов | = Cwi, т] равны [см. формулу (6.54) и далее] 1 R1 = ССГ Я4а11 —а2 01 [—04^1 — а2^1 . О J 0] = 2 02^4°1 О 2 d^CL j <J | а2<з\ О r2 = (6. 85) Вычисляя ранг соответствующих матриц [см. формулы (4.2) и (4.22)], нетруд¬ но убедиться, что система x=Ax + Cv управляема по v, а вместе с уравнением у=Ех полностью наблюдаема. Это обеспечивает асимптотическую устойчивость фильтра Калмана — Бьюси (см. теорему на стр. 111). Уравнение фильтра Калмана (6. 3) для системы (6. 83) примет вид где ■ £ц £12 1 "Р11 Р12 Р131 к = ^21 £22 = Р21 Р‘22 Р23 - £31 £32 J -Р31 Р32 РЗЗ- Р12%2 Аз%2 —2 —2 Р22°7]2 Р23% Р32%? Р33%2 (6. 87) где Hpijll — единственное положительно определенное решение матричного ал¬ гебраического уравнения Риккати (6.14) [—а4 -02 О 1 °1 ■ Р11 Р12 Р13" ~Р11 Р12 Р13" —04 —02 О- —01 0 Р21 Р22 Р23 1 “Г Р21 Р22 Р23 1 —01 1 0 0_ -Р31 Р32 РЗЗ- -Р31 Р32 РЗЗ - . 0 0 0_ РП Р12 Р13 Р21 Р'22 Р23 Р31 Р32 РЗЗ О О 1 О О 1 г-н 04^2а1 0 + «2^4°! 2 2 02<?i 0 L о 0 0 < 0 1Г010 ° <J L° °1 Pll Р12 Р21 Р22 Р31 Р32 Р13 Р23 = 0, Рзз_ которое ввиду симметрии матрицы Р (Pi2=p2i, Р1з = рзь ргз = Рзг) эквивалентно шести скалярным уравнениям. Решая эти уравнения при: <Ji = 1,2, а7)а = ^д=0,85, найдем рц = 0,86; />22 = 2,78 с-1; рзз = 0,48; Рз1 = Р1з = 0,41 с; p2i = Pi2 = 0,58; 132
р2з = Рз2 = 0,17, а коэффициенты ki} примут следующие значения [см. формулу (6.87)]:^ц = 0,81 с; Aj2i = 3,86; £31 = 0,23 с; ^12 = 0,57; £22 = 0,24 с"1; £32 = 0,67. Для 0'1= 1,2 и о7]2 — а7]з = 0,3 величины рц и кц будут: <рц = 0,45; р22=1,5; рзз = 0,1; Р12 = Р21 = 0,24; Р1з = Рз1 = 0,085; р2з —Рзг — 0,056; &ц = 2,7 с; &i2 = 0,94; /г21=14,5; й22 = 0,62 с-1; &3i = 0,62; &зз = 0,92. Функции pa(t), полученные путем решения дифференциального уравнения (6.75), показали, что длительность переходного процесса в данном примере рав¬ на 1—3 с. По полученным оценкам координат Xi, i=l, 2, 3, можно сформировать уп¬ равление в виде и =—Lx=/iXi — 12х2 — I3X3. Пример 2. Синтез дискретного фильтра Калмана для автопилота тангажа.. Пусть объект (6.83) находится под управлением дискретного автопилота. По¬ строим дискретный фильтр Калмана для этой системы. Будем считать, что из¬ меритель (6.84) является дискретным. Построим дискретную модель объекта (6.83) с интервалом дискретности автопилота h. Учитывая, что фундаменталь¬ ная матрица однородной системы, соответствующей (6.83),' представляется в форме? (/, s)=exp{A-(/ — s)}, найдем [см. Приложение (П5), (П6) и форму¬ лы (6.50), (6.51)] t х (/) = ехр (А-(/— $)} x(s) + J exp {А-(/ — и)} а(т)д?т/ (6. 88) $ где а(т) = Bu(t)+ Cw(t). Полагая в (6.88) s = kh, t=(k+\)h и считая и(т) на шаге дискретности постоянным, запишем интеграл (6.88) для интервала [kh, (^+1)/г] (k+i)h х((^ 4- 1)А) = ехр {Ah} x(kh) 4- J exp (A-[(£ 4- 1)Л — т]} rftBu (kh) 4- kh (k+l)h 4- J exp {A-[(& 4- 1)A — u]} Cdw(T), kti или x ((k -F 1) h) = uhx (kh) — ₽ЛВи (kh)+l (k) , (6. 89) (*+1)Л где l(k) = J exp {A [(£ 4-1)Л — т]} C^w(t); kh [k+l)h аЛ = ехр АЛ = I 4-АЛ + А2Л2/2! 4-..0Л = J exp A [(£ 4- 1)Л—= kh h = J exp (Ax) dr. = A-i [exp {Ah} — I] = h 4- АЛ2/2! 4- А2ЛЗ/3! 4- ... . о (при вычислении 0^ была проведена замена переменного к= (k+\)h—т. Вычислим корреляционную матрицу Rj сигнала £(k) на входе дискретной системы (6. 89) Ri = {g (^)gT(A>)} = .е (g(O)gT(O)} = = £ { Jexp {А-(Л — is)) Cdw(u)j£jexp (А(Л — $)} Cdw(s) Л h -= JJexp (А-(й—т)} С£ [rfw(n)rfwT(s)] Сгехр (АТЛ— s)) = о о h = Jexp (А (Л — т)} СС гехр АТ(Л —(6. 90) о 133
где при последнем переходе учтено, что Е [г/w (т) dwl (s)] = О при т =И= s и Е [dfw (т) dwL (т)] = \dx, так как w—белый шум единичной интенсивности. Раз¬ лагая экспоненты, входящие в (6. 90), в ряд, найдем h R1 = J(i + А (Л — т) + А2(Л —т)2/2! -i- ...) СС(I + Ат(Л-т) + о 4- (д*)2 (k _ т)2/2! + ...) dx = ССТЛ + (АСС1 4- ССТА1) Л2/2! 4- ... Учитывая, что обычно сведения о шуме ограничены, можно оставить член Ri~ «ССТЛ первого порядка малости относительно h. Легко проверить, что слу¬ чайный сигнал C/i°-5v(&), где v(£)—белый шум с единичной интенсивностью, есть шум с матрицей ССТЛ: Е (B/i0’5v (£) (B/r0,5v (й))т) =СЛ°>5£(у(й) уг(й)) СТЛ0'5 = СС‘7г. Следовательно, для дискретной модели системы (6. 89) вектор § (£) можно записать в виде | (k) = C/i°>5v(&). Уравнение дискретного измерителя представим в виде [см. формулу (6.84)] у (^ + 1)А) = Ех(^) -М(£), (6. 91) где (k)—дискретный белый шум с ковариационной матрицей (6.85). Уравнение дискретного фильтра Калмана для рассматриваемой системы примет вид [см. формулы (6.39), (6.40), (6.41)] х ((k -р 1) h) -.= ahx (kh) 4- 0лВи (kh) + К [у ((£ + 1) А) — х (kh)]. (6. 92) Уравнение для ковариационной матрицы ошибки (6.45) в установившемся со¬ стоянии (Р = Р(/) = Р(/4-1)) примет вид Р = алРа * — КЕРа^ 4- ССТЛ, К = алРЕт [ЕРЕТ 4- К2]~х • (6. 93) Решая последнее уравнение относительно Р, найдем единственное положи¬ тельно определенное решение, которое обеспечит устойчивость фильтра Калмана. Подставляя найденные значения рц в выражение (6.93), найдем оптимальное значение матричного коэффициента усиления К фильтра (6.92): &ц = 0,00844 с; Л12 = 0,00677; ^21 = 0,0382; ^22 = 0,00139 С"1; /г31 = 0,00139 с; /г32 = 0,00546. При¬ веденные значения получены при а^=0,72 град2/с2, =0,72 град2; R2 = R1 = ССГЛ = Г 2 2 a4oi #2#4ai Л л о 4 2 0 4 h 2 2 2 о 0 0 0 0 0! = 1,44 град2; Zi = 0,01 с. Поставленная задача решена, 6.5. ДВОЙСТВЕННОСТЬ ЗАДАЧ ЛИНЕЙНОЙ ФИЛЬТРАЦИИ И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Пусть дана произвольная несмещенная оценка [см. формулу (6.63)] x(/i)-=Jv(fb H-nift) (6.94) ^0 состояния системы dx=A(f)xdt 4-dg(/) в момент построенная по наблюдениям на интервале процесса dy=E(/)x(/)c4f-|- rfr)(Z). При этом Е (^)^T(/)]=Ri (t}dt, Е [rfi] (/)rfi]T(/)]=R2(/)iZ/. cov(x(/0), x(/0))=R0- 134
Причем предполагается, что матрица Кг(О невырождена при каж¬ дом значении t. Положим для краткости v(/b /)=v(^), m(/i) =mi. Рассмотрим линейную управляемую систему i = _A'r(/)z + Ef(/)u(/) (6.95) с управлением u(/) = vT(/)b, (6.96) где Ьт= (6Ь..., Ьп) —постоянный вектор. Пусть z(Z) —решение ли¬ нейной управляемой системы (6.95) с управлением (6.96) на интер¬ вале и условием в концевой точке z(/!) = b. (6.97) Введем функционал качества I=z' (/о) RoZ (/о) + f [zT (/)Rj (/) z (/) + uv (/) R2 (/) u (/)] dt. (6. 98) /о После замены переменной t на (—t) система (6.95) может быть приведена к стандартному виду (5.2) и при этом условие (6.97) в концевой точке интервала управления перейдет в соответствующее условие в начальной точке, внеинтегральный член в функционале (6.98), относящийся к начальному моменту времени, перейдет в со¬ ответствующий член в (5.3), относящийся к конечному моменту ин¬ тервала управления, т. е. задача управления (6.95) —(6.98) приоб¬ ретает стандартный вид. Допустим, что v(/i, t)=v(t) выбрано в (6.94) произвольно, а m(Zi) обеспечивает несмещенность оценки x(/i). Тогда для ковари¬ ационной матрицы ошибок x(Zi)=x(/i)—х(6) справедлива следу¬ ющая формула: _ _ л Ьгсоу(х(Л), x(/1))b=z'c(/o)Roz(/o) + J zr(/)R1(/)z(/)a'/ + ^0 я uT(/)R2(/)u(/)d/, (6.99) /о где управление u(f) связано с функцией v(/) формулой (6.96). От¬ сюда следует, что функции v(/ь /)=v(/) соответствует управление £6.96), при котором функционал качества (6.98) равен bT cov(x(/), x(Z))b. Значит, если решается задача выбора такой пары функций v(/) и mi, что bT cov(x(Z), x(Z))b = min, то тем самым решается и задача нахождения оптимального управления u*(Z) системой (6.95) с критерием (6.98), принимающим минимальное значение. Итак, свойство двойственности состоит в следующем: если v*(7) — 135
оптимизирующая функция в задаче оценки состояния системы с функцией mi, обеспечивающей несмещенность этой оценки, то уп¬ равление и* (г) =v* (О )ТЬ и решение z*(/) системы (6.95) с этим управлением и значением в концевой точке z(/i) =b минимизируют функционал качества (6.98). Замечание. Используя двойственность, из решения в гл. 5за¬ дачи аналитического конструирования регулятора для стационар¬ ного объекта легко выводится сформулированный в разд. 6.1 ре¬ зультат об асимптотической устойчивости стационарного фильтра Калмана.
Глава 7 АВТОНОМНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ 7.1. КЛАССИФИКАЦИЯ Автономными системами управления следует считать такие, кото¬ рые обеспечивают полет ЛА по информации, заложенной при стар¬ те, и которые никакой дополнительной информации в процессе по¬ лета не получают. Лишь программные системы управления в пол¬ ной мере отвечают такому определению. Однако к автономным системам обычно относят инерциальные и доплеровские системы. Инерциальные системы управления в процессе полета получают информацию путем измерения так называемого кажущегося уско¬ рения, равного разности абсолютного и гравитационного ускорения центра масс ЛА. Процесс измерения ускорения не связан ни с мес¬ том старта, ни с какими-либо устройствами, находящимися вне данного ЛА. Инерциальные системы управления являются помехо¬ защищенными, как и автономные системы. Доплеровские системы управления в процессе полета измеряют вектор скорости ЛА по из¬ менению частоты отраженного сигнала от близлежащей подстила¬ ющей местности. Создать помеху на любом возможном направле¬ нии и на протяжении всего пути следования ЛА практически невозможно. Итак, в автономные системы управления будем вклю¬ чать программные, инерциальные и доплеровские системы управле¬ ния. Все эти системы характеризуются большой помехозащищен¬ ностью от организованных помех: полет осуществляется достаточ¬ но автономно в том смысле, что с момента старта связь с ними не осуществляется. Некоторые автономные системы управления нуждаются в разо¬ вой или систематической коррекции. При этом приборные значения координат ЛА сравниваются с их значениями, измеренными други¬ ми техническими средствами, и вводятся соответствующие поправ¬ ки. При этом различают радиокоррекцию, астрокоррекцию и др. В программных системах управления в процессе полета отраба¬ тываются программы, заложенные в память бортовой системы уп¬ равления. Многие классы ЛА начальный участок полета осуществляют по программе. По программе могут осуществляться отдельные этапы полета ЛА: полет на маршевом участке, взлет, посадка, разворот, смена высоты полета. В простейшем случае программу можно свя¬ зать со временем движения ЛА. Например, беспилотный ЛА, осу¬ ществляющий рассеивание полезных насекомых на полях, может 137
двигаться определенное время по заданному курсу. При достиже¬ нии местности, подлежащей заселению полезными насекомыми, от¬ крываются контейнеры и производится рассеивание насекомых. Программные системы управления применяются также в комби¬ нации с системами самонаведения и телеуправления. Доплеровские системы управления включают в свой состав доп¬ леровский измеритель путевой скорости и угла сноса. Доплеров¬ ский измеритель излучает электромагнитную энергию в виде узкого иглообразного луча в сторону поверхности земли. Электромагнит¬ ная энергия, достигая поверхности земли, отражается от нее и улавливается приемным устройством, находящимся на борту ЛА. Частота принятого сигнала будет отличаться от частоты излучения на величину доплеровского сдвига частот, который пропорционален проекции вектора путевой скорости ЛА на направление луча. Эта зависимость лежит в основе работы доплеровских измерителей. Однолучевые доплеровские системы не применяются. Для измере¬ ния путевой скорости и угла сноса горизонтально летящего ЛА не¬ обходимо иметь два луча. Увеличение количества лучей до трех¬ четырех и рациональная их ориентация относительно ЛА позволя¬ ют значительно уменьшить ошибки определения скорости и угла сноса, возникающие из-за неточности стабилизации по крену и тан¬ гажу, а также из-за наличия вертикальной составляющей скорости. Знание путевой скорости и угла сноса позволяет вычислить местоположение ЛА относительно земной системы координат. Срав¬ нивая приборные значения координат ЛА с требуемыми, получают сигнал рассогласования для формирования команды управления. Ниже подробно рассматриваются инерциальные системы управ¬ ления, так как они наиболее распространены. 7.2. ИНЕРЦИАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ Принцип действия Для измерения пространственного вектора ускорения на ЛА рас¬ полагают три акселерометра, Рис. 7.1. Принципиальная схе¬ ма акселерометра: /—корпус акселерометра; 2— инерциэнная масса—чувстви¬ тельный элемент акселерометра; 3—пружина*. 4—нет.ка потенцио¬ метра; 5—потенциометр оси чувствительности которых обыч¬ но образуют ортогональную систему координат. Выясним сначала, какие же ускорения измеряет акселе¬ рометр? На инерционную массу пг действуют следующие силы (рис. 7. 1). 1. Сила упругой деформации пру¬ жины /, которую в установившемся состоянии будем считать пропорцио¬ нальной отклонению х инерционной массы m от ее нейтрального положе¬ ния: f—kx, где f — реакция со сто¬ роны корпуса акселерометра на массу т, передаваемая через пру¬ жину. Действительно, если ускоре¬ 138
ние ЛА х направлено вдоль оси X слева направо (см. рис. 7. 1), то масса т отклоняется влево. Масса отклоняется в сторону, проти¬ воположную ускорению х. 2. Гравитационная сила Fx обусловлена притяжением массы т внешними материальными телами: Землей, Солнцем, Луной, звез¬ дами и т. п. Гравитационные силы приложены непосредственно к массе т, так же как и к каждой материальной точке корпуса аксе¬ лерометра. Под действием этих сил как масса т, так и корпус аксе¬ лерометра получают одинаковые ускорения. Поэтому деформация пружины под действием гравитационных сил отсутствует. Таким образом, если за показание акселерометра принимать отклонение его массы от нейтрального положения, то оказывается, что акселе¬ рометр измеряет ускорение, равное разности между абсолютным и гравитационным ускорением. Это ускорение часто называют кажу¬ щимся. Если бы человечество научилось управлять гравитационными полями, создавать их и осуществлять разгон и торможение ЛА с помощью гравитационных полей, то экипаж и ЛА могли бы пере¬ носить любые сколь угодно большие гравитационные ускорения и ЛА приобрел бы большую скорость за короткий промежуток времени. Выяснив, какие силы действуют на массу т, можно записать дифференциальное уравнение ее движения в инерциальной (не¬ подвижной) системе координат OX^Y^Z^ mx1=FJc^-f, (7. 1) где Fx— проекция равнодействующей гравитационных сил, прило¬ женных к массе т, на ось ОХИ, которая в данный момент направ¬ лена по оси измерения акселерометра X. Движение массы т отно¬ сительно корпуса акселерометра вдоль других осей ОУИ и OZ^ ограничено связями. В уравнении (7.1) принято, что направление сил Fx и f совпадает с направлением оси Хи. В общем случае знак каждой из них может быть произвольным. В правую часть урав¬ нения (7.1) следовало бы добавить член kx, пропорциональный ско¬ рости х перемещения массы т относительно корпуса акселеромет¬ ра. При введении этого члена уменьшается колебательность систе¬ мы и длительность переходного процесса. Поскольку интерес представляет показание акселерометра в установившемся состоя¬ нии, то для простоты изложения член kx можно не вводить. Раз¬ решая уравнение (7. 1) относительно силы f, получаем f—mxx~ Fx. (7.2) Разделив левую и правую части последнего соотношения на т и учитывая, что f=kx, найдем выражение для отклонения х инер¬ ционной массы от нейтрального положения kxtn~x =f ~ хх —F хпг\ (7.3) 139
т. е. акселерометр измеряет абсолютное ускорение за вычетом гра¬ витационного Fxtn~x. К такому же заключению можно прийти из чисто качественного рассмотрения работы акселерометра. Рассмот¬ рим некоторые частные случаи движения объекта с акселеро¬ метром. 1. Пусть под действием гравитационного поля Земли ЛА начи¬ нает падать (сопротивлением воздуха будем пренебрегать). Масса т акселерометра будет испытывать те же ускорения, что и падаю¬ щее тело. При этом гравитационная сила Земли приложена непо¬ средственно к каждой частице массы т, которая не будет испыты¬ вать реакции со стороны пружины, так как последняя остается и нейтральном положении, т. е. акселерометр не измеряет ускорения, создаваемого полем Земли. Так как акселерометры не измеряют гравитационных ускорений, то для того, чтобы инерциальная система могла вычислять коорди¬ наты местонахождения объекта, необходимо каким-то образом в- систему счисления пути вводить сигнал, пропорциональный векто¬ ру гравитационного ускорения. Но поскольку вектор гравитацион¬ ного ускорения изменяется при перемещении объекта и, кроме того, его положение относительно чувствительных осей акселерометров изменяется, то возникает сложная задача создания специального вычислительного устройства для выработки сигнала, пропорцио¬ нального гравитационному ускорению, и для ввода его в соответст¬ вующие показания акселерометров. Если оси измерения акселеро¬ метра ориентировать перпендикулярно гравитационному ускоре¬ нию, например, путем установки их на гиростабилизированной в горизонте места платформе, то отпадает необходимость ввода по¬ правки на гравитационное ускорение. 2. Пусть ЛА стоит неподвижно на стартовой площадке. В этом случае масса щ очевидно, будет находиться в отклоненном состоя¬ нии (вниз). Разберемся, какая сила вызвала это перемещение. Как отмечалось выше (см. рис. 7.1), масса т отклоняется в сторону, противоположную действующему ускорению х. Следовательно, ус¬ корение направлено вверх. Но вверх действует сила N — реакции опоры, численно равная силе тяжести G: |N| = |G|. Таким обра¬ зом, в данном случае отклонение массы т (показание акселеро¬ метра) вызвано силой реакции N. 3. Летательный аппарат совершает горизонтальный полет. В этом случае масса т акселерометра, ось чувствительности которо¬ го перпендикулярна местному горизонту, опустится вниз. Ускорение здесь вызвано действием подъемной силы Ya, которая в горизон¬ тальном полете численно равна силе тяжести самолета: | Ya| = |G|. Приведенные примеры достаточно наглядно иллюстрируют тот факт, что акселерометры не измеряют гравитационных ускорений. Каким же образом по показанию акселерометров осуществляется определение скорости и местоположения ЛА, т. е. как решается основная задача навигации? Очевидно, для формирования сигнала, пропорционального- пол- 140
ному ускорению €гь необходимо к величине выходного сигнала ак¬ селерометра (7.3) добавить сигнал равный проекции грави¬ тационного ускорения на ось измерения акселерометра x1=ax-^Fxnr\ (7.4) где ax = kxm~i — ускорение, измеряемое акселерометром Интегри¬ руя (7.4) дважды, получим t •*1„ = f kx (t)\FX (t) nr'] dx+x10; (7.5) [Лд.(т(—|—Л x (т) m dxdx -f- x^t *-{- 0 0 где iin, %in — приборные значения абсолютной скорости и пройден¬ ного расстояния; хю, %ю— начальное значение абсолютной скорос¬ ти и начального положения ЛА. Для фактического определения местоположения ЛА и его ско¬ рости необходимо знать гравитационное ускорение Fx(x)m~x в каж¬ дой точке пространства, через которую проходит траектория ЛА> и соответствующим образом вводить дополнительный сигнал со¬ гласно формуле (7.4). При перемещении ЛА в трехмерном пространстве необходимо иметь три акселерометра, оси чувствительности которых обычно располагаются перпендикулярно друг другу. В этом случае соотно¬ шения (7.4), (7.5) справедливы и для координат у\ и Z\. При вы¬ числении г/m, yin, iin, Zin необходимо формировать и подавать в ин¬ теграторы сигналы Fy(%)rrr\ учитывающие соответству¬ ющие гравитационные ускорения в проекции на оси ОУИ, OZU. При решении многих задач навигации оказывается возможным вектор гравитационного ускорения ввести в интеграторы более простым способом: в виде постоянного сигнала, равного его значению в точ¬ ке старта (например, равным g при старте с Земли), или в виде известной функции времени или координат. Обычно представляет интерес пройденное расстояние и скорость не в абсолютной, а в относительной системе координат. Так, при движении вблизи поверхности земли удобно вести отсчеты относи¬ тельно некоторой земной системы координат: широта и долгота места, высота и скорость полета. В связи с этим возникает задача пересчета координат из абсолютной системы в относительную. Для этих целей создается специальное вычислительное устройство. Имеется большое разнообразие инерциальных систем навига¬ ции. Описанная выше схема называется аналитической: в этой схе¬ ме чувствительные оси акселерометров X, Y, Z во все время движе¬ ния удерживаются неизменно ориентированными относительно инерциальной системы координат ОХИУИХИ (см. рис. 7.1). В других схемах инерциальной навигации акселерометры подвижны. Очень 141
часто создаются схемы, в которых оси чувствительности двух аксе¬ лерометров удерживаются во все время движения в горизонте мес¬ та, а ось третьего акселерометра направляется по вертикали места. В таких схемах инерциальной навигации вычислительное устройст¬ во менее громоздко, но при этом создается следящая система, при¬ водящая оси акселерометров в заданное положение. В последнее время в связи с успехами вычислительной техники и увеличением точности акселерометров появились бесплатформенные системы навигации. Однако в настоящее время большинство инерциальных схем на¬ вигации включает в себя одно-, двух- или трехосную гироплатфор¬ му, которая обеспечивает нужную ориентацию акселерометров от¬ носительно заданной системы координат. Эти гироплатформы, в частности, могут удерживаться в заданном положении на основе принципа силовой гиростабилизации или путем создания высоко¬ качественной следящей системы (см. гл. 2). Во многих инерциаль¬ ных схемах навигации используется гироплатформа с так называе¬ мой интегральной коррекцией. В этих схемах гироплатформа по сигналам с первых интеграторов удерживается в горизонте места. Ниже описан принцип работы такой схемы, а также рассмотрена реализация невозмущаемой вертикали в гироплатформах с интег¬ ральной коррекцией. Геоцентрические ускорения ЛА При построении инерциальных систем навигации необходимо знать выражения для составляющих абсолютных ускорений центра масс ЛА в проекции на измерительные оси акселерометров. Положим, что оси измерения двух акселерометров (восточного и северного) во все время движения удерживаются в горизонтальном положе¬ нии, а третьего — по вертикали места. Введем подвижную систему координат OXYZ. Начало коорди¬ нат О совместим с центром масс ЛА, а ось X направим на север, Z — на восток и У — по геоцентрической вертикали места (рис. 7.2). Для простоты выкладок будем считать, что Земля есть шар радиу¬ са 7? и что ее масса распределена равномерно. В этом случае гра¬ витационная вертикаль места совпадает с направлением радиуса Земли в этой точке. При решении задач динамики полета ЛА вблизи поверхности Земли оказывается достаточным взять в качестве инерциальной (неподвижной) экваториальную систему координат Oi*Xi*Yi*Zi*, начало которой совпадает с центром масс Земли, ось Zi* направле¬ на на северный полюс Земли, оси %i* и У1* лежат в плоскости не¬ бесного экватора так, что ось Xi* направлена в точку весеннего равноденствия Y, а ось У1* направлена так, чтобы образовать пра¬ вую систему координат. В соответствии с приведенным определе¬ нием в экваториальной системе координат принимается, что центр масс Земли неподвижен, т. е. пренебрегаем влиянием годового 142
г Рис. 7.2. Экваториальная Х/У/Z/ и горизонтальная географическая XYZ системы координат движения Земли относи¬ тельно Солнца на динами¬ ку полета ЛА, а также движением Солнечной си¬ стемы в целом. Поскольку экваториальная система координат не участвует в суточном вращении Зем¬ ли (одна из ее осей на¬ правлена в точку весен¬ него равноденствия Y)»’ вращение Земли вокруг своей оси учитывается при изучении динамики полета ЛА. Для определения ко¬ ординат места ЛА относи¬ тельно поверхности Зем¬ ли введем в рассмотрение геоцентрическую правую ортогональную систему координат Х/У/Z/ (см. рис. 7.2), начало которой совпадает с центром Зем¬ ли, оси X/, У/ лежат в плоскости экватора, при этом ось X/ про¬ ходит через Гринвичский меридиан. Положение ЛА на траекто¬ рии определяется: 1) радиус-вектором g=R+h, где g — радиус- вектор начала О подвижной системы координат; R — радиус Зем¬ ли; h — высота полета ЛА; 2) геоцентрической широтой ср; 3) долготой X, отчитываемой от плоскости Гринвичского меридиа¬ на. Геоцентрическая система координат вращается относительно экваториальной с угловой скоростью суточного вращения Земли со, а их взаимное положение определяется углом SrP. Абсолютное ускорение /а центра масс ЛА задается формулой (7. 6) где ij', z—проекции абсолютных ускорений на оси X, У, Z под¬ вижной системы координат, a i, j, k — орты этих осей; <о0 — вектор угловой скорости подвижной системы координат OXYZ, являющий¬ ся геометрической суммой вектора ю угловой скорости суточного’ вращения Земли, направленного по оси Oi*Zi*, и вектора о)ЛА угловой скорости ЛА при его перемещении относительно Земли (йо = о) +(ола . В свою очередь, о>ЛА можно представить в виде двух векторов: 1)т*/р, возникающего вследствие перемещения ЛА в се¬ верном направлении и 2) z/pcoscp, возникающего вследствие поле¬ та ЛА на восток. Вводя единичные орты k, ki* осей Z и Zi*, имеем (см. рис. 7.2) (оЛА = —хр_1к+г(р cos(p)_Iki*. Подставляя значение о>ЛА в формулу о)о=<о+'0)ЛА , приходим к следующему выражению 14а
для вектора угловой скорости подвижной системы координат OXYZ: oo = (o+z(q cos ф)-!к1*—хр_1к. Проектируя вектор со0 на оси под¬ вижной системы координат, находим сох = о) cois ср-|-.гр--1; а)^ = (п sin ср -j- гр-1 tg ср; хр-1. (7.7) Вектор скорости центра масс ЛА q можно представить в виде (см. рис. 7.2) p = xi -\-h j + (^Q cojscp-(-^)k, (7. 8) где cop cos <p — скорость перемещения центра масс ЛА, вызванная вращением Земли вокруг своей оси; х, h, 2— составляющие скоро¬ сти центра масс ЛА в проекции на оси X, Y, Z, обусловленные пере¬ мещением ЛА относительно поверхности Земли. Взяв локальную производную от вектора (7.8), найдем j + + cos ср — ox sin ср) к. (7. 9) При выводе этой формулы учтено очевидное соотношение х= = рф. Используя формулы (7.7), (7.8), найдем выражение для век¬ торного произведения (dQXdqldt\ i со cois ср гр-1 х со sin ср Ц- р_1г tg ср — хр~1 h сор cos cp-j-Z = [(сор cos ср -f- г) (со sin cp4-^P_1tg ср)4-хйр-1] i 4~ [ — -^2Р~1 — — (со COIS ср 4" 2р-1) (ШР COS ср 4~ г)] j 4- [Лео COS ср 4“ 4-гЛр-1 — сох sin ср — zxp_1tgcp]k. (7. 10) Подставляя формулы (7.9), (7.10) в соотношение (7.6) и при¬ равнивая выражения при одинаковых ортах в обеих его частях, получим формулы для проекций абсолютного ускорения ЛА: х' = х4-хЛр_14-2со2 sin ср4~0,5рсо2 sin 2cp4~z2p_1 tg ср; у' = Л — (х24’22)р~1 — 2сог cosep —рсо2 cos2ср; (7. И) z' = z — хгр-1 tg ср — 2сох sin ср 4- 2сой cos cp4-z/zp_1. Правые части формул (7.11) содержат: 1) относительные ускоре¬ ния х, Л, z (эти ускорения необходимо знать, чтобы, интегрируя их, вычислить сначала скорость, а при повторном интегрировании — пройденный путь); 2) кориолисовы и переносные ускорения (все ос¬ тальные слагаемые). Из этих формул легко получить выражения для любых ускорений. В частности, решая их относительно Дх, Ду, ДУ, найдем Дх=х' —x=x/£q“14-2<dz sin ср4"0,5qo)2 sin 2ср 4-^2Q—1 tg ср; Ьу=у' — y = — (x24-22)q-1 —2(dz coisep —qco2 cas2cp; (7. 12) Дг = г'~2 = — хгр-1 tgcp —2o)x.sin cp4-2a)A coiscp4-iAp“1, 144
которые можно назвать методическими ошибками. Они подлежат компенсации при построении инерциальной системы навигации. Ускорения х, z измеряются акселерометрами, оси чувствительности которых во время перемещения ЛА направлены на север (ось ОХ) и восток (ось OZ). в мо- подвиж- и Неподвижная О0А11Г11 ная OXY система координат Гироплатформы с интегральной коррекцией Рассмотрим работу гироплатформы с интегральной коррекцией для частного случая полета — полета ЛА на неизменной высоте по ме¬ ридиану с севера на юг (рис. 7.3). При описании работы вертикали будут использованы следую¬ щие системы координат: 1) неподвижная система координат ХИУИ, начало которой мент старта ЛА совпадает с цент¬ ром карданового подвеса гиро¬ платформы (ГП), ось Уи направ¬ лена по геоцентрической вертика¬ ли места старта, а ось Хи — в на¬ правлении движения ЛА и пер¬ пендикулярна Уи; 2) подвижная система коорди¬ нат ХУ, начало которой совпада¬ ет с центром карданового подвеса гироплатформы, ось У направле¬ на по геоцентрической вертикали места, а ось X лежит в горизон¬ тальной плоскости и направлена в сторону движения. Полагаем, что в начальный момент движе- ния_кинетический момент гироско¬ па Но совпадает с осью У, а следовательно, и с осью Уи. Акселеро¬ метр (А) жестко закреплен на гироплатформе. Его ось измерения должна быть направлена по оси X. Связь между пройденным рассто¬ янием в угловой ф и линейной S мере выражается формулой ф=£Д), где q — расстояние от центра масс Земли до центра масс ЛА, т. е. q — радиус сферы, по которой перемещается ЛА. При перемещении ЛА гироплатформа должна поворачиваться до положения местной горизонтали на тот же угол ф. Однако практически она поворачи¬ вается на некоторый (приборный) угол фп, отличный от ф, что приводит к ошибке а в положении гироплатформы (а=ф—фп). Разворот гироплатформы с интегральной коррекцией осуществля¬ ется следующим образом. Акселерометр с передаточным коэффици¬ ентом kx, расположенный на гироплатформе, измеряет абсолютное ускорение х'. Из приборного значения ускорения х^ вычитается методическая поправка kx\Xx, содержащая переносные и кориолисо¬ вы составляющие ускорения [см. формулы (7.11), (7.12)]: х/—Лх = =хп. Далее сигнал хп поступает на первый интегратор (рис. 7.4). 145
На выходе первого интегратора имеется приборное значение ско¬ рости движения Vn, которое используется для формирования мо¬ мента коррекции в моментном датчике гироскопа, расположенного на гироплатформе; ЛТк=^з^п + /г, где п— постоянный сигнал, вели¬ чина которого подлежит определению; £3— постоянный коэффици¬ ент, величина которого будет выбрана из условия невозмущаемости гировертикали Vn = J xndt\ хп— приборное значение относительно¬ го ускорения. Под действием момента коррекции Л4к=£31/п + п- кинетический момент гироскопа Hq будет прецессировать с угловой скоростью фп = <///о = (^н4-/г)/Яо, ' (7.13) что приведет к повороту гироплатформы в горизонт места на угол io Фп=^Фп^- При угле а=т^0 акселерометр будет измерять ускорение (см. рис. 7.3, 7.4, 7.5) ах = х' cos a + yz sin a^x' + y'a. В приведен¬ ном выражении у' sin ахуа является составляющей ускорения у' б проекции на ось измерения акселерометра. Эта составляющая ускорения измеряется акселерометром, что приводит к ошибке опре¬ деления местоположения ЛА. Для выбранных условий полета с точностью до методической ошибки можно считать, что составляю¬ щая у' численно равна ускорению g. При этом сигнал на выходе акселерометра с учетом предыдущей формулы будет равен (см, рис. 7.5) хп= (х' cos a+g sin a)£x= (x'-\-gu) kx. В соответствии co структурной схемой, представленной на рис. 7.4, вычтем из изме¬ ренного значения х^ методическую поправку kxkx: хп = kxxr cos a — kxLx kxg sin o^kxx' -f- kxgu — -kx/ix=(s+ga)kx, (7.14) где s=x—А£. Сигнал хп, определяемый последней формулой, по¬ ступает на первый интегратор. Попробуем подобрать постоянные параметры k3 и п в выраже¬ нии для момента коррекции Л4к=£з1/п + я такими, чтобы во время движения гироплатформа находилась в местном горизонте. Очевид¬ но, математическим выражением последнего утверждения является выполнение условия а(7) =0. Прежде чем решить этот основной вопрос, посмотрим, к каким ошибкам может привести невыполнение условия а(/)=0. Для при- Рис. 7.4. Структурная схема гироплатформы с интегральной коррек¬ цией 146
Рис. 7.5. Схема измере¬ ния ускорения акселе¬ рометром мера положим, что угол а=0,001 рад=3,4' и время работы инерциальной системы равно 1000 с. Ошибка в измерении ускорения в соот¬ ветствии с формулой (7.14) составит что приведет к ошибке измерения скорости AV = gat и пути Ax = 0,5^czZ2. Подставляя чис¬ ленные значения а и /, найдем, что ошибка в счислении пути составит Дх=5000 м. Как вид¬ но, ошибка в ориентации платформы даже в 3—4 угловые минуты приводит к значитель¬ ным ошибкам в счислении пути, которые пропорциональны квадра¬ ту времени работы системы. Вернемся к основному вопросу — к выводу условия невозмущае- мости вертикали в гироплатформах с интегральной коррекцией. Сигнал Vn на выходе первого интегратора при а(7)^0 в соответст- t вии с формулой (7.14) можно представить так: Vu= (sga) kxdx. о Подставляя значение Кп из последней формулы в выражение (7.13) и дифференцируя, находим Фп=Мз(« + 5'а)Лг^1- (7.15) Продифференцировав дважды соотношения ф = 5р-1, ф = фп + а, найдем ф = 59-1, ф=фп-|-а. Приравнивая правые части последних равенств, получаем следующее соотношение: $р_1 = фп-|-а. Под¬ ставляя значение фп из формулы (7.15) в последнее соотношение, получаем линейное неоднородное уравнение a-\-kxk3gH'o1a = SQ~1 — kxk3sHn\ (7. 16) которое описывает динамику приведения гироплатформы в гори¬ зонтальное положение. Левая часть этого уравнения описывает соб¬ ственные свойства гироплатформы как динамической системы; правая часть задает возмущения, вызванные перемещением ЛА. Система должна так отработать возмущения, чтобы гироплатформа находилась в местном горизонте (а(/)=0) все время движения. Для этого необходимо, чтобы тождественно равнялось нулю част¬ ное решение уравнения (7.16): a*(Z)=0. Это можно получить пу¬ тем выбора параметров гироплатформы так, чтобы правая часть уравнения (7.16) обращалась в нуль: р_1 + /гх^з/Яо=О. Из послед¬ него условия находим значение одного из параметров гироплат¬ формы: kxk2> = k = HQ^. (7. 17) При выполнении условий (7.17) гироплатформа будет невозму- щаемой по отношению к ускорению £. Подставляя значение kxk3 из формулы (7.17) в уравнение (7.16), получим так называемое урав¬ нение маятника Шулера « + gQ_1a = 0. (7. 18) 147
Решение этого уравнения — незатухающие гармонические колеба¬ ния. Период этих колебаний при р = 7? будет Т = 2л “j/’Q/g- = 84 мин 20 с. Этот период называется периодом маятника Шулера. Решение однородного уравнения (7.18) будет равно нулю при нулевых на¬ чальных условиях: ао=О, ао=О. Первое условие означает, что в начале движения кинетический момент Яо направлен по верти¬ кали места старта, т. е. по оси Уи. Второе условие ао = О означает, что в начальный момент угловая скорость дрейфа гироплатформы равна нулю. Абсолютно точно оба эти условия не выполняются, ка¬ кие-то отклонения обязательно имеют место. Оказывается возмож¬ ным так выбрать параметр п, что, несмотря на наличие некоторой скорости Vo в начальный момент, можно теоретически удовлетво¬ рить условию ао=О. Действительно, из соотношения «=ф—фп имеем а=ф—фп. Подставляя ф = 5/р и фп из равенства (7.13) в последнее соотношение, находим, что а=$Д)—(&зУп + ^)/7/о. Так как Рп=0 при /=0, то из последнего уравнения находим значение п при «о=О: п — Hqso/q. Последняя формула задает второй пара¬ метр п момента коррекции MK = k3Vn-[-n. Найдем выражение для этого момента с учетом полученных выражений для параметров k (7.17) и n = HQso/Q: Мк=s0H o/q + Ипя о/е^л- = но (s0 + VnlkxYlQ=н<У/е = kV, т. е. момент коррекции пропорционален полной скорости. Таким, образом, путем определенного выбора параметров гироплатформы и следящей системы можно добиться невозмущаемости гироплат¬ формы к ускорению 5 центра масс ЛА. Полезно на полученный результат посмотреть с точки зрения теории дифференциальных уравнений: для достижения невозмуща¬ емости (инвариантности) рассматриваемой системы были подобра¬ ны такие коэффициенты уравнения (7.16), что оно из неоднородно¬ го стало однородным, частное решение которого тождественно рав¬ но нулю. Следовательно, достигнута инвариантность по отношению к возмущению s — относительному ускорению. В теории автоматического регулирования неоднородное линей¬ ное уравнение можно свести к однородному несколькими способа¬ ми. Один из них приведен выше: путем надлежащего выбора пара¬ метров регулятора удается частное решение дифференциального уравнения, описывающего работу рассматриваемой системы, сде¬ лать равным нулю, т. е. избавиться от статической ошибки системы. В другом случае создается дополнительный канал (принцип двухканальности) для компенсации возмущения и достижения ин¬ вариантности, предложенный академиком Б. Н. Петровым. Система из неоднородной делается однородной, частное решение которой равно нулю, и статизм в системе, следовательно, отсутствует. При этом, говоря об инвариантности системы, необходимо указывать, по отношению к какому возмущению и координате рассматривает¬ ся инвариантность системы. 148
И, наконец, неоднородное уравнение можно свести к однород¬ ному путем введения интеграла в закон управления. В настоящее время существует несколько условий невозмущен- ности в теории построения инерциальных систем навигации. В част¬ ности, имеется условие невозмушенности для так называемой ана¬ литической вертикали. В этой схеме гироплатформа вместе с рас¬ положенными на ней акселерометрами неподвижна относительно инерциального пространства. В принципе, используя возможности современной теории управления, можно всегда добиться невозму- щаемости системы (координаты) к какому-либо возмущению с не¬ обходимой для практики точностью. Построение инерциальной системы управления (примеры) Пример 1. На рис. 7.6 представлена структурно-функциональная схема ЛА с автопилотом и гироплатформой. Гироплатформа приводится в горизонтальное положение посредством интегральной коррекции так, что оси измерения двух акселерометров, расположенных на гироплатформе, находятся все время в гори¬ зонте места и направлены на север (канал А) и на восток (канал Z). Каналы включают вычислители (/—Л'), (/—Z) ускорений Ах, Ау, реализующие алго¬ ритмы (7.12). В контуры II—Z и II—X входят гироплатформа (1/Яор), интегра¬ торы (kjp и fe/p), акселерометры (kx и kz), усилитель (7г3), задающий закон создания коррекционного момента, а также ряд кинематических звеньев (1/р2 Q cos <р, 1/р2 Q, г/1), осуществляющих связь между некоторыми координата¬ ми рассматриваемой системы. Ниже приведено описание функционирования сис¬ темы. Если бы гироплатформа была строго в горизонте места, т. е. a(t) = О, то на вход акселерометра поступила бы составляющая х' ускорения ЛА в проекции на ось измерения Хаке- Но так как угол а между осью Хакс и горизонтом места отличен от нуля, то акселерометр измеряет также проекцию вертикальной сос¬ тавляющей ускорения у' на ось измерения Хакс (см. рис. 7.5) при &х = 1, т. е. хи' = х'cos a+pz sin а^х'+#'а. Из величины выходного сигнала хи' вычитается методическая поправка Ах (хи = хи'—Ах). Далее сигнал поступает на первый и второй интеграторы. Сигнал Ухп на выходе первого интегратора используется для формирования момента коррекции в моментном датчике гироскопа, установленном на гироплат¬ форме, в соответствии с формулой MK = ks Vx +л. Момент коррекции Мк пово¬ рачивает гироплатформу на угол фп, который в идеальном случае должен быть равен углу ф — пройденному расстоянию ЛА в угловой мере. В реальных усло¬ виях полета возникает некоторый угол рассогласования а = ф—фп, что приводит к ошибке у'а в показании акселерометра. Аналогичные процессы протекают в канале Z (восточный канал). Сигналы с первого и второго интеграторов поступают (см. контур III на рис. 7.6) на вход вычислителя сигнала рассогласования (ВСР). Туда же посту¬ пают сигналы с программного механизма (ПМ) или с вычислителя координат ки¬ нематической траектории. С вычислителя сигнала рассогласования команды по¬ ступают в автопилот (АП). Автопилот воздействует на режим полета ЛА, изме¬ няя его траекторию в соответствии с командами управления. Для компенсации ухода гироплатформы из горизонта места вследствие вра¬ щения Земли и для удержания гироплатформы в азимуте, т. е. чтобы северный акселерометр был направлен на север все время движения ЛА, необходимо гиро¬ платформу дополнительно разворачивать относительно осей X и Y (см. пояснения в примере 2). Для невозмущаемости гировертикали необходимо выполнение условия kzktkz =kxkik3=kt где коэффициент k определяется формулой (7.17) 149
Рис. 7.6. Структурно-функциональная схема ЛА с автопилотом и гироплатформой: /—Л—вычислитель северного капала; II—X—северный канал; X— вычислитель восточного канала; II—Z—восточный канал 150
Рис. 7.7. Кинематическая траек тория ЛА Пример 2. Рассмотрим работу системы управ¬ ления движением центра масс ЛА, предназна¬ ченного для фотографирования местности. Пусть необходимо сделать съемки некоторой полосы MiM2, ориентированной относительно точки стар¬ та известным образом (рис. 7.7). Траектория, представленная на рис. 7.7, состоит из рабочего участка MiM2y на котором осуществляется фото¬ графирование местности, участка CLM± взлета и захода на рабочий участок и из участка М2ОП— возвращения к месту посадки на аэродром.- Систе¬ ма управления обеспечивает автоматический взлет, полет и посадку. На рис. 7. 8 представлена функ¬ циональная схема автопилота с гироплатформой, необходимыми приборами, оборудованием и логи¬ ческими устройствами, которые обеспечивают по¬ лет по заданной траектории. На гироплатформе установлены северный АЛг и восточный АЕ акселерометры. В счетно-решающем устройстве СРУ1 осуществляется-выработка методических поправок Ах и Az по формулам (7.12). СРУ1 соответствуют вычислители I—X и I—Z на рис. 7.6. Методические поправки Ах и Az вычитают из выходных сигна¬ лов акселерометров х' и z'. Полученные относительные ускорения хи и zH посыла¬ ются в первые интеграторы 1/р и далее на моментные датчики гироскопов 10. В моментных датчиках вырабатываются моменты коррекции Л4к = ^зУ+п. Под действием моментов коррекции гироплатформа «следит» за местным горизонтом с угловыми скоростями х/р и z/q [см. рис. 7.2 и формулы (7.7)]. Однако разворот гироплатформы с угловыми скоростями х/р и z/q не обеспечит гори¬ зонтальность гироплатформы. Действительно, вследствие вращения Земли гироплат¬ форма будет выходить из горизонта места с угловой скоростью —со.-г = —w cos ср [см. рис. 7.2 и формулы (7.7)]. Чтобы компенсировать этот уход, на моментный датчик 10 (см. рис. 7.8) необходимо подать сигнал со cos ср. Теперь платформа не выйдет из местного горизонта. Если не принять соответствующих мер, гиро¬ платформа, оставаясь в местном горизонте, будет поворачиваться в азимуте от¬ носительно вертикальной оси Y (см. рис. 7.2) с угловой скоростью (оу [см. фор¬ мулы (7.7)]: —coy = со sin ф + z tg ср/р. Если необходимо удержать гироплатформу от этого поворота, то на моментный датчик 10, который создает момент для по¬ ворота гироплатформы относительно вертикальной оси Y, необходимо подать сиг¬ нал, под действием которого гироплатформа поворачивалась бы относительно оси У с угловой скоростью Юу = со sin (p+z tg ф/р (см. рис. 7.8). В этом случае гиро¬ платформа будет удерживаться в горизонте и в азимуте, а оси измерения акселе¬ рометров, находясь в местном горизонте, будут направлены во время движения на север и восток. Первое слагаемое w sin ф в последней формуле компенсирует вертикальную составляющую вектора угловой скорости вращения Земли, а второе слагаемое z tg ф/р — вертикальную составляющую вектора угловой скорости (Одд летательного аппарата, возникающую вследствии перемещения ЛА относительно поверхности Земли. Все остальные блоки, приборы и устройства предназначены непосредственно для осуществления полета ЛА. Функции их заключаются в следующем. В счетно¬ решающем устройстве СРУП осуществляется переход от координат х и z к коор¬ динатам s и 6 по формулам s = x cos A+z sin A; d = x sin A + z cos А, где s и 3 — составляющие скорости ЛА, направленные соответственно вдоль расчетной траектории (на рабочем участке по направлению AfiM2) и перпендикулярно (рис. 7.9). Очевидно, чтобы избежать больших отклонений от заданной траекто¬ рии MiM2, необходимо так управлять вектором скорости V центра масс ЛА, чтобы боковая составляющая скорости б была мала и, следовательно, вектор V был направлен по расчетной траектории MiM2. С выхода СРУП сигналы s и 6 поступают на интеграторы 1/р. Полученные с интеграторов значения координат используются для управления ЛА следующим образом. 151
Рис. 7.8. Структурно-функциональная схема ЛА с автопилотом, гироплатформой, счетно-реша¬ ющими и программными устройствами: /—усилитель; 2—редуктор; 3—суммирующий усилитель; 4—усилитель мощности; 5—блок ДУСов; 6—автомат виража; 7—программное устройство; 8—спецаппаратура; 9— вариометр; 10—моментный датчик; //—разгрузочный двигатель; 12— блок свободных гироскопов; 13—уст¬ ройство для изменения режима полета Рис. 7.9. Кинематические элементы Сигналы боковой составляющей скорости б и бокового отклонения б направ¬ ляются в канал курса автопилота, на его суммирующий усилитель 3 (см. рис. 7.8). В результате руль направления отклоняется так, чтобы компенсировать бо¬ ковые отклонения б ЛА от траектории MiM2. Сигнал б вводится в канал курса для улучшения качества переходного процесса, для ликвидации нежелательной колебательности. Этот сигнал создает необходимое демпфирование в переходном процессе по координате б движения центра масс ЛА. Сигнал s— пройденное расстояние вдоль траектории, подается в програм¬ мное устройство 7. При старте в программное устройство 7 вводится ряд значений пути sb s2,..sn. Эти значения Si соответствуют точкам траектории, в которых программным устройством 7 должны быть выданы разовые команды типа: «произвести второй разворот», «включить аппаратуру» (например, фото¬ аппараты), «изменить высоту полета», «приступить к этапу посадки ЛА» и т. п. Разовые команды, посту¬ пающие на спецаппаратуру 8 (см. рис. 7.8), управля¬ ют работой этой аппаратуры. В автопилот входит блок демпфирующих гироскопов (ДУСов) 5 и блок свободных гироскопов 12 (см. рис. 7.8). В некоторых схемах углы Ф. ф, у снимаются с потенциометров ги¬ роплатформы, и блок свободных гироскопов 12 отсут¬ ствует. 152
Глава 8 СИСТЕМЫ САМОНАВЕДЕНИЯ 8.1. КРАТКАЯ ХАРАКТЕРИСТИКА Определение и классификация. Системы самонаведения характери¬ зуются тем, что они имеют специальное устройство, называемое головкой самонаведения, назначение которой — измерять координа¬ ты некоторого объекта относительно своего местоположения. Целью ЛА, на котором расположена головка самонаведения, является сближение с объектом. В качестве объекта может выступать кос¬ мический корабль, находящийся в аварийном состоянии; орбиталь¬ ная космическая станция; межпланетный космический корабль; самолет, нуждающийся в пополнении топливом и т. п. При рассмот¬ рении общих вопросов теории удобно все эти объекты назвать целью. В процессе сближения цель может бездействовать, нахо¬ диться в пассивном состоянии, в других же случаях цель может активно участвовать в процессе наведения. Головка самонаведения измеряет относительные координаты пели путем улавливания энер¬ гии, излучаемой или отражаемой целью. Используя информацию, поступающую с головки самонаведения, автопилот вырабатывает управляющие команды, по которым исполнительные устройства от¬ клоняют управляющие поверхности ЛА. Создаваемая ЛА боковая перегрузка обуславливает его полет в направлении к цели. Таким образом, в системах самонаведения выработка сигнала рассогласо¬ вания, формирование команды управления и его отработка осу¬ ществляются на борту ЛА. Если энергия, излучаемая целью, возникает вследствие физи¬ ческих процессов, сопутствующих полету, то системы самонаведе¬ ния называются пассивными. Если же цель излучает недостаточно энергии для ее обнаружения и измерения ее координат, то цель «подсвечивается» (облучается) и ЛА улавливает отраженный сиг¬ нал. При этом, если облучение осуществляется с борта ЛА, то си¬ стема самонаведения называется активной. Если же облучение осу¬ ществляется с третьего объекта, то система самонаведения называ¬ ется полуактивной. Существующие системы самонаведения исполь¬ зуют все перечисленные выше типы самонаведения. К полуактив- ным и активным системам самонаведения прибегают, в частности, б 1996 153
для более надежной связи с целью и обеспечения больших даль¬ ностей захвата пели головкой самонаведения. Работа головки самонаведения основана на улавливании энер¬ гии акустической или электромагнитной волны. Акустическая энергия (акустические головки) используется в диапазоне звука и ультразвука. В настоящее время в водной среде для целей самонаведения в ведущих морских державах использу¬ ется исключительно акустическая энергия. Электромагнитная энергия используется в диапазоне радиоволн, теплового излучения и видимого спектра. Соответственно головки самонаведения называются радиолокационными, инфракрасными (тепловыми) и оптическими. Прохождение электромагнитных волн в атмосфере Земли сопровождается сложными явлениями и степень их затухания для различных длин волн резко изменяется, что, в частности, объясняется сложностью состава воздуха и большой энергией, заключенной в электромагнитной волне. Большая скорость электромагнитной волны — 300000 км/с, хо¬ рошая проницаемость в воздухе и космосе позволяют создать си¬ стемы самонаведения с большим радиусом действия; временем пе¬ ремещения энергии от цели к ЛА практически всегда можно прене¬ бречь. Системы самонаведения широко используются в водной сре¬ де, атмосфере и космосе. Иерархическая система функционалов качества. Системный подход к проектированию систем управления. Так как конечным результатом наведения является выполнение ЛА своей задачи, то за основной, генеральный показатель совершенства системы наве¬ дения можно принять максимум вероятности Р выполнения ЛА своей задачи P=£{P(x)} = jQ(x)P(x)dx, (8.1) где Р(х)—плотность распределения вероятностей конечного про¬ лета, Q(x) —условный закон выполнения ЛА своей задачи; Q — область интегрирования; х— конечный пролет. Условный закон выполнения ЛА своей задачи задает вероят¬ ность выполнения ЛА своей задачи при определенном положении ЛА относительно цели. Чем ближе расположен ЛА к цели на за¬ данном направлении, тем большее значение принимает Q(x), так что в этом смысле Q(x) является монотонно убывающей функцией конечного пролета. Условный закон Q(x) выполнения ЛА своей за¬ дачи учитывает лишь расстояние х ЛА от цели, а направление, т. е. угловое положение относительно цели, не учитывает. В этом смыс¬ ле критерий (8.1) является приближенным. Критерий (8.1) отра¬ жает свойства системы управления и ЛА в целом и может рассмат¬ риваться при создании системы управления как генеральный кри¬ терий, которому должны быть подчинены и быть с ним согласованы другие частные функционалы, оценивающие работу системы управ¬ ления. Обычно в процессе проектирования систем наведения пара¬ метры отдельных звеньев системы выбирают таким образом; чтобы минимальное расстояние ЛА от цели, которое может быть достиг¬ 154
нуто в процессе наведения и называемое конечным пролетом, было минимальным, т. е. при проектировании добиваются создания та¬ кой системы управления, которая минимизировала бы конечный пролет. Поэтому в качестве критерия совершенства системы управ¬ ления можно принять минимум математического ожидания модуля конечного пролета хк: /1=£'{|4K|} = min) (8.2) или квадрата модуля конечного пролета I2=E {|хк|2} = min. (8. 2а) или, наконец, максимум вероятности попадания ЛА в заданную об¬ ласть местоположения цели. Выбор одного из перечисленных функ¬ ционалов может определяться, например, удобством решения зада¬ чи в целом. Критерии (8.2), (8.2а) подчинены и согласованы с гене¬ ральным (8.1) в том смысле, что чем меньше 1\ и /2, тем больше Р- Критерий (8.2) и (8.2а) отражают лишь динамические качества ЛА совместно с системой управления, в то время как критерий (8.1), учитывает более широкий круг условий, в том числе свойства ЛА и цели. По данным зарубежной печати для разных классов ЛА среднее квадратичное значение конечного пролета не должно превосходить 0,2 ... 13 м. Конечный пролет является существенной характерис¬ тикой ЛА и при его уменьшении увеличивается вероятность выпол¬ нения ЛА своей задачи. При решении задачи в детерминированной постановке в качестве функционала качества обычно берут мини¬ мум модуля пролета. При проектировании системы управления пользуются и другими функционалами качества, которые также должны согласовываться с генеральным критерием. Качество ЛА неотделимо от качества системы управления, сис¬ тема управления должна создаваться совместно с ЛА, в комплексе. Можно, например, путем установки более мощного и совершенного привода, несколько увеличив его массу и габариты, уменьшить ко¬ нечный пролет. Но вместе с тем увеличение массы и габаритов при¬ вода может привести к уменьшению полезной нагрузки ЛА. Следо¬ вательно, облик ЛА и системы управления должны создаваться из рассмотрения задачи в целом. И все же представляет практический интерес отыскать функционалы, критерии, которые бы отражали качество работы только системы наведения. Критерием совершенства системы управления имеет смысл при¬ нять какую-либо количественную оценку пролета, которая получа¬ ется вследствие отличия реальной системы наведения от некоторой идеальной. Сложность здесь заключается в разумном задании иде¬ альной системы управления. При заданном методе наведения за идеальную систему наведе¬ ния можно принять систему, которая осуществляет мгновенную пе¬ рекладку рулей в соответствии с заданной перегрузкой. Следова¬ тельно, будет учитываться только инерционность ЛА как объекта управления (от руля до перегрузки) и инерционность кинематичес- 155 6*
Рис. 8.1. Упрощенная функциональная схема системы самонаведения кого звена. Вся остальная часть системы будет описываться усили¬ тельным звеном. Построенная модель отражает маневренные воз¬ можности ЛА как объекта управления при заданном методе наве¬ дения. Применяя различные методы наведения, получим ряд моде¬ лей. Подобная модель системы наведения с идеальным автопило¬ том должна учитывать основные нелинейности, вносимые ЛА: мак¬ симально допустимые перегрузки, определяемые прочностью ЛА; ограничение располагаемых перегрузок при малых скоростных на¬ порах. Сравнение пролетов такой модели наведения со значениями пролетов реальной системы наведения позволяет оценить увеличе¬ ние пролета, вызванного неидеальностью системы наведения, нали¬ чием шумов на входе системы и т. п. В некоторых режимах полета ЛА удается построить модель, ко¬ торая позволяет оценить неидеальность информационной системы управления. Функциональная схема системы самонаведения. На рис. 8.1 представлена упрощенная функциональная схема системы самона¬ ведения ЛА на цель. Головка самонаведения измеряет относитель¬ ные координаты цели. Сигнал с выхода головки самонаведения по¬ ступает на фильтр и далее на устройство выработки команды управления. Команда /г3 поступает на рулевой привод, который отклоняет управляющие поверхности. Система обратных связей позволяет реализовать перегрузку, близкую к заданной. ЛА совер¬ шает маневр, сближаясь с целью по заложенному алгоритму уп¬ равления. Кинематическое звено устанавливает связь между относитель¬ ными координатами цели и нормальными перегрузками ЛА п и пе¬ ли Иц, которая не может быть непосредственно измерена головкой самонаведения. Выходом кинематического звена являются относи¬ тельные координаты, измеряемые головкой самонаведения, что поз¬ воляет замкнуть систему самонаведения. 8.2. УРАВНЕНИЯ КИНЕМАТИЧЕСКОГО ЗВЕНА. ПРОЛЕТ Уравнение кинематического звена. На рис. 8.2 изображено в плос¬ кости векторов V и 7Ц взаимное расположение ЛА и цели: точка ЛА соответствует центру масс ЛА, а точка Ц — центру масс цели. 156
Рис. 8.2. Кинематическая схема наведения ЛА на цель Ц Ось Xg характеризует направ¬ ление земной (неподвижной) системы координат; оси X, Хц направлены соответственно вдоль ^продольной оси ЛА и цели; V и Уц— векторы скоро¬ сти ЛА и цели; в — угол места цели; ц — угол упреждения; т]ц — курсовой угол цели; D — вектор относительной дально¬ сти; линия ЛАЦ называется линией визирования; g — угол пеленга цели. Из рассмотрения рис. 8.2 следует, что скорость сближе¬ ния по линии визирования и угловая скорость линии визирования выражаются дифференциальными уравнениями вида Ь = — V coysт] 4~1/ц cost]u, (8. 3) e = (V sin ц — sin т]ц)/£). (8. 4) Приведенная система уравнений выражает кинематическую связь относительного движения цели и ЛА. Из этой системы легко полу¬ чить уравнение кинематического звена, связывающего относитель¬ ные координаты ЛА с перегрузками ЛА п и цели пц. Действительно, дифференцируя уравнение (8.4) по времени и учитывая очевидные кинематические связи: е — ц + 0 = т|ц + 0Ц; е = г]4-*0 = т]ц+0ц, получим De-}-De = V sill Т] — 1/ц sin Т]ц-|-И COST] (е — *6) —1/ц COS Т]ц(е — 0ц). С учетом уравнения (8.3) это соотношение примет вид De Д-2Z9e = 1/ц9ц cost]u — VG cojS'n+Z7^), где F(t) = V sin ц—Уц sin т|ц — проекция касательных ускоре¬ ний V и Уц на нормаль п—п к линии визирования. Последнее урав¬ нение представим в виде De-\-2De = g (/гц собТ)ц — п cost])-}-/7 (/), (8. 5) где n^=V^lg, n=VQ/g — нормальная перегрузка соответственно цели и ЛА, а пц cos цц, п cos ц — их проекции на нормаль к линии визирования. Уравнение (8.5), являющееся уравнением кинематического зве¬ на, устанавливает искомую связь между перегрузками цели и ЛА и угловой скоростью е линии визирования. Относительно е уравне¬ ние (8.5) является линейным неоднородным уравнением второго порядка с переменными коэффициентами D и 2D. Коэффициент Ь в процессе полета может изменяться в несколько раз, а коэффици¬ ент D — от некоторого начального значения Z)o До нуля при сбли¬ 157
жении ЛА с целью. Таким образом, уравнение (8.5) является не¬ стационарным. Дифференцируя (8.3) и учитывая выражение D& из (8.4), полу¬ чим уравнение b — Dz2= — V6 sin т] +^Ц9Ц sin т]ц— V cost] +^u cosr]4, (8. 6) которое тоже является кинематическим. При исследовании процес¬ са наведения при помощи цифровых вычислительных машин урав¬ нение (8.6) совместно с (8.5) используется для создания полной нелинейной модели процесса наведения ЛА на цель. На более ран¬ них стадиях проектирования кинематические уравнения (8.5), (8.6) упрощаются. Если можно считать cos T]q=cos т]=1 ввиду малости этих углов, то уравнение кинематического звена (8.5) принимает вид Z)e + 2£)e=g‘(n4—п). Вводя оператор дифференцирования р = —dldt, последнее уравнение можно записать в виде (Dp2-\-21Jp)z=gbn, кп = Пц — п. Если оператор р рассматривать как параметр преобразования Лапласа, то последнее уравнение в предположении постоянства D и D можно записать в виде передаточной функции ^кин(/?) = е (/>)/'Дл(p)=glp(Dp + 2D). (8. 7) Выражение (8.7) может рассматриваться как передаточная функция кинематического звена только для отдельных участков траектории малой протяженности. Пролет. Конечным пролетом называется минимальное расстоя¬ ние ЛА от цели, которое достигается в процессе полета. Система наведения проектируется таким образом, чтобы конечный пролет был мал. Наряду с понятием конечного пролета имеется понятие мгновен¬ ного пролета. Вектор относительной скорости F0Th определяется путем геометрического сложения векторов скорости ЛА V и цели Ец:70тн=Е—Уц (см. рис. 8.2). В общем случае вектор F0TH будет составлять некоторый угол р, с вектором относительной дальности D. Угол ц называют мгновенным угловым пролетом. Величина перпендикуляра, опущенного из точки цели Ц на направление F0Tn, называется мгновенным пролетом. Из рассмотрения треугольника ЛААЦ непосредственно имеем x=D sin ц. С другой стороны, для угловой скорости е линии визирования имеем уравнение 8 = FoTHSin ц/Д которое эквивалентно уравнению (8,4), так как про^ екция суммарного вектора FOth равна сумме проекций векторов V и Уц. Подставляя значение sin ц из этого уравнения в соотношение x = Dsin ц, найдем выражение для мгновенного пролета х=£)2в/Уотн, (8.8) Так как угол ц мал, то скорость сближения Ь можно приближенно считать равной относительной скорости FOth: 158
PI — Иотн cos ц^Иотн- В этом случае точная формула пролета (8.8) может быть заменена приближенной *=D4/\D\. (8.9) Точность формулы (8.9) достаточно высокая: при расстояниях ЛА от цели, превышающих мгновенный пролет более чем в 5 раз, ошиб¬ ка вычисления пролета по приближенной формуле не превышает 2%. 8.3. МЕТОДЫ НАВЕДЕНИЯ Наведение ЛА на цель осуществляется путем реализации некото¬ рой стратегии, обычно называемой методом наведения. Все приме¬ няемые в системах самонаведения стратегии можно разделить на три группы. К первой группе относятся стратегии, при которых устанавлива¬ ется некоторая связь между направлением вектора скорости ЛА и линией визирования пели, например, стратегия, заключающаяся в том, что вектор скорости ЛА должен быть направлен по линии визирования цели. Этот метод наведения называется методом пого¬ ни, угол упреждения iq во все время движения ЛА должен быть равен нулю. В других стратегиях этой группы вектор скорости ЛА должен составлять некоторый угол упреждения ц, постоянный по величине в течение всего времени наведения или изменяющийся по некоторому закону. Ко второй группе относятся стратегии, при которых устанавли¬ вается некоторая связь между направлением продольной оси ЛА и линией визирования цели, например, стратегия, при которой про¬ дольная ось ЛА направлена по линии визирования цели, т. е. угол пеленга g=0. Этот метод наведения называется методом прямого наведения. В других стратегиях этой группы продольная ось ЛА составляет в процессе полета постоянный (g = const) или перемен¬ ный (g=var) угол с линией визирования цели. В третьей группе стратегий линия визирования цели должна за¬ нимать определенное положение относительно некоторого неизмен¬ ного направления. К этой группе относится, например, стратегия, при которой линия визирования цели составляет постоянный угол €== const с заданным направлением. Этот метод называется мето¬ дом параллельного сближения. В других стратегиях этого метода угол е будет изменяться по некоторому закону. Перечисленные стратегии не исчерпывают всех возможных ме¬ тодов наведения. Траектории полета ЛА к цели, получающиеся при осуществле¬ нии каждого из перечисленных методов наведения, без учета инер¬ ционности всей системы наведения, называются кинематическим,и траекториями. Эти траектории и их кинематические элементы от¬ ражают лишь некоторые общие закономерности методов наведе¬ ния. Важнейшей характеристикой каждого метода наведения явля¬ ются необходимые для его осуществления перегрузки. 159
Остановимся более подробно на методах третьей группы стра¬ тегии. Метод параллельного сближения (наведение в мгновенную точку встречи) При методе параллельного сближения угол упреждения q выбира¬ ется из условия 8 = 0, или Vsinq— y4sin-qu=0, т. е. проекции скорости ЛА (Vsinq) и скорости цели (V4sinq4) на нормаль к ли¬ нии визирования равны. Следовательно, линия визирования в про¬ цессе полета будет перемещаться параллельно самой себе. Очевид¬ но, угол упреждения будет равен q = arcsin (V4 siq т]ц/У). Так как |sinqu| ^1, то угол упреждения не может превосходить значения Л^Лтах= arcsin(7ц/V). Последнее условие задает область распо¬ ложения ЛА, из которой возможно осуществить встречу ЛА с це¬ лью по методу параллельного сближения. Если цель и ЛА не маневрируют, то угол упреждения будет по¬ стоянный, т. е. приходим к методу наведения с постоянным углом упреждения. Следовательно, если выбрать угол упреждения в соот¬ ветствии с методом параллельного сближения, то при F=const и Гц=const, оба метода будут совпадать. При этом ЛА встретится с целью в точке, называемой точкой встречи. Вводится также понятие мгновенной точки встречи для случая, когда цель и ЛА маневрируют. Это та точка, в которой встретились бы ЛА и цель, если начиная-с рассмотренного момента ни цель, ни ЛА не совершали бы маневра. Все семейство мгновенных точек встречи, вычисленных для каждого момента времени, описывает в пространстве некоторую кривую. Поэтому рассматриваемый метод наведения часто называют наведением в мгновенную точку встре¬ чи. Важная особенность метода параллельного сближения заклю¬ чается в том, что при k^l (У/Уц^1) и отсутствии помех необхо¬ димая перегрузка ЛА не превосходит перегрузок цели. Метод (пропорционального сближения В настоящее время в системах самонаведения ЛА широкое приме¬ нение приобрел метод пропорционального сближения. Согласно этому методу угловая скорость 0 вектора скорости ЛА пропорцио¬ нальна угловой скорости линии визирования е. Ь = кг. (8. 10) Этот метод при увеличении коэффициента усиления k трансформи¬ руется к методу параллельного сближения. Действительно, из уравнения (8. 10) имеем е = 0/£ и, следовательно, при k—>оо бу¬ дем иметь е—>0. При конечных значениях коэффициента /?, обычно не превышающих нескольких единиц, метод пропорционального сближения можно рассматривать как первое приближение'к мето¬ ду параллельного сближения. 160
При кинематическом исследовании установлено, что при конеч¬ ном значении k существуют прямолинейные траектории. Направле¬ ние этих прямолинейных траекторий (0 = 0) может быть получено из уравнения (8.4), в котором необходимо положить k&=Q = O. При k=l метод пропорционального сближения переходит в ме¬ тод наведения с постоянным углом упреждения 0=ig и 0 = е+'^о, где ео—угол визирования в момент начала самонаведения. Если в начальный момент вектор скорости ЛА направлен на цель, т. е. 8о=0, то метод пропорционального сближения переходит в метод кривой погони. Возможные способы реализации метода пропорционального сближения. Для осуществления наведения ЛА на цель важна не нормальная перегрузка, т. е. перегрузка, перпендикулярная векто¬ ру скорости ЛА, а составляющая перегрузки п<р , перпендикуляр¬ ная к направлению линии визирования цели (вектору дальности D). Именно под действием этой составляющей перегрузки враща¬ ется линия визирования цели. Выражение перегрузки и<р , нормальной к вектору дальности, через нормальную скоростную пУа и тангенциальную пХа пере¬ грузки имеет вид п(?=Пуа coist) + ^ sin т\ = Пуа cost) (l + /zXfltgT)MJ. (8. 11) Это соотношение указывает на зависимость nv от угла упрежде¬ ния и отношения nyjnx*, т. е. от аэродинамического качества. Значение п<? может значительно отличаться от нормальной скоро¬ стной пу и нормальной пу перегрузок. Обычно датчики перегрузок жестко укреплены на корпусе ЛА и измеряют перегрузки в связанной или скоростной системе коор¬ динат. В этом случае метод пропорционального сближения реали¬ зуется не в строгом соответствии с методом ^=^8, (8.12) а приближенно. Для ЛА с неподвижным крылом реализуется зави¬ симость ny=k&, а для ЛА с поворотным крылом—rtya = kz. В по¬ следнем случае корпус ЛА ориентирован по направлению вектора скорости и датчик перегрузки измеряет нормальную скоростную перегрузку. Нормальная скоростная перегрузка пУа мало отлича¬ ется от нормальной перегрузки пу при малых углах атаки. Значение перегрузки п? , нормальной к вектору дальности, мож¬ но получить путем пересчета перегрузок пу и пх по формуле n^=rty cos|-{-пх sin где g — угол пеленга цели. Знание перегрузки п<? позволит осу¬ ществить метод пропорционального сближения в соответствии с его определением. * При неработающем двигателе ЛА пУа!Пха ~ СУа/Сха- 161
Рассмотренные методы наведения задают лишь стратегию наве¬ дения ЛА на цель, кинематические траектории получаются без уче¬ та инерционности системы наведения. Исследование процесса наведения в шролетах Линеаризация уравнений кинематики (8.3), (8.4) в окрестности режима параллельного сближения. Линеаризуем уравнения кине¬ матики (8.3) и (8.4) в окрестности прямолинейных траекторий. Запишем систему уравнений (8.3) и (8.4) для режима параллель¬ ного сближения Z) = — У cQST)0 + V\casT]u„; De0=V sin т]0 — sin Пц„, (8.13) где индекс «О» означает режим параллельного сближения. Разла¬ гая каждый член уравнений (8.3), (8.4) в окрестности режима параллельного сближения в ряд Тейлора, учитывая только величи¬ ны первого порядка малости и вычитая из полученной системы со¬ ответствующие уравнения системы (8.13), получим уравнение в вариациях в предположении постоянства V и Уц = V cos (е090) (Де - ДО) - 1/ц cos (е0- 9Цо) (Де - Д0Ц). Это уравнение с учетом первого уравнения системы (8. 13) может быть представлено в виде DLz 4- О Де = - УД9 + УЦД9Ц, (8. 14) где V=V cos(e0 — б0), Иц=Кц cos (е0 — 9Цо). При сделанных допу¬ щениях дальность будет изменяться по линейному закону D — = DZ+Dt. Уравнение метода пропорционального сближения в окрестности режима параллельного сближения можно записать в виде Д6 = Ш. (8. 15) Уравнения (8. 14) и (8. 15) в совокупности образуют замкнутую систему уравнений, которая описывает процесс наведения ЛА на цель в окрестности режима параллельного сближения. Уравнение (8.15) задает закон изменения перегрузки, так как \n-V\Qlg, а уравнение (8.14)—уравнение кинематики. Подставляя Ай из (8. 15) в (8. 14), получим уравнение, описывающее процесс наве¬ дения ЛА на цель: 2)Дё + (2D-\-kV) Де = КЦД9Ц (8. 16) при следующих начальных условиях: /=/о=О, D=DQ, Де = Дё0. (8. 17) Уравнение (8. 16) является линейным нестационарным уравне¬ нием первого порядка относительно Де, решение которого с учетом (8. 17) представим в виде с
X (8. 18) Исследование интеграла (8.18) представляет значительные трудности. Исследование процесса наведения легко провести непо¬ средственно относительно пролета х. Дифференциальное уравнение пролета. Запишем формулу про¬ лета (8. 8) в вариациях Дх=£2ДеХтн. (8.19) Для исследования процесса наведения уравнения (8.14), (8.19) должны быть рассмотрены совместно. Исключая величину Де из уравнения (8.14) при помощи соотношения (8.19), получим диф¬ ференциальное уравнение пролета A*+gDAn cost)/PI = O/ W/A (8. 20) где Ап= VAQ/g— нормальная перегрузка ЛА; /(/)=Ицсо5(еов—0цо)^ц- Уравнение (8.20), связывающее пролет с перегрузками цели и ЛА, является уравнением кинематического звена, выраженного че¬ рез значение мгновенного пролета х. В связи с тем, что система наведения для уверенного сближения с целью должна обеспечить минимизацию пролета, представляет интерес исследование метода наведения, в котором перегрузка ЛА формируется непосредствен¬ но в функции мгновенного пролета. Динамика процессов наведения. Положим, что перегрузка созда¬ ется по закону n=k^D~'. (8.21) Уравнения (8.20) и (8.21) образуют замкнутую систему, опи¬ сывающую динамику процесса наведения без учета инерционности бортового контура. Подставляя значение перегрузки (8. 21) в урав¬ нение пролета (8. 20), получим x+b=Z)/(/)|D|-i, (8.22) где k=g созПоМД- Сначала рассмотрим прямолинейный полет цели /(f) =0. Реше- ние уравнения при этом будет иметь следующий вид х=СеЛ (8.23) где С — произвольная постоянная интегрирования, определяемая из начальных условий: х=хо при /=0. С учетом начальных усло¬ вий из (8.23) получим х=хоехр(—kt). Таким образом, при отсут¬ ствии маневра цели назначение системы наведения сводится к вы¬ бору начального пролета хо. При времени наведения /Нав>3/£ на¬ чальный пролет уменьшится до 0,05 хо. Следовательно, чем больше 163
коэффициент усиления k, тем быстрее уменьшается начальный про¬ лет, т. е. скорость уменьшения начального пролета можно регули¬ ровать соответствующим выбором k* ; в этом и заключается расчет контура наведения. Реализация закона наведения (8.21) крайне осложнена необходимостью измерения дальности D и скорости сближения D. Полагая, что цель маневрирует с постоянной перегрузкой f(t)=a и что относительная дальность D изменяется по закону D\=Dq— \Ь\ t, представим уравнение (8.22) в следующем виде: х_|_^х = (/н — /) а, (8. 24) где /н=£>о|£>|-1 — начальное расстояние ЛА до цели, выраженное в единицах времени. Так как правая часть уравнения (8.24) является полиномом первой степени от /, то частное решение х* уравнения (8. 24) будет иметь вид х*=А0+?М. После нахождения частного решения х* = = (/н— запишем общее решение уравнения (8.24) с учетом (8.23) х=Сехр(—kt) + (/н— t+k-l)ak~\ которое при на¬ чальных.условиях (/о=О, х=хо) примет вид х = хоехр (— Л/)4-а£-1 (4 + ^_1) (1 — ехр( — kty — atk-1. (8. 25) Решение (8. 25) позволяет сделать вывод, что после завершения переходного процесса (Z=Ai>3&-1) величина пролета будет равна частному решению уравнения (8.25) %=ak~}(tll — /+&-1) при Для момента встречи ЛА с целью (t=tu) пролет состав¬ ляет %=a/k2, таким образом, увеличивая коэффициент k, можно уменьшить конечный пролет. Но все же система наведения в целом является статической, так как установившееся значение выходной координаты х отлично от нуля. Если в закон регулирования (8. 21) ввести интеграл kx J D~4dt или повторный интеграл D~4dtd%r систему наведения в целом можно сделать астатической, однако при этом возникают трудности по обеспечению достаточного запа¬ са устойчивости. Рассмотренные здесь методы наведения не учитывают инерци¬ онности бортового контура. Для учета инерционности бортового контура закон создания перегрузки представим в виде п= = kx hW(p)D~\ где W(р) —передаточная функция бортового кон¬ тура, который может быть аппроксимирован апериодическим W(p) = (Гр-|-1)-1 или колебательным W(p) = (Т2р2 + 2%Тр + I)-1 звеном. Аналитическое исследование процесса наведения при уче¬ те инерционности бортового контура крайне затруднено. 8.4. ГОЛОВКИ САМОНАВЕДЕНИЯ Классификация. Головки самонаведения (ГСН) можно классифи¬ цировать по типу используемой энергии и конструктивному оформ¬ лению. 164
По типу используемой энергии и длине волны головки самона¬ ведения подразделяются на акустические, оптические, тепловые, радиолокационные. По конструктивному оформлению головки самонаведения бы¬ вают неподвижные и подвижные. В первом случае головка самона¬ ведения жестко связана с ЛА, во втором случае головка самона¬ ведения подвижна относительно ЛА. Подвижные головки самонаведения подразделяются на два класса: головки самонаведения, стабилизированные относительно неко¬ торого неподвижного направления, за которое принимают направ¬ ление вектора начальной дальности; следящие головки самонаведения, отслеживающие заданное на¬ правление, за которое принимают вектор текущей относительной дальности. По типу применяемого следящего привода различают: а) голов¬ ки самонаведения со следящей системой, основным элементом ко¬ торой является привод с высокой добротностью; б) головки само¬ наведения с гироскопической следящей системой. Рассмотрим ра¬ боту последних двух головок. Головка самонаведения со следящим (негироскопическим) при¬ водом. Назначение следящего привода головки самонаведения, жестко закрепленного на корпусе ЛА, сводится к вращению голов¬ ки таким образом, чтобы ее ось была направлена на цель. Тем са¬ мым осуществляется слежение за перемещениями цели относитель¬ но корпуса ЛА, т. е. отслеживание угла пеленга § (рис. 8. 3). Обо¬ значая через W(р) передаточную функцию разомкнутого следяще¬ го привода, найдем измеренное значение угла пеленга gK- ^=W(pW + W(p)), (8.26) а с учетом очевидного геометрического соотношения —О формула (8. 26) преобразуется к виду ?K = lF(/7)(e-&)/(l+UZ(p)). (8.27 Из анализа (8. 27) следует, что привод должен отслеживать изме¬ рение угла места цели е и угла тангажа Так как спектр угла е ниже спектра Ф, то полоса пропускания следящего привода должна быть очень высокой, достаточной для отработки угла $. При реа¬ лизации метода пропорционального сближения 9 = fee для измере¬ ния угловой скорости линии визирования е на антенну координато¬ ра цели устанавливают или с ней кинематически связывают дат¬ чик угловой скорости (звено р на рис. 8.4). Так как гироскоп работает в абсолютной системе координат, то он измеряет как уг¬ ловую скорость перемещения антенны gK, так и угловую скорость тангажа 4. На рис. 8. 4 введено звено, в котором осуществляется чисто кинематическое суммирование сигналов gK и 4: ек=5к+^- Подставляя в последнюю формулу значение из (8.26), найдем ^=w(p)a(P)-&(P)/(\+w(p))+^(p)= 165
Рис. 8.4. Упрощенная структурная схема следящего координатора цели = s(p)W(p)/(l-{-W(p))+'&(p)/(l + W(p)). На выходе ДУСа будем иметь ек = t(p)W (/?)/( 1 + W (/?)) + 4 (р)/( 1 + W (/,)). (8. 28) Если в диапазоне спектрального состава сигнала О модуль | | = | Wz(/co)/(l + W (/cd) ) | близок к единице, а |(1 + Н-Л^(/оз) )-11 —к нулю, то первое слагаемое формулы (8.28) со¬ ответствует измеренному значению ек, т. е. eK — e(p)Wz(p)/(l + + IF(p)), так как составляющая сигнала от второго слагаемого, являющегося ошибкой измерения е, близка к нулю. Если же сле¬ дящий привод не обладает достаточно широкой полосой пропу¬ скания для отработки сигнала 4, то второе слагаемое будет вносить; значительные погрешности. Таким образом, для достаточно точно¬ го измерения необходимо, чтобы следящий привод обладал высо¬ ким быстродействием. Трудность создания такого следящего привода усугубляется тем, что на вход головки самонаведения поступают шумы значительной интенсивности в диапазоне частот его работы. При наличии шумов высокая добротность привода приведет к тому, что привод будет отрабатывать (пропускать) высокочастотные составляющие шумов. Так как диапазон частот полезного сигнала ек ниже диапазона •частот сигнала ошибки, то путем установки фильтра низких частот тиожно значительно ослабить сигнал ошибки. Но это не всегда уда¬ ется осуществить в достаточной мере, так как выходные сигналы некоторых элементов системы достигают предельных значений; при этом система становится нелинейной. Для высокоманевренных ЛА применяют следящие координато¬ ры цели на базе использования силовой гироскопической стабили¬ зации. В этих координаторах цели чувствительный элемент не участвует в колебаниях ЛА относительно центра масс, поэтому сле¬ дящий привод в этом случае может быть рассчитан лишь на от¬ работку угловой скорости линии визирования е, т .е. будет обла¬ дать малой полосой пропускания и, следовательно, эффективно демпфировать высокочастотные шумы. Следящая гироскопическая головка самонаведения. Принцип работы следящей гироскопической головки самонаведения рассмот- 166
Рис. 8.5. Конструктивная схема оптической следящей головки само¬ наведения рим на примере оптической головки самонаведения, основные узльг которой следующие (рис. 8. 5): 1) оптическая система, предназначенная для улавливания энер¬ гии, идущей от цели, и концентрации ее в фокальной плоскости; 2) устройство выделения сигнала рассогласования; 3) чувствительный элемент, преобразующий энергию излучения в сигнал электрических напряжений; 4) усилитель сигнала рассогласования, система фильтров и вы¬ прямителей; 5) следящая система, предназначенная для доворота оси го¬ ловки самонаведения на цель. Блок выделения сигнала рассогласования 1 (см. рис. 8. 5) со¬ стоит из модулирующего диска МД, электрического двигателя ЭД и редуктора Р. Двигатель через редуктор приводит во вращатель¬ ное движение модулирующий диск. Модулирующий диск представ¬ ляет собой прозрачный круг небольшой толщины с нанесенным на него специальным рисунком (рис. 8. 6) на двух концентрических кольцах, называемых растрами. При совпадении направления оси головки самонаведения с направлением на цель изображение цели будет проектироваться на линию, разделяющую внешний и внут¬ ренний растры. При несовпадении направления оси головки само¬ наведения с направлением на цель изображение цели будет пере¬ мещаться к внешнему или внутреннему растру в соответствии с на¬ правлением отклонения оси головки самонаведения от направления на цель. Изображение цели будет модулироваться внешним или внутренним растром. Частота чередования прозрачных и непро¬ зрачных участков на внешнем и внутреннем растрах различна (на приведенном рисунке частоты различаются в два раза). Модулиро¬ ванный энергетический поток поступает на чувствительный эле¬ мент ЧЭ, усилитель У и далее на фильтры Фх и Ф2, настроенные соответственно на частоту сигналов, промодулированных внешним и внутренним растром. Это позволяет определить местоположение цели относительно оси головки самонаведения: вверху или внизу, т. е. получаем сигнал рассогласования типа «да — нет». Если ри¬ сунок на растрах сделать более сложным, то можно получить сиг- 167
Рис. 8.6. Модулирующий диск IK=k8 Рис. 8.7. Структурная схема головки самонаве дения. нал рассогласования, пропорциональный угловому отклонению оси головки от направления на цель. Сигнал с фильтров Ф1 и Ф2 после выпрямления и осреднения поступает в коррекционный двигатель (КД) (рис. 8.5, 8.7). Если формируемый сигнал рассогласования пропорционален отклонению оси координатора цели от направления на цель, то момент коррек¬ ции LK пропорционален сигналу рассогласования Де: L^=k^z= =kln, где /к — ток коррекции в коррекционном двигателе (момен¬ тном датчике). Под действием коррекционного момента гироскоп вместе с измерительной частью ГСН начнет прецессировать с уг¬ ловой скоростью ^=LJH=kIJH в сторону цели. Следовательно, ток коррекции /к пропорционален угловой скорости прецессии ги¬ роскопа (/к=йег). В установившемся состоянии угловая скорость прецессии гироскопа ег будет равна угловой скорости линии визи¬ рования е. Следовательно, ток коррекции /к пропорционален угло¬ вой скорости линии визирования IK=k&. Сигнал /к=йег с момент¬ ного датчика гироскопа поступает в автопилот для выработки ко¬ манды управления. Структурная схема, приведенная на рис. 8. 7, иллюстрирует про¬ цесс измерения угловой скорости линии визирования е. Передаточ¬ ная функция оптической системы, устройства выработки сигнала рассогласования, чувствительного элемента и усилителя представ¬ лена усилительным звеном ky. Фильтры Фь Ф2 (см. рис. 8. 5) за¬ мещены передаточной функцией Мь(р). Назначение этого фильт¬ ра — пропускать сигнал соответствующего спектрального состава. Передаточная функция W&(p) достаточно точно описывается апе¬ риодическим или колебательным звеном. Размещенное в обратной цепи звено IFr(p) =kr/p описывает работу гироскопа. Обычно кон¬ структивно обеспечивается совпадение направления кинетиче¬ ского момента гироскопа с направлением оси головки самонаведе¬ ния. Выходом звена Wr(p) —kr/p является угол ег— направление оси ГСН. Замыкание системы Де='ец — ег позволяет отразить про¬ цесс образования сигнала рассогласования Де между направлением на цель и осью ГСН. Если передаточную функцию фильтра W<t>(p) описать звеном W<p(p) = k/(Tp-\-l), то передаточная функ- 168
1 ция ГСН в замкнутом состоянии может быть представлена в виде Wr Ы = /к Ы/Ч Ы = kykp/\T2p2 + Тр + kykrk\ (8. 29) При помощи описанной системы можно измерить угловую ско¬ рость линии визирования только в одной плоскости, т. е. в канале высоты или направления. Построить систему для измерения состав¬ ляющих угловой скорости по обоим каналам можно путем приме¬ нения двух оптических систем с одним модулирующим диском (рис. 8. 8, а) или двух модулирующих дисков, но одной оптической системы (рис. 8.8,6). Соответствующие рисунки на растрах нано¬ сятся на двух четвертях каждого растра, а две другие четверти остаются прозрачными, без рисунков. Конструктивно обеспечива¬ ется очередность их работы через каждую четверть оборота. По¬ ток энергии, идущий от цели, модулируется то диском /, то дис¬ ком 2. Система фильтров аналогично тому, как это имеет место в одноканальной схеме (см. рис. 8.3), обеспечивает фильтрацию и выделение сигнала рассогласования по обоим направлениям. 8.5. СТРУКТУРНАЯ СХЕМА СИСТЕМЫ НАВЕДЕНИЯ И МОДЕЛИ БОРТОВОГО КОНТУРА Описание структурной схемы. На рис. 8. 9 представлена структур¬ ная схема системы наведения самонаводящегося ЛА. Маневр такого ЛА и цели осуществляется путем создания нормальных перегрузок, которые головкой самонаведения (контур Г) непосред¬ ственно не могут быть измерены. Кинематическое звено g/ (Dp2-\-2Dp) позволяет осуществить замыкание системы наведе¬ ния путем преобразования перегрузок цели пц и ЛА п в относи¬ тельные координаты. Входным сигналом ГСН является угол места цели е, а выходным — е, т. е. угловая скорость линии визирования цели *. Выходной сигнал ГСН наряду с полезной составляющей, пропорциональной угловой скорости линии визирования, содержит сигналы, порожденные шумами и помехами. Интенсивность шума зависит от типа и характеристик ГСН, а также от условий наведе¬ * Здесь во многих случаях ради краткости изложения и более непосредст¬ венного восприятия не вводятся в рассмотрение электрические аналоги физиче¬ ских величин, речь идет о самих физических величинах. 169
ния (типа цели, дальности до цели и т. д.). Для уменьшения шу¬ мовой составляющей выходной сигнал ГСН фильтруется; переда¬ точная функция фильтра чаще всего имеет вид одного или не¬ скольких апериодических звеньев. Значения постоянных времени фильтра выбираются при рассмотрении задачи на¬ ведения в целом в стоха¬ стической постановке. Для ЛА с радиолокаци¬ онной головкой самонаве¬ дения постоянная време¬ ни фильтра 1^фа(р) при¬ мерно равна или даже больше постоянной вре¬ мени контура стабилиза¬ ции перегрузки (контур II на рис. 8. 9). Сигнал с фильтра по¬ ступает на устройство вы¬ работки команды управ¬ ления 1^з (р), где форми¬ руется заданная пере¬ грузка п3. Обычно на вы¬ ходе звена W3(p) уста¬ навливается нальное звено с нием. Величина ния выбирается вия ограничения мых перегрузок, определяются стью ЛА или ограничени¬ ем величины его угла атаки. Заданная перегрузка п3 отрабатывается конту¬ ром стабилизации пере¬ грузки II. Замыкание кон¬ тура стабилизации пере¬ грузки осуществляется пу¬ тем сравнения заданной перегрузки п3 с измерен¬ ной пу. Контур стабилиза¬ ции перегрузки включает в себя контур демпфиро¬ вания I. На участке авто¬ номного полета может быть подключен свобод¬ ный гироскоп &с. г путем замыкания ключа 1. пропорцио- насыще- насьпце- из уело- допусти- которые прочно- 170
Связь нормальной перегрузки с нормальной скоростной. В систе¬ мах самонаведения датчики перегрузок жестко укреплены на кор¬ пусе Л\ и, следовательно, работают в связанной системе коорди¬ нат. Обычно датчики устанавливают так, что их ось измерения пер¬ пендикулярна продольной оси ЛА, на выходе датчика получается сигнал, пропорциональный нормальной перегрузке. При описании динамики ЛА его выходным сигналом считается нормальная ско¬ ростная перегрузка (см. разд. 1.3). В связи с этим необходимо осу¬ ществить переход от нормальных перегрузок к нормальным скоро¬ стным. Из рассмотрения рис. 1. 1 найдем выражения для нормаль¬ ной скоростной пУа и нормальной пу перегрузок: пУ'л=(Уа-\-Т sin а)/О; ny = (Ya coea-J-A^ sin а)/О, где Ya=Y^^Ybal. Если угол атаки а достаточно мал, то можно положить sin a = а, cos а— 1, и искомая передаточная функция будет Wn nip) — У а У = nyai.P)ln-yiP) = [iXa-\-T)a(p'}-\-Ya^ip)]:!{iYa-\-Xa}(l{p)-\-Y^ip')}. При допущении Ya=Ya<i-\-Ya^=Yaa искомая передаточная функция трансформируется в передаточный коэффициент ^А = (Г: + Т)/(П + ^а)- Система уравнений наведения ЛА на цель. В соответствии с разд. 1. 1 уравнения в вариациях для продольного движения ЛА можно записать в виде ip* -фахр) & -ф a2a -ф a38=0; рО — a4a — a5o—0; &=6 + a; = (8.30) Передаточные функции ЛА IFas (р), Иф» (р), Wne (р), соответст¬ вующие системе уравнений (8.30), приведены в разд. 1.3. Передаточная функция рулевого тракта Иф,. т(р) в системах на¬ ведения обычно описывается апериодическим (7>+1)8=Ар.та (8.31) или колебательным (7V + 2£7> + 1)8-Ар.та (8.32) звеном, где £р. т — коэффициент усиления рулевого тракта; a — суммарный сигнал на входе рулевого тракта, который на этапе самонаведения можно представить в виде °(р) & 4- ktlWn (р)п-п3 = (р) & + + knWn (р) п — fa. (8.33) Сигнал /гД11Ж (р) $ снимается с выхода демпфирующего гироскопа (см. рис. 2. 6, 2. 7), описываемого колебательным звеном (2. 7). При анализе работы системы наведения иногда демпфирующий гиро¬ скоп описывается усилительным звеном. Сигнал с ДУСа вводится 171
в автопилот для создания момента искусственного демпфирования. Введение этого сигнала позволяет уменьшить колебательность про¬ дольной оси ЛА. Сигнал knWn(p)n снимается с датчика нормаль¬ ных перегрузок, который описывается колебательным звеном Wn\p) = 1/ (Тп2р2-\-2%пТпр+1). При анализе динамики наведения датчик перегрузок может описываться апериодическим или даже усилительным звеном. Сигнал knWn(p)n позволяет сформировать контур стабилизации перегрузки и тем самым увеличить быстро¬ действие системы, до некоторой степени стабилизировать процесс отработки заданной перегрузки на различных режимах применения ЛА, обеспечить пропорциональность текущей перегрузки ЛА задан¬ ной перегрузке в установившемся состоянии. Заданную перегрузку можно представить в виде з п3 = ]^г(р)^2(Р)^3(Р)^ (8.34) где передаточная функция IFr(p) головки определяется формулой (8.29); W3(p) —передаточная функция устройства выработки за¬ данной перегрузки, которое часто берется в виде усилительного звена W3(p)=k3. Система уравнений (8.30), (8.32), (8.33) сов¬ местно с (8.34) описывает работу бортового контура. Совместная система уравнений бортового контура и кинематического звена (8. 5) описывает процесс наведения ЛА на цель. Система уравнений бортового контура совместно с линеаризо¬ ванным уравнением (8. 14) кинематического звена описывает ли¬ нейную модель наведения ЛА на цель в окрестности режима парал¬ лельного сближения. Линейные модели бортового контура. Если положить а5 = 0 и пренебречь инерционностью движения ЛА относительно центра масс, то из системы (8. 30) найдем уравнение ЛА в=- — а4а3Ъ/а2. (8. 35) Если все остальные звенья, составляющие контур стабилизации перегрузки, считать усилительными звеньями, то его уравнение будет fiya=kyn3!g, (8.36) где kz = — AjPt<Z3«4 (а1а4 + УТ1 [1 + ^РТ«3«4) («А + д2)-1 (^д.г + -J-ktiyVg-1)]-1 — коэффициент усиления контура стабилизации. Остальные звенья бортового контура представим в виде апе¬ риодического звена /л3 = е£2/(7>+ 1), (8.37) Величину постоянной времени Т в основном определяет передаточ¬ ная функция 1¥7ф2 (р\ Исключая п3 из системы (8.36), (8.37), по¬ лучим уравнение бортового контура nUa = ^kckyig{Tp-\-\}. (8.38) Учитывая, что п— VQ/g, перепишем (8. 38) в виде Q = &kck2/(Тр-[-1). (8. 39) 172
В рассматриваемой модели инерционность бортового контура уч¬ тена апериодическим звеном (8.37). Перепишем (8.39) в виде Рис. 8.10. Изображение цели для различных дальностей ё = (8.40) где 1Га. к(р) —передаточная функция автономного контура. В бо¬ лее сложных моделях передаточная функция IFa. к(р) может быть получена из системы уравнений бортового контура. Так, напримерг при описании работы контура стабилизации перегрузки апериоди¬ ческим или колебательным звеном уравнение (8.40), с учетом инерционности (8. 37), будет описываться соответственно уравнени¬ ем второго и третьего порядка. Вычисление пролета с учетом ослепления ГСН. Для полной модуляции потока энергии, идущей от цели, ширина полос растра моду¬ лирующего диска должна быть достаточно большой, во всяком случае изображение цели должно быть меньше ширины одной полосы растра (см. рис. 8.6, 8.8). Однако при сбли¬ жении ЛА с целью изображения цели будет возрастать (см. возрастающие концентриче¬ ские окружности на рис. 8. 10), и, наконец, на некотором расстоянии изображение цели пол¬ ностью перекроет полосу растра. При этом происходит искажение модуляции изображе¬ ния цели и при дальнейшем сближении ЛА с целью произойдет полное ослепление ГСН. С момента ослепления ГСН система управления получает иска¬ женную информацию о местоположении цели. Одна из стратегий движения ЛА к цели с ослепленной ГСН заключается в том, что ЛА продолжает полет в сторону цели с той перегрузкой, которая была в момент ослепления. В других случаях осуществляют пово¬ рот руля в ту же сторону, как это было в момент ослепления, и продолжается полет с максимальной располагаемой перегрузкой. Наконец, иногда оказывается целесообразным организовать полет ЛА по прямолинейной траектории. Вычислим значение пролета с учетом ослепления ГСН в пред¬ положении, что цель маневрирует с постоянной перегрузкой f=a= = const при управлении по закону (8.21). Полагая в (8.25) t = = /Осл, получим значение пролета к моменту ослепления хосл = ^ 1 (^н !) (1 ехр ( Л/осл)) + ^0ехр( ^Аэсл)- (8.41) Выберем стратегию, при которой движение ЛА после ослепления ГСН будет происходить с перегрузкой, имевшей место в момент ослепления: п=посл=к^осл/Посл = const, (8. 42) где пролет хОсл вычисляется по формуле (8. 41). Подставляя в дифференциальное уравнение пролета (8. 20) зна¬ чение перегрузки (8. 42) и полагая /(/) = а, получим Х= — gD cos Т]£х*осл/| &I ^осл + aD/\ Ь |. 173
Это уравнение содержит один существенно изменяющийся пара¬ метр— D. Так как D = D0Cji— |Ь|/, по последнее уравнение при¬ мет вид X = ( Л 4" а) (4сл — 4, где Л= — §-Лххосл cosr|/Z)OCJ1; /0СЛ = 2Э0СЛ/| Ь | — дальность в момент ослепления, выраженная в единицах времени. Интегрируя последнее уравнение при начальных условиях (8.41), получим значение пролета к моменту /к достижения ЛА цели х=х0СЛ4-(А-(-а) /осл^к-’ (А + а)^к/2- Вычисляя значения пролета при различных предполагаемых стратегиях цели (/=0, f—a, f=bt — соответственно полет без ма¬ невра, с постоянной перегрузкой, с изменяющейся перегрузкой) и различных стратегиях движения ЛА, можно выбрать наиболее ра¬ циональную стратегию поведения ЛА после ослепления его головки самонаведения. 8.6. СЛУЧАЙНЫЕ ОШИБКИ И ШУМЫ В КОНТУРЕ НАВЕДЕНИЯ В процессе наведения ЛА на цель на систему самонаведения дей¬ ствуют различные случайные возмущения и сигналы. ЛА подвер¬ гается силовому воздействию со стороны турбулентной атмосфе-' ры, влиянием которой на процесс наведения в ряде случаев можно пренебречь. На процесс наведения влияют внутренние и внешние шумы и ошибки. К внутренним шумам относятся дрейф нулей уси¬ лителей, ошибки датчиков первичной информации и т. п. Внешние шумы можно разделить на амплитудные, обусловленные флуктуа¬ циями мощности отраженного сигнала, и угловые, вызванные эффектом блуждания энергетического центра отраженной от цели энергии. Более детальное рассмотрение работы головки самонаве¬ дения приводит к выявлению так называемой карданной ошибки, т. е. ошибки, вызванной размещением измерительной части голов¬ ки самонаведения в кардановом подвесе. В принципе случайные ошибки не могут быть компенсированы Рис. 8.11. Обтекатель головки са¬ монаведения каким-либо детерминированным сиг¬ налом. Их воздействие может быть ослаблено путем фильтрации сигналов. Вопросы фильтрации сигналов на базе Калмана — Бьюси изложены в гл. 6. Особо следует выделить ошибки об¬ текателя, существенным образом влияющие на точность наведения ЛА. Обтекатель ГСН защищает элементы ее конструкции от механических и дру¬ гих видов повреждений. Он размеща¬ ется в головной части ЛА и является 174
прозрачным для энергии, которая используется в данной головке (рис. 8. И). Криволинейная форма обтекателя выбирается из ус¬ ловия удовлетворения требованиям аэродинамики ЛА. Отмечают, что применяемые материалы и технология изготовления все время совершенствуются, и тем не менее ошибки, вносимые обтекателями, являются значительными, и в радиолокационных головках само¬ наведения смещение электрической оси достигает 0,5° и больше. Электромагнитная волна при прохождении через обтекатель преломляется, так что фактический угол места цели е будет отли¬ чаться от его значения е0 на выходе обтекателя на некоторую ве¬ личину Дф('ф): е0 = е + д?(?), (8.43) называемую статической пеленгационной характеристикой обтека¬ теля. Для многих типов головок эта зависимость носит в значитель¬ ной степени случайный характер. Она может существенно изме¬ няться от аэродинамического нагрева, деформации обтекателя вследствие аэродинамической нагрузки, от неоднородности мате¬ риала обтекателя и т. п. Все же для некоторых головок самонаве¬ дения прослеживается для математического ожидания Аф(ф) не¬ которая закономерность: значение Аф(ф) увеличивается при воз¬ растании угла ф до некоторого значения, а при дальнейшем возра¬ стании угла ф пеленгационная характеристика Аф(ф) колеблется в некоторых пределах. Бывают и более сложные зависимости. В полете зависимость Аф(ф) может существенно изменяться. Если бы существовала определенная закономерность изменения Дф(ф), идентичная во всех продольных сечениях обтекателя, то ее можно было бы компенсировать введением корректирующего сиг¬ нала. Считают, что проблема борьбы с ошибками, вносимыми обтека¬ телями, является, пожалуй, самой важной и трудной. Борьба с этой ошибкой ведется в двух направлениях: созданием более совершен¬ ных обтекателей и разработкой алгоритмов управления, что в зна¬ чительной степени ослабляет влияние ошибки Аф(ф) на точность самонаведения. В результате совершенствования качества обтекате¬ лей их стоимость за последние два десятилетия возросла на поря¬ док. Различные мероприятия, применяемые создателями систем управления, значительно уменьшили влияние Аф.(ф) на пролет. Однако до настоящего времени эта проблема остается в значитель¬ ной степени неразрешенной. Выявим пути проникновения ошибки Дф(ф) в контур управления ЛА. Так как ТСН дифференцирует угол места цели е, поступаю¬ щий на ее вход [см. передаточную функцию (8.29)], то продиф¬ ференцируем по времени формулу (8. 43) £о = £ + (т)МР * dyldt. При этом производная йДф(ф)Д/ф часто называется градиентом об¬ текателя. Учитывая очевидное кинематическое соотношение ф = 175
Рис. 8.12. Структурная схема контура наведения самонаводящегося ЛА с ошибками, вносимыми обтекателем = е — О', последнее выражение преобразуем к виду е0 = з (1 —б/Дср/гУср) — ftd&y/dv. Из анализа этого выражения следует, что на выходе ГСН, кроме полезной составляющей сигнала 8, имеем ошибку (е—О') >< Хб/Дф(ф)/Ар. Эту ошибку удобно представить в виде двух слагае¬ мых е^Дф/Ар и МДф/Лр. Первая составляющая ошибки несколько изменяет коэффициент усиления контура наведе¬ ния в целом, а вторая приводит к -созданию до¬ полнительной паразитной связи в контуре управле¬ ния (рис. 8. 12). Влияние первой составляющей не¬ значительно, так как не¬ большое (на 10 . . . 20%) изменение коэффициента усиления контура наведе¬ ния не приведет к замет¬ ным осложнениям в уп¬ равлении ЛА. Вторая составляющая влияет на работу системы на¬ ведения. Она в зависимости от знака градиента dkqldq создает отрицательную или положительную обратную связь по угловой ско¬ рости Ф. При положительном градиенте ^Дф/б/ф (паразитная отри¬ цательная обратная связь) уменьшаются быстродействие и коэф¬ фициент усиления системы управления. Переходные процессы кон¬ тура управления становятся затянутыми. При отрицательном гра¬ диенте (УДф/йф (паразитная положительная обратная связь) бы¬ стродействие незначительно возрастает, однако при этом увеличи¬ вается колебательность процессов и коэффициент усиления систе¬ мы управления. При увеличении градиента dNqldq система управ¬ ления теряет устойчивость. При отрицательном градиенте потеря устойчивости происходит при меньших величинах |б/Дф/Лр|. При этом в системе управления развиваются колебания более низких, чем при положительном градиенте. на частотах, 8.7. ДЕТЕРМИНИРОВАННЫЕ МОДЕЛИ СИСТЕМ НАВЕДЕНИЯ Приведенная на рис. 8. 9 структурная схема системы наведения не отражает многих нелинейностей, присущих всякой реальной си¬ стеме. Первая группа нелинейностей — это линейные звенья, которые при некоторых предельных значениях входных сигналов имеют на выходе также предельные значения. Например, ограничена ско¬ рость перекладки рулей, обусловленная располагаемой мощностью рулевых машин; ограничен угол отклонения управляющей поверх¬ ности вследствие нежелательности выхода в закритические углы 176
атаки; ограничена скорость е слежения ГСН за целью; ограничены входные сигналы из-за ограниченности мощности источников энер¬ гии. Ограничение выходных сигналов звеньев системы является обычным явлением. Вторая группа нелинейностей организуется специально путем введения дополнительных звеньев (обычно типа пропорционально¬ го звена с насыщением) для ограничения максимальной величины сигналов. К этому типу относится звено, приведенное на рис. 8. 9. Часто прибегают к ограничению максимальной величины сигнала на входе сумматора во избежание «забития» всего канала сигна¬ лом одного рода, например, сигналом В других случаях в систему искусственно вводят зону нечувствительности. Таким образом, работа системы наведения описывается весьма сложной нелинейной, нестационарной системой дифференциальных уравнений высокого порядка, исследование которой представляет значительные трудности даже при помощи аналоговых и цифровых машин. Поэтому задача синтеза и анализа системы наведения раз¬ бивается на несколько этапов. Выполнение предшествующего этапа позволяет определить структуру и значения параметров системы, существенно сократить объем работы, проводимой на последующих этапах. Поэтапность решения задач синтеза управления сложилась исторически и широко используется сейчас на практике. Для каж¬ дого этапа синтеза и анализа создается своя математическая мо¬ дель: линейные стационарные и нестационарные модели разных порядков, нелинейные модели, стохастические модели и т. п. Ниже приведен ряд математических моделей систем наведения при осуществлении метода пропорционального сближения. Если уравнение бортового контура аппроксимировать усили¬ тельным звеном, то простейшая модель системы наведения может быть описана линеаризованным уравнением кинематического звена [см. формулу (8. 16)] ДДе + £>Де = - УД9 + 17цД6Ц; (8. 44) и уравнением метода наведения Д0 = Ме, (8.45) где k — коэффициент усиления бортового контура. Система уравнений (8.44), (8.45) эквивалентна уравнению первого порядка относительно угловой скорости е линии визиро¬ вания + (2D + kV) Де= УЦД9Ц. (8. 46) Если коэффициенты D и 2D считать известными функциями време¬ ни, то уравнение (8. 46) является линейным нестационарным отно¬ сительно Де. Коэффициент D изменяется от некоторого значения до нуля при сближении ЛА с целью. Коэффициенты D, V и Уц при многих теоретических исследованиях можно осреднить и считать постоянными. 177
Рассматриваемая математическая модель учитывает инерцион¬ ность только кинематического звена. Работа всего бортового кон¬ тура описывается уравнением усилительного звена с коэффициен¬ том усиления k: угловая скорость 0 вектора скорости ЛА устанав¬ ливается пропорционально угловой скорости в линии визирования мгновенно, без запаздывания. Эта модель идеализирована и дале¬ ка от реальной системы. В результате исследования этого уравне¬ ния можно получить лишь некоторые общие свойства, характери¬ зующие метод пропорционального сближения при различных зна¬ чениях коэффициента /г. Естественно, эта модель совершенно не от¬ ражает свойства бортового контура. Если уравнение бортового контура аппроксимировать уравнени¬ ем первого порядка (8.39), а уравнение кинематики считать ли¬ неаризированным (8. 14), то замкнутую систему наведения можно описать уравнением TDte + (TL)-\-D) Дё +(2£> + АЛ17) Дё=ГК,1Д9ц+(7’Гц-Ь1/ц) дбц), (8.47) которое получается исключением ДО из упомянутых уравнений. Полученная модель (8. 47) является первым уточнением модели (8.46), которая не учитывает инерционности бортового контура. Модель (8.47) учитывает инерционность бортового контура апе¬ риодическим звеном с постоянной времени Т. В теории автомати¬ ческого управления разработаны методы выбора параметров урав¬ нения более низкого порядка, аппроксимирующего уравнения бо¬ лее высокого порядка. В первом приближения можно положить Т = где (ос — частота среза бортового контура. Так как самым инерционным звеном бортового контура почти на всех режимах наведения ЛА является фильтр, стоящий после ГСН, то можно считать, что модель (8. 47) учитывает инерционность этого фильт¬ ра. Модель (8. 47) в первом приближении позволяет выявить не¬ которые показатели системы наведения: быстродействие, полосу пропускания, величину пролета и т. п. Следующим приближением математической модели к реальной является система уравнений ДДе + ДДе = - УД6 + КЦДОЦ, Д9 = + 2^Тр + 1). (8. 48) Здесь инерционность бортового контура учитывается колебатель¬ ным звеном. Эта модель в классе линейных моделей достаточно точно описывает бортовой контур. Исключая 0 из системы уравнений (8.40) и (8.14), получим более общий вид линейной модели системы наведения £>Дё + (2/> + Ри/а.к(р)) Де = РцД6ц- (8-49) Линейные модели системы наведения типа (8. 49) достаточно точ¬ но аппроксимируют нелинейные модели, в которых кинематическая связь описывается нелинейными уравнениями кинематики (8. 6) и (8.5). На режимах при е^180° и е^О разница в значениях про¬ 178
лета х, вычисленного по линейным моделям (8. 49) и нелинейным моделям, не превышает 5%. Ошибка в е достигает 50%, если рас¬ сматривать наведение на цель при всех значениях е. Модель (8.48) и модели более высокого порядка типа (8.49) обычно исследуются путем математического моделирования, а так¬ же с применением метода частотных характеристик. Однако ни одна из линейных моделей не может достаточно точно описать систему наведения, необходимо обязательно учитывать ее нелинейность, в первую очередь ограничение перегрузки при полете на макси¬ мальных скоростных напорах. На этих режимах ЛА может выхо¬ дить на недопустимые перегрузки. Для предотвращения этого перед контуром стабилизации перегрузки вводится линейное звено с на¬ сыщением (см. рис. 8.9). Максимальное значение сигнала на вы¬ ходе этого звена /гтах назначается из соображений прочности кон¬ струкции ЛА. Формируемая перегрузка для рассматриваемого слу¬ чая может быть записана в виде /г3=п. при п</гп1ах; п3 = nmax при>> «тах. (8. 50) Ограничение располагаемой перегрузки при полетах с неболь¬ шими скоростными напорами возникает вследствие отклонения уп¬ равляющих плоскостей до упора (8.51) где tiq — перегрузка, которая может быть создана в конкретных условиях полета при полностью отклоненных управляющих по¬ верхностях. Это имеет место при полете на больших высотах, где плотность воздуха, а следовательно, и скоростной напор незначи¬ тельны. Фактическая перегрузка может быть в несколько раз мень¬ ше требуемой, что приводит к большим пролетам. При этом необ¬ ходимо иметь в виду, что и цель летит на этих высотах по траек¬ ториям, близким к прямолинейным. Если каждую из рассмотренных математических моделей (8.46), (8.47), (8.48), (8.49) дополнить уравнениями (8.50), (8.51), то получим соответствующие нелинейные модели, которые достаточно точно описывают работу системы наведения. Нелиней¬ ные модели систем наведения исследуются в настоящее время пу¬ тем моделирования на аналоговых и цифровых вычислительных машинах. На точность наведения ЛА существенно влияет скоростная ха¬ рактеристика привода: скорость отклонения руля пропорциональ¬ на управляющему сигналу до определенного предельного значения бтах- Величина бтах ограничивается располагаемой мощностью ру¬ левой машины. Скоростная характеристика привода в значитель¬ ной степени определяет его полосу пропускания. Имеются и дру¬ гие факторы, влияющие на точность наведения ЛА, например, пре¬ дельная скорость слежения ГСН за целью, ее предельные углы от¬ клонения и т. п. На более поздних этапах проектирования необходимо исполь¬ зовать нелинейные" уравнения (8.5), (8.6) кинематики. Математи- 179
Рис. 8.13. Преобразованная структурная схема системы наведения ческая модель, построенная с учетом этих уравнений и всех перечисленных нели¬ нейностей бортового контура, достаточно точно отражает процесс наведения ЛА на цель в детерминированной постановке. Перечисленные модели наведения, кроме модели (8.46), используются и при исследовании системы в стохастической постановке. Но при этом параметры бор- в определенной степени и его структура тового контура, а также выбираются с учетом статистических характеристик полезного сиг¬ нала и шумов. Иногда удобно структурную схему системы наведе¬ ния представить в виде, приведенном на рис. 8.13. В соответствии с этой схемой задачу наведения ЛА на цель можно представить как задачу стабилизации угловой скорости линии визирования при нулевом заданном ее значении. В этом аспекте объектом управле¬ ния можно считать кинематическое звено №к.3(р), а регулятором— •бортовой контур и^а.к(р). В последнее время интенсивно развивается, хотя и находится в начальной стадии, метод автоматизированного проектирования конструкций ЛА и систем управления. На всех этапах проектиро¬ вания систем наведения широко применяются цифровые вычисли¬ тельные машины. При помощи ЦВМ организован автоматизиро¬ ванный поиск параметров системы, оптимальных передаточных функций и траекторий наведения. После каждого из этих этапов проходит относительно продолжительное время, пока специалист проанализирует результаты и наметит программу дальнейших ис¬ следований. Задача автоматизированного проектирования — сокра¬ тить время проектирования, включить в работу машины человека- оператора, сделать удобным общение оператора с машиной. Работа по созданию автоматизированных систем проектирова¬ ния ведется по многим направлениям: создание более совершен¬ ных приспособленных для автоматизированного проектирования алгоритмических языков, расширение возможностей вычислитель¬ ных машин (увеличение оперативной памяти и быстродействия), расширение математического обеспечения, улучшение системы вы¬ вода и ввода данных (создание системы терминалов и т. п.), раз¬ работка рациональной последовательности математических моде¬ лей, создание итерационных методов поиска решений, построение иерархической системы функционалов и т. п. 8.8. СТОХАСТИЧЕСКИЕ МОДЕЛИ СИСТЕМ НАВЕДЕНИЯ ФИЛЬТР КАЛМАНА-БЬЮСИ Полагая в (8.5) cos r] = cos т]ц— 1 в предположении малости углов т|иг)ци пренебрегая членом F (t), получим е = — 2DD~4 — gD~xn -j- gD~xn& (8.52) 180
Будем считать, что иц — стационарный белый шум интенсивности Оц2, и положим для краткости B1 = gD“1/zu, <з2 =7Щ2 = £2Л)“2с;ц. Уравнение автономного контура (8. 40) представим в виде (8.53) где е — оценка е, поступающая с фильтра Калмана — Быоси. Урав¬ нение измерителя представим в виде £r = £_l“rh’ (8.54) где ег — сигнал на выходе ГСН; Ц1 — стационарный белый шум с интенсивностью Система уравнений (8.52), (8.53), (8.54) образует простейшую стохастическую модель системы самонаведе¬ ния. Построим фильтр Калмана — Бьюси для оценки вектора со¬ стояния ЛА, который используется для формирования алгоритма управления. Сначала построим фильтр для безынерционного бортового кон¬ тура (8.53) IFa. к(р) = kck2 [см. формулу (8.38)]. Исключив п из системы уравнений (8.53), (8.54), получим уравнение наведения ё= - 2DD~^ — (8. 55) Уравнение фильтра Калмана — Бьюси (6.81), дающего оценку е, примет вид cUldt=-2DD-^- ^2£>-11/е + К(/)(ёг- е), (8.56) где в соответствии с (6.74) К(/) = Р(/)о^, а матричное уравне¬ ние Риккати (6. 75) редуцируется в скалярное p=4DD~1p-\-p2^-[- Система уравнений (8.55), (8.56) описывает контур само¬ наведения с фильтром Калмана — Бьюси. Здесь оценка е исполь¬ зуется для формирования алгоритма управления. Если бортовой контур (8.53) аппроксимировать колебатель¬ ным звеном (T2p2 + 2lTp-\-l)n=Vkck2g~i&, то, вводя новые пере¬ менные %i = e, х2=п, = запишем систему уравнений (8.52), (8. 53) в нормальной форме Х1= — 2DD~xx1—- gD-xx2-Y^\ х2 = х3\ х3= —T~2x2 — 2T-^x^T-2Vkck2g~1x1 или х = Ах + Вх-Н, (8.57) где ~-2DD~' — gD~l 0 0 0 0' 0 0 1 ;В= 0 0 0 ;|= 0 0 —Т~2 — 2$Г-1 T~2Vkck2g-i 0 0 0 181
Уравнение измерителя представим в виде у = Ех+п> где Е=[1, 0, 0]; tjt= [t|i, О, О]. Уравнение фильтра (6.81) для объекта (8.57) запишем в виде х =Ах-|-Вх-|-К(/)(у—Ех), где К (/)=₽(*) Р(/) находится из уравнения Риккати а 0 0 1 tl ‘1 ■ Р=АР+ РАТ+ ООО -Р 0 .000 0 При более точной модели системы наведения будет повышать¬ ся порядок уравнения фильтра Калмана — Бьюси. Трудности внед¬ рения фильтра Калмана — Бьюси в системах самонаведения свя¬ заны с измерением некоторых фазовых координат (£), D и др.), входящих в уравнение фильтра. Вектор оценки х используется для формирования алгоритма управления.
Глава 9 СИСТЕМЫ ТЕЛЕУПРАВЛЕНИЯ 9.1. ОПРЕДЕЛЕНИЕ, КЛАССИФИКАЦИЯ Телеуправление — управление на расстоянии. В системы телеуп¬ равления ЛА входят: 1) объект управления; в качестве объекта управления могут выступать самолеты, спутники, космические корабли межпланет¬ ных перелетов и другие ЛА; 2) цель, куда должен быть доставлен объект управления, на¬ пример, в космических полетах это — планета назначения, орби¬ тальная станция и т. п.; 3) пункт управления, предназначен для измерения координат цели и объекта управления, выработки сигнала рассогласования, формирования команд управления и передачи их по каналу теле¬ управления на борт объекта управления. При осуществлении кос¬ мических полетов организуется специальный центр по координа¬ ции полета. В работе пункта управления обязательно принимает участие оператор или целый коллектив сотрудников (космические полеты), в задачу которых входят наиболее ответственные операции по осу¬ ществлению полета: выбор цели, переход на другой режим работы и т. п. Пункт управления может быть расположен на земле или в космосе, на самолете или другом объекте. Системы телеуправления подразделяются на лучевые и ко¬ мандные. При лучевом телеуправлении объект управления летит в луче радиолокатора, ориентированного по заложенному алгоритму в сторону цели. Радиолокатор находится на стационарной или по¬ движной станции наведения. Бортовая система управления объек¬ том измеряет сигнал рассогласования, формирует и отрабатывает команду управления. Сигнал рассогласования получается путем измерения напряжения, характеризующего отклонение объекта уп¬ равления от оси луча сопровождающего локатора. Реализуя раз¬ ные способы формирования направления луча радиолокатора, можно осуществить наведение по различным кинематическим тра¬ екториям. При командном телеуправлении обычно измеряются координа¬ ты цели и объекта управления станцией наведения. На основе ин¬ 183
формации, полученной от станции наведения, формируются непре¬ рывные и разовые команды управления. Непрерывные команды обеспечивают управление полетом объекта по каналу высоты и бо¬ ковому каналу. Разовые команды выдаются с целью изменения структуры бортового контура, его параметров, отделения ступеней, выброса парашюта, включения и выключения двигателей, переори¬ ентации космического аппарата, перехода на автономный режим полета и т. п. Кроме двух, отмеченных типов систем телеуправления, сущест¬ вуют комбинированные системы, в которых пункт управления ча¬ стично использует информацию с датчиков, расположенных на объ¬ екте управления. Дальность действия систем телеуправления для различных ти¬ пов объектов изменяется от нескольких километров до сотен мил¬ лионов и миллиардов километров. 9.2. КИНЕМАТИКА НАВЕДЕНИЯ ПРИ КОМАНДНОМ ТЕЛЕУПРАВЛЕНИИ Функциональная схема. Рассмотрим функциональную схему ко¬ мандной системы телеуправления (рис. 9. 1). Станция наведения (СН) выполняет функции обнаружения цели и сопровождения це¬ ли и объекта управления. В процессе сопровождения измеряются координаты цели и объекта управления, прогнозируются их тра¬ ектории, и на основе этой информации вырабатываются команды управления, посылаемые в закодированном виде по линии телеуп¬ равления на борт объекта управления. Аппаратура станции наве¬ дения используется многократно. Бортовая аппаратура управле¬ ния является более дешевой, чем аппаратура станции наведения. В ее функции входит прием команд управления, их декодирование и отработка. В общем случае траектория объекта управления мо¬ жет включать два участка. Первый участок — участок автономно¬ го полета, начинающийся с момента старта. Здесь осуществляет¬ ся автономный полет по заложенной при старте в виде программ информации. Рис. 9.1. Функциональная схема командной системы телеуправления 184
Рис. 9.2. Кинематические элементы при теле¬ управлении Второй участок — участок полета объекта по командам станции наведения. После пе¬ рехода на телеуправление объ¬ ект обычно находится далеко от расчетной (кинематичес¬ кой) траектории. Угловые и линейные отклонения настоль¬ ко значительны, что требуется большое время, прежде чем удается достигнуть кинемати¬ ческой траектории. Чтобы со¬ кратить это время непосредст¬ венно после автономного уча¬ стка, целесообразно для выво¬ да объекта на кинематическую траекторию применить оптимальное по быстродействию управление. После этого объект летит по кине¬ матической траектории, определяемой выбранным методом наведе¬ ния, в соответствии с командами станции наведения. В некоторых типах объектов на конечном участке полета для достижения мень¬ шего пролета применяется принцип самонаведения. Например, сближение и стыковка двух КА может осуществляться с исполь¬ зованием принципов самонаведения. Телеуправление находит сейчас широкое применение. В совре¬ менных космических перелетах нельзя обойтись без телеуправле¬ ния. При телеуправлении необходимо иметь обслуживающий пер¬ сонал на станции наведения для осуществления сопровождения объекта управления до момента достижения им цели. Широкое применение систем телеуправления в настоящее время объясняется в определенной степени ограниченными возможностями вычисли¬ тельной техники, расположенной на борту управляемого объекта. При дальнейшем развитии вычислительной техники, ее миниатю¬ ризации можно будет решать все или почти все навигационные за¬ дачи управления на самом объекте. Полет будет совершаться в значительной степени автономно. При этом не нужно будет содер¬ жать значительный персонал, организующий полет объекта. При расширении космических исследований, когда в космосе одновре¬ менно будут находиться десятки кораблей, длительность перелета которых будет исчисляться годами, использовать современные ме¬ тоды управления будет невозможно. Автономный полет с примене¬ нием самонаведения на отдельных этапах заменит полет по теле¬ управлению при космических перелетах. Основные кинематические уравнения. При самонаведении ис¬ пользуются относительные координаты цели, а при телеуправле¬ нии — абсолютные координаты цели и объекта. Естественно, здесь кинематические зависимости будут другими. Проектируя вектор скорости V объекта на направление вектора дальности г и на пер¬ пендикуляр к нему п— п (рис. 9.2), получим основные кинемати¬ ческие уравнения (при условии неподвижности СИ) 7 1996 185
r = V cois(6 —<p), (9. 1) ry = V sin (9 — cp). (9.2) Дифференцируя уравнения (9. 2) и учитывая (9. 1), найдем ки¬ нематическое уравнение rcp-|-2rcp = l/ sin (6—ср)-[-1/в cos (6 — ср), (9. 3) связывающее перемещение ЛА с его тангенциальным V и нормаль¬ ным У0 ускорениями. Обозначим через /=Vsin(0— <р) + + V0cos(0 — ср) проекцию полного ускорения ЛА на перпендику¬ ляр п — пк вектору г. Под действием ускорения j осуществляется маневр ЛА — его угловые перемещения относительно СН. Левая часть уравнения (9. 3) по форме совпадает с левой частью уравне¬ ния кинематического звена (8.5). Однако здесь в левой части аб¬ солютные, а не относительные координаты. Для цели имеет место аналогичное кинематическое уравнение ^ц?ц + 2гц<Рц=^ц sin (0ц — ?ц) + ^Л COS (9Ц — <рц), (9. 4) правая часть которого равна проекции полного ускорения цели на нормаль к Гц. Управляющие перегрузки. Приведенные кинематические уравне¬ ния отражают математическую зависимость между ускорениями ЛА и его координатами. При этом необходимо иметь в виду, что изменение направления полета как объекта 0, так и цели 0Ц, осуще¬ ствляется путем изменения нормальной перегрузки. Относительное перемещение объекта и цели, т. е. изменение дальности по линии визирования Д соединяющей объект и цель, и изменение направ¬ ления е линии визирования цели осуществляется, как и в системах самонаведения, путем изменения проекции полных ускорений объ¬ екта и цели на нормаль к линии визирования цели D (см. рис. 9. 2). В конечном счете важно взаимное положение объекта и цели, по¬ этому желательно рассматривать относительные координаты D, е. Но в системах телеуправления они непосредственно не измеряют¬ ся, поэтому для управления полетом используются перегрузки, нор¬ мальные к векторам г и гц [см. уравнения (9.3), (9.4)]. Методы наведения. Простейший метод наведения объекта на щель при телеуправлении заключается в том, что объект управ¬ ления находится на линии, соединяющей станцию наведения и цель (СН — Ц). Этот метод называется методом трех точек. Ма¬ тематическим выражением этого метода является равенство ф = фц. (Следовательно, уравнение кинематической траектории имеет вид <Рк=?ц> (9.5) а сигнал рассогласования Дф вычисляется по формуле Д? = ?к —? = ?ц —?, (9.6) где фк — значение координаты ф для кинематической траектории. В других методах наведения кинематическая траектория зада- 186
ется с некоторым упреждением Дфупр> =?ц+Д(?упр, (9.7) и сигнал рассогласования Дф вычисляется по формуле Д? = ?к— ? = ?ц— ? + Д(?упр- (9. 8) Задавая различные значения Дфупр, получим ряд методов наведения. Рассмотрим более подробно простейший метод наведения— Рис 9.3. Кинематические элементы при ме¬ тоде трех точек метод трех точек. В соответствии с приведенным определением при этом методе станция наведения, объект управления и цель находятся на одной линии. Для простоты выкладок положим, что цель движется гори¬ зонтально с постоянной скоростью Уц на постоянной высоте h (рис. 9.3). С учетом особенности движения цели уравнения кине¬ матики (9. 1), (9.2) примут вид = (9.9) 'VPn=KI sin^. (9.10) Перепишем уравнение (9.10) в виде (p4/sin<pu= 7ц/гц. Разделив почленно последнее уравнение на sin<p4 и учитывая, что высота по¬ лета цели Л=Гц sin <рц=const, получим dcp4/sin2<p4= V^dtlh. Инте¬ грируя это уравнение, найдем фц =—arcctg (V^tlh-^-C). Для началь¬ ных условий фц(0 |/=о—Фцо последний интеграл примет вид — arcctg (1/ц//Л —ctgcpu0). (9. 11) Формула (9. И) определяет закон изменения координаты цели в функции времени. Из уравнения кинематики (9.2) объекта управления найдем угол наклона его траектории 9=ф+агсзт (np/V). Учитывая, что для метода трех точек фц=ф, а следовательно, и фц=ф, перепишем по¬ следнюю формулу в виде 0 =:<рц-ф-arcsin (прцУ'~1). (9. 12) Формула (9. 12) определяет направление вектора скорости объек¬ та управления при рассматриваемом методе наведения. Необходи¬ мое кинематическое ускорение для осуществления этого метода на¬ ведения с учетом (9. 12) определяется выражением ;=У«ц + У(;Тц+гТц) / /У2 — г2?2. (9. 13) Формулы (9. 11) и (9. 13) позволяют вычислить необходимое ки¬ нематическое ускорение для осуществления полета по рассматри¬ ваемому методу. Расчеты показывают, что для всех траекторий 7* 187
движения объекта управления кинематические перегрузки его зна¬ чительны и при приближении к цели возрастают. Чтобы уменьшить необходимые кинематические перегрузки объекта управления, осуществляют наведение с некоторым упреж¬ дением (9.7). В частности, угол упреждения может быть пропор¬ ционален расстоянию D объекта управления от цели: Тогда уравнение наведения (9. 7) примет вид ^K=^+kD, (9. 14) а сигнал рассогласования в соответствии с формулой (9. 6) будет д?=?к — ?=?!! — ¥ +^О. (9. 15) Для осуществления метода наведения (9. 14) требуются меньшие кинематические перегрузки, но в районе точки встречи (D^O) они могут достигать недопустимых значений. В этом случае коэффици¬ ент пропорциональности в (9. 14) можно подобрать таким, чтобы кинематическая траектория в точке встречи (£)»0) была прямо¬ линейной (<рц|п=о = О) или близка к ней. В системах телеуправления локатор непосредственно не может измерить ни угол визирования е, ни его производную е, как это имеет место в системах самонаведения. Это вызывает значитель¬ ные трудности при осуществлении в системах телеуправления ме¬ тодов параллельного и пропорционального сближения: требуются очень сложные вычисления. Усложнение метода наведения обяза¬ тельно приведет к увеличению флуктуационных ошибок в системах наведения. Главным препятствием для более сложных законов на¬ ведения являются не вычислительные возможности станций наве¬ дения, а возрастание флуктуационных ошибок. Передаточная функция кинематического звена. Уравнения (9. 1) и (9.2) являются основными кинематическими уравнениями, из которых было получено нелинейное нестационарное уравнение (9. 3) кинематического звена, связывающего координаты г и ср, из¬ меряемые станцией наведения, с ускорением^/, являющимся проек¬ цией полного ускорения объекта управления на нормаль ti — п к вектору г (см. рис. 9.2). Анализ динамики наведения ЛА по урав¬ нению (9. 3) представляет значительные трудности. Выведем при¬ ближенное упрощенное уравнение. Так как обычно угол 0 — ср мал, то уравнения кинематики (9. 1) и (9.2) можно упростить так: r=V, (9. 16) rcp-|- Vy = VG. (9. 17; С учетом (9. 16) уравнение (9. 17) представим в виде (9. 18) где rtp=S — длина дуги (см. рис. 9. 2). Дифференцируя (9. 18), по¬ лучим S = V0+V0. Подставляя сюда значение 0 из (9. 18), найдем уравнение кинематического звена S—VS/V = j, j=VG. Считая V = 188
= const и осредняя значение скорости V, получим искомую пере¬ даточную функцию = (9. 19) которая при отсутствии тангенциального ускорения У=0 приобре¬ тает тривиальный вид: Wl{. 3(р) = 1/р2. 9.3. МАТЕМАТИЧЕСКИЕ МОДЕЛИ ЗВЕНЬЕВ СИСТЕМЫ ТЕЛЕУПРАВЛЕНИЯ Уравнения бортового контура. Математические модели объекта управления и цели описаны в гл. 1 для всех трех каналов: тан¬ гажа, курса и крена. Математические модели автопилотов всех ка¬ налов описаны в гл. 3. В совокупности уравнения ЛА и уравнения автопилота описывают работу бортового контура. При телеуправ¬ лении, как и в системах самонаведения, формируется контур ста¬ билизации перегрузки. На автономном участке полета управление осуществляется по сигналам, снимаемым со свободного гироскопа, и по сигналам, поступающим с программных устройств. На участ¬ ке телеуправления программные устройства, свободные гироско¬ пы канала высоты и бокового канала отключаются. Свободный ги¬ роскоп в канале крена не отключается, и осуществляется стабили¬ зация угла крена. К бортовой аппаратуре управления следует также отнести при¬ емник, дешифратор команд, поступающих со станции наведения, ответчик, если он установлен на объекте управления. Уравнения кинематики. Точные уравнения кинематики объекта управления и цели задаются уравнениями (9. 1) и (9.2). Прибли¬ женные кинематические уравнения могут быть заданы уравнени¬ ями вида (9.19). Уравнения метода наведения. Уравнение метода наведения за¬ дается одним из уравнений (9.5), (9.14), (9.7). Формируя соот¬ ветствующим способом Дфупр, можно задать любой метод наве¬ дения. Уравнения информационных элементов. Радиотехнические сред¬ ства измеряют непосредственно угол места ф, азимут ф, дальность г. Эти координаты измеряются при помощи угломерных и дально¬ мерных визирных систем (рис. 9.4), являющихся замкнутыми сле¬ дящими системами. Блок управления отрабатывает сигнал рассо¬ гласования Дф* между направлением на ЛА и равносигнальной зоной антенны. Для совмещения этих двух направлений антенну доворачивают в сторону цели при ее механическом перемещении или формируют диаграмму направленности антенны. Текущее зна¬ чение угла оси равносигнальной зоны антенны <рп является прибор¬ ным значением угла места ЛА. Сигнал рассогласования Дф= = Ф—фп определяет отклонение оси равносигнальной зоны антен¬ ны от направления на ЛА. Сигнал на выходе приемника можно представить при нормальной работе локатора в виде д?*=К+х WJд?+« 189
Рис. 9.4. Функциональная схема угломерной следя¬ щей визирной системы где n(t)—аддитивная помеха, вызванная амплитудными флук¬ туациями отраженного сигнала, может считаться нормальным бе¬ лым шумом; kn— коэффициент усиления приемника; х(^)—слу¬ чайная составляющая сигнала; сигналы х(/) и n(Y) некоррелиро- ваны. Инерционность системы визирования при механическом приводе локатора можно описать передаточной функцией ^(р) = ?п(р)/?(р)=^(Лр+1)/(Г1Р2+2^^+ О (Т2р+ 1), (9. 20) где фп — угол поворота антенны радиолокационной станции; ф — угол места ЛА. Следящая система измерения дальности может быть изображе¬ на в виде схемы, аналогичной приведенной на рис. 9. 4. Прибор¬ ное значение дальности гп получается на основании измерения вре¬ менной задержки ответного импульса по отношению к зондирую¬ щему. Можно считать, что гп=г+Дг, где Аг — ошибка в измерении дальности. Уравнение линии передачи. В телеуправляемых системах ли¬ нии передачи обычно являются многоканальными: путем частотно¬ го, временного и кодового разделения можно передавать на объект управления команды управления по курсу, тангажу, крену и разо¬ вые команды на изменение параметров и режимов работы борто¬ вой аппаратуры. Командную линию передачи можно описать пере¬ даточной функцией. грту(р) ^рту ехр(-^)/(^+1)- (9.21) Как временное запаздывание т, так и постоянная времени Т на¬ столько малы, что можно считать линию передачи команд при ис¬ следовании динамики систем телеуправления безынерционным звеном, т. е. передаточная функция канала радиотелеуправления ^рту == ^рту- 9.4. ФУНКЦИОНИРОВАНИЕ СИСТЕМ ТЕЛЕУПРАВЛЕНИЯ Структурная схема. На рис. 9. 5 представлена структурная схема системы телеуправления при наведении по методу трех точек. Два локатора с передаточными функциями №\>ц(/2), W?(p) измеряют угловые координаты соответственно цели фц и объекта управления ф. Координаты фц и ф измеряются с аддитивными помехами П\ (t) и n2(t) соответственно. Сигнал рассогласования между их прибор¬ ными значениями Дфп=фц. п — Фп поступает на устройство выра¬ ботки команды управления IFK. у(р), на выходе которого получа¬ ем сигнал управления и. Сигнал и через канал радиотелеуправле- 190
Рис. 9.5. Структурная схема системы телеуправления ния Грту(р) в виде заданной перегрузки п3 поступает на вход кон¬ тура стабилизации перегрузки IFK. с. п(р)- Выходной координатой контура стабилизации перегрузки явля¬ ется перегрузка n=VQ/g, которая не может быть непосредствен¬ но замерена локатором. Поэтому для замыкания системы вводит¬ ся кинематическое звено 1FK. 3(р), связывающее нормальные пере¬ грузки объекта управления с длиной дуги S = r<p. При методе наведения по трем точкам можно измерить одним локатором угол между векторами г и гц, т. е. измерить сразу сиг¬ нал рассогласования Афп=фц. п — фп- При этом случайная состав¬ ляющая ошибки измерения сигнала Афп будет меньше, нежели при формировании Дфп в соответствии со схемой на рис. 9. 5. Поэтому метод наведения по трем точкам иногда предусматривается как резервный на тот случай, когда основной метод наведения — на¬ ведение с упреждением — становится невозможным из-за, напри¬ мер, возрастания шумов. При наведении с упреждением (9. 14) необходимы два локато¬ ра: один для измерения координат цели (фц, гц), другой — объек¬ та управления (ф, г). При этом уровень шумов увеличивается, во-первых, из-за применения двух локаторов, режимы работы ко¬ торых абсолютно идентичными сделать нельзя, а во-вторых, из-за необходимости измерения дальностей до цели гц и до объекта г. Кроме того, приходится вычислять разность двух сигналов Гц.п — гп? что приводит к дополнительному возрастанию шумов, особенно при приближении объекта управления к цели, когда зна¬ чение гп близко к значению гц. п. Для уменьшения шумовой состав¬ ляющей сигнала рассогласования Дфп приходится пропускать его через сглаживающие фильтры типа фильтров низких частот. При помощи установки приемопередатчика (ответчика) на объекте уп¬ равления можно избавиться от случайных ошибок отраженного сигнала гг2(/). Формирование команды управления. Рассмотрим возможные подходы к формированию команды управления в звене IFK. у(р). В системах телеуправления команда управления формируется на станции наведения. На вход устройства выработки команды посту¬ пает сигнал рассогласования в угловой или линейной мере. Если сигнал рассогласования поступает в угловой мере, то вычисляется сшибка наведения в линейной мере Л=/?(/)Дф — отклонение объ¬ екта управления от кинематической траектории. Здесь R(t) —за- 191
ложенная в память станции наведения функция, примерно равная для. каждого момента времени расстоянию от станции наведения до объекта управления. Часто сигнал команды управления форми¬ руется в виде и = kxh!Wx {р} + k2phjW2 (р) + kJi]pW3 (р). (9. 22) Передаточная функция устройства выработки команды управле¬ ния №к. у(р) с учетом /г=7?(/)Дф из последнего соотношения будет ^к.у (р) = “ (Р) = KR/W. (р) + k2Rp!W2 (р)+k3R)pW3 (р), где Wzi(p), IF2(p), Wa(p)—передаточные функции фильтров низ¬ ких частот, которые вводятся для подавления высокочастотных по¬ мех, возникающих в процессе дифференцирования и других преоб¬ разований сигнала рассогласования. Закон управления (9. 22) позволяет осуществить регулирование по отклонению, производной и интегралу. Однако необходимо иметь ввиду, что контур наведения содержит двойное интегрирующее зве¬ но [кинематическое звено (9. 19)]. Поэтому введение-интеграла в закон (9.22) потребует дополнительных корректирующих цепей для обеспечения устойчивости контура телеуправления в целом. Для ограничения максимального значения каждой из составляю¬ щих сигнала и могут устанавливаться ограничения типа линейного' звена с насыщением. Сформированная команда управления и по¬ ступает в канал телеуправления для передачи в закодированном виде на борт объекта управления. Общая характеристика системы. Представленную на рис. 9. 5 схему телеуправления можно рассматривать как следящую систе¬ му, которая предназначена для отработки маневра цели, т. е. для отработки сигнала фц при наведении по методу трех точек или сиг¬ нала фк при наведении с упреждением. Выходной величиной явля¬ ется угловая координата объекта управления ф, которая в момент встречи tB должна быть равна угловой координате цели фц. Систе¬ ма телеуправления отслеживает заданную угловую координату фк с некоторой ошибкой, возникающей из-за маневра цели и из-за случайных и систематических ошибок. Система телеуправления является нестационарной системой. Нестационарность эта возникает из-за изменения дальностей гц, г в процессе наведения, а также вследствие изменения свойств кон¬ тура стабилизации перегрузки и кинематического звена на различ¬ ных режимах полета ЛА. На некоторых расчетных режимах поле¬ та ЛА (минимальный и максимальный скоростной напор, отделе¬ ние ступеней, включение двигателя и т. п.) система телеуправле¬ ния может рассматриваться как стационарная с «замороженны¬ ми» коэффициентами. В действительности система телеуправления является и нестационарной и нелинейной из-за тех же нелинейно¬ стей, что и в системах самонаведения. Поэтому структура систе¬ мы телеуправления и ее звеньев, а также значения параметров системы могут быть получены лишь при моделировании ее работы в детерминированной и стохастической постановке на цифровых машинах. 192
Передаточные функции. Считая систему стационарной, запишем передаточную функцию !Fp(p) системы телеуправления в разомк¬ нутом состоянии (см. рис. 9. 5) (Р) = (Р)/Д?п (Р) =7- ^к.у (Р) (Р) ^K.c.n (р) WK,3 (Р) (р). Выражения для всех передаточных функций, входящих в контур телеуправления, приведены выше. Структура передаточной функ¬ ции контура стабилизации перегрузки та же, что и в системах са¬ монаведения. При комбинированном управлении, когда осущест¬ вляется телеуправление на начальном участке и самонаведение на конечном участке траектории, структура контура стабилизации перегрузки может оставаться без изменения. Передаточная функ¬ ция системы в замкнутом состоянии будет иметь вид ^з(Р)=?../?ц.п = ^р(р)/(1 + ^р(р))- - (9.23) Так как практический интерес представляют не приборные значе¬ ния координат, а их физические значения, то, учитывая, что и <р„(р)=Гд(р)<?, получим W'a (Р) = ? (р)/?ц (Р)=^р(р)^,Д( 1 + ^р(Р)) (/>)] • (9.24) Если передаточные функции локаторов сопровождения W? (р) и (р) идентичны, то передаточные функции (9.23), (9.24) будут совпадать. Так как сигнал ошибки наведения в угловой мере равен Д<р = ='фк — ф=фк—№(р).фк,'то, с учетом (9.23), ее передаточная функция Ж,, (р) = Д<рп (р)/?ц.п (р) = 1/(1 + rp (р)). (9.25) Передаточная функция ошибки наведения в линейной мере h = — гДср, очевидно, будет равна wh (p)=h (р)/Тц (р) = r/( 1 + Гр (р)). (9. 26) Полученные передаточные функции являются приближенными, так как они не учитывают нестационарность системы, однако они могут дать приемлемые результаты при рассмотрении отдельных режимов полета объекта управления, где коэффициенты изменяют¬ ся незначительно. Краткая характеристика динамической точности. Полученная линейная модель системы телеуправления с передаточными функ¬ циями (9. 23) — (9. 26) может быть исследована хорошо разрабо¬ танными методами в теории автоматического управления. При от¬ сутствии интеграла в законе (9. 22) можно показать, что линейная ошибка h(t) прямо пропорциональна требуемому кинематическому ускорению j(t) и обратно пропорциональна коэффициенту усиления /гр разомкнутого контура, т. е. Л(/)^/(^р. (9.27) Из формулы (9. 27) видно, что желательно выбирать такой метод 193
наведения, для осуществления которого требуются меньшие пере¬ грузки. Таким образом, для метода трех точек следует ожидать большие значения динамической ошибки (9. 27). Путем увеличения коэффициента усиления йр системы телеуправления в разомкнутом состоянии можно уменьшить динамическую ошибку. Но при этом возрастает случайная составляющая ошибки, среднее квадратич¬ ное значение которой с учетом (9.26) может быть представлено' в виде Г— OftW==j/ i где Sn((o) —спектральная плотность входного случайного воздей¬ ствия, в данном случае белого шума n{(t) (см. рис. 9.5). Таким образом, уточненные параметры системы могут быть выбраны только с учетом случайных воздействий. На окончательном этапе расчета и синтеза системы необходи¬ мо учесть основные нелинейности в системе телеуправления, те же, что и в системах самонаведения. При этом необходимо иметь в ви¬ ду, что свойства нелинейных систем в отличие от линейных зависят от величины входных сигналов, детерминированных и случайных.
Глава 10 СИНТЕЗ УПРАВЛЕНИЯ В ЗАДАЧАХ НАВЕДЕНИЯ В ИГРОВОЙ ПОСТАНОВКЕ 10.1. СОДЕРЖАНИЕ ИГРЫ ПРЕСЛЕДОВАНИЯ — УКЛОНЕНИЯ В ЗАДАЧАХ НАВЕДЕНИЯ Представим себе задачу наведения как конфликтную ситуацию, когда задача ЛА — сделать время захвата по возможности мень¬ шим, а задача пели — по возможности большим, или, если возмож¬ но, вообще избежать захвата. Положим для простоты, что движе¬ ние цели и ЛА происходит в одной плоскости — в плоскости XgYg (рис. 10.1), их линейные скорости постоянны по величине и равны Гц и V соответственно, а их угловые скорости 0Ц, 0 ограничены: b = Vu/'R, | и | < 1; (10. 1) 0Ц=ГЦ^//?Ц, (10.2) где 7? и —минимальные радиусы кривизны траекторий ЛА и це¬ ли соответственно, а управления uf v в каждый момент времени могут выбираться произвольно из интервала [—1, 1]. Вводя коорди¬ наты ЛА Хла, Ула и цели хц, уц, запишем кинематические соотно¬ шения ^a = 4cois6; ynA = I/sin0; (10.3) хц=1/цСОб9ц; jf„=Vnsin0u. (Ю.4) Совокупность дифференциальных уравнений (10.1) — (10.4) описы¬ вает эволюции системы ЛА — цель. Положим, что законы управле¬ ния формируются как функции состояния (хЛа> У ла, б, ха, Уа, 0ц) сис¬ темы (10.1) — (Ю.4): « = «(*ла> Ула, 0> х» Ук 0ц); (Ю.5) г’ = 'ц(-«лА> Ула> 0> xv уа, 0Ц); (10.6) это значит, что ЛА и цель полностью информированы о текущем состоянии партнера и своем собственном. Подставляя (10.5), (10.6) в уравнения (10.1), (10.2), получим замкнутую систему уравнений (10.1)—(10.6), из которой однозначно определяется траектория движения системы при заданном начальном состоянии. Зафиксиро¬ вав каким-либо образом начальные состояния, после интегрирова¬ ния системы уравнений (10.1) — (10.6) определим время захвата Т3=Т3({и}, {^}) как функционал от выбранных позиционных уп- 195
Рис. 10.1. Неподвижная O0XgYg и подвиж¬ ная OXY системы координат равлений (10.5), (10.6). Если по¬ зиционные управления {и}, не обеспечивают захвата, полага¬ ем Т3=оо. Если предположить, что извес¬ тен закон управления цели (10.6), то необходимо заложить та¬ кой закон {и} управления ЛА, который обеспечит минимум по {и} функционала Т3({и}) = = Т3({и}, {у}), где {а} — фикси¬ ровано. Это обычная задача оп¬ тимального управления, и ее ре¬ шение может быть осуществле¬ но на основе принципа макси¬ мума Понтрягина или динамического программирования Вел¬ лмана. Точно так же решается задача выбора оптимального закона управления цели в предположении, что закон управления ЛА из¬ вестен. Особенность задачи наведения в конфликтной ситуации за¬ ключается в том, что ни ЛА, ни цель не располагают сведениями о законе управления, выбранном партнером. Чтобы пояснить обста¬ новку, предположим, что и ЛА, и цель совершают выбор в преде¬ лах некоторого конечного числа возможных стратегий управления: и(1),..., и сИ1),..., № соответственно. Зафиксировав начальные ус¬ ловия и подсчитав Tl3J = Т3({и[}, {^j}), Z= 1,..., /?г; /= 1,..., лг, со¬ ставим из величин Т3 матрицу ||7V|I размерности тХп.В резуль¬ тате приходим к так называемой матричной игре двух лип: один игрок (ЛА) выбирает номер строки (скажем Zi), второй игрок (цель) — номер столбца (скажем / J и ни один из игроков при сво¬ ем выборе не осведомлен о выборе партнера (однако матрица || Т133 || известна им обоим). После того как выбор сделан, игра за¬ канчивается и на языке теории игр первый игрок выплачивает вто¬ рому сумму Tl3Jl. В задачу первого игрока входит минимизировать проигрыш, а в задачу второго максимизировать выигрыш. Какой выбор игроков следует считать наилучшим? Положим, что первый игрок сделал некоторый выбор ix. Самое большее, что при этом может получить второй игрок, это шах7^17' ► J Руководствуясь этим, первый игрок может попытаться минимизиро¬ вать этот максимально возможный выигрыш второго игрока, при¬ менив такую стратегию Z=Z*, при которой выражение шах, j рассматриваемое как функция /, принимает минимальное значение min {max Гз7}==тахГз*7. Стратегия /* гарантирует первому игроку * / J проигрыш не больше величины min max Т3 , какова бы ни была стратегия второго игрока. Аналогично, если второй игрок применя- 196
ет стратегию у* такую, что max{min77} = min77’, то он обеспе- j 1 1 .. чит себе выигрыш, по крайней мере, max min Тз7, какая бы ни бьг- J i ла стратегия первого игрока. Очевидно: шахштГз^ттГз7* Tl3*j* <СтахТз*7 = тттахГз7, j I i j z i так что если игроки одновременно применяют свои стратегии /*, /*, то значение платы Т3^ лежит между величинами max min Tlj Ji и min max Гз7. Особый интерес представляют игры, у которых i J платежная матрица || T'j ||, как говорят, имеет седловую точку max min Tl3j= min max T3. Значения минимакса и максимина, 7 z 1 i очевидно., при этом совпадают со значением Гз 7 , которое называ¬ ют ценой игры, а стратегии /*, /* — оптимальными стратегиями или решением игры. Если оба игрока применяют оптимальные страте¬ гии £*, /*, то проигрыш первого и, соответственно, выигрыш второ¬ го игрока равны пене игры Т3 7 . Для игр с седловой точкой, если первый игрок применяет оптимальную стратегию /*, а второй игрок Еыбирает некоторую стратегию /ь то выигрыш Т3 J1 второго игрока при этом может только уменьшиться, т. е. Гз*71<шах Тз*7=щт max Tl3j=T3^ . J 1 J (см. определение стратегии /*). Точно так же, если второй иг¬ рок придерживается оптимальной стратегии, а первый — от¬ клоняется от нее, то его проигрыш при этом может только увеличи¬ ваться. Таким образом, если один из игроков рассчитывает, что его партнер применяет свою оптимальную стратегию, то наилучший способ действия этого игрока — применить свою оптимальную стра¬ тегию. Если один из игроков заранее осведомлен о выборе страте¬ гии партнера, то задача теряет игровой характер. Если известно, например, что второй игрок выбрал /1=И=/*, то при этом первому иг¬ року, очевидно, надо выбрать такое r’i, при котором тшГз71 = Гз171, а не /*• В приведенных рассуждениях конечность возможного выбора стратегий обоих игроков не имеет принципиального значения. В об¬ щем случае вместо конечной матрицы ||7^7|| выступает функционал Т3(Н {^}). Если выполняется условие седловой точки maxmin73({«), {^}) = min max7\({&}, {^}), (10.7) М {а} (а) М то определена цена игры как значение (10.7), и существуют опти¬ мальные стратегии {и*}, {у*}, для которых Т3({и*}, {а*}) совпа¬ дает со значением (10.7). Эти законы управления обладают всеми теми свойствами, которые излагались выше в случае конечной воз¬ можности выбора. 197
Рассмотрим для примера игры с матрицами "2 5 2 5 3 4 1 6 1 2 1 2 1 Для первой игры maxminr^=max(l, 4, 1)=4, min max 7^'= j 1 i i j — min(5, 5, 4, 20)=4. Таким образом, условие седловой точки выполнено, цена игры равна 4, /* = 3, /* = 2. Для второй игры maxTninP‘>=max(l,l)= 1, min тахГ^=пип(2,2)=--2, т. е. условие i i I j седловой точки не выполнено. 10.2. ОБЩИЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ Описанная выше игра преследования — уклонения входит в широ¬ кий класс так называемых дифференциальных игр. Опишем способ решения подобных игр. Общая дифференциальная игра задается системой дифференци¬ альных уравнений x=f(x, u, v), (10.8) где хт=(%1, ..., хп), uT=(tZ1, ..., ир), vt=(t71, ..., ^); fT=(/* Состояние игры в каждый момент времени описывается точкой фазового пространства Rn. Векторы управления и и v находятся в распоряжении первого и второго игроков соответственно, их выбор в каждый момент времени подчинен некоторым ограничениям: ueLu, v^Lv , где Lu и Lv — ограниченные замкнутые подмножест¬ ва в евклидовых пространствах R? и Rq соответственно. Игра на¬ чинается в некоторой точке фазового пространства х и заканчива¬ ется, когда фазовая точка х достигает некоторого заданного мно¬ гообразия S^Rn. В определение игры входит функционал платы Z=f/o(x, U, v)^+g(x(7’))> (10.9) О где Т — момент первого достижения точкой х конечного многообра¬ зия S. Величина I является выигрышем второго игрока и проигры¬ шем первого. Перед одним игроком стоит задача минимизировать / за время игры, перед другим — максимизировать I. Оба игрока делают свой выбор, основываясь на знании системы уравнений дви¬ жения (10.8) и состояния игры, т. е. на знании фазовых координат х в каждый момент времени, когда производится выбор. Опреде¬ лим стратегии игроков как вектор-функции: u=u(x), v=v(x). Отметим еше раз, что если бы стратегия одного из игроков, ска¬ жем v(x), была фиксирована и известна, то игровая задача преоб¬ разовалась бы в задачу оптимального управления. 198
Если в функционале платы (10.9) положить g=0, то получим игру с так называемой интегральной платой; если же положить /о=0, то получаемая при этом плата называется терминальной. Для формального определения цены игры необходимо ввести классы допустимых стратегий, т. е. вектор-функции от х. Для ре¬ альных игровых задач вполне достаточными оказываются классы кусочно-непрерывных управлений u(x), v(x). Ценой дифференци¬ альной игры назовем общее значение U7 = min maxi— min min I, (10. 10) (u(x)}{v(x)} {v(x)}{u(x)} если оно существует. Стратегии {u*(\)}, {v*(x)}, для которых пла¬ та совпадает с ценой игры, назовем оптимальными. Игра становит¬ ся вполне определенной, если задано начальное состояние, поэтому цена игры' есть функция начального состояния, т. е. W= 1Г(х). 10.3. ВЫВОД ОСНОВНОГО УРАВНЕНИЯ ТЕОРИИ ДИФФЕРЕНЦИАЛЬНЫХ ИГР Пространство состояний игры можно разбить некоторыми поверх¬ ностями на области, в которых функции W(x), u*(xj, v*(x) регу¬ лярны, т. е. имеют непрерывные производные. На разделяющих по¬ верхностях эти функции могут не иметь производных или даже иметь разрыв первого рода. Определим функции IJ^(x), u*(x), v*(x) в областях, где они ре¬ гулярны. Выведем для функции IF(x) уравнение в частных произ¬ водных. Пусть в некоторый момент t состояние игры определяется точкой х. Если игра развивается из точки х оптимально, то соот¬ ветствующая плата по ее окончании равна цене IF(x). Выберем какие-либо значения управлений и и v в точке х и будем считать их постоянными в течение некоторого малого промежутка времени ДЛ За это время произойдет смещение состояния игры на вектор Ax = f(x, u, v) Д/-|-о(Д/). (10. 11> Предположим, что из состояния х+Дх игра развивается оптималь¬ но, тогда плата /(х) для точки х, которую рассматриваем как на¬ чальную в соответствии с (10.9) и (10.8), будет t+^t /(х)= f /0(x(s), u, v)ds+U7(x + Ax)= t п = fо(х, u, v) Д/-|-U7 (x)-j-^^jо (Д/), или п /(х) = /о(х,и,у)Д/ + 1Г(х) + ^^-)Л(х, и, у)Д/ + о(Д/). (10. 12) /=1 1 199
При последнем переходе использована формула (10.11). Применив к левой части (10.12) операцию min max или max min , что U V V u jb силу предположения (10.10) дает тот же результат, получим в ле- 'вой части (10.12) функцию W(x). Здесь использован принцип оп¬ тимальности: min max и max min взят по векторно-числовым па¬ раметрам ueLu и v^Lv, а не по векторно-функциональным. Таким образом, от (10.12) приходим к уравнению 0 = min max u V Г п dW(x) dxi /z(x,u, v)A/ + /0(x, и, у)Д/-]-о(Д/) Поделив это соотношение на At и считая А/—Ч), получим следую¬ щее уравнение для цены игры 1^(х): min max u V дх[ u, v)+/0(x, u, v) =0, (10.13) которое будем называть основным уравнением дифференциальных игр. Уравнение (10.13) было получено Айзексом. Если стратегия у(х) выбрана и фиксирована, то, отбросив в (10.13) операцию мак¬ симума по v? получим известное уравнение Веллмана. 10.4. РЕШЕНИЕ ОСНОВНОГО УРАВНЕНИЯ МЕТОДОМ ХАРАКТЕРИСТИК Основное уравнение дифференциальных игр (10.13) превращается в нелинейное уравнение в частных производных первого порядка, если предварительно выполнить операцию минимакса. Введем обоз¬ начение grad Г(x) = (dlF(x)/oxi,..., dW(x)/dxn) = (Гь ..., №„). Обозначим далее через <р(х; grad IF(x)) и if (х; grad IF(x)) соответ¬ ственно оптимальные значения параметров ииу, для которых дости¬ гается значение минимакса выражения (10.13). Функции <р и if, во¬ обще говоря, многозначны, однако будем считать, что они распада¬ ются на конечное множество непрерывных однозначных ветвей, каждую из которых необходимо рассмотреть отдельно. Таким образом, уравнение (10.13) на оптимальной траектории приобретает вид п Iх’ ф (х; gradUZW): 'Их; gradIT(x))] + /=1 * + /olx> ф(х; gradlT(x), ф(х; gradU7(x))]=0. (10.14) Пена игры удовлетворяет уравнению (10.14) и граничным услови¬ ям на терминальном многообразии lT(x)|s=g(x), (10.15) поскольку для точек, лежащих на многообразии S, интегральный 200
член в функционале платы (10.9) обращается в нуль. После того, как найдено решение Wz(x) уравнения (10.14) с граничными усло¬ виями (10.15), оптимальные управления определяются соотноше¬ ниями и*(х) = ф(х; gradU7(x)); у*(х) = ф(х; gradlF(x)). Уравнение (10.14) есть дифференциальное уравнение в частных производных первого порядка. Общий метод интегрирования таких уравнений — метод характеристик — приводит к следующей систе¬ ме 2п обыкновенных дифференциальных уравнений, относительно переменных xiy Wi = dW/dXi, i= 1, 2,..., п\ = <Р(х; ..., Wn\ ф(х; ..., 1TJ], i= 1, 2, ..., /г; (10. 16) <p(x; UZj, .... Wn\ ф(х; ..., Г„)]- — <p(x; Wn); ф(х; Wi, ..., Wn)], Z=l, 2, ... n. (10.17) Траектории этой системы называются характеристиками, а сама система — уравнениями характеристик. Вводя переменную х——t, а также пользуясь автономностью системы уравнений (10.16), (10.17), положим, что момент 1 = 0 отвечает попаданию траектории на многообразие S. Заменив t на —т, перепишем систему уравнения (10.16) и (10.17) в регрессивной форме Xt= — /, [х; <р(х; .., W„), ф(х; 1Г15 ..1Г„)], Z= 1, 2, ... ,п; П ^'•=2 Г1’ • • •’ Г1’ • • •’ + +/-/о[х; ф(х; IFi,..., Wn), <р(х; IFi, . .., Z=l, 2, ..., п. dxi (10. 18) Система (10.18) описывает процесс обращенного движения — от терминальной поверхности S к начальному состоянию х игры. Напомним, что основное уравнение дифференциальных игр опи¬ сывает оптимальные траектории лишь «в малом», т. е. в тех облас¬ тях, в которых функции IF(x), u*(x), v*(x) регулярны (см. разд. 10.3). При переходе из одной области в другую через разделяющую их поверхность оптимальные синтезирующие функции и цена игры терпят разрыв или излом. Пока еще нет общей теории таких по¬ верхностей, и поэтому при решении конкретных дифференциальных игр приходится, исходя из траекторий игры, получаемых при интег¬ рировании уравнений характеристик, составлять решение в целом, учитывая специфику задачи. 201
10.5. ЗАДАЧА ПРЕСЛЕДОВАНИЯ — УКЛОНЕНИЯ ПРИ БЕЗЫНЕРЦИОННОЙ ЦЕЛИ И ЛА С ИДЕАЛЬНЫМИ СИСТЕМАМИ УПРАВЛЕНИЯ Рассмотрим простейший вариант игры преследования — уклонения, полагая, что и ЛА, и цель могут в каждый момент времени выби¬ рать произвольно направления своих скоростей. В такой постанов¬ ке дифференциальные уравнения игры (10.1) — (Ю.4) редуцируют¬ ся к виду: XflA=^cQs9; г/ЛА = ^ sin 9; хц=Уц cos 9Ц; уц==Уц sin 9Ц. (10.19) Введем подвижную систему координат, связав ее начало с целью и направив оси параллельно осям XgYg исходной системы координат (см. рис. 10.1). Обозначив через х, у координаты ЛА в новой системе координат, из (10.19) путем почленного вычитания соответствующих уравнений получим следующую систему: x=V сое 9—- 1/ц cos 9Ц; у= V sin 6 — Vn sin 9Ц. (10.20) Углы 0 и 0ц наклона к оси абсцисс векторов скоростей ЛА и пе¬ ли здесь выступают в роли управлений и на области их изменений никаких ограничений не наложено. В качестве терминальной кри¬ вой выберем окружность радиуса I с центром в начале координат, т. е. в местоположении цели: х2 + у2=/2. (10.21) Рассмотрим задачу на быстродействие, так что в функционале (10.9) будем иметь /0= 1; £=0 и, следовательно, W(х, т) =т. Ос¬ новное уравнение дифференциальных игр (10.13) для данной зада¬ чи (10.20) примет вид (Wi = dW/dXi): min max [\Fi(V cos 9 — 1/ц cos 9ц)-|-1172(У sin 9 — 1/ц sin 9ц)-|- 1] = 0» 6 0ц или после перегруппировки слагаемых min max [V cos 9 + W2 sin 9)- Уц (cois 9Ц + W2 sin 9Ц) + 1 ]=0. 0 0ц (10. 22) Первое слагаемое в (10.22) зависит от управления 0, а второе — от 0ц, поэтому экстремум (10.22) достигается на оптимальных уп¬ равлениях 0*, 0ц*, получаемых из условий: min (W\ cois ti-\-W2 sin 9); o max( —U/i cas9u—IF2 sin 9Ц), так как операция максимум по 0Ц 0Ц в (10.22) распространяется только на второе, а операция минимума по 0 — на первое слагаемое. Выражения, стоящие в скобках, мож¬ но рассматривать как скалярные произведения векторов (lFi, W2) и (cos 0, sin 0 ), (IFi, W2) и (cos 0ц, sin0u). Скалярное произведение двух векторов достигает максимального (или минимального) зна¬ чения при угле между ними, равном нулю (или л). Поэтому мини- 202
Рис. 10.2. Подвижная система координат OXY мальное (или максимальное) значение последние выражения при¬ нимают при следующих значениях 9 * и 0Ц*: sin 9ц = sin 6* = — №2/УWi-j-Wl; cos 9ц = cas 9*= - WJ У Wl+Wl (10.23) Подставляя значения (10.23) оптимальных управлений в основ¬ ное уравнение (10.22), получим - УУ Wl+Wl + + 1 = 0- (10.24) Найдем значения IFi, IF2 на терминальной кривой (10.21). Для этого параметризуем ее в виде x=lcoiss; y = Zsins. (10.25) Так как на терминальной кривой И7=0, то дифференцируя это тожде- /1ЛОг\ V л dVT dx I dy ство nos, с учетом (10.25) найдем, что 0 = = = J v 7 ds дх ds dy ds = — Z sin s-|-IF2 Z cos s, t. e. на терминальной кривой UZ^Xcoss; UZ2=Xsins. (10.26) Подставляя найденные значения W2 в уравнение (10.24), по¬ лучим — У|Х| + V4|X| + 1 =0. Возрастание функции W идет в на¬ правлении grad W= (IFi, IF2). Поскольку представляет интерес развитие игры во внешнюю по отношению к области захвата часть фазового пространства и grad W направлен в сторону возрастания W, необходимо взять Х>0. Поэтому из последнего уравнения имеем а=(^-УцГ. (10.27) Из системы (10.20) с учетом значений (10.23) найдем уравнения характеристик (10.18) в регрессивной форме х=VWi/Уwl+wl- V^ity= 0; (10.28) y=.VW2iyW\+W22-VaW2!yW7°2=0. 203
Интегрируя правые уравнения системы (10.28), найдем, что IFj и 1^2 имеют постоянные значения вдоль траекторий, равные своим начальным значениям (10.26). Подставляя значения и IF2 из (10.26) в левые уравнения системы (1С.28), получим x=(V—► — Иц) cos s; y=(V—Уц) sin s. Интегрируя последнюю систему уравнений при начальных условиях (10.25), получим оптимальные траектории х = [/ + т (V - 1/ц)] cois s; у = [I - х (V - Уц)] sin $. (10. 29) Итак, при оптимальном развитии игры, заканчивающемся в точке s терминальной кривой, значения управлений 0*, 0Ц* определяются соотношениями sin О ц* = sin 0* =—sin s; cos 0Ц* = cos 0* = —cos s, т. e. во время оптимального движения ЛА и цель двигаются по прямой, их соединяющей, причем цель движется от ЛА. Нетрудно выразить цену игры и оптимальные управления как функции фазо¬ вых координат. Учитывая, что в задаче на быстродействие функци¬ онал платы F(x) есть время т до окончания игры, из оптимальных траекторий (10.29) получим = т = (10.30) далее вычислим W1—^-=x/(V — Va)Vx2-\-y2; W2=-^~ — дх ду = y/W —VijVх2-\~У2, а воспользовавшись (10.23), найдем sin 0* = sin 0*= — y/Vx2-[-y2; cos6* = cos 6*= — х/У х2-]-у2. (10.31) Как следует из формулы (10.31),направление вектора скорости ЛА и цели одинаково и поэтому V и Гц лежат на одной прямой. Следовательно, оптимальное управление ЛА заключается в ориен¬ тации вектора скорости V на цель, а оптимальное управление пе¬ ли— в ориентации Уц от ЛА. Однако оптимальный закон управле¬ ния ЛА полностью сохраняется даже если цель не будет следовать оптимальному управлению. Если при этом ЛА использует оптималь¬ ное управление, то захват цели произойдет раньше. 10.6. ЗАДАЧА ПРЕСЛЕДОВАНИЯ— УКЛОНЕНИЯ ПРИ ИНЕРЦИОННОЙ ЦЕЛИ И БЕЗЫНЕРЦИОННОМ ЛА С ИДЕАЛЬНЫМИ СИСТЕМАМИ УПРАВЛЕНИЯ Предположим, что радиус кривизны траектории цели ограничен снизу, что соответствует ограничению величины максимальной пе¬ регрузки, а ЛА может в каждый момент выбирать направление своей скорости произвольно. Такая постановка задачи имеет опре¬ деленный практический смысл, так как обычно ЛА более маневре- нен нежели цель. Система дифференциальных уравнений игры (10.1) — (Ю.4) сводится теперь к уравнениям ^A = lZcos0; sin 0; Xu=l/ucos9u; уц = 1/ц sin 6Ц; 0u=V>//<- (10.32) 204
Управляющим параметром ЛА является угол 0, определяющий направление вектора скорости, который в каждый момент времени может быть выбран произвольно. Управляющий параметр цели и определяет радиус кривизны траектории цели и направление дви¬ жения и может быть выбран в каждый момент времени произволь¬ но в пределах В уравнениях (10.32) — минимальное значение радиуса кривизны. Для сокращения размерности фазового пространства игры, рав¬ ной пяти, выберем, как и в предыдущем разделе, подвижную систе¬ му координат OXY, связав ее начало с целью и направив ось абс¬ цисс по направлению вектора скорости цели (рис. 10.2). Обозначим через <р=0—0ц угол, который составляет вектор скорости ЛА с на¬ правлением оси абсцисс подвижной системы координат. Пусть х». у — координаты ЛА в подвижной системе координат. Выведем уравнение движения ЛА в подвижной системе координат. За время dt подвижная система координат повернется относительно исход¬ ной системы (см. рис. ГО. 1) на угол = VJ^vdt. Это эквива¬ лентно повороту радиуса-вектора ЛА на угол — Г'цЛщ1 vdt, равный по величине и противоположный по направлению углу Й0Ц. Коорди¬ наты ЛА х, у получат приращения d1x = yV^R^1vdt\ d1y=—xVilx xR^vdt. За это же время dt подвижная система координат XY переместится параллельно оси X на расстояние V^dt, что дает при¬ ращение координат х, у\ d2x =— Vudt\ d2y = 0 и, наконец, движение ЛА по вектору скорости V дает приращение координат х, у,: - = V cos ydt\ d3y=V sin ydt. Складывая эти три приращения коорди¬ нат х, у, получим уравнения дифференциальной игры в виде x=ybv— Уц-{-У cqscp; у= — xbv-\-V sin ср, (10. 33) где &= ]/ц/7?ц; v, ср — управления. Учитывая, что задача преследования — уклонения решается на минимакс времени захвата, запишем основное уравнение дифферен¬ циальных игр (10.13) в виде min max (ybv — 1/ц + V cois ср) -р W2 (— xbv -f- V sin ср) -|- 1] = 0, (p V или после перестановки слагаемых min max [biW^y — W^v-^-V^Wx cos<p + UZ2 sin <p) — Wya-\-1] = 0. <P V (10.34) Выполняя операцию минимакса, получим, что оптимальные уп¬ равления <р*, v* находятся из условий maxb{Wxy~W2x)v, min V (UZ, cos<p + UZ2 sin ?). (10.35) V <p Так как b и V — положительные константы, то из первого условия, учитывая, что ]у|^1, находим оптимальное управление для цели y* = sign (Wiy—W2x) при Wiy—W2x^0. В противном случае для нахождения и* необходимо использовать дополнительные данные. Из второго условия, так как под знаком операции min стоит ска¬ 205
лярное произведение векторов (Wif W2) и (cos ср, sin ср), найдем по аналогии с (10.23) значение оптимального параметра управле¬ ния ЛА Sin <Р*= - vrt+wl; cos<f>*= - Wi/У Wl+wl (10.36) Как и в разд. 10.5, находим, что на терминальной кривой значения х, У> Wzi, W2 задаются теми же соотношениями (10.25), (10.26). Уравнения характеристик в регрессивной форме (10.18) будут сле¬ дующие: Х= -+ UZi+Vri; Wi= — W2bv*-, у=xbv*-\-VW2/+1^2; IT2=^1^*- (10.37) Для определения оптимального управления a* = sign (W\y— —W2x) выясним знак (Wjy—W2x) вдоль траектории системы (10.37) . С учетом (’1'0.25), (10.26) на терминальной кривой будем иметь Wiy—W2x=l X cos s sin s—I k sin 5 cos s=0, и, следователь¬ но, управление v* надо находить из дополнительных данных. Вы¬ числим производную от (Wiy—W2x) по т с учетом системы (10.37): — (Wiy - W2x) = Wvy + Wxy- W2x- W2x = dv = - W2bv*y + (xbv* + VW2/y - UZjto**- - W2 (- ybv* + Уц + УVrf+wty = - 1Г2УЦ. (10. 38) Ввиду симметрии задачи рассмотрим только верхнюю половину терминальной окружности (10.25), где sin s>0 и производная (10.38) с учетом (10.26) отрицательна при т=0. Следовательно, выражение (W\y—W2x), равное нулю при т=0 и убывающее в окрестности точки т = 0, отрицательно при малых значениях т>0, так что y* = sign (IFiy—W2x) = — 1 для характеристик, выходящих из верхней половины терминальной окружности (10.25). В силу симметрии рассматриваемой задачи для траекторий, выходяших из нижней половины терминальной окружности, и* = 1. Проинтегрировав правые уравнения системы (10.37) при v* = = — 1 и начальных условиях (10.26), где, как нетрудно показать, А= (У + Кц cos s)-1, получим Wi=\cojs(&T — s); W2= — k sin (Znr — s), 0<^s<^tc. (10.39) Подставляя (10.39) в левые уравнения системы (10.37), получим х=г/64-^ц-р1/ cos(Znr — s); y=—xb—V sin(6r — s). (10.40) Система уравнений (10.40) является линейной неоднородной. Проинтегрировав однородное уравнение и найдя частное решение при помоши вариации произвольной постоянной, получим при на¬ чальных условиях (10.25) следующее решение системы (10.40): • 206
x=(Z-f-Vt) cois(it —s) sin У— — (Z +I/t) sin (px — $) — — 7?ц4-/?ц cos it, (10.41) где 0<s<л и учтено, что ЬКЦ= Уц. Графическое представление о траекториях (10.41) нетрудно по¬ лучить из следующих соображений. Траектория (10.41) складыва¬ ется из трех движений: 1) вращения по окружности радиуса с центром в точке (О, —/?ц) с угловой скоростью — b и начальным положением в точке (О, О); 2) вращения по окружности радиуса I с. той же угловой скоростью — b и начальным положением в точке (Z cos s, I sin s); 3) движения с постоянной по величине скоростью V вдоль (вращающегося) радиуса I (рис. 10.3). Как видно ив (10.41) , угол между радиусами-векторами двух первых движений сохраняется постоянным и равным —sj в течение всего време¬ ни движения. Для доказательства этого достаточно рассмотреть скалярное произведение векторов (cos(it—s), —sin (it—s)),. (sin bxy cos it), которое постоянно и равно sin s = cos Траектории семейства (10.41) справедливы лишь до момента их попадания на ось абсцисс, так как, в силу симметрии задачи, тра¬ ектории оптимального движения в нижней половине плоскости по¬ лучаются отражением построенных траекторий относительно оси абсцисс (см. рис. 10.3 и 10.4). Однако найденное решение игры (10.41) справедливо только для ограниченной части фазового про¬ странства: ее границами служит кривая, получаемая из уравнений (10.41) при s = n в верхней полуплоскости, и симметричная ей от¬ носительно оси X траектория в нижней полуплоскости. Оптималь¬ ное управление v* =—1 для области, лежащей выше оси абсцисс. Далее, подставляя значения IFi, W2 из (10.39) в Sin <р* = — W^/У Г1+Г2; cos ср*= - Wt/У wl+wl, sin ср*.— sin ( — s-}-bx) = — sin (s— bx) = sin (лД-s — it); = — cos( — s-[-bx)= — cois(s— bx)= cojs(n Ц-s — it); откуда следует cp* = s — bx-\- л. формулы получим COS Ср* = Рассмотрим траектории цели и ЛА в неподвижной системе ко¬ ординат для состояний игры, оканчивающихся в точках n>s>0* терминальной окружности. Из проведенного анализа следует, что цель движется по окружности минимального радиуса кривизны /?ц. Из (10.32) при v* =— 1 находим 0Ц =—b или 04=it, откуда 0Ц = =|0цо+£т, или 0ц = 0цо—bt, где 0цО — значение угла 0Ц в момент т = 0. Учитывая, что <р=0—бц, из формулы <p* = s—it+л получаем, что оптимальная траектория ЛА есть прямая в плоскости XgYg: 0* = =<р* + О ц=s—it + л + it + 0цо = s + л-|-0цо. Чтобы синтезировать оптимальное управление ЛА как функцию фазовых координат х, у, необходимо для точек (х, //), лежащих в верхней половине области, из (10.41) найти s и т как функции х и 207
Рис. 10.4. Полный фазовый портрет оптимальной траектории плоскости OXY 208
у. Исключая s, получим уравнение (x-Z?usin6r)2 + (i/ + /?u-/?ucos6T)2 = (/ + lZT)2 (10.42) для определения т. Отсюда нельзя получить т в виде явной зависи¬ мости т(х, z/), так что уравнение (10.42) надо решать приближенно. Значение s(x, у) может быть найдено, например, из первого урав¬ нения (10.41): cos(6т—s) — (х—sin 6r)(Z+Vx). Получив т= =т(х, у) и s=s(x, у) как функции фазовых координат х, у и ис¬ пользовав выражение <р*=$—6т + л для оптимального движения ЛА, можем ф* выразить в виде функции состояния системы (г, у) <Р*=ф*(х, y)=s(x, у)—Ьх(х, у) + л. Итак, решение игры для траекторий, исходящих из терминаль¬ ной поверхности при л>£>0 (верхняя полуплоскость) и 2л>5>л (нижняя полуплоскость), найдено. Вычислим значение параметра X для данной задачи. Подставляя найденные значения оптимальных управлений в уравнение Айзекса (10.34), получим = которое на терминальной кривой с учетом (10.25), (10.26) приобре¬ тает вид 6(Х/ cqss sin s — lX sin s coss)t>* — V |X [ — ХУЦ cos $4“ 1=0, из которого находим Л= (V+V4 cos s)_1. Исследуем развитие игры для траекторий, которые заканчива¬ ются в точке s = n терминальной кривой. Рассмотрим начальное состояние игры, которое определяется точками луча (х^—Z; у — 0). Это значит, что в начальный момент вектор скорости цели лежит на прямой, соединяющей ЛА и цель, и направлен от ЛА. Очевидно, что оптимальное движение ЛА и це¬ ли в этом случае прямолинейное: v*=O; ф* = 0. Предположим, что ограничение на радиус разворота цели отсутствует. Из разд. 10.5 следует, что оптимальное движение цели — по прямой ЛА — цель. Для рассматриваемого начального положения в данной задаче с ограничением такое движение допустимо. Однако если движение является оптимальным в одном классе стратегий, а затем этот класс сужен, но указанное оптимальное движение попало в этот более узкий класс, то, конечно, оно будет оптимальным и внутри этого более узкого класса стратегий. Следовательно, оптимальное движение для начального положения на луче (х^—Z; у=С) будет о* = 0. Следовательно, для ЛА оптимальное управление ф* = 0. Игра заканчивается в точке $ = л. Таким образом, найдена еще одна оптимальная траектория — это луч (х^—Z; £=0) или в па¬ раметрическом виде у=0\ х=—I—r(V—Уц). Вдоль этой траекто¬ рии и* = 0, ф* = 0, т. е. ни цель, ни ЛА не маневрируют. Перейдем к построению решения игры для оставшейся части фазовой плоскости. Для фазовых точек (х, у), расположенных сколь угодно близко к лучу (х<—Z; у=0), время захвата сколь угодно близко к времени захвата из соответствующей точки луча (х^—Z, 0) (см. рис. 10.4). Действительно, ЛА, используя преиму- 209
щество в маневренности, может так выбрать направление своего движения из точки (х, у), что через бесконечно малое время А/ он переместится на луч (х^—Z; 0) и направит V на цель. При этом фазовая точка (х, у) переместится в точку (x+lAx, 0), где Ах беско¬ нечно мало. После того, как описанное событие произойдет, опти¬ мальное движение ЛА и цели уже определено. Таким образом, бес¬ конечно малое смещение ЛА от луча (х^—Z; у=0) может приве¬ сти к увеличению времени захвата лишь на бесконечно малую ве¬ личину. Более полное рассмотрение хода игры показывает, что W(x, у) не только непрерывная, но и регулярная функция вблизи луча (х^—Z; у=0), т. е. функция имеет непрерывные производ¬ ные = (х, у)1дх, W2=dW (х, у)/ду. Отсюда следует, что траектории оптимального движения в системе координат OXY, по крайней мере вблизи от луча (х^—Z; у = 0), определяются урав¬ нениями характеристик (10.37). Поскольку на луче (х^—Z; z/ = 0) оптимальное управление <р* = 0, из уравнения sin И+1^2 найдем F2= W2 (х, 0) =0. Учитывая, что Ц7(х)=т, получим W (х, у)=х, но на луче (х^—Z; z/ = 0) имеем т=(—х—Z) (V—Йц)"1, поэтому W (х, 0) — = (—х—Z) (V—Уц)-1, откуда находим, что IFi(х, С) =dW!dx= = -(К-Уц)-‘. Следовательно, уравнения (10.37) необходимо интегрировать при найденных выше начальных условиях: IFi (х, 0) = — (V—Уц)-1; W2 (х, 0)=0; //=0; х=—l—x(V—Уц), заданных на луче (хС—Z; z/=0). Параметризуем уравнение луча: х=—г; у—0 при Проинтегрировав правые уравнения системы (40.37) при v* =— 1 и начальных условиях W2 (х, 0) =0; (х, 0) = — (V—7ц)-1, най¬ дем IFi = — (7—7Ц)-1 cos bx; W2=(V—74)_1sinbr. Подставив значения W2 в левые уравнения (10.37), запишем их в виде x = yb-]-Vu — V coisftr; у=-xb-\-V sin bx. (10.43) Уравнения (10.43) могут быть получены из уравнений (10.40) при s = Следовательно, решение (10.43) в соответствии с (ГО.41) представим в виде х= — (г-]-Vx) CO)Ssin y=(r-\-Vx) sin bx — /?ц + /?ц casZrr, (10.44) Построение этих траекторий ввиду симметрии задачи необходи¬ мо проводить лишь до момента их попадания на ось абсцисс (см. рис. 10.4). Оптимальная траектория игры на плоскости (X, У) сос¬ тоит из двух участков: кривой (10.44) и части луча (х^—Z; у = 0). На первом участке оптимальное управление v* =— 1, а на вто¬ ром— v*=l0. Таким образом, цель начинает свое движение с раз¬ ворота по окружности минимального радиуса кривизны вплоть до перемещения ЛА на луч (х^—Z; у=С), а затем цель движется прямолинейно. Подставляя значения и W2 в формулы sin <р* = = 172(I712+W)“0’5, cos ф* =—W1 (lFi2+W)-0’5, найдем ф* = = —bx. Учитывая, что v* =—4, из уравнения dQ^ldt——b или 210
dQ^!d%=b и формулы <р=0—0Ц делаем вывод, что, когда цель дви¬ жется по окружности минимального радиуса, ЛА движется прямо¬ линейно в плоскости Xgl Yg, причем в конечной точке этого участка имеем (р* = 0._После попадания ЛА на луч (х^—Z; 0) и направле¬ ния вектора V на цель, цель прекращает движение по окружности минимального радиуса и движется по прямой, касательной к этой окружности. Так как на луче (x<:Z; 0) оптимальное управление ЛА ф* = 0 и цель движется прямолинейно, то ЛА будет продолжать прямолинейное движение по той же прямой до попадания на тер¬ минальную поверхность. Решение игры построено однозначно для всех областей фазовой плоскости X, Y, за исключением луча (r/ = 0, x>Z), когда ЛА нахо¬ дится точно впереди цели. Нель может применить' оптимальную стратегию.v* = — 1 или v*=l, т. е. может отворачиваться от ЛА по радиусу минимальной кривизны влево или вправо. Понятно, что практически эта неоднозначность роли не играет. ПРИЛОЖЕНИЕ Вывод матричной импульсной переходной функции и некоторые ее свойства Рассмотрим однородную линейную систему х = А(7)х, хс=(х1,...,хп), = (П1) где переменная t пробегает действительную ось. Введем обозначения б7- для вектора, /-я координата которого равна 1, а все остальные — нули (6/= (0, 0,1, 0, ..., 0)). Рассмотрим решение x(t) системы (П1), проходящее в некоторый момент s через точку dj, т. е. x(s) = 6j, и введем обозначение х(/) = срД/; s). Таким образом: d^j(t,s)ldt = А(/)Ф/(Л s); q>y(s, S) = 8j, ; = n. (П2) Систему векторных уравнений (П2) удобно записать в матричном виде [4<Р1(Л s)/dt,. .., d^n(t, s)/dt} = [А(О<Р1(Л s),..., А(ОФл(Л «)]• Вводя матрицу <p(f, £)=[ф1(^, s),..., фп (/, s)] размерности мХп, составленную из векторов ф,(^, s) как из столбцов, и единичную матрицу I = [Si, ...,8П], преобра¬ зуем последнее уравнение к матричному виду dq (t, s)/dt = А (О <р (/, s), ф($,$) = 1. (ПЗ) Учитывая, что значение параметра s можно выбрать любым из интервала дейст¬ вительной прямой, где рассматривается система (П1), замечаем, что элементы матрицы ф(/, s) можно представить как функции двух переменных t и s. В таком понимании матричная функция Ф(/, s) носит название фундаментальной матри¬ цы системы (П1) или матрицы импульсных переходных функций системы (П1). Если х(/) — решение однородной системы (П1), проходящее при t = s через некоторую точку bT= (£ч,..., bn) ' x(s) =b, то, очевидно, х(/) = ф(^, s)b. (П4) Действительно, во-первых, полагая в (П4) t=s, найдем х($)=ф(5, s)b = = Ib = b. Во-вторых, дифференцируя (П4) по t, получим dx (t) dt dq> (t, s) , \-^Ь = А(/)ф(/, s)b = A(0x(/), t. e. x(t), представленное формулой (П4), удовлетворяет системе (П1). 211
Если x(t) — решение неоднородной системы х - А (О х Н- а (0; ат (/) = (а1 (/),..., ап (/)) с условием x(s) = b, то х (t) = J ф (/, т) а (т) dr 4- ф (/, s) b. $ (П5) (П6) В самом деле, полагая в (П6) t=s, убеждаемся, что x(s)=b. Далее, дифферен¬ цируя (П6) и учитывая (ПЗ), (П6), получим t dx(t) г ^ф(Лт) </ф(М) —= <р (t, О а (0 + \ 7 а (т) dt + ; b = dt J dt dt s t = la (0 + J A (/) <p (t, t) a (t) dt + A (t) <p (t, s) b = = A(0 ■ t jtf(i,t)n(t) dt + <f(t,s)b + a(0= A(/)x(O+a(Z). Следовательно, вектор-функция, представленная правой частью (П6), является решением уравнения (П5) , что и требовалось доказать. Отметим одно важное свойство матрицы <р£/, s): <р(Л s)«p(s, т) = ф(Л т) (П7) при любых значениях t, s, т. Чтобы убедиться в справедливости (П7), достаточно проверить, что при любом постоянном векторе b верно Ф (t, s) ф ($,т) b = ф (Z, т) Ь. (П8) Пусть s и т в (П8) фиксированы, a t изменяется. Правая часть (П8) как функ¬ ция t в силу (П4) есть решение системы (П1), левая часть (П8) также есть ре¬ шение системы (П1). Учитывая, что ths фиксированы, можно записать левую часть (П8) в виде <Р(^, S)[q>(s, Х)Ь]. (П9) В момент t=s решение (П9) проходит через точку ф($, S) [ф ($, Т)Ь] = I [ф(5, Т) Ь] = ф (s, т) Ь. Но правая часть (П8) в момент t=s также проходит через эту точку. Следова¬ тельно, применяя теорему единственности, приходим к выводу, что эти решения совпадают при всех значениях t, т. е. верно (П8), что и требовалось доказать. В частности, при x = t соотношение (П7) принимает вид ф(*, $)ф($, 0 = Ф(М)= I. (П10) В заключение рассмотрим систему, сопряженную к (П1): х = —Ат(/)х. (П11) Покажем, что фундаментальная матрица s) системы (ПН) связана с мат¬ рицей ф(Л s) соотношением Ф(^*) = ФТ(5,О. (П12) Действительно, дифференцируя (П10) по t, имеем г/ф (£, s) dt ф($, t) Ч-ф(*, s) 6?ф (s, t) dt = 0. (П13) Последовательно используя (ПЗ), а затем (П10), из (П13) получим б/ф($, t) А (/)Ф (^, s)ф(s, /) + Ф (/, s)- = О; dt А (0 4- ф (t, s) <Ap(s, t) dt = 0. 212
Умножая последнее соотношение слева на <p(s, t) и разрешая относительно d<p(s, f)ldi, получим d<p(s, f)!dt = —<p(s, ^)A(^), или dq)T(s, t)/dt = — AT(f)(pI (s, t), (pT ($,$) = I. (П14) Но по определению фундаментальная матрица ф(/, s) должна удовлетворять со¬ отношениям d$ (t, s)/dt = — Ат (О ф (Z,s), ф (<$, 5) = I. (П15) Сравнивая (П14) и (П15) и применяя теорему единственности для линейных сис¬ тем, делаем вывод о справедливости соотношения (П12). Умножив обе части (П10) на [ф(/, s)]"1, получим формулу <p(s, ^)=[(p(Z, s)]*1, с учетом которой (II12) можно записать также в виде Ф(^, 5) = [ФТ(^ 5)]-1. (П16) Рассмотрим скалярное произведение произвольного решения (П4) однород¬ ной системы (П1) и произвольного решения у = ф (t, s)a, ат= (ai,..., ап), сопря¬ женной системы (ПН) S */(ОУг(О = хт(ОУ(О = Ьт<Рт(Л 5)Ф(Л 5) а = Ьт1а = Ьта, (П17) 1-1 где при предпоследнем переходе использовано соотношение (П16). Так как а и b — постоянные вектора, то скалярное произведение произвольного решения х(0 системы (П1) и произвольного решения y(t) сопряженной системы (П11) неиз¬ менно во времени. СПИСОК ЛИТЕРАТУРЫ 1. Айзекс Р. Дифференциальные игры. — М.: Мир, 1967. — 479 с. 2. Алексеев К. Б., Бабенин Г. Г., Ярошевский В. А. Маневрирование космиче¬ ских аппаратов. — М.: Машиностроение, 1970. — 416 с. ■3. Батков А. М., Тарханов И. Б. Системы телеуправления.—М.: Машинострое¬ ние, 1972. — 192 с. 4. Беллман Р. Динамическое программирование. — М.: ИЛ, 1960. — 400 с. •5. Боднер В. А., Козлов М. С. Стабилизация летательных аппаратов. — М.,: 1961. — 508 с. >6. Бортовые системы управления полетом. Под ред. Ю. В. Байбородина. — М.: Транспорт, 1975. — 336 с. 7. Власов М. И., Сергеев Э. А. Автопилот АП-15. — М.: МАИ, 1970. — 62 с. 3. Доброленский Ю. П., Иванова В. И., Поспелов Г. С. Автоматика управляемых снарядов. — М.: Оборонгиз, 1963. — 548 с. .9. Ишлинский А. Ю. Об уравнениях задачи определения местоположения дви¬ жущегося объекта посредством гироскопов и измерителей ускорений. — При¬ кладная математика и механика, т. XXI, 1971, с. 725—739. 10. Казаков И. Е. Статистическая теория систем управления. —М.: Наука, 1975. —432 с. 11. Квакернаак X., Сиван Р. Линейные оптимальные системы управления. — М.: Мир, 1977. — 650 с. 12. Кирст М. А. Навигационная кибернетика полета. — М.: Воениздат, 1971.— 182 с. 13. Козлов А. С. Теория авиационных гироскопических приборов. — М.: Оборон¬ гиз, 1958. — 250 с. 14. Козлов В. И. Самонастраивающиеся системы с релейными элементами. — М.: Энергия, 1974.— 99 с. 15. Кочетков В. Т., Половко А. М., Пономарев В. М. Теория систем телеуправле¬ ния и самонаведения ракет. — М.: Наука, 1964. — 536 с. 16. Красовский А. А. Системы автоматического управления полетом и их анали¬ тическое конструирование.—М.: Наука, 1973. — 558 с. 17. Кринецкий Е. И. Системы самонаведения. — М.: Машиностроение, 1970.— 236 с. 213
18. Кузовков Н. Т. Модальное управление и наблюдающие устройства. — М.: Ма¬ шиностроение, 1976.— 184 с. 19. Кузовков Н. Т. Системы стабилизации летательных аппаратов. — М.: Высшая школа, 1976. — 304 с. 20. Лебедев А. А., Красильщиков М. Н., Малышев В. В. Оптимальное управле¬ ние движением космических летательных аппаратов. — М.: Машинострое¬ ние, 1974. — 199 с. 21. Лебедев А. А., Соколов В. Б. Встреча на орбите. М.: Машиностроение, 1969. —366 с. 22. Лебедев А. А., Карабанов В. А. Динамика систем управления беспилотными летательными аппаратами. — М.: Машиностроение, 1965. — 528 с. 23. Лейтман Дж. Введение в теорию оптимального управления. — М.: Наука, 1968.— 190 с. 24. Летов А. М. Динамика полета и управление. — М.: Наука, 1969. — 359 с. 25. Ли Э. Б., Маркус Л. Основы теории оптимального управления. — М.: Наука, 1972. —574 с. 26. Михайлов Ф. А. и др. Динамика нестационарных линейных систем. — М.г Наука, 1967. — 363 с. 27. Основы радиоуправления. Под ред. В. А. Вейцелла и В. Н. Типугина. — М.: Советское радио, 1973. — 463 с. 28. Остославский И. В., Стражева И. В. Динамика полета. — М.: Машинострое¬ ние, 1969. — 499 с. 28. Острем К. Ю. Введение в стахостическую теорию управления. — М.: Мир, 1973. — 322 с. 30. Павлов В. А., Понырко С. А., Хованский Ю. М. Стабилизация летательных аппаратов и автопилотов. — М.: Высшая школа, 1964.— 483 с. 31. Павлов А. А. Синтез релейных систем, оптимальных по быстродействию.— М.: Наука, 1966. — 390 с. 32. Петров Б. Н. и др. Принципы построения и проектирования самонастраиваю¬ щихся систем управления. — М.: Машиностроение, 1972. — 259 с. 33. Петров Б. Н. и др. Научные проблемы управления летательными аппарата¬ ми. — Вестник АН СССР, 1970, № 11. — 144 с. 34. Понтрягин Л. С. и др. Математическая теория оптимальных процессов. — М.: ГИФМЛ, 1961.-391 с. 35. Проектирование систем наведения. Под ред. Е. А. Федосова. — М.: Машино¬ строение, 1977. — 304 с. 36. Радиоуправление реактивными снарядами и космическими аппаратами. Под ред. Л. С. Гуткина. — М.: Советское радио, 1968. — 680 с. 37. Ройтенберг Я. Н. Автоматическое управление. — М.: Наука, 1971.— 395 с. 38. Росин М. Ф. Статистическая динамика и теория эффективности систем управ¬ ления.— М.: Машиностроение, 1970. — 335 с. 39. Селезнев В. П. Навигационные устройства. — М.: Машиностроение, 1974.— 600 с. 40. Сломянский Г. А., Прядилов Ю. Н. Поплавковые гироскопы и их примене¬ ние.— М.: Оборонгиз, 1958. — 244 с. 41. Соколов Н. И. Аналитический метод синтеза линеаризованных систем авто¬ матического регулирования. — М.: Машиностроение, 1966.— 328 с. 42. Стромилов В. М., Харитонов В. Н. Автоматы стабилизации ЛА и двигателей летательных аппаратов. — М.: МАИ, 1971. — 193 с. 43. Шаталов А. С., Топчеев Ю. И., Кондратьев В. С. Летательные аппараты как объекты управления. — М.: Машиностроение, 1972.— 239 с.
ОГЛАВЛЕНИЕ Стр. Предисловие а ; 3 Глава 1. Летательный аппарат как объект управления . . ... 5 1.1. Продольное движение ЛА 5 1.2. Боковое движение ЛА 13 1.3. Передаточные функции ЛА 18 Глава 2. Гироскопы и гироскопические устройства как элементы систем уп¬ равления ЛА 20 2.1. Уравнения гироскопа .... 20 2.2. Трехстепенные гироскопы .... 23 2.3. Двухстепенные гироскопы .... 27 2.4. Гирорамы .... 30 Глава 3. Структурные схемы автопилотов 39 3.1. Автопилоты, их назначение, состав. Функциональная схема 39 3.2. Автопилоты крена 40 3.3. Автопилоты для продольного и курсового каналов . . 47 3.4. Общие вопросы построения автопилотов 49 3.5. Работа автопилота 53 Глава 4. Управляемость и наблюдаемость линейных стационарных систем. Модальное управление 57 4.1. Управляемость линейных стационарнвх систем 57 4.2. Модальное управление при полной информации о состоянии сис¬ темы 59 4.3. Наблюдаемость линейных стационарных систем 61 4.4. Принцип построения наблюдающего устройства в виде модели сис¬ темы с обратной связью по ошибке восстановления .... 64 4.5. Модальное управление при неполной информации о состоянии сис¬ темы 66 4.6. Структура систем, не обладающих свойством полной управляемо¬ сти 68 4.7. Структура систем, не обладающих свойством полной наблюдаемо¬ сти 71 4.8. Связь понятий управляемости и наблюдаемости 72 4.9. Модальное управление для неполностью наблюдаемой системы . 73 Глава 5. Оптимальное управление детерминированными системами . . 75 5.1. Аналитическое конструирование автопилотов 75 5.2. Принцип максимума Понтрягина 35 5.3. Связь принципа максимума с методом динамического программи¬ рования Веллмана 104 215
Ctd. Глава 6. Синтез линейных систем в стохастической постановке 107 6.1. Основные результаты по оптимальному восстановлению и управ¬ лению 107 6.2. Построение дискретного фильтра Калмана 115 6.3. Построение непрерывного фильтра Калмана—Быоси .... 122 6.4. Примеры построения фильтра Калмана 131 6.5. Двойственность задач линейной фильтрации и оптимального уп¬ равления ' 134 Глава 7. Автономные системы управления 137 7.1. Классификация 137 7.2. Инерциальные системы управления 138 Глава 8. Системы самонаведения .... 153 8.1. Краткая характеристика .... 153 8.2. Уравнения кинематического звена. Пролет . . .... 156 8.3. Методы наведения .... 159 8.4. Головки самонаведения 164 8.5. Структурная схема системы наведения и модели бортового контура 169 8.6. Случайные ошибки и шумы в контуре наведения 174 8.7. Детерминированные модели систем наведения 176 8.8. Стохастические модели систем наведения. Фильтр Калмана—Бьюси 180 Глава 9. Системы телеуправления . 183 9.1. Определение, классификация . 183 9.2. Кинематика .наведения при командном телеуправлении . .184 9.3. Математические модели звеньев системы телеуправления . .189 9.4. Функционирование систем телеуправления . 190 Глава 10. Синтез управления в задачах наведения в игровой постановке 195 10.1. Содержание игры преследования — уклонения в задачах наведе¬ ния 195 10.2. Общие дифференциальные игры 198 10.3. Вывод основного уравнения теории дифференциальных игр . 192 10.4. Решение основного уравнения методом характеристик . . . 20С 10.5. Задача преследования — уклонения при безынерционной цели и ЛА с идеальными системами управления 202 10.6. Задача преследования — уклонения при инерционной цели и безынерционном ЛА с идеальными системами управления . . 204 Приложение ... . 211 Список литературы 214