Text
                    Расчет
и анализ
движения
летательных
аппаратов
ИНЖЕНЕРНЫЙ СПРАВОЧНИК


УДК 629.7.015(031) С. А. ГОРБАТЕНКО, Э. М. МАКАШОВ, Ю. Ф. ПОЛУШКИН, Л. В. ШЕФТЕЛЬ Расчет и анализ движения летательных аппаратов. Инже¬ нерный справочник. М., «Машиностроение», 1971, стр. 352. В справочнике изложены методы, применяемые для расчета и анализа движения летательных аппаратов (ЛА): их траек¬ торий, переходных процессов, управления и устойчивости. При¬ ведены методы расчета и свойства различных методов наведе¬ ния ЛА на цель, методы исследования ЛА как объекта управ¬ ления, основанные на линейной теорий автоматического управ¬ ления, нелинейной механике и теории устойчивости нелинейных систем. Рассмотрены основные задачи теории оптимального управления в применении к ЛА и методы их решения. Изло¬ жены численные методы расчета траекторий, переходных про¬ цессов, установившихся режимов полета и численные методы решения задач оптимизации управления. Приведены примеры, поясняющие технику использования различных методов рас¬ чета и анализа. р Весь фактический материал по ЛА и их характеристики яв¬ ляются гипотетическими. Справочник предназначен для научных работников и инже¬ неров, азнимающихся механикой полета и исследованием си¬ стем управления ЛА. Он может быть полезным также для студентов вузов соответствующих специальностей. Иллюстр. 75. Табл. 51. Библ. 17 названий. Рецензент докт. техн. наук И. В. Стражева Научный редактор докт. физ.-мат. наук В. Г. Демин 2-4-3 110-71
ПРЕДИСЛОВИЕ Инженерные методы расчета и анализа движения ЛА непре¬ рывно развиваются и совершенствуются. С одной стороны, этому способствует появление новых задач, ставящихся перед ЛА, и усложнение уже известных, а с другой—’Внедрение в прак¬ тику проектирования новых научных достижений и методов тео¬ рии оптимальных процессов, нелинейной механики, теории авто¬ матического управления, численных методов решения задач на (лектронных вычислительных машинах. Рассматривая современные методы исследования задач ме¬ ханики полета ЛА, можно обнаружить тенденцию к их дальней¬ шей дифференциации на методы синтеза (проектирования) дви¬ жений, обладающих заданными характеристиками, и на методы анализа полностью описанных движений. Следует, впрочем, отметить, что граница между этими методами остается иногда довольно условной. К методам первой группы можно отнести методы наведения, методы теории оптимального управления, методы синтеза теории автоматического управления; к методам второй группы — методы нелинейной механики, методы анализа кюрии автоматического управления и некоторые численные ме¬ тоды решения уравнений. В настоящем справочнике рассматри¬ ваются обе группы методов, при этом основное внимание уделе¬ но траекториям наведения, устойчивости движения ЛА, траекто¬ риям и методам управления, оптимизирующим тот или иной кри- о'рий качества, а также движению ЛА вокруг центра масс. Наряду с этим в справочнике приведены численные методы решения уравнений для многих задач механики полета. Отбор конкретных численных методов решения алгебраических, транс¬ цендентных и дифференциальных уравнений производился с по- иций точности и эффективности использования их при расчетах ми ЭВМ. Предлагаемый справочник является логическим продолже¬ нием предыдущей работы авторов — справочника «Механика полета»*; в нем используются принятые'в первом справочнике " С. А. Г о р б а т е н к о и др. Механика полета (Общие сведения. Уравне¬ нии движения). Инженерный справочник. М., Машиностроение, 1969. аюн з.
условные обозначения, системы координат и формы записи урав¬ нений механики полета. Если первый из этих справочников по¬ зволяет составить математическое описание движения ЛА, то второй дает методы расчета и анализа этого движения и методы синтеза движения, обладающего необходимыми техническими свойствами (например, удовлетворяющего определенным крае¬ вым условиям или оптимальностью по какому-либо критерию качества). Справочник состоит из четырех глав. В гл. 1 рассмотрены различные методы наведения ЛА на цель и приведены решения кинематических уравнений движения, описывающих эти методы. Решения даются для случаев записи уравнений наведения в двух системах координат — прямоуголь¬ ной и относительной полярной. Гл. 2 посвящена методам исследования ЛА как объекта управления (линейного или нелинейного). Приведенные в ней методы позволяют оценить устойчивость и качество движения ЛА'на траектории и вокруг своего центра масс. В гл. 3 приводятся различные постановки задач об оптималь¬ ном управлении или об оптимальном выборе проектных парамет¬ ров ЛА, минимизирующих или максимизирующих тот или иной критерий качества ЛА. Приводятся формулировки необходимых условий оптимальности управления на основе принципа макси¬ мума, динамического программирования и классического вариа¬ ционного исчисления. В гл. 4 излагаются методы численного интегрирования урав¬ нении движения, методы расчета равновесных режимов полета, решения краевых задач, численные методы оптимизации управ¬ ляющих функций, соответствующих различным задачам меха¬ ники полета ЛА. Материал справочника авторы старались изложить в форме, наиболее удобной для практического пользования. Описание большинства методов сопровождается типовыми примерами, иллюстрирующими последовательность операций при их исполь¬ зовании в инженерных расчетах. Для отыскания в справочнике нужного материала следует обращаться к предметному указателю и достаточно подробно составленному оглавлению. Основные обозначения, используе¬ мые в каждой главе, вынесены в ее начало, а остальные обозна¬ чения приведены в тексте. Авторы приносят благодарность д-ру техн. наук, проф. И. В. Стражевой и доц. Н. Н. Завидонову за ценные замечания, сделанные при просмотре рукописи. Все замечания по книге авторы просят направлять по адресу: Москва, Б-66, 1-й Басманный пер., 3, издательство «Машино¬ строение».
Глава I. МЕТОДЫ НАВЕДЕНИЯ Задача наведения состоит в выведении одного ЛА (перехват¬ чика) в определенное относительно другого ЛА (цели) положе¬ ние. При этом в конце участка выведения могут задаваться не 'юлько относительные координаты перехватчика, но и относи¬ тельные скорости и направление полета. Дифференциальные и конечные соотношения между коорди¬ натами (прямоугольными или криволинейными), линейными и угловыми скоростями или иными кинематическими параметрами полета перехватчика и цели, определяющие относительное дви¬ жение перехватчика в процессе выполнения наведения, назы¬ ваются методами наведения. Методы наведения разделяются на плоские и пространствен¬ ные. Методы плоского наведения строятся в предположении, что векторы скорости перехватчика v и цели v4 в процессе наведения в каждый момент времени лежат в одной неподвижной плоско¬ сти (горизонтальной, вертикальной или наклонной). Методы пространственного наведения не предполагают каких-либо огра¬ ничений на взаимное расположение векторов скорости пере¬ хватчика и цели. В настоящей главе рассматриваются лишь методы плоского наведения в кинематической постановке, т. е. без учета действующих на ЛА сил и моментов и в предположе¬ нии наличия полной информации о движении цели. Формулировка задачи наведения. Пусть имеется цель, о движении центра масс которой дана полная информация, с е. задан закон движения центра масс цели: xn=fi (t); zn=f2(t) при рассмотрении наведения в некоторой неподвижной прямо¬ угольной системе координат Oxz или закон изменения угловой скорости вращения вектора скорости цели: «Ц = /(*) при рассмотрении наведения в полярной системе координат U,Dq. Перехватчик, закон движения которого определен выбранным методом наведения, описывает траекторию, зависящую от траек¬ тории цели. 5
Характеристиками траектории перехватчика, движущегося по некоторому методу наведения, являются ее кривизна 1 /г или потребная перегрузка ппотр, угловая скорость вращения линии «перехватчик—цель» соп, угол пеленга цели ср и курсовой угол цели q, расстояние между перехватчиком и целью D (см. табл. 1.1), которые определяют приемлемость конкретного ме¬ тода наведения как в смысле физической его реализации, так и в смысле реализуемости в аппаратуре наведения. Движение перехватчика и цели рассматривается в двух си¬ стемах координат: неподвижной прямоугольной Oxz, начало которой связано с произвольной неподвижной точкой земной поверхности, и относительной полярной lXDq с полюсом Ц в центре ма&с цели. Уравнения движения как перехватчика, так и цели записы¬ ваются в этих системах координат. Под уравнениями движения понимаются дифференциальные кинематические соотношения, характеризующие изменение во времени прямоугольных или полярных координат ЛА. При выводе уравнений движения и уравнений (законов) ме¬ тодов наведения сделаны следующие предположения. 1. ЛА рассматривается как материальная точка постоянной массы. 2. Наведение осуществляется в горизонтальной плоскости. 3. В любой момент времени (в том числе и в начальный) перехватчик находится на траектории, строго соответствующей рассматриваемому методу, т. е. не принимается во внимание динамика движения перехватчика по реальной траектории (ошибки отклонения от траектории метода равны нулю). Дифференциальные уравнения, описывающие движения пере¬ хватчика и цели, уравнение метода наведения совместно с за¬ данными законами изменения скоростей перехватчика v и цели Оц, угла курса цели фц (в прямоугольной системе координат) или угловой скорости цели сол (в полярной системе координат), а также начальными прямоугольными координатами перехват¬ чика х0, z0 и цели Хцо, 2цо или полярными координатами перехват¬ чика Dо, q0, образуют замкнутую систему уравнений. В качестве независимой переменной при интегрировании этой, системы целесообразно выбрать не время t, а некоторый естест-' венный параметр (например, угол курса ф или курсовой угол цели q). Поэтому приведенные в главе решения представляются в виде функций указанных параметров. В этом случае для того чтобы в момент времени t* определить координаты перехватчика, летящего по какому-либо методу наведения (например, по ме¬ тоду трех точек), необходимо найти по соответствующим форму¬ лам угол курса ф* для этого момента времени, а затем по из¬ вестному углу курса ф* определить искомые координаты. Ана¬ логично следует поступать при определении других параметров. 6
((писание всех методов проводится по единой схеме, т. е. i.M-ioi определение метода, излагается графическое построение траектории, приводятся уравнения движения и уравнение метода наведения, а затем даются решения этих уравнений и двух системах координат (прямоугольной и полярной) при ч.к тпых предположениях о законах движения дели и изменения екорости перехватчика v(t). Сводка решений включает: законы и 1менения прямоугольных и полярных координат перехватчика м цели в функции угла курса ф или курсового угла цели q, за¬ мши изменения дальности между перехватчиком и целью, вре¬ мени полета по кинематической траектории, угловой скорости вращения линии «перехватчик—цель», радиуса кривизны г и по- | робной для полета кинематической перегрузки «Потр, значений ■ тих параметров в точке встречи перехватчика и цели, а также арактеристики зоны возможных атак по перегрузке и по ско¬ рости. В настоящей главе даны следующие методы наведения: 1. Метод кривой погони. 2. Метод параллельного сближения. 3. Метод наведения с постоянным пеленгом. 4. Метод трех точек. 5. Метод пропорционального сближения. 6. Метод прямого наведения. 1.1. НЕКОТОРЫЕ ОПРЕДЕЛЕНИЯ ЭЛЕМЕНТОВ ТРАЕКТОРИИ ПРИ НАВЕДЕНИИ В табл. 1.1 даны определения всех встречающихся в главе 'Лсментов траектории перехватчика и цели. Эти величины пока- 1Лпы на рис. 1.2, 1.6, 1.14, 1.16, 1.25, 1.26. Таблица 1.1. Название элемента Определение Кинематическая траектория наведе¬ нии Траектория, определяемая кинема¬ тическими соотношениями при полете по методу наведения Линия «перехватчик—цель» (линия минирования) Отрезок прямой, проведенной через точки нахождения перехватчика и цели Центр наведения О (для метода трех точек) Начало луча, отслеживающего цель (точка на линии визирования, отно¬ сительно которой определяется метод наведения) 7
Продолжение Название элемента Определение Скорость сближения перехватчика с целью D Скорость изменения расстояния между перехватчиком и целью Вектор относительной скорости пе¬ рехватчика (вектор скорости сближе¬ ния перехватчика с целью) D Вектор, равный геометрической разности векторов скорости перехват¬ чика v и цели v4 Вектор относительной дальности D Вектор, направленный по линии «перехватчик—цель» в сторону пере¬ хватчика и равный по модулю рас¬ стоянию между центрами масс цели и перехватчика Радиус-вектор цели D4 Вектор, направленный из начала координат неподвижной прямоуголь¬ ной системы координат Oxz в центр масс цели и равный по модулю рас¬ стоянию между началом координат и центром масс цели Радиус-вектор перехватчика Dn Вектор, направленный из начала координат неподвижной прямоуголь¬ ной системы координат Oxz в центр масс перехватчика и равный по мо¬ дулю расстоянию между началом координат и центром масс пере¬ хватчика Плоскость наведения Плоскость, которая проходит через векторы скоростей перехватчика и цели (если они компланарны) и в которой осуществляется наведение Курсовой угол цели q Угол между вектором относитель¬ ной дальности (линией «перехват¬ чик—цель») и вектором скорости цели Пеленг цели ф Угол между вектором относитель¬ ной дальности (линией «перехват¬ чик—цель») и вектором скорости перехватчика Курс перехватчика ф (курс це¬ ли фц) Угол между осью Ох прямоуголь¬ ной системы координат и вектором скорости перехватчика (цели) 8
Продолжение Название элемента Определение Рубеж перехвата RK Расстояние до перехватчика в мо¬ мент выполнения задачи наведения от начала прямоугольной системы координат Время перехвата fK Время полета перехватчика по ки¬ нематической траектории от начала движения до момента выполнения задачи наведения Потребная перегрузка «ПОтр Перегрузка, вызванная кривизной кинематической траектории и необхо¬ димая перехватчику для полета по методу наведения Зона возможных атак Часть плоскости вокруг цели, на¬ чиная движения в которой перехват¬ чик, двигаясь по кинематической траектории, выполнит задачу наве¬ дения Зона возможных» атак по пере¬ грузке Часть плоскости вокруг цели, из которой начинаются кинематические траектории перехватчика, характери¬ зующиеся условием Япотр^^зад Зона возможных атак по скорости Часть плоскости вокруг цели, на¬ чиная движение из которой перехват¬ чик при полете с заданной скоростью по кинематической траектории встре¬ тится с целью Угловая скорость вращения линии • перехватчик—цель» (линии визиро¬ вания) СОл Угловая скорость вращения вектора относительной дальности D (линии «перехватчик—цель») относительно неподвижной прямоугольной системы координат Oxz. Положительное "на¬ правление соответствует вращению конца вектора D по часовой стрелке (см. рис. 1.2, 1.6, 1.14, 1.16, 1.25, 1.26) Угловая скорость вращения вектора скорости цели соц Угловая скорость вращения соц вектора скорости цели v4 относитель¬ но неподвижной прямоугольной си¬ стемы координат Oxz. Положитель¬ ное направление соответствует вра- 6
Продолжение Название элемента Определение щению конца вектора v4 по часовой стрелке (см. рис. 1.2, 1.6, 1.14, 1.16, 1.25) Заданная угловая скорость враще¬ ния вектора скорости перехватчика СОзад Угловая скорость вращения шзад вектора скорости перехватчика v от¬ носительно неподвижной прямоуголь¬ ной системы координат Охг при за¬ данном значении перегрузки язад Положительное направление соот¬ ветствует вращению конца вектора v по часовой стрелке (см. рис. 1.2, 1.6, 1. 14, 1. 16, 1.25) 1.2. МЕТОД КРИВОЙ ПОГОНИ* Методом кривой погони называется метод сближения пере¬ хватчика с целью, при котором направление касательной к тра¬ ектории перехватчика в каждый момент времени проходит через точку нахождения цели. Уравнения метода даны в табл. 1.2. Таблица 1.2 Уравнения движения Уравнения метода наведения ВектЬрная форма V0TH = V —vu —0)ц X D D X v =0 Прямоугольная система координат дгц = cos 2-ц = Кц sin фц х = v cos 0 г = v sin ф л: — хц х 2 2ц г Полярная систе¬ ма координат D = — v — г/ц cos q ^„sin# 9 — jj + “ц О III э- Кинематическая траектория перехватчика, соответствующая полету по методу кривой погони, называется кривой погони. * Встречаются иные названия этого метода: оптическая погонная кривая, «собачья кривая», «чистое преследование». 10
1.2. 1. Графическое построение кинематической траектории по методу кривой погони Пусть цель движется равномерно со скоростью иц. Ее траею тория разбивается на участки ЯоЯ1 = ЯгЯ2 = ... = vnAt, где At — выбранный интервал времени (рис. 1.1). В начальный мо¬ мент времени заданы расстоя¬ ние от цели до перехватчика По и курсовой угол цели q0. I la прямой П0Ц0 откладывает¬ ся от точки П0 отрезок П0Пи равный по величине vAt. Точки II | и Цх соединяются отрезком П\Ц\. На прямой ПхЦх от точ¬ ки П\ вновь строится отрезок II\Я2, равный по величине vAt. Далее построение повторяется аналогично. Ломаная, прохо¬ дящая через точки П0, Яь //о,..., представляет кривую погони. Чем меньше интервал времени At, тем ближе полу¬ ченная линия к кривой погони. В пределе, при Af-^0, ломаная и кривую погони. Рис. 1.1. Графическое построение ки¬ нематической траектории по методу кривой погони линия П0ПхП2П3... переходит 1.2.2. Уравнения движения и метода наведения по кривой погони Пусть цель движется со скоростью пц и разворачивается с угловой скоростью сйц, положительное направление кото¬ рой указано на рис. 1.2. В некоторый (начальный) момент времени перехватчик находится в точке Я, а цель — в точ¬ ке Ц. . . J Положение перехватчика и цели в прямоугольной системе координат Oxz определяется координатами (х, z) и (хц, гц) соот¬ ветственно, а в полярной системе U,Dq— расстоянием D между пелыо и перехватчиком и курсовым углом цели q. Ориентация векторов скорости перехватчика и цели в прямоугольной системе определяется углами ф и фд между осью Ох и соответствующими векторами v и уц. Уравнения движения перехватчика и цели и условия полета его по методу кривой погони (уравнения метода наведения), за- ввеаиные в векторном виде и в проекциях на оси прямоугольной в полярной систем координат, приведены в табл. 1.2. 11
Начальные условия. При £=0 заданы координаты: — в прямоугольной системе л:ц(0) = Лц0; х(0)=л0; гц(0) = гц0; z(0)=z0; — в полярной системе D(0) =D0; q(0)=q0. Рис. 1.2. Элементы кинематической траектории метода кривой погони В этот же момент времени углы -ф0 и ф0 определяются соот¬ ношениями: tgto = ^цО ^0 ХцО Xq Добавив к этим условиям законы изменения скорости дели Уц(t), скорости перехватчика v(t), курса цели фц(£) или угловой скорости вращения вектора скорости цели соц(£), получим замк¬ нутую систему дифференциальных уравнений как в прямоуголь¬ ных, так и в полярных координатах. 1.2.3. Решение уравнений движения при перехвате по кривой погони прямолинейно и равномерно летящей цели (соц=0, Уц=const) и постоянной скорости перехватчика (и = const) Пусть цель движется прямолинейно и равномерно (соц = 0, ij;q = const, n4=const). Перехватчик решает задачу наведения, двигаясь с постоянной скоростью (y = const). Для этих условий ниже представлены решения уравнений движения в полярной и прямоугольной системах координат, а также характеристики кинематической траектории перехватчика и зоны возможных атак. 12 О
Значения функции Itg «Ъ ’-N <3 йг 2, 'О К Л о 0(М^^0нЮ^0 OOrHCDW^OOCDO О О О О (М СО СО '—1 О ОООООО-—<ФО o' о’ о" о" о" о" о" О ГН* OONCD!NOiO(NO О’-'ЮЬЬ^ОЮО ООО—"фг-чфазО ООО о_о_—< см ф о ОООООООО»-* СОЮСМСОФФЮС^О ОЮОгн гн(МСОгнО ОО-—'ЮООЗФОЗО ООООННСОЮО ОООООООО'—* fOOMO^M^TtO СЧСОЬОООСООЮО О'-'СОСОФЮ—<ФО ОООО-М Ф^СО о ОООООООО-—< СО-—*СО>-ОФСМЮФО N^^ONCOO^O О СО N СО 1—* СО 03 О О ООО г-^см со Ф О ОООООООО’—1 ЮОЮСМСМОСОЮО (МФСОСМСОСМСООЗО -н^а)союьм(мо ООО-Ч1МС0Ю t^o о о о" о о" о о~ о j СОСМСОЮОСМЮФО ОС^’-'СОЮЮЮЮО (MOCNOOrHCDlOO ООгНгн^'ФЮЬО ОООООООО'—* О'-Н’ФС^СО^СОЮО СОООСОЮСОСОС^СМО СОООЮ^’ФСООООО OO--MMC0^tDNO о о" о о о о" О о" гн С^СОООФСМФСМФО CO^IONOGO(MOO ЮСМОООг-ионо О-—'СМСМФЮСОСОО ООО О ООО О*'—| сосоаюо^ю^о 00 СО Ф О СМ СО lO Ф О ОФСОСМСОФЬ-СМО О--ч(МС0Ф1ас000О ООО о о о о" о —« IOCOOOCOCOCOCOO NCOCO^CONOOO OOt^COCOCOt^-OCOO O'—'(МСО^ЮЬСОО ОООООООО т—** СО ОО (>«!>■ ’—'О ОО »—| О 1—'ОЗЮСМСООЗЮФО >—'ОООООСМЮО »—'(МСОФЮСО^СОО О О ООО ООО-—| ^ЮЬЮС^ССЮСОО (MOiCOlOCO'tCOOO '-'(МСО’ФЮСО^СОО ООООООООг-ч COOGO^CO-1 «O'—I о г-< coco lO'-iOJNOO СОЮЮ’ФСОнООО CMCO-^LOCONOOOJO ООО О О О О О >-ч Ф Ф Ю> Ф lOOOCN^O NOObCOWMNO ЬООСОСООСОСОО CO^IOCONOOCOQO ОООООООО г-Г COO'^O't OCONO Ф СО СО t>- 0О СО ■—< Ю О ’—1 О СО ’—1 Ю О СО СО О СО м> со СО оо О) О) о ООООООООг ОООООО ООО >—'(МСОФЮСОС-нСООЗ <3 is* a Vo *5 > ф со аз ) см n со ) IM - - 3 03 Ю Ф о ф о о со аз ф о о ю со со аз о Ф Г-Н 03 Ф СО СО аз —* —* ^NCOO С4 Ю г-ч о О -ч О О со -н аз ф <м г СО —• ф ф • ф <м СО Ю СО (М со аз аз со СО СМ г-н О аз —< аз о i—* аз со о lOCOONOO rHCNCOiOCOlOO со^со аз —' ьазфюо ОСОСОСОСОСО‘(Мг—I »—. СО с^. см N^00300 , NMOOOOCOIMO Ф —'ОЗФСОООФО см см со см Ф со <м".—Г,—Г О СО г-I , , ’—1 аз аз аз >—< о ффос^-фооозь-о CMtMt^-.CM03COCOCOO СМ со О СО СО СО О ON^N030CO(MO МО(МОсОФЬСОО со со СМ со О О '—1 СО СО СО о см аз <—I ю ф 1>н о со со аз 1—1 со см о ф —< см со о со СОСО со со Ф о ю <м аз со ' со со о со ф аз lo см о СОЬгнфоОМО 00 ф LO U0 ’—* СО 00 г-н о ЮЬнСМСОСОСОФСМО Ф СО ф г—I С4 '—I 1—I >—ГI—Г СМ СО ю М соI о соьььфсосмозо ФсОСОЮ^ЬФгнО т-ч ю со»-<см г-1 г-Г Гг-Г CON-чЬ^ОСООО ЮСОЬОСОФ^ЬО аз^смюазсосО’—'О »—' аз coo I—|<моз’—о (МОСОФФЮСМЮО ООСОФСОЮСО’—'О t'-T ф см" Т-? Г-Г т—Г Г-Г Т—Г Ф ю СО СМ СО Ф О »—< СО ’—1 о ’—1 со о ■—1 со аз со '—'О СОООСМСОЮСОСМ’—I о ф" <М <М У-Ч < —I —Г г-Г Г-Г со о осмсоаз^сососоо юоазозюф1С^о СООСО’-ЧСОСМ’ЧОС СО со О СОЮЧ10ЮСОСОЮО (М’чООЗСОгнЬсОО СОФСООчгчоОО ооооооооо -ч(мсоф1осоьооа> 13
f-f- Ja ■ «V l. Решение уравнений движения в полярной системе координат дается следующими формулами. Расстояние между перехватчиком и целью D = D0 sin q0 cosec q (tg - J • ctg - J (1.1) Значения функций (tg приведены в табл. 1.3 и 1.4. Время полета перехватчика по кинематической траектории от точки (D0, <70) до точки (D, q) t- _ Do (k — cos qo) — D (k — cos q) VU (&- 1) (1.2) или 1 — ——sin q0cosec q ^tg-^--ctg j. (1.2') k— cos qp vu №—1 L k—cos qo Угловая скорость вращения линии «перехватчик—цель» “л sin2qcosec q0 ^ctg-^-tg . (1.3) Решение для частных случаев значений курсового угла цели, а) Курсовой угол цели q достаточно мал (sin q^q\ cosg«*l). Решение дается следующими выражениями. Расстояние между перехватчиком и целью D = D0 — v^(kAr\)t. Курсовой угол цели Я = Яо 1 I Vu.(k+\)t D0 (1.4) (1.5) б) Курсовой угол цели q достаточно близок к я/2 (sin^^l; cos q^q). Решение дается следующими выражениями. Расстояние между перехватчиком и целью D = D0 exp ■k(q-qo) -(q*~q\) (1.6) Время полета перехватчика по кинематической траектории от точки (D0, qo) до точки (D, q) t- /^[ф{к±д)_ф{к + до)]ехр(Ь±1о!>!, (1.7) у £ V дО ^ где Ф (£+?)= k+q е dx — интеграл вероятности. 14
2. Решение уравнений движения в прямоугольной си¬ стеме координат дается следующими формулами. Координаты перехватчика ^cos*“° ■ sin2(»0 —фдо), [ 1 + £ cos (.ь - фц0)] X х=хп ф0(й2—!) sin (ф — фц0) X sin (ф —фц0) sin (ф0— фц0) Ад sin фц0 ctg фо 2Фц0 tg 2 1 + k cos (фр— фцр) 1 + k cos (ф — фц0) to — ФцО 461 Фо- т] sin2 (to - *ц0) [ 1 —(ctg 4-iao ig Ф~ФдО^Фр—ФдО X X X ctg Фо —ФдО ^ Ф —ФдО 2 ь 2 [l+to»-yx фо(*2—1) Sin (ф фцо) х (ctg tg I 1 + k COS (to— фц0) ^ 1 + k cos (Ф — фц0) X sin (ф — фдр) (Mn ф— фцо t to — ФдО =LiBo)/ctg i Фд0) \ sin (фо Z/iT COS фпП *9/1 i \ - ц Yu0sm2(t0—фц0) to -n+ (ctg ф—tuO to— to0\fe 2 g 2 X X (ctg to —ФдО to—ФдО 2 g 2 (1.8) Координаты цели •^ц — Хцо -j- vvt cos фц0; ■гц = 2’д0+®д^1п«14,в. (1.9) Время полета перехватчика по кинематической траектории от точки (х0, 20) до точки (х, г) ф —ФдО to —ФдО NS 2 ё 2 X cosec2(Фс,—фц0) ( X (ctg ■ 1- [k + cos (Ф — фцо)] Sin2 (Ф — фц0) X k + cos (Фо — фцо) sin (ф — фц0). k + соэ(ф — фц0) sin (фо— фц0) X Ф — ФдО Фо —ФдО' tg 61 2 2 , Угловая скорость вращения линии «перехватчик—цель» (1.10) |==Ф=Фо ctg Ф—ФдО ^ Фо —ФдО ’ sin2 (ф - фц0) cosec2 (Ф0 - фц0). (1.П) 15 2 2
Квадрат расстояния перехватчика от начата прямоугольной системы координат Фо — ФцО Ф — ФдО \ 26 • D2n=xt- 2 -20- (Ш tg- х X Sin2 (ф0 — фд0) cosec2 (ф — фц0) [ 1 + k cos (ф — фц0)]2 X X 1- 1 + k cos (ф0— фц0) sin (ф — фцо) ф—фцо х Фо—Фцо 1+Acos (ф—-фц0)-8т(ф0—фц0) ь 2 2/_4.„ Фо — ФцО irr ф — ФцО )2 + Д0 ctg -1g. •f+ _ Р^Ф—фцо^ Фо — ФиО 12^ " 2 а 2 J Л Xsln (fc-fa) - fgL *"■ »- fl ctg tg -±ZlM- X №—1 sin (ф — фц0) 2 2 X [ I + k cos (ф — фц0)] (JC0 cos фц0 + z0 sin фц0) X X 1 _ 1 + k cos (Фо— фц0) sin (Ф — фц0) ctff ф — фцо tg Фо — Фдо' 1 +k cos (ф — фц0) sin (фо—фц0) + + 2D0 ctg tg ’bfe (1 • ctg Ф — фцо tg ФобгФцо X 2 2 X(*0 sIn фц0— 20 cos фц0) sin (ф0—фц0). (1.12) Решение для частных случаев движения цели, а) Цель движется параллельно оси Ох (орцо = 0). Решение дается следующими выражениями. Координаты перехватчика л; = X Z=zn v sin2 ф0 (l+)fecos Ф)(^-^^-^Л*Х Фо (£2 — 1) sin Ф 1+ЙСОзфо . , , / , Ф . Фо ] 35- Sin ф cosec ф0/ctg; 1 + k COS ф psin2,h> /ct„ Фо t _ФХй Фо V 2 ё 2 1 — ctg — tg— s 2 2 (1.13) Время полета перехватчика по кинематической траектории от точки (х0, z0) до точки (х, z) sin2 фо Фо(*2 щг(с,!!т)>тГ X X , k + COS Фо . , 1 1 — эшф k + COS ф cosec ф0 (ctg tg (1.14) Угловая скорость вращения линии «перехватчик—цель» од=ф=ф0 sin2 ф cosec2 ф0( ctg — tg Фо (1.15) 16
б) Цель движется параллельно оси Oz ^фц0=-^ • Решение дается следующими выражениями. Координаты перехватчика х=х0—. —sm2 —cosec ф (1 -|-£cos Wctg — 0 ф0(£2 —1) \ 2 НУ X X 1- l+Acosibn - I , / . Ф + Фо^* —2= ^ sm ф cosec ф0 ( ctg -уtg 2 Z=Zn 1 + k COS ф |-(с18т18т)‘]-. (1.16) Время полета перехватчика по кинематической траектории от точки (х0, 2о) до точки (х, z) ‘--Т^*(т-$Мт-±)*[т++)х х [‘ - тЩуcos fsec ♦* ctg‘ (f - ir) *8’(т- т1)] • ('•17) Угловая скорость вращения линии «перехватчик—цель» “л = Фо c°s2 Ф sec2 ф0 ctg* —i)-tgft j—- — . (1.18) 3. Связь элементов кинематической траектории пере¬ хватчика в полярной и прямоугольной системах координат имеет вид: s'n (Ф—Фцо)=~sin (1.19) D= — «ц[^ —соз(ф —фц0)]= — n4(A+cos^); (1.20) q — tt -j-ф фц0. (1.21) 4. Радиус кривизны кинематической траектории пере¬ хватчика г и потребная для полета по кривой погони и е- регрузка перехватчика иПотр определяется формулами г=——~= kD° ctgft — tgfe — sin2q0cosec2q= sin q sin q0 2 2 =T = T ctgft tg* sin2 (Фо - Фцо) cosec2 (Ф - фд0); (1.22) ”потр=—ctg* ~ • tg* - J- • sin q cosec q0. (1.23) goD goDo 2 2 5. Параметры движения в момент встречи перехватчика с целью (D = 0, х=хц, z = zn) представляются сле¬ дующими выражениями. 17
Скорость сближения Dk О—V ц. Время перехвата t — D° ~ cos ?о) A) k + cos (to ~ tap) к 1>Ц(А2_1) уц £2 — 1 Квадрат рубежа перехвата Rl = 40 + 4о + D02 [ ^ + с^-^о)]2 + + 2До--+72^7Фцо) (*цоcos 1>ц0 + ^цоsinфц0)= (1.25) = *о + zl + £% sin2 (t0-tuo) + Do -J2- — [ 1 + k cos («1>0 - фц0)]а + (tf2 1)^ + 2D°k2~i f1 + ^ cos(to ~ t„o)] (*оcos tuo + г„ Sin фц0) — — 2D0 sin (<!»„ — t„0) • (х0 sin фц0 — z0 cos tu0). (1. 26) Координаты точки встречи перехватчика с целью х«= х0 - уСЦ Фц0 [ 1 + k cos (ф0 - фц0)] sin (ф0 - фц0) + toA2— 1) = р s in фц0 *to р sin фц0 ’to(*2-l) sin2 (to — фцо); [ 1 + k cos (to - фц0)] sin (t0 - tu0) - • (1.27) V COS Фио • 9 / , . \ •sm2(t0-tu0). *to Угловая скорость линии «перехватчик—цель» сол и потребная перегрузка пПотр определяются по табл. 1.5. Таблица 1.5 Отношение скоростей перехватчика и цели k Угловая скорость линии „перехватчик—цель“ о>л Потребная перегрузка лпотр 1 < £ <2 8 £я II О ^110 тр = 0 k = 2 “л = 4шл0 л V ^потр — 4о>ло ёо £>2 “л = °° ^потр ~ 00 18
6. Зона возможных атак по перегрузке. Граница зоны возможных атак по перегрузке (см. табл. 1.1) опреде¬ ляется равенством n wising1 ^гр • £оЛзад Граница зоны возможных атак образована двумя окружно¬ стями, касающимися в точке цели, с радиусами wJ2g0n3aR. Зона возможных атак по перегрузке показана на рис. 1.3. Для вычисления границы зоны возможных атак на рис. 1.4 приве¬ ден график функции /х=—ш q■ . Тогда граница определяется £0^зад соотношением £>rp=/iWi,. q, град 10 30 50 90 fi, сек^/м (по рис. 1.4) 0,0045 0,013 0,020 0,026 £>г р, м 935 2705 4160 5410 Пример 1. Цель летит со скоростью иц=1500 км/час. Перехватчик движется по кривой погони со скоростью у =1800 км/час и располагает пере¬ грузкой я3ад=4. Определить границу зоны возможных атак по перегрузке. С помощью графика на рис. 1.4 находится функция fi для выбранных значе¬ ний курсовых углов цели 9=10°, 30°, 50°, 90° при я3ад = 4. Затем вычисляется DrI, для выбранных значений курсового угла цели. 1.2.4. Решение уравнений движения при перехвате по кривой погони движущейся равномерно по логарифмической спирали цели (ф—фц=const, иц—const) и постоянной скорости перехватчика (n = const) Пусть цель движется по кривой, описываемой в прямоуголь¬ ной системе координат уравнениями а:, ц Лц0 _{_Дд ^(Фц Фц0)‘85 _ lj gin (фц-|-8) cos 8; Фо где гц==2’цо~Ьт^ НФц +цо) ‘е5 _L i] cos (фц + 5) cos S, Фо tg s J-c-°.s^-^l.=C0nst. sin (ф0— фц0) (1.28) (1.29) Траектория цели представляет логарифмическую спираль с радиусом кривизны г„ = ^е^ цо-фц)‘85. Фо (1.30) 19
Лзад^^- Рис. 1.3. Зона воз¬ можных атак по пере¬ грузке для метода кривой погони при на¬ ведении на прямоли¬ нейно летящую цель (зона возможных атак находится вне заштрихованной обла¬ сти, ограниченной окружностями /гза д = = const Л Рис. 1.4. График функции f\= ^О^зад 20
1. Решение уравнений движения (табл. 1.2) в прямо¬ угольной системе координат дается следующими фор¬ мулами. Координаты перехватчика х=х0-\~?- ») s — 1] sfn(60-j- 8)cos 8; Фо (1.31) z = z0—Д- tgs_ i] cos (ф0_[_8)cos 8. Фо Траектория перехватчика также представляет логарифмиче¬ скую спираль. Время полета перехватчика по кинематической траектории от точки (х0, z0) до точки (х, z) /—£1|А(е(<и-Фо) tgs_ |] (1.32) Фо Угловая скорость вращения линии «перехватчик—цель» шл=ф0е(фдо-*ц)^8. (1.33) 2. Связь элементов кинематической траектории пере¬ хватчика в начальный момент времени имеет вид %=arctg ^ ; •^цО *^0 Ф _ф _ sin (фцр — фо) 0 10 V(xaO— хо)2~г (гц0_—zo)2 (1.34) 3. Радиус кривизны кинематической траектории г и потребная для полета по кривой погони перегрузка перехватчика гаПотр определяется формулами г=— е^—'+») 6: Фо (1.35) п (1.36) 4. Пар аметры движения в момент встречи перехватчика с целью представляются следующими выраже¬ ниями. При 6 = 0, т. е. при & = соэ(фц—тр) < 1, цель движется по окружности, а кривая погони представляет также окружность, концентрическую с первой. В этом случае траектория перехват¬ чика не пересекает траекторию цели. При бэ^О, т. е. при &>cos(i|)4—ф), параметры движения находятся из следующих соотношений. 21
Курс перехватчика Фк = Фо + ctg s-ln Время перехвата L=- 1- sin (фцо— Фо) Dn (1.37) (1.38) »ц[/г — сов(4<ц0 — ф0)] Рубеж перехвата RK = {хо + z\ + k2Dl cos2 8 cosec2 (<Ьц0 — ф0) + + 2kD0 cos 8 cosec (фц0 — <I>0) [г0 cos (<]>„ + 8) — x0 sin (<(>„ + 8)])2 , (1.39) где б определяется по формуле (1.29). Координаты точки встречи перехватчика с целью *к = *о — kD0 sin (<]i0 + 8) cos 8 coses (<|»ц0 — %); zk=zo + kDo cos («I»0 + 8) cos 8 cosec (фц0 — <|>0). (1.40) 1,3. МЕТОД ПАРАЛЛЕЛЬНОГО СБЛИЖЕНИЯ Методом параллельного сближения называется такой метод наведения, при котором линия «перехватчик—цель» остается параллельной своему первоначальному положению (угловая ско¬ рость линии «перехватчик—цель» равна нулю). При прямолинейном и равномерном полете цели кинемати¬ ческая траектория перехватчика, летящего с постоянной ско¬ ростью, представляет собой прямую, проходящую через точку, в которой должны встретиться перехватчик и цель. Уравнения метода даны в табл. 1.6. 1.3.1. Графическое построение кинематической траектории метода параллельного сближения Пусть цель движется равномерно со скоростью оц. В началь¬ ный момент времени задано расстояние от цели до перехват¬ чика D0 и курсовой угол цели qQ. Траектория цели (рис. 1.5) раз¬ бивается на равные участки ЦоЦ\ = Ц\Ц2 = Ц2Цз= ■ ■ ■ =v4At, где At-—выбранный интервал времени. Через точку Ц0 под углом qо к отрезку Ц0ЦХ проводится прямая. На ней отмечается отрезок ЦоПо—Dq. Через точки Ци Ц2, Ц3. . .. проводятся пря¬ мые, параллельные начальному положению линии «перехватчик— цель» П0Ц0. Далее определяется точка Пх пересечения прямой, параллельной отрезку /70До и проходящей через точку Цх, и окружности радиуса vAt с центром в точке П0. Точки Я0 и Цх соединяются отрезком. Затем находится точка Я2 пересечения прямой, проходящей через точку Ц2 параллельно отрезку П0Ц0, 22
и окружность радиуса vAt с центром в точке П\. Точки Ях и Ц\ соединяются отрезком. Аналогичным построением определяются Рис. 1.5. Графическое построение кинематической траек¬ тории по методу параллельного сближения точки Я2, Я3,... Линия, проходящая через точки Я0, П\, Я2..., при ДА-Я) представляет траекторию параллельного сближения. 1.3.2. Уравнения движения и метода наведения по параллельному сближению Пусть цель движется со скоростью иц и разворачивается с угловой скоростью свц, положительное направление которой показано на рис. 1.6. Положения перехватчика и цели в прямоугольной системе координат Oxz, начало которой находится в произвольной точ¬ ке О и оси Ох и Oz ориентированы произвольно, определяются координатами (х, z) и (хц, 2Ц), соответственно. Положение перехватчика относительно цели в полярной си¬ стеме координат ЦDq, начало которой связано с целью, опреде¬ ляется расстоянием D между целью и перехватчиком и курсовым углом цели q, определяющим угловое положение перехватчика относительно вектора скорости цели. Ориентация векторов скорости перехватчика v и цели уд в прямоугольной системе координат Oxz дается углами и т|)ц между осью Ох и соответствующим вектором v или уц. Ориентация вектора скорости перехватчика v в полярной системе дается углом пеленга цели <р — между линией «перехват¬ чик—цель» и вектором скорости v. 23
Уравнения движения перехватчика и цели и условия полета перехватчика по методу параллельного сближения, записанные в векторной форме, а также в проекциях на оси прямоугольной и полярной систем координат, приведены в табл. 1.6. Таблица 1.6 Уравнения движения Уравнения метода наведения Векторная форма ^отн = V V4 (Оц х D Voth X D = 0 . Прямоугольная система координат ха = Va COS фц ' za = va sin фц X — V COS ф Z = V s in ф X Хц Xq — ^ц0 Z Я'ц Zq -^дО Полярная систе- ма координат D = — v cos у — Уц cos q 1 sin 9 = —• sin q k II e в Начальные условия. При ^=0 заданы следующие ко¬ ординаты: — в прямоугольной си¬ стеме ха(0) = хп0; х(0) = л:0! г„(0) = 2:ц0; z(0) = z0; — в полярной системе D(0) = D0; <7(0) = ?о- В этот же момент вре¬ мени углы -фо и ф0 опреде¬ ляются соотношениями sin(s0 — ((»0) = sin (®ь Фдо)» sincp0 = -^-sin ?0; *^ц0 — х0 Добавив к этим условиям законы изменения скорости цели vn(t), скорости перехватчика v(t), курса цели фц(0 или угловой скорости вращения вектора скорости цели юд(£)> получим замк¬ нутую систему дифференциальных уравнений как в прямо¬ угольных, так и в полярных координатах. Рис. 1.6. Элементы кинематической траектории метода параллельного сближения 24
1.3.3. Решение уравнений движения при перехвате по методу параллельного сближения прямолинейно и равномерно летящей цели (соц=0, иц=const) и постоянной скорости перехватчика (w=const) Пусть цель движется прямолинейно (сод=0, фц=const) и равномерно (цц=const), а перехватчик летит с постоянной ско¬ ростью (у = const). Решение уравнений движения в этих условиях для полярной и прямоугольной систем координат, а также некоторые характе¬ ристики кинематической траектории и зоны возможных атак приведены ниже. 1. Решение уравнений движения в полярной системе координат дается следующими формулами. Расстояние между перехватчиком и целью D=D0 — vat (cos q0 k cos cp0). (1.41) Время полета перехватчика по кинематической от точки (Do, <?о) до точки (D, q) траектории 1 Do — D t/ц (cos q0 — k cos <po) (1.42) Пеленг цели cp==arcsin ^-i-sin^0^ . (1.43) Курсовой угол цели q—Яо- (1.44) 2. Решение уравнений движения в прямоугольной си¬ стеме координат дается следующими формулами. Координаты перехватчика x—xg-j-vt cos ф0; ) z = Zq -)- vt sin ф0. J (1.45) Координаты цели •*ц=-*цо + *ц* cos <!>„„; | z4 = 2uo + Vsin'l,4o- J (1.46) Время полета перехватчика по кинематической от ТОЧКИ (Хо, z0) до точки (х, z) траектории X — X0__Z — Z0 v cos ф0 v sin ф0 (1.47) Расстояние перехватчика от начала координат Dn = ]/л;о+4 + -f 2vt (х0 cos ф0 + z0 sin ф0). (1.48)
(1.49) Уравнения траекторий перехватчика и дели где z = z0 — x0tg% + xtg^0; zn = zuo - -*ш> tg фцо + xu tg фц0, Ф0 = s0 — arcsin s0=arctg *o ^ до Xq Хцо (1.50) 3. Параметры движения в момент встречи перехватчика с целью (Z) = 0, х=хц, г=гц) представляются сле¬ дующими выражениями. Время перехвата ^ До х0 хц0 к vu (cos д0 + к cos ©0) vu (cos фц0—к cos ф0) *0 ^цО (1.51) »a(sin фцо— к sin <ро) Рубеж перехвата Як = [(*0 cos <|>цо - kxц0 cos ф0)2 {Z0—Zn0f + (z0 sin фц0 - kznn sin ф0)2 x 1_ X (x0 —хц0)2]2[(г0—^(cos^o-^cos^)]-1 . (1.52) Координаты точки встречи перехватчика с целью х0 cos фц0 — к Хц0 cos ф0 . COS фцО — k cos фо Zp Sin фц0 — kxnp sin ф0 sin фц0 —fesin ф0 (1.53) 4. Зона возможных атак по скорости. При ско¬ рости перехватчика, большей скорости цели (k>\), зона воз¬ можных атак по скорости (см. табл. 1.1) представляет всю плос¬ кость наведения. При скорости перехватчика, меньшей скорости цели (й^1), зона возможных атак по скорости определяется неравенством в диапазоне курсовых углов цели — я/2<<7<я/2: <7 < arcsin k. (1.54) При курсовых углах цели я^^^я/2 и —я/2^^^—я зона возможных атак отсутствует. На рис. 1.7 приведена зона возможных атак по скорости. Эта зона справедлива для любых значений расстояний между пере¬ хватчиком и целью при данном значении отношения скоростей перехватчика и цели. 26
На рис. 1. 8 показана перехватчика и дели k, область значений отношений скоростей при которой перехватчик встретится с целью, в зависимости от значений курсового угла цели q в момент на¬ чала движения перехватчика. к Рис. 1.7. Зона возмож¬ ных атак по скорости для метода параллельного сближения при наведе¬ нии перехватчика на пря¬ молинейно летящую цель (зона находится вне за¬ штрихованной области, ограниченной прямыми k = const) Рис. 1.8. Область значений отношений ско¬ ростей k и курсовых углов цели q, при- ко¬ торых перехватчик, двигаясь по методу параллельного сближения, встретится с пря¬ молинейно летящей целью 1.3.4. Решение уравнений движения при перехвате по методу параллельного сближения равномерно движущейся по окружности цели (оц=const, соц=const) и постоянной скорости перехватчика (и = const) Пусть цель движется по окружности с постоянной скоростью уц. Перехватчик летит к цели с постоянной скоростью v по методу параллельного сближения. Решение уравнений движения в по¬ лярной и прямоугольной системах координат, а также некоторые параметры кинематической траектории приводятся ниже. 1. Решение уравнений движения в полярной системе координат дается следующими формулами. Расстояние между перехватчиком и целью D= D0-\-— (sin <70 — sin q)-|—— Е (Оц (Од при &>1; <7о (1.55) 27
Я = £>0+— (sin^o — sin^)+ — E{k, cp0) —E(k, Ф) — Оц coFr — (1 — k2)F (k, <p0) + (l — k2)F{k, q>) При k<\\ £) = £)„-f 2—5-(sin^0 — sin#) при k== 1. (Оц Курсовой угол цели ^=<7o+V- Пеленг цели tP = To+Yarcsin(1 - -j- arcsin ^ 1 - A. sin2 (#0+a>^)j (1.56) (1.57) (1.58) ; i-59) где F (k, cp) —эллиптический интеграл первого рода с мо¬ дулем k и амплитудой ср; E(k, ср), ^ — эллиптический интеграл второго рода с мо¬ дулем k и амплитудой ср(#). 2. Решение уравнений движения в прямоугольной си¬ стеме координат дается следующими формулами. Координаты перехватчика = ■хо+ — Sin s0 COS(s0 — Фд0 — С0Цt) sin s0 COS (e0 — фц0) + —COS &йЕ , s0 — Фцо «и \ к ■ cos =-0E г l ТЦ0 -V); z=z0— COS sQ COS (s0 !})ц0) -J —COS eq COS (s0 фц0- соц^)-(- СОц СОц --^-Sine0£'^, £0-фц0) — sin е0Е ( , е„ — Фц0 — «V 1 v 1 при 1; (1. 60) Х = Х0 + — sin е0 COS (е„ — фц0 — шц*) — sin Е0 COS (е„ — фц0) -f (Оц (Оц -f— COS £„£-(£, е0 —фц0) —COS s0E(k, е0 —сЬц) + (Оц (Оц + (1 -k*)F(k, s0-W-(l-k*)F(k, £0 — Фо); Z == Zq COS e0 COS (e0 — <hj + — COS s0 COS (s0 — фц0 — aj) -f sins0E(k, so-^o) sin e0E (k, s0 —фц) + 28
-{\-&)F{k, 4-^)-{l-k*)F{k, е0-фд0) при 1; (1.61) x=x0-j 8!п(Фц0 + шдО; (Од 2 = г0 — — cos (фц0 + соц/), Шц при А=1, где во определяется формулой (1.50). Координаты дели =•*«<> + — sin (фц0+<од0; “д • — (СО8фц0+шд0. (1.62) z„ = z, Ц0 Курс цели Фц=ФцО + а>Д^- (1.63) (1.64) Расстояние перехватчика от начала прямоугольной системы координат Dn{t)= V& + &, (1-65) где координаты х и z вычисляются по формулам (1.60) — (1.62), (1.64). 3. Радиус кривизны кинематической траектории пере¬ хватчика г и потребная для полета по методу пере¬ грузка перехватчика пПотр определяются следующими фор¬ мулами: V2 /1 — — si k2 sin2 q vYk2 — sin2 (ff0 -f (0Ц^) i/цШц cos q »ucos (q0 + ЫцО V Y № — sin2 (e0 фц) vY k 2 —Sin2(e0 — фц0 —С0ц0 . “uCOS (e0 —фц) ^потр Ыц COS (gfl — фцо — “цО V2 gar ' ; (1.66) (1.67) 4. Параметры движения в момент встречи перехватчика с целью (D = 0, х = хц, 2 = 2Ц) определяются сле¬ дующими выражениями. Курсовой угол цели qK из решения трансцендентного урав¬ нения: при £>1 -4 5—^ sin q0-\-kE (-j-, q0)=s\nqK + kE{-±- , <?,<) ; \ k \ k (1.68) 29
(1.69) при k <; 1 ^^ + sin<70 + £'(&, <Fo) — (1 — k2)F(kr cp0)= »ц =sin?K+£(&, <pj —(1 — &)F{k, tpK); при k=l ^+2sin9o=2sin^K. (1.70) Определение курсового угла цели qK может быть облегчено с помощью вспомогательных графиков, приведенных на рис. 1.9, 1.10. На них представлены графики функций, стоящих в левых и правых частях уравнений (1.68) и (1.69). Для нахождения значения угла qK необходимо предвари¬ тельно вычислить левую часть одного из уравнений (1.68)— (1.69) для заданных значений начальных величин фо и -а>цД°- , а затем по графикам на рис. 1. 9 или 1. 10 для вычисленной вели¬ чины левой части найти значение курсового угла цели qK в мо¬ мент встречи перехватчика с целью. Пример 2. Найти курсовой угол цели в точке встречи qK, если цель двигалась по окружности со скоростью пц=400 м/сек и угловой скоростью соц=—0,05 1 /сек. Скорость перехватчика о=480 м/сек. Начальное положение перехватчика и цели определялось полярными координатами Z>0=15 000 м и 9о=60°. Отношение скоростей перехватчика и цели составляет v k = — vu 480 400 = 1.2. По графику (см. рис. 1.9) для й=1,2 и <7о=60° определяем величину 4) = sintfo + A£^-j-. до) = 1,95. Далее вычисляем величину «иD0 0,05-15 000 400 = — 1,875. Теперь находим величину Л = Ад + °цОо = 1,95— 1,875 = 0,075. Затем по графику (см. рис. 1.9) для &=1,2 и Л=0,07б определяем вели¬ чину <7к«3°. Время перехвата . Як — <70 Фц.к — ФцО L (1.71) Пеленг цели 'pK = cPo + ^-arcs;n sin2<?0j —~ arcsin ^1 -L sm2 q^ . (1.72) 30 \
Рис. 1.9. Вспомогательный график для определения курсового угла цели q при k>\ Р 30 60 Рис. 1. 10. Вспомогательный гра¬ фик для определения курсового угла цели q при k<l: В—Тг sin cp+If (ft.<р)—(1—ft2) F (ft,cp); <p=arcsin 31
В) ‘зад -■=1,1 Рис. 1.11. Зона возможных атак по перегрузке для метода па¬ раллельного сближения при наведении перехватчика на цель, движущуюся по окружности (зона возможных атак находится вне заштрихованной области, ограниченной прямыми ft=const) Рис. 1. 12. Область значений курсовых углов цели q, соответствующих зоне воз¬ можных атак по перегрузке, при наве¬ дении перехватчика по методу парал¬ лельного сближения на цель, движущую¬ ся по окружности (находится вне за¬ штрихованной области, ограниченной ли¬ ниями k=const) и 32
5) Зона возможных атак по перегрузке. Зона возможных атак по перегрузке (см. табл. 1.1) определяется соотношением. <7 < a resin £2- / “ц ч“зад = arcsm “ц 'зад k (1.73) На рис. 1.11 эта зона представлена для двух значений отно¬ шения перегрузки цели и заданной перегрузки перехватчика Яц/пзад и различных значений отношения скорости перехватчика и цели k = v/vn. Область значений курсовых углов цели q, соответствующих зоне возможных атак по перегрузке, а также области величин k, fl ц —1— , —— , при которых имеется эта зона, представлены на лзад “зад рис. 1. 12 и в табл. 1.7. Таблица 1.7 Отношение скоростей пере- хпатчика и це¬ ли k = — % Отношение угловых скоростей цели и перехватчика % “зад Отношение перегрузки цели и перехватчика пи пзая Существование зоны возмож¬ ных атак по перегрузке k < i (Оц < 1 Яц 1 Существует “зад пзая < к (Оц >i Лц 1 >Т Не сущест¬ вует “зад пзая k > i “ц > 1 /2ц 1 Существует “зад пзая k (Оц <i /2ц 1 Не сущест¬ вует “зад ^зад ^ k 1.4. МЕТОД НАВЕДЕНИЯ С ПОСТОЯННЫМ ПЕЛЕНГОМ ЦЕЛИ* Методом наведения с постоянным пеленгом цели называется такой метод наведения, при котором вектор скорости перехват¬ чика в каждый момент времени образует постоянный угол (пе- ** Встречаются иные названия, например, кривая атаки с постоянным упреждением. 'I 3398 33
ленг) с линией «перехватчик—цель». При пеленге, равном нулю (ф = 0), этот метод совпадает с методом кривой погони. При <p = arcsin sin q'j он совпадает с методом параллельного сбли¬ жения. Уравнения метода даны в табл. 1.8. Таблица 1.8 Система координат Уравнения движения Уравнения метода наведения Прямоугольная Хп = Уц COS ■гц = уц sin X — V COS Ф Z = V s in ф X — Хц I £5 II С сгс /■“ -€ 1 -6 о Полярная D = — v cos ср0 — vn cos q г/цвт# — г/sincpo 1 — Q + “ц ¥ = ?0 1. 4. 1. Графическое построение кинематической траектории метода с постоянным пеленгом цели Пусть цель движется равномерно со скоростью иц и заданы в начальный момент времени расстояние D0 между перехватчи¬ ком и целью и курсовой угол цели q0. Пеленг цели ф0 задан и постоянен на всей траектории. Траектория цели разбивается на равные участки величиной Ц0Ц1 = Ц\Ц2 = Ц2Цз— ■ ■ ■ — vnAt, где At— выбранный интервал времени (рис. 1. 13). Через точку Ц0 под углом q0 к линии ЦоЦ\ проводится прямая, на которой откладывается отрезок Д0Я0=По (начальное расстояние между перехватчиком и целью). Затем через точку Я0 под углом ф0 к отрезку П0Ц0 проводится прямая, на которой откладывается отрезок n0IIi = vAt. Далее через точку П\ под углом фо к отрезку П\Ц\ проводится прямая. На ней откладывается отрезок ll\n2 = vAt. В точке П2 построение повторяется по описанному плану. Получившаяся в результате ломаная ПйП\П2,... при ДГ-Ч) представляет траекторию с по¬ стоянным пеленгом цели. 1.4.2. Уравнения движения и метода наведения с постоянным пеленгом цели Пусть цель движется произвольно со скоростью оц и разво¬ рачивается с угловой скоростью сод, положительное направление которой показано на рис. 1. 14. 34 О
Положение перехватчика и дели в прямоугольной системе координат Oxz, начало которой находится в произвольной точке О и оси ордентированы произвольно, определяется коор¬ динатами х, z и хц, 2Ц, соответственно. Положение перехватчика относительно дели в полярной системе координат U,Dq, начало которой связано с целью, определяется расстоянием D между целью и перехватчиком и курсовым углом цели q, определяющим угловое положение перехватчика относительно вектора скорости цели. Рис. 1. 13. Графическое построение кине- Рис. 1. 14. Элементы кинемати- матической траектории по методу с по- ческой траектории для метода стоянным пеленгом цели наведения с постоянным пелен¬ гом цели Ориентация векторов скорости перехватчика v и цели уц в прямоугольной системе координат Oxz дается углами -ф и лрц между осью Ох и соответствующим вектором v или уц. Ориента¬ ция вектора скорости перехватчика v в полярной системе дается углом пеленга цели ф — между линией «перехватчик—цель» и вектором скорости v. Уравнения движения перехватчика и цели и условия полета перехватчика по методу наведения с постоянным пеленгом цели, записанные в проекциях на оси прямоугольной и полярной си¬ стем координат, приведены в табл. 1.8. Начальные условия. При t = 0 заданы следующие ко¬ ординаты: — в прямоугольной системе (0)=лгцО; х (0)=jc0; (°)=2uo; z(0) = z0; — в полярной системе D(0) =D0; 9(0) = q0. 2* 35
В этот же момент времени углы -ф0 и <р0 определяются соот¬ ношениями Ctg(% —То)= ^~Хц0 , ср = ср0. 20 гий Добавив к этим условиям законы изменения скорости дели Оц(t), скорости перехватчика v(t), курса дели фц(^) или угловой скорости вращения вектора скорости цели сoR(t), получим замк¬ нутую систему дифференциальных уравнений как в прямоуголь¬ ных, так и в полярных координатах. 1. 4. 3. Решение уравнений движения при перехвате по методу с постоянным пеленгом прямолинейно и равномерно летящей дели (соц=0, D4=const) и постоянной скорости перехватчика (v = const) Пусть цель движется прямолинейно (соц=ярц=0) и равно¬ мерно (Дц=const) и перехватчик летит с постоянной скоростью (и = const). Решение уравнений движения в этих условиях для полярной и прямоугольной систем координат, а также некоторые характеристики кинематической траектории и зоны возможных атак приведены ниже. 1. Решение уравнений движения в полярной системе координат дается следующими формулами. Расстояние между перехватчиком и целью D = D о k sin сро — sin q0 k sin <po — sin q q , k sin cog tg — —1— V 1 — ^2 sin2 To £ X Q о , k sin шо tg —- —1+ у 1 —£2 sin2 <p0 Ф £ Qo r k sin cp0 tg — —1+ Y1 — £2 sin2 To X k sin cpo tg — —1— Y1 — £2 sin2 cp0 = !k Sin ?0 —sin | p-1 0 \k sin <3>0 — sin q0) ^ / i — /г sin уд sin qо cos g0 у t — n* sin-s cp0 у 1—k sin <p0 sin q + cos q ]/" 1—sin2 cp0 при sin2 cp0 1; ( Ik cos <po D=D0 k sin tpo — sin 9o k sin cpo —• sin q X — 1 k sin <p0 tg-^ arctg —7— - : у № sin2 ср0 — 1 6XP {Yk? Sin2yo — k sin <p0 tg -arctg - X 9o_ 2 & Yk2 s in2 cp0 — 1 I при &2sin2<p0>l; (1.75) (1.74) 36
D — D. 1 — sin 1 1 — sin q где exp{*co.<p„[tg (f+f)-‘g(f+f)]} при k2 smztp0=l, (1=76) &cos cfo m, 1^1 —£2 sin2i{>Q (1.77) Время полета перехватчика по кинематической траектории от точки (D0, до) до точки (D, д) t— — — (1 — sin<70) exp 2 va X' — k COS cpo tg (-f+-J-)]x f / 3T 1 + tg2 (У + f) 24f+i) I 2 й cos 90 £2 COS2 9o 1 £3COS39o X Xexp k cos cp0 tg j 4_ 4 ' 2 1 2 kcos 9q &2 cos2 90 1 Й3 cos3 9o Xexp kCOS cp0tg n _L go 4 1 2 X при &2sm2cp0= 1; (l.|78) «ц(1 — Щ cos 90 {D [k - cos (g - ?„)] — D0[k — cos (g0 — cp0)]} где COS cp0 : при k2 Sin2 cp0 Ф 1, У № — 1 (1.79) (1.80) <V=<7: Dq (k sin 9o — sin g) m i—2 Угловая скорость вращения линии «перехватчик-—цель» • t/ц (k sin 9о — sin (7o)m‘_1 /1—& sin 90 sin q+ cos q У 1—k2 sin2 90\m 1—k sin 90 siny0+cos go V1—£2 sin2tp0/ при &asin2cp0 < 1;] (1.81) г 2A cos 90 v„ (sin о — &sin90)2„ шл=g = —3- -i 6ex p Do sin qo — &sin90 1 fsV~k2 s’n21 X X arctg q k sin 9o tg — — 1 -ardg q 0 k sin To tg -y —1 "pX2 sin29o — 1 У № s in 29,,— 1 при ^2sin2tp0^>l. (1.82)
При k=\ угловая скорость вращения линии «перехватчик— цель» конечна, за исключением точек, где выполняется соотно¬ шение sin q=k sin ф0. (1.83) Значения угловой скорости вращения линии «перехватчик— цель» при.ф0<л:/2 следующие: при т1<^2 при т1 >■ 2 при тх—2 шл—0; “л = ос; (1.84) 4 Dn 1 г/ц /1 + 7^ 1—*2 sin2 сро k sin <ро X X {k Sinср0 — sin q0)(\ — ksincp0sin q0 — — cos qn Y\ — № sin2 cp0) № cos4 <p0, причем в этом случае sin qo=£k sin фо. 2. Решение уравнений движения в прямоугольной си¬ стеме координат дается следующими формулами. Координаты перехватчика = -*цо + Vj cos фц0 - D COS (То - Ю; | 2'—,^o + V®in^f — ^sin(To — Ф), J (1.85) где время полета определяется по формулам (1.87) — (1.89), а расстояние D между перехватчиком и целью вычисляется по формулам (1.74) — (1.76). Координаты перехватчика при fe2 sin2 <ро< 1 можно определить также с помощью соотношений -*nO + A> k sin <f>0 + sin (ф — уд — фцрУ k sin tp0 + sin (ф0 — <p0 — фц0) /72,-1 X k cos фц0 _|_ 1 — &2 cos <fo cos фц0 cos Ц — 2y0—фц0) — (1 — Щ cos (y0—ф) cos fQ (1 — Щ cos ?o 1 i X 1 + k sin cpo sin (фо — f0 — фцо 1 +k sin <f0 sin (ф — <p0 — фц0) Д cos Ы — cos (Ф — <fo — фцо) Kl — № sin2 ?0 j Фцо [k + cos (Фо — Уо — фц0)] . ^ gg,( (1 — №) COS <fo sin (ф fo — фц0) l"»!-1 X X X _ , n \k sin <fo + sin (ф — <pq — фц0) « • /Сцо ~J- J—'Q " L k sin <p0 + sin (фо — <p0 — фц0). k зшфц0 + sin фцр cos (ф — 2y0 — фц0) — (1 — Щ sin (f0 — ф)соз f0 (1 — £2) cos tp0 X [+k sin f0 sin (фо—fo— фцо)— cos (Фо—Уо—фцо) Vl — № sin2 fQ 1 +k sin f0 sin (Ф—fo — фцо) — cos (Ф— fo — фцо) Kl— £2sin2 f0 _ D sin фц0 [k + cos (фо — 2fo — фцо)] ° (1—fe2)cosfo 38 0 /
Время полета перехватчика по кинематической траектории от точки (Яо, zо) до точки (х, z) t-- Da 'k sin <p0 + sin (ф — y0 — фио)"1^!-1 k sin <pq + sin (ф0 — y0— фц0)_ va (1—Щ cos <po X \k cos (ф 2cp0 — фц0] x X X 1 + k sin <p0 sin (фр Уо фцр) ~ COS (ф0—90—фцр) —■ к2 sin2 у0 1 + & sin у0 sin (ф — y0— фц0) —cos (ф— у0—фцо) 1/^1 — sin2 у0 — k — — cos(*0 — 2ср — Фц0)} при k2 sin2 ср0 < 1; Dq (к siny0 + Sin (фр — yp— фцр) vu (1 — №) cos y0 { k sin cpo + sin (ф — y0 — фц0) (1.87) [ k-\- c os( ф 2^f 0—ф„0)) X X exp 2 cos y0 Уk2 sin2 y0— 1 arctg • k sin y0 tg Ф — Уо — ФцО 2 •arctg t = -1 — [ 1 +sin (K + To - ’Ко)] exp \ У № sin2 y0 — 1 У k2 Sin2 (fg 1 I — — COS (Фо — 2cp0 — Ф, Ц0 при &2sin2cp0> 1; (1.88) -*cos»0te(f+fcfcfe)' X 2.8 (3“ +♦-»-+») , 2 k cos уо k2cos2 уо k3 cos3 уд X x X exp JCOSfttg ^ + tzl!L=±» l+tg2 (Зп , Фо—УО—фцо) 2 tg (Зп _ Фо — Уо— Фцо) , 2 ( 4 1 2 J .4 + 2 1 - к cos уо X exp k cos у,, tg 'Зя ( 4 к2 cos2 уд 1 Фо — Уо — фцо \ " 2 1. 1 к3 cos3 уо ) X при k2 sin2 cp0 = 1. (1.89) Угловая скорость вращения линии «перехватчик—цель» о)л = ф=ф0 # sin уд + sin (фр — ш0 — фц0) ~\mi 2 к sin у0 + sin (ф — уо — фц0) . X X 1 + k sin Уо sin (ф —Уо — фц0) — cos (ф — Уо — фцр) У1 — &2 Sin2 yQ т> 1 + k sin уд sin (фо— уо — фц0) — cos (ф0 — у0— фц0) У\ — к2 sin2 у0 при ^asin2cp0< 1; (1.90) 39
X exp = Ф=Фо 4k cos <po k sin <p0 + sin (ф —cop — фц0) k sin f0 + sin (ф0 — <p0 — ?ц0). 'X У № sin2 <pg — 1 k sin <p0 tg -arctg arctg £sin<j>0tg 4 — ?o — ФдО — l У № sin2 <p0 — 1 4o — ?Q — ФцО 1 У № sin2 <ро — 1 при k2 sin2 ф0> 1. (1.91) Расстояние перехватчика от начала прямоугольной системы координат Dn = V^+Р, (1.92) где координаты перехватчика х, z вычисляются по формулам (1.85) или (1. 86). 3. Связь элементов кинематической траектории пере¬ хватчика в полярной и прямоугольной системах координат имеет вид <7 = я + '1» —(р0 — фц0; (1.93) D0 = V{x0 — xn0f + (z0 — za0f. (1.94) 4. Радиус кривизны кинематической траектории пере¬ хватчика г и потребная для полета по кривой с постоянным пеленгом перегрузка пПотр определяется следующими фор¬ мулами: ^ kD _ kDo / jfe sin <fo — sin^yn—1 &sincp0— sin q k sin fg — sin 9 \k sin tp0— sin q0) У / 1— k sin tpo sin ^0+ cos qoy 1 — № sin2 tp0\” 1 — k sin cpo sin q + cos g У1 — № sin2 tp0 / при sin2 cp0 1; „ __ kDp sin g0 — sin q0) (k sin <p0 — sin q)2 Xexp arctg 4k cos tpo jfe2 s in2 <p0 — 1 \ <7o k sintpotg-^ — 1 уk2 sin2 cpg 1 arctg k sin ?0 tg — — 1 У № sin2 <p0 — 1 при £2sm2cp0> 1; (1.95) (1.96) 40
(1 - Sin4fj) exp f*cos<p„ Гtg f 4 + -f) - tg + f (1 — sin q)2 ( '" “ l 4 2 при &2sin2cp0=l, где mx определяется формулой (1.77). 1/2 gof ’ П потр (1.97) (1.98) 5. Параметры движения в момент встречи перехватчика с целью (D = 0, х — хц, z = z4) представляются сле¬ дующими выражениями: Время перехвата _£>о cos (^о у0) k _Р0 cos (4iq — 2у0 — фцр) — k (1 — №) cos f0 при (1 — №) cos <p0 !sina<p0 ф 1; ;i.99) : — (1 — sin q0) X 2 v„ X [‘Mf+f) Чт+i) 1 2 k cos fo &2 cos2 <fQ A3 cos3 <(>o При ^2sinacp0=l. (1. 100) Квадрат рубежа перехвата Rl = xlo + 4о - 2D0 **7** + **?inV № ~ cos {q0 - ?„)] + (1 — №) COS а о Dp [k— cos (go — Уо)]2 (1 — £2) cos2 <p0 Координаты перехватчика v — v- _ n cos tuo [k — cos (y0 — <Pq)|. лк ^цО •Ly0 /л uo\ ~ ’ (1 — &2) COS cpQ sin фц0 [Д; — cos(?o — 9q)] . (1 — £2) cos tpo Зя ”F — z —D c ^UO ^0 ?K = при &2sin2 cp0> 1. ;i. ioi) (1. 102) (1. 103) 6. Зона возможных атак по перегрузке. Граница зоны возможных атак по перегрузке (см. табл. 1.1) опреде¬ ляется уравнением оОц (k sin <f0 — sin q) ё0пзал ^rp = - (1. 104) 41
1.5. МЕТОД ТРЕХ ТОЧЕК Методом трех точек называется такой метод наведения, при котором перехватчик в любой момент времени находится на прямой, соединяющей центр наведения с целью. Уравнения ме¬ тода наведения даны в табл. 1.9. Предполагается, что центр наведения неподвижен. 1.5.1. Графическое построение кинематической траектории метода трех точек Пусть цель движется равномерно со скоростью vn. Траекто¬ рия цели (Ц) разбивается на равные участки Ц0Ц1 = ЦХЦ2 = = ^2-^3 At, где At — выбранный интервал времени (рис. 1. 15). Счи¬ тается, что центр наведе¬ ния находится в точке О. Через центр наведения и точки Ц0, Ц1, Ц2,... про¬ водятся прямые ОЦ0, ОЦ1, ОЦ2,... Предпола¬ гается для простоты, что ■ перехватчик в начальный момент времени нахо¬ дится в точке П0, совпа¬ дающей с центром наве¬ дения. Далее определяет¬ ся пересечение прямой ОЦ\ с окружностью ра¬ диуса vAt и с центром в точке По и т. д. Лома- траекторию метода трех Рис. 1. 15. Графическое построение кинема¬ тической траектории по методу трех точек ная ПоП\П2 точек. при At—И) дает 1.5.2. Уравнения движения и метода наведения трех точек Пусть цель движется произвольно со скоростью оц и повора¬ чивается с угловой скоростью соц, положительное направление которой показано на рис. 1.16. Положения перехватчика и цели в прямоугольной системе координат Oxz, начало которой находится в центре наведения, а оси ориентированы произвольно и определяются координатами (х, z) и (хц, 2Ц), соответственно. Положение перехватчика отно¬ сительно цели в полярной системе координат UDq, полюс кото¬ рой связан с целью, определяется расстоянием D между целью и перехватчиком и курсовым углом цели q, определяющим угло¬ 42
вое положение перехватчика относительно вектора скорости цели. Ориентация векторов скорости перехватчика v и цели vn в прямоугольной системе координат Oxz дается углами тр и ор>ц между осью Ох и соответствующим вектором v или уц. Ориента¬ ция вектора скорости перехватчика v в полярной системе коор¬ динат дается углом пеленга цели <р — между линией «перехват¬ чик—цель» и вектором скорости V. Рис. 1. 16. Элементы кинематической траектории для метода трех точек Кроме того, вводится еше одна прямоугольная система коор¬ динат OxiZi, начало которой также находится в центре наведе¬ ния О, ось Ох 1 перпендикулярна вектору скорости цели v4, а ось Oz\ параллельна ему. Координаты перехватчика и цели в этой системе обозначены индексом «1»: X\, Z\, Хщ, 2щ. Вводятся две величины: Dn — расстояние от центра наведе¬ ния до перехватчика и Д, — расстояние от центра наведения до цели. Уравнения движения перехватчика и цели и условия полета перехватчика по методу трех точек, записанные в векторной форме, а также в проекциях на оси обеих прямоугольных и по¬ лярной систем координат, приведены в табл. 1.9. Начальные условия. При ^ = 0 заданы следующие коор¬ динаты: 43
Таблица 1.9 Уравнения движения Уравнения метода наведения Векторная форма v0TH = V — vu — й)ц X D VXD„-V,XD„ = 0 Прямоугольная система координат Oxz ЛГц = иц cos фц •гц = va sin фц X = V COS ф г = v sin ф X 2 ЛГц Z ц Прямоугольная система координат Охчг 1 х\ д — 0 гТц= [il = i/sin (фц —ф) zx = V cos (фц —- ф) X\ Zl -^1ц z1ц Полярная систе¬ ма координат D — — v cos ср — t/u cos q t/ц sin q — v sin <p 9 — jj + “u t/ц sin q — v sin у p D i= t/u sin q n v sin cp Du D„ — в прямоугольной системе -^ц(^) -^цО» *^(^) -^0’ ^•ц(^)==~цо» ^(0) = zcJ — в полярной системе D(O)=D0- q(0)=qo. В этот же момент времени углы фо и срс определяются соот¬ ношениями Фо — Фцо “Ь То “I- Яо ~ п‘* tp0 = arcsin (4- sin^0] . \ k -^цО 1 Добавив к этим условиям законы изменения скорости дели ац(0, скорости перехватчика v(t), курса цели фц(П или угловой скорости вращения вектора скорости цели соц(^), получим замк¬ нутую систему дифференциальных уравнений как в прямоуголь¬ ных, так и в полярных координатах. 44
1.5. 3. Решение уравнений движения при перехвате по методу трех точек прямолинейно и равномерно летящей цели (®ц=0, o4=const) и постоянной скорости перехватчика (u = const) Пусть цель движется прямолинейно (соц = 0, ip4=const) и рав¬ номерно (уц = const), а перехватчик летит с постоянной ско¬ ростью V. Решение уравнений движения в этих условиях для прямоугольных систем координат Oxz и Ox\Z\, а также некото¬ рые характеристики кинематической траектории и зоны возмож¬ ных атак перехватчика приведены ниже. 1. Решение уравнений движения в прямоугольной си¬ стеме координат дается следующими формулами. Координаты цели -*ш = *т<>; •г'ш = 2'то + ‘КЛ (1.105) Координаты перехватчика х 1 = 1 / *10 - fotao У sin лф у sin Дф0 cos Дф0 cos Дф 1/^sin Дфо УвшДф ^ kxmo Vs<n АФ [F (Дф0) - F (Дф)]; (1. 106) I х10 — kxiuQ cos Аф0 I cos Дф cos Аф0 \ 1 10 УэтДфо уУвшДф УвтДфо/ jcm —'kxin0 cos Дфо i кхш cos Д<1; У sin Дфо или в системе Oxyz 2 У sin Дф \F (Дф0) F (Дф)] “Ь кХШ (Дф0)~~ F (Дф)]2 х:=^ gin фц0 % cos фц0; г=—хг cos фц0 + zx sin фц0, (1.107) (1. 108) где УдО Фо» F / я W ’ A^ = tu0 — ф; Афо = фц F (Ц>) —У 2 F , arccos"j/sin Дф^ — — 2 У”2 Е , arccos Ysin дф j ; arccos V^sin дф^ —- эллиптический интеграл первого рода / с модулем -j- и аргументом arccos y^sin дф; 45
Е , arccos l/"sin —эллиптический интеграл второго рода с модулем и аргумен¬ том arccos j/sin дф. Время полета перехватчика по кинематической траектории от точки (х0, z0) до точки (х, z) (=■ *то 1 т/4 У si in Афр \ Аф / + + ^ (Аф)~ F (Аф0)] - - sin q0 (ctg <70 - ctg ?). (1. 109) Угловая скорость вращения линии «перехватчик—цель» (или линии «центр наведения—перехватчик», или «центр наведения— цель») = —X X 1ц0 X 1+ sin Дфо sin Дф I kxlUQ Хт )2 10 созД^--?^—^°[Д(Дф0)-Д(Дф)] (1.110) Расстояние от центра наведения до перехватчика Dn = Xluol/ 1 + Го—Г,1' •' 'л ,• — k C0S АФо 1 | *10 . № sin Дф0 sin Дф [jfiuo kYs'll^ [У(Аф0-^(Аф)]1 . (1.111) Расстояние от центра наведения до цели л/Щ-\^_к /зТШ, У sin Дф0 (хщо — [F (дb0)-F (Д<|>)]| X Ml — Х1и0 cos Дфо cos Дф У sin Дф0 У sin Дф X 1 + 1 ■*го № sin Дфо sin Дф (jCiuo кУsin Д(ро — ^COS Д<|*0 — [У(Д^о)-^ (ДФ)] (1.112) Значения функции У(Дф) приведены в табл. 1.10 и на рис. 1. 17. 46
2. Связь элементов кинематической траектории пере¬ хватчика в полярной и прямоугольной системах координат имеет вид: sin q = *•»• 1 (' -* C0S +*с« Afc+ У sin Дф0 ( у sin Дф хт +—/sin дф0 /(дф,,)-/7 (дф)] X X 1 + I *10 №■ sin Дф0 sin Дф 1д:1цо k / sin Дфо • k COS Дф„ - / (Дф0) — F (Дф)] (1.113) Зависимость между углами y-\-q=n /ф— фц; (1.114) ctg <р = ^cos Дф — k — j cosec дф; (1.115) ctg q=(cos Дф— — —) cosec Дф V k x\ц/ sin Афо/ 1 ?JCXo — ‘-42—cos дф0) cosec дф0+ sin Дф \ & лг1ц0 [/7(дФ)-^'(АФо)]; (i.ii6) 2 У sin Дф sin <7=11 1 *10 1 з!пДфовтДф kx 2ц0 -cos Дф0 — ф) 7 ф 1 I 1 1 j 7 <7 7 90! ’0 Я 0 & / 1 1 1 1 7 /sin Дф0 {F (Дф0) — -Z7 (Дф))]! (1.117) 3. Радиус кривизны кинемати¬ ческой траектории перехватчика г и по¬ требная для полета по кинематиче¬ ской траектории метода трех точек пе¬ регрузка «потр определяются следую¬ щими формулами: ^1ц0 ctg Аф Рис. 1. 17. График функции F (Дф) = я Т’ =/2Д( arccos У sin Дф) — — 2/2£| 2 /sin Дф f £10 ъ j cos Афр 1 *1ц0 /sin Дфо l /sin Д<1 л; Т’ arccos /sin Дф ) cos Дф Дфо /sin Дф --g-t/^сдфо) —^(Лф)][; V2 ^потр gor (1.118) (1.119) 47
<3 а* а 2 К *Э- I со СО 1 <1 =г £ , >> в- ST СЗ X СО V + ft, II 1,3585 см со ю СМ г-н О ТЧ С"- 00 —< ю см 03 ф ф ф оо оо ю см Ю со со ю со ф СО 03 о со СО ф ф ф см й LO CM Ф ф Ф CM Ф CM Ф 00 0 Ф о ф см ф ю Ю СО Ф со см см ~ 1 о 0 0 0 о 1 o' 1 0" 1 1 Ю со со оо о со СО со ,7124 ,3192 ф 0 LQ 0 со см Ю со 40 ф 03 СО со ф 40 со со со ф {2 ф со со ф СО о со Ф см 0 Ф CM Ф Ф oo CO со 00 чф со оо 40 40 0 00 ф со СО см о о о о о о 0 1 0 1 0 1 о" 1 о 1 о 1 о 03 со см ,2710 —' со СО со —ч ф 00 ю ю со Ф со ю со см СО о см см см о ф 40 0 Ю "si4 ф LO со со CM 00 s? 40 40 00 40 со Й CO 03 S г- о ф со оо оз оо см о о о о о о 0 1 0 1 о 1 0 1 0" 1 0" 1 о 1 о" 1 о 1 ф ф 03 со см см ф оо Ф 1_о О —1 Ф ю 03 40 см ф ф со см 03 СО Оз ф см ф 03 ф оз LO со ф ф 40 00 00 CO CO LO 03 оз 40 0 0 0 Ф 0 чф см о со СО 40 ф см см о о 1 ? 7 о 1 о 1 о 1 0 1 о 1 о 1 0 1 0 1 7 7 7 7 7 о о о . о ^ G) N s о СО СО 03 CNJ ' 4 ' ' о ^ 'Ф С7, ^ СМ СМ СМ СМ сч г-ч to ю — ф СО ь- 1C СО ГН й S Й ^ 'О СМ^ <М см со СО 00 03 о 00 ф со ф $$ С> 03 О г-1 CM LO ® О) со ю О) N 00 ^ S9 ф чэ оз ф о Ь- ю ОЗ Ф со ^ о UO q ts N ® [О S ^ СО “ ° ® ® « N N (О (О S з С^ CN ,—| —, ,—, , Г __Г Г Ф оо О ф ф ь- ^ Ю СО '" со со 3 о Ф со о 03 ОЗ ф со lo оз со Ф ф i_0 О СО 03 ф о ф ^н оз LO —* ф со со N Ю ^ ^ со ю со СО СО СМ СО со оз СО со ОО ф СМ СО со СМ оз - Ф <N О ^ оз со оз о - ~ ’—1 со 03 Ю со Is* СО lO ^ ^ Tf «cocj)e\icNic^e^(Ncsr я ® 01 00 N О N СО 03 N О ф С^. о» 03^ оз N оз —ч 03 00 03 СО со ф ф ю N N СО Ж 2fc;2'St°oio.-, Ф WSflONiOOCOrt СМ '—1 СО СО 1—1 О СО 00 о со СО Ю Т 1 ^ ^ СО со +. ft, . II Со I оо ф 5 LO со о 40 со см ф LO со СО СО со со ф со ф оз о ф 40 СО СО ф о оо со оо ф й LO Ю 00 00 со 40 см 40 03 о со ф со о ю см 03 ф см оз ф о ф СО 03 со Оз" ф~ со ю ф ф ф со со см см" Г-Г -Г чГ о о Ф о оо 03 l'- со о 40 о 03 оз 03 оо оо ч-1 — •—4 гН Г-н _с Г-, N со со N со ю 03 со со 03 N со СО ю см со ,-н о о ! со ф со ф со ф со ф оо о ф оо со ф_ ф ф1 о о о о СМ СО ф iO СО N со оз О ю о ю о ю о ю см см со со ф ^ 48
сч сч 00 00 со СО сч о со со ф о о сч о 05 сч ю ю ,—I ю со оо 1—1 о ф о 05 со СО сч 05 со сч СО сч 05 to 05 сч сч г—1 05 г- ю со о со 00 оо 05 о со со ф сч ю 05 г-н со СО ф ю ю со со 05 о о сч со ю со 05 1—< со ю 05 со со О 1 о 1 о 1 о ! о 1 о 1 о 1 о 1 т—4 1 7 7 7 7 7 7 7 7 сч I сч 1 сч ! сч 1 7 со 1 г-н ю о ю ю сч ф со Г"~* 05 со сч СО ю 05 ф т—Н о 05 СО h- 05 сч ф о оо со со 05 сч со 05 со 05 сч со оо 05 1-- сч СЧ <75 СО 7—Н 05 со ф со сч сч СО ю 05 ф сч сч со со оо СО со t'- Г- со 05 о о т—1 сч СО ф ю со со 05 т—1 со Ю со со оо ф о 1 о ] о 1 о 1 7 7 7 7 7 7 7 7 7 7 7 сч 1 сч 1 <■4 1 сч 1 со 1 со 1 со ! ф 1 г-1 со со , о СО ф о со ю ю СО т—Н сч сч со со 05 со сч со со 05 Г"- со 05 ф СО со 05 со ф со со h- г- СО со со СО ю (74 ОО сч 05 I"- ю со сч сч со ф h- ю СО СЧ ф со 05 О О СЧ сч СО ф ю со оо 05 о сч со «О со со со ’~н t'- о 1 7 7 7 7 7 7 7 7 7 7 7 7 сч 1 сч 1 сч 1 сч 1 7 со 1 со 1 СО 1 ф 1 ф 1 ф сч 00 со о 05 сч СО сч сч ф ф сч сч 05 05 СО со со СО со оч о ф СО со СО 00 05 Of) со со со ю со 05 сч 05 с.ч (ф Г-Н 1> СО 05 Ю со ю со 1—1 о о Г-Н со со Г-Н оо h- 05 Г'- г- г- СО сч со СО Ф ю Ю со со 05 С_5 Г-Н сч со ю со оо о со о t£ J сч 7 7 7 7 7 7 7 I—1 1 7 7 сч I сч 1 сч 1 сч I сч I сч сч 1 со 1 со 1 7 ■ф 1 ф 1 7 со со сч со оо сч г—1 о Ю ф сч 05 ф СО СО г—1 СО оо со to ю СО ю сч сч оо 05 СО о со 05 сч СО ф со 05 05 05 [>• сч со СО а) ф о со СО г—1 о 05 05 о сч ю а> оо 05 сч ю ф Ю ю со с-~ со 05 о о 1—1 со ф ю оо о со to 05 СО оо ю 7 7 7 7 т—н 1 7 7 7 7 7 7 сч 1 сч 1 сч 1 сч 1 7 СО 1 со 1 со 1 со 1 ф 1 ф 1 7 со ю со ю 05 сч со со со со s> ю СО со сч о ф 05 05 ф ю ф со 00 сч ф ю ь- со сч GO о со со ф <75 сч СО ь> СМ h- со 05 со со сч сч ю 05 ю со со со h- ф 05 ю с- оо СО 05 05 о сч со ф ю со t- 05 со to оо сч со 7—1 05 Г—Н 1 7 7 7 т—1 1 7 7 сч 1 7 7 сч 1 сч 1 сч 1 сч I сч 1 7 СО 1 СО 1 СО 1 Ф4 ! Ф4 1 ю ] 7 СЧ 05 05 со о 05 05 сч со ф сч 05 Г"- со о ю оо СО о 05 СО ю СО со сч о ю со оо 05 СО СО ф ю оо сч ю оо со О оо о t"- ю ю Ю с- о ю со со со со со to ф^ с— СО ф Ф ю ю ю со &> i>- 00 05 о т—( со ф со 00 о со со о ю 1 о СЧ~ ! 7 сч 1 сч 1 7 'Ч 1 7 сч 1 7 сч 1 со 1 со 1 7 7 со 1 со 1 ф 1 ф 1 ф 1 ю 1 to 1 со 1 1 О 05 ю оо ю 05 о со сч со со ю со Ф4 сч оо ф со ф со 1C .5 со ф 05 о ю со со h- о со 05 ф ф о со СО сч со ф со о ю о 05 о со оо со со 05 оо 05 05 со ю со 05 Г7- оо 00 05 о о сч СО ф со 00 о со со о to 05 05 со 1 со 1 со ] 7 со 1 со 1 со 1 7 ф 1 ф 1 ф 7 ф 1 ф 1 т ф 1 ю 1 ю 1 ю 1 со 1 СО 1 7 7 оо 1 ф сч ф со 00 сч f—н о т—н сч 00 со ф сч ф t- 05 сч со 05 ю 05 со со оо о со СО о Ь- со со о оо со со 05 05 о сч 05 СО ю со СО со о 00 Ь- со СО to со 05 со о 1Ф о оо ю со to ф- со сч 1—Н о о о 1—1 сч со ф ю ,со 05 г-Н сч ю о о о o' о о о о о о о о о о о о o' о 1 1ф1 сч ю ф сч сч со ю оо о о о оо ю оо сч сч ф ю г-н о о у—, со сч 05 Г-н 05 ф о СО о t-- со о ф 05 05 ф со ф со со 05 сч ф со оо о со со ф сч 05 со ф о оо ф о со СО ю ю ф со СЧ 7—1 о о о 7-4 сч со ф to ю СО t- оо оо 05 о о 7 о 1 о ] о 1 о 1 о ! о 1 о J о о о о о о о о о о о о о о to о ю о to о to о to о to о ю о ю о to о ю о ю о to to со СО оо 00 05 05 о О Г-Н сч сч со г-н со ф ф 1—1 to ю со 49
Продолжение + + -Э- IV + CO oo ю о CO CO 1“H О 00 4 CO о Ю Ф 1—4 CO CO 05 Ю tO t'H Ю C"- Ю 1—4 О CO LQ o' 11 Ю '“l 05 GO 05 CO LQ о 05_ О CO CO Ф Ю ьГ 05 T-* Ю* О Ai 7 7 7 1 ■ч 1 7 *—» i i-H 1 CM 1 cm 1 CO 1 Ф CO LQ Ф Ю Ф Ю oo 05 CO t". (M <M Ю LQ CO & OO Ю 05 oo CO 00 CO о 05 о CO CO OO oo* r—« 1—4 (Гн Ю Ф 1>- 05 О со S ф 05 lO СО со со о ф о <М 8 СО со ф ф со С''. ю 05 05 о 1—4 CO CO CO r7‘ rr* r-** r_H1 <M ю I СМ 05 СО м t>. I !>■ CM t'H CO tO 05 OO LQ 05 О <м см 3 CO CO CO CO ф 04 05 К r—4 (M с-н to •* •* о cm* Ф LO oo 05 Ф i—4 i—4 см I I I <M CO CM CO* I t>. О Ф 05 CM о со о о 05 1—-4 ф со 00 со 05 о to 1—4 to о см ф 05 со со CO Ф s Й со <М^ ф см со • о о 1—4 со to 05 tHi 00 05 05 1—4 г~* г-Н см О см CO О co^ oo i 00 Ф 05 CO OO I О Ю CO Ф CM 05 OO CO CO CO 05 05 00 CM CO Ф со о о CM 00 СО ф Ю м о ф СО S ю 05 ts. оо о> со о со о оо ю 05 LQ о о в to о 05 ю ф со 00 о СМ ф о. о о т—* со ф снГ о АС ! со 1 05 1 1 4 1 1 4 1 т—4 1 7 г—4 1 т-Н 1 7 СО 1 <М ф СО см *>. со ю С"- оо *—4 со о о со о to со ю со со о о т—4 ф 00 со о о ф о оо ф оо СМ о со LQ 11 СО •1 ж - о 1—4 1—4 см СО ю Сн о ф ю ' 1 т-Н 1 7 1—н 1 7 7 7 г-Н 1 см 1 СМ г СО 1 LQ ф о СО о ф 00 с^. об оо СО оо СО со (М со ОО со ф С"- СО СО ф о 05 СО ю оо ю 05 Ю СО to to СО <М 1 7 СО 1 ф 1 f ф f со 1 ьГ 1 f 7 /—ч о СО со СО 05 оо о t-H о ■Э- 05 05 СО со 05 lO о ю о СО < о ф lO со СО ф оо со 05 05 05 т—4 г-н Ч, ГН* г-Н 1—4 г—4 т-4 гН V ^н г—4 1-1 < СО ю о СМ со ф to СО oo ъ § СО tTH !>• г-н гН 50
4. Параметры движения в момент встречи перехватчика с целью (П = 0, х=хц, г = гц) представляются сле¬ дующими выражениями. Угол Дфк определяется из решения трансцендентного урав¬ нения где SAk, дфк)=-Мт^, ’ V kxm ) 1 cos Дфк— — SAK Дфк)=2 ——==Д-+Д(дфк); У s in Дфк cos Дф0- *10 4w- **)-г-ржж“+'(4« Дфк = фк — фцо- (1. 120) (1.121) (1.122) (1.123) Для решения уравнений (1.120) целесообразно использовать графики на рис. 1. 18 и 1. 19 или табл. 1. 10. Последовательность определения величины Дфк следующая. По заданным начальным условиям Хю, Хщ0, k, Дф0 с помощью графика на рис. 1. 18 нахо¬ дится величина 5ко- Эта же величина более точно может быть вычислена с помощью табл. 1.10. Для этого сначала для задан¬ ных значений Дф0 и k находят в таблице величины S и 5К (точки, попадающие в интервал между заданными в таблице значе¬ ниями Дф или k, вычисляются посредством линейной интерполя¬ ции). Затем, вычислив разность AS=SK—S, умножают ее на начальное значение ХшАДцо: Д^ Хю • Найденное значение *1ц0 AS-10 ■ прибавляют к величине 5К, что дает значение Sk0: *^1д0 «5ко=5к+Д5 (хюДщо) • Для вычисленной величины SK0 и задан¬ ного значения к по графику на рис. 1. 19 находится первое при¬ ближение величины Дфк. Значение величины Дф„ далее уточ¬ няется с помощью табл. 1. 10. Для этого находят в таблице для заданного значения k такую величину SK, которая равна SK0 (если надо, производят линейное интерполирование). Величина Дф, соответствующая этому значению 5к=5к0, и есть Дфк. Пример 3. Перехватчик, летящий со скоростью и=480 л«/се/с, наводится на цель, прямолинейно летящую со скоростью цц=400 м/сек (k=\, 2). Найти угол Дфк в момент встречи перехватчика с целью, если в начальный момент времени задано: Дфо=60°, *т/*що=0,12. Сначала определяется величина SK0: по графику на рис. 1. 18 величина SKO=0,35; по табл. 1.10: для k—1,1 и Дф0 = 60° 5К = —1,3904; для 6=1,3 и Дф0=60° 5„ =—1,0898. После линейной интерполяции для 6=1,2 и Дф0=60° величина S„=—1,2401. 51
Рис. 1. 18. График функции ( X ' cos Дфо 5К0 (ДФО, —) = ^ (ДФ) + 2 52
Рис. 1. 19. График для определения значения угла Дг]з„ в момент встречи перехватчика с целью 53
Для Дг|5О=60° получим S=0,5634. Отсюда Д5=5К—S=—1,2401—0,5634= =—1,8035. Величина AS(Xi0/*mo) =—1,8035x0,12=—0,2164. Тогда SKo=SK + +AS (JCjo/хщо) =0,5634—0,2164=0,3470. Затем находится величина Дфк по известным значениям Sk=Sko и к: по графику на рис. 1. 19 величина Aij)K^20,5; по табл. 1. 10 для к= 1,1 и Дф=2° величина 5К=—0,2269; для £=1,3 и Дф=2° величина 5К=1,2710; для £=1,1 и Дя|)=3° величина S„=—0,4074; для £=1,3 и Дф=3° величина S„=0,8161. С по¬ мощью линейной интерполяции для £=1,2 и Дф=2° величина 5К вычисляется и равна SK—0,6220; для £=1,2 и Дф=3° величина 5К=0,2043. Теперь легко найти величину Дфк, соответствующую значениям £=1,2 и SK0=0,3470. Путем линейной интерполяции эта величина Дфк вычисляется и равна Д'фк;»20,55. Курсовой угол цели и пеленг цели (рис. 1.20): <7к— arcctg ^ctg ДФК Тк — arcctg (^ctg Афк £ sin J V in Дфк / К (1. 124) (1. 125) 54 sin Дф,
Рис. 1.21. График функции X = ctg АФК — k sin Дфк 55
График функций qK и <рк приведен на рис. 1. 20. Координаты перехватчика и цели: х 1Ц.К ' :Х,„ = Х 1н0* "1ц. к — Z,.. = X, 1ц0 ' k cos Дфк — 1 (1. 126) k sin Дфк График функции \(k, Афк) из рис. 1.21. = хишА (&, Д<ЬК). (1.126) представлен на / / iX15пасть Возможного перехвата Время перехвата £>до sin q0 (ctg <70 —ctg qK) = X\цО X X (ctg Дф0— ctg Дфк - •*10 . k sin Дфк Рубеж перехвата kx1IiQ sin Дф0 (1. 127) AT •*1ц0 0,5 k sin Дфк V'+k2- Рис. 1.22. Область возможного перехвата по начальному углу Дфо* и отношению скоростей k для метода трех точек 2k COS Дбк. (1.128) 5. Зона возможных атак по скорости. При скорости перехватчика, большей скорости большей цели (&>1), зона возможных атак по скорости (см. табл. 1.1) пред¬ ставляет всю плоскость наведения. При скорости перехватчика, меньшей или равной скорости цели (£г^1), зона возможных атак по скорости ограничена. Область начальных углов Афд, с которыми перехватчик начинает движение и встречается с целью, определяется уравнением k cos Дфц — 2 -*!п0 +X(Afo)=/X£) + 2 • (1Л29) У sin Дфд k yf 1 — &2 На рис. 1.22 изображена область возможного перехвата по начальным углам Аф^ и отношению скоростей k. Значения на¬ чальных углов Лф*, соответствующие уравнению (1.129), при¬ ведены в табл. 1.11. 56
6. Зона возможных атак по перегрузке. Граница зоны возможных атак по перегрузке (см. табл. 1.1) определяется уравнением = 1 k При ц /гр cos q sm q \ 2 1 + 1 cos q gu«3a;.A.. v 2vvu ■ sin q —1 . (1.130) ^ГО^зад^ц 2vv ■ sin q a D <^1 вид граничной кривой упрощается: k D ц /гр sin q (1.130') Рис. 1.23. Приближенная зона возможных атак по перегрузке для метода трех точек Эта приближенная зона возможных атак по перегрузке при¬ ведена на рис. 1.23 для значений курсовых углов цели 0°^9^180°. Зона возможных атак на рис. 1.23 построена в ко- 57
ординатах q, (■ ) , т. е. лучам, проведенным из точки Ц, соот- ветствуют значения отношения расстояния между перехватчи¬ ком и целью к расстоянию от центра наведения до цели. Лучи проводятся под углами, равными соответствующим значениям курсовых углов цели q. При этом значениям курсового угла цели 0^9^180° соответствует расположение перехватчика, цели и центра наведения, приведенное на рис. 1.16; значениям угла Рис. 1.24. Возможные поло¬ жения перехватчика и дели относительно центра наведе¬ ния 180° eg; <7 ^360° соответствует следующее взаимное положение центра наведения, перехватчика и цели: — цель и перехватчик находятся по разные стороны от центра наведения (рис. 1.24,а); — цель находится между перехватчиком и центром наведе¬ ния (рис. 1. 24, б). Размеры зоны возможных атак по перегрузке приведены в табл. 1. 12. Таблица 1.12 Значение отношения скоростей Положение цели и перехватчика относительно центра наведения Зона возможных атак /г> 1 (tl>° Вся плоскость наведе¬ ния (аг1<0 Часть плоскости наве¬ дения, ограниченная кри¬ вой (1.130) k < 1 (—) >0 V £>ц /гр V Оц /Гр ^ 58
Следует отметить, что часть зоны возможных атак по пере¬ грузке при k<\ и (—) >0, представляющая область плоско- \Du /гр сти наведения, ограниченной кривой (1.130), находится внутри зоны невозможных атак по скорости, т. е. кривая (1.130) на рис. 1.23 служит границей между: — областью, где перехват невозможен из-за недостатка у перехватчика перегрузок для полета по кинематической траек¬ тории; — областью, где перехват невозможен из-за превышения скорости цели над скоростью перехватчика (перехватчик отстает от цели и не может догнать ее). 1.5.4. Решение уравнений движения при перехвате по методу трех точек прямолинейно и равномерно летящей цели (соц=0, n4=const) и переменной скорости перехватчика (t»=var) Пусть цель движется прямолинейно (сод=0; aK,=const) и рав¬ номерно (»4=const). Перехватчик движется с переменной ско¬ ростью (u=var). Решение уравнений движения в этих условиях в прямоугольной системе координат Oxz для степенного закона v=xzn изменения скорости перехватчика дается ниже. Координата г(ф) перехватчика определяется для различных значений показателя степени п по табл. 1.13. Координата х пере¬ хватчика находится по формуле Ф х=х0 Чг f Z(£)ctg2^ Чц09 - X п — 2 J г/ц (я—2) Ф О Xf *“(*) — л, (1.131) J [sin? Фо где z(£) и п определяются по табл. 1. 13, а интегралы вычис¬ ляются каким-либо приближенным способом. Таблица 1.13 П оказатель степени п ?акон из¬ менения скорости V**Y.Zn Координата z (|») 3 2 3 О V = Х2 f s in ф у 1 Х*о(Ф-Фо) Г2 \sin ф0 / _ sin 5 3 5_ V = %zz ( sin ф ^ \Sin Фо / 3 2 ~ 3 z0 __ 3 2x^0 1 2 — sin2 ф0 (cos фо — cos Ф) VU 59
Продолжение Показатель степени Закон из¬ менения скор ости vr=xzn Координата 0(А) sin <|; \4 sin 'i'o ■ г 3xz0 . „ , ( 1 , 1 , _ зшзфо sin 2ф + “ sin 2^0j j v = хг sin Ф \6 sin ф0 “Г 4хго sin4 ф0 (cos ф — cos фд + + COS3 ф 3 Y ■ -^-cos^oj 1 П_ 6 V = Ъ2 sin ф -ё“ 5х~0 . Р , ( 3 , sin ф0 / 0 vu Т0 \ 8 Y 3 1 1 — to— "т- sin + "Гsin 2to + о 4 4 + _32 Si" 44'~ ^"sin4to г; = xz 60
о Продолжение Показатель степени п Закон из¬ менения скорости v*=>xzn Координата z(<\>) 3 V = %23 sin ф0 ..-2 ! xz0 / COS фо COS ф sin ф т иц8ш2ф0\ «-fvl + in .1 sin2<pQ sin2 ф 1 1 2 Примечание. Здесь и = const — коэффициент пропорциональности между координатой и скоростью. 1.6. МЕТОД ПРОПОРЦИОНАЛЬНОГО СБЛИЖЕНИЯ Методом пропорционального сближения называется метод наведения, при котором угловая скорость вращения вектора ско¬ рости перехватчика пропорциональна угловой скорости враще¬ ния линии «перехватчик—цель». Уравнения метода даны в табл. 1.14. Таблица 1.14 Система координат Уравнения движения Уравнения метода наведения Прямоугольная хи = vacos фц гц = уц sin фц х = v cos ф z — v sin ф ф = ри>л Полярная D — — v cos <р — г^ц cos q vn sin q — v sin <p q - D + “д sin q — v sin <p D Ф = Д“ л р — постоянный коэф¬ фициент пропорциональ¬ ности 1.6. 1. Уравнения движения и метода пропорционального сближения Пусть цель движется произвольно со скоростью иц и пово¬ рачивается с угловой скоростью <вц, положительное направление которой показано на рис. 1.25. 61
Положения перехватчика и цели в прямоугольной системе координат Oxz, начало которой находится в произвольной точке О, а оси Ох и Oz ориентированы произвольно, опреде¬ ляются координатами х, z и хц, гц, соответственно. Положение перехватчика относительно цели в полярной системе координат U,Dq, начало которой связано с целью, определяется расстоя¬ нием D между целью и перехватчиком и курсовым углом цели q, задающим угловое положение перехватчика относительно век¬ тора скорости цели. Рис. 1.25. Элементы кинема¬ тической траектории для метода пропорционального сближения Ориентация векторов скорости перехватчика и цели в прямо¬ угольной системе координат Oxz дается углами ip и■ -фц между осью Ох и соответствующим вектором v или v4. Ориентация век¬ тора скорости перехватчика в полярной системе координат дается углом пеленга цели <р — между линией «перехватчик— цель» и вектором скорости уц. Уравнения движения перехватчика и цели и условия полета перехватчика по методу пропорционального сближения, запи¬ санные в проекциях на оси прямоугольной и полярной систем координат, приведены в табл. 1.14. Начальные условия. При t=О заданы координаты: •— в прямоугольной системе хц(0) = лГц0; x(0) = ^0; <КО) = *0; 2'ц(°) = гцо'. z(0)=z0; — в полярной системе D (0) =Z)0; q{0) =q0. Добавив к этим условиям законы изменения скорости цели уц(t), скорости перехватчика v(t), курса цели фц(/) или угло¬ вой скорости вращения вектора скорости цели сод(£), получим замкнутую систему дифференциальных уравнений как в прямо¬ угольных, так и в полярных координатах. 62
1. 6. 2. Решение уравнений движения в полярной системе координат при перехвате по методу пропорционального сближения прямолинейно и равномерно летящей цели (соц=0, zv=const) и постоянной скорости перехватчика (о = const) Пусть цель движется прямолинейно (соц=0; aj)q = const) и равномерно (yq=const). Перехватчик движется также равно¬ мерно (ц = const). Решение уравнений движения в этих усло¬ виях для некоторых значений постоянной р дано ниже. 1. Решение уравнений движения при р = 2 дается следую¬ щими формулами. Расстояние между перехватчиком и целью D=Dn sin tp + k sin (<f — ei) . sin <po + k sin (<fo — £l) 1—ft2 ft!+2ftcos Ei+l X X exp 2£ (9 — ?o) sin Et № + 2k cos ej + 1 (1. 132) где el = % —^fo¬ il. 133) Угловая скорость вращения линии «перехватчик—цель» . = <?= — <Р=. -^7 [sin сро-— A sin (ех — ср0)] kD0 X exp 2k (ft+cos ) 1—ft2 2k (? — To) sin £ l—k2 Ч- x (1.134) 2. Решение уравнений движения при р = 3 дается следую¬ щими формулами. Расстояние между перехватчиком и целью £)—£) | k sin q — sin 2 {q + sp 0 \ k sin q0 — sin 2 (q0 -f ei) _ X П 1 1 ctg— [qi+ ч) — ctg — {q + Sl) ~ " i " ctg — (^oi + ei)—ctg —(^о + е,) где /_i 3 (я — q0) -f фр . 1 2 ’ X —3B{ ctg s, Bt = cos qt cosec2 — (qi + £i) 2 [2 cos 2 {qi + ep — k cos {qt + ei)]* qt — корни уравнения ^sin^-fsin2(9 + £i) = 0. (1.135) (1.136) (1. 137) (1.138) 63
Частный случай. Пусть величина ei = 0. Тогда расстояние между перехватчиком и целью определится по формуле D = Dn 1—k \+k 1 + cos q 2 (ft+2) 1 — cos q 2 (2—k) 1 + cos q0 1 — cos q0 X k — 2 cos q 2 (1— £2) 4—ft2 k — 2 cos q0 ' ' X (1.139) 3. Решение уравнений движения при р = 4 дается следую¬ щими формулами. Расстояние между перехватчиком и целью D =А>[— (sin sin 3 (q + ер + k sin q 3 (?o + £i) + k sin qо X ХП Z = 1 tg(g + El) tg CgQ + Si) tg (4i + El) — tg (<7d + El) AMjk sin £j 3 (1—k COS ) где Л4 =tp — C0S Я1 sec2 (qi + ei) _ 1 ё 2 3 sin (qi + ер + £ cos q-t ’ (1.140) (1.141) <7, —корни уравнения ksinq—cos3(<?-)- s1) = 0. 1.7. МЕТОД ПРЯМОГО НАВЕДЕНИЯ Методом прямого наведения называется метод наведения, при котором вектор скорости перехватчика направлен в некото¬ рую выбранную определенным образом точку М (рис. 1.26). Рис. 1. 26. Элементы кинема¬ тической траектории для метода прямого сближения В частности, эта точка может быть выбрана из условия, опреде¬ ляющего положение перехватчика в некоторый момент времени на расстоянии / относительно цели. Уравнения метода наведения даны в табл. 1. 15. 64
1.7. 1. Графическое построение кинематической траектории метода прямого наведения Пусть цель движется равномерно со скоростью уц. В началь¬ ный момент времени заданы расстояние от цели до перехват¬ чика D0, курсовой угол цели q0, расстояние / и время tM- Траектория цели разбивается на участки Ц0ЦХ = ЦХЦ2 = ... = — v-aht, где At— выбранный интервал времени (рис. 1.27). Под углом q0 к отрезку ЦоЦх через точку Ц0 проводится прямая, на Рис. 1.27. Графическое построение кинематической траектории по методу прямого наведения с 1 sin Ф = sin а. ‘К-д) которой откладывается отрезок Ц0П0 = О0. По формуле 1 smcp0= sm<70 вычисляется значение угла пеленга к{'+^к) цели ф0 в начальный момент времени. Затем через точку Я0 под углом ф0 проводится прямая, на которой откладывается отрезок П0Пи равный по величине vAt. Точки П\ и Цх соединяются. Изме¬ ряется курсовой угол цели qx в точке Цх. По вышеприведенной формуле для этого угла qx вычисляется угол пеленга цели ф! в точке Пх. Далее через точку Пх проводится прямая под углом 3 3398 65
Ф1 к отрезку П1Ц1. На ней откладывается отрезок nln2 = vAt. Точки П2Ц2 соединяются. Затем аналогичное построение произ¬ водится в точках П2, П3, Ломаная, проходящая через точки П0, Пи П2,..., при А^О дает кривую метода прямого наведения. 1.7.2. Уравнения движения и метода прямого наведения Пусть цель движется прямолинейно и равномерно со ско¬ ростью ац (см. рис. 1.26). Положение перехватчика относительно цели в полярной системе координат ЦОд, начало которой свя¬ зано с целью, определяется расстоянием D между перехватчи¬ ком и целью и курсовым углом цели q, определяющим угло¬ вое положение перехватчика относительно вектора скорости цели. Ориентация вектора скорости перехватчика дается углом пеленга цели <р между линией «перехватчик—цель» и вектором скорости v. Ориентация векторов скорости перехватчика и цели в прямоугольной системе координат Oxz дается углами г|; и г|)ц между осью Ох и соответствующим вектором v или уц. Точка М выбирается таким образом, чтобы в тот момент tM, когда цель достигнет точки К, лежащей на продолжении пути перехватчика, перехватчик находился бы в точке М, т. е. рас¬ стояние между перехватчиком и целью в этот момент было бы равным I. Уравнения движения и метода наведения, записанные в про¬ екциях на оси прямоугольной и полярной систем координат, при¬ ведены в табл. 1.15. Таблица 1.15 Система координат Уравнения движения Уравнения метода наведения Прямоугольная xu = uncos4>u iu = t'usin <|/д X = V cos ip Z ~ V sin 1р x — xu х0 — хц0 — lcost); z—zn го — zuo — / sirup Полярная D = — v cos <р — г/ц cos q t/ц sin q — v sin <p 9~ D 1 sin cp = sin q *(•4) 66
1.7.3. Решение уравнений движения в полярной системе координат при перехвате по методу прямого сближения прямолинейно и равномерно летящей цели (<мц = 0, o4=const), постоянных скорости перехватчика (и = const) и величине l/tM Пусть цель движется прямолинейно и равномерно со ско¬ ростью уц. Перехватчик также движется равномерно со ско¬ ростью V. Величина l/tM считается постоянной. Решение уравне¬ ний движения при этих условиях имеет вид. Расстояние между перехватчиком и целью D = Dn sin q sin q0 ^1 k // n . \ Д7Д У 1 — Ц Sin2 q0 + Xj cos q0 \ X X _ у 1—Xj sin2 q + Xi cos q j 1 |/ 1—Xj sin2 q -j- cos ^J/X— Xj sin2 q0— cos 0O] T2 (Al IV~ Xj sin2 q — cos 1 — Xj sin2 q0 + cos g'o) (1.142) Время полета перехватчика по кинематической траектории от точки (D0, <?о) ДО точки (D, q) t-- 1 D{q) vu (1 — йХ]) J sin q 4a dq. (1.143) Пеленг цели где cp = arcsin(X1sin<7), (1.144) О M vu?M + 1 (1.145) 3*
Глава 2. ЛЕТАТЕЛЬНЫЙ АППАРАТ КАК ОБЪЕКТ УПРАВЛЕНИЯ ОСНОВНЫЕ ОБОЗНАЧЕНИЯ А О») — aij — Ьц — fa 1 а— g— h — i— к— M(s)- мх- Му- ль¬ да— тх— ту — mz— Р — Р(й)- QH- S — Т — Та- Трег t — V- X- ■^вх (0~ •^вых (О" •^вых О)" &х(0- Y- T(S)- амплитудно-частотная характеристика, динамические коэффициенты ЛА в продольном движении, динамические коэффициенты ЛА в боковом движении, собственная частота колебаний ЛА. вес ЛА. ускорение силы тяжести. запас устойчивости по модулю, переходная (временная) функция, мнимая единица. передаточный коэффициент; коэффициент усиления. характеристический многочлен. момент крена. момент рысканья. момент тангажа. масса ЛА. коэффициент момента крена, коэффициент момента рысканья, коэффициент момента тангажа, сила тяги. вещественная частотная характеристика, мнимая частотная характеристика. комплексная величина; независимая переменная изображений. постоянная времени. период собственных колебаний ЛА. время переходного процесса (время регулирования). время. скорость центра масс ЛА относительно воздуха; функция Ляпунова. сила лобового сопротивления ЛА. входная переменная (оригинал), изображение входной переменной, выходная переменная (оригинал), изображение выходной переменной, отклонение (возмущение), подъемная сила ЛА. передаточная функция. 68
Y (i“)—амплитудно-фазовая частотная характеристика. Z — боковая сила. а — угол атаки ЛА. Р — угол скольжения ЛА. 7—угол крена ЛА; запас устойчивости по фазе. Д—-приращение (отклонение) какой-либо величины. Ь — откленение органов управления ЛА. $ (t) — дельта-функция. 8В—угол отклонения органов управления тангажом (рулей высоты). —угол отклонения органов управления рысканьем (рулей направ¬ ления). 8Э—угол отклонения органов управления креном (элеронов). Вдв—угол отклонения поворотного двигателя. е—ошибка управления (рассогласование). £(°°)—установившаяся (статическая) ошибка. Един—динамическая ошибка. 6—угол наклона траектории к горизонту. &—угол тангажа ЛА. £ — относительный коэффициент затухания (демпфирования), о — перерегулирование, т—постоянная времени. 9 (<ь)—фазо-частотная характеристика, фс—угол скоростного курса, ф— угол курса ЛА. ю — частота колебаний. <оа —• собственная частота колебаний ЛА. соСв—частота свободных колебаний ЛА. <йср—частота среза. <лх, со у, сог— проекции вектора угловой скорости ЛА на связанные оси. [ 1 ] — единичное ступенчатое воздействие. В данной главе содержится характеристика динамических свойств ЛА как звена системы автоматического управления по¬ летом при детерминированных воздействиях. При этом ЛА рассматривается как одно из нескольких звеньев системы управле¬ ния, а именно как объект управления. При исследовании динами¬ ческих свойств ЛА в разд. 2. 2 и 2. 3 предполагается, что возму¬ щенное движение ЛА описывается системой линейных диф¬ ференциальных уравнений с постоянными коэффициентами. Свойства ЛА исследуются методами теории автоматического управления, применяемыми как для изучения всей системы управления в целом, так и для отдельных ее элементов и звеньев. В разд. 2. 1 предварительно излагаются основные сведения и приемы линейной теории автоматического управления. В разд. 2.4 приводятся некоторые методы общей механики, при¬ годные для аналитического построения и анализа движений ЛА в тех случаях, когда эти движения описываются системой обык¬ новенных нелинейных дифференциальных уравнений. 69
В тех случаях, когда анализ нелинейных задач не удается провести методами, описанными в данной главе, следует обра¬ титься к численным методам решения (см. гл. 4). 2.1. ОСНОВНЫЕ СВЕДЕНИЯ ИЗ ЛИНЕЙНОЙ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 2. 1. 1. Система управления движением ЛА Движение ЛА является управляемым, если происходит управление или регулирование параметров его движения в про¬ странстве. Наиболее общим способом целенаправленного изме¬ нения параметров движения является создание и использование управляющих сил и моментов, называемых управляющими воз- действиями. Рис. 2.1. Пример представления системы управления угловыми движениями ЛА: 8(f)—отклонение органа управления, эквивалентное сигналу автопилота; 6упр (О—отклонение органа уп¬ равления, эквивалентное управляющему воздействию; *возм^~отклонение °Ргана управления, эквивалент¬ ное возмущающему воздействию; 63 (О—суммарное отклонение органа управления Кроме управляющих воздействий, на ЛА в полете действуют также возмущающие силы и моменты, называемые возмущаю¬ щими воздействиями. Все переменные системы уравнений движения ЛА (см. разд. 2.2.1, 2.3.1) подразделяются на входные xBX(t) и выход¬ ные xBblx(t). Определения их приведены в табл. 2. 1. Для целесообразного создания и эффективного использова¬ ния управляющих воздействий применяется аппаратура управ¬ ления, предназначенная для: — получения необходимой информации о действительном значении параметров движения ЛА; — формирования управляющего сигнала на основе получен¬ ной информации; — приведения в действие органов управления ЛА. Динамическая система, состоящая из ЛА и аппаратуры управления, образует систему управления. 70
Рис. 2.2. Пример функциональной схемы системы управления уг¬ лом 0 наклона траектории Автопилот Возмущающие воздействия Рис. 2.3. Пример функциональной схемы автоматического управления углом тангажа ■& ЛА: <Н/)— действительное (текущее) значение угла тангажа; W)—требуемое (задан¬ ное) значение угла тангажа; 8—ошибка управления. е=1>(()—&(0; ие— сигнал ошибки; «у —управляющий сигнал; 6В—угол отклонения руля высоты; Нюзм и Mz возм—возмущающие сила и момент, соответственно 71
Большинство систем автоматического управления движением ЛА являются замкнутыми системами, т. е. системами с обратной связью (табл. 2.1). Работа таких систем строится на сравнении действительных и требуемых значений параметров движения ЛА и на стремлении к нулю полученной разности. Способами изображения систем управления являются функ¬ циональные и структурные схемы (см. табл. 2.1). Структурные схемы обычно представляют в виде совокупности простейших, т. е. элементарных типовых звеньев, характеристики которых приведены в табл. 2.3. Так как дифференциальное уравнение высокого порядка можно заменить соответствующим числом уравнений более низкого порядка, то одному элементу функцио¬ нальной схемы может соответствовать несколько элементарных звеньев структурной схемы. Представление системы управления в виде совокупности эле¬ ментов той или иной схемы обычно производится в предположе¬ нии, что состояние каждого элемента описывается лишь двумя конкретными переменными — входной xBX(t) и выходной xBUX(t). Если какая-либо из этих величин является алгебраической сум¬ мой нескольких других переменных, в схеме предусматривается суммирующее устройство (сумматор), производящее указанное суммирование. Преобразование структурных схем см. в разд. 2.1.6. Примеры систем управления, а именно различные виды функ¬ циональных схем систем управления угловыми движениями ЛА, приведены на рис. 2.1, 2.2, 2.3.
2.1.2. Основные понятия и определения теории автоматического управления гг а 1 Ьн а. Р S я го Р ° §• % ~ Cl) CD Я Я CQ Я H CD О ЕГ »Я G<< v м2 со 4) CO CD <D к о я § я CD CD >-■*4 р£ vo 5 _ 2 m * 2 к 4 n t! - g <d £ Oh fct 3 С щ cd >> “■& G G О G E* W S о R CU Он G О я О 2 x В \о 5 ° и CD G WH G Д Он .. G < >> П К о я н G Я Я Я§1 £§s я u S к я «5ч О) Ч « fcC Л. g со <L> ° о и 3 к g q- Ч я э 2 >=-ш н о д о я о о G Н 2Й Я S я« CD Я »S ■3 >> CD СО S О О И н В к 4 я ё § 5 & cq =к Й Я <0 5 ч S 5 S- 2 4 О Я О со я S й « Э- Л CD S О о К Ю >» 5 >р н* CD Ф< Л trC ь я X со « ® 3 Е- G О о я л ^ 5 G S У я CD Р ч о. 2 « CD CD G Я Е- G Я G И С X Е- О) О) св S м к о Я нч Он м ЭЯ н н о о „ CQ =>я Я я О t? CD се 1=1 О Д Он Он « О 5 S I к 2 я Ч Я Я Е- S S о и я Е- CD <г< о я 2 =Я G ER CD я Я! СО =Я СО R Я о CD я Я ngS£ „р“ 2 к Л G ■ О ч м н я 1 и ' : *=(: и s О О) О. |>> - -ft® м< " <и S 5 со CQ Он се х g s CQ и Он Ч S доя 2 я ч О и s «о я isfej К Я g 8 s S 2 s s m § s Э « 5 и s я ce Д n, _ oT g ^ C—< 2 2^| ® Он Я * и >,2 CD 2 ' S 5 S g g я В G Jg С гЯ Он CO О G О Он X M я Я CD s CD Oh CD G Я « О X CQ Он t=C w g ь; 2 о Й R« О R C CD S Ч и et »s«® CD R p, О я £ я я CD Он Я S £ ^CD СО О G я 2 s к * I G CD S Ф o ^ О I “ G- G Я 0> Oh Я 4 о X 3 CQ сё ^ ccS C3 oJ=£ Я « s ^ g »s J ts К щ'с SS $ ь gg gu ^ m «’•a Я о ^ СО О CQ ^ GO О ggsa 1§чЦ £ S s _ о _ G E-< .•Яв5 Он G CJ H Я « 3 £ Он 3 3 S с 03 03 cj Я ^ CO CN 6 £ G ° £ >» CD . tQ 3 ce VQ p, S ° >» CD E- H к> G CJ x G G О _ G R< Я я О 2 « я я я 2 s s _ s к S s 2 S ч аз Я 3 W CD iS R G 4 RoOhW f-н G G О >-. Q- к>э CJ я G Oh G *=5 G S CD H О Я CJ 73
пор. Наименование понятия Обозначе¬ ние Определение 74
' OS S O 5 ^ Й к я „ га p 3 со <L) К О Л % £ я я № Я Я <D о м- К д cd 3 "аГ 2 S Я Л Я О- >^Ю 4 о О ' Я С СО S к .S S м CQ и си н 2 Н >■> р Он л О Я о 3 н И о я Я Он о И»Я § S* >, я *Г 8 n'D СО и о о Я о д н я Он Ч О я я с О »Я а> я >• я с й s tt _=к к 2 я к я е- S я о ■ 3 га Я я 3 ^ Э CD 'я 2 я о К 3 m я 2J t* я 2 к Я я U В! Я « _ а, о ° g “ 2 s 5 *ч ** <—> я н 3 я 3 о н я >-> к я я Я я 3 I о ч я я я я а & о я я я я я ю I g ° я я о н Ssg «SO Й сг о S И я о я ® &S. § g &■ *>*! | CL) § а н « я о к со» s я Он я я я я я я о >>га •©« о Я о а з 3 ^ 3 я я 5sS Я о с w 3 5 1-Г я я S о 2 S я Я ь ч Я CD (D Я я fct о ч со я я я Я я Он CN с4 я CU со СМ к-Г л »я ) я я о 5 з я я 5 3 ^н t-f Д Я О Ч- J и,Я $ J м 0) ^ s3 Ч Я см см СХ. со я я , к я я ■ »я >* х 2 S 3§S § «* 9 3 rt 1 Й о я я н о я «* CL) Он _ ч\о 2 Я О я — 3 я ^ 2 Он ч стз я я 2 я я >»га ак яЁоП« Н ° •Э" § S К И S В н я s о 2 2 ч . я a Я Я (и я о 02®ч& >> . 2 2 со Е-1 Е-1 Я . . 2 я я Ч ч я я я я н а> а> я я 3 S £ Ч «2 X 3 я g я я я ю (U Чя Я о СО Л arc ся к Я Я я О) о 2 я 2 я Ч ^ о О 3 X я , я о о я я к*~» я »я о ” я CJ о я \о CU о о я о о - Я а) Н я н Я Д- ° о Й Я s|° §*■■§ я 3 я Я Я ч о я я я я я « я s а S3 я ч СО Я я о* х,»я я о я я 2 л I р а ^ Я Он к ' 3 2 &=* о г а; ^ S’ «5 Я р4 со я СЬ> - _ Он я о) н-н 2 Я л ^ н я я 2 о Н S 2 О 3 I н 2 я я н 53 3 Ф ГС м к СО Я 4 м 5 ьг а |Й Я о я _ Я X S? 3 »я а о Я о см Я Г CU г ' =я >» д § я ч; я | 3 3 ю я 2 л' Я -н S* ч я к я я н Я 2 д О) Ч. я яря 5 Он к 2 с я Он о VO Я- о s .п со 2 S о 3 х Ян з 2 ' ^=я g с S 2 s и я н я я я Я О « Ч я га Он X о5 ^ я a s S я VO^Qh s о К о \о § Я Ч ° Я л S &* S о о О Я Ю я о о я о я >» н s Я х S и я н Н Я о га Ой 2 я О >, я я Я W ' о CJ 2 и S вз О) ш S Й о В s о.ц 9 « Э 2 й ^ о ^ я Он га га я >» 5 н га х я Р я Р" т н Я и а 3 я Я н Н г- я я S | о га чн vi/ о га, Ч я о Ч д Я Я й Ч о Я CD Я Я Ч S Я <1) я X 2 га я I яГ га га о я ^ •е-^Г я Я Он >-3 н я >-> Он н a 5 S.2'3 8 X о “ “ 2 « 2 ^ S о о Я и Ч а« Ч к о s СО &, н »■- о о а) о к с м и с ег я о &. ь я я Е- СТ) 75
76
77
<v я CD * Q § динамики фференци- ч я 8 Н a • »Я си _ я; 2 СО с-1 /—s о о ИЬ ^ т. 19 и 24 О, a, E § Я £ X <5 3 S & 3 Я w Ег <У S s Cl, c Уравнениями ычно являются ьные упаинриия ' 4 ° II , «. / N 8 л as н ч 51 ^ Я 2 ^ ^ о w CU К я я оз Я (V со X 3 S ю a, 1 * С 2 й) * Я о *=3 Ь о s —, Он с см" S сЯ ХО «=з W к U ю О 03 со 03 Е- со Cl, о5 S a. VO C 03 н S и о К Л »я к '-'о S 2 5 5 х 2 Я я S § при я 6 03 5 Я 6 оз Я Я Я О) О ►Q CL) О Я W и д д « м ё X g оЗ Я s £ £ н 2 я о ,—ч S.I gS. ё a CU >э (D g S н аз о CU О (U о a s x о g о Л g =s §§*"§§ $ M >, 0- § g и £ S 2 § g g go к g «о я II 4о с С »я ^ о К О) Чо S С СО О »я СО о 5- s ч: я я Я зЯ О О § Я О) flj 4—' О § 03 о со =я S ^ M Д n.^ X х S я х н я Й я a, c О Процесс из от старого значения к но шемуся значе входным (уп возмущающим Зависимость JX=[1] И Хв ы Значение вы эй, определи- им воздейств Значение \вы )й при отсутс их воздейств Значение выя й в установи и я я а a о я я я (U sr /•—v 2 <y сг w 'Kj 8 g S 4—' X ^-n X! О 3 X о 14 4 ►С се Я понятия роцесс пс X (времен- заданное) ной пере- >е значе- :ременной движе- :я значе-. перемен- си S Я ca и о К 3 ’§ ч“ §=Я Я « Я Я = я w <=с О о. 5 О Л и щ Л, я я о Я Я 4) « Я 1—f О Я Я Я О) 03 2 5Я 3 2 « S X V S s C3 К § S х 5 % V си 2 ® о С си <D я к я О JE * £> S.*1 CD ^ 03 Я Требуем значение в менной Я 5 О Я « £> о s s m „ m <D М О ►Я СО •-U CD 0 d) Я щ я Я W Я Установи ^ие выхо^ iOfi о . № п пор 22 23 24 25 26 78
Отклонение выходной Дх {{) Разность между действитель- переменной ным (текущим)' значением вы- ¥ ходной переменной и ее на¬ чальным значением, т. е. Дх (^) = xBbIX (t) хВЬ1Х (0) О Я Я н о Н =Я CU О) я fct Я СО Я О Он и Н Я’ Он; ' о 1=3 ■ О я : ag ■ s ° “3 к я я я Ч >» Е- О g Я Щ со К о 2 Я я я я я 1=3 я о ф я ф* /-"■S н я S ф я я н ф я ф н ^ X о 3 о н*Г* я ф ^ И сО Ф Я ^ g со g R Я Я Я 3 S § я я s s я о я Е ^ С_, S'"» СО о я с о £ Я .^я со О Я Н К о, S й я о Я X 4 <1 оЯ <Ь о о я я кс я о X я S я о 2 Я О я'-' ФэЯ л EJ S Pi о (О я CQ Он я <о я Я КС 00 с-д л о R Я О « н о »я К В О R н СО Ф о я я я « о Си ер 5 3 S S О я £ 3 cog д Я § ° о « W о о я н X < § КС Я S Я о я СО S§P «Й1! СО ч. Я &S „ я Рч со Я СО я ф &Sss "я я Е’Я Я" я S О И , s ф О % S о л ф 14 2 К Ф и К я я сС си га =я ч ш ф . Й Е-н W я я и я л Он к я о" я а о о> я я я S ч ию Sgin h. ф О И Ф я я Я о Я О <5 со я 5 « Я о st н ф я 1=3 я я =к<; в в У К 0! я 0-^0 Д . с g о as О о я s Ф я я я я я я о СО н к 2 ^ о Я *н я я \0 О я § а а § а я Ф я я я я о Ф я “ я н я со 5 * а40 Я д В а >> а о со я я я Я *Н Ф я я я я я я я Он о я н ^8 я ° я 'ё я а § я я я Н Я О Н Н О < я S Он о я я я я я t=c X X S 2 а в а *=с S о S * a w я я с( Й я \о я а а я л я , ф ^ф я Й& я л я ф И ^ X sS cL’K § х&° « о я о со Я X я g ю ф ф 2 Я Он к S S* a g ОЙ Й Я О О- £ И'О О^о О со X я я я яг я я о н § 79
ной Xbx(s) при нулевых на- передаточные функции в общем О о Он Е- О О О —- Ч .3 « ^ о Л в в fl : <ц ч Я н о я Б Он S си о м * сЗ Он Л X 5qJ 'O' я я Я Я >> 4 5 C CQ , 3 о «з Я iti 4 я s h «3 «3 в к ° s ^ Я аз о 03 & CO CO У о ^ я 3 у я я си § У Ч я Ч н о 5 в я я о CQ сV X X ,—, 3* ^ О >> я .3 4 К ^ О О V Ч ^ 5 « к о 2 ? ►с Н s » ч $ я1 я СО & Я я о я о + 3 СО 3 Он н о н 03 Я сЗ Я Я « 5 я 5 0 £ СО ^ “ g О 03 0 Он СО « 03 Я СО Я Он Я - я - я : ■ev •е^ X о O' 5 § * я к н 03 О S S я Он я 2 ^ я В Он Я Я 0 ^ о % g S См® a s и - s о и « к. м О я ЕГ 0 >> S 4 Я ^ О о ч Ч ^ 5 и о « S щ ь к £ о я 5 t( ш 5 ш £ 1=1 g-я С Он Я Я а я СО О я к u я н > 2 и О—^ Я 3< Й “ я I я и 2 и ?s я 7 S я я я я s I я 03 Я * « Ю Я « 0 ч £ ч 0 ” я о я ч! я я ■3 5 н о н о оз я сз о g § р 5.0 Е>s S Я О g Н 9 и S СО <; &, СЗ X СО СО 80 Фазо-частотная харак- <р(ш) Зависимость от частоты со См. табл. 2.3 См. примечание теристика сдвига фаз ф выходных коле- табл. 2. 1 баний относительно входных колебаний
2.1.3. Летательный аппарат как звено в системе управления его движением ЛА в системе управления является элементом системы — объектом управления. При этом его свойства вполне характери¬ зуются определениями и понятиями теории автоматического управления (табл. 2.1). Управляющим воздействием для ЛА в общем случае являются отклонения органов управления, а входной перемен¬ ной — величина, характеризующая положение или состояние органов управления. В частном случае управляющим воздейст¬ вием для ЛА могут быть углы отклонения воздушных или газо¬ вых рулей 6В, 6Н, бэ, угол поворота крыла или двигателя, изме¬ нение геометрии крыла, изменение тяги двигателя и др. Возмущающее воздействие для ЛА может быть учтено или введением возмущающих сил и моментов в уравнения движения ЛА, или соответствующим изменением входных или выходных переменных, например: Mz в0зм=А12б ■ бВОзм, откуда 6ВОЗм = =MZB03JMZ6 (см. разд. 2.2). Выходной , переменной для ЛА может являться любая вели¬ чина, характеризующая движение ЛА, например а, 0, Я, V и т. д. Выбор выходной переменной определяется изучаемой за¬ дачей. Изменение выходных переменных по времени, характеризую¬ щих движение ЛА, определяется двумя факторами: 1) изменением входных переменных, т. е. характером откло¬ нения органов управления; 2) динамическими свойствами ЛА как звена системы управ¬ ления. Для оценки динамических свойств различных ЛА необходимо предполагать одинаковыми входные воздействия. Для этой цели широко используются различные виды типовых воздействий. Некоторые, наиболее употребительные типовые воздействия при¬ ведены в табл. 2. 1. Динамические свойства ЛА как звена системы управления характеризуются устойчивостью его движения (см. разд. 2.1.7) и качеством переходных процессов. Величины, характеризующие качество реакции ЛА на скачкообразное воздействие, т. е. оце¬ нивающие график переходной (временной) функции h(t) (табл. 2.1), называются показателями качества переходного процесса. Основные показатели качества ЛА по переменной хвых указаны в табл. 2. 2 и на рис. 2. 5. Демпфирующие свойства ЛА характеризуются величиной перерегулирования сг, периодом Тсв или частотой сосв свободных колебаний. Быстродействие ЛА, т. е. характеристика задержки реакции аппарата на скачкообразное воздействие по времени, опреде- 81
см CM G S' G VO G К S 03 H c3 o. VO о Ж X X я о с. X я о X о SP ж 03 о X о о * to о о о ю см CD od CD Ж (D со С к о к о 03 U Ж CD §3 х § М 1 о ч И о * 2* ^ >» ^ о o-g VL» >? ж CD CD ж н J <U Я <о а4 р; g о ^ о CD ~ ж. * CD 03 к CD Ж s <=Q 8? s g £ £ S cr* Ж К ж 4 О £> Он о ж *=t . о и ~ (D CD CD О, CD Ж С w Я ,- CD CD а Ж а _ CD (D ЛЯ Й CQ о CQ CD О Ж CD 03 Ж со (D О Ж Ж 4 «3 а ж о Я и 03 5 "ж ж ж о 4 я g 'о ° ж аз я о £ 5 a £ >~Э аЗ S SCO о w из О О- я С53 CD ; £ CD CDr- a ч O vo % <D Ж Ж Я Ж о CD Ж Ч >-» и <D CD CD CD CD o *si ЧС g ж 5 s о Cf к « ж. It* s’®* >^0S ж о чс ж t»o Я X * a аз 53 <D ж s к a 03 a a cq a ж О * т-н t-1 03 . Й ж ч 2 a vo s НД C3 ч a X 3 ж я о vo Or CQ CJ *=c §3S CD g i-П *rl 03 C VO Ж Я О vo оз oS £ S 2 и Г со ^ vo ^ аз ЕГ ч о X tq см a U »=t л о » X S ж CQ О ож О к ё a CQ Ж CD S аз м о ж «в н о a _. ж X * s- о S«o Ф в 5 СО 5 « и . |§"в gsft~ £< о. °« д § 5|' § I ж а) 4 из аз 5 g vo N CD t£l § « 5 * CM « ч cu vo ^Dc3 ^ H a CJ 03 X я'з £ * ^ 03 о Ж ° a CD G О ё о X CD CD :r о 03 VO (D 4 О *G 82 Линейная интегральная I\ 00 оценка г Г -^вых (°°) (0
ляется временем переходного процесса Грег, временем выхода на установившийся режим to, периодом Тсв или частотой со0в сво¬ бодных колебаний, а также интегральными оценками. Статические и астатические свойства ЛА. ЛА называется статическим по отношению к возмущаю¬ щему воздействию f(t), если при воздействии, стремя¬ щемся при t-^-oo к постоян¬ ному значению, отклонение выходной переменной Ax(t) также стремится к постоян¬ ному значению, зависящему от величины воздействия (рис. 2. 6, кривая 1). ЛА называется астатиче¬ ским по отношению к воз¬ мущающему воздействию f(t), если при воздействии, стремящемся при t~*oо к постоянному значению, отклонение вы¬ ходной переменной Ax(t) стремится к нулю независимо от вели¬ чины воздействия (рис. 2.6, кривая 2). Рис. 2.5. График устойчивого пере¬ ходного процесса и основные показа¬ тели его качества; х(оо)=/Г; %вх=[1] Рис. 2.6. Примеры переходных про¬ цессов по переменной хВЫх для ста¬ тического (кривая 1) и астатического (кривая 2) ЛА по отношению к воз¬ мущающему воздействию xBX(t); XBx(t) =[1] Л А называется статическим по отношению к управляющему воздействию g(t), если при воздействии, стремящемся при t-*-oо к постоянному значению, ошибка управления e(t) также стре- Рис. 2. 7. Примеры переходных процессов по переменной хВых для статического (кривая 1) и астатического (кривая 2) ЛА по отношению к управля¬ ющему воздействию xBX(t); Хвх(0=[1] 83
мится к постоянному значению, зависящему от величины воз¬ действия (рис. 2.7, кривая 1). ЛА называется астатическим по отношению к управляющему воздействию g(t), если при воздействии, стремящемся при t-*-оо к постоянному значению, ошибка управления z(t) стремится к нулю независимо от величины воздействия (рис. 2.7, кривая 2). 2. 1.4. Передаточная функция как способ выражения динамических свойств ЛА Реакция ЛА на воздействие произвольного типа характери¬ зуется его передаточной функцией. Передаточной функцией ЛА называется составленное при нулевых начальных условиях отношение =К>ЫХ(5), (2.1) •*вх (S) вх где ■^ВХ (s) й Хвых (s) — изображения по Лапласу входной и вы¬ ходной переменной, соответственно. Как видно, передаточная функция F(s) связывает изображе¬ ния двух определенных переменных. Различным парам перемен¬ ных, рассматриваемых в качестве входной и выходной, соответ¬ ствуют и различные передаточные функции ЛА, например, (см. разд. 2. 2.4). в (5) yfj К . Хвых—0’ В (s) ■ 8 1 J T2s2 + 2rts -f 1 ’ г _8. &(s) K(Tis + i) ^вых=«; В (s) 51 J S(7’2S2+ 2ns +1) ’ r _g Передаточные функции некоторых типов элементарных звеньев приведены в табл. 2. 3. Получить передаточную функцию Y (s) по линейному диффе¬ ренциальному с постоянными коэффициентами уравнению дви¬ жения ЛА типа (см. разд. 2. 2. 1, 2. 3. 1 и 2. 3. 6) #m-*Lix(0 + am—iAbhx 5 W+ • ■ • + аоХвых W = = Ьпх<$ (О+$Я_1*<Г1) (0+ • • • +b0xm (t) (2.2) можно следующим образом: 1) применить преобразование Лапласа к обеим частям урав¬ нения (2.2) с учетом нулевых начальных условий ^(s)^b,x(s)=-/v(s)^Bx(s). (2.3) где М (s) = amsm + am_xsm~l +... + а0; N(s)=bns" + bn_1s"-' + ...+boi 84
Таблица 2.3 Уравнения движения, передаточные функции и частотные характеристики типовых элементарных звеньев 85 1081-
апериодическое устойчивое колебательное устойчивое 86 ОШ-
усилительное интегрирующее ' дифференцирующее 87
усилительное интегрирующее дифференцирующее о ГО та •=С « >-> ГО н н к у cj X с а. a g С S <D Я и я 5 & S * О № " § So ty rv та *•* о О я ^ КС та « го Н а го CL ■ О СО го « го о <D ГО ГО a *©< го Оц ГО U о а, го И « го го н о н о го го го <и го к о го сто <D с КС о к» го КС £ ю «S го СО СО <з5 го го та го <D a го сто С 88
2) составить по уравнению в виде отношения изображений: У (S): (2.3) передаточную функцию ВЫХ (5) N ($) *-вх (s) М (s) (2.4) Пример 1. Пусть продольное возмущенное короткопериодическое движе¬ ние ЛА описывается следующими линейными дифференциальными уравне¬ ниями (см. разд. 2.2.3) с постоянными коэффициентами: Д» — #22^ — &24АСЕ = Дгз^в; Д0 — а34Да = 0; — Д»+ Д0 + Да= 0, которые можно свести к одному уравнению относительно переменных Дбв и А0: Г2Д0 + 2Г£Д0 + ДО = АГД5в. где «22«34 + «24 2 Д22~Д14-; «22«34 + «24 «25®34 А = — «22а34 + «24 Получим по этому уравнению передаточную функцию К5 (s), равную 6(s)/60(s). Принимая переменную Д6В за xBx(t), а Д0 за хВЫх(0. получаем уравнение движения в виде т’^вых (0 + т -^вых (0 + -^вых (0 = ^и(0. (I) Применяя к обеим частям уравнения (I) преобразование Лапласа, полу¬ чаем (при нулевых начальны» условиях) М (s) лгвых (s') = N (s) xBX (s). (II) где M(s) = r2s2 + 27’?s +1; N(s) = K. По уравнению (II) составляем отношение -*вых (s) __ N (s) Д® (s) у!) .4 *bx(s) ~M(S) ~ bbB(s) ~ * (> ~ 7-2S2 + 2ns + Г Полученное выражение для Fj (s) является одной из передаточных функ¬ ций ЛА. Постоянные коэффициенты ат,«о, bn,-.-, Ьо уравнения (2.2), входящие в выражение Y(s), называются параметрами передаточной функции. Многочлен M(s) называется характеристическим многочле¬ ном, а уравнение M(s)=amsm-\-am_1sm~1 + ... + а0 = 0 (2.5) называется характеристическим уравнением. 89
Динамические свойства ЛА, т. е. реакция по переменной Хвых на произвольное входное воздействие xBX(t), полностью определяются передаточной функцией Y(s) следующим образом. 1. По заданному оригиналу входной переменной хвх(^) опре¬ деляется изображение входной переменной xBX(s) с помощью прямого преобразования Лапласа: *«(*)=£[*■*(*)]• (2-6) 2. По найденному изображению входной переменной xBX(s) и известной передаточной функции ЛА Y(s) определяется изо¬ бражение выходной переменной: ■*вы*(«)=П») ■*.*(«)• (2.7) 3. По найденному изображению выходной переменной x^bI5;(s) определяется оригинал выходной переменной хВЬ1Х(^) с помощью обратного преобразования Лапласа: V(0 = i_1kix(«)]. (2.8) Таким образом, передаточная функция Y(s) позволяет опре¬ делить реакцию ЛА на любой вид воздействия. Основные свойства передаточных функций 1. Передаточные функции ЛА являются рациональными функциями вида N (s) bnsn + bn_isn 1 + • ■ • + bp g, ^ (S) amsin + am—Is™ 1 + • • • + a0 " причем n^.m. 2. Все параметры передаточных функций a0,..., am; b0,...,bn действительны. 3. Комплексные нули передаточной функции и ее комплекс¬ ные полюсы могут быть лишь комплексно-сопряженными. 4. Передаточный коэффициент К по переменной хвых опреде¬ ляется передаточной функцией следующим образом: Нш Y (s)=K. (2.10) s->0 5. Все полюсы передаточной функции ЛА, устойчивого по пе¬ ременной Хвых, имеют отрицательные действительные части. 2. 1. 5. Частотные характеристики как способ выражения динамических свойств ЛА Реакцию ЛА на любой вид входного воздействия позволяет определить его передаточная функция Y(s). Большой практи¬ ческий интерес представляет изучение реакции ЛА на гармони¬ ческое воздействие типа ■*вх(*) = Аа COS«rf. 90 (2.11)
Гармоническое колебание входной переменной ЛА (напри¬ мер, органа управления) с постоянной частотой со и с амплиту¬ дой АВх вызывает гармоническое колебание выходной перемен¬ ной типа с той же частотой со, но с измененной амплитудой Авых и со сдви¬ гом по фазе ср. При этом переменная s в выражений для переда¬ точной функции Y(s) принимает чисто мнимое значение s—jсо, где со — частота подаваемых на вход колебаний. Передаточная функция У (/со) в этом случае называется частотной характери¬ стикой. Различаются следующие виды частотных характеристик. Амплитудно-частотная характеристика (АЧХ) — представ¬ ляет зависимость от частоты со отношения Фазо-частотная характеристика (ФЧХ) — представляет зави¬ симость от частоты со свига фазы ф(со) выходных колебаний относительно входных. Частотная характеристика Y(ja) совмещает свойства АЧХ и ФЧХ. Выражение для частотной характеристики ЛА можно получить, полагая s=jсо в выражении соответствующей переда¬ точной функции: Комплексное выражение У (/со) (см. разд. 2. 1.3) можно пред¬ ставить в экспоненциальной форме где Л (со)—характеристика АЧХ, а ф(со)—характеристика ФЧХ, или в алгебраической форме где Р(со)—вещественная частотная характеристика; Q(co) — мнимая частотная характеристика. Частотная характеристика У (/со), построенная графически в комплексных осях Р(со) и /Q(со) по выражению (2.16), назы¬ вается амплитудно-фазовой характеристикой (АФХ). Перемена знака величины со меняет лишь знак сдвига фаз, сохраняя неизменным отношение амплитуд. Следовательно, АФХ симметрична относительно действительной оси Р и обычно строится лишь для значений частоты со в интервале 0^со<оо. Характеристика АФХ связана с АЧХ и ФЧХ соотношениями W=Ab,xcosK+cp) (2. 12) вых (2. 13) (2. 14) У(уш) = А(со)еМ“), (2.15) r(>) + />)+/Q(w), (2. 16) Р (ю)= А (ш) cos ср (<о); Q («О—А (о>) sin ср (со). (2. 17) 91
Характеристики АЧХ и ФЧХ связаны с АФХ соотношениями л (»)=//» м+Q»; tgcp(a)) = Q (<о)/Я (<!>). Графически связь различных видов частотных характеристик показана на рис. 2.8. (2. 18) Рис. 2.8. Связь различ¬ ных видов частотных ха¬ рактеристик: У (jсо) — амплитудно-фазовая характеристика звена с пере¬ даточной функцией У (s); со. — фиксированное значение частоты со У (}т)-А (Ш) еЛ(“)=Р(ш) + +1Q (°0; Я(ш.)- y'P2(to) + Q!(®); tg 9(0>г)-* (?(<■>) P(u>) Характеристики АЧХ и ФЧХ используются также в логариф¬ мическом виде. Логарифмической амплитудно-частотной характеристикой (ЛАХ) называется зависимость 20 IgA (со) от lg со. При этом 20 IgA (со) считается значением А (со), выраженным в децибе¬ лах (дб), т. е. 20 IgA (со) =А (to) дб. (2.19) Логарифмической фазо-частотной характеристикой (ЛФХ) называется зависимость фазового сдвига <р(со), выраженного в градусах, от Igco. Характеристики ЛАХ и ЛФХ строятся одна под другой с сов¬ мещением шкалы по горизонтальной оси (оси частот), причем ось частот размечается по значениям частоты о. Отрезок гори¬ зонтальной шкалы, соответствующий увеличению частоты в 10 раз, называется декадой, а отрезок, соответствующий увели¬ чению частоты в 2 раза, — октавой. Наклон частей ЛАХ отме¬ чается приращением или убыванием ординаты на протяжении одной декады, например 20 дб/дек (см. табл. 2. 3). Частота, при которой происходит пересечение логарифмиче¬ ской амплитудно-частотной характеристики с осью частот, назы¬ вается частотой среза соСр- Примеры различных видов частотных характеристик для ряда типовых элементарных звеньев приведены в табл. 2. 3. 2.1.6. Преобразования структурных схем Если ЛА как элементу функциональной схемы соответствуют несколько звеньев структурной схемы, его передаточная функция 92
I 1 ^•вл ! | Tniii К, К, ^вых 1 T,s+1 P2V + 2Tzts + 7 I I I 1 I Рис. 2. 9. Пример последовательного соединения звеньев: К, . „ кг У1^). Tts+1 Г,(5). f|i2+2r»5i+l ■ Br 'Vn УМ-УгМ-УМ- xbx's> K-KtKz (Г,*]+1) (т-|хг+2Г2Е*+1 ) Рис. 2. 10. Пример параллельного соединения звеньев: ■гвых=‘хвых”*~'*:вых’ К, сs) К, . Г,х+1 ’ К2(х) = 1<Г2х . Гхх+г ’ •*вых<*> *вх<*> !K(i)=r1(s)+K2(i)=/ir1 Т5 + 1 7V+T Рис. 2. 11. Пример замыкания зве¬ на единичной отрицательной об¬ ратной связью ra(s)“ —; у»(4)-1; 5 *(*) -К(4)- К.(Х) I + KxWKxls) 1 7\s+l’ 93
sr X X CU >» н а >> о* н X сd CQ О СО й a VO о <и а с й 1=3 я я й о* С 'з' а. -н Cl 5S . о о ЕС Я ч D VO О эЯ О X я => (U £-> !>■, '—'га s чь g S й S 1X1 S.w о 2 . I Рш ч 5 -Ь о ° g S 5 ’о к * ч- 9 ч о 35 ч о ^ = Ч к + СО СО Й § си О) VO Е- О а я ^ сj й Я н га X « Я к 2 сО Я Я й 3 § S о сч 6 Я о* СО я S о О) S я о. с 94
ii частотные характеристики в делом рассчитываются в зависи¬ мости от способа соединения звеньев. При этом необходимо ру¬ ководствоваться правилами, представленными в табл. 2.4. 2. 1. 7. Устойчивость движения Любое движение ЛА, характеризуемое зависимостью хвыx(t), можно представить в виде **„(0= А(0 + Л*(0, (2.20) где левых (0 называется невозмущенным движением, a Ax(t) — возмущенным (см. табл. 2.1). При отсутствии управляющих воздействий ненулевые начальные значения Дх(0) являются следствием приложенных к ЛА внешних возмущений и назы¬ ваются начальными возмущениями. Устойчивость движения ЛА по переменной хВЬ1Х определяется его способностью возвращаться с течением времени к невозму¬ щенному движению (t) после прекращения действия внеш¬ них возмущений. Следовательно, устойчивость движения опреде¬ ляется поведением возмущенного движения Ax(t) при Г>0, а под устойчивостью движения ЛА понимается устойчивость не¬ возмущенного движения ЛА в смысле прочности, неподатливо¬ сти его внешним возмущениям. Далее приводится определение устойчивости, данное А. М. Ляпуновым. Невозмущенное движение Лвых (t) называется устойчивым по отношению к величинам Ах, если для всякого как угодно малого положительного числа г найдется другое положительное число 6(e) такое, что для всех возмущенных движений Ах(^), для ко¬ торых в начальный момент t=0 выполняется неравенство |Дх(0)|^6, будет выполняться неравенство |Д*(01<* (2-21) при всех ^>0. Если неравенство (2.21) выполняется при всех начальных возмущениях, удовлетворяющих, кроме условия |Дх(0) ^6|, еще дополнительным условиям вида А(Дх(0))=0 или А(Ах(0))^0, то рассматриваемое невозмущенное движение называется условно-устойчивым. Устойчивость движения в смысле основного определейия иногда именуется безусловной. Невозмущенное движение .Хвых (t) называется устойчивым асимптотически, если, кроме условия |Ах(0)[^6 и неравенства (2. 21), имеет место 11т | C\x(t) | = 0. (2.22) #—►00 95
Если условия устойчивости выполняются при любых Дх(0), то говорят об устойчивости в большом. Если же для их выполни ния требуется, чтобы Дх(0) были достаточно малы, то говорят об устойчивости в малом. Если существует такое е, что при любом сколь угодно малом 6(e) можно найти такое Дх(0), удовлетворяющее условию |Дх(0) |^б, что неравенство (2.21) не выполняется при некото¬ рых />0, то невозмущенное движение xi°Jx (t) называется неустойчивым. В некоторых задачах динамики ЛА более целесообразной с практической точки зрения является постановка задачи об устойчивости по отношению к части переменных. Так, например, при управлении угловыми движениями ЛА обычно не интере¬ суются изменением скорости ЛА в возмущенном движении и, в частности, задача об устойчивости невозмущенного продоль¬ ного движения ставится как задача об устойчивости по отноше¬ нию лишь к части переменных, а именно, по отношению к а, й и 0. Иногда требуется так выбрать параметры ЛА, чтобы иссле¬ дуемое невозмущенное движение его было заведомо неустой¬ чиво. Примером такого движения может быть полет ЛА в што¬ поре. Данное определение устойчивости показывает, что решение задачи об устойчивости невозмущенного движения ЛА сводится к выявлению характера поведения решения Дx(t) уравнений возмущенного движения ЛА. Далее предполагается, что возмущенное движение ЛА опи¬ сывается системой линейных дифференциальных уравнений с постоянными коэффициентами *. В этом случае решение задачи об устойчивости движения ЛА по переменной хвых сводится к определению знака корней характеристического уравнения (см. разд. 2.1.4) М (s) =0, (2.23) образованного приравниванием нулю знаменателя передаточной функции Y(s), составленной по соответствующей переменной. Для того чтобы невозмущенное движение Хвь/х (t) Л А было асимптотически устойчивым, необходимо и достаточно, чтобы все корни S\,...,sm характеристического уравнения M(s)=0 имели отрицательные действительные части, т. е. Re Si<0 (г = 1,..., пг), (2.24) где m — степень характеристического уравнения. Если хотя бы один из корней s\,..., sm уравнения Af(s)=0 имеет положительную действительную часть, то невозмущенное движение ЛА — неустойчиво. * Методы исследования устойчивости движения при более общих предпо¬ ложениях рассмотрены в разд. 2. 4. 96
Случаи, когда среди корней уравнения Af(s)=0 ЛА имеется но крайней мере один нулевой или пара чисто мнимых, назы¬ ваются критическими (нейтральными). В критических случаях об устойчивости или неустойчивости ЛА нельзя судить по линей¬ ным уравнениям возмущенного движения и для решения задачи об устойчивости необходимо исследовать уравнения возмущен¬ ного движения в их исходном, нелинейном виде (см. разд. 2. 4. 2). Условие (2.24) показывает, что для выяснения вопроса об устойчивости нет необходимости знать величину самих корней s|,..., sm характеристического уравнения, а важно знать лишь знак их вещественных частей. Приемы, которые позволяют выяс¬ нить знак вещественных частей корней характеристического уравнения, получили название критериев устойчивости. Разли¬ чают группу алгебраических критериев устойчивости и группу частотных критериев устойчивости. Алгебраические критерии устойчивости. Кри¬ терии устойчивости, позволяющие судить о знаке корней харак¬ теристического уравнения (2.23), записанного в алгебраической форме M{.s)=amsm + am_xsm-' +...-fa0=0, (2.25) называются алгебраическими критериями устойчивости. К этой группе критериев относятся критерии А. Гурвица, Э. Рауса и др. Наиболее употребительным является критерий Гурвица. Критерий Гурвица. Для того чтобы все корни характеристи¬ ческого уравнения (2.25) имели отрицательные действительные части, необходимо и достаточно, чтобы определитель Гурвица Am и все его диагональные миноры Аь Д2,..., Am_i имели знак, одинаковый со знаком коэффициента а0, где ах (23 " ^19 д 2 ач #2 9 (2.26) ах <23 аъ д3= а0 а2 а4 0 ai а3 «г а3 аъ . 0 а0 ах . • . 0 0 ах а3 0 0 . . ат~ 2 • • т Следствие из критерия Гурвица. Для того чтобы все корни характеристического уравнения ЛА (2.25) имели отрицательные вещественные части, необходимо, чтобы все коэффициенты а0,..., ат уравнения (2. 25) имели одинаковый знак. 4 3398 97
Для характеристических уравнений невысокого порядка (т^5) требования критерия Гурвица упрощаются и принимают следующий вид: при т = = 1 #о > 0; а-х > 0; при т = = 2 а0 0, ах>0; а2>0; при т = = 3 0, <Д>0; 0) а$ 0, Д2 > 0; при т = = 4 & о V о ai > 0; ..., ц4>0; А3 > 0; при т = = 5 Од 0, «1>0; ■.<з5>0; Д2>0; > V о Если использование критериев алгебраической группы за¬ труднительно (например, высокий порядок характеристического уравнения), то применяются критерии частотной группы. Частотные критерии устойчивости. Критерии устойчивости, позволяющие судить о знаке корней характери¬ стического уравнения по свойствам соответствующих частотных характеристик ЛА, называются частотными критериями устой¬ чивости. Выражение для частотной характеристики Y(/со) можно по¬ лучить по выражению для передаточной функции Y(s), совершая подстановку s=jсо (см. разд. 2.1.5). При этом характеристиче¬ ский многочлен M(s) принимает вид Af(»=am(y<o)m+ ... + a0 = U(«>)-!rjV (и), (2.28) где выражение М(/со) = t/(co) + jV(со) называется характеристи¬ ческим вектором. При изменении частоты со от —оо до +оо конец характери¬ стического вектора M(j со) опишет на плоскости U( со), jV (со) кривую, которая называется характеристической кривой, или го¬ дографом вектора M(ja), или годографом Михайлова. Характе¬ ристическая кривая симметрична относительно действительной оси {/(ш), поэтому диапазон изменения частоты оз можно огра¬ ничить пределами 0, + оо. Из критериев частотной группы наиболее употребителен для исследования устойчивости движений ЛА частотный критерий Михайлова. Критерий Михайлова. Для отрицательности действительных частей всех корней характеристического уравнения ЛА необхо¬ димо и достаточно, чтобы при возрастании частоты со от 0 до + оо характеристический вектор M(jсо) повернулся на угол тл/2, или, что то же самое, характеристическая кривая при измене¬ нии частоты со от 0 до +оо, начинаясь с положительной действи¬ тельной полуоси, обходила последовательно против часовой 98
стрелки (т. е. в положительном направлении) т квадрантов, где т — порядок характеристического уравнения. Примеры поведения характеристических кривых приведены па рис. 2. 12 и 2. 13. Рис. 2. 12. Поведение характе¬ ристических кривых устойчиво¬ го ЛА для различных поряд¬ ков т характеристического уравнения Рис. 2. 13. Поведение характеристической кривой неустойчивого ЛА (кривая 1) и ЛА, находящегося на гра¬ нице устойчивости (кривая 2), для треть¬ его порядка характе¬ ристического уравне¬ ния (т=3) Следствие из критерия Михайлова. Для отрицательности действительных частей всех корней характеристического урав¬ нения ЛА необходимо и достаточно, чтобы одновременно: 1) корни многочленов U(со) и У(м), т. е. корни действитель¬ ной и мнимой частей характеристического вектора, были дейст¬ вительными и чередовались по величине; . 2) при значении <в = 0 выполнялись условия: U (0) > 0; У (0)=0; dV (ш) dix> >0. со—0 (2.29) Графическая интерпретация лова представлена на рис. 2. 14. Построение обла¬ стей устойчивости. При исследовании устойчивости движений Л А часто возникает вопрос: при каких значениях коэффициентов характеристи¬ ческого уравнения M(s) =0 ЛА устойчив и при каких неустой¬ чив? Решение этого вопроса сводится к построению границ следствия из критерия Михай- 1/(ы) VM V(u>) и Ы /\lf-0 \ ц=0/ 0 v=o\v=o\<^ /4=0 \ Ш Рис. 2. 14. Пример выполнения тре¬ бований следствия из критерия Михайлова 4* 99
области устойчивости при различных значениях коэффициент а0,.■.., ат [см. выражение (2. 25)]. Из всего возможного прострап ства изменения указанных коэффициентов необходимо выделить область устойчивости, т. е. область, где корни характеристиче¬ ского уравнения ЛА отрицательны или имеют отрицательные действительные части. Построение областей устойчивости може! производиться в пространстве любого числа коэффициентов. Ниже рассматривается случай, когда коэффициенты а0,..., ат зависят линейно от каких-либо параметров А и А. В качестве таких параметров могут рассматриваться аэродинамические или конструктивные параметры ЛА. Построение областей устойчивости в плоскости двух действи¬ тельных параметров А и В производится следующим образом. Характеристическое уравнение (2. 25) представляется в виде ат{А’ B)sm-\-am—i(A, -|-.. ,-\-а0{А, В) = 0. (2.30) Так как коэффициенты а0,..., ат зависят от параметров АяВ линейно, то уравнение (2. 30) можно представить в виде AP(s) + PQ(s)-fS(s)=0. (2.31) Подстановка s—jсо, соответствующая границе области устой¬ чивости, приводит к уравнению [АРг (to)-j- BQt (со) -f-Sx (со)] j [ АР2(<о)-f- 5Q2((o)-|- S2 (ад)] — 0, (2.32) где Pi (со), Qi(co), Si (со) —действительные части P(j со), Q(j со), S(jсо), соответственно, а Рг(со), Q2(co), 52(со)—мнимые части P(jсо), Q(/co), S(jсо), соответственно. Уравнение (2.32) сводится к двум уравнениям: где Мг ((B) = AP1(co)4-fiQ1((o)-l-51(co)==0; Ж2 (ш)=АРг (o)) + PQ2( ш) + 52 (со) = 0, решение которых относительно А я В имеет вид А (<а) = дл/д; 5(ш) = Дв/д, PiM Qi(m) q2 w —QiW — S2(co) Q2(co) —Si (®) Я2(со) — S2(co) Д = Д A До (2.33) (2.34) (2. 35) (2.36) (2.37) (2.38) На плоскости А, В каждое из уравнений Мх (со) =0 и М2(со) = =0 при некотором фиксированном со = со* определяет прямую. 100
i ""1> шпаты точки пересечения этих двух прямых представляют ©•и|.hi решение уравнений М;(со)=0 и М2{ш)=0 относительно А и />’ при со == со И:. При изменении значений со от—оодо +оонапло- in А, В прочертится кривая Г, являющаяся границей области \п шйчивости (см. рис. 2. 15 и 2. 16). Уравнения Mi(co)=0 и M2(co)=0 определяют одно значение I п В для каждого со только в том случае, если они совместны п независимы, т. е. если одновременно не обращаются в нуль Hi ределители А и Аа или А и Дв. Исли при некотором значении со = со, А =Аа=0 или А=Ав = 0, решения уравнений М1(со)=0 и М2(со)=0 неопределенны, т. е. одно уравнение является следствием второго. Указанные выше прямые при этом совпадают и, следовательно, всем значениям со, при которых определители обращаются в нуль, соответствуют и плоскости А, В не точка, а прямая линия, именуемая особой прямой. Точкам, не лежащим на кривой Г, заданной в параметриче¬ ской форме А=Л(со), В = В (со), соответствуют корни характе¬ ристического уравнения (2. 32) с неравной нулю действительной частью. Для обозначения области, в которой вещественные части этих корней отрицательны, граница Г штрихуется. Правило штриховки-, при движении по кривой Г по мере ро¬ ста значений со от со = —оо до со = +оо штриховка кривой Г ве¬ дется слева, если Д>0, и справа, если Д<0. Возможен случай, когда при некотором значении частоты со = со кривую Г пересекает прямая, именуемая особой прямой. Особая прямая штрихуется так, как показано на рис. 2. 15, если при прохождении точки со = со определитель А меняет знак, и не штрихуется, если при прохождении точки со = со знак А сохра¬ няется (см. рис. 2.16). Область, которая становится заштрихо¬ ванной в результате штриховки кривой Г, может быть областью устойчивости. В этом необходимо убедиться с помощью какого- нибудь критерия устойчивости, взяв любые значения А=А* и В = В* из этой области. При построении границ областей устойчивости параметр А из характеристического уравнения (2.31) всегда располагается по горизонтальной оси. Запасы устойчивости. Изменение одного или не¬ скольких коэффициентов а* характеристического уравнения (2. 25) ЛА приводит к изменению величины и знака корней его характеристического уравнения. Указанные коэффициенты зави¬ сят в общем случае от аэродинамических и конструктивных пара¬ метров ЛА, которые заданы или рассчитаны с известной точ¬ ностью. Поэтому теоретическое выполнение условий того или иного критерия устойчивости может не привести к действитель¬ ной устойчивости движения ЛА. Во избежание такого положе¬ ния, помимо самого факта устойчивости движения, необходимо 101
Рис. 2. 15. Пример штриховки границы областей устойчивости и особой прямой. При прохож¬ дении точек о) = со и со=0 определитель Д меняет знак Рис. 2. 17. К опреде¬ лению запаса устой¬ чивости по модулю h Рис. 2. 16. Пример штриховки гра¬ ницы области устойчивости. При »<0 значение Д>0, при со>0 значение Д<0; при прохождении точки со = со знак определителя Д сохраняется; особая прямая не штрихуется Рис. 2. 18. К опреде¬ лению запаса устойчи¬ вости по фазе у: 7—min jlarg s,|— 1аг^т|-т}: Sj—1-ый корень характе¬ ристического уравнения; i= 1, . . . , т 102
I ,'iiwM' знать, насколько близко корни характеристического урав- III huh ЛА расположены на комплексной плоскости к мнимой -и или к началу координат. Указанная близость характери- ;по1 запасами устойчивости, которые используются в виде ишаса устойчивости по модулю и запаса устойчивости по фазе. На комплексной плоскости распределения корней характери- | гнческого уравнения запас устойчивости по модулю h опреде- чяс'1'ся минимальным значением min |si| модулей корней | Si |,..., |sm|, где m — порядок характеристического равнения (рис. 2.17); запас устойчивости по фазе у опреде¬ ляется минимальным значением разности min arg Si где | arg5г-1 — абсолютная величина аргумента f-го корня харак¬ теристического уравнения порядка m (рис. 2. 18). Запасы устойчивости звена (системы) имеют смысл только для устойчивого звена (системы). Запасы устойчивости ЛА относятся к важнейшим характеристикам его динамических свойств, так как они влияют на его быстродействие, колебатель¬ ность и демпфирующие свойства. 2.2. ПРОДОЛЬНОЕ ВОЗМУЩЕННОЕ ДВИЖЕНИЕ ЛА 2. 2.1. Уравнения движения Линеаризированные уравнения продольного возмущенного движения ЛА представляются в виде где йЬУ -й-цД!/ <218д8 а — dt а21 фу —— а22 —— a2iд а а^——- — dt2 dt dt = я2Бд8в -)- а25 + ti2SMz в; dt аъ1 ФУ ®здД0“1 — azit\u = а36Д^ в, dt — д Э- —дб —[— да, = 0; дд» dt = Дид (2.39) (2.40) (2.41) В системе (2.39) неизвестными, т. е. выходными перемен¬ ными, являются отклонения ДУ, Д0, ДД и Да; входными перемен¬ ными в виде заданных функций времени являются управляющее воздействие Дбв и возмущающие воздействия Хв, Ув и MZB (см. разд. 2. 1. 1). 103
Нулевое решение системы (2. 39): \V = д1Л°)1=0; Д8 = Д0(О)=О; | (2 42} д& = д9(°)=0; да = Да(0>=0, J имеющее место при Д6В = 0, XB = YB = 0, MZB = 0, определяет про¬ дольное невозмущенное движение ЛА (табл. 2.1, п. 25). Динамические коэффициенты ац системы (2.39) соответст¬ вуют невозмущенному движению и являются известными функ¬ циями времени. В пределах применимости принципа «замороженных коэффи¬ циентов» динамические коэффициенты ац можно считать по¬ стоянными. Движение ЛА, определяемое общим решением системы (2.39), т. е. зависимостями ДУ(/), ДФ(£), Д0(О> Да {t), является суммой двух движений: свободного и вынужденного. Свободное движение определяется общим решением системы (2. 39) при ненулевых начальных условиях, которые можно рас¬ сматривать как результат импульсных воздействий в начальный момент времени t—t0 (см. табл. 2. 1, п. 18). Вынужденное движение определяется частным решением си¬ стемы (2.39) при заданных зависимостях A6B(t), XB(t), YB(t) или При заданных воздействиях характер вынужденного движения полностью определяется передаточными функ¬ циями ЛА. 2.2. 2. Характеристический многочлен и характеристическое уравнение Преобразование системы (2.39) с помощью соотношения (2.40), составление для преобразованной системы определителя M(s) = «11 0 «13 «14 ' «21 S (s ^22) 0 9 — ^24 ^24^ '«31 0 s a3s «34 0 - 1 1 1 (2.43) и раскрытие его приводит к характеристическому многочлену M(s)=s4 + A1s3 + A2s2 + A3s+A4, (2.44) где = as з -j- asi a23 ^ui -^2==«31«14 «31«13 &ъДзЗ «22«34 «24 «33«24~|- -j- а33а,ц ^34®ii -f- a22an “l- ^24^x1» A3= Я21«14 «31«22«14~i~ «22«31«13 4“ «24#sl«13 ~T -(- Ct-24Й33 «22«33«11""Ь «22«34«11 ~Г «24«11— «33«П«24> = ®21«33«14 «13«21«34 ~Ь «24«31«18 — «24«33«И' (2.45) 104
Приравненный нулю характеристический многочлен обра¬ зует характеристическое уравнение Исследование свободного продольного движения ЛА сво¬ дится к анализу корней характеристического уравнения (2.46) (см. табл. 2.5). Знак вещественных частей корней определяет устойчивость (или неустойчивость) невозмущенного движения (2.42), а вид и величина корней определяют характер продоль¬ ного свободного (возмущенного) движения. В общем случае многочлен 714 (s) можно представить в виде произведения двух квадратичных трехчленов Для продольного возмущенного движения ЛА типично нали¬ чие среди корней характеристического уравнения 7W(s)=0 двух пар комплексных корней, отличающихся друг от друга по мо¬ дулю: пары больших по модулю корней и пары малых по мо¬ дулю корней. Трехчлен Ps2 + 2T|s + l, соответствующий паре больших по модулю корней, определяет в суммарном свободном движении быстропротекающую составляющую — короткоперио¬ дическое движение. Трехчлен t2s2+2tt]S +1, соответствущий паре малых по модулю корней, определяет в суммарном свободном движении медленнопротекающую составляющую — длиннопе¬ риодическое движение. Для определения корней характеристического уравнения мо¬ гут быть использованы различные приближенные методы. Про¬ стейший из них, представленный в табл. 2. 5, сводит вычисление двух пар различных по модулю корней к решению, соответст¬ венно, двух квадратных уравнений: Пример 2. Пример посвящен расчету «приближенных» значений корней характеристического уравнения (2.46). Рассматривается полет ЛА на высоте 12 000 ж со скоростью 250 м/сек-, динамические коэффициенты ац системы {2. 39) имеют следующие значения: 714 (s)=s4 + Axs3 + A2s2 + A3s + Л4=0. (2.46) 2. 2.3. Свободное движение М (s) = А4 (TW + 2 ns +1) (tV + 2xns + 1), (2.47) ■S3 | (^34 ^22 ®24) ^ “l- (— ®24 ^22^34)' A2s2-|- A3sIf- A4—0. (2.48) (2.49) an = — 0,0134 1 /сек; «15 = 0; #2i = 0; «24 =— 2,98 1/сек2; a25 = — 2,32 1/сек2; a31 = 0,0007 1/м; «35 = °; «14 = — 9,35 м/сек2: «13 =—9,81 м/сек2; д22 = — 0,49 1 /сек-, «24 = —0,22 1/сек\ г -п. 105
Исследование свободного продольного движения ЛА Вид характеристического многочлена Состав движения М (S) = s4 + Л,S3 -J. Л252 4- + Лз5 + А4 Выражения для А\, А2, А3, А4 см. в (2. 45) Сумма длинно¬ периодического (медленного) движения и ко¬ роткопериодиче¬ ского (быстрого) движения Разложение характеристического многочлена на множители M(S)^A4(T2S2 + 2T!;A-1)X X (t2s2 + 2tt)s +1) х = — 4 s3 .(*3 + s4)3 11/2 S3 + S4 Ч' = 2 s3 .S3 + S4 «3 s34" s4/. 1/2 Mi (s) = s3 +A5s2 +.46s +Л7 A3 - : ^22 — ^22 4-(234 —aZ3 Ле = — Й24 — <*22^34 + + (a22 + #24) a33 Короткоперио¬ дическое (быст¬ рое) движение с уменьшением влияния длинно- периодического (медленного) движения за счет пренебре¬ жения измене¬ нием скорости Для Т, £ см. табл. 2. 6 М1 (s) = (ns2 + 2T^s + 1) X X (ts + 1) Ai — «24^33 Mi (s)« M (s) при йц»0 021 0; a31 к 0 (случай, когда и а33«0, см. в табл. 2.6) 106
Таблица 2.5 по характеристическому многочлену Выражения для корней характеристического уравнения приближенные Характеристика корней характеристического уравнения —£±-|Л2 — 1 —Ц±УГ]2— 1 Я22+а24 — а34 1 , - . ~Г\аЗ4~ д22— + + ^24 + д22я34] 1/2 Для ЛА типичным является случай, при котором уравнение М (s) = 0 имеет два больших по модулю корня (например, Si и s2), определяющих коротко¬ периодическое движение, и два малых по модулю корня (напри¬ мер, s3 и S4), определяющих длиннопериодическое движение в суммарном движении з,4' -А3±УА| -4А2А 2А2 Для Ai см. (2. 45) —n±Vi2-1 s3== —- As , 2 ± V *3; 4 ,Aj_ ' А6 Аб Два больших по модулю корня (Si и S2) определяют коротко¬ периодическое движение, а ма¬ лый корень «з определяет долю длиннопериодического движения в суммарном движении Для некоторых типов ЛА (на¬ пример, для баллистических ра¬ кет) типичным является случай, когда s3)>0, т. е. т<(0 107
Исследование свободного продольного короткопериодического Тип движения и вид характеристического многочлена Характер невозму¬ щенного движения при (—д22 —«21+Д34) >0 Характер переходного процесса Разложение характеристи условия разло¬ жения вид разложения Коротксшериоди- ческое движение (s) = s2-|-^gs + + Лд ^8 = — «22 — «24+ + «34 Лд = — («24 + + «22«34) iW2(s)» М (s) при ацякО «21 ~ о «31 «0 «33 ~ О (см. табл. 2. 5) Устойчиво [(«24 + «22«34) <С 0 ] Колебатель¬ ный Апериодиче¬ ский е<1 5 = 1 Ж2 (S) = T2S2 -f + 2 ns + 1 М2 (s) = (Ts + 1)2 6>1 Ж2(5) = (Г15+1)Х X (Г25 + 1) ТхФТ2 Неустойчиво [(«24 + «22«34> > 0] Апериодиче¬ ский e>i Нейтрально [(«24 + «22«34) = 0] M2(s) = (7>+1)Х X (Tis + 1) Ti Ф т2 М2 {s) = s(Ts + 1) Примечание. Для колебательного переходного процесса справед * *СВ — я24 — «22а34— («34 — «22—«24)" *а ~ V— «24 — «22 «34 = У~~ «24^. При |«24| > | Д22«34| «34 — «22—«24 (см. табл. 2. 2) 108
Таблица 2. 6 движения по характеристическому многочлену чес кого многочлена на множители корни многочлена и их характеристика выражения, необходимые для вычисления корней по динамическим коэффициентам ЛА Два комплексно-сопря¬ женных корня с отрица¬ тельными вещественными частями sh2 =' -Z ± Щ2-1 т = - 1 у —#24— «22«34 — «22—«24 + «34 5 = — «22 —«24 "Ь «34 2 Г — «24 2 У—#24—«22«34 при | й24 I > [«22«34| Корни кратные, веще- ственнные, отрицательные _ ' _1_ Т = (— #24 — «22«34) Корни вещественные, различные по величине, отрицательные si = ■ _1_ Т} S 2: 1 Т% т = Г1,2 = Г(£ ± /62-1) 1 «22 —«24 "I- «34 Y — «24 — «22 «34 ’ 2 У— #24 — «22 «34 Корни вещественные, один положительный, другой отрицательный 1 1 «1 = — — «2 = - 11 Т2 Один корень нулевой, другой вещественный, отрицательный 1 Sl = 0; s2 = — — Th2= у(± b+ УЬ2-4а) 1 ■ «24 — «22 «34 b =- — «22 —«24 + «34 —#24 — «22 «34 Т — (—#22 — «24 + «34) —1 ливы выражения (см. табл. 2.2): 109
следовательно, коэффициенты характеристического уравнения (2.46) согласно (2. 45) равны: Л! = 1,299; Аг = 0,0455; Л2 = 3,278; А4 = 0,0201. Уравнение (2. 48) s2+l ,287 s+3,263=0 определяет следующие приближенные значения пары больших по модулю корней: Уравнение (2. 49) Sj,2=—0,6435 ± j 1,688. 3,278 s2+0,0465 s + 0,0201 =0 определяет следующие приближенные значения пары малых по модулю корней: 5з,4=—0,0069±/ 0,0780. При этом точные значения корней равны: Si ,2=—0,644±/ 1,687; S3,i = —0,0056 ± / 0,0783. Как видно, приближенные значения корней достаточно близки к их точ¬ ным значениям. Так как для управления ЛА особенно важную роль играет короткопериодическое движение, то в ряде случаев целесооб¬ разно выделить это движение из общего (суммарного) движе¬ ния. С этой целью в уравнениях (2.39) можно пренебречь изме¬ нением скорости (см. табл. 2.5), что приведет к снижению на единицу порядка характеристического уравнения. Если допол¬ нительно пренебречь влиянием силы тяжести на возмущенное движение ЛА (см. табл. 2.6), то порядок характеристического уравнения станет равным двум. Исследование характера продольного свободного (возмущен¬ ного) движения представлено в табл. 2.5 и 2.6. Там же приведены выражения для коэффициента демпфирования, или декремента затухания Т для частоты свободных колебаний С0св и для ча- стоты свободных колебаний при отсутствии демпфирования (т. е. при а3 4—а22—а2 /=0) со а, называемой собственной частотой коле¬ баний Л А. 2. 2.4. Передаточные функции Считая коэффициенты уравнений системы (2.39) постоян¬ ными, можно преобразовать уравнения по Лапласу при нулевых начальных условиях к виду 110
(s — ац) ьУ (s) —a13A0(s) —a14Aa(s)=a16A8B (s) + T Д16^в(5)’ ' — a21 У (s)+s (s — a22) Д & (s) — a24Да (s) — а^Да (s) = = (a254-a25s)A8B(s)+a2eAf2B(s); — а31 У (s) — а33д0 (s)+5Д0 (s) — а34Да (s)= — а35^в (S)~bas6-^B (S)> — Д& (s) -(- Д0 (s)-j- Да (s)—0. (2.50) Используя систему (2.50), можно получить передаточные функции ЛА, определяющие его продольное возмущенное дви¬ жение (см. разд. 2. 14). Для каждой пары входной и выходной переменных можно получить свою передаточную функцию. В обозначениях передаточных функций нижний индекс отвечает входной переменной, верхний — выходной. В частности, разрешение алгебраических уравнений (2.50) относительно неизвестной A{l(s) приводит к выражению S — Ojl «16A8(s)+«16^b(S) а13 аи тЧ <м в 1 (a25 + ф?) Д8В (s) + a26Mz в (s) 0 г ^24 ^ 24*5 аз1 «35A8b(S)+«36^b(s) S й33 а34 0 0 1 1 (2.51) где Af(s) •—характеристический многочлен, определяемый выра¬ жением (2.46). Раскрытие определителя в (2.51) приводит к следующему выражению, определяющему полное изменение угла тангажа в продольном возмущенном движении: да (s)=K? (s) Д8В (5) + (S). хв (s) + + Y% (s) Ув (s) + У^ (s) Mz в (s), (2.52) где передаточные функции Kx(s), k*(s) и y^js) харак¬ теризуют реакцию угла тангажа на соответствующие воздейст¬ вия. При составлении структурных схем систем управления ЛА возмущающий момент может быть учтен в соответствии с пере¬ даточной функцией Fai (s) (см. схему «а» на рис. 2. 19). Но воз¬ мущающий момент можно также учесть, приведя его к углу 111
отклонения органов управления в соответствии с передаточном функцией Ymz{s) (см. табл. 2.7) (см. схему «б» на рис. 2.19). Если у ЛА нормальной схемы отклонение органов управле¬ ния слабо влияет на лобовое сопротивление, подъемную силу и на момент от запаздывания скоса потока, то можно пренебречь коэффициентами а\ъ,«25, а35 и учет возмущающего момента про¬ изводить в соответствии с выражением Кжг(5)=а26/а26, т. е. SB03M = —-^г. (см. схему «в» на рис. 2. 19). Щя а) 5) 6) Рис. 2. 19. Варианты учета возмущающего момента при составлении структурных схем Передаточные функции ЛА, определяющие реакцию различ¬ ных выходных переменных на управляющие и возмущающие воздействия, приведены в табл. 2. 7, 2. 7а и 2. 76. Передаточные функции для короткопериодического движения (см. разд. 2.4.3) таких ЛА, у которых максимальная подъемная сила крыльев вместе с нормальной составляющей силы тяги значительно пре¬ вышает вес ЛА (т. е. а33~0), приведены в табл. 2. 8. Передаточные функции ЛА, у которых нормальная сила органов управления мала по сравнению с подъемной силой крыльев, приведены в табл. 2. 9. Важным параметром передаточной функции ЛА является передаточный коэффициент, представляющий ее значение при s->0 (см. табл. 2. 1, п. 20). Различные передаточные коэффициенты ЛА, определяющие соотношения между различными парамет¬ рами входных и выходных переменных в установившемся состоя¬ нии, приведены в табл. 2. 10. Знак передаточных коэффициентов ЛА определяется его схе¬ мой, а также аэродинамическими и конструктивными характе¬ ристиками. Так, например, при mza<0 ЛА схемы «утка» имеют Ка>0, а ЛА нормальной схемы и схемы «бесхвостка» имеют Ка.<0. При построении частотных характеристик ЛА (см. разд. 2. 2. 5) его передаточный коэффициент считают положитель¬ ным, а знак «минус», если коэффициент отрицателен, учитывают при составлении структурных схем систем управления ЛА. 112
45 ч К я ф й s* Ш Я ч о =с о SD X о я ч о с к ч ч < 'Ч =г я я >> ’9- я Ег о ь й *=с + + + + Со ?Г СЧ1 + + о СЧ ю сч ч VO я ULP о ь> к я я я 0) ч <D CD Я О cq|Q3 I -4*1 ^ 03 I "sq sr _ч< CQ Tf + СМ Ч ' + + СО СО ч 1 - см | + СО со ч 1 + со со СО Ю Ч1 ч« - <м ч^ 1 со Ч ✓“—ч СО СО / S СО СО ч *< к аз + (М Со СМ + СМ Со см СЧ Я Ч со со Ч г-н х LO со Ч + Ч <3 4 1 ч«- 5 Ч 1 СО Ч СО »я оз + 1 of ■чг* - см 1 Ч Я я VO О + со со 03 со со ч; + Я ч ч Ч 1 1 Ч1 Ч w' Ч^ СО Ч 1 % ч^ LC3 см Ч ч 1 см ч Ч 1 ч4 (М ч 1 ч4 Ч^ со я я со ч со ч см Ч + ч со ч СО Ч 1 <5 и to LO ю LO /—V ч4 ер Ю ю ✓—ч со сз в ч в Ч ч3 ч Ч Фес CD Я II II II + 1 II 1 + CQ 03 ем Q3 СО 03 Ч4 03 Ф> СС е£> < <3 ср <1 * <! 113
Продолжение + Ь-ч - + + со UJ> к <N + *=3 \о сЗ н к t; <D fcf <U o< в о 1=3 + ^ I ^ + со + Co со ^4 + CO fC tq | oq 3< + co CO + <M CO CM + + CO co + В <D Я CQ I! (M tq 03 + Co CO 03 + cm Co CM OQ CQ <ю ^ * <1 dp <1 4 <1 * <1 H <a 114 Примечание. Для ЛА типичным является случай, при котором уравнение f^s3 + B2S2 + B3s + В4 = 0 имев! два больших по модулю вещественных корня (определяемых параметрами Т\ и и соответствующих короткоперио¬ дическому движению) и один малый по модулю вещественный корень (определяемый параметром т; и соответствую¬ щий длиннопериодическому движению)
\ Таблица 2.7а Передаточные функции Л А для полного продольного движения Обозначение Общий вид А8 О.) ASB(s) = У\ W У1(*) С1 S3 -j- СоЗ'2 4~ C;,s -j~ С 4 s4 4- Л^3 4- Л2«2 + Л3з + Л4 Выражения для А,• см. в (2. 45) С1 = «35 С2 = —Л35 («П + «22 + «24) + «25«34+«15«з4 С3 = Д35 («ц(«22+ «24) —«24] + «2о«34— — «25 («П«34 — «14«3l) ~ «15«31 («22 +«24) С4 = «35 («11«24 — «21«м) — «25 («11«34 — — «14«з0 — «15 («31«24 — «21«34) А6 (Д) А8В (S) = П (S) У\ (5) s (Cjs3 + C2s2 + C3s + C4) s4 + Л^3 + A2S2 + A3s + Л4 Выражения для A-L см. в (2. 45) Да (s) ДВ B(s) =W W = Dis3 + Z)2s2 + 03s + D4 s4 -f- AiS3 4- Л2$2 4~ A3s + Л4 Выражения для Л; см. в (2.45) D\ =« 25 «35 Z)2 = — а35 («22 — «ц) 4- «25 —«25 («п + + «зз) — «15«31 D3— — «35«11«22 — «25 («11 + «зз) — — «25 («31«13 — «11«33) + «15 («31а22 + «21) D4 = «35«21«13 — «25 («13«31 — «11«3з) — — «1Б«21«33 115
Передаточные функции ЛА для короткопериодического продольного движения 'О К. см <3 к 116
117
Передаточные функции ЛА для продольного корпи.., Лхвх • Л*вых Общий вид А-^ВХ — А?)в А-^вых = Ай й25 5 + (а25 +а25а34—a24a3s) 5 — #24я35 + а25а34 S [s2+ (й34 — #22 — а24) 5 — й24 — ^22^34]. А-^вх — А5в a25s2 (а25 +а25а34 — a24a35)s— а24 в35 + а2Бл34 А-^вых == Ай 5 ) с\ / F \ 52 + (#34 — #22 — #24) s — #22#34 — #24 Алгвх — А?в А^вых = Аа — (а33 —а2б) 5 + (й2-5 + Й22^35) Kg(s)= 52 + (#34 — #22 — #24/ 5 — #24 — #22#34 А-^вх == А?в А-^вых — А9 П a35s2 + (<225 a34 — a22a35 — а24 ^Зб) 5 — а24а35 + а25а34 / 5 ($)= : — S2 -f (а34 — #22 —#24) 5 — #24 — #22#34 Д*вх = ДВв ув^ J a35s2 + (a25a34 — а22а35 — а24 а3б) S — «24^35 + а25 а34 А-^вых — А9 S [s2 + (#34 — #22 — «24) s — а24 — й22й34] 118
Таблица 2.8 tti риодического движения («ц = аы = «3i = я33 = 0) j И пиде разложения на. множители • hi ЛА схем „утка“ н I поворотными ВОК¬ РУГ оси OZi крыльями для ЛА нормальной схемы и схемы „беехвостка" Выражения параметров числителей перела- точных функций через динамические коэффи¬ циенты ЛА (для параметров знаменателей см. табл. 2.6) к=- -«25«34+«24«35 «24 + «22«34 Тг = В+ V А +В2 Т2 = В—У А+В2 (см. табл. 2.10) А = • ^25 В-- ■«24«31 — «25«34 Г Г «25 + «25«34 — «24 а35 «25«34 —«24«35 к г6« +1 T5s + 1 ... «25 + «22а35 , , 0 1П, K„ — — (см. табл. 2. 10) «24 + «22«34 ^ «35 7 5 — . #25 + #22 #35 «25 i<235 Г6- «25 + «22 «35 'Ч|х т^ + 2Т& + 1 ,ч“ r2s2 + 2T£s + 1 • 7’es2+27'fi^e's+1 ,ДГз5+1)(Г45+1) „ —«2Г«34 i «2;«35 „ „ Г. Шч /С— (см табл. 2. 10) #24+#22#34 т 1 a3S 9 «25«34 — «24«35 f F «25 «34 — «22«35 — «24 «35 К Г252 + 2Д5+ 1 Д T2S2 + 2 T£s + 1 'Т*р+2Г^ + \ „ (7V+1)(7V+1) 9 2 У a35 («25«34 — «24«35) Г3 = £> + VC+D2 c = — «24«35 ~ «25«з4 T4=D — yc + D2 «35 («22 + «24) «24«35 — «25«34 К s(TW+2Tts+\) д s(7'2s2+27’£s+l) 119
Таблица 2. f) Передаточные функции ЛА для продольного короткопериодического движения (при ап = a2i=a3l=a15=a33=a'25 = а35=.0) Д'АГвх. А*вых А-*ГВХ — АЬВ Алгвых ~ А$ AaTry I А-^вых — А® А^вх — АЬВ А-^вых ==А Ну Вид передаточной функции K(TlS + l) а s(7’2s2 + 2rss +1) s T2S2 + 2ns + 1 У\ (S) = к S (T2S2 -j- 2T£s + 1) H(s) = к T 2S2 + 2rgs + 1 П (0 = /CTj Г252 + 2 ns +„1 K- Y7Xs)=- _Vl 8 T2S2 + 2 ns + 1 Выражение параметров передаточной функции через динамические коэффициенты ЛА к=- «25«34 «2 4 + «22«34 Т, = • «34 т = — («24 + «2 2 «34) S = «34 — «22 — «; •24 2 К — («24 + «22 «34) (см. табл. 2. 6) 120
< «2 + Я * я са К я е* О я л <у с о я н о О. § О я я п о t=C О CU к S < f=s 3 н я я *& О) о я я я о н Я »=с о<и «8^ X s «и 2 Я се Я Ь К к •8*2 *9-5 9 я «3 + С , - CN + + Н" + я си я 8 эинэьинео90 я К < С? н я <и я яг я *& •8* о ЭЯ си Рэя |§ Э 2 Г1. г* <и >D § и иг и иг < 1=3 н я к 2 Я Я Я я ,Hi ч> г£г си ’в4 о 2 я §£ =3 о, л S я О !Я д о л н Ч Я ев « S ^ CU CU о а 2 с к § « < I ^ Ъд М *0 «< *=2 Н я а> я gg •&« f & <D as Я 3 sS S О £ 33 о д £ ^ s «в t=[ g -1) s S? v <M . -— « Ю ^ го ! Q + s £ « Q — CU я cn «I в Ш \l a < t? н я <D Я Я я *&• *©< CD О Я 121
Передаточные коэффициенты ЛА характеризуют его манев¬ ренные свойства. Так, в частности, они показывают, что в резуль¬ тате ступенчатого отклонения органов управления на угол Д6„ по окончании переходного процесса (см. табл. 2. 1, п. 22) уста¬ навливаются постоянные значения угловых скоростей Дт&, Д0 и нормальной перегрузки Дпу. Имеют место соотношения: (Д»)уст=( Дб)уст = К Д8„; (2.53) (Д^#) уст= К Д8В, (2.54) g причем максимально возможные установившиеся значения угло¬ вой скорости и нормальной перегрузки равны: (Аё)гаах=АС(д8в)гаах; (2.55) (Л/^)тах=Л'у (Д8в)шах» С2-56) где (Дбв)тах'—максимально возможное значение угла отклоне¬ ния органов управления ЛА, не нарушающее линейности исход¬ ных уравнений возмущенного движения (2.39). 2.2. 5. Частотные характеристики Передаточные функции ЛА таковы, что сомножитель, соот¬ ветствующий передаточной функции колебательного звена, вхо¬ дит во все основные передаточные функции ЛА. Частотные ха¬ рактеристики колебательного звена (рис. 2.20 и 2.21) показы¬ вают, что при слабом демпфировании (£<^1) и при частотах отклонения органов управления со, близких к собственной ча¬ стоте колебаний соа (см. табл. 2.6), наступает резонанс, причем амплитуда колебаний достигает максимума при фа=УТ^2ё. (2.57) Поскольку резонанс наиболее сильно проявляется при малых значениях g, обычно за резонансную частоту принимают собст¬ венную частоту юа, равную 0)а==УГ (®24“Г ^22^34)" (2.58) Передаточные функции ЛА типа KUs), W(s) и Yse(s) яв¬ ляются непосредственно передаточными функциями колебатель¬ ного звена. На рис. 2. 22 приведены примеры логарифмических частотных характеристик ЛА, соответствующих этим передаточ¬ ным функциям. Примеры частотных характеристик, соответст¬ вующих передаточным функциям ЛА, приведенным в табл. 2. 7, 2.7а, 2. 8 и 2.9, представлены на рис. 2.23—2.30. 2. 2. 6. Переходные функции Переходные функции ЛА (см. табл. 2.1, п. 23), определяю¬ щие поведение различных выходных переменных Л А в коротко- 122
Рис. 2.20. Амплитудно-частот¬ ные характеристики колеба¬ тельного звена Рис. 2.21. Фазо-частотные характеристики колебательного звена 123
124
А,д5г Рис. 2.26. Логарифмические частотные характеристики мно¬ жителя Tis+l: Г1=0,42 сек Рис. 2.27. Логарифмические ча¬ стотные характеристики переда¬ точных функций ■&(s)/6(s) и O(s)/ 6(s) ЛА с поворотными крыльями: |/f| =2,38; Г=0,1 сек; 5=0,15; Т,-= =0,084 Сек 125
Рис. 2.28. Логарифмические ча¬ стотные характеристики переда¬ точных функций 0(s)/6(s) и 0(s)/6(s) ЛА с поворотными крыльями: I, #[1=2,38; 7=0,1 сек; 5=0,15; 7в = =0,09 сек; =0,05 Рис. 2.29. Логарифмические ча¬ стотные характеристики переда¬ точной функции a (s)./6(s) Л А с поворотными крыльями: Ка =0,1; Т=0,1 сек; |=0,15; Г6=0,125 Рис. 2.30. Логарифмические ча¬ стотные характеристики переда¬ точной функции ft(s)/6(s): 7’=0,55 сек; £=0,35; 7’i = l,76 сек; Т2=0, т=12,7 сек; £х =0,07; Ti=71,4 сек а—полные частотные характеристики; б—при допущениях ДУ=0 и а44А0=О 126
iii |>подическом движении, вызванном ступенчатым отклонением ' ||)1.1 нов управления, представлены в табл. 2. 11 и 2. 12. Таблица 2.11 Переходные функции ЛА по Ф, Ф и 0 при Абв=[1], g<l Название Обозначение Выражение для переходной функции h (t) 11ереходная функ¬ ция по углу тан¬ гажа да h (0= — ’ КАЬ да К Д8' t т, — —25 + — • т т 5 t Г1—25—ч- (—) т у _ т V т ) 1-52 V1—52 X Sin I t + 92 X tg<P2 = /1-52^-25 1-252 + 5 ^r Переходная функ¬ ция по угловой скорости тангажа , да А (/)— ^ ’ КАЬ Т ^ /Гх\2- *-*т+Ы 1-52 X / V1—52 X COS t + 91+92 tg(fl + ?2) = т V i — s2 Переходная функ¬ ция по углу накло¬ на траектории *(0= де КАЬ А8 КАЬ = Т 'У 1 — 52 X sin | t — 2<Pi 25 ^Г=^52 tg 2<f! = 1—252 127
Название Обозначение Переходная функ¬ ция по углу атаки *(0= Да АГ7’1Д8В Переходная функ¬ ция по угловой скорости каса¬ тельной к траек¬ тории А (О Д6 Каьв Переходная функ¬ ция по нормальной перегрузке А(0= Апу V К— Д8 g В Переходные функции Л Л ш Колебательный игре выражение для h (t) Да е = 1- -Т* KTiAbB ' V1 — 52 X X cos tg <Pi = ' ■t — <f i _J . Д0 e -7' ДДВв • Kl—£2 x X cos * — Vi tg<Pi = ' 5 yi_g2 Any V К— Д5В g =1 V1—£2 X X cos /1—s* tg?i = _j VT^2- 128
Таблица 2.12 <1, 0 и Пу при А8В = J1] • Ходный процесс (Е < 1) Апериодический переходный процесс (Е > 1) некоторые показатели качества выражение для Л (О некоторые показатели качества Д^тах ~ Д&уст О “Ь °)» яЕ Yi—i* а = е Дауст = КТ iA3 Да КТ^АЪ ~ _ -О-ь-Н*"1' A^max ~ ^CtycT = = КТгАЬ ^^max == Д^уст О ~Ь а)> *Е YiTTz} а — е дбуст = *:д5 Д0 ДД8 ==1~ “(1+г”0е Англах == А^уст ~ = каъ max ^ &Пу уст О “Ь а)> 7СЕ VI-Е2 °а= е V Д/2w уст — А8 £ АПу V К — ДЗ g -Ы‘У¥' Дпу тах“ АЯу уст= V = к — Д5 g 5 3398 12
Рис. 2.31. Изменение угла д и угло¬ вой скорости Ь в переходном про¬ цессе 9 Да КТ, AS ДЭ Рис. 2. 32. Изменение угла 0 в пе¬ реходном процессе а (И в зависимости от относи¬ тельного коэффициента демп¬ фирования % Рис. 2.33. Характер переход¬ ного процесса B(t), ny(t) и 130
Примеры переходных процессов, соответствующих некоторым переходным функциям табл. 2. 11 и 2. 12, приведены на рис, 2. 31 — 2.33. Как показывают приведенные зависимости, переходные про¬ цессы по Да, А0 и Апу различны при различных значениях отно¬ сительного коэффициента демпфирования |. При заданном зна¬ чении g время переходного процесса Трег (см. табл. 2.2) обратно пропорционально собственной частоте колебаний юа (см. табл. 2.6). Наиболее короткий переходный процесс имеет место при g = 0,75. В этом случае длительность процесса равна Грег — ЗГ — З/сОа. (2.59) Выражения для Т, Ти g и К, входящие в значения переходных функций табл. 2. 11, приведены в табл. 2. 6-1-2. 10. 2.3. БОКОВОЕ ВОЗМУЩЕННОЕ ДВИЖЕНИЕ ЛА 2.3. 1. Уравнения движения Линеаризированные уравнения бокового возмущенного дви¬ жения ЛА представляются ib виде dAia,- dt фЬц Ашх Ь^А^у ЬиА$— — + ^18Д^э + в» dt b^n — b^ — b '24 " dt --Ь2чАЬп-\-Ь dA 27 ■ dt - b29 в; dA'bc dt ' (^S4~b ^34) Др ^36 Ду ^37Д^Н “Ь ^39^в» 1 COS & (°) dAfy л Д°ф- л^=°; at А«>х — (tg а)(0) Д">г/ — =0, dt (2.60) где., (cos0)(°> дфс+дР —(§ina)(°)ду —(со5 0)(°1дф = О,. (2.61) В системе (2.60) неизвестными, т. е. выходными переменными, являются отклонения Дсож, Аа>у, Дф0, Д|3, Ду, Аф; входными пере¬ менными в виде заданных функций времени являются управляю¬ щие воздействия Дбн, Дбэ и возмущающие воздействия Мх в, Му в, ZB (см. разд. 2. 1. 1). 5* 131
Нулевое решение системы (2. 60) —(2. 61): Дюдг = Л<40) =0; др = др> = 0; дш^ — дш<0) =0; Ду = Ду(0> = 0; Дфс = Дфс0) = 0; дф=др) = 0, при А6н = Абэ = 0; ZB = 0; (2.62) имеющее место при А6н = Дбэ = 0; ZB = U; УИхв=УИ3/в = 0, опреде¬ ляет боковое невозмущенное движение ЛА (см. табл. 2.1, п. 25). Все коэффициенты уравнений (2.60) — (2.61), в том числе динамические коэффициенты Ьц, соответствуют невозмущенному движению и являются известными функциями времени. В преде¬ лах применимости принципа «замороженных коэффициентов» их можно считать постоянными. Движение ЛА, определяемое общим решением системы (2.60) , т. е. зависимостями Дсо* (t), Дсоy (t), Афс(0> АР(0> Ау(0> Аф(/), является суммой двух движений — свободного и вынуж¬ денного. Свободное движение определяется общим решением системы (2.60) при ненулевых начальных условиях, которые можно рас¬ сматривать как результат импульсных воздействий в начальный момент времени t=to (см. табл. 2.1, п. 18). Вынужденное движение определяется частным решением си¬ стемы (2.60) при заданных зависимостях Абн(^), А6Э(0> Мхв (t), MyB(t). При заданных воздействиях характер вынуж¬ денного движения функциями ЛА. полностью определяется передаточными 2.3. 2. Характеристический многочлен и характеристическое уравнение Преобразование системы (2.60) с помощью соотношения (2. 61) приводит систему к виду б?Дых < , . , . п dt ■ — biz — ьи ДР = — Ь21 Дсо —&Х7д8н-}-&18д8э-1-&19УИХ в; dAay -баяДШу-МР-^ — dt dt &27Д8н-|-^27 dAbH dt +^29 Му в; 1 cos 8 + (0) 1 (0) ЙДр cos и у dt + cos в у dt А«Д —(tga)(0) dt =0; l cos 8 (0) A<V dAty dt = 0. (2.63) 132
Последнее уравнение можно не учитывать, так как в осталь¬ ные уравнения приращение Дф не входит и уравнение для il/\ty/dt можно проинтегрировать после решения оставшихся уравнений. Составление для первых четырех уравнений системы (2.63) определителя М (s) = 1 -(tg9)C°> 0 — s и раскрытие его приводит к характеристическому многочлену где М (s) — | A2s3 -\- .AgS-j- Л4, cos 0 \(°) Ax — bM (1g S)(0) (sin a)(°> — Й24 (2.65) + Mcos0)<°> -bn+ cos 8 + &34(cos0)(O) — b22\ A2 — — 624635 (tg & cos 0)(°i — 612624(sin a)<°) -j-614(sina)(°> — — /0u624(*gfrsina)<°> -\-b2i (tg ® sin a)<°) — 624 COS 0 \ (0) cos 0 ^(0) + 6цb\ 24 COS 1 cos & • 6n634 (cos 0)<°> + (- 6226s4 - — 6U634 — 622634) (cos 0)<°) +6U6U — 612621; A3 — {ЬурчФ3ъ 'Г ^14^35 “1" 6ц6126д4 bi2b21b3i -|~ + bnbnb[4 — 6126216s4)(cos0)(O) + 6^24635 (*g frcos0)<°> — — *24*85 (tg® cos 0)<°> — 612624(sina)(°>-f 614622(sina)№ — — 6ц624 (tg & sin a)<°> -f bub21 (tg & sin a)<°) — (2.66) - 614621 COS 0 \ (0) cos i +bnb 24 COS 0 \(°) COS ч A4 (^12^24^35 ^14^22^3б) (C0S + (^11^24^35 -A4M35)(tg&cos0)<°>. Приравненный нулю характеристический многочлен M(s) образует характеристическое уравнение М (s)= si + A±s3 + Л 2s2 + Л3« + Л4=0. (2.67) 133
2. 3. 3. Свободное движение Исследование свободного бокового движения ЛА сводится к исследованию корней характеристического уравнения (2.67) (см. табл. 2.5). Знак вещественных частей корней уравнения (2.67) определяет устойчивость (или неустойчивость) невозму¬ щенного движения (2.62), а вид и величина корней характери¬ стического уравнения (2.67) определяет характер бокового сво¬ бодного (возмущенного) движения. Для бокового возмущенного движения ЛА типично наличие среди корней характеристического уравнения M(s)=0 одной пары комплексных сопряженных корней и двух вещественных корней. При этом многочлен Af(s) можно представить в виде следующего произведения сомножителей: A7(s)=A4(r2s2 + 271s + 1)(7V+ 1)(7>+ 1). (2.68) Двум вещественным корням соответствуют два апериодиче¬ ских движения, паре комплексных — колебательное. Все три частных движения существуют одновременно и, накладываясь друг на друга, образуют боковое возмущенное движение. При этом один из двух вещественных корней обычно велик по абсо¬ лютной величине по сравнению с другим, а комплексные корни имеют по модулю обычно промежуточные значения. Движение, соответствующее большому по абсолютной вели¬ чине вещественному корню, называется движением крена. За¬ ключается оно, в основном, в изменении угла крена и угловой скорости крена. Движение, соответствующее малому по абсолютной величине вещественному корню, называется спиральным. Обычно этот «малый» корень больше нуля, что приводит к соответствующей неустойчивости и называется спиральной неустойчивостью. Движение, соответствующее паре комплексных корней, назы¬ вается колебательным. Спиральное и колебательное движения образуют движение рысканья. Пример 3. Пример посвящен иллюстрации значений корней характери¬ стического уравнения (2.67). Рассматривается полет ЛА на высоте 12 000 м со скоростью 250 м/сек. Характеристическое уравнение (2. 67) имеет вид s4+1,909 s3+2,69 s2+3,95 s—0,00437=0, а значения корней таковы: s,=—1,695; «2=0,001105; s3,4=— 0,107±/ 1,525. Для аэродинамически осесимметричных ЛА, стабилизирован¬ ных по крену или угловой скорости крена, можно пренебречь влиянием движения крена на движение рысканья. В этом случае система линеаризированных уравнений бокового возмущенного движения (2.60) — (2.61) распадается на две изолированные подсистемы — систему уравнений возмущенного движения ры¬ 134
сканья (2.69) и систему уравнений возмущенного движения крена (2.71). 2. 3. 4. Уравнения движения рысканья Линеаризированные уравнения возмущенного изолированного движения рысканья представляются в виде сР- Дф dt 2 ^22 d№j dt bub$ — b'2i dt =b„^a + b'„-^- + btaMl,Bi (2-69) at где дф— ДР — Д<1>с=0. В системе (2.69) неизвестными, т. е. выходными перемен¬ ными являются отклонения Дар, Д|3 и Aapc; входными переменными в виде заданных функций времени являются управляющее воз¬ действие Дбн и возмущающие воздействия Муъ и ZB. Нулевое решение системы (2. 69): Дф=Дф<°) =0; др=др(0) = О; Дфс = Д^0)=О, (2.70) имеющее место при Дбн = 0; Муъ = 0; ZB = 0, определяет невоз¬ мущенное движение рысканья (см. табл. 2. 1, п. 25). В уравнениях (2.69) динамические коэффициенты Л А Ьц являются известными функциями времени, которые в пределах применимости принципа «замороженных коэффициентов» можно считать постоянными. 2. 3. 5. Передаточные функции и частотные характеристики ЛА в движении рысканья Используя систему (2.69) в пределах справедливости прин¬ ципа «замороженных коэффициентов», можно найти выражения передаточных функций динамических осесимметричных ЛА (см. разд. 2. 14), характеризующих движение рысканья. Уравнения движения рысканья ничем не отличаются от урав¬ нений короткопериодического продольного возмущенного дви¬ жения. Указанные уравнения имеют одинаковый вид, причем углу тангажа Ф соответствует угол курса ф, углу наклона траек¬ тории 0 — угол скоростного курса фс, углу атаки а — угол скольжения (3, углу отклонения органов управления тангажом Дбв — угол отклонения органов управления рысканьем Дбн, ди¬ намическим коэффициентам — динамические коэффи¬ циенты Ьц. 135
В силу указанного совпадения передаточные функции, харак¬ теризующие движение рысканья, ничем не отличаются от пере даточных функций, описывающих короткопериодическое про¬ дольное возмущенное движение. Справедливыми остаются так же и дальнейшие упрощения, анализ свободного движения и переходных процессов, а также частотные характеристики, соот ветствующие указанным передаточным функциям. 2. 3. 6. Уравнения движения крена Линеаризированное ^уравнение возмущенного изолирован¬ ного движения крена представляется в виде + ьпмх в, (2.71) где динамические коэффициенты Ьц равны: М, » Ь18= у19 " (2. 72) В уравнении (2.71) выходными переменными являются отклонения Ау и Ду; входными переменными в виде заданных функций времени являются управляющее воздействие Абэ и воз¬ мущающее воздействие Мх в, где Мх в •— возмущающий момент крена, который может, в частности, учитывать влияние движе¬ ния рысканья на движение крена: Мха*=шх в+ Map + АГ>д8н+ MlyL*y. (2.73) Как и при исследовании продольного возмущенного движе¬ ния, можно положить МХЪ=М\. (2.74) Нулевое решение уравнения (2.71): ду== ду(°) ==0; ду=ду(°)=0, (2.75) имеющее место при Д6Э=0, Мхв=0, определяет невозмущенное движение крена (см. табл. 2.1, п. 25). В уравнении (2. 71) динамические коэффициенты Ьц являются известными функциями времени. Поскольку процессы стабили¬ зации угла крена или угловой скорости крена протекают доста¬ точно быстро, то обычно при исследовании этих процессов используется прием «замораживания» динамических коэффи¬ циентов bij. 136
:t. 7. Передаточные функции и частотные характеристики ЛА в движении крена По уравнению (2.71) в пределах справедливости принципа «1.1 мороженных коэффициентов» можно составить следующие передаточные функции: Я.(*)= д-f (S) К э УШ А5Э (s) s (Тas -f- 1) (2. 76) _дт(£) Кв Д8Э (s) Tas + 1 (2. 77) где Къ — передаточный коэф¬ фициент ЛА в движении крена, равный ^18 /с Ьп , (2.78) а Та — постоянная времени ЛА в движении крена, рав¬ ная Т = 1 э bn .(2.79) Рис. 2.34. Логарифмические частот¬ ные характеристики передаточной функции y(s)/6a(s): |*ГЭ|=3; Т = 1'2 сек~1 Постоянная времени Тэ, характеризующая запаздывание реакции ЛА в отклонении органов управления креном, всегда положительна, так как всегда !ЛХХ < 0. Примеры логарифмических частотных характеристик, соот¬ ветствующих передаточным функциям (2.76) и (2.77), приве¬ дены на рис. 2. 34-4-2. 36. 2. 3. 8. Переходные процессы по углу крена и угловой скорости крена при ступенчатом отклонении органов управления креном Изменение по времени угла Ау и угловой скорости Ау при ступенчатом отклонении органов управления креном описы¬ вается следующими уравнениями, соответствующими передаточ¬ ным функциям (2.76) и (2.77): Г\ г»)]; ДЬЭ 12.80) е г*)- (2.81) Пример переходного процесса по Ау, описываемый соотноше¬ нием (2.81), изображен на рис. 2.37. 137
138
2.4. ЛЕТАТЕЛЬНЫЙ АППАРАТ КАК НЕЛИНЕЙНЫЙ ОБЪЕКТ УПРАВЛЕНИЯ 2.4.1. Уравнения движения Возмущенное движение ЛА (см. разд. 2.1.7) описывается в общем случае системой нелинейных дифференциальных урав¬ нений вида дхг = А7(а;{0), 40); ДХь ..Ах„) (1 = 1,..., л), (2.82) (0) (0) где я — порядок системы; х{ ,, х'п — переменные, характе¬ ризующие невозмущенное движение ЛА (например, У<°), сс(0), у(0) и Др.); Ах\,..., Ахп — переменные, характеризующие возмущенное движение ЛА (например, А У, Аа, А#, Ау и др.). Предполагая, что функции Х{ допускают разложение по сте¬ пеням возмущений AXi в ряды, сходящиеся в некоторой доста¬ точно малой М-окрестности невозмущенного движения 2 А-! < М, (2. 83) /- 1 и выполняя такое разложение, систему (2.82) мы можем пред¬ ставить в виде П Д^=2 а«(х10). •••. 40))-Д-^й + ЛАгг(^0),..., х(п0), Axlt..., АХ„), й= 1 (1 = 1,..., л), (2.84) где ацг •—коэффициенты линейной части разложения, а функции АХ, содержат лишь члены второго и выше порядка относительно возмущений Ахь ..., Ахп. Основываясь на малости возмущений А я* (7=1,..., я), можно пренебречь членами второго и выше порядка относительно воз¬ мущений и считать, что возмущенное движение ЛА описывается системой линейных уравнений Дxi = '2iaik{xi,...,x0„)Axk (/=!,«.., я). (2.85) г= 1 Уравнения (2. 85) называются уравнениями первого прибли¬ жения, или линейным приближением системы (2. 84). Поскольку коэффициенты аш в системе (2.85) суть явные функции параметров невозмущенного движения ЛА, которое предполагается известным, то, следовательно, коэффициенты aih являются в общем случае известными (заданными) функциями времени. В дальнейшем (как и в разд. 2. 1—2.3) предполагается справедливым «принцип замораживания» коэффициентов, т. е. 139
предполагается, что aik = const (i, k=l,..., n). Если условие по¬ стоянства коэффициентов eta не выполняется, то это специально оговаривается (см. разд. 2.4.4—2.4.6). Для решения задачи об устойчивости ЛА с помощью системы (2. 85) большое значение имеют корни sb ..., sn характеристиче- - ского уравнения D(s) =0 (см. разд. 2. 1.4), имеющего вид ^(s) = K*-s8«| = 0 . (*, я), (2.86) где const; 8/ft= 1 при i=k и 8гй —0 при i ф k. В зависимости от свойств ЛА система линейных уравнений (2.85) может быть в свою очередь разделена на несколько неза¬ висимых подсистем, описывающих соответственно продольное возмущенное движение (система уравнений (2.39), разд. 2. 2.1), возмущенное движение рысканья (система уравнений (2.69), разд. 2.3.4) и возмущенное движение крена (система уравнений (2.71), разд. 2.3). В связи с тем, что правомерность замены нелинейных уравне¬ ний (2.84) линейными (2.85) не очевидна, возникают следую¬ щие задачи: а) отыскание условий, при которых для исследования устой¬ чивости и характера возмущенного движения Л А допустимо рас¬ сматривать линейные уравнения первого приближения (2.85); б) указание способов и методов исследования устойчивости и характера движений ЛА в тех случаях, когда уравнения пер¬ вого приближения (2. 85) для этих целей непригодны. 2. 4.2. О допустимости исследования устойчивости невозмущенного движения ЛА по уравнениям первого приближения Если ограничиться рассмотрением возмущенных движений ЛА в Л4-окрестности (2.83) невозмущенного установившегося движения, т. е. достаточно малыми значениями возмущений Axi,..., Ахп, то допустимость исследования устойчивости ЛА по линейным уравнениям (2.85) вместо нелинейных (2.84) опреде¬ ляется следующими теоремами А. М. Ляпунова. Теорема 1. Если вещественные части всех корней S\, ..., sn характеристического уравнения (2.86) первого приближения отрицательны, то невозмущенное движение (Лч<0),..х(ф) асимп¬ тотически устойчиво независимо от нелинейных членов AXi (i = = 1,..., п) уравнений (2.84). Теорема 2. Если среди корней s i,..., sn характеристиче¬ ского уравнения (2.86) первого приближения найдется по край¬ ней мере один корень с положительной вещественной частью, то невозмущенное движение (х[0),..Хп°у) неустойчиво незави¬ симо от нелинейных членов (г = 1,..., п) уравнений (2.84). Случаи, когда среди корней характеристического уравнения 140
(2.86) имеются нулевые корни или корни с нулевыми вещест¬ венными частями, называются критическими случаями. Во всех критических случаях, как показал Ляпунов, вопрос об устойчи¬ вости невозмущенного движения не может быть разрешен с по¬ мощью уравнений первого приближения (2.85), а должен быть решен с учетом нелинейных функций ДХг- (г = 1,..., п), т. е. по уравнениям возмущенного движения в полном виде (2.84) или (2. 82). Таким образом, общим признаком допустимости использова¬ ния уравнений первого приближения для анализа устойчивости движения ЛА при достаточно малых возмущениях Д%ь ..., Ахп является отсутствие нулевых или чисто мнимых корней харак¬ теристического уравнения (2.86). Пример 4. Предполагается, что продольное возмущенное коротко¬ периодическое движение ЛА (см. разд. 2. 2. 2. и 2. 2. 3) описывается нелиней¬ ным дифференциальным уравнением Да + Да = АДа(ЗДа2 — Да2 ), в котором вид правой части обусловлен нелинейностью аэродинамических характеристик ЛА. _ I ' В обозначениях Aa=Axi, Аа=Ах2 исходное уравнение эквивалентно сле¬ дующей системе уравнений: Ах\ = — Д x<i + ААх\\ Ах2 = Ах\ + ААх^, для которой характеристическое уравнение первого приближения s2+l=0 имеет два чисто мнимых корня: Si,2—±j. Соответствующее решение по пер¬ вому приближению для начальных возмущений Дхю, Ах20 принимает вид Дхх = Дхш cos t — Дд"2о sin t\ Ах2 = Длдо sin t + Длгго cos t- Согласно определению устойчивости (см. разд. 2.1.7) состояние равно¬ весия ЛА.Ах1 = 0, Ах2=0 устойчиво (но неасимптотически!), так как для лю¬ бого заданного числа е>0 при условии 1А-^ю1 < -у; 1Д^2о1 < у выполняются неравенства !Д.*л! < е; 1Д-Г21 < £ для всех t^sO. Однако данный случай относится к разряду критических и по¬ этому вопрос об устойчивости может быть строго разрешен только с учетом нелинейных членов в уравнениях возмущенного движения. Следуя прямому методу Ляпунова (см. разд. 2.4.3), функцию Ляпунова для этой цели можно взять в виде V (Длгь Ах2) = у (Ах\ + Axf), причем производная dV/dt, вычисленная в силу системы (I), равна у = А( Ах\ + Ах\). 141
Согласно теоремам разд. 2. 4. 3 невозмущенное движение ЛА, соответ¬ ствующее состоянию равновесия Axi=0, Ах2=0, при любых начальных воз¬ мущениях! Дхю, Ах2о устойчиво асимптотически при А<0 и неустойчиво при А>0. Случай А=0 сводит задачу к линейной. 2. 4. 3. Прямой метод Ляпунова исследования устойчивости установившегося движения ЛА Прямой метод Ляпунова при решении задачи об устойчиво¬ сти движения целесообразно применять в тех случаях, когда уравнения первого приближения (2.85) для этой цели непри¬ годны и необходимо использовать уравнения возмущенного дви¬ жения ЛА в полном виде Axi = Xi(Ax1,..., Ахп) (2.87) где все обозначения и допущения соответствуют системе (2. 82). Предполагается, что функции А* явно от времени t не зависят, т. е. изучается установившееся невозмущенное движение ЛА. Прямой метод Ляпунова сводится к построению таких функ¬ ций V переменных Ахь..., Ахп, полные производные которых по времени согласно уравнениям (2.87) обладают некоторыми специфическими свойствами. Относительно F-функций предполагается, что они одно¬ значны, определены в некоторой достаточно малой //-окрестно¬ сти невозмущенного движения 2 Д-*л < Н, (2.88) /=1 обращаются в нуль при Ах\ = ... =Ахп = 0 и обладают непрерыв¬ ными частными производными. Функция V(Ахи ..., Ахп) называется знакоопределенной (определенно-положительной или определенно-отрицательной), если она в области (2.88) может принимать значения только одного определенного знака и обращается в нуль только при A*i= ... = Ахи = 0. Функция V{Ах\,..., Ахп) называется знакопостоянной (поло¬ жительной или отрицательной), если она в области (2.88) мо¬ жет принимать значения только одного определенного знака, но может обращаться в нуль и при AXj+ ..., +Ах2п ФО. Функция V(Ах\,..., Ахп) называется знакопеременной, если она не является ни знакоопределенной, ни знакопостоянной и, следовательно, как бы мало ни было число Я, может принимать в области (2.88) как положительные, так и отрицательные зна¬ чения. Пример 5. Для п=3 функции V = Ax\ + Ах\ + Ал:|; V = Ах\ + 2Ах\Ах2 + 2Ах\ + Ах\ 142
являются положительно определенными и при этом величина Н в (2. 88) мо¬ жет быть как угодно большой. 9 2 2 3 Функция V = Ах\ + Ллг2 + ДАГд — Длгд тоже является положительно опре¬ деленной, но величина Н в (2. 88) должна быть взята достаточно малой. Функции V = Ах\ +Ах\ + 2АххАх2+Ах\, V = Ах\ -f Ах\ являются знакопостоянными (положительными), функции V — Ахх\ V = Ax\+Ax\ — — Ах\ — знакопеременны. Если V — знакоопределенная функция, то уравнение У=С = = const изображает однопараметрическое семейство замкнутых поверхностей. При уменьшении параметра С каждая такая по¬ верхность стягивается к началу координат Axi = ... = AxJl = 0, а в пределе при С->0 превращается в точку-— начало координат. Эти поверхности пересекают все пути, идущие из начала коорди¬ нат в бесконечность. Наряду с функциями V(Axh ..., Ахп) рассматриваются также их полные производные по времени в силу уравнений (2.87), равные у дУ dKXj __ dt дАxi dt ! = i П дУ дА Х[ — W(А-^1, •. •, АХп). (2.89) Следовательно, функция V=W является также функцией переменных Ахи ..., Ахп, обращающейся в нуль при Ах\= ... = = Ахп = 0. Содержание прямого метода Ляпунова для установившихся движений составляют следующие основные теоремы. Первая теорема Ляпунова об устойчивости. Если для дифференциальных уравнений возмущенного движе¬ ния (2.87) можно найти знакоопределенную функцию V(Axu... ..., Ахп), полная производная которой по времени V, составлен¬ ная в силу этих уравнений (2.89), есть функция знакопостоянная, знака, противоположного с V, или тождественно обращается в нуль, то невозмущенное движение устойчиво. Вторая теорема Ляпунова об устойчивости. Если для дифференциальных уравнений возмущенного движения (2.87) можно найти знакоопределенную функцию У(Ахь... ..., Ахп), полная производная которой по времени V, составлен¬ ная в силу этих уравнений, есть функция также знакоопределен¬ ная знака, противоположного с V, то невозмущенное движение устойчиво асимптотически. Теорема Ляпунова о н е у с т о й ч и в о с т и. Если для дифференциальных уравнений возмущенного движения (2.87) 143
можно найти функцию V{Axu..., Ахп) такую, что ее полная про¬ изводная по времени V, составленная в силу этих уравнений [см. (2.89)], есть функция знакоопределенная, а сама функция V не будет знакопостоянной знака, противоположного с V, то не¬ возмущенное движение неустойчиво. Теорема о неустойчивости Н. Г. Чет а ев а. Если для дифференциальных уравнений возмущенного движения (2.87) можно найти такую функцию V(Ax\,..., Ахп), что а) в сколь угодно малой окрестности начала координат сущест¬ вует область, где У>0, на границе которой У=0, и б) во всех точках области V>0 производная V [см. (2.89)] принимает поло¬ жительные значения, то невозмущенное движение неустойчиво. Функции, удовлетворяющие одной из приведенных теорем, называются функциями Ляпунова или функциями Четаева. Теорема В. В. Румянцева об устойчивости по отношению к части переменных. Если дифференци¬ альные уравнения возмущенного движения таковы, что можно найти знакоопределенную по отношению к переменным Ахи... ..., Axk функцию V, производная которой в силу этих уравнений была бы знакопостоянной функцией противоположного с V знака или тождественно равной нулю, то невозмущенное движение устойчиво по отношению к переменным Ахи ..., Ах Примечание. Если число величин Дх,, по отношению к которым ис¬ следуется устойчивость, равно п, то теорема В. В. Румянцева эквивалентна первой теореме Ляпунова об устойчивости. Для практического применения прямого метода Ляпунова необходимо знать способы построения функций Ляпунова, а так¬ же критерии знакоопределенности и знакопеременности функ¬ ций V. Простейшие способы построения функций Ляпунова при¬ ведены в разд. 2.4.4 и в примерах разд. 2.4. Поскольку общих критериев знакоопределенности и знакопеременности функций V не существует, ниже приводятся некоторые простые критерии, с помощью которых эта задача легко разрешается в ряде част¬ ных случаев. Некоторые признаки знакоопределенности и знакопеременности функций Предполагается, что функция V(Ax\,..., Ахп) есть однород¬ ная форма произвольного m-го порядка. Рассматривается также произвольная функция W(Ахи..., Ахп), обращающаяся в нуль при Ах{= ... ~Ахп = 0 и удовлетворяющая в области (2.88) неравенству | W (Д.^!,..., Д-^л)|<Л (| Д-Д1 + ...-Н дх„|}"\ (2.90; где А — некоторая постоянная. Помимо представления V-функции в виде формы, рассматри¬ вается также произвольная [/-функция, разлагающаяся в ряд по 144
степеням Дхь ..., Дхи в некоторой окрестности начала координат Дхi= ... = Дх„ = 0. Допускается, что это разложение начинается членами некоторого произвольного порядка т, так что справед¬ лива запись V{Ax{,..., Axn) = V т{ь.хг,..., кхп), (2.91) где Vm■—форма m-го порядка, а V* — совокупность членов бо¬ лее высоких порядков относительно Дхь ..., Дх„. При этом функ¬ цию V* (Ахи ■ ■ ■, Ахп) можно рассматривать, и притом бесчис¬ ленным множеством способов, как форму m-го порядка, коэффициенты которой являются функциями Дхь ..., Дх„, обра¬ щающимися в нуль при ДХ]= ... =Дхта = 0. Следовательно, если величина Н, определяющая область (2.88), достаточно мала, то и указанные коэффициенты будут сколь угодно малыми. При сделанных допущениях и замечаниях справедливы сле¬ дующие утверждения. 1. Любая форма V нечетного порядка т есть функция знако¬ переменная. Если же т есть число четное, то форма V может быть как знакоопределенной, так и знакопеременной. Вопрос о том, какой из этих случаев действительно имеет место, является очень сложным для форм порядка выше второго, если число независимых переменных больше двух. Для форм второго по¬ рядка (при любом числе независимых переменных) эта задача разрешается просто с помощью следующего критерия, извест¬ ного как теорема Сильвестра. 2. Теорема Сильвестра. Для того чтобы квадратичная форма вида П 21/= ^ Сар ДхаДХ|з (2.92) а, Р=1 была положительно определенной, необходимо и достаточно, чтобы все угловые миноры ее дискриминанта, т. е. величины Си Cl 2 • • • Си Си. Си Ci2 СХ2 С22 , « . С12 С22 • • • с2Л Си С2л • • ■ Слл были положительны. 3. Если V — знакоопределенная форма m-го порядка, то функция U{axu ..., Дхя) = 1/(дх1,..Дх„) + Г(дх1,..., t,xn) (2.93) будет также знакоопределенной того же знака при любом вы¬ боре функции №(Дхь..., Дх„), удовлетворяющей в области (2.88) неравенству (2.90), где А — достаточно малое положи¬ тельное число, зависящее исключительно от коэффициентов 145
формы V. Если V есть форма знакопеременная, то при тех же условиях функция U будет также знакопеременной. 4. Знакоопределенность или знакопеременность формы сохра¬ няется, если к ней добавить любую форму того же порядка с достаточно малыми коэффициентами. Справедливость этого утверждения непосредственно вытекает из того обстоятельства, что всякая форма т-го порядка необхо¬ димо удовлетворяет неравенству (2.90), причем коэффициент А будет сколь угодно мал, если коэффициенты формы достаточно малы. 5. Если Vm(Ax 1,..., Ахп) есть форма знакоопределенная, то и функция (2. 91) будет знакоопределенной; если Vm(Ax\, ..., Ахп) есть форма знакопеременная, то и функция (2.91) будет знако¬ переменной. Последнее утверждение остается в силе, если предположе¬ ние, что функция V* в выражении (2.91) является аналитиче¬ ской с разложением, начинающимся членами не ниже (т-Н)-го порядка, заменить более общим предположеннием, что V* обра¬ щается в нуль при Ах\ = ... =Дх„ = 0 и имеет порядок малости более высокий, чем т, т..е. что V* удовлетворяет в некоторой окрестности начала координат неравенству | V" {Ахг,..., Дх„) 1 А {| дхх | —|—... —(— | Ахп | }m+!I) (2, 94) где а — положительное число, которое может быть сколь угодно малым. Аналитичность функции V* при этом не требуется. Таким образом, знакоопределенность и знакопеременность аналитических функций определяется совокупностью членов наинизшего порядка в разложениях этих функций, за исключе¬ нием того случая, когда эта совокупность членов наинизшего порядка представляет знакопостоянную форму. Однако если функция не является формой, ее знакоопределенность или знако¬ переменность можно нарушить добавлением членов более высо¬ кого порядка. Пример 6. Пример посвящен применению прямого метода Ляпунова для исследования устойчивости относительного равновесия космического ЛА (КЛА); при движении относительно его центра масс в поле земного тяготения *. Для построения функции Ляпунова использованы свойства первого интеграла. Движение КЛА рассматривается при следующих предположениях: 1) поле тяготения предполагается центральным ньютоновским; 2) КЛА является абсолютно твердым телом, размеры которого пренебре¬ жимо малы по сравнению с орбитой движения центра масс КЛА; 3) центр масс КЛА движется по кеплеровой круговой орбите; 4) изучаемое движение около центра масс не влияет на движение центра масс, так что орбита движения центра масс КЛА остается все время невозму¬ щенной, т. е. кеплеровой круговой; 5) на КЛА действуют только силы тяготения, никаких других сил не при¬ ложено. * В. Г. Д е м и н. Движение искусственного спутника в нецентральном поле тяготения. М., «Наука», 1968. 146
При сделанных предположениях уравнения движения КЛА относительно его центра, масс в связанной системе координат OxuUnZn, оси которой направ¬ лены по главным центральным осям инерции КЛА, имеют вид уравнений Эйлера: АгЧдг + (!z —Iу) “г/Чг = 322 (7Z — Iу) Ч"‘> IУаУ + (Jх — Iz) ЧгЧс = 322 (Iх —I z) Ч"Ч’ (I) ЛгЧг + (JУ — 1х) шх1йУ = 322 (/^ —/х) -ру', где Q — постоянная угловая скорость движения центра масс КЛА по орбите; а>х, Ыу, (Oz — компоненты угловой скорости КЛА в относительном движении. Для относительных направляющих косинусов а, а', а"; (3, |3', |3"; у> У\ Y"> определяющих взаимное положение связанной OxnynZu и орбитальной Охуг систем координат с помощью матрицы Х]1 У11 Z\1 | X а а' а" У р р' р" Z ч 7' 7" справедливы кинематические соотношения 1 = 7' ю2 — ч"ши +а2; а = а' — а "<лу — у2; •j' =f"ax — "fo)z +а'2; а' = а"шх— ашг —у’ 2; у" — fcoy —у шх + а"2; а" — силу —а'шх—у"2; Р = Р' Чг — Р"“4Ь Р' = Р"Чг — Р“г! Р" = Р“г/ — Р' Чг- ■ Система уравнений (I)—(II) замкнута, так как матрица направляющих косинусов обладает свойствами: 1) сумма квадратов элементов строки (столбца) равна единице; напри¬ мер, a2+p2+Y2=l; 2) сумма попарных произведений элементов двух строк (столбцов) равна нулю; например, сф+а,|3'+а"|3//=0; 3) каждый элемент матрицы равен своему алгебраическому дополнению; например, а'=|3"у—Ру". Система (I) — (II) трудно интегрируема в конечном виде; между тем при произвольных моментах инерции /*, /у, h для нее существует первый интеграл V = — + h^y + ^z“z) + №(!х Ч2 + Iy~\rl + + ^2Т"2) — ® (Л:ЧгР + ^г/мг/p, + ЛгЧгР") = Const, выражение которого через относительные угловые скорости Чг = Ч* — SP; аУ = <*у — 2Р'; <аг = <аг — 2р" принимает вид 1$ = ~ (^хых + + ^2“г) + ЛД ^2 (^-Л2 + ^Т'2 +^zT"2) — 22 (/д-Р2 2 -j-^zP"2) = const. В качестве невозмущенного движения, устойчивость которого исследуется, рассматривается частное решение уравнений движения, которое определяет относительное равновесие КЛА на круговой орбите: 147
= 5(°) = 4°) = 0; а<°> = Р' <°> = rW = 1; а' <°> = а"<°> = р<°> = = 7(°> = у’ (о) = о. При таких значениях направляющих косинусов ось уи совпадает с нор¬ малью к плоскости орбиты, ось 2ц совпадает с радиусом-вектором, ось хп — с касательной к круговой орбите КЛА. Компоненты угловой скорости КЛА в относительном равновесии имеют значения a>x = a>z=0; a>y = Q, т. е. КЛА в относительном равновесии все время одной стороной «смотрит» на Землю.. Любое движение, как состоящее из возмущенного и невозмущенного, можно представить в виде <°х = Дых; и>у = Ди>у‘, u>z = Дшг; а = 1 + Да; а' = Да'; а" = Да"; Р = ДР; Р' = 1 + Др'; Р" = ДР"; 7 = Дт; 7' = Ду'; у" = 1 -f Ду", где индекс «А» — означает возмущенное движение КЛА. Интеграл V в переменны» возмущенного движения с учетом первого свой¬ ства матрицы направляющих косинусов записывается в виде V = — (/-f IzДы^) + -у &2 [(/х + Iz) Ду2 + + (/у - Iz) Д7'+ i- S2 [([у _ [х) Др2 + Цу _ Гг) ДР"2]. Функция V при Iy>Ix>Iz является функцией определенно-положитель¬ ной, так как она положительна на любом возмущенном движении, а в нуль обращается только на невозмущенном движении. Производная от V по t в силу уравнений движения по определению первого интеграла тождественно равна нулю. Следовательно, по теореме Ляпунова об устойчивости неравен¬ ства Iy>Ix>Iz являются достаточными условиями устойчивости рассмотрен¬ ного относительного равновесия КЛА. 2.4.4. Прямой метод Ляпунова исследования устойчивости неустановившегося движения ЛА Прямой метод Ляпунова при решении задачи об устойчиво¬ сти неустановившегося движения ЛА целесообразно применять в тех случаях, когда уравнения первого приближения (2.85) для этой цели непригодны и необходимо использовать уравнения возмущенного движения ЛА в полном виде Ах^Х^Ах^..., Axn,t) (/=1,..., л), (2.95) где обозначения и допущения соответствуют системе (2.82), а явная зависимость от времени t нелинейных функций Xz есть следствие неустановившегося характера невозмущенного дви¬ жения ЛА. Так же как и в разд. 2.4.3, применение прямого метода Ля¬ пунова в данном случае сводится к построению таких функции V(Хх\,..., Ахп, t), полные производные которых по t согласно уравнениям (2. 95) обладают некоторыми специфическими свой¬ ствами. В отличие от разд. 2.4.3 функции V в данном случае явно зависят от t. 148
Относительно функций У(Лхь ..., Дх„, /), заданных в области 2 Д^<//; t>t0>o, (2.96) г=1 где Я — достаточно малая постоянная, предполагается, что они обладают в указанной области непрерывными частными произ¬ водными по всем переменным и обращаются в нуль при Axi = = ... = Дхи = 0. Функция V (Ахх,..., Дх„, t) допускает бесконечно малый выс- П ший предел, если она стремится к нулю при 2АХг2->0 равномерно i = 1 относительно t. п Пример 7. Функция V = sin t ^ Ах,- 1= 1 ший предел, а функция sin t допускает бесконечно малый выс- такого предела не допускает. Функция V(Axi,..., Ах„, t) называется знакопостоянной по¬ ложительной (или отрицательной), если она не может принимать в области (2. 96) отрицательных (или положительных) значений. Функция V (Ахи ..., Ахи, t) называется определенно-положи¬ тельной, если она в области (2.96) удовлетворяет неравенству V (ДлТц,..АХП, Ахп), (2.97) а функция V (Лхь ..., Ахп, t) называется определенно-отрица¬ тельной, если она в области (2.96) удовлетворяет неравенству V {Axv ..., дх„, t) < — W (ахъ.. ., Ахп), (2.98) где W(Axi,..., Дх„) —не зависящая от t определенно-положи¬ тельная функция (см. разд. 2.4.3). П Пример 8. Функция V\ = (2 + sin t) ^ А*? является положительно опре- 1=1 п п деленной, так как Vx > ^ функция = (—2 + sin t)^ Дх? является г-i г-1 п / п определенно-отрицательной, так как 1^2< — 2 Дх2; функция V3 — ё~1 2 X г-i ‘ \г=1 ХАх?) лишь знакопостоянна (положительна), так как она, обращаясь в нуль при ДХ] = ... = Дх„ = 0, стремится к нулю при t -* °о при фиксированных ДХ[ Дх„ и, следовательно, для нее условие (2. 97) не выполняется. Наряду с функциями F(Axi,..., Дх„, t) рассматриваются также их полные производные по времени, в силу уравнений (2. 95) равные П /-1 (2.99) дУ dt 149
Основы прямого метода Ляпунова для неустановившихся движений составляют следующие основные теоремы. Первая теорема Ляпунова об устойчивости. Если для дифференциальных уравнений возмущенного движения (2.95) можно найти знакоопределенную функцию V(Ax\,... ..., Ахп, t), для которой производная по времени dVjdt в силу уравнений (2. 95) есть функция знакопостоянная знака, противо¬ положного с V, или тождественно обращается в нуль, то невоз¬ мущенное движение устойчиво. Вторая теорема Ляпунова об устойчивости. Если при выполнении условий предыдущей теоремы производная dV/dt (см. (2.99)) является знакоопределенной, а сама функция V(Ax\,..., Ахп, t) допускает бесконечно малый высший предел, то невозмущенное движение устойчиво асимптотически. Теорема Ляпунова о неустойчивости. Если существует допускающая бесконечно малый высший предел функция V (Ах\,..., Ахп, t), производная которой по времени dV/dt (см. (2.99)) есть функция знакоопределенная, а сама функция V в области (2. 96) может принимать значения того же знака, что и dV/dt, то невозмущенное движение неустойчиво. Теорема о неустойчивости Н. Г. Четаева. Если для дифференциальных уравнений возмущенного движения (2.95) можно найти функцию V{Axh..., Ахп, t), удовлетворяю¬ щую условиям: 1) в области (2.96) существует область F>0; 2) в области \/>0 функция V ограничена; 3) в области F>0 производная dV/dt, составленная по (2.99), принимает положительные значения и при этом для всех значе¬ ний Ах\,..., Ахп, t, связанных соотношением V{Ax1,..., Axn,t)^a, где а — какое-нибудь положительное число, выполняется нера¬ венство причем I — также некоторое положительное число, зависящее от а, то невозмущенное движение неустойчиво. Функции, удовлетворяющие приведенным теоремам, назы¬ ваются функциями Ляпунова или функциями Четаева. В том случае, когда уравнения возмущенного движения до¬ пускают существование знакоопределенного первого интеграла, то этот интеграл можно рассматривать как функцию Ляпунова. Производная от этой функции в силу уравнений движения тож¬ дественно равна нулю (по свойству первого интеграла) и, со¬ гласно первой теореме Ляпунова об устойчивости, невозмущен¬ ное движение будет устойчивым по отношению к тем перемен¬ ным, относительно которых первый интеграл является знакоопределенной функцией. 150
В том случае, когда уравнения возмущенного движения допу¬ скают существование k первых интегралов Ф^ДлГц ..Дхя; 0=cons1 (/=!,...,&), (2.100) каждый из которых не является знакоопределенной функцией, по способу, предложенному Н. Г. Четаевым, в качестве Н-функ- ции можно рассматривать функцию V = F{<bi, Ф2 Ф*> ■ • ч (2.101) зависящую от нескольких неопределенных параметров А,],. • • i подбираемых так, чтобы функция V являлась бы знакоопреде¬ ленной. В простейших случаях функция V представляет линей¬ ную комбинацию (связку) первых интегралов Ф*. Если построен¬ ная функция является знакоопределенной, то исследуемое не¬ возмущенное движение будет устойчивым, так как Ё=0 по свойству первых интегралов. 2.4.5. Устойчивость движения ЛА при постоянно (непрерывно) действующих возмущениях В предыдущих разделах рассматривалась устойчивость дви¬ жения ЛА по отношению к мгновенным возмущениям, т. е. к на¬ чальным отклонениям Дх*(0) параметров движения ЛА х, от их значений х^ в невозмущенном движении. Однако в таком виде некоторые возмущающие воздействия на движение ЛА пол¬ ностью учесть не удается и поэтому большой практический инте¬ рес представляет исследование устойчивости движения ЛА по отношению к возмущениям, действующим постоянно (непре¬ рывно). В этом случае уравнения возмущенного движения ЛА (2. 82) представляются в виде ^xi = Xi{\x1,..., Дх„, if) + Q,(Ax1,..., Ахп, 10 (/=1,. •., п), (2. 102) где функции Qi соответствуют постоянно действующим возму¬ щениям, например силам или моментам. Относительно правых частей уравнений (2. 102) предпола¬ гается, что они в области 2 Дх?<Я; />0 (2.103) 1= х непрерывны, допускают существование единственного решения при заданных начальных условиях, удовлетворяют условию Xi(0,..., 0, t) = 0, а практически неизвестные функции Qi доста¬ точно малы по модулю при всех значениях переменных AXj и t. Невозмущенное движение ЛА (лф0),..., х„<°)) называется устойчивым при постоянно действующих возмущениях, если при 151
всяком заданном положительном числе А, как бы мало оно ни было, найдутся два'других положительных числа К {А) и е(Л), таких, что для всех возмущений Ах4(0), удовлетворяющих условию 2д*?(0)<Х, (2.104) »-1 и любых возмущающих функций Qj, удовлетворяющих условию 2^. дх„) <е, (2.105) i=i любое возмущенное движение (Дхь ..., Дх„), определенное урав¬ нениями (2.102), удовлетворяет неравенству (2.106) г=1 при любом />0; в противном случае невозмущенное движение ЛА называется неустойчивым. Другими словами, невозмущенное движение (xi0) ,..., х(п0)) устойчиво при постоянно действующих возмущениях, если вели¬ чины Ахг- остаются все время малыми при условии, что они были малыми в начальный момент времени и что возмущения Qi также малы. Для исследования устойчивости невозмущенного движения ЛА при постоянно действующих возмущениях можно использо¬ вать прямой метод Ляпунова (разд. 2.4.4). В этом случае спра¬ ведливы следующие теоремы, принадлежащие И. Г. Малкину. Теорема 1. Если для дифференциальных уравнений воз¬ мущенного движения (2. 102) существует определенно-положи¬ тельная функция V, полная производная которой по времени, составленная в силу уравнений (2.102), есть функция опреде¬ ленно-отрицательная, и если в области (2.103) частные произ¬ водные dV'/dAXi (i= 1,..., п) ограничены, то невозмущенное движение устойчиво при постоянно действующих возмущениях. Теорема 2. Если уравнения возмущенного движения ли¬ нейны и имеют вид Д*/= 2 ««***+/(*) (г — 1,,.п), (2.107) *=i где f(t)—произвольная и ограниченная функция t, то для устойчивости при постоянно действующих возмущениях условия теоремы 1 не только достаточны, но и необходимы. Теорема 3. Если уравнения возмущенного движения не. содержат явно t, то для того чтобы невозмущенное движение было устойчиво при постоянно действующих возмущениях, необ¬ 152
ходимо и достаточно, чтобы оно было устойчиво асимптотически в смысле Ляпунова, т. е. при Qi = 0 (г = 1,..., п) в уравнениях (2. 102). 2. 4. 6. Устойчивость движения ЛА на конечном интервале времени В ряде задач предположение о постоянстве динамических коэффициентов ЛА (см. разд. 2.2. 1, 2. 3. 1 и 2.3.3) или о спра¬ ведливости «принципа замораживания» коэффициентов яв¬ ляются неверными или неподтвержденными. В таких задачах необходимо учитывать, что в уравнениях возмущенного движе¬ ния ЛА (см. разд. 2.4. 1) П Дх^ — ^ ciikif) Д-Xfc-)- Ь>Х i (Д-Xi,..., Lxn, t) (2,108) ft-i коэффициенты aih(t) линейной части разложения являются явными функциями времени t. Функции АХг- являются нелиней¬ ными функциями переменных Axj,..., Ахп с коэффициентами, также зависящими от времени t. Явная зависимость правых частей уравнений (2.108) от вре¬ мени t является следствием неустановившегося характера невоз¬ мущенного движения ЛА, изменяющегося, например, по опреде¬ ленной программе. Основываясь на предположении, что интервал движения ЛА по времени может быть ограничен конечным числом Т, можно в данном случае поставить задачу об устойчивости движения ЛА на конечном интервале времени. При этом предполагается, что коэффициенты a.ik(t), являющиеся в уравнениях (2.108) веще¬ ственными, ограниченными и непрерывными функциями вре¬ мени t, можно представить в виде сумм я«(О=01*(О) + Дв«(*) (М=1, • -,«). (2.109) где aih(0) — значения коэффициентов в момент времени t=t0, принятый за начальный, причем Да^(0) =0. Уравнение 0(s) = |e«(O)-s8»l = O (2.110) где aife(0)=const (6,^=1 при i=k, 6^ = 0 при i=/=k), является характеристическим уравнением (см. разд. 2.13), соответствую¬ щим уравнениям возмущенного движения (2.108) при t—U- Невозмущенное движение ЛА называется устойчивым на ко¬ нечном интервале времени [t.Q, U+x], если переменные AXi(t), определяемые уравнениями (2. 108), удовлетворяя в начальный момент t=to условиям -О [®/iA-^i(0)-j-.. • -|-<А-,гд.хл(0)]2 “С А; ап . • а1п ап 1 • • п (2.111) (2. 112) 153
удовлетворяют условию п 2 [«aA*iW + ...+a;„A*„№]2^A (2. ИЗ) на конечном интервале времени [£0, 4+т], где А—достаточно малое положительное число; в противном случае невозмущен¬ ное движение ЛА неустойчиво (г. е. т='0). Вышеприведенное определение устойчивости движения на конечном интервале вре¬ мени дано Г. В. Каменковым. Устойчивость (или неустойчивость) движения ЛА на конеч¬ ном интервале времени можно определить с помощью следую¬ щих теорем, принадлежащих Г. В. Каменкову. Теорема 1. Если характеристическое уравнение (2.110), не имея кратных корней, имеет только отрицательные корни или комплексные с отрицательными вещественными частями, то не¬ возмущенное движение устойчиво на некотором конечном интер¬ вале времени (Y0, U+x] независимо от функций Aa*fc(0 и нели¬ нейных членов AXi в уравнениях (2. 108). При этом невозмущен¬ ное движение устойчиво и при постоянно действующих возму¬ щениях. Теорема 2. Если среди корней характеристического урав¬ нения (2.110) имеется по крайней мере один положительный корень или два с положительными вещественными частями, то невозмущенное движение неустойчиво на конечном интервале времени (т. е. т = 0) независимо от функций Aaik{t) и нелиней¬ ных членов AXi в уравнениях (2. 108). Теорема 3. Если среди корней характеристического урав¬ нения (2.110) имеется по крайней мере один нулевой корень или два чисто мнимых корня при остальных отрицательных или комплексных с положительными вещественными частями, то невозмущенное движение может не обладать устойчивостью на конечном интервале времени. Теорема 4. Если характеристическое уравнение (2.110) не имея положительных корней или комплексных с положитель¬ ными вещественными частями, имеет только кратные веществен¬ ные отрицательные корни Si (где i— 1,..., а) и кратные ком¬ плексные корни с отрицательными вещественными частями Aj (где /=1,..., (3) и если при этом все диагональные миноры определителей — s, 0 ... 0 0 2 Я&)= 2 ... о о 2 (2. 114) 0 154 О
£>&)= -h О . . 0 0 2 1 2 — . 1 2 . 0 0 (7 = 1 ■ — -х, (2.115) будут больше нуля, то невозмущенное движение устойчиво на конечном интервале времени независимо от функций Да^(7) и нелинейных членов в уравнениях (2. 108). Если хотя бы один диагональный минор определителей (2.114) и (2.115) окажется отрицательным, невозмущенное движение неустойчиво на конечном интервале времени незави¬ симо от функций Aa,ih(t) и нелинейных членов уравнений (2. 108). В некоторых задачах динамики ЛА более целесообразной с практической точки зрения может оказаться постановка и ре¬ шение задачи о технической устойчивости ЛА. 2. 4. 7. Расчет движений ЛА методом малого параметра Пуанкаре Во многих практических задачах о движении ЛА в соответст¬ вующих дифференциальных уравнениях удается выделить неко¬ торые члены или группу членов, которые можно считать малыми по сравнению с остальными «главными» членами. Отбросив та¬ кие малые члены и разрешив задачу для упрощенной системы, можно затем использовать полученное решение в качестве нуле¬ вого приближения для решения основной задачи, применив спе¬ циально разработанный аппарат последовательных приближе¬ ний. Этот прием и лежит в основе метода Пуанкаре. В механике полета метод малого параметра А. Пуанкаре используется для расчета и изучения периодических и почти- периодических движений ЛА. Первоначально метод был разра¬ ботан Пуанкаре в связи с исследованием классической небесно¬ механической задачи трех тел. В настоящее время, несмотря на существенные ограничения, накладываемые на выбор уравнений и на поставленные задачи, метод все же охватывает многие важные случаи, дает ответ на ряд существенных для практики вопросов и успешно применяется в разнообразных задачах меха¬ ники полета, например для расчета орбит космических ЛА. Для отыскания периодических движений ЛА с помощью метода Пуанкаре исходные уравнения движения ЛА должны быть представлены в следующем виде: Д-=^г(-Н, ..., xn\t\ [а) (/=1,— , л), (2.116) для которых справедливы следующие предположения: 155
1) п — порядок системы; 2) х\,...,хп — переменные, характеризующие движение и состояние ЛА; 3) фуНКЦИИ Xi ЯВЛЯЮТСЯ ГОЛОМОрфнЫМИ ФУНКЦИЯМИ Х\, ... ,хп, (х, т. е. их можно разложить в сходящиеся (по крайней мере для малых значений переменных) степенные ряды по хь...,хп, |х; 4) для неавтономной системы, т. е. при явной зависимости функций Xi от времени t, коэффициенты вышеуказанных разло¬ жений — суть также функции t; в этом случае коэффициенты должны быть непрерывными периодическими функциями вре¬ мени t с некоторым общим вещественным периодом Г; метод применим также и для изучения автономных систем, когда функ¬ ции Xi не содержат явно времени t\ 5) основным предположением является зависимость функций Xi от некоторого достаточно малого параметра jx, причем так, что при определенном значении |х = |х0 (например, 1X0 = 0) исход¬ ная система (2. 116) обращается в уравнение (или систему урав¬ нений) с известным решением х\0) (t), например в линейное уравнение (или систему линейных уравнений) с постоянными коэффициентами. В дальнейшем принимается, что при цо = 0 имеется известное решение хг-0)=<рi(t). При сделанных предположениях систему (2.116) можно представить в виде Xi=Xf\x1,хп; 0+ МГР (*i,..., хп; t) + + ^2) (Xl,...,x„;t)+...(i=h...,n), (2.117) где величины Xf\ Х^Х не зависят от ц. Система (2.117) при ц = 0 переходит в систему х^ = х\0)(4°\ ,x(n0)U) (/— 1,..j ti), (2.118) называемую порождающей системой, решение которой на¬ зывается порождающим решением. Если порождающая система (2.118) является системой линейных уравнений, то основная система (2.117) называется квазилинейной. Принципиальное содержание метода заключается в следую¬ щей теореме. Теорема Пуанкаре. Если порождающая система (2.118) допускает голоморфное решение лг<°> (t) (i = 1, . .., п то основная система (2.117) имеет решение, которое может быть представлено в виде рядов xt^{XxW(t) (/=1 ») (2.119) fc=0 по целым положительным степеням ц, абсолютно и равномерно сходящихся при достаточно малом по модулю значении [х. 156
При выбранном (фиксированном) значении ц ряд (2.119) будет сходиться к голоморфной функции для всех t, удовлетво¬ ряющих условию где т=т(ц). В общем случае чем меньше по модулю р, тем больше оказывается величина т. Совокупность членов *}0,(*)+И1,(0+ ■ • • +V-kx?]{t) (2. 120) в (2. 119) при фиксированном значении k составляет k-e прибли¬ жение решения для хг. В соответствии с методом Пуанкаре и сделанными предполо¬ жениями далее рассматривается вопрос о построении таких периодических (или почтипериодических) решений основной системы (2.117), которые при достаточно малом р мало отли¬ чаются от порождающего периодического решения Хг(0) = фг№ порождающей системы (2.118) или, точнее, о таких периодиче¬ ских (или почтипериодических) решениях системы (2.117), которые при р—>-0 стремятся к соответствующим решениям системы (2. 118). Среди всех возможных случаев, доставляемых исходной си¬ стемой (2. 116), далее рассматривается так называемый нерезо¬ нансный случай, условием которого является отсутствие нулевых и чисто мнимых корней в характеристическом уравнении системы (2.116) (см. разд. 2. 4. 1). Процедура построения решения. Построение пе¬ риодических решений для лу, т. е. рядов (2. 119), рассматривается далее для случая неавтономных систем, т. е. для случая, когда правые части уравнений (2.116) X, являются периодическими относительно t функциями периода Г. Предполагается также, что порождающая система (2.118) обладает известным периодиче¬ ским решением 4°)==СР /(0 (/=!,...,»), (2.120') соответствующим начальным условиям Xi(0)=xpi(4) и имеющим период Г, так что срг(/ + Г) =ф;(1). В соответствии с теоремой Пуанкаре основная система (2. 117) имеет решение Xi = q>i{t, ц), представляемое в виде рядов П xi — 4i{k Pi> • • • > I1) — + (^~) P+.-.S (*=1,...,л), (2.121) V ф Л-о где через (З3- обозначены отклонения начальных значений вели¬ чин Xj в искомом решении от начальных значений тех же вели¬ чин в порождающем решении, т. е. Pi=<Pi(*0, I*) — <Р/(*о) (г = 1, ...„«). (2.122) 157
Ряды (2.121) будут сходиться абсолютно и равномерно для всех достаточно малых по модулю р и для всех t, удовлетворяю¬ щих условию /^т(р); если же Г^т(р), то ряды (2. 121) будут сходиться при всех значениях t. Для того чтобы решение х* = фг(рь..., ри; р; t) было перио¬ дическим периода Т, необходимо и достаточно выполнение условий ь (*о+т; Рх »)-?* (*<>; Pi,р)=Ф/=о (2.123) п). Уравнения (2. 123) служат для определения неизвестных на¬ чальных значений искомого решения. Следовательно, вопрос о существовании периодических решений для х{ основной си¬ стемы (2. 117) в виде (2. 121) сводится к вопросу о разрешимости системы уравнений (2. 123) относительно р,, причем так, чтобы Pi обращались в нуль при р = 0, так как искомое решение должно обращаться в порождающее при р = 0. На основании теоремы о существовании неявных функций уравнения (2. 123) имеют при достаточно малом р одно и только одно решение Рг= Рг(м>) (г = 1,..., п), причем |3г(0)=0, и это решение будет аналитическим относительно р при условии, что ~ Фд) . д (Pi Примечание. Для того чтобы вычислить определитель в выражении (2. 124) при Pi=.. .=рп=р=0, достаточно найти лишь линейные относительно рг и р члены разложения х, в ряды. Подстановка решения р, = р{(р) в функции <рД£; рь • • •, Рп', р) приводит к одному и только одному периодическому решению Xi—<pi(t, р) основной системы (2.117); это решение получается аналитическим относительно р и обращается в порождающее при р = 0. Само вычисление искомого периодического решения в виде (2. 119), или, что то же, в виде (2. 121) происходит следующим образом. Подставляя ряды (2. 119) в уравнения системы (2. 117) и при¬ равнивая коэффициенты при одинаковых степенях р в правых и левых частях уравнений, можно получить следующие уравне¬ ния для последовательного определения функций x\k) (t): для k=0 i(0) =Х(0) (Х(0)) ( Х(0); (2. 125) для k = 1 П 41)=^](g-)o^1)+^1) И0), • • •. 40); 0:0, (2.126) ]= 1 /0. (2.124) 158
где —значения при xt —[t)\ \dxj /о dxj для любого k (S'). •'Г+Ф»ма> х?~"' ')• (2.127) где функции cptft. зависят только от функций, определенных из предыдущих систем уравнений. Таким образом, k-e приближение определяется системой ли¬ нейных уравнений типа П (2.128) с периодическими относительно t коэффициентами. В задачах механики полета ЛА часто встречаются случаи, в которых исходная система (2.116) допускает существование первого интеграла, например, вида Ф(хь..., хп\ ц; t)=C, что эквивалентно тождественному равенству нулю определителя (2.124). В таких случаях уравнения (2.123) будут зависимыми и из рассмотрения надлежит исключить одно из уравнений, на¬ пример, фи = 0. Тогда решение вопроса о существовании перио¬ дических траекторий КЛА сводится к доказательству существо¬ вания простого решения системы уравнений ([(1=ф2=..,=фл_1=0 (2.129) относительно рь ..., |Зп-ь Для чего достаточно потребовать, чтобы S0- (2.130) Р1-;..=Рл_1-|*=0 Значение одной из величин |3j (например, рп) можно взять произвольным образом. Если исходная система (2. 116) допускает существование нескольких первых интегралов, то условие (2.130) изменится соответствующим образом. Если исходная система уравнений движения (2.116) авто¬ номна, т. е. имеет вид х1 = Х1(х1, и-), (2.131) то возможно отыскание периодических траекторий ЛА с произ¬ вольным периодом, причем периоды порождающего решения и решения системы (2.131) не обязательно должны быть равными. В ряде задач применение метода Пуанкаре может быть зна¬ чительно облегченно с помощью следующей теоремы. 159
Теорема симметрии. Если для системы дифферен¬ циальных уравнений x-t=Xi (х^, ..., хп, Xj, ..., хп) (2. 132) правые части таковы, что сама система инвариантна относи¬ тельно подстановки у=«+1, »),J (2. 133) то условия периодичности решения принимают вид X; —> X;; х, —> —- хг; г? —> — Xj-^—Xj] Xj-^Xj X/ (0) = 0; x^y-j = 0 (/=1, ...,«); хД0) = 0; x/^-J = 0 (y'=s + l л), (2.134) где Т ■— период решения. Величина малого параметра. Изложенный метод Пуанкаре накладывает определенные ограничения на величину параметра р. Эти ограничения исходят, во-первых, из теоремы Пуанкаре, требующей достаточной малости параметра для схо¬ димости ряда (2. 119); во-вторых, из стремления ограничиться на практике низшими приближениями при расчете членов ряда (2.119) (например, первым приближением), а это связано с достаточной малостью параметра р при заданной точности расчета. Однако в каждой конкретной практической задаче, решае¬ мой методом Пуанкаре, параметр р имеет реальное физическое содержание, являясь функцией конструктивных, аэродинамиче¬ ских, тяговых и других характеристик ЛА. Поэтому мы не мо¬ жем произвольно считать параметр р сколь угодно малым, не теряя физического смысла изучаемой задачи. Если по физическому смыслу задачи параметр р может при¬ нимать значения 0^р^рь то возникают следующие вопросы: во-первых, удовлетворяет ли величина р; условиям сходи¬ мости ряда (2.119); во-вторых, является ли значение pi таким, при котором пер¬ вое приближение обеспечивает заданную точность расчета. При отрицательном ответе на первый вопрос следует отка¬ заться от использования метода Пуанкаре; при отрицательном ответе на второй вопрос, если на первый вопрос ответ дан поло¬ жительный, следует перейти к расчету последующих прибли¬ жений. 160
2. 4. 8. Расчет движений ЛА методом усреднения по Крылову—Боголюбову Во многих практических задачах механики полета уравнения движения ЛА можно представить в виде следующей системы: s ^'s~s==:Iх Xs (zlt ..., zn, - ], ..., zn, t, p) (2, 135) (s=l, ... , N), которую, в свою очередь, с помощью замены переменных ftj —ftj , Zs — Xs6 | X—s6 , .. ftst ., -;y zs (2. 136) можно преобразовать к так называемому стандартному, с точки зрения метода усреднения, виду xs== рА^ (х1; ... , хп, /, р) (2,137) (5=1, ...,"Л), где хп — переменные, характеризующие движение и со¬ стояние ЛА; р— достаточно малый вещественный параметр, а Хь ..., Хп — функции, голоморфные относительно переменных хи..., х-п, р, т. е. они представимы в виде рядов по целым поло¬ жительным степеням указанных переменных, в частности Xs(x 1, ..., хп, t, р) = X(J'(jfj, ..., хп, t)-j- + \хХ[^{х1, .... JC„; /)+■... (2. 138) Имея в виду разложение (2.138), систему (2.137) можно представить в виде *, = РATf>(.*:,, О + W>(^, (2. 139) (5=1, ...,«), ИЛИ х=рАГ(х, t, р) = рА'1(х, ^)-j-p2X,(x, /)~|-..., (2. 140) где х=(х1, ..., хп)\ Xk— (X\k), ..., XW) —действительные (векторные функции (/г=1, 2,...). В уравнениях движения (2.140) или исходных— (2.135) члены, содержащие параметр р, играют роль возмущающих фак¬ торов, действующих на опорное, или невозмущенное движение ЛА, определяемое уравнениями (2. 140) при р = 0. В этом смысле уравнения (2. 140) или (2. 135) при рэ^О можно трактовать как уравнения возмущенного движения ЛА. 6 3398 161
Если для функций Xh(x, t) при достаточно малых значениях параметра ц существует среднее значение по явно входящему t, равное т -±r{xk{x,t)dt, (2.141) Г-оо l J 0 то к уравнениям (2. 140) возможно применение метода усредне¬ ния по Крылову—Боголюбову для построения асимптотических решений в виде x=x(i)-ir\xu1(xj)-j-^u2(x, /) + .. .+\>.kuk{x, t), (2- 142) где х=^А1(х) -\-[>-2А2(х) -ф... -4-рк Ап(х). (2. 143) Практически применимость указанных решений определяется не свойствами сходимости сумм (2. 142) и (2. 143) при k-*-oo, а их асимптотическими свойствами при ц—И) для любого фик¬ сированного k. Асимптотические свойства решений заключаются в требовании, чтобы выражение (2. 142) при малом ц представ¬ ляло бы достаточно точно решение уравнений (2. 140) для доста¬ точно длительного интервала времени. Для фиксированного k уравнения (2. 142) называются реше¬ ниями k-го приближения, а уравнения (2. 143) называются усредненными уравнениями k-го приближения. Для построения асимптотического решения k-то приближения в виде разложения (2. 142) метод усреднения таким образом определяет функции %(•*, t), ..., uk{x, t); Ах(х), , Ak{x), чтобы выражение (2.142) удовлетворяло уравнению (2. 140) с точностью до величин порядка [#+Д Аналогичный метод построения асимптотических решений применяется и к системам более общего типа, математическая модель которых может быть представлена в виде i=p.A'1(x, у, O+lAX^*, У, *)+'-••; (2. 144) y = Y0(x, у, t)+у.К1(х, у, 0+р.2К2(х, «/,/) + ..., где все обозначения соответствуют уравнению (2. 140) или си¬ стеме (2.137) и, кроме того, х —{хг, ..., хп), ATft=(A"(fe>, ..., X <*>) — й-мерные векторные функции [k— 1, 2 ...); у—^, ..., ym), ..., К^>)-m-мерные векторные функции (& = 0, 1, 2,...), причем л: являются медленно меняющимися перемен¬ ными, так как х~ц, а у— быстро меняющимися переменными, 162
так как z/ ■—■ 1; Хи и Yh соответственно удовлетворяют условиям по t типа (2. 141). Примечание. В простейшем случае предел (2.141) существует, если Xh(x, t) в уравнении (2. 140) [или Хк(х, у, t) и Yh(x, у, t) в системе (2. 144)] являются периодическими или почти периодическими функциями t. Построение решений. Результаты метода усреднения приводятся далее для случая, когда функции Xh(x, t) являются функциями, периодическими по ( с периодом 2л, и допускают разложения в ряды Фурье, т. е. представимы в виде Xk{x, t)=^XnAx)e^ {k= 1,2,...). (2.145) П В первом приближении относительно параметра ц уравнение (2. 140) с учетом условия (2. 145) принимает вид где x=pX1{x)Jrp^X\'n(x)eint, (2.146) Т 2% A" =lim — f Х^х, t)dt = — f Хг{х, t)dt = Xi,о. (2.147) г->°о т J 2л J о о Разработанный в методе усреднения процесс последователь¬ ного определения функций ии и2,..., Аи А2,.. . для построения асимптотических решений в виде разложений (2. 142) и (2. 143) приводит к следующим результатам: г Лх (х) =Хг (х) = lim — Г Хг(х, t)dt\ (2. 148) Т-*оо т J о иг{х Пу=- 0 jn (2. 149) A2{x) = Xix) + V dXh~nM-- X'M— Хг{х)\ XmA dx jn dx n^O (2. 150) где uh:0(ж) —произвольные функции, появляющиеся при интег¬ рировании по t на определенном этапе. В теоретическом отно¬ шении выбор функций uktо (ж) не существенен, но в практических приложениях обычно вводят дополнительные условия для их однозначного определения, исходя из соображений удобства решения конкретной рассматриваемой задачи. Таким образом, функции щ, и2,...; Аи Л2,... могут быть по¬ следовательно определены в любом количестве и их определе¬ ние не представляет принципиальных затруднений. Однако ввиду быстрого усложнения формул (2. 147)-4-(2. 150) на практике 6* 163
обычно ограничиваются несколькими низшими приближениями, часто — первым, реже — вторым. Точность метода. В общем случае метод усреднения не интересуется проблемой сходимости разложения (2. 142) при /г-мх> и рассматривает выражения (2. 142) и (2. 143) как фор¬ мальные разложения, необходимые для построения асимптоти¬ ческих приближений. Из того факта, что асимптотическое (приближенное!) реше¬ ние k-то приближения удовлетворяет уравнению (2. 140) [или системе (2. 144)] с ошибкой порядка р,&+1, с помощью мажора- ционного приема устанавливается, что отклонение приближен¬ ного решения от соответствующего точного (при согласовании начальных условий) будет ограничиваться величиной порядка \ih+xt, остающейся малой при достаточно больших значениях pi (если только само р достаточно мало). Пример 9. Пример посвящен расчету траектории центра масс космического ЛА методом усреднения по Крылову—Боголюбову при старте КЛА с круго¬ вой орбиты Земли. Движение КЛА изучается при следующих предположе¬ ниях: 1) КЛА рассматривается как материальная точка массы т; 2) движение КЛА происходит в экваториальной плоскости Земли; Rt 3) на КЛА действует сила земного притяжения G = mgQ —— и по- R* стоянная тангенциальная сила тяги F=mf. При сделанных предположениях уравнения движения центра масс КЛА в полярной системе координат, совмещенной с плоскостью траектории, при¬ нимают вид R2, R — Rf2 = — До + / sin Ф; /?ср + 2 R<f = f cos Ф, где R — расстояние между КЛА и центром притяжения в любой точке траек¬ тории; До — значение R при t=ta\ ср — полярный угол в любой точке траектории; g — ускорение силы земного притяжения для данного R(i); g—go при R=Ra\ Ф — угол между касательной к траектории и нормалью к радиусу R в любой точке траектории; f—постоянное касательное к траектории ускорение тяги. С учетом обозначений и соотношений Ro R Д2ср ср ^О'РО х2ср0 go R-- к = — z^oRo ■ d2x dx dy ^x2*o(^ + x2 + dz dx af<p dx fifcp 21 164
sin Ф = ■ x2. dx df dx \2-ll/2 ■m cos Ф = X2 + X dx \2 df 1,2 R где V2 = R2 -j. ^2щ2; sin Ф = cos Ф Rf V уравнения движения КЛА преобразуются к виду d 2х dz dx 1 —- + 4- zx = -— 4- и df2 df dy z dx df x2z [' / dx \2 .1/2 ’ = ц- cc2z *2 + dX \ 211/2 df J J y; — x + — ; z2 dz df или к системе уравнений dx df dz S df К системе (I) применяется изложенная выше процедура усреднения по Крылову — Боголюбову. Нулевое относительно р приближение означает решение системы (I) при р = 0, т. е. при z=const, и имеет вид dy df 1 ' *22 [X2 + у 2]1/2 • (I) 22 + г cos (<р +„0); у = — г sin (у + 0), где г и 0 — постоянные интегрирования. Полагая, -что z=z(q>), r=r(ф), 0 = 0(ф), дифференцируя х и у по ф, подставляя результат в систему (I), сравнивая левые и правые части полученных выражений и разрешая их dr dO относительно и , находим df df где dr df 2 dz = —-cos (cp + 6)—— z6 dy 2 dz — sin (? + fl)—— zAr df dz pz5 [1 + rz2 cos (f + 6)] 2 df {[ 1 + rz2 cos (f + 0)]2 + [rz2 sin (f -(- 0)]2}1''2 Разлагая выражение для dz/dq> в ряд по степеням rz2, полагая, что rz2=0(p) и удерживая вследствие этого в разложении лишь члены, содержа¬ щие rz2, получим для данной задачи уравнения движения КЛА в стандарт¬ ной по Крылову — Боголюбову форме dr df = 2(j.z2 cos (cp + 0) [1 — 3rz2 cos (f -j- 0)]; 165
M Z2 = — 2д sin (tp 4- 6) fl — 3гг2 cos (ф + 0)]; d.D ' г dz d<p = jxzs fl — 3rz2 cos (f + 0)]. Применяя к стандартным уравнениям операцию усреднения, получаем усредненные уравнения первого приближения 2тс dr 2p*2 C df 2n J 0 dd 2(122 d<p 2 nr 2ic dz d<f ' 2n J (1 0 (1 — 3rz2 cos т) cos Taft = — Зргг4; 2п (1 — 3/\s2cos т) sin xdx = 0; ■ 3rZ% COS t) dX = (Д.25. (H) Второе уравнение системы (II) дает 0=0О. Решение последнего уравнения может быть записано в виде —=(l-Vf)1/4- Объединяя это решение с первым уравнением системы (II), получаем уравнение dz z dr 3 г ' которое обладает решением rQrzs -- 1. Произвольные постоянные г о и 0О определяются по следующим началь¬ ным условиям: при t=to dx х=1; -=0; z = 1; df dz dv/ = p; ч> = 0- Следовательно, rg = — 2p n ~2 Объединяя полученные результаты, получаем следующее уравнение траек¬ тории КЛА в первом приближении: Ко х — — - = (1 — 4[л<р)2 + 2[х (1 — 4(хср)4 sin ср. R 1_ В этом уравнении первое слагаемое (1 — 4р9)2 описывает так называемое «главное движение» КЛА, имеющее спиральный' характер. Второе слагаемое дополняет «главное движение», определяя колебания центра масс КЛА около выделенного «главного движения» по спиральной траектории.
Глава 3. МЕТОДЫ ОПТИМИЗАЦИИ УПРАВЛЕНИЯ И ПРОЕКТНЫХ ПАРАМЕТРОВ ЛЕТАТЕЛЬНЫХ АППАРАТОВ ОСНОВНЫЕ ОБОЗНАЧЕНИЯ ^-управляющий параметр, а — вектор управляющих параметров. Н, // — функция Гамильтона (гамильтониан задачи оптимизации). /.— функция Лагранжа. J — критерий качества. т — число управляющих переменных и, (/= 1 ,2,..., т). п—число переменных состояния (фазовых координат) Xi <i= = 1, 2,.., п). г — число управляющих параметров ае(д=1, 2,..., г), t—независимое переменное (аргумент), время. Rn — n-мерное пространство с вещественными компонентами. ит ■— m-мерная допустимая область изменения значений управляющих переменных. uj—управляющая координата. U—управляющий вектор (управление). Хп— re-мерная допустимая область изменения значений переменных состояния X. Xi—переменная состояния (фазовая координата), х—вектор состояния (фазовый вектор). X,-—сопряженная переменная (множитель Лагранжа). X—вектор сопряженных переменных (вектор множителей Лагранжа). Индексы .«О» — начало процесса (начальные условия). «1»—конец процесса (конечные условия). «т» — индекс транспонирования вектора или матрицы. Символы ,arg max //(и)— значение вектора и, доставляющее максимум функции и 6 Um Н на множестве Um. .arg min Н(u)— значение вектора ц, доставляющее минимум функции Н и 6 Um на множестве Um. max //(u)— максимум функции Я по переменным ц, принадлежащим и 6 Um мнонсеству Um. min //(и)— минимум функции Я по переменным щ принадлежащим и 6 Um множеству Um. 6— символ вариации. 167
6— гимвол принадлежности элемента некоторому множеству (например, и 6 Um означает, что и является элементом множества Um или принадлежит множеству Um). CZ—символ включения (например, XncRn означает, что мно¬ жество Хп содержится во множестве Rn или множество Хп включено во множество R71). В общем процессе проектирования ЛА можно выделить проб¬ лемы двух типов. 1. Проектирование схемы летной операции, направленной на достижение поставленной задачи (формирование траекторий, режимов и профилей полета и выбор методов управления, реа¬ лизующих эти траектории, и т. д.). Этот круг задач можно назвать проектированием движений ЛА. 2. Проектирование аэродинамических, конструктивных и прочностных схем ЛА (выбор геометрических, аэродинамиче¬ ских, конструктивных и т. д. параметров), обеспечивающих вы¬ полнение общих летно-тактических характеристик и конкретных летных операций. Этот круг задач проектирования связан с вы¬ бором ресурсов, необходимых для реализации поставленных задач. Проектирование движений ЛА тесно связано с группой проблем второго типа, так как полученная при проектировании движений информация является исходной (и во многом опреде¬ ляющей) для этих проблем. Но и в тех случаях, когда имеется уже готовый ЛА (т. е. располагаемые ресурсы определены), в процессе его модификации могут быть осуществлены оптими¬ зирующие изменения. Как традиционные оптимальные задачи механики полета (расчет максимальных скоростей полета, наивыгоднейших ре¬ жимов набора высоты, максимальной дальности, продолжи¬ тельности, оптимального виража и т. д.), так и новые задачи, возникшие в связи с развитием ракетно-космической техники (выведение на орбиту, перелет с орбиты на орбиту, вход в атмо¬ сферу, ориентация и стабилизация в космическом пространстве и т. д.), решаются в настоящий момент наиболее эффективно и строго на основе общих методов математической теории опти¬ мальных процессов управления. Значение математической теории оптимальных процессов управления заключается в том, что она дает единую методоло¬ гию решения весьма широкого круга задач оптимального проек¬ тирования и управления, устраняет эмпиризм и недостаточную общность прежних частных методов и способствует обмену цен¬ ными результатами и методами, полученными в смежных областях. Теория оптимальных процессов позволяет решать широкий круг практических задач механики полета в достаточно общей постановке с учетом большинства ограничений технического характера, накладываемых на осуществимость полета ЛА. Роль методов теории оптимальных процессов особенно возросла в пос- 168
ледние годы в связи с широким внедрением в процесс проекти¬ рования универсальных быстродействующих вычислительных машин, а также в связи с использованием бортовых и наземных быстродействующих управляющих устройств. В данной главе приводятся основные положения математи¬ ческой теории оптимальных процессов, дается математическая постановка задач оптимизации различных типов и приводятся общие методы их решения, основанные на применении принципа максимума, динамического программирования и классического вариационного исчисления. Приводятся также примеры приме¬ нения этих принципов к некоторым задачам механики полета и управления полетом. Следует заметить, что задачи оптимизации движения управ¬ ляемых ЛА, с точки зрения их математического описания, можно разделить на детерминированные, стохастические и игровые (конфликтные.). В данной главе в основном рассматриваются детерминированные задачи. 3. 1. ОБЩАЯ ХАРАКТЕРИСТИКА МЕТОДОВ ОПТИМИЗАЦИИ, ОСНОВАННЫХ НА МАТЕМАТИЧЕСКОЙ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ УПРАВЛЕНИЯ 3. 1.1. Техническая задача оптимального управления и ее математическая модель Исходная информация для решения задач оптимального управления содержится в постановке технической задачи. Техни¬ ческая задача управления ЛА может формулироваться в содер¬ жательных (неформальных) терминах, которые часто носят не¬ сколько расплывчатый характер. Для применения математиче¬ ских методов необходима четкая и строгая формулировка задачи, которая бы устраняла возможные неопределенности и двусмыс¬ ленности и одновременно делала бы задачу математически кор¬ ректной. С этой целью для технической задачи необходима адекватная ей математическая формулировка, называемая математической моделью технической задачи оптимизации. Математическая модель — достаточно полное мате¬ матическое описание физической системы и процесса управления в рамках выбранной степени приближения и детализации. Математическая модель отображает исходную техническую задачу в некоторую математическую схему, в конечном итоге — в некоторую систему чисел. В ней, с одной стороны, явно указы¬ ваются (перечисляются) все те сведения, без которых невоз¬ можно приступить к аналитическому или численному исследо¬ ванию задачи, а с другой стороны, — те дополнительные сведе¬ ния, которые вытекают из технической сущности задачи и кото¬ рые отражают определенные требования к ее характеристикам. Полная математическая модель технической задачи оптими- 169
задии управления состоит из ряда частных математических мо¬ делей, например математической модели процесса управляемого движения ЛА и действующих на него сил, математической мо¬ дели располагаемых ресурсов и технических ограничений, мате¬ матической модели показателя качества процесса управления (критерия качества), математической модели управляющих воз¬ действий и т. д. Таким образом, математическая модель технической задачи управления характеризуется совокупностью определенных мате¬ матических соотношений между ее элементами (дифференциаль¬ ных уравнений, ограничений типа равенств и неравенств, функ¬ ции качества, начальных и граничных условий и т. д.). В теории оптимальных процессов устанавливаются общие условия, кото¬ рым должны удовлетворять элементы математической модели, для того чтобы соответствующая математическая задача опти¬ мизации была бы, во-первых, четко определена, а во-вторых, имела бы смысл, т. е. не содержала условий, приводящих к от¬ сутствию решения. Эти условия содержатся частично в разд.. 3.2 и 3.3. Следует отметить, что техническая формулировка задачи и ее математическая модель в процессе исследования не остаются неизменными, а находятся во взаимодействии друг с другом (рис. 3. 1). Обычно первоначальная техническая формулировка и ее математическая Модель претерпевают значительные измене¬ ния в конце исследования. Таким образом, построение адекват¬ ной математической модели напоминает итерационный процесс, в ходе которого уточняется как постановка самой технической задачи, так и формулировка математической модели. Важно подчеркнуть, что для одной и той же технической задачи мате¬ матическая модель может быть неединственной' (например, одну и ту же задачу можно формулировать в различных систе¬ мах координат и т. п.). Поэтому необходим поиск такого варианта математической модели, для которой решение и ана¬ лиз задачи были бы наиболее просты. Важным шагом в постановке и решении технической задачи управления является выбор критерия оптимальности. Этот выбор является неформальным актом, он не может быть предписан какой-либо теорией, а целиком определяется содержанием за¬ дачи. В некоторых случаях формальное выражение технического понимания оптимальности системы допускает несколько эквива¬ лентных (или почти эквивалентных) формулировок. В таких случаях успех и простота получаемого решения во многом опре¬ деляется выбранной формой критерия оптимальности (при усло¬ вии, что во всех случаях он достаточно полно отражает требова¬ ния технической задачи к системе). После построения матема¬ тической модели процесса управления дальнейшее ее исследо¬ вание и оптимизация проводятся математическими мето¬ дами. 170
171 Рис. 3. 1. Схема взаимосвязи постановки технической задачи оптимизации с соответствующей математической моделью и результатами решения задачи оптимизации для математической модели
3. 1.2. Классификация методов теории оптимальных процессов Методы теории оптимальных процессов можно условно раз¬ делить на непрямые и прямые методы. Непрямые методы (косвенные методы) сводят задачу опти¬ мизации динамических характеристик системы, которые яв¬ ляются функционалами (см. разд. 3.2.5), к решению известных математических проблем. К непрямым методам относятся: ]) принцип максимума Л. С. Понтрягина (см. разд. 3.4.3) и метод множителей Лагранжа классического вариационного исчис¬ ления (см. разд. 3.9.2). Принцип максимума сводит решение задачи оптимизации функционалов к решению теоретически известных задач — максимизации (или минимизации) некоторой спецальной функции конечного числа переменных в сочетании с решением краевой задачи для канонической системы обыкно¬ венных дифференциальных уравнений первого порядка. В клас¬ сическом вариационном исчислении задача оптимизации функ¬ ционала сводится к решению краевой задачи для системы обык¬ новенных дифференциальных уравнений второго порядка. Принцип максимума особенно удобен для решения задач меха¬ ники полета вследствие особенностей записи дифференциальных уравнений движения ЛА * и возможности с его помощью наибо¬ лее просто учесть различного рода ограничения на величины управляющих и фазовых переменных. Классическое вариацион¬ ное исчисление более удобно в задачах, описываемых дифферен¬ циальными уравнениями более общего вида, чем в механике полета (в частности, не разрешенных относительно производ¬ ных), и не содержащих ограничений в виде неравенств на управ¬ ляющие и фазовые переменные; 2) принцип оптимальности динамического программирования Р. Веллмана (см. разд. 3.5.2) и метод Гамильтона — Якоби классического вариационного исчисления. В этих методах задача оптимизации функционала сводится к решению одного нелиней¬ ного дифференциального уравнения в частных производных первого порядка с одним граничным условием; 3) некоторые методы, основанные на использовании резуль¬ татов функционального анализа. Прямые методы теории оптимальных процессов сводят задачу оптимизации функционала к построению минимизирующей (или максимизирующей) последовательности, на основании которой с помощью предельного перехода может быть получено точное решение задачи. К прямым методам относятся методы, основан¬ ные на сведении задач оптимизации функционалов к задачам * Формулировка принципа максимума относится к задачам, описываемым системами обыкновенных дифференциальных уравнений 1-го порядка, разре¬ шенных относительно производных. Именно в такой форме чаще всего запи¬ сываются уравнения движения ЛА. 172
на условный экстремум функций конечного числа переменных, различные варианты градиентных методов (см. разд. 4.3.1), методы типа Ритца— Галеркина и др. Как в случае применения непрямых методов, так и в случае использования прямых методов окончательное решение задачи оптимизации может отыскиваться либо в аналитической (замк¬ нутой) форме, либо в числовой форме. Аналитические решения (за исключением редких случаев, таких, например, как линейные стационарные системы с квадра¬ тичным критерием качества) могут быть найдены лишь для за¬ дач в упрощенной постановке. С их помощью можно исследо¬ вать качественные особенности оптимального управления рас¬ сматриваемого ЛА. Если аналитическое решение не слишком громоздко, из него можно получить необходимые технические выводы. Поскольку решения такого рода не зависят от конкрет¬ ных числовых значений параметров системы и граничных усло¬ вий, они обладают высокой степенью универсальности. Однако в задачах, постановка которых приближается к реальной техни¬ ческой ситуации, получение решений в замкнутой форме, как правило, либо невозможно, либо приводит к весьма сложным выражениям. В этом случае следует обратиться к численным методам решения. Численные методы на современном этапе развития вычисли¬ тельной математики обладают общностью, сравнимой с общно¬ стью аналитических методов. Результаты, относящиеся к чис¬ ленным методам решения задач оптимизации, даны в гл. 4. 3.1.3. Необходимые условия оптимальности управления, достаточные условия оптимальности управления и проблема существования оптимального управления Приведенные в следующих разделах необходимые условия оптимальности управления для различного типа задач оптими¬ зации получены на основе аналитических непрямых методов (см. разд. 3.1.2) оптимизации и образуют совокупность функ¬ циональных соотношений, которым обязательно должно удов¬ летворять экстремальное решение. При выводе их сделано существенное для последующего применения предположение о существовании оптимального управления (оптимального реше¬ ния). Другими словами, если оптимальное решение существует, то оно обязательно удовлетворяет приведенным (и поэтому необхо¬ димым) условиям. Однако этим же необходимым условиям могут удовлетворять и другие решения, не являющиеся опти¬ мальными [подобно тому, как необходимому условию df(x)/dx=0 для минимума функции одного переменного удовле¬ творяют также точки максимума и точки перегиба функции }(х)]. Поэтому если найденное решение удовлетворяет необходимым 173
условиям оптимальности, то это еще не означает, что оно яв¬ ляется оптимальным. Использование одних только необходимых условий дает возможность в принципе найти все решения, им удовлетворяю¬ щие, и отобрать затем среди них те, которые действительно являются оптимальными. Однако практически найти все реше¬ ния, удовлетворяющие необходимым условиям, чаще всего не представляется возможным в силу большой трудоемкости такого процесса. Поэтому после того как найдено какое-либо решение, удовлетворяющее необходимым условиям, целесооб¬ разно проверить, является ли оно действительно оптимальным в смысле исходной постановки задачи. Аналитические условия, выполнимость которых на получен¬ ном решении гарантирует его оптимальность, называются доста¬ точными условиями оптимальности управления. Формулировка этих условий и особенно их практическая (например, вычисли¬ тельная) проверка часто оказывается весьма трудоемкой зада¬ чей. Некоторые достаточные условия оптимальности приведены в разд. 3.4.4. В общем случае применение необходимых условий оптималь¬ ности было бы более обоснованным, если бы для рассматривае¬ мой задачи можно было установить факт существования или существования и единственности оптимального управления. Этот вопрос является математически весьма сложным. Проблема существования оптимального управления состоит из двух вопросов: 1) существование допустимого управления (т. е. управления, принадлежащего заданному классу функций), удовлетворяю¬ щего заданным ограничениям и переводящего систему из задан¬ ного начального состояния в заданное конечное состояние (см. разд. 3.2.10). Иногда граничные условия задачи выбраны так, что система —- в силу ограниченности ее энергетических ресур¬ сов — не в состоянии их удовлетворить, т. е. не может быть указано хотя бы одно допустимое управление. В этом случае не существует решения задачи оптимизации; 2) существование в классе допустимых управлений оптималь¬ ного управления и его единственность. Как первый, так и второй вопрос этой проблемы в случае нелинейных систем общего вида не решены еще с достаточной для приложений полнотой. Проблема осложняется также тем обстоятельством, что из единственности оптимального управле¬ ния не следует единственность управления, удовлетворяющего необходимым условиям. К тому же обычно удовлетворяется какое-либо одно, наиболее важное необходимое условие (чаще всего —принцип максимума). Проверка дальнейших необходимых условий бывает доста¬ точно громоздкой. Это показывает важность любой информации о единственности управлений, удовлетворяющих необходимым 174
условиям оптимальности, а также о конкретных свойствах таких управлений. Необходимо предостеречь от заключений о существовании оптимального управления на основании того факта, что решается физическая задача. На самом деле при применении методов теории оптимальных процессов приходится иметь дело с матема¬ тической моделью. Необходимым условием адекватности описа¬ ния физического процесса математической моделью как раз и является существование решения для математической модели. Поскольку при формировании математической модели вводятся различного рода упрощения, влияние которых на существование решений трудно предсказать, доказательство существования является отдельной математической проблемой. Таким образом: 1) из существования оптимального управления вытекает существование, по крайней мере, одного управления, удовлетво¬ ряющего необходимым условиям оптимальности. Из существова¬ ния управления, удовлетворяющего необходимым условиям оптимальности, не вытекает существование оптимального управ¬ ления; 2) из существования оптимального управления и единствен¬ ности управления, удовлетворяющего необходимым условиям, вытекает единственность оптимального управления. Из сущест¬ вования единственности оптимального управления не следует единственность управления, удовлетворяющего необходимым условиям оптимальности. 3. 1.4. Общая характеристика результатов, которые могут быть получены методами теории оптимального управления Теория оптимальных процессов является основой единой методологии проектирования оптимальных движений ЛА. В ре¬ зультате применения методов теории оптимальных процессов к задачам механики полета могут быть получены: 1. Оптимальные по тому или иному критерию временные про¬ граммы изменения управляющих воздействий и оптимальные значения постоянных управляющих (проектных, настроечных) параметров с учетом различного рода ограничений на их зна¬ чения. 2. Оптимальные траектории, режимы и профили полета ЛА с учетом ограничений на область их расположения в про¬ странстве. 3. Оптимальные законы управления в форме обратной связи, определяющие структуру контура системы управления (реше¬ ние задачи синтеза управления). 4. Предельные значения летных характеристик или иных критериев качества, которые затем можно использовать как эталон для сравнения с другими системами. 175
5. Решения краевых задач попадания из одной точки фазо¬ вого пространства в другую; в частности, задача выведения на неуправляемый объект. 6. Оптимальные стратегии наведения при преследовании управляемого объекта. 3.1.5. Условия рационального применения методов оптимизации Методы оптимизации управления рационально применять: 1. В сложных комплексных системах, где отыскание приемле¬ мых решений на основе опыта затруднительно. Опыт показывает, что оптимизация малых подсистем может приводить к большим потерям в критерии качества объединенной системы. Лучше при¬ ближенно решить задачу оптимизации системы в целом (пусть в упрощенной постановке), чем точно для отдельной подсистемы. 2. В новых задачах, в которых отсутствует опыт формирова¬ ния удовлетворительных характеристик процесса управления. В таких случаях формулировка оптимальной задачи часто позволяет установить качественный характер управления. 3. На возможно ранней стадии проектирования, когда имеется большая свобода выбора. После определения большого количе¬ ства проектных решений система становится недостаточно гиб¬ кой и последующая оптимизация может не дать существенного выигрыша. 4. При необходимости определить направления изменения управления и параметров, дающих наибольшее изменение кри¬ терия качества (определение градиента качества). Следует отметить, что для хорошо изученных и долго экс¬ плуатируемых систем методы оптимизации могут давать неболь¬ шой выигрыш, так как найденные из опыта практические реше¬ ния обычно приближаются к оптимальным. Так, в традицион¬ ных задачах механики полета (оптимальный набор высоты, по¬ лет на максимальную дальность) в случае свободных граничных условий для большей части переменных оптимальные управления дают обычно выигрыш в 5—12% по сравнению с ранее извест¬ ными управлениями. В случае закрепленных граничных условий выигрыш может достигать 20—50%. В некоторых практических задачах механики полета наблю¬ дается определенная «грубость» оптимальных управлений и па¬ раметров, т. е. большим локальным изменениям управлений и параметров отвечают малые изменения критериев качества. Это дает иногда повод к утверждению, что оптимумы на практике всегда пологие и строгие методы оптимизации не нужны. На самом деле «грубость» управления наблюдается лишь в случае, когда оптимальное управление соответствует стацио¬ нарной точке критерия качества. В этом случае изменение уп¬ равления на величину е приводит к отклонению критерия каче¬ ства на величину порядка е2. 176
В случае управлений, лежащих на границе допустимой обла¬ сти, указанная грубость может и не иметь места. Это свойство должно исследоваться для каждой задачи специально. Кроме того, в некоторых задачах даже небольшие улучшения критерия качества, достигаемые за счет оптимизации, могут иметь суще¬ ственное значение (например, в механике космического полета увеличение полезной нагрузки или конечной скорости на 0,5% может давать значительную экономию стоимости системы). Сложные задачи оптимизации управления часто предъяв¬ ляют чрезмерные требования к характеристикам используемых при решении вычислительных машин. Поэтому целесообразно использовать рациональные упрощающие'предположения в ходе постановки задачи с тем, чтобы объем вычислений был не слиш¬ ком велик для современных ЦВМ и не приводил к слишком .затянутым срокам получения решения. 3.2. ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ МАТЕМАТИЧЕСКОЙ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ УПРАВЛЕНИЯ 3.2. 1. Математические модели Теория оптимальных процессов управления имеет дело с ма¬ тематическими моделями технических задач оптимизации про¬ цесса управления физическими системами. Математическая модель есть достаточно полная сводка функциональных соотно¬ шений, описывающих основные свойства физических объектов, процессов их функционирования и управления в рамках выбран¬ ной степени приближения и детализации и отражающая все существенные требования к конкретным техническим характери¬ стикам системы. Математическая модель технической задачи оптимизации процесса управления ЛА состоит из ряда частных математиче¬ ских моделей, включая математическую модель управляемого процесса (например, уравнений движения ЛА и его рулевых приводов), математическую модель технических ограничений на величины управляющих воздействий и на возможное распо¬ ложение ЛА на траектории, математического описания показа¬ теля эффективности (критерия качества) процесса управле¬ ния и т. д. Основные элементы общей математической модели техниче¬ ской задачи оптимизации процесса управления ЛА приведены в табл. 3. 1. Математическая задача оптимизации процесса управления считается полностью определенной (корректно поставленной), если точно описаны все элементы математической модели, фигу¬ рирующие в табл. 3. 1. Построение математической модели за¬ дачи оптимизации управления ЛА удобно проводить, следуя по¬ следовательности общей схемы, указанной в этой таблице. 177
Таблица 3.1 Этапы построения и элементы математической модели технической задачи оптимизации процесса управления для детерминированных систем с сосредоточенными параметрами и непрерывным временем Ч О Я о Е_ s? К >-> оЗ О ^ щ О Он о ° „г ° з £ я о я и а о ca>s ьа fcf CL) Ч Я « Я Я g 4 ° £ « s s 4 2 CQ я 2 ^ CQ S О о S 111 СО К я Л Я я Ч Я Я Я £ «=с * о с С 1 CD о к S Я « со О >т О CD ас сг н Я fct о Я § в ° я tc я я аэ о fcf Я с_ Я Я г ё «*- я Я. я аЗ 3 я Я я Они О 5 8 * & ^ О й g з ш s „ я § Я Н л аз Я ^ СО ' 1х о o*Ss ®2зс. Л р И о CQ (D д О о я В М со са Чу Я й g"- о <1> аД я о Я си я с Он „ я О Я и Е-* 2 CD CD ‘-‘н д и Я Я 7 s « CD t=C ! я 5 о X я о S я t£ я я СО Я Я Я О Я >Т КЗ 03 pH Чо о \о s 2 м •я S а) си сг й >» аз со о я я о Е- t=C CD CD Я Я О О Я О СО, Я Я СИ Я Он СО о я О Я Я о о я я о я н я о Я >5 о Я о 2 3 я я Я н_| m К х 2 Я гЯ С Я £ ^ со н О ^ я со о 5. К ЯЯ д Я О я « Ян ^ CD cd я; я о я с CD. Я Я Он Я О X хо ч д CD . - я 2 д Я сИ я о я я я я я аз CD Я н я н а) Я о Я( СО О я я я & О я д Я Я О я н я о О я н Я СО я CD я я я CD я к fc « © S S Он 5 о Л _ я я Я Я Ян о О •& CD я w я я Я Я о аз § О со д Ю Я д О Я о 2 я S я о я о О я о О CD О »я Я 03 5 S Я та cd Я Е-н О Д Я •< S Он © он га tf Я СМ 8* Ч ОС i,u I'5 * X я к я Я К-Н CD й Я g я о. CD CD Он Я о к. CQ о- я ОнО^ I «о ' я С *i е-н -—- о СИ О ч я Я СО Я я ' О-, О 4 CD Ю н О X я О Я so о 2 Он я я « я о CD »Я Я Я я я ' CD я 5 о Он с о t Я I Я к С4 я г ^ Он Е ^хо г о о о Я Я CD Он Ч О CD Н О CD Я Он Я ^ ° Я X „ я я cD о Он Я CD Я Я .0Н я я Он я о я ю к CQ о о ш и -§| X я £ я Е-н ^ Он я ^ О я Й ^ Я о о 5 я у Он о к CD _ 2 so я S о о хо - О д Н ►э я я и СИ £ ) o-CQ я о о я я К Н s СИ Я Я CD Я о я н си СИ Он § е я я CD O' Ч-» *к "ё1 к S н ■ я ;о о к g Я Я s га Я 2 m 2 & ч я о о Я о д- со »Я ю д 2 ° О S , CD 2 к 178
г *=з ю О Я >=3 XD Я к CU S Я 04 с „ 5 * Я е- CD - ^ 03 О) Я Он Ю С о о _4 •* СЗ о о ^ <§ g 3 « S Ч ° =к S a^pffl “ <u а * 4 ш ^ Я Ч aj£gi 5 5» Й ^ К Е-* дч д" си S 5 « м g 9 g-e« § ag иа С о 5« ° s 2 S £ я и н я со д § *1 К * : Я s ■J 2 а г) 2 £ я с--1 ® S Ч з1 Я 'О CQ д си я о а £ CQ *=3 VQ О- о s с са Оч о н , s с w • >» ч >> х *9- 8 X ш >» с;*4 \х О) X к О) ОС и S to О) а g 2 Он с >н QC U to Г* О) 3 Я & 2 03 Я Я 04 а с а, >> ^ & ^~> S со о CQ + V. ОС U Со ш г: I О) СО ! & а : к со ; о д Ко f-ч Дч d) О 03 а к ч а (=з и я ю со t=3 о а- =к а с ® g Я s х й g &3 | >> D g з S aa £Sgg =3 E- <L) Я «=* S 03 я и я Я я я CO a to ^ re U U U b 'С UJ Ш <-L> 3 X со ~ со ч ><; ю о ьЗ ф S ^ d. 9- сО С Я Е-* К Я Я я я я я о- с- О •w^ к X—S я 3 X -э- л Яг с 5 ^ г$ н я ^ S а я я 5 ^ 5 w я Оч S 0^1-4 ° я а я со X 2 я а к к g ч t=t £®а' О) , Оч о ' С а >> О) 2 К -. а Оч я я со коя Я О) со Я Я Я <и 5 2 -8- к ^ а £ я Я ж ~ <£ =я 2 я я я Я Я 1=3 179 Выбор функциональных классов Обычно u(f) кусочно-непрерыв- для управлений и траекторий. Опре- ные, ограниченные функции времени t, деление допустимых траекторий, х(<) — непрерывные кусочно-глад- управлений и управляющих парамет- кие функции времени t ров
180
181
3.2.2. Переменные состояния (фазовые координаты) управляемого процесса В основе математической модели технической задачи опти¬ мизации процесса управления лежит математическая модель управляемого процесса. Эта модель в свою очередь основы¬ вается на понятии переменных состояния (фазовых координат), которые вводятся в задачу следующим образом. Пусть физическая управляемая система 5 (ЛА, приводы его управляющих органов и т. д.) может быть идеализирована на¬ столько, что в каждый фиксированный момент времени наблю¬ дения t=t' на интервале наблюдения T={t, t'£T ее свойства могут быть описаны конечным множеством действитель¬ ных чисел х\\t'), x2(t'),..., xn(tf), которые рассматриваются как компоненты некоторого вектора x(t') = (xi (f), x2(f),..., xn(t'))T. При изменении момента времени наблюдения, вообще говоря, изменяется и вектор х. Это изменение может быть вызвано при¬ ложенными к объекту воздействиями. Если и при (t' ■—про¬ извольный момент на интервале наблюдения Т) свойства си¬ стемы по-прежнему полностью описываются вектором x(t) = (Xi (t), X2(t),..., Xn(t))т (3.1) и если число п— наименьшее количество величин Xi(t'), с по¬ мощью которых оказывается возможным предсказывать значе¬ ния x(t) при всех t>tf по известным значениям x(t') и известным на Т значениям приложенных воздействий, то вектор x(t) назы¬ вается вектором состояния (детерминированной) системы S в момент t (или вектором фазовых координат). Величины Xi называются компонентами состояния, или фазо¬ выми координатами. Поскольку Xi изменяются с течением времени, то иногда вели¬ чины X{(t) называют переменными состояния (фазовыми пере¬ менными). Множество всех возможных состояний x(t) — (x\(t), x2(t),... ..., х„(/))т в различные моменты времени Т образуют д-мер- ное пространство состояний A" <^Rn (п-мерное фазовое простран¬ ство). Точка х£Хп является изображающей точкой этого про¬ странства. Вектор г = (х, t)T, т. е. состояние в момент t, назы¬ вается событием (фазой). Множество всех возможных событий z образует пространство Zn+1czRn+l событий. Точка z£Zn+l является изображающей точкой пространства событий. Примечания. 1. В механике полета переменными состояния обычно являются пространственные и угловые координаты ЛА, линейные и угловые скорости, масса и т. д. Выбор переменных состояния часто определяется выбо¬ ром системы координат, в которой рассматривается движение ЛА. Отсюда ясно, что для описания одной и той же задачи могут быть использованы раз¬ личные фазовые координаты, т. е. их выбор не является единственным. Однако все мыслимые наборы фазовых координат эквивалентны друг другу в смысле описания состояния системы. 182
2. Фазовое пространство теории оптимального управления не всегда сов¬ падает с фазовым пространством конфигураций и импульсов механики, так как может содержать координаты немеханических систем (например, электриче¬ ских, гидравлических и т. п.). 3. 2. 3. Управление Система 5 называется управляемой на интервале |Yo, t{\, если ее поведение при t>t0 зависит только от начального состояния (t=t0, x0 = x(f0)), будущего поведения некоторого переменного вектора и (входа системы): и= {ии и2,..., umy, m^sl, (3.2) называемого управляющим вектором (или просто управлением), и постоянного вектора а: а= (аь а2,..., аг)т, г>0, (3.3) называемого вектором управляющих (проектных) параметров. Рис. 3. 2. Виды множеств U2 допустимых значений управлений: а, б, в—замкнутые ограниченные выпуклые области, содержащие начало координат; г—невыпуклая область, не содержащая начало координат; д—невыпуклые одномерные области Ui2 и U2Z; е—дискретное множество допустимых значений (1, 2, 3, 4—изолиро¬ ванные точки) Вектор и принимает значения из некоторого множества U™ m-мерного пространства Rm с координатами щ, и2,..., игп. Это множество может быть всем пространством Rm или его частью 183
UmczRm. В механике полета чаще всего Um — замкнутая область пространства Rm. Множество Um называется множеством допустимых значе¬ ний управления. Некоторые виды множеств Um приведены на рис. 3. 2. Постоянный вектор а управляющих параметров в механике полета обычно принадлежит некоторому замкнутому множеству AraRr (Rr — пространство с координатами а\, а2,..., аг). Примечание. В механике полета управляющими переменными и; обычно являются координаты отклонения рулевых поверхностей, вектора тяги и т. п., а в качестве управляющих параметров aQ выступают конструктивные, весовые и геометрические характеристики ЛА (его проектные параметры). Замкнутость и ограниченность множеств Um и Аг означает, что в реальных конструкциях положения рулей и конструктивные параметры не могут быть произвольно большими. В каждой конкретной задаче управляющие перемен¬ ные не обязательно совпадают с координатами отклонения физических «рулей» и органов управления, а определяются степенью детализации задачи и совер¬ шенством математической модели объекта. В некоторых «усеченных» задачах, т. е. задачах, не дающих достаточно полного описания реального объекта, в качестве управляющих переменных могут выступать координаты углового положения ЛА, компоненты скорости и ее направления и т. д. 3. 2. 4. Эволюция состояния системы. Дифференциальные уравнения движения Изменение состояния (эволюция) системы S на временном интервале Т= {/, обычно с хорошей степенью прибли¬ жения описывается системой обыкновенных дифференциальных уравнений первого порядка в нормальной форме Коши: =f (4 х, и, а), (3.4) at где х= (хь х2,..., х„)т — вектор состояния; u = (Ui, и2, ..., Um)т — управляющий вектор; а=(аь а2,..., аг)т— вектор проектных параметров; f = (f ь /г,..., fn)т — вектор обобщенной силы. Система (3.4) образует существенную часть математической модели физической системы S (см. табл. 3.1). В математической модели, описываемой системой дифференциальных уравнений, формальным признаком переменной состояния х является нали¬ чие ее производной dx/di в левой части системы уравнений (3.4). Управляющая переменная и входит только в правую часть си¬ стемы (3.4) и не встречается под знаком производной (это — формальный признак управляющей переменной). Предполагается, что вектор-функция f (t, х, и, а) определена для любых значений х £Хп, и £Um, а £ЛГ, t £Т, непрерывна по совокупности переменных t, х, и, а и непрерывно дифференци¬ руема по t, х, а. Так как поведение вектора и может быть произ¬ вольным (за исключением условия и £ Um) и, кроме того, можно произвольно выбрать постоянный вектор а £ЛГ, то система урав¬ 184
нений (3.4) определяет управляемый процесс. Ход управляемого процесса будет определен на некотором интервале если на этом интервале вектор и задан в одной из двух форм: U = U(t)= u2(t),..., «т(0)Т; (3- 5) u = v(x, ^) = (t»!(x, t),v2(x,t) vm(x, /))T. (3.6) Вектор-функцию u(^) называют программным (временным) управлением (или просто управлением), а вектор-функцию v(x, t) — координатным управлением, или законом управления (в некоторых задачах механики полета — законом наведения). Закон управления (3.6) физически выражает известный прин¬ цип обратной связи, согласно которому величина управляющего воздействия определяется на основании измерения текущего состояния системы х и, быть может, момента времени t. Каждому выбору векторов управляющих параметров а и управления и [в виде (3.5) или (3.6)] и каждому начальному состоянию (при t— to, х0 = х(/0)) соответствует по (3.4) времен¬ ная последовательность состояний x{t, х0, to), которая назы¬ вается фазовой траекторией (поведением, эволюцией, движе¬ нием) системы S. Пара вектор-функции {и(£), х(^)} или {v(x, f), х(/)} называется процессом управления. 3. 2.5. Функционал. Критерий качества управления Величина 7[и(/)] называется функционалом функции u (t) на отрезке to^t^tu если каждой функции n{t), t£[to, t{\, принад¬ лежащей некоторому классу функций, поставлено в соответст¬ вие определенное число. Таким образом, функционал 7[и(^)]— это функция, в которой роль независимого переменного (функционального аргумента) играет функция u(f). При этом 7[и(^)] зависит от совокупности всех значений, принимаемых функцией u(t) на отрезке [to, ft], и может рассматриваться как функция бесконечного числа неза¬ висимых переменных. Для каждого фиксированного конечного момента времени ti = t\ состояние x(ft') системы S, движущейся из начального состояния (t0, х0) в соответствии с уравнением (3.4), является одновременно векторным функционалом (т. е. вектором, компо¬ нентами которого являются функционалы) от управления и(^) и вектор-функцией от вектора а и вектора начальных условий Хо(^о)- Критерии качества процессов управления являются функ¬ ционалами. Достаточно общая форма критерия качества в теории опти¬ мальных процессов имеет вид J [и (/); а] = Ф (/0, ft, х0, хь а) + + j/o(ft x(t), u(t),a)dt, (3.7) ^ 0 185
где x(t) удовлетворяет системе (3.4); u(^) —некоторое выбран¬ ное управление; а — управляющий параметр. В частности, каждую из координат системы (3.4) можно записать в форме (3.7): ■*,•&) = { fi{t, х(/), n{t), a )dt+xi{t0) (i=l, л). to 3.2. 6. Автономные системы Если правые части системы (3.4) и функции f0 и Ф в (3.7) от времени явно не зависят, то соответствующая задача назы¬ вается автономной: d х р г \ — = f(x, и, а); at (3.4') ti 0, Xlt a) +j /0(х, u, a)dt. (3.7') Автономные системы инвариантны относительно сдвига вдоль оси t. Поэтому для автономных систем важна только длитель¬ ность процесса t\—10 и можно положить ?о = 0- 3.2. 7. Допустимое программное управление Вектор-функция и(£) называется допустимым программным управлением в основной задаче (см. разд. 3.3. 1), если: а) u(t) принадлежит к классу кусочно-непрерывных по t на интервале [t0, t{\ функций, т. е. может иметь лишь конечное число точек разрыва первого рода; б) значения и(Т) принадлежат заданному множеству Um для всех [to, fi]. Кусочно-непрерывные управления соответствуют предполо¬ жению о «безынерционное™» перекладки рулей, которые в мо¬ мент разрыва мгновенно «перескакивают» с одного положения в другое. Если желательно учесть «инерцию» рулей, то следует искать управление в классе непрерывных кусочно-гладких ' функций u (t). Такой класс допустимых управлений иногда сводится к предыдущему путем введения нового безынерционного управ¬ ления u(t), связанного со «старым» управлением и(^) соотно¬ шением (3.8) at где и=(и1, й2, ..., U==(K1> ^2> • • • ) Ит) . 186
Рис. 3.3. Примеры управлений Uj(t), принадлежащих различным классам функций: а—гладкое управление; б—кусочно-гладкое непрерывное управление; в—непрерывное управление (в окрестности точки t\ функция u^{t) недифференцируема); г—кусочно¬ непрерывное управление; д—управления, не являющиеся кусочно-непрерывными («^Ю. содержат бесконечное число переключений в окрестности точки t\\ u^n\t)— элемент последовательности, сходящейся к функции, разрывной в каждой точке отрезка |Y0, t\])\ а—управление, содержащее 6-функции Дирака; и°, и1, и2—константы 187
Если Um — замкнутая и ограниченная область, то это озна¬ чает, что введены ограничения на значения первых производных «от вектор-функции и(^). Кусочно-непрерывным функциям и(^) отвечают кусочно-глад¬ кие, функции u(t) в силу (3.8). Таким образом, в новой задаче u_(t) становится переменной состояния, управляемой посредством u(t) через систему (3.8). Если условие u € Um в новой задаче можно снять, то задача сводится к предыдущей для кусочно-непрерывного управления u £Um. В противном случае следует обратиться к задаче опти¬ мизации с ограничениями на фазовые координаты (см. разд. 3. 7). На рис. 3.3 приведены примеры управлений, принадлежащих как к классу кусочно-непрерывных функций, так и к другим классам. Примечание. Рассмотрение допустимых управлений в классе кусочно¬ непрерывных функций объясняется тем, что для оптимизации функционалов на этом классе функций разработан соответствующий математический аппа¬ рат— принцип максимума (см. разд. 3.4.3). Для каждого допустимого управления u(t) в силу сделанных предположений (см. разд. 3.2.4) относительно f(/, х, и) сущест¬ вует единственное абсолютно-непрерывное решение системы x{t)=x{t, х0, to), которое удовлетворяет системе (3.4) почти всюду на [t0, riij (т. е. за исключением конечного числа точек разрыва функции и(£)) и при t=t0 принимает заданное значение xQ=x(t0). 3.2. 8. Допустимый закон управления Закон управления v(x, t) является допустимым на х£Хп, t\\, если а) v(x, t)£Um при всех t£T—[t0, t{\, х£Хп', б) v(x(f), t) =u(/), где x(t) —траектория системы S; u(tf)—допустимое программное управление при законе управления v(x, t). Вектор а управляющих параметров называется допустимым, если его значения принадлежат заданному множеству Ar<^.Rr. 3. 2. 9. Допустимые траектории и процессы Фазовая траектория x(t) системы S называется допустимой, если: а) она получена из решения системы дифференциальных уравнений при допустимом управлении и(/) или при допустимом законе управления v(x, t); б) значения х(£) принадлежат заданной области Хп простран¬ ства состояний Хп. Управляемый процесс (х, и) называется допустимым, если в нем под действием допустимого управления и(£) или допусти- 188
мого закона управления v(x, t) реализуется допустимая траек¬ тория х(/). 3. 2. 10. Граничные условия. Краевая задача Цель управляемого процесса (х, и) состоит в переводе си¬ стемы S из некоторого заданного при t — t0 начального состояния Хо = хЦ0) в заданное конечное состояние Х! = х(^) за время Рис. 3. 4. Примеры граничных условий: а—левый и правый концы фазовой траектории закреплены; б—левый конец закреплен, правый — свободен; в — левый и правый концы — подвижные; г — левый конец закреплен, правый — свободен, за исклю¬ чением координаты Х\; д — общий случай подвижных граничных усло¬ вий; е — граничные условия в задаче встречи движений (перехвата) оптимальная траектория; — произвольная траектория T=t\—10. При этом не все компоненты векторов х0 и Xi и моменты времени t0, t{ обязательно должны быть фиксированными; неко¬ торые могут оставаться не заданными (свободными). В общем случае система 5 в начальный и конечный моменты времени мо- 189
жет находиться в состояниях, описываемых уравнениями вида где l-y -j-/2 2л -|— 2 “I-/"! К2п + 2 + г. Уравнения (3.9) — (3.10) описывают (при фиксированном управляющем параметре а) поверхности размерности (я+1—1\) и (п—/2) в пространстве (t, х) и называются разделенными гра¬ ничными условиями для концов фазовой траектории. Примеры граничных условий приведены на рис. 3.4. Уравнения (3.11) называются смешанными граничными усло¬ виями. Если значения фазовых координат в момент t0 (или t\) не фиксируются, то граничные условия для левого (или правого) конца траектории называются свободными. Разделенные усло¬ вия вида (3.9) — (3.10) часто называют подвижными гранич¬ ными условиями. Определение управлений и(£), при которых решение системы (3.4) удовлетворяет условиям типа (3.9) — (3.10), называется двухточечной краевой задачей. Перевод начального состояния х0 в конечное состояние Х[ на заданном отрезке [4, t{\ не всегда возможен. Однако если най¬ дется хотя бы одна пара векторов {и (7), а} или {v(x, t), а}, осу¬ ществляющая указанный переход, то обычно существуют и дру¬ гие пары векторов, реализующие этот же самый переход. В этом случае каждой паре (и(/), а} соответствует определенное значе¬ ние критерия качества /[и, а]. Можно ставить задачу об отыска¬ нии таких {и(/), а}, которые минимизируют или максимизируют этот критерий. 3.3.1. Основная задача оптимального программного управления Основная задача оптимального программного управления в форме временной программы (3.5) для системы (3.4) с крите¬ рием качества (3.7) и краевыми условиями (3.11) формули¬ руется следующим образом. Среди всех допустимых на отрезке [4, t{\ программных управ¬ лений u = u(t) €Um и управляющих параметров а £ЛГ, переводя¬ щих точку (4, х0) в точку (tu X])’, найти такие, для которых функционал (3. 7) на решениях системы (3.4) принимает наи¬ h (Аь х0, а)-—{.h-y, h-2, ■.., /0,)т-—0; q xl5 a) = (<?!, q2, .. ., 0 (3. 9) (3. 10) или более общими уравнениями вида (3. 11) 3.3. ПОСТАНОВКА ОСНОВНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 190
меньшее (наибольшее) возможное значение с выполнением условий (3.11). Управление u(t), решающее эту задачу, называется опти¬ мальным (программным) управлением, а вектор а — вектором оптимальных параметров. Если пара {и*(/), а*} доставляет абсолютный минимум функционалу 7[и(^), а] на решениях системы (3.4), то выпол¬ няется соотношение jmin=J* = J К (0, а*] < j [U (*), а) (3.12) для всех и в Um, а £ Аг, являющихся допустимыми и осущест¬ вляющих заданный переход с выполнением условия (3.11). Аналогичное определение имеет место для абсолютного мак¬ симума (с заменой знака неравенства < знаком ^). Примечание. Из определения абсолютного минимума (3. 12) следует, что абсолютное минимальное значение функционала /*=/[и*, а*] является единственным, чего нельзя утверждать, вообще говоря, об оптимальном управ¬ лении u*{t) и оптимальном параметре а*. 3. 3.2. Основная задача оптимального координатного управления Основная задача оптимального координатного управления известна в теории оптимальных процессов как проблема синтеза оптимального закона управления, а в некоторых задачах меха¬ ники полета — как задача об оптимальном законе наведения. Задача синтеза оптимального закона управления для системы (3.4) с критерием качества (3.7) и краевыми условиями (3.9), (3. 10), где для упрощения предполагается, что функции /0, f, h, q, Ф от вектора а не зависят, формулируется следующим образом. Среди всех допустимых законов управления v(x, t) найти та¬ кой, что для любых начальных условий (/0, х0) из (3. 9) при под¬ становке этого закона в (3.4) и в (3.7) осуществляется заданный переход в (3.10) и критерий качества /[и] принимает наименьшее (наибольшее) значение. 3. 3. 3. Оптимальные траектории Траектория системы (3.4), соответствующая оптимальному управлению и*(/) или оптимальному закону v*(x, t), называется оптимальной траекторией. Совокупность оптимальной траектории x*(f) и оптимального управления и*(/) образует оптимальный управляемый процесс |х*(^), и*(/)}. Установлено, что при отсутствии вектора а управляющих па¬ раметров в /о, f, h, q, Ф задачи программного и координатного управления эквивалентны. Так как закон оптимального управления v*(x, t) имеет форму закона управления с обратной связью, то он остается оптималь¬ ным для любых значений начальных условий (х0, U) и любых координат х. В отличие от закона v*(x, t) программное опти¬ 191
мальное управление u*(^) является оптимальным лишь для тех начальных условий, для которых оно было вычислено. При изме¬ нении начальных условий будет меняться и функция и*(£). В этом состоит "важное с точки зрения практической реализации системы управления отличие закона оптимального управления v*(x, t) от программного оптимального управления и*(£), по¬ скольку выбор начальных условий на практике никогда не мо¬ жет быть сделан абсолютно точно. Свойства оптимальных управлений и оптимальных траекторий 1. Всякая часть оптимальной траектории (оптимального^ управления) также является в свою очередь оптимальной траек¬ торией (оптимальным управлением). Это свойство математиче¬ ски формулируется следующим образом. Пусть u*(^'), ■—оптимальное управление для вы¬ бранного функционала /[и], соответствующее переходу из состоя¬ ния (t0, х0) в состояние {tu Х]) по оптимальной траектории х* (t). Числа t0, t\ и вектор х0 — фиксированные, а вектор хь вообще говоря, свободен. На оптимальной траектории х* (t) выбираются точки х*(т0) и х* (п), соответствующие моментам времени t=т0 и t=xи где Тогда управление и*(^) на отрезке [to, ti] является оптималь¬ ным, соответствующим переходу из состояния х* (to) в состояние x*(ti), а отрезок [х* (т0), x*(ti)] является оптимальной траекто¬ рией (рис. 3. 5). Таким образом, если начальное состояние системы естьх*(то) и начальный момент времени t=to, то независимо от того, каким образом пришла система к этому состоянию, ее оптимальным последующим движением будет отрезок траектории x*(t), To=sH=£^i, являющийся частью оптимальной траектории между точками (^о, х0) и (tu Xi). Это условие является необходимым свойством оптимальности процесса и служит основой динамиче¬ ского программирования (см. разд. 3.5.2). Примечание. Приведенная краткая формулировка основного свой¬ ства оптимальных траекторий не должна толковаться слишком широко. Тре¬ бование, чтобы начальная и конечная точки траекторий сравнения лежали на оптимальной траектории в те же моменты времени То, И, что и точки опти¬ мальной траектории, или чтобы свободный правый конец х/ траектории срав¬ нения оканчивался в тот же момент t\, что и конец оптимальной траектории, являются существенными. Без их выполнения это свойство, вообще говоря, не имеет места. Так, если заданы только начальная точка х0=х(10) и моменты времени и То, ах(т0) свободен, то отрезок траектории может и не быть оптимальным. В этом случае оптимальным может быть, вообще говоря, другой отрезок x'(t) (см. рис. 3.5). 2. Автономные системы (см. разд. 3. 2. 6) инвариантны отно¬ сительно сдвига вдоль оси t. Это означает, что если и*(£), *о<*<*1 совершает переход хо-э-Х! и сообщает функционалу /[и] значение /*, то при любом действительном т управление 192
|-т), —т также совершает переход х0->Х; и при- .ч ап функционалу /[и] значение /*. Рис. 3. 5. Основное свойство оптимальных траек¬ торий: t f (i=l, 2, 3) — значения функционала на участках оптимальной траектории и на траекториях сравнения, соответственно 3.3.4. Геометрическая интерпретация основной задачи оптимального управления Основным задачам оптимального управления при закреплен¬ ных концах можно дать следующую эквивалентную геометриче¬ скую формулировку. Пусть при t=t0 задано начальное состояние x0=x(to), а при t = t\ — конечное состояние Xi=x(^i), где to, tu х0, xi — фиксиро¬ ванные значения. Тогда в функционале /[и] (3.7) слагаемое Ф(/0> t\, х0, Xj) является известным числом Ф0. Введем новую переменную х0, закон изменения которой имеет вид ^Г = /о(*. X.U, а), (3.13) at с начальным условием ■Хо(^о) =^00=Ф'0- Присоединим эту переменную к системе (3.4). Тогда при t=t0 система находится в точке (xo(t0), *1 (М>..., xn(to) )т, а при t = t 1 — в точке (х0(^), xi{ti),..., xn(ti))T, где t, •*о(/1) = фо +f /о(^.х,и, a)dt=J[u\. to Таким образом, если в (я+1)-мерном пространстве точек (х0, х) провести через точку ( О, Xj) прямую П (рис. 3. б) парал¬ 7 3398 193
лельно оси Ох0, то решение системы (3.4), (3.13) проходит при t = t 1 через точку на прямой Я с координатой x0(ti)=J. Теперь основная задача оптимального программного управ¬ ления формулируется геометрически так. Рис. 3.6. Геометрическая формулировка основной задачи опти¬ мального управления: /—оптимальная траектория; /'—изменение критерия качества / вдоль опти¬ мальной траектории; 2, 3—неоптимальные траектории, проходящие через точки (хо, U), (xi, t\)‘, 2', 3'—изменение критерия качества / вдоль неопти¬ мальных траекторий В (п+1)-мерном фазовом пространстве (х0, хи..., х„)т даны: 1) при t—i0 точка (Ф0, х0); 2) прямая Я, параллельная оси Ох0 и проходящая через точку (О, х;). Среди всех допустимых програшмных управлений u = u(£), обладающих тем свойством, что соответствующее решение (x0(t), x(t)) системы (3.4), (3.13) с начальным условием (Фо, Xi(^o),--., хи(Ф))т пересекает при t=tx прямую Я, найти такое, для которого точка пересечения с прямой Я имеет наи¬ меньшую (наибольшую) координату Xo(^i) =/. 3.4. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОСНОВНОЙ ЗАДАЧИ ПРОГРАММНОГО УПРАВЛЕНИЯ. ПРИНЦИП МАКСИМУМА 3. 4. 1. Краткая формулировка задачи Пусть даны: 1. Система дифференциальных уравнений дви¬ жения =*(*, х, и, а), (3. 14) dt 194
I дг f (t, x, u, а) определены для всех x = (лгь x2,..., xn)T £Xn<^Rn, /„ u £Um, a £Ar, непрерывны по совокупности перемен¬ ных (/, x, u, а) и непрерывно дифференцируемы по (t, х, а). 2. Соотношения, которым удовлетворяют начальные {to, х0) и конечные (С, Xi) фазы движения системы (3. 14): gj{t0, ti, х0) хх, а) = ° (/ = 1, 2, .. . , /<2« + 2 + г), (3.15) где функции gj непрерывно дифференцируемы по всем своим аргументам. 3. Критерий качества управления (функционал) ti J[u{t), а] = Ф((0, tx, х0, х1,а)+| /0(/, х, u, a)dt, (3. 16) to где Ф и /о обладают всеми необходимыми производными. Множество Um представляет собой замкнутую и ограничен¬ ную область эвклидова m-мерного пространства Rm. Функция и(() считается допустимой, если она кусочно-непрерывна и ее значения принадлежат множеству Um: u(t)£Um. 3.4. 2. Некоторые вспомогательные построения и терминология Вводятся: 1. Зависящий от времени вектор сопряженных координат (вектор-функция множителей Лагранжа) ЧО=(*о(ДЛ(0, •••. K(i)h (3.17) 2. Постоянный Вектор р: Ц = (1*1,Р2, • • •, Ыт- (3.18) 3. Вспомогательные функции (гамильтониан задачи оптими¬ зации и функция Лагранжа) ■77 (t, х, u, %, а)=2*///(*, х, и, а)-(-Х0/0(7, х, и, а) (3.19) г=»1 И I L{t0, tu х0, хъ а, М0 = У WjVo, *i, хо, х1,а) + 0ХФ(70, tx, х0, хь а). jTi (3.20) 4. Система дифференциальных уравнений, сопряженная* * Система линейных дифференциальных уравнений у =B(t)y называется сопряженной для системы х=А (t)x+i(t), если B{t)=—Лт(0 и размерность векторов х и у (а также матриц B(t) и A(t)) одинаковы. Таким образом, си¬ стема (3.21) является фактически сопряженной к линеаризованной системе (3. 14), (3.23): df df 8х = — 8х+— bu(t), дх л л ди л л х(0,ч(С) 'х(/),и(0 л л где x(t), U(f) —некоторая опорная траектория и опорное управление, соот¬ ветственно. 7* 195
к (3.14), (3.16) и определяющая изменение вектора 'k(t): d\[ dt dfk (t, x, u, a) 1 dxt (1=0,1,2, *_o (3.21) С помощью функции H исходная система уравнений (3.4) записывается в виде -~Г =// (^, х, и, а) (/ = 0, 1,2, ...,«). (3.22) dt ol[ Индексу i=0 соответствует новая переменная Хо (t), опреде¬ ляемая скалярным уравнением ^7r = fo(t, х, и, а) (3.23) dt с начальным условием -Д>(^о) = -Д>о=ф(*о, tx, х0, хь а). Система уравнений (3.24) (3.25) где H=Vi\ дГ/дх— матрица Якоби, х= (х0, Х\,. .., хп), f= (/о. fu-..,fn), хб ^m+1 — называется канонической системой диффе¬ ренциальных уравнений, связанной с основной задачей. 3. 4. 3. Принцип максимума Л. С. Понтрягина Пусть и*(^)=(й1 (t\ .. ., йт(0)т, ^Gft,, ^i] ~ такое допустимое управление, a a*=(ai, «2, •.пг)т —такое допустимое значение вектора параметров, что соответствующая им траектория x*(t) системы (3. 14) удовлетворяет условиям (3. 15) для концов. Для оптимальности (в смысле минимума *> критерия каче¬ ства (3.16)') управления u*(t), траектории x*(t) и вектора управ¬ ляющих параметров а* необходимо существование такого нену¬ левого переменного вектора l(t) = (Xo{t), An(0)T> Я0(О =const^0 **) и такого постоянного вектора р= (рь цг, . ..., [X;)т, что выполняются следующие условия. *> Случай максимума функционала /[и, а] сводится к задаче в данной по' становке путем рассмотрения функционала /i[u, а]=—/[и, а]. **> Обычно можно принимать Яо=1, см. разд. 3.4.4, следствие 2. 196
1. Вектор-функции x*(t), u*(t), k(t) и вектор а* удовлетво¬ ряют системе dA _ dHjt, x*(Q, u*(Q, X(Q, а*) . dt д\[ dlj _ дН (t, х* (0, и* (О, X (О, а*) Л dxi (3.26) (/.=О, 1,2,..., л). 2. Функция H{t, х*(/), u, ?*ф), а*) переменного u£Um при каждом t£[t0x ф], т. е. при фиксированных х* и 1 и при фик¬ сированном векторе а* достигает при u = u*(/) минимума*): H{t, х* (/), u*(0, М*). а*) —/У*(/, х*(/), Л,(0, а*)= = minW(i, и, М<). а'). (3.27) Таким образом, оптимальное управление определяется как и*ф) = и*(фх*(0, Ц/) a*) = argmm H{t, x*{t), u, X(t), a*). (3.28) ueum Принцип максимума, следовательно, утверждает, что опти¬ мальное управление и*ф) в каждый момент времени t миними¬ зирует проекцию фазовой скорости x=f(t, х, и) управляемого процесса (т. е. проекцию скорости изображающей точки х ^Жп+1) на направление, задаваемое вектором k(t) (напомним, что Я= 2^// = ^тх=)Л(г, х, и, а) г=0 — скалярное произведение векторов %(t) и х. 3. Сопряженные переменные 'ki(t) и функция Н(t, x*(t), u*(t), h(f), а*) непрерывны вдоль оптимальной траектории (аналог условия Эрдмана—Вейерштрасса классического вариационного исчисления, см. разд. 3.9.2). 4. Условия трансверсальности. Для концевых точек (t0, х0), (ti, Xi) и вектора параметров а* при произвольных вариациях концевых точек и параметров выполняются обобщенные условия трансверсальности ИЫ — у1 \1Ьх1 fZo -ф-Я/.-)- дН дап baQdt- (3. 29) Q-l t0 *> В отличие от классической формулировки принципа максимума Л. С. Понтрягина в данном случае операция max в (3. 27) заменена на min. В соответствии с такой заменой необходимое условие (3. 27) можно было бы назвать принципом минимума. Следует обратить внимание, что в данном слу¬ чае Хо > 0, тогда как в классической формулировке Х0 < 0. 197
Здесь dL ■—полная вариация функции L(t0, t\, х0, хь ц, а), определяемой уравнением (3.20): dL = — 8/0+— dt0 0 dt\ bt +5 ; = 0 dL dx-L (t0) (A>) "H dL 8a о (3. 30) dxi (+) Joel da 1 = 0 Q=i ц где 6to, 6tu 8Xi(t0), 8xi(ti), 8aQ — произвольные вариации конце¬ вых точек и параметров. Обобщенные условия трансверсальности (3.29) с учетом выражения (3.30) приводят в силу независимости вариаций б^о, 8th 8xi(t0), 8xi(ti), 8aQ к следующим 2п + 2+г соотношениям: _Я + — dt0 Ц,=0; dL г) Н dxt J t0 dL dti bxl{t0) = btx = 0; 1, 2, 0 (i-- Хг+-^)| 8^(/х)=0 (/=1, n); dL dan dxi J |tt dt\baQ = 0 (e=l, 2..' dao ) n)\ r). (3.31) (3.32) (3. 33) (3.34) (3.35) Если какое-либо конечное условие Xi(to), Xi(tx) или пара¬ метр aQ закреплены (не варьируются), то соответствующая ва¬ риация равна нулю: 6z = 0 (z = t0, t\, Xi(t0), Xi(ti), ae). Если какое-либо конечное условие Xi(to), Xi(t\) или управляю¬ щий параметр ав свободны, то равен нулю коэффициент при свободной вариации бz в (3.33) — (3.35). Таким образом, совокупность условий, выражающих принцип максимума (3.26), (3.28), условий трансверсальности (3.29), дают необходимые условия оптимальности программного управ¬ ления. Условия принципа максимума позволяют среди множества всех траекторий и управлений, переводящих систему из (t0, х0) в (tj, Xi), выделить те отдельные, вообще говоря, изолированные траектории и управления, которые могут быть оптимальными. В формулировке принципа максимума участвует 2п + 2 + т неизвестных функций x0(t), X\(t),..., xn(i): Ло(t), ..., Xn{t); U\ {t),..., um(t), для определения которых имеется (п+1) дифференциальных уравнений физической системы (3.14), (3.23), (п+1) дифференциальных уравнений сопряжен¬ ной системы (3.21) и т конечных соотношений для вытекаю¬ щих из (3. 27). 198
Следовательно, для 2п + 2 + т неизвестных функций имеется 2п + 2 + т соотношений. Если известны все начальные условия х0=х(/0) = (Ф, x1(t0), x2(t0),..xn{t0)y-, | Xo = X(/0) = (X0 (/(,), ^"2 (^o)j • • •) К (^o))T I и фиксированное значение управляющего параметра а, то си¬ стема (3. 26) может быть проинтегрирована. Однако начальный и конечный моменты времени t0, t\, начальное и конечное значе¬ ния вектора фазовых координат х0= (хю,. . ., хп0); Х[= (хц,. . . ..., хп\), начальное и конечное значения вектора сопряженных переменных Я0= (I, Яю,..., Яио), Я[= (1, Хц,..., Хп\), постоянный вектор jx= (fxi, ji2,..., щ) и вектор управляющих параметров а= (аи а2,..., аг) для оптимального решения заранее неизвестны. Они могут быть определены из условий трансверсальности (3.31) — (3.35) и граничных условий (3. 15). В самом деле, для определения (2 + 4н + /+г) неизвестных to, tu х0, хи Яо, Яь ц, а имеется 2 условия (3.31), (3.32), 2п условий (3.33), (3.34), г условий (3.35) и I условий (3. 15); кроме того, 2п соотношений вида x(/i) =ф! (/0, t\, Яо, х0), Я(Ч) =<р2(А>, Я Я0, х0) будут полу¬ чены в результате интегрирования системы (3.26). Таким обра¬ зом, для полученной краевой задачи имеется достаточное число соотношений, позволяющих считать ее, по крайней мере теоре¬ тически, разрешимой. Численные методы решения краевых задач приведены в гл. 4. 3. 4.4. Некоторые следствия принципа максимума 1. Непосредственным следствием системы (3.26) и условия (3.27) является выполнение между точками разрыва функция u(t) соотношения dH _ дН dt dt (3. 37) Это условие для автономных систем (т. е. систем, не завися¬ щих явно от t) приводит к первому интегралу: Я = const вдоль всей оптимальной траектории. 2. В большинстве практических случаев Я0>0 (так называе¬ мый нормальный случай) и поэтому без нарушения общности в силу однородности функции Я по переменным Я* можно при¬ нять Яо = 1. Примечание. Из-за однородности Я по Я, управление и из (3.28) определяется не самими величинами Я,, а их отношениями к одной из них, например, к Я0. Это эквивалентно принятию Я0=1. Случай Я0 = 0 является осо¬ бым (анормальным) и здесь не рассматривается. 3. Условия (3.27), (3.28) принципа максимума позволяют найти оптимальные значения всех т компонент вектора и. Если минимум Я по и достигается во внутренней точке мно¬ жества Um и функции fi дифференцируемы по и, то %* опреде¬ ляются из условия 199
=0 (7 = 1, 2,..., т). (3.38) дН duj Это условие совместно с (3.26) образует условие Эйлера — Лагранжа классического вариационного исчисления для задачи (3.14), (3.15), (3.16) (см. разд. 3.9.2). Примечание. Минимум Я по и далеко не всегда достигается во внут¬ ренней точке множества Um, а в тех случаях, когда он достигается во внутрен¬ ней точке, последняя не обязательно является стационарной (рис. 3. 7). Типы Рис. 3.7. Примеры зависимостей гамильтониана Я от управления и и типы минимизирующих точек и* на множестве U: а—внутренний min Н( и ) в стационарной точке; 6, в—граничный min Н(и); г—гра¬ ничный min Н(и)• ис1, ис2—стационарные точки локальных шах и min; д—внутрен¬ ний т'тН(и) в угловой точке; ис3—точка перегиба; е—две изолированные миними¬ зирующие точки 2 и 3; ж—нестрогий min Ж и) на отрезке 4—5 и изолированный min Щи) в точке 6 минимизирующих точек довольно разнообразны (см. рис. 3.7). Из них особо следует отметить случаи нестрогого минимума, так как принцип максимума не позволяет для них однозначно определить и*. Этот случай в теории опти¬ мального управления является особым (см. разд. 3.6). Если функция Н достигает минимального значения в точке на границе Гцт области Um, то условие (3.38) не является более необходимым в этой точке. При этом возможны три случая: а) множество Um описывается системой связей в виде равенств Xs(«b «2,«т)=0 (s=l, 2,..., v<m); (3.39) тогда минимум Н при условиях (3. 39) находится методом не¬ определенных множителей Лагранжа; 200
б) множество Um задано системой неравенств KSl («1, и2,..., Ит)<0 (s; = 1, 2, 3,...). (3.40) Тогда задача сводится на каждом шаге интегрирования к проб¬ леме нелинейного программирования; в) множество Um является ограниченной областью, не имею¬ щей границ (например, замкнутой двумерной поверхностью типа сферы или эллипсоида в трехмерном пространстве). Для всякой непрерывной функции Я (и), имеющей непрерывные частные производные, заданной на замкнутой поверхности и выраженной через параметрические координаты этой поверхности, точка максимума Я по этим параметрическим координатам принадле¬ жит к числу решений (3. 38), где роль щ играют параметрические координаты поверхности. Пример. Пусть H(uh и2, иг) задана на сфере. Тогда замена «i=rsin 0 содср, u2=r sin 0 sin ф, u3=rcos0 приводит к Н(и\, м2, u3)=H(Q, ф, г) —периодиче¬ ской функции с периодом 2л по 0 и ф и в точке минимума Н—Н имеют место равенства дН дН (30 <?<р 4. Условия (3.38) определяют лишь стационарную точку функции Я. Если и = и* удовлетворяет системе (3.38) и достав¬ ляет минимум функции Я (и), то должны быть выполнены необ¬ ходимые условия второго порядка: матрица частных производных второго порядка функции Я (и) яии=№ (/, / = 1, 2,..., т) (3.41) (дари) I должна быть неотрицательно-определенной в точке и* минимума функции Я (и). Положительная определенность матрицы Яии при выполне¬ нии условий (3.38) в точке и* является достаточным условием для относительного (но не абсолютного!) минимума Я (и) в этой точке. Условие (3.41) неотрицательной определенности матрицы Яии представляет собой условия Лежандра -— Клебша класси¬ ческого вариационного исчисления (см. п. 3.9.4). Проверка положительной определенности матрицы Яии мо¬ жет проводиться по критерию Сильвестра: для положительной определенности матрицы Яии необхо¬ димо и достаточно, чтобы ее угловые миноры были поло¬ жительными. В частности, для положительно определенной матрицы Яии выполняется условие det д*Н ) duiduj] *>°- (3.42) являющееся аналогом условия Гильберта неособенности (невы¬ рожденности) вариационной задачи (см. разд. 3.9.4). 201
5. Приведенная формулировка принципа максимума остается справедливой и для случая, когда область Um зависит явным образом от времени t: Um = Um(t). Замечание. Принцип максимума является, вообще говоря, лишь необходимым условием. Любое допустимое оптимальное управление, если оно существует, удовлетворяет принципу мак¬ симума. Однако не всякое допустимое управление, удовлетво¬ ряющее принципу максимума, является оптимальным. Поэтому после определения управления на основе необходимых условий следует убедиться в его оптимальности. Для этого служат доста¬ точные условия оптимальности. В некоторых случаях принцип максимума является не только' необходимым, но и достаточным условием оптимальности управ¬ ления и(/). Пусть, например, найдено допустимое управление и*(£), которое переводит заданное начальное состояние x(t0) = xQ линейной относительно фазовых координат системы х=Л(/)х + Ь(и, t), иet/m, (3.43) (где Um — замкнутое ограниченное множество; A{t), h(u, t) — непрерывные функции t, и; х= (хи х2,..., хп), и— (щ, и2,..., ит)) в заданное конечное состояние x(^)=xj. Введем такую систему начальных значений сопряженных переменных ^ №>)== (\)0> ^ло)Т> что u* (t) минимизирует в каждый момент t функцию Н = \<Л(и, (4)h(u, f] по всем Um, где Д/о(х*(0, О дх Тогда .управление и * (t) минимизирует на траекториях х* (t) си¬ стемы (3.43), проходящих через х0, хь критерий качества •/[и(01= f 1/о(х, 0 + До(и, *)]<#. ^0 если только f0(x, t) является однозначной выпуклой вниз *> функ¬ цией х для всех t б [Д, t\\ *> Функция fo(x, t) называется выпуклой вниз по х при ^6 [<о> б], если для всех х 6Rn, x£Rn d/0 (x, О (~__х ) + /0(Х, t) < /0(х, t). 202
Пример I. Найти необходимые условия оптимальности программного управления вектором тяги жидкостно-ракетного двигателя (ЖРД) при выве¬ дении гипотетического крылатого ЛА на заданную высоту с максимальной конечной скоростью (см. [15]). Математическая модель задачи выведения. Пусть тех¬ ническая задача выведения ЛА адекватно описывается, математической мо¬ делью процесса управления, сформированной на основе следующих предполо¬ жений. 1. Движение ЛА в процессе выведения достаточно полно характеризуется уравнениями движения его центра масс; движением ЛА (как твердого тела) вокруг центра масс можно пренебречь; изменение массы ЛА в процессе дви¬ жения следует учитывать. 2. Полет происходит над сферической невращающейся Землей в плоско¬ сти большого круга. Гравитационное поле Земли принимается центральным ньютоновским, т. е. гравитационное ускорение определяется выражением где go — стандартное значение ускорения силы тяжести у поверхности Земли; R3 — радиус Земли; h — высота над поверхностью Земли. 3. ЛА совершает полет под действием силы тяги ЖРД, аэродинамических сил и силы земного притяжения. Атмосфера Земли характеризуется известными зависимостями давления p(h) и скорости звука а (к) от высоты (парамет¬ рами стандартной атмосферы). 4. Двигатель ЖРД неподвижно закреплен в корпусе ЛА. Управление дви¬ жением на участке выведения осуществляется за счет поворота продольной оси корпуса ЛА и изменения величины тяги. Переменные состояния. С учетом изложенных выше предполо¬ жений в качестве переменных состояния (фазовых координат) процесса управ¬ ления ЛА на участке выведения целесообразно использовать следующие величины, которые (в соответствии с законами механики) полностью характе¬ ризуют плоское движение точки переменной массы: v(t) —скорость полета ЛА относительно Земли; 0(0 —угол наклона траектории к местному горизонту; h(t) —высота полета над поверхностью Земли; Ig(0—дальность полета вдоль поверхности Земли; m(t)—масса ЛА; t — время. Таким образом, фазовый вектор х= (хи х2, х3, х4, x5)T=(v, 9, h,L3,mY в данной задаче состоит из пяти компонент: Xi = v; х2=0; Xs = h; xt=L3 Хь=т. Закон изменения состояния ЛА. Уравнения движения. Произведенный таким образом выбор переменных состояния эквивалентен рассмотрению движения ЛА на участке выведения в скоростной (ЛА-центри- ческой прямоугольной вертикально-скоростной) системе координат С115. Урав¬ нения плоского движения центра масс ЛА (как точки переменной массы) в системе координат С115 имеют вид Р V = m cos a — — g sin 0; m 0 p Y (g V mv S 1 11 (X ■ | mv 1 V R3+ h cos 0; h = v sin 0; L = vR„ 3 *з+Л ■ cos 0; m = — (лсек (I) 203
Здесь Р = “ист^сек — сила тяги ЖРД, ось которого неподвижно закрепле¬ на относительно корпуса ЛА и направлена вдоль хор¬ ды крыла; «ист— скорость истечения массы; Рсек ■— секундный расход массы топлива; Q — c.kQS) У = oyqS — сила аэродинамического сопротивления и подъемная сила; q = 0,7p(h)M2 — скоростной напор; М — число Маха; сх, с у— аэродинамические коэффициенты; 5 — характерная площадь ЛА; а — угол атаки. Для конкретизации закона, которому подчиняется эволюция состояния ЛА в процессе выведения [т. е. уравнений движения (I)], необходима дальнейшая конкретизация действующих на него аэродинамических сил. Примем, что аэродинамические коэффициенты определяются соотноше¬ ниями, справедливыми для эллиптической поляры Ох = Охо (М) + 2ВЛ (М) [с“ (М)]2 (1 — cos а) = сх0 (М) — clx (М) cos а; Су = с“ (М) sin а, где с*о(М), Ba (М), с®(М)— известные непрерывные и кусочно-гладкие функ¬ ции числа М. Полученная система определена в области «>0, т>0. Она является авто¬ номной, так как не зависит явно от t. Отметим, кроме того, что правые части системы не зависят от L3. Управляющие переменные. Анализ системы уравнений (I) (после учета всех входящих в правые части зависимостей) показывает, что, кроме выбранных переменных состояния (о, 0, A, L , т), в нее входят вели¬ чины а и реек, которые пока не определены. Будем считать, что величины а и Реек могут в известных пределах меняться в течение процесса выведения так, чтобы можно было оказывать воздействие на его характеристики. Предполо¬ жение о том, что величины а и рсек являются некоторыми функциями времени a=a(t), Реек = Реек (t), программа изменения которых может выбираться по нашему усмотрению, соответствует выделению а, рСек в разряд управляющих воздействий. Таким образом, управляющий вектор и(£) в данной задаче имеет две компоненты u(t)-(ui(t), U2(t)) = (a(t), Рсек(О). Область определения управляющих переменных:—я^а^я, 0^рСек<°°. Будем считать, что конфигурация ЛА жестко определена и скорость исте¬ чения «ист задана. Тогда данная задача не содержит проектных (управляю¬ щих) параметров. (Если отказаться от возможности изменения р сек В ПрОЦвССв выведения, т. е. считать p0eK = const, но оставить возможность выбора значе¬ ния рсек, то эту величину следовало бы отнести к управляющим пара¬ метрам). Таким образом, управляемый процесс изменения состояния ЛА при выве¬ дении подчиняется следующим дифференциальным уравнениям, записанным в общих обозначениях разд. 3.2: 204
ЙИСТ х\ — г/2 cos а\ Q(xи х3, hi) *5 *5 = /1 (*Ь *2: -*3. *5. «1. «2); • #ист ^2 = #2 sln ' ■*1*5 *1 Г (лгь лг3, bi) *5 g(x3)sinx2=s gC-Уз) L Xi R3 + -«з COS *2 = fi(x\, x2, XS, XSt Ml, M2), (II) *3 = Xj sin x2 = / (Xu *2); ■*1^0 *4 = ^3 + хз COS *2 = /4 (*1, -«2. *3); Xs = —«2^/5 (“2>- Отметим, что функции fi (x) — непрерывные и кусочно-гладкие функции в своей области определения. В прикладных задачах удобнее, однако, пользо¬ ваться обозначениями переменных, указывающими на их физический смысл. Поэтому в дальнейшем будем использовать систему уравнений (I) в физических обозначениях механики полета. При этом будем учитывать, что v, 0, h, L3, т являются фазовыми координатами, а а, рСек — управляющими переменными: V = -^L {Асек COS а — сх0 (М) + с1 (М) т т qS_ т cos а — -g {h) sin ^ист qS mv ~g(h) v h = v sin 0; vR~ p.ceKsina 4- c“ (M) sin a — R3 + h cos 0; ^3 = R3 + h -cos I (III) m — реек* Ограничения на управляющие воздействия и фазо¬ вые координаты. Будем считать, что по техническим условиям выведе¬ ния на значения величин управляющих переменных) a (t), рСек(?) наложены ограничения ctmin (О < a (t)< amax (t); 0 реек (() ^ реек max» (IV) где ctminctmax^O; Реек max — заданные числа. Ограничения на фазовые координаты отсутствуют (за исключением v>0, т>0). Классы функций управляющих и фазовых перемен- н ы х. Для того чтобы можно было уверенно пользоваться разработанным математическим аппаратом теории оптимальных процессов, необходимо опре¬ делить, какому классу функций времени соответствуют управляющие пере¬ менные a(t), реек (0- Пусть техническая постановка задачи не препятствует предположению о кусочной непрерывности функций a(t), Рсек(0 (т. е. разрывы непрерывности функций a(t), рсек (t) в конечном числе точек не окажут влия- 205
ния на принципиальную возможность физической реализации программы управления). Тогда кусочно-непрерывные функции a(t), р,сек(1), удовлетво¬ ряющие ограничениям (IV) на интервале выведения, будем называть допу¬ стимыми. Относительно фазовых переменных будем предполагать, что они являются непрерывными кусочно-гладкими функциями времени. В силу непрерывности и кусочной гладкости правых частей дифференциальных уравнений выбранный функциональный класс фазовых переменных согласован с функциональным классом управляющих воздействий. Следует, однако, заметить, что выбор класса функций для фазовых переменных может производиться независимо от выбора класса управляющих функций (так, например, масса m(t) могла бы быть разрывной функцией времени, если производится сброс сосредоточенных грузов или отделение ступеней. В этом случае задача должна была бы форму¬ лироваться как проблема с разрывными фазовыми координатами, см. разд. 3. 10). Таким образом, допустимыми являются любые фазовые траекто¬ рии, удовлетворяющие системе (III) при допустимых управляющих функ¬ циях a (I), Реек (t). Начальные и граничные условия. Пусть в начальный момент времени t=t0 заданы начальные значения фазовых координат: v Vo) = vo. 6 (^о) = во; k (*о) = 13 Ш = L30’ т (to) — mQ. (V) Так как система (III) автономна и правые части ее не зависят от /.3, то можно принять tо = 0, Z-30 =0. В конечный момент выведения t=t\ заданы краевые значения следующих фазовых координат: 0(^i)=0i; h(ti)=h\\ m(t\) = m\. (VT) При этом величины t\ и L31 = L3 (Ii) не фиксированы (свободны). Этот тип краевых условий соответствует такому процессу выведения ЛА в заданное конечное состояние 0i, hi, ти при котором время выведения t\ и дальность выведения L31 не представляют технического интереса. Показатель качества выведения ЛА. Критерий опти¬ мальности. Различные способы выведения [т. е. программы управления a(t), Реек(t)] ЛА в заданные условия будем оценивать по величине скорости v(ti) в конце процесса выведения на заданные условия (VI). Величина v(ti) в принятой постановке является функционалом от управления u=(a(t), Реек (Т)) и функцией от свободных значений времени выведения t{ и дальности выведения. Будем считать процесс управления выведением ЛА оптимальным, если управляющие переменные a(t), рсек(0 и конечные значения t\, L31 вы¬ браны так, что максимизируют конечную скорость v(ti). Таким образом, пока¬ зателем качества J в данной задаче является величина J[tl, L31, (a(0, Рсек(0)]=»(*1) (VII) и задача оптимизации процесса выведения ЛА заключается в определении величины J* = max v (t\)- (VII') t„ L3V a (<). ^сек(<) Точная формулировка задачи оптимизации. Среди всех допустимых управляющих функций u=(a(t), рСек(0) и всех значений ве¬ личин 11, L31=L3(t 1) найти такие, при которых ЛА выводится из заданного начального состояния (V) в частично заданное конечное состояние (VI) и величина J—v(t\) принимает максимальное значение /* = /шах- Таким образом, 206
./ max max J [h, L , a(t), fj.ceK (0] = max max /lt Z-gj a (t), !J-CeK (0 11^31 a (0< М-сек^ ^ (C L*3 1, a* (0, f**eK (0) =-arg max max / [*b I a(0, PceK(0] <1. £31 ®, а-сек I щглдочкой отмечены оптимальные значения fi, L31 и оптимальные программы .правления а(Х), ЦсекСО)- Необходимые условия оптимальности управления "(/), Цсек(0 и конечных значений th L31- Для получения необходи¬ мых условий оптимальности управления a(i), Реек(t) применим принцип мак¬ симума, а для получения необходимых условий оптимальности значений и / (| условия трансверсальности (см. разд. 3.4.3). С этой целью вводится вектор Х=(ХЩ, Х6, \h, %L, Ят)т сопряженных переменных и составляется га¬ мильтониан Я системы (III): + И = К иистрсек С%стРсек Q(v> &) COS a — m m Y (v, h, a) f g(h) r{h) sin 6 mv (g(h) v \ \ v + R3 + h ) + COS + \ frV s in 0 + X R3v L *3 + h COS 0 ^/я^сек — H ((X, (Л-сек) “b H где z-w/ ( ИиСт . ^ист • . \ H (a, fJ-ceK) = ( \v cos a + Ag sin a кmj [xceK + + (VIII) aS qS + X„cL (v, h) cos a + Xfic“ (v, h) sin a x m y mv — «управляемая» (т. e. зависящая от управляющих переменных а, рСек) часть гамильтониана Я; 1 - qs 1 - Г g.w V g (п) Sin 0 -Г Сх0 (V, Л) | Ад L т j V - R3 + h J cos 0 + R v + X, v sin 0 4- X, — cos 0 h L R3+h — «неуправляемая» (т. e. не зависящая от управляющих переменных) часть гамильтониана Я. Величину Я(а, Цсек) можно записать в виде я (а, Реек) = Л (а) Реек + Я2 (а), где Fi (а) = Хр М“ст cos а + Х„ —!i^L sin а — Xm; т mv F2 (а) =2Хр баГс“)2 cos а + Хйс“ sin 0. т v “ у mv Система уравнений, сопряженная к исходной системе (III), с помощью функции Я запишется так: 207
X». дН \v dQ dv m dv Xe X0 cos 0 — gcos 0 — dH R3 + h -X* sin 0 — X L R3 + h - COS I (30 : \vg cos 0 — Xfl sin I R,v R3 + h Хл — Хди cos 0 + X , sin 0; £ R3 + h дН lv dh т dQ . . dg . „ , sme —a, oh dh 1 dg J V cos 0 ) + kL v dh C°S ' (R3 + h)2 дн X ( ^истР-сек Q\ dm v V m2 rrR J 1 дГ mv dh • (IX) R3v (R3 + h)2 cos 0; + X dH dU пстрсек nfiv = 0. sin a + trfiv Максимум гамильтониана Я по переменным а, роек, удовлетворяющим ограничениям (IV), достигается в точках а* и рсек , доставляющих максимум управляемой части Я (а, рсен): (а*, Р-сек) = аг§ тах Н (а, рсек) = 0<(Х сек^^сек шах = arg шах апип<а<"шах {Л (а) Реек .+ Я2(а)}. "сек ^сектах Проблема максимизации Я(а, рСек) на прямоугольнике (amin^a^amax, О^Рсек^Цсек max) относится к задачам нелинейного программирования. В данном случае решение можно получить из следующих соображений. По¬ скольку при любом фиксированном а = а величина Я(а, рСек) достигает мак¬ симума по реек при значениях реек, равных Реек max» если F\ (<х) 0,‘ 0, если F\ (а) < 0; любому Реек ИЗ 0 реек ^ Реек шах » если F1 (а) = 0, (X) то соответствующие этим значениям рСек оптимальные значения угла атаки а* находятся из условий: 1. При рСек —0 (или Fi(a)=0) a* = ai = arg шах Я (а, 0) = arg max Я2 (а) = 208
Ctic при \у > 0 и amin ^ С ct^c ■< amax; amax при ку > Оч И Ctlc > amax ИЛИ ку < 0 И а1с < 2 (amin “Ь Ctmax)» amin при к у > 0 И ащ < a1T1in ИЛИ при ку < 0 и aic > 1 2 (amin "b amax)> (XI) где au — стационарная точка функции Н{a, 0)=F2(a), определяемая из урав¬ нения дН{а, 0) да dF% (a) да = — 2X„£ac“ sin a + Х9 cos 6 V = 0. Отсюда следует, что alc=arctg 2\vvBac а У Примечание. Формулы (XI) получены с учетом главного зна¬ чения обратной тригонометрической функции arctg х. 2. При Реек = Реек max а* = а2 = arg max Н (а, (лсек max) = а |а2с при 1,>0и arain ■< Ct2c ^ ®тах» ^тах при ^ ^ 0 И Ct2c ^ &тах ИЛИ I При kv ^ 0 и 0&2с ^ 2 (^min “Ь ^шах)> ctmin при lv > 0 и a2c < amin или при kv < 0 И 0&2с ^ —Т” (®min “Ь ^тах)> I ^ где а2с — стационарная точка функции #( а, ^сектах), определяемая из условия (а, р»сек max) да dFi (а) , д.Р2 (а) да '"сектах+ <3а = 0. Отсюда (при /ц (а) ^0) а2с = arctg h Ч I V X I V ^истР-сек max c ^истрсек max "Г" (c Теперь оптимальные значения a*, р.*ек можно получить из следующих со¬ отношений (при F1 (а) ф 0): аь если Н (аь 0) > Н (а2, р.сек max)» а2, если Н (а1( 0) < Н (а2, рСек max)» не определено, если Н (аь 0) = Н 1а2, рСек max); 209
V- сек / / / О, если И ((Ху( 0)И (ctg, рсекшах)! (^сек тах> ЕСЛИ Н (dj, 0) <^// (СС2, ^сектах)! не определено, если // (а1; 0) = Н {а.2, р-сектах!- При /д(а)Е=0 имеет место так называемый особый режим оптимального управления по р,Сек (см. разд. 3.6). В этом случае оптимальное управление углом атаки находится из условия a* = di, а оптимальное управление секундным расходом топлива ,аСек не может быть определено с помощью принципа максимума. Более подробно особый режим в этом примере не рассматривается (по поводу методов исследования особых режимов см. разд. 3.6). При Я(аь 0)=Я(сс2, Цсев max) и Fj(a)^0 точка, в которой функции Н (а, Цоек) достигает абсолютного максимума по а, рСек на множестве (IV) неединствбнна. Если это равенство соблюдается лишь в изолированные мо¬ менты времени, то безразлично, какую пару значений выбирать из (cti, 0) и (а2, Реек max). Если же это равенство выполняется на некотором интервале времени, то может возникнуть так называемый «скользящий» режим. Для получения необходимых условий оптимальности свободных (незадан¬ ных) значений t\ и Z,31 = /_ (ti) выпишем условия трансверсальности. Общие условия трансверсальности в данной задаче принимают вид НЫ — Xvbv — Х056 — Хд8Л — lLbL3 — \mbm + 5^ = 0. Поскольку левый конец закреплен, то 6(0=6vo=6Qo=8ho+6L30 = 6m0=0. Кроме того, так как на правом конце координаты 0Ь mi, hi заданы, то 60ч = = 6/ii = 6mi=0. Таким образом, окончательно: Н (t{) btx — lv (ti)bvx —,lL(t{) Ы31 + bvi = 0. Отсюда в силу произвольности вариаций 6ti, 6щ, 6L31 находим H(ti) = 0; Xv(tl)= 1; Xi(<1) = 0. (XII) Из уравнения для XL (см. (IX) следует, что X,£, = const; тогда из (XII) получаем Принцип максимума устанавливает, что гамильтониан Я и сопряженные переменные Я, непрерывны вдоль оптимальной траектории. Так как исходная dH дН система уравнений (I) автономна, то из равенства = = 0 (следствие dt dt принципа максимума) и непрерывности гамильтониана Я вдоль оптимальной траектории следует, что задача имеет первый интеграл Н (t) = const = С, причем в силу условий трансверсальности вдоль оптимальных траекторий С=0, Совокупность полученных условий является «достаточной» (в смысле, указанном в разд. 3.4. 3) для численного решения краевой задачи (см. гл. 4). Заметим, однако, что полученные условия оптимальности а, |хСек, h, Е31 яв¬ ляются лишь необходимыми. Поэтому не всякое решение краевой задачи при¬ водит к оптимальному управлению. 210
3.5. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ОСНОВНОЙ ЗАДАЧИ СИНТЕЗА ЗАКОНА УПРАВЛЕНИЯ. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ 3.5.1. Задача синтеза оптимального закона управления Для синтеза оптимального закона управления систем с об- luiiiofi связью, оптимальных замкнутых контуров управления, оптимальных законов наведения и т. д. (см. разд. 3.3.2) более • ■I иттвенен другой подход, чем использованный при решении ы I.Iч, описанных в разд. 3.4, 3.9. И отличие от уравнений Эйлера — Лагранжа и принципа максимума Понтрягина, использующих временное представле- оптимального управления [в форме и*=и(Д1 для единичного моы'кта управления, этот подход рассматривает оптимальное управление в форме закона u* = v*(x, t) (координатное управле¬ ние, управление в форме обратной связи) для множества одно- рпдпых одинаковых объектов, отличающихся различными на¬ чальными состояниями. С точки зрения механики этот подход соответствует рассмот- |м пшо распространения «волн возбуждения» от некоторого источника в неоднородной среде. Общность обоих подходов уста¬ навливает проективная геометрия, с точки зрения которой I расктория точки в фазовом пространстве может рассматри- наться и как последовательность точек и как огибающая своих касательных. Последовательное применение описываемого подхода к за- Iачам оптимального управления приводит для непрерывных про¬ цессов к дифференциальному уравнению (нелинейному) в част¬ ных производных первого порядка типа уравнения Гамильтона — Якоби. Один из возможных способов получения этого уравнения со- е Iопт в использовании принципа оптимальности динамического программирования. Динамическое программирование является нжольно общим методом, разработанным для решения общих мдач многоэтапного выбора (т. е. задач, в которых результаты предыдущих операций можно использовать для управления ходом будущих операций). Г 5. 2. Принцип оптимальности динамического программирования Принцип оптимальности. В основе динамического программирования лежит сформулированный Р. Веллманом принцип оптимальности. Основное свойство оптимальной траек- гории (оптимального управления), указанное в разд. 3.3.3, можно сформулировать в виде следующего принципа оптималь¬ ности. Оптимальное управление не зависит от того, каким образом пришла система к данному состоянию при t=t' (т. е. не зависит 211
от «предыстории» движения) и для будущих моментов времени полностью определяется лишь состоянием системы в рассматри¬ ваемый момент времени. Как частный случай в динамическом программировании рас¬ сматриваются задачи управления непрерывными процессами (типа сформулированной в разд. 3.3.2 основной задачи опти¬ мального координатного управления). Краткая формулировка задачи. Пусть дана си¬ стема уравнений движения: х, и), (3.44) at где и=(я1> я2,..umy£Um\ x=(Xl, хп)т£Хп; f=(/i(A х, и), /,(*, X, и),..., fn{t, X, и))т; и граничные условия х(А>)=х0; х(/1) = х1. (3.45) Требуется синтезировать закон оптимального управления u* = v*(x, t), минимизирующий значение функционала 11 J[t0, х0, u] = j/0(/t X, u)dt. (3.46) ^0 Необходимые условия. Пусть в (п+1)-мерном про¬ странстве (Хп, Т) имеется некоторая область G(x, t) начальных значений х0, tо((х0, ^o)€G(x, /)), для каждой точки которой существует оптимальное (в смысле минимума J[t0, х0, и]) управле¬ ние u*(f), переводящее эти начальные точки в некоторую фик¬ сированную точку (x(^i)=xb ^i); Xj, ti — заданы. На таких оптимальных управлениях минимальное значение критерия ка¬ чества (3.46) будет зависеть лишь от начальных значений х0, to- Таким образом, *^rain== ^ ==^/(^о> Х0), где V (to, х0)—некоторая функция (я+1) переменного to, XiO) . • • , ХпО- Имея в виду произвольную точку области G(x, t), в дальней¬ шем, в целях упрощения записи, нижний индекс «О» будем опу¬ скать. Таким образом, функция V(t, х)—минимальное значение критерия качества (3.46) на оптимальных траекториях системы (3.44), начинающихся в точке (t, х) и заканчивающихся в фик¬ сированной точке (/ь Xj): V {t, х) = min Г /0(/, х, u)dt (3.47) uWm f на траекториях (3.44) из (/, x) в (t\, xj). 212
Примечание. Функция V(t, х) является аналогом «действия» в ана- штической механике и «экстремального интеграла» в классическом вариацион¬ ном исчислении. Если функция V{t, х) существует и является непрерывна дифференцируемой по (t, х), то она удовлетворяет основному уравнению динамического программирования — дифференциаль¬ ному уравнению в частных производных первого порядка (урав¬ нению Гамильтона — Веллмана): -^ + min Hit, х, [u) = 0, (3.48) dt ug цт \ дх с граничным условием V&, х1)=0; (3.49) здесь М{{, х, Vx, и.)=/„(*, х, u)+Kxf(if, х, u), (3.50) ГДе v х — —-— (см. табл. 3.2). ох Примечание. Уравнение (3.48) аналогично уравнению Гамильтона— Якоби классического вариационного исчисления: (3. 51) где функция Н получена в результате подстановки в функцию H(t, х, Vx, и) управления u0=u°(^, х, Гх), найденного из условия стационарности этой функции: дН du.j = 0 (/=1,2, .... т). (3. 52) Из (3.48) можно определить оптимальный закон управления: u*=v* (г?, x) = argmin Hit, х, , u) — u*(f, х, . (3.53) иеит \ дх J \ дх J Геометрический смысл условия (3.53) пояснен на рис. 3.8. Если функция V(t, х) найдена путем решения уравнения (3.48) с условием (3.49), то проблема синтеза решена, так как для известной функции V(t, х) имеем u* = u* (i, x,--^) = V(/, х). (3.54) Подобно тому как принцип максимума Понтрягина придает удобную форму и уточняет условие Вейерштрасса (см. разд. 3.9.3) для основной задачи оптимального программного управления в случае замкнутой области значений управления 213
Um, так и уравнение Гамильтона — Веллмана является уточне¬ нием и обобщением уравнения Гамильтона — Якоби. Уточнение состоит в том, что вместо условия стационарности дН/ди=0 там, где оно не отвечает существу дела, в (3.48) используется условие Рис. 3. 8. Геометрический смысл условия min H(t, х, Гх, и) = и 6 ит В приведенном условии (3.48) требование непрерывной диф¬ ференцируемости (гладкости) функции V(t, х) является суще¬ ственным. Но в отличие от принципа максимума, где утверж¬ дается существование необходимой для него вектор-функции !(/), существование гладкого потенциала V(t, х) в методе ди¬ ных фазовых CKODOcmim~''V(t0,x) = C0 = cmst x=f(x,u) в точке х0 при допустипых значениях и е U = min х, u)]: u 6 um V(i ,x) = mln J [u(t)J, Кх=^-,л=т = 2, /„=0, ueum x*—оптимальная фазовая скорость: x*= f (t, X, u*); u '(^x)—оптимальное управление: u*=arg min H (t, x, Vx, u); u6Um x*—оптимальная траектория 214
мимического программирования не доказывается. Это снижает ценность необходимого условия (3.48), так как для негладкой функции V(t, х) трудно сохранить необходимость его в полном объеме. 3. 5. 3. Ослабленное необходимое условие Уточненное необходимое условие для основной задачи .опти¬ мального координатного управления на основе принципа опти¬ мальности, частично освободное от требования непрерывной дифференцируемости функции V(t, х), формулируется следую¬ щим образом. Формулировка задачи. Пусть краевые условия имеют вид x(2f0) = x0; я(/х, х &)) = ().. (3.55) Минимизируемый функционал имеет вид J[tо, Х„, u] = ®(flt x(^»+j/o(^ X, u)dt (3.56) to и определен на траекториях системы (3.44) с управлением и (о е £""(*, х). Закон управления v(t, х) считается допустимым, если и(/) = = v(t, x(t)), v(t, x(t)) £ Um(t, x), и является кусочно-непре¬ рывным. Если управление u = u*(/), доставляет минимум: функционалу /, то ему соответствует оптимальная траекто¬ рия х* (/). Пусть V(г'о, х0)=ш1п(ф(<1, х(^))+ f f0(t, х, u)dt ( i * 11 = Ф(*х, x*()*)) —}— j*fait, x*00, U*{t))dt. (3.57) 10 Тогда V(tQ, х0)<Ф&, x(^)) + j/o(/, x(0, U to где u(£) произвольно. _ Необходимые условия. Предполагается, что искомое оптимальное управление u* = V* (t, х) существует. Тогда можно1 установить необходимые условия для основной задачи опти¬ мального координатного управления. 216
Пусть в области G пространства состояний Хп выполняются следующие условия. 1. Для x£G в момент / функция П и (*’ х’ "ДГ ’ и)=/о(^. х> х’и) iS 6 имеет абсолютный минимум по и, т. е. min Я=Я* (/, х, Ух) при U u* = v*(/, x)=u*(/, х, Ух) но всем допустимым u(/)£ Um(t, х), где Vx=dV/dx — градиент У(/, х). 2. Решение х(/) системы (3.44) существует и является непре¬ рывной функцией для всех допустимых u(t)£Um(t, х). 3. Функция fo(t, х, и) непрерывна по /. 4. Функция Уг(/, x)=dV/dt непрерывна по / и х; вектор- функции Ух(/, х) и f (/, х, и) либо непрерывны по / и х, либо имеют равные левый и правый пределы для скалярного произве¬ дения Vx -f вдоль любой траекториях)/) системы (3.44): lim [Пх(/, x)f(/, х(/)), и(/))]= lim [Vx(/, x)f(/, х(/), и(/))]. t-*-t о+О t->-t о—О 5. Существует оптимальное движение для каждого началь¬ ного Xo(G в некоторое состояние, удовлетворяющее условию q(/b Xj)=0 и притом такое, что траектория не выходит из G. 6. Каждая точка в G, не удовлетворяющая условию q(/, х)=0, имеет окрестность, целиком лежащую в G. Тогда функция У(/, х) в области G удовлетворяет уравнению Г амильтона — Веллмана +/„(*, х(0, u(/))]=0, (3.58) . U J min иеит i dt или min \dV-{i’, Х) + ^х(/, x)f(/, х, и) + /0(/, х, u)| = ug Um dt dV(t, x) dt dV(t, x) min H (/, x, Vx(/, x), u)= ueum dt e граничным- условием ■H\t, x, Vx(t, x)) = 0 V(i, х) = Ф(/, x) (3.581) (3.58") на гиперповерхности q(t, x)=0. Здесь обозначено: Я*(/, х, Ух(/, x))=min//(/, х, 1/х(/, х), и), иб ит ■j —полная производная вдоль траектории, реализуемой dV dt под действием управления и. 216
Так как при известной функции V (i, х) u* = argminН = и*(t, х, V%{t, х)) = v*(t, х), u &Jm то найденное решение V(t, х) уравнения (3.58) одновременно дает решение проблемы синтеза оптимального закона управ¬ ления. Замечания. 1. Требование 4 влечет за собой непрерыв¬ ность функций -^-1 и V(t, х) по времени t. L d-t Ju 2. Когда Vt, Vx и fi непрерывны по ^ и х, уравнение (3. 58) представляет собой уравнение Гамильтона — Якоби. Общая последовательность действий, которой целесообразно придерживаться при решении задачи синтеза оптимального за¬ кона управления методом динамического программирования, представлена в табл. 3. 2. Таблица 3.2 Сводка общих процедур метода динамического программирования для вычисления оптимального закона управления u*=v*(l, х) Шаг 1 Образуется функция Н, в которой сопряженные переменные X; заменяются на компоненты вектора dV — = graAxV{t, x) = VK: (dV(t, x) dVjt, x) dV(t, х) дхп \ дх\ дхп H(t, х, u, Vx) = VJ(t, х, u)+f0(t, х, u) Шаг 2 Минимизируется H(t, х, и, Гх) по и 6 Um и находится явная зависимость управления и* от компонент вектора Vх. и* = и*(х, Vx, t) = argmin H(t, x, и, Гх) ue ит Шаг 3 Находится минимальное значение Н* путем подстановки в Н зна¬ чения u*(t, х, Гх): H*(t, х, Гх) = Н (t, х, u* (t, х, Г ), V ) 217
Продолжение Шаг 4 Решается дифференциальное уравнение в частных производных Г амильтона — Веллмана dV H*it, х, П ) Н- —— = 0 dt с соответствующим граничным условием для функции V it, х): V (t, х) = Ф(Д х) на гиперповерхности q(^, х) = 0 Шаг 5 Подставляя результаты шага 4 в выражение для и* (t, х, Vх), получаем закон управления с обратной связью „ , .Л dVit, х)\ u* v* (t, х) — и* 1/, X, ^ J Пример 2. Синтез оптимального закона управления для линейной системы с квадратичным критерием качества. Проблема аналитического конструирова¬ ния оптимальных автопилотов. Пусть нестационарная линейная система описывается векторным линей¬ ным дифференциальным уравнением х = A (t) х + В (t) u + Ci (t) (I) с начальным условием х (/о) = х; < t < th (1П где t\ — фиксировано, a to, х0 — известные величины (которые, однако, спе циально не выбираются), и пусть критерий качества имеет вид J [u] = ljxj + — x^jXj + j1 [lj (t) x (0 + I3 (О U + — (xTQ (t) X 4- to + xrN (t) и + итЛД (0 x + итЯ (t) и)] dt. (ПН Здесь • x = (Xj, jc2, . . .. хл)т; f = (/j, . . fn)T; C, A (t) — матрицы размерности n X n; u = (ui,. . um)T, Xx = x(^i); B(t), N(t)—матрицы размерности nxm; Rh Q(t) — положительно полуопре- деленные * симметричные матрицы размерности яХя; P(t)—положительно * Симметричная матрица Q называется положительно полуопределенной, если все ее собственные значения неотрицательны или если соответствующая ей квадратичная форма неотрицательна, т. е. xTQx^0 для всех х = = (хь х2,..хп)т. Для того чтобы матрица Q была положительно полуопре¬ деленной, необходимо и достаточно, чтобы все главные (а не только угловые!) миноры были неотрицательны: Qf.12 * [Л > 0 (1 <- г'х < г2 <... < ip < п; р = 1, 2 . . .. /г). ^2 • • • tр/ 218
определенная симметричная матрица размерности тхт; f(t)—известная функция времени; 1I; 12(t) — «-мерные векторы, I3(t)—«z-мерный вектор. Предполагается, что на значения управляющего вектора и не наклады¬ вается каких-либо ограничений, а матрицы Q(t), N(t), P(t) таковы, что вы¬ полняется условие Q(t)—N(t)P-l(t)N*(t)^s О [это условие гарантирует отсутствие сопряженных (см. разд. 3.9.5) точек в данной задаче]. Необходимо найти закон управления с обратной связью u *=v * (х, (), минимизирующий критерий /[и]. Заметим, что значения вектора фазовых ко¬ ординат х при t—t\ не заданы (т. е. рассматриваемая задача относится к числу задач оптимального управления со свободным правым концом). Пусть V(t, х) — минимальное значение критерия качества /[и] при дви¬ жении системы (I) из произвольной начальной точки (t, х) (нижний индекс «О» опущен) на отрезке времени [f, t{\, t^ty. J* = Jmin = V (t, x) = min J [u]. U При решении задачи методом динамического программирования целесооб¬ разно руководствоваться последовательностью действий, изложенной в сводке общих процедур (см. табл. 3.2). В соответствии с табл. 3-2 составляем функ¬ цию H(t, х, X, и) (гамильтониан) для данной задачи Н (t, х, к, и) = /о ((, х, и) + кТ/ ((, х, и) = 1£х -f lju + + (xTQx + xTN и + и T7VTx + итЯи) + Хт (Дх + Ви + С f) и заменяем сопряженный вектор Хт на градиент*) Vx (t, х) функции V (t, х)) по х: Н (t, х, Vx, u) = l£x + IgU + -у- (xTQx + 2xT7Vu + uTPu) + + Пх(Дх + Bu 4- Cf). Дифференциальное уравнение Гамильтона—Веллмана (3.48) в данном случае имеет вид + min | lgX + I3U + ~ (xTQx + 2xTiVu + uTPu) + dt п l 2 + (Дх + Bu + Cf)} = О, (IV) где функция V{t, x) удовлетворяет граничному условию (3. 58"): V (th x) — ljx + — xTBiX. (V) Поскольку, по предположению, P(t)—положительно определенная мат¬ рица, то минимум H(t, х, Vx, u) по u достигается в стационарной точке, т. е. в точке, где ^-=0. du *) Градиент строкой. dV(t, х) дх =У ((, х) функции V(t, х) считается вектором- 219
Отсюда u* = arg min И (t, x, Vx, u) = — P~1 [I3 + NTx + BVX]. (VI) u Подставляя теперь полученное выражение для и* в (IV), находим окон¬ чательный вид основного дифференциального уравнения динамического про¬ граммирования (в данном случае это будет дифференциальное уравнение Гамильтона-Якоби, так как и* найдено из условия стационарности Я): dV 1 1 — + Vx Ar - — VxBP-43 - VXBP~W4 - — VxBP~WTVl + VxCf + + \3p-^vi + + -y xTQx — XTNP-Wrx = 0. (VII) Доказано, что в линейных системах с квадратичным критерием качества при сделанных предположениях относительно матриц Q(t), P(t), N(t), R{ решение уравнения (VII) с краевым условием (V) существует и его можно искать в виде V {t, х) = ~~~~ xTR (t) х + qT (0 х + г (О, (VIII) где R(t)— симметричная матрица размерности яХ«; q(t)—n-мерный вектор; r(t) — скаляр. Частные прозводные функции V (t, х), записанной в форме (VIII), имеют вид dVU, х) 1 т. д’ ' = —хтЯ(Ох + чт(/)х + г(0; (IX) Vl(t, х) = W(t, х) дх = R( О X + q (0; dV(t, х) дх = Xе R + qT (X) Подставляя выражения (IX) и (X) в уравнение (VII) и учитывая, что: 1) при одновременном умножении произвольной матрицы М слева и справа на вектор х имеет место соотношение xtjMx = хт (М + уИт) х (т. е. происходит выделение симметричной части — (М + Мг) матрицы М); 2) скалярное произведение обладает свойством транспонируемости УТЬ = Ьту, получим -у хт [R + R (А — ВР-тт) + (А — BP-mT)TR + Q — NP~Wr — — RBP-iByR] х + [qT + qT (A — BP~WT) — 1 lP~WTR — c?BP-lBTR — — 1JP-WT + \\ + (Cf)TiR] x + ‘r—y qT5P-iBTq — lJP-iSTq + qTCf — (XI) 220
Поскольку условие (XI) должно выполняться тождественно для любых значений х и поскольку при t=t\ для любых значений х должно выполняться тождественно следующее соотношение [см. (V) и (VIII)]: xrR (П) х + qT (({) х + г (tx) = xT^iX + \\х, то для определения матрицы R(t), вектора q{t) и скаляра r{t) получаем сле¬ дующие уравнения и граничные условия: 1) R + R {А — BP-WT) + (А — BP~iNT)TR — RBP-iBrR + Q — — NP-mr = R + RA + ArR — (ЯВ + N) P~i (VT + ВТЛ) + Q = 0; (XII) Я(<1) = *1. (Х1Г) 2) qT + qT {A — BP~WT) — 1 *Р-1ВТЯ — qTBP~iBrR — -l£P~WT + l£ + (Cf)TP = 0; (XIII) qT(^i) = lI- (ХШ') 3) r~Y qTBP~iBTq — l*P-i5Tq + q TCf — -у 1*P-H3 = 0; (XIV) r (^i) = 0. (XIV') Полученные уравнения следует интегрировать в обратном времени от t=tl к t=t0. Оптимальный закон управления с обратной связью имеет вид и* (х, t) = - Р-1 (О [(£т (О Р (О + 7VT (О) х + £т (0 q (<) + 13 (01- (XV) Решения некоторых других задач оптимального управления для линейных систем с квадратичным критерием качества при¬ ведены в табл. 3.3. В пп. 1—7 (строках 1—7) этой таблицы при¬ ведены постановка и решения задачи синтеза оптимального за¬ кона управления при свободных граничных условиях на правом конце траектории, а в п. 8 — постановка и решение задачи при заданных граничных условиях на правом конце. В пп. 1—6, 8 рассматриваются однородные линейные системы, в п. 7 — неодно¬ родная линейная система. В п. 1 дано решение задачи синтеза для нестационарной линейной системы и нестационарного квадратич¬ ного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 2—для стационарной (незави¬ сящей явно от t) системы и стационарного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 3 •— для стационарной системы и стационар¬ ного критерия качества на неограниченном интервале времени ([0, оо]), в п. 4 — для нестационарной системы и нестационарного квадратичного критерия более общего вида, чем в пп. 1—3 (кри¬ терий содержит перекрестные Члены типа xTNu). В п. 5 приве¬ дено решение задачи, которая в определенном смысле эквива¬ лентна задаче п. 4 (см. 5-й столбец таблицы), в п. 6 дано реше¬ ние для оптимизации отклонения системы от заданного желаемого поведения, в п. 7 рассмотрен случай синтеза опти- 221
Таблица 3. 3 Оптимизация линейных систем с квадратичным критерием качества при отсутствии ограничений на значения управляющих функций К я щ ю Э" н та <у S н С « О Вн та £ ft S „ О s s<; * К с, та к m £* oS QJ к 5 11 S а * Й £ 3 та и о ч 2 £ К >> К Л «£ S О О) н К CJ * К в и и та ■don on «я х ь. s. х X So нТ' / s So о. х А аси + + 35 QJ 1 I ■а и :°-х о; о? О <1) В* fcC К с- О. I С:° '£^ « сЗ 03 - CQ ' <-*' о - So ^ ^ х^& + х£ I X •X I X оз Т Т 0, о; cq о а I g "«I т о? + X О? X ч а + х се е *-< X s’ О е X о а Си О) S; ГО а О. о"„ С а Л I и аг а a Is о® s &£ - О Л ^ 5^ г? S X Он S н О S S н с К К о. С 1=с £ с1) Л Он S cq + х so ■'С II ■ X сЗ о с К *= 3 s ■ X : с з "Ч & So о w О oq О- X II II 1 -__,п о- X ХГ о , S о X II * а н X X II 4м II X з s 5 Он g Й о я я <D W Он 5 I , >> X X I I н I ( oq ; х$П Q? з 0. н 3 ~г X O' нх 3 S3 + к i н н £ о о Л О О к к ° К Он D? (D «• ° n S ё §х в о 5 я ъ а “ O.S О н X н х4 1) сЗ S g о 222
II <y-_N о X с о X о ОС 0- о XT il * >о к X — | СМ il II - ■R + QC Qd •« qc L н ^ " il t* L ** V “3 ~ * £ il О T £ O' 0; x g g H 0 5. a ffl H н sag я g X о a s a я a, QC X « ^ d> I s I а о <u QC 0 <u О + or ■X -R QC ^ *-4 rCs &>, a; <u oc P ■« о QC 0? 05 7 0, 05 QC p5 о и « CD i i v- ° H « I й * н s C3 Cd H CD _ fcf P E H 3 w VO CO ^ L S S H к <D cd cd « s a 5 a> о P ч <d ^ <D U ч ts к о О С, и I s I ca O' S О к 03 _L Qh ~г >■> о eg я s dr н E cd a, x о 18 S 0J5S СП О p ^ и ca 7 н к о о e о С£ 0Q ^ _° 0) °?С & ? Р Л <ы § з о я е $ о § 3 ч к о S Оч « К о о Н О Ч о о с к Q? 3 ч - CD X CD Si з S к н dr О s о p< к H CD <D «d s § а i g s 4 « о 2 в к cd 5 4 К S ^ CD £ Оч 2 £T cd E S R V § as e о § ■« X К s g . о sr к S я л ан л л ч £ о О) С) о Н S Е о Е Ч Е Ч ^ Л 3 oq + X ■X £ о о 5 Е ° § а “as я X S , 05 •X н ^ я 3 S Е Р* si £ si 223
_ Продолжение Оптимальный закон управле- Уравнение движения Начальные и конечные Критерий качества J [и] ния (в смысле минимума J[ц]) Оптимальное значение системы условия и* = v* (х, t) критерия качества н + + fee + Of ОС И | Н 7 о- се 1 Си X II 7 си 1 ОС 1 II /***<. + 03 ос н аз + ос II ■ОС ос * 3 аз + X + , X fee си С? НИ X о- н fee о, ■а 1 о S —j о X ТО Й I X Я CU О <D S СО О ТО Е CU л t=z ТО (U Ef н S Е Си * £ О 2 ч Я а о 44 ? SX 1= S О <0 W Ч Е л о н й,Чо си о Си Е я S 0 1 С? Е I «0 I V/ « Я 1 я X + W 'Ki oq II W . X Е _ч си g Й « „ м сD _ Л S Е Е Я (D Я « Си й> н Си 2 к s о *dou он ^ ос н •, °3 I fee + х се 'х X Н 3 н Н | O' + си fe; о’ О X О Е О Е О Е •-< о Е «=С О Я ТО -кл ТО X ХО fee то t=C то V/ ^ II ТО со 11 о М со со ч~> О 1 1 V/ 1 £ 1 о X о •*3 X X fe; 7 си «3 я в.-; - ° к х м и О) " - со /—N ш (1) , 3 1 Е , * £ 0Q о Я Е Е <и ч „ й) ' <D си я ■ 3 cq с-г 3 Си CD н а. в /—S w Е а, =г с + 2 Е Я О S си н 224
8 3398 225
* ч о <=£ о О- С н g* б о _, ч со 1 + X £ S X О f X £ S '—' ©2# + н Sc Е- ч, 7 •0 7 1 Q£ н 7 О, х—s .5" 03 с? II + 03 ос 0, н 03 0, н 03 S»:, ю 1 ' о о 1 Sc + v”'/ н 1 5S - « 3 1 1 ч, 2, Ч, н 03 7 ч ос 1 + 03 ос % X 'w' ОС 1 н 2н 0. X II /• V а, 03 Е- о. О II ✓—-. 2 II н о. II w 1 II -ча 5 £ £ 6 * * з 03 + 1 а> ^ + II •0, ч. •О о <и £ § « £ £ М о <и ч 2 W £ ^ Л Ч £ Э" £ 'doii I _ OU ojyf 1 ОС X н жа 7 о ьГ X О 0^ 7^ о X! X ►э* О Е- г~ •0* ч CSI х X + О н X + ■5 1з А £ + X—S * н о? аГ з 7Г + 3 Ж» С f S -КА - ' + Ъ СМ £ е» ✓—v 1 'х СХ1 O' =7 о к сЗ Он о S « oS Ж га « 3 к /-ч £ w <v а 03 К и з + * 2 о 0J CSJ X 5 и сГ"*4 gS X £ Он II • X Ч>» V/ О сз 1=Г «• S с~ II & X .—.go ж ж Ж Он сЗ О 1=с н « V '(-А со S г w сз a « О S5- V/ 1 X I о о 'КА 'к» -£* ж Ж I ж я о . и 5 с .S и _, Ж CQ ^ Ж ' 5 ч " ж а) ^ Ж fcf , Он (D н Он оз д S о 226
мального закона управления для неоднородной линейной си¬ стемы, в п. 8 — синтез оптимального закона управления при заданных граничных условиях на правом конце и квадратичном критерии более общего вида. Некоторые из приведенных в табл. 3.3 решений (пп. 1—4, 6, 7) являются частными случаями рассмотренной выше задачи. Пример 3. Синтез оптимального закона стабилизации крена ЛА с по¬ мощью автопилота. Изолированное движение крена ЛА описывается следующей системой линеаризованных дифференциальных уравнений dku>xi dt — 6цДш^1 -(- 618Д5э; ' d\-\ dt АоШ- (I) Здесь Ду, Aobi — угол крена и угловая скорость крена в возмущенном движе¬ нии, соответственно; Д6Э — угол отклонения элеронов относительно некоторого программного значения; ьа*=мх\Рхъ где /xi — момент инерции ЛА относительно связанной оси Oxt\ Mxi — аэро¬ динамический момент относительно оси Ох\, дМх1 дшХ1 \мх\= дМх1 дЬэ Предполагается, что О, Мх f^O и, следовательно, йц <( О, ^18>0, Пусть номинальный режим полета выбран так, что коэффициенты bu, b\S можно считать постоянными. Необходимо найти такой закон управления отклонениями элеронов (закон стабилизации крена) ДВЭ = Д5Э (Aw.vb aY)> который минимизирует критерий качества еэ J [А5э] = — j [qn\v?xl + у22Ду2 + ЛДЬ.2] dt. (II) О Здесь весовые коэффициенты уц, у22 — «цены» отклонений угловой скоро¬ сти крена и угла крена, соответственно, от невозмущенного движения на бес¬ конечном интервале 110, 00] времени стабилизации; 70 =0, р\— «цена» затрат «энергии» на стабилизацию. Предполагается, что уп, у22, р\ — некоторые поло¬ жительные константы. (В некоторых случаях в качестве их ориентировочных значений целесообразно выбрать следующие величины: Г 1 1 2 1 2 Г 1 1 L (Ac*>*i)max- . <722 — . (^7)max , . р\ — . (Д^э)тах - где (AcOxl) max, (Ay) max, (Дбэ) max — максимально допустимые значения ука¬ занных переменных на интервале стабилизации). Пусть на значения управляющей переменной Абэ не накладывается каких- либо ограничений. Воспользуемся для решения поставленной задачи данными, 8* 227
Д®г1 *п о- ‘Д“л‘ + *18 .Ат . .1 о Дт . 0 приведенными в табл. 3.3 (см. строку 3). Поскольку уравнения (I) в вектор¬ ной форме записываются в виде (I') то в обозначениях табл. 3. 3 . Г*11 0 1 „ Г*18 1 п ' Чи 0] р А= 1 n ’S=n > Q = п . Р = Pi- .10] Lo J Lo q22\ Теперь оптимальный закон стабилизации согласно табл. 3. 3 принимает вид 'Д“*1' ’Ut . = — (*18/"ll//’l) Д<"М — (.bl8ri2/Pl) Д7. (Ill) где матрица >и /42] г 12 Г22J — единственное положительно определенное решение квадратичного ма¬ тричного алгебраического уравнения Риккати: Д8Э = — P~iBrR0 ■ — [*18. 0] [ Pi L Г/-П /* 12* Д“*т L/-12 /"22. Дт . Ro = R0A + ArR0 + Q- R0BP-iBrR0 = 0 (IV) 6n 1 0 0 [>Ц n 2 1П2 /"22 J_rni Иг] Г*18 I r, m Г “и-L rd о 0 "1 0 *18 0 r 11 n 2 n 2 /"22 Г11 Г\2 /" J2 /"22. + f?U °1- LO q22 J _ [/"11*11 +/"12. 0 Lr 12*11 + /"22> 0 + + (V) Это матричное уравнение эквивалентно системе трех линейных алгебраических уравнений относительно гп, Г\2, г22: 2 (/-ц*11 + /* 12) + Я и — — b\&r\l =l°. ^ Р1 Г/"11*11 + /"12 /"12*11 + /"22 яп 0 1 *18rll *18 rHr12 [о 0 + .0 я22. pi _b\8r\\r 12 *18r12 /"12*11 + /"22— ь\ътг\2 = 0; [ Р\ 1 q22 — — *i8/*i2 — 0- |>1 Решениями системы (VI) являются: /•12= ± ]/Л/’19,22'*?8. (VI) /-11 = *llPl/*?8 ± ]/ (*11//1/*18)2 + 2»12/*18 + qnPllbjs> Г22 = (*?8/Pl) /* 11/* 12 — *Ц/"12 = — ± (p\^pi) j/"(*uPi/*f8)H *1р\Г 12,1*18 + 9llPl/*ia/-12- (VII) 228
Поскольку оптимальному решению соответствует лишь положительно определенная матрица Ro. то ее элементы должны удовлетворять критерию (шльвестра (см. разд. 3.4.4), т. е. П1>0, Г22 > 0, гпг22 — г\2 > 0. Так как 6ц<0, то ясно, что во втором уравнении (VII) перед корнем сле¬ дует выбрать знак «плюс». Кроме того, из третьего уравнения (VII) следует, что г 12>0. Таким образом, окончательно Г12 = V PiW.b 18 > Г\ 1 = bllPl/b 18 + j/~(buPllbls)2+2 (Pilots) YP\422]b\z + 9uPi'bis', Г22 = (bis/Pi) [(^ll^l/*is)2+2 VР1Яп'$я + + quPilbis]112 V piq^f>\ 18- (VIII) С учетом (VIII) закон оптимальной стабилизации принимает вид Д5э=— (bw'Pi) {ЬпР\1Ь\ъ + [(^nPi/^is) +2 (pi/bfg/) X X VPi422lb\& + ЧиР\1Ь\^12) Дш-*1 — (.bi&lpi) X XjV/T?22/6i8 =— {Ьп!Ь\Ъ + [(^ll/^is)2 +2 X X-Y 422/(PibizY1!^ pY2} Ac0j:1 — Уяю/Рг&Ч = =— kmAu>xl— k^-i, (IX) где *Ш={<ГМ4?+ [(Af“fVAl“f)2+2 1/ (/,#'?)Wi+ ,u/,ij1/2}. \ — К Q22lP\ — (X) передаточные числа (коэффициенты в цепи обратной связи) автопилота. Минимальное значение критерия качества (см. табл. 3.3) определяется выражением ' б1П2| pWi„' - Г* 12^*22 J L д7о . ■fm!n = V(A“«0> дТо)= ^"[Д“дп0. дТо] = [гцД(0®1 + 2Г 12Дш^1оДТО + С22Д1о] = (Jxi/mIi) [ЙсоД410+2*тДш^10Д^0+ + k^JxlIMh) (k0-Mu/fxl■ (XI) 3.6. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ОСОБОГО УПРАВЛЕНИЯ 3.6.1. Краткая формулировка задачи При решении задач механики полета встречаются случаи, когда управление и входит в дифференциальные уравнения математической модели объекта линейно 229
(3.59) dx dt -A(t, x, u),= y(x, *) + /?(x, t) u, где x=(jcr, x2,xn)\ u=(«!, «2, • • •, *v)T, Y = (Yi, Ya. • ■ •. Yn)T; R={rij{t, x)} jfll, 2,.m); ^G[G>, Gl> а критерий качества имеет вид /[u, t0, /ь x0, х1] = Ф(^0, /ъ х0> хх)+ %(*, X, и)Л=Ф(А>, Х0, xj (3.60) + J [Yo(x, 0 + uTr0(x, t)\dt, где г 0 = (г01, roa,.... r0m)T; т uTfo = 2 го;«/- i-i Функция Гамильтона Я для (3.59), (3.60) имеет вид н=±ь,/,=±.ш*, ^)+2g-x i — 0 i=0 1=0 т п т / п x2w=^,y,(x,^2 vx,. Г/У %'■ (3.61) j-l i = 0 j= 1 \i = 0 Если Um—m-мерный прямоугольник: Ят = {и = (и1( и2,..., ит)т ] ах < иг < 6Х, а2<и2<£г, • • м <ит<а/<Л' (/=1,2,..., ш) (й3-, bj могут зависеть от 1), то в силу принципа максимума (разд. 3.4.3) для минимизации /[и] оптимальное управление определя¬ ется из условия u = argmin//(^, х, u, X) (3.62) и еит ИЛИ j при 2 '-irii > 0; ll] = 1=0 bj при 2ХЯ;/<°- 1=0 (3.63) 230
При некоторых значениях х и К функции Н в (3.61) может "казаться независящей явно от какой-либо компоненты Uj на "грезке [ть тг], Тг—Ti>0. В этом случае выполняется соотноше¬ ние (см. также рис. 3.9) фл*., х, о*=2х*г,/(х* ^е0' (3-64) / = 0 1 I aJ 0 н* Ь ч I 1 <pj =0 Любое Uj е [cij, bj] пинипизи - рует Н, (и,■) в) ' Рис. 3.9. Поведение гамильтонианов Hi(Uj) =a+4>jUj и Нг(щ) =Ф3«з+ \и,\ +а в зависимости от Ф;-: а, б, г, д—строгий минимум (регулярное управление); в, е—нестрогий минимум (особое управление) которое формально совпадает с условием: дН duj — на отрезке [ть т2]. П *) = о мшил 1=0 (3. 65) Отрезок [ti, Т2], на котором имеет место соотношение (3.64), на¬ зывается участком особого управления для компоненты щ, 231
а оптимальное управление и,* (t) на таком участке (если оно существует) называется особым оптимальным управлением. Та¬ кое название объясняется тем, что поскольку гамильтониан Н от Uj не зависит, оптимальное управление не может быть найдено непосредственно с помощью принципа максимума. Более того, в случае выполнения условия (3.64) ни необходимые условия классического вариационного исчисления (см. разд. 3.9.2), ни необходимые условия динамического программирования (см. разд. 3. 5. 2) не могут служить для непосредственного вычисления компоненты щ*, хотя все эти условия формально и выполняются. Так, например, если гамильтониан Н от управления щ не за¬ висит, то Н достигает максимума при любом Uj. Условия (3.64) не могут установить различие между управ¬ лениями Uj, дающими минимум или максимум функционалу /[и]. На участке особого управления выполняется соотношение det{<Sy^° -/=2>-• ■» т)* на К. У (3-66) показывающее, что условие Гильберта невырожденности вариа¬ ционной задачи (см. разд. 3.9.4) нарушено. Задачи, для кото¬ рых имеет место условие (3.66), в классическом вариационном исчислении называются вырожденными. Если множество Um — замкнуто и ограничено, то в вырожденных задачах может на¬ блюдаться два режима оптимального управления: регулярный, когда и определяется из принципа максимума (как, например, (3. 63)), и особый, когда и не может быть найдено из принципа максимума [как, например, при выполнении (3.64)] и когда тре¬ буется особая процедура для его отыскания. 3.6. 2. Процедура нахождения особого управления Общая теория вырожденных вариационных задач пока раз¬ работана недостаточно. Наиболее полно исследован случай особого управления по одной компоненте Uj. В этом случае реше¬ ние можно получить следующим образом. Условие (3.65) показывает, что режим особого управления на участке [ti, тг] (участке особого управления) имеет место, если дН duj У] УЖ х) = 0. /So Последовательное дифференцирование этого соотношения по t приводит к соотношениям на [тъ т2] (А = 0, 1, 2,...). (3.67) dt* V ди11 232
Можно показать, что первое ненулевое значение величины jk д duj d", !дН dtk \ duj возможно лишь при четном k. Обозначим его k — &min — 2 р. Число р называется порядком вырожденности (сингулярности) вариационной задачи (оптимального управления). При k = 2р управление щ войдет в J явным обра- dt :юм. Теперь величину особого оптимального управления можно найти из условия d2p 1дН\ dt2p 1 duj ) (3.68) которое линейно по щ (в силу линейности по и системы (3. 59)). Уравнения сопряженной системы (см. разд. 3.4.4) в данном случае имеют вид Считая, что все остальные компоненты вектора и регулярны, т. е. определяются соотношениями типа (3.63), условие (3.68) можно записать в виде = X, t) + u,M2(x, X, 0 = 0, (3.70) dt2p \dujj откуда и может быть найдено особое управление для компо¬ нент up и Mi (х> М О ^ ’ М2(х, X, t) з. 6. 3. Необходимое условие оптимальности особого управления Для минимума критерия качества /[и] на особом управлении и, * в задаче (3.59) — (3.60) должно выполняться следующее необходимое условие (-1)р д ~ d2p duj dt2p l duj ) >0, р = 0, I, 2, (3.71) При максимизации критерия качества знак в неравенстве (3.71) следует заменить на обратный. Отметим, что при р = 0, т. е. для невырожденных задач, это условие переходит в условие d2H/dUj2^0 (при m— 1) и, таким 233
образом, (3.71) является аналогом условия Лежандра — Клебша (см. разд. 3.9.4) для особых (вырожденных) экстрема¬ лей (для одномерного управления щ). При р= 1 условие (3.71) имеет вид 3. 6. 4. Необходимые условия в точках сопряжения особого и регулярного управлений Результаты разд. 3.6.2 и 3.6.3 применимы, если значения оптимального особого управления являются внутренними точками множества Um на отрезке [ti Тг]. Необходимые условия для перехода с регулярного оптимального управления на особое оптимальное в случае, когда Um — яг-мерный прямоугольник ^Uj(t) a ti — момент времени начала перехода, определяются следующими неравенствами: (необходимое условие для возможности перехода регулярного управления с верхней границы Uj(t) =bj(t) на особое оптималь¬ ное управление) и (необходимое условие для возможности перехода регулярного управления с верхней границы Uj(t) =bj(t) на особое оптималь¬ ное управление). Требование совместного выполнения условий (3.72) и (3.73) может быть представлено в виде неравенства Это условие является необходимым для возможности пере¬ хода с обеих границ регулярного управления на особое. Необ¬ ходимое условие (3. 74) легче проверить, так как оно не связано с вычислением Mi(x, %, t). Однако следует иметь в виду, что оно является более слабым, чем условия (3.72) и (3.73), поскольку последние из него не вытекают. 3.7. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ТОЛЬКО ФАЗОВЫЕ КООРДИНАТЫ х В механике полета имеется ряд задач, когда при формирова¬ нии оптимальной траекторий необходимо учитывать ограничения на область допустимых значений фазовых координат. Например, при наборе самолетом высоты или при рассмотрении траекторий (3.71') [Мг(х, I, t)-{-bj(t)M2(x, К 0к<0 (3.72) [Мг{х, I, t)+aj(t)M2(x, 7, Ok > О (3.73) (3.74) 234
i-пуска часто выдвигается требование ограниченности скорост¬ ного напора q\ е(Л(0) г»2 (О т. е. q(AW, ®(0, 0 —<7зад<0- При движении Л А типичными также являются ограничения на допустимые значения высоты полета h и массы т ЛА: h(t) ^0; m(t) ^т. В общем случае ограничения указанного типа можно запи¬ сать в виде ф(У х)>0, (3.75) где Ф—4*2> • • •, 4Vi)T’ х—(^1, х2, ■ ■ ■, хп). 3. 7. 1 Краткая формулировка задачи Пусть эволюция рассматриваемой системы S описывается векторным дифференциальным уравнением -£- = *(*, X, и), (3.76) dt где f=(/i, f 2, • •., f пУ' х=(х1, х2,..., хп) , U (^j, м2,. . ., Чт) > и £Um. Um—некоторая замкнутая и ограниченная область в про¬ странстве Rm. Заданы: начальное значение х(*о)=х„, (3.77) интервал времени [t0, tx], критерий качества У[и] = Ф(У, x(/J)+|/0(У х, хх) dt. (3.78) to Необходимо найти такое кусочно-непрерывное управление u(t)£Um, которое переводит начальное условие (to, х0) в некото¬ рую конечную точку (У, х(/0), удовлетворяющую условиям q(*i, x(2f1))=0, q = (4i, q2, ...qty, (3.79) /<«+1 и минимизирует функционал /[и] на траекториях, удовлетворяю¬ щих условиям Ф(У х)>0, ф = (<!«!, <Ь2>. .., W1. (3.75') 235
Здесь значения функции % не зависят явно от управления и. Предполагается, что f, fo, а|> обладают непрерывными производ¬ ными до второго порядка. 3. 7. 2. Необходимые условия оптимальности В постановке разд. 3. 7.1 вся оптимальная траектория полета в общем случае может состоять из двух типов участков: участ¬ ков, целиком лежащих внутри допустимой области, и участков, лежащих на границе допустимой области (рис. 3.10). Количе¬ ство таких участков и их чередование зависит от конкретной задачи и граничных условий. На участках, целиком расположен¬ ных внутри допустимой области, условия (3.75) выполняются в виде строгих неравенств Ф(*. х)> 0. Для этих участков справедлив принцип максимума, сформу¬ лированный в разд. 3.4.3. На участках, лежащих на границе допустимой области, одно или несколько условий типа (3.75) выполняются в виде равенств. Эти участки называются граничными, для них принцип макси¬ мума разд. 3.4.3 уже не справедлив. Наличием этих участков данная задача и отличается от задач разд. 3.4.1. Известно несколько эквивалентных подходов к получению необходимых условий оптимальности для участков, расположен¬ ных на границе ф(^, х) =0. Будучи эквивалентными, эти подходы ведут к различным вычислительным процедурам получения решения. Рассмотрим случай одного скалярного ограничения вида х)>0. Первый тип необходимых условий оптимальности для граничных участков траектории Для простоты рассматривается случай, когда лишь одно из ограничений типа (3.75) выполняется в виде равенства (напри¬ мер, ограничение г|ц). Пусть это ограничение <К(^, х) = 0 (3.80) таково, что полная производная по времени din О, х) _ дИ . дф! ^ _ #i | /• Эф1 \ f. dt dt дх dt \ дх J , X, и) (3.81) содержит управление и явно. 236
Рис. 3. 10. Типы возможных оптимальных траекторий в зада¬ чах с ограничениями на фазовые координаты: а, б, в, г—случаи, когда допустимые траектории располагаются внутри некоторой области (не обязательно замкнутой); а—траектория, целиком лежащая внутри допустимой области; б—тра¬ ектория, имеющая с границей области одну общую точку (типа отра¬ жения от границы); в—траектория, целиком лежащая на границе; г—траектория, частично расположенная на границе; д, е, ж, з—случаи, когда допустимые траектории располагаются вне некоторой области; б—-случай двух траекторий, доставляющих относительный минимум в задаче о кратчайшем пути на плоскости; е—случай невыпуклой за¬ прещенной области; траектории с несколькими участками входа и схода; ж—1—2—траектория, не имеющая общих точек с границей; 1—3—траек¬ тория, имеющая одну общую точку (касание) с границей; з—случай негладкой границы допустимой области; 7—начальная точка траекто¬ рии; 2—конечная течка траектории, 1'—точка входа на границу, 2'— точка схода с границы
Необходимое и достаточное условие того, что (3. 80) имеет место на некотором ненулевом отрезке [t\, t2'], сводится к урав¬ нению _dij\ (t, х) dt dt ( i, дх f (t, x, u>=-0j(t, x, u) = 0. (3.82) Составляется гамильтониан Hx для граничных участков = Н + х, и), (3.83) где Н = kj , + Лч- i-1 Р = 0 н'а участках, где <Ьг ^>к0; Р ф 0 на участках, где ф1 = 0. Теперь необходимые условия для граничного участка совпа¬ дают с необходимыми условиями разд. 3. 8. 3 с заменой в усло¬ виях (3.98), (3.100), (3.104) функции % на ф]. Отличие этой задачи от задачи разд. 3.8.2 заключается в условиях, наклады¬ ваемых на переменные в точках выхода траектории на границу и схода с нее. В этих точках сопряженные переменные А,,(t) мо¬ гут претерпевать разрывы. Если имеется всего два участка, то сопряженные переменные непрерывны. При этом условие ipi (г", х)=0 может толковаться либо как связь, наложенная на начальные значения (t0, х0), либо как связь, наложенная на ко¬ нечные значения (t\, Xj), в зависимости от порядка следования участков с ф!>0 и гр1 = 0. При трех участках, если сначала идет граничный участок, затем участок с i|)i>0 и далее снова граничный участок, множи¬ тели тоже непрерывны вдоль всей траектории. При всех других порядках следования участков, если последних больше трех, сопряженные переменные имеют разрыв типа скачка. Этот ска¬ чок в значениях Xi(t) можно осуществить на любом конце гра¬ ничного участка, при этом на другом конце множители уже могут быть выбраны непрерывными (выбор конца, на котором происходит скачок, не имеет значения). Если этот конец выбран в момент времени t'2, то условия скачка имеют вид X+(t2) = X-(t2)-C d*fK; (3.84) OX H+(ta')=H-i(ta')+C дЬ{^) ; (3.85) ФГ &') = 0, (3.86) где С — произвольная постоянная; индексы « + » и «—» обозна¬ чают пределы справа и слева, соответственно. , 238
Если условия (3.84) подставить в (3.85), то коэффициент при С будет и, таким образом, условие (3. 85) не зависит от С, и содержит только значения После указанной подста¬ новки уравнение (3.85) может быть использовано в качестве эквивалентного необходимого условия. В данной задаче решение x(t), %(t) зависит от A,o, С как от параметров: X —х(^, С)‘, А = А (/, А;о, С). В каждой точке разрыва непрерывности сопряженных пере¬ менных должна добавляться новая константа С. Величина С не может быть определена заранее из необходимых условий и яв¬ ляется дополнительным параметром, определяющим точку схода. Поскольку число граничных участков заранее неизвестно, задача становится проблемой с переменным числом параметров, что существенно усложняет ее практическое решение даже с по¬ мощью ЦВМ. Пример 5. Пусть имеются три участка оптимальной траектории, следую¬ щие в таком порядке: .1 участок — траектория в открытой области, ipi>0; 2 участок — граничная траектория, opi=0; 3 участок—снова траектория в открытой области, tpi>0. Необходимые условия в конечной точке дают (ге+1) уравнение относи¬ тельно (п+2) неизвестных Aio, U, С. Условия (3.85), (3.86) и Р + 0) = 0 (3.87) определяют точку U и дают дополнительное уравнение относительно неизвест¬ ных Aio, U, С. Задача, таким образом, свелась к нахождению решения (п+2) уравнений с (л+2) неизвестными. Если участков больше, чем три, задача сводится к много¬ точечной краевой проблеме. Второй тип необходимых условий для оптимальности управления на граничных участках Пусть tBX— момент входа траектории на границу допустимой области, tcx — момент схода с этой границы. Еамильтониан Я2 для граничных участков может быть представлен в следующем виде: К/о + 2 ^"Ь Mi + Р2Ф1 = Н + Piti + Р2Ф1. /=1 где ?i=p2r=°, если Ф1>°; ЪфО, если Ф1 = 0, а ф) определяется правой частью соотношения (3.81). 239
На граничном участке (т. е. при tBX^.t^tcx) вдоль оптималь¬ ной траектории выполняются условия: дН2\ » X = дХ дн< (3. 88) дх 1»1=о. k=°- Оптимальное управление на граничном участке определяется из условия минимума Я по u£Uim(t, х), где U\m(t, х)—та часть значений и из области Um, которая удовлетворяет усло¬ вию 1))! (t, х, и) =0. Если минимум Я по и в области U\m{t, х) достигается в ее внутренней точке, то + х> и))=0, 1*1 (*, х)=0, <К(^, х, и)=0. Значения вектора К и гамильтониана Я2 непрерывны в точке входа на границу допустимой области: ь + 0) = Я, (*„ - 0); Я 2 (*„ + 0) = Я2 (*„ - 0). Остальные недостающие граничные условия могут быть найдены из общих условий трансверсальности разд. 3:4.3. В частности, из этих условий следует, что при t=tx ; L = <b[t1, х (/J); dL dti ■Я2(^) = 0 (если tx — не задано). Кроме того, к этим условиям надо добавить заданное гранич¬ ное условие (3.79): Я(*1, х(^)=0. 3.8. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ В ЗАДАЧАХ С ОЕРАНИЧЕНИЯМИ ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ОДНОВРЕМЕННО ФАЗОВЫЕ КООРДИНАТЫ х И УПРАВЛЕНИЕ и В механике полета часто встречаются задачи, в которых до¬ пустимые значения управляющих функций не должны превос¬ ходить пределов, зависящих от текущего состояния системы. Ограничения рассматриваемого типа можно записать в виде x(t, х, u)<0, . (3.89) 240
где и'явным образом зависит от состояния х и управления и. Принцип максимума, сформулированный в разд. 3.4.3, справед¬ лив лишь для неравенств типа *,(*, и)<0, (3.90) т. е. не содержащих фазовых координат х явно. Ниже приводится формулировка принципа максимума, при¬ годная для ограничений типа (3.89). 3.8.1. Краткая формулировка задачи Пусть эволюция системы 5 описывается векторным диффе¬ ренциальным уравнением -£-=!(*, х, и), (3.91) at где х= (х\, х2,..., хп)т — n-мерный вектор состояния; и= («1, «2, • • •, Um)т — m-мерный вектор управления. На значения управляющего вектора и наложены ограничения: И(*. X, и)>0, (3.92) где х— (xi, Х2, • ■ ■, х,, )т — vi-мерный вектор, причем число свя¬ зей, одновременно удовлетворяющихся в виде равенств, не пре¬ восходит т. Область Um допустимых значений и зависит от t, х: Ут = — Um(t, х) и задается уравнением (3.92). Предполагается, что вектор и явно входит в уравнение (3.92). В начальный момент времени t = t0 задано состояние системы х(^0) = х0. (3.93) Необходимо перевести систему S из состояния х0 в неко¬ торое конечное состояние, определяемое соотношениями Ч&, х(^)) = 0, (3.94) где q=(?i, Яи), /,<л+1. Требуется найти такой допустимый кусочно-непрерывный вектор u(t), удовлетворяющий (3.92), что функционал J [и] = Ф (tlt х(г‘1))+1/0(/, х, и)dt (3.95) to принимает минимальное значение на решениях системы (3.91). Примечание. Решения x(t) системы (3.91) предполагаются непрерыв¬ ными и обладающими, по крайней мере, абсолютно непрерывными производ¬ ными. Точки ta, где одна или более компонент вектора и терпят разрыв пер¬ вого рода, называются угловыми точками. Точки ts, в которых изменяется знак «>» на «=» (или наоборот) в одном или нескольких ограничениях (3.92), называются точками соединения. 241
3.8. 2. Типы граничных условий Задача, в которой Ф(4, х(4))=0, а граничные условия (3. 94) имеют вид (/=1, 2,..., /2<я), (3.96) или x,(ti)-^i = 0 (/=1, 2,..., /2-1<я), (3.97) ^1 4ад = 0, где Xii, 4ад — заданные числа, называется иногда простейшей. При /2 =/г условия (3.96) приводят к задаче с закрепленным правым кондом и свободным временем. При /2<п условия (3. 96) приводят к задаче с частично свободным правым концом и сво¬ бодным временем 4- Условия типа (3.97) относятся к задаче с закрепленным временем 4 = 4ад и частично свободным правым концом траектории. 3. 8. 3. Необходимые условия оптимальности Если u*(4€ Um(x, t) [Um определяется условиями (3.92)] является управлением, минимизирующим функционал /[и], то найдутся такие постоянные числа Яо=1, (х= (рь • • •, 1И2)Т> не все равные нулю, и такие одновременно не обращающиеся в нуль переменные векторы k(t) = (A,i(f),..., Яи(4)т (непрерывный на [4, 4]) и Р(4 = (М4> • • • > Pvi(4)T (непрерывный на [4, 4]всюду, за исключением, быть может, точек разрыва управления u(t), где, однако, у него существуют единственные право- и левосто¬ ронние пределы), что на [4, 4] имеют место соотношения dX [дну [dx\rR (дНгу. (3. 98) dt V дх ' X г 1 X г dx dt -(^Г- !дН \т-. 1 дХ ) (3.99) hxJ=о, (у=1, 2,..., vx), (3. 100) Р<о. (3. 101) Для всех фиксированных (t, х, А,) и и, удовлетворяющих (3.92), выполняется принцип максимума (см. разд. 3.4.3) H[t, х, I, и*)<Я(/, х, К, и), (3.102) т. е. min H[t, х, I, и) — х, к, и*), и еит где гамильтониан Н определяется, как и в разд. 3.4.2, выра¬ жением /7=л0/0 + *Л, (3. ЮЗ) 242
а /У1 = Я + |5тх. (3.104) Если минимум Н достигается во внутренней точке обла¬ сти Um, то дН 1 дН , / йи \т„ du <3и 1 i с5и / (3. 105) В угловых точках ta выполняются следующие условия: а) сопряженный вектор %(t) непрерывен, т. е. I (4+0)=Л (4-0); (3.106) б) функция Н непрерывна, т. е. /-/(4, х (4), Ц4), и* (4+0))=Я (4. х(4), 44), и* (4-0)) (3.107) (условие (3'. 102) соблюдается со знаком равенства); в) уравнения (3. 100) и (3. 105) сохраняются. Условия «а», «б», «в» являются аналогом условий Вейер- штрасса — Эрдмана (см. разд. 3.9.2)'. В конечной точке (4, Xi) для любых значений dt\, dx(t\) вы¬ полняются условия трансверсальности [/о + ^*+ i ит iSL dh Ti' dti dx(+ = 0; (3.108) V dx j t=t, q(4, x(4)) = 0. Из (3. 108) следует, что (+=[ (ЭФ \т ~дх + +L дх дц_ dt\ )Ч, (3. 109) (3. ПО) Для простейшей задачи условия (3.109) и (3.110) упро¬ щаются. Так, например, в случае (3.96) они имеют вид Я(4) = 0; | 4(4)=14 (г=Т, 2,..., /2); (3.111) 4(4)=о (/==4+1,..., П). ) 3. 8.4. Аналог необходимого условия Клебша Обозначим через х те компоненты вектора ограничений и, которые в каждой точке минимизирующей кривой х*(/)> u* (t) 243
удовлетворяются в виде равенств. Пусть |3 — соответствующий им вектор множителей. Тогда Я1=//+р*к (3.112) и для внутренних точек области Um на минимизирующем управ¬ лении и*(^) имеет место неравенство ,|,Jlr4>0 <3-П3) для всех г1 = (ill, Лг. •••. 11т)т9^0> удовлетворяющих условию Здесь дх du г| = 0. д^Н\ dvfi д^Н \ d*Hi да\ ’ ’ ди\дит d*Hi датдах ди2т (3.114) Условия (3.113) и (3.114) эквивалентны требованию поло¬ жительности корней s характеристического уравнения D(s)=det &чи_ dvfi дх ди i-S- о =о. (3. 115) Неравенство нулю определителя матрицы д*Нг 1 дх ' ди* 1 ди . дх О ди (3. 116) во всех точках u*(t) оптимальной траектории эквива¬ лентно условию Гильберта (см. разд. 3.9.4) и в данном случае означает непрерывность управления и*(£). Если указанный опре¬ делитель отличен от нуля в каждой точке экстремали, то задача называется невырожденной. Следствия. 1. Условия для открытого ядра области Um(t, х) (условия (3.98) — (3.102)) означают, что во всех точках траектории, в которых минимум Н по и, и £ Um(x, t) достигается при выполнении строгих неравенств *,(/, х, u)>0 (* = 1, 2,..., v) (3.117) 244
(г. е. в так называемом открытом ядре области Um(x, t)) спра¬ ведлив принцип максимума разд. 3.4.3, не учитывающий нали¬ чие связей (3.92). Здесь все |3г = 0 (г=1, 2,..., vj)' и дифферен- пцальные уравнения (3.98)—(3.99) при условии (3.102), даю¬ щем u=u((, х, X), имеют единственное решение: Х{ = Xi(t, t0, Х0, ^;о)> A; = /Vj(^, t0, X0, ^;o). В этом случае u = u{t, t0, x0, Xl0) (3.119) и решение задачи оптимизации погружено в (2п+1) парамет¬ рическое семейство решений, причем решение (3.118) зависит от параметров (t, to, xi0, Ко) по крайней мере непрерывно. Если же на траектории нет точек разрыва функции и(^), то решение по крайней мере дважды непрерывно дифференцируемо ПО (t, ta, Xio, Ко). 2. Если m(t, х, и) не зависят явно от х, то условия (3.98), (3.102) эквивалентны принципу максимума разд. 3.4.3, так как в этом случае Um (х, t) зависит лишь от t: Um—Um(t). 3. Условия для границы области Um(x, t) находятся следую¬ щим образом. Если при определении минимума Я по и часть компонент вектора х удовлетворяется в виде равенств, то недо¬ стающие множители могут быть найдены из условий (3. 105). Если минимум Я по и достигается во внутренней точке обла¬ сти Um, то управления щ и множители находятся из условий (3.105) и тех из (3.92), которые выполняются в виде равенств (3. 118) дН du щ1'р=0: x—(t, х, u)=0. (3. 120) Из (3.120) находятся и и р. При этом u = u(x, X), р = = р (х, X) непрерывны в точке соединения, если только в ней нет разрыва в функции и((). 3.9. ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ Задачи, в которых уравнения движения не приведены к форме Коши (т. е. не записаны в виде дифференциальных уравнений 1-го порядка, разрешенных относительно производных)*, а управляющие функции u(t) явно не введены (и по каким-либо причинам такое приведение невозможно или нежелательно), Отметим, что с точки зрения вычислений всегда желательно привести си¬ стему уравнений к форме Коши, так как именно для такой системы разрабо¬ таны эффективные алгоритмы численного интегрирования (см. гл. 4). 245
можно исследовать методами классического вариационного исчисления. 3. 9. 1. Задачи Больца, Майера, Лагранжа Задача Больца. Одна из наиболее общих формулировок для задач с однократными интегралами и дополнительными условиями заключается в следующем. Пусть класс траекторий определяется: 1) кривыми x(t) с координатами Xi(t) (i= 1, 2,..., я), 2) параметрами aj (/= 1, 2,..., г). Параметры ctj можно рассматривать как некоторые постоян¬ ные координаты кривой С : z(t) = (х(/), а)т в (я + г)-мерном про¬ странстве, z= (xi, Х2,..., хп, аи ..., аг)т. Пусть кривые (x(f), а) удовлетворяют уравнениям движения (или уравнениям связей, вообще говоря, неинтегрируемым) вида Fj = (t, х, х, а) = 0 (j — 11 2,..., т < п) (3.121) и условиям х(Л), <1, х(У,а)-bj/*(*. х, х, а)Л=0 (3. 122) где х (A=l, 2, 3,.. е), dx , • ~ dt ~' 15 " ' - ХпУ Необходимо найти кривую из указанного класса траекторий, которая минимизирует функционал j = ®{tо, Х0, хх, /15 а)-(- J / [t, X, х, а)Л. (3.123) to Задача Майера. Эта задача формально получается из .задачи Больца при /==0, fk=0 (k—l, 2,..., q). В этом случае краевые условия (3. 122) становятся общими граничными усло¬ виями, число которых должно быть q<2n+r+2. Если фиксиро¬ ван вектор параметров а, то число степеней свободы о системы дифференциальных уравнений (3.121), равное разности между числом зависимых переменных и числом независимых дифферен¬ циальных уравнений, для задачи Майера равно: о=п—т. Задача Лагранжа. Эта задача вытекает из задачи Больца при Ф = 0, fk==0, k=\, 2,..., q. 246
Виды связей и граничных условий. Связи вида t г (3.122) при Ф*=Ф*(а),т. е. при х, х, a)dt= — Ф*(а), t о где все или часть компонент вектора а фиксирована, называются изопериметрическими. Если fh=0, то связи типа (3. 122) задают подвижные граничные условия. Если связи типа (3. 122) имеют вид ®ki = Xkl{t0) — Xk1o=Q (£i=l, 2,..., га); — (^2=1: 2,..., и); ®2л + 1 = ^о' ^00 = ®> ®2л+2^^1" ^ю> где XftjO,..., tio — заданные числа, то граничные условия назы¬ ваются закрепленными. Если &i = l, 2,..., п; k2=\, 2,..., пх<п\ t0—^ю = 0; t\—/ю = 0, то п1 концов закреплено, а остальные условия называются сво¬ бодными граничными условиями. Если граничные условия 4>k{to, t\, хо, Xi) =0 (при fh = О, /г=1, 2,..., q) можно разбить на две группы ФЙ1(^о, х0)=0; Фь,(£ь xi) =0, k\ = \, 2,..., Qi, ^2 = Qi + 1, • • ■, Q, Qi<n и если Ф= E=q(tx, xi)—h(to, x0), то задача называется задачей с разделен¬ ными условиями для концов. Общие условия (3. 122) называются смешанными гранич¬ ными условиями. 3.9. 2. Первое необходимое условие экстремума функционала в задаче Больца Первое необходимое условие экстремума состоит из: — правила множителей Лагранжа; — уравнений Эйлера — Лагранжа; ■— условий Эрдмана — Вейерштрасса; — условий трансверсальности. Пусть минимизирующая кривая С : (х = х(/), а} допускает в любой точке слабые (малые как по x(t), так и по x(t)) вариа¬ ции бx(t) — x(t)—х(/), 6x(t) =x(t)—x(t) no любым совместимым со связями (3.121) направлениям в пространстве Хп, х£Хп и функции /, fh, Ф, Фй обладают непрерывными производными до третьего порядка. Тогда необходимые условия экстремума фор¬ мулируются следующим образом. Правило множителей Лагранжа: существуют функции цо, Ць, hj(t) и функции 0 тп F = 9о/ Н~ 2 V-kf kН~ ^ (^) ^j(t, х, х, а); (о. 124) Й=1 7=1 247
о L = \\®{ta, х(/0), tx, x&), а) + 2]|»*Ф*(<0. x(g, ilt x&), a) fc=i (3.125) такие, что множители (То^О, р*— постоянные и решение исход¬ ной задачи на условный экстремум лежит среди решений задачи на безусловный экстремум для вспомогательного функционала 7=L + j Fdt. to Примечание. Всегда можно считать р0 = 1, за исключением особых (анормальных) случаев. Уравнения Эйлера — Лагранжа. Между угловыми точками (см. (3. 129) минимизирующей кривой: С : {х = х((), а} выполняются уравнения Эйлера — Лагранжа: (3. 126) F, — Fi =0 dt xl (t—1, 2, n), (3. 127) где Fx, dF_. dxi ’ dF . dx ,• ’ Примечание. Уравнение (3. 126) является следствием остальных (при условии, что все Xi(t) обладают вторыми производными) и для функций F, не содержащих явно t, приводит к 'первому интегралу. Р — 2-М7- =С (3.128) 1-1 Х1 в силу (3. 130), (3. 131), непрерывному при переходе через угловую точку. Решения х(/) уравнения Эйлера — Лагранжа называются экстремалями независимо от того, являются ли они минимизи¬ рующими, максимизирующими или седловыми кривыми для функционала J со связями (3.121), (3.122). Условия Эрдмана — Вейерштрасса. Величины П Л — ^ xiFи Fi. (i= 1, 2,..., п) непрерывны вдоль кривой i=\ 1 С : {x=x(t), а}. В частности, если при t—t' кривая С имеет угло¬ вую точку, т. е. если хотя бы по одной компоненте Xi(t) имеет место разрыв (1-го рода) в производной: = xt, (3.129) t-t’+о dt t=t’—О Ф dx[ (Q dt то справедливы соотношения: F~ > дР д’х. дР -хТ dxi = /=’+ . r+ xl (/=1, 2,..., л); (3.130) 248
" ^ - 2Xi F*i= г - 2 *lF*l i-i V 1=1 (3.131) г-1 /-1 Здесь F~ = F (t, x, x, a) F + = F(t, x, x, a)|i_k+; x+=(xih, jcJ, ..Xn)T; х~=(хГ = -*Г, • • •, x7f. Условие трансверсальности. Концевые точки 0 и 1 кривой С: {х=х((), а} таковы, что равенство F-^XiFiAdt+^F.^ i-1 /«=“1 + г <, -f сЛ + 2 j Fa/iajdt=0 j = 1 <0 (3. 132) выполняется тождественно для d(o, <^ь dxi0 = dxi(t0), dxi{ = dXi (t\), dcLj (т. e. для всех произвольных и независимых значений указан¬ ных вариаций концов траекторий и вариаций параметров). Здесь db—полный дифференциал функции L(t0, t\, х((0,)> a, рь): П dL = ^-dt0 + X) ^dxl0+%-dt1 + dtQ ox п dt\ i*= 1 (ЗЛЗЗ) V^^o(a) 44 da) ;=i /=i I dto (a) Примечание. Если to = to (a), t\ = t\ (a), to dtQ = > , ———■ da 7=1 ЙЛ = ^Ma)_ ^ g силу независимости величин dtQ, dt\. dxio, dxu id а‘> условие (3. 132) эквивалентно 2л + 2 + г равенствам вида (f- S +£) ° h+ - \ г-i /г = <. О (3. 134) (г = 1, 2, .... л); 6L dt dto —0, , К ; + xl dxdt-to (г = 1.2 л); dXjQ — 0 (3. 135) 249
dl Г dF \ {^+\^dt)dai = 0 ('-=1’2 '>• (3'136) число которых достаточно для того, чтобы совместно с уравнениями (3. 121), (3.122), (3.127) определить недостающие значения р0, цл(й=1, 2,..., р). ij(t) (/=1, 2,..., т), xt(t) (1=1, 2,..., re), aj (j=l, 2,..., r). 3. 9. 3. Второе необходимое условие минимума функционала в задаче Больца (условие Вейерштрасса) для случая /=0, fft=О Для допустимой кривой С: (х=х(/), а}, реализующей мини¬ мум в задаче Больца, всегда существует такая система множи¬ телей цй (k = 0, 1,..., q) , Xj(t) (/= 1, 2,..., т), что для кривой С с этими множителями выполняется правило множителей (см. разд. 3.9.2), а для всякого элемента (/, х, х, ц, Я) (в том числе и в угловых точках) кривой С функция Вейерштрасса Е(/, х, х, Я, X): Е (t, х, х, Я, Х) = F (/, х, X, X) — П -F(t, х, х, Я,)-У (Aх, х, Я) (3.137) -Й25В Л i /=1 удовлетворяет неравенству е(( х, х, I, Х)>0, (3.138) Неравенство (3. 138) имеет место при всех возможных допу¬ стимых элементах (t, х, X, Я), не совпадающих с элементами (t, х, х, Я) кривой С, но удовлетворяющих условиям Fj(t, х, х, а) = 0 (у = 1, 2,..., т). Если минимизирующая кривая С:{х=х((), а} нормальна, то система множителей ро = 1, \ih, Xj(t) (/=1, 2,..., т, k = = 1,2,. .., q) —единственна и условие Вейерштрасса для этой системы выполняется. 3. 9.4. Третье необходимое условие минимума в задаче Больца (условие Лежандра—Клебша) для случая / = О, Д=О Если кривая С : (х(^), а} реализует минимум в задаче Больца, то всегда найдется такая система множителей ро, Цд (Дг = 1,2,... . . ., q), Xj(t) (j= 1, 2 т), что для этой кривой С удовлетво- ряется правило множителей, а для всякого ее элемента (t, х, х, ц, Я) выполняется неравенство Х’ *’ (3.139) /=1k=i 250
м|)п любых |г, • • •, ^n)¥=(0, О,..., О), удовлетворяющих V равнениям где х’ х)5/ = 0 U—1> 2,..-, т), (3.140) F: - dFJ ; С- • . ;*г Рх,- ’ •'Л dx-tdxk В рассматриваемой задаче важную роль играет матрица гF- ■ xFk F ■ п т-Ч F■ 1 X F ■ L 0.x k 0 0 (3. 141) (I, k=l, 2, п), F d(FuFt Fm). g _ Г д2Г (a, y= 1, 2,. .m), x d(*i, *2 •*«). ’ xx дхрхк ' Определитель этой матрицы называется определителем Гиль¬ берта. Вариационные задачи с отличным от нуля определителем Гильберта называются регулярными (невырожденными). 3. 9. 5. Четвертое необходимое условие в задаче Больца (условие Якоби—Майера—Кнезера) Условие Якоби — Майера — Кнезера носит нелокальный (интегральный) характер и характеризует экстремальность всей кривой в целом на основе рассмотрения поведения экстрема¬ лей, лежащих в малой окрестности от данной экстремали. Условие Якоби — Майера — Кнезера. Чтобы экс¬ тремаль: С : (х(*)} доставляла на отрезке [t0, С] минимум функ¬ ционалу в задаче Больца, необходимо, чтобы отрезок [t0, t\] не содержал точек, сопряженных с to- Сопряженная точка. Считается, что экстремаль С:{х(/)} имеет на интервале (/0, ^1) точку t, t0<t<ti, сопря¬ женную с t0, если существует последовательность экстремалей, выходящих из той же начальной точки (to, х(ф)) и бесконечно близких к данной экстремали x(t), такая, что каждая из этих экстремалей пересекает данную экстремаль х(1) и последова¬ тельность точек пересечения имеют точку t своим пределом. Со¬ пряженная точка (?, x(t)) является точкой касания экстремали х(/) с огибающей семейства экстремалей, в которое данная экстремаль x(t) включена (заметим, что огибающая может вы¬ рождаться в точку). Это показывает, что в сопряженной точке (t, x(t)) расстояние между данной экстремалью x(t) и произ¬ вольной близкой экстремалью х(^), выходящей из той лее на¬ чальной точки (t0, х(ф)), есть величина выше первого порядка малости по сравнению с указанным расстоянием вне сопряжен¬ ной точки (t, х(?)) (т. е. при t0^tt<t). 251
Методы определения сопряженных точек весьма трудоемки. В частности, они могут основываться на вычислении определи¬ телей Майера— Кнезера. Для задачи Майера (см. разд. 3.9. 1) с закрепленными кон¬ цами Fj{t, х, х)=0 (/=1, 2,..., т), t < tx, (3. 142) to, t\ — заданные числа, х(*о) — х0, х(tj) — — (м fti), • • •> хп~l(^l))> Л х0, Xi — заданные векторы, и с функционалом J = tv х0, хх) = л:л&) (3. 143) (3. 144) сопряженная точка t может быть вычислена как момент времени, в который обращается в нуль определитель Кнезера: д(хг, х2 *„-i) D(t, К)- <НОо> ^20>"ч ^п—по) dxx(t, Х0) дххЦ, Я0) ^ л-1,0 d*n-i (/, Х0) dxn-i(t, Xq) дХю ^л—1,0 t—t =0, где К (^10> ^20’ • • •> 1,о)т> (3. 145) (3.146) удовлетво- х(/, ?i0) = (xi(zl, Я-о),..., xn-i(t, ко)) —эстремаль, ряющая при к = ко заданным условиям (3. 143). Примечание. При применении численных методов решения краевой задачи иногда [например, в методе Ньютона (см. разд. 4.2)] одновременно с основной экстремалью x(t) вычисляется (п—1) дополнительных экстремалей хг,~!(0> лежащих в близкой окрестности к основной и выходящих из той же точки (начальной) (t0, х0) по линейно-независимым направлениям (соответст¬ вующим линейно-независимым начальным условиям для множителей Лагран¬ жа Х0). В этом случае можно утверждать, что точка t будет сопряженной с точкой t0 в сформулированной выше задаче, если в точке t определитель (о *я-1(0—*J£ii(0 А (О *о) = *1 (О —*1(1) (О. *2(0- *1 (О—*р (о. *2 (о—42) (О хл-1 (О—*<22, (о Х\ (0 — (О. *2(0 — Х^п~Х> (О *л-1 (0 — -Cl<0 t = t (3. 147) представляет бесконечно малую величину более высокого порядка, чем при 252
X К). НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В ЗАДАЧАХ С РАЗРЫВНЫМИ ФАЗОВЫМИ КООРДИНАТАМИ Для механики полета (особенно для ракетодинамики) важен ' Iучай, в котором допускаются конечные разрывы (разрывы 1-го рода) в фазовой траектории (например, мгновенный «сброс» массы после отделения ступени). При расчете ступенчатых ра- ыт полезны результаты следующей задачи с фиксированным 11ранее числом разрывов и варьируемой переменной величиной «скачка» в точке разрыва. Пусть q—1— число интервалов, внутри которых траектория непрерывна; tj (/=1, 2,..., q)—моменты времени, в которые наступают разрывы фазовых координат. Точки tj считаются и общем случае неизвестными. Индекс / указывает, что функции рассматриваются на /-ом отрезке времени 3.10.1. Краткая формулировка задачи i j : Д I tj-\-\. На каждом /-ом отрезке задана система связей FU){t, x(t), x{t)) = О, (3.148) где и краевые условия в точке разрыва функций Xi(t): g(t], X{tr), X (/,)) = о, (3.149) где g = (gi> ^2. •••> gpYi j= 1, 2, ..., q; r=j\ i</<•?—i; p<2{q-l)n-\-q. Требуется минимизировать функционал У = Ф(//, х(/г+), х(^г)). (3.150) Примечание. Здесь величины х (^ + ) суть правосторонние пределы в точке разрыва tj, a x(ta~) —левосторонние пределы. 253
3. 10. 2. Необходимые условия оптимальности Необходимые условия экстремума функционала (3. 150) со¬ стоят из: — правила множителей Лагранжа; — уравнений Эйлера — Лагранжа; — условий Эрдмана — Вейерштрасса; — условий трансверсальности. Для рассматриваемых разрывных задач эти условия имеют следующий вид. Правило множителей. Вводятся функции Лагранжа для разрывных задач: г-i FU) =У<}^}) (У=1, 2, <7-1) (3. 151) (3. 152) а затем отыскиваются функции Xi(t), %i(t), ц*, удовлетворяющие (3.148), (3.149) и доставляющие стационарное* значение вспо¬ могательному функционалу I: J = L + f Fdt==L + 9'2i Т FU)dt. (3.153) t, j= l tj В этом случае вариация б/ функционала J имеет следующее выражение: П +2 I +1] dL /дР(1) \ dxi(t i) V dxi Jtl dL /ад(1)\ \ dxt /гг dL /dP(2)\ дхг(г2+) \ дх,, )li г-1 dL dxdtq) \ dXi } dxt (/х) -\- dX{ (z?2 ) —|- dxt{tt)~|-.. .+ dXl{tq)-\- + dL dt\ г-i РД(1) V дх: X; dt-^Аг dl dt2 4- * Стационарной величиной называется такое значение /, вариация б/ ко¬ торой равна нулю: б/ = 0. 254
п I-1 dfW dxi dtz~\~ ■ ■ • + j^-УС №U--i\ <*, Zi\ d I dF^-V dt \ dxt dF(g-1) dxi bxt (t)dt. dtq + (3. 154) Уравнения Эйлера — Лагранжа. Из выражения (3. 154) вытекает, что если x(t) — кривая, доставляющая стацио¬ нарное значение функционалу / (т. е. 6/ = 0), то между точками разрывов удовлетворяются уравнения Эйлера — Лагранжа (см. разд. 3. 9. 2): d / dFu) \ \dpU) -0 dt 1 \ dxi / dxi (1=1, 2,.. ., IV, 7 = 1, 2,..., 1). (3. 155) Условия Эрдмана—Вейерштрасса и условия трансверсальности. В концевых точках tu tq и точках раз¬ рыва tj выполняются соотношения, обобщающие условия транс¬ версальности и условия Эрдмана — Вейерштрасса (см. разд. 3. 9. 2): 1) при t = t\ dl dti +S /-1 2) при t — tj (у = 2,3,q— 1) ' ^y(l) . - 0" dL . ■ -*7 - ' dx‘V i) = 0; (3. 156) t=t1 dL 1 — 0“ dL dfU) dxi{tj) “Г дХ; (t) t=tj dxi(tf) dx[(t) dL dtj г+ЖЧ-гЗ i—1 * —1 f-1 3) при t—tL dF(j-1) -x, dxi t~t, dL dta -s 1=1 dF^~1) ■ n« dL | ■ dp(.q-') ■ Xi _ dxt — u, *4 dXi(tq) 1 dX; (3. 157) = 0; (3.158) = 0. (3. 159) 255
Для задач с фиксированными (заданными) величинами раз¬ рывов (скачков) краевые условия типа (3. 149) включают соот¬ ношения вида gk = —*,■(#) —A,W)== О, (3. 160) где дР — постоянная (величина скачка x.-L в момент времени ij)> 1= 1> 2, ..., п, / = 2,3,..., q—1, k—1,2,..., р. Тогда при t=tj (/=2, 3,..., </—1) условия (3.157) и (3.158) имеют вид ^7+2j dFU) дх[ ■х, i-tf dF^-V dxi Xi dL dxi (tj) ' <э/г(Л" + + dFu~1} dxi dx i (3. 161) (3. 162)
Глава 4. ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ ЗАДАЧ МЕХАНИКИ ПОЛЕТА ОСНОВНЫЕ ОБОЗНАЧЕНИЯ Е—оценка локальной ошибки метода интегрирования. Н—функция Гамильтона. J— критерий качества. f (t, х)—вектор-функция скалярного аргумента t и векторного аргумента х (вектор-столбец). //О. х)— компонента вектор-функции f(t, х). t—независимая переменная (время). x(t)—вектор-функция скалярного аргумента t, вектор-столбец. xi (t) — компонента вектор-функции x(i). х— вектор-столбец. xi — компонента вектора х. || х |[ — норма вектора х. Индексы „0“ — величины, соответствующие начальному моменту времени t=t0. N, 1 — величины, соответствующие конечному моменту времени t=tN = T; t=t\. п—порядок системы дифференциальных уравнений, количество конеч¬ ных уравнений, размерность векторов х или f. г — номер шага интегрирования, номер итерации, номер интервала разбиения. р—порядок метода интегрирования, порядок сходимости метода. Символы firgmax Н (и) иеи arg min Н (и) иеу т — символ транспонирования вектора или матрицы. — значения вектора и, доставляющие максимум (минимум) функции Н (и) на множестве U. 6 — знак принадлежности элемента некоторому множеству. {•}А— — dt — символ дифференцирования по временному аргументу t. ^ — символ, означающий: „равно по определению”, О (гр) — символ бесконечно малой величины p-то порядка по отно¬ шению к £.• Пт О (sp)/sp = С ф 0, а 1 im О (zp)lzp~1=0. £ —> 0 £->-0 Заключительная стадия инженерного решения задач меха¬ ники полета состоит в получении и анализе численных результа¬ тов. Этот этап, как правило, невозможно осуществить без обра¬ щения к численным методам решения дифференциальных, 9 3398 257
алгебраических и трансцендентных уравнений, а также к числен ным методам оптимизации. В настоящее время с инженерной точки зрения задача счи¬ тается решенной только в том случае, если указан эффективный метод, позволяющий вычислить требуемое решение с достаточ¬ ной точностью за приемлемый отрезок времени с использова¬ нием ограниченного объема запоминаемых промежуточных результатов. При этом сами вычисления, как правило, прово¬ дятся с помощью достаточно мощной вычислительной техники. В этом состоит отличие современного этапа развития вычисли¬ тельной математики от предыдущего, когда из-за недостаточного технического оснащения вычислительного процесса основное предпочтение отдавалось вычислениям по явным (аналитиче¬ ским) формулам с широким привлечением вспомогательных таблиц. Аналитические методы не потеряли своего значения и в на¬ стоящий момент, однако область их применения несколько из¬ менилась. Основными техническими средствами при решении задач механики полета являются быстродействующие цифровые вычи¬ слительные машины с программным управлением (ЦВМ) и ана¬ логовые вычислительные машины (АВМ). Практикой применения АВМ и ЦВМ установлено, что про¬ стые задачи механики полета, связанные с исследованиями устойчивости движения, анализом систем стабилизации, управ¬ ления и т. д., целесообразно решать на аналоговых вычислитель¬ ных машинах, а исследование траекторий ЛА и их оптимизацию рационально проводить на цифровых вычислительных машинах. Совместное рассмотрение сложных траекторных задач и задач стабилизации и управления целесообразно проводить на ЦВМ либо на специальных комбинированных вычислительных устрой¬ ствах, состоящих из ЦВМ и АВМ и объединяющих их достоин¬ ства. Применение цифровых вычислительных машин для реше¬ ния сложных нелинейных задач механики полета получило в на¬ стоящее время наибольшее распространение. Поэтому в главе описаны численные методы, основанные главным образом на применении ЦВМ.' При выборе конкретного численного метода для данной за¬ дачи нужно принимать во внимание следующие факторы: 1. Требуемую точность конечного результата и устойчивость численного метода или алгоритма (т. е. влияние ошибки, допу¬ щенной на данном шаге, на ошибку окончательного результата). 2. Возможность и сложность получения оценки ошибки на каждом шаге вычислительного процесса, что позволяет при необ¬ ходимости автоматически изменять ход вычислительного про¬ цесса для достижения необходимой точности. 3. Общий объем вычислений, необходимых для получения окончательного результата с заданной точностью. Этот объем 258
miши-ит от сложности вычислений на одном шаге вычислитель- iium процесса и общего количества шагов, а последние, в свою м'к'редь, зависят от скорости сходимости алгоритма. 4. Сложность программирования метода на ЦВМ. Это в пер¬ ну ю очередь определяется сложностью алгоритма метода. 5. Характеристики конкретной ЦВМ (быстродействие, объем ипсративной памяти, способ представления чисел, размер раз¬ рядной сетки и т. д.), на которой предстоит решать задачу. Мри решении задач механики полета приходится иметь дело го следующими основными вычислительными задачами: — решение систем дифференциальных уравнений (задачи г начальными данными и краевые задачи); — решение систем алгебраических и трансцендентных урав¬ нений; — минимизация (максимизация) функций конечного числа переменных; — решение задач оптимизации траекторий и оптимального управления (задач минимизации или максимизации функцио¬ налов). 1 4.1. ЧИСЛЕННЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ ДВИЖЕНИЯ ЛА Уравнения движения ЛА — основной объект исследований в механике полета. Задачи исследования траекторий полета ЛА, определение его ориентации, исследование движения относительно центра масс, задача исследования системы автоматического управления поле¬ том, систем наведения и навигации и др. описываются системами дифференциальных уравнений. В перечисленных примерах уравнения движения образуют систему обыкновенных дифференциальных уравнений, каждое из которых первого или второго порядка и разрешено относи¬ тельно старшей производной: Xi = fi{t, -Ц, х,,..., хп) (/=1, 2,. .., п) (4.1) или Xi=-r^i[t, . .., хл, *Чз> • • •> -%п)> Ч -’ 2,..., /z). (4. 2) В этих уравнениях правые части ft и ср* являются функциями параметров движения ЛА (сил сопротивления,, тяги, веса, гео¬ метрических размеров ЛА и т. п.), задаваемых обычно в виде графиков, таблиц, реже в аналитической форме. Часто данные, представленные с помощью графиков и таблиц, аппроксими¬ руются какой-либо аналитической зависимостью. Задача интегрирования системы (4.1), (4.2) на заданном интервале изменения независимой переменной to^i^T стано¬ вится определенной, если заданы либо начальные, либо краевые условия. 9* 259
(4.3) Начальные условия для системы (4.1) имеют вид Xi(tv)=Xi0 (j=l, 2,.... п), где Xio — заданные величины. Начальные условия для системы (4. 2) имеют вид — (г=1, 2,. .п), J (4.4) где xi0, Xio — заданные величины. Задачи с краевыми условиями рассматриваются в разд. 4.2. Уравнения движения в форме (4.2) с начальными условиями (4.4) могут быть сведены к системе уравнений вида (4. 1) с на¬ чальными условиями (4.3) с помощью введения дополнительных зависимых переменных xn+i = xi (/= 1, 2,.. ., п). (4.5) В этих обозначениях система (4. 2) и начальные условия (4. 4) принимают вид xl = xn+ii 1 (4.2') Хп+1 = ъ(1> Х1> Х2, ■ ■ •. Х2пУ, 1 Xi{t0) = XlW 1 (4.4') xn¥i(t о)=-*и> (г=1, 2,..., я),J который совпадает с видом системы (4.1), но уже для 2п неиз¬ вестных Xi (/ =1,2,..., 2п). Получить решение уравнений (4. 1) в замкнутом виде можно лишь при определенных и иногда весьма существенных упро¬ щениях. В подавляющем большинстве случаев, когда такие упрощения по каким-либо причинам вводить нельзя, решение уравнений (4. 1) не может быть получено в виде явных выраже¬ ний через элементарные функции. Приближенные решения в виде степенных или тригонометрических рядов в задачах дина¬ мики атмосферного полета не получили большого распростране¬ ния в связи с трудностями аналитического представления аэро¬ динамических сил, моментов и тяговых характеристик двигателя (они обычно задаются графически и часто не являются непре¬ рывно дифференцируемыми функциями своих аргументов). Проблема численного интегрирования системы (4.1) с на¬ чальными условиями (4.3) на отрезке [t0, Г] _состоит в выборе такого разбиения t0, tu t2,:.., tr,..., tN отрезка [/0, T] на N участ¬ ков и построения такой таблицы значений переменных на кон¬ цах этих участков, что погрешность между точным решением Xi(tr) в момент tr и приближенным Xir удовлетворяет выбранным требованиям по точности интегрирования. 260
Разность Atr='tr+i—tr значений аргумента на концах элемен- I ирного участка интегрирования называется шагом интегрирова¬ ния. Если величина шага интегрирования остается неизменной ши всех участков, т. е. если A£,. = Arf=const при всех г, то гово¬ ря!', что интегрирование ведется с постоянным шагом; если М,ФАtj (r^j), то с переменным шагом. Здесь г — номер шага ни гегрирования. Погрешность процесса численного интегрирования объяс¬ няется следующими причинами: — приближенным характером методов интегрирования, по- ■ кольну в них отбрасывается часть членов в выражениях, аппрок- нмирующих точное решение; возникающая при. этом ошибка называется локальной ошибкой, ошибкой метода (погрешностью метода, ошибкой усечения); — приближенным результатом выполнения арифметических операций над числами с ограниченным количеством разря¬ дов. Эти операции всегда выполняются с округлением. Возникаю¬ щая при этом погрешность носит название ошибки округления. Ошибки округления в процессе решения могут усиливаться. Кроме того, следует помнить, что при использовании ЦВМ все элементарные функции вычисляются также приближенно с по¬ мощью стандартных подпрограмм; — распространением ошибок (неустойчивостью метода чис¬ ленного интегрирования), приводящим к накоплению и усилению ошибки метода и ошибки округления. В устойчивых вычисли¬ тельных методах небольшие погрешности быстро затухают, а в неустойчивых — растут неограниченно. Различные методы численного интегрирования обладают раз¬ личной величиной погрешности. Важной характеристикой при этом является погрешность метода интегрирования на одном шаге (локальная ошибка метода). Эта величина дает представ¬ ление об ошибке, возникающей лишь от приближенного харак¬ тера метода без учета ошибок округления, и может служить (совместно с оценкой сложности метода и объемом необходимой для его реализации запоминаемой информации) основанием для предварительного выбора метода. Точное выражение для по¬ грешности метода на одном шаге известно не для всех методов; часто неизвестны даже удобные выражения для оценок погреш¬ ности метода. Однако для всех методов известен порядок этой погрешности (называемый также порядком локальной ошибки метода) в зависимости от величины шага At. Если Xi(tr+1) — точное решение дифференциального уравне¬ ния, a xi:r-|_i — приближенное решение, вычисленное на одном шаге длиной At с помощью какого-либо метода численного интег¬ рирования при использовании точной информации о начальных условиях Xi(tr) и необходимых предыдущих значениях Xi(tr-1), 261
Xi(tr-2), ■ ■ ■, i— 1,..., n и если при этом для погрешности Xi(tr)—Xi>r имеет место соотношение xl(ir) — xlr = 0{b.tP+1), (4. (5) то число (р + 1) называется порядком погрешности метода па одном шаге (порядком локальной ошибки метода). Численное значение главного члена выражения 0(Д^+1), найденное каким-либо образом, называется оценкой локальной ошибки метода и обозначается Е. Тогда формула (4.6) приобре¬ тает вид x,(tr) — xlr^E. (4.6') Порядок погрешности метода на одном шаге тесно связан с понятием порядка метода интегрирования. Метод численного интегрирования называется методом р-то порядка, если используемая в методе формула для xr+J экви¬ валентна отрезку ряда Тейлора по степеням At до р-го порядка включительно. Таким образом, порядок метода на единицу меньше порядка локальной ошибки метода. В настоящей главе приведены численные методы интегриро¬ вания задачи с начальными данными (задачи Коши) для систем уравнения вида (4.1), (4.3) и указаны вычислительные схемы их реализации при помощи ЦВМ. Кроме того, в главе приведены специальные методы интегрирования системы (4.2), (4.4) без сведения ее к системе вида (4.2), (4.4). 4.1.1. Метод Адамса Метод Адамса принадлежит к конечно-разностным одното¬ чечным многошаговым методам численного интегрирования обыкновенных дифференциальных уравнений. В этих методах для вычисления значения xr+J в точке tr+1 необходимо вычислять значения правых частей f(£, х) только в одной точке; при этом используются ранее вычисленные значения х и f (t, х) на несколь¬ ких предыдущих шагах интегрирования. Исходные данные. Пусть дана система обыкновенных диффе¬ ренциальных уравнений первого порядка в нормальной форме Коши: — в скалярной форме dt хя) (/ = 1, 2,.. д); (4. 7) в векторной форме rfx dt = f(/, х), (4.7') 262
I Д(\ Х1 гЛ- х2 ; f= • • to 1 с • К 1 -/J Начальные условия при t=t0 - в скалярной форме xi{to) = Xi0 (/=1, 2, .... л); (4.8) - в векторной форме х(/0)=х0. (4.80 Требуется найти приближенное решение системы на отрезке [£о, Т]. Идея метода состоит в том, что значение искомой функ¬ ции xr+i в точке tr+i выражают через линейные комбинации функ¬ ций х,—з, х,—s-j-i,. .х,-—1, хг, хг в точках tr—s, tr—s+ь • • •> —ь Н (экстраполяционные формулы) или через линейные комбинации функций Xr_s+1, Xr-s+2, ■ ■ xr, Xr+1, Xr В Т0ЧКЗХ tr-s+1, U-s+2 U, tr+i (интерполяционные формулы). Оба типа формул являются следствием формулы Ньютона для интерполирования назад. Расчетные формулы. Приведенные ниже формулы за¬ писаны для одного скалярного уравнения системы (4.7). Для интегрирования всей системы (4.7) эти формулы следует рас¬ пространить на каждую компоненту. В практических расчетах применяются экстраполяционные формулы. Интерполяционные формулы находят применение лишь в сочетании с экстраполя¬ ционными формулами (см. разд. 4. 1.2). Экстраполяционная формула Адамса *, представленная че¬ рез разности Vpfr или ординаты fr,..., fr-s, имеет вид: • разностная формула хг+1=хг+М^ B.VVm (4.9) /7=0 — ординатная формула xr+1=xr-\- tf^aSpfr_p, (4.10) /7=0 где xr=x(tr); b.t=tr+1 — tr— шаг интегрирования; fr = f(tr, xr); V°/r=/r; * Эта формула иногда называется формулой Адамса—Башфорта. 263
V/r^=/r —/г-1 —левая разность 1-го порядка, SJpfr = = V(VP_1 fr) — левая разность /?-го порядка; 1 Х-±№+')--*+р+№ о Оур — коэффициенты, удовлетворяющие условию 2 а^=1 (Р = °> 2, .s). р—О Число p = s+l определяет порядок формулы (метода) Адамса. На практике чаще всего используются формулы поряд¬ ка рг£С 5. Значения коэффициентов и asp приведены в табл. 4.1 и 4. 2. Таблица 4.1 Значения коэффициентов для экстраполяционной разностной формулы Адамса (4.9) р 0 1 2 3 4 5 1 1/2 5/12 3/8 251/720 95/288 Таблица 4.2 Значения коэффициентов asp для экстраполяционной ординатной формулы Адамса (4.10) 0 1 2 3 4 5 aip 3/2 -1/2 — — — — «2/7 23/12 —16/12 5/12 — — — «Зр 55/24 —59/24 37/24 —9/24 — — а4д 1901/720 —2774/720 2616/720 —1274/720 251/720 — «5/7 4277/1440 —7923/1440 9982/1440 —7298/1440 2877/1440 —475/1440 264
Пример 1. Для s= 3 (четырехшаговый метод Адамса 4-го порядка) раз¬ ностная формула (4. 9) и ординатная формула (4. 10) имеют вид: хг+л = хг + м [fr + ~- yfr+ \2fr+ -у Д3/гj ; (4.9') JC,+1 = *, + A* (|| /г-Ц/^+у/г-2-у/г-з). (4.10') Интерполяционная формула Адамса*\ представленная через |)азности VPfr или ординаты fr...,fr+1_s имеет вид: — разностная формула xr+1^=xr + fp\/P/r+ii (4-11) Р =о — ординатная формула Xr+^Xr-^bt^alpfr+t-p, (4.12) р=о где 1 о а^ —коэффициенты, удовлетворяющие условию 2 а^=1- Р-О Некоторые значения коэффициентов §р и а^, наиболее часто употребляемых в расчетах, приведены в табл. 4. 3 и 4. 4. Для вычислений по формулам (4.11), (4.12) необходимо знать значение /г+ь которое является функцией хг+\. Таким обра¬ зом, соотношения (4.11), (4.12) являются по существу нелиней¬ ными уравнениями относительно неизвестной хг+\. Поэтому гово¬ рят, что интегрирование по формулам (4.11), (4.12) образует так называемую неявную вычислительную схему. Для решения уравнения (4. 12) в качестве начального приближения можно использовать значение xr+i, полученное по экстраполяционной формуле (по поводу совместного использования экстраполяцион¬ ной и интерполяционной формул — см. разд. 4. 1.2). Коэффициенты и [3^, $р и <Д0 связаны между собой соот¬ ношениями: Pp+fWi = Рд+гИ (4.13) ^=сСо. I *> Эта формула иногда называется формулой Адамса—Мултона. 265
Пример 2. Для s=3 (четырехшаговый метод Адамса 4-го порядка) раз¬ ностная формула (4.11) и ординатная формула (4.12) имеют вид: Хг+1 — хг ■м( fr+l — \ v/r+l V2/г+1 V3/ г+1 (4.11') ,9 19 , 5 1 Хг + 1 — ХгМ \ /л +1+ /г— /г—1+'„л /л— 2 24 24 24 24 (4.12') Вычислительная схема экстраполяционного метода. Для вычислений по экстраполяционным формулам Адамса необходимо определить предварительно начальные («разгонные») значения хг и fr (г—О, 1, 2, .. ., s). Эти значения обычно находятся другим приближенным способом, например методом Рунге—Кутта (см. разд. 4.1.3). При ручном счете вычисления целесообразно производить с помощью разностных формул (4.9). Таблица 4.3 Значения коэффициентов р* для интерполяционной разностной формулы Адамса (4.11) р 0 1 2 3 4 5 6 & 1 -1/2 —1/12 —1/24 —19/720 —3/160 —863/60480 Таблица 4.4 Значения коэффициентов а*р для интерполяционной ординатной формулы Адамса (4.12) Р 0 1 2 3 4 5 * а1д 1/2 1/2 — — — — * aip 5/12 8/12 —1/12 — — — * «3 р 9/24 19/24 —5/24 1/24 — — ■ * % 251/720 646/720 —264/720 106/720 —19/720 — * “5 Д 475/1440 1427/1440 —798/1440 482/1440 —173/1440 27/1440 266
При машинном интегрировании с помощью ЦВМ обычно И'пользуются ординатные формулы (4.10). Вычислительные схемы, основанные на использовании интер- in'опционных формул, — см. разд. 4. 1.2. Точность метода. Формулы (4.9) ~ (4. 12) позволяют ш,[числить приближенные значения хг+\ точного решения x(tr+\) системы (4.7). Погрешность этих формул на одном шаге интег¬ рирования (локальная ошибка метода) определяется остаточным членом Rs+i- Выражение остаточного члена: 1) для экстраполяционной формулы Адамса ^+1 = ^+1Д^+2-к(5+2) (S). tr-s < £ < A+il I (4. 14) 2) для интерполяционной формулы Адамса #*+1 = Й+1Д^+2-*(*+2)('П), (4.15) Оценка полной ошибки интегрирования методом Адамса (с постоянным шагом А/) на всем отрезке [t0, T = tN] дается формулой Ur — ■*(*,)!< О (1+|РД/|М)6- 1 — | рдц м +Чд+'Ш'+1) Уя,г (4.16) где эсг(г = 0, 1,2,. .., А^—1) —решение разностного уравнения xr+1 = xr-j-д/^ aspfr-p~h'°r Для экстраполяционного метода и р- о уравнения xr+1 = xr-\- ht ^ а*р/г-р+1-\~К Для интерполяционного метода; Р-0 faJ0 —для экстраполяционного метода, Wo—для интерполяционного метода; — оценка ошибки округления, 8 = max 6,; Г 8Г —максимальная ошибка округл гния на r-ом шаге; 0— максимальная ошибка начальных условий и разгонных точек; G, /И, М, К — постоянные, не зависящие от ДА Как видно из этой формулы, с уменьшением At ошибка сна¬ чала уменьшается за счет члена KAts+1 (уменьшение ошибки метода), а затем начинает возрастать за счет 6/At (накопление ошибок округления). Остаточный член оценивается следующими выражениями: 267
— для экстраполяционной формулы (4.10) I Rs+1 I Д^+21 Pi+i 11 fs+11 max» (4- ^ ^ I — для интерполяционной формулы (4. 12) |/?;+1|<^+2|Й+1||/^Мтах, (4.18) где |/s+1|max — оценка максимального значения частных произ¬ водных порядка s + 1. Интерполяционные формулы (4.11), (4.12) имеют меньшую ошибку, чем экстраполяционные формулы (4.9), (4.10), за счет величины коэффициентов |3^+i, которые меньше (З3+ь Замечание. Приведенные оценки точности предполагают, что решение x(z?) дифференциальных уравнений является (s + 2) раз непрерывно дифференцируемой функцией времени. Это накладывает определенные ограничения на дифференцируе¬ мость правых частей f (г?, х) дифференциальных уравнений (4.7), которые должны обладать непрерывными частными производ¬ ными по t и х вплоть до (s+1)-го порядка. В задачах механики полета правые части иногда не удовлетворяют этим условиям. В таких случаях для правильного использования метода необхо¬ димо в процессе счета при переходе через границы нарушения указанных свойств производить пересчет «разгонных» точек. При этом в качестве начальной точки берется та, которая лежит на границе нарушения гладкости (она может быть определена с по¬ мощью интерполяции по точкам, полученным на предыдущих шагах). Достоинства и недостатки метода 1. При s = 3 и одинаковом шаге интегрирования экстраполя¬ ционный метод Адамса обладает тем же порядком погрешности на одном шаге (порядком локальной ошибки метода), что и ме¬ тод Рунге—Кутта 4-го порядка (см. разд. 4. 1.3). 2. При s = 0 метод Адамса соответствует методу ломаных Эйлера (или методу Рунге—Кутта 1-го порядка, см. разд. 4. 1.3, табл. 4. 9). 3. Метод Адамса целесообразно применять при постоянном шаге интегрирования At. 4. Экстраполяционный метод Адамса р-го порядка требует для возможности начала вычислений обращения к специальной процедуре определения дополнительных начальных («разгон¬ ных») точек. Для их получения может быть использован метод Рунге—Кутта одинакового порядка. 5. На каждом шаге вычислений экстраполяционного метода Адамса правая часть f(/, х) системы дифференциальных уравне¬ ний вычисляется лишь один раз. 268
Пример 3. Численное интегрирование уравнений движения самолета эк- |Т|)|П0Ляционным методом Адамса. 1Формулировка задачи. Определить изменение параметров движения п. р.чтукового самолета-истребителя при полете в вертикальной плоскости I постоянной поперечной перегрузкой % = const. Исходные данные. 1. G (/) = G0= 15 500 кГ — сила тяжести (вес) Самолета. 'A S = 50,0 м2 — площадь крыла. 3. «ц(/)=%о=1,8 — поперечная перегрузка. I. Аэродинамические характеристики самолета, заданные соотношениями, | нраведливыми в диапазоне высот 11 km^/IisS/25 км и чисел Маха Сх = сх0+ Вяй®а2; = 0,95 рад"1; с* =3,10—0,56 М рад—1; У _ 0,0034М + 0,0055 Сх0~ М —0,61 М -v/a; а = 295,07 м/сек—скорость звука. 5. Сила тяги, заданная соотношениями, справедливыми в диапазоне и и сот 11 кжггС/г<25 км и чисел Маха 0,9<М<3,2: Р = Рп (М) В (*) ей ЯИ(М) = 10650 [0,60+0,55(М — 1,45)] кГ = = 104 441 [0,60 + 0,55 (М — 1,45)] я; Qu = 3,7204-10-2 кГ-сек2/м4 = 3,6485-10—1 н.СекЩм4; Q (Л)—значение плотности воздуха на высоте h, соответствующее таблице стандартной атмосферы СА-64, ГОСТ 4401—64. Требуется найти: изменения скорости полета v (t), угла наклона траекто¬ рии 0(^) и высоты полета h(t) на отрезке 0^^40 сек. •Допущения. 1, Самолет рассматривается как точка постоянной массы (G = G0=const), движущаяся в однородном гравитационном поле Земли в вер¬ тикальной плоскости (g=go=9,80665 м/сек2, ус = 0, фс=0, [3 = 0). 2. Кривизной и вращением Земли можно пренебречь. 3. Угол атаки мал (sin а «а, cos а яг 1). Уравнения движения. В соответствии со сделанными допущениями дви¬ жение центра масс самолета в ЛА-центрической прямоугольной вертикально- скоростной системе координат OxcycZc при полете в вертикальной плоскости описывается следующими дифференциальными уравнениями, приведенными к нормальной форме: v=-pr [Р — Q (М, h, а) —G0 sin 0]; °0 0 = — (Яг/о— cos 9); ^ h = v sin 0, где Q(M, h, а) = cxqS — сила сопротивления; q«2 — скоростной напор (в кГ/м2, если q измерено в кГ-сек^/мЬ и в н/м2, если р— в н-сек2/м4); <А)Я//о а — — угол атаки в рад. Р + с yqS Начальные условия. При ^=0, v0 = 500 м/сек, h0 = 12 000 м, 0о=8°.
Численное решение. Численное интегрирование системы уравнений (I) с заданными начальными условиями было проведено на ЦВМ типа БЭСМ при постоянном шаге интегрирования по экстраполяционной формуле Адамса (4. 10), которая применялась к каждому уравнению системы (I). Для приве¬ дения системы (I) к виду (4. 1) можно ввести следующие обозначения: Xi = v, Х2 = в, x3 = h, fi(Xi, *2, х3) = ~- [Р — Q(M, h, а) — G0 sin 8], Go go /2 Оь x2)= — (пуо cos 0), (II) V /3 Ob x2) = v sin 0. Результаты интегрирования системы уравнений движения самолета (I) по экстраполяционной формуле Адамса (с шагом Д^=1 сек) сведены в табл. 4.5 (результаты даны с сохранением 8 значащих цифр, выданных ЦВМ). Таблица 4.5 Результаты интегрирования уравнений движения по экстраполяционной формуле Адамса на ЦВМ БЭСМ с шагом Д£=1 сек Параметры движения t, сек v, м'сек 0° h, м Примечания 0 500,00000 8,0000000 12000,000 1. Начальные („разгон- 4 500,38731 11,659288 12341,576 ные“) точки получены стандартным методом 5 499,95167 12,583011 12446,601 Рунге—Кутта 4-го поряд- 10 494,22870 17,291847 13086,942 ка с шагом Д^=1 сек 20 462,17631 27,539044 14903,576 40 266,87068 59,563744 19792,786 2. Численные резуль¬ таты выдавались на пе¬ чать через интервал вре¬ мени А/печати—1 сек 4. 1. 2. Методы прогноза и коррекции Методы прогноза и коррекции принадлежат к одноточечным многошаговым методам численного интегрирования обыкновен¬ ных дифференциальных уравнений. В этих методах при вычисле¬ нии значений хг+1 необходимо вычислять значения правых частей f(^, х) только в одной точке, при этом используются ранее вы¬ численные значения х и f(/, х) на нескольких предыдущих ша¬ гах интегрирования. Исходные данные. Пусть дана система обыкновенных дифференциальных уравнений 1-го порядка, разрешенных отно¬ сительной производной: 270
в скалярной форме ~r = fi(t, хг, Xj,..хп) (f=l, 2, 3,. .«); (4.19) dt в векторной форме х), (4. 19') dt где "Л X = х2 ; ft -Хп- с ] Начальные условия при t=U: — в скалярной форме */(*„)=■*/<> (/=1, 2,..., л); (4.20) — в векторной форме х(*0) = х0. (4.20') Необходимо найти приближенное решение системы на отрезке [/о, Т\. Идея метода состоит в том, что по формулам прогноза (формулам экстраполяции) вычисляется значение х"+хв точке t=tr+1. Это значение затем уточняется по формулам коррекции (формулам интерполяции). Для увеличения точности решения часто используются специальные модифицирующие формулы, которые не требуют новых вычислений правых частей уравнений, а основываются на использовании результатов предыдущих ша¬ гов. Формулы коррекции метода могут быть использованы мно¬ гократно, т. е. в итерационном процессе*. Расчетные формулы. Приведенные ниже формулы записаны для одного (скалярного) уравнения системы (4.19). Для интегрирования всей системы (4. 19) эти формулы следует применить к каждой компоненте вектора х. Методы прогноза и коррекции, использующие различные экстраполяционные и ин¬ терполяционные формулы и формулы, исправляющие (модифи¬ цирующие) предсказанные значения, приведены в табл. 4. 6. Вычислительная схема. Для использования методов интегрирования, основанных на прогнозе и коррекции, необхо¬ димо предварительно определить дополнительные начальные (разгонные) значения хг и fr (r=0, 1, 2,..., s). * На практике, как правило, формулы коррекции применяются 1—2 раза.
Таблица 4-6 Расчетные формулы методов прогноза и коррекции (с модификатором и без него) для интегрирования обыкновенных дифференциальных уравнений 1-го порядка 272
273 или назначенное заранее
Метод Формулы прогноза и коррекции Окончательные формулы локальной ошибки О 05 СП 4*4 ° + * V <М 1 «К СП ч + Оч К •«. 7 * V. 1 V 1 1 V. Р. О ьс »- СП 'w' 00 I 05 <3 СЧ 1 СП ■Ф | со + + р< + СО 1 Н 1 V. ч II ]!__ ° + С V. К 'к + к. + о + S кГ < г-< | СО + ■ О н 03 а а Эти значения обычно на ходятся с помощью одноша говых многоточечных мето¬ дов типа Рунге—Кутта (см. разд. 4.1.3). Точность вычис¬ ления разгонных точек долж¬ на быть не ниже точности по¬ следующих точек. Методы прогноза и коррекции целе¬ сообразно использовать с применением ЦВМ. Форму¬ лы методов прогноза и кор¬ рекции могут применяться как с использованием моди¬ фицирующих формул, так и без них. При ручном счете обычно используются формулы мето¬ дов низкого порядка (напри¬ мер, усовершенствованный метод Эйлера с вычислением разгонных точек методом Рунге—Кутта 2-го порядка). Точность метода. Оценки локальных ошибок различных методов интегри¬ рования прогноза и коррек¬ ции, а также порядки этих ошибок представлены в табл. 4. 6 и 4. 7, соответственно. Замечание. Порядок локальной ошибки метода прогноза и коррекции и ее оценка справедливы, если правые части f(^, х) диффе¬ ренциальных уравнений об¬ ладают достаточно большим числом непрерывных част¬ ных производных по t и х |(не ниже порядка метода). 3 задачах механики полета правые части дифференци¬ альных уравнений часто не обладают достаточной глад¬ костью. В этих случаях сле¬ дует в процессе счета опре¬ делять (желательно доста¬ точно точно) точки наруше- 274
Mini гладкости, например, путем интерполирования, и начиная с иий точки, как из начальной, производить расчет заново (т. е. учать новые «разгонные» точки и т. д.). Выбор шага интегрирования. За меру оценки пра- MII и,пости выбранного шага интегрирования обычно принимается локальная ошибка, приведенная в табл. 4.7. Если полученная Таблица 4.7 Локальная ошибка методов прогноза и коррекции Метод Формула оценки локальной ошибки метода Порядок локальной ошибки метода Адамса—Баш- форта—Мултона Е— 0 (Д15) Хемминга Q р — /'гкор __ уПр ^ 121 vг+' г+1> 0 (ДД5) Милна р -L ( у«ор _ пр \ 29 'Xr+1 хг+1' 0 (Д*5) Эйлера, усовер¬ шенствованный Р — (уЛР _ VK°P \ п — 5 V Г + 1 Аг+1) 0 (Д/3) текущая ошибка Е не удовлетворительна (т. е. Е>г, где е — за¬ данная точность интегрирования на шаге), то шаг интегрирова¬ ния обычно уменьшают вдвое. Если Е< —, то шаг интегрирова¬ ния может быть увеличен в два раза. При изменении шага требуется снова вычислить «разгонные» точки. Перевычисления разгонных точек можно избежать, если хранить в памяти ЦВМ вдвое больше точек хг, чем требуется в методе (для увеличения шага вдвое), и использовать формулы интерполяции (для умень¬ шения шага). Значения х для промежуточных точек (при уменьшении шага вдвое) целесообразно вычислять с помощью следующих интер¬ поляционных формул 4-го порядка: х 1 — ■\АЪхг-\-72хг_-1-\-1—2 —(— Г- 2~ “Ъ ЛЦ' 9/r-f- 36fr—i -j- 3/r—2)]; (4 21) xr_ з_ = -^- [1\хг-\-72хг^1-\-АЪхг^ — — ДЦ 3/f + 36/r_x — 9/r_2)]. 275
Формулы (4.21) не используют всей накопленной информн 1 ции. Для большей точности интерполяцию можно проводить im следующим формулам: xr_L~ 255 135л:г—)— 40лг_2-(-xr_3-j- + Д/(-15/г + 90Л_1 + 15/г._2)1; (4>22) xr_A~ 2gg [12xr-J- 135jcr——|— 108лгг—2-|—л:г —g —j— + Д/(-3/г-54/г_1 + 27Л_2)]. ) Замечания. 1. При получении разгонных точек одним из вариантов метода Рунге—Кутта рационально выбрать среди них такой, который требовал бы наименьших затрат памяти ЦВМ и в котором вычисления проводились бы по циклической схеме. Этим требованиям хорошо удовлетворяет метод Рунге—Кутта— Гилла (см. разд. 4. 1.3). 2. Получение разгонных точек целесообразно организовать так, чтобы при этом мог быть произведен выбор величины на¬ чального шага интегрирования, если он заранее не известен. Та¬ кой выбор шага может быть сделан на основе двойного просчета с шагами At и At)2 для определения значения х в точке t0+At. Если \\хи~х м ||<в 2 2 ixAt —решение в точке t0 + At при интегрировании с шагом At: х А(~ решение в точке t0+At при интегрировании с шагом At)2; 2~ At — пробный начальный шаг; е — заданная точность счета; || ... || —- норма вектора), то считается, что шаг At приемлем для заданной точности е и в качестве начального шага целесооб¬ разно (с некоторым запасом) выбрать величину At0=At)4. 3. В процессе интегрирования методами прогноза и коррекции в тех случаях, когда вычисление по интерполяционным форму¬ лам ведется в итерационном режиме, целесообразно производить оценку точности по признаку (4.23) где Xr+i — решение в точке tr+ ь полученное по интерполяцион¬ ной формуле (корректору); —решение в той же точке, по¬ лученное по экстраполяционной формуле (формуле прогноза). Если условие (4.23) выполняется, то считается, что шаг вы¬ бран удовлетворительно. Если (4. 23) не выполнено, то шаг сле¬ дует изменить. Процедура изменения шага может быть следую¬ щей: 276
Ltr-i, если I Xr+i — х/+i 1 < e или если одновременно выполняются условия ЦлЭД —jcftiK*!*; если I ^Cr+i — хГ+г || > *ie. 2д/г_1, если трижды последовательно выполняется условие || хкг+\ — xur+\I < х2е. 11дссь е — заданная точность интегрирования на одном шаге; ■ | ОТ'1)2 — результат повторного вычисления по интерполяцион- I in hi формуле; хь хг— параметры, обусловленные остаточным I -I ншом формулы интегрирования. (В случае применения метода I \ i.iMca—Башфорта—Мултона 4-го порядка xi = 270/19; хг=1/32; 1ЛЯ метода Хемминга 4-го порядка xi = 121/9; хг=1/32; для мето- ia Милна 4-го порядка xi = 29, хг=1/32). Особенности применения методов прогноза и коррекции при использовании ЦВМ. Методы, опи- гаиные в табл. 4.6, входят в библиотеки стандартных подпро- I грамм некоторых ЦВМ. При практическом использовании рассматриваемых методов || следует иметь в виду следующее. 1. Методы численного интегрирования с прогнозом и коррек¬ цией, как правило, требуют меньшего числа обращений к счету правых частей уравнений, чем многоточечные методы Рунге— Кугга (см. разд. 4. 1.3) одинакового с ними порядка. Так, в ме¬ тоде Рунге—Кутта 4-го порядка необходимо четырехкратное вы¬ числение f(/, х) на каждом шаге, а в методе Адамса—Башфор- га—Мултона-—лишь двукратное. 2. Методы прогноза и коррекции требуют несколько большего объема памяти ЦВМ для запоминания результатов предыдущих шагов, чем методы Рунге—Кутта одинакового с ними порядка. 3. Для методов прогноза и коррекции в процессе счета легко устанавливается необходимость изменения шага интегрирова¬ ния. Эта процедура основывается на простых явных формулах оценки локальной ошибки метода. Для фактического изменения шага интегрирования необходимо, однако, заново производить вычисление разгонных точек или применять специальные интер¬ поляционные формулы и увеличивать объем запоминаемой информации о результатах предыдущих шагов, что увеличивает размер и сложность программы. 4. Применение процедур автоматического изменения шага, как правило, существенно уменьшает машинное время решения задачи по сравнению с интегрированием при постоянном шаге (при одинаковой заданной точности интегрирования). I 1 1 А/ 2 277
5. Иногда формулы коррекции употребляются многократно, образуя итерационный процесс определения хкг°+\ ■ К такому использованию метода следует относиться с известной осторож¬ ностью, так как такой процесс при больших At не всегда схо¬ дится или сходится лишь после большого числа итераций, что ведет к большим затратам машинного времени. При отсутствии сходимости после 2-уЗ итераций целесообразно уменьшать шаг или использовать модифицирующие формулы. 6. Использование модифицирующих формул не требует новых вычислений правых частей и позволяет увеличить точность решения. 7. При нарушении в некоторых точках t=f непрерывности правых частей дифференциальных уравнений или их непрерыв¬ ной дифференцируемости до соответствующего порядка (напри¬ мер, в методе Адамса—Башфорта—Мултона — до (s-fl)-ro порядка) для сохранения порядка метода необходимо начинать вычисления заново, беря в качестве начальной точки точку нару¬ шения свойств непрерывности и дифференцируемости правых частей. Эту точку, как правило, можно получить с помощью со¬ ответствующих формул интерполяции. Пример 4. Численное интегрирование уравнений движения самолета методом прогноза и коррекции. Для иллюстрации применения методов прог¬ ноза и коррекции приводятся результаты численного решения задачи, описан¬ ной в разд. 4. 1. 1. (Пример 3.) Интегрирование системы уравнений движения самолета производилось на ЦВМ БЭСМ методом Адамса—Башфорта— Мултона при постоянном шаге интегрирования Д^=1,0 сек. Результаты рас¬ чета сведены в табл. 4. 8, где они даны с сохранением 8 значащих цифр. Таблица 4.8 Результаты интегрирования уравнений движения самолета методом Адамса—Башфорта—Мултона на ЦВМ БЭСМ с шагом М—\ сек Параметры движения t, сек V, м!,сек е° h, м Примечание 0 500,00000 8,0000000 12000,000 Начальные („разгон- 4 500,38736 11,659106 12341,557 ные“) точки получены стандартным методом 5 499,95186 12,582643 12446,558 Рунге—Кутта 4-го поряд- . ю 494,23103 17,290515 13086,739 ка с шагом Л4~1 сек 20 462,19181 27,535343 14902,857 40 266,95998 59,550212 19790,925 - 4. 1.3. Методы Рунге—Кутта Методы Рунге—Кутта принадлежат к многоточечным одно¬ шаговым методам численного интегрирования систем обыкновен¬ ных дифференциальных уравнений. В многоточечных одношаго¬ 278
вых методах для получения приближенного значения решения xr+i в точке tr+\ производится вычисление правой части f (t, х) системы дифференциальных уравнений в нескольких вспомога¬ тельных точках аргументов t их. При этом для определения указанных вспомогательных точек используется лишь значение хг, вычисленное в одной предыдущей точке tr. Основное преиму¬ щество одношаговых методов заключается в том, что поскольку для построения приближенного значения решения в новой точке tr+1 необходима информация о решении лишь в одной предыду¬ щей точке, в этих методах для начала процесса интегрирования нет надобности в специальных процедурах получения решения в нескольких предыдущих начальных точках. Таким образом, для применения одношаговых методов достаточно задания на¬ чальных условий в одной точке. Вместе с тем формулы Рунге—Кутта (наиболее важные среди общих одношаговых методов) имеют тот недостаток, что правая часть уравнений вычисляется на одном шаге многократно. Это может приводить к большим затратам времени в тех случаях, когда правые части описываются сложными выражениями. Исходные данные. Пусть даны системы обыкновенных дифференциальных уравнений 1-го или 2-го порядков, разрешен¬ ные относительно старшей производной: ■— в скалярной форме dxi dt d2xi dt2 -в векторной форме -.flit, xlt х2,..., хп); (4. 24) хп, хи х2,..., хп) (1= 1, 2,. . ., /г); (4. 25) х); dt (4. 24') d2x ,, ■. — =ф(/, X, X), dt2 (4. 25') где "■*1 ГЛ1 ?1 II Л II ?2 -*П- “в . L_ Начальные условия при t—t0: — в скалярной форме для уравнений (4.24) ■*/(* о)==х,0; (4.26) 279
для уравнений (4.25) (4. 27) — в векторной форме для уравнения (4.24'); x(g = x0) (4. 26') для уравнения (4. 25/) х(2“о) = х0, х(*0, х0)=х0. (4. 27') Требуется найти приближенное решение систем на от¬ резке |Yo, Т]. Идея методов Рунге—Кутта состоит в том, что при¬ ближенное значение решения дифференциального уравнения 1-го порядка (4.24') в точке tr+i ищется в виде b.tr=tr+1 — tr — шаг интегрирования. Коэффициенты у\р\ а\р), в формулах (4.28), (4. 29) выбираются так, чтобы несколько первых членов разложения в ряд Тэйлора по степеням Atr правой части формулы (4. 28) совпадало с таким же числом членов разложения точного реше¬ ния x(tr+Atr) по степеням Дtr. Метод Рунге — Кутта называется методом порядка р, если указанные разложения совпадают вплоть до членов, содержа¬ щих Лtpr . Поскольку полученные таким образом соотношения для определения коэффициентов у\р\ а(р\ §\р) при каждом фикси¬ рованном порядке р допускают, как правило, неединственное ре¬ шение, это обстоятельство обусловливает большое разнообразие формул Рунге-—Кутта одного и того же порядка. Как видно из структуры формул (4.28) и (4.29), для получе¬ ния значения решения в точке tr+Atr не требуется специальных процедур для нахождения решения в нескольких предыдущих точках, а достаточно информации лишь о значении хг. Для дифференциального уравнения 2-го порядка (4. 25') фор¬ мулы Рунге — Кутта имеют вид, аналогичный (4. 28) и (4. 29): (4.28) где kx=Ltr- fit г, хг)\ (4. 29) 280
(4. 30) хг±г=- хг ! Мгхг--^ y\p)k-L\ i = 1 ^r+1 = Xr + V y\p)k;, [-1 где ^1 ==z tJ^r ’ f {^гч Xr\ kt = £\tr ■ f Ur + aIДtr, xr + а, Д/гхг + 2 - -^ + 2 i=i Расчетные формулы. Приведенные ниже формулы записаны для одного скалярного уравнения системы (4. 24) или (4.25). Для интегрирования всей системы (4.24) или (4.25) эти формулы следует применить к каждой компоненте вектора х. В табл. 4. 9, 4. 10 приведены формулы различных вариантов методов Рунге — Кутта 1, 2, 3 и 4-го порядков для численного интегрирования систем дифференциальных уравнений 1 и 2-го порядков. В методах Рунге — Кутта, порядок которых р<4, число пр коэффициентов ki в формуле (4.28)' и, следовательно, число вы¬ числений правых частей i(t, х) равно порядку метода: пр=р, если р<4. Для р = 5 число пр=6, а для р>7 число пр>р + 2. Формулы Рунге — Кутта высокого порядка достаточно сложны и здесь не приводятся. При использовании ЦВМ непосредственно программируются вычисления по формулам, указанным в табл. 4. 9. При этом для решения сложных задач целесообразно использовать методы, для которых известны простые выражения для локальной ошиб¬ ки (например, методы типа Рунге — Кутта — Мерсона, Рунге — Кутта — Ингланда). Для методов с известной оценкой локаль¬ ной ошибки можно использовать схемы автоматического выбора шага (см. ниже), что приводит к экономии машинного времени при заданной точности решения. Точность метода. Точное выражение для суммарной ошибки приближенного решения при численном интегрировании дифференциальных уравнений методами Рунге — Кутта неиз¬ вестно. Общая априорная оценка (т. е. оценка, не связанная с ре¬ зультатами интегрирования конкретной системы) суммарной ошибки при интегрировании на отрезке [То, К] одного дифференци¬ ального уравнения 1-го порядка методом Рунге — Кутта имеет вид (* = 2, 3, 4,.. ., п ). 281
Q 5f Vo «5 К « я к <u X Cfi Я a >> X 2 X j3 4 Я Я X X *0* *8* к я я я я о a н X я =£•* са $ ° £ * $ =( * к а a 2 о с с X £ Л *3 СО Я Q- 5 6"* >> I >> О, а о =с о н *5 >> £ a о е •е- •& к S a) S 'К < <5 + i- < + 'к •ег + Ч •<* + а ч * « 3 го S а « S о ” ш § § Н <и « ^ ва 5 а >> о а с Й я Л н + Ч <и а а ц г« ^го >а ее о н < + Ч + 'К < + ч + ч~> •га + Ч < + Ж» •к < Я О я « S си 8 ЭЯ 3 го*е5 „ g М & fct Я ег о JJ о .5 S О g<CT) § §.»« R-&H Я I g | S 1) « я о Си о н сз <D + + ч ео + + К ч 1Г: J «V. Я Н >~.8Я CU о) «'т Й« I *=с I 5 о си с-« о £,R D-, о geo £ «* о н § £ я 282
Ч-v , < >se »fti лГ (N | CM CO | 'Ф —• | CM _L + / N H + + V. H V. H - m W „ * < 4** <J < < + <1 + V. 'Kj < + + + *•> H l + t- к "к < + < ~ir CO CM + <M »££ CM + + • я p н S н =s£V-s 3 , e Я со s a, g 2 § r4 _ Я 2 e H *•—✓ s я id VQ ЭЯ О я л Ч я <D Ef я я Я Рч >> о о я оя CD Я я 4 CD 0 Я Очсо 5 ccj «■* м | CJ I 1 СО I *«L CD Рч id a я <D О Оч н я t=c я я Я! I « 1 к <D « 2 л Я о >-> м О. ^ О и fcf I о "Ф Ф я Р с_ + Г* ■’•■ со + C<j >£* СО f CD 3 sS I CM 'К + + 's < ч-, ч<» <! + w. 4 со + -• | cc + Рч c 283 At'f{tr-\-M, xr-\-ki—^2+Ag)
Общее название Название конкретного метода метода Формула для вычисления ^г+1 Формулы для вычисления коэффициентов + + + ч + О) 03 и, х Ж о о Оц-си о :> ес I 2 I |s и 284
я 5 I- л 2 я £ w | 2 I *Г. сз <1) Сч 285
\Хт- ■х it,) I < I *0 - x (*0) 1 eM “ " M -!- [utP4- Л ) M (< -<„) e r M (г=0, 1, 2,..., N-\), (4.31) где x(tr)—точное решение дифференциального уравнения в точке tr\ хт — решение, полученное методом Рунге— Кутта по¬ рядка р: хг+\ =хг+Ф/р)(^г, хт, Д/)+бг; бг — ошибка округления; 8 = шах8г—максимальная величина ошибки округления; М, Г L — некоторые постоянные, не зависящие от t, х, At, но завися¬ щие от вида и свойств правой части f(t, х); Ф/р) — общее обозна¬ чение для формулы Рунге — Кутта порядка р. Таблица 4.10 Четырехточечные формулы Рунге — Кутта для дифференциальных уравнений 2-го порядка х = ? (t,x, х) (порядок точности р = 4, порядок локальной ошибки 0(Ш5)) Название метода Формулы для вычисления ХГ+1. *г + 1 Значения коэффициентов k. Стандартный метод Рунге — Кутта 4-го по¬ рядка для урав¬ нений 2-го по¬ рядка (правило .Ve‘) Xr + \=Xr-\-XrAt-\- + ~Т~ ifil + ^2+ &з) 4 t 0 1 ХГ±1=ХГ + - (&1 + 0 + 2^2 + 2^з Т &4) k\ = At-<f(tr, хг, xr) / 1 1 . *2= At-<t\tr+ — At, xr+— xr\t + 1 1 \ + ^ ^lA^ ■ xr+ g j £3 = A*1-<p ^tr+ At, Xr + 1 . 1 .IN + 2 Xr^Jr ^ k\At, xr-\- ^ 1 ki = At-<?(tr+ At, xr+ xrAt+ + — k%At, xr-{-k^j В формуле (4.31) величина LAH характеризует влияние ло¬ кальной ошибки метода (ошибки на одном шаге)', а величина б/At — влияние ошибки округления. Из формулы видно, что стремление уменьшить локальную ошибку метода приводит к уменьшению At и, следовательно, к увеличению ошибки округле¬ ния. Кроме того, формула (4.31) показывает, что оценка сум¬ марной ошибки экспоненциально растет с увеличением интерва¬ ла интегрирования [/0, 4-]- Практические методы определения ошибки численного инте¬ грирования на интервале :[(0, tr]. Теоретические формулы априор¬ ной оценки точности интегрирования, типа формулы (4.31), яв¬ ляются довольно грубыми и основываются на информации (по¬ 286
стоянные L, М), не содержащейся в формуле Ф/р) метода Рун- ге — Кутта. Поэтому они находят малое применение в практике вычислений. Практический метод получения приближенной апо¬ стериорной оценки ошибки численного интегрирования (т. е. оценки, использующей информацию, полученную в ходе расчета) основан на так называемом принципе Рунге. Принцип Рунге со¬ стоит в использовании асимптотических оценок (т. е. оценок, справедливых при At—>0) для оценки ошибок при конечных At. Хотя асимптотические оценки не дают гарантированных преде¬ лов погрешности, однако они, как правило, очень близки к таким пределам или дают удовлетворительные с практической точки зрения результаты. Кроме того, асимптотические оценки можно использовать для оценки поведения действительной ошибки метода. Пусть x(tr) —точное, а хг — приближенное решения диффе¬ ренциального уравнения в точке tr=rAt+to, полученное с по¬ мощью метода порядка р при постоянном шаге интегрирования At (метод может быть как разностным, так и методом Рунге — Кутта). Тогда для дифференциальных уравнений с достаточно гладкими правыми частями выражение для погрешности метода имеет вид xr — x(tr) = r\(tr) ), (4.32) где г](tr) — некоторая функция, зависящая от tr и не зависящая от Д& Для оценки погрешности необходимо дважды интегрировать систему (4. 24) на отрезке (Y0, tr]: один раз с шагом At, другой — с шагом At/2 (или 2Дt, что менее надежно, но более экономно с точки зрения машинного времени). Тогда на основе формулы (4. 32) можно получить следующую оценку погрешности: /2) -*(/,)« (4Л0 - 4^/2)). (4. зз) По поводу формулы (4.33) следует заметить, что: 1) при вы¬ воде формулы не учитывались ошибки округления, поэтому она неприемлема при расчетах, в которых превалируют ошибки округления (например, при очень больших интервалах интегри¬ рования и очень сложных правых частях дифференциальных уравнений)'; 2) формула несправедлива для дифференциальных уравнений с разрывными или кусочно-гладкими правыми частя¬ ми. В этом случае, однако, на основе формулы (4. 33) можно ис¬ следовать поведение действительной ошибки, производя интегри¬ рование по интервалам между точками разрыва (сами точки раз¬ рыва следует определить довольно точно, например, с помощью интерполяции). Локальная ошибка метода и практические способы ее оценки. Методы Рунге — Кутта p-то порядка обладают локальной ошиб¬ кой (ошибкой на одном шаге длиной At), равной 0(Д/р+1). Глав¬ 287
ный член (т. е. доминирующая величина при малых At) этой ошибки равен КРА№+1. Порядок локальной ошибки, указанный в табл. 4. 9, имеет место лишь для тех дифференциальных урав¬ нений, правые части f (t, х) которых имеют непрерывные частные производные по t и х вплоть до порядка, равного порядку метода. В тех случаях, когда непрерывность или непрерывная дифферен¬ цируемость правых частей f(tf, х) нарушается в некоторой точке t+, следует следить за тем, чтобы точка t+ не попадала внутрь интервала At. В противном случае следует определить точку (/+, х((+)) (например, с помощью интерполяции) и дальнейшие вычисления вести из точки (/+ х(£+)) как из начальной. Одним из недостатков методов Рунге — Кутта является то, что точные выражения для локальной ошибки в большинстве ме¬ тодов неизвестны, а в том случае, когда они известны, их исполь¬ зование затруднительно. Так, точные формулы для локальной ошибки методов Рунге — Кутта 1 и 2-го порядков имеют вид Е = /г<5<*г+1, (4.34) (для метода Эйлера); Е = -1<0<1 (4.35) (для улучшенного метода Эйлера) Выражения (4.34) и (4.35) показывают, что для методов Рунге — Кутта 1 и 2-го порядков величина локальной ошибки за¬ висит от значения производных р+1 порядка (р= 1, 2) искомого решения x(t) в некоторой точке I внутри отрезка интегрирования [К, tr+1]. Отсюда следует качественный вывод, что при интегриро¬ вании дифференциальных уравнений, решения x(t) которых об¬ ладают большими значениями x(t), x(t), необходимо использо¬ вать меньшие шаги At, чем при интегрировании уравнений с малыми x(t), x(t). Поскольку явные выражения для х, х часто весьма громоздки, вместо формул вида (4. 34) применяют фор¬ мулы, использующие значения лишь уже вычисленных величин (обычно такие формулы дают приближенную оценку локальной ошибки с точностью 10—20%). Так, для метода Эйлера оценка локальной ошибки имеет вид E = ^{fr+1-fr]=\[bi{tr+1, хг+1)-к^г, Хг)\ = 0{ьП (4.34') Для использования формул типа (4.34) необходимо произ¬ вести одно дополнительное вычисление правой части в точке (К+Ъ Л-г-и) • 288
Для модифицированного метода Эйлера. (At3), где k1 = Atf (/,, xT)=Atf,\ ki=Atf{tr-\ Д//2, xr + ^/2= Atfr+yt, оценка локальной ошибки имеет вид £= if [5Л+1- 12Л+1,2 + 8/г- /,_*]. (4. 35') Для ее использования требуется одно дополнительное вычис¬ ление правой части в точке (tr+u хг+\) и одно ранее вычисленное значение fr-\- Среди методов Руиге — Кутта 3-го порядка известен вариант, в котором возможно последовательное увеличение порядка ме¬ тода с оценкой локальной ошибки: Метод 1-го порядка Xr+i ==хг k-y, k1=Atf/tr, xr). Метод 2-го порядка x^+\ = xr-\- — {kц-рЗ&з), kg = Atf ^ tr-\-— д/, хг-\—y-j . Оценка ошибки метода 1-го порядка Ew = 4%-х?4 = \(4-к2)=0{АР). Метод 3-го порядка 4+i—xr-\- — [21+3 (£21 &3)], ks — Atf ^ tr-f—) • (4. 36) Оценка ошибки метода 2-го порядка Ес2) = х?4 - 4% 1 — ~-^-{k2 — kg)=0( At3). О Локальная ошибка стандартного метода Рунге — Кутта 4-го порядка может быть оценена с помощью следующего выражения: E — 3Atf(tr+u xr+ \) +k\—2kz—2ki, (4.37) которое требует вычисления значения f(tr+ь хг+\). Другой метод оценки локальной ошибки, часто используемый в стандартных подпрограммах в тех случаях, когда явное выра¬ жение для ошибки неизвестно, состоит в интегрировании с двумя различными шагами. Если получены результаты интегрирования от точки tr до точки tr+i с шагами At и At/2, то ошибку можно оценить с помощью формулы (4. 33). Такой способ требует, одна¬ ко, больших затрат машинного времени [для этого необходимо 11 раз вычислять правую часть f(/, х)]. Для сокращения машин¬ ного времени можно производить интегрирование с шагами At 10 3398 28&
и 2At, а оценку производить через шаг. В этом случае на каждые 8 вычислений f(/, х) необходимо производить 3 дополнительных вычисления для получения оценки локальной ошибки. Удобные оценки локальных ошибок имеются для методов Рунге — Кутта — Мерсона и Рунге — Кутта — Ингланда (см. табл. 4.9). Следует заметить, что оценка локальной ошибки ме¬ тода Рунге — Кутта — Мерсона, строго говоря, относится к слу¬ чаю интегрирования одного линейного уравнения. Тем не менее она часто используется на практике и при интегрировании систем нелинейных уравнений. Аналогичное замечание относится и к контрольному члену Стретона для стандартного метода Рунге — Кутта 4-го порядка (см. табл. 4. 9). Оценка локальной ошибки в' методе Рунге — Кутта — Ингланда применима в случае интегри¬ рования систем нелинейных уравнений, но требует двух допол¬ нительных вычислений правых частей f (t, х). Выбор шага интегрирования. При выборе шага ин¬ тегрирования обычно руководствуются следующими общими со¬ ображениями. 1. Шаг интегрирования не должен быть слишком большим, так как с увеличением шага растет ошибка метода. 2. Шаг интегрирования не должен быть слишком малым, так как с уменьшением шага растет ошибка округления. Кроме того, интегрирование с малым шагом приводит к большим затратам машинного времени. Если в нескольких характерных точках I] отрезка интегриро¬ вания [t0, Т] для m контролируемых компонент вектора решения л Xi(t), i= 1, 2, ..., m<n системы (4.24) заданы величины гц, 1= Г, 2, ..., m допустимой погрешности численного решения, то оценку приемлемости выбранного постоянного шага At можно осуществить на основе использования принципа Рунге (см. выше). Для этого дважды интегрируют систему (4.24): один раз с постоянным шагом At, другой — с постоянным шагом 2Аt и вы¬ числяют по формуле (4. 33) ошибку интегрирования в выбранной точке \tj. Если вычисленные таким образом ошибки контролируе¬ мых компонент не превосходят заданных, то шаг At считается приемлемым. В противном случае величина постоянного шага ин¬ тегрирования должна быть уменьшена. Отметим, что такой спо¬ соб оценки величины шага не учитывает ошибок округления. Во многих задачах механики полета (особенно в вариацион¬ ных) интегрирование с постоянным шагом не является рацио¬ нальным, так как на некоторых участках шаг может быть увели¬ чен по сравнению с тем постоянным значением, которое является допустимым для всего интервала [Д, Т]. С целью сокращения вы¬ числительной работы при одновременном соблюдении требуемой точности численного решения применяют интегрирование с авто¬ матическим выбором шага. Вычислительные схемы автоматиче¬ ского выбора шага основываются на использовании оценок ло¬ кальной ошибки метода и при интегрировании систем вида (4. 24) 290
строятся следующим образом. Среди п компонент вектора х вы- бирается т компонент, т<п, точность интегрирования которых' должна контролироваться. Для контролируемых х, назначаются величины si, i= 1, 2, ..., т, допустимых ошибок на одном шаге интегрирования. Тогда, если в процессе интегрирования из точки (tr, хг) текущее значение оценки локальной ошибки E-L для i-ой компоненты превосходит допустимое значение ц (хотя бы для одной из т контролируемых компонент), то шаг A/r+i уменьша¬ ется (обычно в два раза) и расчет производится заново из точкй (tr, х,,). Если текущее значение Е\ удовлетворяет условию Ei<Si/2p+l для всех г = 1, 2, ..., т, то шаг увеличивается вдвое и интегрирование с этим шагом начинается из точки (tr+ь х,..: О. В остальных случаях интегрирование ведется из точки (tr+1, Xr+i) с прежним шагом. (Увеличение и уменьшение шага в два раза связано со стремлением получать либо целочисленные, либо дробные, но с небольшим числом знаков, значения для моментов времени tr). Таким образом, схема автоматического изменения шага в про¬ цессе интегрирования может быть следующей: д/г/2, если Е[^>е[ для хотя бы одного?, i=l, 2,..., т; Л^+1 — { дtr, если sJ-/2p+1 < Е, <С £/ Для всех 1=1, 2,.. т; (4.38) 2дtr, если Дг<^ег/2р+1 для всех i=l, 2,. .., т, где Atr+1 — шаг интегрирования из точки (tr+i, xr+i), если инте- гоирование должно вестись с прежним или удвоенным шагом, и из точки (tr, хг), если интегрирование должно вестись с умень¬ шенным шагом. В тех случаях, когда целочисленность значений tr не является необходимой, схема автоматического изменения шага может быть следующей: Д^+1 = ад/г min (ег/Яг.)1/(р+1), (4.3Э) /=з1, 2,..., т где а<1 (можно принимать а = 0,85-т—0,95). В тех случаях, когда min (в!/Е1)Шр+Е> 1, 1=1, 2,..., т интегрирование с шагом Atr+l ведется из точки (tr+\, xr+i)', а в тех случаях, когда min (S;./£\)V<r+1><1, » i=1, 2,..., т интегрирование с шагом A^+i повторяется из точки (tr, хг). Выбор величины начального шага А/0 для схемы (4. 38) не является очень существенным, так как нужное значение шага на¬ 291
ходится довольно быстро даже в том случае, когда в качестве ЛА> берется значение Т—■to=At0. Для схемы (4.30) величину на¬ чального шага ДА) целесообразно выбирать близкой к действи¬ тельному значению. Методы интегрирования с автоматическим выбором шага обычно на 20—30% сокращают время, необходи¬ мое для получения решения, по сравнению с методами интегри¬ рования при постоянном шаге (при одинаковой точности). При этом вторая схема автоматического изменения шага несколько эффективнее первой. Особенности применения методов Рунге—- Кутта при использовании ЦВМ. Алгоритмы интегри¬ рования систем дифференциальных уравнений различными мето¬ дами Рунге—Кутта входят в библиотеки стандартных подпро¬ грамм практически всех отечественных ЦВМ. Выбор того или иного алгоритма зависит как от типа ЦВМ, так и от сложности решаемой задачи. Применительно к задачам механики полета наибольшее распространение из методов Рун¬ ге— Кутта получили методы 4-го порядка. Достаточно высокая точность методов 4-го порядка позволяет проводить интегриро¬ вание с неслишком малым шагом и для многих задач обеспечи¬ вает приемлемую величину затрат машинного времени. При ре¬ шении некоторых задач механики полета возникает необходи¬ мость размещения программы всей задачи в оперативной памяти ЦВМ. В таких случаях все алгоритмы должны обладать не толь¬ ко высоким быстродействием, но и небольшим объемом програм¬ мы. Поскольку методы Рунге — Кутта не требуют (в отличие от методов Адамса и прогноза-коррекции, см. разд. 4. 1. 1 и 4. 1.2) отдельных процедур для получения дополнительных начальных (разгонных) точек, их программы короче программ разностных методов одинакового порядка. Некоторые модификации методов Рунге — Кутта допускают дополнительную экономию машинной памяти. Так, метод Рунге — Кутта — Гилла (см. табл. 4. 9)' мож¬ но записать в такой форме, которая потребует для своей реали¬ зации на ЦВМ только 3п групп рабочих ячеек (вместо 4л групп, как это необходимо для стандартного метода Рунге — Кутта 4-го порядка). Кроме того, при такой форме записи метода все коэф¬ фициенты ki, i= 1, 2, 3, 4, вычисляются с помощью одного и того же цикла программы. Указанная форма представления метода Рунге — Кутта — Гилла (эквивалентная 1-му методу Гилла, см. табл. 4. 9) имеет вид: 4+\ —хг +0,5 + i/i)? •4+1 =4+i +(1— 1^0,5) (A2+i/2); 4+1=4+1 +(1 + УЩ (++ qB); (4,40) 4+i=4+i=4+i 4—~ +4+ #4)» 6 292
где Ч\ — Р» ^=—(*1 + ^1); <?3= -(2-/2)^+ 2~^°_5 <?2); 2{2+V2)(ka-\- 2 + 3^дЛ ; K = Ltf{tr, xr), k2 = Aif(tr-\-At/2, 4+i); &з=Д*/(^- + Д//2, 4+i); £4 = Д*/(*Г+Д*, 4+i). Численное значение коэффициента а в этой схеме не играет роли, так как он умножается на нуль. Многие стандартные программы для интегрирования систем дифференциальных уравнений вида (4.24) предусматривают замену независимой переменной t в правой части этих уравнений на новую зависимую переменную х0. Замена осуществляется с помощью присоединения к системе (4.24) дифференциального уравнения ^=1 (4.41) dt с начальным условием -^0(^0)= Не¬ включение дополнительного уравнения (4.41) в общую си¬ стему (4.24) позволяет автоматически вычислять нужные значения независимого переменного t (например, tr, tr+At/2, tr+At и т. д.) интегрированием, а не прибавлением соответствующих значений долей шага. Кроме того, введение новой переменной х0 облегчает формирование величины последнего шага интегрирования в тех случаях, когда момент времени Т окончания процесса интегриро¬ вания определяется условием совпадения значения какой-либо из зависимых переменных л+Ц) с наперед заданной величиной л+*. В этих случаях величина последнего шага определяется посред¬ ством деления разности Хг—х * на известную производную fi(xо, х). Сравнительные достоинства и недостатки методов Рунге — Кутта. 1. Методы Рунге — Кутта обладают достаточно простой и однотипной вычислительной схемой; программы для ЦВМ, реа¬ лизующие эти методы, получаются достаточно компактными. 2. При интегрировании дифференциальных уравнений метода¬ ми Рунге — Кутта нет необходимости вычислять дополнительные начальные (разгонные) точки, как это имеет место в методах 293
Адамса и прогноза-коррекции. Вся информация, необходимая для получения решения на данном шаге, находится путем вычис¬ ления правых частей уравнений в нескольких специально фор¬ мируемых вспомогательных точках. 3. При наличии способа вычисления локальной ошибки в ме¬ тодах Рунге — Кутта легко реализуются схемы автоматического изменения шага в, процессе интегрирования. При этом, в отличие от методов Адамса и прогноза-коррекции, для изменения шага не требуется дополнительных вычислений (например, новых раз¬ гонных точек или интерполяции) и запоминания результатов предыдущих шагов. 4. При интегрировании дифференциальных уравнений с раз¬ рывными или недостаточно гладкими правыми частями для со¬ хранения порядка метода необходимо возобновлять интегриро¬ вание при каждом переходе через точку разрыва или нарушения гладкости (эта точка находится путем интерполяции и принима¬ ется за новую начальную точку). Методы Рунге—-Кутта при интегрировании таких уравнений имеют то преимущество, что для перехода к новым начальным условиям не требуется дополни¬ тельных вычислений. Иногда упомянутые уравнения интегри¬ руются с малым шагом без определения точек разрыва. В таких случаях наличие точки разрыва оказывает в методах Рунге —■ Кутта непосредственное влияние лишь на один шаг, тогда как в методах Адамса и прогноза-коррекции — на несколько последую¬ щих шагов, определяемых числом разгонных точек. 5. Методы Рунге — Кутта характеризуются многократным об¬ ращением к вычислению правых частей дифференциальных урав¬ нений на одном шаге. Так, для методов порядка требуется р-кратное вычисление правой части f(f, х) уравнения (4.24). В случае сложных правых частей это приводит к большим за¬ тратам вычислительной работы. Вместе с тем в методах Адамса или прогноза-коррекции любого порядка требуется всего l-f-3-кратное вычисление правой части. 6. Для получения локальной ошибки в методах Рунге — Кутта необходимы дополнительные вычисления, тогда как в методах прогноза и коррекции локальная ошибка получается как побоч¬ ный продукт вычислений. 7. Если не учитывать влияния ошибок округления, то точность интегрирования методами Рунге — Кутта может быть повышена как за счет уменьшения шага At, так и за счет перехода к методу более высокого порядка. Методы Рунге — Кутта, как правило, не допускают перехода к формулам более высокого порядка в пределах одной вычислительной схемы [исключение составляет, например, метод (4.36)], поэтому изменение порядка метода со¬ провождается изменением программы. Кроме того, методы Рун¬ ге — Кутта высокого порядка требуют большого количества вы¬ числений правых частей (р + 2 вычислений для методов порядка р>6). В то же время разностные формулы метода Адамса допу- 294
Таблица 4.11 Результаты интегрирования уравнений движения самолета различными методами Рунге—Кутта на ЦВМ БЭСМ с шагом М=\ сек t, сек Параметры движения Значения параметров движения, вычисленных методом: Рунге—Кз'тта 1-го порядка (методом Эйлера) Рунге—Кутта 2-го порядка (методом Эйлера с пере¬ счетом) Рунге—Кутта 3-го порядка (методом Рунге—Кут¬ та—Гейне) Рунге—Кутта 4-го порядка (стандартным методом Рунге—Кутта) v, м/сек 500,00000 500,00000 500,00000 500,00000 0 0, град 8,0000000 8,0000000 8,0000000 8,0000000 h, м 12000,000 12000,000 12000,000 12000,000 V 500,49950 500,40354 500,40169 500,40232 1 е 8,9099438 8,9107658 8,9108502 8,9108370 h 12069,586 12073,552 12073,548 12073,550 V 500,80722 500,60813 500,60440 500,60564 2 е 9,8216009 9,8237420 9,8239148 9,8238896 h 12147,104 12155,019 12155,011 12155,014 V 500,91630 500,60676 500,60113 500,60297 3 0 10,735602 10,739585 10,739850 10,739814 h 12232,536 12244,374 12244,362 12244,367 V 500,81986 500,39246 500,38490 500,38731 4 0 11,652598 11,658971 11,659334 11,659289 h 12325,842 12341,584 12341,569 12341,576 V 500,51102 499,95823 499,94869 499,95168 5 0 12,573257 12,582601 12,583066 12i583013 h 12426,996 12446,610 12446,592 12446,600 V 495,53968 494,24294 494,22319 494,22870 10 о 17,256615 17,290855 17,291923 17,291856 h 13048,610 13086,956 13086,918 13086,941 V 465,65994 462,21093 462,16787 462,17605 20 0 27,376625 27,535936 27,538942 27,539092 h 14833,866 14903,610 14903,497 14903,574 V 284,03406 267,08954 266,89992 266,82796 40 0 57,621190 59,527634 59,551980 59,569621 h 19763,512 19793,989 19792,920 19792,634 295
скают переход к методам более высокого порядка почти без изме¬ нения вычислительной схемы; при этом такой переход не сопро¬ вождается увеличением количества вычислений правых частей уравнений, но количество разгонных точек должно быть соответ¬ ственно увеличено. 8. Методы Рунге — Кутта вычислительно устойчивы, однако область устойчивости невелика. Поэтому при интегрировании уравнений движения с сильно различающимися постоянными времени допустимая величина шага At может ограничиваться не локальной ошибкой метода, а условиями его устойчивости. Пример 5. Численное интегрирование уравнений движения самолета ме¬ тодами Рунге—Кутта различных порядков. Для задачи, описанной в Примере 3, разд. 4.1.1, проведено интегрирование системы уравнений движения самолета методами Рунге—Кутта 1, 2, 3 и 4-го порядков с постоянным шагом =1,0 сек. Расчеты выполнены на ЦВМ БЭСМ, причем были составлены программы как для вычисления правых частей уравнений движения, так и для вычислений по формулам различных методов Рунге—Кутта. Результаты расчетов сведены в табл. 4.11, где они представлены с сохранением 8 значащих цифр, выданных ЦВМ. В подзаго¬ ловках этой таблицы указаны более точные названия методов, соответствую¬ щих табл. 4. 9. 4.1.4. Общие замечания и рекомендации по выбору и применению методов численного интегрирования в задачах механики полета 1. Для простых задач с небольшой загрузкой оперативной памяти ЦВМ целесообразно пользоваться имеющимися стан¬ дартными подпрограммами численного интегрирования. 2. В сложных задачах с большой загрузкой оперативной па¬ мяти ЦВМ, а также при использовании ЦВМ с небольшой опе¬ ративной памятью лучше (в целях экономии памяти) самостоя¬ тельно запрограммировать какой-либо из приведенных методов (исходя из конкретной задачи и требований к точности резуль¬ тата) . 3. При ограниченности оперативной памяти и не слишком сложных правых частях дифференциальных уравнений целесооб¬ разно использовать методы Рунге — Кутта с постоянным шагом. 4. При необходимости сократить время интегрирования (на¬ пример, при решении краевых задач методами редукции к задаче с начальными данными, когда на каждой итерации приходится многократно интегрировать исходную систему дифференциальных уравнений) целесообразно использовать методы прогноза и кор¬ рекции с постоянным или переменным шагом или методы Рунге — Кутта с переменным шагом. 5. Практика решения задач механики полета показывает, что методы низкого порядка (методы Эйлера, улучшенный метод Эйлера) с постоянным шагом при решении сложных задач боль¬ шой размерности часто дают значительную ошибку (при боль¬ шом шаге At велика ошибка метода, при малом шаге At велика ошибка округления) или приводят к значительным затратам 296
времени ЦВМ. Вместе с тем использование методов 2-го порядка с автоматическим выбором шага (Рунге — Кутта или прогноза с коррекцией) при решении простых траекторных задач дает вполне удовлетворительные результаты. 6. При отсутствии предварительных данных о шаге интегри¬ рования в какой-либо конкретной задаче перед проведением мас¬ совых или окончательных расчетов необходим численный экспе¬ римент. Этот эксперимент обычно использует какую-либо стандартную подпрограмму (СП) численного интегрирования с автоматическим выбором шага (например, СП, реализующую стандартный метод Рунге — Кутта 4-го порядка с двойным просчетом с шагами At и 2Аt). 7. Методы Адамса и прогноза-коррекции целесообразно при¬ менять при интегрировании с постоянным шагом (особенно, если шаг интегрирования известен заранее). «Разгонные» точки при этом следует находить методами Рунге — Кутта 4-го порядка, например, методом Рунге — Кутта — Гилла. 8. В задачах с большим количеством вычислений (например, при интегрировании на больших отрезках времени) следует при¬ нимать меры к уменьшению влияния ошибок округления. Стати¬ стический анализ ошибок округления при интегрировании урав¬ нений движения небесной механики показывает, что при некоторых предположениях ошибки округления растут пример- 3/2 но пропорционально п , где п — полное число шагов интегри¬ рования. Это означает, что случайная ошибка округления в по¬ следнем разряде через 1000 шагов переходит в 3-й младший разряд числа. Оценку числа k потерянных десятичных разрядов иногда определяют по формуле k = lgioO, 1124я3/2, установленной также для задач небесной механики. Число потерянных разря¬ дов, вычисленное по этой формуле, приведено в табл. 4. 12. Таблица 4.12 п 7 31 144 670 3100 14400 k 1 2 3 4 5 6 Истинное число потерянных знаков при этом меньше числа, указанного в таблице, с вероятностью 99,7%, т. е. данные табли¬ цы дают оценку сверху. 9. Для сохранения порядка метода (порядка локальной ошибки) при интегрировании дифференциальных уравнений с разрывными или недостаточно гладкими правыми частями необ¬ ходимо начинать расчет заново от точки разрыва (или точки на¬ рушения гладкости) как от начальной. В случае многих разрывов особенно подходят методы Рунге — Кутта, поскольку для них не нужна процедура формирования «разгонных» точек. Точки раз¬ 297
рыва правых частей или их производных должны быть опреде¬ лены при этом достаточно точно, например, с помощью интерпо¬ ляционных формул соответствующего порядка. 4.2. ЧИСЛЕННЫЕ МЕТОДЫ РАСЧЕТА РАВНОВЕСНЫХ РЕЖИМОВ ПОЛЕТА ЛА И МЕТОДЫ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ МЕХАНИКИ ПОЛЕТА (ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ НЕЛИНЕЙНЫХ УРАВНЕНИЙ) Достаточно полные уравнения движения ЛА состоят из диф¬ ференциальных уравнений движения центра-масс ЛА, дифферен¬ циальных уравнений движения ЛА относительно центра масс, кинематических дифференциальных и алгебраических уравнений и дифференциальных уравнений изменения массы и моментов инерции ЛА. Такая система уравнений описывает, вообще говоря, неуста- новившееся движение ЛА, и для ее исследования необходимо привлекать методы численного интегрирования дифференциаль¬ ных уравнений движения (см. разд. 4. 1). Прежде чем исследо¬ вать сложное неустановившееся движение ЛА, часто бывает це¬ лесообразно рассмотреть некоторые важные частные случаи движения. Одним из таких случаев является равновесный режим полета, при котором суммы действующих внешних сил и момен¬ тов тождественно равны нулю. Летные характеристики ЛА на равновесных режимах полета описываются системами нелинейных алгебраических или транс¬ цендентных уравнений. В общем случае уравнения движения ЛА имеют вид Я- = /г(х, z, и) (/= 1, 2,.. п); . (4.42) г;- = ®Дх, z) (у = 1, 2,..., п). (4.43) Здесь х= (х\, х2, ..., хп)т — вектор линейных и (или) угло¬ вых скоростей; z = (zu z2, ..., zn)T—-вектор линейного и (или) углового положения; /г — проекции сил и моментов; ср3- описыва¬ ют кинематические соотношения; и=(мь ..., ит)т — вектор управления. Равновесные режимы полета описываются условиями /г(х, z, и) = 0 (г' = 1, 2, . .., п), (4.44) откуда следует, что на таких режимах х = Хо = const. При различных фиксированных значениях некоторых компо¬ нент вектора положения z и некоторых составляющих вектора управления и соотношения (4. 44) образуют систему п нелиней¬ ных трансцендентных уравнений с п неизвестными. Решения этой системы определяют, в частности, диапазон кинематических параметров, при котором возможен равновесный режим полета. 298
Пример 6. Уравнения движения центра масс самолета, совершающего полет без крена и скольжения в вертикальной плоскости над плоской невра- щающейся Землей, будучи записанными в прямоугольной вертикально-ско¬ ростной системе координат Охсусгс, имеют вид то = Р cos (а -f ув) — Q (v, h , а) — mg(h) sin 6; (I) mvh— P sin (a + <pp) + Y (v, h, a) — mg (h) cos 0; (II) j = i;cos0; (III) p = h = v sin 0; (IV) PCe(v, h, P) 3600 £ (V) Здесь v — скорость полета; 0 — угол наклона траектории; | — продольная дальность; т] = Л — высота полета; т — масса ЛА; а — угол атаки; фр — угол установки двигателя; Р — сила тяги; Q — сила аэродинамического сопротивле¬ ния; Y — подъемная сила; g — гравитационное ускорение. Равновесный режим определяется соотношениями Р cos (a + Чр) — Q (v, h, а) — mg (h) sin 0 = 0; (VI) P sin (a -b 9p) + Y {v, h, a) — mg (h) cos 0 = 0, (VII) откуда следует, что y = t)0=const, 0 = 0O=const. Если величины фр, m, h, v0, 0o заданы, то соотношения (VI) и (VII) пред¬ ставляют собой систему трансцендентных уравнений относительно величин Р и а. Решения Р* и а* системы (VI) и (VII) определяют тягу и угол атаки рав¬ новесного режима полета. С помощью этих величин определяется секундный расход массы т на равновесном режиме полета. Расчет равновесных режимов—-не единственный пример, когда в механике полета приходится иметь дело с решением си¬ стем нелинейных алгебраических или трансцендентных уравне¬ ний. Имеется ряд задач, решение которых в итоге сводится к решению систем нелинейных уравнений. Часто встречающимся примером могут служить краевые задачи механики полета, воз¬ никающие при рассмотрении оптимальных траекторий (см. гл. 3). Пусть уравнения движения ЛА имеют вид xi = fi{t, х) (/= 1, 2, ..п), (4.45) и пусть при t = tо заданы начальные условия x.[t0)=xia (г = 1, 2,.,., £<я), (4.46) а при t=.t\ заданы конечные условия вида Xj(ii)==Xj\ {j = k-j-I, (fe-f-2,n), (4.47) либо xi{t1)=Xn {i— 1, 2,..., ti — k). (4.48) Решение краевой задачи (4.45) — (4.47) или (4.45), (4.46), (4. 48) не может быть проведено с помощью известных численных методов интегрирования (см. разд. 4.1), поскольку последние 299
предназначены для решения задачи с полностью известными на¬ чальными данными для всех компонент вектора х= (х\,.. ., х?г)т, т. е. для так называемой задачи Коши. Рассматриваемую задачу можно, однако, свести к задаче Коши, если доопределить недо¬ стающие начальные условия для компонент х$, j = k+ 1, . . ., п, вектора х. Для этого полагают xi(^o)~xJ — & -j-2, . .., «), (4.49) л где Xj — некоторые неизвестные пока переменные. Если проин¬ тегрировать систему (4. 45)' с начальными условиями xi {t<s)—xio 2,..., k)\ xj(^o)=x) = k-\-2,..., n), то значения компонент векторов xy, j = k+ 1, ..., п (4.47) или Хц, 1= 1, 2, ..., п—k, в момент t\ окончания интегрирования бу- д дут функциями переменных лу- (при фиксированных xi0): xh — Fj{xk+n xk+v —> хп) U = k-\-\, k-\-2, . .n \ Xil= l Xk+ 2> • • • > Xn) == ^ > 2...., П k). В каждом из указанных случаев для удовлетворения задан¬ ных краевых условий (4. 47) или (4. 48) необходимо решить не¬ линейную систему (п—k) трансцендентных уравнений с (п—k) л неизвестными Ху. xii х^~^j{.xk+\i ■ ■ • > хп) — Xji=0 k-\-2,..., п), (4. 50) или хп~xn=^iixk+i, ■ ■ • , •*„) — -**1 = 0 (/ = 1, 2,. . п — k). (4.51) Краевые задачи часто встречаются в проблемах внешней бал¬ листики и навигации, в задачах наведения и в теории межпла¬ нетных перелетов. В данном разделе даны основные определения и понятия, необходимые для использования методов численного решения систем нелинейных (алгебраических или трансцендент¬ ных) уравнений, а также приводятся сами методы. 4.2. 1. Итерационные методы решения систем нелинейных уравнений Система уравнений. Проблемы расчета равновесных и установившихся режимов полета, а также методы решения крае¬ вых задач динамики полета, основанные на их редукции к зада¬ 300
че с начальными условиями, приводят к рассмотрению систем не¬ линейных алгебраических или трансцендентных уравнений вида fi(Xi, х2, х3,хп)=0 (/= 1, 2, 3,. .п), (4. 52) или в векторных обозначениях f(x) = 0, (4.-53) где 'Л" 1 rH ч 1 f = II X 1 jn. -*1.- я-мерные векторы-столбцы. Системы уравнений могут иметь различный вид, например: gi(x1, х2,xn)=hi(x1, х2,хп) (/= 1, 2, 3,..., л). . (4. 54) Однако всякая система уравнений (4. 54) равносильна системе вида (4.52). Решение системы уравнений. Если в общей области X czRn определения п функций /Дх) с п независимыми перемен¬ ными х\, х2, хп можно указать такую определенную систему значений независимых переменных х^^фс} а) r(D •*2 » Х(п \ х(2>=(л!2), Х(2 (2) X, (2) х(*> = (х' (ft) Дй) Лк)), (4. 55) что только для этих значений справедливы равенства .... х[1)) = 0; /„(хИ\ хР,..., х</>) = 0 (у = 1, 2, 3,..., к), (4. 56) то каждое из значений х(Л называется решением системы уравне¬ ний (4. 52); если же равенства (4. 56) справедливы для любых х, то они называются тождествами. Возможные решения. Система уравнений вида (4.52) может иметь одно решение, несколько, бесконечно много реше¬ ний и ни одного решения. С формальной точки зрения задача полного исследования системы включает определение всех воз¬ можных ее решений. Однако с прикладной точки зрения не все решения одинаково интересны. Так, некоторые решения могут лежать вне допустимой по смыслу задачи области DczX^Rn зна¬ чений вектора х. Кроме того, могут рассматриваться как действи¬ тельные, так и комплексные решения системы (4.52). Для задач динамики полета, связанных с расчетом равновесных режимов 301
и решением краевых задач, наибольший интерес представляют! действительные решения; они и будут рассматриваться в после-1 дующих разделах. Что же касается проблемы отыскания всех решений в заданной области D (области «технических» решений), то алгоритмы решения такой задачи пока недостаточно разрабо¬ таны. Ниже будут рассмотрены методы отыскания решения, бли¬ жайшего в некотором смысле к выбранному начальному прибли¬ жению. Число решений независимой совместной системы уравнений общего вида может колебаться в весьма широких пределах. Так, в том случае, когда все Д являются многочленами степени т; от- П носительно (хи х2, , хп), система (4. 52) может иметь N= П mt г-i решений (действительных или комплексных)'. Совместная система. Система уравнений (4.52) назы¬ вается совместной, если для нее существуют значения компонент вектора х, удовлетворяющие всем уравнениям системы. Независимая система. Система уравнений (4.52) на¬ зывается независимой, если определитель матрицы Якоби J = df/dx не обращается в нуль тождественно: det/= det <Д/ь f2,.-., /я) ~ д(хъ х2,..., хп) _ г-д/, df i df i л dxi дх2 ' ’ дхп Ф о. д f п dfn dfn - dxi дх2 ” дхп (4.57) Обращение в нуль определителя матрицы Якоби, как правило, затрудняет вычислительный процесс нахождения решений. Недоопределенная система. Если одно или несколь¬ ко уравнений системы (4.52) является следствием других, то такая система имеет бесконечное множество решений. Такая си¬ стема может рассматриваться как недоопределенная: в ней име¬ ется не больше (п—1) уравнений с п неизвестными. Равносильные с и с,т е м ы. Две системы п уравнений с п неизвестными: f (х)=0 (4.58) и g(x) = 0 (4.59) с одним и тем же вектором независимых переменных х, рассмат¬ риваемые в одной и той же области определения, называются равносильными (эквивалентными), если каждое решение одной из них является решением другой и наоборот. Изолированные, простые и кратные решения. Если система совместна и независима, то ее решения являются 302
чаще всего изолированными, т. е. в достаточно малой окрестности каждого решения х<Л не содержится других решений. Если, кроме того, в точке решения хО) определитель матрицы Якоби (4. 57) отличен от нуля, то решение называют простым; в противном слу¬ чае решение может быть кратным. Вычислимые функции. Особенностью прикладных за¬ дач динамики полета является тот факт, что функции /*(х) часто задаются не явно, а посредством какого-либо более или менее сложного вычислительного процесса. Например, при решении краевых задач методом, основанным на редукции к задаче с на¬ чальными условиями, функции fi (х) являются результатом инте¬ грирования на отрезке Ро, ^i], некоторой системы дифференциаль¬ ных уравнений. При расчете равновесных режимов аэродинами¬ ческие силы и сила тяги могут быть заданы с помощью формул, включающих итерационные процессы и т. д. В таких случаях го¬ ворят, ЧТО функции fi (х) являются вычислимыми функциями. Под вычислимыми функциями понимаются такие функции, значения которых могут быть вычислены с заданной точностью для любых значений независимых переменных в области их задания, однако явный вид функций неизвестен. В частности, могут быть неиз¬ вестными и некоторые ее общие свойства (непрерывность, диффе¬ ренцируемость и т. д.). Все операции над такими функциями могут выполняться лишь посредством вычисления значений самой функции. Например, операция дифференцирования не может быть выполнена непо¬ средственно, однако можно вычислить частные прбизводные такой функции в любой точке с помощью подходящих формул числен¬ ного дифференцирования. Эти обстоятельства накладывают спе¬ цифические требования к методам, предназначенным для ре¬ шения систем нелинейных уравнений с вычислимыми функциями. Во-первых, эти методы не должны опираться на знание явного вида функций fi (х). Во-вторых, желательно, чтобы в них не упо¬ треблялись производные высокого порядка, поскольку для их вы¬ числения требуются значительные затраты машинного времени. В-третьих, необходимо ввести оценку вычислительной эффектив¬ ности численных методов, которая учитывала бы затраты на вы¬ числение fi (х) сравнительно с прочими операциями, употребляе¬ мыми в вычислительном процессе. Наконец, отметим, что в случае вычислимых вектор-функций f (х) возможны ситуации, когда вычисление значения какой-либо одной компоненты вектора f(x) автоматически сопровождается вычислением всех остальных компонент этого вектора. Так, на¬ пример, если система конечных уравнений возникает из решения краевой задачи методом редукции к задаче с начальными данны¬ ми, то при необходимости получить значение какой-нибудь коор¬ динаты на правом конце приходится одновременно вычислять значения и всех других координат. Эту особенность следует учи¬ тывать при выборе численного метода. Как правило, системы не¬ 303
линейных уравнений, допускающие независимое вычисление ком¬ понент вектора f(x), позволяют организовать более экономные вычислительные процессы, чем системы, в которых все компо¬ ненты вектора f(x) должны вычисляться одновременно. Идея итерационного процесса. Итерационная и рекуррентная формы. Для нелинейных уравнений об¬ щего вида (4.52) применяются итерационные методы (методы последовательных приближений) отыскания решений. Сущность этих методов заключается в том, что специальным образом стро¬ ится последовательность векторов {х^ц сходящаяся к решению системы уравнений (4.52). Последовательность векторов {хС>} = {Х<°>, ^={х[г\х[г\..., х<г>) (4.60) называется итерационной, если она образована с помощью вычис¬ лений по формуле х(^) =сР/(х^-1>) (r= 1, 2, 3,...) (4.61) (индекс «/» у функции ф/ указывает на возможную зависимость от системы уравнений f(x)=0). В координатной форме итераци¬ онная последовательность имеет вид х (/). z<?/i (4 (Г-1) хГ", х(г_1) Ап ) (Г=1, 2, 3,. (4. 62) Так образованная последовательность называется итерационной по совокупности координат. Задав каким-либо образом начальное приближение х<°> с по¬ мощью выражения (4.61), последовательно вычисляют хб), х<2> и т. д. Такое единообразие перехода от одного члена последо¬ вательности к следующему члену очень удобно при вычислениях на универсальных ЦВМ. Если компоненты ф/j (х)’ можно вычислять независимо, то итерационная последовательность векторов {х<г>} может строить¬ ся по схеме «итераций по отдельным координатам» (схеме Зей- деля): *.(/)_„ (J/) у(г) ЛП „(г—11) (г-1) л-1 тfi » а2 , • . .5 Xi—l, X’i , Xi+1 r 4Г_1)) (4.63) (г = 1, 2,..., я; г= 1, 2, 3 ...), т. е. при нахождении г-й компоненты вектора х используются,уже найденные компоненты х\г), х{р,..., х\Г2\. Более общим является использование рекуррентных последо¬ вательностей (итерационных последовательностей «с памятью»). Последовательность векторов {х<г)} называется рекуррентной (за¬ данной рекуррентной формулой), если задано несколько (р> 1) 304
ее членов х(°), х+..., х^ и известна функция, с помощью которой .хМ выражается через предыдущие члены последовательности: х(г) =ф/(х(г_1), х(г~2\ ..., х(г-р), хС-р+1' (4.64) (Р> 1, Г = р+1, /7+2,...). Методы построения конкретных функций ср/ как для итераци¬ онных, так и для рекуррентных последовательностей рассматри¬ ваются в последующих разделах. Сходимость последовательности. Последова¬ тельность векторов {хМ} называется сходящейся к вектору х *, если для каждой компоненты векторов х<г) их* имеет место со¬ отношение \тх\г)—х] (f = l, 2, 3,..., п). (4.65) Г-э-ОО В векторной записи это условие имеет вид Нш хм = х*. (4.66) г —> оо Если между точками хО') их* введено расстояние (метрика) q(x(?'>, х*) или если введена норма ||х|| вектора х (например, / п \ 1/2 ||X||=/ ^ -П —евклидова норма), определение сходимости (4.66) можно записать в эквивалентной форме: х* = Нт х(г), Г—>со , если lime(x(r), х*)= limIх(г> — х*||=0. (4.67) Г-э-ОО Г-т-оо Фундаментальная последовательность. По¬ следовательность {хМ} называется фундаментальной (или после¬ довательностью Коши, или сходящейся в себе), если для каж¬ дого е>0 найдется такое R, что I х<г> — х<г> || < е, как только r>R и r>R (в остальном г и г — любые). Условия сходимости. Для того чтобы последователь¬ ность {xW} имела предел (была сходящейся), необходимо, чтобы она была фундаментальной. В' общем случае фундаментальность последовательности еще не гарантирует сходимости этой после¬ довательности. Однако если метрическое или нормированное пространство будет полным, то фундаментальность последова¬ тельности является достаточным признаком ее сходимости. Прак¬ тическое значение фундаментальных последовательностей заклю¬ чается в том, что это свойство легко проверяется в процессе 305
решения системы уравнений (величины хМ и х(г-1) известны), тогда как непосредственно установить сходимость по норме II хМ—х* || не представляется возможным из-за незнания х*. Другим (косвенным) признаком сходимости последователь¬ ности {хм} к х * может служить сходимость последовательности нормы вектора невязок *) II f(r) - f*M|f (x<r>) - f (x*) II = IIf (x<'>) II (4.68) или фундаментальность последовательности (f(xW)}, т. e. выпол¬ нение условия ||f(x<'>)-f(x<'>)||<e (4.69) ДЛЯ r>R, г >7?. Порядок (скорость) сходимости. С вычислитель¬ ной точки зрения важны характеристики скорости сходимости последовательности {х<г>} (или {f (хМ) }). Пусть {хМ} — последо¬ вательность векторов в X, которая сходится к элементу х* из X. Если существует такое положительное действительное число v и ненулевая константа С, что Пт Г~> оо |1 х(г+1) —X* |1 1|х('-) — x*||® " (4.70) то число v называется порядком сходимости (асимптотической скоростью сходимости) последовательности {х<г>}, а константа С — асимптотической константой сходимости (в случае рекур¬ рентных последовательностей число у>1 может быть дробным). Так, если у=1, то последовательность имеет асимптотическую сходимость первого порядка (линейную), а если у = 2 —второго порядка (квадратичную)'; если 1<у<2, то говорят, что последо¬ вательность имеет сверхлинейную сходимость. Иногда вместо (4.70) удается получить оценки вида || х^г+1> — х* I <7 ^ || х^г> — х* ||, <? < 1, (4.71) или II х<'+0 - х* И < СI х<г> - х* f. (4. 72) В первом случае говорят, что последовательность {х^} схо¬ дится со скоростью не ниже линейной (или не медленнее, чем геометрическая прогрессия со знаменателем <7<1), во втором — со скоростью не ниже квадратичной. Преимущество квадратич- *> Вектором невязок называется разность векторов f<r)—f*. **> Иногда порядок сходимости определяется как предел v = lim Г-> ОО log Цх(г+1) — X* log Цх(г) — Xw|| Это определение эквивалентно (4.70). 306
ной сходимости заключается, грубо говоря, в том, что если С<1 и хМ дает k верных десятичных знаков *• решения, то приближе¬ ние х<г+1> дает по меньшей мере 2 k верных десятичных знаков (вообще для метода порядка н>1 значение Aki+l =vAkit где Aki+i — приращение количества верных знаков). В случае же ли¬ нейной сходимости число верных знаков определяется соотноше¬ нием П{ = По—-1 log с/, т. е. изменяется значительно медленней. Счи¬ тают линейную скорость сходимости «быстрой», если 1/10, и «медленной», если~<д<1. Вычислительная эффективность. С вычислитель¬ ной точки зрения важен не только порядок сходимости, но и за¬ траты на вычисление вектора х(г) по итерационной или рекур¬ рентной формуле. Эти затраты складываются из количества вычислительных операций, необходимых для вычисления вектор- функции cpf. В большинстве методов функция <р/ строится на ос¬ нове вычислений функций f(x) исходной системы уравнений, а также ее производных. В случае сложных f(x) на ее вычисление тратится подавляющая часть машинного времени (особенно при решении краевых задач, когда значение f(x) получается числен¬ ным интегрированием). Если 0 —количество вычислений вектор- функции f(x) и ее производных, необходимое для вычисления итерирующей функции ср/, то вычислительная эффективность £„(<pj, f) метода порядка v(v>\) определяется выражением Ev{ q>/Jf) = ‘o1/e. (4.73) На основе (4. 73) можно провести сравнение вычислительной эффективности двух численных методов порядка щ и v2 fl2>l), использующих итерирующие функции cpi и срг. Пусть оба метода начинают расчет с одного и того же начального прибли¬ жения х<°) и заканчивают вычисления по достижению одинакового числа верных десятичных знаков в решении. Тогда отношение не¬ обходимого для достижения одинаковой точности числа 1\ итера¬ ций первого метода к необходимому числу/2 итерации'второго метода приближенно равно h log ^2 h log ’ (4.74) а отношение суммарных затрат 0si и Ом ляется приближенно соотношением 01 logw2 62 logtl! ’ двух методов опреде- (4.75) * Точнее, следует говорить не о векторе х'г>, а о норме ошибки ||е<г>|| = = ||х<г>—х*||. Поскольку, однако,Ц х^— х*|| > \ХР — -*)|для всех /, то выво¬ ды относятся к ошибке по каждой компоненте вектора х<г>. 307
где дг (/=1,2)—затраты вычислительной работы (на вычислен ние f (х) и ее производных)' на одну итерацию для первого и втон рого численных методов, соответственно. Область сходимости. В общем случае сходимость ите¬ рационной последовательности {х<г>} к решению х* системы f(x)=0 зависит как от выбора начального приближения х<°> (или х<°), хб),..., х(р) в случае рекуррентной последовательности), так и от выбора метода, т. е. функции ф/. Для каждого решения х* си¬ стемы f(x)=0 множество всех элементов х(°), для которых после¬ довательность (хй)}, построенная с помощью функции ф/, схо¬ дится к х *, называется областью сходимости точки х* для ме¬ тода ф/. Решение х * называется точкой притяжения метода ф/, если некоторая окрестность точки х* целиком входит в область сходимости этой точки для метода фf. Решение х* называется точкой отталкивания метода q>f, если некоторая ее окрестность не содержит ни одной точки области сходимости (за исключением самой точки х*). В прикладных задачах со сложными вычисли¬ мыми функциями f (х) в тех случаях, когда неизвестно достаточно близкое к х * начальное приближение, целесообразно стремиться к выбору такого метода, который обладал бы достаточно большой областью сходимости (даже за счет медленной сходимости). Этапы решения. Общую стратегию поиска решений си¬ стемы f(x)=0 можно наметить в виде следующих этапов. 1. Определяется область допустимых значений х* :Ос1 2. В области D на основании всей располагаемой информации (физического смысла задачи, грубых упрощенных решений, ре¬ шений аналогичных или близких задач и т. д.) выбирается на¬ чальное приближение х<°). 3. Выбирается такой численный метод, который обладает по априорным теоретическим или экспериментальным для данной задачи сведениям достаточно большой областью сходимости. С помощью такого метода целесообразно убедиться в возможно¬ сти систематического улучшения последовательных приближений (например, оценивая поведение нормы вектора невязок ||f(x<r>)|| от итерации к итерации). 4. В достаточной близости от решения (при малых значениях нормы вектора невязок) целесообразно перейти на метод с вы¬ соким порядком сходимости. 5. После получения одного из решений с удовлетворительной точностью следует изменить начальное приближение и повторить весь процесс поиска решения. В итоге новой попытки будет полу¬ чено либо старое решение х*, либо другое решение х**. К сожа¬ лению, методы получения всех решений системы недостаточно разработаны и прием изменения начального приближения яв¬ 308
ляется почти единственной практической рекомендацией (кото¬ рая, разумеется, не гарантирует полностью от возможных неудач в случае неединственного решения). 4.2.2. Метод простой итерации Назначение. Метод предназначен для решения систем не¬ линейных алгебраических и трансцендентных уравнений f(x)=0, которые могут быть приведены к виду х=ф(х). Обычно это воз¬ можно в том случае, когда правая часть f(x) системы уравнений задана аналитически и позволяет выделить из каждого уравне¬ ния одну из переменных и перенести ее в левую часть. Если такое выделение переменных невозможно, применяют специальные методы, некоторые из которых изложены ниже [см. уравнение (4.78)]. Метод отличается простой вычислительной схемой и, если он сходится, то скорость сходимости не ниже ли¬ нейной. Исходные данные. Пусть дана система п нелинейных уравнений с п неизвестными, которая имеет вид: — в скалярной форме fi{x1, х2, х3,..., хп)=0 (/= 1, 2, 3,..., п)\ (4.76) — в векторной форме f (х) —0, (4.76') где Х1 Л(х) х2 Л(х) х = ; f(x)= хп Л(Х)_ Пусть эта система приведена к эквивалентной (см. 4. 2. 1) си¬ стеме: — в скалярной форме Xi = (м> "^2> • • • j ^п) :== 1, 2, ..., д), (4. 77) .— в векторной форме Х = ср(х). (4.77') Необходимо найти вещественный вектор х *, являющийся одним из решений системы уравнений (4-76). Идея метода состоит в том, что каким-либо образом оп¬ ределяется вектор начального приближения х<°\ «достаточно» близкий к искомому решению. Затем с помощью формулы (4.77') 309
находят последовательные значения х<г), подставляя в правую часть формулы (4.77') найденные ранее значения хй-1). При вы¬ полнении определенных условий, накладываемых на свойства функции <р(х), этот процесс сходится и приводит к решению х* исходной системы (4. 76). Вычислительная схема. Процесс простых итераций целесообразно проводить следующим образом. 1. Выбирается некоторое начальное приближение х<°). 2. Вектор х<°) подставляется в правую часть уравнения (4. 77'). Получается новое приближение — вектор хП): х(1) = ф(х(0)). 3. Вектор хб> подставляется в правую часть уравнения (4.77'). Получается следующее (второе) приближение — вектор х(2>: х<2) = ф(х(1)). 4. Этот циклический процесс вычисления приближений х(г+1> = ф(х(г>) (г = 0, 1,2,3, ...) продолжается до тех пор, пока последовательные приближения не сойдутся. Критерием сходимости является выполнение условия где е — заданная точность решения, а ||х(г+1)—х0')||р— любая из р-норм вектора x<r+1)—хМ. Полученные выше последовательные приближения образова¬ ны с помощью «итераций по совокупности координат». Если ком¬ поненты фг вектора ф можно вычислять независимо друг от друга, то метод простой итерации допускает итерации по отдельным координатам (схема Зейделя). В этом случае: 1. Выбирается некоторое начальное приближение х(0) = = (4°\ 4°\ ... , х(п0)). 2. Вычисляется сначала первое приближение xi(I) для первой координаты х\\ 41)=cPi(40)’ 4°), . .. , 404 затем вычисляется первое приближение для второй координаты х2: 41) = с?2 (44 40)> 40)> • • • > 40)). для третьей х3: 41)=<p«WI).41)»4440)> •••-40)) 310
и т. д. вплоть до хп: 41)=ч,*И1)* 4!)> 44 • • ■ > 44 > 40))- 3. Процесс циклически повторяют, вычисляя хО по схеме 4Г+1,=<р/- (4г+1), 4г+1),..., 4~+i1)’ 44 4+х> • > 4°) (/=1, 2, 3, , п; г=0, 1, 2, ...) пока не будут выполнены условия сходимости. Замечания. 1. Сходимость и скорость сходимости метода простой итерации по совокупности координат зависит от способа преобразования исходной системы f(x)=0 к эквивалентной си¬ стеме х = ф(х). В частности, существенное влияние оказывают как способ выделения координаты х,- из уравнения /,(х)= 0, так и то, какая компонента (индекс /) выделена из уравнения Д(х)= 0. По этому поводу не существует каких-либо общих рекомендаций, и такое преобразование осуществляется на практике методом проб. В случае итераций по отдельным координатам на вычисли¬ тельную эффективность влияет еще, кроме перечисленных факто¬ ров, и порядок последовательности, в которой вычисляются от¬ дельные компоненты вектора х (т. е. нумерация переменных Хг). 2. Метод простой итерации может быть обобщен за счет бо¬ лее сложного формирования эквивалентной системы (т. е. функ¬ ции ф/(х). Это позволяет иногда получить более высокую, чем ли¬ нейная, скорость сходимости. Некоторые формулы для построения функций ф/(х), соответствующие различным обобщениям метода простой итерации, приведены в табл. 4.13. Более подробное из¬ ложение методов, основанных на использовании ф/(х) из табл. 4. 13, содержится в разд. 4. 2. 3 и 4. 2. 4. Отметим, что большинство итерационных методов может быть описано с помощью функции Ф/(х) = х + а5(х)1(х) = х + ар(х), (4.78) где S(x) — невырожденная матрица; р(х)—вектор. Табл. 4. 13 дает конкретизацию матрицы S(x) или вектора Р(х)- В таблице использованы обозначения: х<°> — начальное при¬ ближение, г — номер итерации, дf _ <Э(/ъ/2,.. •, fn) дх d(xi,x2,.. • » xn) -dfi d_fj_ dfi - dxj dx2 dxn dfn dfn dfn _dxi dx2 dxn _
матрица Якоби вектор-функции f(x) векторного аргумента х; а, ц — действительные числа. Таблица 4.13 Некоторые формулы общих итерационных методов х^г+1^=ср/ (х^) для решения систем нелинейных уравнений вида f (х) = О № по пор. Итерационная формула Название метода Примечание 1 Ф/ = Х— [Г (х)]-1 f (X) Стандартный ме¬ тод Ньютона Если метод схо¬ дится к простому решению, то ско¬ рость сходимости не ниже квадратич¬ ной 2 ср/ = х— [f' (Zr)]-lf (X), где zr — заданная последователь¬ ность точек Упрощенный ме¬ тод Ньютона (при гт ее х^ для всех г соответствует модифицирован¬ ному методу Нью¬ тона) Если метод схо¬ дится, то скорость сходимости не ни¬ же линейной 3 ¥/.= х — ar [f' (х)]—1 f (х) ar = arg min || f (x^r) —аХ а>0 X [Г (x^)]-if(x(r>)||2 Расширенный стандартный метод Ньютона (аг -* 1 при г -»оо) Обладает расши¬ ренной (по сравне¬ нию со стандарт¬ ным методом Нью¬ тона) областью сходимости. Ско¬ рость сходимости не ниже линейной 4 9/ = х —[Г (x)] + f (х). где [А]+—обобщенная обратная матрица для исходной матрицы А Обобщенный ме¬ тод Ньютона (мо¬ жет применяться в случаях, когда чис¬ ло уравнений m не равно числу неиз¬ вестных п) Метод сходится в общем случае к решению системы [Г (х)]т f (х) = 0. Если ш = п и V (х*) — невырож¬ дена, то метод сов¬ падает со стан¬ дартным методом Ньютона 5 ?/ = х —p.r [f (x)]Tf О) Уг — arg min 1) f (x(r) — p. X |i>0 X [f' (x)]Tf(x)l|2 Метод скорей¬ шего спуска Скорость схо¬ димости линейная 312
Продолжение а, о с о Итерационная формула Название метода Примечание я ?/г=хг— /,-(х)- 1 или — f l (x) dfi(x) dxt ar dfi(x) dx[ ar = arg min a>0 a -''Л /л 7 ЛЛ (0 = 0) Скорость сходи¬ мости не ниже ли¬ нейной. Достоин¬ ство метода в том, что нет необходи¬ мости решать сис¬ тему линейных уравнений Сходимость и точность метода. Общие теоремы о сходимости итерационных процессов указывают достаточные условия, при которых существует решение х* системы (4.76), а также условия, при которых гарантируется сходимость ите¬ раций. Эти теоремы устанавливают, что скорость сходимости метода простых итераций не ниже линейной. Оценка скорости сходимости метода простой итерации имеет вид ||х(г+1)-х1<?Цх(г)-х*||, (4.79) где 0<<7< 1. Теоремы о сходимости утверждают, что если функции <р(х) дифференцируемы в некоторой выпуклой окрестности G реше¬ ния х* и их первые производные непрерывны в точке х*, то до¬ статочное условие сходимости метода итерации, начинающегося из близкой окрестности решения, состоит в выполнении неравен¬ ства Я(/)<1, (4.80) где X(J) —максимальное по модулю собственное значение мат¬ рицы Якоби 1 вектор-функции <р в точке х* (т. е. 7 (У) = max | X, | (v= 1,2, , п). Таким образом, точка х* есть точка притяжения, т. е. найдет¬ ся такая окрестность точки х*, что если начальное приближение находится в этой окрестности, то метод итерации сходится к х*. 313
Вместо условия А(/)<1 часто можно пользоваться одним из более слабых достаточных условий сходимости: 1) или дуг (х) dxi < 1 (г = 1, 2, ... , п) для всех х из некоторой окрестности точки х% П <^ 1 (/'=1, 2для всех х из некоторой окрестности точки х*. 2) (х) dxi Однако для каждого конкретного вида эквивалентной систе¬ мы оценки скорости сходимости могут быть лучше. Так, для ме¬ тода Ньютона скорость сходимости будет не ниже квадра¬ тичной. Пример 7. Расчет методом простой итерации значений потребной тяги Р и угла атаки а для равновесного сбалансированного режима полета самоле¬ та. Такой полет в плоскости большого круга (см. пример 8 из разд. 4.2.3) описывается системой нелинейных уравнений: /: (Р ,а) а Р cos (а + <рр) — Baq0Sa2 — cx0q0S — m0g (h0) sin 0O = 0, Г 1 /г(Р>а)Д P sin (a +tfp) + c«q0Sa — m0 g (h0) — ———- cos0o = O, — * L Дз т й0 . где величины cpp, Bar qo, cxo, m0, ho, 0 o, , 5, R3 —заданы; P, a — неизвест¬ ные, подлежащие определению; #0 — ду 6 (Aq) Wq! Q(ho) соответствует стан¬ дартной атмосфере CA-64; g(h0) =g0(R3 )/(R3+h0)2. Запишем эту систему в виде, удобном для применения метода простой итерации. Для этого выде¬ лим из первого уравнения переменную Р, а из второго — переменную а: Р = [схо%S + rn0g (До) sin 0О + BaqoSa2]/cos (а + ур) Д <рг (а); m0\g(h0) — Рз "г cos 0о — Р sin (а+ 9р) c^qS Д Уг(Р.а)- Пусть равновесный режим полета характеризуется параметрами До = 12 /сж; Оо = 500 м/сек-, 0 0= 12°; = 9,80665 м/сек2-, R3 =6371 210 м и пусть приняты следующие значения характеристик самолета: Фз> — 3°; 60 = ^0^0=15 500 кГ; 5 = 50 ж2; сх0= 0,01038; с“ =2,151 рад~1-, В а =2,044 рш5-2. Для приведенных условий полета величины углов атаки а на равновес¬ ном режиме должны быть невелики. Поэтому можно принять в качестве начального приближения для угла атаки величину а<°> = 0. Ввиду того что переменная Р в функцию tpi не входит, удобно использовать метод простой итерации по отдельным координатам: W1) =?2(Я(1), а<о>), |а(2) =Т2(Р(2)_ a(D) и т. д. 314
При принятых числовых параметрах функции cpi(a) и ф2(-Р, а) прини¬ мают вид ?1 («) = 5273,9+ 123,7а2 cos (а + 3°) ?2 (Я. а) = 15043,8 — Р sin (а + 3°) 7460,4 Расчет на настольной клавишной машине дает следующие результаты (с точностью до четырех десятичных значащих цифр): а(°) = о°; Р(1) = 5287 кГ; Р(2) = 5774 кГ; а(1)= 1,967°; а(2) = 1,949°. Р<3>= 5766 кГ; р(41 = 5766 кГ; а(3> = 1,949°; а(4) = 1,950°; 4. 2. 3. Метод Ньютона * Назначение. Метод предназначен для решения систем нелинейных алгебраических и трансцендентных уравнений f(x)=0 с дифференцируемыми функциями f(x). В частности, метод применяется для решения систем нелинейных уравнений, возникающих при решении краевых задач. Если итерационный процесс сходится, то его скорость сходимости в окрестности простого (некратного) решения не ниже квадратичной. Исходные данные. Пусть дана система п уравнений с п неизвестными: ч— в скалярной форме /; (м> -*2, -*3> • • • . хл)=0 (if= 1, 2, 3, ..., п)\ (4. 81) — в векторной форме f (х) = 0, (4.81') где М Л(х) х2 Л(х) X = . . *(х) = _Л(х)_ Необходимо найти вектор х*, являющийся решением си¬ стемы (4. 81). Идея метода состоит в том, что каким-либо образом опре¬ деляется приближение х<г>. Тогда следующее (г+1) приближе¬ ние находится решением системы линейных уравнений. Эти * Другие названия: метод Ньютона—Рафсона, метод линеаризации. 315
Таблица 4.14 Итерационные формулы различных вариантов метода Ньютона | № по nop.j Название метода Итерационная фомула для (r-j-l)-ro приближения Примечание 1 Стандартный ме¬ тод Ньютона х(М-1) _ х(г) — — [Г (х(г))]—1 f (х(г)) Вычисления до¬ вольно удобны, но требуют на каждом приближении вы¬ числения обратной матрицы [Г (х<г>)]-1 и умножения ее на вектор f (х^) 2 Расширенный стандартный метод Ньютона х(г+1)=х(0_ —ar [f' (x(r))]_1 f (х(г)) ar — arg min ЦТ (x(r)— а X 1>а>0 X [Г (х(г))]-Н(х(гб)||2 3 Упрощенный (модифицирован¬ ный) метод Нью¬ тона х(г+1)=х(г) — — [Г (Х<0))]—1 f (х(г>) 1. Матрица f' (х*°^) вычисля¬ ется только один раз в начальной точке 2. Формула дает меньшую скорость сходимости, чем формула стандарт¬ ного метода Нью¬ тона 3. Требует для своего вычисления значительно мень¬ ше времени, чем формула стандарт¬ ного метода Нью¬ тона 4 Обобщенный расширенный ме¬ тод Ньютона х(г+1)=х(г)— аг [f' (x(r))]fX Xf(x(r)) ar = arg min (\ f (x^ —а X 1>а>0 X tf' (x(r))]~H(x(r)))ll2 Примечания. 1. Смысл символа arg min пояснен в основных обо¬ значениях. 2. Здесь а — действительное число. 3. [f7]+ — обобщенная обратная матрица для матрицы f'. 316
уравнения получаются путем линеаризации Тейлора в окрестно¬ сти искомого решения левых частей уравнений (4.81). Вычислительная схема. Формулы,-по которым стро¬ ятся в различных вариантах приближения метода Ньютона, приведены в табл. 4. 14. В вычислительном отношении предпочтительнее решать си¬ стему линейных уравнений, для которой имеются хорошо разра¬ ботанные методы и стандартные подпрограммы для ЦВМ. Си¬ стема уравнений для основного варианта метода Ньютона имеет вид: — в скалярной форме ЛИГ)> 4Г)> • • • ’ 4Г)) +2 dfi(xir)’ 1-1 (/ = 1 > 2, 3, . .., д, ■(О х(г)\ '2Х) л V;+1)-*}r))°° г=0, 1,2, 3, ...); (4.82) — в векторной форме f (х<'>)+f (х<г>)(х(г+х> - х(г>) = О (4. 82') (г=0, 1,2, 3, ...), где dfi dfi' dfi d(fi ./2... • . /я) дх\ ’ dx2 дхп д (xi, х2,.. • * хп) dfn dfn dfn dxi ’ дх2 dx n Удобно решать систему (4. 82') относительно неизвестных величин (x<r+1)—х<г>) =Ах(г). После определения Дх<г> новое при¬ ближение определяется по формуле х(г+1) = х1г) + Дх<г>. (4.83) Определение коэффициентов аг в обобщен¬ ных вариантах метода Ньютона. В обобщенных ва¬ риантах метода Ньютона величина коэффициентов а,- опреде¬ ляется как результат минимизации функции Ф(а) переменно¬ го а: Ф(а)=||f (х(г) — а [f' (x(r))]_1 f (x(r))||2 (4. 84) (где величины xW, Г(хО), f(xO) —фиксированы), т. е. ar = argmin® (а). (4.85) 1 >а>0 317
Практическое вычисление минимума функции (4. 85) может производиться по схеме, основанной на проведении квадратич¬ ной параболы через три точки: Ф (0), Ф j, Ф(1) и на после¬ дующем определении точки ап минимума этой параболы (при Ф(0)-2Ф (-f) + ®(l)>0: где 1, если ап, если «п>1; ЗФ (0) — 4Ф (у|+ф(1) Ф (0) — 2Ф (—) Ф (1) (4. 85') Сходимость и точность метода. Общие теоремы гарантируют квадратичную скорость сходимости. Эти теоремы устанавливают достаточные условия существования решения и указывают оценки ошибки полученного решения. Оценка скоро¬ сти сходимости имеет вид Дг+1) С х (г) (4. 86) где С — постоянная. Достоинства и недостатки метода. 1. Обладает сравнительно простой вычислительной схемой, так как сущест¬ вуют весьма экономные методы решения систем линейных урав¬ нений. 2. Обладает в окрестности решения квадратичной сходи¬ мостью. 3. Допускает ряд модификаций. 4. Все последующие вычисления в методе строятся незави¬ симо от предыдущих. 5. Устойчив к выбору начального приближения в некоторой окрестности решения. 6. Наибольшие затраты машинного времени приходятся на вычисление левых частей уравнения f(x)=0 и их производных. Поэтому для краевых задач высокого порядка метод может привести к большим затратам машинного времени для получе¬ ния каждого нового приближения. Пример 8. Методом Ньютона определить численные значения параметров равновесного режима сбалансированного полета самолета. Уравнения движе¬ ния центра масс самолета, совершающего полет без крена и скольжения в пло¬ скости большого круга в атмосфере сферической невращающейся Земли, запи¬ сываются в прямоугольной вертикально-скоростной системе координат Oxcyczc в виде 318
//«•v л \~\jо -|- Тр/ \,с/ • '•'i v-"/ ''»S V.'^/ /иг/б = Я sin (а + <р ) -f Y (v, ft, а) — т v cos 0 ft = и s in 0! L = ——;—7- Я3 *(*)• ifi Рз + ft cos 0; (I) Я3 + ft (обозначения величин см. в примере 3 ра'зд. 4. 1. 1). Поскольку рассматри¬ вается сбалансированный полет, уравнения движения относительно центра масс можно не учитывать. Условие равновесности режима полета означают, что при каждом фиксированном значении высоты полета ft=fto выполняются тождественно соотношения vs=0\ 0 = 0. При этом масса самолета считается постоянной. Так как высота ft для равновесных режимов считается фиксированной, а правые части уравнений (I) от дальности L не зависят, то в определении параметров равновесных режимов уравнения для ft и L не участвуют. Таким образом, параметры равновесного режима полета определяются следующей системой двух нелинейных трансцендентных уравнений, связываю¬ щих шесть независимых переменных: Р, а, и, ft, 0, т: fi(P, a, v, 9, ft, т) = Р cos (а + <р ) — — Q(v, ft, а) — mg (h) sin 8 = 0; /2 (Я, a, v, 0, ft, т) — Я sin (а +<рр) + + Y (и, ft, а) - gW- V2 Я3+ ft. cos 0 = 0 (И) (величины фр, Яз считаем заданными). Если дополнительно заданы любые четыре из шести независимых пере¬ менных, то остальные две могут быть найдены путем численного решения этой системы уравнений. Пусть, например, заданы v0, 0О, Л о, Щ- Необходимо определить потребную тягу Р и угол атаки а равновесного режима полета. Тогда система двух уравнений (II) с двумя неизвестными Р и а запишется в виде: fi(P. а) = Я cos (а + <рр) — Ва (М) Sq0 а2 — — Cxo4qS — m0g (ft0) sin 0O = 0; /2 (Я, а) g Я sin (а + <рр) + с“q0Sa — vl —Щ g (А0) — р' 1 У4 ,2 0 Яз + ft cos 0О = 0 (III) (в этой системе учтено, что Q = cx0q0S + Baq0Sa.2; Y = с® q0Sa). При решении системы (III) с помощью стандартного или упрощенного вариантов метода Ньютона необходимо задаться начальным приближением Я<°>, а<°), после чего первое приближение Я<*>, оЯ> находится из решения линеа¬ ризированной системы (4.82): <9/1 (Я<°>, а(0)) дР а/2(Я<°>, а(0)) дР (р(В-р(°>)+ d/l (Р(0)‘ а(°)\а(1) - а<°>) =-fx{pW, а(0)); (р(1)_р(0))+ ^/2 (р<0) ■ а<0)) (а(1)_а(0)) /2 (Р(0) t a(0))f да 319
где d/i(P(0), а(0)) cos (а + ®р); d/2(P(0>, а(0>) = sin(a(0) + ?p); р)' дР =— р(0) sin (a(0)+(?J _ ?0Sa<0); дР d/i(P(0), а(0)) da ^/2(С’ а(0)) ="/,(0) cos (а(0)+Ур) + , /1 (Р(0), а(0)) = Р(0) cos (а(0)+<рp) — Baq0S (а(0))2 — — — m0g (А0) sin 80 ф 0; /2(Р(0), а(0))=Р(0) sin (a(0)+<pp)+c“#0Sa<0) — f20 — щ g (Ао)- ТЛ' 1 cos 0q =р 0 'l Яз + Л0 (эти величины в общем случае не равны нулю в силу произвольности началь¬ ного приближения Р<0), а(0)). Последующие итерации (г—2, 3, . ..) строятся с помощью аналогичной системы следующим образом: — для стандартного метода Ньютона {р(г + i,_p(r)) + a(°)(a(/-+i)_a(0) = dP da =_/1(p(r), «(Н); ?fl(P{T), a{r)\p(r+l)_p{r)\+ df2(P( )’ а<'Г''\(а(,г +1) _a(r))= dP v ; da v —— /2[p^r)* a(r)); — для упрощенного метода Ньютона d/i (Р(0)I а(0))(р(/-+1)_р(г))+ ^/i(P(/')._a(°^)^a(r+i)_a(r)) = dP (IV) da ■fi{P{r\ a<r>); } (V) <?/2(я(0). а^)(л(г+» ^СПЛ, a(r+l)_a(r)) дР да =-/2(р(г). <*(г)); — для расширенного метода Ньютона (метода Ньютона в варианте ско¬ рейшего спуска) а/.(Р« а/.(еи. „,г)) = дР да =-bfi(P(r)' a(r))5 ^(Р(,)'«(1й+1) п(г)),Д/2(Р(Г).°(Г)) (а(г+1)_а(П) = dP да -Хг/2(Р(г\ а(,)), ■ (VI) 320
где Xr — либо заданное число (Аг<1), либо находится из условия Ar = arg rain {/? +А — Р(г)), а<г) + х>0 1 +А (а(г+1) —а(г))] + f\[Р(Г)+Х (я<г+1>— р(г>), а(г)+Л(а(,'+1)—а(г))]} = arg min Г(X) + /|(Х)1. L J (VII) Поиск минимума функции [/i (А) + f\ (А)] от параметра спуска А осу¬ ществляется с помощью схемы (4. 85'). Считая разности рН+П—рV) и а(г+1) а(г) неизвестными приращениями ДР(Г> и Да<г>, решают относи¬ тельно них системы (IV)—-(VI). После определения приращений ДРМ и Да<г> новое приближение Р<г+‘>, а<г+1> находится по формулам (4.83): p(r+l)_ p(r)_i_ др(П; а^г+1^ = а^ + Да^. В табл. 4.15а и 4. 156 приведены результаты расчета параметров Р, а равновесного режима полета самолета с помощью стандартного и упрощен¬ ного методов Ньютона. При вычислениях были использованы следующие зна¬ чения числовых параметров G0 = m0g0 = 15 500 кГ\ S = 50 м2\ <?р= 3°; Р3 =6 371 210 м\ go = 9,80665 м/сек2; v = vq = 500 м’сек, 0 = 0О = 12°; h = h0 = 12 000 щ; q (/г0) = 0,0318 кГ-сек2/лД. Аэродинамические силы Q и Y вычислялись по формулам: Q = cxQqQS + r)c“p'0-S«2; V = cayq0Sa, где коэффициенты сх0; rjc“ = Ва,_с“ определяются формулами, приведен¬ ными в примере 3 разд. 4. 1. 1, и для выбранных условий полета (М0= 1,695) равны: Сгсо=0,0104; Ъа = Т]е“ = 2,044 1/gad; с® = 2,151 1 /рад. Величины q0 и g(h0) определяются соотношениями 1 о ( Рз и для принятых условий полета равны: до = 3975 кГ/м2; g(h0)=9J7 м/сек2. Для приведенных численных значений параметров движения и характери¬ стик самолета уравнения (III) принимают вид /i(P, а) = Р cos (а + 3°) — 123,5а2 —5274 = 0; | /2(Р, а) = Р sin (а + 3°) + 7450а— 15 089 = 0. J ( ^ Было проведено два расчета при двух различных начальных приближе¬ ниях для Р и а. Первый вариант (Р(0>, а<°>) = (0, 0) был взят довольно про¬ извольно, а второй ((Р(0\ а(0)) = (5799,1 кГ, 2,0165°)) был найден с помощью приближенных методов динамики полета. Известно, что для приведенных условий полета самолета рассматриваемого типа углы атаки а довольно малы и без особой погрешности можно положить sin(a+cpP) «а+фр, а тяга Р и сопротивление Q — величины одного порядка малости. Пренебрегая произве¬ дением Psin(a+9p), которое примерно на порядок меньше других членов, 11 3398 321
из второго уравнения системы (III) можно найти приближенное значение для угла атаки аравн на режиме равновесного полета: ,(0). /п0 paBH~4<7oSL (Ао)- = 2,01648373° Рз +h о а из первого уравнения — приближенное значение для тяги: р(0) ^ р — ~ гравн — [схо + Tie® (cx(0))2J q0S + m0g (h0) sin 60 cos (а(0) + <fp) = 5799,12677 кГ. Табл. 4. 15а, 4. 156 демонстрируют влияние достаточно близкого началь¬ ного приближения на точность результата и объем вычислительной работы. В частности, они показывают, что для получения решения с точностью до че¬ тырех верных десятичных знаков для первого варианта начальных' приближе¬ ний требуется в упрощенном методе Ньютона 7—8 вычислений функций f(x), а в стандартном ~ 10. Для второго варианта начальных условий ответ с ука¬ занной точностью получен упрощенным методом Ньютона за 5 вычислений f(x), а стандартным—за 7. Таким образом, в данном примере, несмотря на более низкую скорость сходимости, упрощенный метод Ньютона требует меньших вычислительных затрат, чем стандартный метод Ньютона (при оди¬ наковом порядке точности результата). Отметим, что при решении данного примера частные производные dfi dfi , (г = 1,2) находились численно по разностным формулам дР да dfj (Р, a) fi [Р+ Уа)—ft (Р’а) дР ~ hP dfj(P, а) fi(P, а + К)—fi(P, а) да ~ где шаги дифференцирования hP и ha принимались равными Лр=100 кГ, д»=0,1°. (Эксперименты с другими шагами дифференцирования hP, fta пока¬ зали, что в данной задаче они не оказывают существенного влияния на схо¬ димость, если выбираются в пределах 10 кГ < hp < 100 кГ, 0,01° < ha < 0,1°). 4. 2. 4. Метод секущих Назначение. Метод предназначен для решения систем нели¬ нейных алгебраических и трансцендентных уравнений f(x)=0 без вычисления частных производных вектор-функции f(x). В частности, метод применяется для решения систем уравнений, возникающих при решении краевых задач путем сведения их к задаче Коши. Вычислительная схема этого метода более эко¬ номна по числу вычислений функции f(x), чем схема метода хорд и метода Ньютона. Исходные данные. Пусть дана система п уравнений с п неиз¬ вестными: 322
lo <3 5Г 3 'o к о X о Q, и <D cdtQ |s oCO о cd g1 g X 5 о 2 H c 2 cd X SK к x й Я ^ x cu e cd H X X s: я cd X X cd о, о Ья X о О X а н н си о) cd S =С cd х Си cd cd н с о н 2 Si о 3 cd о й- 2 о 'К S ы н о О cd си о о СО гг ЭК о си н о 3 о О) с Й а cd к о X г 3 ^ х s о и о О о с ^2 н к X >$£ си CD *6< Is Я cd “ н Й X си е* >-> Я си & Я С X п ^ X Й X Я я Ч 5 с о Я X Я.о X £ Й X 5; .8 0 ч < CUxo г 5. ^ Я Й н cd <т* q Sea UU си^ О *0* ’в* X й О ЭЯ „оГ =н £« § о.4 я- Д С1' ■ — ■ "Ч _ о g си - 3 2 и О К « ° Я S ь Я X • н X fX. г ^ w 'О «3 16 X X Й е®1 cd 5 ^ си <D Н I э X X ^ cd ез X s«2s Си X ~ Cd d ж CQ X ^ tN О со С 00 to 05 Й1 о 1 о 05 со см N4 05 о О ю to со to см •й Й< 05 Й* со N4 05 D CM to о о со со 05 о о о со Й< Ю со D со 05 D ю to О о см D о T-H to со D ГЧ1 to СО Й< о Ю со со t>- D ю СО 05 со со со 1 со 1 1 1 О 1 о О 05 о 1—1 О О СО со 05 СМ D ю 05 tO N- 05 D N- СО N4 Ю N^ со о О CD О”.) 00 СО СО оо со о* 00 D D СО о ОС 5 N- СО to 05 СО й* СМ СО СМ О О О О 1 о со со со 05 05 О I о - Й4 СМ ю 1"ч -d4 Й< 05 00 см 1> tr^ Й< ю Я> О S см со О О 05 -н й< о со ю CD см 05 05 N■4 Й* ООО со оо со 05 05 05 Й* Й* Й< 05 05 05 ^ CD со О ю о о со со о CD М N ю ю N4 N4 05 05 05 05 CD CD to to ю ю ю О CD CD CD CD CO N NN N tO Ю Ю tQ tQ CM СО Й< tO Й1 t>- О CO I о CD Ю to CO й1 ч-. CD CO CM CM CD Ю 05 N- Ю Ю _ й4 О Ю CD CD CD CO GO CO О о О ООО со со со 05 05 05 " Й< Й< 05 05 Й< 05 С"- см СО D N- СМ ’—1 г-» СО 05 ю ю Й< Ь- N- 05 05 05 05 05 05 D CD D 05 Й< 05 D N4 N^ Ю Ю to to to D D D N N N tO to iO 11» 323
v© *о а vo CJ сг> <и «- ч Si О CQ 5^ О II Оч ХО ей S § §1 с 2 ей „а Е Е й =.о о 0) “ S 2 а 5 л СИ со ас 324 СО Я Оч в О, ч- Й О О к Оч ж н о <U s I ей ® Он Он ев = С >» эЖ Ж В 2 с- 54 *&• о о •в — с Он *ci к ж СЙ Ж Й Я О гл &■ 5 & а Ж Е-* <D К Оч я CD ^ а Я & G Л (D ей О Ж ■* 2 * & в ЕГ ж CD ■Сн Оч Е-1 ей (D :а о со ^ ^ О 0, о оЖ ж ж н ж О V р» Ф о ж ж ч^ 0S Й > ж £< О ^ В 2sr s ж II Оч ■*0, ье Оч, СМ Ч-, *5 о^ ,7 <3 & ъ* о. ж ж о ж Ж ^ ж ей ч К ж 0S . ж s ей 3 2 Оч Ж ~ «=3 - ' Ж у >-» ей ой СО ж с^Ю^ЬСООО’ ю со ю СО С— г-н со 1-Н г—* t—' t— юоюо ■ф со со со -02 СО 02 т-н -см со ф со -О 0)000 - tO Ю 1—1 ' 1 О СО Ю со ,1111 ч о о о о 23 tr- оо со fM Ю со 02 СО SJ ф см t- г- о 53 СО 02 СО Ф «>82$нЬ £2смфсм1г- i^S О О СМ СО « СМ »—< Ф СО О , ' <DCD CD (D t*- CO tT- GO f- t> GO -02 CO CM Ф CO о - to CM о Ф Ф CO I Й о I T—I О I . о GO r CO < GO CO GO GO Г— О r-H Ю 02 -to CO - т-Н О CO CO GO CM to tr- to CO to ф oo О CO CM to • Ф7 о ю® Snfeo coS=2 02 ю 7ч о ' 'ой. I о О I * гнО) со CM tr- t— Ф THONCO СО Ф О >—1 02 to >—*1 7 -СО т-t оо СО -02 Ф b- CM CM to см tr- -00 ю ф см - 1 I г“' О I I ? f I о о I I о г-н 7-1 О О -Н ООО • • 02 02 С"" СО 02 С—■ -чЬСОООЮ- со со со см со ° ^04^0^ см Ф со О Ф со tr- со см оо СО СМ т-н 02 со СО ’—< О ’—1 СМ о О . -О I I оо I CD 1—1 02 ’—1 СО СО СО ^ Ю см соо со со CONCOOO^OO со СО —< 02 о о о СМ оо со оо О 02 т—I 02 02 02 02 02 to ^ ^ ’Ф 02 02 02 02 02 02 02 со со оо со о о о о со со 02 02 02 02 ^ ^ О tr- CD 02 СО '.О Ю со 02 СО ’—1 to СО 00 to со ЬЮ!ОЮЮ tOOOC—t'-C-— СО 02 02 02 02 02 02 02 02 02 СО СО со СО со to оо со ю о СО СО со tr- tr- tr¬ io Ю to to ю to to to Ю со СО со со со tr— tr— tr— tr— to Ю to to to Oi—(СМСОжНЮСОС—-0002 * нф Ю CO t— GO 02 СО о CM СМ -н 02 ^ О оо -оо tr- со ^ нф оо ’ф ^ ю СО оо 1—I О оо оо t- 02 tr- со 02 -ф со Ю СМ СО со о tr- 1-н СО -Ф ООО cd со со till О о оо 02 • О со СМ со 02 ОО СО О со -оо tr- •Ф О 05 tO СО ОО 02 оо оью tO to ’—1 t>- ОО «Г— О t—■ СО 02 Ф со оо со со ю со tr- СМ Ф* О О о о I coSi to • т-Н 02 со • Со см со Ю СО т—I О tr— т—I 02 о о СО t>, СО со со о ' tr— О 7 tr- см ■ф о 1 г-г«0 СО СО Ю С— со со СО г-н: о ОО СМ О фн со оо СО 02 02 1—I "ф ф О 02 02 СО СО со 00 оо оо ООО ООО оо оо со 02 02 02 ф ф ф 02 02 02 СМ г t- CM СО to to tr— СО 1—1 t—1 СО t—• СО tr— 02 02 02 02 CM '1 02 02 02 02 Г-н со СО СО со со 02 Ф to to to ю 02 со со со со со tr— с—1~— tr— tr— t—’ ю to to ю ю ю
— в скалярной форме fl{X 1’ "^2> • • • > -^п — в векторной форме 1 = 0 (/ = f(x)=0, 1,2, . п) (4. 87) (4. 87') где х = Х1 Х2 , *(х)= “Л(ХГ Л(х) .Хп _ _Л(Х)_ Необходимо найти вектор х*, являющийся решением системы (4. 87'). Идея метода состоит в том, что по известным (я+1)-м начальным приближениям x(?)= (х[р\, х[р\ .. . х^)т(р = ___й - - п ' 1, ..., — 1. 0) вычисляются значения левых частей (4.87) >С|(хЧ=(Л (х(р)), /2(хы), ■ , /пЫР)))\ ^ каж¬ дому значению 1</7) приписывается определенный „вес“ р-оц, V р(р)= 1*. Величины Р(Р) определяются так, чтобы центр тяжести системы точек t(p)(р= — п, ..., —1,0) в пространстве рп\ f = (/1? /2, .. ., fn)^Fn и находился в начале координат этого поостранства. С помощью найденных величин {р= 5 —1,0) вычисляется положение центра масс системы точек х(р)’ [р= —п., , 0) и принимается за новое приближение. Вычислительная схема. Пусть на r-й итерации из¬ вестно (п+1) начальных (опорных) точек (начальных прибли¬ жений) : х(р+г) = (х[р+г\ х\р+т\ ...,х[Р+г^){р=-п, — я+ 1 — 1. 0). (4. 88) Тогда следующее приближение хй+й к решению системы (4. 87') получается по формуле для среднего взвешенного точек х(р+г) с весами Щр+г)’- х<г+1)= ^ ^+г>х(Р+Г)” (4.89) р~-п Веса р(р+Г) определяются из системы (п+1) линейных отно¬ сительно р,(Р+г) уравнений: У. ^Р+г)Л(х^+г))=о, (*=1, 2 РТп (4.90) 2 р=—п * Переменные (хР иногда называются барицентрическими координатами точек f(x<P>) 6 Fn- 325
или в развернутом виде: p.(_„+r)/1(x<-"+r)) + !i(_n+i+r) /1(х<-'!+1+г>) + +(*(—1+г) А(х(~ь r>)-j-[x(r) /1(х(г>)=0; [Х(_п+л)/2(Х(-л+'-)) + [Х(_„+1+г)/2(х(-л+1+г))4- + • • • +R-i+r)/2(x(-1+r)) f Rr) /а(х<'>) = 0; (4.91) !J'(-n+r)/«(x(-"+r)) + R-«+i+r)/„(x(-,,+1+'')) + ”Ь • • + ц(_1+»-)/л(х(_1+г)) + 1»(г> /„(х(г))=0; !*(—л+г) +fx(-«+l + r) “Г • • • “bp(-l + r) H4fV) — 1. (4.92) В векторной форме эта система имеет вид д(гУг)=(о,о,i)T. Здесь обозначено: Лг> — матрица системы (4. 90) или (4.91): /r(r) = (For), F(r). Flr)) = '/i(x(-"+r)). Л(х(-«+г+1)),..., Л(х<'>) Л(х(-«+')), /я(х(-»+^1), .... /Я(Х<'>) L 1 1 1 (4.93) F ]п /1(х(-л+-'+о) /2(х(-«+^+г)) /л(х(_л + ; + г)) 1 —((*(—Л+Г)> р.( — П + 1 + Г) 1 • ■ • (/=0, 1, ... , п); ^(-1+о> 9(о)т- (4. 94) (4. 95) Дальнейшее решение рассмотрим в векторной форме. Ре¬ шение уравнения (4.92) имеет вид |4(О==[^]-1(0,0< - - -, о, 1)\ (4.96) т. е. р/Р есть правый столбец обратной матрицы [ЯР]-1. С по¬ мощью вектора р<г) по формуле (4. 89) находится х(г+Д После получения (г+1)-го приближения x(r+1) из ряда (я+1) началь¬ ных точек (4. 88) исключается одна из точек х(р+0—п^р<0 и вместо нее вставляется вновь полученная точка х<г+Д Если ис¬ ключена точка с произвольным индексом (—п+т+г), 0<т<п, то новая матрица Яг+9 системы (4.90) или (4.91) будет иметь вид Д(г+1) =(Fo°, Fi°, ?(г) p(F + l) p(r) m—1? B m ? i m +11 326
7i (х(-л+г)), ... , /, (х^-я-1+r)), /1(x(r+1)),/1(X(m-n+1+r)), ... , /, (x<'>) /я(х(“я + г)), ..., /я(х<я-1,-1+r)), /„(x(r+1>), /, (x(m-"+,+r)), /„(x<r>) 1 1 , 1 , 1 1 (4. т. e. вместо столбца Fm)=(/i, (х(-Л+т+Г)), /2 (х(-Л+т+Г)), ...,/л(х(-Я+т+Г)), 1)T ставится столбец Fm+1) = (/i(x(r+1)), /,(х<,+,) К-. Л(х(,+1)). 1)т. Обращая матрицу F(-r+1\ находим новый вектор цд,(г+1) = =[ЯГ+1)]-1 (0, ..., О, 1) т, а с его помощью по формуле (4.89)—- новое приближение х(г+9 и т. д. Процесс итераций продолжается до тех пор, пока не будет достигнута желаемая точность реше¬ ния системы (4. 87'). Например, пока норма невязок ||f (х<г+1>) || не станет меньше заданной величины s>0. Для выбора исключаемой точки можно рекомендовать сле¬ дующие процедуры: а) исключение точки с наименьшим индексом (наиболее «старой» точки). В этом случае в матрице Яг+1> новый вектор f(x(r+')) всегда располагается справа, а самый «старый» f(x(r-n+i))—слева. Сходимость метода при такой процедуре может быть немонотонной; б) исключение точки с максимальной величиной квадрата нормы невязки. Этот метод часто используют в сочетании с мо¬ дификацией, увеличивающей область сходимости метода се¬ кущих. Вычислительная схема модифицированного метода секущих с исключением точки, соответствующей максимальному значению квадрата нормы невязок, сводится к следующему. На каждой итерации вычисляют квадраты нормы невязок П ||f(XOH-'>)||* = 2 /2(х(^+г>) для всех точек х<-р+г\ (г — п < t=i и находят среди них точку х(т+г), в которой эта величина мак¬ симальна: |||(x(m+r))||2= max |)f (х(*'+г>) U2 = Ц fг Umax- —n+r<p+r<r Затем определяют точку х(г+г), в которой квадрат нормы не¬ вязок минимален ||f(xa+r))lla = min ||f(x(^>)|| = |№n. —n+r<p+r<r 327
Для предотвращения расходимости процесса при вычислении из далеких начальных приближений следует постепенно, а не за один шаг, уменьшать невязку. С этой целью находят такую систему значений переменных Ц(Р+г), для которой «центр тяжести» системы (п+1) точек №+г> лежит не в начале координат про¬ странства Fn, f(p+rleF», а в некоторой точке на луче, проведен¬ ном из начала координат в ближайшую точку f(*+0 = f (х(г+г>). Задавшись значением а<°) коэффициента уменьшения невязки 1), определяют Ц(р+Г) из системы уравнений: 2 !W)/^x(p+r)) = (l-<>)/,■ (х(г+г)) (*=1,2, р—п (4.98) О 2 tA(p+'-)=1- Р~—п Новое приближение хб+О определяется по-прежнему из (4. 89). Если ||f (x<r+i)) ||2>||fr||2max, то полагают а*15 — а<°)/2 и сно¬ ва решают систему (4. 98) с прежним набором опорных точек до тех пор, пока не выполнится условие |'Д(х<'+1>)Ц2 <||fr||„ax. (4.99) После выполнения условия (4.99) x<r+m) и f(x<r+m)) заменя¬ ются новыми значениями х<г+9 и f(x(r+9) и итерации продолжа¬ ются до тех пор, пока не будет достигнута нужная точность. Условие (4. 99) гарантирует монотонность процесса сходимости по невязке. Значение а<°) можно увеличивать по мере прибли¬ жения к решению: <х<°) —> 1 при х(г+1>-»х* или || f (х(г+1) )|| —>0. При аг=1 система (4.98) переходит в систему (4.90). Примечания, 1. Матрица Яг+|> отличается от матрицы только одним столбцом. Это обстоятельство может быть использовано для сокращения вычислительной работы по обращению матрицы Лг+1>. Так, если Лг+1> полу¬ чена из Яг> заменой т-то столбца на новый вектор f(x(r+1>), то элементы — 1 обратной матрицы [уУМ)]—:1 могут быть вычислены через извест¬ ные элементы матрицы [ДО]-1 по формулам [/?(г + 1)]-1=[/ДО]-1. д(/)- \<0 , j = 1 • 2, ..., п + 1), где \\г\ дУ) — элементы вектора-столбца Л)Д д<'> = ~Д<Г> д(0 А2 [^)]-Ч (х<г+1)): 0 при i m\ 1 при i = m. 328 д(0 _ал+1 _
2. В процессе итераций векторы f(x^+r^), р = — п,—п+ 1 О, мо¬ гут иногда становиться линейно зависимыми. Тогда метод секущих вырож¬ дается, так как для таких векторов матрица [,F<r>]-i не существует. В этом случае следует выбрать новую систему опорных точек х^, р = — п,—п+ + '1. .... 0. Сходимость и точность метода. При довольно общих, хотя и громоздких условиях, метод секущих сходится. Асимптотическая скорость сходимости, характеризующая, во сколько раз увеличивается количество верных знаков в ответе после каждой итерации, выражается формулой T) = lim /■->00 log || x<r+1> — х*|| log||x(r> — х*|| (4. 100) где х* — решение системы (4. 87); г — номер итерации. Величина v равна доминирующему положительному корню v0(n) характеристического уравнения метода секущих vn+1 = v"-j-l, (4.101) где п — число уравнений системы (4. 87). Для одного уравнения (п— 1) асимптотическая скорость схо¬ димости им.с метода секущих им.с=4,618, что меньше асимптоти¬ ческой скорости сходимости метода Ньютона*) (им.н=2). Для произвольного числа п уравнений асимптотическая скорость сходимости метода секущих всегда меньше асимптотической ско¬ рости'сходимости метода Ньютона: •Эм.с(«)Ом.н = 2, а при п—>оо значение ом.с—И. Для погрешности метода справедлива оценка |Х(г+1) -х*||<С||х<г> —х*||-||х<г-п> — х*||, (4. 102) где г — номер итерации; С — константа сходимости. Эта оценка показывает, что ошибка на (г+1)-й итерации не превосходит величины, пропорциональной произведению ошибок на г-й и (г—п)-й итерациях. Вычислительная эффективность метода ха¬ рактеризуется не только скоростью сходимости (т. е. тем, во сколько раз увеличивается число верных знаков в получаемом решении за одну итерацию), но и объемом вычислений, затра¬ чиваемым на получение определенного числа верных знаков. Этот объем в конечном счете характеризует необходимое ма¬ шинное время. *> Данные этого раздела относятся к основным (немодифицированным) вариантам методов Ньютона и секущих. 329
Вводится показатель эффективности метода Еш— число, по¬ казывающее, во сколько раз уменьшается ошибка (увеличива¬ ется число верных знаков) в решении хО+б за счет однократного вычисления вектора f(x) при достаточно большом номере ите¬ рации: Е.= У = lim Г-*- ОО log Цх(г+1) х*Ц log Цх<г) — х*|| (4. 103) где 9М — число вычислений вектора f(x) за одну итерацию; vM — асимптотическая скорость сходимости метода. Для метода секущих 0м.с = 1, Для метода Ньютона* 0М.Н = = (п+1). Установлено, что при всех п (см. табл. 4.16) имеет место неравенство ^,с(«)=4с>4, = 21,л+1, (4. 104) где индексы «м.с» и «м.н» соответствуют названиям методов се¬ кущих и Ньютона. Таким образом, метод секущих по вычисли¬ тельной эффективности превосходит метод Ньютона. Отношение суммарного числа 0sMH вычислений функции f(x) в методе Ньютона к суммарному числу 0лМс таких же вычислений в методе секущих для заданного уменьшения ошиб¬ ки 8м.н=8м.с равно [см. (4.75)]: ва М.н =e„.Hlogt>M.c(n) (П+ 1) log «м.с (Л) Ям. с ®М.'С ^М.Н log 2 (4. 105) Величина R (я) показывает, в определенном смысле, во сколь¬ ко раз метод секущих эффективнее метода Ньютона (см. табл. 4. 16). Таблица 4.16 Сравнение вычислительной эффективности метода секущих и метода Ньютона п 1 2 3 4 6 8 10 20 50 Ем.Н. 1,414 1,260 1,190 1,148 1,104 1,080 1,065 1,034 1,014 Вы.е. 1,618 1,466 1,380 1,325 1,255 1,213 1,184 1,114 1,058 Rn 1,388 1,654 1,860 2,028 2,297 2,509 2,684 3,283 4,179 * Данные по сравнительной эффективности относятся к использованию основных (немодифицированных) вариантов методов при решении уравнений с вычислимыми функциями f(х). 330
Достоинства и недостатки метода. 1. Метод-характеризует¬ ся самой высокой вычислительной эффективностью среди всех известных методов решения системы уравнений (4. 87). 2. Метод требует повышенного объема запоминаемых дан¬ ных (хранение (я+1) точки х(р+г> и (я+1) векторов f(x(?+?'))) по сравнению с одноточечными методами (типа метода Ньютона). 3. Метод не обладает самокорректирующим свойством, т. е. исправление результатов неверного предыдущего шага затруд¬ нено. Пример 9. Расчет параметров равновесного сбалансированного режима прямолинейного полета методом секущих. Система нелинейных' уравнений, описывающая режим прямолинейного сбалансированного полета, имеет вид (см. пример 8, разд. 4.2.3): /l (Я , а) Д Р cos (а + ерр)_ Baq0Sa.2 — cx0qQS — mg (А0) sin 0О = 0; /2(Р. а) = Р sin (а + <р ) + c*q0Sa — от0 g(.bo) Рз + h0 COS 0n = 0. Пусть каким-либо образом заданы три начальных приближения: (/>(— 2)"t а(—2))т, (р(—1)| а(—П)^ {Р®\ а^)т и пусть вычислены соответ¬ ствующие этим приближениям значения вектора f=(fi(P, а), [2(Р, а))т: {(-2) _ fi(P(~2)■ /2(р(-2). а(-2)) (-2)) а ; {(-г> = {(°) _ fi (Р(~г), /2 Ср(_1). «(0)Г /2(Р(0). а<°)) ' а^) a<-D) Тогда в соответствии с вычислительной схемой метода секущих следую¬ щее приближение {Рт, сб1))1 находится по формулам (4.89): а(1) =Н-(_2)а( 2) +Р-(_1)а< 1)+P-(0)a(0) ■ где величины [х(Р), (р = —2; —1; 0) определяются из решения системы линей¬ ных относительно Щр) уравнений (4.90): Р(_2) /ДЯ(-2), В(-2))ДИ)/.(РН), а<°))=0; 9(_2)/2(Р(-2), а(-2))+^(_1)/2(Я(-1)' а(-1))+^0)/2(Р(0>, «(0)) = 0; fi(_2)+P'(_1)+P-(0) =1. Решение системы линейных уравнений для р,(Р) при большом числе неиз¬ вестных удобно проводить каким-либо из методов исключения (например, с помощью метода Гаусса) или методом пополнения. При небольшом числе неизвестных (п=2н-3) можно осуществить решение методом Крамера через определители. Последующие приближения Р<-т+1\ а<г+1>)т (г=1, 2,...) находятся по фор¬ мулам вида Р(г+1)=^(г_2)Р(г-2)+(л(г_1)Р(г-1)+у(г)Р(г); a(r+1)=p.(r_2)a(''“2)-p,n(r__1)a( _1)+р(.)а(''), 331
где переменные Щр+Г) (р = О, —1, —2) определяются из решения системы И/--2) /i (я(г_2), а(г~2>) +д(г_1} fi{p{r~ -О, а(г-1)) +E(r)/i(P(r), а(0) = 0; Р(г-2) /2 (р(г_2). а(г_2)) +д(г_1) а(г—!)) +Р(Г) /2(^(г). a(0) = 0; IV-2) +IV-1) +V) = 1 (г=0, 1, 2, При этом замена «старых» точек (Р(р+г\ а<?+г>) на (г+ 1)-й итерации мо¬ жет производиться либо по наименьшему индексу р (т. е. циклически), либо по максимальной норме невязок: max |/120(p+r), а(Р+т'>) + f\{P^+r\ а(Р+г>)1 —2 + r<p+r<r L J' Результаты определения параметров установившегося полета самолета, численные значения аэродинамических характеристик и параметров движения которого приведены в примере 8, разд. 4.2.3, показаны в табл. 4. 17а и 4. 176. Расчет производился для тех же двух вариантов начальных условий, что и в примере 8, разд. 4. 2. 3. Видно, что для получения решения с точностью до четырех значащих цифр необходимо 5-ь7 раз вычислить вектор f(Р. а) = = (f,(P. га), h(P’ а)т. 4.3, ЧИСЛЕННЫЕ МЕТОДЫ ОПТИМИЗАЦИИ ТРАЕКТОРИЙ И УПРАВЛЕНИЙ ПОЛЕТОМ ЛЕТАТЕЛЬНЫХ АППАРАТОВ Необходимые условия оптимальности управления 'u(t) и со¬ ответствующей ему траектории х(/) приведены в гл. 3. Краевые задачи, возникающие при применении необходимых условий оптимальности в форме принципа максимума, могут быть сведе¬ ны к решению систем нелинейных трансцендентных уравнений относительно неизвестных- начальных значений сопряженных переменных о (см. разд. 4.2). Эти уравнения можно решить численными методами, рассмотренными в разд. 4. 2. Ниже при¬ ведены численные методы решения задач оптимального управ¬ ления, не связанные непосредственно с использованием необ¬ ходимых условий оптимальности. 4. ЗЛ. Метод функционального градиента Метод используется для решения задач оптимального про¬ граммного управления. Исходные данные. Пусть управляемое движение описы¬ вается системой обыкновенных дифференциальных уравнений: — в скалярной форме Xi = ft{t, Xj, ха, ...,хп, щ, и2, ... , aj (4. 106) (7= 1, 2, 3, , п), — в векторной форме x = f(A х,и), (4.107) 332
Таблица 4.17а Расчет параметров равновесного режима полета самолета с помощью метода секущих на ЦВМ БЭСМ Хс* Л 1 Ч 1 а (D <1 еГ.7 2<? «в I s а н о VO cd Он ю <D Ю СО а I i S — (1) си И w о о Я 2 Е<? ЕГ I Си S эЕ s + cd Е К Е '0. (D в cd Ч О X . 3 ^ и сГ о в <1 С о О' о 3 ,| 5 к I' W (D о Ч Е >-> <1 Ч о О Е ^ cd О, >-> - <D О Ef ' О О- Е о Ъ <1 ~ + ■— сэ С1, I <D 3 н к Е CJ 3 Е- cd Н Е 4 >3 СО <D Си U* _ Е Е <D 5 Е S CU Е Ч VO СО Общее коли¬ чество вы¬ числений вектора f для г итераций СО Ф Ю СО N- со 03 СО Ф LO О N <M Ю — со со 1 1 1 1 моо О O' 05 О CO CM ,—i ,—i и. СОСОСМЮСООЗ'—'г—< OCO^rH . . — г-нСОЬЬсМЮ • • CM CO CM ’—1 t-— CO О юфф--<озффоз СЗФСОф^Ь -Ф1>.СООЗСООЗСОСО CO CO CM 1-2 CM - - -СО CM CM 03 СМ О О CO -CO COOOO - « т-нСООЗОЗОФС^ОЗ _ ® -Ф CO ,—( •ФОСС -Ф СМ Ф о ЬЮОСООЬ Q, 03 03 СМ СО -ЮОЗСМ о CM CM -tr^ ^H ю lO UQ о Ф - СО 05 lO LO 1—< T—< оо ф 03 Ф ' Ч—1 СМ —< — о" о о о (M со Г 1 ? 05 ! 1 о 1 W. N- , т-< ^ со о 05 СО ’—1 О >—1 О СО СО со *-H: со т—1 о Ф О) I—1 • 1—1 со ю ф со оз о • СМ Ф 1— • ’Ф • Ю N- 03 Ф СМ Ю 05 со 1— 05 СМ 05 —' к, - - -СМ СО Ф СО СО со !—• г-1 со t- СОООЦ-СОфСО^ОО О оо СМ со СО ио о — *с ф со 05 -О СО СМ - - -со г-н СО О О СМ СМ СО г-ч о ЫОСОЬФЧ ЮЮФОО - - со о < со СО 1—| Ф ^ Т-Н г-, (М О О ю Ю СМ Ф со ОО см 1 1 1 1 ф Г-н 05 г-н СО 'к II! ! см СО -см -о о О | о <м Т-Ч СО 1 ? —ч 1 1 СО о г—I LO 05 05 —1 о о СО ОО г-н О СМ СМ '—1 N- >—' »—1 т—1 ■—. СМ О СО • т—н г-1 СО СО О 00 05 . . СО оз 05 СО • СО СО со Ф Ю СМ со Стз ЮЬЬСО-Н 0)0’—'ЮЮСОЮСО 05 1 1 СМ С''- , , 'Г ^ - - -СО СМ О СО СМ О ОСООЬ-нСО° w ^ СО Ф Ю *Ф О СО 05 г-н -СО со Ф NNSCMCOG5TOO СО СМ со см 1>- СМ 1—11 СМ N- -Ф-ФСМ -Ю -00 о —' 10Ю10ФФ - со 05 & 1 Т1 ь* Ф 1 1 I 1 ф О СЗ г-н 05 1 03 ф 1111 со 1—1 1 о'*1 о о 1 ° о О 05 со со 05 СО СО со со со со 05 СО со о ф со N- со оо оо г-- Ц- Ц- СО Ц- со со О со оо о о о о СО СО со т-iO оо х-ч с^5 О COOJbOOO со со СО СМ о о о *» Q О СМ Ю СО СО СО Ф Ф оо оо со со СЬ 000050305050503 СО со СО 05 05 05 05 О ф ф ф ф ф г—< Г-Н т-Ч 1ф ф Ф Ф i—< 05 05 05 05 03 05 О О 1—< 05 05 05 05 О 1—• 1—< г—' i—' 1—< i—' СМ СМ СМ —• 1—1 1—' О г-н см со ю ю ю t>. CM 05 to Ю О со N- N- оо t>. t>- N Ь- Ь CO oo N N о ю оо со 05 05 05 CO CO CO t"- 05 05 05 О СО О 05 03 05 CM CM CM 1— со 05 05 о со 1—1 ч—<1 со со со HHHCOOCOCO ООО ------ о. юосоююю a> го 05 ю io iq О о 1—< СО со со со 03 05 05 со СО CO to о со оо t> N- N CO b N NN N i—i 10 10 10ЮЮЮ ююююююю S s Ef CMr-tOr-'СМСОФЮСО CM ’—'O’—i CM СО Ф t|! Я U ^ си 1 1 1 1 <D Н S Н 1 ЭЯ Е Е S cd ч И м Е cd з О 1 CM CU &* 3 Ч cd cd к о оз * ^ 333
Q a* a к CQ X s Э- >> a ee £4 О H Я c S о П 4 о се S 33 о я со се о. я с а н О) S ей а се се £и 3 а, 2 <1 о I К I О ФГ к CL, » о а> I ж"а ЭЯ о 2 ч §а * а. 2 <N К О, Q-, 03 g 3 3 С я « о Я о >■* о о < "О, 0) 3 к се Йг се Оч к s о ЯГ — II <0 с л О, Ч W Я о О S ф о 0, 3 'о, я ^ се Оч о CQ 1=Г эЯ О Он ч VO 1 . эЯ о Q s ^ ЭЯ я 2 я _, я н <о Й ^ яг §§ I ? § §. 1||й*£ о ё “ s а ~-а, ь: а. а, « О C-J О ■< а. г- ТЭ Ь <3 а ^ W L, а, » Н I JS — ча s се с- ^ CQ 3 (е 3 о ся tr я ч се се ж а СО X со ф to со с-- оо аз со со *-• СО to ф ф i> •-* со ф о аз аз ю ю см ю t>- Ф Г-Н со аз -со аз аз со - СМ со ю о —< to см оо аз см со аз ф со аз см см О Ф Ф см -Ю Ф - Ф о со СО I I О о ф аз оо со аз см ь- аз о ф о аз см ао аз ю см !—■ 0*0 I ь* —• ^ аз 2 со со СО 00 t>i . 00 Ю Ф t-*- т-н СО to ^ 10со аз о со - - -аз Фсм>. СОСО^СМСОФсМ ФсоазсоФсоо00 о о см -о оо 5о Ю to Ф СМ со т-< о ГНГН^ОО - -Я^ 1 I I —< to CM CM —< ОО со со аз о со Ф см •-< Ю to аз аз Г-Н о, оо о СО Ф ГЧ Ю -со ю - см CM to Ф 0 0 00 аз ^ "Т1 ю см со аз to со to со см о СО см _ ■Ф О СО 03 о со аз ю о -ф ф см ф - со аз ф о аз г-н ОО »-н о аз со со аз со со о ФСОЬСОООСО о со оо о о о о О СО 03 1>> о о о О ОМ to 0О оо ОО оооазазазазазаз О !>■ Ф Ф Ф Ф Ф гн аз аз аз аз аз аз О г-< см оо юю ю> О СО t>- (>■ СО О- С'- о ю оо со аз аз аз О COO N03 03 03 о СО г-н —4 со СО со ООО to О со ю ю ю о о г-н со СО СО со о со СО Ь- N N т—н to to tO LO to to T7 < CM со Ф to CO СО ’Ф lO со ь CO аз О 00 CM о CO CM CO аз Ф GO CO о CO Cd CO CD I I I 000 t'- to о CM to to CM Г-1 СО Ф аз соеосоь CM '—1 см аз ю о -оо со со со Ф СО О т—1 i—1 со СО со 00 ф CM -О 00 00 ГНЧСОМГО г-н i—1 CM о o' o' I о I гн О гн О аз со со г-н . »-« О Ф 1—I -03 см ф 1 аз со аз 03 со ’—1 ’—1 03 t>- СОСОСМСОФОЮО о оо -СО СО оо - -СО СМ !>• tO СО GO О ф О >—| СМ Ф СО оо ю to *—< аз г-н со со - о -о О 1 о 1 f о I г-н О СМ со ОО . —, ОО со со СО • to о аз со ф аз аз t> со со ОСОМОсООзОО o' 00 со со О со ю гн - -со СО оо аз см -со оо 03 tO г-н ^ о . 1 О СО со со С- со СО СО СО СО оо ф ф ф СО со со SS- СО tO СО СО СО СО СО 00 ОО ОО 1—I О О О О СМ О О О О СО ОО ОО 00 оо аз аз аз аз аз ф -ф Ф< Ф» -ф! аз аз аз аз аз ЬЬЬМгнЮЮЮ t^-l^l>-COCOt>-t>-t^ сососоь-азазазаз смсмсм-чазазазаз чччСОСОСОСОСО аэазазФюююю азазазсососососо юююююююю 334
где x = (x1, х2, ..., хп)~ вектор фазовых координат; и=(й1, и2, ..., ит) — вектор управлений. При этом управление и принадлежит некоторой открытой области Um: u £Um. Начальные условия. При t=to задан вектор х: х(гУ = х0. (4.108) Краевые условия. В конечный момент времени t=t\, который не задан, выполняется условие ср(^х(^))=0. (4.109) Критерий оптимальности. Задан функционал /[и], подлежащий оптимизации (для определенности — миними¬ зации): = Х(У) + f /о(*> х> u)dt- (4.110) Необходимо найти такой вектор управления u(0 = («iW. • • •. Um(t)\ (4. Ill) при котором решение системы (4. 107) удовлетворяет началь¬ ным и краевым условиям (4. 108), (4. 109), а функционал (4. ПО) достигает минимума. Идея метода. Вводятся функции х, u)+2*i//(*. х’ u)> б = *о£о(*1. х(^))+!«р(^, х(*,)), где Х0=1; 1к=(к1, Х2, ..., АД — вектор сопряженных переменных; р —постоянный множитель Лагранжа. Вектор X удовлетворяет уравнению са_ дН_ dt дх (4. 112) (4.113) (4.114) Для вариации 8J функционала /[и] в момент времени t=t\, когда выполнено условие <p(^i, x(^i)) =0, справедливо следующее выражение: п U\t=t=mt “2 x,8л:, /3г tx т tx \dQ -|- ( — Ьщ dt. . .JffiEsW J dU-i 10 1=1 t0 (4.115) 335
Теперь выбираются такие Xi(t 1) и р, для которых при всех 6tь 8xi(ti) выполняется условие п *1 п //^+’Sx<8'Xf +d°=Hbt +^«х+ i =1 f0 /-1 to (n btl +S7^r^w]-°. (4> II6) /=i t. e. dgj d-*y(7i) /.+^№И+|+^=0; / = 1 dgo i .. jj. • Отсюда = 0. p = dxt{ti) 1 ' dxi(ti) go + /о f t =<! (4.117) (4. 118) (4. 119) (4. 120) где полные производные по времени go(ti) и <р(t\) определяются численным интегрированием системы (4. 107). Тогда выражение (4. 115) примет вид tt т ~ \дН »у|, -/,=5* Если выбрать t о /*= 1 ды,- ■ bu,dt. s ,,, <ш о U: = kl —, г <Эиг (4. 121) (4. 122) где № — весовой коэффициент, то приращение б/ функционала имеет вид 11 яг <4Л23) t о '=1 Следовательно, приращение б/ функционала 7[и(^)] на ва¬ риациях бUi имеет определенный знак: при &*>0 67>0 (максимизация); при &<0 б/<0 (минимизация). С помощью вариации б/ определенного знака можно постро¬ ить последовательность управлений {иМ(Т)}, которой соответ¬ ствует убывающая последовательность значений функционала j [и(0)(0]|до) > j кто» №rmU) >■■■ (4.124) 336
Если функционал Z[u(£)] ограничен снизу, то процесс после¬ довательных приближений приводит не только к сходящейся по¬ следовательности значений J[u^(t)\ но и к сходящейся к нулю на отрезке (Y0, t\] последовательности функций {Su<r>(*)} (г = 0, 1,2, ...). (4.125) Вычислительная схема. Алгоритм решения следую¬ щий. 1. Выбирается из каких-либо соображений начальное при¬ ближение вектора и(^): и(О>00 = (и|°>00. «Р W, . .. , <>(/)). (4. 126) 2. Для заданного значения вектора х0 на отрезке интегрируется система (4, 107) с управлением u(°\t) до выполне¬ ния условия ср(Д, х(71))=0. Для этого момента времени численно или аналитически определяются значения х(^), dgo д° и численно —величины Д[о dt dt t-t i dxi(ti) dxi(ti) Величина tt опреде¬ ляется с помощью интерполяции из условия (4. 109). 3. Вычисляются вектор к и число ц в точке t=t\ [см. (4. 119), (4. 120)]. 4. Назначаются весовые коэффициенты № и интегрируются основная и сопряженная системы (4. 107) и (4. 114) при u(°)(t) в «обратном» времени т=А—t при начальных условиях: т = 0, х(0) = х(/1), Ц0) = МД). (4.127) В процессе интегрирования вычисляются значения функций k(t) ,0Я(ц(°Н И 8й<°>(^): чения да. а также формируются и запоминаются зна- в{1)(/) = в<0)+'8я{0). (4.128) Последнее выражение для ир принимается за новое (улуч¬ шенное) управление. 5. Пункты 1—4 повторяются до тех пор, пока не выполнится какое-либо из принятых условий окончания вычисления, напри- дН Г дН /дну ,, мер, до тех пор, пока не станут малыми — или I — — at dui J du \du j или пока не станут меньше заданной величины разности \J [u(r+1> ] — У [u(r)]| < е/, (4.129) 337
max \u.y+l\t) — и$л>(ОИ£ев/ (r=0, 1, 2, ...; /= 1, 2, ..., m). 0<<«! (4. 130) Примечание. Эти условия не представляют теоретически обоснован¬ ного условия окончания вычислений. Лишь в достаточно «хороших» случаях проверка одного из них (а лучше — нескольких) может служить надежным практическим признаком получения результата с нужной точностью. Выбор весовых коэффициентов №. В конкретных задачах часто трудно разумным образом выбрать значения №. Один из способов выбора состоит в том, что № назначают по схеме № = — 1. если 8и™п ЩЬи,Ш I зад ^ i \ / ' 8м'!1ах I яял » шал. Ч зад | max but (t) I m<tt i если I max bti, (t) I "> 8«™fx 1о<г«, Г ‘зад или I max 8ut(t)I < 8m™’" |o««, I (4. 131) или так: № = k = &xg min J [u<'>(0 + A8u<'>(*)]; ft> о 8u<r> dH (u(r)) du (4. 132) Скорость сходимости метода. Градиентные мето¬ ды обладают лишь линейной скоростью сходимости. Поэтому часто они сходятся весьма медленно, особенно в окрестности ре¬ шения. Общая рекомендация по их применению состоит в том, что их целесообразно использовать на начальных этапах улучше¬ ния управления. 4. 3. 2. Метод штрафных функций Метод штрафных функций позволяет решать задачи с не¬ сколькими краевыми условиями. Исходные данные. Пусть управляемое движение опи¬ сывается системой обыкновенных дифференциальных урав¬ нений: — в скалярной форме x-L = f i(^, хХо, .. •, хп, й2, ..., ит) (/ = 1,2, . ■., (4. 133) — в векторной форме x = f(7, х, и), (4. 134) где х=(х±, х2, , хпу — вектор фазовых координат; и—(их,м2, ..., ит)т — вектор управлений; f=(/i, Л. • • •. /пУ- 338
При этом управление и принадлежит некоторой открытой об¬ ласти U: и е£/. Начальные условия. При t = t0 задан вектор х: х(^0) = х0. (4.135) Краевые условия. В конечный момент времени t=tu ко¬ торый не задан, выполняется условие cp(tu х(^))= 0 и, кроме него, <7<п условий вида ?Л^х(У) = 0 и =1,2,..., д). (4.136) Критерий оптимальности. Задан. функционал /[и], подлежащий оптимизации (для определенности — минимиза¬ ции) : ■/[4]=g'o(2fi. x(^)) + j /о(*. Х> U)dt- (4- 137) to Необходимо найти такой вектор управления u(0=(«i(0. «я(0. • • • - ««,(0). (4. 138) при котором решение системы (4. 134) удовлетворяет началь¬ ным и краевым условиям (4. 135) и (4. 136) и минимизирует функционал (4. 137). Идея метода состоит в том, что используется вычисли¬ тельная схема метода функционального градиента (см. разд. 4.3.1), но вместо заданного функционала (4.137) рас¬ сматривается вспомогательный функционал Л[и] = У[и] + Ф1(ср1,...,ср9), (4.139) где Ф] — мера отклонения от заданных краевых условий (функ¬ ция штрафа). Вычислительная схема. Вычислительная схема пол¬ ностью соответствует схеме разд. 4. 3. 1, в которой /[и] заменено на /фи]. Практически часто функцию Ф] выбирают в виде = х&)) =2 х&))> (4. 140) )-1 где Vj>0 — весовые множители. Замечания по применению метода. 1. Известно, что решение задачи безусловной минимизации функционала /фи] стремится к решению задачи минимизации /[и] при наличии свя¬ зей —0, если Vj—>-оо. На практике иногда удается подобрать такие конечные значения vJt при которых краевые условия 339
удовлетворяются с заданной точностью. Однако часто введение «штрафных» слагаемых ухудшает процесс сходимости по основ¬ ному функционалу /[и] и управлению и(£). 2. Метод штрафных функций может быть применен и к за¬ даче с ограничениями типа неравенств: с нулевыми начальными условиями. Эта система присоединяется к основной, и метод функцио¬ нального градиента (см. разд. 4.3.1) используется для мини¬ мизации вспомогательного функционала Процесс сходимости может быть весьма медленным. Указанные приемы целесообразно применять на первой ста¬ дии вычислений, когда управление и краевые условия далеки от оптимальных. Метод используется для решения двухточечных краевых за¬ дач оптимального управления. Он является обобщением на слу¬ чай краевой задачи для системы обыкновенных дифференциаль¬ ных уравнений метода Ньютона для решения систем нелиней¬ ных алгебраических и трансцендентных уравнений (см. разд. 4. 2. 3). Исходные данные. Пусть задана система дифференци¬ альных уравнений фг(/, х, и)>0 (/=1, 2, 3, . . ., s). В этом случае вводится функция n+s (4. 141) ф2(^х, x(/J)= 2 VЛ&). (4. 142) i =л + 1 где a xt(t) (t=n-\-1, п-\-2, ... , дф-s) удовлетворяют системе х, = ехр { — х, и)} (4. 143) Л [и]=У[и]+Ф8. (4. 144) 4.3.3. Метод Ньютона—Канторовича (4. 145) dX_ _ _дН cLt дх ’ (4. 146) Другое название: метод квазилинеаризации. 340
(4. 147) (4. 148) где х, f, X— л-мерные векторы; и-—m-мерный вектор; П H = X, и)+ /„(*, X, и); /=1 и = и{t, х, X) = argmin//(t, х, и); и еи t€[^0, х£Х; А,е A; u^U; X, A, U — некоторые открытые множества. Краевые условия. При t=t0 и t = t\ заданы условия: xi {to)—xiw (4.149) xi{tг)=Х11 (/=1, 2, . . . , п). (4.150) Необходимо найти x(t) и Х(/), удовлетворяющие системе (4. 145), (4. 146) и краевым условиям (4. 149), (4. 150). Идея метода состоит в том, что если заданы начальные приближения x(°)(t) и №(t), то последующие приближения х^1) (t) и Wr+1) (£) определяются из линейной относительно них системы дифференциальных уравнений, полученной путем ли¬ неаризации системы (4.145) — (4. 146) относительно величин дх = х(г+1) — х(г) и дХ = Х(г+1) — Х(г): х(г+1> = /Л^, x(r), u(r))(x(r+1)-x(f)) + /7,„(/,x(r), u(r))x X (u(r+1) - u(r)) + f (i, x(r), u(r)); (4. 151) x(r), u(r)) (x(r+I) — x(r>) — H x\ {t, x(r), u(r)) x ‘(r+1) - X(r)) - Hiu (t, x(r), u(r)) (u(r+1) - <>(r)' dH- x(x( ; (4.152) dx u(r+I) = u(r) — Hau (t, x('\ u('>) [Hax(t, x(r), u(r))(x(r+1)-x(r)) + + x(r),u(r))(X(r+1)-X(r))], (4. 153) где HXx,Hiu, Hxx, Hua, Hux, Ha\ — матрицы частных производ¬ ных по (1, х), (X, и), (х, х), (и, и), (и, х), (и, X) (т. е. (Э2 н д^И \ , , и т. д. , вычисленные вдоль траектории r-го прибли- дХдп дх2 жения. При этом должны выполняться краевые условия xY+1){to)=xiv (4.149') x\r+14ti)=xn- (4,150') При определенных условиях последовательность {х(г), Х<г)} сходится к решению (х, X*) исходной краевой задачи. 341
Вычислительная схема. На каждом (г-Н)-ом ите¬ рационном шаге должна быть решена краевая задача для си¬ стемы (4. 151) — (4. 153) с условиями (4. 1497), (4. 1507). Записав эту систему и краевые условия в векторной форме z = G1(t)z[t)-\-D{t)\ (4. 154) zi (*о) ~ У if (4. 155) zi (А) = Уiii (t— 1, 3,..., ti) (4. 156) где z ==-(У\) у2? • ■ • ч У Л!). N = 2n, (4. 157) получим следующий алгоритм решения этой линейной краевой задачи. 1. Определяется совокупность решений {z^n+i’>(t) } (г' = = 1,2,...,«) однородной системы z = G1(*)z (4. 158) с начальными условиями 2л+^о)=(0, 0, . . . , гл+г = 1, 0, . . . , 0) (/= 1, 2, .. . , я). (4. 159) 2. Находится частное решение неоднородной системы (4. 154) с начальными условиями вида Z (^o)==(l/xo> ^/го> • • • > ^/по> ^1. • • • » ^я)> (4- 160) где kj (/=1,2, - - -, п) —произвольные числа, например, нули. 3. Составляется общее решение системы (4. 154): z(t) = cn+1z(n+1)(t)+cn+2zn+\t) + • • • ~bGv zN (4.161) 4. Определяются постоянные с(гг-к) (i— 1, 2, ..., п) из второй системы граничных условий (4. ISO7). Примечание. Для экономии оперативной памяти ЦВМ и для про¬ верки точности решения линейной краевой задачи целесообразно z(t) нахо¬ дить не из системы (4.161), а численным интегрированием системы (4.154) при начальных условиях 2Цо) = (j/lO, 1/20. • • Уп0, Сп + 1+&1, Сп+2 + ^2. • ■ •, CN+kn). (4. 162) В этом случае не надо запоминать векторы zn+i(t) и z(t), а необходимы лишь их значения в конечный момент времени t=t{. Вектор z(t) должен запо¬ минаться в ЦВМ, так как с его помощью вычисляются матрицы частных про¬ изводных Hljc и т. д. и правые части системы на следующем шаге итераций. 5. Если время Ц не задано, то можно применить следующий прием. Задаются некоторым начальным приближением для вре¬ мени окончания интегрирования ^ = п<0)5 а одну из компонент 342
вектора x(t\), например Xj(t\), оставляют свободной (т. е. не вводят в граничные условия краевой задачи). После этого по проведенной схеме решается задача с фиксированным временем ti = ti(°). Снова задаются значением времени t\ = t\(ll и повто¬ ряют расчет. Затем производится коррекция времени U путем линейной интерполяции на заданное значение Xj(t\) —Хц: 1,163) При необходимости счет по формуле (4. 163) повторяется до тех пор, пока не выполнится условие где e~=Q + _L|^ + I)-/(r)j; 6= У тах|хг.(/('-+1)) —х;.(г;('-))| + д* е и» .м П где b — масштабный коэффициент. Сходимость метода. Метод обладает квадратичной сходимостью. При очень грубых начальных приближениях мо¬ жет потребоваться модификация метода, чтобы устранить рас¬ ходимость. Достоинства и недостатки метода. 1. Метод целесообразно применять в случаях, когда: — легко указать достаточно близкое начальное приближе¬ ние в виде {х<°>(0,1(0)(О }; — решается серия близких вариационных задач, для типич¬ ного представителя которой решение уже найдено; тогда за на¬ чальные приближения для последующих задач молено принять решение типичной задачи. 2. Функции начального приближения можно выбирать кусоч¬ но-гладкими; управляющие переменные-—даже разрывными; 3. Начальные приближения не обязательно должны удовлет¬ ворять краевым условиям. 4. Метод не гарантирует оптимальности решения в целом, хотя и удовлетворяет необходимым условиям оптимальности.
Л ИТЕРАТУРА 1. Ата нс М., Фалб П. Оптимальное управление. М., «Машино¬ строение», 1968. 2. Березин И. С., Жидков Н. П. Методы вычислений, тт. 1, 2. М., «Наука», 1966. 3. Боголюбов Н. Н., Митропольский Ю. А. Асимптотиче¬ ские методы в теории нелинейных колебаний. М., Физматгиз, 1963. 4. Болтянский В. Г. Математические методы оптимальнего управ¬ ления. М., «Наука», 1969. 5. Булинский В. А. Динамика маневрирования самолета-истребите¬ ля в воздушном бою. М., Воениздат, 1957. 6. Гантмахер Ф. Р. Теория матриц. М., «Наука», 1966. 7. Г о р б а т е н к о С. А. и др. Механика полета (Общие сведения. Уравнения движения). Инженерный справочник. М., «Машиностроение», 1969. 8. Де м и д о в и ч Б. П., Марон И. А. Основы вычислительной мате¬ матики. М., Физматгиз, 1963. 9. Д е ч Г. Руководство к практическому применению преобразования Лапласа. М., «Наука», 1965. 10. Кан В. Л., Кельзон А. С. Теория пропорциональной навига¬ ции. Л., «Судостроение», 1965. 11. Лебедев А. А., Чернобровкин Л. С. Динамика полета бес¬ пилотных летательных аппаратов. Оборонгиз, 1962. 12. Л е т о в А. М. Динамика полета и управление. М., «Наука», 1969. 13. Малкин И. Г. Теория устойчивости движения. М., «Наука», 1966. 14. Матвеев В. Н. Расчет возмущенного движения самолета. М., Обо¬ ронгиз, 1960. 15. О с т о с л а в с к и й И. В., Стражева И. В. Динамика полета. Траектории летательных аппаратов. М., «Машиностроение», 1969. 16. Остославский И. В., Стражева И. В. Динамика полета. Устойчивость и управляемость летательных аппаратов. М., «Машинострое¬ ние», 1965. 17. Методы оптимизации с приложением к механике космического по¬ лета. Под ред. Д. Лейтмана. М., «Наука», 1965.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Быстродействие ЛА 81 Вариация функционала 254, 335 Вектор множителей Лагранжа 195, 247 — невязок 306 — сопряженных координат 195, 197, 243 — состояния 182 — управляющий 179, 183, 185 — управляющих (проектных) пара¬ метров 19, 183 — характеристический 98 Вырожденные вариационные задачи 201, 232 Гамильтона функция (гамильтониан) 195, 238, 242 Гильберта определитель 251 Годограф Михайлова 98 Градиентные методы 173, 332, 339 Граничные условия 242, 247 — закрепленные 247 — подвижные 190 — свободные (естественные) 190, 247 — смешанные 190, 247 Граничные участки 236 Движение ЛА возмущенное 79, 95, 161 — длиннопериодическое 105 — короткопериодическое 105 — невозмущенное 78, 95, 161 — свободное 105, 132 Допустимое программное управление 186 Допустимый закон управления 188 Допустимые процессы 188, 189 — траектории 188 Достаточные условия оптимальности 173, 202 Задача вариационная Больца 246 — Лагранжа 246 — Майера 246 — краевая 190, 299 — основная оптимального програм¬ много управления 190 — координатного управления 191 — синтеза оптимального управле¬ ния 191 Закон наведения 6 — управления 185 — допустимый 188 — оптимальный 191 Запас устойчивости по модулю 103 — по фазе 103 Звено типовое 76, 85 Зона возможных атак 9 — граница 19 — по перегрузке 9, 19, 33, 41, 57 — по скорости 9, 26, 56 Изопериметрические связи 247 Колебательность ЛА 82 Коэффициент демпфирования 81 — динамический 77 — передаточный 77 — усиления 77 Краевые условия 180, 190, 299 Кривая характеристическая 98 Критерий качества управления 81, 185 — Сильвестра 145, 201 — устойчивости алгебраический 97 — Михайлова 98 — частотный 98 Курс перехватчика 8, 22 — цели 8, 29 Курсовой угол цели 8, 14, 25, 54 Лагранжа вариационная задача 246 — метод множителей 172, 247 Линия визирования 7 — перехватчик—цель 9 Матрица Якоби 302, 312, 313, 317 Метод Адамса 262, 297 — Гамильтона—Якоби 172 — Гилла 1-й 284, 292, 293 — Гилла 2-й 283 — итерационный 300, 304 345
, квазилинеаризации 340 — Крылова—Боголюбова 161 — Ньютона—Канторовича 340 — Ньютона 312, 315, 318 — модифицированный 316, 312 — обобщенный 312, 316, 317 — расширенный стандартный 312, 316, 320 — стандартный 312, 316, 319, 320 — упрощенный 312, 316, 319, 320 — прогноза и коррекции 270, 272, 297 — простой итерации 309 — Пуанкаре 155 — редукции к задаче Коши 300 — Рунге—Кутта 278, 280, 282, 297 — Рунге—Кутта—Гейне 282 — Рунге—Кутта—Ингланда 285 — Рунге'—Кутта—Мерсона 284 — секущих 322, 331 — скорейшего спуска 312 — функционального градиента 332— 338 — Четаева 151 — штрафных функций 338 — Эйлера 282 — с пересчетом 282 Минимум абсолютный 191 Многочлен характеристический 89 Модель математическая 169, 177 Наведения задача 5 — метод 5 — плоскость 8 — процесс 5 — центр 7 Необходимые условия оптимальности 173, 194, 211, 229, 234, 240, 247, 253 Область сходимости 308 — устойчивости 99 Ограничения 177, 179, 234, 240 Оптимальные траектории 191 Оптимальный управляемый процесс 191 Особое оптимальное управление 232 Оценка асимптотическая ошибки ин¬ тегрирования 287 -— интегральная квадратичная 82 — линейная 82 Ошибка динамическая 79 — локальная численного интегриро¬ вания 261, 262, 267, 274 — округления 261, 297 — статическая 79 — суммарная 267, 281 — управления 79 — установившаяся 79 Параметры передаточных функций 89 Пеленг цели 8, 25, 30, 54, 67 Период свободных колебаний 81, 82 Перегрузка заданная 10 — потребная 9 Переменная входная 70, 73 — выходная 70-, 73 — состояния 182 Перерегулирование 81, 82 Показатель качества, 81, 82 Последовательность векторов — итерационная 304 — сходящаяся 305 — фундаментальная 305 Порядок локальной ошибки метода 262 Предел последовательности векторов 305 Принцип максимума Поятрягина 196, 207 — оптимальности Веллмана 211 — Рунге 287 Программное управление 185, 186 Пространство событий 182 — фазовое 182 Процесс переходный 78 — управления 185 Прямые методы решения задач опти¬ мального управления 172 Равновесный режим полета 298 Равносильная система 302 Решение возможное 301 — изолированное 302 — кратное 303 — простое 303 — системы алгебраических уравне¬ ний 301 — численные системы дифференци¬ альных уравнений 260 Рубеж перехвата 9, 22, 26, 56 Свойства астатические 83 — демпфирующие 81 — динамические 77, 81 — оптимального управления 192, 211 — оптимальной траектории 192 — статические 77 Связь изопериметрическая 247 — обратная 74 •— отрицательная 74 — положительная 74 Система автономная 186 — замкнутая 72 — недоопределенная 302 — независимая 302 — совместная 302 — сопряженная 195 — стабилизации 73 — равносильная 302 — разомкнутая 75 — управления 70, 73 Скорость относительная 8 — сближения 8 — угловая 9, 10, 16, 18, 37, 39, 46, 63 Состояние динамическое 77 — статическое 77 Сопряженные координаты 195 346
Стационарная точка 200 Схема вычислительная 266, 271, 310, 317, 325, 327, 337, 339, 342 — структурная 72 Сходимости область 308 — скорость 306 Теорема Каменкова 154 — Ляпунова 140, 143, 150 — Малкина 152 — Пуанкаре 156 — Румянцева 144 — Сильвестра 145 — Четаева 144, 150 Точка начальная — отталкиванйя 308 — разгонная 266, 268 — разрыва 253 — соединения 241 — угловая 241, 248 Управление временное 185 — координатное 185 — кусочнонепрерывное 186 — программное 185 Управляющие воздействия 70, 73 Управляющие (проектные, настроеч¬ ные) параметры 183 Уравнение Гамильтона—Веллмана 213 — Гамильтона—Якоби 213 — метода наведения 6, 11, 24, 34, 44, 61, 66 — характеристическое 89, 96 — Эйлера—Лагранжа 200, 248, 255 Условия Вейерштрасса 250 — в угловых точках 248, 255 — Гильберта 201, 251 — Лежандра—Клебша 201, 250 — трансверсальности 197, 249, 255 — Эрдмана—Вейерштрасса 248, 255 Фазовая траектория 185 Фазовое пространство 182, 183 Фазовые координаты 182 Формулы Адамса 263, 265 — Адамса—Башфорта 263 — Адамса—Башфорта—Мултона 265 — интерполяционные Адамса 265 — Милна 273 — ординатные 263, 265 — разностные 263, 265 — Хемминга 273 — четырехточечные Рунге—Кутта 286 — экстраполяционные Адамса 263 Функционал 185 Функция вычислимая 303 — знакоопределенная 142, 149 — знакопостоянная 142, 149 — Ляпунова 144, 1501 — передаточная 79, 84 — переходная 78 — Четаева 144, 150 Характеристика частотная амплитуд¬ ная 80, 91 — амплитудно-фазовая 80, 91 — вещественная 80, 91 — логарифмическая 92 — мнимая 80, 91 — фазовая 80, 91 Частота свободных колебаний 81, ПО — собственных колебаний ПО, 122 —• среза 92 Шаг интегрирования 261, 275, 290 Экстремаль 248 Эффективность вычислительная 307
ОГЛАВЛЕНИЕ Стр. Предисловие 3 Глава 1. Методы наведения 5 1.1. Некоторые определения элементов траектории при наведении 7 1.2. Метод кривой погони* 10 1. 2. 1. Графическое построение кинематической траектории по методу кривой погони 11 1. 2. 2. Уравнения движения и метода наведения по кривой погони 11 1.2.3. Решение уравнений движения при перехвате по кривой погони прямолинейно и равномерно летящей цели (соц=0, Ou = const) и постоянной скорости перехватчика (o = const) 12 1.2.4. Решение уравнений движения при перехвате по кривой по¬ гони движущейся равномерно по логарифмической спирали цели (ф—фц = const, цц=const) и постоянной скорости перехватчика (u = const) 19 1.3. Метод параллельного сближения 22 1.3.1. Графическое построение кинематической траектории ме¬ тода параллельного сближения 22 1.3.2. Уравнения движения и метода наведения по параллель¬ ному сближению 23 1. 3.3. Решение уравнений движения при перехвате по методу параллельного сближения прямолинейно и равномерно летящей цели (сйд = 0, иц = const) и постоянной скорости перехватчика (o = const) 25 1.3.4. Решение уравнений движения при перехвате по методу параллельного сближения равномерно движущейся по окружности цели (yq=const, co4=const) и постоянной ско¬ рости перехватчика (n = const) 27 1.4. Метод наведения с постоянным пеленгом цели* ..... 33 1. 4. 1. Графическое построение кинематической траектории метода с постоянным пеленгом цели 34 1.4.2. Уравнения движения и метода наведения с постоянным пеленгом цели 34 1.4.3. Решение уравнений движения при перехвате по методу с постоянным пеленгом прямолинейно и равномерно летя¬ щей цели (<вц=0, Уц — const) и постоянной скорости пере¬ хватчика (v = const) 36 1.5. Метод трех точек 42 1.5.1. Графическое построение кинематической траектории мето¬ да трех точек 42 348
Стр. 1.5.2. Уравнения движения и метода наведения трех точек . . 42 1.5.3. Решение уравнений движения при перехвате по методу трех точек прямолинейно и равномерно летящей дели (соц=0, Дц = const) и постоянной скорости перехватчика (u = const) 45 1.5.4. Решение уравнений движения при перехвате по методу трех точек прямолинейно и равномерно летящей цели (®ц=0, u4=const) и переменной скорости перехватчика (u = var) 59 1. 6. Метод пропорционального сближения 64 1.6.1. Уравнения движения и метода пропорционального сбли¬ жения 61 1.6.2. Решение уравнений движения в полярной системе коорди¬ нат при перехвате по методу пропорционального сбли¬ жения прямолинейно и равномерно летящей цели (соц = 0, o4=const) и постоянной скорости перехватчика (u=const) 63 1.7. Метод прямого наведения 64 1.7. 1. Графическое построение кинематической траектории метода прямого наведения . . . . 65 1.7.2. Уравнения движения и метода прямого наведения .... 66 1.7.3. Решение уравнений движения в полярной системе коор¬ динат при перехвате по методу прямого сближения пря¬ молинейно и равномерно летящей цели (соц=0, uq=const), постоянных скорости перехватчика (n = const) и величине Щм 67 Глава 2. Летательный аппарат как объект управления 68 Основные обозначения 68 2. 1. Основные сведения из линейной теории автоматического управления 70 2. 1. 1. Система управления движением ЛА 70 2.1.2. Основные понятия и определения теории автоматического управления 73 2. 1.3. Летательный аппарат как звено в системе управления его движением 81 2.1.4. Передаточная функция как способ выражения динамиче¬ ских свойств ЛА 84 2.1.5. Частотные характеристики как способ выражения дина¬ мических свойств ЛА 90 2.1.6. Преобразования структурных схем 92 2. 1.7. Устойчивость движения 95 2.2. Продольное возмущенное движение ЛА 103 2.2.1. Уравнения движения 103 2. 2. 2. Характеристический многочлен и характеристическое урав¬ нение 104 2. 2. 3. Свободное движение 105 2.2.4. Передаточные функции ПО 2. 2. 5. Частотные характеристики 122 2.2. 6. Переходные функции 122 2. 3. Боковое возмущенное движение ЛА 131 2.3.1. Уравнения движения 131 2. 3. 2. Характеристический многочлен и характеристическое урав¬ нение 132 2. 3. 3. Свободное движение 134 2. 3.4. Уравнения движения рысканья 135 2.3.5. Передаточные функции и частотные характеристики ЛА в движении рысканья 135 2.3.6. Уравнения движения крена 136 349
Стр. 2. 3.7. Передаточные функции и частотные характеристики ЛА в движении крена 137 2.3. 8. Переходные процессы по углу крена и угловой скорости крена при ступенчатом отклонении органов управления креном 137 2. 4. Летательный аппарат как нелинейный объект управления ... 139 2.4.1. Уравнения движения 139 2. 4. 2. О допустимости исследования устойчивости невозмущен¬ ного движения ЛА по уравнениям первого приближения . 140 2. 4. 3. Прямой метод Ляпунова исследования устойчивости уста¬ новившегося движения Л А 142 2.4.4. Прямой метод Ляпунова исследования устойчивости не- установившегося движения ЛА 148 2.4.5. Устойчивость движения ЛА при постоянно (непрерывно) действующих возмущениях 151 2.4.6. Устойчивость движения ЛА на конечном интервале вре¬ мени . 153 2. 4. 7. Расчет движений ЛА методом малого параметра Пуанкаре 155 2.4.8. Расчет движений ЛА методом усреднения по Крылову — Боголюбову 161 Глава 3. Методы оптимизации управления и проектных параметров летательных аппаратов 167 Основные обозначения 167 3. 1. Общая характеристика методов оптимизации, основанных на математической теории оптимальных процессов управления . 169 3. 1. 1. Техническая задача оптимального управления и ее мате¬ матическая модель 169 3. 1. 2. Классификация методов теории оптимальных процессов . 172 3. 1.3. Необходимые условия оптимальности управления, доста¬ точные условия оптимальности управления и проблема су¬ ществования оптимального управления 173 3. 1. 4. Общая характеристика результатов, которые могут быть получены методами теории оптимального управления . . 175 3. 1.5. Условия рационального применения методов оптимизации 176 3. 2. Основные понятия и определения математической теории опти¬ мальных процессов управления 177 3.2.1. Математические модели 177 3.2. 2. Переменные состояния (фазовые координаты) управляе¬ мого процесса 1,82 3. 2. 3. Управление 183 3.2.4. Эволюция состояния системы. Дифференциальные урав¬ нения движения 184 3. 2. 5. Функционал. Критерий качества управления 185 3. 2. 6. Автономные системы 186 3. 2. 7. Допустимое программное управление 186 3. 2. 8. Допустимый закон управления 188 3.2.9. Допустимые траектории и процессы ,188 3.2.10. Граничные условий. Краевая задача 189 3. 3. Постановка основных задач оптимального управления .... 190 3.3.1. Основная задача оптимального программного управления igo 3. 3. 2. Основная задача оптимального координатного управления 191 3. 3. 3. Оптимальные траектории 191 3.3.4. Геометрическая интерпретация основной задачи оптималь¬ ного управления 193 3.4. Необходимые условия оптимальности для основной задачи программного управления. Принцип максимума 194 3.4.1. Краткая формулировка задачи 194 3. 4. 2. Некоторые вспомогательные построения и терминология . 195 350
Стр. 3.4.3. Принцип максимума Л. С. Понтрягина 196 3. 4. 4. Некоторые следствия принципа максимума 199 3.5. Необходимые условия оптимальности для основной задачи синтеза закона управления. Метод динамического программи¬ рования 211 3.5. 1. Задача синтеза оптимального закона управления .... 241 3.5.2. Принцип оптимальности динамического программирования 211 3. 5. 3. Ослабленное необходимое условие 215 3.6. Необходимые условия оптимальности особого управления . . 229 3.6.1. Краткая формулировка задачи 229 3. 6. 2. Процедура нахождения особого управления 232 3. 6. 3. Необходимое условие оптимальности особого управления . 233 3. 6. 4. Необходимые условия в точках сопряжения особого и ре¬ гулярного управлений 234 3.7. Необходимые условия оптимальности управления в задачах с ограничениями типа неравенств, содержащими только фазо¬ вые координаты х 234 3. 7. 1. Краткая формулировка задачи 235 3.7. 2. Необходимые условия оптимальности 236 3.8. Необходимые условия оптимальности управления в задачах с ограничениями типа неравенств, содержащими одновременно фазовые координаты х и управление и 240 3.8.1. Краткая формулировка задачи 241 3.8.2. Типы граничных условий 242 3. 8. 3. Необходимые условия оптимальности 2Й2 3. 8. 4. Аналог необходимого условия Клебша 243 3.9. Элементы классического вариационного исчисления 245 3.9. 1. Задачи Больца, Майера, Лагранжа 246 3.9. 2. Первое необходимое условие экстремума функционала в задаче Больца 247 3. 9. 3. Второе необходимое условие минимума функционала в за¬ даче Больца (условие Вейерштрасса) для случая f = 2. fk = 0 250* 3.9.4. Третье необходимое условие минимума в задаче Больца (условие Лежандра — Клебша) для случая f=0, fh = 0 ■ ■ 250 3. 9. 5. Четвертое необходимое условие в задаче Больца (условие Якоби — Майера — Кнезера) 2)51 3. 10. Необходимые условия оптимальности в задачах с разрывны¬ ми фазовыми координатами 253 3. 10. 1. Краткая формулировка задачи 253 3. 10.2. Необходимые условия оптимальности 254 Глава 4. Численные методы решения задач механики полета . . . 257 Основные обозначения 257 4. 1. Численные методы интегрирования дифференциальных урав¬ нений движения ЛА 259 4. 1. 1. Метод Адамса 262 4. 1. 2. Методы прогноза и коррекции 270 4. 1.3. Методы Рунге — Кутта 278 4.1.4. Общие замечания и рекомендации по выбору и примене¬ нию методов численного интегрирования в задачах меха¬ ники полета 296 4. 2. Численные методы расчета равновесных режимов полета ЛА и методы решения краевых задач механики полета (численные методы решения систем нелинейных уравнений) 298 4.2. 1. Итерационные методы решения систем нелинейных уравне¬ ний 300 351
4. 2. 2. Метод простой итерации 4. 2. 3. Метод Ньютона 4. 2. 4. Метод секущих 4.3. Численные методы оптимизации траекторий и управлений по¬ летом летательных аппаратов 4.3.1. Метод функционального градиента 4.3.2. Метод штрафных функций „ . . . . 4. 3. 3. Метод Ньютона — Канторовича Литература Предметный указатель Стр. 309 315 322 332 332 338 340 344 345 Станислав Алексеевич Горбатенко, Эрнст Михайлович Макашов, Юрий Федорович Полушкин, Леонид Вольфович Шефтель РАСЧЕТ И АНАЛИЗ ДВИЖЕНИЯ ЛЕТАТЕЛЬНЫХ АППАРАТОВ Редактор Г. Ф. Лосева Художник Е. Г. Байтман Техн. редактор Т. С. Старых Корректор Е. П. Карнаух Т-13699 Сдано в набор 5/VII-1971 г. Подписано в печать 4/XI-1971- г. Формат бОХЭШЛб Печ. л. 22,0 Уч.-изд. л. 21,36 Бум. л. 11,0 Бумага № 2 Тираж 6000 экз. Изд. зак. № 2921. Цена 1 р. 31 к. Тем. план 1971 г. № ПО. Издательство «Машиностроение», Москва, Б-66, 1-й Басманный пер., 3. Московская типография № 8 Главполиграфпрома Комитета по печати при Совете Министров СССР, Хохловский пер., 7. Тип. зак. 3398
ЗАМЕЧЕННЫЕ ОПЕЧАТКИ Стр. Строка Напечатано Должно быть 89 19 снизу 4s)l*o(s) 0(s)/Sa(s) 99 Формула (2.29) dV (ю) I —— > о d ш (<о—о dV (ш) d LO 6 О V о 144 11 сверху точках области V>0 точках области 1/>0 157 Формула (2.121) + «а, 9^ -ь •Р ^ О + (£-) \ <V /р.=0 195 Формула (3.25) X = X = 201 5,8, 10, 12, 16 снизу Нии н UU 222 Графа 5, 6 снизу -0 = * — /) X 238 Формула (3.84) . <Ь, («) дх дх 250 Формула (3.138) £ ((> Е (t, 273 Графа 2, 3 сверху + 2fr-i)M ~*fr -х)А# 282 ГраЛа 3, 3 сверху 1 — *т 2 ^ 1 — Г *"}“ г 2 - (*1 -Г *2) 285 Графа 4, 7 снизу 28 + 27 Л'’ 18 ~f* ~~ ■ A t, 27 289 Формула (4.36) 2*2 ^ г+ 3 1 хт -Ь 3 J 314 14 снизу + Чр] 1 cl %s + ЧР] ItyjS 326 6 снизу х(р+с ) _ п < р < 0 х^+г\ - п < р < 0 327 1 снизу l|f(x(/,+r))|l Ilf (х^+г>) II2 Заказ ЗЯ98'2921