/
Similar
Text
fl. Д Акуленко
Асимптотические
методы
оптимального
управления
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
19 8 7
ББК 32.81
А44
УДК 681.5
Акуленко Л. Д. Асимптотические методы оптимального управле-
ния.— М.: Наука. Гл. ред. физ.-мат. лит., 1987.— 368 с.
Излагаются эффективные аналитические методы малого параметра для
приближенного решения широких классов задач оптимального управления,
ориентированные на построение синтеза. Актуальность разработки прибли-
женных методов в теоретическом и прикладном аспектах обусловлена важ-
ностью их для практики. Математический аппарат исследований получен
сочетанием асимптотических методов нелинейной механики с методами тео-
рии оптимального управления. Значительное внимание уделяется_ анализу
управляемых колебательных движений, лежащих в основе многих процес-
сов. Развитые подходы подтверждаются решением задач оптимального уп-
равления орбитальными движениями и вращениями космических аппара-
тов, движениями манипуляционных роботов, маятниковых систем, тел с
внутренними степенями свободы и др.
Для специалистов в области механики, теории управления и приклад-
ной математики.
Табл. 4. Ил. 60. Библиогр. 261 назв.
Рецензент
доктор физико-математических наук В, В. Белецкий
1502000000—106
А 053 (02)-87 144-87
Издательство «Наука».
Главная редакция
физико-математической
литературы, 1987
ОГЛАВЛЕНИЕ
Предисловие..........................................• •
Введение ..................................................
Глава 1. Метод усреднения в задачах оптимального управления коле-
баниями квазилинейных систем...............................
§ 1. Управляемые квазилинейные колебательные системы
§ 2. Метод усреднения в задачах оптимального управления дви-
жением квазилинейных колебательных систем на фиксиро-
ванном интервале времени...............................
§ 3. Асимптотическое решение задач оптимального управления с
нефиксированным временем...............................
§ 4. Примеры управления квазилинейными колебаниями механи-
ческих систем .........................................
§ 5. Стабилизация несбалансированного ротора ......
Глава 2, Обоснование асимптотических методов для управляемых
квазилинейных систем и некоторые обобщения........................62
§ 1. Метод канонического усреднения в системах стандартного
вида с вращающейся фазой.....................................62
§ 2. Построение высших приближений решений краевых задач
принципа максимума...........................................68
§ 3. Асимптотическое решение двухточечных краевых задач 72
§ 4. Применение методов усреднения и последовательных при-
ближений для построения общего решения стандартной сис-
темы ........................................................77
§ 5. Усреднение в задачах оптимального управления движением
многочастотных систем и систем более общего вида в окрест-
ности устойчивого интегрального многообразия .... 85
§ 6. Замечания.................................................96
Глава 3. Метод усреднения в задачах оптимального управления одно-
частотными существенно нелинейными колебаниями .... 104
§ 1. Нелинейные системы, приводимые к стандартному виду уп-
равляемых систем с вращающейся фазой.........................104
§ 2. Усреднение в задачах с фиксированным моментом оконча-
ния процесса управления......................................108
§ 3. Асимптотическое исследование задачи оптимального управле-
ния с нефиксированным моментом окончания процесса 119
§ 4. Усреднение существенно нелинейных систем на основе невоз-
мущенных интегралов..........................................124
§ 5. Управление нелинейным осциллятором с регулируемым поло-
жением равновесия............................................130
Глава 4. Обоснование асимптотических методов разделения движений
в существенно нелинейных управляемых системах . . . . 136
§ 1. Приведение к стандартному виду и каноническое усреднение 136
§ 2. Построение высших приближений решения краевой задачи
принципа максимума и задачи оптимального управления 141
4
ОГЛАВЛЕНИЕ
§ 3. Двухпараметрическая схема канонического усреднения 147
§ 4. Исследование задачи оптимального управления на относи-
тельно коротком интервале времени........................149
§ 5. Замечания...............................................154
Глава 5. Управление движениями колебательных систем «типа маят-
ника» ...........................................................158
§ 1. Пространственные колебания маятника с регулируемым по-
ложением точки подвеса.......................................1g®
§ 2. Перемещение маятника по криволинейной трассе ... 161
§ 3. Управление колебаниями и вращениями плоского маятника
с регулируемым ускорением точки подвеса......................165
§ 4. Колебательные системы с управляемым по скорости положе-
нием равновесия..............................................172
§ 5. Перемещение линейной колебательной системы с учетом ма-
лого линейного трения........................................178
§ 6. Синтез оптимального по быстродействию перемещения маят-
ника переменной длины........................................180
§ 7. Оптимальное по быстродействию перемещение маятника с
управляемой длиной подвеса...................................191
§ 8. Параметрическое управление маятником («качели») . . . 193
Глава 6. Задачи оптимального управления орбитальным движением и
вращениями КЛА при помощи «малой тяги»...........................198
§ 1. Оптимальная по быстродействию коррекция орбиты, близкой
к круговой...................................................198
§ 2. Оптимальная эволюция элементов плоской эллиптической ор-
биты ........................................................201
§ 3. Управление вращениями твердого тела, близкого к динами-
чески симметричному, с помощью малых моментов . . . 207
§ 4. Управление вращениями несимметричного твердого тела 212
§ 5. Локально оптимальные и квазиоптимальные законы тормо-
жения .......................................................215
§ 6. Стабилизация КА на эллиптической орбите с помощью ма-
лых управляющих моментов.....................................217
Глава 7Метод динамического программирования для приближенного
синтеза оптимальной стабилизации возмущенных управляемых
систем с инвариантной нормой и эквивалентных им ... . 221
§ 1. Оптимальная по быстродействию стабилизация возмущенной
системы с инвариантной нормой...............................221
§ 2. Оптимальный по быстродействию синтез стабилизации воз-
мущенной системы, близкой к сферически симметричной 231
§ 3. Приближенный синтез оптимального управления движением
по части переменных..........................................238
§ 4. Замечания по реализации приближенного синтеза .... 249
§ 5. Обоснование метода возмущений для построения решения
задачи Коши с конической особой точкой......................253
§ 6. Синтез оптимального управления в задачах с фиксирован-
ным моментом окончания процесса.............................258
Глава 8, Задачи стабилизации и ориентации твердого тела . . . 269
§ 1. Оптимальная по быстродействию стабилизация твердого тела 269
§ 2. Стабилизация тел с внутренними степенями свободы . . . 274
§ 3. Задачи переориентации и стабилизации несимметричного
твердого тела...............................................278
§ 4. Переориентация и коррекция оси аппарата, стабилизирован-
ного вращением..............................................285
§ 5. Импульсное торможение вращений твердого тела . . . 292
ОГЛАВЛЕНИЕ 5
Глава 9. Задачи и методы исследования некоторых возмущенных уп-
равляемых систем.............................................304
§ 1. Построение кривых и поверхностей переключений релейных
управлений для возмущенных неколебательных систем 304
§ 2. Построение приближенного синтеза для гладких систем на
основе динамического программирования......................318
§ 3. Построение возмущенного синтеза с помощью канонических
преобразований.............................................324
§ 4. Исследование некоторых сингулярно возмущенных задач оп-
тимального управления......................................329
§ 5. Приближенный оптимальный синтез для манипуляторов ант-
ропоморфного типа с электромеханическими приводами 333
§ 6. Управление транспортными движениями нагруженного мани-
пулятора с учетом упругости конструкции................346
Список литературы..............................................356
ПРЕДИСЛОВИЕ
Развитие приближенных методов построения управлений и
оптимизации динамических систем вызвано многочисленными
приложениями теории оптимального управления. Основу этих
конструктивных приемов составляют хорошо разработанные и
апробированные в нелинейной механике методы малого парамет-
ра (усреднения, регулярных и сингулярных возмущений) и тео-
рия оптимального управления движением (принцип максимума,
вариационное исчисление и динамическое программирование).
Существенная особенность решения задач управления обуслов-
лена тем, что требуется решать краевые двухточечные задачи
для нелинейных и, как правило, негладких многомерных систем
дифференциальных уравнений. Это затрудняет применение ука-
занных методов теории возмущений, которые разрабатывались,
в основном, для исследования начальных задач (задач Коши).
В настоящее время назрела необходимость в систематическом
изложении конструктивных аналитических методов возмущений
применительно к задачам оптимального управления движением
нелинейных систем.
Цель монографии состоит в том, чтобы восполнить имеющий-
ся недостаток и последовательно изложить развитие методов ма-
лого параметра для конструктивного исследования классов задач
оптимального управления, часто встречающихся в приложениях.
Книга содержит введение, девять глав основного текста, ил-
люстративный материал и список использованной литературы.
Во введении обсуждаются состояние проблемы, способы введения
малого параметра для систем общего вида и различные асимп-
тотические процедуры упрощения и приближенного решения
задач оптимального управления.
В гл. 1 разрабатывается процедура метода усреднения при-
менительно к задачам оптимального управления движением ква-
зилинейных колебательных систем с медленно меняющимися
параметрами. Рассматриваются способы введения малого пара-
метра, излагаются приемы преобразования исходных уравнений
к стандартному виду управляемых систем с вращающейся фазой.
Построены алгоритмы приближенного решения задач управления
в случае фиксированного асимптотически большого интервала
времени, а также задач типа оптимального быстродействия. Ал-
горитмы иллюстрируются решением в первом приближении по 8
ПРЕДИСЛОВИЕ
7
ряда задач оптимального управления движением механических
систем. В гл. 2 рассматриваются вопросы обоснования асимпто-
тических методов решения краевых задач принципа максимума
и задач оптимального управления; обсуждаются возможности и
особенности применения метода усреднения для более общих ква-
зилинейных систем и в критических (нестандартных) ситуациях.
Метод усреднения в задачах оптимального управления дви-
жением существенно нелинейных вращательно-колебательных
систем развивается в гл. 3, 4. В гл. 3 рассматриваются приемы
приведения механических систем общего вида (19) к стандарт-
ному виду (20) (см. Введение) управляемых систем с вращаю-
щейся фазой. Излагаются процедуры построения решения пер-
вого приближения для одпочастотпых задач оптимального уп-
равления на асимптотически большом интервале времени
в случаях фиксированного и свободного моментов окончания про-
цесса. Развиваются схемы усреднения уравнений принципа мак-
симума на основе интегралов движения исходной иевозмущен-
ной системы. В гл. 4 приводится обоснование методов канони-
ческого разделения движений для нелинейных гамильтоновых
систем принципа максимума. Развивается методика построения
высших приближений на основе уравнений Уиттекера; предла-
гается двухпараметрическая схема канонического усреднения,
приводящая к меньшему объему преобразований. Рассматрива-
ются многочастотные системы и системы более общего вида
в окрестности устойчивого локального интегрального многообра-
зия, схемы усреднения на относительно коротком интервале вре-
мени, обсуждаются особенности применения метода усреднения
для нелинейных систем. Общие теоретические результаты ил-
люстрируются решением модельных примеров, имеющих меха-
ническое содержание.
В гл. 5, 6 асимптотическими методами гл. 1—4 исследуются
в первом приближении по малому параметру задачи оптималь-
ного управления движением механических систем, имеющие при-
кладное значение. Глава 5 содержит результаты решения задач
управления колебательными системами «типа маятника» в раз-
личных постановках. Исследуются пространственные и плоские
модели, случаи регулируемой по ускорению или скорости точки
подвеса, случаи переменной или управляемой длины маятника.
Рассматривается задача управления движениями качающегося
груза в вертикальной плоскости с учетом геометрических огра-
ничений. В гл. 6 исследуются задачи оптимального управления
орбитальными движениями и вращениями космического лета-
тельного аппарата (КДА) при помощи «малой тяги». Рассмот-
рены квазиоптимальные и локально оптимальные режимы тор-
можения вращений твердого тела.
Методы малого параметра для решения задач синтеза регу-
лярно возмущенных систем с инвариантной нормой и эквива-
8
ПРЕДИСЛОВИЕ
лептпых им развиваются в гл. 7, 8. Возмущающие воздействия
принимаются из достаточно широкого для приложений класса.
Развивается методика последовательной аппроксимации областей
значений вектора управления и численной реализации алгорит-
мов приближенного решения задачи синтеза. Обосновывается
метод возмущений для решения задачи Коши с конической осо-
бой точкой. Разнообразные задачи стабилизации и ориентации
осей твердого тела, в том числе с внутренними степенями сво-
боды, исследуются в гл. 8.
В гл. 9 обсуждаются и изучаются другие аспекты теории воз-
мущений для исследования управляемых систем, не рассмотрен-
ные в предыдущих главах. Развивается методика построения
кривой переключений релейных управлений для возмущенной
неколебательной системы с одной степенью свободы, обобщается
процедура на случай произвольных возмущений. Строятся про-
цедуры приближенного и асимптотического решения регулярно
и сингулярно возмущенных задач управления, проводится де-
композиция методом канонического разделения движений. При
помощи методов малого параметра эффективно строятся квазиоп-
тимальные управления сложными движениями манипуляционных
роботов, в том числе для упругой конструкции, работающих
в цилиндрической и в угловой сферической системах координат.
В каждой главе нумерация параграфов самостоятельная; для
удобства параграфы разбиты на пункты и подпункты. Номера
формул состоят из трех чисел, указывающих последовательно на
номер главы, номер параграфа и порядковьш помер формулы
в параграфе. При ссылке на формулу внутри параграфа указы-
вается только порядковый помер, ссылка на формулу из другого
параграфа данной главы имеет «двойную» нумерацию, из дру-
гой главы — «тройную». Утверждения (леммы и теоремы) и ри-
сунки имеют «двойную» нумерацию: первое число — помер гла-
вы, где они приводятся, второе — порядковый помер в этой главе.
Основу монографии составляют новые результаты, получен-
ные автором. Некоторые результаты получены в соавторстве
с Н. Н. Болотником (§5 гл. 9), А. Т. Зарембой (§6 гл. 5),
Д. Д. Лещенко (§ 2 гл. 8) и Ф. Л. Черноусько (§ 2 гл. 3). По-
мощь в проведении расчетов мне была оказана С. А. Михайло-
вым (§ 1 гл. 6) и Ю. Р. Рощиным (§3 гл. 5). Некоторые
вопросы применения метода усреднения в неклассических слу-
чаях и канонических преобразований обсуждались с В. Ф. Жу-
равлевым и А. И. Нейштадтом. Автор благодарит Ф. Л. Чер-
ноусько, привлекшего его внимание к асимптотическим методам
оптимального управления, а также всех коллег, оказавших по-
мощь в работе.
Автор также благодарен Р. П. Солдатовой за большую и ква-
лифицированную помощь в оформлении рукописи.
ВВЕДЕНИЕ
1. Состояние проблемы. Методы конструктивного построения
законов управления движениями сложных нелинейных систем и
их оптимизации представляют значительный научный интерес.
Они важны также в прикладном отношении для многих обла-
стей техники. Актуальными традиционно считаются задачи оп-
тимального управления траекторными и вращательными движе-
ниями летательных и космических аппаратов. Повышающиеся
требования к качеству функционирования этих объектов приво-
дят к существенному усложнению механических моделей и не-
обходимости учета возмущающих сил различной физической
природы. Прикладное значение имеют задачи управления слож-
ными динамическими системами, такими, как манипуляционные
роботы, с учетом различного рода неидеальностей их конструк-
ции и системы управления, грузоподъемные машины большой
мощности и вертолеты, несущие качающиеся грузы на гибких
подвесах, и многие другие. Общим для указанных систем явля-
ется наличие колебательных и вращательных звеньев с сосредо-
точенными или распределенными параметрами. Колебательные
движения могут составлять основу управляемого процесса,
а также появляться как нежелательные вследствие указанных
неидеальностей управляемой системы.
Решение задач управления движениями сложных механиче-
ских систем и оптимизации встречает существенные аналитиче-
ские и вычислительные трудности. Это обусловливается необхо-
димостью решения нелинейных двухточечных краевых задач для
многомерных (как правило, негладких) систем дифференциаль-
ных уравнений. Трудности усугубляются, если решения этих
уравнений имеют немонотонный, осциллирующий характер.
Практическая реализация «точных» законов управления в виде
алгоритмов при помощи современных ЭЦВМ значительно ослож-
няется, поскольку программное управление необходимо строить
в реальном масштабе времени быстропротекающих процессов.
Динамика системы управления приводит к дополнительным по-
грешностям колебательного характера. Проблема построения оп-
тимального синтеза, который и представляет практический ин-
терес, также сопряжена с большими трудностями, а его реали-
10
ВВЕДЕНИЕ
зация требует большого объема памяти для записи многомерных
управляющих вектор-функций от большого числа фазовых пере-
менных системы. Поэтому оказывается актуальной разработка
эффективных приближенных методов, в первую очередь анали-
тических и полуаналитических, допускающих существенное уп-
рощение решения задачи при помощи вычислительных средств.
Как правило, встречающиеся в приложениях управляемые си-
стемы содержат малые в некотором смысле воздействия (возму-
щения), слабо влияющие на характер движения. Однако па до-
статочно большом интервале времени возмущения могут накап-
ливаться и приводить к существенному качественному изменению
состояния системы. При построении законов управления требу-
ется оценка влияния этих малых воздействий на качество функ-
ционирования системы, а также их учет, если влияние оказыва-
ется существенным.
В основе методов теории возмущений содержится идея ма-
лого параметра (скалярного или векторного). Развитые в на-
стоящее время асимптотические методы малого параметра —
регулярных и сингулярных возмущений, усреднения и связан-
ных с ним преобразований переменных и др.— широко приме-
няются для исследования сложных задач нелинейной механики,
теории колебаний и т. д. Представляет значительный интерес
в теоретическом и прикладном аспектах развитие этих конструк-
тивных методов малого параметра для эффективного приближен-
ного решения различных классов задач оптимального управле-
ния путем сочетания указанных аналитических методов и мето-
дов теории оптимального управления.
Для динамических систем с конечным числом степеней сво-
боды теория оптимального управления движением развита в зна-
чительной степени. Проблема построения оптимального управле-
ния может быть поставлена и исследована при помощи наиболее
общих необходимых условий локальной оптимальности принципа
максимума Л. С. Понтрягина [180]. В ряде важных для прило-
жений случаев эти условия составляют основу необходимых и
достаточных условий оптимальности. В задачах построения опти-
мального синтеза широко применяется также метод динамиче-
ского программирования, предложенный Р. Веллманом [53]. Для
исследования важного класса линейных управляемых систем
применяется метод моментов, разработанный Н. Н. Красовским
[115]. Метод моментов получил дальнейшее развитие для иссле-
дования управляемых систем с распределенными параметрами
[65, 134]. Интенсивно развиваются методы функционального ана-
лиза и вычислительные методы.
Разработке аналитических и численных методов построения
оптимальных управлений для динамических систем и их прило-
жениям посвящены многие исследования отечественных и зару-
бежных ученых [6, 11, 13, 20, 21, 24, 26, 28, 29, 36—42, 49,
ВВЕДЕНИЕ
11
61, 68, 71-74, 77, 84, 87, 88, 90-92, 100-103, 106-108, 111,
115, 116, 118, 126, 129-131, 138, 139, 145, 154-157, 159, 168—
171, 173, 185-187, 191, 194, 198, 200, 205-207, 209, 211-216,
222, 229, 230, 233-235, 238—240, 243—252, 254-261].
Предлагаемая монография содержит систематическое разви-
тие асимптотических методов малого параметра для конструктив-
ного исследования задач оптимального управления движениями
некоторых классов нелинейных механических систем, содержа-
щих колебательные и вращательные звенья. Эти методы ориен-
тированы на построение приближенного синтеза. Существенная
часть результатов посвящена исследованию на основе принципа
максимума и метода усреднения управляемых колебательных
систем на асимптотически большом интервале времени. Большое
внимание уделяется разработке регулярного метода возмущений
для построения синтеза оптимального управления при помощи
динамического программирования. Рассматриваются вопросы
применения метода регулярных и сингулярных возмущений для
построения кривых и поверхностей переключений релейных уп-
равлений, для приближенного построения синтеза в гладких за-
дачах управления общего вида, для декомпозиции и оптими-
зации слабосвязанных систем и др. Разработка и обоснование
общих процедур сопровождается построением приближенных
решений конкретных задач оптимального управления, имеющих
механическое содержание. Обсуждается ряд нерешенных про-
блем в области асимптотических методов оптимального уп-
равления.
Опыт практического применения методов малого параметра
показывает их достаточно высокую эффективность, если упро-
щенные (порождающие) задачи или так называемые задачи пер-
вого приближения могут быть решены существенно проще, не-
жели исходные. Невозмущепная система обычно имеет более
простой вид — не содержит ряда членов, обращается в линейную
или распадается на несвязанные подсистемы меньшей размерно-
сти. Асимптотические методы позволяют уменьшить размерность
системы и разделить медленные и быстрые движения. В ряде
случаев удается провести аналитические построения или свести
задачи к более простым и предложить алгоритмы численного
решения. Кроме того, асимптотические методы позволяют решать
актуальную проблему построения простых для практической
реализации квазиоптимальных законов управления и проводить
щенки влияния различных возмущающих факторов на качество
функционирования управляемой динамической системы.
2. Управляемые динамические системы, введение параметров.
Управляемые динамические системы широко распространены
в современной технике; на некотором этапе исследования они
могут быть рассмотрены в рамках механических моделей с сосре-
тоточенными и распределенными параметрами. Как отмечалось,
12
ВВЕДЕНИЕ
существенным для таких объектов является наличие колебатель-
ных процессов.
Имеется много важных в прикладном отношении постановок
задач динамики и управления движением таких систем в рам-
ках механических моделей с сосредоточенными параметрами.
Это — системы твердых тел и тел с внутренними степенями сво-
боды, гиростаты, гироскопические системы, маятники и осцил-
ляторы, несбалансированные роторы, КЛА, манипуляционные
роботы и многие другие. Как правило, движения перечисленных
механических объектов описываются обыкновенными дифферен-
циальными уравнениями, содержащими управляющие воздей-
ствия (функции или параметры) и имеющими решения враща-
тельно-колебательного типа. Кроме того, движение системы ха-
рактеризуется набором конструктивных параметров — постоянных
или изменяющихся во времени — и начальными условиями.
Вращательно-колебательные системы с распределенными па-
раметрами обычно описываются дифференциальными или инте-
гродифференциальными уравнениями гиперболического или эл-
липтического типов с соответствующими краевыми (граничными)
условиями и обыкновенными дифференциальными уравнениями.
Эти системы содержат распределенные или сосредоточенные на
некоторых многообразиях (областях меньшей размерности, обыч-
но на границах или сосредоточенных элементах) управляющие
воздействия. В качестве механических моделей можно взять си-
стемы, содержащие твердые тела, маховики, материальные точки
и т. п., соединенные упругими элементами с распределенными
и сосредоточенными характеристиками (струны, стержни, по-
лости с жидкостью и др.). Примерами из техники являются
такие объекты, как крупногабаритные космические конструк-
ции, тросовые системы большой протяженности, манипуляцион-
ные роботы с существенной упругой податливостью звеньев,
аппараты, содержащие полости с тяжелой жидкостью — одно-
родной, со свободной поверхностью или стратифицированной, ко-
торая может также целиком заполнять сосуд (танкеры, цистер-
ны) и т. п.
Ограничиваясь при рассмотрении механических колебатель-
ных систем, имеющих распределенные параметры, некоторыми
предельными случаями, например квазистатическим приближе-
нием для упругих систем или учетом конечного числа низших
мод колебаний, можно прийти к конечномерным колебательным
системам. И наоборот, углубленное изучение механических про-
цессов в ряде объектов большой размерности с сосредоточенны-
ми элементами может привести к более удобной для исследова-
ния модели с распределенными характеристиками.
Разрабатываемые в монографии методы асимптотического
анализа управляемых динамических систем предполагают нали-
чие числового параметра. Этот параметр характеризует отноше-
ВВЕДЕНИЕ
13
ния различных размерных физических величин, и способы его
введения могут быть весьма многообразными. Некоторому пре-
дельному значению параметра отвечает так называемое порож-
дающее, или невозмущенное, движение. Ставится задача иссле-
дования решения в малой окрестности указанного значения и
конструктивного построения возмущенного решения. Идеи и ме-
тоды малого параметра получили значительное развитие в иссле-
дованиях А. Пуанкаре и А. М. Ляпунова [184, 141].
Ниже приводятся и обсуждаются основные постановки задач
оптимального управления движением возмущенных динамиче-
ских систем и некоторые методы их исследования. Итак, рас-
сматривается конечномерная система общего вида
г = 7?(£, г, и, pi), = (1)'
Здесь г — вектор фазовых координат и переменных параметров
системы, r^Dr, r = (rh ..., rn); точкой обозначено дифференци-
рование по аргументу (времени t, I7]). Величина Т (Т <
<оо) может быть заданной или определяться в процессе реше-
ния задачи управления. Далее, в (1) и — вектор управляющих
функций из допустимого класса со значениями из фиксированной
выпуклой области U*.
u — u(t, pi), u = u(t, г, pi). (2)
Вектор pi постоянных параметров системы (1) может принимать
значения из некоторой области р1^Ри, 2)^ = const. Начальные
значения f0, г° предполагаются заданными, при этом допускает-
ся, чтобы ^о = ^о(ц); заданная величина также может зависеть
от pi: Т = Г(ц). Множества 2)r, суть фиксированные и связ-
ные, причем Dr — открытая область.
В качестве допустимых управлений и из заданного класса °U
принимаются, как правило, кусочно-непрерывные функции t и
кусочно-гладкие по г. В случае переменного множества U вида
U = U(t, г. pi) предполагается существование гладкого однознач-
ного преобразования точек ue U в точки где U = 17 (pi) —
постоянное множество.
Цель управления и условие окончания процесса принимаются
в виде векторного равенства
Q{t, г, ц)1(=г = 0, (?=(<?„.., &), к>0. (3)'
Соотношения (3), естественно, должны быть непротиворечивыми.
Минимизируемый функционал, заданный на траекториях уп-
равляемого движения и характеризующий качество управления,
для определенности принимается в виде скалярной функции ко-
нечных значений фазового вектора г и t:
Jii [u] = Ф (t, г, pi) |f=T min, u<=U (pi). (4)
и
Все введенные выше функции и граница множества U пред-
полагаются достаточно гладкими в рассматриваемой области
14
ВВЕДЕНИЕ
изменения аргументов
(£, г, и, н)е T]XDrXUXD>. (5)
Решение задачи оптимального управления (1) —(5) состоит
в нахождении допустимых управлений в форме программы и =
~up(t, pj или синтеза u = u3(f, г, ц), которые однозначно опре-
деляют движение системы, в построении оптимальной траекто-
рии r = r(t, t0, r°, р,), t^[tQ, Г], доставляющей минимум функ-
ционалу 7ц[и], и в вычислении момента Т(ц) окончания процес-
са (при Т не заданном). Для приложений существенный интерес
представляет исследование вопроса о степени гладкости решения
по параметру р, р^-Ой. Следует отличать приведенную выше
постановку задачи оптимального управления движением дина-
мической системы с параметром от соответствующей постановки
задачи оптимального управления с (управляющим) параметром
[180, 61].
3. Принцип максимума и методы возмущений. Анализ постав-
ленной задачи оптимального управления (1) — (5) проводится
при помощи математического аппарата принципа максимума,
дающего необходимые условия локальной оптимальности управ-
ления u*(Z) из достаточно широкого для приложений класса
кусочно-непрерывных функций. Для этого, согласно [180], вво-
дится функция Гамильтона Н:
H = (p-R), R = R(t, г, и, р), (6)
где р — n-вектор, сопряженный г:
дН* dR* ту. г>\
Р= — — = —Р — ' Н* = Н]п*. R* = R\U*. .7)
Он удовлетворяет на правом конце траектории, т. е. при t = Т,
условию трансверсальности
р(П = 4^-<?)-ф11т- -3)
где % — /с-вектор постоянных множителей Лагранжа.
Необходимое условие оптимальности (принцип максимума
1180]) состоит в том, что для оптимальности процесса управле-
ния u*(fj и соответствующей траектории r*(t) необходимо су-
ществование такого вектора p(t), что функция Н (6) удовлетво-
ряет условию
Н* = sup Н, t^[tQ,T]. (9)
u&U
Здесь p(t) — решение линейной системы (7), удовлетворяющее
условию трансверсальности (8). Кроме того, для функции /7*
выполняется следующее условие трансверсальности:
= - [(л.0 - ф) иО)
ВВЕДЕНИЕ
15
В прикладном и конструктивном отношениях содержательный
аспект условий принципа максимума весьма велик. Он заключа-
ется в том, что если максимум функции Я, согласно (9), дости-
гается и достаточно гладкая функция и однозначно определяется
в виде
и = и* (t, г, р, |л), и* == arg max Н, (11)
u^U
то подстановка ее в функции, содержащие управление, приводит
к замкнутой двухточечной краевой задаче принципа максимума.
Она описывается гамильтоновой системой уравнений и краевы-
ми условиями
г = = /?*(*, г, р, у.), н*==н\и*,
Р = -д-^ = -£(р-к*),
(12)
r(U = r°. С|т = 0, р(Т) = Х[(Х.0-Ф]|п
я*|т = -^ЧМ)-Ф1Ь'-
Следует отметить, что в уравнениях (12) использовано свойство
дифференцируемости функции максимума [87, 189], справедли-
вое при U = const:
дН I дН* дН I дН*
др |u# др ' дг\и*~~ дг ' ' '
Краевая задача принципа максимума составляет основу мно-
гих математических методов оптимального управления.
Среди решений краевой задачи принципа максимума (12)
находится оптимальное. Если решение единственно, то оно и яв-
ляется оптимальным [180]; в противном случае для определения
оптимального используется функционал (4).
Таким образом, алгоритм решения задачи оптимального уп-
равления (1) —(5) сводится к операции определения функции
и* (И), доставляющей максимум функции Гамильтона Н в за-
данной области U при фиксированных t, г, р, ц и решению крае-
вой задачи принципа максимума (12)
Г = Г* (<> г0’ г°> Т, н)> Р=Р* (*> *о> г°> г> и)-
Т], Т = Т(ц) (Т = T*(t0, и)), (14)
и = w* (t, г*, р*, ft)
с последующим выбором оптимального решения согласно (4),
если решение неединственно. Если же функция и* находится из
условия (9) неоднозначно, что имеет место, например, при р^О,
то эта критическая ситуация приводит, как правило, к особым
16
ВВЕДЕНИЕ
вырожденным управлениям [72, 73, 118, 211, 215, 235]. Такие
случаи часто встречаются в прикладных задачах. Они требуют
дополнительных исследований необходимых и достаточных усло-
вий оптимальности [56, 72, 73, 118, 211, 215, 235, 248] и учета
специфических особенностей конкретной управляемой системы.
Следует отметить, что точное аналитическое решение вида (14)
краевой задачи принципа максимума (12) удается построить
сравнительно редко для определенных частных классов задач
оптимального управления.
Значительное развитие получили численные методы оптималь-
ного управления, основанные на математическом аппарате прин-
ципа максимума [62, 84, 155, 156, 207, 230]. Однако, как отме-
чалось, численное построение решения краевой задачи требует
больших быстродействия и оперативной памяти, часто недости-
жимых для современных ЭЦВМ. Непосредственное использова-
ние вычислительных процедур приводит к значительным труд-
ностям принципиального характера: неустойчивость решений,
непродолжаемость, отсутствие сходимости и т. п. Применение
численных методов затрудняется в тех ситуациях, когда требу-
ется построить управления в реальном масштабе времени. Их
эффективность уменьшается в случаях, когда движение имеет
осциллирующий характер, интервал времени велик (малые уп-
равления), а система (12) имеет высокую размерность. Трудно-
сти усугубляются существенной нелинейностью и негладкостыо
уравнений краевой задачи.
Прикладные задачи оптимального управления, как правило,
содержат ряд малых величин (малых параметров), характеризу-
ющих относительные величины тех или иных воздействий и фак-
торов. Приведенная выше постановка позволяет просто ввести
векторный малый параметр б:
ц = Цо + 6, 6 = 0^ZZj. (15)
Здесь Цо ~ невозмущенное значение, для которого решение крае-
вой задачи (12) строится существенно проще. Ставится задача
его конструктивного построения при 1б1 >0 достаточно малом.
В приложениях, однако, удобнее использовать некоторый скаляр-
ный числовой параметр е > 0. Его можно ввести, например, сле-
дующим формальным способом:
ц = ц(е)=ц(0)+ец! + ..., е €= [0, е0], 80«1. (16)
Поэтому представляется важным и актуальным развитие эффек-
тивных аналитических и полуаналитических методов приближен-
ного построения искомого решения (14), основанных на мето-
дах малого параметра. Асимптотические методы исследования
динамических систем разработаны и широко используются в не-
линейной механике и в теории нелинейных колебаний [8, 10, 12,
18, 43, 45—47, 50, 57-59, 63, 66, 67, 69, 70, 75, 82, 85, 89,
ВВЕДЕНИЕ
17
97, 121, 122, 141, 147—150, 154, 158, 162, 219, 220]. Установлено
также, что формальное введение малого параметра часто бывает
целесообразным при построении начального приближения в чис-
ленных процедурах оптимизации [222, 229, 230].
Далее рассматривается случай (16) скалярного малого па-
раметра 8, 8^[0, 80]. Вхождение величины 8 в задачу оптималь-
ного управления (1) —(5) и тем самым в краевую задачу прин-
ципа максимума (12) может быть весьма многообразным и слож-
ным. Это приводит к необходимости введения ряда упрощающих
допущений. Предполагается, что по отношению к параметру 8
размер области управлений Ue имеет «нулевой порядок», т. е.
|u| ~ 1. Функции Q, Ф считаются регулярно возмущенными:
Q = Q(t,r, 8) = (?о(^г)+8(?1 + 82...,
Ф = Ф(£, г, 8) = Фо(/, г)+8Ф1 + 82...
Фазовый вектор г может содержать «медленную» ж, «быст-
рую» у и «сингулярную» z составляющие, т. е. для функции R
справедливы представления
R = (7?х, Ry, Rz), пх + пу + nz = п,
Rx — 8X1 (t, X, у, Z, и) + 82 . . ., Xi ~ 1, I > 1,
/?у = У0(£, х, у, z, и)+ еУ1 + 82..., У>~1, 7>0, (18)
Rz — 8-1Z-i (t, х, у, z, и) + Zo + 8 ..., Zh ~ 1, к > —1,
T], T = T(e), 8s[0, 8o],
(x, y, z, u)^ DxXDyXDzX Ue.
Если Z-i 5^ 0, т. e. n2#=0, то задача оптимального управления
(1) — (5) и краевая задача принципа максимума (12) оказыва-
ются сингулярно возмущенными: их порядки уменьшаются на
nz и 2nz соответственно. Исследование таких задач управления
получило развитие в работах [252, 254, 257, 260] и др. (см. об-
зор [68]). Здесь применяются асимптотические методы обыкно-
венных дифференциальных уравнений с малым параметром при
части производных [67, 135, 158, 199].
Формально при 8 = 0 получается конечное уравнение Z_4 = 0,
из которого определяется изолированный, по предположению
асимптотически устойчивый корень z = z*(t, х, у, и). Подста-
новка z* в Rx, Ry (18) в предположении независимости Q, Ф
(17) и регулярности управления и в первом приближении по 8
приводит к регулярно возмущенной «вырожденной» задаче мень-
шей размерности. При выполнении ряда требований гладкости
можно установить свойства близости исходной и упрощенной
краевых задач по переменным х, у. Следует отметить, что пе-
ременная z может иметь погранслойные участки при t == tQ,
t — T и в других точках, где управление и изменяется релейно.
2 Л. Д. Акуленко
18
ВВЕДЕНИЕ
Далее рассматривается, в основном, возмущенная управляе-
мая система, содержащая только медленную х и быструю у век-
торные переменные, т. е. г = (я, у). Задача оптимального управ-
ления описывается уравнениями, краевыми условиями и функ-
ционалом, вытекающими из (1) —(5):
х = еХ (t, х, у, и, б), х (£0) = х°,
у = Уо (£, х, у, и) + еУ (t, х, у, и, е), у (tQ) == у°, (19)
Q (t, х, у, е) |г = 0, /е [zz] = Ф (t, х. у, е) |r->min ,
u^U&
При исследовании задачи оптимального управления (19) и соот-
ветствующей краевой задачи принципа максимума, следующей
из (12), по отношению к величине интервала времени, на кото-
ром происходит процесс управления движением системы, суще-
ственно различаются два случая. Если интервал времени (T — tQ)
равномерно ограничен для всех ё е [0, в0], то имеет место регу-
лярная ситуация метода возмущений, приводящая к регулярным
разложениям. В случае, когда управляющие воздействия малы,
порядка е, а момент времени Т ©о асимптотически при е О,
например Т = 0б-1, 0 ~ 1, то ситуация становится нерегулярной,
требующей привлечения асимптотических методов разделения
медленной и быстрой переменных.
4. Асимптотические методы разделения движений (усредне-
ния) в задачах оптимального управления. На асимптотически
большом интервале времени исследуется движение слабоуправ-
ляемой вращательно-колебательной системы (19), приведенной
к стандартному виду с вращающейся фазой (см. § 1 гл. 1,
§ 1 гл. 3):
а = е/ (л, ф, zz, е), а (/0) = а°, Da,
ф = со (а) + zF (а, ф, и, е), ф (t0) = гр°, ф е
(20)
а = (а1? . . ., аПа), па>1; ф = (ф1? ..., фПф), пф>1;
со; (а) (о® > 0, 1 = 1,...,^; t <= Т], Т = 0е~\
Конечные условия и функционал аналогичны (19). Здесь а —
медленный вектор, изменяющийся в ограниченной области Da,
ф — вращающаяся фаза, значения которой неограничены. Возму-
щающие функции /, F предполагаются периодическими или ква-
зипериодическими по ф. При заданной функции и, удовлетворя-
ющей дополнительным условиям гладкости и периодичности,
естественно проводить исследование краевой задачи при помощи
хорошо развитого математического аппарата метода усреднения
Крылова — Боголюбова [121, 58], обобщенного в многочисленных
монографиях и статьях [19, 23, 47, 57, 59, 64, 69, 70, 82, 85, 89,
ВВЕДЕНИЕ
19
95-97, 119, 122, 143, 147-150, 161-167, 192, 208, 241]. Этот
метод связан с приближенным по степеням е преобразованием
исходной системы уравнении краевой задачи к более простой,
не содержащей быстрой переменной — фазы ф в правой части
уравнений для медленных переменных. В результате уравнения
для управляемых медленных переменных отделяются, и в ряде
случаев размерность краевой задачи значительно уменьшается.
Введение медленного времени т = е£ приводит к интегрированию
усредненных медленных переменных на относительно коротком
интервале аргумента т^[т0, 0], т0 = е£0, что существенно умень-
шает объем расчетов при использовании ЭЦВМ. Кроме того,
метод усреднения позволяет исследовать ряд особенностей реше-
ния краевой задачи.
Первые работы, в которых применялся метод усреднения для
приближенного исследования задач управления и оптимизации,
были опубликованы в 60-х годах [2, 3, 90, 127, 154, 244, 245.
256, 258, 259, 261]. Результаты сочетания теории управленпя и
метода усреднения нашли применение в динамике космических
летательных аппаратов для управления и оптимизации орби-
тальных полетов. Систематические исследования по развитию
асимптотических методов и их приложениям для решения задач
оптимального управления проводились в 70-х годах [6, 7, 11. 13,
19, 36, 71, 77, 160, 173-178, 229, 238, 239, 247, 249, 250]. Сле-
дует отметить, что асимптотическому исследованию особенностей
решений краевых задач принципа максимума уделялось недо-
статочное внимание. Применение метода усреднения к аппарату
уравнений в контингенциях (управляемые системы описываются
дифференциальными включениями) не позволяет строить регу-
лярные уточняющие процедуры, а также исследовать задачи ти-
на оптимального быстродействия с фиксированным конечным
многообразием, рассмотреть топкие особенности задачи опти-
мального управления с переменными частотами (со = со (а) пли
о) =v(t) ) ит. п.
В работах автора, например в [6, 7, И, 13, 19, 26, 36, 229,
238], основное внимание уделялось систематическому исследова-
нию краевой задачи принципа максимума. Такой подход позво-
ляет регулярным образом проводить аналитические построения,
используя теорию гамильтоновых систем и асимптотических раз-
гожений. Значительная часть монографии (гл. 1—6) посвящена
юимптотическому исследованию классов задач оптимального уп-
равления движением вращательно-колебательных систем прп по-
мощи методов разделения медленных и быстрых переменных.
Приведенные здесь результаты существенно расширяют и обоб-
щают материал, изложенный в [229].
5. Методы регулярных возмущений и динамическое програм-
мирование. В случае ограниченной величины Г е Е [0, е0], ммее^
чеето так называемая регулярно возмущенная задача опта мал ь*
20
ВВЕДЕНИЕ
ного управления (19) (при этом можно не выделять медленный
вектор х). Предполагается, что решение задачи для всех е, е <=
<= [0, е0], существует и единственно, а при е = 0 может быть
сравнительно просто построено (аналитически или численно) и
считается известным. Требуется исследовать важный для прило-
жений вопрос об оценке погрешности невозмущенного решения
по функционалу, управлению, траектории и конечным условиям.
Если погрешности, вызванные отбрасыванием в (19) членов по-
рядка е, существенны, то возникает проблема построения при-
ближенного решения задачи оптимального управления с учетом
малого параметра, т. е. вычисления поправок или приближенно-
го упрощения системы с достаточной степенью точности по 8.
Этот естественный прием исследования сложных задач управ-
ления широко используется также при линеаризации систем
в окрестности известного или заданного (программного, номи-
нального) движения. Тогда в системе (19) функция Уо линей-
на по у, и, а нелинейности входят в виде малых возмущений.
Невозмущенная система оказывается линейной; методы решения
задач оптимального управления в форме программы или синтеза
(по обратной связи) для таких систем развиты в значительной
степени [40, 49, 53, 54, 61, 62, 101, 106—108, 115, 126, 130, 145,
159, 198, 251]. В ряде важных для приложений задач управле-
ния движением сложных систем со многими степенями свободы
удается разбить ее на подсистемы со слабой связью между ними,
которая может быть формально описана малым параметром.
В невозмущенном состоянии задача оптимального управления
распадается на ряд задач для подсистем меньшей размерности,
для которых решение строится существенно проще. Взаимное
влияние подсистем на искомое решение может быть учтено ме-
тодами возмущений. В приложениях применим также другой
подход, связанный с исследованием так называемых слабоуправ-
ляемых систем [222, 229, 74]. Предполагается, что невозмущен-
ная при 8 = 0 система (19) становится неуправляемой, а крае-
вые условия автоматически выполняются. Учет членов О (г) про-
изводится разложениями или последовательными приближения-
ми по малому параметру. К этой постановке преобразуется ис-
ходная задача (19). Действительно, подстановка и = uQ(t)+ v,
где uQ (t) е Uо с= Ue — программное управление невозмущенной
задачи, для нового управления v s Ve (V8 = 0 при 8 = 0, и =
= 0 Уе) приводит к указанной выше модели системы со «сла-
бым» управлением.
В приложениях часто возникает необходимость построения
синтеза оптимального управления возмущенными существенно
нелинейными системами. Имеется ряд задач, для которых целе-
сообразно применение метода возмущений на основе математи-
ческого аппарата метода динамического программирования, при-
водящего к решению уравнения Гамильтона — Якоби для функ-
ВВЕДЕНИЕ
21
ции Веллмана, см. [1, 53, 61, 62, 106, 116, 125, 126, 130, 159,
251].
Для задачи оптимального управления общего вида (19) про-
блема заключается в следующем. Требуется найти функцию
Веллмана S = S(t, г, е), где S — значение функционала (19),
отвечающее текущей точке (t, г). Функция S удовлетворяет не-
обходимым условиям оптимальности — уравнению Гамильтона —
Якоби и конечным условиям [53, 61]:
+ min г, и, ей = 0, (21)
01 и=и£\°г J
£(£, г, е) |г = Ф(£, г, е) It, Q(t, г, е)|г = 0. (22)
Из условия минимума скалярного произведения в соотношении
(21) определяется управление и в виде
[ j. dS \ • ( OS Т)\ /О9\
и = и* It, г, —, 8 , = argmin . (23)
\ / w=^e \ /
После подстановки выражения и* (23) в (21) с учетом условий
(22) получается замкнутая задача Коши для нелинейного урав-
нения в частных производных:
dS . f dS туf, dS \ \ \ г» /o/\
at + [~aTR r' u* I/’ r’ aP J = °* (24)
Требуется построить гладкое решение задачи Коши (24),
(22), удовлетворяющее достаточным условиям оптимальности
[61], для значений 8^(0, 80] в предположении, что при 8 = 0
такое решение известно. В общем случае применение метода
возмущений затруднено, так как функция и* (23), а вместе
с нею и левая часть уравнения (24) не являются гладкими.
Следует отметить, что этой проблеме, интересной в теоретиче-
ском и важной в прикладном аспектах, уделяется недостаточное
внимание, что отчасти можно объяснить существенными матема-
тическими трудностями, связанными с исследованием и прибли-
женным решением нелинейной задачи Коши типа (24), (22).
Отдельные исследования посвящены построению алгоритмов при-
ближенного решения задач управления и стабилизации для глад-
ких систем, в частности, с квадратическим функционалом [62,
106, 116, 125, 130, 251].
Можно выделить также важный для приложений класс уп-
равляемых систем, для которых оптимальный закон управления
при 8 = 0 находится весьма просто при помощи функционально-
го неравенства Шварца [49, 115]. Этот математический аппарат
эффективен для оценок и построения синтеза управления опти-
мальной по быстродействию стабилизации систем с инвариант-
ной нормой и эквивалентных им при выполнении дополнитель-
ных упрощающих предположений, см. [49, 115, 130, 131].
22
ВВЕДЕНИЕ
Монография содержит полученные автором [14—16, 20—22,
32, 35] результаты исследования интересного для приложений
класса задач оптимальной стабилизации таких систем с учетом
возмущений весьма общего вида (гл. 7, 8). На основе регуляр-
ного метода возмущений для задачи Коши (24), (22) и метода
характеристик Коши [172, 197] строится функция Веллмана 5,
обладающая особенностью типа «конической точки» в начале
координат (г = 0), и на ее основе приближенное оптимальное
управление в форме синтеза с заданной степенью точности по 8.
Алгоритм решения допускает также простую численную реали-
зацию. Интегрирование замкнутой задачи Коши для системы
типа (19) с известным управлением по обратной связи позволяет
построить приближенную оптимальную траекторию и программ-
ное управление. Метод оказался пригодным для приближенного
решения ряда возмущенных задач оптимального по быстродей-
ствию торможения вращений твердых тел относительно непод-
вижной точки (центра масс), в том числе объектов с внутрен-
ними степенями свободы, имеющих приложения к динамике кос-
мических и летательных аппаратов.
Возможности методов малого параметра не исчерпываются
описанными выше классами возмущенных задач оптимального
управления. Некоторые другие задачи при помощи метода воз-
мущений рассмотрены в гл. 9. В частности, оказывается эффек-
тивным применение метода возмущений для построения кривых
и поверхностей переключений релейных управлений в случае
так называемых неосциллирующих объектов [61]. Асимптотиче-
ские методы позволяют исследовать ряд задач управления дви-
жением для таких сложных электромеханических систем, как
манипуляционные роботы, в том числе для моделей с учетом
упругости звеньев и редуктора.
ГЛАВА 1
МЕТОД УСРЕДНЕНИЯ
В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
КОЛЕБАНИЯМИ КВАЗИЛИНЕЙНЫХ СИСТЕМ
Рассматривается широкий класс задач управления движением
квазилинейных колебательных и вращательных систем на асимп-
тотически большом интервале времени при помощи малых уп-
равляющих воздействий. Развивается приближенный метод ре-
шения, основанный на сочетании принципа максимума [180] и
асимптотических методов нелинейной механики [58, 69, 70, 148].
В первом приближении исследованы задачи, имеющие механи-
ческое содержание.
§ 1. Управляемые квазилинейные колебательные системы
1. Одночастотная управляемая система общего вида. Рассмат-
ривается система, содержащая медленную х и быструю у пере-
менные [229]:
х = еХ(т, ж, у, u), гг (^0) = а:0,
У = У0(т, х, z/)+ еУ(т, х, у, и), y(t0) = y'>.
Здесь t<^ [/0, 71] —время, Т = 08-1, 0 = const; х е Dx — вектор
размерности пх, y^Dy — вектор размерности пу > 1 (пх + пу > 2);
и е U — управляющая вектор-функция размерности m > 1, т =
= st — медленное время, е [0, е0] — малый параметр. Функции
X, Уо, У предполагаются достаточно гладкими в рассматривае-
мой области изменения аргументов; свойства гладкости уточня-
ются ниже. Открытые связные множества Dx, Dy суть открытые
области; область Dx ограничена, a Dy не ограничена. Множество
?7, как правило (см. Введение), связное и фиксированное. По-
стоянные t0, х\ yQ — начальные данные, причем xQ Dx, yQ е Dy.
Параметры tQ, xQ, у\ а также функции X, У могут непрерывно
зависеть от е. Однако для сокращения записи эта зависимость
не указывается.
24
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
Система (1) приводится к стандартному виду в предположе-
нии, что при 6 = 0
г/ = У0(т, х, у), х, т = const (1.1.2)
она допускает общее одночастотное решение вида
У = У0 х,х) = Р (гр) + ср (гр, с, х, т),
Р = (Рх, ..., Рп^), Pi = Щгрг/(2л), i = 1, ..., тц,
гр = v (т) (t — ?0) + гр0, с. гр0 = const, (1.1,3>
Уо (т, X. у + П) = Уо (т, х, у).
Здесь П — постоянный м^-вектор с составляющими, равными ну-
лю для колеблющихся переменных и отличными от нуля — для
вращающихся; ф — 2л-периодическая функция векторной фазы
гр; v(t) — векторная частота, Vi(T)>vi0>0, vi0 = const; (с, гр0) —
Му-вектор постоянных интегрирования: c^Dc, |гр01 < °°, м^ + мс =
= пу 1.
Соотношения (3) при е > 0 используются в качестве замены
переменных (х, у, т) -> (х, с, гр, т). Дифференцирование их
в силу (1) и использование тождества (dyQ/d^)v = У0(т, х, yQ)
приводит к системе с начальными условиями
х = еХ(т, х, у о (гр, с, х, т), u), x(tQ) = xQ,
с = еС(т, х, с, гр, и), с(£о) = с°, (1.1.4)
гр = v(t)+еТ(т, х, с, гр, и), гр(^о)=='Ф°.
Здесь функции С, Т определяются как однозначное решение
линейной алгебраической системы
d^W+^C=Y^X,y0,u)-^-^X(x, х,у0,и),
(1.1.5)
Правая часть системы (4) будет 2л-периодической по гр,
если функции X, У П-периодичны по у. Начальные значения
для с, гр вычисляются согласно (3). Объединение ж, с в один
мв-вектор а приводит к управляемой системе стандартного вида
с вращающейся фазой:
а = е/(т, а, гр, u), a(tQ) = a°,
(1.1.6)
гр = v(t)+cF(t, а, гр, и), гр(£0) = гр°.
§ 1. УПРАВЛЯЕМЫЕ КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
25
Здесь /, F — достаточно гладкие функции в области a^Da (Da =
= DxXDc), т^[т0( 0], u^U. Системы типа (6) без и в теории
нелинейных колебаний принято называть квазилинейными [58,
69, 141, 148]. По аналогии система (6) называется управляемой
квазилинейной системой в стандартной форме с вращающейся
фазой [229].
Следует отметить, что зависимость v(t) может быть задана
более сложным образом, например, в виде
v(t) = Q(z), z = eZ(z), z(tQ)=z°, (1.1.7)
где z — медленный вектор произвольной размерности nz 0.
Чтобы полностью определить движение, нужно в системе (6)
задать управление и как функцию времени t или t и фазовых
переменных а, *ф. К допустимым управлениям будут относиться
кусочно-непрерывные функции u(t) или u(t, а, *ф), и &U, такие,
что подстановка их в (6) приводит к системе уравнений, реше-
ние которой существует и, как правило, единственно для t е
[tQ, Г], Т = 08-1. Движение рассматривается на асимптотиче-
ски большом интервале времени t — tQ ~ на котором медлен-
ная переменная а получает, вообще говоря, приращение а — aQ ~
~ 1, а фаза — приращение ~ е^1. Дополнительные требо-
вания, налагаемые на управление щ вытекают из постановки за-
дачи оптимального управления и будут установлены ниже.
Нужно еще отметить, что запись исходной системы уравне-
ний движения в форме (1) есть известная дань традиции
[58, 69, 148]. Без уменьшения общности (при сделанных пред-
положениях относительно порождающей системы (2)) вектор х
можно включить в состав вектора у. Более общий случай, когда
размерность вектора с в (3) меньше — рассматривается
в § 5 гл, 2.
2. Многочастотная квазилинейная система. Рассматривается
колебательная система со многими степенями свободы и медлен-
но изменяющимися параметрами, приведенная к нормальной
форме-.1
Уг + V? (т) yi = Yi (т, х) + e/i (т, х, у, у, и),
Уг(!0) = У1, yi(to) = yoi, v|>v?o>0, i = l, (1.1.8)
х = еХ(т, х, у, у, и), x(tQ) = xQ.
При 8 = 0 система совершает^ колебания относительно сме-
щенного положения равновесия Уг = (т, х) v^~2 (т). Преобразо-
вание типа (3) можно применить к каждой составляющей yit уе.
yi = a<sint|)< + iyi(T, х), у{ = a^cos^, (1.1.9)
26
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
где at — амплитуды парциальных колебаний, — фазы. Диффе-
ренцирование (3) в силу (8) приводит к системе с пу фазами:
• /. V- —,
= cos е ai cos2 s^n
Л .
tpi = Vi — 8 Sin + 8 — COS Ipj Sin l|)i — 8 — COS ф|,
(1.1.10)
• I—r dy>
x = eX, x (t0) = x°
y? — У? y®
sin ^0 = -L—2., 008^=^,
г ivi
правая часть которой 2л-периодична по каждой фазе фг-.
Нужно отметить, что применение асимптотических методов
исследования неуправляемых систем типа (10) приводит к су-
щественным трудностям, связанным с «проблемой резонансов»
[10, 18, 45—47, 58, 59, 70, 82, 148, 162, 163], которые усугубля-
ются для переменных частот v<(t). В случае когда правая часть
системы представляется «конечным отрезком» разложения в мно-
гомерный ряд Фурье и т. п. может быть применен метод усред-
нения [69, 147, 148]. В приложениях часто система (10) по су-
ществу оказывается одночастотной, т. е. Vi(r) = v(t) + О(&).
К классу одночастотных систем приводятся, например, уравнения
возмущенного движения точки в центральных гравитационном
или линейном полях колебаний маясников, вращений твердого
тела относительно неподвижной точки и др., см. п. 3. Выделение
одной из фаз ₽= х|)^и введение расстроек 0f по формулам фг =
= Ф* + 6г ПРИВОДИТ К (6) С Щ = 1.
Одно- и многочастотные системы посредством замены
Фг=фг+0Ь <Pi = Jvi(T)^, j=l, (1.1.11)
могут быть представлены в стандартной форме вида
% = еХ(£, %, и, 8), х(^о) = Х°, % = (а, х, 0). (1.1.12)
Здесь X — сложная функция t; исследование вопроса о суще-
ствовании равномерного среднего и его построении представляет
трудную проблему. К виду (12) система (8) приводится также
заменой типа Ван-дер-Поля [58]:
Уг = sin (pj + bi cos срг- + yh i== 1, ..., ny,
/ ь \ (1.1.13)
yi = Vi (ai cos q)i — bi sin фг),
§ 1. УПРАВЛЯЕМЫЕ КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
27
где bi — оскулирующие (медленные) переменные. Для неиз-
вестных at, bi (13) получается система уравнений
• f. v' _,
аг = е “ COS фг + 8 (^ COS (ft Ьг sin (ft) COS (ft — 8^ sin (ft,
• f. v' _f
= ~ e T7 sin ’Pi ~ г V" (ai C0S Ti ~ bi sin Vi) Sin 4>i — e^i C0S Tit
(1.1.14)
у 9 _ p
4 = 4’ 4 = 4-4, Фг=
V,- J
усреднении
не меньше
Многочастотная система общего вида (1), для которой у =
= г/0(ф, а, т) — многофазная функция (ф — вектор), преобразо-
ванием, описанным в п. 1, приводится к виду (6), а также при
помощи замены (11) — к виду (12). Вид стандартной управляе-
мой системы должен выбираться из соображений удобства
в каждом конкретном случае. Следует еще отметить, что замены
(9) в общем случае являются особенными, если какие-либо из
амплитуд а{ (i = l, ..., пу) обращаются в нуль; уравнения (10)
для фаз ф£ имеют нерегулярные правые части. Подстановки типа
Ван-дер-Поля (13) — неособенные при Vi>Vf0>0; в этом основ-
ное преимущество таких замен. Удобство переменных типа
амплитуда — фаза (а», ф^ состоит в том, что при
уравнений по фазам порядок системы понижается
чем на единицу. Порядок системы для усредненных
оскулирующих переменных (at, bi) сохраняется и
в общем случае равен 2пу.
задачи управления движением квазили-
нейных колебательных систем ставятся и исследу-
ются для систем уравнений, приведенных к стан-
дартной форме (6) со скалярной фазой ф, 7гф = 1.
На основе проведенного анализа рассмотрены воз-
можности применения асимптотических методов
(усреднения) для многочастотных систем вида (6)
(§ 5 гл. 2 и § 9 гл. 5).
3. Примеры одночастотных управляемых систем.
Способы введения малого параметра.
3.1. Модель колебаний лифта. Рассматриваются
вертикальные колебания груза массой ш в поле сил
тяжести, подвешенного на однородной упругой ни-
ти (рис. 1.1). Длина нити I в нерастянутом
состоянии плавно изменяется по заданному закон
= 8L Уравнение движения квазистатического приближения име-
ет вид [33, 140, 151]
my + ESI-1 (y — l) = mg — N, N = ту.. (1.1.15)
Рис.
28
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
Здесь у — относительная координата груза, Е — модуль Юнга
материала нити, S — площадь ее поперечного сечения, g — уско-
рение сил тяжести; N— управляющее воздействие кинематиче-
ского типа, предполагаемое далее малым. Пусть I*—характер-
ная длина нити; тогда Т* = 2л (ml*/(ES)y/2 — характерный пе-
риод свободных упругих колебаний. Плавность изменения I оз-
начает, что 1Т*Ц* ~ е < 1. Заменами в (15)
= = 2 л/У*, у* = у jl*,
<з = l/l*, G = g/(l*v^), &и= N/{ml*v^
получается уравнение вида (8) в безразмерных переменных
У + у2(т)у = 1 + G — eu, v2 = I/O. (1.1.16)
Описанным в п. 1.2 приемом уравнение (16) приводится
к стандартному виду (10) или (14). Целью управления и может
быть, в частности, гашение упругих колебаний, вызванных воз-
мущениями.
3.2. Плоский маятник с управляемой точкой подвеса, В ква-
зилинейной трактовке рассматриваются плоские колебания маят-
ника переменной длины Z(t); его
точка подвеса Р может перемещаться
в вертикальной плоскости Оху с уско-
рением (ы?х, wy), рис. 1.2. Условия
движения предполагаются таковыми,
что реакция связи положительна [229].
Уравнения движения записываются
в виде
•• a f
Ф + у sin ф =------— cos Ф +
+ wy sin ср) — 2 уф, (1.1.17)
Рис. 1.2 = wK, iy = Wy.
Здесь ф — угол отклонения маятника от вертикали, wx, wy — уп-
равляющие воздействия кинематического типа. На основе харак-
терных для системы (17) величин I* и у* = (g/Z*)1/2 вводятся
безразмерные переменные; в результате
Ф + ст"1 sin ф = —о-1 (iyacos ф + Wy зшф) - 2оо-1ф
0* = WXy = wx,yg , о = ll* ). (1.1.18)
Предполагается, что о = о(т), т = е£; амплитуда колебаний и
управления считаются малыми, т. е.
Ф, Ф~8а, а>0; Wx,v ~ ъах,у> ах>у>0.
§ 1. УПРАВЛЯЕМЫЕ КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
29
При различных значениях показателей а, ах, у можно полу-
чить квазилинейную модель колебаний маятника
ср + v2(т)ф = е/(ф, ф, а, о', ux, е2..v2 = а-1 > 0 (1.1.19)
с различными функциями /, например:
а) а=1, ах=2, ау = 1; f = — <г*(их+ ф^) — 2о'о_1ф; (1.1.20)
б) а = 1/2, ах = 3/2, ау=1;
/ = (1/6) о-1ф3 — а-1 (их + фиу) — 2o'(j“V
Если точка подвеса перемещается вдоль прямой, наклоненной
под углом б к горизонту (FFa = W cos б, Wv = W sin б), см.
рис. 1.2, то, согласно (18) —(20),
Ф + о-1 эшф = —соэ(ф — б) — 2оо_,ф;
б^±л/2: а) аб = 2, б)аб = 3/2; (1.1.21)
б = ±л/2: а) аб = 1, б) аб = 1.
Целью управления может быть гашение колебаний (ф = Ф =
= 0) или «разгон» до заданной скорости перемещения vx, vy
с гашением относительных колебаний и др. (см. гл. 5).
Следует отметить, что в примерах пп. 3.1, 3.2 длина —
параметр, изменяющийся плавно по заданному закону Z(t)
типа (7). Однако в квазилинейной трактовке I нельзя считать
переменной, зависящей от управляемых координат. В противном
случае такие системы относятся к существенно нелинейным, ис-
следуемым в гл. 3—5.
3.3. Пространственный осциллятор. Уравнения управляемого
движения квазилинейного осциллятора можно записать в век-
торной форме:
r = v, mv = -*r + f(r, v) + F,
Г(М = Л v(M = v». (1Л,2'2)
Здесь г — радиус-вектор, v — скорость точки массой т, к — ска-
лярный коэффициент возрастающей силы, f — возмущение, F —
управление. При f = F = O система (22) совершает гармониче-
ские колебания в плоскости, а траектория имеет форму эллипса,
см. рис. 1.3. Далее в (22) вводятся безразмерные переменные по
формулам
** = v£, v2 ^к/т, т*=т/г*, v*=vl(r*v),
ef* (г*, V*) = f/(znr*v2), eu = F/(mr*v2),
где г* — характерный линейный размер эллипса. Получается од-
ночастотная система частного вида (8): nx = 0, Vt=l. Она
30
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
преобразуется к виду (14) с фг = £—£0 посредством замены
г = a sin (£ — /0) + Ь cos (t — t0),
v = a cos (t — t0) — b sin (t — t0),
где a, b — оскулирующие элементы. Для получающейся системы
возможны различные постановки задач управления медленными
переменными посредством малых управляющих воздействий, см.
§ 4 и гл. 5.
3.4. Управление «малой тягой» в задаче Кеплера, Уравнения
движения материальной точки в поле сил тяготения при условии
близости орбиты к окружности (рис. 1.4), приводятся к стан-
дартной форме (14). Управляемое движение в плоскости орби-
ты можно описать уравнениями [84]
г = vr, mvr = — mkr~2 + Wr + Pr, । 23)
Ф = = — mvTv^r~l + Жф + P^
Здесь г, ф — полярные координаты, vr — радиальная, а гф —
трансверсальная составляющие скорости, пг — масса, к — грави-
тационный коэффициент, Wr, Ф — возмущения, Рг, Ф — составляю-
щие вектора тяги. Введением характерных параметров движения
г* и v2 = кг3* получаются уравнения в безразмерных величинах.
Пусть движение близко к круговому (s < 1):
г° = 1 + е/?°, ь°г = еУ?, Wr = e2/r, Pr = e2ur;
1 ф° | < оо, уф = 1 + е7ф, ГИф = е2/ф, Рф = е2иф.
Тогда посредством замены в (23)
г = 1 + еЯ, pr = eVr, Ф = Ф, рФ=1 + еУФ
§ 1. УПРАВЛЯЕМЫЕ КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
31
после сокращения на 8=/=0 получается система типа (1), для
которой порождающее решение имеет вид (3)
R = a sin (t — t0) + р cos(£ — £0)+ 2с, ф = (t — tQ) + у,
Vr = Я, 7Ф = V2 (/? + /?); а, р, с, 7 = const.
Связь параметров а, р, с и 7 с общепринятыми в небесной ме-
ханике элементами орбиты проста, например эксцентриситет
е = е (а2 + £2)1/2 + 82... Оскулирующие пе-
ременные а, Р, с, 7 при 8 0 описываются
уравнениями типа (14). Для получающейся
системы может быть поставлен и решен ряд
задач управления, в частности задача опти-
мального быстродействия (см. § 1 гл. 6).
3.5. Управление вращениями осесиммет-
ричного тела. Рассматриваются управляе-
мые вращения твердого тела относительно
неподвижной точки О (центра масс), см.
рис. 1.5, описываемые векторным уравнени-
ем [140]
L + (i)XL = M, o)(f0) = ©° (Ji 2 = J J3).
(1.1.24)
Здесь L — вектор кинетического момента, Л — главные (цент-
ральные) моменты инерции, М — управляющий момент: |М|
< Считается, что управляющий момент мал, т. е. V2(L° • (о°)^>
ЛГ; тогда в безразмерных переменных получается система
типа (1)
coj 2 ±(d — 1) (о3со2 1 = 8Н1,2, (Оз = sd~iu3
(**=ю<,/’ °*="Э’ и==Р’ е=?5г<1)‘
(1.1.25)
Пусть управление и3, определяющее независимое изменение
осевой составляющей угловой скорости со3, задано: со3(т) — из-
вестная функция т. Тогда замена
t
(01 = — Q sin гр, со2 == Q cos ар, ар = v (т') dt' + ар°,
*о
v (т) = (d — 1) со3 (т), т = st
приводит к уравнениям управляемого движения для экваториаль-
ной составляющей (со1} со2) стандартного вида (6):
Q = 8(— Ujsin ар + и2 cosap), Q° = (со?2 + (o®2)1^2, (1.1.26)
ар = v(t)+ eQ-1(Ui cos ар + u2 sin ар),
sin ap° = — co?/Q°, cos ap° = (O2/Q0.
32
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
Если же принять
t
cDjl = a cos ср — Ъ sin ср, со2 = a sin ф + Ъ cos ф, ф = v (т') dt'v
то можно получить систему вида (12) или (14)
а == 8 (Uji cos ф + и2 sin ф), а° = со?,
Ъ = 8 (— ut sin ф + и2 cos ф), Ь° = (о2- (1.1.27)
Для системы (26) или (27) представляет определенный
прикладной интерес задача гашения экваториальной составляю-
щей угловой скорости, см. § 4. Следует обратить внимание на
то, что уравнение для гр (26) имеет особенность при Q = 0.
Таким образом, приведенный ряд примеров управления ме-
ханическими колебательными системами, который может быть
продолжен, см. гл. 5, 6, показывает содержательность исследо-
вания задач управления, в том числе оптимального, квазилиней-
ными колебаниями.
§ 2. Метод усреднения в задачах оптимального управления
движением квазилинейных колебательных систем
на фиксированном интервале времени
1. Постановка задачи. Для определенности рассматривается
управляемая система стандартного вида (1.6). Требуется в неко-
торый заданный момент времени t = Т, где Т = 08-1, 0 = const,
выбором допустимого управления и U привести фазовую точ-
ку системы (а, гр) на множество, определяемое соотношениями
гр)|г = О, 2И = (#1, ..., Я), O^Z^n+1, (1.2.1)
таким образом, чтобы принимал минимальное значение функцио-
нал J, характеризующий качество управления:
т
J [u] = g (а, гр) |т + 8 f G (т, а, гр, и) dt min. (1.2.2)
i u^U
Го
Заданные функции М, g, G, как и правая часть системы (1.6),
предполагаются достаточно гладкими по всем аргументам и
2л-периодическими по гр. Нужно найти оптимальное управление,
фазовую траекторию и минимальное значение функционала.
Считается, что задача оптимального управления (1.6), (1),
(2) имеет решение для 8^(0, 80]. Справедливость такого ут-
верждения устанавливается при помощи весьма общих условий
леммы Филиппова [211, 235]. Для построения искомого решения
применяются необходимые условия оптимальности u*(t) в фор-
ме принципа максимума Понтрягина [180]: для всех Т]
§ 2. УСРЕДНЕНИЕ НА ФИКСИРОВАННОМ ИНТЕРВАЛЕ ВРЕМЕНИ
33
имеет место равенство
Н (т, а, гр, р, q, и*, е) = тахЯ(т, а, гр, р, 7, и, е),
и=и (1.2.3)
Н^е(р •/)+#(v + eF)—eG.
Здесь Н — функция Гамильтона задачи, р и q — сопряженные
соответственно а и гр переменные. Они определяются линейной
сопряженной системой и условиями трансверсальности при t = Т*.
• дН д (1.2.4)
1--^, ят-Д[(1-м)-г1|Г.
Здесь К — Z-мерный постоянный вектор множителей Лагранжа;
функции a(t), гр(0 определяются из (1.6) при u = z/*(£); ае
f=Da^Rn, P^Rn, гр, q^R\
Предполагается, что искомое оптимальное управление не яв-
ляется особым, т. е. из (3) функция и* определяется од-
нозначно:
и* = и (т, а, гр, р, q), zz* =arg max Я. (1.2.5)
u^U
Функция и* выбирается 2л-периодической по гр и считается
достаточно гладкой по всем аргументам в некоторой допустимой
области их изменения. После подстановки и* из (5) в (3) для
максимального значения Н* получается выражение
Я*(т, а, гр, р, д, е) = qv(x)+ е&*(т, а, гр, р, q). (1.2.6)
Далее используется свойство дифференцируемости функции
максимума Я*, справедливое, если множество U не зависит от
а, гр, а вектор и* единствен, что и предполагается. В резуль-
тате [87]
дН/др |и* = дН*/др = zdh*/dp = е/*,
dH/dq |u* = dH*!dq = v + zdh*ldq = v + eF*,
дН/da |u* = dH*lda = zdh*lda, (1.2.7)
<ЭЯ/<Эгр|и* = <ЭЯ*/<Эгр = Е<ЭЛ*/<Эгр.
Здесь /*, F*, G* — известные функции т, а, гр, р, q, получаемые
в результате подстановки г/* согласно (5). В итоге получена
краевая задача принципа максимума, описываемая гамильтоно-
вой стандартной системой с вращающейся фазой, имеющей по-
рядок 2(п+ 1):
а = ef* (т, а, гр, р, q), ip = v (т) + eF* (т, а, гр, р, q), (1.2.8)
Р = -+ q = l(p-/*) + <1F*-<?*]•
3 Л. Д. Акуленко
34
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
Начальные и конечные условия (общее их количество
2{п+1)+1) имеют вид
a(t0) = a°, ф(/0) = ф°, М (а, ф) |г = 0, (1.2.9)
Р (Л = l^M) - g] |т, q (T) = [(W/) - g] |r.
Решение а*, гр*, /?*, q* краевой задачи (8), (9) существует
в силу сделанных ранее предположений. Если оно единственно,
то эти функции определяют решенпе поставленной задачи опти-
мального управления. В случае неединственности искомое реше-
ние определяется из условия минимума функционала J (2).
Пусть функции а*, гр*, р*, 7* найдены:
a* — a(t, t0, а0, гр°, е), гр* = гр(£, я0, гр°, е),
* + о , \ * к + о .о \ (1.2.10)
р* = р (t, t0, а?, гр°, е), q* = q (t, t0, a°, гр , e). 7
Тогда подстановка их в (5) приводит к программному оптималь-
ному управлению ир:
ир (t, е) = и (т, я*, гр*, р*, 7*). (1.2.11)
Если эти функции построены для всех начальных значений
to < Т, a°^Da, гр0^грг<00, то оптимальное управление находит-
ся также в форме синтеза us:
щ (t, а, гр, 8) = и (т, а, гр, р {t, t, а, гр, б), q {t, t, а, гр, е)). (1.2.12)
Уместно заметить, что аналитическое решение краевой зада-
чи (8), (9) удается построить в исключительных частных слу-
чаях. Численное решение представляет значительные трудности,
так как правая часть (8) является быстро осциллирующей функ-
цией гр, а интервал времени велик (t — £0~8-1), что приводит
к большому объему вычислений. Поэтому существенный интерес
вызывает развитие асимптотических методов, позволяющих упро-
стить численное решение и в ряде случаев получить аналитиче-
ское решение краевой задачи в явном виде.
2. Разделение переменных в уравнениях краевой задачи. Для
этой цели применим асимптотический метод усреднения, который
позволяет исключить быструю переменную — фазу гр из правой
части (8). Как известно [45, 58, 59, 69, 70, 148], метод усредне-
ния связан с заменой переменных, исключающей фазу из пра-
вой части с заданной степенью точности по 8, ограничиваемой
лишь гладкостью системы по медленным переменным.
Ниже приводится краткая схема такой замены. Объединим
для сокращения записи переменные а, р, q в один вектор z раз-
мерности 2п + 1. Тогда уравнения (8) запишутся в виде
2 = 8Z(t, z, гр), гр = v(t)+ eW (т, z, гр). (1.2.13)
§ 2. УСРЕДНЕНИЕ НА ФИКСИРОВАННОМ ИНТЕРВАЛЕ ВРЕМЕНИ
35
Производится замена переменных (z, х|))->-(£, ср):
z ==£ + ер(т, £, ф, е) = ^ + еР1(т, £, ср)+е2г2 + ... + + ...,
(1.2.14)
ф = ф + Е1Р(т, £, ф, б)=ф + е1Р1(т, ф)+ &2W2 + . . . + &3Wj + . .
такая, чтобы уравнения для £, ф не содержали фазу, т. е.
£ = eZ (т, £, е) = eZi (т, £)+ e2Z2 + ... + е% + ...,
(1.2.15)
Ф = v (т) + еФ(т, £, б) = v(т) + еФ1 (т, £)+ е2Ф2 + ... + е;Ф; + ...
В (14), (15) функции у, w и Z, Ф подлежат определению,
причем у, w должны быть 2л-периодическими по ф. Для точного
определения функций замены р, w (14) нужно знать общее реше-
ние исходной системы (8). Функции v, w строятся приближенно
путем последовательного вычисления коэффициентов р}, Wj, j =
= 1, 2, ... Дифференцирование (14) в силу системы (13) и под-
становка разложения (15) для £, ф приводят к последовательно-
сти систем 2(п+1) дифференциальных уравнений в частных про-
изводных. Последовательное их решение с учетом периодичности
по ф позволяет получить искомые выражения для коэффициентов
Vj, Wj [58, 69]:
zl(t, C) = <Z(r, ф)> = г0 (т, о,
фх (т, 0 = <т (т,ф)> (т, □, (1.2.16)
(т, ф) = J[Z (т, ф) — Zo (т, £)] Лр + с?! (т, £),
W1 (т, ф) = J [Т (т, С, ф) - То (т, 0] Z + ег (т, £),
z2 (т> £) — \ i’i + «'1 дх Zi — 9(р Ф1/,
_ .' / дЧ diu> ди\ \
ф2 (Т, 9 = \ у 1>1 + -- ---—i-----—- Zj----—5 ф] /
1 1 dtp 1 dx Ol, 1 dtp ]Z i
Здесь угловые скобки означают усреднение по ф, а нуль в ниж-
нем индексе — нулевую гармонику Фурье. Функции Zj, Ф; вы-
числяются квадратурами при помощи вычисленных на предыду-
щих шагах функций, а Wj требуют также знания Zj, Ф;. Из
(16) следует, что преобразование определяется неоднозначно,
с точностью до произвольных функций йДт, g), е;(т, £). Эта
неоднозначность исключается при возвращении к исходным пе-
ременным z, х|) [58, 69, 70, 148].
Преобразование 7*-го порядка определяется /*-м членом
разложений (14), (15). В результате правая часть системы (15)
будет построена с погрешностью 0(8^’*+1); интегрирование про-
3*
36
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
водится в медленном времени на коротком промежутке:
е [то, 6]. Если общее решение /*-го приближения построено, то
подстановка его в (14) дает искомое общее решение с такой же
точностью. Нужно отметить, что вычисление функций Wj*
излишне: их использование не увеличивает точность, а приводит
к так называемому «улучшенному 7*~МУ приближению», которое
применяется при обосновании. Как установлено [69], общее ре-
шение произвольного /<го приближения может быть построено
дифференцированием и квадратурами на основе решения первого
приближения (§ 1, 2 гл. 2). После этого постоянные интегриро-
вания находятся из начальных и краевых условий (9) с искомой
точностью.
Если при этом удается удовлетворить эти условия с погреш-
ностью О(б>*), то решение задачи оптимального управления
7^-го приближения по управлению, фазовой траектории и функ-
ционалу тем самым будет построено. Детальная схема построе-
ния искомого решения на основе метода канонического усредне-
ния и вопросы обоснования излагаются в гл. 2. Вопросы сходи-
мости при 7*—>оо не исследуются [166, 167].
3. Первое приближение. В приложениях обычно можно огра-
ничиться первым приближением решения задачи оптимального
управления, которое определяет качественное поведение систе-
мы с ошибкой О (б) на асимптотически большом интервале вре-
мени t — t0~ е”1. Кроме того, это обстоятельство часто обусловли-
вается негладкостью системы (8).
Краевая задача первого приближения имеет вид
Г= /о(т, I, п, ₽), ф = e-,v(r) + F0(x, I, п, Р),
Я’ = + РЛ) — Go]> р = const, ( =
В (т0) = а0, ф (т0) = ф°, М (£, ф) |е = 0, т = ei [т0, 0],
(1.2.17)
П(0) = ^[(Л.Л7(^, ф)) - g(L ф)]|е,
р=^[(Л.Л7(^ ф))-?(В, ф)]|9.
Система (17) определяется усредненной функцией Гамильто-
на HQ (6): Яое-1 = 8“*[}у(т)+й0(т, В» Л, ?)• Здесь интегрирова-
нию подлежит система 2п уравнений для ц; фаза <р находится
квадратурой. Система для ц также оказывается канонической
с гамильтонианом /г-0(т, ц, £). Она должна быть проинтегри-
рована на относительно коротком интервале медленного времени
те[т0, 0]. Кроме того, если hQ не зависит от т, то hQ = const.
Постоянные интегрирования и неизвестный Z-вектор X опреде-
ляются краевыми условиями (17). Если корень единствен и соот-
§ 2. УСРЕДНЕНИЕ НА ФИКСИРОВАННОМ ИНТЕРВАЛЕ ВРЕМЕНИ
37
ветствующий якобиан (см. § 2 гл. 2) отличен от нуля, то по-
строенное решение действительно определяет искомое с погреш-
ностью 0(c). В случае когда краевая задача допускает несколь-
ко простых корней, критерием выбора оптимального является
функционал J (2), вычисленный с погрешностью 0(e):
J = Л + О (8), Jo = g & ф) |в + j Go (т, В, Т], Р) dr. (1.2.18)
то
4. Примеры управления амплитудой колебаний для системы
с одной степенью свободы.
4.1. Постановка задачи для квазилинейного осциллятора. Рас-
сматриваются управляемые колебания системы (см. примеры 3.1,
3.2 § 1)
х +v2(t)x = е/(т, х, х, и), / = /°(т, х, х) + О(т)и.
Посредством замены типа (1.3) получается система вида (1.6)
а = 8v-1 (/ — av' cos ф)cos ф, а0 = [х02 + x02v-2 (т0)]1/2,
ф = v — 8v-1a_1 (f — av' cos ф) sin ф,
. ,0 ,0 *° d-2-19)
sin = -у, COS = 0
а а V (т0)
(x = asin\p, х = у(т)асозф, а>0).
Для системы (19) рассматриваются задачи оптимального уп-
равления с функционалами и конечными условиями (Т = 6е-1):
т
A. Ja= 1IJia2 (Л + е J (т) | и 1 < о°, G Go > 0;
io
Т
Б. /Б = е [ G (т) u2dt, |u|<oo, а(Т) = а*^0;
*0
В. JB = dz ^ (Л, |u|<u0. (1.2.20)
Для случаев А, Б, согласно (3), (6) и (5), функция Гамиль-
тона Н, Н* и соответствующее управление и* равны
Н = qv + ev”1 (у + Du) w — eGu2,
v = v (т, а, ф) = /° — av’ cos ф,
w = w (а, ф, р, q) = р cos ф — qa~r sin ф; (1.2.21)
Я* = qv + 8v-1Ptz; + sv~2D2w2G~1,
и* = 1i2v~1DwG~1.
38
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
4.2. Решение первого приближения. Усреднение функции Я*
из (21) приводит, согласно (17), к усредненным краевым зада-
чам А п Б:
= v-7c° (т, I) - 1/2v-1v'^ + (1/4) (Z>2/(v2G))n, В (То) =
т]' = — V-1 djc/dt,] т)> Р = О, /? = </° cos ср>, (1.2.22)
<р- = e-1v (т) — Г"7° (т, £), Ч>(То)=^0, f°s =</°sincp>;
А. П(0) = -^(0).
Б. g(0) = a*.
В общем случае уравнения (22) для g, ц проинтегрировать
аналитически не удается. Они интегрируются, в частности, когда
не зависит от т (й0 = const) или Ло линейна по g (уравнение
для ц линейно и не зависит от %). Последнее справедливо для
примеров 3.1 и 3.2 (при щ = из § 1.
Решение краевых задач (22) для частного случая системы
/° = — 2%х+ щг3, v, х, pi = const, D = G = 1 (1.2.23)
приводит к выражениям
£ (т) = [а° — (ц*/(8у2х)) 4- (n*/(8v2x)) с’~х(е~т),
•1 (т) = fc = — vxl, /® = (3/8) (1.2.24)
Параметр ц* для задачи А равен
т]* = - ka°e-*Q [1 4- (*/(8v2x)) (1 - е-^0)]"1. (1.2.25)
Из (25) следует, что величина |ц*| ограничена при к -> °°
(7с>0), поэтому, согласно (22), значение £(0)->О, если к -+ «>.
Для задачи Б значение параметра ц* равно
= 8v2x (а* - а°е~^) (1 — е"2^0)-1. (1.2.26)
Выбором величины к* = к(а*) в задаче А можно добиться, что-
бы $ (0) = а* при к = к*.
Усредненная фаза ср первого приближения находится простой
квадратурой на основе (22), (24):
t
ср (£, е) = гр° 4- j* Q (т', е) dt', Q = v — е (3/8) pv-1£2 (т). (1.2.27)
о
Здесь Q(t, е) имеет смысл возмущенной частоты.
Программное оптимальное управление для обеих задач А и
Б имеет вид (см. (И), (21))
up(t, е) = 1/2У~1'Ц*е~х(€>“т) cos ср (t, е). (1.2.28)
§ 2. УСРЕДНЕНИЕ НА ФИКСИРОВАННОМ ИНТЕРВАЛЕ ВРЕМЕНИ
39
Оптимальное управление в форме синтеза, согласно (12),
равно
us (0 — т, а. гр) = cos гр,
созгр = х/(уа), а = (х2 + x2/v2)1/2.
При этом в выражениях (25), (26) для л* нужно совершать за-
мены а° -> а, 0 -> 0 — т. Минимальные значения функционалов
(20) в первом приближении вычисляются прямым интегрирова-
нием и равны
Ja = '/Л [й-1 + (V(8v2x)) (1 - г-2*®)], „ 9 _
jB = (n;/(i6v2x))(i-*-2n Лк* = /в.
Следует отметить, что в случае фиксированного значения
а(Т) = а* (условие Б (22)) управление us имеет особенность
при т-> 0, а именно: us «>, поскольку г]^-> °°, см. (26). Оцен-
ки близости управления становятся неравномерными. Эта нере-
гулярная ситуация имеет место и в общем случае фиксирован-
ного конечного многообразия М (1).
Для задачи В функции Я, Н* п и* находятся согласно
(3) —(6):
Я = qv + 8v"1 (р + Du) w, D > DQ > 0,
(1.2.31)
Я* = qv + £V-1 (pip + Duq\w\), и* = u0 sign ip, w 0.
Если i] 0 па некотором целом промежутке времени, то ус-
редненная краевая задача первого приближения для ц имеет
вид
Г = V-1 [/“ (Т, £) — 1/2у'1 + (2/л) Du0 sign т|], £ (т0) = а0 >0,
П = — dfc/d^-r], т] (0) = 4= I (0), 0=0. (1.2.32)
Как следует из уравнения (32) для ц, функция ц(т)^0
знакопостоянна при ^(0)=^О. В этом случае
ир(£, е) = uQv(r) sign cos ф(£, е), р = sign ц =+1. (1.2.33)
Для анализа решения краевой задачи (32) важно отметить,
что fc,s = 0 (£) при всех т и достаточно малых Это свойство
вытекает из требования гладкости функции /°(т, х, х) по х, х и
из замены (19). Таким образом, знак правой части первого урав-
нения (32) совпадает со знаком ц. Сначала рассматривается
случай знака «—» для 7В в (20), что отвечает максимизации
амплитуды колебаний. Тогда краевая задача удовлетворяется
при ц(0)>О, так как ц(т)>0 для т^[т0, 0], и правая часть
уравнения для g положительна по крайней мере для малых
§ > 0, что обеспечивает £(т)>0 для всех т^[т0, 0]. Краевое
условие удовлетворяется нормировкой ц(т). Итак, усредненная
40
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
оптимальная амплитуда £(т) определяется как решение задачи
Коши для первого уравнения (32) при w = signT] = +l, т. е.
us = Uo sign х, Up = щ sign cos <p (£, e).
Случай знака «+» для JB в (20) отвечает минимизации ампли-
туды. Если £(т)>0, те[т0, 0], то иР = —Uq sign cos cp(£, e),
us — ~ Wo sign x есть оптимальное управление в виде програм-
мы и синтеза соответственно. Если же в некоторый момент
т = т* < 0 решение | (т*) = 0, то имеет место случай осо-
бого управления [73, 118]: здесь т](т) = 0 па части интервала
движения, па которой оптимальное управление определяется не-
однозначно. При этом достигается абсолютный (нулевой) мини-
мум функционала первого приближения: 7b==1/2V(0)=:=O. В ка-
честве функции г(т), |г(т) | С 1 в (33) можно взять произволь-
ную кусочно-постоянную (релейную) функцию, такую, чтобы
£(т)^0, g(0) = O, например вида г(т) = —1, т^[т0, т*]; г(т)^
^0, (т*, 0].
Проверка описанных выше условий в текущий момент време-
ни определяет оптимальное управление первого приближения
в форме синтеза.
Решение содержательных в механическом отношении задач
оптимального управления квазилинейными колебаниями получе-
но в § 4, 5 и в гл. 5, 6.
§ 3. Асимптотическое решение задач
оптимального управления с нефиксированным временем
1. Постановка задачи типа оптимального быстродействия. Как
и в § 2, рассматривается управляемая система стандартного ви-
да с вращающейся фазой (1.6). Считается, однако, что момент
окончания процесса управления Т не задан, а выбирается из
условия достижения фазовой точкой а, гр множества (т — па-
раметр)
А(т, а, гр)1г = 0, А = (А1? ..., Аг), 0^г^п+1. (1.3.1)
Минимизируемый функционал типа (2.2) для сокращения
записи принимается в виде, не содержащем интегрального чле-
на [180]:
J [и] = g(r, a, ip)r->min, и е U. (1.3.2)
и
Это предположение не ограничивает постановку задачи, так
как увеличением размерности медленного вектора а на единицу
функционал (2.2) приводится к частному случаю (2). Далее,
если N = а — а*, g = T —т0, то соотношения (1), (2), (1.6) опре-
деляют двухточечную задачу оптимального быстродействия по
медленным переменным.
Как и в § 2, естественно предположить, что функции A, g
2л-перподичны по гр и достаточно гладки по всем аргументам.
§ 3. ЗАДАЧА УПРАВЛЕНИЯ G НЕФИКСИРОВАННЫМ ВРЕМЕНЕМ 41
Применяя необходимые условия оптимальности управления и*,
можно получить краевую задачу принципа максимума [180],
аналогичную (2.9):
л = е/*(т, а, *ф, р, q), р = —гд1г*/да,
г|) = v (т) + eF* (т, а, гр, р, q), q = —8<Э7г*/5гр,
a(t0) = a°, 'ф(^о) = 'ф°, N(t, а, гр) 1т = 0, (1.3.3)
р (п=4 к*-*) - si ь ? (л=-Дт - *11т
Здесь функции Я*, А* и соответствующее управление и* опре-
деляются соотношениями
qv + е max [(р-/) + qF] = Я* = qv + s/г*,
(13 4^
и* = и (т, а, гр, р, q), и* = arg max h, \ • f
u~U
причем для Я* необходимо выполнение условия трансверсаль-
ности:)
Н*\т = ^{g- (X-2V)]|r, T = 0e-1. (1.3.5)
Таким образом, краевая задача (3)~ (5) содержит 2(н+1) +
+ г+1 неизвестный параметр: 2(п+1) постоянных интегриро-
вания системы (3), r-вектор X и время Т, которые должны удов-
летворять такому Яле числу выписанных выше начальных и ко-
нечных условий.
2. Построение приближенного решения. При помощи изло-
женной в пп. 2, 3 § 2 методики при заданном Т строится при-
ближенное решение краевой задачи (3) с заданной степенью
точности по е. Затем используется соотношение (5) для опреде-
ления оптимального значения Г, Т = 0е-1. Однако приближен-
ный анализ краевых условий показывает (см. модельный при-
мер п. 4), что решение существенно неединственно, так как
вследствие (3) слева в (5) стоит быстро осциллирующая функ-
ция 0 с амплитудой порядка единицы и средним порядка 8.
Кроме того, оказывается, что точки локальных экстремумов бу-
дут определяться колебаниями функций N и g, что делает асимп-
тотический анализ задачи управления, как правило, малосодер-
л;ательным и весьма трудным.
Из анализа ряда прикладных задач следует вывод, что есте-
ственно предположить для задач управления колебательными
системами с малыми управляющими воздействиями независи-
мость или слабую зависимость функций N и g от фазы В этом*
важном для приложений случае построение оптимального управ-
ления существенно упрощается и могут быть получены довольно
простые достаточные условия локальной и глобальной оптпмаль-
42 ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
ности приближенного решения, хотя, как будет установлено ни-
же, решение краевой задачи также существенно неединственно.
Итак, рассматривается краевая задача (3) — (5) при упро-
щающем предположении независимости функций N и g от ф:
7V(t, а) \т = 0, J[u\ = g(r, a) |r->-min. (1.3.6)
u=U
Считается, что решение усредненной системы (2.15) /*-г0 при-
ближепия построено в виде
В = В (т, 0, £°, П*, е), 1] = 11 (т, 0,%>, 1]*, 0, e)t
£ |т0 = 1°, 1] |е = 11*> 0 = const, (1.3.7)
т т
Ф = Ф° + j v (т') dTf + Jo (т', g, rj, Р, 8) dr'.
то то
Здесь V» Л*» Р, 9, ф° — неизвестные постоянные, подлежащие
определению из краевых условий. При помощи (2.14) искомые пе-
ременные исходной краевой задачи можно представить в виде
а = £ + 84 (т, ф, ц, р, в),
'ф = ф + еЧг(т, ф, ц, р, 8),
р = ц + еР(т, В, Ф, Л, Р, е), ( • • )
£ = Р + 8(2(т, ф, Т], Р, 8),
где Л, V, Р, Q — известные 2л-периодпческие функции ф, вы-
численные с нужной точностью — погрешностью 0(8>*). Затем
выписываются с такой же точностью условия для определения
искомых величин |°, ф°, Ц*, р, 0:
£° + еА |Т() = а0, ф° + 8V |Tq = ф°, ЛЧтЛ + ^)|0^=О,
П* + гР |0 = -Д-ЦХ.ЛГ) - g] |е, Р_+е<2[0 = Ол (1.3.9)
|е = ((1] + еР)./*) |е = [g _ (Х.дг)] |е.
На основе (6) из условия трансверсальности для q следует, что
Р = О(е). Далее, левая часть последнего уравнения (9) вслед-
ствие (7) быстро осциллирует по 0 с частотой порядка V8-1 и
амплитудой порядка единицы. Это обстоятельство, аналогичное
отмеченному выше, приводит в общем случае к большому, по-
рядка 8-1, числу корней 0а с расстоянием 0(e) между соседни-
ми корнями.
Для определенности сначала рассматривается решение задачи
оптимального управления в первом приближении по 8. На его
основе, см. гл. 2, более просто строится произвольное приближе-
§ 3. ЗАДАЧА УПРАВЛЕНИЯ С НЕФИКСИРОВАННЫМ ВРЕМЕНЕМ
43
ние. В приложениях, как отмечалось в § 2, оказывается доста-
точным первое приближение.
3. Решение первого приближения.
3.1. Свойства краевой задачи первого приближения. Соотно-
шения (3) в первом приближении по е имеют вид
Г = /о(т, п). П = -3(Т] • Л)/^, Ро = О,
£ (*o)> а°> N (т> & |е = °’ ’I* = -^ I(х- I®’ (1.3.10)
Ф’ = 8_1v(t) + F0(t, £, ц), ф(т0)=г|)°, ( ')^(сШт).
Функции /о, Fo определяются аналогично (2.17) с учетом оценки
Р = О(е). Предполагается, что для заданного значения 0 реше-
ние краевой задачи (10) построено (зависимость от а0, т0 не ука-
зывается для сокращения записи):
В = £(*, ©), Ц = Ц(т, 0),
' (1.3.11)
Ф = гр° + е-1 j v (т') dC + J F^dv, Z = А, (0).
то то
Искомые переменные а, р, ф, q па основе (2 14), см. § 3 гл. 2,
отличаются от выражений (11) на величины 0(e) для т^[т0, 0]:
я = £ + О(е), р = г| + О(е), д = О(е), 'ф = ф + О(е).
(1.3.12)
Неизвестный пока параметр 0 определяется последним соот-
ношением (9), в которое подставляются выражения (12):
(!]./* (т, ф, я, 0)) |е+ -^[(1 (Q)-N (т, £)) - g (т, £)] |в= О (е).
(1.3.13)
После отбрасывания членов О(е) уравнение (13) примет вид
(т/о) |е + (0) - £11е = - (П- (/* - /о)) 1е- (1-3.14)
Соотношение (14) допускает, как правило, асимптотически боль-
шое число корней {0а}, причем расстояние между соседними
корнями порядка е. Достаточным условием справедливости этого
утверждения является требование, чтобы усредненное уравнение
(14), т. е. с правой частью, равной нулю, допускало простой ве-
щественный корень 0о > т0. Действительно, на основе (И), (14)
правая часть быстро осциллирует по 0 с частотой порядка е-1 и
конечной амплитудой около среднего О(е) при е 0. Поэтому
заведомо в некоторой окрестности значения 0 = 0О качественная
картина поведения корней {0а} уравнения (14) имеет вид, ука-
занный на рис. 1.6. Требование пекратности корня 0О существен-
но для дальнейшего.
44
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
Так как по предположению корень 0О усредненного уравнения
первого приближения простой, то учет членов порядка е в исход-
ном уравнении (13) приведет к его смещению на величину 0(e),
а корни {0а} сместятся на величины 0(е2). В результате уста-
новленное свойство корней {0а} приводит к важному факту —
существенной неединственности решения краевой задачи прин-
ципа максимума для задачи типа оптимального быстродействия
Рис. 1.6
и сгущению множества корней {0а} при е -> 0, что обусловлено
вырождением при 8 = 0.
Итак, искомые корни {0а} определяются с достаточной для
построения первого приближения точностью — погрешностью
<?(е2), если в (13) отбросить члены 0(e), т. е. рассмотреть урав-
нение (14). Оптимальное значение 0* {©«}, а вместе с ним оп-
тимальное решение краевой задачи можно получить из условия
минимума функционала первого приближения
Л (®) = g (© Л (0, ©)) min, 0 е {©«}. (1.3.15)
е
3.2. Определение параметра 0. Без уменьшения точности ре-
шения краевой задачи по медленным переменным величину 0
достаточно определить с погрешностью 0(e), т. е. считать допу-
стимое множество значений 0 непрерывным, так как в е-окрест-
ности каждого значения находятся точные корни. Поэтому зада-
ча (15) сводится к определению границ 0- и 0+ соответствую-
щего интервала /е=(0", 0+) (одного или нескольких: =
= U (©Г» 07) и минимизации функции /о(0), 0 Ze. При
3=1
этом можно применить известные аналитические и численные
методы оптимизации [157].
Для широкого класса задач управления оптимальное значение
0 определяется аналитически. Уравнение (14) переписывается
§ 3. ЗАДАЧА УПРАВЛЕНИЯ С НЕФИКСИРОВАННЫМ ВРЕМЕНЕМ
45
в виде
(1Т/о) \е + -^ le + v (О) х = 0. (1.3.16)
Здесь х = — параметр со значениями х 7Х, когда 0 <= 7©,
причем х = 0 7Х, так как левая часть (14) обращается в пуль
при 0 = ©о 7е. Далее, вследствие простоты каждого корпя и
неравенства v(0o)>O на основе теоремы о неявных функциях
между 0 и х существует взаимно однозначное соответствие: 0 =
== 0(х) и х = х(0).
При условии, что зависимость 0 = 0(х) установлена, ставит-
ся задача нахождения минимума функции 70[х]:
/0М = g(T, g)|0(x)->min, хе7х. (1.3.17)
X
Лемма 1.1. При выполнении условий гладкости функции /0[х],
х^7х точка х = 0 подозрительна па экстремум. Если 0'(О)>О,
то х = 0 и 0(0)= 0о — точки локального минимума; если
0'(х)>О для всех х^/х, то х = 0 определяет глобальный ми-
нимум /0.
Функция Л[х] считается непрерывно дифференцируемой в
силу соответствующих предположений относительно гладкости
функций /, N, g. Поэтому необходимое условие минимума пред-
ставимо в виде
+(>-(/-+>))lLe'M=0- (1-зл8)
Здесь £’(т, 0) заменена на /0(т, ц) согласно (10). Подстановка
в (18) вместо (3g/d£)le выражения (d/d£) (Х-У) |© — ц* соглас-
но (10), а затем вместо (ц -/0)1в его выражения из (16) позво-
ляет найти производную dg*/dQ в виде
Sr) + v (0) х S U 11* = П le, = N |в).
Вектор-функция Л7* = 0 относительно 0; поэтому 7V* = 0. В ре-
зультате для искомой производной справедливо выражение
/о [х] = ©' (х) v (® (х)) х = 0. (1.3.19)
Из (19) следует, что точка х = 0 определяет локальный мини-
мум, если 0'(О)>О, а определенная выше величина 0(О) = 0о —
оптимальное значение 0. Если 0'(х)>О для всех х 7Х, то 00-
точка глобального минимума /о(0). Условие глобального мини-
мума 70[х] в точке х = 0 можно при помощи (19) записать так-
же в виде
X
/0[х] —/[0] = Jv(0(x))0'(x)xdx>°» x<=Zx. (1.3.20)
О
46
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
Если использовать выражение для v(0(x))x из (16), то мож-
но получить условие оптимальности 0 = 0О в другой форме:
в
Jo (0) - Jo (0О) = J' р (0) d0 > О, 0 е 7в,
Од
э ° (1.3.21)
p(0)=^[g-(^-^)]]6-(n7o) Io-
Проверкой указанных неравенств фактически завершается по-
строение решения задачи оптимального управления (1.6), (6)
в первом приближении по малому параметру е > 0. Точность по-
нимается по функционалу и удовлетворению краевых условий.
Детальное исследование краевой задачи принципа максимума,
построение высших приближений и обсуждение вопросов обосно-
вания близости проводится в гл. 2.
3.3. Замечания и выводы. Таким образом, алгоритм асимпто-
тического решения задачи оптимального управления сводится к
решению краевой задачи для гамильтоновой системы относитель-
но 2п переменных ц на ограниченном интервале медленной
переменной т [т0, 0]. С погрешностью О (е) минимальное зна-
чение функционала J (6) равно Jo из (15) при 0 = 0О или (16)
при х = 0, если выполняются условия леммы 1.1. Оптимальное
управление получается подстановкой в (4) найденных выраже-
ний для £, <р, ц:
ир = п(т, £, ср, ц, 0), us==w(t, a, гр, ц(т, я), 0). (1.3.22)
Как отмечалось в п. 3 § 2, если /0 не зависит от т, то сохра-
няется гамильтониан Лэ=(ц -/0) = const. Краевая задача для си-
стемы с одной степенью свободы в этом случае приводится к
квадратурам. Если же функции g и N не зависят от т, то 0О есть
корень уравнения hQ = 0.
При построении оптимальных управлений в § 2, 3 предпола-
галось, что п* из (2.5) или (4) определяется условиями (2.3)
или (4) однозначно и является достаточно гладкой относительно
медленных переменных функцией. Это позволило применить из-
вестную схему усреднения по фазе гр, что привело в общем слу-
чае к существенному упрощению решения краевой задачи прин-
ципа максимума. Задачи оптимального управления с ограниче-
ниями па управляющую функцию и [7, где U — замкнутая об-
ласть с негладкой границей, например вида U = {и: | щ | н?,
Ui > 0, i = 1, ..., т}, приводят, как правило, к разрывным, в част-
ности релейным, функциям времени, фазовых и сопряженных пе-
ременных. В этих случаях значения функции в точках разрывов
определяются неоднозначно. Наличие разрывов в правых частях
уравнений затрудняет применение метода усреднения, см. [90,
95, 96, 143, 148, 161, 178, 192]. Тем самым существенно усложпя-
§ 3. ЗАДАЧА УПРАВЛЕНИЯ С НЕФИКСИРОВАННЫМ ВРЕМЕНЕМ 47
ется построение приближенного решения краевой задачи принци-
па максимума и оптимального управления, а также оценка бли-
зости формальных построений. Изложенная в § 2, 3 методика
формально может быть использована также и в задачах с раз-
рывными управлениями для построения первого приближения.
Основная трудность, возникающая в таких случаях, связана с
возможностью особых или скользящих режимов управления, ко-
торые требуют специального рассмотрения в каждом конкретном
случае. Один из примеров рассмотрен в п. 4.2 § 2. Асимптотиче-
ское решение ряда квазилинейных задач с релейными управле-
ниями содержится ниже, в п. 5 § 3 и в гл. 5. Особенности при-
менения метода усреднения в нерегулярных случаях рассматри-
ваются в § 5, 6 гл. 2.
4. Иллюстративный пример. Рассматривается простая модель-
ная задача, допускающая полное точное интегрирование и ана-
лиз типичных ситуаций, описанных в пн. 2, 3:
х = ъи sin ip, z = efc2 + V2eu2, х|? = 1, t е [О, Т],
х(0)= z(0) = ip(0) = 0, N(x, ,ф) = х — а(х|?),
сс(ф> + 2л) = а(\р); J[u\ = z(T), 1п|<<».
Здесь е/с2 — весовой коэффициент, характеризующий «штраф за
расход времени», а второе слагаемое в z — расход ресурсов уп-
равления. Согласно п. 1 выписывается краевая задача принципа
максимума. Ее решение равно (рх, pz, q — соответствующие х, z,
г|) сопряженные переменные)
х = 1/гРх (т — у sin 2 a), z = А2т + 1/2pxx (t, e)t
, Т о « (0/е) .
Px~2Tie7£)’ Pz-~ix
q (т, е) = -у Рх (sin2 -sin2 -|-) + g (0, g), и = рх sin ip,
q <0’е) = - р*’ J <0>е) = *20 + ТР*х (0’
Условие трансверсальности (5), определяющее 0, имеет вид
/Т* I а2 гу । 8 а (@/£) 2 ® СЪ2 _ О
н =Н |в__^-грх + т-г_sin-Рх-гк -0.
Отсюда следует, что в первом приближении по е корни 0а отве-
чают пулям производной периодической функции а2(0/е), т. е.
{0а} = Arg а2'(0/е), и образуют сгущающуюся при е -> 0 после-
довательность, целиком заполняющую числовую ось 0. Миними-
зация 7(0, е) по {0а} представляет малосодержательную труд-
ную проблему, что обусловлено быстрой осцилляцией р» по 0
вследствие периодической зависимости а от х|?.
48
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
В соответствии с замечаниями п. 2 далее исследуется случай
а = const (без нарушения общности полагается а=1). Опреде-
ляющее {0а} условие (5) перепишется в виде (а2' = 0), см. (13):
1 7.9 1 _ог0 sin2 (6/8) sin (29/8) (0 — (8/4) sin 20/8)
о /с — л cos 2 28 г> о *
02 02 е 02 (0 — (8/2) sin 20/8)2
Левая и правая части этого соотношения представлены для
0>О без учета малых членов О(е) на рис. 1.7, а. Получена кар-
тина, качественно совпадающая с изображенной на рис. 1.6.
Здесь 0о = к~\ а 0_= 0, 0+= У2&-1 > 09; следовательно, 0, 0ое
^(0_, 0+). Для функционала J справедливо выражение
J (Q, е) — z^ g j — к О + 0 + 2 0 —(е/2) sin 20/е) —
^Jo (0) +еЛ (0, 0/е),
из которого следует, что 0 = 0Э есть точка минимума функцио-
нала первого приближения Уо(0): Лтш = 7о(0о)= 2/с. Здесь нуж-
но отметить, что добавление величины O(ed), d > V2 к 0О не из-
меняет значения в первом приближении. Действительно, при
0 = &_1 + O(ed) значение J0(Q) = 7о(0о)+ O(e2d). Поэтому в слу-
чае произвольной негладкой относительно 0 функции Л(0, 0/е)
нельзя гарантировать, что найденное из условия минимума /о(0)
значение 0О лежит в 8-окрестности точного оптимального значе-
ния: это значение 8-близко по функционалу J. Однако в рассмат-
риваемом примере из полученного выражения для Д(0, 0/е)
следует, что точка минимума 0*(е) точного значения функцио-
нала 7(0, е) лежит в 8-окрестности 0О: 0* = 0О + 801. Это утвер-
ждение следует из того геометрического факта, что огибающая
£ 3. ЗАДАЧА УПРАВЛЕНИЯ С НЕФИКСИРОВАННЫМ ВРЕМЕНЕМ
49
функции Л(0, у) по у является гладкой по 0, 0^(0", 0+). Ка-
чественное поведение 7(0, 8) и 7О(0) приведено на рис. 1.7, б.
Аналогично можно установить свойство 8-близости точки
0 = 0О точному значению 0*(е) в общем случае системы (1.6),
(6), обладающей достаточной гладкостью.
5. Управление колебаниями системы с одной степенью сво-
боды.
5.1. Постановка задачи типа оптимального быстродействия.
Для системы (2.19) функция N и функционал J из (6) берутся
в виде
7V = a —а(т), б = е[у(т) + G(r)u2], (1.3.23)
&(io) = O, J [u] = б (71) —min, |u|<oo.
и
Здесь момент Т не фиксирован, учитывает затраты времени,
a Gu2 — ресурсов управления. Далее выписывается функция Га-
мильтона с учетом цикличности переменной Ъ. Усредненная си-
стема типа (10) для а, хр, р, q совпадает с (2.22), а начальные
и конечные условия, согласно (10), (16), приводятся к виду
(£ — среднее от Ь)
£(To) = a°, Ц0) = а(0), Ф(т0) = хр°, Ч(ь) = 0,
.2^2
2L
V
D2v\2
7 + s%
(1.3.24)
О
е
— г]*а' (0) + v (0) х = 0.
Последнее соотношение (24) связывает 0 и х;
значения определяются условиями
их оптимальные
Уо(0) = £(©) =
min,
е
6(х)
с* ( л2 2\
•Л>[х] = £(0(х)) = Y + 7VdT->mir1’
О \ oV G/ х
то
0 е 7@;
(1.3.25)
хе/х.
Далее требуется проинтегрировать систему (2.22) при задан-
ном 0, а затем из условий (25) с учетом (24) найти оптималь-
ное значение 0 или х. Для установления локальной оптимально-
сти х = 0 достаточно убедиться в выполнении неравенства, что
можно осуществить вычислением неявной производной 0'(х).
5.2. Построение оптимального решения. Рассматривается кон-
кретный случай системы (2.19) вида (2.23) при условии а =
= а* = const > 0 с учетом результатов интегрирования п. 4.2 § 2
и, в частности, выражения (2.26) для ц*. Затем разрешается
квадратное относительно ц* уравнение (24) и находится функ-
ция ц* (х). Потом из соотношения (2.26), приводимого к виду
4 Л. Д. Акуленко
50
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
квадратного уравнения относительно неизвестной z = е-х0, нахо-
дится положительный корень для обеих ветвей ц*(х). В итоге
получаются два выражения для z = Zi>2 1-
z112 = е-хеЬ2 = а°/(2с1)2) + + 1 - а*/С1,2]1/2,
С1,2 (%) = 4 [а* ± («*2 + (1>3-26)
Здесь знак плюс в clt 2 отвечает т|* > 0, т. е. задаче увеличения
амплитуды (а*>а°), а минус — ее уменьшения (а*<а°); при
а* = а0, очевидно, Zi, 2 = 1, т. е. 0Ь 2 = 0. Формулы (26) опреде-
ляют зависимость 0(х) для допустимых значений х, которые от-
вечают неотрицательным подкоренным выражениям: согласно
(24) величина у — vx > 0.
Доказывается, что оптимальному решению соответствует зна-
чение х = 0. Для этого, согласно (19) (или (20)) и (26), доста-
точно установить неравенства dz/dx < 0, i = 1, 2. Так как
dcjdw < 0, a dc-z/dn > 0, то z^< 0, если dzjdc^ > 0, a dz2/dc2 < 0
для допустимых значений х в окрестности х = 0. Производные
dzi/dct, согласно (26), равны
dzi
dci
1 о /1 , \V:
(1.3.27)
Ai = a°/ci; Bi = а*/с^ i = 1, 2.
Рассматривается сначала случай а* > а0 > 0; тогда Ci > а*,
Следовательно, производная dzjdc^ существует
и непрерывна по так как подкоренное выражение в (27)
строго положительно. Ее знак положителен при В{ 1 и Л^0;
способом от противного доказывается, что при В{>А{ равенство
нулю производной невозможно; поэтому в силу непрерывности
значения dzi/dci^O также невозможны. Если же имеет место
задача уменьшения амплитуды колебаний а* < а0, то с2 < 0,
— оо < л2 < < 0. Аналогично методом от противного устанав-
ливается, что значения dz2/dc2 0 в области у — vx > 0 также
невозможны. Таким образом, х = 0, 0О = 0(0)—искомые опти-
мальные значения параметров задачи
е., г (0) - ± ш С1.2 (0) _ 2- [«♦ ± («• + .
(1 3.28)
Оптимальное управление ир (2.28) или и3 (2.29) и функцио-
нала УБ (2.30) получаются после подстановки выражения ц* =
= dzP^Syv.
§ 3. ЗАДАЧА УПРАВЛЕНИЯ G НЕФИКСИРОВАННЫМ ВРЕМЕНЕМ
51
5.3. Сравнение с релейным управлением. Пусть рассматрива-
ется задача оптимального быстродействия для системы (2.19),
(2.23) посредством управления и, ограниченного по модулю:
\и\ ^и0 (см. случай В (2.20)). Тогда применение метода усред-
нения в предположении / = 0 приводит к краевой задаче первого
приближения:
V = (2и0/ (nv) Мт), U0) = а°, U®) =
(1.3.29)
(2и0/ (jvv) ) I ц I — 1 + vx = 0, р = sign ц, г] = const #= 0.
Решение задачи (29) определяется знаком т), который, очевидно,
равен sign (а* —а0); последнее условие при любом ц удовлетво-
ряется за счет выбора х. Аналогичная ситуация имеет место и
для многих других задач с релейными управлениями, см. гл. 5.
Управление в первом приближении равно, согласно (22),
йР = uosign[(a* — a°)cos<p(i, е)],
iis = uQ sign [(a*—a)cosip]. * ’ '
Здесь cp(£, e) определяется согласно (2.27), a g изменяется по
линейному закону: (т) = а0 + (а* — а0) т/0*, где 0* — время
быстродействия: 0* =(лу/(2и0)) | а* — а01.
Для сравнения выписывается теперь решение задачи опти-
мального управления, которое получается из построенного
в пп. 5.1, 5.2 предельным переходом при % -> 0:
В СО = 4 'v-2n*'r + а°, Т) (т) = n* = - 4v2 (а0 - а*) 60, (1 3 31>
0o = vla*-a°l(2/“f)1/2.
Требуется, чтобы 0О = 0*; отсюда следует связь:
п0 ==(я/2) (у/2)1/2.
Затем сравниваются интегральные функционалы, характери-
зующие расход ресурсов управления, для обоих полученных ти-
пов управления (2.28) и (30). В случае квадратичного функцио-
нала, определяющего расход энергии на управление, получаются
соотношения
©о
J{q2) = j* u^dx = v (2у)1/21 а* — а01,
е* ° (1.3.32)
f2 2
V (2 у)1 /21 а* - а°| =
о
Из (32) следует, что управление, оптимальное по критерию типа
(23), при одинаковых условиях более экономно расходует инте-
гральный квадратический ресурс управления, что представляется
довольно очевидным. Интересно, однако, отметить, что точно та-
4*
52
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
кое же отношение = (л2/8) получается для функциопа-
о
лов вида 4Х) = J | ир | dr, характеризующих расход импульса
о
(рабочего тела) системы управления. Таким образом, гладкое
управление, отвечающее квадратическому критерию качества уп-
равления, более экономно расходует интегральные ресурсы уп-
равления 4Х), Jq2). По-видимому, это обстоятельство имеет место
для всех 0<р<оо.
§ 4. Примеры управления
квазилинейными колебаниями механических систем
1. Управление колебаниями маятника переменной длины.
Рассматривается задача оптимального по быстродействию управ-
ления системой типа маятника посредством перемещения точки
подвеса по горизонтальной направляющей, см. п. 4.2 § 1, рис. 1.2.
Уравнение (1.19) и соотношения (1.20,6) при иу = 0 заменой
(2.19) приводятся к стандартному виду:
а = — е
и----^-а3 sin3 гр +
3 о'а ,11 ,
S"'IS jracos
1 q • q . 3 О Cl 1 . / Л / Л X
u__a3sin31|9 + __coslJ) __sinip5 (1.4.1)
TV |г = (a — a) I г = 0, J[u] = 0, щ и C u2 (u^ux).
На основе § 3 (см. п. 5.3) получается оптимальное управле-
ние первого приближения релейного типа
и = 1/2(щ + и2) + V2(w2 — Ui)v, Id 1,
vp = — sign [(z° —z*)cos <p(£, e)], vs = — sign [(z — z*)cp],
z = 6703/4, z° = a°o(0)3/4, z* = ao(0)3/4. (1.4.2)
Уравнение первого приближения для амплитуды | после под-
становки v из (2) в (1) и усреднения интегрируется в виде
т
% (т) = а°а-3/4-------2--у-- sign (z° — z*) f 01/4 (9) dd. (1.4.3)
ло3/4 J
0
Время оптимального быстродействия 0 определяется из усло-
вия £(0)=сс и является положительным корнем уравнения
©
ао3/4 (0) — а° =--—^-sign [z° — аа (0)3/4] J а1/4 (т) dx. (1.4.4)
о
§ 4. ПРИМЕРЫ УПРАВЛЕНИЯ МЕХАНИЧЕСКИМИ СИСТЕМАМИ
53
Нужно отметить, что вследствие естественных ограничений
па относительную длину маятника о типа 0 < Oi о < о2 < 00 не
для всяких законов ее изменения при заданных значениях пара-
метров задачи а0, а, Ui|2 имеется решение. Например, в случае
гашения колебаний (а ~ 0) при постоянно убывающей длине
подвеса о'=—У, У>0 условие разрешимости уравнения (4)
имеет вид
= а° = - (1 - Г0)5М]. (1-4.5)
Если а0 больше &тах, то постановка задачи должна быть до-
полнена возможностью состояния движения с о = Oi. Аналогич-
ные (5) оценки и утверждения справедливы также при о,== V,
V = const > 0.
2. Управление вращениями динамически симметричного твер-
дого тела. Задача наискорейшего гашения экваториальной со-
ставляющей угловой ско-
рости ((Di, (о2) при усло-
вии (о3(т) — известная
функция ( I (Оз I > (Озо > 0) ,
описывается системой
уравнений (1.27) в оску-
лирующих переменных а,
b и соотношениями
а(Г) = Ь(Т) = О,
О -> min, (ux, z/2) е Z7(2).
ul,2
(1.4.6)
Ниже строится реше-
ние для некоторых кон-
кретных систем управле-
ния, встречающихся в Рис. 1.8
приложениях, см. рис. 1.8.
А. Торможение при помощи одной фиксированной в связан-
ных с телом осях пары двигателей: область (7(2) вырождается
в отрезок, см. рис. 1.8 (случай А):
U(2) — {щ, и2\ Hi = zz cos б, w2 = nsin6, |н| н°, б = const}.
(1.4.7)
Для решения задачи (1.27), (6), (7) применяется методика § 3.
В силу цикличности а, Ъ импульсы ра, pb = const. Согласно (3.4)
и = и° sign cos((p — б + у),
cosy = ра/р, siny = рь/р, р = (/>* + pl)1'2.
54
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
Подстановка (8) в (1.27) и усреднение по ср приводят к уравне-
ниям первого приближения для усредненных переменных а,
а = u° cos у, р = —zz°siny, у = const. (1.4.9)
Решение краевой задачи (9), (1.27), (6) позволяет найти
,ч0 гчО
W1 . w2 ( 2 . 2X1/2
cosy =------sin у =-------(0± = ((Ox + (02) ,
(d“ O_L
г ' . г 0 (L4-10>
а(т) = «>?[1—J], 0(т) = ю»[1- -£], © =
После подстановки в (10) текущих значений переменных оп-
тимальное управление выражается в форме синтеза:
uls = — и° cos б sign Шб, iz2s = — и° sin б sign (Об,
сое = (01 cos б + (о2 sin б. (1.4.11)
Интересно отметить, что в первом приближении фазовая тра-
ектория и время быстродействия (10) от параметра б не зависят,
что объясняется эффектом усреднения по осевому вращению тела.
Б. Гашение посредством моментов сил, направленных вдоль
каждой из связанных осей, см. рис. 1.8 (случай Б):
и™ = (ult u2: |u2|<^}. (1.4.12)
Аналогично вышеизложенному находятся программные управ-
ления:
иг = н? sign cos ((р + у), z/2 = и2 sign sin ((р + у). (1.4.13)
После подстановки (13) в (1.27) и усреднения по (р краевая за-
дача принципа максимума принимает вид рассмотренной ранее
с заменой и° = zz? + и2. Выражения для а, р, у и 0 также сов-
падают с (10), а синтез управлений ult 2 имеет вид
z/15 = — и° sign (Oj, u2s = — *4 sign (o2- (1.4.14)
В. Пусть имеет место случай «поворотной пары» двигателей,
см. рис. 1.8 (случай В):
U(2) = [и15 и2: и2 + uf<u02}. (1.4.15)
Тогда, как и раньше, находятся искомые выражения
U°<B, U°(0. ~ (0 °.
«1 ---------и2 =-------------2, 6 =
1 w, ’ 2 <о± ц°
®i = —
<о“
0 I л Т
= «А |1 —-0-
I
Sin ср, 0)2 = — (0± cos <р.
(0^
(1.4.16)
§ 4. ПРИМЕРЫ УПРАВЛЕНИЯ МЕХАНИЧЕСКИМИ СИСТЕМАМИ
55
Нужно отметить, что полученное оптимальное решение (16)
совпадает с точным, т. е. справедливо для любого е > 0. Анало-
гичным получается решение для переменного uQ(t)^O. При этом
управление остается прежним, а время быстродействия опреде-
ляется из условия
t
(0(7) = 0, 71>/0; со± (0 = <о°. - е J и° (s) ds. (1.4.17)
*0
Более подробно такого рода задачи исследуются в гл. 6—8.
3. Управление энергией квазилинейных колебаний плоского
осциллятора. Исследуется на асимптотически большом фиксиро-
ванном интервале времени Т = 0е-1 задача оптимального управ-
ления системой типа (1.22) из п. 3.3 § 1. Параметры системы
при этом считаются постоянными. Уравнения движения в поляр-
ной системе координат имеют вид
г = vr, vr = z^r-1 — г + гиг + 8/г,
(1.4.18)
ф = ZV"1, Vy = — VrV^r-1 + + 8^,.
Возмущающие функции /г, /ф могут зависеть от г, vr, vv и 2л-пе-
рподически от ф. Система (18) относится к виду (1.1) и имеет
одночастотное порождающее решение типа (1.3). Полный набор
интегралов невозмущенной системы равен
V2 (*4 + 4) + */2r2 = Е, rv<f = К, (1.4.19)
г2 = Ez, ф = б + arctg [ (tg х|) + d) (1 — d2)_1/2].
Здесь E — полная энергия, К — кинетический момент, б — угло-
вая постоянная, ф — фаза,
z = 1 + d sin 2х|), d = (1 — K2E~2)1/2, if = t + x|)°. (1.4.20)
Величины E, К (или d), 6, x|)° — постоянные интегрирования.
Из (19), (20) следует, что
Е (1 — d) г2 Е (1 + d), vr — d 1/2 cos 2гр,
(1.4.21)
Траектории невозмущенной системы представляют собой эллипсы
с общим центром в начале координат, см. рис. 1.3. Их размеры
и ориентация определяются параметрами Е, К. (d), б.
В качестве медленных переменных для системы (18) удобно
взять интегралы Е, К. б, а быстрой — ^. На основе (18), (1.5)
56
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
получается
Е = evr (иг + /г) + ерф (иф + /ф), К = er (w<p + /ф),
i (Б К \ (1 — </2)1/2 , , !А , OOY
6 = — I— -дг I'—— (cos ф + d sin ф) cos ф, (1.4.22)
• л d + sin 2vp . Г К cos 2ф , . . x
Ч’ - 1 ~ + Ы <“• +
Начальные условия для Е, К, 6 и гр определяются при помощи
формул замены (19) — (21), причем 6° и гр0 определяются с точ-
ностью до л. Вместо какой-либо из переменных Е или К можно
взять d, которая считается ограниченной неравенствами 0 < dL
d d2 < 1 (при d = 0 траектория представляет собой окруж-
ность, при d = 1 — отрезок).
Рассматриваются терминальные условия и функционал в виде
в
£(Т) = .Е*>0, J[M] = [ (u2 + и2)(/т, | и | < оо. (1.4.23)-
О
Интеграл в (23) имеет смысл энергии, затрачиваемой на управ-
ление. Для определенности возмущение берется в виде fr = or3r
/Ф s 0, что отвечает нелинейной добавке возвращающей силы.
На основе § 2 находятся соответствующие б, гр сопряженные
переменные: р& = 0, р$ = О(&). Согласно (2.17) получаются вы-
ражения
ho = 4" £ № + + ’/гНПЕПк = const,
Ш = [ /£’ - -J- ( УЁ~° - /Ё*)Г, И (т) = х2 С). (1-4.24)
L ° j п
, . 4 (. . п . 0 — т/.
П£(т)=ж® l1-w x(T)=1-_0“V~wr
Здесь g, ц, ця — усредненные переменные Е, К, рЕ. Рк соот-
ветственно. Оптимальное управление и функционал в первом при-
ближении равны
=’/гПЕ^’г.ф, Л = ^О0> = (1.4.25)
Следует вновь обратить внимание на особенность управления
в форме синтеза при т -> 0 (цЕ Е Ф Е*).
Управление (25) направлено по касательной к траектории.
Функции цЕ, рг,ф и входящие в них Е, E(d) определены в пер-
вом приближении согласно (24), (21), а фаза гр равна (см. (2.17))
т
ф(«,8) = г-4-оУ^(0)(/9 + ф°. (1.4.26)
то
§ 5. СТАБИЛИЗАЦИЯ НЕСБАЛАНСИРОВАННОГО РОТОРА
57
Формулы (24) —(26) определяют искомое решение задачи опти-
мального управления, как программное, так и в форме синтеза.
Следует отметить, что выражение (26) сходно с соответствующим
(2.27) и совпадает с ним при замене Е = V2a2, где а — «ампли-
туда».
§ 5. Стабилизация несбалансированного ротора
Рассматривается механическая система с тремя степенями
свободы, представленная на рис. 1.9. Эта модель в ряде практи-
ческих случаев описывает колебания в вертикальной плоскости
OXY корпуса ‘ массой М, жестко связанного с несбалансирован-
ным ротором массой т и дебалансом Z. По осям X и Y корпус
связан посредством аморти-
заторов с неподвижным ос-
нованием. Предполагается,
что их характеристики —
вязкость к = (кх, ку) или
коэффициент упругости
с = (сх, су) — можно регули-
ровать в некоторых неболь-
ших пределах. Угловая ско-
рость вращения ротора ср =
= со также может быть ре-
гулируемой, а угловое уско-
рение со = 7 — управлением.
Прикладной интерес пред-
ставляет решение задач уп-
равления с целью уменьшения амплитуды нежелательных коле-
баний, возникающих как в переходном процессе разгона или тор-
можения, так и в установившемся режиме вращения ротора, см.
[60, 75, 112, 202, 205, 238].
Пренебрегая малыми нелинейными эффектами демпфирую-
щих устройств, можно получить систему уравнений движе-
ния [238]:
(М + т)х + кхх + схх = mZ(cp2 sin ф — ср cos ф),
(Л/+ т)у + куу + суу = — (М + m)g — cos ф + ф sin ф),
(1.5.1)
Ф = со, (0 = 7, 7(Z)^ Г.
В (1) предполагается, что слабоуправляемыми являются ко-
эффициенты жесткости сх, см. [217], а угловое ускорение 7,
58
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
масса т и вязкости кх, ку малыми, т. е.
Cxty — Сх,у (1 "Ь $х,у), $х,у — 8 1? уУх,у z'4Z
г0 к
2 _ сх,у х,у _ т
~~ М — т* (Л/ + m) vx y ~ ™х'у' М + т
Далее вводятся единицы измерения L ~ I, v ~ vXtV. При заданной
функции у = Е7*(со) функция со(т) становится известной; в ре-
зультате получаются две раздельные колебательные системы, на-
ходящиеся под действием общего периодического воздействия
вида (см. (1.8))
я + v2xx = — zv2xxux — &кхх + Epico2 sin ср,
У + у*У = — g — Evfytty — екуУ — Ерю2 cos ср, (1.5.2)
ср = со (т), т = [0, 0].
Здесь величины у2,у ~ 1, управления | их,у | их,у ~ 1, g ~ 1 —
ускорение свободного падения, отнесенное к v2L, а ец ==
= ml/((М + m)L). Рассматривается задача минимизации полной
энергии колебаний по каждой из степеней свободы х, у:
0
Jх,у [^х,у] ~ J EXiydx min, | их,у | и^у,
О и^у (1.5.3)
= V2 G2 + Еу = V2 [У2 + Уу(У~ Уо)2], Уо = - gvy2-
Далее коэффициенты v2Xty, кх ^ ц полагаются постоянными.
При помощи (1.9) подсистемы (2) приводятся к форме (1.10),
содержащей внешнее периодическое воздействие. В предположе-
нии нерезонансности (Qx—со)~ 1, (Qy— со)~1, т [0, 0], где
ЙХ)У(т, е)—возмущенные собственные частоты, среднее значение
внешнего воздействия мало (0(e)), а искомое управление имеет
вид
их = и® sign (га), иу = Uy sign (уу). (1.5.4)
Согласно методу эквивалентной линеаризации [58] оптималь-
ные законы гашения колебаний (4) в первом приближении дают
тот же эффект убывания амплитуд колебаний, что и вязкое тре-
ние вида
9 I/O • 2
хих^^-^-х, yUll~ — ^-d(p)y, (1.5.5)
d(p)=2/p, 0 < р < 1; d(p) = 1 + 1/р2, р > 1,
Р = аУ/\ Уо I, аУ = + (У- Z/0)2]1/2 = &Еу)11й/ vy.
§ 5. СТАБИЛИЗАЦИЯ НЕСБАЛАНСИРОВАННОГО РОТОРА
59
Исследование задачи оптимального управления существенно
усложняется, если имеет место резонансный случай и требуется
учет влияния внешнего воздействия на амплитуду и собственную
частоту колебаний системы (2).
Дальнейшее интегрирование уравнений движения для пере-
менных амплитуд ах, ау и фаз -фх, при помощи метода усредне-
ния не представляет затруднений, поскольку ах, ау> 0 (особые
управления не возникают, см. п. 4 § 2).
Исследование задачи (2) оптимального управления амплиту-
дами колебательных подсистем усложняется, если имеет место
резонансный случай vx, у—со = 0(e) и требуется учет влияния
внешнего воздействия па амплитуду и фазу собственных колеба-
ний согласно § 5 гл. 2. Ниже для определенности рассматривает-
ся (как менее громоздкая) задача минимизации ах(Т) в резо-
нансном случае (для сокращения записи нижний индекс х опу-
скается) :
т
co (т) = v + еа (т), ср = ср0 + + б (т), б (т) = j о (s) ds. (1.5.6)
о
Посредством обычной замены (см. § 1 гл. 1)
х = a sin ip, x = tfvcos4>, ip = ср + а, (1.5.7)
где а — фазовая расстройка, получается система стандартного
вида:
а = е [—vua sin (ср + а) — ка cos (ф + а) + ptv sin ф] cos (ф + а),
(1.5.8)
а = —ео(т) 4-e[vw sin (ф + а)+/t cos (ф + а)+pva-1 sin ф] sin (ф+а).
Из условия максимума функции Гамильтона находится уп-
равление
и* = — и° sign {[р cos (ф + а) — (p/а) sin (ф + а) ] sin (ф + а)},
(1.5.9)
где р, р — сопряженные а, а переменные. Для усредненного по ф
гамильтониана h в медленном времени т получается выражение
(СМ. § 2)
h =(vu°/ji) (р//) (VI —x2 + xarcsinx)~
— V2 кар — V2 pv [p sin a + (pAz)cos a] — ро(т),
-1 (р/л) [P2 + (p/a)2]'I/2 I- (1.5.10)
Каноническая система уравнений краевой задачи первого при-
60
ГЛ. 1. МЕТОД УСРЕДНЕНИЯ ДЛЯ КВАЗИЛИНЕЙНЫХ СИСТЕМ
ближепия при помощи (10) записывается в виде
VU0 ЛГ-Л---9 ра к 11 v .
« = - /1 - 7? —- т “ - тS1" “•
а' = (х /1 — X2 + arcsin х) + - о (т),
0 2 ?
(ts-H)
р* = [р cos а — (p/а) sin а],
а (0) = а0, а (0) = а0 = гр° —- ср0, р (0) = — 1, р (0) = 0.
Для нерезопансного случая, коротко изложенного выше, крае-
вая задача первого приближения имеет вид (11), но в ней нужно
положить ц = 0, а = 0. Это сразу приводит к выражениям
р = 0, sign/?(т)= — 1, а = а0, 'ф = у£ + 'ф°,
а(т) = а°ехр + а>0, те[0, 0].
Подстановка выражений (12) в (9) позволяет определить иско-
мое управление первого приближения.
Наличие коэффициентов, обусловленных резонансом, сущест-
венно усложняет решение краевой задачи (И), которое может
быть проведено численно. Можно установить, что при достаточно
больших ц и 0 достигается абсолютный нулевой минимум функ-
ционала (3), что приводит к особым управлениям (см. § 2 гл. 1).
Пусть имеет место обратный случай «разумного» соотношения
между ц, 0, а0 и другими параметрами, такого, что а(т)>0 при
те[0, 0], т. е. пусть |ц| достаточно мало. Тогда искомое реше-
ние задачи (11) находится приближенно разложениями по мало-
му параметру ц в виде
р = цр1 + О(ц2), р = ро + 0(ц2),
а = ссо + цсс! + О(ц2), а = а. + + О(р2). ( }
Для неизвестных коэффициентов разложений (13) имеют место
выражения
Ро (т) = — ехР 1Г (т — 0)Ь «о (т) = а° ехР (— гт)>
а0 (т) = а0 — J о (9) dO, (1.5.14)
о
т
«1 W = V J U°P! (0) - ± cos а0 (0)
§ 5. СТАБИЛИЗАЦИЯ НЕСБАЛАНСИРОВАННОГО РОТОРА
61
т
Р1 (т) =-----J ехр [г (0 — 0)] cos а0 (0) dB,
О
т
Я1 (т) = —у J"exP (0 — Т)1 sina0 (0) (/0,
о
(1.5.14)
уи° к
г ==— +-у.
Л 2
Подстановка выражений (14) в (13), а затем в (9) приводит
к искомому оптимальному управлению, обеспечивающему по-
грешность О(е + р,2) по траектории и функционалу.
Существенный прикладной интерес представляет исследова-
ние задач гашения колебаний основания, вызванных вращением
несбалансированного ротора, при медленном прохождении резо-
нанса в случае существенного обратного влияния этих колебаний
па угловую скорость вращения. К таким относятся системы с ог-
раниченным возбуждением [112], в которых необходимо изуче-
ние совместной динамики вращательно-колебательной системы и
механизма привода (см. § 5, 6 гл. 9).
ГЛАВА 2
ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
ДЛЯ УПРАВЛЯЕМЫХ КВАЗИЛИНЕЙНЫХ СИСТЕМ
И НЕКОТОРЫЕ ОБОБЩЕНИЯ
На основе метода канонического разделения переменных стро-
ятся решения краевых задач принципа максимума с заданной
степенью точности по малому параметру. Метод усреднения обоб-
щается па многочастотные системы, а также системы более об-
щего вида; рассматриваются критические случаи: малые частоты,
релейные управления, прохождение резонансов и др.
§ 1. Метод канонического усреднения в системах
стандартного вида с вращающейся фазой
1. Каноническая замена переменных и метод усреднения.
1.1. Предварительные замечания. Как известно [45, 58, 59, 69,
70,148], метод усреднения связан с заменой переменных, которая
исключает быструю переменную — фазу из правой части системы
с заданной степенью точности по е (см. § 2 гл. 1). При достаточ-
ной гладкости системы такая замена определяется решением не-
которой последовательности систем 2(п+1) дифференциальных
уравнений в частных производных [58, 69, 70]. Интегрирование
этих уравнений приводит к произвольным функциям медленных
переменных (см. [69] и (1.2.16)). Видом этих функций можно
распорядиться из соображений удобства исследования повой
усредненной системы [58, 69].
Например, для исследования задачи Коши в случае малого
периодического по времени t гамильтониана Н = х, р), где
х — координата, р — импульс, е — малый параметр, авторы работ
[64, 208] распорядились указанной неоднозначностью так, чтобы
усредненная по t система также имела каноническую форму.
Тогда усредненный гамильтониан дает важный для приложений
интеграл энергии, что позволяет во многих практических случа-
ях сделать важные качественные выводы и оценки относительно
поведения системы на большом интервале времени. Еще одно
удобство с методической точки зрения состоит в том, что нужно
§ 1. МЕТОД КАНОНИЧЕСКОГО УСРЕДНЕНИЯ
63
строить решение уравнения в частных производных для скаляр-
ной производящей функции, а не для 2(n+l): р(т, ср, е),
g, ф, е), см. (1.2.14).
В общем случае гамильтоновых систем метод, основанный на
преобразованиях Ли, развивался в [89, 97, 136, 149, 253]. Ниже
рассматривается метод канонической замены переменных для
стандартной гамильтоновой системы с вращающейся фазой и
медленно изменяющимися параметрами, т. е. с учетом медленно-
го времени т.
1.2. Построение производящей функции и усредненного га-
мильтониана. Строится унивалентная каноническая замена пере-
менных а, гр, р, q для системы (1.2.8) (или (1.3.3)) с гамильто-
нианом Я* (1.2.6) (или (1.3.4)) на новые усредненные перемен-
ные £, ф, ц, р посредством производящей функции S =
= 5(т, а, гр, ц, р):
dS л dS с. dS dS
^ = 7? * = = Ф=< (2ЛЛ>
Требуется, чтобы новый гамильтониан К не зависел от ф: К =
= К (т, g, ц, р, е) и, кроме того, при е = О старые и новые пере-
менные совпадали. Производящая функция S и гамильтониан К
связаны нелинейным дифференциальным соотношением [76]
g + -g, е)=Я(тЛ,т], М). (2.1.2)
На основе сделанных предположений искомые функции 5, К и
замена (1) имеют вид
5 = (а-г|) 4- грР + ео(т, а, гр, г], Р, е),
до о , до о , до , , до
р = 11 + е^ ? = 0 + ^ = а + е^’ = +
(2.1.3)
К = v (т) р + гк (т, ц, Р, е).
Здесь о, к — неизвестные функции, определяемые соотношением
(2) после подстановки в него выражений (3):
v(T)g + /г* (т’ Ф> П + eg, 0 + eg) +
+ е^ = /с(т, а + eg-, т], 0, е). (2.1.4)
Из уравнения (4) искомые функции о, к могут быть определены
в виде разложений по е:
о(т, а, гр, ц, р, е)= о0(т, а, гр, ц, Р)+ eOi + ... + eJOj + .. .,
(2.1.5)
&(т, Л, Р, 8)= Л, р)+ efci + ... + eJ7cj + ...
64
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
Приравниванием коэффициентов при одинаковых степенях е
(в предположении достаточной гладкости функции Л* по мед-
ленным переменным) на основе (3) — (5) получается зацепляю-
щаяся последовательность скалярных дифференциальных урав-
нений. В частности,
V (т)^2 + h* (т, а, -ф, т], Р) = к0 (т, а, я], Р). (2.1.6)
Можно потребовать, чтобы функция о (т. е. все коэффициенты
о0, Qi, ...» Oj, ...) была 2л-периодической по хр. В результате для
искомых функций kQl о0 получаются выражения
к0 (т, П, Р) = <h* (т> Ф» Р)> = ho (т, I, г], Р),;
(2.1.7)
ст0 (т, а, яр, т|, Р) = — 7(7) J [h* (т, а, яр, я], Р) — h*0 (т, а, я], р)] <йр.
Для последующих неизвестных коэффициентов ki, о,- (О 1)
справедливы аналогичные представления:
(т, я], Р) = hi0 (т, £, я], р), 1 = 1,...,/,...,
(2.1.8)
щ (т, я, яр, Я1, Р) = — 7^- J [hi (т, я, яр, Я], Р) — hi0 (т, я, яр р)] Лр.
Функции hi в (8) определяются через найденные па предыдущих
шагах коэффициенты, например:
, , , (>СТ1 (dh* , 1 (d2h* до0 до \ ,
/г, (т, я, яр, ЯЯ, Р) = — — -т— • -=-4 + -я- -г • ч +
2 v ’ т» и । / \ дт\ да J \ дУ\ /
dh*d<\ ! Э2А* р2/г* _
+ “зр^Г + "2' ЗР2 W/ \<?Я)<?р’да }дЦ
(2.1.9)
\ да *дт] J 2 ^а2 дг\ в дх\ J \да дт] J1 V * *
Нужно отметить, что коэффициенты определяются, как и в
(1.2.16), неоднозначно, с точностью до произвольной функции
медленных переменных. Эта неоднозначность исчезает при воз-
вращении к исходным переменным.
Для построения канонической усредненной системы (/+ 1)-го
приближения нужно вычислить первые (/ + 1) коэффициентов
разложений (5) для (0 I /) и j — для о£ (Z j — !)• Так
как в усредненной системе для ср, ц, р при этом будут отбро-
шены члены <?(ej+2), то ее интегрирование после введения мед-
ленного времени т = st (т~1) приведет, вообще говоря [69],
к погрешности 0(eJ+1). Исходные переменные а, хр, р, q будут
§ 1. МЕТОД КАНОНИЧЕСКОГО УСРЕДНЕНИИ
65
также определены при помощи (3) с указанной точностью. Изве-
стно [58, 69, 70, 148], что учет о; приводит к так называемому
улучшенному (по уравнениям) приближению (/ + 1)-го порядка,
используемому при обосновании метода усреднения.
В медленном времени т = е£ усредненная система (у + 1)-го
порядка приближения имеет вид
<.• дк . дк v (т) , дк „
= —+ <i = const’
j (2.1.10)
А' (т, 1], р, е) = 2 81 кг (т, В, 1], Р), Т €= [т0, 0].
г=0
Индекс /, указывающий порядок приближения по е, для сокра-
щения записи опущен. Интегрированию в (10) подлежит только
гамильтонова система 2п уравнений для £, ц, в которой р — пара-
метр. Фаза ф на основе известных £, т] с такой же погрешностью
находится квадратурой. Если к не зависит от т, то система для
допускает интеграл к = к(£, ц, р, s)= const. Как отмеча-
лось, общее решение уравнений (10), необходимое для опреде-
ления решения краевой задачи принципа максимума, может быть
построено на основе решения первого приближения.
2. Построение первого приближения. Система первого прибли-
жения для т| (см. п. 3 § 2 или п. 3 § 3 гл. 1) получается
из (10) при / = 0:
— (Т. S. I). ₽)• Р = confit’
Ч г <2ЛЛ11
Л* — д^ ~ д^ lOWo) + 0Л) ^ob
Предполагается далее, что общее решение системы (11) построе-
но в виде
1 = ц (т, т0, е до, Р), (2112)
П = По (т> т0, П*, Р), По Ь = П*-
Фаза ср получается па основе (12), (И) квадратурой
Ф = Ф° + е-1ф-1 (т, т0) 4- ф0(т, т0, 0, £°, Т]*, Р),
(2.1.13)
ф-i = ) V (9) d$, Фо = J Fo (0, £0 (9), Г|о (9), Р) dQ.
S то
Из (1.2.17) или (1.3.10) при фиксированном 0 следуют крае-
вые условия первого приближения, которым должны удовлетво-
рять свободные параметры £°, Л*, Р,
ф° = г|Д Л/(^ф)|0 = О,
(2.1.14)
5 Л Д. Акуленко
66
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
Здесь в функции M(N), g подставляются выражения типа (1.3.12)
и проводится разложение в окрестности значений (12), (13) при
известных = а0, <р° = гр0. Вследствие сделанных предположе-
ний должен существовать корень Л, г|*, р, зависящий от осталь-
ных параметров задачи. Если он простой и единствен, то на ос-
нове теории о неявных функциях [66, 93] построенные выраже-
ния определяют оптимальное решение — траекторию а, гр, функ-
ционал J и управление и с погрешностью 0(e). В случае когда
простых корней несколько, оптимальное значение выбирается
из условия минимума Л (1.2.18). Если оптимальный в смысле Д
корень является кратным, то вопросы оценки близости требуют
дополнительного исследования, так как в этом случае нельзя га-
рантировать 8-близости при возмущениях О (б); соответствую-
щие добавки к решению первого приближения могут иметь по-
рядок дробной степени 8 [8, 66, 93].
3. Каноническое преобразование сопряженных переменных
при замене фазовых переменных. Пусть в гамильтоновой системе
с функцией Гамильтона H = х, р), где х— вектор коорди-
нат (фазовая переменная), р — вектор импульсов (сопряженная
переменная) производится достаточно гладкая невырожденная
точечная замена:
я = У), У = Ш *)• (2.1.15)
Замена типа (15) проводится часто в исследованиях методом
усреднения задач оптимального управления при помощи условий
принципа максимума. Например, опа проводится при переходе
от исходных (лагранжевых) координат и скоростей к оскулиру-
ющим переменным типа «амплитуда — фаза» (см. гл. 1) или от
одной системы оскулирующих переменных к другой (см. §2 гл. 6).
Требуется найти такое преобразование импульсов, чтобы си-
стема уравнений сохранила гамильтонову форму. Оно определя-
ется производящей функцией S [76]:
S = S(t,x,q), д±=ср, д±=У, (2.1.16)
где q — новый импульс, с — валентность канонического преобра-
зования (с¥=0). Из последнего равенства (16) следует, что
S(t, х, q) = (q • гр(£, х)) + a(t, х). (2.1.17)
Здесь а — достаточно гладкая произвольная функция t, х, кото-
рая может выбираться из соображений удобства. Дифференциро-
вание S (17) по х приводит к искомому выражению для нового
импульса q и нового гамильтониана К:
q = с -r-М р — = г] (t, х, р),
\дх J 1 \дх J дх 1 v г'
(2.1.18)
K(t, у, q) = сН[ t, х, + Ц-» х = ф(^ У}-
§ 1. МЕТОД КАНОНИЧЕСКОГО УСРЕДНЕНИЯ
67
Далее для простоты рассматриваются унивалептные канониче-
ские преобразования (с=1). Следует отметить, что координат-
ное преобразование (15) приводит к линейному по р преобразо-
ванию т] импульсов (18). Это свойство также непосредственно
устанавливается, если гамильтонова система (£, х, р, Я) может
быть представлена в форме Лагранжа (q = рд^/ду). Когда зада-
ча стационарна, т. е. функции Я, ф и -ф не зависят от t, то ука-
занные преобразования и новая система могут быть выбраны не
зависящими от t. Если некоторые компоненты вектора х преобра-
зуются тождественно, то также тождественно могут быть преоб-
разованы соответствующие им импульсы.
Пример. Рассматривается возмущенная гамильтонова система
с функцией Гамильтона Я:
Я = pxv — v2(r)pvx + &h(t, т, х, р, рх, pv), т = s£. (2.1.19)
Здесь х, v — фазовые координаты, рх, pv — соответствующие им-
пульсы, е — малый параметр, h — достаточно гладкая возмущаю-
щая функция. Пусть производится «точечная» замена (15) к пе-
ременным типа Ван-дер-Поля [58]:
х = a cos ср 4- Ъ sin ср, v = v (т) (— a sin ср + Ъ cos (р),
С z х 7 1 С z х л (2.1.20)
ср = \v(r)dt =— I v(r)dr, r = 8t v
Тогда при помощи производящей функции S и замены рх = dS/dx,
pv = dS/dv для qa, qb можно получить
5(т, ф, х, р, qa, qb) =
= qa (х cos ср — sin (р) + qb (х sin ср + v-1p cos ср),
(2.1.21)
qa = Рх cos ср — vpv sin <p, qb = px sin cp + vpv cos cp,
К = H + = e/г* + 8 (qasin ф + qb coscp) (— (шпф + b coscp).
ot
Здесь h* — возмущающая функция h (19), в которую для х, v,
рх, pv подставлены их выражения через a, ft, qa, qb (20), (21).
Дифференцированием по qa, qb и а, Ъ получаются искомые урав-
нения для новых гамильтоновых переменных, которые оказыва-
ются оскулирующими.
Пусть замена (15) соответствует переходу к переменным
«амплитуда А и фаза гр»:
х = A cos гр, р =—x4vsini|). (2.1.22)
Тогда при помощи производящей функции S,
S = qA(x2 + х~2и2у/2 — q^ arctg(p/(xv)),
получаются искомые выражения для преобразованных импульсов
68
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
qA, и функции Гамильтона К:
qA = рх cos ф — vpv sin ф, = —А (рк sin ф + vpv cos ф),
(2.1.23)
К = vq^ + &h* — 8v_1v' (qAA sin2 ф + q^ sin ф cos ф).
Здесь h* — функция в новых переменных, которая получается
из выражения h (17) при подстановке х, г, рх, р» согласно (22),
(23). Формулы (20), (21) и (22), (23) позволяют осуществить
переход от переменных а, Ь, ра, Рь к переменным Л, ф, рл, р^.
§ 2. Построение высших приближений решений
краевых задач принципа максимума
1. Общее решение усредненной системы. С требуемой сте-
пенью точности по малому параметру строится решение систе-
мы (1.10), удовлетворяющее условиям g(T0) = £0, ц(0) = ц*, гДе
g°, Л* — неизвестные параметры из области определения систе-
мы. Искомое решение g, ц ищется в виде разложения
£ = go + egt + ... + 8Jgj, ц = ц0 + ещ + ... + еЧ- (2.2.1)
Здесь go, Цо — известные функции аргумента т и параметров за-
дачи (1.12). Функции gi, ц, (i=l, .. ., /) в (1) неизвестны и
находятся путем последовательного решения двухточечных задач
вида
д^к д~к
= ’I' W = 0’
Л (2'2>2)
тй=—+ т м«) = о,
до, U(=> и 'I
где n-мерпые вектор-фупкции /|, /? па каждом шаге известны;
они определяются через к0, kh ..., fcf-i и найденные па предыду-
щих шагах коэффициенты g0, ц0, ..gi-i, щ-i. Например:
fl = дк./дц, /Р = - дк./д^, (2.2.3)
+ (^^^0 + — П1-П1)], ...
§ 2. ПОСТРОЕНИЕ ВЫСШИХ ПРИБЛИЖЕНИЙ
69
Производные функций Ао, кь кг, ... в (2), (3) берутся па извест-
ном порождающем решении £0, т)о (1.12). Так как при /f = /?s
= 0 однородная система (2) есть система в вариациях для урав-
нений первого приближения (1.11), то ее фундаментальную мат-
рицу Z(t) можно получить дифференцированием общего реше-
ния (1.12) по параметрам т]* в виде (2ге X 2п)-матрицы:
Z(t) =
(2.2.4)
Предполагается далее, что матрица Z(t) неособеппа при
т <= [т0, 0]. При помощи метода вариации постоянных интегри-
рования общее решение системы (16) на основе (18) запишется
в виде
(п!, <’>) -z 4zi <e> (р 3+z«(;$)• ‘ -1..............>
то 1 '
(2.2.5)
Решение (5) представляется в виде суммы частного (%* (т), ц* (т))
и общего для однородной системы. Затем, согласно (1.12), полу-
чаются выражения
^0 =Ч =о
То О ’ То д? 6
где 7, 0 — единичная и пулевая соответственно (n X п)-матрицы.
Используя эти равенства, из вида решения и краевых условий
(2) можно найти неизвестные с},
4 = 0, сР = -ц*(0), / = 1, (2.2.6)
В результате применения изложенной процедуры будет по-
строено решение (/ + 1)-го приближения как функция т и пара-
метров краевой задачи, часть из которых (£°, ц*, Р (©)) неиз-
вестна и подлежит определению из краевых условий. На основе
известных т] из (1.10) находится ф:
ф = Ф° + e-Icp-i + ф0 + £ф1 + . .. + 85ф5, (2.2.7)
гДе ф° — неизвестный параметр, а ф; — известные функции.
2. Построение общего решения исходной системы. Далее с не-
обходимой точностью по 8 вычисляются исходные переменные а,
р, </, которые связаны с усредненными £, ф, ц, р соотноше-
ниями (1.3). Коэффициенты о, разложения (1.5) известны в ви-
де (1.7) — (1.9). Найденные функции ц (1) и ф (7) (р =
= const) подставляются в формулы преобразования (1.3), где
70
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
члены O(ei+1) отброшены:
t . д<У , о „ о . о до
а = ^-е^-’ ^ = <р-е^-’ /, = г1 + 8^-’ 9 = р + е^’
(2.2.8)
о = <?о + eai + • • • + eJ-4-i (/ > !)•
Искомые исходные переменные a, ip, р, q ищутся в виде
a(t, е) = а0 + eai + .. . + e;aj, г|)(/, е)= ipo + fi'ipi + .. . + fiApj,
(2.2.9)
р(£, е) = Ро + £Р1 + ... + £>ь q(t, £) = £о +££1 + • • • + e^j.
Выражения (9) подставляются в (8), разлагаются по е, затем
приравниваются коэффициенты при одинаковых степенях £г. Из
соображений удобства можно использовать разложение относи-
тельно усредненных переменных g, ср, ц, р или двойное разложе-
ние относительно их первых приближений £0, ср0 + + ф0,
Цо, Ро. В частности,
«О = ^0’ Фо = Ф° + 8-1ф-1 + Фо, Ро = 11о, % = Р = COnSt>
до до до до
«1 = ^1-^, Ф1 = Ф1-0Р ^1 = П1 + ^-, 91 = ^
0о = 0о(т, go, ф° + + фо, Цо, Р). (2.2.10)
Решение (/ + 1)-го приближения представляется в виде
а = Во + еИ, ip = <р° + £-1cp-i + фо + еЧ7, р = т]0 + вР,
? = Р + е(). (2.2.11)
Здесь плавные функции Во, ф-i, фо, Цо определяются согласно
(1.12), (1.13), а функции А, Ч1*, Р, Q содержат быстрые осцил-
ляции вследствие периодической зависимости от £_1ф-1(т, т0).
Все функции зависят также от т и параметров т0, 0, В°, ф°, Л*, Р-
3. Решение краевой задачи принципа максимума. Асимпто-
тическое решение и оценка близости по £ для задачи Коши, опи-
сываемой стандартной системой с вращающейся фазой, были
предметом исследований многих работ [23, 46, 58, 69, 85, 143, 162,
164, 192, 210, 219, 241]. Асимптотический анализ двухточечных
краевых задач требует специального рассмотрения. Результаты
по обоснованию е-близости первого приближения содержатся в
[19, 146, 177, 239], см. § 3.
Для определенности рассматриваются начальные и конечные
условия краевой задачи (1.2.9). Можно выделить два подслучая,
когда I = п+ 1 и Z < n + 1. В первом условия трансверсальности
не учитываются, если система относительно В°, ф°, Л*» Р допуска-
ет конечное число корней. Если 1<п + 1, то предполагается, что
ранг линейной системы конечных уравнений относительно /-век-
тора X, получаемой из условий трансверсальности для р, q после
§ 2. ПОСТРОЕНИЕ ВЫСШИХ ПРИБЛИЖЕНИЙ
71
подстановки а, гр, р, q в первом приближении при g° = а0, ср0 = гр°,
равен I в некоторой области изменения параметров задачи. Тогда
он будет максимальным при достаточно малом е после подстанов-
ки а, гр, р, q из (И) в (/+ 1)-м приближении. Далее линейная
система разрешается относительно % в зависимости от элементов
матрицы (дМ/да, дМ/д^) 1е и вектора (dg/da, д£/дгр)|в. После
подстановки найденного % в оставшиеся 2(п+1) соотношений
получается система 2(п+1) уравнений относительно искомых
параметров g°, <р°, ц*, р вида
(В + еЛ) |т0 = а°, (ф + еТ) 1т0 = Ф°, м |е = 0, (2.2.12)
R(a, ф, р, q) |е = 0, /? = (/?,, . . ., Яп+1_().
Корень системы (12) как функция параметров 8, а0, гр°, т0 и 0
строится разложениями по е аналогично (8) —(10):
5° = а0 + 8g? + . . . + Ejg°, срО = ^0 + ефо + _ + е;фо?
П* = П° + • • • + ^П*\ 0 = р° + ер(1)+ ... +^0).
После подстановки (13) в (12) и разложения функций А, Ч1*, Р,
Q, М, R в окрестности значений а0, гр°, Ц?, получаются асимп-
тотические представления искомых параметров с нужной сте-
пенью точности по е. Следует отметить, что при т = 0 проводит-
ся разложение в окрестности точки гр0 ~ что возможно вслед-
ствие периодичности по гр. Параметры Г|°, определяются урав-
нениями
м (Но (0, а°, nt 0°), ф0 + (©) + <р0 (0, а», nt 0°)) = 0,
(2.2.14)
R а0 (0, a0, nt 0°), ф° + P-iq)-! (0) + Фо (0, а», nt 0°), nt Р°) = 0.
Функции М, R (14) быстро осциллируют при изменении 8.
Поэтому корень должен существовать для любого гр, в том числе
для средних этих функций по гр, т. е.
м0 а0 (0, а», nt 0°)) = о, ^0 (Во (е, nt 0°), nt 0°)= о,
а также для максимумов и минимумов по гр. Кроме того, требо-
вание простоты корпя ц?, р° должно выполняться для всех
гр° <= [0, 2л]. В частности, если М и g не зависят от гр, то указан-
ные трудности не возникают.
Итак, пусть коэффициенты g?, гр?, ц(*г), £(г) (13) найдены и
подставлены в а, гр, р, q (И). Они определяют решение краевой
задачи и значение функционала J (1.2.2) с погрешностью O(ej+1).
В случае гладких функций и* (1.2.5) имеет место такая же оцен-
ка и по управлению. Если управления кусочно-непрерывпы, то
близость понимается в смысле среднеквадратической по периоду
нормы или по J.
72
ГЛ. 2 ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
Па основе вышеизложенного можно сформулировать утверж-
дение.
Теорема 2.1. Пусть выполнены необходимые требования глад-
кости и условия леммы 1.1, а также следующие:
1) задача (1.11) допускает решение вида (1.12);
2) система (1.14) имеет простои вещественный корень ц*,
0, X;
3) ранг матрицы Z(t) (14) равен 2п.
Тогда задача оптимального программного управления имеет
решение (1.2.10) — (1.2.12), отличающееся от точного на величи-
ны О(е;+1) по функционалу и удовлетворению краевым условиям.
В случае фиксированного 0 эта близость имеет место также и по
фазовой траектории.
Синтез оптимального управления и оценка близости в случае
фиксированного Т и заданного конечного условия имеет особен-
ность при tТ; поэтому равномерная оценка точности не га-
рантируется.
§ 3. Асимптотическое решение
двухточечных краевых задач
1. Исходные предположения п постановка задачи. Рассматри-
вается краевая задача для системы, записанной в стандартной
форме (1.1.12). Объединение медленных фазовой и сопряженной
переменных в один вектор х и исключение при соответствующих
предположениях из условий трансверсальности вектора множите-
лей Лагранжа (на левом, при t = 0, и нравом, при t — Т, кон-
цах) позволяет получить двухточечную краевую задачу вида
x = sX(t, х), Л/(х(0), х(Г))=0. (2.3.1)
Здесь х — искомый медленный и-вектор, t — независимая пере-
менная, t е [0, Г], Т = 0£-1, 0 = const > 0; £ — малый числовой
параметр, в <= [0, в0]; X(t, х), М(у, z)—заданные в области
(£, х)^[0, T]XDx, (г/, z) <= Dx X Dx вектор-фупкции размерности
п > 2. Следует отметить, что в краевых задачах принципа макси-
мума граничное условие (1) распадается обычно па два вектор-
ных соотношения в начале (t = 0) и конце (t = Т) процесса уп-
равления размерности п{} и пт соответственно:
М. (х (0)) = 0, Мт (х (71)) = 0, и0 + пт = п. (2.3.2)
Если формально допустить, что одна из величин и0 или пт
равна нулю (в краевых задачах принципа максимума заведомо
По, ит^1), то (1), (2) имеют вид задачи Коши, для исследова-
ния которой широко применяется метод усреднения [46, 58, 69,
70, 85, 143, 148, 162—164, 241]. Ниже устанавливаются довольно
общие условия, налагаемые на функции X, 71/, достаточные для
§ 3. РЕШЕНИЕ ДВУХТОЧЕЧНЫХ КРАЕВЫХ ЗАДАЧ
73
близости решений исходной (1) и соответствующей усредненной
краевых задач [19].
Следует напомнить, что к системе (1) с требуемыми свойст-
вами приводится ряд других более общего вида (см. § 1 гл. 1):
а = еА (т, а, ф), a = (ан . . ., яп), т = е£,
(2.3.3)
ф = v(t)+ еТ (т, а, ф), ф = (фь ..., фг), Vj(t)^v0>0.
Например, если г = 1, а функции А, V квазипериодичпы ио
4‘, то введением независимой переменной 0 и медленной 6:
/ / т \
9 = j v (ел*) ds, ф = 0 + б I Е0 = о = v (т') di' I, (2.3.4)
о \ b J
система (3) приводится к виду (1). Если же г>1, по частоты
уДт)= v(t) (cm. § 1 гл. 1), то векторной заменой для ф типа (4)
получается задача (1). В случае различных или частично совпа-
дающих частот vj при условии разложимости функций А, Ч7
в конечные тригонометрические суммы по ф7 замена (4) приво-
дит к системе (1).
Ниже формулируются требования, налагаемые на X(t, х),
1. Функция X{t, х) определена на всех t > 0, измерима но t
для фиксированных значении х Dx, где Dx— открытое связное
множество (открытая область).
2. Известное требование существования равномерного относи-
тельно х <= 1)х среднего по t функции X(t, х) заменяется более
жестким. Считается, что X(t, х) равномерно квазипериодпчпа
по t, т. е. представляет собой конечную сумму периодических
по t функций X{J) (j = 1, . . ., к, к > 1) с произвольными постоян-
ными периодами Щ
3. Функции X{t, х), Л/(у, z) определены для всех х, у, z е Т)х
и равномерно непрерывны по х, у, z.
4. Существуют постоянные См > 0, зависящие от Dx, та-
кие, что
\X(t,x)\^Cx, \М(у, z)I^Cv, ^0, x,y,z^Dx. (2.3.5)
5. Функции X, Al удовлетворяют условиям Липшица по х, у,
z е 1)х, т. е. существуют постоянные X.Y, ХЛ/, вообще говоря, зави-
сящие от Dx, такие, что
\Х(£, х')— X(t, х" ) I лЛ:1х' — х" I, t > 0; х', х" е Dx,
(2.3.6)
1Л/(/, 2')-М(у", Г)| /'I + I/- Г1);
у', у", zr, z" ^Dx.
74
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
Далее требования (6) для упрощения доказательств усилива-
ются предположением существования непрерывных и ограничен-
ных частных производных
(2.3.7)
t 0, х, у, z Dx.
6. При выполнении указанных требований существует среднее
Х0(х) функции X(t, х) по t, равномерное относительно x^Dx\
z+s k
XQ (х) = lim \ X (s, х) ds = У Xq} (x),
S->oo J
t+щ
Xq ) (x) = "]7~ J X (s, x) ds, i = 1, ..., к, t^O.
(2.3.8)
Функция XQ(x) обладает свойствами 3—5.
Обычно предполагается, что краевая задача (1) допускает ре-
шение x = x(t, s)^Dx, t [0, 08-1], 8^(0, 80]. Доказательство
существования такого решения представляет самостоятельную
трудную проблему, исследованную автором в § 4, см. [23].
Наряду с исходной краевой задачей (1) рассматривается бо-
лее простая, усредненная согласно (8):
Г = Хо(^), Л(^(О)Л(0))=О, т^[0, 6], ( >d/dT.
(2.3.9)
Предполагается, что некоторое решение £(т) краевой задачи (9),
принадлежащее области Dx, для всех т [0, 0] существует и
единственно. Известно, что при выполнении условий 1—5 реше-
ния задач Коши исходной и усредненной систем для некоторой
области общих или достаточно близких начальных значений об-
ладают свойством 8-близости [58, 69, 70, 241]. Ниже исследуется
вопрос, при каких дополнительных условиях на функции X(t,x),
М(у, z) существует также решение x(t, е) исходной краевой за-
дачи (1) и какова степень близости его решению £(е£),
е [0, 08-1], 8 > 0. Как отмечалось, в силу отсутствия зависимо-
сти усредненной системы от t и свойства каноничности построе-
ние решения усредненной краевой задачи принципа максимума
(9) аналитическими или численными методами обычно бывает
существенно проще, чем исходной (1).
2. Оценка близости решений исходной и усредненной краевых
задач. Для исследования вопроса о существовании решения
x(t, е) исходной двухточечной задачи (1) и близости его реше-
нию £(т), т = st, усредненной задачи (9) применяется следую-
щий конструктивный подход. В силу требований 1—5 п. 1 задача
§ 3. РЕШЕНИЕ ДВУХТОЧЕЧНЫХ КРАЕВЫХ ЗАДАЧ
75
Коши
x = eX(t, х), x(0)=a^Da^Dx, [О, Т] (2.3.10)
имеет решение вида
x(t, а, е)=ср(т, a)+v(t, а, е), а Da, х Dx. (2.3.11)
Здесь Da — некоторая непустая открытая область, ср(т, а)— не-
прерывно дифференцируемая функция по т <= [0, 0], Da — об-
щее решение усредненной задачи Коши
V = X0(g), £ = <р(т, a)^Dx. (2.3.12)
Функция v в (И), согласно [58, 69, 70, 201], равномерна от-
носительно t, 8, ограничена и непрерывна по а, т. е.
Ы 8G, t [0, Г], Т = 08-1, 8 [0, 80], Cv = const,
(2.3.13)
lim v (t, ak, г) = v (t, а*, c), ah a*, ah, а* е Da- V 7
k-^oo
Определенное согласно (9) решение усредненной краевой за-
дачи £(т) отвечает некоторому значению параметра а = а0 Da
в функции ср(т, а) (12), удовлетворяющему нелинейной системе
М(а, <р(6, а))=М*(а)=0, £(т)=ф(т, а0). (2.3.14)
Аналогично решение x(t, 8) исходной краевой задачи (1) по-
лучается при подстановке в (11) значения параметра а, опреде-
ляемого соотношениями
М*(а)+А(а, е)=0, А (а, е)^1(а, х(Т, а, е))-М*(а).
(2.3.15)
Здесь функция N непрерывна по а е Da в силу (7), (13), а вслед-
ствие (5), (13) равномерно ограничена: \N\^sCn, 8 [0, 80].
Для исследования неявной функции а = а(е), определяемой
уравнением (15), предполагается, что корень а0 системы (14)
простой:
det (дМ*/да) |% =# 0, aQ g= Da- (2.3.16)
Корень а(е) уравнения (15) ищется в виде а = а0 + а, где не-
известная а непрерывно зависит от 8, 8 [0, 80], и обращается
в пуль при 8 = 0. Она определяется соотношением
/ дМ*\-1 0М*(а % (0)) /0 \
-----/Д-р а0’е; + А(а’е>- (2.3.17)
Здесь А — непрерывная функция а, 8 при aQ + а <= Da, 8 <= [0, 80],
обращающаяся тождественно в нуль при 8 = 0, а = 0, причем
А = о(е+1а1). Для определения а из (17) применяется схема
метода последовательных приближений, в которой А считается
возмущением. Получается равномерно ограниченная и равносте-
76
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
пенно непрерывная при достаточно малых 80 > О последова-
тельность
(л W* \ — 1 Мр ~
~дги I® = 0
М* = М (а0, U), ^ = <р(0,ао). (2‘ЗЛ8)
Из (18) па основе теоремы Арцела [197, 218] можно выделить
равномерно сходящуюся к решению (17) последовательность
такую, что
ah = aQ + ая g Da, а* = а0 + а*, |а* (8) | < еСа.
Таким образом, справедливо следующее утверждение.
Теорема 2.2. При выполнении условий 1—6, (14), (16) ис-
ходная краевая задача (1) в рассматриваемой области
е [0, 08-1], 8 е [О, 80], x^Dx при 80 > 0 достаточно малом допу-
скает решение x(t, е), лежащее в 8-окрестпости порождающего
решения усредненной задачи (9) §(т), т = е£, т. е.
1х(£, 8)— £(т)1^еС, т = st е [0, 0], С = const. (2.3.19)
Более того, задача (1) не допускает в рассматриваемой области
решений, не удовлетворяющих оценке (19). Значение постоян-
ной С в этой оценке может быть эффективно определено в тер-
минах коэффициентов задачи и размеров областей 7)х, Da.
3. Замечания. 1) Единственность решения уравнения (17),
а вместе с тем и краевой задачи (1) не гарантируется. Для су-
ществования и единственности решения исходной краевой зада-
чи, обращающегося в порождающее £(т) при 8 = 0, достаточно
помимо условия (16) потребовать, чтобы функция А в (17) удов-
летворяла условию Липшица или обладала равномерно ограни-
ченной производной по а. Очевидно, эти предположения повле-
кут аналогичные требования гладкости по а па функцию v из
(И). Следует отметить, что равномерная оценка производной
dv/da = O(s) для всех t е [0, 08_1], а Da, 8 е [0, 80] может
быть получена стандартным способом па основе леммы Гропуол-
ла — Веллмана [58, 69, 70, 148, 218, 241]. Однако для этого мо-
гут потребоваться более высокие свойства гладкости функций
X, М по х, у, z е Dx. А именно: для функции X должна сущест-
вовать производная дХ/дх, равномерно ограниченная и удовлет-
воряющая условию Липшица по х с не зависящими от t, 8 посто-
янными. Аналогично должны быть усилены свойства гладкости
функции М по у, z Dx. Для построения решения краевой зада-
чи в первом приближении дополнительные свойства гладкости
оказываются излишними.
2) Выполнение неравенства (16) существенно, так как в про-
тивном случае возможно ветвление корня а0 при 8 =/= 0 на вели-
чины порядка дробной степени е [66, 93, 141]. Отличие порожда-
§ 4. ПОСТРОЕНИЕ ОБЩЕГО РЕШЕНИЯ СТАНДАРТНОЙ СИСТЕМЫ
77
ющего решения от точного в общем случае может иметь порядок
низшей ненулевой степени малого параметра е. В этом критиче-
ском случае требуются дополнительные исследования.
3) В частном случае терминальной задачи управления (кри-
терий качества Ф(г(Т) )-> minu) краевые условия для вектора
x=(z, р), где z — фазовый, а р — сопряженный векторы, имеют
вид z(0)=z°, р(Т) = — Ф'(з(Т)). Неравенство (16) эквивалент-
но требованию существования общего решения £=(£, л) усред-
ценной системы, такого, что £(0, а, Ь)= а, т)(©, а, b)=b, где па-
раметр а принимает значения из некоторой окрестности точки z°,
а b — точки &* = &(z°), являющейся простым корнем уравнения
Ф'(Ц0, Л &))+& = 0.
4) Сформулированная теорема и приведенные замечания
справедливы для каждого допустимого корня а0 е Da. Выбор
нужного значения а* применительно к задаче оптимального уп-
равления проводится из дополнительного условия минимума
функционала, вычисленного с достаточной степенью точности
по е.
Таким образом, утверждения теоремы 2.2 обосновывают при-
менение метода усреднения для асимптотического решения задач
оптимального управления в первом приближении по малому па-
раметру 8. Обоснование рекуррентных разложений § 1 и оценка
погрешности при построении высших приближений требуют со-
ответствующих, более высоких свойств гладкости управляемой
системы или другой методики построения общего решения с до-
статочной степенью точности по 8, например сочетания методов
усреднения и последовательных приближений (см. § 4 и [23]).
§ 4. Применение методов усреднения
и последовательных приближений для построения
общего решения стандартной системы
Рассматривается вопрос о существовании решения задачи
Коши для стандартной по Н. Н. Боголюбову системы обыкновен-
ных дифференциальных уравнений [58, 69], описывающей широ-
кий класс нелинейных процессов колебаний и вращений. Мето-
дом последовательных приближений [82, 141, 220] устанавлива-
ются конструктивные достаточные условия существования и
единственности этого решения па асимптотически большом ин-
тервале времени. Исследуются свойства гладкости нестационар-
ного процесса по параметрам задачи (начальным данным). Эти
результаты используются при построении решения краевых
задач § 2.
1. Постановка задачи и исходные предположения. Рассматри-
вается стандартная система обыкновенных дифференциальных
уравнений па асимптотически большом интервале времени с за-
78
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
данными начальными условиями
x = eX(t, я), x(to)=£°, t^[t0, Т = 08-1. (2.4.1)
Здесь х, X — векторы произвольной размерности п > 1, t0, я0,
6 — заданные постоянные величины, 8 > 0 — малый числовой
параметр, 8 е [О, 80]. Относительно вектор-фупкции X предпола-
гаются выполненными следующие требования:
1) она определена для всех t > tQ и х Dx, где Dx <= Rn — от-
крытое связное множество, 2л-периодичпа и кусочно-непрерыв-
на по t\
2) функция X обладает непрерывной производной по х, х е
е Dx, удовлетворяющей условию Липшица в указанной области;
3) для всех 8^(0, 80], xQ существует единствен-
ное решение задачи Коши (1) (далее это будет доказано)
x = x(t, #°, е), t е [t0, 08-1], (2.4.2)
принадлежащее открытой области Dx;
4) задача Коши для усредненной системы (1.1)
V = X0(g), т = et, те[То, 0], (2.4.3)
где XQ — среднее функции X по t па периоде 2л, т — медленное
время, допускает в указанной области общее решение
£ = £ (т — т0, х°), I е= Dx, х° е Dxo. (2.4.4)
Это решение предполагается далее известным.
Замечание. Имеется большое число исследований (см. [58, 69,
148, 241] и библиографию в [70, 220]), устанавливающих свой-
ство близости, в частности 8-близости, между неизвестным реше-
нием (2) исходной задачи Коши (1) и решением (4) усреднен-
ной системы (3) при тех же начальных условиях. Усредненная
система автономна и позволяет исключить параметр е; ее реше-
ние обычно исследуется или может быть построено существенно
проще, чем исходной полной системы. Определение искомого об-
щего решения (2) с более высокой степенью точности по 8 на
рассматриваемом асимптотически большом интервале времени
t е [t0, 08-1] затруднено, так как построения метода усреднения,
связанные с заменой переменных, приводят к решению возму-
щенной системы уравнений в частных производных. Последнее
обстоятельство требует соответствующей высокой гладкости
функции X по х е= Dx.
Ниже рассматривается задача существования и единственно-
сти общего решения (2) системы (1) при выполнении предполо-
жений 1), 2), 4). Развивается конструктивный алгоритм построе-
ния этого решения и исследуются его свойства по отношению к
изменению параметров задачи.
2. Упрощение исходной задачи Коши. В системе (1) прово-
дится ряд замен неизвестной переменной х. Аналогично [58, 69]
§ 4. ПОСТРОЕНИЕ ОБЩЕГО РЕШЕНИЯ СТАНДАРТНОЙ СИСТЕМЫ
79
вводится погрешность метода усреднения:
6 = х — £*, U (t. е) = I (т) + ъи (t. е),
t (2.4.5)
и (С е) = J [X (s, % (о)) — Хо (£ (о))] ds. о = es.
*0
Здесь функция и равномерно ограничена по t. е; зависимость и.
g от to. х° в (5) для сокращения записи пе указывается. Для не-
известной 6 получим задачу Коши
б = eX'(f, £)6 + еФ(^, б, е), 6(f0) = 0, t [£0, 08-1],
Ф (t. б, е) = [X (t. U) - X (t. £)] + [X (t. U + б) - (2.4.6)
- x (t. U) - X' (г, £) б], X' (t. x) = дХ/дх,
где Ф — известная функция t. б, е. В области (£* + б) е Dx.
как следует из (6), для Ф справедлива оценка
1Ф(£, б, е) I < СФ(е + еIбI + б2), СФ = const,
(2.4.7)
1Ф(£, бн е)—Ф(£, б2, е)1 ^АФ1б1-б2|(1б11 + 1б21 + е),
Аф — const.
Совершается линейное преобразование вектора б, близкое к
тождественному [46, 58, 69]:
6=(Z + eC7)z, U(t, е)= f [X' (s, | (и)) - Х'о (В (a))] ds. (2.4.8)
<0
Здесь I — единичная матрица, U — равномерно ограниченная мат-
ричная функция, аналогичная и из (5); штрих означает произ-
водную по вектору х. Дифференцируя подстановку (8) в силу
системы (6), для неизвестной z получим задачу Коши:
z = еХо (£ (т)) z + zF (t. z. е), z (£0) = О,
F (t, z, е) = (I + гиг11 [X (t, - X (t Л)] - гих'о (£) z +
+ sX' (t, I) Uz + [X (i ,^ + (Z + sU) z) - X (t, U) - X’ (t, U ~ ew) z]},
(2.4.9)
где F — известная функция t, z^ e; для нее, согласно (9), при
[£* + (Z + ef7) z] e Dx на основе предположения 2) п. 1 спра-
ведлива оценка типа (7) и выполняется условие Липшица:
I F(t, z, б)1 ^CF(e + elzl + z2), CF = const,
(2.4.10)
\F(t, 21, 8) — F(t. Z2. 8) I — Z2| ( |zj + |z2l + 8) , Af = COHSt.
При помощи оценки (10) возмущение может быть сделано
величиной порядка 82. Действительно, функцию F можно
80
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
представить в виде
F (t, Z, е) = е/\ е) + eF€2 С, z, е) z + zF(t, z, е) Z, (2.4.11)
где Ff, F?Z1 F'zz — равномерно ограниченные функции. Отметим,
что при F = Q (9) есть система в вариациях для (3). Учитывая
перечисленные свойства, совершим в системе (9) замену искомой
переменной z:
t
z = e.Z(r + ср), Z (т) = Д, <р (£, е) = j Z-1 (о) F (я, 0, 8) ds. (2.4.12)
дх J
*0
Здесь Z— фундаментальная матрица для указанной системы в
вариациях, ср — известная равномерно ограниченная функция,
а г — неизвестная переменная. Интеграл в (12) равномерно огра-
ничен на основе (10), (И). В результате для искомого вектора г
получаем задачу Коши:
r = &R(t, г, е), г(С) = 0, t^[t„ Ое"1]. (2.4.13)
Функция R равномерно ограничена и удовлетворяет условию
Липшица:
\R(t, г, е) I < &Сп, CR== const,
\R (f, п, е)— R(t, r2, &) I eXhIfj — r2l, = const.
Для построения решения задачи Коши (13) на асимптотически
большом интервале времени t е [t^ Г], Т = 08-1, применима рекур-
рентная процедура метода последовательных приближений (ме-
тода Пикара) по степенялт 8 [82, 141, 197, 201, 218, 220].
3. Построение точного решения. Искомая функция г строится
при помощи рекуррентной схемы метода Пикара [98, 141, 218]:
t
rj Н1 (t, e) = 8 R (.9, rj (s, 8), e) ds, r0 = 0, / = 0, 1, ... (2.4.15)
I о
Переметшая г зависит также от параметров х°, однако эта
зависимость для сокращения записи не указывается. Справедливо
следующее утверждение.
Теорема 2.3. При достаточно малом 8 > 0 последовательные
приближения (15) равномерно сходятся к единственному реше-
нию задачи Коши (13) на асимптотически большом интервале
[Zo, 0Е"1].
Сначала доказывается, что любое /*-е приближение ограниче-
но величиной сЛ, где М > 0 — некоторая определяемая ниже
постоянная. Действительно, величина представима в виде
суммы
= ГО + (Г1 - г0) + (г2 — гг) + ... + (г^ — (2.4.16)
§ 4. ПОСТРОЕНИЕ ОБЩЕГО РЕШЕНИЯ СТЛНД ХРТПОЙ СИСТЕМЫ
81
Далее используется (14) и оценка t^[tQ, 0е-1]:
| гх | eTV, N = max | Z-1 [/? (Z, cZcp, е) — F (/, 0, е)] | 0е-2.
Мажорируя сумму (16), можно получить для t е |70, 0е-1] при
значениях е С е0 < Хл/0
e;V
оо
1 +
г-1
= т—п «С F.M.
1 —
(2.4.17)
Из (15), (17) следует также, что последовательные прибли-
жения равномерно сходятся при е < 1/Хл0 к непрерывно диффе-
ренцируемой функции г*
Um rj = г* (t, e), lim rj = r* (t, e).
j->TO j->OO
(2.4.18)
Устанавливается затем, что предельная функция r*(t, е) из
(18) является решением задачи Коши (13). Это утверждение сле-
дует из того факта, что решение р(£, е) системы
р = ря (£, г* (£, е), е), р (<„) = О, I <= [/„, (-)е г],
совпадает с г* (£, е).
Наконец, построенное решение г* (£, е) единственно, что до-
казывается методом от противного. Пусть рь р2 — какие-либо два
решения задачи Коши (13); тогда из тождеств
t
Pi (z, е) = е J R (5, Pi (.9, е), е) ds, i = 1, 2,
и из (14) следует неравенство
max | рх - р21 еЛя0 max | рх — р., |, еХя0 < 1,
t t
возможное лишь при pt = р2 для всех t е [Л,, 0е-1]. Теорема до-
казана.
Таким образом, подстановка построенной функции г* (t, е)
в (12), а затем известной z(t, е) в выражение (8) для 6 и, на-
конец, известной функции 6(£, е) в (5) приводит к искомому
точному решению задачи Коши (1) в виде (ц — равномерно огра-
ниченная функция)
x(t, tQ, Х°, е)=£(т — То, Х°)+ ЕГ| (t, to, XQ, е),
ц = и + (7 + &U) Z (г* + ср), t е [/0, 0е-1]. (2.4.19)-
6 JI. Д. Акуленко
82
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
4. Замечания. 1) Исходная система уравнений (1) при по-
мощи замены
я = £* + б, £*(£, т, е)= £(т)+ер(£, £(т)),
V = V (I Д) = J [X (s, 1) - Хо (£)] ds, (2.4.20)
zo
где v и g* — 2л-периодические функции явно входящего аргумен-
та t, приводится к виду (6) с другой функцией Ф == Ф*(£, т, 6, е).
Эта функция 2л-периодична по t и в рассматриваемой области
удовлетворяет по е, б равномерной оценке (7), так как
Ф^Х(^, g* + 6)-X(£, %)-X'(t, g)6-E2F'X0a). (2.4.21)
Здесь предполагается двукратная дифференцируемость X по х.
При помощи линейного преобразования неизвестной б, близкого
к тождественному, получается система типа (9):
г/ = еХ' (£) у + eG (t, т, у, е), у (£0) = 0,
6 = [Z + eF(i, £ = m (2.4.22)
G (/ + eV)"1 [Ф* + еХ' (it ® Vy - eV'Xoy - eVX'oy].
Функция G в (22) 2л-периодична по явно входящему аргументу
t. Очевидно, для G справедлива по е, у оценка типа (10) и она
может быть представлена в виде (И).
К системе (22) применима схема последовательных прибли-
жений по степеням е, аналогичная развитой в п. 3. В качестве
первого приближения решения, обращающегося в нуль при е = 0
для всех t [tQ, 0е-1], принимается функция
t
у0 = 8<р (^ е) == eZ (т) j Z-1(cr) G (5, о, 0, е) ds, о = zs, (2.4.23)
%
где ср — равномерно ограниченная функция на указанном интер-
вале. Рекуррентная схема метода Пикара позволяет построить
квадратурами искомое решение y(t, е) с любой наперед заданной
степенью точности по е: /
t
yj+1 (t, е) = eZ (т) J Z”1 (о) G (s, о, yj (s, e), e) ds, j = 0,1, ... (2.4.24)
Последовательные приближения (23), (24) равномерно сходятся
при ее(0, Ео] достаточно малом к единственному решению за-
дачи Коши (22). Таким способом вновь построено искомое точное
решение вида (20) задачи Коши (1). Изложенный выше подход
может быть более удобным при аналитическом построении функ-
§ 4. ПОСТРОЕНИЕ ОБЩЕГО РЕШЕНИЯ СТАНДАРТНОЙ СИСТЕМЫ
83:
ций и и V, а также Ф* и G, например в виде рядов Фурье по L
Однако, как следует из (21), он требует несколько более высоких
свойств гладкости функции X относительно х, х Dx.
2) С помощью подхода [197] можно установить непрерывную
дифференцируемость решения (12) по начальным данным £0,
Сначала устанавливается равномерная непрерывность предельной
функции г* (С е, |1), а вместе с нею и решения х исходной систе-
мы (1) по некоторому параметру ц, если функция X за-
висит от ц непрерывно. Это утверждение следует из равномерной
сходимости последовательности (18), получаемой по методу Ии-
кара (15). На основе равномерной непрерывности затем доказы-
вается возможность предельного перехода при А 0 в матричном
дифференциальном уравнении
/7 /а: * — #
4 (Л-) =ел А— <2-4-25>
Здесь хд — решение системы (1) при начальном условии хд(£о) =
= х° + А. Матрица А, непрерывно зависящая от параметра А, по-
лучается па основании теоремы о конечном приращении. В ре-
зультате предельных переходов в (25) для матрицы Р частных
производных решений х по начальным данным х° (P = dx/dxQ)
получается линейное матричное уравнение
P = zX'(t, x(t, е))Р, Р(£0) = Д (2.4.26)
где I— единичная матрица. Для каждого г-го столбца /ъ матрицы
Р получается система в вариациях [141] с соответствующими на-
чальными условиями:
Рг = sX'(t, x)Pi, Pn(t0)=l, plh(to) = O (2.4.27)
Аналогичное (27) уравнение получается для вектора произ-
водной решения по £0; начальное значение равно dx/dt0\tQ =
« -8Х(£0, х») [197].
Решение задачи Коши (26) строится в виде
t
P = (I + tU*) W, U* (t, е) = J [X' (s, х (s, е)) - X (£ (о))] ds.
° (2.4.28)
Здесь W—неизвестная, a U*—равномерно ограниченная для
t <= [f0, 0е-1] матрицы. Дифференцирование подстановки (28) в
силу системы (26) дает
(Z + е£/J W = sX'0W + e2X'l7*W, W (t0) = I. (2.4.29)
Искомая матрица W представима в виде ряда с неизвестными
матричными коэффициентами Cj (7 = 1, 2, ...) :
W = Z (/ + еС, + 82С2 + ...), С. (£0) = 0. (2.4.30)
84
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
Подставляя это выражение в (29), можно получить рекуррентные
соотношения для равномерно ограниченных коэффициентов
С At,
t
Cj+1 = J Z-1 [e (X'67* - Xi) ZC] - U*ZC}] ds,
(2.4.31)
G = e j Z"1 [X' (s, В (a)) U* (s, e) - X'o (£ (a))] Z ds, ...
*0
Ряд (30) равномерно сходится при е е= [0, е0] достаточно малом к
единственному решению системы (29) для всех t <= [£0, 0е-1]. Тем
самым определена, согласно (28), матрица Р, характеризующая
«чувствительность» решения [188] x(t, to, х°, е) (19) по отноше-
нию к изменениям начальных данных.
3) Аналогичным образом определяется «матрица чувствитель-
ности» К решения [188] x(t, t0, xQ, е, ц) в общем случае системы
вида
x = zX(t,x, ц), х(^о) = ^°, £о = Мн), я0 = х0(ц),
по отношению к вектору параметров ц произвольной размерности
т, который может включать начальные данные. Для этого при
помощи изложенного выше приема может быть решена задача
Коши для матричного уравнения с начальными условиями, полу-
чаемыми дифференцированием функций х°(ц), £0(ц) по ц:
К = &Х' (t, х, pi) К + ъдХ (t, х, ц)/д|д,
Dr cirQ di.,
К = -^, К (t0) = ^--еХ (г0, х°, и) .
D[i ’ v 0/ дц v 0’ » г/ др
В частности, если параметры х°, t0 фиксированы и не зависят от
ц, получится линейное неоднородное матричное уравнение с ну-
левыми начальными условиями.
4) Теперь рассматривается задача Коши для стандартной си-
стемы с вращающейся фазой на асимптотически большом интер-
вале времени t^[tQ, 0е-1] [58, 69, 148]:
а = гА(а, ф), a(i0) = a°,
(Z.4.32)
г|)= co(a)+ eT (a, х|)), xp(£o) =
Здесь а — n-вектор медленных переменных, ф — скалярная фаза;
А, Ч1* — 2л-периодические функции быстрой переменной х|), часто-
та cd (а) > (о0 > 0. Правые части уравнений (32) считаются доста-
точно гладкими по a^Da, х|? [x|)°, 00). Система (32) описывает
широкий класс возмущенных существенно нелинейных вращатель-
но-колебательных процессов.
§ 5. МНОГОЧАСТОТНЫЕ И БОЛЕЕ ОБЩЕГО ВИДА СИСТЕМЫ
85
Обычным приемом [69] (делением а на г|?) получается стан-
дартная система вида (1):
da _____ А (л, гр)
“ 8 со (л) 4- еТ (л, гр) ’
а (Ф°) = а°-
(2.4.33)
Для системы (33) считаются выполненными предположения п. 1.
Тогда на асимптотически большом интервале изменения быстрой
переменной г|э, гр е= [г|э°, грг], грг ~ е"1, при помощи подхода пп. 2, 3
получается гладкое по гр° и а°еВао^йа решение вида, анало-
гичного (19):
а = л(гр, гр°, а0, е) = а(9 —9°, п0)+еу(гр, гр°, а0, е),
9 = егр, 9 [9°, 9т], 9° = ег|?°, 9Г = сфт ~ 1.
Здесь а — решение усредненной по гр системы первого прибли-
жения
da/dfi = Л0(а)/ы (а), а(9°) = а0,
а у — равномерно ограниченная для всех гр <= [гр°, грГ] функция.
Подстановка выражения для а в уравнение для гр (32) приво-
дит к уравнению с разделяющимися переменными, однозначно
связывающему гр и t\
Ф
t — t0 = \ —7~T~f(р lin-Г’ а = а (гр, е). (2.4.34)
0 J (О (л) + еТ (а, (р) ’ VY» / \ /
%
Зависимость ограниченной функции а от других аргументов для
сокращения записи не указывается. Из соотношения (34) искомая
функция гр(/, е), а вместе с нею и a(t, е) могут быть найдены
последовательными приближениями па основе решения первого
приближения. Величина Т = 0е-1 определяется из (34) при зна-
чении гр = грт.
Таким образом, изложенный выше метод последовательных
приближений (метод Пикара) оказывается довольно эффективным
приемом анализа нестационарных колебательных процессов на
большом интервале времени. Полученные на его основе результа-
ты используются при решении краевых задач принципа макси-
мума Понтрягина (§ 2).
§ 5. Усреднение в задачах оптимального управления
движением многочастотных систем и систем
более общего вида в окрестности устойчивого
интегрального многообразия
1. Асимптотическое исследование управляемых квазилинейных
систем с произвольным числом фаз.
1.1. Постановка задачи. Для определенности рассматривается
случай фиксированного интервала времени. Ряд результатов, по-
лученных в гл. 1, 2 для одночастотных колебаний, переносится на
86
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
многочастотные управляемые системы стандартного вида (1.1.6),
где ф = (ф], ф^), ^>2. Пусть задача оптимального управ-
ления приведена к краевой задаче принципа максимума (1.2.8),
(1.2.9), где фаза ф и сопряженная ей переменная q — векторы
размерности п*. Предполагается также, что правые части системы
(1.2.8) —достаточно гладкие функции медленных переменных и
фаз, представимые абсолютно и равномерно сходящимися рядами
Фурье по ф [58, 69, 148]. Тогда заменой вида (1.1.11) уравнения
(1.2.8) приводятся к виду (1.1.12), где число медленных перемен-
ных равно 2(па + п^). Правая часть получающейся системы стан-
дартного вида в общем случае будет сложной непериодической
функцией t. Формальное применение методов § 2 гл. 1 и § 1, 2
гл. 2, вычисление и исследование средних по t этой функции и
различных комбинаций производных в зависимости от медленных
переменных представляет весьма трудную проблему, усложняемую
переменностью частот. Поэтому такой подход к исследованию
многочастотных систем не представляется достаточно конструк-
тивным.
1.2. Трудности разделения движений в многочастотных неста-
ционарных системах. Далее оказывается наиболее удобным иссле-
дование условий применимости различных схем усреднения при
помощи канонических преобразований. Функция Гамильтона Я*,
согласно (1.2.6), имеет вид
Я* = (v(t) • #)+ей*(т, л, ф, р, 7), T — 8L (2.5.1)
В общем случае при произвольном поведении вектора v(t),
е [т0, ©], исследовать проблему не удается, поскольку формаль-
ное применение метода канонического разделения движений при-
водит к «малым знаменателям» и расходимости соответствующих
рядов Фурье [45, 58, 59, 148]. Действительно, уравнение типа (1.4)
для производящей функции S приводится к виду
5 = (ф • Р) + (а • ц) + ео(т, а, ф, ц, е),
I / \ до \ . 7 * / , . „ до d } до \
+h г-а’ п + +
+ е57 = k('z’ а + е^’ Т)’ Р’ е)' <2-5-2>
Решение а уравнения (2) и определение усредненного гамильто-
ниана к строится простыми разложениями по степеням е в виде
(1.5). В так называемом нерезонансном случае [45, 59]
l(vs)l>6(s)>0, Is! ^0, те[гг0, 0],
5 ~ (Sl’ ^2? • • -ч sj ~ 0, zb 1» z±z 2, • . ., 7=1,...,
§ 5. МНОГОЧАСТОТНЫЕ И БОЛЕЕ ОБЩЕГО ВИДА СИСТЕМЫ
87
искомые функции к0, о0 имеют вид
2 Л 2Л
к0 (т, Ь П. ₽) = —Ч- i • • • f h* (тЛ, яр, т], Р) <tyi • • • =
(2л) ’м «;
= Ло (тЛ, П> Р)> к* = 2 (2.5.3)
V, (Т, Л» Р) Г-----
а0 (т, а,ip, 1], Р) = (V(T).5)--ei(*'s)’ 1 = У- !•
|s|>0 V k '
Поскольку множество рациональных чисел образует всюду плот-
ное множество, то свойство нерезонансности может выполняться
при соответствующих жестких условиях на поведение вектор-
функции v(t), т^[т0, 0]. Приведенное выражение (3) будет схо-
дящимся к дифференцируемой по т, а, ц, j3 функции, если h3 =
= О(е) при |$| >5*, где 5* — фиксировано, или многомерный ряд
Фурье при |$| >5* переходит в сумму п* одномерных рядов по
каждой фазе xpi, г = 1, ..Нужно отметить, что функция о0
определяется неоднозначно; она не участвует в построении реше-
ния первого приближения, а только в оценке точности этого ре-
шения. Аналогичные трудности возникают при вычислении сле-
дующих приближений, т. е. при построении oz(r, а, х|), ц, р),
^(т, ц, Р), l>i.
2. Частные случаи. Случаи, когда между некоторыми часто-
тами имеет место резонанс (среднее по времени не совпадает со
средним по фазам), причем эта ситуация может изменяться во
времени, требуют конкретного исследования с учетом специфиче-
ских особенностей. Ниже выделяются некоторые частные случаи,
встречающиеся в приложениях, к которым применимы конструк-
тивные схемы метода усреднения. Предполагается, что определен-
ные между парциальными частотами vt(T), Z = l, 2, ..., п* соот-
ношения выполняются равномерно для всех т [т0, 0].
2.1. Соизмеримые частоты. Пусть все частоты vJt) соизме-
римы, т. е. существуют такие «небольшие» положительные целые
числа rf, что
v. (т) v • (т)
-^ = -7—+ е%у(т), Ху = -%я- г,/= 1,2, ..., (2.5.4)
г j
Тогда согласно § 1 гл. 1 система (1.2.8) приводится к одночастот-
ноп посредством линейной замены фаз. Фиксируется в (4) неко-
торое например 1 = тогда уравнения для медленных пере-
менных OLj запишутся в виде
«7 = — VjIm + е \Fi~ '-rFi ), 7-фь
Фг, ri 0»: (2.5.5)
ф<^ф,- (“i = 0), г = пф, 7 = 1, ..., ггф — 1.
88
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
Уравнение для единственной фазы ф = сохранит вид (1.2.8) с
учетом замены (5) для i|> В результате линейного стационарного
преобразования фазовых переменных — фаз —при помощи не-
особой матрицы А соответствующий вектору а сопряженный век-
тор р также преобразуется линейно (п. 3 § 1):
1 ° ••• ~ri!ri
° 1 -''г/'','
О О ... 1
B-l=AT, detyl = l,
i —1
Pi = (7j, 7 = 1, Мф- 1. *7i = Pi-
j =1 1
l = n^. (2.5.6)
Функция Гамильтона Я* (1) преобразуется следующим обра-
зом (55/dt 0):
И* (т, a, ip, р, q, е) = К (т, a, a, р, р, рь с) =
i-i
= V;p; — е 2 rjiijpj + еА* (т, а, а, р, р, рь е), I = п^. Г2.5.7)
Здесь функция к* получается из А* (1) в результате подстановок
(6). Таким образом, краевая задача принципа максимума для
многочастотной системы с гамильтонианом Я* (1), где хр — век-
тор размерности п^~> 1, в случае полной соизмеримости частот (4)
приводится к виду одночастотпой с гамильтонианом К (7), где
— скалярная фаза. Однако при этом число медленных пере-
менных увеличивается—добавляется 2(ftM. — 1)-вектор (а, р).
К новой гамильтоновой системе применима изложенная выше,
в гл. 1, 2, методика усреднения. Начальные и конечные условия
и условия трансверсальности (1.2.9), а также функционал (1.2.2)
п оптимальное управление (1.2.5) переписываются в новых пере-
менных согласно (6).
Следует отметить, что вследствие периодической зависимости
функции ft* от а в ряде случаев усреднение по 1[д может приво-
дить к ситуации, когда эта зависимость от некоторых компонент
а исчезает («ложные резонансы» [148]). Например, в двухчастот-
ной системе с функцией А* = hx (т, а, фд, р, q) + h2 (т, а, ip2,
р, г/)+О(е) для среднего 7г0 = <Я*> получается выражение
= а. р, 7)+/г20(т, а. р, q), q = (q^ q2),
q(t, 8) = const + 0(e), 0e-1]
при произвольных соотношениях между Vi(t) и v2(t). Аналогич-
ная ситуация может возникнуть, когда функция А* в первом
приближении представима конечной тригонометрической суммой.
§ 5. МНОГОЧАСТОТНЫЕ И БОЛЕЕ ОБЩЕГО ВИДА СИСТЕМЫ
89
2.2. Строго несоизмеримые частоты. Пусть для рассматривае-
мых значений т [т(), 0] соотношения (4) не выполняются для
всех Z, j = 1, 2. ..., i =£ j. т. е. имеет место ситуация грубой
несоизмеримости частот
\ (т) (т)
б О, i=^= j,
(2.5.8)
где л, г, — «небольшие» взаимно простые целые числа: |г| =
= lri| + lr2| + ••• + | гПф|<г*, б — фиксировано. Для больших зна-
чений гг, для которых условие (8) нарушается, коэффициенты
Фурье функции Л*(т, a, гр, р, q) достаточно быстро убывают:
/Z* = 2 (т, а, Р, q) е'^ = 2 fCei(r'^ + О (е) (/ = /=Л).
|r|^0 |г|4г*
(2.5.9)
Тогда в первом приближении усредненная система описывается
функцией Гамильтона (см. (1.3) — (1.7)):
К = (v (т)-Р) + e/iq (т, £, гр Р) + О(е2), Р = const. (2.5.10)
Таким образом, в случае (8), (9) грубой несоизмеримости пере-
менных частот и так называемых «ложных резонансов» усред-
ненная система получается независимым усреднением по 4Т 7 =
= 1, 2, ..., п4. В оценке точности (в знаменателе) будет содер-
жаться величина б из (8). Следует отметить, что число медлен-
ных переменных по сравнению с п. 2.1 не возрастает и интегри-
рованию подлежит система 2па уравнений относительно %, ц. По-
стоянный пм-вектор р подлежит определению из условий транс-
версальности (и оптимальности 70 при незаданпом Г, см. § 3
гл. 1). В частности, если функционал и конечные условия не за-
висят от 1р(Г, е), то Р = О(е). Аналогично рассматривается слу-
чай, когда наряду с выполнением условия (8) для некоторых
частот имеют место также соотношения соизмеримости типа (4),
приводящие к «ложным резонансам». Исследование существенно
упрощается, если частоты приближенно постоянны: vj (т) = +
+ О (е), V; = const, /=1,2, . . ., п^.
Более общие методы исследования многочастотных колебатель-
ных систем, использующие метрические и арифметические свой-
ства несоизмеримых частот на основе метода последовательных
замен (метода усреднения и его разновидностей), излагаются в
[45, 47, 59, 82, 162—167] и др. Существенные результаты полу-
чены для двухчастотных гамильтоновых систем [47, 82, 163].
2.3. Общий «грубый» случай. Рассматривается ситуация, когда
для т [т0, 0] частоты тДт), 7 = 1, ..., щ распадаются на I групп
вида
W = {{vjJ, ..., (Vj;)). = v’y,
& = 1, ..., I, m, + ... + m, = n4-, (2.5.11)
90
ГЛ 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
vS'w/r!‘’_v!j;w/r« + 4“sW,
Здесьrjk_ «небольшие» целые числа. Частоты из различных
групп, т. е. отвечающих различным к, считаются сильно несоиз-
меримыми, а внутри группы частоты соизмеримы. Тогда если
Z = l, то к=1, mk = mt = и имеет место частный случай соиз-
меримых частот типа (4); при I = щ все частоты грубо несоизме-
римы.
В каждой группе совершаются линейные преобразования фаз
и соответствующих сопряженных переменных типа (5), (6);
(mh — 1)-векторы фазовых расстроек в каждой группе равны
СА-'....................................»-».
mk~1 r(h)
V (W /2 5Г>1
~ — Чтк + rW
>Л=1 mk
Матрицы А(к\ В{к> и сопряженные векторы выписыва-
ются, согласно (6), независимо для различных к — общее преоб-
разование имеет блочно-диагоиальный вид. Поэтому для преобра-
зованной функции Гамильтона К выписывается аналогичное (7)
выражение
i i mk~1
И'-К- 2 v™ (т) р" + s S V 7« (х) +
k=l k=l j/j=l
+ гк* (т, а, а(1), ..., а(!), р, рш, р^, ..р(г), р<», 8).
(2.5.13)
Функция к* в (13) получается из h* (1) посредством замен (12).
В результате усреднения по фазам (ф(1), ..., ф(|)) (соответст-
вующие им частоты сильно несоизмеримы) порядок системы
уменьшается на Z, а сопряженные переменные = const. В слу-
чае «ложных» резонансов зависимость от некоторых компонент
векторов а(1), ..., а(0 в усредненном гамильтониане отсутствует,
а соответствующие импульсы также постоянны в первом прибли-
жении.
Проблема исследования многочастотных систем в общем слу-
чае переменных частот остается открытой. Большую трудность
для применения метода усреднения и его обоснования представ-
ляют более тонкие случаи, чем рассмотренные выше. Система по
некоторым частотам может «проходить резонансы», а по другим —
«застревать на резонансах» [47, 82, 141, 163], причем эти условия
могут изменяться во времени. Ситуация значительно упрощается,
если исследование управляемых колебательных движений много-
§ 5. МНОГОЧАСТОТНЫЕ И БОЛЕЕ ОБЩЕГО ВИДА СИСТЕМЫ
91
частотной системы проводится на относительно коротком интер-
вале времени 0е-1/2] ([70] и § 4 гл. 4).
3. Пример двухчастотной системы. Для иллюстрации методики
приводится решение задачи управления движением линейной
колебательной системы, находящейся под действием гармониче-
ского внешнего воздействия, в нерезонансном и резонансном слу-
чаях.
3.1. Модельный пример. Рассматривается управляемая система
на фиксированном интервале времени без ограничений на управ-
ление:
х + v2x = eu + ец sin t, x(0) = xQ, i(0) = x°,
lu|<oo, [0, 0e-1], ц, v, 0 = const, (2.5.14)
e
x(T) = x*, x(T) = x*, J [zz] = -i- j* zz2dr, т = EL
о
Задача управления (14) допускает точное решение. Для
удобства сравнения точного и приближенного решений вводятся
переменные а, Ъ типа Ван-дер-Поля, см. (1.1.13):
х = a cos xt + Ь sin v£,
х = v (—a sin vt + b cos \7),
a = —e (и + ц sin £)sin vt,
aQ = xQ, a*=x* cos vT — x*v~l sin vT, (2.5.15)
b = г (и + ц sin t) cos vL
6° = x°v-1, b* = x* sin vT + x*v-1 cos vT.
Согласно принципу максимума оптимальное управление равно
(ра, Рь — сопряженные переменные)
и* = — /?asin vt + pb cos vt, pa, pb = const. (2.5.16)
Постоянные pa, Рь определяются из краевых условий (15):
= . /сс (Л [Ад 4- wfs (Л] -I- fsc (Л [Aft - Wfc (Л]
Ра~Е 82[/ss(n/ee(n-/s2c(n]
с /6С (Г) [Да + (Г)] + (Г) [А6 - ер/с (Г)}
Рь е
Да = а* — а0, ЛЬ = Ь* — Ь°,
/ss (<) = Ц-— 27 sin2vi), fcc(t) = + 2^-sin2vj), (2.5.17)
Лс (0 = 27 sin2vZ,
92
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
fss (t) fee (t) fsc (t) — -7- ( t2-2" sin2v^)
* \ v J
' s.\ — 1 [sin(l — v)t sin (1 + v) t
~ 2 [ 1- v 1 + v J’
4 1 Г 1 — cos(l— v)t 1 — cos(l + v)f
— 2 [ 1 — V + 1 + v
Следует отметить, что порядок величин числителя и знаменателя
в выражениях для ра, рь (17) по отношению к параметру е равен
нулю, т. е. ра = 0(1), рь = 0(1)? поскольку еТ = 0~1. Выраже-
ния для а(£, е), b(t, е) выписываются просто при помощи вве-
денных в (15) выражении
a(t, e) = a° + e[pa/s,(Z)-pi,Ac(^)]-ep,/s(0,
b(t, е)= b0 - e[po/sc(0-Pbfcc(t)] + ец/с(О.
Поскольку T = 0е-1 — асимптотически велико, то можно для
простоты положить T = W(2n/v), где N > 1 — натуральное число.
Тогда согласно (15) /ss(7)e/сс(7)= 7/2, /.sc(7)=0 и выражения
для ра, рь существенно упрощаются:
ра = -^[Ла + цф(Т)], Pb = -^[^b-Epfc(T)]. (2.5.19)
Искомое управление ир (t) получается после подстановки
Ра, Рь ИЗ (17) ИЛИ (19) в (16).
В нерезонансном случае при (1—v)~l непосредственно из
(17), (18) и методом усреднения устанавливается, что в первом
приближении по е внешнее воздействие не оказывает влияния:
Q Д^ Q Д^
Ра ~ % -0“ , Рь — 2 ,
* 2
up (0 =----0" (ка 8*п kb cos (2 5 20)
a = a° + b = b° + Afe r e [0, 0],
Jo== (Да2 + Д62)©-1.
В резонансном случае при 1 — v = еу, 7 1 из точного реше-
ния и методом усреднения в первом приближении по е получа-
ются выражения для ра, ръ и /0:
Ра~ 4" (2Да + “7 SinV0)’
рь=±[2ЬЬ---------&.(l-cosV0)], (2.5.21)
UP (0 = — Ра sin Vt + pb COS Vt, jo = -J- (pa + ^b) ©•
§ 5. МНОГОЧАСТОТНЫЕ И БОЛЕЕ ОБЩЕГО ВИДА СИСТЕМЫ
93
Синтез оптимального управления (0-^0—т, aQ -+ a, bQЬ)
имеет, как отмечалось ранее, особенность при т 0, т [т0, 0].
В общем случае выражения (21) сильно отличаются от со-
ответствующих (20), поскольку в случае резонанса малые внеш-
ние силы на большом интервале времени приводят к значитель-
ному изменению медленных переменных — «производят сущест-
венную работу». При точном резонансе (7 = 0) выражения для
ра, рь упрощаются: ра = 2Да0-1 + ц, рь = 2Д&0-1.
Ниже рассматривается пример задачи с ограничениями на
управление, в котором иллюстрируется влияние периодических
возмущений на качественное поведение решения.
3.2. Задача оптимального быстродействия. Для двухточечной
задачи (15) рассматривается критерий быстродействия (Т не за-
дано заранее):
J [и] = ъТ = 0 -> min, | и |< и°. (2.5.22)
и
Точное решение задачи (15), (22) не известно. В первом при-
ближении по е оптимальное управление и гамильтониан (усред-
ненный) равны
a* (t) = u° sign (— ра sin vt + pb cos vt), pa, ь == const,
h0 = e-1 <Я*> = - 1 + (2/л) u° (p2 + p2b)1/2 - npa<ps (r), (2.5.23)
ф5(т)^0, (l-v)~l;
(t) = V2 cos 7т, 1 — v = 87, 7 ~ 1.
В нерезонансном случае приближенное решение находится
однозначно и имеет вид (внешнее воздействие влияния в первом
приближении не оказывает)
а (т) = а° + Да b (т) = 6° + Дб
0 = (л/2) (Д/а°), a* (t) = и° sign cos (vt + 9), (2.5.24)
cos 9 = ЛЬ/Л, sin 9 = Да/Д, Д = (Да2 + Дй2)1/2.
В случае резонанса, согласно (23), усредненные переменные-
а = а(т), Ь = Ь(т) и время быстродействия 0 определяются со-
отношениями
а(т) = а0 + (2/л) и°т cos 9 — V2 (iui/7) sin 7т, а(0) = а*,
b (т) = 6° + (2/л) а°т sin 9, b (0) = Ь*, 0 > 0, (2.5.25)
[Да + 72 (ц/7)sin 70]2 + \Ъ2 = (2/л)2 (а°0)2.
Здесь 9, 0 — неизвестные; после определения времени быстро-
действия 0 > 0 из последнего трансцендентного уравнения вели-
чины cos 9 и sin 9 находятся элементарно из краевых условий для
a, Ь (25). Нетрудно установить, что при 7^0 это уравнение всег-
да имеет решение 0 > 0; при ц -> 0 решение единственно и близко
(24). Для достаточно больших значений |ц| решение не единст-
венно, кроме того, возможны кратные корни. При |р,| числа
94
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
корней также неограниченно возрастает как Ipl, причем с такой
же скоростью растут максимальные значения корней. Решение
задачи оптимального быстродействия определяется минимальным
корнем 0* = min 0; > 0. Построение достаточно полной картины
i
поведения корней как функций параметров системы не представ-
ляет затруднений.
Пусть имеет место точный резонанс: 7 = 0. Тогда трансцен-
дентное уравнение для 0 (25) переходит в квадратное:
(Да + 72|и0)2 - (2/л)2(а°0)2 + Afe2 = 0, (2.5.26)
0 = цДа ± Ь2Да2 + 4А2 [(2/л) V2 — М2/4]}1/2
1,2 2[(2/л)2и02 — ц2/4]
Анализ корней (26) показывает, что при достаточно малом внеш-
нем воздействии 1 цI <(4/л)а° решение задачи существует и един-
ственно: 0* = 0!>О. Если имеет место неравенство IjnAfol >
>(4/л)и°Д, то задача управления неразрешима.
Возможна ситуация, когда уравнение имеет два положитель-
ных корня 01,2>О: цДа<0, (4/л)а°ДIAfe|-1 > Ipl >(4/n)u°;
тогда 0* = 02; при этом в пределе при 1ц1 =(4/л)и°ДlAfel-1 оба
корня сливаются, т. е. 0* — двукратный корень. Если Afe = 0, то
задача управления разрешима при условии
~ 1 цАа ± (4/л) и°Да _ Да 1
Ь2 “ 2 (4/л)2и02 _ ц2 - - — ц (4/л)м0 > U-
Если же Да = 0, то решение существует и единственно при Ipl <
<(4/л)а0. В критическом случае IjliI =(4/л)п° решение также
существует и единственно (0* = 0t > 0), если цДа < 0, см. выше.
Таким образом, наличие резонирующих членов качественным об-
разом изменяет картину управления в задачах с ограничением на
управляющую функцию по сравнению с задачами без ограниче-
ний. Оптимальное управление в форме синтеза получается ана-
логичными построениями, если в качестве начального момента
взять t = t0, а затем в полученных выражениях для 0, ра, рь, и*
сделать замену t0 -+ t, а° -> а, Ь° Ь.
4. Усреднение в задачах управления движением систем более
общего вида. Развитые выше методы приближенного решения
задач оптимального управления применимы также к слабоуправ-
ляемым системам более общего вида, чем (1.1.6), а именно:
а = Л(т, a, ip, z, а, е), а(£0) = а°,
= v(т) + Ч7 (т, а, г|), z, и, е), 'ф(^0)^'ф°, (2.5.27)
z = A(t)z + Z(t, а, -ф, z, и, е), z(£о) == z°.
Здесь а, х|), z — векторы произвольных размерностей; А(т)— асимп-
тотически устойчивая матрица, т. е. характеристические показа-
тели Хг(т), т [т(), 0] имеют отрицательные вещественные части.
§ 5. МНОГОЧАСТОТНЫЕ И БОЛЕЕ ОБЩЕГО ВИДА СИСТЕМЫ
95
Возмущающие функции Л, Ч7, Z 2л-периодичны по ф =
= (фп ...» достаточно гладки по (a, z)^DaXDz, где Dz —
некоторая окрестность точки z = 0. Кроме того, для них спра-
ведливы оценки
Л, Т, Z = O(e + |z|2), (2.5.28)
е е= [0, е0], (a, z) f= Da X Dz, ip (= fl”*
При соответствующих предположениях малости 80, 1и| и ха-
рактере поведения управляющей функции u = u(t, е) или и =
= u(t, а, ф, z, е) (ограниченности и гладкости) система (25) с
оценками (28) при Т t> t° = to + Д£о, Т = 08-1, Д£п~1пе-1 бу-
дет совершать движения в 8-окрестности (lz| ~ е) асимптоти-
чески устойчивого локального интегрального многообразия а <= /Л,
фей'Ч\2=:0 [147, 150]. К системе (27), (28) приводятся урав-
нения (1.1.1), если при 8 = 0, т, х = const порождающее семей-
ство решений (1.1.3) асимптотически устойчиво для рассматри-
ваемых значений т^[т0, 0], a=(c, x)^Da. Считается, что размер-
ность пс вектора с удовлетворяет условию пс С пу — тц. Случай
ис = пУ — когда вектор z отсутствует, рассмотрен выше,
в гл. 1, 2; при пс<пу — тц исходная система (1.1.1) на основе
теории Ляпунова — Флоке [58, 220] неособенным преобразованием
(я, z/)-^(a, ф, z) приводится к виду (27), (28) [58,147,150,229].
Для системы (27), (28) ставится задача оптимального управ-
ления по переменным а, ф:
М (т, а, ф) |т = 0, J [u] = g (т, а, ф) \т -> min, и е U. (2.5.29)
и
Далее предполагается, что Г], т. е. z(f) = O(e); тогда влия-
ние вектора z на изменение переменных а, ф для t — ?~ 1/е бу-
дет порядка 8. Поэтому в первом приближении по 8, которое
обеспечивает метод усреднения, в уравнениях для а, ф можно
положить z^Oii рассматривать задачу оптимального управления
независимо от z. Это утверждение устанавливается при помощи
оценок, справедливых для средних от Л, V, Z и переменной г,
сопряженной вектору z. Указанные оценки имеют вид
lim-A-j
T~^ A
а, 1|)0 (<), z0 (Z), р, q, г, е) dt =
т
= lim -4~ f Ф* (т, a, ip0 (/), 0, р, q, 0, 0, 8) dt + О (е2),
Г’" J
(2.5.30)
%(г) = j v(T')dt' + i|>°, z0(Z) = z°exp Ja(t'
t° L<0
r(t) = O(e), Ф = (Д Y, Z), Ф* = Ф|и*.
96
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
Здесь Л*, V*, Z* — 2л-периодическпе функции if, получаемые в
результате подстановки п = п*(т, a, if, z, р, ср г, е) в возмущения
Л, Чт, Z. При этом следует иметь в виду, что
Ф = еФ(1) (т, a, if, z, п, е) + Ф(2) (т, a, if, z, с), Ф(2) = О (I zl2).
(2.5.31)
Оценка (30) для r(t) при t — tQ~ 1/е получается из уравнения и
конечного условия
Г = - ГЛ (т) - А [(р./1) + + (r-Z)]*, г (П = 0
с учетом оценок (31). Таким образом, в первом приближении по
г можно ограничиться решением задачи оптимального управления
(29) для системы
я=еЛ(1)(т, a, if, 0, п, 0), a(tQ) = a°,
if = v(t) + еЧг(1) (т, а, if, 0, и, 0), if(f) = if°, (2.5.32)
8Л(1) = А (т, а, if, 0, u, е), 8W(1) = V (т, а, if, 0, и, s).
Если требуется построить решение задачи оптимального уп-
равления (27), (28) более точно по степеням 8, то процедура
усреднения (последовательной замены переменных) в соответст-
вующей двухточечной краевой задаче принципа максимума долж-
на быть обобщена при помощи схемы метода усреднения, раз-
работанной В. М. Волосовым [69, 70]. В качестве решения пер-
вого приближения принимается решение задачи (29), (32), ко-
торое находится на основе подходов гл. 1, 2.
§ 6. Замечания
1. Усреднение квазилинейных систем при малых частотах. Рас-
сматривается одночастотная система (1.2.13). Случаи, когда
частота v = v(t, 8) асимптотически мала по 8 или становится
сколь угодно малой для t е [£0, 08-1], 0 = const, существенно
осложняют применение изложенных выше, в гл. 1, 2, различных
схем усреднения. Эти трудности обусловлены как особенностями
в правых частях уравнений стандартного вида (см. (1.1.10),
(1.1.14) и др.), так и невыполнением основного требования су-
ществования равномерного среднего по t [58, 69, 70]. Приведен-
ные выше схемы усреднения и оценки погрешности становятся
несостоятельными, поскольку соответствующие выражения в фор-
мулах замен будут содержать v(t, е) в знаменателе (см. (1.2.16),
(2.1.7), (2.1.8) и др.). Элементарные примеры показывают [47],
что в указанных случаях асимптотическая близость решений
формально усредненной по фазе и исходной систем для t — tQ ~
— 1/е, как правило, не имеет места. Метод усреднения или ста-
новится непригодным для приближенного исследования движения
§ 6. ЗАМЕЧАНИЯ
97
на интервале t [£0, ©е-1] и следует применять другие асимпто-
тические подходы, например изложенные в гл. 7, 9, или требу-
ются более точные оценки погрешности, которые могут оказаться
приемлемыми для решения прикладных задач.
Ниже рассматриваются такие случаи и приводятся некоторые
оценки погрешности метода усреднения. Для удобства с помощью
замены фазы гр = ср+ 9, cp = v, аналогичной (1.1.11), система
(1.2.13) записывается в переменных типа Ван-дер-Поля z =
= & 9, Р, ?):
Z = £g(T, Z, ф), Т = &t, z(t0) = Z°,
(2.6.1)
<P = v(T, е), ф(Л>) = ф7 ©Е"1].
Здесь z — вектор произвольной размерности, ср — скаляр, g — 2л-
периодическая пли квазипериодическая функция по ср и гладкая
по z.
1.1. Асимптотически малая частота. Пусть на рассматриваемом
интервале времени t [^0, ©е-1] величина v удовлетворяет оценке
v = O(£a), a >9, т. е. существуют постоянные ci>2, e2>Ci>0
такие, что CiEa^v(r, e)^c2ea. Если cz>l, то переменная ср ока-
зывается медленной и формальное усреднение по ср приводит в
общем случае к погрешности 0(1) для переменной z. Если a< 1,
то заменами
со(т, e) = v(t, E)e-a, с2 > со с\ > 0, 9 = е°7,
9^[90, ©ц-1], ц = Е1-а, р,«1, 90 = е°7о (2.6.2)
система (1) приводится к виду (штрих означает производную по
аргументу 9)
z' = p,g(T, z, ср), т = е7 = ц9^[т0, 0],
ср' = со(т, е), 9^[90, ©ц-1].
К системе (3) применимы изложенные выше схемы усреднения
по фазе ср, приводящие на интервале 9 [90, ©ц-1], т. е.
е|70, ©е-1], к погрешности 0(|Р*+1), где /*—порядок процедуры
разделения движений, см. § 1. Изменение медленной переменной
z составит величину 0(1), а фазы ср — величину 0(ц-1). Изложен-
ный прием обоснован, если выражение для g не содержит величи-
ну v в знаменателе, например имеет вид (1.1.27), а начальные и
конечные условия для z приводят к величинам 0(1).
Возможна другая ситуация (см. (1.1.14) и др.), когда функ-
ция g имеет вид
g = giv"1 + g2v'v~l + g3 (Yv~2) g2( з = 0(1).
Система (1) приводится к форме (3), если справедливы оценки
gt ~ v==0(Ea), v'v-1 = O(l), (Kv-2)' = 0(1).
7 Л. Д. Акуленко
98
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
1.2. Переменная частота-, прохождение нулевого значения.
Пусть в процессе управления движением частота v(t, е) стано-
вится асимптотически малой, может достигать нулевого значения
и даже изменять знак. Для определенности предполагается, что
функция v(t, е) аппроксимируется одним из выражений
v (т, е) = v0 (т) | Tjj. — т |а + еЗо (т), а, р = const > 0;
v (т, е) = v0 (т) | т* — т |а sign (т* — т) + Лт (т); (2.6.4)
v0 (т) v° > 0, | а (т) | а°, v°, а0 = const >> 0, т, т* е [т0, 0].
Тогда усреднение в системе (1), (4) приводит к степенной осо-
бенности в функциях замены и оценках. Следует отметить, что
второе выражение (4) для т>т* становится отрицательным; та-
кая ситуация может иметь место в задачах управления враще-
ниями твердого тела (например, (1.1.2), п. 2 § 4 гл. 1 и § Згл. 6).
Далее для определенности рассматривается первое выражение (4)
при о(т) = 0 или, что то же самое, р>1 (при Р<1, о о0 спра-
ведливы оценки п. 1.1). Более общий случай о(т)^0, р<1 для
второго выражения (4) исследуется аналогично приведенному
ниже.
Пусть £(т, z°) — известное общее решение формально усред-
ненной по ср системы (1), (4) при v = т0| т* — т|а. Тогда оценка
погрешности (z —£) получается, как обычно (см. [58, 218] и § 4
гл. 2), при помощи леммы Гронуолла. С помощью подстановки
t
Z = £ + v + 6, V (t, т, е) = е | [g (т, <р (s, е)) — g0 (т, £)] ds,
* о
(2.6.5)
в которой go — среднее g по ср и при интегрировании переменные
т и £ считаются параметрами, для неизвестной 6 получается
оценка
t
161 eLe max е f (l | р|+ МII II +|
M/o.es-Ч Г/ 11 U
(2A,i)
Здесь К > 0 — постоянная, определяемая конструктивно через
L — постоянную Липшица функции g по z и М — максимум
|g0(T, £(т, z°)) I по т, т^[т0, 0]. Итак, согласно (6) погрешность
метода усреднения (z — £) для [t^ 0с-1] определяется оцен-
ками величины и и ее производных, т. е. IN, H5iV<?£ll и Idr/drl.
Ниже излагается прием получения таких оценок, пригодный для
оценивания всех трех величин.
§ 6. ЗАМЕЧАНИЯ
99
Пусть требуется оценить по параметру е величину вида
f / (ф (s, е)) ds ,
/ = [о.6е-1] о
w = 8 max
ф = v0 (т) I т* — т |а.
(2.6.7)
Здесь / — квазипериодическая ограниченная функция ср, имею-
щая нулевое среднее, см. (5). Без ограничения общности можно
полагать tQ = 0, ср(0, б) = 0, т*^0, v0 = const >0; связь между т
и ср приводится к выражению вида
। irr I 1+ос 1 -|-ос |<х/(14-а) л qv
Ф = *о|** — т |а = v0 т/ — у , ? = е<р. (2.6.8)
I vo I
Тогда с учетом соотношения (8) выражение (7) для искомой
оценки величины w перепишется в виде
е
w = — max
° т=[о,Ге-1]
Гф
J/W
о
-а/(1+а)
л+а 1
о
Г = лЫ - К - 011+“ |, ф е [0, Ге-Ч. (2.6.9)
Величина Y = Y* = vo U + а)”1 т*+а, для которой частота v (у*) =
= V(T*) = 0 согласно (8) при О^т*^©, удовлетворяет нера-
венствам Г. Элементарными преобразованиями и под-
становками для выражения w (9) получается оценка
|ш! ^Z>8P, р = (1 + а) \
0 < р С 1,
t [0, 08 ‘],
D = v^ppap
vldy
уар
+ max
VS[v*,r]
(V*-V*)e 1
J
о J
(2.6.10)
Поскольку F (y, 8)j= / (y^s”1 — у) — квазипериодическая функция
у равномерно по 8 имеет нулевое среднее, а величина ар удов-
летворяет неравенствам 0<ар<1, то для интегралов, стоящих
под знаком модуля в (10), можно получить равномерные оценки.
Итак, требуется оценить несобственный интеграл I вида
ХЕ-1
Г F(y, g)
I --- J | у |OCP I X I Г.
0
(2.6.11)
7*
100
ГЛ. 2.' ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
Интеграл I (11) имеет особенности при у — 0 и при е -> 0,
поскольку верхний предел становится неограниченным. Оценка I
проводится следующим образом: 1 = Ц + 12 затем для h^Q
(х^О):
ПК1Л1 + 1М
а = (1 + a) max | F |,
I ?/1<оо
н
b = 2 max i Fdy ,
(2.6.12)
| 77 | < ОО.
Минимум по h оценки для I (12) достигается при \h\ =aba~
в результате справедлива равномерная оценка
171 ^аарЬрр~1а~ар.
(2.6.13)
Таким образом, искомая оценка погрешности метода усред-
нения для системы (1), (8) на основе (5), (6), (10) —(13) при-
водится к виду
k - £l COeLeEp, t g= [j0, 0g-1], (2.6.14)
L, С = const >0, р = (1 + а)-1, ре (0,1], а [0, °о).
Здесь С > 0 — постоянная, определяемая через введенные выше
параметры Я, v0, а и соответствующие постоянные типа а, Ь, ха-
рактеризующие функции г, ди/д^, dvldx.
Исследование системы (1) с частотой v, изменяющей знак
согласно второму выражению (4), приводит к аналогичным (14)
оценкам погрешности метода усреднения. Вопросы обоснования
метода усреднения в случае малых и обращающихся в нуль
частот для более общих управляемых систем с медленно изме-
няющимися параметрами требуют дальнейшего изучения.
2. Усреднение в многочастотных системах при прохождении
резонансов. Рассмотренные в § 5 модели отвечают частным слу-
чаям, когда между частотами во время эволюции сохраняется
соотношение соизмеримости (возможен резонанс) или несоизме-
римости (резонанс отсутствует). В реальных условиях управляе-
мая система может «проходить через резонансы» [47, 163]. Такие
ситуации представляют значительный практический интерес. Раз-
витие асимптотических методов исследования таких систем и в
первую очередь метода усреднения имеет важное теоретическое
и прикладное значение. Общая ситуация, которая может возник-
нуть в многочастотной системе, весьма сложна и не поддается де-
тальному анализу. Далее для определенности рассматривается слу-
чаи квазилинейной системы, приводимой к двухчастотной, в кото-
§ 6. ЗАМЕЧАНИЯ
101
рой имеет место ситуация прохождения резонанса при t = е
е [t0, Т]:
z = &Z (т, z, г|), ср),
-ф = со(т) + еТ (т, z, гр, ф), (2.6.15)
Ф = v (г), г v0 > 0, con — vm = Q, Q (т*) = 0.
Здесь m > 0, п > 1 — взаимно простые «не очень большие» целые
числа, Q(t) — гладкая функция. Независимое усреднение функ-
ции Z приведет к погрешности определения медленной перемен-
ной z. Эта погрешность определяется свойствами функции Q(t)
в окрестности точки т = т*, т. е. скоростью прохождения резонан-
са. Пусть справедлива степенная аппроксимация см. (4)
Й(Т) = к(т) 1р, \к\^ко>0, 0<?<оо.
Тогда предельный случай -> 0 отвечает нерезонапсному случаю,
а оо — резонансному соотношению («застреванию на резонан-
се»). В нерезонансном случае независимое усреднение приводит
к погрешности 0(e) для £ —£0~1/е см. § 5. В случае соизмери-
мых частот со и v независимое усреднение может привести к
погрешности 0(1), что нетрудно показать на простых примерах.
В промежуточном случае 0 < 7 < «> имеет место оценка типа (14).
В частности, на основе результатов [47, 163] можно установить,
что при ч = 1 погрешность составляет О(е1/2), поскольку выпол-
няется основное условие, обеспечивающее «прохождение резонан-
сов»: | co'v — v'co | Vo&o/n >* 0. Таким образом, при выполнении
неравенства Ico'v — v'col > х > 0, т^[т0, 0] и соответствующих
условий гладкости следует оценка О(е1/2) для погрешности усред-
ненного решения системы (15) по медленной векторной перемен-
ной z и фазе г|>.
3. Метод усреднения в задачах с релейными управлениями.
Как отмечалось в § 2 гл. 1, задачи управления, приводящие к
уравнениям с разрывными правыми частями, представляют боль-
шие трудности для применения асимптотических методов. Эти
трудности усугубляются тем, что решению подлежат двухточеч-
ные краевые задачи. Правые части уравнения в случае релейных
управлений претерпевают разрывы 1-го рода, число которых по-
рядка 1/е на рассматриваемом интервале времени. Кроме того,
в реальных задачах, как правило, оптимальные или квазиопти-
мальпые траектории скользят по поверхностям разрывов, которые
могут быть переменными во времени. Это делает неприменимым
имеющиеся результаты [143, 148, 178, 192], поскольку движение
на поверхностях разрывов может иметь произвольный (неколе-
бательный) характер. К скользящим режимам могут привести
особые управления, которые также отвечают поверхностям раз-
рывов управлений.
102
ГЛ. 2. ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
Особенности исследования краевых задач принципа максимума
и применения метода усреднения для релейных систем удобно
проиллюстрировать на линейной по управлению системе, приве-
денной к стандартному виду:
z==eg(£, z)+eG(£, z)u, z(tQ) = z\ z^Dz,
ЛгСг)|т=О, J [u] = cp (z) min, и e U,
(2.6.16)
U = \u: | uk К u°k, к = 1, . .., m], [£0, Г], T = 08-1,
z = (zb ..., zn), Я='(Л\, Nt),
Здесь g, G, /V, ср — достаточно гладкие функции z, причем g, G
имеют равномерное среднее по t. Согласно принципу максимума
оптимальное управление и* и функция Гамильтона Я* равны
(р — вектор, сопряженный z)
uh = u® sign S PiGik ,
\t=i I (2SA1)
H*(t, z, p, e) = e(p • g) + (|pGl • u°).
Функция Я* имеет равномерное среднее по t. Требуется найти
решение краевой задачи принципа максимума:
z = 8g(£, z)+eG(£, z)u*(f, z, p),
P = — rPp7 -4>^ (t, Ъ PI- (2.6.18)
гШ-Л Л'й|г-0, р(7')=(_Й + х^|/
В расширенном пространстве переменных (t, z, р) правые
части системы (18) могут терпеть разрывы на поверхностях
ПА = 0, определяемых разрывами функций ик (£, z, р):
ПЛ (t, z, р) = У pfiik (^ z) = 0, к = 1, .. ., т. (2.6.19)
1=1
Сечения (£, z) = const поверхностей (19) представляют п-мерпые
гиперплоскости в (2н + 1)-мерном пространстве точек 5 =
= (^ 2, р).
_______________________________________________________ т
Если в процессе движения точка S (t) = (t, z, р) е U Щ,
k=i
то справедлива развитая выше методика усреднения. Если же
точка S(t) = (t, z(t), p(t)) может пересекать некоторые поверх-
ности разрыва, то для применимости метода усреднения, как сле-
дует из [143, 148, 178, 192], требуется, чтобы происходило их
«протыкание» траекторией с ненулевым углом, т. е. были нену-
левыми скалярные произведения касательного к траектории век-
тора s и векторов нормалей pft к поверхностям разрыва в точках
§ 6. ЗАМЕЧАНИЯ
103
пересечения в моменты времени t = — 0 и t = th + 0:
I (s-Рь) 1>Х>0, S*k = S (^) = (^, z(^), p(t*h\),
S = (1, Eg + &Gu*, — spg'z &pG'zti*\
рк = (<ЭПл/д£, dUk/dz, dHk/dp). (2.6.20)
Здесь к — номер поверхности разрыва Щ (19), с которой в момент
t = ti происходит пересечение траектории (£, z(£), p(t)). В мо-
менты tk — 0и^ + 0 скалярное произведение ($ • pfe) (16)
должно сохранять знак; в противном случае в системе может осу-
ществляться скользящий режим по поверхности разрыва ПА = 0
(19). При достаточно малых е > 0 скалярное произведение ($ • р&),
согласно (20), равно
(^ -рА) = 5Пк/^^ + О(е),
dGih (t, z) (2.6.21)
~dt = 2л Pi dt •
i=l
Из (18) —(21) следует, что ситуация, когда на некотором ин-
тервале /) = 0 (случай особых управлений [73, 118]), является
критической, поскольку заведомо (s-ph) = O. Нужно отметить, что
такие ситуации естественны для многомерных систем типа (16),
и при асимптотическом анализе требуется учет специфических
особенностей управляемой системы. Исследование конкретных
примеров показывает, что случаи особых управлений приводят,
как правило, к неединственности решения задачи по управлению
и траектории. Типичными ситуациями являются такие, когда
достигается абсолютный минимум функционала, как в примере
§ 2 гл. 1 (случай терминального функционала) или когда одна
часть фазовых координат системы достигает конечного многообра-
зия раньше, чем другая (задачи типа оптимального быстродейст-
вия, см. гл. 5, 6) и т. п. Решение конкретных задач управления
механическими колебательными системами показывает, что метод
усреднения в сочетании с другими асимптотическими и числен-
ными методами может быть достаточно эффективным средством
для упрощения анализа также в указанных сложных случаях
вырождения необходимых условий оптимальности.
ГЛАВА 3
МЕТОД УСРЕДНЕНИЯ
В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
ОДНОЧАСТОТНЫМИ СУЩЕСТВЕННО НЕЛИНЕЙНЫМИ
КОЛЕБАНИЯМИ
На основе принципа максимума развивается асимптотический
метод построения оптимального управления движением нелиней-
ных вращательно-колебательных систем, приводимых к стандарт-
ному виду со скалярной вращающейся фазой. В первом прибли-
жении решены конкретные задачи оптимального управления ме-
ханическими системами.
§ I. Нелинейные системы, приводимые к стандартному виду
управляемых систем с вращающейся фазой
1. Приведение уравнений управляемых нелинейных колебаний
к стандартному виду. Рассматривается слабо управляемая систе-
ма, аналогичная (1.1.1):
х = еХ(х, у, и), х(^0) = ^°,
у = Уо(х, у) + еУ(х, у, и), y(t0) = y°. (3.1.1)
Переменные х, у — векторы произвольных размерностей, а функ-
ции X, Уо, У обладают свойствами, определенными в § 1 гл. 1.
Отличие заключается в предположении, что невозмущенная фаза
гр скалярпа и имеет вид (см. (1.1.3)):
г|? = со(а) (t — t})+ гр°, а = (х, с), о(а)^ о0 > 0. (3.1.2)
Здесь частота со зависит от управляемых медленных переменных
х, с. Преобразованием, подобным (1.1.3), можно прийти к систе-
ме вида (1.1.4), (1.1.5), которая затем представляется в форме,
аналогичной (1.1.6):
d = &f(a, гр, и), а(£0) = а°, л, a?^Da,
(3.1.3)
гр = со(а)+ eF(a, гр, и), гр(£0) = гр°, |гр| < °°.
§ 1. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
105
Функции /, F предполагаются 2л-периодическими по скалярной
фазе хр.
2. Примеры нелинейных систем, приведение к стандартному
виду. Для иллюстрации ниже приводятся некоторые примеры
управляемых систем вида (1) и способы приведения их к стан-
дартной форме (3). Для заданных типов воздействий и = u(t,a.ty),
например периодических по £, хр, такие системы были предметом
ряда исследований. В последние годы также интенсивно разви-
вались методы исследования более широкого класса нелинейных
колебательных систем вида (3), когда фаза хр— вектор произволь-
ной размерности. Асимптотическим методам исследования су-
щественно нелинейных колебаний посвящены многие работы [10,
12, 18, 45-47, 57-59, 63, 69, 70, 82, 89, 119, 122, 136, 141, 148—
150, 154, 161-167, 202, 219, 220, 237].
2.1. Вращательно-колебательная система. Часто встречается в
механических приложениях система с одной степенью свободы у
и медленно изменяющимися параметрами х вида [12, 69, 70]
!/ + Q(x, у, y) = Eq(x, у, у, и), y(t<l)=yl>, y(t0) = y°,
(3.1.4)
х = ъХ(х, у, у, и), x(F) = xQ, u^U.
Предполагается, что при е = 0, х = const уравнение (4) для у
допускает решение, описывающее вращательные движения
с? у /
У = Уо(х, с, 'Ф) = + (Р(А’, 4’), У = “ (1 + (3.1.5)
или колебательные
У = Уо (X, с, гр) = (р (х, с, г|г), у = 0)22 = ©22 (3.1.6)
Здесь гр = со (х, c)(t — ^0) + х|?°— вращающаяся фаза, ср — 2л-пе-
риодическая функция хр, с — амплитуда или энергия. В случае
вращений функции Q, q, X должны быть 2л-периодическимп по у.
Считая (5) или (6) формулами замены г/, г/, х на с, х|'. х и
дифференцируя их по t, можно получить в силу (4) систему
= г/0, uj, (3.1.7)
x=zX(x, z/0, co dyjd^, u).
При помощи тождества co2d2y0/<?x|)2 + 0 (§1 гл. 1) после
106
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
разрешения (7) относительно си (гр —со) получается система
е Г <? Ч , (7ЭЧ Ч Ч и
W со дгр \\дг|)2 ^х dip dtydx ) j
, £
Ф = ® +-гр
<7 Ч [(дУод2Уо
со дс \ \ de д^дх
д2 у ду \
______у0 у0 |
дурдс дх I
(3.1.8)
с(<0) = с°, 4’(£о)='ф° (г/о(х°, с°, Ч>°) = г/°, ((дОуо/д^)0 = у°),
х = гХ(х, у<>(х, с, ф), ыдуо/dty, u), x(ta) = x°.
Производная от у0 по с в (8) берется частным образом. Здесь
определитель Вронского W—2л-периодическая функция ф:
W _ Ж(1, с, «й - ± det^"’
' ’ г/ w д (с, гр) дс dip dlpdc
(3.1.9)
W (х, с, ip)^ 0, x^Dx, c^Dc, I гр I < <».
К системе вида (4) приводит исследование механических си-
стем с невозмущенной функцией Лагранжа L вида L =
= 1/2т(х, у)у2 — П(х, у), где т > mQ > 0 — инерционная характе-
ристика, у, у — обобщенные координата и скорость, х — вектор-
ный параметр, П — потенциальная энергия. В этом случае функ-
ция Q из (4) имеет вид
4(4 +5?) (злл0>
и в случае вращений должна быть периодической по у с пулевым
средним. Для функции Q вида (10) вывод системы (8), а затем
и ее усреднение могут быть проведены на основе известных ин-
тегралов.
2.2. Система, близкая консервативной. Рассматривается более
простой вариант системы (4):
y + Q(x, y)=tq(x, у, у, и), y(t0)=y<’, y(t0) = y\
(3.1.11)
X = &Х (х, у, у, и), X (to) =
Стандартная система (8) строится на основе интегралов
72у2 + П(а:, у)=с, у(х, с, у) = ±У2(с-П)1/2,
ф = со (х, с) J у-1 (х, с, у) dy = W (х, с, у), (3.1.12)
П (х, у) = J Q (х, у) dy, & =~^, То (х, с) = <У> у-1 (х, с, у) dy.
§ 1. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
107
Дифференцирование с, фв (12) по t в силу (И) дает
с = к [qy+(дП/дх-Х)], х = гХ, (3.1.13)
г i , /1^ г дтап]
ф = (о + е J qy — + т— • X И.
I хР* де да: \
Правые части уравнений (13) выражены через х, с, ф и и, а пере-
менная у связана с фазой ф. Для режима вращений функции
dW/дх и д^/дс оказываются периодическими по у и тем самым
по ф, как и в случае колебаний [8, 70].
Примером системы (И) является маятник с управляемым
положением равновесия при малом ускорении точки подвеса (см.
(1.1.17)) (1.1.18). Параметром типа х является длина маятника I
(или о). Следует отметить, что система будет существенно нели-
нейной даже в случае малых колебаний, если I управляема.
2.3. Случай быстрых вращений. Рассматривается вращатель-
ная система вида (И) без малого параметра (е = 1) в предполо-
жении, что начальная угловая скорость вращений г/° велика, т. е.
кинетическая энергия Ч2У2 (ттг = 1) значительно превосходит
потенциальную П, которая периодична и ограничена по у. Движе-
ние в этом случае близко к равномерному вращению у ~ Q = ift
[4, 5]. Введением быстрой независимой переменной 9 [148, 154]
и делением уравнения для у на //02 и для х — на z/° получается
при соответствующих предположениях о величинах и порядках
роста по у возмущений 7, X система
ij = t,q(x, у, у, и), y(tll)—y<>, y(ta) = y°, (3Ц4)
х = еХ(х, у, у, u), x(t^) = х°. Ь • J
Приведение системы (14) к стандартной форме (13) элементар-
но: у — ф, у = с. К исследованию системы вида (14) приводит ряд
задач управляемого движения в слабых силовых полях и др.
2.4. Нелинейный осциллятор с управляемым положением рав-
новесия. Рассматривается система, описываемая уравнениями вида
my + F {у — $) = 0, s = zu. (3.1.15)
Здесь у — абсолютная координата массы т, s — регулируемое по
скорости перемещения положение равновесия, — F(z)—возвраща-
ющая сила; F(0) = 0, zF(z)>0 при z=^0. Уравнения (15) просто
преобразуются к стандартной форме (13), см. далее § 5. К иссле-
дованию уравнений вида (15) приводится ряд задач управления
движением маятниковых систем с перемещаемой точкой подвеса
(гл. 5), упругих систем с управляемыми краевыми условиями
(гл. 9) [24, 29, 30, 55, 65].
Нужно отметить, что в более общем случае колебательная
система с управляемым положением равновесия описывается
функцией Гамильтона Н = V2(p — и)2 + Ф(ср), р = р(ср, и), где
ср — координата, р — импульс, и — управление, причем и (ср, 0)
ss 0. Из уравнений движения следует, что при х = и 0 и соот-
108
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
ветствующих предположениях система совершает колебательные
(Ф'(0) = 0, фФ'(ф)>0, ср 0) или вращательные (Ф(ф + 2л) =
= Ф(ср), г(ф + 2л, и) = г(ф, и)) движения. Кроме того, она мо-
жет перемещаться как целое без колебаний, если выполнены ус-
ловия и = и0 = const, ср ss 0, р = г(0, и0). В частности, для плоских
колебаний и вращений маятника (zn = Z = 1) имеют место выра-
жения
dll • дН . хд»
Ч = —р = Р~», Р=-Тф = (р-Р)^ + ^81Пф,
Я = Ч2(р — г)2 — geos (р, V = Х0 COS ф + у о sin ф,
X (•£()? Z/o) ? U Ux, У о == Uy.
2.5. Управление элементами плоской эллиптической орбиты.
В едучае немалого эксцентриситета е (0 < е^ е ег < 1) систе-
ма уравнений (1.1.23) при отсутствии возмущений допускает об-
щее периодическое решение, которое находится неявно в виде
полного набора интегралов [52, 79, 84, 140]. Применение мето-
дики, использующей интегралы движения, позволяет в неявной
форме построить и исследовать стандартную систему на асимпто-
тически большом интервале времени, см. § 5.
2.6. Управление вращениями твердого тела. Важным в при-
кладном и интересным в теоретическом аспектах представляется
класс задач оптимального управления вращательными движения-
ми твердого тела относительно неподвижной точки (центра масс)
с учетом возмущающих воздействий различной физической при-
роды. Среди них — проблемы стабилизации, ориентации, закрутки
и др. Математическим аппаратом для исследования таких задач
является система уравнений движения в связанных с телом осях
типа Эйлера [37, 50, 104, 140] или в координатах, связанных с
вектором кинетического момента [50, 221, 224—226] и др. Эти
уравнения приводимы к стандартному виду (3). Для частного
случая осесимметричного тела задача управления экваториальной
составляющей вектора угловой скорости в квазилинейной трак-
товке рассматривалась в п. 2 § 4 гл. 1. Развиваемая ниже асимп-
тотическая методика позволяет исследовать задачи управления
такими объектами в нелинейной постановке. В гл. 6 приводится
решение ряда задач оптимального управления вращениями твер-
дого тела.
§ 2. Усреднение в задачах с фиксированным моментом
окончания процесса управления
1. Постановка задачи и принцип максимума. Конечное мно-
жество и функционал задаются общими соотношениями типа (1.3.6)
ДО(а)|т = 0, М = ..., Mz), O^Z^n-1, (32
J[u] = g(a) It -*• min, u(t)^U, TeQe-1.
и
§ 2. ЗАДАЧИ G ФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ
109
Функции М, g и множество U определяются аналогично § 2 гл. 1
и таковы, что при 8^(0, е0] решение задачи оптимального управ-
ления (1.3), (1) существует. Предполагается, что особые управле-
ния отсутствуют, а система является достаточно гладкой. В каж-
дом конкретном случае особых управлений требуется специальное
исследование, которое можно упростить при помощи излагаемого
подхода.
Как отмечалось в § 3 гл. 1 к виду (1) приводится случай ин-
тегрального функционала
т
J [и] = g0 (а) \т + е G (а, ф, и) dt (3.2.2)
*0
или
^[^] = ^Го(«) 1т + ап+1|т, dn+i = eG(a, х|), п), ап+1(^о) = О.
Аналогично § 3 гл. 1 функции М и g в (1) не должны су-
щественно зависеть от фазы ф. Вынужденность такого ограниче-
ния постановки задачи управления вытекает из анализа краевой
задачи принципа максимума. Предполагается, что из условия мак-
симума функции Гамильтона Н оптимальное управление и* опре-
деляется однозначно как достаточно гладкая по всем аргументам,
2л-периодическая по х|? функция, т. е.
Я->тах, u<=U, Н = е (p^f) + q (со + eF),
и
и* = и (а, ф, р, q) = arg max Я, и е Ui (3.2.3)
и
Н* = Я|и* = е (p-f*) + ?(ю + eF*).
Здесь р, q — сопряженные а, х|) переменные. Как результат при-
менения методики § 2 гл. 1, следует краевая задача
а = 8/* (а, ф, р, q), ф = со (а) + eF* (а, ф, р, q),
Р = — t(P'f*) + ? = ~e^[(W*) +
а(/0) = а°, = <(а)1г = 0, (3.2.4)
p(T)=£[(K-M)-g]\T, q(T) = Q.
Важно отметить, что в отличие от квазилинейного случая
(1.1.6), приводящего к стандартной системе уравнений для крае-
вой задачи принципа максимума (1.2.9) или (1.3.3), полученная
для (1.3) система дифференциальных уравнений (4) не имеет
стандартного вида. Как следует из (4), сопряженная переменная
р формально не является медленной: р = — qa/^O при 8 = 0.
Уравнение для вектора р сходно с соответствующим для вектор-
ной фазовой расстройки, возникающим при исследовании много-
частотной нелинейной колебательной системы в окрестности ре-
зонансной точки [5, 10, 47, 70, 82, 148, 162, 163]. Такие случаи
110
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
представляют большие трудности для асимптотического анализа.
Кроме того, оказывается, что решение краевой задачи принципа
максимума, как правило, существенно неединственно, аналогично
§ 3 гл. 1. Отмеченные два обстоятельства взаимосвязаны и су-
щественно усложняют исследование краевой задачи и построение
асимптотического решения задачи оптимального управления (§ 4,
5 гл. 4 и § 6 гл. 6).
2. Вывод стандартной системы с вращающейся фазой. Модуль
сопряженного вектора (р, q) считается ограниченным величиной
порядка единицы, что достигается нормировкой. Далее исполь-
зуется граничное условие q(T)=0 из (4) и свойство канонич-
ности автономной системы, заключающееся в постоянстве Я*
вдоль траекторий:
Н* = 8 (р • /*)+ 7(со + бЯ*) = С = const. (3.2.5)
В предположении гладкости и ограниченности функций /*, F*
и их производных на интервале времени t [£0, Т], Т = 08-1 век-
тор а также будет ограниченным: a^Da при aQ Dao^Da.
Тогда из (5) при t—T следует, что С = 8 (р • /*) |г ~ 8. Полагая
С = zh, где параметр Л ~ 1 при 8 -> 0 и равен
= (Р /*) К, (3.2.6)
= ip, р, q), q(T) = 0,
можно переписать соотношение (5) с учетом (6) в виде
q = бсо-ЧЛ - (р • /*) - qF*]. (3.2.7)
Соотношение (7) следует рассматривать как уравнение отно-
сительно переменной q. При условии ограниченности частных
производных функций /*, F* по q в окрестности q = 0 решение
существует и имеет вид
q = еоГ1 [h — (p-f*0)] + e2q2 (h, a, ip, p, e),
/о = /* (a, °); Q = 0 (e)- (3.2.8>
Функция q = q(h, а. гр, p, e) может быть построена разложе-
ниями по степеням 8, последовательными приближениями или
методом Ньютона (касательных [86]), причем q2 является гладкой.
Подстановкой (3) в (4) получается семейство краевых задач вида
(h — параметр семейства)
a = 8/о (а, гр, р) + 82/2 (Л, а, гр, р, в),
Р = ~еТа(р'^ +e2pz(fe> а’ Я’, Р, е)’
гр = © (а) + eFj (h, а, гр, р, е), (3.2.9)
а(О = а\ гр(«0) = 1р», Л7(а)|Г = 0, р (Г) = [(Х-М) - g] |т.
§ 2. ЗАДАЧИ С ФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ
111
Таким образом, построена стандартная система (9), где /2, Pz,
Fi — известные функции, периодические по х|). Решение краевой
задачи (9) при фиксированном h^Ih и е>0 существует и равно
(/ е ]7о, 71])
a = a(t, h, е), = г|э (£, с) р = р(^ К с). (3.2.10)
В § 3, 4 гл. 2 установлены соответствующие достаточные условия.
Однако соотношение (6), определяющее параметр Л, допускает,
как правило, много корней, число которых при выполнении не-
которых общих условий, аналогичных сформулированным в п. 3
гл. 1, порядка е-1, причем расстояние между соседними порядка
с. Для доказательства этого уравнение (6) переписывается с уче-
том (8) в виде
h = (p-f0(a, ip, р))|т, (3.2.11)
где a, ip, р подставляются согласно (10). Так как решение за-
дачи оптимального управления существует, то уравнение (11) до-
пускает хотя бы один вещественный корень h* е /д. Следова-
тельно, при достаточно малом е > 0 в 8-окрестности h = h* долж-
ны существовать еще корни, что обусловлено быстрой осцилля-
цией функции /о |т по h из-за периодической зависимости от х|).
Частота осцилляций порядка е-1, а амплитуда порядка единицы.
Действительно, первое свойство вытекает из оценки величины
dty/dh\T, так как в общем случае
т т т
S |т = J ^dt~ J ° (а> dt = J -Й) dt ~ е-1’ (3-2*12>
% *0 *0
Амплитуда колебаний характеризуется величиной размаха
функции fo по х|), т. е. имеет порядок единицы. Типичное поведе-
ние правой части уравнения (11) как функции h при малом 8
представлено на рис. 3.1 и качественно совпадает с приведенны-
ми па рис. 1.6, 1.7. Достаточные условия такого поведения кор-
ней устанавливаются при помощи решения задачи первого при-
ближения, как и в § 3 гл. 1, и будут обсуждаться ниже более
подробно.
Итак, в общем случае можно считать установленным факт
существенной неединственности решения краевой задачи прин-
ципа максимума (4) или (6), (8) —(И). Множество решений
определяется множеством корней {ЛД уравнения (И). Оптималь-
ное значение Л* выбирается из условия минимума функцио-
нала (1)
J* = min J [u] = min J (fe, £), h е {/zv},
u<=U h
h, 8)). (3.2.13)
112
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
Типичное качественное поведение функции J(h, е) при малых 8
представлено на рис. 3.2. После определения Л* из (13) перемен-
ные a*, хр*, р* и 7* находятся однозначно согласно (10), (8), а
на их основе и оптимальное управление и* (3) в форме програм-
мы или синтеза. Указанные выше трудности, связанные с реше-
нием краевой задачи (9) и трансцендентного уравнения (И) с
последующей оптимизацией по h согласно (13), могут быть пре-
одолены при помощи развиваемой ниже асимптотической методи-
ки, аналогичной § 3 гл. 1. Этот подход существенным образом
исподьзует решение задачи первого приближения.
3. Краевая задача первого приближения. Отбрасывая в стан-
дартной системе (9) члены порядка 82 и усредняя по фазе хр,
можно получить в медленном времени т = st краевую задачу
(т0) = a0, ЛГ(£)|е = О, T](0) = ^-[(X.J/)-g]|e; (3.2.14)
ф-= e-iw (^), ф(т0) = 1|>° (/„(£, п) = </Ж П)>)-
Члены порядка единицы в уравнении для ср (14) удерживать
не имеет смысла, так как к такой же погрешности в определении
фазы хр приводит погрешность O(s) в определении величины а:
a = ^ + O(s) [58, 69]. Известно [58, 69, 70, 148], что решение за-
дачи Коши для системы (9) с заданными значениями а0, р°, хра
п величинами fe, 0 близко решению усредненной (14), если
начальные значения V» ц°, ср0 и величины параметра % достаточно
близки, т. е.
\а— |р —I хр — cpI^Cc,
\а° — VI ^ds, 1р° — т]°1 (3.2.15)
I хр° — ср01 d, I h — Тг\ ds
(с, d = const, [£0, 0с-1]).
§ 2. ЗАДАЧИ С ФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ
ИЗ
Для обоснования аналогичных (15) оценок близости решений
краевых задач (9) и (14) предполагается, что решение усред-
ненной задачи существует, единственно и обладает свойством
изолированности при h^Ih, сформулированном в § 3 гл. 1. В этом
случае добавление малых слагаемых О (г) в правые части урав-
нений и краевые условия (14) приводит к такому же малому
изменению решения возмущенной задачи.
Исследование усредненной краевой задачи (14) позволяет
установить следующее. Система уравнений для ц допускает
интеграл
со-1 (g)[Л — (ti -/0(g, Y]))] = p = const, (3.2.16)
что проверяется непосредственным дифференцированием (16) в
силу уравнений (14) с использованием равенства 3(т] • /0)/дт| = /0,
которое следует из (1.2.7). Сравнение (10) и (8) показывает, что
При помощи интеграла (16) уравнения для g, г] (14) предста-
вимы в более удобном виде:
Г=/о(^,11), С)Ц- (3.2.17)
Если считать р фиксированным параметром, то система (17),
как нетрудно установить дифференцированием, гамильтонова с
функцией Гамильтона, равной
lime-1 <Я* (£, гр, г], ер)> = со(£)р + (гр/0 (£, г])) = h = const. (3.2.18}
Е-» 0
Постоянство h отвечает соотношению (16). Наряду с Л-семей-
ством уравнений (14) далее рассматривается ^-семейство (17).
Параметры р и h связаны соотношением (18) или (16). Предпо-
лагается, что в некоторой области значений h^Ih и р Zp эта
связь взаимно однозначная, причем точка р = 0 Zp. Ниже, ана-
логично § 3 гл. 1, устанавливается, что последнее предположение
при некоторых дополнительных предположениях выполняется и
связано с достаточными условиями существования корня h* е Ih
у усредненного по гр соотношения (11) и поведения корней {hv}r
как это представлено на рис. 3.1, у точного уравнения. В резуль-
тате [J-семейство краевых задач для системы (17) имеет единст-
венное решение, представимое в виде
£ = £(т-т0, 0 —То, а\ Р), Т| = т](т — т0, 0-То, а0, р),
TGE[T0, 0], а° е Dao cz Da, Z(=Da, (3.2.19}
4. Связь усредненной и исходной краевых задач. Параметр р
должен удовлетворять уравнению (11), в которое подставлены
8 Л. Д. Акуленко
114
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
выражения для а, ф, р\
х
а = + О (е), р = г) + О (е), гр = г|?° + J ® (£) <70 + О (1),
то
(3.2.20)
и выражение для h согласно (16), (18). Получается соотношение
П, + v р(£) dQ + 0(1)) |0 = р + О (е),
Т° / г * (3.2.21)
Ф(£, П, гр) s со-1 © (£, ip, n) —/о(^> П)])-
Введенная в (21) функция Ф периодична по 11 имеет нулевое
среднее. Пусть выполнено условие
Тогда при достаточно малых значениях е > 0 левая часть соотно-
шения (21) в некоторой окрестности значения p = O^Zp есть
быстро осциллирующая функция р с частотой порядка 7о8“1,
амплитудой порядка единицы и средним 0(e). Следовательно,
в некотором интервале значе-
ний р, включающем £ = 0, урав-
нение (21), аналогично уравне-
нию (И) вследствие (12),имеет
порядка е-1 корней, причем со-
седние отличаются друг от дру-
га на 0(e). Любая точка этого
интервала обладает тем свойст-
вом, что в ее е-окрестности на-
ходится корень (Jv точного урав-
нения (21), отвечающий корню
hv уравнения (И). Связь меж-
Рис. 3.3
ду этими значениями взаимно однозначная и задается согласно
(16), (18). Качественная картина поведения корней (Jv уравнения
(21) представлена на рис. 3.3. Более глубокий смысл введения
параметра р выясняется из построений высших приближений
§ 1 гл. 4.
5. Выделение оптимального решения. Для определения опти-
мального значения служит условие (13), где функционал J
представлен в виде
У = Ж e) = J0[p] + O(e), ee[0, е0],
/o[₽] = g(B(©- То, О-То, а», ₽)), (3.2.23)
§ 2. ЗАДАЧИ С ФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ
115*
Здесь параметры h и р связаны согласно (16), (18), а функция
70 считается гладкой по р Ц. Рассматривается следующая зада-
ча на минимум гладкой функции 70[Р]:
Jo [0]-> mint ре/p; Уо*=Л[РоЬ (3.2.24)
3
Важно отметить, что здесь параметр р выбирается из непрерыв-
ных множеств значений.
Из близости J (Л, е) и 70[Р] и гладкости 70 по р следует, что
минимумы (13) и (24) отличаются па величину 0(e), т. е.
J* — J0=O(e). Следовательно, решение Po, Jq задачи (24)
дает приближенное решение исходной задачи оптимального уп-
равления (1), (13) в следующем смысле. В 8-окрестности най-
денного Ро найдется pv, отвечающее некоторому корню hv урав-
нения (И), для которого в силу установленных свойств спра-
ведливы оценки близости
J (hv, е) = Jo [pv] + Ot (е) = Jo [р*о] + 0.2 (е) =
= /; + 02(e) = J* + 6?3(e), (3.2.25)
где 01>2,з(е) — малые порядка е. Таким образом, отличие при-
ближенного решения от точного но функционалу — 0(e), при-
чем в е-окрестности Ро имеется точный корень pv уравнения
(21). Близость порядка е к оптимальному значению р*, отве-
чающему Л*, не гарантируется. Вследствие этого не гаранти-
руется также е-близость для всех t е [70, 0е-1] решений урав-
нений краевых задач по медленным переменным; е-близость
имеет место в выполнении краевых условий, так как краевые*
условия п условия трансверсальности выполняются тождествен-
но по р 7Р или 1ъ.
Таким образом, проведенные рассуждения позволяют в пер-
вом приближении по е ограничиться минимизацией гладкой
функции Л[р] -> minp, р е 7Р, согласно (24). Ниже устанавлива-
ется, что полученные выводы содержательны, т. е. на множе-
стве 7Р имеется точка р, подозрительная на экстремум. Спра-
ведливо утверждение:
Лемма 3.1. При точка р = 0 является точкой локаль-
ного экстремума; если у0 > 0, то в точке р = 0 значение /о[О] есть
локальный минимум 70(Р], если *у0 < 0, то максимум.
Доказательство. Дифференцирование функции JofPl из
(23) по Р дает
Л [₽1 = («.«)|е. (3.2.26)
Учет краевых условий (14) для ц, а также равенства
о*
116
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
(д£/#Р) |т0 == да°/д(3 = 0 позволяют представить (26) в виде
о
то
(3.2.27)
Во втором равенстве (27) использован тот факт, что
д(\ • М)/д$\е = 0, так как условие М|в = 0 выполняется тожде-
ственно по р, см. выше. Дифференцируя подынтегральное вы-
ражение (27) и используя уравнение для ц (17), можно по-
лучить
°
л- J {([₽<+Ж <з-2-28>
то
Выражение для производной (dg/dp)*, содержащееся в (28), на-
ходится на основе дифференцируемости функции /0(^, ц) (14):
= Аг _ зь I
dr д$ dp ё dg др'-1- дг] др ‘
Вклад второго слагаемого после подстановки полученного выра-
жения в (28) равен нулю на основе равенства д(ц • fQ)/dv\ = /0-
В результате
о о
4(01 =₽ = I (0®с/т- (3-2,29)
го го
Из равенства нулю производной Jq [[3] (29) следует, что зна-
чение р = 0 есть точка возможного экстремума J0[P], если р =
= 0 7Р, что предполагалось выше. При условии, что вторая
производная J0[P] по р ограничена, то р = 0 будет точкой ло-
кального минимума при выполнении строгого неравенства
о
4 [0] = ± J со © dx |р=0 = То > 0. (3.2.30)
то
Величина 70 определена в (22) и по предположению отлична
от нуля. Таким образом, требование (30), включающее условие
быстрой осцилляции (22) и поведения корней pv уравнения (21),
качественно представленного на рис. 3.3, является достаточным
для локальной оптимальности значения Ро = 0 п соответству-
ющих ему переменных ц и функционала Л-
Для вывода достаточных условий глобального минимума на
некотором интервале Ре Л вычисляется функция J0[P] интег-
§ 2. ЗАДАЧИ С ФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ
117
рированием ее производной (29) по частям:
©
Л IP] - Л10] = j
то
р
p))-J®(Ur, P'))d₽'
о
dx. (3.2.31)
Из условия Л[Р] — Л[0] > 0, согласно (31), следует неравенство
о 3 о
р J о (£ (т, 0)) dr > j dfi' J о (£ (т, Р')) Л, р <= Zp. (3.2.32)
Другое эквивалентное условие получается из определения
Л[р] В (23):
g(g(0, P))>g(S(0, 0)), ре Л. (3.2.33)
Выбор формы для условия оптимальности определяется со-
ображениями удобства. Важно отметить, что достаточные усло-
вия локальной оптимальности (29), (30) могут быть проверены
на основе известного общего решения уравнений (17) при р =
= 0. Действительно, требуемые для проверки функции ц при
Ipl Р° могут быть построены разложениями по р, для чего
понадобится решать некоторые линейные краевые задачи с из-
вестной фундаментальной матрицей, аналогично построениям
§ 2 гл. 2, см. (2.2.1) —(2.2.6). При этом однородная часть си-
стемы уравнений есть система в вариациях для (17) при р = 0;
ее фундаментальная матрица находится дифференцированием
указанного общего решения по параметрам — постоянным ин-
тегрирования (см. пример п. 7 и задачу § 2 гл. 6).
6. Заключительные замечания. Процедура построения опти-
мального управления, как и в § 3 гл. 1, связана с построением
Р-ссмейства решений краевой задачи (16), (14) и последующей
минимизацией функционала первого приближения J0[P] (24) по
параметру семейства р па множестве Ц его значений, для ко-
торых решение краевой задачи существует в рассматриваемой об-
ласти Da. Для гладких систем, как установлено выше, в случае
единственного решения задачи оптимального управления, как
правило, значение р0 = 0 оптимально. Фазовые и сопряженные
переменные, согласно (8), (19), (20), задаются в виде выра-
жений
а = £*, р = ц*, 7 = 0, г|? = гр0 + (3.2.34)
в которые подставляется Р = Ро* Используя (34), можно полу-
чить приближенное оптимальное решение задачи управления,
обладающее свойством 8-близости по начальным и краевым ус-
ловиям, а также 8-близости управления по функционалу. Рас-
суждениями по схеме п. 4 § 3 гл. 1 можно установить при
118
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
достаточной гладкости огибающих функции Д по у
Л (р, У, е) = Л [р] - /0 [р], У <Р—i (©, р) = J (О dr, (3.2.35)
то
что значение Ро обладает также свойством 8-близости по мед-
ленным переменным (15) для точного и приближенного опти-
мальных движений, см. рис. 3.2. Более детальное исследование
этого вопроса содержится в § 2 гл. 4. Быструю фазу гр = ср +
+ 0(1) в управлении и* (3) нельзя заменить на ср без потери
точности. Поэтому представляется возможным записать прибли-
женное управление и* в виде синтеза или «частичной» про-
граммы:
us = и* (a, if, Tj* (0, 0 - т, а, р»), 0), 0
ир = и* (£*, гр, ц*, 0).
Нужно иметь в виду, что синтез оптимального управления мо-
жет иметь особенность при т = 0, поскольку при заданном ко-
нечном многообразии М (а) (1) сопряженная переменная ц* ->
°°, если т0 0.
Следует отметить, что решение усредненной краевой задачи
(14) или (17) в прикладных задачах обычно существенно про-
ще, чем исходной (4) или (9). Это связано с меньшей размер-
ностью усредненной системы и отсутствием быстрых осцилля-
ций, что позволяет ввести медленное время при ее интегриро-
вании. Задачи управления системами с одной степенью свободы,
как правило, приводятся к квадратурам и конечным уравнени-
ям. Решения ряда задач оптимального управления нелинейны-
ми колебаниями механических систем содержатся в гл. 5, 6.
7. Модельный пример. Для иллюстрации изложенного выше
подхода рассматривается пример управления скоростью дина-
мической системы с одной степенью свободы у:
ij = е[и + F (у) — xy], Х = const,
уМ = у\ уМ=уа>0- ( °
Здесь F — 2л-периодическая по у со средним Fo функция, и —
управление. Уравнением (37) описывается ряд модельных за-
дач управляемого движения в слабых периодических полях, бы-
стрых вращений (см. (1.14)) и др. Заменой у = гр, у = а урав-
нение (37) приводится к стандартному виду (1.3):
а = e[zz + ^(гр) — /я], гр = a; a(tQ) = у" > 0, ^p(Z0)=z/°. (3.2.38)
Для (38) ставится задача оптимального управления
т
а(Т) = у*^О, J [u] = е J u2dt, | и | < оо, 7 = 0/8. (3.2.39)
§ 3. ЗАДАЧИ G НЕФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ
119
Приемом (2) интегральный функционал J[u] (39) можно пред-
ставить в виде терминального. Краевая задача первого прибли-
жения в соответствии с (14), (17) приводится к виду
V = */21] + F, - xg, Uto)=!/°, £(0) = у*,
11=X’1~ P, n(0) = ^, T = e£e[T(,,0], To = s/0.
При p = 0 решение линейной краевой задачи (40) равно
t /т\ _ [„о _ А _ А е-х(в-то)1 е-х(т-то) + £1 + А е-х(е-т)
*( } И X J 7. 4х
ч] (т) = (3.2.41)
X = 4х{? - ?гХ(0’То) - [1 - [1 - е-2Х(0-то)]-\
Приближенные оптимальные управление и функционал с уче-
том (41) находятся в виде
Up (Т) = V2T1 (т), us (0 - т, у) = ‘/2л
К = Jo Ю1 = (Х2/2Х) [ 1 - е-2Х<е-то) ]. (3-2'42)
Легко показать, что значение Ро = 0 доставляет минимум /0[р]
согласно (24). Действительно, из линейности системы (40) сле^
дует, что решение краевой задачи линейно по р, 1р1<°°:
£ = £о + Р£1, Ц = По+РПь Х = Хо + рХ!. (3.2.43)
После подстановки (43) в (42) следует выражение
е
/о 1Р1 = Т J + dx- (3-2-44)
то
Так как ц^О, то из (44) следует, что minp J0[p] существует
и единствен. С другой стороны, из формулы (29) следует, что
Р = 0 — точка минимума /0[Р]. Поэтому интеграл от цот]i в (44)
должен быть равным нулю, что нетрудно проверить также не-
посредственным интегрированием. Тогда из вида функционала
(44) при помощи неравенства (33) устанавливается строгая гло-
бальная оптимальность точки Ро = 0 и минимум 7о[О].
§ 3. Асимптотическое исследование задачи
оптимального управления с нефиксированным моментом
окончания процесса
1. Постановка задачи управления и анализ краевой задачи
принципа максимума. Рассматривается нелинейная управляемая
по медленным переменным система (1.3), (2.1), в которой Т =
== 0е-1—нефиксированный момент окончания процесса управ-
120
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
ленпя, подлежащий определению. В этом случае [49, 61, 62, 129,
180] условия трансверсальности па правом конце (t = Т) до-
полняются равенством (см. (1.3.5))
Я*1т = (р-/Да, 1Р,р))|г = 0. (3.3.1)
Здесь функции Л* и /о определены формулами (2.3), (2.8).
Построение асимптотического решения при нефиксированном ©
(0 ~ 1 при 8-^0) проводится по схеме, аналогичной случаю за-
данного 0, согласно § 2 (см. также § 3 гл. 1). Поэтому ниже
отмечаются, главным образом, лишь отличия от построений § 2.
Из (1) следует, что в соответствующих соотношениях крае-
вой задачи принципа максимума (2.6) — (2.11) следует поло-
жить равной нулю постоянную h. Однако решение краевой за-
дачи (2.9) будет содержать другой неизвестный параметр 0Г
и это решение можно представить в виде, аналогичном (2.10):
а = a(t, 0, е), ф = ф(£, 0, 8), p = p(Z, 0, е). (3.3.2)
Предполагается, что решение вида (2) существует в рассмат-
риваемой области для значений 0 из некоторого множества 7е.
Подставляя (2) в условие (1), можно получить определяющее
уравнение для 0 = &Т:
(р(4’ 0’ е)'^ (а (т’ 0’ е)’ (т’ 0’ е)’ 0’ 8Ш = °-
(3.3.3)
Как и при анализе уравнения (2.1), устанавливается вслед-
ствие быстрой осцилляции /о 1т по 0, что уравнение (3) допу-
скает, как правило, много, порядка б-1, корней {0V\ причем
расстояние между соседними корнями 0(e). Для определения
оптимального значения 0* е {0V} требуется аналогично (2.13)
решить задачу па минимум:
J* = min J (0, е), 0 е= {0V}; J (0, е) = g (а / —, 0, eYl (3.3.4)
е \ \ 8 //
Качественная картина поведения функции 7(0, е) из (4) в ок-
рестности минимума при малом б сходна с представленной на
рис. 3.2 (с заменой fe-^0).
2. Усредненная краевая задача первого приближения. В пер-
вом приближении по б краевая задача имеет вид (14) § 2, где
h = 0, а 0 — неизвестный параметр, подлежащий определению.
Предполагается, что решение £, т] удовлетворяет сформулиро-
ванному в п. 3 § 2 условию изолированности с заменой h па
0. Краевая задача (2.14) преобразуется к виду (2.17) при по-
мощи интеграла (2.16) с h = 0. Соотношения (2.16), (2.18) оп-
ределяют зависимость 0(Р). В дальнейшем считается, что 0 =*
§ 3. ЗАДАЧИ С НЕФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ
121
= 0(£), Р /|з, п ставится задача определения оптимального зна-
чения параметра р.
Подстановка зависимости 0(^) в решение (2.19), (2.20), а за-
тем в соотношение (3) приводит к трансцендентному уравнению
относительно р, совпадающему с (2.21), однако здесь © = ©([}).
Предполагая выполненным условие быстрой осцилляции ти-
па (2.22)
0(3)
Та
- т0, 0 - т,
а0, 0)) dx |р=0 = ц0 =/= 0,
(3.3.5)
можно прийти к выводу, что параметр р определяется условием
минимума функции /0[Р], причем р = 0 е Zp. В резуль-
тате получается задача определения минимума функционала
первого приближения, аналогичная (2.24):
/o[P] = g(U©(₽)-To,0(p)-To,a%p))~>min, peZ3. (3.3.6)
3
Исследование и решение задачи (6) проводятся аналитически-
ми средствами, аналогично п. 5 § 2, см. также п. 3.2 § 3 гл. 1.
3. Определение оптимального решения. При сделанных пред-
положениях относительно гладкости функций /, со, F п g функ-
ционал 70[Р] (6) дифференцируем по Производная вы-
числяется, следуя методике п. 5 § 2:
(3-3.7)
Здесь 0(Р) — корень уравнения (2.16) при /г = 0 и £ = £(т — т0,
О — То, а0, Р), ц = т](т — т0, 0 — То, а0, Р), которое приводится
к виду
[®(Ш+(тгШ, n))]l*(f» = o (=®(Ш + 0гШ, п)))-
(3.3.8)
Из (2.14) берется выражение для dg/dt}^ и подставляется в
(7); аналогично (2.27) следует, что
i₽i -(|/ЛгЧ> -”•] t) - -(”• t)- ,3-М)
Здесь первое слагаемое в первом равенстве равно пулю, так как
Л/1© = 0, р Zp, 0 = 0(Р). Далее преобразуется выражение (9)
дифференцированием (0) по р как сложной функции со-
гласно (7):
К [₽] = -Ы’)|90'(р)- oi-ад) |в. (з.з.ю)
В выражении (10) вместо £* = с/^/йт подставляется /0(5, л)
согласно (2.17), а второй член представляется в виде интеграла
от производной, как в (2.27). Учитывая при этом равенство
122
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
3£/<Э|3 |т = да°/<Э|3 = О, можно получить выражение
0(₽)
= J 4b-t)dT- (ЗЛ11)
то
Первое слагаемое в (И) заменяется согласно (8), а интеграл
вычисляется при помощи приема п. 5 § 2, см. (2.28), (2.29).
В результате получается выражение для производной Jq [р]г
внешне идентичное (2.29):
о
j'o W = 0-^ j <° - т0’ 0 - то,«°. 0)) е = 0 (Р). (3.3.12)
то
Существенное отличие заключается в том, что 0 = 0({3), р Ц.
Так как точка р = 0 Zp согласно (5), то дальнейшие выводы
п. 5 § 2 об оптимальности значения Ро = 0 сохраняются. Име-
ет место следующее утверждение.
Лемма 3.2. Достаточное условие локальной оптимальности»
включающее требование (5) указанного выше поведения корней
{pv}, имеет вид, аналогичный (2.30): ц0>0.
Условия глобальной оптимальности совпадают с (2.31) —
(2.33) при 0 = 0(Р). Процедура построения фазовых и сопря-
женных переменных, а также оптимального управления и обос-
нование близости построенного асимптотического решения про-
водятся посредством сходных рассуждений. Следует отметить,
что управление в форме синтеза us (2.36) оказывается завися-
щим лишь от а, хр: зависимость от т отсутствует, что является
следствием автономности (величина 0 — т0 определяется из (8)
как функция аргументов а0 и Р).
4. Модельный пример. Для иллюстрации изложенной в § 3
методики рассматривается задача управления быстрыми враще-
ниями системы типа маятника (см. (2.37)):
y = eu + eF(y), у(О)=у°, у(0) = у°>0,
y(T) = y*>0, |и(£)|<°°, ie[0, Т], 7’ = 0е-1,
О
J [и] = А’0 + j* iFdx-+ min, &>0, т = zt. (3.3.13)
о и
Здесь F — 2л-перицдическая функция, F(} = 0. Фазой в системе
типа (1.3) будет = у, а частотой со (а)—скорость а = у. Со-
гласно (2.2) функционал из (13) записывается в виде
J[uJ = Ъ (Т), б = е (к + и2), Ъ (0) = 0. (3.3.14)
Усредненная краевая задача для £, ц на основе (2.17), (2.14)
§ 3. ЗАДАЧИ С НЕФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ
123
записывается в виде
Г = 72т], < = -0, Ш = У°, В(0) = У*. (3.3.15)
Решение (15) равно
|(т) = -±р(е-т)2 + 0-1(0-т)(л + 4р02) +?,
. ' . (3.3.16)
Т) (Т) = Р (0 - т) - 20-1 (а + р02I, А = у° - у*,
а связь между 0 и р задается уравнением (8), принимающим
вид
+ V2n2 - л 11е = 0 (=^ + - к). (3.3.17)’
Подстановка Л из (16) в (17) приводит к соотношению
Р? + 0~2 (А + ± р02)2 - к = 0. (3.3.18)
Функционал (14) в первом приближении равен
/»[0] = 2kQ - (0724) 03 - 7гА00 - у*00. (3.3.19)
Искомые производные /«[О], 0'(О) и величина 0(0) равны
J'o [0] = 2/с0' (0) - (? + i/2A) © (0), з 2())
0' (0) = 1/2Ar-1 (У* + 72А) © (0), 0 (0) = к~1/21 А |. '1 ’
Из выражений (20) в соответствии с общим выражением (12)
следует, что/0[0] = 0. Таким образом, необходимое условие оп-
тимальности выполнено. Вторую производную /0[0] можно вы-
числить, используя формулу (12) для JQ [р]; в результате по-
Jo [0] = (1/24) 03 (0) + */2й-1 (У* + 72А)2 0 (0) > 0. (3.3.21)
Из неравенства (21) следует локальная оптимальность значе-
ния Ро = 0. Значения р = 0, 0(0) после подстановки их в (16),
(19) определяют оптимальное решение задачи управления (13),
(14) в первом приближении по е:
£ (т) = у° - тк1/2 sign А, 0 (0) = k~l/21АI,
и* = ^Л, ир=— &1/2 sign А» u* = — kl/2 sign {у — */*),
4 [0] = 2к1/21 А | = 2кЭ (0).
Следует отметить, что вклад каждого слагаемого в функ-
ционал (13) в первом приближении одинаков и равен ki/2\Д|.
Свойство глобальной минимальности /0[0] при р0 = 0 устанав-
ливается на основе выражений (18), (19).
124
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
§ 4. Усреднение существенно нелинейных систем на основе
невозмущенных интегралов
I. Состояние проблемы. Непосредственное применение мето-
дов разделения движений (усреднения) для нелинейных систем
часто сопряжено с большими аналитическими и вычислитель-
ными трудностями. Эти трудности обусловлены тем, что, как
правило, решение порождающей системы бывает известно не-
явно лишь в виде полного набора первых интегралов. В каче-
стве важных для механических приложений примеров таких си-
стем можно взять нелинейный осциллятор, систему «типа маят-
ника», вращательные движения твердого тела относительно не-
подвижной точки (центра масс, случай Эйлера пли Лагранжа),
движение материальной точки по эллиптической орбите (задача
Кеплера) и многие другие. Движения таких систем задаются в
неявной форме или при помощи специальных функций, что по
существу то же самое. Поэтому возникает насущная необходи-
мость построения схем усреднения на основе интегралов невоз-
мущениой системы. Для вращателыю-колебательпых систем «ти-
па маятника», допускающих простую систему первых интегра-
лов, неявные схемы усреднения первого и второго приближе-
ний разработаны в [69, 70, 148]. В задачах динамики твердого
тела схема усреднения по движению Эйлера — Пуансо была
предложена в [221]; усреднение по движению Лагранжа прово-
дилось в [122, 237] и др. Усреднение по угловой переменной
(истинной аномалии) в задаче Кеплера осуществлено в [84, 127].
В последнее время разрабатываются схемы прямого усреднения
па основе приближенного представления порождающего движения.
Ниже приводятся различные схемы усреднения па основе
известных интегралов невозмущенных систем.
2. Неявные схемы усреднения колебательных систем. Рас-
сматривается управляемая система (1.1) частного вида (я, у —
скаляры, z — вектор):
х — уу(х, у, z)+&J(x, у, z, н),
у = —ху(х, у, z)+eg(x, у, z, н), (3.4.1)
Z = £Й(Х, I/, Z, и).
Считается, что «часто!а» v положительна, т. е. 0 < Vi v
<v2<°°. При е = 0 система (1) полностью интегрируется:
х2 + у2 = с = const > 0, z = const,
х с — х2 у (х, + угс — х2, z)
= f d]i =
J ip V c— £/2v(± y2,y,z)
§ 4. УСРЕДНЕНИЕ НА ОСНОВЕ НЕВОЗМУЩЕННЫХ ИНТЕГРАЛОВ
125
= | .-----г (х = V^cosrp, у= l^csincp).
J v( ус cos ср, ус sin ср, Z)
(3.4.2)
Согласно (2) период колебаний 70 певозму щепной системы
(1) вычисляется интегрированием одного из выражений:
(ds = (dx2 + dy2)i/2, х = У с cos ср, у = Vcsincp).
Уравнение для медленной переменной с получается диффе-
ренцированием соотношения (2) в силу возмущенной системы
(1) и просто выражается через исходные переменные:
с = 2е (xf + yg), x2 + y2 = c>0. (3.4.4)
Уравнение для фазы колебаний ф при помощи (2) может
быть представлено в одном из видов:
* 9 тт
= Т \с ~) + еТ z’ =
d / 2л Г___________________с? ср____________
dt \ v ("|/с cos ср, "|/csincp, z)
Дифференциальная связь фазы г|) с переменными х, у, <р позво-
ляет проводить усреднение произвольной функции F (х, у, z, zz)r
где и — управление, зависящее от х, у. z и других (напри-
мер, сопряженных) медленных переменных. Схема усреднения
126
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
может быть взята в одной из удобных форм:
го
<F> = —г f F dt =
т0 (с, Л
2Л
= 1 /С F ds _ 1 С _______________________F dq__________
9 J 9 ~l/cv (я, Уч 2) То •' vd/ceoscp, T/csinq), z)
О
/с
Vc
(3.4.6)
Возможны и другие удобные для усреднения преобразования
уравнений (1) для х, у, z. Замена (х, у) на переменные типа
амплитуда — фаза (а, if) приводит к эквивалентным (при а =£ 0)
уравнениям:
а = £ (/ cos if — g sin if) (z = eh),
if = v — ezz-1 (/sin if H- g cos if), (3.4.7)
x — a cos if, z/= — a sin if, a 0; v = v(£, z/, z).
Усреднение проводится следующим образом (F —правая
часть системы (7)):
2Л 2Л
_ 1 С ___________F dty______ у , ч = С _____________dty________
х ' Т J v (a cos гр, — a sin ф, z)’ ov ’ / J v (a costf,—asinxf, z)’
0 о о
(3.4.8)
Переход от исходных переменных (я, у) к переменным
(а, 6, ср) типа переменных Ван-дер-Поля дает схему усредне-
ния вида
а = £ (/ cos ср — gsin ср), х = a cos ср + Ъ sin ср,
Ъ = 8 (/ sin ф + g cos ф), У = — a sin ф + Ъ cos ф,
2Л
<Р = V (ж, у, z), То (a, b, z) = j (3.4.9)
о
2Л
<Fy = _____г________________________________________
х 7 Т (a, b, z) J v (a cos (р -f- b sin (р, — a sin (р 4- b cos ср, z)
0 о
j(F — правая часть системы (9)).
§ 4. УСРЕДНЕНИЕ НА ОСНОВЕ НЕВОЗМУЩЕННЫХ ИНТЕГРАЛОВ
127
Пусть рассматривается более общая, чем (1), система, в ко-
торой
^=z/v(x, г/, z) + е/(х, г/, z, zz),
z/ = —()(х, z)v(x, г/, z) + eg(x, z/, z, zz), (3.4.10)
z = &h(x, y, z, u).
Предполагается, что функция Q допускает устойчивое для рас-
сматриваемых значений z положение равновесия x = x*(z), ко-
торое, не ограничивая общности, можно считать нулевым,
x*(z) = 0, $'(0, z)>0. Тогда в некоторой окрестности начала
координат x = z/ = 0, z = const невозмущенная система (10) ин-
тегрируется и имеет колебательное решение x = xQ(c, z, ф), у —
= z/0(c, ^>), определяемое соотношениями
Чгу2, + П (х, z) = с = const > 0, z = const,
П (я, z) = [ Q (х, z) dx, П > 0, х Ф 0,
о
I/= 2/м(я, с, z)= ±V2|c — П(я, z)]1/2, z/2^2c,
х^. х2, xlt2 (с, z) = arg (с ~ П (х, z)), (3.4.11)’
х
X
t + Т = J У1'2 (х, С, z) V-1 (х, J/l,2»z) dx=Q(x, с, z),
о
*“7^b(‘ + T)-5^b>0<w)’
Z,(e, z)- »-(!/’+ОТ-1'1*-
у2/2+П=С
X2
= J | У Г1 (v-1 (x, Vi, z) + v-1 (x, y2, z)) dx.
xi
На основе порождающего решения, задаваемого набором ин-
тегралов (11), усреднение возмущающей функции F в уравне-
ниях для с и z проводится по схеме
го
<F> = 4- f Pdt =
0 о
x2(c,z)
_ 1 С F ( 1 4- 1
— z) J c,!z) I\v (•r> Vr z) v (x’ у2' z)
xj(c,z)
Аналогично обобщается схема усреднения по порождающе-
му колебательному движению х = х0(с, z, г|?), у = уо(с, z, x|?),.
dx, (3.4.12)’
128
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
определяемому соотношениями (е = 0)
х = G(z/, z)v(x, г/, z), y = —Q{x, z)v(x, z/, z),
У
Г (z/, z) + П (ж, z) = с > 0, Г (у, z) = J G (x, z) dx,
0
T0(c, z)= j v"1 (G2 + Q^'-ds, (3.4.13)
Г+П=с
Tp
<F> = A- J F dt= ф Fv"1 (G2 + QX^ds.
° 0 0 Г4-П-С
Для проведения интегрирования в выражениях 70, (F) нуж-
но осуществить параметризацию семейства замкнутых кривых
-x(s, с, z), y(s, с, z)- Г (г/, z)+II(x, z) = c, где с, z — параметры
семейства.
Аналогично (13) проводится усреднение в случае, когда по-
рождающее движение задается уравнениями общего вида, до-
пускающими устойчивое состояние равновесия x = z/ = O:
x = G(x, г/, z), z/ = (?(x, г/, z), z = const;
(3.4.14)
G (x, 0, z) = (?(0, z/, z) = 0; dG/dy > 0, dQ/dx > 0.
Считается, что в некоторой окрестности точки х = у = 0 суще-
ствует и известен первый интеграл Е(х, z/, z) = c>0, где функ-
ция Е имеет локальный минимум. Тогда согласно (13)
То (с, z) = (f (G2 + Q2)~l/2ds,
Е=с
т0 (3.4.15)
<F> = A- j F dt = F (G2 + Q^ds.
В выражениях (15), как и выше, нужно провести парамет-
ризацию замкнутого семейства кривых Е(х, у, z) = c, по кото-
рым проводится интегрирование: x=x(s, с, z), z/ = z/(s, с, z).
Пусть рассматривается система с переменными параметрами
вида
х = Х(х, z)+e/(x, z, zz), x<^Dx,
. / n (3.4.16)
z = е/цх, z, zz), z Dz.
В системе (16) x — вектор произвольной размерности п 1, для
которого порождающее движение представимо в виде
X=Z0(cp, С, Z), С=(С1? . . ., Сп-1),
(3.4.17)
ф = Ф(ф, С, z) , |ф| < оо?
§ 4. УСРЕДНЕНИЕ НА ОСНОВЕ НЕВОЗМУЩЕННЫХ ИНТЕГРАЛОВ
12)
где х0, Ф — 2л-периодические функции скалярной угловой пере-
менной ср (0 < Ф1 Ф Ф2 < °°). Усреднение возмущающей
функции F проводится аналогично (3), (9):
2 Л 2 Л
TQ (с, z) = f Ф-1 (ср, с, z) dcp, <F> = -5- ^Ф"Мср. (3.4.18)
о 0 о
Развитые выше схемы усреднения переносятся на системы
(10), (13), (14), (16), допускающие вращательно-колебатель-
ные движения.
Если c = (ci, ..., С/), 1<п — 1, а движение порождающей си-
стемы происходит в окрестности асимптотически устойчивого ло-
кального интегрального многообразия, то усреднение проводится
согласно схеме (18), в которой переменные, отвечающие этому
многообразию, полагаются равными нулю (§ 5 гл. 2 п § 5 гл. 4).
Случай, когда ср — вектор, весьма сложен для исследования и
требует приведения к стандартному виду [45, 47, 58, 59, 70, 82,
162, 219].
3. Усреднение вращательно-колебательных систем. Рассмат-
ривается система вида (10), в которой Q — 2л-периодическая
функция х, имеющая нулевое среднее. Тогда, как следует из
выражения (И), для первого интеграла при с>таххП(^г, z) пе-
ременная у сохраняет знак, определяемый начальным условием.
Пусть 0 < у{ у у2 < о°, тогда искомые выражения и схема
усреднения имеют вид
1 /2г/2 + П (х, z) = с > 0, у = V2 (с - П)1/2 > 0,
. . ✓ . \ 2л fл , ди \
X = ф + V (1|), с, г), у= — ^1 + —j,
X
, + + = (3.4.19)
2Л
То (с’ z) = J У~1 (х> с, z) V~1 (х, У с, ZY z) dx,
о
2Л
<F> = Fdt = Fy-'y-'dx.
0 о 0 о
Для применения схемы усреднения по х в вращательно-ко-
лебательной системе необходимо, чтобы функции F, v были
2л-периодпческпми по х. Вращающаяся переменная ЛчД'Ф, с, z)
имеет смысл угловой переменной ср в схеме усреднения (17),
(18). Если первый интеграл невозмущенной вращательно-коле-
бательной системы (14) имеет общий вид
Е(х, у, z) = c>0, Е(х + 2л, г/, z)=E(x, у, z), (3.4.20)
9 Л. Д. Акуленко
130
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
а у(х, с, z)=arg(c — Е) — строго знакоопределепиая (например,
положительная) функция для х (Ы<°°), то усреднение при-
водит к интегрированию по переменной х:
2Л
TQ (с, z) = G-1 (х, у (х, с, z), z) dx,
о
2Л
<F> = f FG~l (х, у (х, с, z), z) dx, (3.4.21)
0 о
с е 1а» Ci; 2 > 0; z Л.
В частности, пусть первый интеграл (20) системы вида (14)
равен (т — инерционная характеристика)
1/2m(rr, z)y2 + П(х, z) — с > 0, |х| < <», (3.4.22)
0<т1^т(т, z)^m2< °°, у [yh у2], z^Dz.
Тогда при условии 2л-периодичпости т, П по х схема усред-
нения (21) упрощается с учетом известного выражения для у
у~у(х^ с, z) = V2m~l/2 (х, z)[c — П(х, z)]1/2.
Наиболее общая схема усреднения (17), (18) оказывается
справедливой и для вращательно-колебательных одночастотных
систем.
Следует отметить, что построение схем усреднения более вы-
сокого приближения по степеням е приводит к весьма громозд-
ким труднообозрпмым выражениям [69, 70, 148].
§ 5. Управление нелинейным осциллятором
с регулируемым положением равновесия
1. Нелинейная система с упругим элементом. В качестве при-
мера рассматривается существенно нелинейная модель механи-
ческой колебательной системы, представленной на рис. 3.4.
В пренебрежении переходными процессами предполагается, что
управляемая по скорости v точка Р и точка G массой т могут
скользить по параллельным направляющим, расстояние между
которыми d. Управляющее воздействие передается посредством
линейной невесомой пружины с коэффициентом жесткости с и
длиной Zo в нерастянутом состоянии. Потенциальная энергия
пружины П оказывается зависящей лишь от разности (у — х),
где у и х — абсолютные координаты точек G и Р:
П = П (у - х) = 72с (Z - Zo)2, I2 = d2 + (у - х)2. (3.5.1)
При d^l^ положение равновесия у = х устойчиво, а при d <
< Zo неустойчиво; но тогда система имеет еще два устойчивых
§ 5. УПРАВЛЕНИЕ НЕЛИНЕЙНЫМ ОСЦИЛЛЯТОРОМ
131
положения равновесия ^i,2 == я ± Go “ ^2)1/2- Если d = 0, то си-
стема «линейна» и описывается уравнением типа (5.4.2). Если
же d = Ц, то главным в функции П (1) является член О((у —
— х)4), и система существенно нелинейна. Ее порождающее ре-
шение описывается эллиптическими функциями [69]. Уравнения
движения системы в форме Лагранжа имеют вид
у + v2(l — ^(У — х) =0, X = V, Р2], v2 = 4-
(3.5.2)
Введением безразмерных переменных и параметров в пред-
положении малости v получается система вида (1.15), причем
в однородном поле сил система
сохраняет этот вид. Система
(2) является обобщением мо-________________
дели, исследованной в [69] dV
(для неуправляемой модели *7
х = const).
2. Постановка задач опти-
мального управления. Для не- ^7
линейной колебательной си- ^7
сте м ы
y + F(y-x) = 0, —------------------LZT >
*/(0) = //°, y(O) = j/°, (3.5.3).
x = eu, rr(O) = ;zr0, и^[щ, u2] Рис. 3.4
предполагается, что у = х — точка изолированного минимума по-
тенциальной энергии, т. е. F(0) = 0, a zF(z)>0 при z 0 в не-
которой окрестности точки z = 0. В предположении, что и = 0
e[wi, п2], ставятся следующие задачи оптимального управления
для системы (3).
А. Наискорейшее гашение относительных колебаний. Конеч-
ные условия и функционал имеют вид
у{Т) = х(Т), у(Т) = 0, T^min, ue[ult u2], (3.5.4)
и v
При t > Т для п = 0 система (3) остается в состоянии покоя
(4). Конечные значения переменных у и х при этом не зада-
ются.
Б. Разгон системы как целого. Конечные условия и функцио-
нал имеют вид
У(Т) = ^(Т), ^(Т) = 8и°;
(3.5.5)
7-^min, и е [п17 и2].
132
ГЛ. 3. 31ЕТ0Д УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
При t> Т для и = и° система перемещается со скоростью ez/° как
целое без относительных колебаний. Задачу (4) можно считать
частным случаем постановки (5) при и° = 0.
В. Перемещение в заданную точку. Требуется удовлетворить
следующим условиям в конце процесса управления:
у(Т) = х{Т) = р(Т) = 0; min, и2]. (3.5.6)
и
Здесь х*— заданная величина; для I > Т при и = 0 система
остается в состоянии (6).
Постановки задач оптимального управления А, Б, В имеют
определенный прикладной аспект для рассматриваемого класса
механических колебательных систем с управляемым по скорости
перемещения положением равновесия (3), см. также гл. 5.
3. Приведение к стандартному виду с вращающейся фазой.
При 8 = 0 система (3) допускает полное интегрирование (см.
(1.12)). Пусть z(h, \|?) —общее решение уравнения z + F(z) = 0.
Тогда при помощи замены (у, у, x)-+(h, ф, х)
у = х + z(fc, -ф), у = (o(fc)dz/dip, х = х (3.5.7)
получается стандартная система вида (1.13). Здесь h — интеграл
«энергии относительных колебаний», —фаза, со — частота, см.
(1.12), z— 2л-периодическая функция г|э:
Z
/г- = |.й2(/г)т2 + п(г), ® = П(з) = ^F(s)ds.
\ J 0 0
(3.5.8)
Действительно, дифференцированием замены (7) в силу (3) по-
лучается система стандартного вида с вращающейся фазой г|? с
соответствующими (4) — (6) конечными условиями А, Б и В:
h' = 8-^-^р- и, х = h (0) = h°, х(Р) = х°,
(2 \
® и' (0) = (3.5.9)
, Idz \2 dz d2z dz d2z_________1
W = 05 \ W + ° Й ~ co (II) '
А, Б: fe(D = 0; B: fe(r)=0, x(T) = x*.
Здесь W — определитель Вронского для соответствующей систе-
мы в вариациях; свойство W — W(h) следует из консерватив-
ности исходной системы, а равенство JV=l/<o устанавливается
дифференцированием по h первого соотношения (8).
4. Процедура асимптотического решения. Через р, q, г обо-
значаются переменные, сопряженные h (или а(й)), х соот-
§ 5. УПРАВЛЕНИЕ НЕЛИНЕЙНЫМ ОСЦИЛЛЯТОРОМ
133
ветственпо. Так как х — циклическая переменная, то г = const.
Более того, в задачах А и Б (9) величина г = 0. Функция Га-
мильтона и сопряженная система линейны по |г|, что позволяет
нормировать эту постоянную следующим образом:
А, Б: г = 0; В: г^{-1, 0, 1). (3.5.10)
В первом приближении оптимальное управление определяется
из условия типа (2.3), в котором полагается # = 0:
и* = 72(zzi + и2)+ 72(н2 — ^1) sign (г — pF). (3.5.11)
За усредненными переменными сохраняются прежние обозначе-
ния и полагается, как обычно, <^>==е^. В результате для ус-
редненного гамильтониана К в первом приближении получается
выражение
== V2(tti + u2)r + 72(н2 — щ) <\г — рГ\У + = const. (3.5.12)
Соответствующая краевая задача первого приближения для
постановок А, Б, В описывается соответствующими уравнениями
и условиями:
h' = —72(u2 — Ui) <Fsign(r — pF) >, fe(0) = h°, h(Q) = 0,
P = -72(u2 - u{) (d/dh) <\r- pF\y - 0co' (0 = e7), (3.5.13)
x ’ = 72(щ + u2) + V2(u2 — ^t)<sign(r —pF)>, x(0) = xQ
(В: x(Q)=x*).
Третье уравнение (13) сводится к квадратуре после интегриро-
вания первых двух.
Пусть рассматривается решение задачи (13) для постановок
А и Б. Тогда, полагая г = 0 согласно (10), можно определить,
что скорость убывания h максимальна, если signp = —1. При
Р = 0 из второго уравнения (13) для р следует, что его нетри-
виальное решение знакопостоянно при условии ограниченности
\dF/dh\. Итак, полагая г ={3=0 и signp = —1, можно получить
оптимальное решение. Конечное условие (13) для h будет удов-
летворено, т. е. значение 0 будет ограниченным, если при ма-
лых h значение <|F|> = O(fea), где a < 1.
В результате получается искомое решение первого прибли-
жения
Л° 2Л 2Л
h 0 0
х(т)= х° + V2 (zzjl + Н2)т, 0 = т |л==о. (3.5.14)
Если ограничение на и симметрично (и2 = — гл), то, согласно
(14), в первом приближении не происходит «дрейфа» поло-
жения равновесия: x(x)=xQ. Из свойства функции F в (3)
134
ГЛ. 3. МЕТОД УСРЕДНЕНИЯ В НЕЛИНЕЙНЫХ ЗАДАЧАХ
sign F(z) = sign z для и* следует
и* = 1/2(zz1 + и2) + V2(w2 — mJ sign (у — х). (3.5.15)
Физический смысл управления и* (15) ясен: оно сводится
к уменьшению рассогласования \у — х| перемещением точки
подвеса.
Следует отметить, что усреднение по в (14) можно про-
вести на основе интегралов невозмущенного движения. Если
функция П(г) имеет обычный вид, представленный на рис. 3.5,
то (см. § 4)
22(h)
т? (ij\ _ 9 ® W С ____I F \dz______
2п J у^_П(2)р/2
= (2 /2/л) hll2(d (h) = 4 ]^21г1,2/Т0 (h). (3.5.16)
Здесь z12(fe) —точки возврата, определяемые уравнением
П(г) = Л, и учтено соотношение
F = dU/dz. В результате выра-
жения для т, 0 (14) сводят-
ся к интегрированию функции
h~l/2T0(h) в указанных пределах.
Условие F0(h)= O(ha), а<1,
сводится к оценке T0(h)= O(ha),
о >-1/2.
5. Примеры. На основе (14)
строится решение линейной зада-
чи F(z) = z, имеющей период
Зп0 = 2л. Зависимость х(т) имеет
вид (14), а величины 0, а(т) равны
е = а° = (2/г°)1/2, а=(27г)1/2 = а0 (1 —(3.5.17)
Пусть имеет место случай произвольной степенной нелиней-
ности
П(г) = ц|г|т, ц, у = const > 0. (3.5.18)
Тогда для точек возврата z = zl2(h) и периода колебаний TQ(h)
получаются выражения (Г — гамма-функция Эйлера [236])
z2 (h) = -Zl (h) = (/г/р)1/т, h > 0, (3.5.19)
i
7n (/г) = 2 V%-1/v/ix J (1 - аЛ)-172 dx =
0
= (2 /2л/у) Г (l/у) Г-1 (1 + x) p“1Zv/ix, To ~ h*, x=l/y—1/2>—1/2.
Подставляя выражения (19) в (16) и (14), можно получить
§ 5. УПРАВЛЕНИЕ НЕЛИНЕЙНЫМ ОСЦИЛЛЯТОРОМ
135
искомые зависимости
‘« - '° - Я' е- .-Д'п.Т) (тГ- (3-5'20)
В случае линейной системы при у = 2, ц = 1/2, h = а2/2 вы-
ражения (19), (20) переходят в (17).
Период То колебаний в окрестности положения равновесия
у = х нелинейной системы с упругим элементом (1), (2) в без-
размерных переменных (vt -> Z, z/d-+z, равен
z*
To (h, lQ) = 2 f [2h - ((1 + ^)V2 _ Z0)2]-l/2 dz,
—Z*
z* = z* (h, l0) =,[ (Zo + V2 h)2 - 1]1/2 > 0.
При малой амплитуде относительных колебаний z* < 1 величина
То вычисляется приближенно по степеням z*.
6. Перемещение нелинейной системы. Решение краевой за-
дачи В (13) сводится к интегрированию уравнений для fe(z),
р(т) с известным интегралом К = const, квадратуре для опре-
деления х(х) и вычислению неизвестных параметров 0, г, [}.
Для их определения имеется краевое условие (13) на х, соот-
ношения (9) и условие минимальности 0(jJ) (см. § 3). Усред-
нение и решение краевой задачи в общем случае можно прове-
сти численно. Краевую задачу (9) для линейной системы уда-
ется проинтегрировать аналитически и построить графически
зависимости сопряженных переменных от параметров и состоя-
ния движения, т. е. найти приближенный синтез оптимального
быстродействия (см. § 4 гл. 5).
ГЛАВА 4
ОБОСНОВАНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ
РАЗДЕЛЕНИЯ ДВИЖЕНИЙ
В СУЩЕСТВЕННО НЕЛИНЕЙНЫХ
УПРАВЛЯЕМЫХ СИСТЕМАХ
Развиваются методы канонического разделения движений и
построения высших приближений решения краевой задачи прин-
ципа максимума. Рассматриваются обобщения асимптотических
процедур: двухпараметрическая схема разделения, усреднение в
многочастотных системах и в системах более общего вида, ус-
реднение движений в окрестности сепаратрисы и др.
§ 1. Приведение к стандартному виду
и каноническое усреднение
1. Уменьшение размерности системы уравнений принципа
максимума и уравнения Уиттекера. Ставится задача построения
уравнений решения (3.2.4) с произвольной наперед заданной
степенью точности по е. В отличие от случая квазилинейной
системы (1.2.8) или (1.3.3) каноническая система (3.2.4) не
имеет стандартного вида, а приведенная к стандартной форме
система (2n4- 1) уравнений (3.2.9) заведомо не гамильтонова.
Оказывается возможным привести эту систему к канонической
форме, что позволит применить эффективную методику канони-
ческого усреднения (см. § 1 гл. 2).
Как и в § 2 гл. 3, используется свойство постоянства //*:
//* = со(я)(/ + е(р • /*(«, гр, р, (/))+ zqF* (а, г|\ р. q} = &h. (4.1.1)
Здесь /*, F* — достаточно гладкие функции медленных перемен-
ных а, р, q. Постоянная h определяется условиями трансверсаль-
ности (3.2.11) при Т фиксированном и условием А = О при Т
свободном. Соотношение (1) рассматривается как уравнение от-
носительно q, разрешимое точно пли с достаточной степенью
§ 1. КАНОНИЧЕСКОЕ УСРЕДНЕНИЕ
137
точности по е:
q = е(? (/г, а, гр, р, е) =
= i [Л - (р-/о‘)] {1 - (Р-/*)о + p;j) + е2 • • • (4.1.2)
После подстановки выражения (2) в (3.2.4) для «, гр, р полу-
чаются уравнения
а = ej* (a, гр, р, £(?), гр = со (а) + &F* (а, гр, р, е(?),
Р = + ^*1^’ (4Л-3)
Начальные и конечные условия для а, гр из (3.2.4) имеют вид
а (£0) - а\ гр (£о) = Ф°, М (а)\т = 0. (4.1.4)
Условия трансверсальности в случае фиксированного момента Т
окончания процесса управления после построения решения си-
стемы (3) как функции t и h задаются соотношениями
p(7') = ^[(A.M)-g]|r, Q(h, а, гр, р, е) |Г = 0. (4.1.5)
Последнее уравнение (5), определяющее неизвестный параметр
/г, в силу (1), (3.2.4) можно представить по-другому:
(р-/о (а, Ф, ?)) |г = h. (4.1.6)
При нефиксированном значении момента Т краевая задача прин-
ципа максимума сохраняет вид (2) —(6), однако во всех выра-
жениях следует положить h = 0. Неизвестный параметр 0 =
= еГ определяется как корень второго уравнения (5) или урав-
нения (6) при h = 0.
Таким образом, требуется найти множество решений краевой
задачи, которое, как установлено при некоторых дополнительных
общих условиях, определяется множеством значений корней {hv}
пли {0J, а затем определить оптимальное значение корпя, ре-
шая задачу на минимум (см. (3.2.13)):
Jу Ш1Щ Jу = J (^v? v'=== J (0-v, k)* (4»1.7)
V
Для упрощения построения приближенного решения при по-
мощи метода усреднения в системе (3) делением на гр вводится
в качестве независимой переменной фаза гр, гр <= [гр°, грт] (грт ~
~ е""1), что допустимо при достаточно малом е > 0, так как
о) > (1)0 > 0. В результате получается стандартная система [8,
138
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
58, 69] (с соответствующими краевыми условиями)
da 8/* (а, гр, р, 80
dty со (а) &F (а, хр, р, 80 ’
' [С + i <“ +
a(i|>°)=a°, М(а)|Фг = 0, (4.1.8)
= g%, С1фг = о.
Краевые условия (8) при этом должны быть дополнены следу-
ющими соотношениями:
Ф
грт = я|> |т, t - t0 = J |9=gQ d(f. (4.1.9)
ф°
Итак, исходная гамильтонова система (3.2.4) приведена к
стандартной форме (8). Преобразования состояли в исключении
при помощи интеграла (1), согласно (2), переменной q и пере-
ходе к новому аргументу хр — фазовой переменной, сопряжен-
ной q. Известно [46, 76, 140], что при такой замене получается
каноническая система (уравнения Уиттекера) с функцией Га-
мильтона, равной — &Q (см. (2)):
Q = Q(k, а, хр, р, е), е^[0, 80].
Здесь Q — гладкая функция аргументов а, р и параметров Л,
8, 2л-периодическая по хр. К системе (10) применяется схема
канонической замены переменных, более простая, чем в § 1 гл. 2.
2. Построение канонической усредненной системы и ее интег-
рирование. К уравнениям (10) применима методика канониче-
ского усреднения по аргументу гр, которая заключается в пре-
образовании
£ = а + 8 За/Зц, р = ц + 8 до/да\ (4.1.11)
(а, р) (%, ц); S = (а • ц) + еа(Л, а, гр, ц, е).
Требуется, чтобы функция а была 2л-периодической по гр, а но-
вый (усредненный) гамильтониан &R не содержал гр, т. е.
= 4т = —7? = 7?(/гД, т], е). (4.1.12)
(Пр 5ц’ tfxp 5g ’ v ” 7 v 7
Система (12), очевидно, имеет интеграл
7?(Л, г), 8)=—^ = const. (4.1.13)
Это отвечает постоянству среднего значения q (§ 1 гл. 2 и § 2,
3 гл. 3). Неизвестные функции а и R определимы с заданной
степенью точности по 8, если функция Q достаточно гладка по
л, р. Как и в § 1 гл. 2, выражения для a, R строятся в виде
§ 1. КАНОНИЧЕСКОЕ УСРЕДНЕНИЕ
139
разложений (2.1.5) [И, 229]
о(Л, a. ф, ц, е) = 0о(^, а, ф, ц)+ ещ + ... + e*oft + ...,
(4.1.14)
R (h, g, rj, e) = Ro (Л, g, rj) + e7?t + ... + shRh + ...
Функции a, R и Q связаны нелинейным дифференциальным
уравнением в частных производных [46, 76]
— Q[h, а. ф, г] + е 8^ = R [h, а + е ц, 8 1 (4.1.15)
дф v 1 1 да* J У ’ д?]’ ” ) х 7
В результате подстановки представлений (14) в (15) получает-
ся зацепляющаяся последовательность соотношений для аг, Ri
(/>0):
dGi/dty — Qi(h, а, ф, г]) = 7?г(й, а, ц). (4.1.16)
Здесь функции Qi на каждом шаге процедуры известны: они
определяются при помощи Q, ее производных и функций а0,
7?0, ..., Ог-!, вычисленных на предыдущих шагах. В ча-
стности, для I = 0, 1 справедливы выражения
Qo = Q (h, a, ip, n, 0), Q1 = (g)o +
(4.1.17)
На основе требования периодичности а по ф из (16) следует
(h, n) = — <<2i (h, 1,ip, Т])> = - <?i0 (h, %, q), ! 18)
Qi (h, a, ip, q) = j [(2, (h, a, ip, q) — <?i0 (h, a, q)] dip.
Нужно отметить, что функции аг, как и в (2.1.8), определя-
ются неоднозначно, с точностью до произвольных функций от
а, ц, h. Неоднозначность исчезает при возвращении к исходным
переменным а, р согласно формулам замены (11).
Пусть коэффициенты 7?0, • • •, Rk разложения (14) вычис-
лены согласно (17), (18). Тогда система (12) (& + 1)-го прибли-
жения получается отбрасыванием членов О(ей+2), что приведет,
вообще говоря, к погрешности О(еа+1) в определении ц для
ф — ф° ~ 8-1. После введения медленной фазы 0 = еф система
(А’+1)-го приближения запишется в виде
k k
S = S — 2^. («лэ)
Ri = Ri(h, ц), еф0 = 90 C 9 9T = 8фт, 9о,т ~ 1.
Общее решение системы (19) на интервале 9е[9л, 9Т], 9о.т ~ 1
строится с погрешностью О(еЛ+1) для некоторой области значе-
ний постоянных интегрирования
£(9о)==<4, П(9г)=ст1; c^D^c^D^. (4.1.20)
140
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
Вычисления проводятся па основе решения системы (19)
первого приближения, т. е. при к = 0:
ft _ g7?o ? = ,t. = _ Э7?о „ m \ = с .
— ’ * и° Ci' dQ ' 11 Сг”
(4.1.21)
В, n) = -«2o> = -®-‘(B)P*-(n-MB, п))]-
Области задания параметров Q, в (20) определяются
решением краевой задачи первого приближения и являются вы-
пуклыми окрестностями этих значений, которые зависят от не-
определенных пока параметров h и 0т = 81|)т~1. Далее общее
решение задачи (21) считается известным:
В = Во (0, С„), Т] = По (0, СЬ с„),
0е [00, 0т], Ci^Di, C^D,. (U’ '
Здесь зависимость от других параметров (90, 9Т, h) для сокра-
щения записи не указывается.
Приближенное решение задачи (19), (20) строится в виде
k k
B(ft) = Во + S giBi, Т)(Л) = По + S (4.1.23)
2=1 2 = 1
Неизвестные функции гр (i = 1, . . ., к) находятся путем
последовательного решения краевых задач для линейных неод-
нородных уравнений с нулевыми граничными условиями:
§=+ (4?)+^(0, (0о)=°>
“° V’KS/ \ 5t] / (4.1.24)
(2 \ / 2 \
) ^ — (зрн / 0’ + ci)’ 11i =
Производные от функции 7?0 берутся па порождающем решении
(22). Функции vf, р? определяются последовательно: на каж-
дом г-м шаге они вычисляются на основе 7?0, ..., Ri—± и най-
денных на предыдущих шагах коэффициентов щ, ..gf_i,
Цг-i, например:
р|=№/^), р?= -(dR./dl), 1 = н = По- (4.1.25)
Общее решение линейной неоднородной системы строится ме-
тодом вариации постоянных интегрирования при помощи общего
решения соответствующей однородной системы. Аналогично § 2
гл. 2 фундаментальная матрица X размерности (2пХ2п) полу-
чается дифференцированием (£0, Цо) по параметрам q, сп. Учет
§ 2. ПОСТРОЕНИЕ ВЫСШИХ ПРИБЛИЖЕНИЙ
141
%
граничных условий (24) приводит к искомым выражениям:
/Е \ / b\ \ г , (
i^\=x (0)[] + х (0) j х-1 (S) r?(s)j ds^
(
^X(0) fcn
\ *
Х(0) =
дъ>10с1
д\!дс\
и>| (0) \
(4Л'26>
0 \
\ д\!дсх\ ’ [bi ) 1 — м??(ет) /
Здесь указана зависимость только от аргумента 9; функции wf,
iVi определены согласно тождеству в (26). В результате фор-
мулы (23) — (26) дают искомое общее решение (& + 1)-го при-
ближения краевой задачи (19), (20) для c^D^.
§ 2. Построение высших приближений
решения краевой задачи
принципа максимума и задачи оптимального управления
1. Приближенное вычисление исходных переменных и реше-
ние краевой задачи принципа максимума. Решение (& + 1)-го
приближения исходной стандартной системы (1.10) строится в
виде разложений, аналогичных (1.23):
k k
a(k) = £о + 2 еЧ, Pm = По + 2 eiPi« (4.2.1)
t=l 2=1
Здесь g0, Ло — известные функции от 9, 90, 9Т, сц и h; члены
O(eft+1) не учитываются. Неизвестные коэффициенты разложе-
ния a,, pi, зависящие от указанных параметров, а также 2л-пе-
риодически от х|), находятся обычным образом в результате
подстановки (1.23), (1) в (1.11) с учетом выражений (1.14),
(1.17), (1.18) для ог; в частности
«1 = gt - (дОо/дц), Pi = Ц1 + (до0/да). (4.2.2)
Круглые скобки означают, что производные берутся при а = g0,
г] = т]0. Без потери точности в функции ог (/ = 9, 1, ..., к— 1)
подставляются приближения для g, ц более низкого порядка
(к— i). Учет Gh не приводит к уточнению а, р и поэтому не
должен вычисляться в (1.14), (1.18) (§ 2 гл. 2). Для общего
решения краевой задачи (8), (19) получаются представления
«(М = 8)’ aW L° == L°;
(4.2.3)
P(k) = Но + еР№) °, е)> Рт + гРм 1^.
142
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
Здесь Л(Л), P(k) 2л-периодичпы по хр; зависимость от параметров
0О, 0т и h не указана для сокращения записи. Теперь для ре-
шения краевой задачи, т. е. определения неизвестных сп и
других параметров (0Т, x|)r, h или 0) построенные функции a(hu
p(h) (3) подставляются в соотношения (1.9) и используются гра-
ничные условия (1.8). Получаются соотношения
+ 8А&) Iф° = а°, М (£0 + 8/l(ft)) |фг = 0,
|фг = [(X-M(fe)) — g(k)] |фг, Q(k) |Фг = 0, (4.2.4)
Оу
© — То = f [<о (a(ft)) + eF(h)]-idO.
%
Предполагается, что при фиксированном значении h (или 0
при /г = 0) краевые условия (4) (без предпоследнего), исполь-
зуемого для определения h или 0 в первом приближении по е,
допускают простой вещественный корень
4 = 0°, сп = с°, 0Г = 0°, UV, (4.2.5)
обладающий свойством изолированности для рассматриваемых
значений a°^Da, h^h (или 0^7©), т. е. соответствующий оп-
ределитель матрицы Якоби (2п + 1+ 1)-го порядка отличен от
нуля. Конечно, Х°, в (5) зависят от h или 0. Прибли-
женное решение указанных уравнений (4) относительно cv„
0Т (или x|)T) как функций h (или 0) и других известных пара-
метров задачи строится асимптотическими разложениями по сте-
пеням е. При этом следует иметь в виду, что фаза определя-
ется с большей на порядок погрешностью по е. Как следует
из (4), можно вначале из первых трех векторных уравнений
определить q, сл и X как функции 0Т (периодические по =
= 0т£-1) и параметра h (или 0), а затем из последнего уравне-
ния (4) и величину 0Т(М (или 0Т(0)) с погрешностью O(eft+1).
Действительно, имеют место представления
k k k
с$ = Cio + S cn = cno + 5 &сщ, x = Xo + 2 e^i- (4.2.6)
2=1 2=1 2=1
Здесь c^0 = c| = a° — известная постоянная, которая подставля-
ется затем в (1 + п) уравнений для определения сп0, Хо:
М(|о)|вг=0, Cno= ^[(VM(U)-g(U]|er. (4.2.7)
Предполагается далее, что корень сп0, Хо является простым
в рассматриваемой области изменения параметров. Тогда коэф-
фициенты Сы, сЛ1-, X, (i = 1, . .., к) определяются из линейных
уравнений однозначно как функции 0Т, h (или 0) (периодиче-
§ 2. ПОСТРОЕНИЕ ВЫСШИХ ПРИБЛИЖЕНИЙ
143
ские по грт) и других известных параметров задачи. При этом
коэффициенты определяются на каждом f-м шаге независимо
от сПг, X» и подставляются в уравнения для определения послед-
них. Как оказывается, вследствие выбора Of, в виде (1.18),
(1.24), (1.26), коэффициенты с^=0. Линейные алгебраические
уравнения для определения X, с неособой матрицей — мат-
рицей Якоби. — имеют известную неоднородность. В частности,
коэффициенты cSi, cnl, Xi определяются из уравнений
tol W1] ) 1|)° ’ \ да / дс^ nl
= 0,
0 у
(4.2.8)
|z - £5 [(Хо.мо) - g0] |ег1 еп1 - А (Х1.М0) |0Г = - Q)
В результате для сц получаются выражения (А:+1)-го
приближения (для X — аналогичное сп):
d , Сц Ст)о 4“ С^тцЬ), X Хо +
спо, А,о: а0, 0т — 9о, fe(0);
Сп(&), л°, хр0, 0о, грт, 9т, Л(0), с.
(4.2.9)
(4.2.10)
Зависимость от хр0, грт в (10) периодическая. После подстановки
(9), (10) в (3) и отбрасывания членов O(eft+1) получаются ре-
шения для а, р (Л + 1)-го приближения в виде (|Li = fe, 0):
«(fe) = ^0(0 — 00, 0т —9о, а0, ц)+еА(к)(0, гр, 0О, гр°, а0, 0Т, грт, ц, е),
(4.2.11)
p{h} = Цо(0-0о, 0т-9о, ц)+еР(к)(0, гр, 00, 4*°, < 6т, грт, Ц, е).
Здесь 4(fc), Р(к} — 2л-периодические функции аргумента гр и па-
раметров гр°, грт. Таким образом, решение краевой задачи (1.8)
для а, р представляет сумму «плавных функций» |0, Ло, зави-
сящих от медленного аргумента 0 и малых 2л-периодических
по гр осцилляций с медленно изменяющейся амплитудой, поря-
док которой е. Указанные выше построения могут проводиться
другими способами, удобными для реализации на ЭЦВМ, на-
пример, при помощи рекуррентной схемы последовательных
приближений пли методом Ньютона, дающим квадратичную
сходимость по 8 [86].
Таким образом, установлено, что при выполнении изложен-
ных ранее требований гладкости системы и краевых условий
задачи (1.8), существования и изолированности решения крае-
вой задачи первого приближения, которые предполагают суще-
ствование решения вида (1.21) — (1.23) и обратной матрицы
Х-1(0) (1.26), а также невырожденности матрицы уравнений
(9) (матрицы Якоби начальных и конечных соотношений) в
некоторой области значений аргумента гр и параметров а0, гр°,
1 44
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
1|?т, h (или 0) и е
aQ^Da, г|?г], ££(0, е0], h^lh. 0е/е (4.2.12)
существует решение (fc+l)-ro приближения, представимое в
виде (И). Это решение гладким образом зависит от «°, е, h
(или 0) п дифференцируемо по хр, хрт. Оно удовлетворяет оцен-
ке (фе [хр°, хрг])
а - a(k} = O(e*+i), р - p(h} = O(Eft+1), (4.2.13)
где а, р — точное решение краевой задачи при фиксированных
значениях параметров хрг и h (или 0).
Для определения решения исходной краевой задачи (1.3) —
(1.6) пужпо найти фазу хр как функцию времени t из (1.9) и
установить связь между 9Т и 0. Подстановка функций а(й), р(к>
(И) в последнее уравнение (4) позволяет переписать его в
виде (ц = /г, 0)
0 т
е (Т - и - е - J [1 + (л е, ОТ, и,
k-1
T(ft) (ф, фг,0, 0Г, и, е)= 5 e{1Ti (ф, фт, 0, 9т, и). (4.2.14)
г=0
Здесь V (А), Тг — 2л-периодические функции хр, хрг; их зависи-
мость от других аргументов для сокращения записи не ука-
зывается. Так как в (14) отброшены члены O(e7i+I), то точность
определения 9Г при заданных h^Ih (или 0 /е) будет такой
же, как п для медленных переменных (13), а порядок погреш-
ности определения хр, хрт на единицу ниже. Далее определяется
параметр 9Т в виде асимптотического разложения
k
9Г = 9т (ц, е) = 9г (и) + S ег9п (ц, е); ц — fe, 0. (4.2.15)
г=1
Величина 9т определяется из (14) при е0:
0-то = Ц0?, и),
е°г
£ = f (О-1 (£0 (9 - 0о, 9°т - 00, «°, 4, н)) (4.2.16)
%
Предполагается, что корень 0° (р) уравнения (16) существует
и является простым, т. е. d£/<?0® =т^= 0,/г е/ft; 0е/9. Тогда коэф-
фициент От, из (15) находится, согласно (14), как корень
трансцендентного уравнения
4
Zoo'9п + Г W (фто + 0Г1, 0, ®т, м) ), фго =-7-- (4.2.17)
1 п
§ 2. ПОСТРОЕНИЕ ВЫСШИХ ПРИБЛИЖЕНИЙ
145
Здесь функция £0 в (о берется при найденном значении 0?’ и
проводится усреднение То по ф, что не уменьшает точности?
определения величины 9п. Решение 9П уравнения (17) заве-
домо существует в силу простоты корпя От и ограниченности
функции <Т0> по On. Кроме того, вследствие периодичности
<Т0> это уравнение может допускать несколько корней, как
представлено на рис. 4.1. Если выбранный корень 07) простой,
то последующие коэффициенты 9Ti (i^2) асимптотического
разложения (15) определяются однозначно из линейных урав-
нений вида
21
000
Z = 2, 3,
(4.2.18)
Здесь О,- — известные па каждом г-м шаге функции Л(0), за-
висящие от предыду-
щих приближений. В
результате находятся
величины 9Т (ц, е) и
1|?т(ц, е) с погрешно-
стью O(eft+1) и O(zk)
соответственно.
Из второго соотно-
шения (1.9) после под-
становки в (И) най-
денных 9Т, анало-
гично вышепзложенпо-
Рис. 4.1
му определяются функции Q(t, ц, е) и т|)(£, ц, е) с указанной
погрешностью:
k
0 = 0 (£, р, е) = 0(о) (т, р) + 2 (t, И, *), ф = 0/£- (4.2.19)
г=1
Функция 0(О) в (19) однозначно определяется соотношением
е(о)
т — т0 = 0)1 Uo (9 — %, 6г — 0, а0, Г1)) Р =
%
(4.2.20)
Последующие коэффициенты 9t находятся также единственным
образом в виде
0i(^, ц, е) = со(£о(9(0)(т, р)))Ф.(£, т, р, е), i = l, ..., k. (4.2.21)
Здесь Фг—известные функции Л(0), е, ограниченные при
t Е= Г], Т = 0Е-1, Е [0, £о], h еЕ /л; 0 Ц.
10 Л. Д. Акуленко
146
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
Аналогично проводятся асимптотические разложения для оп-
ределения параметра 9Т = 9Т(0, е) и медленной фазы 9 =
= 9(£, 0, е) в случае нефиксированного момента Т окончания
процесса управления.
2. Выбор оптимального решения. В результате искомые функ-
ции а, р, q = &Q построены с погрешностью 0(8*+1), а г|? — с по-
грешностью 0(8*) для Т} при h^Ih (или 0£/е). Па-
раметр h определяется из (1.5) (а 0 — из (1.6) при h = 0)
неоднозначно. Несмотря на то, что погрешность вычисления if,
фт порядка 8*, условие трансверсальности (1.5) определяет ве-
личины корней {hv} (или (1.6) —{0VJ) с достаточной степенью
точности — погрешностью 0(е*+1):
(Р(Л)7о («(fe), Pw)) |ве-1 = h', h<= {М; © е {0v}, h = 0.
(4.2.22)
Оптимальное значение параметра h (или 0) определяется
путем решения задачи на минимум (1.7), где функционал Jv
выписап с погрешностью О(е*+1):
J (h, 8) = J(k) (h, е) + (/г, 8); /(ft) (h, e) -> min, h e {hv},
(4.2.23)
J (0, 8) = J(k) (0, 8) + sWft+1 (0, 8); J(k) (0, 8) -> min, 0 e {0V}.
в
При выполнении условий лемм 3.1 и 3.2 соответственно ло-
кальный минимум функций /(А)(Л, 8) пли /(fe)(0, е) находится
в малой окрестности точек hQ и 0°, определяемых усредненным
уравнением (1.6). Размер окрестности в классе степенных оце-
нок порядка dh = (к + 1)/(2 — d), где показатель d, d^
е(0, 1], характеризует степенную оценку Jk+l по параметру
Р: Jfe+I = Если d=l, то dh = k + l и заведомо условия
(23) определяют точки минимума hv пли 0V с искомой точ-
ностью О(8*+1).
Подстановка найденных значений параметров hv или 0V в
построенные функции a(h), ф(/1_t), p(ft), q(k} определяет искомое
решение задачи оптимального управления с погрешностью
О(е*+1) по функционалу и краевым условиям и такое, что в
8/<+1-окрестности для а и 8*-окрестности для ф находится траек-
тория а, ф — решение точной краевой задачи (1.2) — (1.6). Если
выполняются условия гладкости, гарантирующие дифференци-
руемость функций Jk+i(h, е) или /А+1(0, е) по искомым пара-
метрам h пли 0, то найденные значения hv пли 0V обеспечивают
8*+1-близость по а и 8*-близость по ф. Точность приближения
оптимального управления и* в случае гладкой системы
и* - и*(М = О (ek+1), ир - upW = О (efe), (4.2.24)
а для негладких управлений близость управлений имеет место
по функционалу или другой неравномерной метрике.
§ 3. ДВУХПАРАМЕТРИЧЕСКАЯ СХЕМА УСРЕДНЕНИЯ
147
§ 3. Двухпараметрическая схема канонического усреднения
Как показывают конкретные расчеты, довольно часто све-
дение весьма простых систем вида (3.2.4) к стандартной гамиль-
тоновой форме (1.10), усреднение но хр, а затем решение ус-
редненной системы и краевой задачи и приведение к исходным
переменным связано с громоздкими трудно выполнимыми рас-
четами. Поэтому представляет интерес развиваемая ниже про-
цедура разложения по двум параметрам е и ц (ц — среднее
значение q, ц = О(е)).
Строится унивалентная каноническая замена переменных, ха-
рактеризуемая производящей функцией S (см. (2.1.3)):
5(а, гр, т), ц, е) = (а- ц)+трц + еа(а, хр, ц, ц, е), (4.3.1)
такая, чтобы новый (усредненный) гамильтониан К не зависел
от ср:
Я = со(£)ц + е/с(£, т|, р, е). (4.3.2)
Связь между исходными а, гр, р, q и усредненными ср, ц, pt
переменными задается соотношениями [76] (см. (2.1.1))
о , до .. до , да , да
^ = а + е_ ф = 1|, + е_ р = т) + е_, <7 = р + е^.
(4.3.3}
Если функции а и к построены, то из уравнений
£ = е дк/дт\, ц = —со' (£) ц — 8 дк/д^.
(4.3.4)
ц = 0, ср = со (£)+ 8 дк/др.
и второго условия (1.5) следует, что ц = О(е), так как
ц = —- а (а, гр + 2л, ц, ц, е) = о (а, гр, ц, р, е). (4.3.5)
Эти обстоятельства дают возможность разложения искомых
функций а и к по степеням 8 и р, а затем из соотношения (5)
найти параметр р как функцию 8 и других параметров задачи.
Итак, предлагается строить функции а, к в виде
о = 2 к = 2
ffij = (а, ip, T)), kij = kij (g, T|).
Неизвестные коэффициенты o,j, i, j > 0 определяются в ре-
зультате подстановки разложений (6) в уравнение типа (2.1.2)
10*
148
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
(dS/dt^O):
н* (а> S’’ 8) = к & и- е)>
(4.3.7)
(а, ip, Л + eg-, Н + е^, е) +
. дс \
а + еа?Л
7 [ , до \
р. = е.к\а + е—, т], р., е J.
Разлагая функции в (7) по степеням егц; и приравнивая соот-
ветствующие члены, можно получить зацепляющуюся последо-
вательность линейных дифференциальных уравнений в частных
производных; пх последовательное решение аналогично п. 1 § 1
гл. 2 или п. 2 § 1 приводит к искомым выражениям для ко-
эффициентов kih оо:
Лу & п) = <Ч- & n)> s hij0 (В, n), i, 7 = о, 1, .. •, г;
1 } (4.3.8)
o.j (а, гр, 1]) = j [hij (а, у, 1]) - hij0 (а, л)] dy + ец (а, л).
Ф»
В частности, при г, j = 0, 1,2 функции hi5 равны
Лоо («, г|5, Т]) = Л (а, ip, i], 0, 0),
h (dh da°° ' Vgoo । (dh\ 9k»o daoo
10 \dp J da \dq J dty \de / da dx] '
(4.3.9)
h <dh''' Э°10 1 (d2h\ldaoA2 ldh\daio . 1 (d2h'\(daoo\2 ,
20 \dp )' da 2 \dp* )\ da j ^\dq ) d^ + 2 \crf)\ 9i|> /
. ( 02,1 "I daoodaoo . .fZoo + p2fe Vffoo .
\dpdq) da d\|) \dpds) da \dq de) (Др
dk00 dqio 1 gXoPgoo\2 dkio 4o
2 \ de2 / da ' 2 da2 \ / da di] ’
h _ PH g(Joi । f9aoi । I d2/l dOpp /d2h \ 4o ,
11 \^P ) da \^q / дЯ5 \dp dq) да '
+ ( d2h n' g°oi 1 n" ffZoo?
\dq de) dr] 2 \ dr] J da dr] da 5ц ’
Производные функций Л, огЪ kih w в (9) берутся в точке а,
Л, 0, 0. Для построения некоторого (г+1)-го приближения
§ 4. ОТНОСИТЕЛЬНО КОРОТКИЙ ИНТЕРВАЛ ВРЕМЕНИ
149
нужно вычислить коэффициенты и подставить их в (6),
а"затем о(г)(^, Ч> Л? И? 8) —в (3) и разрешить относительно
Ч, Р, Я- Для этого нужно из первых двух уравнении найти
Ч как Функции аргументов £, ср, ц, ц и е и подставить в два
последних:
а = I + еЛ(г) (I, <р, 1], |i, е), ф = ф + eY(r) (|, ф, 1], ц, е),
р = 11 + е + а(г> + е24(г)’ ф + e4f<r)’ е>’ (4.3.10)
Я = И + e^jra(r)(£ + еЛ(г), <Р + еЧГ(г)> П, О, ₽)•
Подстановка (10) в левую часть первого соотношения (7)
приводит к выражению для К(г}:
А\г) = со (g) р + efc(r) (^, т], ц, e)+efcr+1(g, ср, ц, ц, е), (4.3.11)
где /с‘г+1 — 2л-периодическая по ср функция, порядок величины
которой по малым параметрам е’, равен г+1, т. е. / + / =
= г + 1. Так как ц = О(е), dkr+i/dq) = О(е’ц;), то из уравнения
ц = &dkr+i/dq) следует, что ц = е^ + О(ег+2) для t — £0~1/е, где
Р = const. Отбрасыванием в (11) слагаемого е/сг+1 для £, ц по-
лучается система уравнений (г + 1)-го приближения:
В' = *(>) & П, еР, е), 1]- = — о/ (£) р - -Д- к(г) (£, т), ер, е).
(4.3.12)
Таким образом, получена каноническая система 2п уравне-
ний (г+1)-го приближения (12), которая обобщает уравнения
первого приближения (3.2.17). При дифференцировании по ц
порядок малости отбрасываемого члена будет на единицу ниже.
Поэтому фаза ср определяется из уравнения
ф- = е-1а (£) + /с(г)(^, т], ер, е), (•) вв (А) (4.3.13)
с большей на порядок погрешностью О(ъг). Дальнейшие по-
строения решения краевой задачи и выбор оптимального прово-
дятся аналогично в соответствии с развитой выше в § 2 мето-
дикой.
§ 4. Исследование задачи оптимального управления
на относительно коротком интервале времени
1. Постановка задачи. Как указывалось в п. 1 § 2 гл. 3,
уравнения краевой задачи принципа максимума для существен-
но нелинейной системы (3.2.4) сходны с уравнениями многоча-
стотных нелинейных колебаний в окрестности резонансной точки,
150
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
см. [5, 47, 70, 82]. Анализ движения нелинейной резонансной
системы на асимптотически большом интервале времени t — Zo ~
~ 1/е представляет значительные трудности [46, 47, 58, 70, 82,
162]. В ряде исследований, когда имеет место весьма сложная
общая ситуация, ограничиваются интервалом времени t~ Ц ~
~ 1/Уе, на котором система совершает порядка 1/Уе колебаний,
а медленные переменные изменяются на величину О(Уе).
В аналогичной постановке можно рассмотреть задачу опти-
мального управления. Такая постановка приводит к исследованию
уравнений и краевых условий (3.2.4) на относительно ко-
ротком интервале времени [Zo, Г], Г = 0е_1/2. Как и в рас-
смотренных выше случаях, постановка должна быть непротиво-
речивой, т. е. должна приводить к управляющим функциям
порядка единицы п изменению медленных переменных а, р на ве-
личины О(е1/2). Конечное множество, задаваемое соотношением
типа (3.2.1), может иметь вид
М(а — а*) 1т = (а) |т, я, а* Da, 6 = Те,
М = (А/„ ..., Л/,), А = (Л\, ..., А,), (4.4.1)
где Л/(0) = 0, гапкЛ/'(0)= Z, точка а* принадлежит 6-окрестно-
сти начальной a0, N — гладкая функция. Считается, что вели-
чина Т ~ б^1 в задаче с фиксированным временем пли решение
задачи управления приводит к такой оценке при Т нефикси-
рованном.
Можно установить, что решение краевой задачи при выполне-
нии некоторых общих условий единственно и может быть по-
строено с произвольной степенью точности по 6, определяемой
гладкостью функций, входящих в соотношения (3.2.4). Следует
отметить, что приближенное решение системы уравнений требу-
ет привлечения асимптотических методов разделения быстрых
и медленных движений, так как прямое применение метода воз-
мущений (разложений по степеням 6) на интервале времени
t — /0 ~ б-1 приводит к затруднениям.
2. Построение решения краевой задачи с заданной степенью
точности. Пусть усредненная система (г+1)-го приближения
по е для а, р и r-го для т|? построена в виде (3.12), (3.13). Ее
решение строится па интервале времени t — £п ~ б-1 с погреш-
ностью О(ег+1) для т] и О(ег+1/2)—для ср. Как следует из
уравнений с учетом оценок отброшенных членов (О(ег+2) и
О(ег+1) соответственно), оценки для ц, ср будут справедливы-
ми, если окажется возможным определить параметр [} с точ-
ностью О(ег+1/2) из граничных условий (1) и соотношений транс-
версальности типа (3.2.4), где а, Р, Ч задаются согласно (3.10).
Это доказывается непосредственным построением общего ре-
шения системы (3.12). Действительно, введением медленного
§ 4. ОТНОСИТЕЛЬНО КОРОТКИЙ ИНТЕРВАЛ ВРЕМЕНИ
151
времени s = dt, s [s0, ©], ® ~ 1, получаются уравнения
г =б-^(г)(^,б2Мг), №) = £% о(4)>
U 11 \ (Хо /
(4.4.2)
П' = ~ 60®' (В) - 6 fc(r) (В, я, 62р, 6г), 1] (з0) = п°,
решение которых строится методом возмущений [78, 158, 184]:
в = Во + 6В, + П2 + • • • + 62г+1^+, + О(е^‘),
Т] = Т)о + 6г), + 621]г + • • • + 62г+1Г)2г+1 + O(er+1).
Подстановка (3) в (2) приводит к решению в виде полиномов
1о = £°, По = и0;
дА: Г дА: ?
Si = (« ~ «о), П1 = — [® (£°) 0 + аГ] (s ~ so);
4 д2кп дк 4 д2кп Г ЗА:_1
S, -4nk4<!- ’•)’ - 4(Е">Р + 4](!“s"> <4-4-4>
1 дА: 1 д2А:п дА:
1|2 = - 4 Рю" (ВО) (s - з0)2 - 4 (S - Sor +
1 д2кп 1
+ 4-<^r^)P + d(s-So)-
Аналогично определяются последующие коэффициенты (3).
Запись искомого общего решения значительно упрощается, если
систему (2) представить в виде одного векторного уравнения и
искать его решение по степеням малой величины 6($ —$0) с не-
известными коэффициентами в виде
2г+1
Ж(г) = хо + 2 (s - s0)1 (х- = ЬХ (х), X (0) = х°). (4.4.5)
1=1
В результате подстановки х{г} получается уравнение для се.
2Г2 (s - So)1”1 = X + 22 (з - So)1 \ (4.4.6)
1=1 \ 1=1 /
Пусть коэффициенты Ci (/ = 1, 2, ..2г+1) определены и
тем самым построены искомые переменные ц с погрешностью
О(бг+1), т. е. точностью О(б2г+1) в виде полиномов порядка
(2г+1). Тогда из уравнения (3.13) определяется фаза ср с ис-
комой точностью 0(&г), т. е. погрешностью О(б2г+1). Подстанов-
ка функций |(2r+i), T](2r+i) и ф(2г) в (3.10) позволяет получить
переменные а, р с погрешностью O(er+1), фазу — с погреш-
ностью О(б2г+1) п переменную q — с необходимой точностью —
погрешностью О(б2г+3). Подставляя затем выражения (3.10) в
152
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
краевые условия (3.2.4), (1), можно получить соотношения для
определения неизвестных параметров £°, ц°, ф°, X и р при фикси-
рованном Т ~ 6-1. Если Т не фиксировано, то условия трансвер-
сальности должны быть дополнены соотношением (1.6) при h —
= 0, определяющим величину Т с погрешностью O(62r+1). Ука-
занные параметры находятся в виде разложении по степеням 6
из получающихся в результате уравнений
а° = + еЛ(г) (£«, <р°, 62р, 62) + О(62Г+2),
М (а(г) (0) - а*) = &N (а(г) (6)) + О (б2г+2),
= ср0 + е¥(Г)(В°, <р°, п°, 620, 62) + O(62r+1),
(4.4.7)
т](г) (©) + 8Р(Г) (а(г), ф(г), р(г), 62р, 62) |е =
= - 6ЗД - g(r)] |е + О (Г+г),
Р + <?(г)(«(Н, Ф(г), Р(г), 62Р, 62) |0 = О(62Г+1),
((П<г) + £Р(г))7о (а(г), ’Ч’(г)» Ч(г) + еР(г))) |е = O(6-r+1).
В частности, при 7И, N = 0 решение краевой задачи (7) пер-
вого приближения при фиксированном Т = 06"1 имеет вид
«(1) = а° + 6/0 (а0, — g' (a0)) (s — s0) + О (62),
Фа) = Ф° + 6-I(o(a°)(s —50) + 1/2<я' (а0) /0(а0, — g'(a°))(s—s0)2 + O(6),
(4.4.8)
P(i)= -- g'(a°)+ (а0) p(1) — (g'(a0)~/0(a0, — g'(a°)))j(O— s)—
— gj (a°) /о («°- — g' («’)) (0 ~ S) + ° (62),
P(D = «о-1 (a0) (g' (a°)-[/o (а0, Фа) (0, 6), - g' (a0)) -
~/o« ~g' (a°))]) + 0(6).
Подстановка выражений (8) в функцию и* (3.2.3) позво-
ляет определить оптимальное управление как в виде программы,
так и в форме синтеза (a0 -> a, sQ -> 5). При этом следует иметь
в виду особенность синтеза для t=T ($ = 0), если Т — фикси-
ровано и задано конечное многообразие М— (1). Величина
функционала J[u] (3.2.2) равна
Л1) = g(«0)+ б(g' (а°) • /0(«°, -g' (a0))) (0 - s0) +
+ 6Go(a°, -g'(a°))(0-So)+O(62). (4.4.9)
Таким образом, в рассмотренном случае задачи оптимального*
управления, приводящем к относительно короткому интервалу
времени (71 — tQ) ~ е-1/2, построение приближенного решения су-
щественно проще. В теоретическом отношении проблема не пред-
ставляется интересной. Применение развитого подхода, однако,
может оказаться приемлемым при исследовании конкретных за-
§ 4. ОТНОСИТЕЛЬНО КОРОТКИЙ ИНТЕРВАЛ ВРЕМЕНИ
153
дач оптимального управления нелинейными колебательными си-
стемами, например для построения упрощенного «квазиопти-
мального» синтеза.
Расчет при помощи развитого в гл. 3, 4 подхода конкретных
задач оптимального управления движением нелинейных колеба-
тельных и вращательных систем, имеющих механическое со-
держание, приводится в гл. 5, 6.
3. Исследование многочастотных систем методом усреднения
на относительно коротком интервале времени. Пусть хр — вектор
произвольной размерности, a q — сопряженная ему переменная.
Тогда краевая задача принципа максимума является соответству-
ющим обобщением задачи (3.2.4), (1):
а = 8/* (а, гр, р, q), a (tQ) = а0,
гр = со (а) + sF* (а, гр, р, q), гр (tQ) = гр°,
М(а(Т), б) = 0; t^[t0, Т], Т = ©б”1, б = р?/2, (4.4.10)
р = ~ [(/>7*) + (Q-F*)],
q = — eg-[(p-/*) +
Здесь, как и в (1), выполняется условие М(а\ 0)=0. Без огра-
ничения общности полагается, что функционал J[u] = g(a (Т)),
а подынтегральная функция G = 0. Следует отметить, что в об-
щем случае среднее правой части уравнения для q отлично от
нуля, т. е. нельзя проводить ее независимое усреднение по ком-
понентам фазы гр.
При помощи замены
а = а° + 6а, гр = со (сг°) (t — tQ) + гр° + ср, р = р, q = бр,
(4.4.11)
где а, ср, р, р — неизвестные переменные порядка единицы, си-
стема (10) приводится к стандартной форме:
а = б/* (со (a0) t, а, ср, р, р, б), а (t0) = 0,
ср = бсо' (а0) а 4- б2/^ (со (а°) t, а, ср, р, р, б), ср (£0) = 0,
Р = “ б^-(Р-®(а°)) + &р* (® (а°) t, а, Ф, р, р, б), (4.4.12)
Р = — б^- (?•/*) + (<о(а°) t, а, ф, р, р, б),
а(Т)+(^-) +бЛ(а(Т), б) = 0,
Р (Т) = - (g )ог + g (VM)or + 6L (а (Т), А, б), р (Л = 0.
154
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
Правая часть стандартной системы дифференциальных уравне-
ний (12) есть сложная квазипериодическая функция t с постоян-
ным частотным базисом {со(а0)}, см. [128, 141]. Дальнейший
асимптотический анализ краевой задачи (12) на интервале вре-
мени t — to ~ б-1 проводится аналогично § 5 гл. 2 [19]. Выбор
способа усреднения существенным образом зависит от арифме-
тических свойств постоянного вектора со (а0) и свойств рядов
Фурье по хр функций /*, F*. Таким образом, при выполнении
соответствующих требований гладкости решение краевой задачи
(12), а вместе с ним и решение задачи оптимального управле-
ния движением многочастотной существенно нелинейной систе-
мы может быть построено с заданной степенью точности по
б == е1/2 на относительно коротком интервале времени £ —£0~б_1,
на котором происходит малое, порядка б, изменение медленных
переменных. Изложенный подход может оказаться приемлемым в
прикладных задачах для построения квазиоптимального синтеза.
Аналогично исследуется случай задачи типа оптимального быстро-
действия (с нефиксированным моментом окончания процесса уп-
равления). При этом конечные условия должны приводить, как и
выше, к малому, порядка б = е1/2, изменению фазового состоя-
ния системы по медленным переменным.
§ 5. Замечания
1. Многочастотные системы. Исследование существенно нели-
нейных колебательных систем с многими фазами на интервале
времени £ —приводит к принципиальным трудностям в
построении общих процедур асимптотического решения задач уп-
равления. Главная из них заключается в том, что векторная, соп-
ряженная фазе переменная 7, вообще говоря, оказывается не-
малой, так как <г/> отлично от нуля. Тогда переменная р, сопря-
женная а, будет не медленной: р = O(q) = 0(1), р ~ е-1 для
t — tQ — е-1. Поскольку правые части уравнения краевой задачи не
ограничены равномерно по р, то применение асимптотических ме-
тодов разделения движений на интервале времени t— t0 ~ е-1 ока-
зывается несостоятельным. Требуется учет специфических особен-
ностей задачи управления нелинейными колебаниями («прохожде-
ние резонансов» [47, 163], «застревание на резонансах» [70, 82]
и т. п.) и проведение более тонких оценок, которые позволят при-
вести систему типа (4.10) к стандартной форме, т. е. показать,
что 7 = 0(e) для £0~е_1 (см. § 6 гл. 6). Например, в не-
которых задачах оказывается, что отношение частот постоянно;
тогда соответствующей заменой фаз система приводится к одно-
частотной. Такие ситуации возникают в задачах управления воз-
мущенными вращениями динамически симметричного твердого
тела относительно неподвижной точки, близких к регулярной пре-
цессии; отношение частот определяется главными центральными
§ 5. ЗАМЕЧАНИЯ
155
моментами инерции. Далее, если удается установить, что
р = то в двухчастотной задаче при выполнении условий
гладкости и в зависимости от характера «прохождения резонан-
са», а также при выполнении некоторых общих требований мож-
но получить неулучшаемые оценки погрешности О (Vе) или
О(Уе1п8-1) по медленным переменным [47, 163].
2. Усреднение при малых частотах и прохождение «сепарат-
рис». Большое значение для приложений имеет оценка погреш-
ности метода усреднения в задачах, приводящих к малым значе-
ниям частот, когда скорость изменения фазы ip ~ со (а) = 0(e) и
может проходить через нулевое значение. Оценка погрешности
метода усреднения существенным образом зависит от характера
особенностей.
Так в задачах, связанных с прохождением «сепаратрис» осо-
бенность является логарифмической: со ~ 1/1п|а — а -> я*.
Такие ситуации возникают при переходе маятника из состояния
колебаний во вращение и, наоборот, при переходе вращений не-
симметричного твердого тела из одной области в другую (при
которой полодии [50] охватывают оси с экстремальными значе-
ниями главных центральных моментов инерции) и в других за-
дачах (см. гл. 5, 6). В работах [47,164,165], см. также [82], уста-
новлено, что применение процедуры усреднения приводит к по-
грешности О(е1пе_1) для t — t0 — £-1 по медленной переменной а.
Оценка метода усреднения в задаче прохождения через ну-
левое значение частоты с ограниченной скоростью О(е) анало-
гична случаю прохождения через резонанс. Можно формально
ввести дополнительную фиктивную фазу, от которой не зависят
правые части системы. Тогда исходная фаза имеет смысл «рас-
стройки» в задаче о прохождении через резонанс. Если выпол-
нены аналогичные указанные выше условия гладкости и неко-
торые другие (которые в рассматриваемой одночастотной задаче
проверяются более просто, чем в двухчастотной), то в зависимо-
сти от характера прохождения нулевого значения частоты полу-
чаются оценки О(е1/2) или 0(е1/21пе~1) для t — t0 ~ е"1. Эти
оценки также неулучшаемы [47, 164].
Случаи, когда прохождение через резонанс или через пулевое
значение частоты имеет более общий характер (такие случаи для
квазилинейных колебательных систем рассмотрены, § 5, 6 гл. 2)
требуют дополнительного исследования. В прикладных задачах
оптимального управления часто оказываются выполненными ука-
занные выше условия, допускающие существенное упрощение
уравнений движения и обеспечивающие достаточно высокую точ-
ность метода усреднения.
3. Метод усреднения в управляемых системах более общего
вида. Рассматривается управляемая система вида (3.1.1) при бо-
лее общих, чем в гл. 3, предположениях относительно порождаю-
156
ГЛ. 4. ОБОСНОВАНИЕ МЕТОДОВ ДЛЯ НЕЛИНЕЙНЫХ СИСТЕМ
щей неуправляемой системы. Аналогично § 5 гл. 2 предполага-
ется, что семейство невозмущенных вращательно-колебательных
движений имеет неполную размерность: пс + щ < пу, где пс > О,
щ > 1, пу > 2 и является асимптотически устойчивым. В отли-
чие от рассмотренного квазилинейного случая предполагается, что
вектор частот со = ^)^со(а). На основе теории Ляпунова
и Флоке [150, 220] строится неособенная замена переменных
(я, 'Ф, z), где z — вектор размерности пу — (пс + 1ц) > 1.
Уравнения управляемого движения приводятся к виду
а = А (а, гр, z, и, е), a (tQ) = а0, а е Da,
гр = со (а) + Ч7 (а, гр, z, и, е), гр (Z0) = гр°, гр е (4.5.1)
z = A(a)z + Z(a, гр, z, zz, e), z(tQ)— z°, z, 0 Z)2;
A, V, Z = O(s + |z|2), ee[0, e0].
Здесь А (а)—устойчивая матрица, т. е. ее собственные значения
Х(а) имеют отрицательные вещественные части в рассматривае-
мой области изменения «медленной» переменной а. Движение
системы (1) будет происходить в 8-окрестности устойчивого ин-
тегрального многообразия z = 0 порождающей системы, т. е.
Z = о (б) при t > £0, to — f ~ In 8_1.
Далее для слабоуправляемой системы (1) на асимптотически
большом интервале времени [to, Т], Т = 08-1 ставится задача
оптимального управления по медленной переменной а:
М(а(Т), 8) = 0, ее(0,е,1
А [и] == Е) min> u^U.
и
Здесь величина Т может быть заданной заранее или определять-
ся в процессе решения задачи (1), (2). Поскольку для перемен-
ной z имеет место оценка z(£)=O(e), t^ [£0, 08-1], то ее влия-
ние на медленную переменную а будет порядка 8. Поэтому в
первом приближении по 8 можно ограничиться асимптотическим
решением задачи (2) для системы вида
а = 8^4q1} (а, гр, и), гр = со (а) + еЧ^ (а, гр, и). (4.5.3)
Функции Л^, Ч^ в (3) получаются при исследовании струк-
туры функций Л, Чт (и Z), которая имеет вид
А = еЛ(1) (а, гр, и, z, 8) + Л(2) (а, гр, z, 8),
= Л(1)(а, гр, и, 0, 0), А(2) = OQz|2)
(и аналогично для Y и Z). Следует отметить, что как и в § 5
§ 5. ЗАМЕЧАНИЯ 157
гл. 2, сопряженная z(t) переменная г(£)=О(е); поэтому влия-
ние переменных z и г на остальные фазовые и сопряженные пе-
ременные будет О (е) для t — tQ ~ е-1. Эти обстоятельства позво-
ляют проводить асимптотические разложения решения краевой
задачи принципа максимума с заданной степенью точности по е
при помощи общей схемы метода усреднения, разработанной
В. М. Волосовым [58, 69, 70]. Конструктивные построения удает-
ся провести в случае одночастотной системы (х|? — скаляр) или
при отсутствии резонансной ситуации в нужном порядке по е
метода усреднения. Построение решения высших приближений
существенным образом опирается на решение задачи первого
приближения (2), (3) (см. § 2, 3 гл. 3 и § 1, 2).
ГЛАВА 5
УПРАВЛЕНИЕ ДВИЖЕНИЯМИ
КОЛЕБАТЕЛЬНЫХ СИСТЕМ «ТИПА МАЯТНИКА»
Методами гл. 1—4 исследуются задачи оптимального управ-
ления квазилинейными и нелинейными системами маятникового
типа. В качестве управляющего воздействия выбирается ускоре-
ние или скорость точки подвеса (положения равновесия). Такие
постановки задач имеют практический смысл, например, при
управлении грузоподъемными машинами с учетом колебаний
груза, а также манипуляционных систем с учетом упругой по-
датливости исполнительных органов (см. гл. 9) и др.
§ 1. Пространственные колебания маятника
с регулируемым положением точки подвеса
1. Уравнения движения. Рассматриваются колебания прост-
ранственного (сферического) маятника в окрестности нижнего
положения равновесия (z<0), см. рис. 5.1. Предполагается, что
схода со связи нет, т. е. реакция связи положительна. Для опи-
сания движения вводится неподвижная (инерциальная) OXYZ
и подвижная (Кенигова) O'xyz системы координат:
R = г0 + р, р = (х, у, z); z = —V/2 — г2, г2 = х2 + у2.
/(5.1.1)
Здесь г0 (Z) — заданное перемещение точки О' в системе OXYZ-,
считается, что длина маятника I постоянна. Вводятся масштабы
длины и времени I и 1/v
P* = -f’ го* = -72’’ z* = vz’ v2 = T- (5.1.2)
Тогда точные уравнения движения приводятся к следующему
компактному виду:
- Гф2 + = — Х0 C0S Ф — Уо Sin Ф — Z0
(5.1.3)
фг + 2пр = sin ф — у0 cos ф (r>0). v
§ 1. РЕГУЛИРУЕМОЕ ПОЛОЖЕНИЕ ТОЧКИ ПОДВЕСА
159
Здесь г, ср — полярные координаты, характеризующие движение
точки Р в плоскости О'ху, т. е.
x = rcos<p, у = г sin ф (z = —VI —г). (5.1.4)
Система (3) сходна при малых г с уравнениями (1.4.18) колеба-
нии плоского осциллятора.
2. Постановки задач управления* Считается, что ускорение
Го точки подвеса О' есть уп-
равляющая функция со зна-
чениями из некоторой трех-
мерной области U:
г0 = u, u(t)e U
(u = 0g= U). (5.1.5)
Для управляемой систе-
мы (3), (5) методами
гл. 1—4 удается исследовать
ряд задач оптимального уп-
равления в квазилинейной и
нелинейной постановках.
Следующие основные поста-
новки представляют опреде-
ленный прикладной интерес.
1)
Приведение точки подвеса О' маятника в заданное положе
ние с гашением относительных колебаний
t = tQ: г°, г°; ф°, ф°; г?, rj; (5.1.6)
t = Т: г* = г* = 0; rj, г* = 0. (5.1.7)
Если при t>T управление u(t)=0, то система (3) остается
в заданном положении (7).
2) Приведение системы из произвольного начального состоя-
ния (6) в состояние поступательного перемещения как целого,
без относительных колебаний с заданной постоянной скоростью
г0*, т. е.
t = Т: г* = г* = 0, г*.
(5.1.8)
В обоих случаях (7), (8) значение угла ф и угловой скорости
Ф не фиксируется, так как они не определены при г = 0 (и не
существенны). Кроме того, для условий (8) не фиксируется ко-
нечное значение г0.
160
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
Возможны другие постановки, учитывающие дополнительные
фазовые ограничения на скорость или траекторию перемещения
точки подвеса О', на траекторию массы Р и др. Задачи управле-
ния могут быть также обобщены на случай маятника переменной
длины I (см. § 4 гл. 1, § 6—8), а также путем учета инер-
ционности точки О', к которой приложена некоторая управляю-
щая сила, возмущающих воздействий и т. п. Процесс управле-
ния может исследоваться как на фиксированном, так и не
фиксированном интервалах времени для различных критериев ка-
чества («энергетических», быстродействия и др.). Например, пред-
ставляет принципиальный интерес задача о возможности пере-
мещения пространственного маятника за ограниченное время в
заданную точку с гашением колебаний при условии, что точка
подвеса может перемещаться только вдоль заданной кривой,
в частности по окружности. Эта задача была поставлена
А. Ю. Ишлинским (подробнее см. § 2).
3. Управление энергией относительных колебаний системы
квазилинейного приближения. Предполагается, что колебания ма-
лы и вводится малый параметр е, характеризующий их ампли-
туду и величину управляющего воздействия. Различные порядки
малости этих величин по е аналогично § 1 гл. 1 приводят к раз-
ным выражениям для возмущающих функций, см. (1.1.20а, б).
Чтобы учесть нелинейные эффекты движения, полагается (спо-
собы введения малого параметра для задачи перемещения маят-
ника обсуждаются подробно в § 4)
яо = 83/2их? yo==S3/2Uy (zo = 0(E2)). (5.1.9)
Подстановка (9) в (3) приводит к системе типа (1.4.18) (r*-+r):
г — rep2 + г = er3(V2 — ср2) + + е2 . ..,
срг + 2гср = енф + е2 ..., (5.1.10)
иг = — (и» cos ср + иу sin ср), нф =(nxsin ср — иу cos ср).
Отличие (10) от (1.4.18)—в дополнительном члене (—£г3ср2).
При е = 0 система (10) полностью интегрируется в виде (1.4.19).
Ставится задача оптимального в смысле квадратического функ-
ционала изменения энергии малых относительных колебаний Е
типа (1.4.23). Так как и* + и2 = и2 + и^, то ее решение для си-
стемы (10), (11) имеет вид (1.4.24) — (1.4.26). Отличается лишь
выражение для усредненной фазы первого приближения, точнее,
частота
Q(T,e).f (5.1.11)
Здесь Е(т), А^(т), d имеют прежний смысл и вычисляются со-
гласно (1.4.20), (1.4.24).
§ 2. ПЕРЕМЕЩЕНИЕ МАЯТНИКА ПО КРИВОЛИНЕЙНОЙ ТРАССЕ 161
§ 2. Перемещение маятника по криволинейной трассе
1. Уравнения движения и постановка задачи управления. Рас-
сматривается движение системы (1.10) в предположении, что точ-
ка подвеса О' перемещается по заданной кривой г0($) так, что
выполняются условия (1.9), рис. 5.1. Пусть s— параметр кри-
вой, например ее длина, отсчитываемая от некоторой точки 50,
а скорость движения точки О' управляема. Тогда в предположе-
нии малости отношения sJLv, где L — характерный линейный раз-
мер, a v=(g/Z)1/2, в безразмерных декартовых координатах OXY
система уравнений движения (1.10) примет вид (члены О(е2)
отбрасываются)
R + [R — г0 ($)] = err2 (72 - (р2) = ef, 2
s = v, v [pi, v2], v == 0 [vi, и2].
Здесь введены обозначения
R = (X, У), Го = (х0, Уо) , г = R - Го,
(5.2.2)
г2 = х2 + у2, ф = г~2 (ху — ух).
При е = 0 система (1) совершает колебания относительно
фиксированного положения равновесия: r0 = const. Посредством
замены, аналогичной (1.1.13) (а, Ь — переменные типа Ван-дер-
Поля)
R = r0 (s) + a sin t + b cos Z, R = a cos t — b sin Z, (5.2.3)
управляемая система (1) приводится к стандартной форме
(1.1.14):
а = — 8 [гоз (s) v + f ] sin t, а (0) = а0,
b = — 8 [гоз (s) v + f ] cos Z, b (0) = b°, (5.2.4)
S = 8P, V e [vlt P2], 5 (0) = s°.
Здесь в функцию f подставляются выражения для г, ср, которые
вычисляются на основе замены (3):
х = ах sin t + bx cos t, у = ay sin t + by cos t,
(5.2.5)
x = ax cos t — bx sin Z, у == ay cos t — by sin t.
Согласно (1), (2), (5) для f справедлива кубическая оценка
|f| ==О(г3) = О(|а|3+1Ы3). (5.2.6)
Представляет прикладной интерес следующая постановка за-
дачи управления. Требуется перевести систему (4) за конечное
время Т в состояние
£ = Г.а(Т) = 0, b(T)=0, $(?) = $*¥= $°. (5.2.7)
И Л. Д. Акуленко
162
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
В качестве критерия оптимальности можно взять интеграль-
ный квадратический функционал вида Б из (1.2.20) или время
быстродействия. Свойство оптимальности управления v представ-
ляется не столь существенным. Более важным представляется
вопрос о существовании решения, так как не очевидна управляе-
мость нелинейной системы (4). В частности, если г0($)—прямая,
то становится невозможным гашение колебаний в ортогональной
плоскости. Ниже рассматривается случай движения точки под-
веса О' по окружности радиусом г0, предложенный А. Ю. Ишлин-
ским. Уравнения движения точки О' задаются в виде
х0 = г0 cos а, уо — Го sin а (s = s° + г0 (а — а0)),
(5.2.8)
а = есо, со [(оь со2], а(0)=а°(=0), а(7)=а*.
2. Задача с квадратическим функционалом. Рассматривается
задача управления (4) —(7) с фиксированным моментом Т окон-
чания процесса и интегральным критерием качества
J [®] =
J a>2dt
о
-> min,
(0
(5.2.9)
1®(г)|< оо.
Вводятся сопряженные а, b и а переменные р, п и q и со-
ставляется функция Гамильтона задачи согласно (1.2.3). Из ус-
ловия максимума Я по о следует выражение для оптимального
управления со*:
со* = q + Го (Р sin t + N cos t),
n , J , ' , , . x (5.2.10)
P=(pd), A = (n-d), d =(sma, — cos a). v 7
Подставляя (10) в функцию Гамильтона Н и усредняя по /,
можно получить гамильтониан первого приближения (см. (1.2.2)):
е-1 <Я*> =11 + A r2 (Р2 + N2) + </> = /г = const, (5 2.Ц)
<Р = (Р • М + (п • fc), fs = sin О, fc = <f cos t>.
Сохраняя за усредненными переменными прежние обозначения,
можно получить в медленном времени т гамильтонову систему
вида
а- - '/2r*Pd + fs, а (0) = а0, а (0) = 0,
b = V2r^d + fc, b(O) = b°, b(0) = O, (5.2.12)
я Г г2 1
a‘ = q, a(0) = a°, a(0) = a*, g* = —— (P2. + 2V2) + </> ,
p- = - д ф/да, n- = - д ф/дЪ, ( •) = (d/dx).
Из уравнения (10) определяется переменная q как функция a
§ 2. ПЕРЕМЕЩЕНИЕ МАЯТНИКА ПО КРИВОЛИНЕЙНОЙ ТРАССЕ 163
и других медленных переменных, а также параметра h:
q = sign (а* - а°) [2k - (Р2 + №) - </>]1/2. (5.2.13)
Далее считается, что переменные a, b, р, п — функции а.
Уравнения для них получаются из (12) делением на а' = q:
а' = llir{q~1PA + b' = 1/2Fog—12Vd +
p' = - q~rd </>/5a, n' = — q~ld </>/db, (5.2.14)
(a = a(a), b = b(a), p = p(a), n = n(a), (') = (d/da)).
Штрих означает производную по а. Начальные и конечные усло-
вия (4), (7) примут вид
а(а°) = а°, b(a°) = b°, а(а*) = Ь(а*) = 0. (5.2.15)
Связь между тиа, определяющая при т = 0, а = а* пара-
метр Л, находится из (12), (13) после решения задачи (14), (15),
т. е.
т - т0 = f q~l (Р, h (a0, b°), a0, b°) dp, 0 = т |а*. (5.2.16)
В общем случае решение краевой задачи может быть по-
строено численно. Однако если начальные отклонения малы и f,
согласно (6), можно считать возмущением (|f| =О(г3)), то ис-
комое решение находится приближенно последовательными при-
ближениями по степеням некоторого параметра, характеризую-
щего величину возмущения в рассматриваемой области измене-
ния переменных. В частности, если возмущением пренебречь
(f^O, см. (1.1.20)), то р и п постоянны, а интегрирование урав-
нений (14) для а, b приводит к эллиптическим интегралам, ар-
гумент и модуль которых зависят от искомых медленных пере-
менных. Определение их из трансцендентных уравнений возмож-
но численным способом.
Будет рассматриваться упрощенная краевая задача (14) —
(16) при условии q = const. Тогда управление заведомо не опти-
мально, но можно доказать, что краевая задача разрешима. Из
(16) следует, что q = (а* — а0) (0 — т0)-1, а решение невозму-
щенной задачи (при f = а0 = т0 = 0) сразу приводит к выраже-
ниям для сопряженных переменных р, п:
р0 = - 2r^qW~W п0 = - 2г0-2^"1Ь°, (5.2.17)
а*/2 — -j- sin 2а*
— sin2 а*
— 2/2 sin2 а*
1
а*/2 + sin 2а*
det W = (1/4) (а*2 — sin2 а*) « а*4/12 (Iа*I < 1).
11*
164
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
Решение краевой задачи (14) при малых la°l, |Ь°| строится
методом возмущений. Сопряженные переменные р, п считаются
постоянными, а в качестве их первых приближений берутся ве-
личины (17). Для удобства вычислений совершается замена
f -+ pf (ц = 1). Заменой а = а0 + цДа, Ь = Ьо + цДЬ, где а0, Ьо
получаются элементарным интегрированием (14) при f = О, за-
данном q = а*©-1 и р0, п0, вычисленных в (17). Неизвестные
р, п строятся в аналогичном виде: р = р0 + цДр, п = п0 + цДп.
Постоянные Др, Дп определяются из краевого условия Да(а*) =
==ДЬ(а*) = 0 и вычисляются последовательными приближения-
ми по степеням ц. В первом приближении по ц
а* а*
Др = _ JL w-1 f f’da, Дп =----------v W1 f f°d“-
?* eJ Г
° о 0 о
Здесь f° — функция f, в которую подставлены а = а0(а), Ь =
= Ь0(а). Таким образом, решение краевой задачи (12), а вместе
с тем и задачи управления (4) — (8) существует при достаточно
малых начальных колебаниях и имеет вид периодической по t
функции со* (10) с медленно изменяющейся фазовой добавкой и
амплитудой.
3. Задача оптимального быстродействия. Оптимальное по бы-
стродействию управление системой (4), (7) при ограничении (8)
на основе методики § 3 гл. 1 в первом приближении определя-
ется выражениями со* и <Я*>:
со* = 1/2(со1 + <о2)+ 72(со2 — (Bi) (q/r0 + Р sin t + N cos t),
<#*> = 72^((0! + co2)+ 72ro((o2 - (oO (P2 + N2)i/2g(k) + </>,
g(fc) =
к, |Л|>1 (jc=(q/r0)(P2 + №)-1/2),
(2/n) [(1 — Zc2)1/2 + Aarcsinfc], |A|<;1. (5.2.18)
Усредненная краевая задача первого приближения получает-
ся на основе <Я*> (18) (см. § 3 гл. 1 и § 1, 2 гл. 2), причем
<Я*> = h = const. Из (18) следует, что режим управления мо-
жет состоять из участков двух типов: 1) перемещения точки под-
веса О' с экстремальной скоростью coi, 2, что в (18) отвечает зна-
чениям 1*1 > 1; 2) возвратно-поступательным перемещениям, от-
вечающим 1*1 <1. В первом случае не происходит активного
гашения колебаний. Во втором управление таково, что одновре-
менно гасятся относительные колебания и, как целое, перемеща-
ется система в заданном направлении. Ситуация во многом сход-
на с исследованной ниже, в § 4—7, для плоского маятника.
Рассматривая при малых начальных отклонениях функцию f как
возмущение, решение краевой задачи в первом приближении
можно построить численно.
§ 3. РЕГУЛИРУЕМОЕ УСКОРЕНИЕ ТОЧКИ ПОДВЕСА
165
§ 3. Управление колебаниями и вращениями
плоского маятника с регулируемым ускорением
точки подвеса
1. Постановка задачи управления. Рассматриваются колебания
и вращения физического маятника в вертикальной плоскости
OXY (см. рис. 5.2). Уравнение
движения имеет вид
Л ср + mgl sin ср =
= — ml(xQ cos ср + у о sin ср),
(5.3.1)
ф(0) = Ф°, ф(О) = сро.
Здесь А — момент инерции от-
носительно оси О, т — масса,
I— «плечо»; величины ж0, У о —
перемещения точки О'. Систе-
ма (1) приводится к безразмер-
ному виду (£* = vt, v2 =mgl/A).
Ускорение точки О' считается
малым, т. е. ей —r0/g, е < 1, и
чается уравнение (£*->0:
ср + sin ср = — е (их cos ср + uv sin ср). (5.3.2)
На основе известных при 8 = 0 интегралов — полной энергии
Е и фазы ф (см. § 1 гл. 3) уравнение (2) приводится к стандарт-
ному виду с вращающейся фазой (3.1.13):
Е = — 8 (и» cos ср + иу sin ср) ср, Е (0) = Е°, (5.3.3)
ф(ф, Е) = ± /2 [Я - (1 - cos ф)]1/2,
т !Г\ ___ /4^ х.х _
q\E) w . » ® 1
J <р(ф, Е) zo
Ф
Е = х/2ф2 + (1 — cos ф), ф = (о (Е) f ------------------1- ф°.
„о Ф (у, Е)
ф
Рассматриваются две постановки задачи оптимального управ-
ления: первая — минимизация или максимизация полной энер-
гии колебаний и вращений Е на фиксированном интервале
166
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
времени t е [О, Г]:
JE[u] = ± Е(Т) ->mm, u^U, Г = бе-1; (5.3.4)
и
вторая — минимизация времени Т при заданном конечном зна-
чении 2?*:
М (Е) \т = Е (Т) - /?* = О, Е* 0; (5 3 5)
JT [и] = eZ-^min, и е U.
и
При разумном выборе величины Т в постановке (4) эти за-
дачи оказываются двойственными. На основе метода усреднения
§ 2, 3 гл. 3 исследуются в первом приближении по е задачи оп-
тимального управления (3) — (5) при различных предположениях
относительно области U допустимых значений управляющей век-
тор-функции и,
2. Перемещение точки подвеса по прямой. Если точка О' мо-
жет перемещаться только вдоль прямолинейной направляющей,
наклоненной под постоянным углом б к горизонту, то U есть
отрезок (см. рис. 1.8)
U = {и\ zzx = ^cos6, uy = zzsin6, б = const). (5.3.6)
В результате подстановки (6) в (3) из условия максимума
функции Гамильтона определяется при p(£)^0 оптимальное уп-
равление и*:
и* = — sign [рф соз(ф — б)]. (5.3.7)
Здесь р — переменная, сопряженная Е. Сопряженная фазе 4' пе-
ременная имеет порядок е и в рассматриваемом первом прибли-
жении не учитывается. Усредненное уравнение для Е (3) име-
ет вид
5 = 6)v, v = sign т], Iр(т),| 1, |(0) = Еа,
(5.3.8)
r = efs[0, 0], (-)^(<7/dr), I— <lcpcos(cp — 6)|> >0.
Здесь I, г] — усредненные значения E, p. Определение и(т) прово-
дится просто на основе анализа уравнения (8) и соответствую-
щего для ц, в котором полагается р =0 (см. § 2 гл. 3). В слу-
чае постановки (4) (Т = 0е-1 — задано)
к» о
J /"‘(В, 6)dB = .f v(r)dr, М<1, Еж = £(0). (5.3.9)
Е° О
Здесь v = signr] = +l для задачи максимизации энергии
Е(Т)-+ minu). В случае минимизации функция v(t), |и| С 1
определяется, согласно (9-), более сложным образом, поскольку
§ д. РЕГУЛИРУЕМОЕ УСКОРЕНИЕ ТОЧКИ ПОДВЕСА
167
в этой постановке возможны особые управления. При 0
^^{Е0, 0, б), где '©(Е*, EQT б) — левая часть соотношения (9):
т е [0, 0], и(т)= —1. Если 0>б’(Е°, 0, б), то и(т) может при-
нимать произвольные значения, но такие, чтобы интеграл был
равен -©(Е0, 0, б). Для построения решения задачи управления в
форме синтеза эти соотношения, определяющие и, IpI^I в те-
кущий момент времени, должны рассматриваться при Е° = Е,
То = т, т. е.
е* е
[ Г1^, 6)d| = J
Е X
(5.3.10)
Следует иметь в виду «особенность синтеза» при т -> 0.
Для задачи оптимального быстродействия (5), как следует из
§ 3 гл. 3, функция z?(t), Id 1 равна
v = sign (Е* — Е), и* = — sign [(Е* — Е) ф cos (ф — 6)]. (5.3.11)
Оптимальное приближенное значение Е = £(т) + с ... в слу-
чае однозначного определения v(r) находится квадратурой
£
J Z"1^, б) d£ = T sign (£*-£»). (5.3.12)
Е°
Вычисление функции Z(|, 6) из (8) для режима вращений
(| > 2) дает
2Л
Z(B, 6) = Z2(g,6) = ±J |фсоз(<р-6)|йф =
О
2Л
= т7(1) J 1С08(ф-б)Иф = т^у’ = Л=2Ада2).
(5.3.13)
Здесь К — полный эллиптический интеграл первого рода по мо-
дулю к^, индекс 2 относится к вращениям; Тг — период враща-
тельного движения. Функция 12 (13) от б не зависит.
В случае колебаний, когда 0 < £ < 2, функция I (8) равна
ф0 ф0-6
2 С 2 Г
6) = Zx(g, б) J I соз (ф — б) | dtp = j |cosa:|da!,
1 -ф0 -Фо~в
Фо (I) = arccos(l — I), /сх = £/2<1, T1a) = 4K(/c1). (5.3.14)
Здесь фо — амплитуда колебаний, kt — модуль, — период ко-
лебаний. Квадратура в (14) вычисляется в элементарных функци-
ях от аргументов (ф0 — б) и — (ф0 + б). Однако получающееся в
168
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
результате выражение для Ц весьма громоздко. Разложением
функции Icos х\ в ряд Фурье [81] для Л получается представ-
ление
Л (В, S) = + 2 7^T)sin(2/<p0)cos(2/6) . (5.3.15)
Ряд в (15) сходится довольно быстро: отличие суммы первых
членов от точного значения составляет величину порядка
(1/8) (j* + I)"2-
Если движение происходит в окрестности сепаратрисы ki t 1
или к21 1, что имеет место при £12 или £ I 2 соответственно,
то величины Z’i>2(£)-* 00 (со 10) и фаза ф перестает быть враща-
ющейся (быстрой переменной). Это обстоятельство нарушает ус-
ловия применимости метода усреднения (3.1.2). Как установле-
но в [164], применение метода усреднения при прохождении че-
рез сепаратрису приводит к несколько большей погрешности —
порядка е In е-1 — на интервале t — t0 ~ е-1.
Представляет интерес исследование зависимости решения Е «
«£(т, б) от параметра б, б [0, л/2]. В режиме вращений
(£>2), как установлено в (13), управляемое движение не зави-
сит от б == const.
Для режима колебаний (0<£<2), дифференцируя по б за-
висимость Ц (14), что допускается согласно (15), можно по-
лучить
^ = ^ [ | c°s(<p0 + 6) I - I cos(<p0 — S) IJ. (5,3.16)
Из (16) следует, что если (ро = О, л/2, л, т. е. £ = 0, 1, 2, то
ЗЛ/дб^О, б [0, л/2]. В остальных случаях dljdb обращается
в нуль лишь при б = 0 и б = л/2. Следовательно, Ц монотонно
зависит от б и достигает максимума по б на одном (и минимума
на другом) конце интервала б е [0, л/2]. Вычисление h для
6 = 0, б = л/2 на основе формулы (14) приводит к выражениям
0 4 fsin<p0(B), 0<£<1 (0<<р0<л/2),
)“ 71(5)|2-sin<Po(g), 1<|<2 (л/2<Фо<л),
(5.3.17)
71(В,л/2) = (4/Т1(|))[1-со8фо(В)], 0<£<2 (0<фо<л).
Сопоставлением формул (17) устанавливается, что минимум
Zi(£, б) по б достигается при 6 = 0, если амплитуда колебаний
«мала»: ф0(£)<л/2 (0 < £ < 1) и при б=л/2, если «велика»:
л/2<ф0(£)<л (1<£<2). В режиме вращений при £ > 2, а
также при ф0 = 0 (£ = 0), при ф0 = л/2 (£ = 1) и при ф0= л
(£ = 2) функция h от б не зависит.
§ 3. РЕГУЛИРУЕМОЕ УСКОРЕНИЕ ТОЧКИ ПОДВЕСА
169
Таким образом, скорость изменения | зависит от постоянного
угла наклона направляющей б следующим образом. Для коле-
баний «малой» амплитуды (ср0 < л/2) наиболее эффективным уп-
равлением будет горизонтальное перемещение точки подвеса О',
т. е. б = 0. Для колебаний «большой» амплитуды (ф0 > тс/2) на-
иболее эффективны вертикальные перемещения, т. е. б = л/2.
В случае вращений (£ > 2) все значения б е [0, л/2] равноцен-
ны. Итак, если Е°, 2?* < 1, то наиболее выгодным является зна-
чение б = 0. И наоборот, если 2 > 2?°, Е* > 1, то б = л/2. На
рис. 5.3 приведены зависимости £(т, Е°, б) для Е° = 0 и различ-
ных значений бг == (г/12) тс, i = 0, 1, . .., 6. Кривая для i = 1 не
приведена, так как она практически совпадает с кривой для
i = 0. Проведенный анализ эффективности б подтверждается гра-
фически.
Нужно отметить, что в нижнем положении равновесия
(% = 0, фо = 0) функция Л(0, б)=0 (см. (14) или (15)), т. е.
£ = 0 — точка покоя уравнения (8). Однако при 0 б < л/2 су-
ществует единственное решение, не равное константе и попадаю-
щее в эту точку или покидающее ее за конечное время, так как
при малых фо (и Ю асимптотика правой части (8) имеет вид
/1 ~ фо ~ V/2- В случае же б = л/2 асимптотика будет иной:
Л ~ фо ~ %>• Время движения в точку g = 0 (ф0 = 0) или выхода
из нее при б = л/2 будет бесконечным, что следует из физиче-
ских представлений. Поэтому на рис. 5.3 для кривой с i = 6
(б = л/2) принято £(0)= 0,001.
При помощи семейства кривых рис. 5.3 можно построить за-
висимости времени оптимального быстродействия 0(6, 2?°, Е*) из
170
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
точки | = EQ в точку В = Е* как функции б. На рис. 5.4 приве-
дены кривые, отвечающие различным Е°, Е*\ кривая 1 отвечает
значениям Е° = 0, 2?* = 2, т. е. переводу маятника из нижнего в
верхнее положение равновесия (<р* == л); кривая 2 — соответ-
ственно 2?° = 0, 2?* = 1; кривая 3 — 2?° = 1, 2?* = 2. Очевидно,
зависимость 1 получается сложением зависимостей 2 и 3. Кри-
вая 3 слабо монотонно убывает при б -> л/2, что отвечает про-
веденному анализу.
В режиме вращений интегрирование уравнений (8), (13) с
v = sign ц = + 1 и Е° = 2 приводит к зависимости, близкой к
квадратичной параболе £ (т) « 2 [1 + (т — т^)/л]2 (рис. 5.5). Пусть
т* (б) — время достижения кривой £(т, б) (см. рис. 5.3) значе-
ния ^(т*, б) == 2. Тогда на основе проведенного анализа можно по-
строить полное семейство траекторий для обеих постановок (4),
(5) задачи управления колебаниями и вращениями системы (3).
Действительно, выбором кривой из рис. 5.3 или рис. 5.5, отвеча-
ющей заданному б е [0, л/2], находится значение т = т0, для кото-
рого В = Е°. Для постановки (4) нужно отложить от этой точки
отрезок т — т0 = 0 по оси абсцисс т в направлении, противо-
положном знаку в функционале (4). Для задачи быстродействия
(5) конец оптимальной траектории определяется значением 0
из уравнения £(т0 + 0 sign(2?* — 2?°))'= 2?*.
Таким образом, решение задачи оптимального управления
энергией плоского маятника в режиме колебаний и вращений по-
строено. В процессе управления можно изменить угол наклона б,
например, при прохождении значения ф0(Ю= л/2, без потери точ-
§ 3. РЕГУЛИРУЕМОЕ УСКОРЕНИЕ ТОЧКИ ПОДВЕСА
171
(5.3.19)
пости решения. Случаи, когда б можно считать управлением, ис-
следуются ниже.
3. Обобщение задачи управления. Рассматриваются постанов-
ки (4), (5) для более широких областей допустимых значений
вектора ускорения и точки подвеса О'.
3.1. Ограничение в виде прямоугольника. Пусть область U
имеет вид прямоугольника (см. рис. 1.8):
U = {и: | их | их, | иу | Uy-, Uxty = const'> 0}. (5.3.18)
Для этих ограничений аналогично п. 2 находится приближенное
оптимальное управление и*:
их = — UxV sign (ср cos ср),
Uy = — UyPsign (ср sin ср), | р(т) | 1.
Подставляя (19) в уравнение (3) для Е и усредняя по хр, мож-
но получить искомое уравнение. В режиме вращений, т. е. при
£>2,
/ „о 1 „о
£ = + V = 2 А:2К v' (5.3.20)
В режиме колебаний (0 < £ < 2)
t = + |и(т)|<1. (5.3.21)
Правые части в уравнениях (20), (21) определены согласно п. 2.
Функция р(т), lvl<l определяется аналогично (9), (10). Из
(20), (21) следует, что при = Uy = 1 управление (19) более
эффективно, так как правые части этих уравнений для тех же
£ по абсолютной величине больше, чем (8). Это естественно, так
как ограничение (19) «шире», чем (6). Интегрирование уравне-
ний (20), (21) и анализ проводятся аналогично п. 2. Делением
уравнений (20), (21) на величину и° = Ux + Uy и введением угло-
вой переменной 7 с помощью соотношений cos2 y=Ux/u°, sin2 у =
^=и^/и^ для значений у^[0, л/2] получаются семейства кривых
£(0, Е°, 7), 0 = uQx, сходные с представленными на рис. 5.3,
5.4, 5.5.
3.2. Ограничения в виде эллипса. В случае когда область U
ограничена эллипсом (см. рис. 1.8),
U = {и: а2их + b2Uy 1; a, b = const >0}. (5.3.22)
Аналогично п. 2 находится приближенное оптимальное управле-
ние и*:
их = — cos <р {a2 cos2 ф + Ъ2 sin2 ср)-1/2 v, I v (т) | 1,
(5.3.23)
иу = — sin ср {a2 cos2 ср + Ъ2 sin2 (р)-1/2 v,
172
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
(5.3.24)
а ft.
(5.3.25)
и Ъ. Для
L = L^, a, ft)
М (fe, a, ft)
Усредненная энергия £(т) изменяется согласно уравнению
1 = L(£, a, b)v, к(т)1^1,
L(g, а, Ь)= <|ф| (а2 cos2 ср + b2 sin2 ф)“1/2>.
В режиме вращений (£ > 2) функция L имеет вид
т т м 4К(х(а, &)) , м /, Ь2\1/2
— ^2 (£» — ар (gj ’ X (а, ft) 1 а2 ) ’
Если 6, то в выражении (25) нужно переставить а
режима колебаний функция L в (24) выражается через полные
и неполные эллиптические интегралы первого рода. В случае
«малой» амплитуды колебаний 0 < ф0(£)^ л/2
1(4/аТ1) F (ф0, х(а, Ь)), а > Ъ
1(4/&2\) [К(х (Ь, а)) - F (л/2 - ф0, х (Ь, а))], а^Ь.
(5.3,26)
Для «большой» амплитуды л/2 ф0(£)< л, когда 1 < 2,
((4/аТ\) [2К (х (a, b)) - F (л - ф0, х (а, ft))], а > ft,
t(4/67\) [К/(х (Ь, а)) + F (ф0 - л/2, х(&, а))], а< Ь.
(5.3.27)
При а = 6 выражения (26), (27) упрощаются:
L. (£, а, а) = 4а“1ф0 (£) Т? (£), 0 < ф0 < л. (5.3.28)
Определение функции г(т), |v| 1, построение и анализ фазо-
вой траектории £(т, 2?°) проводятся по схеме п. 2.
§ 4. Колебательные системы с управляемым по скорости
положением равновесия
Исследуются задачи оптимального по быстродействию управ-
ления движением колебательных систем, описываемых уравне-
ниями типа (3.1.15), представляющими частный случай уравне-
ний (1.1.11).
1. Некоторые механические модели. Для иллюстрации рас-
сматривается несколько моделей механических систем и форму-
лируются условия, при выполнении которых уравнения движе-
ния приводятся к виду (3.1.15).
1.1. Маятник с горизонтально перемещаемой точкой подвеса.
Движение маятника постоянной длины I с регулируемой ско-
ростью v перемещения точки подвеса О' описывается уравнения-
ми (см. рис. 5.6)
/ф + g sin <p = — х cos ф, х = р, р2]« (5.4.1)
§ 4. УПРАВЛЯЕМОЕ ПО СКОРОСТИ ПОЛОЖЕНИЕ РАВНОВЕСИЯ
173
схода с удерживающей связи
Рис. 5.6
Предполагается, что реакция связи положительна, а скорость
v может быстро (практически мгновенно) изменяться в заданных
пределах. Если подвес осуществляется с помощью нерастяжимой
абсолютно гибкой нити, то требуется дополнительный анализ дви-
жений, связанных с возможностью
[229]. В предположении ср ~ 8 < 1,
ГДе 8 = lPlmax(v/)"1, V =(g/Z)1/2,
указанным эффектом можно пре-
небречь.
В системе (1) вводится малый
параметр 8 и безразмерные пере-
менные (Л — характерная длина)
= vt, х* = x/L, у* =(х + /ф)/А.
Затем отбрасываются нелинейные
члены в разложениях sin<p = (p +
+ О(ср3) и cosq) = 1 + 0(<р2). По-
следнее допустимо, так как интег-
рал от хер2, в котором х может
быть обобщенной импульсной
функцией интенсивности 8, на ин-
тервале времени t — t0 ~ е-1 при-
ведет, вообще говоря, к абсолют-
ной погрешности О(е2); относи-
тельная погрешность составит 0(e). Опуская индекс в безразмер-
ных переменных, можно прийти к уравнениям движения вида
(3.1.15) (к системе с «управляемым положением равновесия»):
у+(у —х)=0, х = ей, и <= [н1? zz2]. (5.4.2)
Изложенный выше подход обладает существенным недостат-
ком: он позволяет рассмотреть задачу перемещения маятника из
СОСТОЯНИЯ ПОКОЯ В произвольную точку я(Т)=Х*, |я* — Х°| < оо
за достаточно большой промежуток Т — t0 <. (Т = tQ + (х* — х°) X
X(ezz)-1, й^[и{, н2]; например, и = или zz = u2), но ампли-
туда относительных колебаний будет порядка 8. Более точное приве-
дение маятника в состояние покоя, например с погрешностью О (е2),
требует решения задачи синтеза для линеаризованной по ср си-
стемы (1), что представляет весьма трудную для реализации
проблему [99, 229]. Для приложений оказывается полезным ука-
занный простой режим поступательного перемещения точки под-
веса в заданную точку х* дополнить режимом коррекции, т. е.
управлением, имеющим более высокий порядок малости по 8,
например х = ъ2и или х = 83/2н, и ~ 1. Тогда в первом случае
за время Z0~e_1 фазовая точка приводится в 82-окрестность
заданной точки, а во втором за относительно более короткое вре-
мя £ —£о~с-1/2 —в ее 83/2-окрестность. Идея сочетания режимов
перемещения и коррекции весьма плодотворна и часто использу-
174
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
ется на практике (при управлении грузоподъемными машинами,
манипуляционными роботами и др.). Далее для системы «типа
маятника» асимптотическими методами исследуется, в основном,
задача коррекции; при этом рассматриваются также более общие
модели с переменной и управляемой длиной.
Следует отметить, что более удобна для исследования система
уравнений в канонических переменных «угол — действие». Она
не содержит импульсных воздействий и позволяет просто полу-
чить систему уравнений в режиме коррекции типа (2), а также
применять изложенную выше методику усреднения. Такой под-
ход связан с введением более естественных и удобных для ана-
лиза переменных Рауса [76] и широко применяется при исследо-
вании многих задач динамики твердого тела, гироскопии, вибро-
техники и др. [95, 96].
1.2. Вывод уравнений движения и постановки задач управле-
ния. В рассматриваемой задаче от уравнения для угловой пере-
менной в форме Лагранжа с функцией S нужно перейти к урав-
нениям в форме Гамильтона с функцией Ж введением импульса
(действия) р, т. е.
Z = Ж Ж = ру-
Ж = - m (х2 + I2 + Z2cp2 + 21хср cos ср + 21 .г sin ср),
mgl (1 — cos (p)f (5.4.3)
р = = ml (Zcp + х cos ср), ср = -^2-cos ср,
dtp ml L
Ж = р 2------р cos ср----х2 sin2 ср — mx I sin q + mgl (1— cos ср).
(Переменные x = x(t), I = l(t) задаются кинематически.)
При помощи выражения (3) для функции Гамильтона Ж
уравнения движения маятника (1) приводятся к виду, не содер-
жащему импульсных воздействий х (если х — кусочно-гладкая
функция t)
дЗв р v • г ,
<p"==7^r~TC0S<p’ * = р’ (5А4)
р = —— = — р -j-sin ср + то* sin ср cos ср + тlocos ср — mgZsin <р.
Далее в этом параграфе рассматривается случай подвеса по-
стоянной длины (Z = const).
В безразмерных переменных (см. выше) уравнения (4) при-
водятся к виду, в котором т = Z = g = 1; t* = vt, v2 = g/l, о* =
= r/(vZ), x* = x/l, p* = p/(mvl).
§ 4. УПРАВЛЯЕМОЕ ПО СКОРОСТИ ПОЛОЖЕНИЕ РАВНОВЕСИЯ
175
Система уравнений (4) пригодна для асимптотического иссле-
дования задач оптимального управления в нелинейной и квази-
линейной постановках при различных предположениях относи-
тельно порядков малости характерных величин. При v = const
система для ср, р имеет вращательно-колебательное решение, вы-
ражаемое через эллиптические функции, в частности, допускает
стационарное решение вида <р = 0, р = v = const, отвечающее пе-
ремещению маятника с постоянной скоростью v без относитель-
ных колебаний (ф = ф = 0). Из (4) следует, что если ф(27) =
= р(Т) = 0, х(Т)=х*, то при = 0 для t>T система (4) ос-
тается в состоянии ф (t) = ф (t) = р (t) = 0, х (t) = х*.
Далее полагается v = edu, iz ~ 1; d > 0 — выбираемое число,
и рассматриваются следующие постановки задач оптимального по
быстродействию управления движением системы (4) в режиме
коррекции.
1) Нелинейная вращательно-колебательная система; заданное
изменение полной энергии или энергии и положения (Е или Е, х)
Е = 1/2р2+(1-созф), £ = (?(!), # = О(е),
Ф = <9(е-1) (<р = О(1)), Р, Ф = О(1), (5.4.5)
х* — xQ = 0(1), x = eu(d=l, н~1), t — t0=* .
Как отмечалось, в режиме перемещения фазовая точка системы
(4) при помощи управления и = const, и е [иь и2] приводится
в состояние (5). Фазовая точка нелинейной системы окажется в
e-окрестности конечного многообразия.
2) Квазилинейная колебательная система: заданное изменение
амплитуды или амплитуды и положения. Считается, что при по-
мощи малого управления v = ъи система (4) приведена в 6-ок-
рестность заданной точки: ф, ф, р==О(е), х — х* = О(е). Тогда
заменами ф = еФ, р = cP, х = eX, v = е2п, где Ф, Р, X, и = 0(1),
получается задача управления, приводимая к виду (2) или
(3.1.15) (7n = g = Z = l):
ф = Р-еи + О(83),
£ = _ф + О(б2),
X = 6U, и е [щ, П2],
Ф(О)=Ф°, Ф(Т)=О,
Р(О) = Р°, Р(Т) = О, (5.4.6)
Х(0) = Х°, Х(Т) = О.
На интервале времени £ —£0~б_1 для системы (6) методами
гл. 1, 2 решаются задачи управления с погрешностью 0(e). По-
скольку Р(Т)=0(б), то, полагая iz(i)=O при t > Т, можно си-
стему (4) привести в состояние p(t) = О (с2), ф(£) = О(е2),
-х* = О(е2), ф(£) = О(Е2); Т = 06"1.
Если взять корректирующее управление вида е3/2п, и <=
[щ, ZZ2], то за время t — t0 ~ е_1/2 система (4) приводится в
е3/2-окрестность заданного конечного состояния.
176
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
Пусть посредством управления v = е1/2п в режиме перемеще-
ния система (4) приведена в е1/2-окрестность заданной фазовой
точки. Тогда заменами ф = е1/2Ф, р = е1/2Р, я? = е1/2Х при по-
мощи управления v = е3/2п в режиме коррекции получается систе-
ма, приводимая к виду (3.1.15) (т = g = I = 1):
Ф = Р — ги + <?(s2), X = ей, и <= [izi, iz2], ,5
р = _ф + (1/6)(еФ3 + О(е2) ‘ *
с начальными и конечными условиями типа (6). Система (7) по-
зволяет решить задачу управления с погрешностью О(е3/2).
Следует отметить, что если исходная система (4) находится
в состоянии to, ф = О(е1/2), /? = О(е1/2), х = О(1), то при помо-
щи управления v = &u за время £0~8“1 она приводится
в е-окрестность заданной конечной точки q = р = х = 0. В без-
размерных переменных Лагранжа уравнения движения имеют
вид (3.1.15)
у + {у - я) = (е/6) {у - х)3 + О (е2), х = ги. (5.4.8)
Система (7) заменой У = Ф + X также приводится к виду
(8). Таким образом, задачи оптимального быстродействия, описы-
ваемые уравнениями вида (2), (8) или, что то же, системами (6),
Рис. 5.7
(7), являются предметом дальней-
шего исследования при решении
задач управления движением ма-
ятников с регулируемым по ско-
рости положением равновесия.
1.3. Управляемые крутильные
колебания. Рассматривается дви-
жение симметрического твердого
тела G, соединенного с поворот-
ным устройством D при помощи
бифилярного подвеса длины I
(см. рис. 5.7). Устройство D вра-
щается с управляемой угловой
скоростью 7 = со вокруг верти-
кальной оси симметрии OZ. При
возникновении углового рассогла-
сования (ср — у) достаточно ма-
лой величины тело G совершает крутильные колебания согласно
уравнениям
Уф 4- */2т8' (ф — у) (ф — у)2 + mS(ф — у) (ф — у)+ mg dzjdq = О,
5(ф _ у) = hkz~2 sin2 (ф — 7), z = — {I2 — 2Л2[1 — cos (ф — 7)]}_1/2,
7 = со, со [coi, со2].
(5.4.9)
§ 4. УПРАВЛЯЕМОЕ ПО СКОРОСТИ ПОЛОЖЕНИЕ РАВНОВЕСИЯ
177
Здесь J — момент инерции тела G относительно оси OZ, т — мас-
са тела, h — расстояние от оси вращения до точек подвеса. Далее
предполагаются малыми величины Icp — 7I, |ср — 7I и со в указан-
ном выше смысле. Введением малого параметра е: sd = I со I тэх/
/(vT), d > 0, где v2 = mgh2/(Л), а Г — характерный угол пово-
рота системы, и отбрасыванием малых нелинейных членов полу-
чаются уравнение вида (2), (6) —(8). При этом относительно
уравнения (9) справедливы замечания, сделанные в пп. 1.1, 1.2.
Уравнениями (1), (9) можно упрощенно описать основные дви-
жения грузоподъемных машин типа контейнерных перегружате-
лей с идеальными приводами для оценки их предельных возмож-
ностей по перемещению крупногабаритных грузов — контейне-
ров — и управлению их угловым положением.
2. Решение задачи о перемещении квазилинейной системы.
Для систем типа (2), (8) совершается замена у = х + a sin ф,
у = a cos 4*, х = х, где а — амплитуда относительных колебаний.
В результате задача оптимального по быстродействию перемеще-
ния маятника в заданную точку с гашением относительных коле-
баний приводится к виду (уравнение для ф не существенно)
а = — ен sin ф + еаа3 sin3 ф cos ф, х = ен,
«(0) = «° = [(у° - хГ + ГГ, 40) = х\
а(7’) = 0, z(7’) = z*(=0), 1 ;
0==e7’->min, u2].
u
Рассматриваемый ниже частный случай квазилинейной системы
(10) допускает аналитическое интегрирование задачи первого
приближения. Оптимальное управление п* и усредненный га-
мильтониан К в первом приближении равны (среднее от
sin3 ф cos ф равно нулю)
н* = 72(Ui + u2)+ 72(u2 - u1)sign(r - р sin ф), ...
= 72(ui + u2)r + 72(u2 — uj <\r — р sin ф|> + [J.
Здесь р, q, г— переменные, сопряженные а, ф, х; среднее в (11)
находится аналитически:
. | (14 |*|>1 {k^r/p),
|r psinipp |(2/л) | р | [(1—^2)!/2 4- ftarcsin 7с], |А|^1.
(5.4.12)
Из (И), (12) следует, что р, г = const, так как К от а, х не
зависит. Каноническая система имеет вид
а — 0, х = 72(Ui + и2) + iJ2{u2 — ujsignг, |fc| > 1;
(5.4.13)
la' = (1/л) (и2 — uj (1 — k2)1/2 sign p, | k| 1,
U* = x/2 (иг + u2) + (l/л) (u2 — Uj) arcsin k sign p.
12 Л. Д. Акуленко
178
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
Если Ш > 1 и а° ¥= 0, то выполнение конечного условия для
амплитуды а, согласно (13), невозможно.
Пусть |Л| <1; тогда интегрирование задачи (13) дает
а (т) = а0 ^1 — х (т) = xQ + (ж* — ж0) т = st. (5.4.14)
Величины к и 0 определяются из (13) решением трансцендент-
ной системы уравнений
(l/n)(u2-u1)(l-F)1/20 = a°,
[‘/2(^1 + и2) — (1/л) (п2 — Ui)arcsin Л] 0 = х* — xQ. ' ’ ’ '
Исключением в (15) неизвестной 0>О получается уравнение
для к, I&I < Г.
[arcsinк — (л/2) (п4 + n2)/(u2 — Hi)](1 — A:1 2)“1/2 = Х, ,
%=(х°-х*)/а°, |X| <00.
После определения k(k) из (16) величину 0(Х) можно найти
при помощи какого-либо уравнения (15). Решение уравнения (16)
находится численно в виде семейства кривых к = к(к, о) (см.
рис. 5.8), где о =(л/2) (щ + u2)/(u2 — nJ, Ы < оо. При lol < л/2
Рис. 5.8
искомый корень к (к, а) существует и единствен для произвольно-
го X. Для значений lol > л/2 решение задачи управления суще-
ствует не для всех значений X, а лишь для достаточно больших
|Х|. Следует отметить, что в этом случае (lol > л/2) система (10)
оставаться в требуемом состоянии при т > 0 не может. Получаю-
щиеся два значения к отвечают двум значениям 0 и х\ а.
§ 5. Перемещение линейной колебательной системы
с учетом малого линейного трения
1. Постановка задачи управления. Проводится обобщение за-
дачи оптимального по быстродействию перемещения линейной ко-
лебательной системы вида (4.2) или (4.8) путем учета малых сил
линейной диссипации
у + 2ебг/ + (у — х) = 0, х = ezz, б = const > 0. (5.5.1)
§ 5. УЧЕТ МАЛОГО ЛИНЕЙНОГО ТРЕНИЯ
179
Наличие в (1) кубического члена га (у — х)3 не изменяет ана-
лиза и результата, поскольку его влияние на амплитуду в пер-
вом приближении равно нулю.
Как и в § 4, ставится задача перевода системы из произволь-
ного состояния у°, у°, х° в заданное за кратчайшее время
^(Т)==я(Т) = я*, у(Т) = О, ® = гТ-+ min, |и|<1. (5.5.2)
и
При t> Т система (1) остается в положении (2), если положить
zz — 0. Приведение к стандартному виду осуществляется заменой
у = х + a sin гр, у = a cos гр, х = х\
а = — ги sin гр — 2еба cos2 гр, а(0) = а0,
х = ги, I а х(0) = х°, (5.5.3)
гр = 1 — (е/а) и cos гр + 2еб sin гр cos гр, гр (0) = гр°.
Конечные условия (2) для а, х перепишутся следующим образом:
а(Т) = 0, х(Т) = х* (0 = eT->min, |и|<1). (5.5.4)
Для решения задачи оптимального управления (3), (4) в пер-
вом приближении по е используется методика § 3 гл. 1.
2. Асимптотическое решение. На основе (1.3.4) при # = 0 на-
ходится оптимальное управление н* в первом приближении (см.
(4.11))
н* = sign (г — р sin гр), г = const. (5.5.5)
Для усредненной функции Гамильтона К имеет место выражение
г^К = <|г — р sin гр|> — 8ра + £ = const. (5.5.6)
Здесь среднее <|г — рзтгр|> находится аналогично (4.12). В ре-
зультате получается краевая задача первого приближения типа
(4.13):
ст = — 8а, х' = sign г, |А| > 1;
(а ’ = (2/л) (1 — /с2)1/2 sign р — 8а,
Ьг = (2/tt)arcsin&signp, |/с[^1; (5.5.7)
р- = бр, Р = PQe6x, к = №е~*х, к° = г/р°,
а(0) = а0, я(0) = х\ а(0)=О, #(©) = #*.
Решение задачи (7) приводит к трем режимам управления.
1) Движение с Ш > 1 для т [0, 0] имеет место лишь при
а° = 0.
2) Движение при \к\ < 1 для т [0, 0] включает гашение
колебаний (уменьшение а) и перемещение (если к Ф 0). Этот
режим имеет место при относительно больших а0 и малых
1я* — я°|.
3) Общий случай включает режимы 1) и 2) на интервалах
г е [0, т*] и т £ [т*, 0] соответственно. Величина т* определяется
12*
180
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
условиями
1*1 = 1, т* = 6-1 in |*°|, |*°| > 1. (5.5.8)
Движение системы (7) описывается уравнениями
от = — (2/л) (1 — &1 2)1/2% —6а (signp = -l), 5
х' = (1 — x)signr + (2/л)хarcsin 1*1 signr. I • • )
Здесь % = 1 (т — т*) — единичная функция (Хевисайда). Система
(9) интегрируется полностью, так как sign г = sign (я* — я0).
В результате для определения двух неизвестных параметров
бит* (или *°) получается система трансцендентных уравнений
а°е~бв = -1 j е-в(т‘-т) [1 _ е-2б(т*-т)]1/2 (5.5.10)
т*
е
2 С
х* — [я0 + т* sign (х* — я0)] = — sign(x*—х°) \ arcsin еб(т*-г) йт,
т*
0 > т* > 0,
а°>0,
х* #= xQ.
Ее решение О (а0, х°), т*(а°, xQ)
(или *°(а°, х°)) может быть по-
строено численно. Подставляя
*° в выражение (7) для *, а
затем к = к (т, а0, х") в (5),
можно получить после вычис-
ления усредненной фазы ф пер-
вого приближения программное
оптимальное управление ир.
Характерное поведение функ-
ции ир(£, е) и ее связь с функ-
цией % (9) представлены на
рис. 5.9. Полагая т = 0, aQ = а,
х° = х (kQ = к), можно полу-
чить искомое оптимальное уп-
равление в форме синтеза.
К аналогичным режимам
управления и краевой задаче
принципа максимума приводит рассматриваемая ниже, в § 6, за-
дача перемещения маятника переменной длины.
§ 6. Синтез оптимального по быстродействию перемещения
маятника переменной длины
1. Постановка задачи управления. Рассматривается механиче-
ская модель малых колебаний плоского маятника переменной
длины Z, точка подвеса которого может перемещаться с ограни-
ченной скоростью v, щ v(f)^ v2, вдоль горизонтальной направ-
ляющей (см. рис. 1.2, 5.6). Величина амплитуды колебаний пред-
§ 6. ПЕРЕМЕЩЕНИЕ МАЯТНИКА ПЕРЕМЕННОЙ ДЛИНЫ
181
полагается малой, порядка е, е 1. Скорости изменения длины
и перемещения точки подвеса имеют тот же порядок малости. От-
носительно интенсивностей ускорений предполагается, что для х
она 0(e), а для Z —0(s2). Подстановкой у = я+£ф после отбра-
сывания членов третьего порядка малости по е и деления на
е ¥= 0 получаются следующие уравнения движения в режиме кор-
рекции (см. § 4):
g + (*/-*) = О, X = v, pe[r)t v2],
У(О) = У°, yW = y°, *(0) = z°, ( }
по виду совпадающие co случаем I = const > 0. Действительно,
уравнения движения в форме Гамильтона, не содержащей им-
пульсных воздействий
Ф = l~2(P<p ~ cos ф) = 1),
р9 = — sin ф + lv cos ф + v2 cos ф sin ф — lg sin ф, (5.6.2)
Ж = 72Z-2 (рф — Zp cos ф)2 + 72Z2 — lv sin ф + lg (1 — cos ф),
на основе сделанных предположений и указанной подстановки
приводятся к виду (1). Если I—управляемая по скорости длина
подвеса, т. е. /=еш, w ~ 1, то более удобными являются уравне-
ния (2). Эти уравнения при различных предположениях относи-
тельно порядков величин (у — х), х, Т и др. (см. § 4) приводятся
к виду (4.6) или (4.7).
Далее вводятся безразмерные переменные и малый параметр
= vt, Vs = g/Г о = Ш ~ 1, У* = УХ, У* = y/(Lv), (5 б %
x* = x/L, v — &и, e = | v|max/(Av)< 1.
Здесь I — характерная длина маятника, L — характерное расстоя-
ние, на которое перемещается система, |р|гаах — максимальное из
чисел |pj, 1р21. Опуская индексы после подстановки (3) в (1),
можно получить уравнения движения в режиме коррекции:
у + о”1 (у — х) = 0, i = eu, zz2]. (5.6.4)
Исследуется задача оптимального по быстродействию управле-
ния системой (4). Конечные условия имеют вид у(Т) = х(Т) =
= х*, у(Т) = О; замена, приводящая систему к стандартной фор-
ме, есть ((у, у, х) -> (а, ф, х)):
у = я + а sin г|), у = ао-1/2 cos ф, х = х. (5.6.5)
Считается, что относительная длина маятника о медленно и
плавно изменяется по некоторому закону со скоростью, определи-
182
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
емой значениями медленных переменных а, х, а. В результате за-
дача наискорейшего перемещения маятника переменной длины
описывается соотношениями
а = — ezz sin ф + cos2 ф,
(5.6.6)
X = 8ZZ, О = 81Р (а, X, о),
• 1
ф = о-1/2 — гиа~г cos ф —бсг-1^ sin 2ф,
а (0) = а° > 0, х (0) = х°, а (0) = о0 > 0, ф (0) = ф°,
а(Т) = 0, х(Т) = х*> 0 = e7->min, и^[щ,и2].
и
Считается, что закон изменения о в (6) выбирается из требова-
ний фазовых ограничений на движение маятника. Например, при
Рис. 5.10
перемещении висящего груза грузоподъемными машинами необхо-
димо изменять длину подвеса, что обусловлено наличием препят-
ствий (рис. 5.10). Управляемая система (6) будет существенно
нелинейной, если функция w зависит от управляемых перемен-
ных а, х.
2. Приближенная краевая задача принципа максимума. Через
р, д, г, s обозначаются переменные, сопряженные а, ф, х, о соот-
ветственно. Согласно (3.2.3) выписывается функция Гамильтона
и определяется оптимальное управление:
Н = гр (— u sin ф +1/2a(j-1iv соэ2ф) + р (ги + sw) +
+ go-*/2 (иа-1 cos ф + yo-1w? sin 2ф) -> шах, и е [ux, и2],
(5.6.7)
и* = V2 (wi + и2) + V2 (и2 — u1)sign (г — р sin ф — qa,-1 cos ф).
§ 6. ПЕРЕМЕЩЕНИЕ МАЯТНИКА ПЕРЕМЕННОЙ ДЛИНЫ
183
При помощи методики § 3 гл. 3 выписывается усредненная
краевая задача:
-у аъ~Чс>(а, х, о), а (0) = а0,
® = 4
(1/л) (u2 — ux) (Ij— F)i/2 sign /> + -£- аа-1», | к | 1;
P/2(^i + w2) + 1/2^и2 — ^1) sign г, \к\ >1; я(0) = я°,
~ 1(1/тс) (iz2r— щ) arcsin | к | sign г + ^(t^ + н2), ] к | < 1;
а* = w (а, х, а), о (0) = о0, (5.6,8)
р' = — (1/4) ро-13 (aw)lda — 5 dw/da,
г9 = — ((1/4) acr^p + s) dw/dx, к = r/p,
s* = — (1/4) ap + 1/2^~3^2 — s dw/da,
а(0)==Ол x(®) = x*i 5(0) = 0; 0->min, [3 e Zp.
P
В общем случае произвольной функции w решение задачи (8)
может быть построено численно для каждого конкретного закона
w = iv (а, х, о).
3. Квазилинейная трактовка задачи управления. Для случая
квазилинейной системы, когда w = w(o) (см. (1.1.7)), система (8)
допускает полное интегрирование в квадратурах. При |&| > 1
а
0/ о \i/4 а0 А1/4 Г ds *
«=«°Ы > Р=Р°[-5-) > Т = )^Г’ МР = “1.2!
а0
(5.6.9)
х = Х° + 1/2 [(“1 + w2) + (u2 — ui) sign (x* — ®°)] т’
Синтез управления и время быстродействия равны
,__ о
и, = ^2 (U1 + uz) + V2 (u2 — Uj) sign (x* — x), 0 = x-—.
“p
(5.6.10)
Усредненная фаза i[', согласно (6), (10), находится квадра-
турой
а а
о , 1 С ds _ / а?_\2 С ds
s J s1^2w(s) \ 4о° / J s3w(s)
Случай 17с I >1 отвечает перемещению маятника с экстре-
мальной скоростью без активного гашения колебаний; амплитуда
при этом изменяется согласно (9).
Используя выражения для р, г, о, совпадающие с (9), можно
при Ifcl <1 получить после интегрирования уравнений для а, х
184
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
и учета граничных условий (8) трансцендентные уравнения для
а*, 7:
а0
о*
(j - ?2gl/2)l/2
(а)
do,
(5.6.11)
а* о*
,* _ „о _ _ “1 f arcsin (т<т1/4) , “1 + “2 С do
л J ш(о) ’+’ 2 J IP (о)’
о0 о0
Здесь а* — неизвестное конечное значение а, а* = о(0); в реаль-
ных условиях а, а* подвергаются ограничениям: 0 < omln а,
о* Стах < °°; параметр 7 в (И) равен 7 = (г/р°) (о°)-1/4. При
выводе соотношений (11) учтено, что sign р = — 1 и сделано
предположение о знакоопределенности функции ir(o), причем
считалось, что lid > wQ > 0, о(т)^[от1п, Отах]- Величина и знак у,
т. е. \к°\ и sign г при неоднозначном определении о*, 7 из (11)
находятся из условия 0-> min, где 0 =т|а* (см. (9)). При и2 =
= —Hi или достаточно малом lui + u2l из (11) однозначно следу-
ет, что sign г = sign (х* — х°).
Нужно отметить, что вследствие ограничений на о, о* урав-
нения (11) не всегда разрешимы. Например, если скорость изме-
нения о, т. е. Iir(o) I, велика, то правая часть уравнений в слу-
чае убывающей длины подвеса становится малой независимо от
7. Таким образом, при конечных а° и |х* —х°| равенства стано-
вятся невозможными. И наоборот, при условии относительно мед-
ленного изменения о, т. е. малой lir(o) I, система (11) разреши-
ма. В этом случае имеет место ситуация, близкая рассмотренной
в § 4, где рассматривался предельный случай w = 0, о = const.
Для произвольных соотношений между рассматриваемыми вели-
чинами требуется дополнительный анализ уравнений (И).
На практике обычно осуществляется управление скоростью подъ-
ема или опускания качающегося груза. Совмещение операций пе-
ремещения, гашения колебаний и подъема или опускания приво-
дят к увеличению быстродействия всей системы в целом. Поэтому
исследование задачи управления с монотонно изменяющейся дли-
ной маятника может представить интерес как часть более общей
задачи для модели с управляемой скоростью изменения длины
подвеса.
4. Анализ управляемого движения. Совокупность режимов дви-
жений, полученных в результате применения метода усреднения,
можно условно разбить на следующие подслучаи.
1) Как отмечалось в п. 3 (см. также § 4, 5), управление при
к2 > 1 соответствует перемещению маятника с экстремальной ско-
ростью и = 2 без активного гашения колебаний. При этом мо-
жет происходить монотонное уменьшение или увеличение их амп-
литуды вследствие такого же изменения длины подвеса согласно
§ 6. ПЕРЕМЕЩЕНИЕ МАЯТНИКА ПЕРЕМЕННОЙ ДЛИНЫ
185
(9). Для а° = 0 следует, что а = 0, т. е. движение в первом при-
ближении по е оптимально.
2) Возможен оптимальный режим движения, когда 0 < к2 1.
Он имеет место, если разрешима система (И).
3) Аналогично случаю 1) допускается возможность режима
управления с к = 0, который отвечает оптимальному гашению ко-
лебаний без учета перемещения. При этом происходит дрейф точ-
ки подвеса О' со скоростью х' = V2(zzi + н2); в случае симметрич-
ного ограничения щ = — и2 величина х' = 0. Этот режим, как и в
случае 1), является неполным, так как соответствует специаль-
ным начальным условиям.
4) Возможен режим управления, когда к2 > 1 на начальном
участке движения, а затем становится меньше единицы из-за
уменьшения о: к2 = fc02o1/2. На втором участке, как отмечалось,
происходит одновременное перемещение и активное гашение ко-
лебаний.
5) Возможна и обратная ситуация, когда на начальном участ-
ке к2 1, что отвечает одновременному перемещению и гашению
колебаний (до нулевого значения амплитуды а), а затем переме-
щению с экстремальной скоростью ult 2 при к2 > 1. Такой режим
управления может иметь место при увеличивающейся длине под-
веса о.
Для построения синтеза управления и определения движения
системы в области к2 С 1 необходимо построить решение системы
(11) при произвольных допустимых начальных значениях пере-
менных, рассматриваемых в качестве текущих.
5. Синтез управления при постоянной скорости подъема или
опускания груза. Важным для приложений является случай
ir(o)= Wq = const [31]. Зависимость о(т) = о0 + wQx приводит к
простым явным выражениям для формул (9). Далее для упроще-
ния изложения считается, что ограничения на и (7) симметрич-
ны; без ограничения общности и2 = — щ = 1. Несимметричный
случай более сложен для полного анализа.
Режим управления 2) с 0 < к2 < 1 приводит к следующей
системе трансцендентных уравнений типа (И) относительно
ц = г/р° и б = о*/о°:
6
9 f*
х =— 1 (1 — p.2z1/2)1/2z~lfidz, и = —j- w0, |х|<оо,
Л J (Ju
* (5.6.12)
X = — f arcsin (|iz1/4) dzf % = ——~—ir0, |X|<oo.
л J cr
1
Требуется для заданных (или измеренных) значений а0, ж0, а0 оп-
ределяющих величины х, X, найти неизвестные б, ц как функции
186
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
начальных или текущих значений фазовых переменных. Квадра-
туры в (12) находятся в трансцендентных функциях [81], однако
аналитически решить эту систему, аналогично (4.16), как и в слу-
чае системы (5.10), не удается. Искомое решение строится чис-
ленно. Для этого из уравнений (12) определяются соответствую-
щие однопараметрические семейства кривых
цх = ±срх(б), щ = фДб). (5.6.13)
Здесь б, 0 < б < оо — аргумент, а х, X — задаваемые параметры
семейств, которые могут изменяться в неограниченных пределах
согласно (12). Семейства кривых и Цх представлены на
рис. 5.11, а, б.
На рис. 5.11, а номерами от 1 до 14 отмечены кривые семей-
ства цх, отвечающие следующим значениям параметра х:
Номер кри- вой 1 2 3 4 5 6 7
Параметр х —8/(Зя) -0,7 -0,5 -0,4 -о,з -0,2 -0,1
Номер кри- вой 8 9 10 11 12 13 14
Параметр и -0,05 0 0,05 0,1 0,2 0,3 0,5
§ 6. ПЕРЕМЕЩЕНИЕ МАЯТНИКА ПЕРЕМЕННОЙ ДЛИНЫ
187
На рис. 5.11, а представлена «половина» семейства кривых, отве-
чающая знаку плюс в (13): Цх = +фх. Семейство Цх = —<рх по-
лучается отражением относительно оси б.
На рис. 5.11,6 номера от 1 до 16 отвечают следующим значе-
ниям параметра X семейства кривых
Номер кри- вой 1 2 3 4 5 6 7 8
Параметр % -5/8 -0,5 -0,4 -0,3 -0,2 -0,1 -0,01 0
Номер кри- вой 9 10 И 12 13 14 15 16
Параметр X 0,01 0,1 0,2 0,3 0,4 0,5 0,8 1,0
Здесь также представлена «половина» семейства с цх > 0, отве-
чающая движению в отрицательном направлении: sign г = — 1.
Для Цх < 0, отвечающих wQ > 0, семейство кривых получается из
приведенного на рис. 5.11, б отражением относительно оси б с из-
менением знака параметра X: Цх = — <р—х(б).
Ниже приводятся основные свойства семейств кривых
рис. 5.11, а, б. Для семейства рис. 5.11, а значениям х > О отвечают
значения б > 1, т. е. > 0 (увеличение длины маят-
ника); при этом значения р,х ограничены: IpJ < б^174. Ес-
ли допускаются достаточно большие значения б, то ко-
рень первого уравнения (11) существует для любого х > 0.
Значениям х < 0 отвечают б: 0 < б < 1; при этом ограничение на
р,н имеет вид I р*| С 1. Учитывая естественное ограничение б > 0,
из оценки интеграла можно установить, что первое уравнение (И)
удовлетворяется при достаточно малых 1x1: 0>х>—8/(Зл).
Таким образом, в рамках постановки задачи с постоянно убыва-
ющей длиной маятника можно «успеть» погасить колебания ко-
нечной амплитуды: а0 ^(8/Зл)о0|1г01_1, которая может быть сколь
угодно большой при достаточно большом значении отношения
o°li^ol-1. В размерных переменных это отношение имеет простой
физический смысл промежутка времени, за который длина под-
веса уменьшается от начального значения до нуля.
При рассмотрении семейства кривых рис. 5.11, б аналогично
изложенному выше устанавливается, что функция Цх для б > 1
ограничена: 0 < Цх б-1/4, а корни второго уравнения (И) суще-
ствуют для любого % > 0, если допустимые значения б достаточно
велики. В случае уменьшения длины, что отвечает % < 0, ограни-
чение на Цх при 0 < б 1 имеет вид 0 Цх 1. В этой области,
как и раньше, вследствие естественного ограничения б > 0 вто-
рое уравнение (11) может быть удовлетворено, если величина
|А I достаточно мала, т. е. 0>Х>— 5/8. Это означает, что для
модели с постоянно убывающей длиной подвеса маятник можно
188
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
переместить на расстояние, не превышающее величину
Irr* — гг°1 — (5/8)о°|п?о1-1, которая может быть сколь угодно боль-
шой, если время <з°|rz^ol-1 достаточно велико.
Задача определения искомых параметров р, и 6 при помощи
построенных на рис. 5.11, а, б семейств кривых решается следую-
щим образом. Для этой цели выбирается кривая семейства
рис. 5.11, а для заданного х и семейства рис. 5.11,6 —для задан-
ного X. Единственная точка (ц*, б*) пересечения кривых цх(б)
и цДб), если она существует, определяет режим оптимального уп-
равления в случае к2 1. Подставляя найденное значение кй = ц*
в выражение для к\ к = ц*о1/4, а затем в выражение (7), можно
найти оптимальное управление в форме синтеза:
= — sign [ц* (%, Х)а1/4 - (у — ж)], (5.6.14)
х = (a/о) ш0, X = ((я x*)/v) w0.
Время быстродействия находится после подстановки о* =
= 8*(х°, Х°)о° в (9):
0 = 0(а°, х°, о°) = (б*~ 1)о°М. (5.6.15)
Оптимальная фазовая траектория в первом приближении по-
лучается элементарным интегрированием линейных уравнений (8)
для а, х при
zi2 = -zzi = l, w = w0, О = О0 + ад
7*1/4- , л (5.6.16)
к == v , sign р = — 1, sign г = — 1.
Таким образом, режимы 1)—3) п. 4 полностью исследованы.
Возможны случаи управляемого движения, когда выбранные
кривые семейств рис. 5.11, а, б не имеют точек пересечения, что
может соответствовать режимам 4) и 5). Пусть это имеет место
при увеличении длины маятника, т. е. при w0 > 0 (б > 1). Тогда
оптимальным является режим управления 5), состоящий из двух
участков. Первый из них представляет режим 2) с 0 < к2 1,
а второй — режим 1) с к2 > 1. Искомые значения б17 для
первого участка находятся из условия пересечения кривой семей-
ства рис. 5.11, а с ограничивающей кривой цх = б“1/4. Таким обра-
зом, в режиме управления 5) сначала происходит одновременное
гашение колебаний до нулевых значений амплитуды и некоторое
перемещение в нужном направлении, а затем с момента времени,
отвечающего = б^0, перемещение без колебаний (а = 0) с экс-
тремальной скоростью. Определение оптимального управления в
форме программы и синтеза, времени быстродействия и фазовой
траектории проводится на основе исследованных выше режи-
мов 1), 2). Решение задачи управления существует, если отно-
шение (Отах — o°)/ir0 достаточно велико.
Пусть имеет место отличный от указанного выше случай, ког-
да длина маятника убывает: w0 < 0 (б < 1), и пусть соответству-
ющие заданным значениям х, Z кривые семейств рис. 5.11, а, б не
имеют точки пересечения. В этом случае, если задача имеет реше-
§ 6. ПЕРЕМЕЩЕНИЕ МАЯТНИКА ПЕРЕМЕННОЙ ДЛИНЫ
189
ние, оптимальным будет режим 4). Он состоит из двух участков:
на первом к2 > 1, т. е. осуществляется режим 1), а на втором
О < к2 < 1, что отвечает рассмотренному режиму 2). Это означает,
что на первом участке оказывается выгодным использовать умень-
шение амплитуды колебаний за счет уменьшения длины подвеса
(см. (9)), и перемещаться с экстремальной скоростью zzi = — 1.
Затем начиная с некоторого момента, отвечающего значению
длины подвеса о2 = о2ои, нужно осуществить перемещение в
заданную точку х = х* с полным гашением колебаний к концу
процесса. При этом предполагается, что конечное значение
о* = б*о° > 0. Неизвестные величины б* и б2 определяются из
уравнений, аналогичных (12). Эти уравнения получаются в ре-
зультате интегрирования системы (8) при к2 > 1 для о°^о^а2
и при к2 < 1 для о* ст < о2 и имеют вид
б
- 4 С (4 - -4. И. - > 1.
\ z (5.6.17)
б
к + (1 — б2) = arcsin (jui^z1/4) dz.
Аналогичным численным приемом, как и для системы (12),
решаются уравнения (17) относительно б2, б для заданных зна-
чений параметров х и L Численно строятся два семейства кри-
вых, отвечающих первому и второму уравнениям (17) (рис. 5.12,
а, б). Здесь бх, бх —функции аргумента б2&[0, 1], а х и % —
параметры семейств. Кривым бх на рис. 5.12, а с номерами от 1
до 8 отвечают следующие значения параметра х:
Номер кри- вой 1 2 3 4 5 6 7 8
Параметр х 0 —0,01 —0,05 -0,1 —0,2 -0,3 -0,4 -0,5
Аналогично на рис. 5.12, б кривым бх с номерами от 1 до 11
отвечают значения параметра Л, равные соответственно
Номер кри- вой 1 2 3 4 5 6 7 8 9 10 И
Параметр X 0 -0,1 -0,2 -о,з -0,4 —0,5 -0,6 —0,7 -0,8 —0,9 —1
Искомые значения б* и 62 определяются точкой пересечения
соответствующих кривых семейств рис. 5.12, а, б. Как следует из
уравнений и построенных кривых, режим управления 4) может
существовать при х > — 1/2 и % > — 1. Кроме того, очевидно, что
190
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
не для всякой пары кривых, удовлетворяющих этим ограничени-
ям, существует точка пересечения (б*, б£) кривых бх и бх.
Ниже определяется область значений параметров х, Л, для
которых осуществляется режим 2) или 4) при уменьшающейся
длцне подвеса: tv0 < 0 (0 < б < 1). Численно находится мно-
жество значений параметров х, Л, для которых существуют точ-
ки пересечения кривых семейств рис. 5.11, а, б и рис. 5.12, а, б.
Результаты расчетов приведены на рис. 5.13. Здесь область
определяет значения парамет-
ров х, X, для которых реализу-
ется режим управления 2) с
к2 (0, 1), а область S2 — те
значения х, X, для которых за-
дача оптимального управления
решается при помощи режима
4). Объединение областей и
S2 определяет в каждый мо-
мент область начальных или
текущих значений параметров
х, Л, связанных с а°, я0, а0 (или
а, х, а), для которых возмож-
но решение задачи управления
в рамках модели с постоянно убывающей длиной а подвеса. Ре-
шение вне этой области можно доопределить как управляемое
движение маятника с постоянной длиной подвеса. Как показано
в § 4, такая задача всегда имеет решение.
Численное решение задачи синтеза построено А. Т. Зарембой
в совместной работе [31].
§ 7. МАЯТНИК С УПРАВЛЯЕМОЙ ДЛИНОЙ ПОДВЕСА
191
§ 7. Оптимальное по быстродействию перемещение маятника
с управляемой длиной подвеса
Более интересным с прикладной точки зрения представляется
решение существенно нелинейной задачи оптимального по быст-
родействию перемещения висящего груза в вертикальной плоско-
сти на основе управляемого движения маятника с регулируемой
длиной подвеса при естественном фазовом ограничении: 0 <
< Отт о Отах < °°, где огащ и огаах могут зависеть от а И X.
Возможность управления длиной подвеса в процессе перемеще-
ния приводит к дополнительному выигрышу по быстродействию
системы, а также позволяет рассмотреть задачи с дополнитель-
ными фазовыми ограничениями, обусловленными препятствиями.
Как показывает анализ, строгое решение задачи быстродейст-
вия в рамках рассматриваемой математической модели представ-
ляет значительные трудности, так как управляемая система типа
(6.6) существенно нелинейна и будет содержать особенность ти-
па импульсного воздействия. Если предположить, что скорость w
изменения длины может релейно изменять значение лишь огра-
ниченное число раз при 8 0, то приближенное асимптотическое
исследование задачи управления можно проводить на основе
уравнений (6.6), где w(t) — управление. В общем случае нужно
пользоваться уравнениями (4.4) при соответствующих предполо-
жениях относительно порядков величин ср, х, х, I в режимах пе-
ремещения и коррекции.
Рассматривается задача управления (6), дополненная ус-
ловиями
1Г2], О(Т)=О*, Omln^G, 0°, О* < Огаах- (5.7.1)
Здесь постоянные w2, как и и2, имеют разные по знаку
значения; для упрощения amm, отш — постоянные. Тогда из вида
уравнения для а (6.5) вследствие неотрицательности коэффици-
ента при w следует, что для увеличения быстродействия величи-
на w должна быть неположительной на начальном интервале
времени, насколько это возможно, т. е. должно использоваться
обстоятельство, отмеченное при построении режима 4) в п. 5
§ 6, и связанной с уменьшением амплитуды колебаний а при
уменьшении длины (при w < 0).
Для описания возможных режимов управления вводятся два
интервала медленного времени 0а, х и 0а. Величина 0О равна
0О = (о* — а°)[1/2(^1 + ^2) + '/г(ю2 — ir1)sign(a* — о0)]"1 (5.7.2)
и характеризует минимально возможное время подъема или опу-
скания груза до заданного значения о*. Величина 0а, к определя-
ется как время оптимального быстродействия системы (6.8) для
192
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
а, х при заданном законе w изменения длины подвеса о:
_ Р/2 (wi + «’г) + V2 (^г —^i) sign (о* — ст0), S е= [CTmin, сттах],
(О, 2 G= [СТтт, Птах],
(5.7.3)
2 = 2 (?) = ст0 + [х/2 (^i + w2) + V2 (w2 — w2) sign (ст* — о0)] г.
Приведенные в (3) выражения для w означают, что скорость
подъема или опускания максимальна, если значение а не достиг-
ло ограничивающих значений агащ (при а* < а0) или omax (при
а*>а°) и равна нулю в противном случае, т. е. o = amin или
о = Отах при Т > 0а |a* 0a, a = Отт.тах- Решение задачи принци-
па максимума (6.8) для а, х, р, г (г = const) проводится на основе
результатов п. 2 § 4 (для it = 0) и п. 1 — 5 § 6 (при w = w^ или
w = ir2).
Таким образом, величина 0О определяется разностью
(а* — а0), а 0а,х зависит также от а0, а°, xQ. В зависимости от
соотношения между величинами 0О и 0а, х получаются различные
режимы движения.
1) Если 0а, 0а, то режим управления для а имеет вид
it* = + ю2)+ 7г(^2 — iri)sign(a* — а). (5.7.4)
Управление и определяется при 0а, х<0а неоднозначно; в част-
ности, при этом можно использовать закон управления, постро-
енный в п. 5 § 6 для случая w == или w = w2', на участке
т [0а, х, 0а1 полагается и = 0 (см. п. 2 § 4).
2) Если же 0а, х > ©а, то режим управления длиной подвеса
о содержит начальный участок подъема груза (уменьшения дли-
ны подвеса), величина и длительность 0О которого определяются
дополнительными соотношениями. При этом возможен «выход»
на минимальное значение а = 0тш, движение с постоянной ми-
нимальной длиной и «сход» в некоторый момент 0* с ограниче-
ния, если о* > Отт. Качественное поведение переменной а(т)
для различных режимов управляемого движения представлено
семейством кривых на рис. 5.14.
В случае симметричных ограничений на и и w: u^[—н0, н0],
w —ш0, iPol уравнения (6.8) для анх примут вид
((1/4) |А:|^1,
а — (2/л) u0 (1 —/с2)1/2 + (1/4) аог-1ш, | к | < 1; (5.7.5)
(u0 sign (х* — я0), | к | 1,
Х ~ (— (2/л) и0 arcsin/c, | к | < 1.
Пусть осуществляется режим 2), причем 0а, х>0а. Тогда
точки 0о, 0о. mm, 9* и время быстродействия 0 определяются из
условий а = 0, х = х*, а = а* при т = 0. Уравнения (5) интегрп-
§ S. ПАРАМЕТРИЧЕСКОЕ УПРАВЛЕНИЕ МАЯТНИКОМ
193
руются при заданных функциях ip, а и к2:
ш(т) == О,
wQ,
Т ЕЕ [0, ©о,min],
т
Т (= (0О,min, ©*], ст (т) = J w (s) ds + ст0,
о
т е (0Ж, ©], к2 = (ст/ст°)1/2.
(5.7.6)
—
Время подъема 0О,тш =(п° — 0т1п)/ио известно. Поэтому из
конечных условий для а, х, а получаются три уравнения относи-
тельно неизвестных kQ, 0* и 0. Эти соотношения представляют-
ся в виде
е
о
х* — х° = ио~^ J arcsinffc0f-^y/4jdr, о(0) = а*.
о
Переменная о — кусочно-линейная функция т; она зависит,
согласно (6), от неизвестного параметра 0*, который должен
удовлетворять условию 0* 0o,min, так как в противном случае
длина подвеса не выходит на нижнее ограничение. Кроме того,
должно выполняться неравенство 0*<0, если о* > отщ. Сис-
тему (8) можно решить численно.
§ 8. Параметрическое управление маятником («качели»)
1. Постановка задачи управления. Рассматривается нелиней-
ная колебательная система «типа маятника» с неускоряемой точ-
кой подвеса (И^О), уравнение движения которой приведено в
п. 3.2 § 1 гл. 1. Предполагается, что скорость изменения длины
13 л. Д. Акуленко
196
ГЛ. 5. УПРАВЛЕНИЕ СИСТЕМОЙ «ТИПА МАЯТНИКА»
В частности, при т* = 0 (/0 = —1) или т* = О (/0 = +1) для
определения х получается квадратное уравнение. В общем слу-
чае исследование задачи (9) довольно громоздко. Однако метод
усреднения позволяет сравнительно просто построить квазиопти-
мальное управление с определенными свойствами движения, на
пример о(т)« о0 « о*, р(0) = р* р°.
3. Квазиоптимальное решение задачи быстродействия. Ста-
вится задача оптимального быстродействия
J [и] = гТ == 0—>min, (5.8.10)
и
В общем случае решение задачи (4), (5), (10) можно по-
строить численно на основе уравнений первого приближения.
Однако из вида системы (4) и требования, чтобы величина о(т)
оставалась в малой окрестности значений о*, о0 (о* ~ о0), можно
построить квазиоптимальное управление u*f приводящее к экс-
поненциальному изменению амплитуды а и постоянству о(т) в
первом приближении:
и*= — sign (р (ср2 — о^ф2)) = — sign (р cos 2г|?),
(5.8.11)
л* / 3 \
signp = sign In—, а = a0exp I ^-rsignp0 I, а(т) = о°.
Изменение угла отклонения от вертикали ф, угловой скорости
Ф и относительной длины о на периоде колебаний качественно
представлены на рис. 5.16.
4. Управление быстрыми вращениями. На основе подхода,
аналогичного п. 3, в случае «быстрых вращений», т. е. с > о"1 (см.
(3)), получается квазиоптимальное решение задачи управления
§ 8. ПАРАМЕТРИЧЕСКОЕ УПРАВЛЕНИЕ МАЯТНИКОМ
197
в виде
W* = — Sign [(с* — с) (cos ср — 1/1^2)],
q>« /2 [с°з/2 + (2/3) х (о0)-2о]1/3, (5.8.12)
х = у sign (с* — с°), у = (2 — л + я ' > 0.
r v ' г УЩ 2 }/2 /
Из (12) следует, что в случае быстрых вращений малыми уп-
равлениями скорости изменения длины маятника можно добить-
ся только степенного изменения во времени энергии или угловой
скорости.
В заключение гл. 5 следует отметить, что механическая мо-
дель системы типа маятника с управляемыми точкой подвеса и
другими параметрами оказывается весьма полезной и часто
встречающейся на практике. Значительный интерес для прило-
жений представляют различные обобщения рассмотренных выше
задач: построение оптимальных и простых квазиоптимальных
законов управления пространственными движениями маятника с
регулируемыми точкой подвеса и длиной, учет фазовых ограни-
чений на движение груза; учет динамики приводов, осуществляю-
щих силовые воздействия на систему; учет возмущающих факто-
ров различной физической природы (внешней среды, неидеально-
сти механической модели, системы управления и др.). Важным
обобщением представляется рассмотрение двухмассовой модели,
т. е. системы двух тел, соединенных гибким тросом: несущего
тела, к которому приложены управляющие силы, и несомого те-
ла (это объекты типа вертолет — груз на подвесе, КЛА —спут-
ник-зонд на гибком тросе и т. п.).
ГЛАВА 6
ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
ОРБИТАЛЬНЫМИ ДВИЖЕНИЯМИ
И ВРАЩЕНИЯМИ КЛА
ПРИ ПОМОЩИ «МАЛОЙ ТЯГИ»
Методами гл. 1—4 исследуются в первом приближении мо-
дельные задачи оптимального управления плоскими орбитальны-
ми движениями КЛА. Рассмотрены задачи оптимального и ква-
зиоптимального управления вращениями аппаратов относительно
центра масс, в частности задачи стабилизации, в том числе с
учетом гравитационных моментов.
§ 1. Оптимальная по быстродействию коррекция орбиты,
близкой к круговой
Рассматривается задача оптимального по быстродействию уп-
равления движением точки в центральном гравитационном поле
по орбите, близкой к круговой (см. рис. 1.4), при помощи огра-
ниченной по модулю малой тяги — пример 3.4 из § 1 гл. 1. Урав-
нения возмущенного движения первого приближения по 8
(1.1.23) удобнее записать в оскулирующих переменных а, Ь, с, у,
где
а = a sin у + Ъ cos у, £ = —a cos 7 + Ъ sin у. (6.1.1)
Полагая, что внешние возмущения (/г, /Ф) в (1.1.23) являют-
ся малыми более высокого порядка по 8, в результате стандарт-
ной процедуры гл. 1 можно получить систему
а = 8izr sin ср + 2ещ» cos ср + eFa, я (М = я0,
б = 8izr cos ср — 2енф sin ср + eFb, Ъ (to) = &°,
c = 8zz9+eFc, с(£о)=с°, (6.1.2)
7 = —Збс + бГт, у (£0) =7°, t е [tQ, Т].
Здесь <р = t — t0 + у, а функции Fa, ь, с, т имеют нулевое среднее
по <р; поэтому их вид несуществен для дальнейшего. Ставится
§ 1. КОРРЕКЦИЯ ОРБИТЫ, БЛИЗКОЙ К КРУГОВОЙ
199
задача оптимального быстродействия в заданную точку:
a(T)=a* b(T)=b*, с(Т)=с*, 'у(7’)='Г*;
Т = бе-1, T->min, и2г+и^1. (6.1.3)
иг,иф
В соответствии с методикой § 3 гл. 1 составляется функция
Гамильтона Н и находится оптимальное управление и*
(см. (1.3.4))
Н — е lPa& а + Pb* b + PcFс + Ру (^у — Зе)] +
+ eurII sin (ср + |л) + еифП [2 cos (ср + |1) + 6],
п = (р2 + Pb)1/21 sin р, = cos р = 6 = -jp
* _ sin (<р + р) * 6 + 2 cos (Ф + и) /д 4 /л
ит--------ф----, Wq>------------ф-------, (0.1.4)
Ф = Ф(ср + ц, б) = {sin2 (ср + ц)+ [б + 2 cos (ср + ц)]2}1/2.
Усредняя, согласно (2.1.7), по ср и сохраняя за усредненными
переменными прежние обозначения, можно получить гамильто-
ниан первого приближения
kQ = —Зсрт + П <Ф> = const. (6.1.5)
Выражение для среднего <Ф> в (5) обобщает эллиптический ин-
теграл второго рода Е [81, 236]:
<Ф> = / (б) = f (1 + б2 + 46 cos ф + 3 cos2 ip)1/2ch|), , п.
</ (0.1.0)
/(0) = (4/л)Е(УЗ/2).
Аналитические свойства функции /(б) исследуются ниже. На ос-
нове цикличности переменных а, Ъ, у в усредненной системе при
помощи выражений (5), (6) и (2.1.10) получаются уравнения
движения в медленном времени т = st е [т0, ©]:
а’= cos ц [/(б)- б/' (б)], sin p [f (б) - б/' (б)], (6.1.7)
с*=/'(б), = — Зс;
Pa.b.V = const, Pc = 3pv.
Система (7) интегрируется в квадратурах, так как правые
части уравнений для а, Ь, с после подстановки выражения для
б = б° + ЗА(т — т0), где б°, к = рт/П, П — постоянные, становят-
ся известными функциями т. Равенство фазовых координат
а, 6, с, 7 в некоторый момент т = 0 заданным значениям (3)
приводит к трансцендентной системе уравнений относительно
200
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
неизвестных параметров краевой задачи ц, 6°, X, 9 (или 6*):
б*
[ [/ (6) - 6/' (6)] = а* - а0 е= Да,
б°
6*
f I/ (6) -6/' (6)] db = b* - b° = Ab, (6.1.8)
зА J
6°
6*
-1_Г /'(6)d6 = c*_c° = Ac, 6*=6°+3X(0-To),
oA J
6°
-3CO(0_.T) + /(6O)^_%
A
6*
- 3p" = 7* - Y° ~ A?‘
6°
Простыми алгебраическими преобразованиями система (8) при-
водится к двум трансцендентным уравнениям относительно 6°,
б*, содержащим три существенных параметра задачи Да2 + Д&2,
Де и Ду. В общем случае ее решение строится численно.
Решение задачи управления элементами орбиты а, Ь, с, когда
положение точки на орбите, т. е. величины у, в момент Т не су-
щественно, значительно упрощается, так как р1 = 0, б, рс = const.
Система уравнений (8) приводится к виду
cos ц [/(б) — б/' (б)](0 — То) = Да,
sin и 1/(6) — б/'(б)](© - То)= ЬЬ, (6.1.9)
/'(б)(0-то)= Дс.
График функции /(б) приведен на рис. 6.1. Существенно, что
функция /— четная, />0, имеет минимум (6) при б = 0 и неог-
раниченно возрастает при |б|-*«>, стремясь к асимптотам ±б
при б±°о. Производная /'(0)— 0 и, очевидно, /'(б)-^±1 при
б ±ООе
При Дс#=0 система (9) сводится к одному уравнению отно-
сительно параметра б:
d = Z>(6), Ь(-б)=-О(б),
(6.1.10)
d = (Да2 + Д Ь2)1/2/ (Дс), D (б) [/(б) - б/' (б) ]//' (б).
Решение трансцендентного уравнения (10) можно получить
графически при помощи рис. 6.2, где представлена его правая
часть. При заданном или измеренном значении d величина б*
определяется с точностью до знака, который находится из
третьего уравнения (9) и, очевидно, совпадает со знаком Дс.
Из (9) и (10) следует (см. рис. 6.2), что 6 = 0 при Дс = 0. Пос-
§ 2. ЭВОЛЮЦИЯ ЭЛЕМЕНТОВ ЭЛЛИПТИЧЕСКОЙ ОРБИТЫ
201
ле того как параметр б* определен, величина 0 — т0 находится
просто:
0 —т0 =
Дс//'(б*), Де=/=0,
Да2 + Д62 #= 0.
(6.1.11)
Величины cos р и sin р определяются однозначно из (9) при
Да2 + Д&2=И=0. В противном случае в квадратных скобках (9)
содержится выражение, равное нулю, что отвечает |б| = °°, а уп-
равление, согласно (4), равно иг =0, = sign б и не зависит от
значения р = const, которое может быть произвольным. Более
подробное изложение решения задачи содержится в [26, 27].
§ 2. Оптимальная эволюция элементов плоской
эллиптической орбиты
1. Постановка задачи оптимального управления движением
точки по эллиптической орбите в гравитационном поле под дей-
ствием малой тяги. Уравнения движения в полярных координа-
тах (1.1.23) без учета возмущений имеют вид [84] (рис. 6.3)
г = vr, г (0) = г\
Vr = Vqf-1 — r~2 + 8ZZr, vr (0) = Vr, (6.2.1)
Ф= РфГ”1, (p (0) = cp°f
Рф = — VrVqf-1 + еиф, Рф (0) = Рф.
Тяга считается малой по отношению к местной силе тяготе-
ния. В отличие от квазилинейной трактовки § 1 и § 1 гл. 1,
предполагается, что эксцентриситет орбиты е немал: 0 < С е С
С е2 < 1. Для вывода стандартной системы уравнений управ-
ляемого движения используется следующий полный набор
202
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
интегралов [79, 84, 139]:
х/2 (у? + Уф) — г-1 = Е < 0, гУф = ТУ #= О,
г = р(1 + е cos х)-1, г = */2(— 2?)_1(1 — е cos |),
f + 6=(-2E)-3/2(g-esing), ф = ж + у, (6.2.2);
e = (i + 2ENz)l/z, p=Nz, a(E) = (-2E)3/z.
Здесь Е — полная энергия, N — кинетический момент, у — угло-
вая постоянная, характеризующая
поворот линии апсид [79, 84] (см.
рис. 6.3); 6 — временная постоян-
ная.
Эксцентриситет е и фокальный
параметр р выражаются через Е и
7V, а параметр £ связывает перемен-
ные г и t; связь между g и фазой
гр = со (£ + б) взаимно однозначная:
ф = § — е sin g = е),
£ (ф + 2л, е) 2л + S, (ф, е). (6.2.3)'
Дифференцированием интегралов (2)
в силу системы (1) можно получить
систему уравнений управляемого движения стандартного вида:
Е = в (UrVr + ифиф), N = еифг,
7V / . г 2 + в cos х . \
у = 8—• — Ur COS X H-iAdth-----------sinz ,
r e r k ф 1 + e cos x y’
(6.2.4)
гр = co (£) + turfor (я, e, N) + 8иф/фф (x, e, N),
E(0)=E°<0, N(0) = N\ T(0) = y°, гр(О) = гр°.
Связь между истинной аномалией х и фазой гр задается диф-
ференциальным соотношением
йгр=(1 - еЕ 2)3/2(1 + е cos x)~2dx. (6.2.5)
В уравнениях (4) переменные г, vr, — известные 2л-пери-
одические функции х, зависящие также от Е, W (или е, р).
Функции /фГ, аналогичны; их явный вид для дальнейшего не
существен. Часто вместо первых двух уравнений (4) удобнее ис-
следовать эквивалентные им уравнения для е, р:
. Г . , е(1 + cos2 х) + 2 cos х ]
е = epi/2 |^ursin х + uv---1 + ес(^-----J, (6.2.6)
р = 28ифр3 * * * * В/2 (1 + е cos я)-1; е (0) = е°, р (0) = р°.
Ставится для системы (4) — (6) задача оптимального управле-
ния медленными переменными Е, N (или е, р), у на фикспро-
§ 2. ЭВОЛЮЦИЯ ЭЛЕМЕНТОВ ЭЛЛИПТИЧЕСКОЙ ОРБИТЫ
203
ванном интервале времени [0, Т] с критерием качества вида
т
J[u] =I u2d/-->min, и = (иг, uw), |iz|<oo, 7 = —.
J и 8
0
(6.2.7)
Выражение (7) имеет физический смысл в случае малой реак-
тивной тяги [52, 84]. Согласно (3.2.2) его можно привести к ви-
ду терминального функционала
J [и] = 2 (Т)-> min, z = 1/2eu2, 2 (0) = 0. (6.2.8)
|u|<oo
Краевые условия в общем случае имеют вид (3.2.1):
Д(£, 2V, 7)1т = 0; J/Де, р, 7)|г = 0 (/ = 1,2,3). (6.2.9)
Здесь одно или два соотношения могут отсутствовать. В частно-
сти, представляют прикладной интерес следующие постановки
задачи:
— изменение всех элементов орбиты (формы, размера и ори-
ентации)
E(T) = E*^0, N(T) = N*, 7(Г)=7*;
е(Т’) = е*Е(0, 1), р(Т) = р*^О, = (6’2'10)
— частичное изменение формы и размера и поворот линии
апсид
ЦЕ, ДГ)|г = О; М(е, р)|г = 0, 7(Л=7* (6.2.11)
Возможны более частные постановки, предполагающие задан-
ное изменение какого-либо из элементов орбиты.
2. Построение усредненного гамильтониана. При помощи ме-
тодики § 2 гл. 3 составляется функция Гамильтона задачи (4), (7)
и определяется оптимальное управление п* как функция фазо-
вых Е, N, 7, 2, 1|) и сопряженных им переменных. Учитывая цик-
личность 7, 2, можно сразу, согласно (3.2.4), найти выражения
р1 = const, pz = —1. Затем получаются выражения для управле-
ния и*, и гамильтониана Я*:
и* = Ре»г + Pyfyr + Ру = const,
(6.2.12)
= Ре^ф + PNr + Pyfytp +
Я* = 1/2е (ur2 + 42) + щ (6.2.13)
Применяя схему усреднения § 2, 4 гл. 3 и соотношение (5),
для усредненной функции Гамильтона К можно получить, сохра-
няя за усредненными переменными прежние обозначения, вы-
ражения
= юр + к0, ю(£) = (-2£)3'2, Я = 1/2р"1(1-е2). (6.2.14)
204
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
Функция *о в переменных N, у имеет вид
7 77 2 . 22. 5 — 4е^ 2 . яг
Л’о = — ЕрЕ + PN + 4е2'([_ g2) №> + NPePn,
e2 = l + 2EN\ p = N2; (6.2.15);
в переменных e, p, у функция kQ примет вид
У /к//\ 2 . 2-|-Зг2 о 2 . 5 — 4е2 2 5ер%
h = \p!vppe + '^z^-p Рр + ^2(7Т7Урр?Т^?РеРр'
(6.2.16)
В соответствии с п. 3 § 1 гл. 2 при переходе от одной систе-
мы переменных (£\ N, у, *ф) к другой (е, р, у, 4) можно вос-
пользоваться формулами (2.1.18).
Величина к0 на основе (13), (8) равна
й0 = и, и = и(т), т = е^[0, 0], (>(Ж). (6.2.17)
Усредненная система имеет интеграл (см. (3.2.18)),
сор + *0 = const. (6.2.18)
Если р = 0 — точка минимума Jo, то kQ = const; кроме того,
0*о = z (0) = Jo [0], Л = Л [р]. (6.2.19)
Решение краевой задачи первого приближения с условиями
вида (9) — (11) для произвольного допустимого р и последующая
минимизация Л [р] могут быть осуществлены численными мето-
дами. Интегрированию в медленном времени т подлежит система
четырех уравнений (Р и — параметры), вместо восьми для ис-
ходной, допускающая первый интеграл (18). Построение реше-
ния в малой окрестности значения Р = 0 можно осуществить ме-
тодами возмущений, т. е. разложениями по степеням р или по-
следовательными приближениями.
3. Оптимальный набор заданной энергии. Рассматривается
задача управления полной энергией Е\
Е(Т) = Е* (£*^0, Т = 0е-1), (6.2.20)
допускающая полное аналитическое решение. Конечные значе-
ния остальных переменных не фиксируются. Из уравнений и
краевых условий сразу следует для у, и pN, что
У =дкй!дру |р?=0 = 0, у = у0, pv = const = 0, (6.2.21)
Pn = — Pn(Ре + Зй2 рЛ’(0) = О, Рл’СО^О.
\ t —е /
В результате усредненная краевая задача приводится к виду
Е- = - 2ЕрЕ, N- = NpE, р'е = 3(- 2Е)^ 0 + p*Ef
E(0) = E°, ТУ (0) = 2V°; E(Q) = E*. (6.2.22)
§ 2. ЭВОЛЮЦИЯ ЭЛЕМЕНТОВ ЭЛЛИПТИЧЕСКОЙ ОРБИТЫ
205
Из (18), (21), (22) следуют интегралы
(- 2£)3/2 0 - Ер2Е = h = const,
1 + EN2 = е2 = const. (6.2.23)
Разрешая первое соотношение (23) относительно рЕ и подстав-
ляя его в уравнение (22) для Е, можно получить уравнение с
разделяющимися переменными. Его интегрирование приводит к
полному набору интегралов системы. Однако без интегрирования
системы (22) можно доказать, что значение j} = 0 оптимально и
выполняются предположения § 2 гл. 3. Вначале строится реше-
ние краевой задачи (22) при р = 0:
Е (т) = W (т), N (т) = (т), (6.2.24)
РвЮ = -(р) ]’ ст(т) = 1--0 J’
JQ j[0] = О-1 [ (-Я*)1/2 - (-EQ)1/2]2.
Затем проверяются условия быстрой осцилляции (3.2.22) и ло-
кального минимума (3.2.30). Разложением /0[Я и решения за-
дачи (22) по степеням параметра £ получается выражение
J" [0] = - (3/20) Е°& [3 + 4п (О) + За2 (О)} > 0. (6.2.25)
Действительно, величина Е° < 0, а выражение в квадратной
скобке положительно для любых вещественных о, так как дис-
криминант отрицателен. Таким образом, локально оптимальное
решение построено в виде (12), (19), (21), (24). Удается также
установить его абсолютную (глобальную) оптимальность для
всех р, для которых существует решение задачи (22). Приводи-
мое простое доказательство принадлежит Ф. Л. Черноусько [229].
Из (15), (17) следует выражение для Л>[р]:
е е
Jo [0] = Z (0) = J kodx = - j Ep^dr. (6.2.26)
0 0
Подставляя в (26) pE = —E'/2E из (22), можно получить
0 0
Jo I Pl = - J E'2 g = - J [d(~f)1/2]2 dx. (6.2.27)
0 0
При помощи неравенства Коши — Буняковского, применительно
к паре функций d(—E)i,2/(h и 1, получается, согласно (24),
неравенство
[0 -|2
pbg'-rfrj =7о[0]. (6.2.28)
206
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
В результате подстановки q = рт = pN = 0 в (12) получается
оптимальное управление в форме синтеза:
1 Г, /Е*\1/21 е . . .
п---- 1 — тг -^rSinfcp — Y),
6 — т [_ \Е / J N
(6.2.29)
1 Гл ( Е* \1/21 1 + е cos (ф — у)
0 — т[1\£/ J *
Таким образом, оптимальное управление является тангенци-
альной (касательной) тягой с периодически изменяющейся при
движении точки по орбите ве-
личиной. Как функция анома-
лии х оно имеет вид, представ-
ленный на рис. 6.4. При этом
движении эксцентриситет орби-
ты остается постоянным в пер-
вом приближении, а кривая из-
менения энергии во времени
представляется возрастающим
или убывающим отрезком пара-
болы (24). Следует иметь в ви-
ду особенность оптимального
синтеза (29) при т -> 0.
4. Квазиоптимальный пово-
рот линии апсид. Из вида ус-
(14) —(16) следует, что краевая
редненной функции Гамильтона
задача допускает в первом приближении решение
Е(и)=Е°, 2V(t) = 2V°; pE(j) = pN(x)= 0
(е(т)=е°, />(?) = />’; р.(т)=Рр(т)30),
Решение задачи о повороте линии апсид при выполнении тре-
бования, чтобы выполнялись равенства (30), находится просто,
так как рт = const. В результате угол апсид у изменяется линей-
но по т е [0, 0]:
7(т)=1о+(7*_7°)т0-1? рт = (7* _ f)/z°0,
Х° = */г(р7е°2) (5 - 4е02)/(1 - е02). (b.2.ol)
Подставляя рт из (31) в (12) при рЕ = Рт= q s 0, можно по-
лучить оптимальное управление иг^ в форме синтеза:
U* = (у* — y) X-1 (0 — т)-1 /?г (е, р, х),
ulf = (У* — У) X"1 (® — т)-1 /те (е, Р, х),
X = X (е> Р) = (р/е2) (5 — 4е2)/( 1 — е2),
, N ' N 2 + е cos х .
Jvr=-----COS X, ]V(P = — у—-----Sin X, Х = ф~V.
J v е 1 J r е 1 + е cos х ’ 1
(6.2.32)
5 3. ВРАЩЕНИЯ БЛИЗКОГО К СИММЕТРИЧНОМУ ТЕЛА
207
Построенный синтез (32) также имеет особенность при т->0,
что обусловлено постановкой задачи управления.
Значение функционала (8) получается на основе (16), (19):
/o = 72(r-f)/(%o0). (6.2.33)
Из выражений (32) следует, что оптимальное управление
(и*, ^ф) стремится к нулю как величина е при е -> 0. Затраты,
характеризуемые квадратическим функционалом (7), равны
значению (33) и уменьшаются с ростом 0. Они тем меньше, чем
меньше эксцентриситет орбиты е, что очевидно следует из урав-
нения для 7 (4) и отвечает физическим представлениям. Данное
решение задачи о повороте линии апсид не оптимально в случае
свободных переменных Е, N (е, р). Однако оно представляет ин-
терес, если во время поворота линии апсид размеры и форма эл-
липса должны сохраняться согласно условиям (30). Следует от-
метить, что формулы перестают быть справедливыми при малых
значениях е, сравнимых с 8. В этом случае можно применять ре-
зультаты исследования задачи оптимального управления движе-
нием по орбите, близкой к круговой, аналогично § 1.
Развитая в § 1, 2 методика может быть распространена на
пространственный вариант задачи управления элементами эл-
липтической орбиты.
Следующие § 3 — 6 посвящены исследованию ряда задач уп-
равления вращениями КЛА относительно центра масс при помо-
щи реактивных двигателей «малой тяги» в рамках модели твер-
дого тела с идеальной системой управления.
§ 3. Управление вращениями твердого тела, близкого
к динамически симметричному, с помощью малых моментов
1. Постановка задачи оптимального быстродействия. Рассмат-
ривается управляемая система (4.1.11) при условиях
Mi = zbiUi, I2 = (1 + ex), = d #= 1,
8 < 1, bi4 d, x ~ 1, i = 1, 2, 3. (6.3.1)
Общее порождающее решение
(Oi = a cos co2 == a sin гр, co3 = c (a > 0, c =# 0) (6.3.2)
используется для приведения к стандартной системе вида (3.1.3)
а = 8 (ZjUi cos гр + l2u2 sin гр) + х/2 8х (2 — d) ас sin 2гр,
с = б/3п3 — 1/28x(i~1a2 sin 2гр; Ц = Ь{Ц\ i = 1, 2, 3,
Ф = (d — 1) с + еа~1[12и2 cos гр — sin гр +
+ нас (cos 2гр — d cos2 гр)],
a(0)=a°>0, с(0) = с0,/=0, гр(О) = гр°. (6.3.3)
208
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
Для (3) ставится задача оптимального быстродействия
а (Т) = а*9 с(Т) = с*л 7"->min, и е U
(а*>0, с°с*>0). (6.3.4)
Ниже исследуются различные случаи ограничений на вектор
управления и, и U.
1.1. Система управления ограниченной суммарной мощности.
Пусть область U задается соотношением
U = {и: и2 = и\ + и22 + (6.3.5)
Тогда из условия максимума функции Гамильтона в первом при-
ближении по е следуют выражения для оптимального управле-
ния (см. § 3 гл. 2)
Pll . Pl2 • . Г13
U1 = cos г|?, и2 = sin 1|), и3 = -у,
/? = [p2(Z2 cos2 г|? + ll sin2 г|?) + г2/з]1/2. (6.3.6)
Здесь р, г — медленные переменные, сопряженные а, с. Усредне-
нием по гр с учетом равенства нулю среднего от гироскопических
членов можно получить Ао = <Я>. При £ = 0 (см. § 3 гл. 3) по-
лучается краевая задача первого приближения:
а* = р"1 <Я> — 1%р~1г2 а (0) = а0, а (0) = а*,
с-=/зг е(О) = е°, е(0) = е*, ( -) = (й/с?т),
(6.3.7)
<7?> = 1; р, г = const, т = е£, т^[0, 0], 0 = еГ.
Средние <Ю и <R~l> в (7) равны
<7?> = (2/л) (Z^2 + Z32r2) = G+ (к),
(IT1) = (2/л) (l2iP2 + ^2) G~ (к), (6.3.8)
G+ (к) = E ( Vk\
G+(k)= -oo<A'<0,
<Г(*)=К(/Г),
G"(A-) = k(]/ VT^~k, -oo</c<0,
* = (P!-^)(P12 + V)-1, -oo<fc<l,
Pi = ZjZj , P2 = ^2^3 \ A, = rp .
Здесь К, E — полные эллиптические интегралы 1-го и 2-го родов.
Система (7) интегрируется элементарно, так как ее правая
§ 3. ВРАЩЕНИЯ БЛИЗКОГО К СИММЕТРИЧНОМУ ТЕЛА
209
часть постоянна. Краевые условия приводят к системе трех
трансцендентных уравнений относительно неизвестных р, г, 0.
Исключением 0 получается одно трансцендентное уравнение от-
носительно X. Это уравнение всегда имеет корень, определяю-
щий искомое решение задачи управления. Отыскание параметра
X как функции известных величин Ц и отношения (а* — а0)/
/(с* — с°) упрощается, если ввести новые параметры:
А = Ш, |А| <
б = № = Zi/Z2, 0<6<оо;
7 =(а* — а0)./(с* — c°)JJ2, 171 < °°;
(6.3.9)
к=(&- 1)/(б2 + А2),
Знак параметра к, т. е. выбор выражений для &*(&), соглас-
но (8) определяется величиной б2 (б2^1). В частности, при
б2 = 1 оба выражения совпадают, а A= I/7. Зависимость А (7, б2)
в общем случае удобно представить в виде семейства кривых с
параметром б2. В результате получаются выражения для искомо
го семейства
Е (У А:) А2 + д2
К (УГ) А
(6.3.10)
<0.
У + ,>'к(14^)л- л-
Семейство кривых Л (7, б2), отвечающих различным значениям
б2, приведено на рис. 6.5. Из (10) следует, что функция Л(7, б2)
нечетна относительно 7; поэтому достаточно построить кривые,
отвечающие положительным у, Л. Определением |Х|, согласно
(6), находятся управление в форме синтеза, траектория и время
быстродействия:
“1,2 = Рх.гЮх.г-Я?1 sign (а* — а),
и3 = | X | aR~x sign (с* — с),
й* = [(Р? + X2) о? + (р22 + X2) со23]1/2, (6.3.11)
а (т) = (а* — а0) т0-1 + а0, с (т) = (с* — с°) т0-1 + с°,
0 = (а* — а°) р + (с* — с°) г, р = (р-1 sign (а* — а0),
Г = Х/ф, <р = <р (X) = (2/л) + Z2X2) G+ (к).
В частном случае, если а(Т) не фиксировано в (4), то реше-
ние получается из (11) при IXI «>:
м1 = г/2==0, и3 = sign (соз — со3), (6.3.12)
а (т)= а0, со3 = с (т), 0 = 0С = | со3 —- со3|/13.
14 Л. Д. Акуленко
210
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
Если же величина со3(7) не фиксируется, то r = Z = O, управ-
ление и3 = 0 (со3 = (О3); и12((о) определяется согласно (11)
при X = О
0 = Qa = (л/2) I а* - а° \/(l3G+ (к)), к=1- l22/l2t. (6.3.13)
При практическом затруднении в реализации управления
(11), требующего определения X, можно последовательно приме-
нять законы при Х = 0 п |Х| =°°. Необходимое суммарное время
Рис. 6.5
1.2. У правление с помощью ограниченных моментов. Рассмат-
ривается задача (3), (4) в случае ограничений
= |щ| ^1, f = l, 2, 3), (6.3.14)
что отвечает трем парам фиксированных в связанных осях дви-
гателей с ограниченной тягой. Поставленная задача оптимально-
го быстродействия приводит к особым управлениям [73, 118]. Из
условий принципа максимума следует, что оптимальное управ-
ление определяется неоднозначно. При этом одна из сопряжен-
ных переменных обращается тождественно в нуль, а соответству-
ющее управление не определено (см. § 6 гл. 2). Однако прибли-
§ 3. ВРАЩЕНИЯ БЛИЗКОГО К СИММЕТРИЧНОМУ ТЕЛА
211
ценное управление с помощью методики § 3 гл. 3 может быть
построено сравнительно просто. Аналогично п. 1.1 получается
система первого приближения
а' =(2/л) (ZI + Z2)v(t), c=Z3u?(t);
, л • , n (6.3.15)
v = sign p, p ¥= 0; w = sign r, r ¥= 0.
Учитывая краевые условия (7), можно найти время быстро-
действия 0:
О = тах{0а, ©с}, ©а= ©с = ^*^-1. (6.3.16)
Функции г(т), kl < 1 и 1г(т), |н?| С 1 в (15) определяются
следующим образом, вообще говоря, неоднозначно:
0 0
= a*-f, Jip(t) dx = c-^~. (6.3.17)
о 1 2 о 3
На основе соотношений (17) синтез оптимального управления
и имеет вид
ul>2 = vs(a, c)signcoi,2, u3 = ire(a, с), (6.3.18)
где rs(a, с), ws(a, с) определяются в текущий момент времени,
т. е. из (17) при а° = а, с° = с. На рис. 6.6 приведены сечения
функции Веллмана 0(а, с), которая представляет собой часть
пирамиды с вершиной в точке а = а* > 0, с = с* 0, отсеченную
плоскостями а = 0, с = 0; I = (2/л) (h + 12).
1.3. Управление при помощи пары верньерных и пары фикси-
рованных двигателей. Рассматривается случай, когда область уп-
14*
212
ГЛ 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
равляющего момента сил ограничена круговым цилиндром, т. е.
U = [и: и\ + и} < 1, | и3 К 1} (Z1>2 = I). (6.3.19)
Поставленная задача, как и в п. 1.2, приводит к особым уп-
равлениям:
Щ 2 = (01 2а~'и, |г|^1; и3 = it, \w\ 1;
(6.3.20)
p = pp(t), v = vs(a, с); гг = ггр(т), w = ws(a, c).
Время быстродействия 0 и функции v, | г I 1; it, 1м? I < 1
из (20) определяются соотношениями (16), (17), в которых
(2/л) (Zi + Z2) = Z.
Аналогично исследуется случай эллиптического цилиндра
при Ц Ф 12.
2. Управление, оптимальное по расходу энергии. Рассматри-
вается задача управления (3), (4) на фиксированном интервале
Т с критерием качества
т
J [и] = -у J u2dZ->min, и = |и|< оо, Т= (6.3.21)
Дополнительные ограничения на и не налагаются. С помощью
методики § 2 гл. 3 находятся в первом приближении оптималь-
ное управление, функционал и медленные переменные:
а* — a wi,2 W3 W3
ui 2 = ~;—Н- ---------из = ----*
1,2 /2 _|_ /2 0 — т а 3 0 —т
(6.3.22)
jo [0] = 0-1 [(а* - а°)2 (Z2 + Z2)-1 + W - с°)2 Z3~2L
а (т) = а° + (а* — а0) т0“\ с (т) = с° + (с* — с°) т0“\
Из (22) следует, что и ~ 0”1, т. е. при достаточно большом
значении 0 управления не достигают налагаемых ограничений,
если таковые имеются. Выражение для Jo известным образом по-
зволяет получить функцию Веллмана (0 0 — т, aQ -> а, с° с)
в исходных переменных ан.
Следует вновь обратить внимание на особенности синтеза
(22) и функции Веллмана при т -> 0, обусловленные постанов-
кой задачи оптимального управления.
§ 4. Управление вращениями несимметричного твердого тела
Рассматривается более общий случай неравных моментов
инерции, пусть для определенности h< 1г< Is. Система (1.1.24)
приводится к стандартному виду (3.1.3) при помощи известных
интегралов энергии Е и величины кинетического момента L
§ 4. ВРАЩЕНИЯ НЕСИММЕТРИЧНОГО ТВЕРДОГО ТЕЛА
213
неуправляемого движения:
2£ = /хСОх + + Z3(o3, (6.4.1)
L2 = Ifal + Z2cd22 + Г3со3, 2ЕЦ < А2 < 2ЕЦ.
Проекции (di(t) выражаются (неоднозначно) при помощи эл-
липтических функций Якоби [81, 236]. В качестве одного из ин-
тегралов движения удобно взять величину к2 (к2 = к2(Е, L2),
*2М0, 1]); к — модуль эллиптических функций, характеризую-
щий движение конца вектора кинетического момента L на сфере
L2 = const. Определение параметра к2, как и указанных проек-
ций со/, неоднозначно; при L2 > 2Е12
к2 = (12 - Л) (Z3 - 12)~'(2Е13 - L2) (L2 - 2ЯЛ)-1,
coj =ai(E, L2)cn(0, к), ю2 = а2(Е, L2)sn(0, к),
(Оз = ±а3(Е, L2)dn(0, к); 0 = 4(К(&)/2л)‘ф,
ali2(£, L2)=[(2EI3-L2)/Ilt 2(Z3 -Л,2)]1/2, (6.4.2)
а3 (Е, L2) = [ (Л2 — 2ЕЦ) /13 (Z3 - Л) ]1/2,
ф = (2л/70) (t — £0) + ф°,
Го = 4К(Л) (АЛЛ)1/2 (Л - Л)-1/2(А2 - 2£Л)1/2.
Здесь То — период функций сог по t, К — полный эллиптический
интеграл первого рода. Выражения для к2, со* в области L2 С 2EIZ
получаются пз (2) заменой индексов 1 -> 3, 2 -> 2, 3 -> 1.
Дифференцирование L(JE) и к2 из (1), (2) в силу управляе-
мой системы (1.1.24) приводит к уравнениям
3 ( 3 \
А = -г- Л, £ = е У bi^iUi ,
L г-1 \ г-1 / (6.4.3)
И2=(дк2/дЬ)Ё + (дк2/дЕ)Ё.
Уравнение для вращающейся фазы ф в первом приближении не
используется и поэтому не приводится. Рассматривается система
управления ограниченной мощности, т. е. случай ограничений
вида (3.5), и ставится задача оптимального по быстродействию
управления медленными переменными L и к2:
Z7(T) = L*>0, £2 = £*2е[0,1], T->min, и2<1.
(6.4.4)
Составляется функция Гамильтона задачи (3), (4) и из усло-
вия ее максимума находятся управления первого приближения
“< = р7р, pi: = <041., i = 1,2,3,
= bJiP/L + biXt(k2)r/L2. (bAt))
Здесь риг — переменные, сопряженные L и к2; — известные
214
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
функции, например, в области L2 > 2Е12\
Xi = 2 [ (Z2 - Z.)Is + (Z, - Z2) Z,F] (1 - ZiX)/[(Z, - Z2) (1 - XZ,) ],
x = [Z2 - Z, + (Z, - Z2) k*]/[ (I2 — Z,)Z, + (Zs - Z2)Z.F],
Подстановка выражений (5) в функцию Гамильтона II при-
водит ее к виду Н* = [4 + В sn2(0, &)]1/2; 4, 4+В>0, где 4 и
В — известные функции L2, к2, р, г и параметров Л, Ьг. Усредне-
ние Я* — неявной функции от ф — заменяется усреднением по
эллиптической амплитуде ср (£5 = 0):
2Л
н0 (V, к\ р, г) = <zz*> = J йф,
Vе) J (1 — к sin cp)1/z
(6.4.6)
sn(0, &)=sin(p, йф = (2л/(4К)) (1 — &2sin2(p)”1/2dq).
При помощи методики § 3, 4 гл. 3 получается усредненная
краевая задача первого приближения
(6.4.7)
L(0) = Л°, к2(0) = /с02; L(0) = А* > 0, к2(0) = /с*2,
Но | е = Но = const >0, Т = GE [0, 0].
В общем случае ее решение можно построить численно. Прак-
тический интерес представляет задача торможения (Л*/£°<1),
в которой значение к2(в) не существенно (и не определено).
Тогда решение краевой задачи принципа максимума типа (7)
приводится к построению семейства кривых задачи Коши (fc*2 —
параметр семейства)
dk2 _ fh2 dp _ dHoldL dr _ OH^/dk2
dL ~ fL' dL~ fL ’ dL~ fL ’ (6.4.8)
/c2(Z*)= **2e[0, 1], p(L*) = -1, r(L*)=0.
Краевое условие для p приводится к виду (8) нормировкой.
Более подробное изложение алгоритма построения приближен-
ного синтеза оптимального управления и расчет примера для
конкретных значений параметров задачи 7г, 6г- содержится в
[229]. Практическая реализация этого алгоритма весьма трудоем-
ка. Расчет оптимального управления представляет интерес для
сравнения с результатами применения локально оптимальных
управлений, определяемых и реализуемых существенно проще
(см. § 5).
§ 5. ЛОКАЛЬНО ОПТИМАЛЬНЫЕ И КВАЗИОПТИМАЛЬНЫЕ ЗАКОНЫ 215
§ 5. Локально оптимальные и квазиоптимальные законы
торможения
Рассматривается задача торможения вращений твердого тела
с произвольными моментами инерции Ц 12 Ц- Построенные
оптимальные законы в общем случае довольно сложны. Поэтому
представляют интерес простые управления, близкие к оптималь-
ным, например локально оптимальные, приводящие к наиболь-
шей скорости убывания интегралов (4.1).
1. Частные случаи области управления. В случае ограниче-
ния (3.5) из условия minuZ, lul^l (см. (4.3)) следует
-1/2 Г 3 2 V/2
, L = — е 2 bi VT < ~ еЬ'у
\i=l L /
(6.5.1)
b = min{61, 62, b3}, 6>0; О L(x) С £° — Ьх.
Закон торможения (1) обеспечивает полную остановку вра-
щений за время 0 С 0L = LP/b.
Аналогично из условия 2?->minu, lul^l (см. (4.3)) мож-
но получить
, Е = -ef2&?o?Y/2< -ер/£;
__________ _ (6.5.2)
min (/2//Д)>0, О<£(т)<(/£о%ртЛ
г=1,2,3
0<0£ = 2/£()/р.
В случае ограничения (3.14) локально оптимальные законы
по L и Е совпадают:
з
Ui,E = —sign СО;, L = — 8 2 Mi I I
(6.5.3)
Ё = — 8 2 bj | co; | E; 0^min{0L, 0£}.
i—1
(3
i=l
(3
1—1
Полученные законы управления (1) — (3) при любых 8>0
гарантируют полную остановку вращений за время Т ~ 8"1. Эти
законы оптимальны в некоторых частных случаях, например
uf оптимально по быстродействию при одинаковых = иг=
= —LiL~{ (см. гл. 8).
Исследование эволюции вращений при некоторых заданных
законах торможения для несимметричного тела содержится в
[229]. Установлено, что величина кинетического момента L стро-
го убывает, а усредненное уравнение для кг допускает стацио-
нарные точки, определяемые параметрами /г, г=1, 2, 3, при-
216
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
чем одна или две из них устойчивы в смысле усредненных урав-
нений. Показано, что к моменту остановки величина к2 достига-
ет устойчивой стационарной точки к2 — k^~(Q — т)\ у >0.
Исследован вопрос о полной остановке вращений за время, близ-
кое к приближенному оптимальному или квазпоптимальному
значению, полученному асимптотическими методами.
2. Область управления общего вида. Оценки времени тормо-
жения вращений твердого тела могут быть эффективно построе-
ны и в некоторых более общих случаях. Например, пусть допус-
тимая область U значений вектора управления и может быть
довольно произвольной: ue[7=[7(L). Предполагается лишь, что
существуют два шара U*(L) и t/*(L) радиусами /?#(А) и
R*(L) соответственно такие, что
L7* (Я) <=C7(L) <=C7*(L), LgD, u<=t7(L),
0 < 7?0 </?*(£)</?*(£)< Я0 < оо, Lg=[0, £°].
Функции /?*(£), 7?*(L) считаются достаточно гладкими. Тогда
на основе неравенства Шварца [49] с учетом включений и нера-
венств (4) для оптимального по быстродействию управления
u = u(L, е) справедливы неравенства (см. также гл. 7) (без ог-
раничения общности полагается bi = l, г = 1, 2, 3)
-еЯ* (Я)>Я = е (i-u) >-еЯ*(£), <6.5.5)
ue{7(L), L е= D, L е [0, Я°].
Пусть функции 7?*(£), 7?* (А) удовлетворяют условию Лип-
шица по L. Тогда существуют единственные решения Ь*(т, Л °)
и А*(т, А0) следующих задач Коши:
L=-eR*(L), Я = Яш(т,Я°);
г 0
L. (6-5.6)
Я=-еЯ*(Я), Я = Я*(т,Я«);
L°
Согласно (6) определяются величины 0*, 0*:
L° ь°
о о
Вследствие монотонности по т функций L* (т, L0), L*(t, L°)
для минимального времени T = T(L\ е) справедлива двусторон-
няя оценка
Т* = 0* (Z,0) е-i > Т (Л°, 8) > 0* (Л°) 8-1. (6.5.7)
§ 6. СТАБИЛИЗАЦИЯ КА НА ЭЛЛИПТИЧЕСКОЙ ОРБИТЕ
217
Возможны аналогичная (4) аппроксимация сверху и снизу
области U эллипсоидами с соответствующими полуосями, допус-
кающими точное аналитическое решение (см. гл. 7, 8), и эффек-
тивное построение оценок типа (7) времени оптимального по
быстродействию торможения вращений несимметричного твердо-
го тела. Изложенная выше схема оценок может быть непосредст-
венно обобщена на случай, когда область U = U (t, L).
§ 6. Стабилизация КА на эллиптической орбите
с помощью малых управляющих моментов
1. Уравнения движения и постановка задачи управления. Рас-
сматривается движение спутника относительно центра масс под
действием суммы М гравитационного G и управляющего мо-
ментов сил. Для его описания вво-
дятся три декартовы системы ко-
ординат (см. [221, 229]): 1) ор-
битальная ориентирован-
ная по радиус-вектору перигея
и скорости центра масс О в пери-
гее; 2) связанная с вектором ки-
нетического момента L система
Оу}у2у3 и 3) связанная с главны-
ми центральными осями инерции
тела система Oz^z^ задаваемая
относительно Оу^2уз углами Эй-
лера 0, ф, 4*’ и направляющими
косинусами (а«). Ориентация оси
Оу3 (вектора L) в системе
Ш'1^2^3 определяется сферически-
ми углами р, а (рис. 6.7).
Движение системы в указан-
ных переменных описывается следующими уравнениями [221]
L = М3, р = MTL \ o’ = М2 (L sin р) \ М = G +
О = L sin 0 sin ф cos ф (Л 1 — I2 х) + (М2 cos 4 — sin 4) L \
Ф = L cos0 (771 — Ii1 sin2 ф — I2r cos2 ф) +
+ (М2 cos 4 — Mi sin 4) (A sin 0)”1,
4 = 1/ (Ii1 sin2 ф + I2r cos2 ф) — A"1 (Mi cos 4 +
+ M2 sin 4) ctg 0 — L~rM2 ctg p,
v = v0 (1 + e cos v) (1 — e2)-^ 0 < e < 1, (6.6.1)
218
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
3 3
<?i = 3vo (1+2;у 2 - РзМаО (1, 2, 3),
3
Sjj = 2 Pi = cos p cos (v — o),
k=i
P2 = sin (v — o), p3 = sin p cos (v — o).
Здесь v — истинная, v0 — средняя аномалии движения центра
масс; е — эксцентриситет, компоненты G2,3 получаются из
С\(0, ср, г|?) циклической перестановкой индексов.
Система (1) является существенно нелинейной и многочастот-
ной; непосредственное применение метода усреднения здесь про-
блематично. Ставится задача оптимального управления:
о
А (7’) = £*<Л°, J[v] = -1- f Wx -> min , <U = ev (6.6.2)
e J |v|<oo
при условии выполнения ряда упрощающих предположений (см.
далее).
2. КЛА, близкий к сферически симметричному. Пусть
Л = 7(1 + еДг), G~e, 7, Дг, v0, А ~ 1. (6.6.3)
Тогда имеются только две вращающиеся фазы: фаза 4 = Ы~Ч +
+ 4° и фаза переменной v, причем v не зависит от L, 8 и дру-
гих переменных. Формально применяется методика § 2 гл. 3, см.
также § 5 гл. 4; для управлений получаются представления
Vi = 1/2ррЬ~\ v2 = 1/2Po(£sinp)~1, v3 = l/2pL. (6.6.4)
Здесь и далее через р с индексами р, a, L и т. п. обозначены
соответствующие сопряженные переменные. После подстановки
выражений (4) в функцию Гамильтона Н проводится независи-
мое усреднение по фазам 4 и v(0 в соответствии с [221]. Систе-
ма двухчастотна, и в ней возможны резонансы [221, 229] (см.
Gi в (1)):
ЬГ"1 = nv0, nv0, -g- nv0, n = 1, 2, ... (6.6.5)
Следует отметить, что управления Vi в (4) зависят только от
медленных переменных и не добавляют новых резонансов. По-
скольку в управляемом движении величина L изменяется (убы-
вает) монотонно, то управляемая система «не застревает на ре-
зонансах» (5), а число возможных резонансных соотношений ко-
нечно и определяется величиной L°/(Iv0). Это обстоятельство
оправдывает применение метода усреднения, однако точность ре-
шения по медленным переменным существенно ниже, порядка
Veins"1 на интервале времени £~1/е [47, 163] (см. § 5 гл. 4).
§ 6. СТАБИЛИЗАЦИЯ КА НА ЭЛЛИПТИЧЕСКОЙ ОРБИТЕ
219
Итак, после усреднения получается выражение
<//*> = e/i*,
h* = -%- [pl+L~2(pp + p§sin-2p + ре +
+ Рф sin-2 0)] + У-1 (Д2 — At) pqLD sin 0 sin (p cos <p +
+ I^p^LD cos 0 (Aj sin2 cp + A2 cos2 ср — A3) + ра£-1Ф cos p,
D = 1 - (3/4) I*v2L~2 (1 - e2)~3/2 (1-3 cos2 p), (6.6.6)
ф = (3/4) Zv2 (1 - e2) [Дх + Д2 + A3 -
— 3 (Ax sin2 ср + Д2 cos2 cp) sin2 0 — ЗД3 cos2 0].
Из структуры h* (6) следует, что краевая задача для сопряжен-
ных переменных допускает решение вида pL = const, рр = ра =
= Рв=рФ^0. Остальные медленные переменные описываются
усредненными уравнениями в медленном времени т = е^[0, 0J:
L' = 72pL, р =0, о’ = Ег'Ф cos р,
0 = 1~' (Д2 — Д1) LD sin 0 sin ср cos ср, (6.6.7)
<р’ = I-'LD (Д1 sin2 ср + Д 2 cos2 ср — Д 3) cos 0.
Система (7) допускает полное интегрирование:
L (т) == L° + (А* - А0) тб"1, pL = 2 (А* - А0) О"1, р (т) == р°,
(6.6.8)
а(т) = а0 н----- In[1 — fl — -^-1 cosр°, Ф = Ф°.
7 L* — L° L \ LQ) в J г ’
Так как управления являются медленными переменными
[154], то они могут быть представлены как в виде программы,
так и синтеза (yf (т), р*(т, L)):
= 0, V* = (L* - А®) О’1; /0 = (А® - Л*)2©"1; (6Л9)
i/1>2 == 0, vs3 = (L* - L) (0 - т)”1; V = (L - Л*) (0 - т)“\
Здесь V — функция Веллмана задачи; следует иметь в виду осо-
бенность функций Vе и V при т -> 0. Таким образом, прибли-
женное оптимальное управление направлено против кинетиче-
ского момента, что отвечает физическим представлениям. Проек-
ция его на оси Ozjz2z3 приводит к выражениям
Ui = v3 sin 0 sin (p, u2 = v3 sin 0 cos cp, u3 = y3cos0. (6.6.10)
Более подробное изложение способа построения решения и
сравнительный качественный анализ по отношению к неуправ-
ляемому движению [221] содержится в [229] для аналогичной за-
дачи с нефиксированным временем. Проведенное исследование
представляет определенный интерес, так как позволяет рассмот-
220
ГЛ. 6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КЛА С «МАЛОЙ ТЯГОЙ»
реть вращения КЛА с угловыми скоростями, сравнимыми (и го-
раздо меньшими) со скоростями углового движения по орбите.
3. Торможение быстрых вращений КЛА, близкого к динами-
чески симметричному. Рассматривается задача оптимальной ста-
билизации (1), (2) при условии Л, 2 = 7(1 + eAi, 2), где 8 =
= (co°/v0)2 <1. В качестве единицы времени выбирается интер-
вал порядка периода оборота тела 710 = 2л/со. Движение исследу-
ется на промежутке t~ Тоъ~1. За это время КЛА совершит по-
рядка 8-1 оборотов вокруг центра масс О, который сделает по-
рядка 8“1/2 оборотов по орбите. Из (1) следует, что 0 ~ 8, т. е.
0 — медленный угол нутации. Как установлено в [221], резонан-
сы между быстрыми переменными углом прецессии 4 и чистого
вращения ф не возникают. Проводя «частичное» усреднение по
и ф методом разделения медленных и быстрых переменных
1[58, 69] (по v(t) усреднение не производится), можно вновь
прийти к выражениям (9), (10) для оптимального управления и
функционала. Интегрирование усредненных уравнений для мед-
ленных переменных L, р приводит к выражениям (8), а 0 и о
равны
0=0°, o = o° + -i / „Ур (3 cos2 0° — 1) cos р° f-1-— ecos v(t)) j
4 (1 — e2)3 J l(t)
Выражения для усредненных угловых скоростей ф и г|? в пер-
вом приближении по 8 примут вид
IV] , 3 7 — 73 2 /1 4-6>cos v
ьт;1] + т —) х
X {2 — 3sin2p°[l + cos2(v —о)]} cos9°,
/ — 73 2 / 1 Ч- е cos у \3
т дГ1 1 f 1
Ф = L coso-------o’ "7“
L 7з 6 \ 71
1 г / 1 , 1 \ 3 _,____________ ,
2 L (/i + /2 ) 4 L М 1 — *2 J Х
X {(3 cos2 0° — 1) [ 1 + cos 2 (v — о)] cos2 р° —
— 3 cos20° sin2 p° [1 + cos 2 (v — a)] + 2 cos2 0°}.
Интегрирование усредненных уравнений для ф и ф приведет,
вообще говоря, к погрешности 0(1) на асимптотически большом
интервале времени. Для построения более точного решения нуж-
но вычислить медленные переменные L и 0 с погрешностью
О(82).
Таким образом, полученные на основе методики гл. 3 резуль-
таты аналитического и численного исследования управляемых
орбитальных движений и вращений твердого тела относительно
неподвижной точки (центра масс) показывают ее практическую
эффективность. Эти результаты могут быть использованы на
предварительной стадии проектирования систем управления для
определения их предельных возможностей.
ГЛАВА 7
МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
ДЛЯ ПРИБЛИЖЕННОГО СИНТЕЗА
ОПТИМАЛЬНОЙ СТАБИЛИЗАЦИИ
ВОЗМУЩЕННЫХ УПРАВЛЯЕМЫХ СИСТЕМ
С ИНВАРИАНТНОЙ НОРМОЙ И ЭКВИВАЛЕНТНЫХ ИМ
Развивается метод приближенного построения функции Велл-
мана в задачах оптимальной по быстродействию стабилизации
для класса возмущенных систем при помощи управлений ограни-
ченной мощности. При этом учитываются как внешние возму-
щения, так и внутренние, в том числе возмущения в системе уп-
равления. Проводится обоснование решения соответствующей за-
дачи Коши для уравнения Гамильтона — Якоби — Веллмана,
обладающего конической особенностью в начале координат. Рас-
сматриваются вопросы реализации законов синтеза. Исследуются
задачи стабилизации вращений твердого тела.
§ 1. Оптимальная по быстродействию стабилизация
возмущенной системы с инвариантной нормой
1. Постановка задачи оптимального управления. Рассматри-
вается управляемая система вида
У = Ш + ^(у)+[1+гР(у)]и, у(О)=у°. (7.1.1)
Здесь у, и, /о, / — n-векторы; I — единичная, F — произвольная
(п X п)-матрицы, 8 > 0 — скалярный числовой параметр, 8 е
[О, 80]. Функции /о, /, F предполагаются заданными в некото-
рой выпуклой области Dy, включающей точки у = у° и у = 0, и
достаточное число раз дифференцируемыми. Они могут также
непрерывно зависеть от 8. Область Dy можно представить как
n-мерный шар радиусом р, где р = const > |у°|, с центром в на-
чале координат.
Относительно управляющей вектор-функции и предполагает-
ся, что она подвержена ограничению U:
U = {и: |u|1 2^u02, и° = const>0). (7.1.2)
222
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Не теряя общности, можно считать в (2), что и° = 1 (после за-
мены времени t = t*/uQ). Предполагается, что неуправляемая не-
возмущенная система (1), т. е. при и 0, 8 = 0, является систе-
мой с инвариантной нормой [49]:
(П*/о(у))=О, y^Dy, (7.1.3)
ц = уА, h= \у\ е= [0, fe°], fe°=|y°|.
Здесь и далее ц— орт вектора у, (•) —скалярное произведение.
Из (3) следует, что h(t)=hQ при 8 = 0, и = 0; поэтому
1уг(01^^°» * = 1» • • ч п- В механике силы /0, обладающие свой-
ством типа (3), называются гироскопическими [76, 139]; их
«мощность» в каждый момент времени равна нулю.
Синтез оптимального по быстродействию управления, приво-
дящего невозмущенную систему (1) в начало координат, опре-
деляется при помощи функционального неравенства Шварца [49]:
— 1 <й = (т] • u)< 1, uQ(y)= — ц; (7.1.4)
hQ = hQ (t, h°) = h° (1 - t/TQ), TQ = TQ (h°) = h°.
Здесь uQ(y)—синтез управления оптимальной стабилизации,
TQ — время быстродействия. Интегрируя задачу Коши после под-
становки функции и0(у) =—ц в систему (1) при е=0, можно
получить невозмущенные оптимальные фазовую траекторию и
программное управление
У = Уо(*, У°), uQ(t, у°) = -т](£, у°) = -уо/Ло. (7.1.5)'
Далее функция yQ(t, у0) предполагается известной.
Посредством замены у = zh0 для неизвестной z получается
задача Коши:
z = z(O) = n° (Ч = -1)- (7.1.6)
Вследствие сделанных предположений гладкости /о(О) = О, и по-
этому задача Коши (6) имеет единственное решение в Dy. Если
/о — однородная функция степени т > 1, то (6) приводится
к виду
t
g- = /0(z), z(O) = n°, (7.1.7)
о
т. е. к системе с инвариантной нормой. Таким образом, в этом
случае достаточно знать общее решение системы при и 0,
е = 0, для которой норма является первым интегралом.
Функция Веллмана невозмущенной задачи управления, т. е.
неотрицательное гладкое решение соответствующей задачи Коши
для уравнения Гамильтона — Якоби [62, 118] (или уравнения
Веллмана [61]), получающейся в результате применения доста-
точных условий метода динамического программирования [53,
§ 1. СТАБИЛИЗАЦИЯ СИСТЕМЫ С ИНВАРИАНТНОЙ НОРМОЙ
223
61], равна Z0(z/)=fe. Оптимальное управление и0(у) получается
на основе TQ(y): uQ(y)=—(dTQ/dy)\dTQ/dy\~l = --x] (см. ниже).
Применение управления и0(г/) (4) позволяет полностью ста-
билизировать возмущенную систему (1) при достаточно малом
8. Это утверждение следует из уравнения для h= \у\
й = -1 + 8(п -(/-/ц)), fe(0) = fe°, (7.1.8)
и ограниченности множителя при 8 для рассматриваемых у Dv.
Погрешность по времени быстродействия и фазовой траектории
составит, вообще говоря, величину 0(e). В прикладных задачах
может оказаться необходимым учет возмущений, т. е. решение
задачи оптимального управления с более высокой степенью точ-
ности по 8.
Ставится следующая задача оптимального управления движе-
нием возмущенной системы (1). Требуется найти с заданной
степенью точности по 8 синтез оптимального по быстродействию
закона управления и = и(у, е), минимальное значение времени
Т = TQ(y\ 8), необходимое для стабилизации системы, а также
построить возмущенную фазовую траекторию y(t, у°, е) та-
кую, что
У(0, У\ 8)=у°, У(Г(у°, 8),у°, 8)=0,
У& у\ О)=уо(^ г/°), (7.1.9)
а вместе с нею и программное управление u(t, у°, е).
2. Управляемые вращения твердого тела. В качестве важного
примера системы типа (1) рассматриваются динамические урав-
нения Эйлера (1.1.28) в покомпонентной записи:
Л»! + Чз -- Л) «2®з = мг, ®1(0) = ®$ (1,2,3). (7.1.10)
Здесь цифры в круглых скобках означают циклическую переста-
новку индексов, Mi = biUi (i = l, 2, 3) — управляющие моменты
относительно каждой из связанных осей, 6, = const > 0, — уп-
равления, ограниченные неравенством (2). Ставится задача о пе-
реводе фазовой точки сог системы (10) из начального состояния
со? в начало координат (cot(Z)=0, f=l, 2, 3) за минимальное
время Т, т. е. задача оптимальной по быстродействию стабилиза-
ции тела. В общем случае аналитическое решение построить не
удается. Для установления соотношения между параметрами L
и bi, при которых имеет место равенство (3), вводятся перемен-
ные Zi = где Li = Z,coi — компоненты вектора кинетиче-
ского момента. Уравнения (10) приводятся к виду
21 + (Z3 12^ I2 ^3 lz2z3 Uli Z1 = (1» 2, 3).
(7.1.11)
224
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Условие инвариантности (3) для системы (11) выполняется,
если параметры Ц и bi связаны соотношениями:
2 £i±LZZi±£^±L^±L = 0, Ь1+з=Ъг, (7.1.12)
°г Л+1 Уг+2
ИЛИ
Л (Л Л) ^2^3 + А (Л — Л) bl + 1.3 (/2 — /j) ь[ь1 — 0.
Устанавливается с учетом неравенства треугольника для Л,
что множество таких значений параметров Л, bi непусто. Равен-
ство 12) можно представить в более удобном виде (7t^ Ih
= 7?/2 (ИЛ + v)"1/2, i = 1, 2, 3. (7.1.13)
Здесь ц, v — произвольные постоянные, такие, что подкоренное
выражение положительно. В приложениях встречаются следую-
щие частные случаи выполнения условий (12), (13).
1. Твердое тело с произвольными моментами инерции 13 >
>72>Д>0: a) bi = b (i=l, 2, 3)—вектор z коллинеарен L;
L = 6z; б) bi = 67-/2, Zi = li^b"1^ (b3 > b2> > 0) — квадрат
нормы вектора z пропорционален кинетической энергии:
Е = l/2bz2.
2. Для динамически симметричного тела (Zi = I2 = I) равен-
ство (12) выполняется при bi = Ь2 = Ь; при этом 13, Ь3 — произ-
вольны. При lb"1 = 13Ь31 вектор z коллинеарен угловой скорости:
Z = 1Ь~1(д.
3. В случае сферически симметричного тела 7г = I соотноше-
ние (12) выполняется при любых bi > 0, i = 1, 2, 3.
Итак, если равенства (12) или (13) справедливы, то, соглас-
но (4), синтез закона торможения вращений и время быстро-
действия суть
Щ = — z{z-1, То (z) = Z, Z = I ZI = (z? + Z2 + z|)1/2,
(7.1.14)
z = z0 (t, z°) = z° (1 — t/T0 (z0)), Zi = if i = 1, 2, 3.
Оптимальное управляемое движение z^t) строится на основе
движения свободного твердого тела (Эйлера — Пуансо), описы-
ваемого в случае 1 несимметричного тела при помощи эллипти-
ческих функций Якоби [46, 140, 236]. Не конкретизируя записи
(см. § 2 гл. 6), компоненты угловой скорости можно записать
в виде
ю. = о.0 + т, 7Д Е°); т, L°, EQ = const, i = 1, 2, 3. (7.1.15)
Здесь Ого выражается через эллиптические функции Якоби sn,
сп, dn [81, 236]. Решение для управляемой системы (10) имеет
вид Li = zZj, где неизвестные Ц удовлетворяют системе уравнений
§ 1. СТАБИЛИЗАЦИЯ СИСТЕМЫ С ИНВАРИАНТНОЙ НОРМОЙ
223
Эйлера, описывающих свободные вращения:
+ Уз = 0) /1(0) = ^. (1,2, 3),
aS 1213 2
t
s = J zo(0, z°)d,Q = z°t(l— l/2t/T0), T0 = z°. (7.1.16)
0
В результате для оптимальной траектории сог получается
представление
Li = Zo(Oio(s+s0, L°/z\ EQ/zQ2), 5° = const. (7.1.17);
Очевидно, что L{ |т0 = 0, так как 20(Г0, z°) = 0 согласно (14).
3. Построение приближенного синтеза оптимального быстро-
действия на основе метода динамического программирования.
Строится неотрицательная дифференцируемая функция Веллмана
Г(у, е), обращающаяся в TQ(y) = h при е = 0. Она удовлетворяет
уравнению и краевому условию
(у) + e/(y)]J + + eF (*/)]“) = -1»
(7.1.18)
Т(0, е) = 0, &е[0, е0].
Минимизация линейной по и функции в (18) приводит к
замкнутой задаче Коши для нелинейного уравнения в частных
производных
(I I/. W + W1) - | 17 + гF (S)! | - - 4, (7л 19)
Г(0, е)=0, ее[0, е„]
и выражению для оптимального управления
u* = ~ f + eF> I аТV + eF) Г"’ “*2 = L (7Л-2°)
Решение задачи (19) имеет в начале координат особенность —
коническую особую точку [172, 197]. Оно строится в виде раз-
ложения по степеням малого параметра е:
Ш е) = Го(у) + еЛ(у) + ... + еТЛу) + ...,
Л(0) = 0, / = 0,1,... (7.1.21)
Здесь неизвестные коэффициенты Tj определяются в результате
последовательного решения зацепляющихся задач Коши
г’"(0)-0;
(7.1.22)
^0, ;>1.
15 л. Д. Акуленко
226
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Первое уравнение (22) нелинейно, а все последующие линей-
ны с известными правыми частями Vj(y), определяемыми через
Z0(y), 7\(у), ..., Т^-Ду), вычисленными на предыдущих шагах;
например:
(7.1.23)
Для произвольных значений индекса 7 = 1, 2, ... функции
Vj(y) определяются соотношениями
[I \ дТ I 1 1
Ьг’-тгНг + Wi +eRi--- (7Л-24)
Непосредственно устанавливается, что Z0(y)=fe = lyl — реше-
ние задачи Коши (22) для j = 0. Из достаточных условий опти-
мального синтеза [61] следует, что TQ(y)— функция Веллмана
невозмущенной задачи оптимального управления. Следует отме-
тить, что решение задачи Коши (22) для TQ неединственно. На-
пример, функция TQ(y) = (c • у), Id = 1 (при /о —0) также явля-
ется решением, однако оно не удовлетворяет достаточным усло-
виям оптимальности.
Скалярное произведение (dTJdy • /0) — 0 в (22) на основе (3)\
а величина IdTVdyl s 1. Поэтому формальные разложения (21) —
(24) справедливы при достаточно малых е>0. Функция Z0(y).
определяет синтез управления согласно (20): u0(y) =
= -(ЗТо/5у)|аТо/5уГ1 = -п.
Решение задачи Коши для / > 1 строится методом характери-
стик [172, 197, 218]. Это оказывается возможным, так как сумма
квадратов коэффициентов при компонентах вектора dTj/dy стро-
го положительна: (/0 (у) — ц)2 = 1 + /о (У) 1 > 0. На основе вы-
шеизложенного уравнения характеристик приводятся к виду
dh = dV1 _ dyn = dT.
-1 /охМ-1»! /оп(г/)~Пп V}(y)’ ^•1‘ >
Здесь первое отношение является производной пропорцией от п
последующих. Общий интеграл (25), согласно (5), можно пред-
ставить в виде
y* = y<>(t, y0) = y0(fe° — й, У°)=У*(й, У°). (7.1.26);
Выражение для Г, (у), обращающееся в нуль при у = 0, со-
гласно (25), (26) равно
h
Ti (У) = - J V; (У* (Z, У)) Д 7 = 1,2,... (7.1.27)
о
§ 1. СТАБИЛИЗАЦИЯ СИСТЕМЫ С ИНВАРИАНТНОЙ НОРМОЙ
227
Таким образом, функция Веллмана определяется однозначно в
виде (21), (27) с заданной степенью точности по 8, которая огра-
ничивается свойствами гладкости системы (1). Для обоснования
развитого приема построения приближенного решения задачи Ко-
ши (19) нужно рассмотреть задачу о приведении фазовой точки
в ц-окрестность начала координат за минимальное время а за-
тем перейти к пределу при ц I 0. Оказывается (см. § 5), что рав-
номерный по 8, у (\у\ >0) предельный переход существует и в
пределе для Т^(у) получаются выражения (27).
Оптимальное управление и* (у, 8) находится в результате под-
становки Т(у, е), согласно (21), (17), в (20). Функция и*(у, 8)
удовлетворяет ограничению (2) точно. Если же представить ее
в виде разложения
U*(y, 8)= — Г] + 8П1(у) + . . . + EjUj(y)+ 8J+1. . .
-ц + 8й(У) (у, 8)+ 8j+1.. ., (7.1.28)
то ограничение (2) удовлетворяется с погрешностью O(eJ+1).
Коэффициенты ..., щ определяются дифференцированием
ГДу), 7 ^1» в частности
«1 (у) = П -п) - ПП + (у), Ut=-i\F + TiPKj. (7.1.29)
Аналогичный (29) вид имеют коэффициенты и, при / > 1, где
Uj(y) определяются аналогично скалярным функциям Wj в (24).
4. Построение приближенной оптимальной траектории. После
подстановки управления п*(у, е) (28) в системе (1) получается
замкнутая задача Коши для определения оптимальной фазовой
траектории y = y(t, yQ, &). Функция у строится с заданной сте-
пенью точности по 8 методом последовательных приближений в
виде у = у0 + 8х, где неизвестная х удовлетворяет квазилинейной
системе
Х= + p(t) + еР (t, х, е),
Р(О = /(г/о) + ^(г/о)т]о + «(0,е)=0, (7.1.30)
t е [0, T(j) (у°, е)], = Т» + 8 Г. +... + 8%
Здесь Р(7, х, 8) — известная функция, гладкая по х в рассматри-
ваемой области. Решение задачи Коши (30) строится последова-
тельными приближениями по схеме
t
xk (t, 8) = х0 (t) + &X (t) § X”1 (т) P (t, xk_-x, 8) dx, k= 1, ..., ]— 1;
° (7.1.31)
t
x0 (t) = X (t) § X-1 (x) p (x) dx, X(t) = d^0, X(0) = L
15*
228
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Здесь X(t) — фундаментальная матрица решений невозмущенной
системы в вариациях. Последовательные приближения (31) опре-
деляют единственное решение е) с погрешностью O(eJ),
а У— искомую оптимальную фазовую траекторию с
погрешностью <?(ej+1), причем (у0, е), у°, e) = O(ej+1).
Следует отметить, что особенность в (31) при t -> не воз-
никает.
Можно предложить другой способ интегрирования задачи Ко-
ши (1). Пусть для системы при 8 = 0 известен «полный набор»
интегралов вида
с = С(г/о), 1р = о(?/о) = Ят (с, т = const); г/о = у(г|), с).
Дифференцированием с, 1|) в силу возмущенной системы (1) по-
лучаются уравнения в оскулирующих переменных для £^[0, Г]:
c=e^<p(y0,e). С’ = С(г/»), (7.1.32)
ф = 1 + 6(S(рФ0 = ст(У0)’ у0 = */(Ф>с),
ф (Уо, = t (Уо) + F (Уо) “(*) (Уо* е) + Й(Л (»0. е)-
Уравнение для переменной h имеет вид, аналогичный уравне-
нию (32) для ф:
h == — 1 + е (По * (/ (Уо) + йу) (Уо, е)]) +
+ е(л-Р(Уо)и*п(Уо> 8))> fe0 = |K°h По = Уо I Уо Г1- (7.1.33)
Неизвестные с, тр строятся по схеме типа (31):
t
С дСъ_л
ck(t, е) = с0 4- ej (fk^dr, с0 = С(у°), к = 1, ...,; — 1,
t
С I — Л \
е) = ф0 + е / —— •(pft_1)c?T, ф0 = t + а (у0), (7.1.34)
о \ У° >
Ск — С(у(^к,сК)), о^а(р(фА, с*)), ф*^ф(НФ*, сА), е).
Аналогично интегрируется уравнение (33) для h.
Подстановка найденной приближенной оптимальной траекто-
рии 2/(j)(^, у\ е) в (20) или (28) приводит к программному
управлению у°, g) с указанной погрешностью <?(вж) для
ТМ е)1-
Таким образом, решение поставленной задачи оптимального
по быстродействию приведения фазовой точки системы (1) в на-
чало координат — задачи наискорейшей стабилизации — с задан-
ной степенью j точности по 8 полностью построено. Вопросы обо-
снования развитого подхода рассматриваются в § 5.
§ 1. СТАБИЛИЗАЦИЯ СИСТЕМЫ С ИНВАРИАНТНОЙ НОРМОЙ
229
5. Торможение вращений твердого тела, близкого к сфериче-
ски симметричному. Для иллюстрации рассматривается задача
оптимальной по быстродействию стабилизации твердого тела в
случае 3 п. 2.
Пусть Л = 7(1 + exf), 7 = 1, 2, 3, где е<1, xf ~ 1, a bf>0 —
произвольны (bi~ 1). Тогда система (И) имеет вид
Zj = ZZi 6й1222з, Zj (0) = Zj (zj = b, I
(7.1.35)
«I = (Ь2Ьз/^1) (x2 — X3) (1 + ехз)-1 (1 + ехз)-1 (1, 2, 3).
Через r{ обозначаются производные rc^dT/dz^ где Т = е) —
функция Веллмана, определяемая согласно (19), (20):
R + е (aj\z2z3 + a2Zir2z3 + a3ZiZ2r3) = — 1, Г(0, в) = 0,
(7.1.36)
7?=|г|, г = (п, г2, г3), u = -r7?-1.
При помощи методики п. 3 на первом шаге (/ = 0) получается
задача Коши, соответствующая невозмущенной системе; в ре-
зультате
7?0=1, 7о(О) = О; 7o(z)=|z|=z, r0 = n = z/z. (7.1.37)
Уравнение для Т1 линейно с известной неоднородностью
(т) • Pi) = —aiT]iZ2z3 — a2Zit]2z3 — a3ZiZ2i]3, Л (0) = 0,
П = (t]i, т]2, Пз), ru = Zi/z. (7.1.38)'
Решение задачи Коши (38) строится однозначно методом ха-
рактеристик [172, 197], так как т)2 = 1 (=/=0). В результате
J1i(z)==Aziz2z3l А = — (1/3) (ai + а2 + а3). (7.1.39)
Здесь и далее все значения индексов равноправны. Аналогично
определяются следующие коэффициенты T’j(z) (/>2), например:
Т2 (z) = - (1/30) Az-1 [12 (zxz2z3)2 + (5z32 - z?) za4 +
+ (бгг — z2) z3 — (z2 + z2) zf] + a2 [12 (z^z^ +
+ (5z| — z2) Zi + (5zx — z2) z* — (z2 + z3) z4] +
+ a3 [12 (zxz2z3)2 + (5z2 — z3) z* + (5z2 — Z3) z[ — (zx + z2) zf]|.
(7.1.40)
Громоздкость выражений для Tj(z) быстро возрастает с ро-
стом /. Из оценок |Tj| ~ (laj + k2| + la3l)z2J+1 следует, что раз-
ложение типа (21) будет равномерно сходящимся к единственной
гладкой всюду, кроме точки z = 0, функции T’ = Z(z, е), если е
достаточно мало:
О^8^8о<(Ы + Ш + кз!)-1^0)-2. (7.1.41)
230
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Следует отметить, что ^(z)s0 при Л = 0, так как в этом
случае точно удовлетворяется условие инвариантности (13),
а Т (z) = z.
Оптимальное управление с погрешностью О(е2) равно
41)1 (z, е) = - Hl + е [ill (n2r2,i + W3,i)-(п! + п!) 4,1] (1, 2, 3).
(7.1.42)
Уравнение для z, согласно (8), после подстановки управления
первого приближения U(d = — ц + еи^ принимает вид
z = -1 + ЗеЛ*-1 + е (т) • uO + 82.. , z(0) = z°. (7.1.43)
Так как (т) -uJ^O, то из (43) следует, что
Z = Z° - t + 8 Л (z°) (z°) -3|[ (z°) 3 - (z° - t) 3] + 82. . .
При значении t = T(1) = z° + 8?\ (z°) величина z(T(1), 8) = O(e2),
т. e. вектор z, а вместе с ним и co, приводятся в 82-окрестность
начала координат. Если ис-
пользовать управление пер-
вого приближения (42) для
приведения системы (35) в
состояние покоя, то погреш-
ность по функционалу будет
О(б2): потребное время будет
больше на указанную величи-
ну. Аналогичные рассужде-
ния справедливы и для более
высоких приближений. Нуж-
но отметить, что ^(z)s0,
/ = 1, 2, ... при bi = b9 т. е.
А = 0, Т = z = b~'L — функ-
ция Веллмана «невозмущен-
ной» задачи оптимального
управления (L = (Ll1 L2, L3),
£i = Zi(Oi)-
На рис. 7.1 приведены се-
чения поверхностей уровня
функции Т первого приближения: Т(1) = z + e7\(z) = с > 0 плос-
костями Zi = const. Введением новых переменных 5» = zjc уравне-
ние поверхности уровня приводится к ВИДУ 51 + £2 + £з~
— 2а5152£3 ==li где а = е4с2. Сечения £i = const (1>^>0)
представляют эллипсы с малым эксцентриситетом 0(e), оси ко-
торых повернуты на угол л/2 по отношению к осям координат.
Значения параметра а на рис. 7.1 брались равными а = 0иа =
в 0,3. Сечения плоскостями z2,3 = const совпадают с построенны-
ми на рис. 7.1.
§ 2. СИСТЕМА, БЛИЗКАЯ К СФЕРИЧЕСКИ СИММЕТРИЧНОЙ
231
§ 2. Оптимальный по быстродействию синтез стабилизации
возмущенной системы, близкой к сферически симметричной
1. Постановка задачи синтеза оптимального управления. Рас-
сматривается в открытой области Dx управляемая система вида
i = f(x, e) + [I + eF(x, e)]u, x(fi) = x°. (7.2.1)
Здесь x, и — ^-векторы; /, F — достаточно гладкие функции при
x^Dx\ е [0, е0], где е0 < 1; ограничение на управление и име-
ет вид (1.2). В отличие от (1.3) предполагается, что невозмущеп-
ная неуправляемая система (1) удовлетворяет условию
(П*/о(а:))^(р(Л), x^Dx, (7.2.2)
y} = x/h1 fe=lxl, /о(я) = /(я, 0).
Здесь рассматривается пока частный случай выполнения условия
(2), а именно когда /0(я) есть градиент гладкой функции Ф(Д):
h
/о (*) = = Ф (ft) П, х (= Dx; Ф(/г)=^ <p(s)ds. (7.2.3)
о
Известно [49], что в этом случае синтез оптимального управ-
ления, как и в § 1, находится при помощи неравенства Шварца.
Решение задачи оптимальной по быстродействию стабилизации
невозмущенной системы существует при 1 — ср (h) > 0 для h е
е [0, h°] и имеет вид
h
u0(x) = -n, г = е(/^»)== h = h0(t,h°),
л®
То (№) = 0 (0, h°),
х = х°ехр
Ф(М~ 1
Мт>
dr
(7.2.4)
= i]oho (t, h°).
Здесь второе соотношение однозначно определяет функцию
h0(t, h°) и время быстродействия T0(h°). Как следует из выраже-
ния (4) для х, фазовый вектор х 0 при 11 То, причем фазовая
точка движется вдоль прямой, соединяющей точки х = х* и х = 0,
со скоростью й = (г)-x) = (p(fe)—1; программное управление по-
стоянно: uQ(t, х°) = — ц°.
Основываясь на решении (4), можно поставить задачу опти-
мального по быстродействию приведения фазовой точки системы
(1) при е^(0, е0]. Требуется, как и в § 1, найти с заданной сте-
пенью точности по е синтез оптимального закона управления
и(х, е), соответствующее ему минимальное значение времени
быстродействия Т(х\ е) и оптимальную фазовую траекторию
x(t, х°, е), а тем самым и программное оптимальное управление
н(£, х°, е).
232
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
2. Построение функции Веллмана и оптимального управления.
Поставленная задача решается на основе достаточных условий
метода динамического программирования [53, 61]. В предположе-
нии достаточной гладкости функций /, F по х, е строится функ-
ция Беллмапа Т(х, е) разложениями по степеням е решения
задачи Коши:
(р •/(*, е))- \p[I+sF(x, е)]| =-1,
р = дТ/дх, Г (0, е) = 0.
При построенной функции Т(х, е) искомое управление и
равно
и(х, &) = —p[I + sF (х, e)]lp[Z + eF(x, е)]!"1. (7.2.6)
Аналогично (1.22) решение нелинейного уравнения в частных
производных (5), имеющее при х==0 особенность — коническую
точку [172, 197], строится в виде разложения
Т(х, г) = Т0(х) + гТ1(х)+... + ehTk(x). (7.2.7)
Неизвестные коэффициенты Th(x) находятся как решения со-
ответствующих задач Коши, получающихся подстановкой (7) в
(5) и приравниванием множителей при одинаковых степенях 8*.
Указанные задачи решаются последовательно; в частности, при
к = 0 для задачи
<Р W (Ро • П)~ IPol = -1, То (0) = 0, (7.2.8)
искомое решение равно То(я) = 0(О, h). Так как °о>с2> 1р01 >
> Ci > 0 при h е= [0, fe°], то последующие задачи Коши получаются
линейными вида
[ф(Ь)-1](Р*-П) = БЛ*), Т*(0) = 0, к = 1, 2, ... (7.2.9)
Неоднородности Vk(x) в (9) на каждом к-м шаге известны.
Они определяются при помощи /, F и вычисленных ранее функ-
ций То(а:), ..Ть-^х), к^1; например:
Г1 (х) = - (1 - ф)-1 [(п-(/е)о) - (П-^оП)],;
(7.2.10)
Р2(л) = — (pr(/e)o) —1/2 (1 — ф)-1 + V2 1(1 — ф)р1 +
+ 2(n-^oPi) + 2(Pi-^ot]) + 2(1 — ф)~х (т|- (Fe)0-n)] —
— Va (1 — Ф)31(1 — Ф)-1 (РгП) + (1 — ф)-2 (П’^оП)]2, • • •
Здесь нижний индекс «нуль» означает, что выражение в скоб-
ках берется при е=0. Решение линейной задачи Коши (9) для
любого к > 1 строится методом характеристик [172, 197],
так как |.ц1 = 1 (^=0) и <р(Д)— 1<0 при h е [0, fe0]. Уравнения
§ 2. СИСТЕМА, БЛИЗКАЯ К СФЕРИЧЕСКИ СИММЕТРИЧНОЙ
233
характеристик приводятся к виду
л (P(fe)_l
Пп h- (7'2,11)
Первая пропорция в (И) является производной от последующих
для ..., хп [197]. В результате интегрирования системы (11)
для искомых решений задач Коши (9) получаются выражения
h
f Vh (ns) r
ч-т- <7-2-12)
0
Таким образом, разложение (7) функции Веллмана Т(х, е)
построено, и притом единственным образом. На ее основе опти-
мальное управление и(х, б) строится при помощи представления
(6) с заданной степенью точности по в и удовлетворяет ограни-
чению (1.2). Выражение (6) можно привести к виду
*4) (я, £)==—)]+ EU(/i)(х, В),
(7.2.13)
о)=щ(х) = (1-ф)[nCPi + • П^о)].
3. Построение оптимальных траекторий п программного управ-
ления. После подстановки приближенного оптимального управ-
ления И(й)(.г, е) (13) в систему (1) получается замкнутая задача
Коши вида
х = [ср(й) — 1]ц + еХ(а:, е), я(0) = я0,
(7.2.14)
?Х (ж, е) = / (х, е) — /0 (х) + EU(fe) (х, в) + zF (х, е) u*k) (х, е).
Приближенная оптимальная фазовая траектория x(t, х\ б)
строится как решение задачи Коши (14) па интервале
е [0, T(k)(x\ е)] с погрешностью O(eft+1), с которой вычислены
функция Веллмана (7) и управление (13). В конце процесса,
т. е. при t = T(k)(xQ, е), фазовая точка х приходит в е*+1-окрест-
ность начала координат х = 0:
x(T(k}(x\ е), х\ 8) = 0(е*+1). (7.2.15)
За время, большее Т(х\ е) па величину O(eft+1), фазовая точ-
ка приводится в начало координат; это вытекает из исследования
функции h(t, х°, е), где h = |я|.
Далее для упрощения процедуры решения задачи Коши (14)
с заданной степенью точности по е строится также функция h ==
—/г(£, х°, е) как решение уравнения (1.8) с заданным начальным
условием
Й = ~1 + ср(й) + е(ц-Х(я, е)), й(О) = й°. (7.2.16)
При е = 0 решения системы (14) xQ(t, xQ) и уравнения (16)
7г0(£, й°) известны и определяются согласно (4). Для определения
234
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
x(t, х\ б) при 8>0 переменную х удобнее представить в виде
x = v\h, где |т)1 = 1, причем h и ц должны быть вычислены с по-
грешностью O(eft+1). На основе (14), (16) вектор направляющих
косинусов г) находится как решение задачи Коши:
П = ^[Х(/и1,е)-(П.Х(И,е))т]], П° = (7.2.17)
Уравнения (16), (17) эквивалентны (14) и могут быть реше-
ны последовательными приближениями по степеням 8, в которых
начальное приближение равно feo = feo(^ fe°) и г)0 = т)° соответ-
ственно. Делением (17) на fe (16) получается задача Коши с ар-
гументом h: •
__ 8 X (М], в) — (Т]*Х (М], 8)) Т]
dh “ fe ср (fe) — 1 + 8 (т)-Х (Дт], 8)) (7.2.18)
fee [О, h°l n(fe°, е) = ц°.
Ее решение также находится последовательными приближениями:
h
_ , f х('Чц-И' 6)~(1в-п'х<Ч»-И’ »)) 1«-1> д
hu
Следует отметить, что функция в числителе подынтегрального вы-
ражения (19) достаточно быстро стремится к нулю при h! 0.
Поэтому интеграл равномерно сходится для всех h е [0, fe0].
После подстановки в уравнение (16) найденного по схеме (19)’
с погрешностью O(eft+1) выражения rj(ft) (fe, fe°, ц°, е) для неиз-
вестной fe получается уравнение с разделяющимися переменными;
квадратурой получается соотношение между fe и t:
h
t = J [<p (Z) - 1 + e (T)(ft) (I, e) .x (I, e), e))]-i dl. (7.2.20)
h°
Разрешая (20) относительно fe, можно найти искомое выражение
fe(A)(^ й°, ц°, е) с погрешностью O(eh+1) для £е[0, T(k)(x°, е)].
В частности, для fe(1)(£, fe°, ц°, е), x(l}(t, х°, 8) получаются выра-
жения при t е [0, Т„(хв, е)]:
/г(1) = h0(t, М>) + е [1 - ф(Ло)] J
J h0 (т, h )
Подстановка приближенной оптимальной траектории fe-ro при-
ближения X(k}(t* е) в (6) дает программное оптимальное
§ 2. СИСТЕМА, БЛИЗКАЯ К СФЕРИЧЕСКИ СИММЕТРИЧНОЙ
235
управление u(k)(t, е), приводящее фазовую точку системы (14)
в 8й+1-окрестность начала координат за время Т = Т(к)(х0, е).
4. Торможение возмущенных вращений твердого тела, близко-
го к сферически симметричному. Рассматривается система
+ (/j+2 -^i+1) ^г+1^1+2 = “Ь (0) = ^г»
cOi+3^G>i, Ii+3=Ii, /г = /(1 + еХг), х<~1, е«1;
Mi = biUil b^O, u2 = u? + u22 + ul<l; (7.2.21)
Ni = — A(Oi +8vt(coi, co2, (o3), % = const, i = 1, 2, 3.
При % > 0, e = 0 вектор N можно трактовать как момент сил вяз-
кого трения, направленный против вектора угловой скорости тела.
Для управляемой системы (21) ставится задача оптимального
по быстродействию торможения вращений: G)(Z) = 0, r->minu.
Здесь применим подход пн. 1—3 после преобразования системы
(21) к виду
Zi = — Pz; + Щ + Egi (z, 8), Zi (0) = z?, i = 1, 2, 3;
A<°i О X , №izi vi
Zi , , |J * , (ZiZi 4-lZ-i -4-2 I А I 1 ,
г ’ 1 i 1 1 1
ai = (bi+lbi+2/(Ibi)) (xi+2- xi+1) (1 + exi+i)"^! + ex^)"1. (7.2.22)
Решение невозмущенной задачи для (22) определяется со-
гласно п. 1 (см. (2) —(4)):
Ui = — T|f, Pi= z^z"1,
T0(z°, p)=p-1ln(l + pz°),
z0(t, z°)=z°e~₽t-p-1(l-e“3<),
z0 = T)oz0(£, z°), u(0== “Л0- (7.2.23)
Семейство кривых TQ (z, P)
При р 0 функция TQ -> z,
т. е. к выражению (1.15).
Если Р<0 («отрицательное
трение»), то, согласно (23),
могут быть стабилизированы
вращения для значений 0 >
>z>— Р; при zf(—Р) вели-
чина То -> +°°. Для Р > 0 до-
пустимы произвольные зна-
чения Z < оо.
Нужно отметить, что
дГо/др <0 в рассматривае-
мой области значений (z, Р);
поэтому для заданного z > 0
величина То монотонно убы-
из (23) представлено на рис. 7.2.
вает при р -> оо до нуля. Этот вывод физически ясен при
Р > 0: время торможения тем меньше, чем больше отноше-
ние коэффициента трения к массе при заданном распределении
последней. Действительно, имеют место оценки xZ2(Oi, I ~
236
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
~ ml2, где % — коэффициент вязкого трения, I — характерный ли-
нейный размер тела, т — его масса; поэтому р ~ %/т. Из (23)
также следует очевидное свойство монотонного возрастания ве-
личины То при увеличении z для фиксированного значения [}.
Для приближенного решения задачи оптимального синтеза
u = u(z, е) выписывается уравнение для функции Веллмана
T(z, е) согласно (5):
г + р(г -2)=1 + 8(г g), Г(0, е)^0,
и = — г/г, r = dT/dz, г=|г|. (7.2.24)'
После подстановки в (24) разложения (7) для Т можно получить,
в частности, выражение То (23) как решение задачи Коши нуле-
вого приближения. Коэффициент Ti определяется соотношениями
(г, • п) 7 (Z) = (я • go)/7 (2), Tt (0) = 0, (7.2.25)
го = i]/y(z), f(z)=l + [Jz, g0 = g(z, 0).
Согласно (12) для имеет место выражение
Z
Л(2)=1’(П-бо(лО)-гЛ7. (7-2.26)
(1 + р0
Пусть имеет место случай линейных по со возмущений:
з
Vi(co) = У, X^-coj, = const, Ри = кцЩ i, j = 1, 2, 3;
(7.2.27)'
Si, 0 ~ (P^i + Pii) Zi Pi. i+lZi+l Р», <+2^i+2 <LiZi+1 + 2»
Тогда после подстановки (27) в (26) и интегрирования для Л
получается выражение
Л (z) = А р-2 (In у - pzv1) + #[P"2z (1 + Г1) ~ 2Р‘3 Ь у],
з
А = А (П) = 2 (P«i - Pii) П? - (Р12П2 + Мз) m - (7-2.28)
1=1
- (Р21П1 + Р2зПз) 1I2 - (РзхПх + РзгЛг) Пз,
В = В (я) = — («1 + а2 + а3) П1П2П3-
Прималом z>0 коэффициент, содержащий множителем В в (28),
имеет порядок z3, так как обусловлен квадратическими по z ги-
роскопическими возмущениями. Аналогично коэффициент при А
порядка z2. В частности, если X = 0, т. е. М = 8V/, i = 1, 2, 3,
з
Т± (z) =---J" flijZiZj 3" (а1 + а2 + аз) Z1Z2Z3* (7.2.29)
2,j=l
§ 2. СИСТЕМА, БЛИЗКАЯ К СФЕРИЧЕСКИ СИММЕТРИЧНОЙ
237
Аналогично (29) вычисляются следующие коэффициенты раз-
ложения функции Веллмана 7\(z), к >2. Оптимальное управ-
ление первого приближения вычисляется, согласно (6), на осно-
ве т], rt:
Щ = — Т1г + £ (1 + ₽z) [Т]г (Пг+Л+1,1 + Пг+2^+2,1) ~
('Mi+i + гг,г* = 1» 2, 3. (7.2.30)
Оптимальная фазовая траектория z(t, z°, е) в первом прибли-
жении определится из системы (22) после подстановки управле-
ния из (30). При этом оказывается более удобным использовать
выражение для z, z = z(i) + е2...
t
Z(1) (t, z°, e) = z0 (t, z°) + e J (T]°.g0(t)°z0 (t, z0))) e-P<(-x> dx.
0
(7.2.31)
Добавка порядка e в (31) от возмущений управления
eui (30) обращается в нуль тождественно. В результате с по-
грешностью О(е2) для z, согласно (22), (31), получается задача
Коши:
z = Z_z + 8U1 + e[g0 — z(0) = z°, (7.2.32)
(7.2.33)
по t е
по бы-
а искомое решение первого приближения имеет вид
Z(D (t, z°, е) = T1OZ(1) (f, z°, 8) +
t
+ ez0 (i, z°) J [ux + g0 - i]° (go-П0)] ~ г-Т-
Здесь функция z(1) (33) непрерывно дифференцируема
e [0, Таким образом, решение задачи оптимального
стродействию торможения вращений с погрешностью О(е2) пол-
ностью построено.
Изложенные выше, в § 1, 2, результаты являются предвари-
тельными и приведены из методических соображений. Они отно-
сятся к случаям, когда размерности фазового вектора и вектора
управления совпадают. В механике такие задачи возникают при
управлении вектором скорости в условиях, когда силы, действую-
щие на систему, не зависят от времени, положения системы и
других факторов. Существенный для приложений интерес пред-
ставляет развитие подхода на случай такой зависимости. Соответ-
ствующая методика приводится в § 3.
238
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
§ 3. Приближенный синтез оптимального управления
движением по части переменных
1. Постановка задачи управления. Рассматривается возмущен-
ная управляемая система более общего, чем в § 1, 2, вида:
х = F (х) + и + е/(х, у, и), х(0) = <г°,
У = G(x, у)+ у, и), у(О) = у'\ (7.3.1)
Ue(x, у), (х, у, е)е DxX Dy X [0, е0].
Здесь х — управляемый n-вектор, управление и е С7е имеет ту же
размерность, у — тп-вектор (тп > 0), 8 е [0, 80] — числовой пара-
метр, £е[0, Г] — время; х\ yQ — начальные данные. Функции
F, /» G, g считаются гладкими в области изменения аргументов
х, у, и и могут непрерывно зависеть от 8. Кроме того, функция F
удовлетворяет условию
(ц • F (х) ) = cp(fe), T] = x/h, h=\x\. (7.3.2)
В отличие от равенства (2.2) выполнение дополнительного
условия (23) не предполагается, т. е. функция F(x) может пред-
ставлять сумму функции типа /0(<г) и гироскопического слагае-
мого.
Относительно замкнутого ограниченного множества С7е пред-
полагается, что оно может гладким образом зависеть от х, у, 8,
т. е. U& = Ut(x, у), причем для 8 = 0 невозмущенная область
U = UQ имеет вид рассмотренной выше, в § 1, 2:
U0 = {u: |u|< 1}, |u| = (i4+ ... +4)1/2.
Для системы (1) ставится задача оптимального быстродей-
ствия по части переменных (вектору х):
x(T)=0, 7->minu, и Ue(x, у). (7.3.3)
Значение у (Т) не фиксируется.
Если х — вектор обобщенной скорости, аг/ — вектор коорди-
нат, переменных параметров и времени, то имеет место задача
оптимальной по быстродействию стабилизации системы (1) с уче-
том возмущений из более широкого класса, чем ранее, в § 1, 2.
Это обобщение позволяет исследовать ряд прикладных задач
управления скоростью движения центра масс или относительно
центра масс летательных аппаратов с учетом возмущающих фак-
торов различной физической природы.
2. Исследование невозмущенной задачи управления. Исследо-
вание исходной задачи оптимального быстродействия проводится
на основе достаточных условий метода динамического програм-
мирования и в методическом отношении примыкает к § 1, 2. Этот
подход существенным образом использует решение порождающей
§ 3. СИНТЕЗ УПРАВЛЕНИЯ ПО ЧАСТИ ПЕРЕМЕННЫХ
239
задачи, т. е. (1), (3) при е = 0:
x = F(x) + и, x(fi) = xG;
х(Т) = 0, Т minu, lul^l. (7-3.4)
На основе неравенства Шварца [49, 115, 130] (см. § 1, 2)\
устанавливаются соотношения для построения искомого невозму-
щенного решения
х = F(x) + uQ(x), х(0) = х\ и°(х) = — ц,
(х • ц) = й = — 1 + <p(fe), h=\x\, 7г(0) = ft0 = k°l,
л°
i = = То(А) = 9(О,Л). (7.3.5)
h
Здесь T0(h°) — время быстродействия; при этом предполагается,
что ф (h) < 1 для h е [0, fe0].
Уравнение для х (5) подстановкой я = 1?Л0(£, Л°), где и —не-
известная переменная, приводится к виду систем с инвариантной
нормой:
v^h-1 F(vh0)-h-\(h0)v, p(0) = n°. (7.3.6)
Действительно, умножая уравнение (6) скалярно на v и учиты-
вая (2), (6), можно получить, что li?(0lsl. Если разность
F — <рр есть однородная функция h степени а > 0, то уравнение
(6) приводится к виду, не зависящему от времени:
t
= F (у) — ф (1) v, s = f h^-1 (т, h°) dx, s e= [0, о (7,3.7)
0
Здесь s — новый аргумент, s = s(t, k°), o(fe°)=s(0(O, fe°), fo°).
Если же F(x)= (p(h)'r], то справедливы соотношения (2.4). Далее
общее решение х°) задачи Коши (5) для любого х° Dx
предполагается известным. Уравнение для у (1) при е = 0 и из-
вестном xQ имеет вид
У = G (4 (f, Х0), у), у (0) = у°. (7.3.8)
Предполагается, что общее решение задачи Коши (8) для yQ^Dv
также известно: У = Уо (£, х°, у°).
Таким образом, решение невозмущенной системы (1) при и =
= —ц представимо в двух видах:
x = x*0(t,x<>), У = y*o(t, xQ,y°), t(==[0, То];
x = xQ(h, h\ ц°), y = yQ(h, ц°, г/°), (7.3.9)
h = h0(t, fe°)e[0, h°].
240
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Функции Хо, у о получаются из х$, yQ при подстановке t = Q(h, hQ)
согласно (5); они удовлетворяют начальным условиям при h = h\
а х0 — нулевому конечному условию при h = 0. В важном част-
ном случае уравнения (8) у=х (G = x), т. е. у — координата,
х — скорость, функция у о выражается через х0 квадратурой
fz„(z, h°, т)°)
Z/o n°, У°) = У° - dl. (7.3.10)
•J 1 т Xе)
hQ
Итак, решение невозмущенной задачи оптимального быстро-
действия (4) полностью определено в виде (5), (9) или (10).
3. Построение возмущенной функции Веллмана. Исследуется
задача управления (1) — (3) для 8 > 0. Требуется найти с задан-
ной степенью точности по 8 оптимальное управление в форме
синтеза и(х, у, е), соответствующее ему значение времени бы-
стродействия Т(х°, z/°, 8) (функцию Веллмана Т(х, у, е)), а так-
же оптимальную фазовую траекторию x = x(t, х\ у\ 8), у =
= z/(f, xQ, yQ, 8) и программное управление u(t, xQ, yQ, 8).
Из свойства гладкости системы следует 8-близость возмущен-
ной и певозмущенпой траекторий. Поэтому для приближенного
построения программного управления требуется, чтобы указан-
ные выше свойства гладкости выполнялись лишь в малой окрест-
ности невозмущенпого оптимального движения. При исследовании
задачи синтеза предполагаются выполненными условия гладкости
во всей области (х, у)^ DxXDy, где может оказаться фазовая
точка системы, и всех 8 е [0, е0], и е [78(х, у).
Уравнение Гамильтопа — Якоби — Веллмана и условие на ги-
перплоскости х = 0 имеют вид
min [(P.(F + и +8/)) + ((?•(<? + 8g))] = - 1, (7.3.11)
p = dV/dx, Q = dV/dy, V=V(x, у, s), У(0, у, e)^0.
Построение замкнутой задачи Коши для функции Веллмана V
приводит, согласно (И), к операции минимизации нелинейной
функции от и в замкнутой ограниченной области £7е(я, у). Допу-
скается, что Ue имеет достаточно гладкую границу и может быть
задана весьма сложным образом. Предполагается для определен-
ности, что она описывается одним неравенством вида
С7е = {н: и2 + еЯ(щ х, у)^ 1}, UQ = {и: и2 < 1), (7.3.12)
где R — достаточно гладкая функция zz, х, у. Для решения за-
дачи минимизации в (11) гладким неособенным преобразованием
вектора и область Us (12) приводится к виду UQ. Действительно,
полагая и = pv, где p=lzzl—модуль, v — вектор направляющих
косинусов, можно получить уравнение границы области U& (12)
Р = [1 — 8г(р)]‘2, r(p) = 7?(pv, х, у). (7.3.13)
§ 3. СИНТЕЗ УПРАВЛЕНИЯ ПО ЧАСТИ ПЕРЕМЕННЫХ
241
Уравнение (13) затем решается относительно р; v, ж, z/, 8 — па-
раметры. Для определения корня р* как функции v, х, у, е мож-
но воспользоваться обычным методом разложения по степеням 8:
P(i+1) = РО + (Р( 1) “ Ро) + (Р(2) ~ р(1)) +. . .
. • (P(i) “ Р(г-1)) + (Р(г+1) — Р(г)) , Р(0)= рО, (7.3.14)
P(i+i) P(i) ~ £1+1Pi+l» Ро 1=3 1, Г = 0, 1, . . .
Можно применить также рекуррентную схему метода после-
довательных приближений, удобную для реализации на ЭЦВМ
и не требующую высокой гладкости функции Д = г(р). Этот под-
ход дает степенную сходимость по 8, если 8 > 0 достаточно мало:
P(i+D =[1 — er(p(i>)]1/-, р(0)=р0 = 1, г = 0, 1, ...,
(7.3.15)
р(1+1) — p(f) = O(e'+1), еIdr/dpI < 2.
Метод Ньютона (или касательных [86]) приводит к квадра-
тичной сходимости по 8:
Ро+1> = [ц(Р(.>)- P(i)<u(p(i))/dp][l - dp(p(.))/rfp]_1,
(7.3.16)
ц(р)^[1-ег(р)]1/2, p(;+i) — p(i) = O(e£(i)), U0 = 2‘.
Итак, пусть единственная гладкая функция р* (v, я, У, ь) по-
строена. Ее можно использовать для преобразования и -> й в про-
странстве управлений
u==pJj:u, р* = 1 + 8б(у, х, у, 8), и = lv, |Z|^1. (7.3.17)
Здесь и — управление со значениями из Uo. Подстановка и в (И),
согласно (17), дает соотношение, в котором минимизация прово-
дится по u^UQ] при этом происходит «деформация» левой части
уравнения на величину 0(e). Функция й, определяется
из условия минимума выражения в (11) (тильда далее опускает-
ся). Делением на |Р| =#0 получается задача минимизации вида
J (р, 8) = min [(р-и) + 8Ф (и)], Uo = {и: | и | 1},
(7.3.18)
\р\ = 1; Ф(и)^(р •/) + ((?
Здесь Ф — гладкая функция щ и Z70; функции J, и подлежат
определению. Зависимость от других аргументов для сокращения
записи пока не указывается. Деление на \Р\ обосновано при до-
статочно малом 8, так как при 8 = 0 эта величина ограничена и
в нуль не обращается. Для невозмущенной задачи (18) следует
= Цр, 0) = —1. (7.3.19)
16 Л. Д. Акуленко
242
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
проводится
(7.3.20)
других па-
Определение искомых функций и(р, е), 7(р, е)
разложениями по степеням параметра е:
и = — р + eui +...+ е% +..
7 = -1 + еЛ+...+ е7,+...
Коэффициенты J, (/>1) как функции орта р и
раметров получаются в результате подстановки (20) в (18) и
приравнивания коэффициентов при одинаковых степенях ej. В ча-
стности, при 7 = 1:
А = min(p.M1) + Фо, (и0-м1)<0; Ф0 = Ф(и0); ,_ОП4Ч
(7.3.21)
71 = ф(—р) = Ф0, (p-ul) = Qi
так как По == —р. Вектор Ui ортогонален р, т. е.
((uo-Ui) = O), и определяется неоднозначно из (21).
/2 = min
“г«2
(p-u1) = 0, 2(w0-u2) +
, \ , РФо 11 афо ЗФ(—р)
(р*ы,)+ —н——
и \ ди 1/J ди ди
(и, -р) = 0
Для / = 2
(7.3.22)
Последнее ограничение в (22) эквивалентно неравенству (р • и2) >
г/2и]; поэтому получается задача условной минимизации квад-
ратической формы от щ:
J2 = min
u,
•“1
(7.3.23)
Решение задачи (23) при помощи метода множителей Лагранжа
[157] находится в явном виде:
5Ф
ди ’
(7.3.24)
В результате функции /Др), /»(р), щ(р) найдены, а н2 под-
лежит дальнейшему определению. При j = 3 имеет место задача
минимизации
г /5ФП \1 1 / а Ф0
J3= min|Jp-u3) ~d^U1'U1
U2’U3 4
(p - !l3) >(«!• U2), (p • U2) = X/2ut
(7.3.25)
Минимизация по u3 и учет равенства (25) для и2 и выражения
(24) позволяет определить J3 и связи на п2, и3:
1 /^Фо 2 1 РЧ
73= L—W1 + (7.3.26)
(Р‘^з) = (wi‘w2)t (Р’иг) =
§ 3. СИНТЕЗ УПРАВЛЕНИЯ ПО ЧАСТИ ПЕРЕМЕННЫХ
243
Неизвестные и2, и3 определяются из условия минимума по-
следующих коэффициентов Jj (/>4). В частности, из условия
для J4
4 = min
u2,u3,u4
/ЗФП \ Р2ФП \ 1 5*фо з
(p-uJ + + "6’77'U1 ’
(р-«4)Х“1-из) +
(7.3.27)
Проводя минимизацию по щ и исключая зависимость от и3 при
помощи соотношений (26), можно получить для Л квадратичную
форму от и2. Методом множителей Лагранжа находятся zz2, Л
1 2 (дфп \ д2фо
и2= —U!p + (z-p)p-z, Z = I— -р] + ——Ult
3 (7.3.28)
T 1 Г 1 2 > / \]2 1 2 . 1 9 Ф0 з
A = -г[тм1 + (2-Р)] - I"2 + —
Таким способом может быть определено любое число коэффи-
циентов Uj, Jj и построена с нужной степенью точности по 8 замк-
нутая задача Коши для (И). В частном случае линейной по и
формы (18) решение задачи минимизации находится точно в виде
н = н(р, 8)= — (р +еФ1) |р +еФ1!”1,
(7.3.29)
у = _|р + 8ф1| +ефо; ф(и)^Ф° + (Ф1 • и).
В общем нелинейном случае управление и имеет вид
\/дФп \ дФ1
и=-р + Е[(-^-.р]р--^] + ... +е^(р)+
(7.3.30)
р = Р|Р|-‘, Ф0^(р -f(x, у, -p)) + (Q • g(x, у, -р))!?!-1.
Замкнутая задача Коши для функции Веллмана V получается
подстановкой известных, согласно (21)— (28), коэффициентов
Jj(p) в (18), а затем в (И). В результате
(Р • F)- |Р| + (Q • G) + е [(Р • /(х, у, -р)) +
+ (Q -g(*, У. ~р))] +• • •+ ^|Р1Л(р)+.. .= -1, (7.3.31):
7 = V(x, у, 8), 7(0, у, 8)^0.
Следует отметить, что приведение функционального уравне-
ния (11) к виду (31) может быть проведено на основе изложен-
ного приема без предварительного преобразования (17) в про-
странстве управлений.
4. Метод множителей Лагранжа. Развитая в п. 3 схема после-
довательной минимизации квазилинейной функции по существу
эквивалентна применению метода множителей Лагранжа [157].
16*
244
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Непосредственное применение этого метода к задаче (18) приво-
дит к аналогичным простым выкладкам. При достаточно малом
8 >0 минимум достигается на границе области UQl так как гради-
ент минимизируемой функции по и при 8 = 0 в нуль не обраща-
ется. В результате получена задача условной минимизации
J (р, е) = min[(p-zz) + 8ф(и)], и2 = 1. (7.3.32)
и
Считая Ф непрерывно дифференцируемой на сфере и2 = 1 функ-
цией, можно выписать следующие определяющие уравнения:
р + е дФ/ди + Хи = 0, и2 = 1, (7.3.33)'
в которых М2 — скалярный множитель Лагранжа. Исключением
из (33) неизвестной X получается уравнение относительно век-
тора и
— (р + е дФ/ди)\р + е дФ/ди\~\ (7.3.34)
Из (34) при помощи одного из приведенных выше приближен-
ных методов с нужной степенью точности определяется искомая
функция и = и(р, 8), а затем, согласно (32), и J = J(p, &).
В частности, если Ф линейна по и, то выражение (34) сразу
дает и(р, 8).
Минимизация в (И), (12) может быть проведена методом
множителей Лагранжа без предварительного преобразования век-
тора и согласно (13) — (17). В результате получается задача ус-
ловной минимизации типа (32):
J(р, 8) = min [(р-и) + гФ (и)], и2 + 8г (и) = 1, (7.3.35)
и
которая сводится к системе (п+1) уравнений относительно и, %:
р + 8^“ + Хи + -4" 8Х = 0, и2 + 8Г = 1. (7.3.36)
* ди 2 ди 1 7
Исключение параметра Х>0 из (36) приводит к выражению
Подстановка Х = Х(р, и, 8)=1 + 0(е) в векторное уравнение (36)
для и приводит к квазилинейному уравнению вида
и=- (р+е й- -г £•s р -еП и'е)- (7-3-37>
Решение п(р, е) уравнения (37) существует, единственно и
является гладкой функцией р (|р| = 1), так как функция П удов-
летворяет условиям существования неявной функции и. Для вы-
числения и(р, 8) можно применить одну из вышеизложенных
§ 3. СИНТЕЗ УПРАВЛЕНИЯ ПО ЧАСТИ ПЕРЕМЕННЫХ
245
схем метода малого параметра, что не представляет затруднений.
Точное решение системы (36) находится элементарными опера-
циями, еслп Ф линейная, а г квадратическая функции от и.
В этом случае Ue есть эллипсоид, близкий единичному шару.
Таким образом, задача Коши (31) построена явно с заданной
степенью точности по е.
5. Построение функции Веллмана и оптимального управления,
Искомая функция Веллмана V задачи оптимального быстродей-
ствия определяется как гладкое неотрицательное решение задачи
Коши (31) в виде
V(x, У, е)= V9(x, у) + eV,(x, у)+...+ nW^x, у)+... (7.3.38)'
Как обычно, подставляя (38) в (31) и приравнивая коэффи-
циепты при одинаковых степенях 8j, можно получить зацепляю-
щуюся последовательность задач Коши. На первом шаге при / = О
(Po-F)-|P0I+((?0-G) = -1, Fo(O, у)^0. (7.3.39}
Так как при 8 = 0 управление и0 не зависит от у, см. (5), то от-
сюда Vo = И0(х)= Tb(h), причем н0(х) = — р = — ц. Кроме того,
норма |Р0(а:)| >0 п ограничена для fe^[0, fe°], поэтому прово-
димые построения обоснованы при 8 > 0 достаточно малом.
Задачи Коши для последующих коэффициентов Vj (/>1) по-
лучаются линейными вида
(Pr[F(^)-T]]) + (^-G(^ у)) = ^(х, у), Vj(O, у)^0. (7.3.40)
Здесь правые части Wj известны; они определяются через f, g и
вычисленные на предыдущих шагах коэффициенты V0(a:),
Vi(x, у), ..., Vj-i(x, у). В частности,
Wt(x, y) = (P9(x)-j(x, у, -Г])),
Ро = Wdx = t]/(l-<p(fc)). (/.3.41)
Решения задач Коши (40) строятся с учетом выражений (9)
методом характеристик путем обобщения методики § 1, 2:
h
V} (х, у) = - f Wj (х0 (I, h, n), у0 (I, h, Т], у)) (7.3.42)
о
Таким образом, построение неизвестных Vj(x, у) сводится к
интегрированию некоторых функций Wj(x, у) вдоль семейств
траекторий (9). Точность вычислений определяется степенью
гладкости системы, т. е. свойствами дифференцируемости (31)
по х, у, у. Затем на основе известного выражения (38) для функ-
ции Веллмана У(х, у, 8) с такой же точностью определяется
246
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
синтез оптимального управления:
и(х, у, е)= —г) + ещ (х, у)+. ..+ £jUj(x, у)+...,
щ (х, у) = - [Р> - (n-PJHl [1 - ф(й)] + (^-nj П - Й’ <7-3-43)
i} = x/h, h=\x\, Pi = dVi/dx, б^(ц-/(.г, у, —ц)).
Последующие коэффициенты Uj(x, у) (/>2) имеют довольно
громоздкий вид и здесь не приводятся, так как в приложениях
для оценки влияния возмущений обычно ограничиваются первым
приближением.
Следует отметить, что приближенное управление (43) удов-
летворяет ограничению и U& (12) не точно, а с погрешностью
O(eJ+1). Принудительное ограничение управляющей функции при-
ведет к такой же погрешности по функционалу и фазовой траек-
тории, что не выходит за пределы точности проводимых вы-
числений.
6. Построение фазовой траектории. После подстановки управ*
ления u = u(.r, у, е) (43) в систему (1) получается замкнутая
задача Коши для определения оптимальной траектории х =
= x(t, х°, у°, 8), у = y(t, х\ у°, 8). Неизвестные х, у должны
быть вычислены с указанной степенью точности j по е на интер-
вале времени £^[0, Т(х°, у°, е)]. Искомое решение строится чис-
ленно или аналитическими методами малого параметра. Напри-
мер, можно применить методику § 1, использующую приведение
к оскулирующим переменным на основе известных интегралов
невозмущенной системы:
Сх=Сх(х), + = (hy су = У)', (7.3AQ
х = х (t + т, сх), у = у (t + т, сх, су).
В результате система (1) приводится к виду, аналогичному
(2.16), (2.17):
сх = е х (^ У), сх (0) = Сх (<г°),
су = Ax&y) + ^Y& У), су (0) = Су (х*, у»), (7.ЗАЗ)
и* и у
— 1 + ф (h) + 8 (ц X (х, у)), h (0) = | xQ |.
Приближенное интегрирование системы (45) проводится по-
следовательными приближениями или разложениями по степеням
е (см. § 1). В результате на каждом шаге получаются непрерыв-
но дифференцируемые функции x{5}(t, 8), е), (^ с)
для t е [0, 71].
Подстановка построенных функций x = x(j)(t, х°, у°, е), у =
^УаЛЪ У°, 8) в выражение для управления и(х, у, ej (43}
§ 3. СИНТЕЗ УПРАВЛЕНИЯ ПО ЧАСТИ ПЕРЕМЕННЫХ
247
позволяет найти приближенное оптимальное управление в форме
программы х\ у°, е), удовлетворяющее с погрешностью
O(ej+1) ограничению u^Uz (12) при £ е= [О, у\ е)]. Важ-
но отметить, что использование приближенного управления в фор-
ме синтеза (43) приводит фазовую точку системы (1) на гипер-
плоскость (3). Однако необходимое для этого время будет не-
сколько больше времени оптимального быстродействия, вообще
говоря, на величину O(eJ+1), т. е. погрешности вычисления функ-
ции Веллмана V(x, у, е) (38) и оптимального управления
и(х, у, е) (43). Программное управление, очевидно, указанное
свойство точной стабилизируемости не обеспечивает. Вопросы
численной реализации алгоритмов построения синтеза на основе
методики § 1—3 рассматриваются ниже, в § 7.
Развитая выше в § 3 методика построения приближенного
синтеза применима к задачам управления в более общей поста-
новке. Например, она позволяет рассмотреть следующее обобще-
ние уравнений движения, конечных условий и критерия качества
управления:
х = F (х, у, z) + S («г, у, z) и + е/ (я, у, z, u), х (tQ) = х°,
У = G(x, у, z) + 8g (х, у, z, и), у (£0) = у0,
z == 8г (я, у, z, и), z (tQ) = z°;
с2 (z) [h — h* (z)] \T + em (x, У, z) \T = 0, (7.3.46)
т
J [u] = EX (x, У, z) \t + J [K (fe, Z, I и I) +
*0
+ zk(x, y, z, u)] dt-+- min, ue t78.
и
Здесь a:, у, z — векторы произвольных размерностей, функция F
удовлетворяет условию типа (2): (т]-Р(.г, у, z))^<p(A, z), где
ц = x/h, h = Ы; S — ортогональная матрица. Введенные функ-
ции предполагаются достаточно гладкими, а область управления
иг(х, у, z) близка сфере радиусом u0(h, z) и имеет гладкую гра-
ницу. Момент Т окончания процесса управления может быть как
заданным заранее (фиксированным), так и определяться в ре-
зультате решения задачи управления.
7. Модельный пример. Для иллюстрации рассматривается за-
дача управления движением летательного аппарата (материаль-
ной точки) в атмосфере без учета подъемной аэродинамической
сплы. Уравнения движения берутся в виде [79]
г — v, г(О) = г°;
(7.3.47)
mv = P — 1/2c(p)p(r)i;v — mg (г), v(0) = v°.
Здесь m — масса, P — управляемая сила тяги, |Р|^Р°; с —ко-
эффициент лобового сопротивления, р — плотность атмосферы,
248
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
g — ускорение силы тяготения. Пусть в нулевом приближении
масса аппарата не изменяется, а начальные условия движения
таковы, что угол траектории мал, т. е. р и g приближенно посто-
янны. Тогда в обозначениях (46) v — вектор х\ (г, t)— вектор у,
масса т — квазипостояппый параметр z, а невозмущенная сила
лобового сопротивления — вектор F. Для приближенного решения
задачи управления величиной и(Т) применима развитая выше
методика возмущений.
Чтобы не загромождать вычислений, полагается т = const,
а силы тяготения и сопротивления относятся к возмущающим
факторам порядка е. При этом допускается произвольная зави-
симость их от v, г. В результате получается система типа (1):
r = v, r(0) = r°;
v = u + ef (v, г), v (0) = v°.
Здесь u = P/m — управление, IuI uQ = PQ/m\ ef — возмущение.
Ставится задача оптимального быстродействия типа (46):
p(Z) = p*^0, Z->min, | u | u°. (7.3.49)
и
Согласно n. 2 управление u0 п время быстродействия при 8 = 0
равны
V I ___ 7;* I
u0 (v) = - ip° sign (y — y*), i] = —, ro^’°) =-----б----•
v и
(7.3.50)
Семейство певозмущепных траекторий управляемого движения
имеет вид
v(£, v°)= v(t, г0)ц°, v(t, vQ) = + (v* —
(7.3.51)
V°, r°) = r°+ 1/2'П°(^02 у2) sign(p° — L>*).
На основе формулы (42) для коэффицпента добавки Vi к Fo =
= TQ(v) — функции Веллмана певозмущеппой задачи — получает-
ся выражение
V
Vjv, г) = X J (4.f0(v, r, h))dh, (7.3.52)
V*
f0(v, г, h)^ f (цй, г + 1/2'П(у2 “ ^2) (^J)-1 sign(p — v*)).
Из (52), (47) следует, что лобовое сопротивление приводит к
уменьшению времени быстродействия при г* < v, а при > v
увеличивает его, что очевидно. Формула (52) позволяет весьма
просто исследовать аддитивное влияние силы тяготения на дви-
кепие системы, а также зависимость времени быстродействия от
других параметров задачи. Приближенное вычисление управления
ч траектории проводится стандартным способом.
§ 4. ЗАМЕЧАНИЯ ПО РЕАЛИЗАЦИИ ПРИБЛИЖЕННОГО СИНТЕЗА 249
§ 4. Замечания по реализации приближенного синтеза
1. Последовательная аппроксимация области значений векто-
ра управления. Представляет интерес более подробное исследова-
ние возможности применения методов малого параметра в случае,
когда область Ue имеет слож-
ную границу. Предполагается,
что существуют два концентри-
ческих шара U~ и U+ таких, что
[/-с= [7е <= [/+ (7.4.1)
и+ — и~ <С 72 (и“ + и+).
Таким образом, множество
L7е близко шару Uа радиусом
н° = 72(н~ + и+) с центром в
начале координат (см. рис. 7.3),
а малым параметром, характе-
ризующим указанную близость,
берется безразмерная величина
е = 72(u+ — u~)/uQ < 1. При
главного члена (Р • и) в (3.11)'
рассмотрении задачи минимизации
по области С7е, удовлетворяющей условиям (1), совершается тож-
дественное преобразование
min (Р »и) == — и° | Р | + [min (P«u) + и° | Р |
uei7e ueue
(7.4.2)
Так как на основании (1) справедливы оценки
— и+ | Р | min (Р *u) — и~ | Р |,
иепе
то выражение в квадратных скобках (2) имеет порядок 8. Вве-
дением обозначения
еФ (Р, х, у, е) = и° | Р | + min (Р «и), (7.4.3)
и<=и8
уравнение (3.11) приводится к виду
-uQ\P\ +(Р -F) + (Q - G) = —1 + еЧг(Р, Q, х, у. е). (7.4.4);
В первом приближении по е минимизацию членов (Р • е/)
(Q * eg), содержащихся в Т, можно проводить по шаровой обла-
сти Uo. Дальнейшее исследование задачи Коши (4) проводится
аналогично § 3.
Ниже рассматриваются некоторые примеры областей Ue.
250
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
1) Пусть U6 — куб с центром в начале_ координат, размерность
пространства лг = 3; тогда и~ = 1, = и0 = (1 + УЗ)/2 ~ 1,36,
т. е. е « 0,27. Если п = 2, то и° = (1 + Т2)/2 « 1,21, е « 0,17.
2) Пусть Ue — эллипсоид, близкий шару радиусом и0:
Й (1 + ерУ ’ ,о + £ V (7.4.5)
е < 1; ai3’, = const, f = 1, ..., и, j = 0, 1, ..., n.
Решение задачи минимизации (2) по области (5) удобнее пред-
ставить в векторном виде. Вводится вектор v = (vh ..., vn), огра-
ниченный сферой радиусом и° и связанный с u = (ui, ..., ип) со-
отношением еа0 + (Z + &В) v = (I + еЛ) и, где В — диагональная
матрица с элементами Вектор и находится обращением мат-
рицы (Z + еЛ):
и = е (Z + eZ)) ссо + (Z + еС) v, v е £70, (7.4.6)
D = - A (Z + еЛ) -1, С = В + D + еРВ.
Тогда выражение для и (6) подставляется в (2) и проводится ми-
нимизация по v в шаровой области |р| и0; в результате
v = -U°P(Z+ еС)\P(I + еС) I"1,
min (Р *и) = — и° | Р (Z + еС) | + е (Р •(! + sD) а0). (7.4.7)
Из (7) следует, что искомая величина минимума на 0(e) отлича-
ется от —н°|Р| (см. § 3). После определения искомой функции
Веллмана V управление v находится согласно (7), а исходное
управление и — при помощи (6).
Для иллюстрации приема рассматривается задача гашения
экваториальной составляющей вектора угловой скорости динами-
чески симметричного твердого тела посредством моментов, ограни-
ченных по модулю (см. § 1, 4 гл. 1). Уравнения движения при-
водятся к виду
Xj + аа:2 = ur, хх (0) = х° (х^ = Z(d,/u°),
х2— ах1 = и2, а:2(0) = а:2, | щ | 1, i = 1, 2.
При а "/= 0 преобразованием переменных х<, t можно привести
уравнения (8) к виду, в котором а = 1. Выписывается задача
Коши для функции Веллмана V согласно (2) —(4):
(—т\х2 + r2Xi)— u°r = —1 + е(|Г11 + \r2\ — и°г), ,
П = i = l,2; 7(0, 8)^0 (е = 1).
§ 4. ЗАМЕЧАНИЯ ПО РЕАЛИЗАЦИИ ПРИБЛИЖЕННОГО СИНТЕЗА 251
На основе методики § 1 получаются выражения, отвечающие
невозмущенной задаче:
*0 — “о ’ Г0г = “o', h = hQ —
и и 1
о h о • h h «л о /гт / л /ч\
t]i = Tix cos —j,--т)2 sin —jp-, cos 6° = tlx, (7.4.10)
и и
0 • Д . 0 • cn 0
T)2 = TJi Sin X-F T)2 cos —7—, sin 6° = T]2•
и и
При помощи формулы (1.27) находится функция Vi в виде
Fi (ях, х2) — -у-
и
h
(7.4.11)
Далее оценивается величина Vt для значения и0 =(1 + V2)/2 ~
«1,21, взятого в соответствии с (1). Так как Icoscpl +
+ Isincpl С У 2, то IVi/Fol <0,17 для всех h. Для больших h
(h^u0) относительная погрешность еще меньше (<0,05). По-
следующие приближения дают еще меньший вклад.
Пусть имеет место случай а = 0 в (8), что отвечает равенству
х3(1 — /3) = 0. Тогда на основе изложенного выше подхода для
искомой функции Веллмана V получается приближенное пред-
ставление
v (Хх, х2) = А + (ь - + • •• (7.4.12)
и \ и /
Точное выражение для V имеет вид V* == max(Uil, |х2|). Макси-
мальная относительная погрешность max | V* — V \/V равна
— — — __ хгх2
|2У2/(1 + У2)+ У2 — 4/(1 + V2) — 11 « 0,07 и достигается при
IxJ = 1#21. Соответствующее приближенной функции Веллмана V
(12) приближенное оптимальное управление равно
Щ = — sign = — sign Hi sign [| T]i I (1 + u°) — 1]. (7.4.13)
Графическое представление функций щ (13) приведено на
рис. 7.4; для удобства введены обозначения r]i = cos(p, т)2 = sin <р,
<р <= [—л, л].
2. Численная реализация приближенных законов синтеза. Рас-
сматривается для определенности задача построения функции
Веллмана согласно методике § 3. Предполагается, что проблема
вычисления функций W3(x, у) в задаче Коши (3.40) так или
252
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
иначе решена. Вычисление коэффициентов Vj(x, у), согласно
(3.42), требует определения многопараметрического семейства
функций xQ(l, h, ц), yQ(l. h, ц, у) (см. (3.9)), которое можно
представить в более удобном виде как x0(Z, х), yQ(l, х, у). Это
семейство функций должно быть довольно полным, чтобы опреде-
лить искомые коэффициенты Vj на достаточно плотном множестве
точек х, у. Область задания параметра х ограничивается неравен-
ством |я| < Л°, где hQ — радиус шара возможных начальных зна-
чений переменной х. Область задания параметра у определяется
как множество всех у = у (t, xQ, yQ), где lz°l hQ, у° принадлежит
области возможных начальных значений, [0, 0(0, fe0)].
В этих областях задаются множества точек ха. уъ где а, у —
векторные индексы, пробегающие значения (i=l, 2, ..., и),
уА (к = 1, 2, ..., т) от 0 до N. Переменная h будет при этом
задана на множестве n(N+l) точек: h{a} = |ха|. Построение мно-
жества траекторий заключается в интегрировании системы урав-
нений с заданными в указанных точках значениями:
dx F (х) — ц dy G (х, у)
dh 1 — ф (h) 1 dh 1 — ф (А) ’
~ У Ь=Л(а) = Уу» (7.4.14)
Пусть определенное таким образом семейство траекторий по-
строено согласно (14):
X = Xb(h, k{a}, Ха). У~Уо(к, h{a}. Ха. Уч).
h G= U{P}}, {£} S {al.
Тогда интеграл в (3.42) заменяется суммированием по дискретно-
му множеству точек fe{P}, в которых задана подынтегральная
функция Wf, при этом fe{P} fe{a}, а величины k{a}, ха, Уч рассмат-
риваются как параметры. Они определяют точки, в которых зада-
ется функция Vj: Vj(h{a}. ла. Уч) = V5(a,7).
Приведенная процедура дискретизации может быть также
осуществлена па основе интегрирования исходной системы во
§ 5. ОБОСНОВАНИЕ МЕТОДА ВОЗМУЩЕНИЙ
253
времени t:
fa.B = J -Д-;-,
|Xa| \ /
y = G(x, y), y(O)=yy, |^|<|a;a|.
Построенные дискретные семейства решений задач (15)
#a, р = Xq р, Х<х) , Z/a, р, 7 = Z/o (^а, р? Ха, У1)
подставляются затем в формулу (3.42)
|xal / / Л \
V] (Ха, у у) = J Wj I Хо I J , Ха |,
0 \ \|ха| /
(Л \ \
С dl „ |l dh
J (p(Z)-l’ Г-фИ”
|xal / /
Интегрирование здесь может быть проведено каким-либо чис-
ленным методом [120]. Последующее дифференцирование функ-
ции Веллмана V, заданной на дискретном множестве точек, для
построения синтеза оптимального управления можно провести
аналитически или численными методами [86].
§ 5. Обоснование метода возмущений
для построения решения задачи Коши с конической
особой точкой
Исследуются вопросы обоснования методов малого параметра
для построения функции Веллмана задачи оптимального управ-
ления (3.1) —(3.3). Соответствующая задача Коши (3.31) пред-
ставляется в виде
(Р-F(x))-\P\+(Q-G(x, г/)) = -1 + е£(я, у. Р, Q),
(7.5.1}
ИО, у, е)^0.
Здесь F, G, D — достаточно гладкие функции своих аргументов в
рассматриваемой области их изменения, причем |Р| > const >0
(P = dV/dx). Строится решение (1), обращающееся в V0 = TQ(h)
при е = 0. Для этого совершается замена неизвестной V и вводят-
ся обозначения
V = 0 (0, h) + еЖ,
dW dw
Г ~ дх ' % — ду '
(7.5.2)
254
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Неизвестная W(x, у, е) определяется как решение задачи Коши:
(г -(hF — x)) + (q • hG) = Dq(x, у)+еФ(х, у, г, у),
Ж(0, у. е)^0; DQ = hD(x, у. т]/(1 — ср), 0), (7.5.3)
еФ = hD - Do + | + ehr | - - (x-r).
Уравнение в частных производных (3) слабо нелинейное, при
е = 0 оно обращается в линейное. Решение задачи Коши (3)
удобно строить методом характеристик [172, 197] (см. § 3). Урав-
нения характеристик записываются в следующем виде:
dx ___ dy
hF — х — еО/ (rr, у, г, q) hG (х, у) — ёФ^ (х, у, г, q)
_____________________— dr________________________________________________— dq_
~ г [ (hF)'x - /] + q (hG)'x - D'w - еФ; “ qhG'y - D'oy - еФ^ ~
_____________________________________________________________dW___ _dh______ dt_
D0 (*, У) — 8 (r-Фг) — 8 (tf-Фд) h (ф — 1) — 8 (трФг) h *
(7.5.4)
Уравнения характеристик (4) интегрируются методом после-
довательных приближений по е при следующих граничных
условиях:
h = h°: х = х\ у = у°;
. ш п * п (7.5.5)
h = h*\ W = 0, г = г*, 7 = 0.
Условия на W и q (5) следуют из (3); в (5) fe*, г* — параметры,
0 /г* С fe°, h° > 0. При е = 0 решение системы (4), (5) строится
в явном виде на основе общего интеграла (3.9). Уравнения для
х, у интегрируются непосредственно на каждом шаге, так как
известно общее решение невозмущенной системы, а тем самым и
фундаментальная матрица соответствующей системы в вариациях.
Функция Ф определяется значениями х, у и г, 7, вычисленными
на предыдущих шагах метода последовательных приближений.
Уравнение для q — квазилинейное с известной фундаментальной
матрицей 5, получающейся на основе общего решения у0(^ я0, у°)
(3.9). Линейная часть уравнения для q является сопряженной
системе в вариациях для у; поэтому транспонированная матрица
5' (£, xQ, у0) = (дУо/ду0)”1. После интегрирования независимого
уравнения для q с нулевым условием (5) и подстановки в урав-
нение для г вновь получается независимое уравнение с линейной
частью, которая является сопряженной по отношению к системе
в вариациях для х. Ее фундаментальная матрица N определяется
аналогично S: JV' (I, х°) — (дх*/дх°)~1. Зависимость h от t также
находится последовательно. В уравнениях (4) переменную h мож-
но взять в качестве аргумента и определять зависимости х, у, W,
§ 5. ОБОСНОВАНИЕ МЕТОДА ВОЗМУЩЕНИЙ
255
г, q как функции h, х°, у°, h*, г и параметра 8. Последователь-
ные приближения равномерно сходятся при 8 > 0 достаточно ма-
лом и h° > h* > 0 к решению краевой задачи (4), (5):
х == x(h, fe°, х\ h*, г*, е), у = у (h, hQ, yQ, h*, r*, 8),
= r (h, hQ, xQ, yQ, h*, r*, e), q = q (fe, fe°, z°, z/°, fe*, r*, 8), (7.5.6)
Из вида решений, получающихся последовательными прибли-
жениями по указанной схеме, следует, что существует равномер-
ный предел функций (6) при fe* I 0, причем предельные функции
х, У, г, Q от произвольного параметра г* не зависят. В результате
получается гладкая функция W(x, у, 8), обращающаяся в нуль
при х -> 0 (felO), непрерывно дифференцируемая по х, у для
h > 0 и рассматриваемых значений у.
Доказательство этих утверждений проводится для случая от-
носительно простой задачи Коши. Способ доказательства на осно-
ве вышеизложенного может быть распространен на общий случай
задачи (1). Итак, рассматриваются соотношения (1), когда век-
тор у отсутствует (GM, q = Q). (см. (2.5)), а функция F = 0.
При сделанных предположениях относительно гладкости F
(см. выше) поведение функции Веллмана при малых h качест-
венно совпадает со случаем F = 0.
Заменой типа (2), где 0 = fe, уравнение для добавки приво-
дится к виду
(х-р) = (х-1)+ьФ(х, р, 8), W=W(x, 8), ИДО, 8)^0;
(7.5.7)
W г
Р = еФ = еЛ(р./)-е-1Л[|т) + ер| - 1 -е(трр)], П = —•
Уравнения характеристик (4) для слабо нелинейного уравне-
ния (7) записываются следующим образом:
dx _ Д—еФ'
dfl h— е(т]-Фр)’
а:(/г0) = Л ж(0) = 0,
dp Р—ефх
h—е (грФр) ’
р (h*) = р*, 0 < Zi* < h°,
(7.5.8)
dW _ (^-У) + еФ —е(р-Фр)
dh h— е(трФр)
TP(O) = O.
Вначале строится решение
ний для х, р аналогично (6):
x = x{h, h°, ха, h*, р*, е),
сопряженной системы 2п уравне-
p = p(h, h°, х°, h*, р*, е). (7.5.9)
256
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Затем устанавливается существование равномерного относительно
8, fe, fe°, х° предела при fe* 4 О такого, что предельные функции
а7, р от р* не зависят:
х = х (h, h°, х°, 8), р = p(h, h°, х°, б). (7.5.10)'
На основе (10) искомая функция W(x, е) записывается в виде
квадратуры:
W _ W (А е) - j + л (7 5 Н)
Краевая задача (8) для х, р сводится к интегральным урав-
нениям
h , z
. Сфр-'п(ффр) dl
x = — h — sh I fe° fe* > 0,
h° p-8(’i-4) 1
h
P = P* 7Г + ~T \(x-f)'xdl +
h*
<7'5Л2)
Для построения искомого решения уравнений (12) применяется
рекуррентная схема метода последовательных приближений. В ка-
честве порождающего берутся функции
h
*о = Ро = + V J (7.5.13)
h*
Следующие приближения имеют вид
_ х _ e/j f (Фр)> ~ (у(Фр)з) dl_ q
(7.5.14)
„ пГг 1 -U В f г(ЯГН^))х-(^г(ФрЬ)[(ЖГН^))х-^] л.
Как отмечалось выше, из (14) следует, что последовательные
приближения Xj, pj зависят от аргумента fe, параметров краевой
задачи fe°, ц0, fe*, е и произведения p*h* (см. (13)).
Доказывается, во-первых, что последовательные приближения
(14) равномерно ограничены для 0 fe* fe fe° при е>0 до-
§ 5. ОБОСНОВАНИЕ МЕТОДА ВОЗМУЩЕНИЙ
257
статочпо малом, если fx удовлетворяет условию Липшица по х.
Согласно (7) в подынтегральных выражениях отношения числи-
телей и знаменателей являются ограниченными функциями для
всех 0 I /г*, так как Фр ~ I. Поэтому знаменатель подынте-
гральных выражений после деления па I (и числителя, и знамена-
теля) при достаточно малом 8 порядка единицы и в пуль не об-
ращается, а функции удовлетворяют условиям Липшица по х, р.
В предположении, что некоторые Xj, pj для всех у = О, 1, ..., у*
ограничены и лежат в области определения подынтегральных
функций kJ < К, IpJ < К, К = const устанавливается [98, 141],
что при достаточно малом 8>0 справедливы оценки \xj +1|<
<Z М, | Pj*+11 < М, М — const, где М > К, независимо от у*.
Во-вторых, доказывается, что последовательные приближения
(14) равномерно сходятся ,к решению интегральных уравнений
(12) и являются непрерывно дифференцируемыми функциями
/г, h() fe*, т. е. предельные функции определяют искомое ре-
шение краевой задачи (8) для х, р, гладкое относительно /г, /г °,
г)°, Д*, и 8. Для доказательства вводятся разности
max |^+1 — = а,+1, max | р}+1 - р} | = &Н1. (7.5.15)
h,h* h,h*
Согласно (14) получаются оценки
/ h°\
aj+1^eX(aj + max feln-r-j, 0^ fe* fe0,
h,h* \ '
+ (7.5.16)
Здесь X — постоянная Липшица подынтегральных отношений по
х, р. Оценка коэффициентов в (16) приводит к выражениям
max
/i*ln'^, ; е = 2,71828...
h* е
Таким образом, справедливы оценки
aj+i 8 Л (aj + ъ>), ь1+1 AaJ+i + + bj).
Усиливая второе неравенство, можно получить
bj+l 8С(п;+ 6J, С = кА+В.
Сложением оценок для и bi+i получается оценка aj+i + bj+l
8 (Л + С) (dj + bj), т. е. dj+l zDdj. Полагая sD = 8 (Л + С)< 1,
можно установить, что dj 0 при у °°, т. е. lima^, 6; = 0. Та-
j->OO
кпм образом, последовательные приближения равномерно сходят-
17 л. Д. Акуленко
258
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
ся при h > h* к гладкому решению интегральных уравнений (12)
и краевой задачи (8).
Методом от противного, в-третьих, доказывается, что решение
единственно при 8>0 достаточно малом, см. выше.
II, наконец, при fe* 10 получаются искомые функции х, р
(10), определяющие функцию W(x, в) согласно (И), а вместе
с нею функцию Веллмана V (х, е) = Д + еИ/(а:, е) задачи опти-
мального управления.
§ 6. Синтез оптимального управления в задачах
с фиксированным моментом окончания процесса
1. Постановка задачи управления с фиксированным временем.
Рассматривается класс задач оптимального управления многомер-
ными системами, приводящимися к одномерным, аналогично
вышеизложенному. Для определенности исследуется система
х = f(t, rr)+ b(t, h)S(t, x)u, h= Ы, x(tQ) = x°. (7.6.1)
Здесь x — n-вектор co значениями из области Dx, в которой оп-
ределены и являются гладкими функции f, b, S; [£0, 7] —
время; tQ, Т, xQ — заданные величины; и — n-вектор управления,
b — скалярная функция, 6^60>0; S — ортогональная (пХп)-
матрица: S~1==S'. Предполагается, что функция /(/, х) удовлет-
воряет обобщенному условию
(n./(z, x)) = a(t,h), П = &t)s=DxX[tQ,T], (7.6.2)
Для системы (1), (2) ставится задача оптимального управ-
ления
т
х(Т) = 0, J [u] = j* u2dt-+- min, |и|<оо. (7.6.3)
t и
го
Дополнительные ограничения на управляющую функцию и пока
не налагаются. Физический смысл критерия качества управле-
ния (3) может заключаться в минимизации энергии, затрачи-
ваемой на стабилизацию системы, величина и2 в этом случае
есть расходуемая мощность [84]. Для задачи оптимального уп-
равления (1)—(3) требуется найти оптимальное управление в
виде синтеза u(t, х), оптимальную фазовую траекторию
x(t, /0, я0), а тем самым и программное управление u(t, tQ, х"),
и минимальное значение функционала J.
С помощью приема, аналогичного примененному в § 1—3,
устанавливается, что задача оптимального управления (1) —(3)
эквивалентна некоторой задаче оптимального управления для
§ 6. СИНТЕЗ В ЗАДАЧАХ С ФИКСИРОВАННЫМ МОМЕНТОМ
259
скалярной переменной h=\x\. Действительно, умножая скаляр-
но уравнение (1) на т], можно получить соотношения
h = a(t, h)+b(t, й)(т|-у), h(tQ)=h°, (7 6 4)
7г(Т) = 0; J[u] = J[v]; v = Su.
Вектор управления v представляется в виде v = iry, где w —
скаляр, ay — единичный вектор. Из уравнения (4) следует, что
управление будет оптимальным, если 7 = гр В результате можно
прийти к скалярной задаче оптимального управления вида
h = a(t, h)+ b(t, h)w, h(tQ) = hQ,
Tr (7.6.5)
Д(Г) = О; J [ш] = I w2dt -> min, |ш|<оо.
t u'
ro
Ее решение строится на основе достаточных условий оптималь-
ности метода динамического программирования [53, 61]. Задача
Коши для функции Веллмана W — W (t, h) имеет вид
'dt+a('t'h^dh~~b “°’ (7.6.6)
W(T, 0) = 0.
Нужно отметить, что задача Коши для функции Веллмана
V (t, х) исходной задачи оптимального управления (1) —(4)
приводится к виду (6). В самом деле, из соотношений
- + (-№г)] (М.7)
к(1, г)--4-I'll’, "I ’ О
с учетом свойства (2) для функции f(t, х) следует, что
V(t,X) = W(t,h), g = (7.6.8)
Подстановка (8) в (7) приводит к задаче Коши (6).
2. Построение оптимального управления. В общем случае
для произвольных функций a(t, h), b(t, h) решение задачи Ко-
ши (6) аналитически построить не удается. Функция Веллмана
W(t, h) может быть построена методом характеристик в пред-
положении кусочно-непрерывной дифференцируемости а и Ъ по
h и непрерывности по t, [£0, Т]. Такой подход аналоги-
чен применению принципа максимума [180], приводящего к
260
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
соотношениям
Н = — w2 + (а + bw) р maxf = г/2Ь (t, h) р,
h = a(t, h)+b(t, h)w*, h(t0) = h°, fe(71) = 0,
P = ~pfy + PW = PT’ (7-6.9)
T
H* (t) = H*(T)-§™ I* dx, H* = H |tt..
t
Таким образом, согласно (6), (9) сопряженная переменная р =
= ~dW/dh. Пусть краевая задача принципа максимума (9) ре-
шена, т. е. известны функции h, р в виде
fe = fe*(£, to, й°), Р = Р*(£, tQ, h°). (7.6.10)
Тогда управление it* в виде программы wp пли синтеза ws
суть
(*, tQ, h°) = 72р* (£, tQ, h°) b (£, fe* (£, tQ, A0)),
ws(t, h)=wp(t, t, h) = 42p*(t, t, h)b(t, h). 1 }
Минимальное значение функционала J* и функция Веллма-
на W находятся квадратурами
т
J* = W (t0, h°) = J iv2p (t, t0, h°) dt,
*o
T. (7.6.12)
W = W(t, h) = | z^(t, t, h)dx.
i
Подстановкой найденных функций fe*, p* в (8), (4) получа-
ется искомое оптимальное управление u* = S'(t, x)v* исходной
системы (1). Оптимальная фазовая траектория x(t, t0, xQ) опре-
деляется в результате интегрирования задачи Коши (1) при
и = us или и = и*. В ряде случаев удается построить ее анали-
тическое решение на основе общего решения при и = 0. Ниже
рассматриваются некоторые частные случаи, допускающие ана-
литическое интегрирование и решение краевой задачи.
1) Пусть a = a(f), b = ^(t); тогда р = const. Оптимальное
управление, функционал и функция Веллмана, согласно (11),
(12), равны
ivp(t, t0, h°)= 1/2^(О/?*(^о, fe°), ^s(^, h)= l/2^(t)p*(t, h),
г T -| IT
p = p*(t0,h°) = -2 h° + $a(t)dt /Jp2(t)dt,
о
r ° (7.6.13)
J* = W (t0, h°) = Д- p*2 (t0, h°) J p2 (0 dt, W = W (t, h).
§ 6. СИНТЕЗ В ЗАДАЧАХ С ФИКСИРОВАННЫМ МОМЕНТОМ
261
Дифференцированием по t, х можно убедиться, что функция
W(t, h) является решением задач (6), (7). После подстановки
ip = ipe(^ k) в (5) или (9) получается линейное уравнение для
h с обратной связью. Его интегрирование приводит к выра-
жению
Г т
h(t, t0, hQ) = hQ + [ a(t)dt
*o
h(T, t0, hQ)= 0.
T IT T
| P2 (t) dx / j* p2 (/) dt — [ a (t) dx,
* Ho *
(7.6.14)
Построение оптимальной фазовой траектории x(t, t0, x°) про-
водится после подстановки u* = Пусть f(t, x) =
= g(^)+ a(0л, где (^'g)s0, причем g(я)—однородная функ-
ция степени in > 1: g(kx) = kmg(x). Тогда система (1) имеет
вид
х = g(x) + a (On — Р2(0 П
^о) = ^°
Т 1 IT
h + j* а (т) dx I / J p2 (t) dx,
(l.SAb)
и подстановкой x = hz приводится к виду с инвариантной нор-
мой (|z| s 1):
t
^ = g(z), t0,h°)dx, z(0) = v[>. (7.6.16)
*0
Если известно общее решение z0 = (₽(£ — tQ, n°> ^°) системы
(1) при a = p = 0, то решения (16) и (15) равны z = cp(s, n°, 1)»
x — hxp. Аналогичным образом определяется траектория x(t, tQ, xQ)
в случае /(£, х) = б (t)g(x) + a(0n, где б—скаляр. Тогда под
интегралом в выражении для $ (16) стоит функция
tQ, hQ).
2) Пусть функция а линейна по h: a(t, h) = y(t)h + a(0,
a b (t, h) = p (0 > p0 > 0; тогда аналогично вышеизложенному
Г т
^Р = 1/2р(0рт(^ А°)Г(Л t), ws = i/^(t)pT(t, h)V(T. t),
M*o, fe°)=-2[ftT(T, М + А(Л М]В(Л tQ),
(7.6.17)
т
V(T,f0) = exp \y(t)dt , A(T, f0)= fa(0r(7\ t)dt,
0
- *о
T
В (T, t0) = J P2 (Z) Г2 (T, t) dt, J* = W (Zo, h°) = (/i°r + A)2/B.
262
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Вновь непосредственным дифференцированием устанавливается,
что функция W(t, h) удовлетворяет (6) —(8). Решение уравне-
ния для ws после подстановки ws(ivs->—сю при t] Т) равно
h(t, Zo, fe°)=fe°[r(Z, Zo)— Г(7\ Z)T(T. Z0)B(Z, Z0)/B(T, Zo)] +
+ A(Z, М~Г(7\ Z)A(7\ Z0)B(Z, Zo)/B(7, Zo). (7.6.18)
Как следует из (17), (18), h\0 при ZtT; это справедливо
для любых Zo, Т (t0<T), hQ. Оптимальная фазовая траектория
x(t, Z(), х°) при /(Z, х)= 6(Z)g(z) + ^{t)x + a(Z)p, где б, 7, а —
скалярные функции, после подстановки и* = w*S'x] в (1) полу-
чается аналогично 1) на основе решения задачи (16):
х = hz, z = ср (5, ц°, 1), 5 = [ б (т) hm~1 (т, Zo, h°) dx. (7.6.19)
*0
3) Рассматривается случай автономной системы (5) или (9),
т. е. a = a(h), & = [3 (Д)> |30 > О, где a, (J — непрерывно диффе-
ренцируемы при h е [0, hQ]. При решении используется свойство
Я* = const (9)
Я* (t) = Я* (Т) = ± р№ (0) + Рта (0), (7.6.20)
из которого следует выражение для сопряженной переменной р:
Р = Р<Л рт) = -2?r2(h){a(h) + [П*(Т) £2(fe)+ а2(й)]1/2>. (7.6.21)
Подставляя р в ip*, а затем w*(h) в (5) или (9), можно полу-
чить уравнение для h с разделяющимися переменными. Интег-
рируя и определяя знак в (21) (нужно брать знак плюс),
можно получить соотношение
h
- f [a2 (Z)'+ Я* (Г) р2 (Z)]-V2 dl = t - Zo. (7.6.22)
h"
При fe(71) = 0 в (22) получается уравнение, определяющее
постоянную рт, которая входит в Я*(/) согласно (20). Пусть
параметр рт = рт(Т — Zo, hQ) определен и подставлен в (21).
Тогда синтез управления ws(T — Z, h) находится согласно (9).
После определения из неявного соотношения функции /г =
= h(t — tQ, Т — Zo, й°) находятся программное управление ыр
и минимальное значение функционала J* = W(T — tQ, fe°), а так-
же функция Веллмана W=W(T — t, h). Подставляя управление
и* = ш*5'г| в (1), можно задать оптимальную траекторию
x(t — Zo, Т — Zo, xQ). В частном случае /(Z, а:) = 6(Z)g(rr), т. е.
а = 0, получаются выражения
Р = Рт Рт= ~ f PVO’ (7.6.23)
о
§ 6. СИНТЕЗ В ЗАДАЧАХ С ФИКСИРОВАННЫМ МОМЕНТОМ
263
На основе (23) и вышеизложенного синтез оптимального уп-
равления ws и соотношение для h имеют вид
h h hQ
ws(T- t, h) = — у—у j руту = t^T J pTftj- (7-6.24)
о h° °o
Фазовая траектория x в соответствии с (24) описывается си-
стемой уравнений с обратной связью:
h
х = б (i) g (*) - f J руу, х (t0) = х». (7.6.25)
О
Подстановкой x = zh для z, Ы^1, система (25) приводится
к виду с инвариантной нормой (16), решение которой имеет
вид (19) для однородной функции g(x).
3. Обобщения задачи оптимального управления с фиксиро*
ванным временем. Приведение задачи управления к одномерной
возможно в следующем случае:
x = f(t, х, |iz|)+ b(t, h, |u|)S(£, x, u)u, x(tQ) — x°,
\x(T)\^M, \xQ\>M (k(T)l>>, \x°\<M); (7.6.26)
т
J [u] = F (h (71)) + f G (Z, h, J и |) dt min , h = | x |.
f0 lul^U0
Здесь S — ортогональная матрица, функции /, b аналогичны
рассмотренным выше. В частном случае (26) получается зада-
ча (1) — (3). Посредством рассуждений п. 1 получается эквива-
лентная одномерная задача оптимального управления:
й = а(£, й, ltd)+&(£, й, |zp|)zp,
Л(^0) = й°; h(T)^M,
h°>M (7.6.27)
т
J [ш] = F (h (71)) + J G (Z, й, | w |) dt min .
|u|Cu°
Функция Веллмана W(t, h)=V(t, x) для (27) определяется в
результате решения задачи Коши:
^7 + min f 7Г Iя (*’ Iw ।) + ь (*’ Iw I) + G (*’ h' I w I)]’
(7.6.28)
W(T,h(T)) = F(h(T)), h(T)^M.
264
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
Считается, что решение одномерной задачи оптимального
управления существует и найдено аналогично вышеизложенно-
му. Тогда для определения управления и* получается конечное
уравнение tv*v\ = S(t, х, и)и, |и|^и°, которое предполагается
разрешимым относительно и. В частности, если матрица S за-
висит только от lul или вовсе не зависит от и, то и* =
= w*S'(t, х, Построение оптимальной траектории в
предположении f(t, х, Ы) = /(£, \и\) g(x)+ a(t, h, |п|)ц прово-
дится аналогично п. 2.
В прикладных задачах равенство типа (2) выполняется не
совсем точно, т. е. с некоторой малой погрешностью 0(e):
(ц • /(£, х, и)) = a(t, h, |u|)+ ecp(f, x, и),
где e [0, e0]—малая величина, а ср — ограниченная достаточно
гладкая функция при t^[t0, Z], h h\ lul=^u°. Ограничение
на управление и, u<^UE, может быть близким шару С70, причем
система может подвергаться воздействию других возмущающих
факторов, зависящих от фазового вектора большей размерности,
чем у х. Тогда возникает задача оценки этих возмущений или
построения приближенного оптимального решения, если идеали-
зация с 8 = 0 недопустима. В последнем случае может быть при-
менен метод возмущений, аналогичный изложенному в § 1—3,
основанный на достаточных условиях оптимальности метода ди-
намического программирования или принципе максимума. Для
рассматриваемого класса задач
в случае фиксированных Т
и конечного многообразия
| х (Z) | < М имеет место неод-
нократно отмеченная выше осо-
бенность синтеза управления
и функции Веллмана при t Т.
4. Оптимальная стабилиза-
ция твердого тела при помощи
системы управления «ограни-
ченной мощности». Рассмат-
Рис. 7.5
ривается задача управления вращениями динамически симметрич-
ного тела в случае Эйлера (уравнения (1.11) при Ц = I2 = I).
1) Пусть схема управления имеет вид, представленный па
рис. 7.5, т. е. состоит из пары фиксированных двигателей
(/3, ~/з), создающих момент сил М3 относительно оси симмет-
рии Осоз и пары верньерных (/±, ~/±), создающих моменты М{
и М2 относительно осей Ось и Осо2
Mi = 2lf± sin ip, M>2 = 2lf± cos M3 = 2r/3,
(7.6.29)
§ 6. СИНТЕЗ В ЗАДАЧАХ С ФИКСИРОВАННЫМ МОМЕНТОМ
265
Здесь Z, г—«плечи сил». Считается далее, что величина (о3 из-
меняется в соответствии с заданным законом управления п3 =
= М3/13, т. е. является известной функцией t.
Ставится задача оптимального гашения экваториальной состав-
ляющей вектора угловой скорости:
(01,2 — + V (О <02,1 + ^1,2» (01.2 (^о) = (7.6.30)
т
(01,2(Л = О, J [Щ, ^21 = J (мх + *4) dZ->min;
/0 UyU2
W1,2 = —р, v(t) = ©3(t), u'l + u^u02, u° = 2y-fi.
Искомое решение задачи синтеза существует, если и°
> (о±/(71 — Z), п имеет вид
W (£, от) = (о2± (7 - 0"1, ws = - (о± (Г - Z)"1,
(7.6.31)
^1,2 ~ ~ <-01,2 0 t <о± = (<0i + <о2) / •
Фазовая траектория, программное управление и значение
функционала, согласно методике п. 2, находятся явно
* * / W1 W2 • * О Т— t
(0х = (0± —- cos 5------- Sin .9 , (О± = (0± „---,
\ <01 (0^ у 1 - '0
* * / (О? <°2 1 С
(Оо = (о± — sin 5 Ч—- cos .9 , <9 = v (т) cZt, (7.6.32)
\ <о? (о°, / 3
у - ± / 'о
<2 = - <2 (Т ~ = (0°±2 (Т - tQ)~\
2) Пусть на симметричное тело со стороны внешней среды
действует тормозящий момент сил вязкого трения. Тогда зада-
ча оптимального управления имеет вид (30), где уравнения
движения суть
(01,2 = ^’(^(Ojt, 1 — 7(01,2 + ult 2. (7.6.33)
Если 7 = const > 0, то решение задачи синтеза при условии, что
управление не превосходит ограничения, равно
\ 2уГ2и, Г) 2 2уГ20, Т)
Ж (t, (0±) = —-—з-2—— 0)±, Ws=-------—5(0±,
1 — Г2 (J, Т) х i — r2(i, Т)
(7.6.34)
Г(£, Т) = ехр 7(Z — Т) 1; 2 = ^(Oi, 2/(0±.
Интегрированием системы (33) после подстановки н12 из
(34) находятся оптимальные фазовая траектория, программное
266
ГЛ. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
управление и функционал
со* = ю? (ц?cos s — sin s), &>2 = ("Hi sin s + cos s),
<ol= оД{Г(Го, t) T)-F(t0, t)V(t0, T)J [1-Г2(t0, T)]-i}
wp = - 2у(оо±Г (t, T) Г (t0, T) [1 - Г2 (t0, T)]"1; (7-6.35)
J* = 2у<Л2Г2 (t0, T) [1 - Г2(£0, Г)]’1 Ь = j v (r) dx
' *0
Условие того, что управление «не выходит на ограничение»
(30) заключается в проверке неравенства
u°>w = 2у®°±Г(«0, Г)[1-Г2(г0, Т)]-1. (7.6.36)
Если же и° < и, где
u = V(D°±r(Z0, Т) [1 - Г (f0, Т)]-\ u<u, (7.6.37)
то система не может быть стабилизирована за время Т —10. Не-
равенство ?г° > и определяет значения параметров, для которых
задача оптимального управления разрешима.
В промежуточном случае и < uQ < й оптимальное управление
разбивается на два участка (рис. 7.6):
и°Г(£, г*),
Шр = । л
I ~ и ,
*0
(7.6.38)
Здесь U, е [L, Т) — некоторый момент времени выхода
управления на минимальное
значение —и°. Оптимальное
управление wp отрицатель-
но и в начале процесса уп-
равления его модуль возрас-
тает. Это показывает, что
«экономия» ресурсов управ-
ления за счет сил трения
более эффективна на началь-
ном участке движения, ког-
да значения относитель-
но велики. Подставляя опти-
мальное управление wp из
(38) в уравнение для со±, из условия co±(Z) = O, где
U <0’ = ю±г(<0> 0 —
°Г/л f1/2Z*) Г(2Z0l i*)],
~U V/2 [Г(<*, 0) — Г(2<0, U]+r(t, О)-Г(^О),
можно получить квадратное уравнение для определения момен-
§ 6. СИНТЕЗ В ЗАДАЧАХ С ФИКСИРОВАННЫМ МОМЕНТОМ
267
та t* как функции параметров задачи:
** = у-1 Jn (Г (Г, 0) - (Т/МО) Г (<0, 0) < +
+ ЦГ(Т, 0) — (у/u0) Г(г0, 0) ]2—Г2(?0, 0)),/2). (7.6.39)
Представляет интерес исследовать предельное поведение
функции t*. Из (39) следует, что при нЧ и величина J* Jo;
если и° 1 й, то t* | Т. В окрестности предельных значений н°
для t* = J* (j0, 71, оД, у) можно получить приближенные вы-
ражения. При uQ = н(1 + е), 1 > 8 >0
t* = tn+ /27у-Ч1-Г(г0, Г)]1/2 Г(1/Л, 1/2Т) + О(г),
t*-/0 = O(/e).
Если же uQ = й(1 — 8), то /* = Т — еу-1 + О(е2), Т — t* = О (г).
3) Рассматривается задача полной стабилизации тела (КА)
при помощи двигателей ограниченной общей мощности [84].
Уравнения движения и ограничения имеют вид
(О],2 = Н“ 4“ ^^1,2» <*>3 = ^3^3» (Q =
х = (/3 - I) Г1, b = 21рГ\ Ъ3 = 2грЦ\ i = 1, 2, 3, (7.6.40)
^ = 1/2И(и?+и2+ W2),
Здесь ц ~ const — скорость расхода рабочего тела, Ui — регули-
руемые в широких диапазонах скорости истечения реактивных
струй двигателей (сила ji = [iut)\ изменение знака щ осущест-
вляется различными конструктивными приемами [84]. В качест-
ве критерия качества управления принимается функционал,
характеризующий расход энергии системы управления на ста-
билизацию:
Е =
N dt-*- min,
u
0 < N < 7V0, u2<z/02 = 2—.
0 P
(7.6.41)
Заменами #1,2 = (th, 2&Ч = <03^3 \ % = x63, £, = 1/2ц/ зада-
ча (40), (41) приводится к более удобному для исследования
виду. Задача управления имеет решение при выполнении не-
равенства > h"(T — Jo)"1, которое должно проверяться при
построении синтеза в текущий момент времени. В результате
применения методики § 6 следует
TT(J, h) = h2(T-t)-1, \i = wsT], ivs =—h(T — t)~l.
Оптимальная фазовая траектория x и минимальное
значение
268 гл. 7. МЕТОД ПРИБЛИЖЕННОГО СИНТЕЗА
функционала J равны
X == fez, fe = fe° (7 - t) (T - tQ)-\ wp = h° (T — Q-i,
zi = Л? cos 5 — Л2 sin 5, z2 = ц? sin s + r|2 cos z3 = ц!},
J* = fe02 (T _ 5 = xfeono {t _ ,o) {T _ [T^1/At + Zo)b
Нужно отметить, что s = 0 при t = T. Влияние дополнительных
внешних моментов сил, например вязкого трения, учитывается
аналогично 2).
Ряд задач оптимального управления вращениями твердого
тела относительно неподвижной точки (центра масс) исследован
методами гл. 7 в гл. 8.
ГЛАВА 8
ЗАДАЧИ СТАБИЛИЗАЦИИ
И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
При помощи подхода гл. 7 исследуется в первом приближе-
нии ряд задач оптимального по быстродействию торможения
вращений относительно неподвижной точки (центра масс) не-
симметричного тела. Учитываются возмущающие воздействия
различной физической природы, в том числе обусловленные
внутренними степенями свободы. Исследуются задачи переориен-
тации и стабилизации заданного движения.
§ 1. Оптимальная по быстродействию стабилизация
твердого тела
1. Торможение возмущенных вращений динамически симмет-
ричного тела. Рассматривается система (7.1.11) при условии
Л = А = 7, 61 = Ь2 = Ь=Л0;
^ = Mi + e2V<(<o), * = 1, 2, 3, u2 1. k '
Возмущающий момент сил eN учитывает влияние внешних и
внутренних (гироскопических) сил. В результате преобразова-
ния к новым переменным zf получается задача управления для
системы вида (7.1.1) — (7.1.3):
Z 1,2 i ^Z3Z2,1 = Wl,2 + е/1,2» z3 = zz3 + е/з, Zj (0) = Zf,
г = 1,2,3; d = b3 (I3 - I)
z(T) = 0, 7-> min, lu|<l. (8.1.2)
u
При 8 = 0, согласно (7.1.4) —(7.1.7), известно решение зада-
чи оптимального управления
Uo=— 1], h0=h°(l — tTo1), T0 — h°, z0 = hoi^ (t, z°);
h° h° z°
Пю = ГТ cos (° + a°)* П20 = 7Г sin (a + a°), Пзо = dh (8.1.3)
n, fl fl
h± = (zj + a = dz$t (1 — -5-7-), coso° = -y, sin a0 = —
270 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
Величины 2i (z2), 23, До, о качественно изображены на рис. 8.1.
Как отмечалось, о = 0 при t = TQ {195, 229].
Функция Веллмана Z(z, е), обращающаяся в TQ = h при
8 = 0, строится как решение задачи Коши для нелинейного
Рис. 8.1
уравнения в частных производных (см. (7.1.20)—(7.1.22)):
R + di\z2z3 — dzir2z3 — 8 (г • f)= 1, Z(0, б) = 0;
(8.1.4)
7? = |г|? т = дТ/дч, и = -гЯ"1; Т = h + (z) + 82...
На основе порождающего решения (3) методом характеристик
получается выражение типа (7.1.27) для искомых коэффициен-
тов Т\(2), в частности
h
= Яо = По(^-^4 (8.1.5)
о
Последующие коэффициенты вычисляются аналогично. Опти-
мальное управление находится при помощи выражений (4):
U(1) (z, б) = — (Т) + 8Fi) It) + 8FJ"1. (8.1.6)
Оно удовлетворяет ограничению (2) и приводит вектор z в
82-окрестность начала координат: z(^° + 8?\ (z°), z°, б) = О(б2).
Приближенная оптимальная траектория z(1)(£, z°, б) получается
интегрированием системы (2) при u = u(1)(z, 8).
Ниже рассматриваются конкретные примеры возмущений.
Предполагается, что соотношение осевой симметрии (1) выпол-
§ 1. ОПТИМАЛЬНАЯ ПО БЫСТРОДЕЙСТВИЮ СТАБИЛИЗАЦИЯ
271
няются приближенно с погрешностью 0(e): Ц 2(е) = 7(1 + e6i, 2),
61,2(е)= 6(1 + 8^, 2), причем на систему действует момент ли-
нейных по скорости диссипативных сил —бАш (А — неотрица-
тельно определенная матрица). В результате преобразовании (2)
функция f приводится к виду
з
fi (z) ~ Уг%г+1%1+2 2 ^ij = jlbjlj, I = 1, 2, 3, j
Ti = - (0/<te) [(Z3 - Iz (e)&2(e) b3b? (e)] |£=0 (1, 2, 3).
Выражение для коэффициента 7\(z), согласно (5), состоит из
двух слагаемых, отвечающих различным возмущениям (7) (ги-
роскопическим и диссипативным):
з
(z) = Tl(z) + ^(z); T^z) =- 2 (z),
_ (/ ч ’’5-1 (8.1.8)
T1 (z) = — !/2 (T1 + ?2 +?з) z3h 3 ((z2 — Zi) cos(dz3h) +
h
+ 2z1z2 sin (dz3h) J I2 sin (dr]3Z2) dl +
о
h
+ [2z1z2 cos(dz3fe) — (z2 — Zj) sin (dz3fe)] j* I2 cos(dr|3Z2) dl|.
о
Здесь функция Z} (z) при dr)3 0 выражается при помощи ин-
тегралов Френеля [81, 236]. Коэффициенты a<j(z) находятся в
элементарных функциях. Их явные представления и анализ
управляемого движения содержатся в [14, 229], см. также (15).
2. Стабилизация несимметричного твердого тела. Исследуется
задача оптимального по быстродействию торможения возмущен-
ных вращений системы (7.1.11):
L + g>XL = M, M = u + ef(G), u), и^Щш),
L = 7g>, 7 = diag(Z±, 72, 73). (8.1.9)
Область Ue близка сфере радиусом iz0, который можно положить
равным единице, с центром в начале координат связанной си-
стемы, и имеет достаточно гладкую границу Ге. Для большей
определенности полагается Гс = {и: u2 + eg(u, ш)=1}, где g —
достаточно гладкая функция и, со (см. § 3 гл. 7); ш/Vщ -+ (о,
W -> t.
При 8 = 0 система относится к виду (7.1.11) — (7.1.14)
с ц = 1, v = 0, bi = 1, i = 1,2, 3. Синтез управления (см. (7.1.15))
есть и0 = —LZ/”1, TQ = Л0, а оптимальная фазовая траектория
о)0 (Z, (д°) определяется на основе известного решения при ио = О,
т. е. движение Эйлера — Пуансо. Для управляемого движения
272 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
довольно просто находятся величины LQ и Ео, которые являются
интегралами свободных вращений. Умножая скалярно (9) при
8 = 0 на Lo и «о, можно получить выражения Z/0 = L? — /,
Eq = EQL2/LQ2. Отсюда следует, что для всех справед-
ливы неравенства 2Е^1Х L2Q 2£0Z3 и, кроме того, Lo = 2£oZ*,
где Zx Z* Z3. С учетом интегралов при помощи за-
мены переменных система (9) приводится, как обычно [197,
236], к одному уравнению с разделяющимися переменными, ко-
торые интегрируются в эллиптических функциях. Другой способ
построения (д0(£, (0°) заключается в подстановке Lo = Z(d0 = Lovt
где v — неизвестный орт вектора Z/0; для v получается урав-
нение
dv/ds + Z~‘v X v = 0, v (0) = L°/Z/° v°,
s = i/2(^-£5), se [0, i/2£02]. (8.1.Ю)
Его решение v(Z/0, L°, v°) имеет вид (6.4.2) в области
h
Г1 = (v)cn (о, х), r2 = a2(v)sn(o, х), v3 = a3(y)dn(v, х),
«1,2 = Л,2 [(2W3 - 1)/Z1>2 (Z3 - Zb2)]V2, (8.1.11)
«3 = ±Z3[(1 -2fcZ1)/Z3(Z3-Z1)]V2, = i/2zr\ / = 1,2,3,
h = h (v) = h^v2 + fe2r>2 + fe3r>3 = Eq!= EQt!LQ2 = const,
x2
(л2-Л)№-1) (л2-Л)(2Уз-£о)
= k2 = const,
X2, £2^[0, 1]; o = xs + o°, x = (Z1Z2Z3)-1/2(Z3-Z2)1/2(1-2W1)-1/2.
Здесь x — модуль эллиптических функций, фазовая постоянная
о° выбирается из начального условия (10) с точностью до пе-
риода 4К(х) (см. (6.4.2)). В дополнительной области h2 h С
hi функция v получается из (11) заменой индексов 1 — 3.
Таким образом, невозмущенное управляемое движение полностью
определено. Оно представляет собой движение типа Эйлера —
Пуансо (х = const) с линейно убывающей во времени величиной
Lo. Оптимальное программное управление п0(£) получается под-
становкой (И) в выражение u0 = — Lo/Lo; в' результате и0(/) =
= -Vo(^, (О°).
Построение приближенного управления при 8 = 0 проводит-
ся при помощи методики § 3 гл. 7. Для искомой функции Вел-
лмана V имеет место задача Коши типа (7.3.31):
У=У(Ь, 8) = £ + 8V1(L)+82..., 7(0, 8) —0. (8.1.12)
Здесь F — известная достаточно гладкая функция своих аргу-
ментов [21]. Для коэффициентов Vj получаются выражения в
§ 1. ОПТИМАЛЬНАЯ ПО БЫСТРОДЕЙСТВИЮ СТАБИЛИЗАЦИЯ
273;
виде квадратур (7.3.42), в частности
L
yx(L) = j’ (Zv0 (Z, L, v), v0(Z, L, v))dl. (8.1.13)
0
Функция v0 в (13) определена согласно (И). Подробный ана-
лиз формулы (13) содержится в [21]. Ниже приводятся расчеты
конкретных примеров возмущений.
2.1. Пусть U = Uo, а возмущение ef зависит от <о линейно:
i = N<&, N = (ntj) = const (f, 7 = 1, 2, 3). Тогда из условия типа
(4.1.19) находится управление u = — (dV/dL) I^V/^Ll-1. Функция
F в (12) при этом равна F = (dV/dL-Мо). Коэффициент V,
согласно (13), равен
з
yi (L) = 2 у2 | (I, L, v) (I, L, v) I dl. (8.1.14)
Интегралы в (14) вычисляются в эллиптических функциях
(см. для сравнения (8)):
ь %
a{j (L) = voivojldl= J i?oipo/fo, о0 = ‘^'/Л2 + о°;
о ' о0
an = (х2 — 1) х-2£2 + х-2 {Е (am о0, х) — Е (ат о°, х)],
а22 = x/2«2x“2£2 + х~2 [Е (ат о0, х) — Е (ат о0, х)],
®зз = «зх-2 [Е (ато0, х) — £ (ат о0, х)], (8.1.15);
«12 = «21 = “АГ1*"2 (dn о° — dn о0),
«13 = «31 = «1«зХ-1 (sn «о — sn °0),
«23 = «32 = «2йзХ"1 (СП О0 — СП О0).
Здесь Е — неполный эллиптический интеграл второго рода,
ат — элллиптическая амплитуда, коэффициенты аг-, х, % —из-
вестные функции L. Хотя параметр а0 определяется из (10) не-
однозначно (с точностью до периода 4К(х)), однако первые
три выражения (и последующие) определяются однозначно.
Можно отметить, что если N — диссипативная матрица, то
Vi<0 для всех L (А>0); если N — положительно определенная
матрица, то Pi>0, т. е. время быстродействия увеличивается.
Для динамически симметричного тела коэффициенты (8) по-
лучаются при помощи формул (15) предельным переходом при
х -> 0 и выражаются в элементарных функциях.
2.2. Пусть относительно каждой из связанных осей действу-
ют малые постоянные моменты сил Iml < 1. Тогда из (5\
18 Л. Д. Акуленко
274 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
следует
F1(L)= 2Х Ыг (Л Л V) dZ. (8.1.16)
о
Выражения для коэффициентов в (16) при f = l, 2 являются
обобщениями на случай эллиптических функций Якоби интег-
ралов Френеля (см. (8)). Из свойств этих интегралов следует,
что при больших L основной вклад вносит момент т3 для
Л3 h < h2 или — в дополнительной области А>А2; вклады
mit 2 или т2,3 ограничены.
2.3. Функция VJL) вычисляется в предположении, что воз-
мущение т, |т1=^тп0<1 стремится увеличить величину Т —
время торможения (игровая постановка), т. е. m = modV/dL.
В этом случае функция Веллмана возрастает на величину Vt =
= m0L. Если же каждый из моментов тг ограничен:
, i=l, 2, 3, то из уравнения Айзекса — Веллмана [1, 116]
аналогично находится выражение
3 С
^1(L) = 4*2 J + mi*)voi + (m** — zn*)|pOi| ] dl. (8.1.17)
1=1 0
Из (17) следует, что Vi -+ °° при L-+ oo.
2.4. Рассматриваются возмущения вида f = A((d)u, lul С 1,
где Л=(а0). Для коэффициента Vi получается выражение
з
Л(Ь) = - 2 L, v))volvojdl. (8.1.18)
t,j=l X
Таким образом, если возмущения расширяют область управления
М = (7 + еА) и, т. е. А — положительно определенная матрица
для всех I co I со0, то из (18) следует, что ^<0 (оптимальное
время уменьшается); если же А < 0, то Vt > 0.
Возможные обобщения применяемого подхода излагаются в
[21]. Из изложенного следует, что развитый в гл. 7 метод воз-
мущений для решения задач оптимального синтеза на основе
динамического программирования оказался эффективным сред-
ством для приближенного построения законов стабилизации не-
симметричного тела.
§ 2. Стабилизация тел с внутренними степенями свободы
1. Торможение вращений твердого тела с подвижной массой.
Неравенство Шварца оказывается весьма полезным при построе-
нии синтеза закона торможения также для «квазитвердых» тел.
деформация (отклонения масс от равновесных состояний) кото-
рых, вызванная силами инерции, оказывается в известном смысле
малой [140, 224—226]. При этом предполагается, что возможные
§ 2. ТЕЛА G ВНУТРЕННИМИ СТЕПЕНЯМИ СВОБОДЫ
275’
большие начальные отклонения и относительные колебания быст-
ро затухают. Тогда применение асимптотической методики «по-
граничного слоя» [67, 135, 158], развитой в [224, 225] для моде-
ли точечной массы с сильным демпфером, в предположении
гладкости управляющих моментов как функций времени
M = &(£)u, |и| ^1, 0<6*^6(£)^6** (8.2.1)
приводит к приближенным уравнениям движения осесимметрич-
ного в невозмущенном состоянии тела. Эти уравнения приво-
дятся к виду [32]
(01,2 Н- £^3^2,1 = (О I ^1,2 — BI а)зС01}2?
оД — (01 + (02, (8.2.2)’
5 _ «P2V dll
(Оз — b (£) /3 В1Ц (0±(03,
, . /3 . ™р2/3
d = 1 - -Д А = -j-/,
7 /3Q2
73Q4
Здесь diag(7, 7, 73)—тензор инерции невозмущенного тела, т —
масса подвижной точки, р — расстояние от центра масс до точ-
ки крепления; постоянные Q2‘==c/m1 у = Ь/т характеризуют ча-
стоту колебаний и скорость их затухания: с—жесткость, б —
коэффициент вязкого трения. Возмущающие моменты в (2)
малы при условии Q2»v(o>(o2; при этом собственные колеба-
ния системы затухают значительно быстрее, чем тело совершит
оборот [224]. Вывод уравнений (2) и оценка погрешности со-
держится в [32].
Ставится задача оптимального по быстродействию торможе-
ния вращений, которые установятся в результате быстрого на-
чального переходного процесса (см. (1), (2)). Требуется найти
оптимальный закон управления и, траекторию <d(t) и время
быстродействия Т. На основе достаточных условий оптимально-
сти метода динамического программирования при помощи не-
равенства Шварца для вектора L находятся управление, вели-
чины L и Т:
t т
и = —L (t, tQ, L°) = LQ — b (t) dr, b (t) dt = LQ. (8.2.3)
Так как согласно (1) 5 > Ь* > О, то корень 71* уравнения (3),
определяющего T* = T(t0, L0), существует, единствен и L?/b**
Т* — t0 L?/b*-, T(t, L)—функция Веллмана задачи. Подстав-
ляя теперь L(t) и /3(о3 = L cos 0, где 0 — угол нутации, в урав-
нение для (i)3 (2) и интегрируя, можно получить связь между
0 и t:
t
sec2 6 - sec2 6° + In ~ J Z? (t, t0, L°) dr. (8.2 Ay
276 гл. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
В частном случае Ъ = const > 0 зависимость (4) приводится к
ВИДУ
т = 1 — [1 + a(tg20° — tg20 + in (tg2 0°/tg2 0))]1/5, 0^ 1,
(8.2.5)
£° 5 bl
Г* = + t 0 = 2 ... 3
ь 0 2 mp2v dLo=>
L — 7* _
Зависимость угла нутации 0(t, 9°, а), согласно (5), для различ-
ных значений о и 0° = л/6 приведена на рис. 8.2. Можно сде-
лать следующие качественные выводы: при о 10 величина
0 -> л/2; при at 0 угол 0-> 0 для т>0. Если же а->±оо, то
угол нутации 0(т)~0°, т. е. за время торможения величина 0
не успевает существенно измениться. В пределе при Ь -> 0 вре-
мя Т* -> оо и полученные
формулы совпадают с соот-
ветствующими для пассивно-
го движения [224].
На основе известной за-
висимости 0(^ t0, 0°) опре-
деляется вектор угловой ско-
рости <о(£, t0, g>°):
cd3 = (L/I3) cos 0,
cos 0° = Z3w“ Д°, (8.2.6)
ci)1 = ©J (LIL°) exp a cos ip,
©2 == ci>2 (LIL0) exp a sin i|?.
a (t, t0, ©°) =
t
= -jJ©3(t, t0, <a°)dr,
ll?(t, t0, ©°) =
t
= J (d 4- ЛЛ2)(о3йт.
*0
Подстановка выражений (6)
в (3) позволяет построить
программное управление для конкретных начальных условий.
Итак, поставленная задача оптимальной стабилизации решена
полностью.
Пусть теперь рассматривается случай связи между телом и
массой с помощью линейной пружины с жесткостью с и демп-
фера с квадратичным трением с коэффициентом ц. Тогда в пред-
положении Q > со, где £22 = с/тп, цй = ЛА3, получаются прибли-
§ 2. ТЕЛА С ВНУТРЕННИМИ СТЕПЕНЯМИ СВОБОДЫ
277
женные уравнения движения вида (2). Различие состоит в
членах, обусловленных диссипацией, которые равны соответ-
ственно
- /)0)л(0з0)12, - D773’1(o3L(o3; D = mp3rf | d| A7~473Q“3. (8.2.7)
Из (2), (7) следует, что решение задачи оптимального быстро-
действия вновь имеет вид (3). Дальнейшее исследование опти-
мального движения проводится аналогично изложенному случаю.
2. Торможение тел, содержащих полости с сильно вязкой
жидкостью. Отмеченное ранее свойство инвариантности неуправ-
ляемой системы по отношению к величине кинетического мо-
мента наблюдается и для других механических моделей. На-
пример, в случае сферической полости с сильно вязкой жид-
костью (при малых числах Рейнольдса) для осесимметричного
в невозмущенном состоянии тела возмущающие моменты сил
равны [223]
^1,2 = - Ppv-V'X (7 - 73) g4®1(2, (8.2.8)
ДГ3 = Ppv-V^r1 (73 - 7) ©>3, Р = (8л/525) 7?7.
Здесь р — плотность, v — кинематическая вязкость жидкости,
R — радиус полости. При помощи методики гл. 7 находится оп-
тимальное управление, значение кинетического момента и вре-
мя быстродействия в виде (3). При 6 = const значение угла
нутации 9 определяется в явном виде:
0 = arctg ^tg 0° exp 1 ~ ——
т = 1], Т* = £о + Л%. (8.2.9)
Дальнейшее исследование проводится сходным с вышеизложен-
ным образом, что не представляет затруднений (см. (6)).
Если тело в невозмущенном состоянии несимметрично
(Zi >Z2>Z3), то величины М равны [223]
л\ = - р 4 7Т7- [л (Л- Л) (Л + /з - /2) «1 +
V 12 3
+ Л(Л-Л)(Л+ ^2-Л)^] (1,2,3).
Они совпадают с (7) при 71 = 72 = 7. Для величины fc2^[0, 1]
(6.4.2) получается уравнение, допускающее разделение перемен-
ных (Л2 > 2Е12):
т
- (1 ~ х)(1 - - [(1 -«) + (!+ I - J
хо
п(т) = (3v/(PP))(717273)2(71 - 73)-1[72(Л + Л-Л) + 2/ЛГ1^"2(т),;
х = 372 [71 + П - 72 (7Х + 73)] (7, - 73)-i [72 (7, + 73 - 72) +
+ 27J3]-1. (8.2.10)
3vbPI3
f>P (I - I3) LQ3 ’
278 ГЛ. 8- ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
В области Z? 2Е1г в выражениях (10) для п, х нужно провести
перестановку индексов 1^3. Дальнейший численный анализ
динамики управляемого движения тела с полостью не представ-
ляет затруднений, и качественная картина поведения к2 совпа-
дает с рис. 8.2.
Нужно отметить, что аналогично могут быть поставлены и
решены некоторые задачи оптимальной стабилизации твердых
тел, содержащих вращающиеся маховики (гиростаты) [37, 102„
117], вязкоупругие элементы [225, 226] и др.
§ 3. Задача переориентации и стабилизации
несимметричного твердого тела
1. Постановка задачи. Найденные в § 1, 2 (см. также гл. 6),
законы оптимальной стабилизации приводят тело в состояние
покоя, однако не обеспечивают заданной ориентации в инер-
циальном пространстве или заданного вращения. Между тем
важное прикладное значение имеют задачи о приведении твер-
дого тела (КЛА), совершающего произвольное начальное дви-
жение, в заданное угловое положение (и закрутку вокруг одной
из главных (центральных) осей инерции, если это требуется) в
инерциальной или орбитальной системе координат. Исследование
таких задач весьма затруднено; их решение можно разбить на
два этапа: торможение вращений и переориентация в простран-
стве. Первый этап не требует знания углового положения тела
и может проводиться на основе динамических уравнений Эйлера.
Такие задачи были предметом проведенных выше исследований.
рез 0.21,2,3 обозначается
Для второго этапа переориентации
начальные и конечные условия за-
даны и являются состояниями покоя.
Задачам оптимального управления
ориентацией посвящен ряд работ
[22, 37, 44, 48, 51, 80, 83, 102, 105,
123, 137, 138, 169, 171, 181, 187, 190,
193, 196, 229, 232].
Ниже рассматривается задача
оптимальной по быстродействию пе-
реориентации твердого тела при ог-
раничении (1.5) в классе плоских
поворотов вокруг оси Эйлера (экс-
тенсивный разворот [37]). Не-
связанная с твердым телом си-
стема координат, совпадающая с главными (центральными)
осями инерции. В начальный момент t = 0 эта система совпадает
с О#1,2,з» а в конечный t = T должна совпадать с Охл,2,3-
Матрица направляющих косинусов (н0) между фиксированными
системами Оад,2,3 и Ох\ 2,з задана. Движение тела строится
§ 3. НЕСИММЕТРИЧНОЕ ТВЕРДОЕ ТЕЛО
279
в классе плоских поворотов, при котором вектор угловой скорости
co сохраняет неизменное направление в пространстве (рис. 8.3).
Кинематические соотношения для плоского поворота имеют сле-
дующий вид [104]:
COS 7 = V2 (Ли + п>2 + Пзз — 1) , 0 < 7 < Л,
(8 3 1)
cot (t) = co (t) rn,i, со = I со I, nti = const, i = 1, 2, 3, ' ’ ’ '
7?Z1
”23 - ”32 ”31 - ”13 _”12~”21
2 sin у ’ 2 2 sin у ’ 3 2 sin у
Здесь 7 — величина угла поворота, тпг — направляющие косинусы
вектора со в системе Oxit 2) з, со£ — проекции вектора со на эти
осп. Величины со, из (1) подставляются в уравнения Эйлера
(7.1.10):
Z1m1co + (Z3 — Z2)m2m3co2 = b{U\ (1, 2, 3),
(8.3.2)
ос = со; а(0) = со (0) = со (Г) = 0, а(Г) = у.
Через а обозначен текущий угол поворота. Система (2) для со
приводится к одному уравнению, которое получается делением
на bi и сложением квадратов левых и правых частей. Для упро-
щения исследования дополнительно требуется, чтобы коэффи-
циент при coco2 обратился в нуль:
m1/n27n3 [Zt (Z3 — Z2) br 2 + Z2 (Zx — Z3) b2 2 + Z3 (Z2 — Zx) b3 2] — 0.
(8.3.3)
Это равенство выполняется, если какой-либо из направляющих
косинусов равен нулю, т. е. происходит разворот в плоскости
одной из осей Ох^ или выражение в квадратной скобке равно
нулю. Последнее требование эквивалентно (7.1.12) и выполня-
ется при условии выполнения (7.1.13), в частности, для 6г= 6,
z = 1, 2, 3.
В результате имеет место следующая задача оптимального по
быстродействию плоского разворота на заданный угол у (см. (1)):
а = со, со = 6Л-1 (zr — 52со4)1/2, w = u\ ,
а(0)=со(0) = со(77) = 0, а(Г) = 7, 0<ч<л,
—> min, б(£) = ± 1, т(0е[О, 1].
b,w
Здесь б, w — управляющие функции, А и В — постоянные
(8.3.5)
280 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
Подстановка найденного решения задачи оптимального быст-
родействия w(t), 6(£), со (2), Т (4) в первые три уравнения (2)
приводит к искомым функциям иг(£), £<=[0, Т], i = 1, 2, 3.
2. Построение и анализ оптимального решения. Применение
необходимых условий оптимальности принципа максимума за-
труднено тем обстоятельством, что производная по со от первой
части соответствующего уравнения становится неограниченной
при некотором значении со. Для исследования задачи управления
следует применить достаточные условия оптимальности [83, 118].
Возникающие трудности преодолеваются также рассмотрением
двойственной к (4) задачи о максимальном угле поворота за
фиксированное время Т: у = а(Т)->тах. Так как зависимость
6,w
7 от Т монотонно возрастающая, то построенное решение двой-
ственной задачи дает решение исходной задачи быстродействия,
если считать 7 заданным, а Т свободным [229].
Ниже приводится формулировка результата. Движение сим-
метрично относительно момента времени ^ = 1/2Тл, а управление
релепно:
ш(0=1, 6(£) = signer—£), [О, Т];
б(0=±1, /ё[0, Т]. (8",ъ*
При этом возможно движение одного из двух видов:
— «ускорение — торможение»; угловая скорость со (О не до-
стигает максимально возможного при плоском повороте значе-
ния со* = В~1/2;
— «ускорение — равномерное вращение — торможение»; име-
ется так называемый особый участок управления, когда величи-
на со достигает значения со*. Момент времени £* достижения
этого значения определяется интегрированием уравнения (4) для
со при подстановке в него выражений (6) (для 6 = ±1, если
7 > 0) в пределах от со = 0 до со = со*:
= А&*кК (к) = (4 Лы*Г (1/4), к = 1 / /Z (8.3.7)
Здесь К — полный эллиптический интеграл первого рода, Г —
гамма-функция Эйлера [236]. Участок движения с максимальной
скоростью со* возникает при условии l/2T>t*. Таким образом,
искомая зависимость со(£) в оптимальном движении приводит-
ся к виду
со (Z) = со* сп ----, A:), 0^Z^min(^*, 1/2Т)1
«)(/) = w# = B-'/2, (Т>2«д (8.3.8)
(о(0-^сп(У2(^~г* + <), fe), max(T-t#,
§ 3. НЕСИММЕТРИЧНОЕ ТВЕРДОЕ ТЕЛО
281
Нужно отметить, что на среднем «особом» участке движения,
если он возникает, происходит равномерное вращение вокруг
оси Эйлера, а управление компенсирует гироскопические мо-
менты («удерживает» ось вращения). На рис. 8.4 приведены
Рис. 8.4
зависимости со (t) для трех случаев: 1 — для Т< 2Z*, 2 — для
Т = 2f* и 3 - для T>2t*.
Зависимость со (а) выражается в элементарных функциях:
со (а) =
/ . 2а \1/2
со* sin—- ,
* I Лео2 /
\ *'
0<a<min(a*, х/2у),
со (а) =
со (а) =
со*, а* < а
Y —а*
sin
2 (у - а)
Лео2
*
1/2
(у>2а:).; а* = (л/4) Асо^),
max (у - а*, г/2у) < а < у.
(8.3.9)
Из (9) следует, что участок со = (о* (£* t Т — t*) отсутст-
вует, если у 2а*, что заведомо выполняется при А 2В.
Угол поворота a(t) получается интегрированием (8) и обра-
щением формул (9) с учетом (8):
а (0 = ао(0, f е= [О,
а(О = 2ао(1/27,)-ао(71~О, ^[Х/2Л Л; (8.3.10)
а0 (0 = х/24со* arcsin [cn2 ( 2 (£* — 0/(Асо*), /с)], 0 t £*,
«о (0 ==
Соответствующие этим трем случаям выражения для a(t) также
приведены на рис. 8.4.
282 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
Обращение выражений (10) при а = у позволяет найти Т:
Т = 2t*~ Y2Aw*F (arccos (sin (у/(Лео*)))1/2, к) 2t*> у < 2а*,
(8.3.11)
Т = 2t* + (у ~ 2а*)/со* > 2f*, у > 2а*.
В результате решения задачи (4) найдены искомые величины
IV(t), 6(Z), g>(0> Т. Затем из (4) определяется со и подставляется
в (2). В результате получаются выражения для управлений
щ(0, г = 1, 2, 3:
1ЛТПЛ Г 614 ('/'И1/2 ГП^ГПг,
= (1,2,3).
(8.3.12)
Если положить и(0^0 при то получается искомое реше-
ние задачи о переориентации твердого тела. Затем при помощи
одного из управляющих моментов щ тело может быть приведено
в состояние закрутки вокруг оси 0^.
3. Синтез закона стабилизации в окрестности заданного по-
ложения. Предполагается, что в начальный момент t = 0, с которо-
го начинается переориентация, стабилизация тела осуществлена
не полностью (со (0) =/=()) и начальная ориентация О^?,2.з оп-
ределена с некоторой погрешностью. Допускается также, что в
процессе переориентации на твердое тело и систему управления
действуют малые возмущения. Поэтому из-за накопления погреш-
ностей построенное выше управление (12) не приведет к строго
плоскому развороту, а в конечный момент времени t = T тело бу-
дет иметь ориентацию, отличную от заданной Оя?1>2>3, и не-
нулевую скорость вращения («(Т1) =# 0). Для приложений пред-
ставляет значительный интерес построение закона синтеза в до-
статочно малой окрестности заданного конечного положения с
учетом возмущений различной природы.
Итак, рассматривается управляемая система, описываемая
динамическими уравнениями Эйлера и кинематическими уравне-
ниями Эйлера — Крылова [104]:
L + со X L = М + f (£, (о, а, £, 7, М), L(f0) = L°,
а = ((Oi cos у — (о2 sin 7)/cos [J, а(£0) = а0, (8.3.13)
Р = (Di sin у + со2 cos 7, (tQ) = Р°,
у = со3 — ((Oi cos у — co2sin 7)tg р, y(to) = у°.
Здесь L = (/1coi, /2со2, /3(о3)—вектор кинетического момента, М =
= (fliUi, а2и2, а3и3) — управляющий момент, и,- — управляющие
функции: и2 = и* + и22 + z/3^ 1; f — вектор момента малых воз-
§ 3. НЕСИММЕТРИЧНОЕ ТВЕРДОЕ ТЕЛО
283
мущающих сил. При L0 = О, а = р = 7 = О имеет место точная
ориентация и стабилизация тела. Ставится задача об оптималь-
ной по быстродействию стабилизации системы (13), т. е. приве-
дения фазовой точки (о, а, ] в начало координат за кратчай-
шее время.
Предполагается далее, что для возмущений справедливы оцен-
ки (0Се« 1. 8 — малый параметр)
L° = О (|У 8), (а02 + £02 + 702)1/2 = О (е), I f I = О (е),
_ (8.3.14)
t<= [to, t0 + 0Уе], 0 ~ 1, со ~ Уе, а, р, у ~ 8, М ~ 1.
На основе соотношений (14) в системе (13) совершается за-
мена
(о = У 8Й, а = 8 А, [} = sB, 7 = 8Г, f = sF, 0 = £/Уе
(8.3.15)
(Й, А, В, Г, F, А0 = 0~ 1).
Получается возмущенная система простого вида:
Й' = /-‘М - zI-'Sl X /Й + 8F (У80, й, А, В, Г, М),
A, = Q1 + 8Fa(Q1, Й2, В, Г, 8), В' = Й2+8^в(Й1, Й2, Г, 8),
(8.3.16)
Г = Q3 + (Qi, Й2, В, Г, 8); ( ') ^ (d/dQ), 0 е= [0О, 0О + 0];
Й(0о) = Й°, А(0о) = А°, В(0о) = В°, Г(0о) = Г°.
Функции Fa, в, г в (16) получаются разложениями по 8 правых
частей кинематических уравнении (13) после подстановки выра-
жений (15).
Конечные условия и функционал качества — оптимального
быстродействия — берутся в следующем виде:
Й (0*) = А (0*) = В (0 J = Г (0*) = О, 0* = 0О + 0 -> min.
|U|<1
(8.3.17)
Требуется построить с заданной степенью точности по 8 син-
тез оптимального управления, оптимальную траекторию и вы-
числить 0# — «быстрое время» окончания процесса управления.
Решение задачи (16), (17) строится методом возмущений, ана-
логично § 3 гл. 7 (см. гл. 9) разложениями функции Веллмана
по степеням 8.
Решение задачи (16), (17) в первом приближении получается
при 8 = 0 и сводится на основе принципа максимума [180] к
квадратурам и семи трансцендентным уравнениям относительно
семи неизвестных параметров 4го, Та, в, г, 0. Первые шесть урав-
284 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
нений получаются из следующих уравнений конечных условии:
й' = Рт], Р = diag (fli/Zj), ц == R/Z?, R = Р4\
t = (у? - Ч'дО, - Тво, Ч^ - Ч'цт),
7? = |R|, h| = l, о = 0 —0о, ое[0, 0], (8.3.18)
A' = QP В' = Й2, Г' = Й3; (') = (cZ/rfcr);
й (0) = Й°, А (0) = А0, В (0) = В0, Г (0) = Г°;
Й(0) = О, А(0) = В (0) = Г(0) = 0.
Следует отметить, что в уравнениях (18) без ограничения об-
щности можно полагать а<//< = 1, Р = diag (1,1, 1). Это достига-
ется линейной заменой переменных й, А, В, Г в (16) или этих
же переменных и параметров 4го, Ч'а, в, г. Дополнительным усло-
вием для определения неизвестной 0 является следующее:
2?|о=е= 1; {©л}, 0ft->min, 0, > 0. (8.3.19)
k
Если параметры 4го, Та, в, г и время процесса 0* — 0О = 0,<*
из уравнений (18), (19) определены как функции существенных
параметров й°, А0, В0, Г°, то программное управление нДо), син-
тез иДЙ, А, В, Г) и функция Веллмана для невозмущенной за-
дачи (16), (17) равны
Up = Цр, Цр = Ц (0 - 00, Й°, А0, В0, Г°);
„.-„(О,а.А,в.Г). <8-3-20>
Найти решение уравнений (18), (19) в аналитической форме
не удается. Оно известно для других конечных условий: 1) «за-
дача попадания» — фиксированы А(0), В(0), Г(0); величина
Й(0) произвольна, тогда u(0) = const; построен синтез и найде-
но уравнение для определения времени быстродействия [180];
2) «задача стабилизации» й(0) = 0 — величины А(0), В(0),
Г(0) произвольны; в § 2 гл. 7 построены программа, синтез,
траектории и функция Веллмана.
Если численно построено решение для достаточно плотного
множества точек 5°=(й°, А0, В0, Г°) из рассматриваемой обла-
сти G возможных возмущений, то оно может быть использовано
для построения синтеза, а также для решения возмущенной за-
дачи (16), (17). Здесь применима общая схема метода возмуще-
ний, развитая далее, в § 2 гл. 9.
Для исследования задачи управления (16), (17). при е=0
можно применять квазиоптимальный синтез вида
_(— 1/ /з, е= iif и g* ;
“I+1//3, S.eltfuGt;
i = 1, 2, 3;
51 = (Й1,А), 52 = (Й2,5), 53 = (й3, Г),
(8.3.21)
П; = ПГ U Itf, Gi = Gf U П, U G = G, X G2 %Ga.
§ 4. ПЕРЕОРИЕНТАЦИЯ И КОРРЕКЦИЯ ОСИ АППАРАТА
285
Здесь П< — кривые переключения для задачи быстродействия ви-
да [180] (см. также § 1 гл. 9)
s- = | щ | i = 1, 2, 3.
Картина синтеза релейных управлений (21) отвечает случаю^
когда управления u,-, i = 1, 2, 3 независимы. Она может быть
реализована при помощи системы управления (17) для которой
I и (0) I 1, так как
{и: |щ| 1/V3, i = 1, 2, 3} с {и: |и I С 1).
Отношение объемов множеств равно 2/л < 1, а отношение
времен может достигать величины УЗ/1 > 1. Управления щ (20)
или (21) приводят фазовую точку S = (Sb S2, S3) возмущенной
системы (16) в 8-окрестность начала координат и будут удер-
живать ее неограниченно долго, если функции Л равномерно
ограничены по 0. Как следует из структуры этих функций, в
общем случае можно гарантировать |FJ ~ 1 для 0 ~ 1/У8, т. е.
I/J ~ 8 ДЛЯ t — tQ ~ 1.
Задачу стабилизации системы (13) можно рассматривать ме-
тодами аналитического конструирования регулятора или опти-
мальности по некоторому (например, квадратическому) интег-
ральному критерию качества, для которых невозмущенная проб-
лема разрешима аналитически [106, 130]. На основе опорного
решения методами возмущений строится с заданной степенью
точности по 8 оптимальный синтез и траектории для возмущен-
ной системы вида (16) (см. гл. 9).
§ 4. Переориентация и коррекция оси аппарата,
стабилизированного вращением
1. Постановка задачи о переориентации оси симметрии аппа-
рата, стабилизированного вращением. Рассматривается аналогич-
ная рассмотренной в § 3 задача переориентации в инер-
циальном пространстве оси динамически симметричного аппара-
та. При этом компоненты р, q экваториальной составляющей
вектора угловой, скорости должны отсутствовать, а осевая состав-
ляющая г—иметь заданное значение (рис. 8.5).
Принимается механическая модель управляемых возмущен-
ных вращений твердого тела, близкого к динамически симметрич-
ному в форме уравнений Эйлера:
Ар + (С — А) rq = аи + jp, р (t0) = р°,
Aq-(C-A)rp = av + fq, q(tQ)=qQ, (8.4.1)
Cr = bw + fr, r(£0) = r°.
Кинематические уравнения для углов Крылова — Эйлера имеют
вид (3.13). Постановка задачи предполагает, что при t = tQ эква-
286 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
ториальная составляющая (р, q) вектора угловой скорости =
= (Р, 7» г) относительно мала: |р°| + IqQI < |г°|, причем С/А — 1.
Вектор-функция i = (fP, fq, fr) характеризует малый возмущаю-
щий момент внешних и внутренних сил, зависящих от времени t.
•фазовых координат (со, а, р, 7) и, возможно, от управляющих
функций и, v, w. Значения вектора управляющего момента сил
М = (бш, av, bw) выбираются из фиксированного в связанных
осях множества двух видов:
а) эллипсоида Ле
Ле = {и, v, w. и2 + v2 + w2 С 1}; (8.4.2)
б) цилиндра Лс
Лс = {и, v, w. u2 + v2^l, |id С 1}. (8.4.3)
Способы реализации таких множеств обсуждались в § 6 гл. 7.
Ставится задача оптимальной по быстродействию переориен-
тации оси симметрии вращающегося тела в классе кинематически
ограниченных (плоских) поворотов и приведения к заданной
скорости вращения с гашением экваториальной составляющей
вектора угловой скорости (д± = (р, q). Таким образом, полная за-
дача управления — переориентации и коррекции оси симмет-
рии— описывается уравнениями (3.13), (1) — (3) и условиями
р(Т) = д(П = 0, г(Г) = г*,
а(О^*,^о, Г], р (Г) = р*; (8.4.4)
7->min: a) б) М е Лс.
м
Считается, что начальное значение угла а(^0) = ос° близко а*,
т. е. величина а0 — а* есть малое возмущение. Если возмущения
f = 0, р° = qQ = 0, а0 — а* = 0, то решение соответствующей ие-
возмущенной задачи в классе плоских поворотов существует и
может быть конструктивно построено. Наличие возмущении при-
ведет к малой погрешности в выполнении конечных условий (4).
§ 4. ПЕРЕОРИЕНТАЦИЯ И КОРРЕКЦИЯ ОСИ АППАРАТА
287
Поэтому, как и выше, при решении задачи переориентации и
стабилизации несимметричного тела, рассмотренной в § 3, можно
разбить решение задачи (3.13), (1) —(4) па два более простых
этапа. На первом этапе исследуется плоский разворот оси сим-
метрии без учета возмущений; на втором рассматривается про-
блема коррекции угловой ориентации оси и угловой скорости
вращения в малой окрестности заданного состояния (4).
2. Разворот оси вращающего тела. Вначале рассматривается
невозмущенная задача оптимального по быстродействию програм-
много плоского разворота. Она определяется соотношениями (2),
(3) и следующими:
Ар+ (С — A)rq = аи, р = $$1пу,
Aq — (С — A)rp = av, q = р cos 7,
Cr=biv, r=y (а = 0, а(£) = а° = а*); (8.4.5))
P(Q = <Z(Q = ?(М = 0, r(t0) = rQ;
р (Т) = q (Т) = 0, р (Т) = р*, г(Т) = г*; Т -> min .
Уравнения для р, q (5) эквивалентны одному уравнению второго
порядка для р. Задача (5) приводится к виду (см. § 3):
Р = a(a2A~2h2 - C2A~2r2i2) 1/2, т = bC^w,
Р(М=Р(М = О, r(fo) = r°; (8.4.6}
Р(Т) = Р*, Р (Z) = 0, г(71) = г*;
Z-nnin, о = О, ±1; h2 = и2 4- г2,
a,h2,w
a) h2 + iv2^[0, 1]; б) Д2^[0, 1], w [-1, 1].
Здесь a, h2, w — управляющие функции, подлежащие определе-
нию. Соотношения (6) содержат семь параметров а2А~2, С2А~\
ЬС~*, rQ, г*, р*, tQ. Их число можно уменьшить до четырех за-
менами
s = р = 4г’ *2 = ^-fe2’ T* = T-t0.
Нижний индекс (*) далее опускается.
В результате получается сложная нелинейная задача опти-
мального быстродействия вида
£ = Х, Х = о(^2-х2Х2р2)1/2> Р = ^, (8.4.7>
x(O)=x(T)=UO)=o, = р(П=р*;
Т -> min , а = 0, ± 1,
a) h2 + w2 е [О, 1]; б) h2 е [0,1], 1].
.288 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
Ее исследование и решение в полной постановке затруднитель-
но, поскольку приводит к сложным особым управлениям и сколь-
зящим режимам. Решение и реализацию законов управления
можно осуществить в виде алгоритмов с помощью ЭЦВМ, так
как не удается аналитически проинтегрировать уравнения (7)
п соответствующую сопряженную систему.
Далее рассматривается ограниченная постановка задачи (7).
Требуется, чтобы в процессе разворота угловая скорость враще-
ния была постоянной: р(0 = const, £^[0, 71], например, равнялась
бы р° или р* (или р = 0) или другому произвольному значению;
это повлечет условие iv(t) = Q, [0, 7]. Требуемое изменение
угловой скорости стабилизации р можно осуществить до или
после разворота (см. замечание в конце п. 2).
Решения задачи (7) при iv(t) = O (р = const) для обоих ти-
пов ограничений а) и б) совпадают. Искомое решение строится
аналогично рассмотренному в § 3 случаю переориентации трех-
осного тела [83, 190, 229]. Оно обладает симметрией относительно
/ = 1/2Т и выражается в элементарных тригонометрических (а нс
в эллиптических) функциях t.
При lS*l^2fc“2, fc2 = (xp0)2 режим управления оказывается
простым и состоит из симметричных относительно t = 4ZT участ-
ков «разгона» и «торможения»:
t е= [0, 72Т]: о = sign S*, Д2 = 1,
Х(0 = о/с”1 sin/d, S(0 = ofc-2 (1 — cos kt);
feC/J., T]: о = —sign S*, Д2 = 1, (8.4.8)
X(0= --^sin*(Z-0,
£(0 = --^-[1 -2cos4 T + cosA'(T’-f)];
t>T: 7г2 = 0; T = 2k~l arccos(l - V2/c2l£*l).
Здесь T — время оптимального быстродействия, 0 C T ^пк~1 при
ОС |£*1 ^2к~2.
Если величина |£*|>2/с-2, то режим управления также сим-
метричен относительно t = 72У и состоит из участков «разгона»
до экстремальной скорости х* = к~' sign S*, «пассивного» враще-
ния со скоростью %* и «торможения» до нулевой скорости
%(71) = 0. Соответствующие соотношения имеют вид
t е [0, t*], t* = п/2к\ о = signS*, /г2=1,
Х(£)= о/с-1 sin kt, S (0 = ofc“2(l — cos kt);
t^(t*, T-t*]: o = 0, Д2 = 1, (8.4.9)
x(0 = x*, £(0 = /^x* [1 + fc"1 (* - **)];
§ 4. ПЕРЕОРИЕНТАЦИЯ И КОРРЕКЦИЯ ОСИ АППАРАТА
289
о = -signh2 = 1,
= —-Jsin/c(T —f),
UO = - 4 [1 + k(T-2t*) + созк(Т - 0];
к
t>T: % = o = h2 = 0, £ = £*; T= \£*\k + 2t*-2k~l.
Графическое представление переменных %(£), £(0 близко изо-
браженному на рис. 8.4.
Программные оптимальные управления u(t), v(t) на участке
разворота вычисляются, согласно (5) — (9), по формулам
и (t) = А(t) sin 7 (t) + Ca~lrfi (t) cos 7 (t),
v (t) = A(t) cos 7(0“ Ca~lrfi (t)sin 7 (t),
(8.4.10)
MO = aA-'O (0 \W (0 “ k\2 (0]1/2, P (0 “A-\(0,
7 (0 = 7°^, r s const, w (0 s 0, [0, T].
Далее при t > T полагаются u = p 0, a w 0, если r /= г*. Изме-
нение до заданного значения г* осуществляется независимо от ре-
жима переориентации. Следует отметить, что общее суммарное
время будет при этом больше или меньше в зависимости от по-
рядка осуществления этих операций. Из уравнений (6), (7) сле-
дует, что нужно стремиться к уменьшению величины г2, так как
это приводит к уменьшению времени разворота вследствие увели-
чения |%*| . Например, если г°>г*, то изменение величины r(t)
следует осуществить вначале, до операции разворота; и наоборот,
если г° < г*, то после. Если величина Ъ относительно велика по
сравнению с а, то может оказаться весьма эффективным следую-
щий режим: изменение r(t) до нуля, затем разворот и в конце
изменение r(t) до требуемого значения г*.
3. Задача коррекции — стабилизация требуемого вращения.
После осуществления переориентации оси вращающегося тела
и изменения скорости вращения, согласно невозмущенной моде-
ли (6) или (7), в соответствии с подходом п. 1 требуется ре-
шить проблему коррекции и стабилизации фазовых координат
системы со, а, £ (7 не фиксируется) в достаточно малой окрест-
ности заданных значений. Далее в предположении малости ве-
личин— начальных возмущений |р°|, |д°|, |г*~ г°1, |а°1, 1 [3° I
производится линеаризация уравнений (1) и (3.13). Система воз-
мущенных динамических и кинематических уравнений приводит-
ся к виду квазилинейной управляемой системы с периодическими
9 Л. Д. Акуленко
290 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
коэффициентами
Р + v*Q = а*и + /р, р (t0) = р°,
q — = a*v + fq, q (i0) = ?°,
d •= b*w + fa, d (i0) = d° (d = r — r*),
a = p cos v* — q sin y* + /J, a (/0) = a0, (8.4.11)
P = psiny* + gcosy* +/p, ₽ (t0) = ₽°,
b = d + f6, 6(4o) = O (6 = V-V*(0),
v* = C ~ r*, a* = b* = y* = r* (t — t0) + y°-
К новым возмущающим функциям fP,q,d в (И) отнесены
+ <8А12)
Возмущающие функции 7a,p,б в кинематических уравнениях
(11) получаются стандартным образом:
.* [cos (у*+6) *1 [sin (у*+ 6) . *
r L cos p J L cos p J
/p = p [sin(y* + 6) — -siny*] + #[cos(y* + 6) — cosy*], (8.4.13)
/б = — [p cos(y* + 6) — £sin(y* + 6)] tgP,
/a,p,e = O((|p| + |?l)(lal + |₽| + |6|)).
Как следует из (12), (13), добавки к возмущающим функ-
циям fptq,r и функциям /а,р,б квадратичны относительно малых
величин р, q, d, a, £, б. Поэтому если fp,q,r обращаются в нуль
при и = v = w = 0 и p = q = d = a = fi = 0, то при управлении,
равном нулю, уравнения для р, q, d, а, £ имеют нулевую ста-
ционарную точку.
Для системы (11) —(13) ставится задача стабилизации по
переменным р, q, d, a, Требуется построить синтез оптималь-
ного управления и, г, приводящего указанные переменные в
начало координат. Согласно методу возмущений сначала рассма-
тривается система линейного приближения, в которой возмуще-
ния f*, /а,р,б отброшены. В приложениях часто применяется
интегральный квадратический функционал качества управления,
например, вида
т
j [“1 V, ш] = -у- f [Ch(u2 + V2) + Cw^2] dt + Ст (T— t0) -> min.
Ь Utv,w
(8.4.14);
§ 4. ПЕРЕОРИЕНТАЦИЯ И КОРРЕКЦИЯ ОСИ АППАРАТА
291
Здесь Ch, Cw, Ст — постоянные «весовые» множители; момент
времени Т не фиксирован и определяется в процессе решения
задачи. Возможны и часто применяются на практике другие по-
становки: 1) момент Т фиксирован, 2) требуемое конечное зна-
чение стабилизируемых переменных учитывается методом «штра-
фов», 3) требуется построить оптимальный регулятор (Т = <х>\
и т. д. Методы решения таких линейно-квадратических проблем
достаточно хорошо разработаны [106, 126, 130, 145, 251] и здесь
не приводятся.
Линеаризованная система с периодическими коэффициентами
(И) для переменных р, q, а, £ приводится к уравнениям вто-
рого порядка для а, с постоянными коэффициентами
а + р — v*a = а*у*,
v* = СА~*г*, и* = и cos у* — v sin у*,
v* = и sin у* + v cos 7*, u*2 + v*2 = и2 + V2.
Уравнения для d, б сохраняют вид (11) . Поэтому линейно-квад-
ратическая проблема при помощи принципа максимума легко
интегрируется для обоих типов ограничений (2), (3) с произ-
вольными начальными и конечными (в частности, нулевыми
для а, а, р, р, d) условиями. Следует отметить, что если величина
Ст достаточно мала, т. е. момент Т велик, то величины h2*=
= u2 + v2 и w2 оказываются малыми, а ограничения (2), (3)'
удовлетворяются автоматически. Этому способствует также то
обстоятельство, что стабилизируемые величины р, g, d, a, малы.
Определенную трудность может представить решение соответст-
вующих уравнений, следующих из конечных условий и условий
трансверсальности. В частности, при нефиксированном Т требу-
ется разрешить трансцендентное уравнение Н* |г = Ст, где
Я* — максимальное значение гамильтониана. Трансцендентность
обусловлена тем, что уравнения принципа максимума интегриру-
ются в тригонометрических функциях; решения содержат также
линейную функцию t и функции вида £sinv% £cosv*f. В прило-
жениях обычно ограничиваются решением линейно-квадратиче-
ской проблемы и подбором весовых коэффициентов, обеспечиваю-
щих нужное качество регулирования и стабилизации движения
системы в малой окрестности заданного состояния. Дальней-
шие построения оптимального синтеза с учетом возмущений
f* и /а,р,б можно осуществить при помощи методики, развитой
в § 2, 3 гл. 9. Этот подход требует интегрирования линейных
уравнений в вариациях с известными неоднородностями и при-
ближенного решения уравнений краевой задачи.
19*
292 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
§ 5. Импульсное торможение вращении твердого тела
Для решения задач управления КЛА (орбитальными движе-
ниями или вращениями относительно центра масс) на предвари-
тельном этапе часто используется модель твердого тела (в част-
ности, материальной точки) и аппроксимация управляющих сил
и моментов сил импульсными воздействиями [52, 84, 123, 138,
140]. Это приближение будет достаточно адекватным и прием-
лемым, например, в задачах стабилизации, если за время су-
щественного изменения скорости вращения, в частности полного
торможения, можно пренебречь изменением инерционных харак-
теристик и поворотом тела. Импульсная аппроксимация сил и
моментов сил обычно применяется в случае реактивных двигате-
лей, работающих на химическом топливе [79, 84]. Такой подход
к задачам управления движениями КЛА весьма удобен, посколь-
ку проблема обычно сводится к конечным (алгебраическим и
трансцендентным) уравнениям, из которых определяются число
импульсов, их величины и моменты выработки. Ниже рассма-
триваются задачи полной стабилизации КА — торможения вра-
щений минимальным числом импульсов — в указанной выше
постановке с помощью одной фиксированной в связанных
осях пары импульсных сил. Полученные результаты могут
представить определенный интерес также при решении за-
дач стабилизации КА в критических (нештатных) режимах
управления.
1. Постановка основной задачи. Рассматривается механиче-
ская модель управляемых вращений несимметричного твердого
тела относительно неподвижной точки (центра масс) в форме
уравнений Эйлера:
L + [(oXL] = M, L(O) = Lo;
L = Jo), J = diag(4, В, С), (8.5.1)
co = (р, д, г), М = М (t) е Л.
Здесь L — вектор кинетического момента, J — главный (цент-
ральный) тензор инерции, предполагаемый постоянным; — век-
тор угловой скорости тела. Относительно возможностей системы
управления, т. е. свойств класса функций Л управляющих мо-
ментов М, считаются выполненными следующие предположения.
Управляющий момент сил М создается при помощи фиксирован-
ной в связанных осях одной пары импульсных реактивных сил.
Управление представляет собой конечную последовательность
импульсов; суммарный расход рабочего тела ограничен. Таким
образом, рассматриваемый класс Л управляющих функций M(Q
§ 5. ИМПУЛЬСНОЕ ТОРМОЖЕНИЕ ВРАЩЕНИЙ
293
описывается соотношениями
М(£)= р,(£)п, п = (а, р, у), n2 = l (n = const),
N N _
ц(0 = S — ti), 0<2 ||л{| = !л2<|л<оо, (8.5.2)
1=0 1=0
ti+l > ti, i = 0, 1, ..., N < «>, t0 0, tN < оо.
Здесь pi (t)— скалярная управляющая функция из класса импульс-
пых, 6 (0 — обобщенная дельта-функция Дирака [200], ^ — момен-
ты времени выработки импульсов; величина ц характеризует запас
рабочего тела. Постоянный вектор направляющих косинусов п
определяет ориентацию момента сил М в связанной с главными
(центральными) осями инерции системе координат Opqr.
Считается, что влиянием на динамику аппарата изменения
тензора инерции J и вектора п в процессе выработки импульса
можно пренебречь. С целью коррекции уравнений (1), (2) после
каждого Z-го импульса указанные параметры системы J и п мо-
гут быть соответствующим образом изменены. При этом также
скачком изменится вектор L(0: L(^ + 0) = L(^) + ngf, а при
ti<t^ti+l вектор L(0 описывается уравнением (1) с М(^0
и начальным значением L(^ + 0).
Для определенной соотношениями (1), (2) импульсно управ-
ляемой системы ставится задача торможения вращений мини-
мально возможным числом N импульсов:
L(^) = 0, min . (8.5.3)
Большой интерес представляет вопрос о возможности решения
задачи стабилизации КА при помощи одной фиксированной па-
ры двигателей. Следует заметить (и это ясно из физических
представлений), что при некоторых предельных значениях тен-
зора инерции J (например, А = В = С) или вектора ориентации
п (например, loci = 1, 1^1 = 1 или 1^1 = 1 и др., см. далее) задача
стабилизации неразрешима для произвольных значений вектора
Lo. Поэтому далее предполагаются выполненными условия
«общности положения» в множестве параметров системы J и п:
0<Л <В<С<оо; (8.5.4)
loci <1, I7I <1, а\В-А)А-^^2(С-В)С~1 (|0| <1).
Первое требование (4) строгой динамической несимметричности
КА можно ослабить и рассмотреть осесимметричный случай
(см. п. 5). Вторая совокупность условий (4) означает, что век-
тор п не проходит через полюсы и сепаратрису (рис. 8.6, а),
отвечающие случаям одноосных вращений и асимптотического
(непериодического) движения аппарата (см. замечания в конце
294 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
п. 2). Кроме того, величина ц считается достаточно большой,
такой, что ограничивающее условие (2) заведомо удовлетворяется.
Если получающееся решение задачи (1) —(4) неединственно,
то возможна дальнейшая его оптимизация по различным крите-
риям, например из условия минимума потребного значения
суммарного расхода импульса или момента времени tN оконча-
ния процесса стабилизации и др. (см. п. 4).
2. Условия торможения вращений одним импульсом. Пусть
имеет место частный случай вращений КА, когда для неуправ-
ляемой, т. е. при ц(£)=0, системы (1), (2) в некоторый момент
времени t = t* > 0 выполняется одно из равенств:
(Т] (/*). п) = ±1 (1) = 1) (i) = L(t)/L (t)). (8.5.5)
Здесь 'П==г1(0—°РТ вектора кинетического момента Ь(£) в свя-
занной системе. Геометрически условия (5) означают, что при
t = t* векторы т] и п (вектор п постоянен в связанной системе)
коллинеарны, т. е. T](Z*) = ±n. Поскольку при этом фазовый век-
тор системы L не движется по исключенному, согласно условиям
(4), множеству точек, то равенства (5) будут выполняться
периодически при t = = £* + jTQ, j = 0, 1, ..., где TQ — период,
определяемый в области 2ЕВ < L2 < 2ЕС выражениями
То = TQ(L, Е) = 4К (fc) (АВС) 1/2[ (С - В) (L2 - 2ЕА) ]"1/2;
fc2= (В —А) (С - В)-1 (2ЕС - L2) (L2-2EA)-\ к2<= (0, 1);
(8.5.6)
L2 == (L • L), Е = 72 (<о • L) =72(Л1 • L).
§ 5. ИМПУЛЬСНОЕ ТОРМОЖЕНИЕ ВРАЩЕНИЙ
295
Здесь К (А) —полный эллиптический интеграл 1-го рода по моду-
лю к [236], L — величина кинетического момента, Е — кинетиче-
ская энергия. Величины L2, Е — первые интегралы неуправля-
емого движения; они удовлетворяют очевидным неравенствам
2ЕА L2 2ЕС. Из-за условий (4), (5) граничные значения
L2 = 2ЕА и L2 = 2ЕС исключаются и, кроме того, исключается
множество L2 = 2ЕВ, определяющее движение по сепаратрисе.
В дополнительной области 2ЕА < L2 < 2ЕВ выражения для Го и
к2 получаются из (6) перестановкой величин А и С. При L2 ->
-* 2ЕВ модуль к\ 1, а период 7^поэтому приведенные вы-
ше рассуждения становятся несправедливыми.
Тогда твердое тело стабилизируемо полностью в любой мо-
мент времениt = одним импульсом величины Iр*I = L = Lo,
который направлен против L (£*) = L (£*;•)), т. е. прэгив ц G**)-
Соответствующий управляющий момент сил М(£) равен
М* (/) = р (£) n = — L (0 б (t — t*jj) (р А = 1/0). (8.5.7)
Действительно, подстановка выражения (7) в систему (1) и
интегрирование уравнений на интервале t е t*j) + т] при т I О
позволяет установить, что L(£) = 0 при t > t^. 1йЙ
Таким образом, для полной стабилизации вращающегося ап-
парата одним импульсом вида (7) в некоторый момент времени
t = t(j) необходимо и достаточно выполнение условий (4), (5).
Из соотношений (5), (6) следует связь между L2 и Е до выра-
ботки тормозящего импульса:
Z = (aM-1 + p2B-1 + fCf-1)-1, B)U(B, С).
Как следует из (4), (8), движение по сепаратрисе исключается.
Вследствие постоянства L2 и Е (L2 и Е — первые интегралы пас-
сивного движения) условию (8) должны удовлетворять векторы
L(Z) и g)(£) = Z-1L(£) в любой момент времени Ра-
венство (8) не противоречит условию принадлежности фазовой
точки системы области допустимых движений, поскольку из (4),
(8) следуют неравенства
А < I < В, 2ЕА <L2 = 2EI < 2ЕВ;
В<КС, 2ЕВ<Ьг = 2ЕК2ЕС. ^8‘5’9^
Пусть теперь начальные условия L(0) =L0 (или (о(0) = (Оо =
= J~1Lo) предполагаются таковыми, что выполняется условие (8).
Тогда при выполнении требований (4), налагаемых на парамет-
ры системы 7, п, можно установить существование момента
времени £*, е [О, TQ) (mod TQ) такого, что выполняется одно
из условий (5) коллинеарности векторов т) (£*) и п.
296 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
Действительно, если В <1 <С, т. е движение происходит в
области, описываемой неравенствами 2ЕВ < L2 < 2ЕС, то для век-
тора T](Z) направляющих косинусов вектора L(£) в связанной
системе координат справедливы выражения
= 7 т4г сп2 <9’ = 7 44 SI? (0-
Пг (О = 7 dl? (0’ кУ> к" = 44 е (°’ !)’ (8-5Л°)
0 = 4^-)i|) + 00, = В<1<С.
Здесь cn, sn, dn — эллиптические функции Якоби [236]; 0 — ар-
гумент, к— модуль; величины A2, TQ определены в (6). Из (8),
(10) следуют условия в виде равенств, которым должен удовлет-
ворять аргумент 0:
сп2 (0 к} ______________
’ а2В(С—А) + $2А(С—В)’
sn2 (0 к) = -—^£^1------,
а2В (С — Л) + ₽2Л (С - В)
dn2 (9, к) = 1 - /с2 sn2 (0, к) = ^~.А}- (8.5.11)
' р2С {В - А) + у2 В (С — Л)
(к* = £.?.-^(^а}Л-^2а(с-в} \
\ Л с — В р2С (£ _ Л) + (С — Л) /
Каждое из уравнений (11) относительно 0 допускает па ин-
тервале 0 &[0, 4К] (mod4K) четыре совпадающих корня 0; =
= 0i (7, п), г = 1, 2, 3, 4, причем 0± < 02 < 6з < 04 и 02 = 2К —01?
03 = 2К + 01? 04 = 4К — 0Ь Один из корней, 0* = 0i* = (4K/Z0) t* +
+ 0° (mod 4К(А)), определяет искомый момент времени £ = £*^
е [0, То) (mod То), удовлетворяющий одному из условий (5), т. е.
условию Т](£*) = ±п.
Аналогично устанавливается существование момента времени
и определяется его величина (значение) в дополнительной
области возможных движений, определяемой неравенствами А <
<1<В, т. е. 2ЕА < L2 < 2ЕВ. При этом в формулах (6), (10),
(И) производится перестановка индексов р и г (т]р -> щ, т]г-> т]Р,
1% 1%) и параметров А и С (А -> С, С -> А, В -> В); выражение
(8) для параметра I остается прежним.
Таким образом, соотношения (4), (8), (9) определяют «одно-
пмпульсное многообразие» G, которому для допустимых значений
параметров могут принадлежать фазовые точки неуправляемой
системы. При этом исключаются одноосные вращения (L2 = 2£'A,
L2 = 2EC) и движения по сепаратрисе (Л2 = 2Е5), включающие
одноосное вращение вокруг оси Oq = г = Случаи одноосных
§ 5. ИМПУЛЬСНОЕ ТОРМОЖЕНИЕ ВРАЩЕНИЙ
297
вращений приводят к вырождению условий (10), (11) и должны
рассматриваться отдельно. Так, в первом исключительном слу-
чае L2 = 2ЕА (р Ф 0, q = г es 0) вращения могут быть полностью
заторможены одним импульсом при условии Iа| = 1. Если |al = 1
(7 = А), то могут быть полностью заторможены только одноос-
ные вращения L2 = 2EA\ в общем случае при L2 < 2ЕВ тело
одним импульсом приводится во вращение вокруг оси Oq, т. е. на
точку множества L2 = 2ЕВ или во вращение вокруг оси Or (L2 =
= 2ЕС), а из дополнительной области 2ЕВ < L2 < 2ЕС — только
во вращение вокруг оси Or. Соответствующий импульс должен
вырабатываться в момент времени t, когда r(t) = O или q(t) = O.
Аналогичные утверждения справедливы при 1^1 = 1 (7 = С).
Если же |р|=1, то полностью тормозятся одним импульсом
вращения вокруг оси Oq (L2 = 2EB, q^=01 р = г = О); при L2 =И=
¥= 2EB вращения из области 2ЕА < L2 < 2ЕВ можно привести
в состояние L2 = 2EA, а из области 2ЕВ < L2 <2ЕС — в состоя-
ние L2 =2ЕС. При известных оговорках физического характера
случай асимптотического (непериодического) движения по сепа-
ратрисе можно также включить в множество G (8), т. е. допу-
стить значения 7 = В.
Итак, если значения вектора L(£) (или ш(£) = 7-1Ь(£)) принад-
лежат «одноимпульсному многообразию» G (8), то вращения
несимметричного аппарата можно затормозить одним импульсом
М*(£) (7), вырабатываемым в момент времени £*, определяемым
условиями (И), (5). Далее исследуется возможность приведения
фазовой точки L системы (1) на множество G (8) из произ-
вольного начального состояния Lo, если L%^2EQI.
3. Приведение фазовой точки на «одноимпульсное многооб-
разие». Оказывается, что эта операция в общем случае враще-
ний, когда 2ЕА L2 2ЕС и Lo е G, может быть осуществлена
одним импульсом в некоторый произвольный момент времени
t = tQ < £*, т. е. управлением
М° (t) = пц°б (t -1°), 0 t° < t*, (8.5.12)
в котором величина ц° подлежит определению. Действительно,
подстановка выражения (12) в уравнения движения (1) и интег-
рирование по t на промежутке t е [£°, f + т] при т 4 0 с учетом
условий (8) приводит к соотношениям
L(£o + O) = L(£°) + ng°; L2(t) = 2E(t)I, t>t°. (8.5.13)
Рассматривая второе равенство (13) как уравнение относительно
неизвестной интенсивности ц° при условии ((7(0° — L0) • п) ¥= 0,
где L° = L (£°), го0 = со (£°) — значения фазовых переменных в
момент времени t = £°, предшествующий импульсу, можно по-
лучить
Ц° = у2 (L02 - 2Е°1) ((7со° - L0) • п)Л £8.5.14)
298 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
Здесь Z?2, EQ — первые интегралы (их значения) для свободных
(пассивных) вращений до первого импульса, определяемые на-
чальными условиями в момент времени t = O^tQ<t*. Из (14)
следует, что ц° = 0 при LQ2 = 2EQ1, т. е. импульс М° (12) не вы-
рабатывается, если L(0eG. Если же справедливы соотношения
А02 =А 257, /(со • n) = (L0 • п), (8.5.15)
то ||1°1 = оо, т. е. задача приведения фазовой точки L системы
(1) па многообразие G (8) одним импульсом в момент времени
t — tQ неразрешима. Можно установить (см. далее осесимметрич-
ный случай, п. 5.1), что множество параметров системы J, п
и аргумента tQ, для которых имеет место равенство (15), непусто.
Следовательно, момент времени tQ желательно выбирать таковым,
чтобы величина знаменателя I ( (Zg)(£0) — L(£°) ) • n) | в выражении
(14) была максимальной; соответствующая диаграмма 1 приве-
дена на рис. 8.6, б.
Итак, пусть Z((o° •n)=#(L°-п); тогда и из равенств
(13), (14) можно получить следующие полезные соотношения
для фазовых переменных до (0 t tQ) и после (tQ<t^t*)
импульса М°(£) (12):
m-L(f + 0)l = ln"l;
L(f) = ^(f° + 0) = [L02 + 2|i0(L0-n)+|i02]1A
Е (t) = Е (t° + 0) = 42I-lL2 (£° + 0) = l/J-lL2(t).
Если при jx° =/= О дополнительно потребовать, чтобы величины
L(t) кинетического момента L(£) до и после (tQ<t^
£*) импульса были равны (см. диаграмму 2 на рис. 8.6, б),
т. е. импульс М°(£) (12) изменял только направление вектора
L, то для фазовой точки L° = L(/°) должно выполняться соотно-
шение 2(L° -п)+ р° = 0, или, в развернутой форме,
4(L0 • п)2 — L02 = 4(L0 • n) • п) - (/ЛЪ0 • L0). (8.5.17)
Аналогично величины 5° и Е будут совпадать (см. диаграмму
3 па рис. 8.6, б), если выполняется равенство
4 (L0 • n) (/ГТ0 • n) - Z/2 = 4 (ZJ-T0 • п)2 - (ZZ"1!? • L°). (8.5.18)
Совокупное выполнение обоих равенств (17), (18) приводит
к следующему соотношению: (L0 • n) = Z(g)° • п), которое исклю-
чается предположением, что 1р°| < <».
4. Полная двухимпульсная стабилизация КА и задачи опти-
мизации. Из вышеизложенного следует, что для полной стабили-
зации аппарата в общем случае 2ЕА L2 2ЕС требуется два
импульса. Первый импульс М°(£) (12), (14), вырабатываемый
в произвольный момент времени tQ > 0 такой, что равенство (15)
пе выполняется, приводит фазовый вектор L системы (1) па
«одпоимпульсное многообразие» G (8). В некоторый последую-
§ 5. ИМПУЛЬСНОЕ ТОРМОЖЕНИЕ ВРАЩЕНИЙ
299
щий момент времени t*(t* < t° + То) , определяемый условиями
(11), (5), вырабатывается второй импульс М*(£) (7), приводя-
щий фазовый вектор L в начало координат: L(£) = 0, t>t*.
Соответствующие различные типы диаграмм приведены на
рис. 8.6, б. Качественная картина двухимпульсной стабилизации
в связанных с аппаратом главных (центральных) осях приведена
на рис. 8.6, а, б.
Полная затрата рабочего тела на двухимпульсную стабилиза-
цию КА, согласно (12), (14) и (7), составит величину
jiz = |ц°| +L(t° + 0). (8.5.19)
Для приложений может представить интерес минимизация
величины ц2 (19) по свободным параметрам задачи. Если тако-
выми являются вектор n, |n| = 1 и момент времени tQ, tQ е
[0, T0(L°, Е0)), то минимум суммарного импульса ц2 = 1/° и
достигается одним импульсом в момент времени tQ = £*. Вектор
п, определяющий ориентацию управляющего момента сил М со-
гласно (2), должен быть выбран из условия Lefi (8), гаран-
тирующего выполнение условия (5).
Если же вектор п фиксирован в связанных осях, как счита-
лось выше, то свободным является только параметр tQ — момент
выработки первого импульса М°(£) (12). Задача минимизации
суммарного расхода импульса (19) приводится к следующей
(см. соотношения (14), (16)):
| ц° | + [L02 + 2ц° (L°*n) + ц02]1/2 = min ,
L°Vt°
|i° = 72(L02 — 2E°Z) ((/о0 — L°) • n)"1, <d° = J-1L0, (8.5.20)
|L°|2 = Z,02, 1/2((o° • L°) = E°; t°e[0, T0(L0, E0)).
Здесь величины L02 и E° фиксированы и определены начальными
условиями L, (1).
Решение задачи минимизации (20) может быть построено
численно при помощи метода множителей Лагранжа или гра-
диентными методами (см., например, [157]). При этом можно
производить минимизацию суммарного импульса gz по L0 с соот-
ветствующими (20) ограничениями или свести задачу к мини-
мизации периодической функции (при L02 Ф 2Е°В) одной пере-
менной tQ, tQ е [0, TQ) после подстановки выражения для L0 =
= L(/°, Е°, Е°) = Ё°т]0, где вектор т)° определяется согласно (10).
В качестве практического решения задачи оптимизации (20)
можно взять значение tQ <= [0, То), минимизирующее выражение
2ц°(Ь° • п)+ц02, т. е. величину L(t° + O), или максимизирующее
величину знаменателя | ( (Zg)° — L°) • п) | в выражении для jut0 (14),
т. е. минимизирующее величину первого импульса I ц° I. Если
отношение | Е02 — 2E'°Z|/Z/02 мало, то значение суммарного импульса
00 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
приближенно равно
Hz = 1н°1 + ^°(п° •n) + L° + O(p02/L°).
Оно может быть минимизировано по LQ или tQ согласно (20) в
результате более простых расчетов.
5. Замечания.
5.1. Динамически симметричный аппарат. Пусть для определен-
ности А = В < С; тогда система (1) интегрируется в элементар-
ных функциях. Этот случай соответствует рассмотренному выше
при к2 = 0, причем движения неуправляемого аппарата сущест-
вуют только в области 2ЕА L2 2ЕС\
р = a cos гр, q = a sin гр, а = \\2EC — L2)/A (С — Л)]1/2,
г = о[ (L2 - 2ЕА)/С(С - А)]1/2, о = sign г = ±1, (8.5.21)
гр = (С - А) A-'rt + гр°, То - 2дЛ / (С - А) г.
Величина I характеризует принадлежность вектора L(t)^G
согласно (8), где G — «одноимпульсное многообразие», и пара-
метры а, г — постоянные интегрирования в (21), равны
а = А[(С-7)М7(С-Л)]1/2, r = oL[(7-Л )/С7(С—Л)]1/2, (8.5.22)
A^I^C, L = (A2a2 + Cr2y/2, а = ±1.
Условие (5) коллинеарности векторов ц и п принимает вид
дс ~Л)1 7 (« cos Я5 + Р sin тр) + а [т^Л)] ' У = ± 1 • (8.5.23)
Равенства (23) удовлетворяются, если фаза гр и постоянные па-
раметры неуправляемой системы связаны соотношениями
(aA/L)cos гр = ±а, (яЛ/Л)з1п гр =
гС/Л = ±7 (а2 + р2 + у2 = 1, 0<72<1). <8-5-24)
Переопределенная система уравнений (24) относительно гр сов-
местна, поскольку первые два равенства приводятся к следу-
ющим:
cos гр = ±a/Va2 + [}2, sin гр = ±f}/Va2 + [}2. (8.5.25)
Нетрудно установить, что выражения (24), (25), определяющие
момент времени tQ, tQ е [0, TQ) (modTo) выработки первого
импульса М°(£) (12) получаются из выражений (10), (И) при
ВА, /с2-> 0.
Величина интенсивности импульса ц°, приводящего фазовый
вектор L на «одноимпульсное многообразие» G (8), согласно
§ 5. ИМПУЛЬСНОЕ ТОРМОЖЕНИЕ ВРАЩЕНИЙ
301
выражению (14), равна
ц0 = 72(Л02-2£°7)/Д
[97?®/^_ 7 02 1/2
А} (Z — Л) (a cos-ф +
21 Л) J
т 02 л TiO j"ll/2
+ р.шф) + g[ с|с Л) ] (/-От (8-5.26)
(/-Л- с_,_ С1С-Л) \
\ С - (С - 4) у2 С - (С - 4) у2 7
Условия (15) невозможности приведения фазового вектора L
па «одноимпульсное многообразие» G (|р01=о°) приводятся к
соотношениям
L02 2ЕЧ (А<КС, 0 < f = 1 - а2 - 02 < 1),
1 (8.5.27)
(2E°C — LQ2 4V у ( х 4
-Ко---о~ —....COS (lb — гр0) = О = ± 1-
\L02—2£°4 С /1-у2
Из (27) следует, что критическое значение момента времени tQ,
приводящее к бесконечному значению 1р°1, может существовать
лишь при условии
2EQC — L™ А 42 (р2 + q2) а2 + р2
L02-2£°4£” С2г2 у2
(8.5.28)
Очевидно, что множество значений Л°, Е° и И, С, у, для которых
выполняется условие (28), непусто.
Определение оптимального значения момента времени tQ вы-
работки первого импульса, приводящего к минимальному суммар-
ному расходу импульса pis (20), осуществляется элементарным
путем.
5.2. Приведение в состояние одноосного вращения. При по-
мощи одного импульса вида р (0 = р*6 (t — £#), где параметры
р#, t* подлежат определению, несимметричное твердое тело мож-
но привести в состояние вращения вокруг одной из осей устой-
чивого вращения Ор или Or. Остальные две составляющие, со-
ответственно (#, г) или (р, q), будут тождественно равны нулю.
В зависимости от области, которой принадлежит фазовая точка L,
в общем случае могут быть одновременно обнулены соответст-
вующие компоненты вектора Ь = (Л/?, Bq, Сг). Параметры р*, t*
определяются из уравнений
2£'B<L»<2EC: — Ар (t*) = ар,*, - = рщ;
2ЕА < L» < 2ЕВ: > Bq (f*) = 0р*, - Cr_(f*) =
Из вида функций p(t), q(t) и q(t), r(t) в указанных областях
следует, что уравнения (29) разрешимы. Предварительными
302 ГЛ. 8. ЗАДАЧИ СТАБИЛИЗАЦИИ И ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА
импульсами цОр — — Ар(1)аг*& (t— или jxor=—Cr(t) 10),
гасящими в произвольный момент времени t0 вращение вокруг
оси Ор или Or соответственно, движение системы (1) можно
привести в заданную область: L2 > 2ЕВ или L2 2ЕВ. Это ут-
верждение следует непосредственно из выражений (6) для пер-
вых интегралов L2 и Е. Действительно, пусть в некоторый
момент времени t = tQ + O величина p(t) = O\ тогда из определе-
ний следуют равенства L2 (t) = B2q2 (t) + C2r* (t), 2E Bq2 (t) +
+ Сг2(£), из которых следуют искомые: 2E(t)B ^L2(t)^2E(t)C,
т. e. 2EB L2 2EC при £>£0. Аналогично, если r(£o + O) = O,
то 2E(t)B> L2(t)^2E(t)A, откуда для £>£0 вытекает, что
2EB >L2> 2EA.
При некоторых дополнительных предположениях возможно
решение задачи об одновременном торможении вращений вокруг
осей Ор и Or. Сходные задачи могут быть рассмотрены для осе-
симметричного по динамическим характеристикам аппарата.
5.3. Одновременное торможение вращений двумя фиксирован-
ными импульсными моментами. Пусть система управления (1),
(2) содержит две пары фиксированных импульсных двигателей.
Направления управляющих моментов сил постоянны в связанных
осях и задаются векторами направляющих косинусов п1? п2, при-
чем, естественно, требуется их неколлинеарность, | (щ • n2) I < 1.
Тогда условия полной стабилизируемости аппарата одним импуль-
сом (одновременными импульсами обеих пар двигателей) сводят-
ся к условиям разрешимости системы линейных уравнений отно-
сительно интенсивностей импульсов щ, ц2 и трансцендентного
уравнения относительно момента времени их выработки. Ис-
ходные, определяющие параметры ц2, £*, уравнения имеют
вид
L(£*) = щр,! + п2ц2, I (nt • n2) I < 1. (8.5.30)
Решая какие-либо два уравнения (30) относительно линейно
входящих неизвестных ц2 и подставляя в третье, можно по-
лучить трансцендентное уравнение относительно вида
Рр (£*) + Qq (£*) + Rr (t*) = 0, (8.5.31)
в котором Р, Q, R — известные коэффициенты, элементарно
определяемые через параметры системы 7, п1? п2. Из общих со-
ображений следует, что уравнение (31) разрешимо не всегда
вследствие знакоопределенности в соответствующих областях и
относительно больших по модулю значений одной из величин
г или р по сравнению с другими (р и q или q и г соответствен-
но) компонентами вектора угловой скорости (см. (10), (21)).
5.4. Вырожденный случай сферически-симметричного аппара-
та. В частном случае А = В = С при произвольных вращениях
тела требуется не менее трех некомпланарных фиксированных
§ 5. ИМПУЛЬСНОЕ ТОРМОЖЕНИЕ ВРАЩЕНИЙ
303
в связанных осях моментов импульсных сил:
М = М1 + М2 + М3, Мг(/) = пгщ(0, 1=1, 2, 3;
II t / / г х/ (8.5.32)
|Пг1 = 1, Щ = const, (nt * [п2 X п3]) ¥= 0. '
Момент времени t выработки импульсов тремя указанными па-
рами двигателей может быть выбран произвольным, а значения
импульсов ц2, ц3 определяются однозначно из линейной си-
стемы уравнений
L(f) = n1pi1 + п2ц2 + п3ц3, det(n1? n2, n3)¥=0.
Таким образом, в общем случае тензора инерции аппарата
(Л В С) могут потребоваться три фиксированные пары им-
пульсных сил, не лежащие в одной плоскости.
5.5. Аналогично вышеизложенному решается задача о приве-
дении КА из произвольного состояния вращения в произвольное
заданное состояние вращения. Вопросы, связанные с приданием
аппарату требуемой трехосной или одноосной ориентации
в инерциальном пространстве, требуют отдельного рассмот-
рения.
ГЛАВАМ
ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ
НЕКОТОРЫХ ВОЗМУЩЕННЫХ
УПРАВЛЯЕМЫХ СИСТЕМ
Развиваются методы приближенного построения оптимальных
решений различных классов задач управления, дополняющие
исследования предыдущих глав. Рассматриваются приложения
методов регулярных и сингулярных возмущений к задачам управ-
ления и оптимизации движений манипуляционных роботов. Раз-
работанные подходы, как установлено, обладают высокой при-
кладной эффективностью и нуждаются в строгом обосновании
и дальнейших обобщениях.
§ 1. Построение кривых и поверхностей переключений
релейных управлений для возмущенных
неколебательных систем
На основе теории оптимального управления и методов возму-
щений проводится исследование картины синтеза оптимального
по быстродействию управления для неколебательной системы
с одной степенью свободы довольно общего вида. При этом ис-
пользуются результаты анализа таких систем при помощи прин-
ципа максимума [180], основанные па построении кривой пере-
ключений релейного управления [61]. Результаты дополняют
также получаемую асимптотическими методами гл. 1—6 картину
приближенного синтеза в окрестности точки покоя, в частности
начала фазовых координат для управляемых колебательных
систем.
1. Постановка задачи оптимального по быстродействию син-
теза для возмущенных неколебательпых систем.
1.1. Исходная задача управления. Рассматривается возмущен-
ная управляемая динамическая система с одной степенью свободы:
х = у, х(0) = х°,
У = №, у, и) + eF (х, у, и), у (0) = уа.
(9.1.1)
§ 1. ВОЗМУЩЕННЫЕ НЕКОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
305
Здесь х, у — координата и скорость системы, обобщенные фазо-
вые переменные, (я:, y)^G^R2, где R2— фазовая плоскость;
[0, Z] — время (Г<оо), начальные значения (ж0, yQ)^G,
и — скалярная управляющая функция из класса кусочно-гладких
такая, что |и(£)|=^1; е [0, е0] — малый числовой параметр
(О^е <80<1); /, F — гладкие функции х, у, и ъ рассматри-
ваемой области, причем возмущающая функция F может непре-
рывно зависеть от е. Дополнительные свойства — гладкость, сте-
пень роста и др.— функций /, F и свойства области G обсужда-
ются ниже. Следует отметить, что ограничения на управление
и вида г~(х, у, е)^и<г+(а:, у, е) приводятся к рассматривае-
мому линейной заменой (р — новое управление):
u = 72(r+ + r“)+72(г+-г")р, ре[—1, 1].
Для возмущенной системы (1) ставится задача определения
закона оптимального по быстродействию управления в форме
синтеза и(х, у, е), приводящего фазовую точку (х, y)^G в на-
чало координат (точка (0, 0)^G) при достаточно малых значе-
ниях 8 > 0. Считается, что решение для невозмущенной задачи
(е = 0) оптимального синтеза известно в виде кривой переклю-
чений управления, имеющего релейный характер [61, 180].
Ниже исследуется случай неколебательных систем (неосцил-
лирующих объектов [61]), для которых невозмущенные кривые
переключений имеют наиболее простой вид: соответствующая
кривая состоит из двух идущих в начало координат полутраек-
торий невозмущенной системы (1), отвечающих значениям и =
= ±1. В [61] приводятся достаточные условия, при выполнении
которых синтез оптимального по быстродействию управления
и(х, у) на всей плоскости Т?2 или в некоторой области G^R2,
включающей окрестность начала координат, качественно имеет
тот же вид, что и для простейшей динамической системы типа
(1): х = и, |н(£)|^1. А именно [61]: «каждое оптимальное
управление имеет не более одного переключения, а линия пере-
ключений переходит из второго в четвертый квадрант, касаясь
в начале координат оси х2» (х{ = х, х2^ у).
Достаточными условиями такой картины оптимального син-
теза оказываются следующие [61]. Предполагается, что функция
/ непрерывно дифференцируема по всем аргументам и удовлет-
воряет условию монотонности по и:
у, и)>0, (x,y)f=G, |u|<l. (9.1.2)
Далее, для и = ±1 в конечной точке х = 0, у = 0 справедливы
неравенства
/(0, 0, +1) = /+>0, /(0, 0, -1) = Г< 0. (9.1.3)
Условия (3) обеспечивают остановку системы в указанной точке
при некотором u(t) = uQ = const, |н01<1 и указанное выше по-
20 л. Д. Акуленко
306 гл. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
ведение кривой переключений и оптимальных траекторий в до-
статочно малой ее окрестности.
Считается также, что никакая траектория невозмущенной
системы (1) не может за конечный промежуток времени уйти
в бесконечность или прийти из бесконечности (достаточные усло-
вия могут иметь форму равномерных условий Липшица по х, у
[61]). Если движение рассматривается в ограниченной области
G, то данное требование оказывается излишним.
Следующее более сложное условие (при выполнении преды-
дущих «естественных» условий) достаточно для указанного выше
поведения оптимального синтеза. Требуется существование не-
прерывно дифференцируемой по х, у функции ср (а:, г/, и) такой,
чтобы
УЦх + + Ф2 — ф4 — 4 < 0,
и = ±1, (х, y)^G. (9.1.4)
При помощи неравенства (4) на основе принципа максимума
устанавливается [61], что оптимальное управление и(х, у) или
u(t) релейно и имеет не более одного переключения.
1.2. Построение невозмущенной кривой переключений и кар-
тины синтеза. При 8 = 0 кривая переключений П(гг, у) управле-
ния и(х, у) строится следующим образом. Верхняя левая П~
и нижняя правая П+ ветви кривой П определяются соотноше-
ниями
П = П-иП+, (9.1.5)
Пт = {х, у: а:т(0, х, z/) = 0, z/T(0, х, у) = 0, 0>О}.
Здесь 0 — параметр кривой; функции xT(t, х°, yQ), yT(t, xQ, у°) —
решения невозмущенной задачи Коши (1) для значений и = +1
(у 0, х 0) соответственно, идущие в начало координат. При
сделанных предположениях эти решения могут быть построены
на интервале времени t е [0, 0], на котором движение происхо-
дит в области G. Величина 0 в (5) имеет смысл интервала
времени перехода фазовой точки (х, у) в начало координат вдоль
кривой переключений при фиксированном и = — 1 или н = +1.
Таким образом, соотношения (5) дают параметрическое пред-
ставление невозмущенной кривой переключений П(я, у).
Кривая переключений П может быть записана в другой
форме:
П(я, У) = {х, у: Чт(х, у) = 0}. (9.1.6)
Здесь — частные интегралы уравнений
f(x, у, ^i)dx = y dy, 4^(0, 0) = 0.
Если удается решить уравнение Чгт(л:, у) = 0 относительно
х, х = х^(у) или у, у = ут(х), то кривая переключений находит-
ся в явном виде. При сделанных предположениях относительно
§ 1. ВОЗМУЩЕННЫЕ НЕКОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
307
гладкости функции / в малой окрестности начала координат для
кривой переключений справедливо выражение х = Ч2Гу2 + О(у*),
у^О.
Кривая переключений П(.г, у) делит область G на две ча-
сти— открытые подобласти G~ и G+: G = G“UIIUG+. В откры-
тых подобластях GT и на частях их границ Пл оптимальное
управление п = т1 соответст-
венно, т. е. оптимальный син-
тез имеет вид
и(х, у) = — 1, (х, y)^G 11П ,
и(х, ?/) = +!, (х, z/)eG+UH+.
(9.1.7)
Типичное поведение кривой
П и оптимальных траекторий
при (х, y)*=G (качественная
картина синтеза) приведены на
рис. 9.1.
Функция Веллмана задачи —
время быстродействия Т =
= Т (х, у) из произвольной точ-
ки (х, y)^G в начало коорди-
нат — представима в виде Т =
= 5 + 0, где S — время движе-
ния из текущей точки (х, у)
до точки (%, ц) пересечения тра-
ектории с соответствующей ветвью кривой П, а 0 — время дви-
жения из точки (g, т|) в начало координат вдоль кривой пере-
ключений, определяемое согласно (5) (см. рис. 9.1). Искомые
величины Т, S, 0, g и ц однозначно находятся из уравнений
Т(х, y)=S(x, у)+0(х, у); (9.1.8)
хт (S, х, у) = у+ (5, х, у) = ц,
х± (0, ц) = 0, у± (0, £, ц) = 0.
Здесь функции х\ у^ определяются так же, как ив (5); систе-
ма (8) элементарными подстановками сводится к двум уравне-
ниям относительно 5, 0. Конкретные примеры построения кар-
тины синтеза и функции Веллмана рассмотрены в и. 3.
В сложных прикладных задачах можно использовать приве-
денный выше синтез как часть общей картины квазиоптималь-
ного синтеза в окрестности начала координат, где в силу (3)
определяющим движение системы является управляющее воз-
действие и. Например, если при больших начальных отклонениях
движение системы имеет колебательный характер, то для их
гашения, т. е. приведения фазовой точки в окрестность начала
20*
308 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
координат, можно использовать приближенный квазиоптималь-
ный синтез простого вида и = */2(и++ и~)~ Ч2(и+—u~)signy,
или какой-либо другой, отвечающий модели слабоуправляемой
колебательной системы (см. гл. 1—6). Затем в области, где по-
давляющим является управляющее воздействие, для более точной
стабилизации используется закон (7).
2. Построение оптимального синтеза для возмущенной систе-
мы.
2.1. Достаточные условия неосциллируемости возмущенной
системы. При исследовании возмущенной задачи синтеза обычно
все условия, кроме последнего условия типа (4), естественным
образом переносятся на общий случай 8 > 0, т. е. должны вы-
полняться равномерно относительно е е [0, 80], что и предпола-
гается в дальнейшем. Значительную трудность представляют
проблемы существования и построения гладкой функции <ре (х, у, и),
обладающей свойством (4), и оценка области GeX[0, е0] пере-
менных х, у, 8, для которой аналогично строятся кривая пере-
ключений Пе = Пе(а:, у) оптимального управления ие(х, у),
а также оптимальная траектория xe(t, х\ г/°), ye(t, xQ, у°) для
G^t^Te(xQ, у°) и функция Веллмана ТДх, у) возмущенной
задачи. Следует ожидать, что для произвольной гладкой возму-
щающей функции F оценки приведут к более узкой области G8,
чем исходная, т. е. GE G Т?2, причем Ge -> G при 8 -> 0. После
того как указанная проблема оценок решена, в области (х, у)<=
Ge возмущенная кривая переключений, картина синтеза (опти-
мальные траектории) и функция Веллмана могут быть аналогично
вышеизложенному построены аналитическими (по степеням е)
или численными методами, что обычно не приводит к принци-
пиальным трудностям. Ниже, в п. 3, рассматриваются представ-
ляющие прикладной интерес примеры конкретных систем (1),
для которых проводятся и обосновываются указанные построения.
Проблему существования функции ср8 и оценки области Ge,
е е [0, е0] удается конструктивно исследовать для произвольных
гладких возмущений в некоторых частных случаях функции /.
1) Пусть, например (см. [61]),
]'х(х, у, и)^0, и = ±А, (x,y)^G. (9.1.9)
Тогда для невозмущенной системы <р = 0, а при е > 0 можно
взять функцию <р8 = —цгщ, где параметр ц>0 подлежит опреде-
лению. Из неравенств (3) следует, что при достаточно малых
положительных ц, е в некоторой малой окрестности (х, y)f=Ge
начала координат справедливо неравенство (4). Действительно,
в этом случае главным членом в левой части неравенства (4),
обеспечивающим его справедливость, будет ТцД.г, г/, ±1), по-
скольку, согласно (3), /(0, 0, ±1)=/±^0. Остальные слагаемые
можно сделать достаточно малыми по абсолютной величине
(х, у)^ Ge соответствующим выбором параметров ц, 8 > 0.
§ i. ВОЗМУЩЕННЫЕ НЕКОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
309
Область Ge будет асимптотически большой по параметру е,
если удается найти такую гладкую функцию <р(.г, г/, 8), что
/2(ф//)у + °, (я, J/)g=Gc, u=±l. (9.1.10)
Здесь h — параметр; существенно, что функция ср строится на
основе только функции /, т. е. невозмущенной системы. Если же
функция / не зависит от х, то неизвестную функцию <р естест-
венно искать в виде ср (г/, 8), а неравенство (10) примет вид
/2 (ф//)у<й< °-
Пусть, в частности, f=u; тогда можно, полагая, как и выше,
<Ре = — уьуи, прийти к неравенству
— н+ шах [(р-г/)2 + е (р.|/’| + + |^х|)]< 0. (9.1.11)
(x,j/)sGe
Если величины |FV|, (Z^l равномерно ограничены для у ~ 1/Ve,
<г~1/е, то неравенство (11) будет выполняться в асимптотиче-
ски большой области Ge с указанными линейными размерами.
Справедливость (11) можно установить, полагая ц = еМ, М ~ 1.
2) Пусть для известной функции <р(я:, г/, и) в некоторой
ограниченной подобласти Go ^ С выполняется строгое неравенство
max [(Z/ср — /)«+ ф2(1 + (//Ф)у)]< — б<0, и = ±1. (9.1.12)
(x,i/)eG0
Тогда при достаточно малом е > 0 неравенство типа (4) будет
выполняться для возмущенной системы (1), если взять <ре = ср,
(х, y)^G0.
Если же область G не ограничена, то требуются дополнитель-
ные условия на рост функции F и ее производных [61]. Напри-
мер, для квазилинейной неколебательной системы
х + 2кх+ ы2х = и + zF(x, х, и), &>со>0, (9.1.13)
функцию ср можно взять постоянной: ср = сре = — к; тогда, соглас-
но (12), следует, что 6 = к2 — со2>0; неравенство типа (4) или
(12) будет выполняться для системы (13) в области Ge X [0, 80],
где
u = ±l. (9.1.14)
Если величины I Fy |, | Fx | равномерно ограничены постоянной N
для (х, y)^R2, то неравенство (14) выполняется (х, y)^R2 при
8^6(/c + l)-W-1.
2.2. Построение возмущенной кривой переключений. В огра-
ниченной равномерно по 8 области Ge построение траекторий
я? (£, Z/0)» Уг (t, У°), входящих в начало координат, которые
аналогично (5) задают искомую кривую Пе(я:, у), осуществляет-
ся простыми рекуррентными процедурами последовательных
приближений (методом Пикара [197, 218]) или разложениями
310 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
по степеням е [78, 158]. В качестве начальных приближений
можно взять функции x^(t, х\ yQ), y*(t, xQ, г/0)» определенные
в п.1 (см. (5)). Фундаментальная матрица, при помощи кото-
рой строятся решения последующих приближений, получается
из х\ у^ дифференцированием по параметрам х\ yQ е Ge. Обос-
нование схем проводится на основе теоремы Банаха об операторе
сжатия [201, 218] или теоремы Коши, использующей метод ма-
жорантных функций Пуанкаре [78].
Кривая переключений Пе в неявной форме типа (6) строится
аналогично п. 1 при помощи частных интегралов возмущенной
системы:
(/ + tF) dx = ydy, и = + 1, (0, 0) = 0. (9.1.15)
Функции Те" можно построить на основе общих интегралов
невозмущенной задачи z/) = c, дифференцирование кото-
рых в силу (15) приводит к уравнениям
de = vfdx + 4^'dy =
= eV?' (F//) dx = eV?' [//(./ + eF)] dy. (9.1.16)
При выводе второго и третьего равенств в (16) используется со-
отношение Тх у + 0 (по х, у)- функции /, F берутся
при п = т1. Частные интегралы возмущенной системы (16)
Л? (х, у. с) = 0, удовлетворяющие условиям Af (0, 0, 0)=0, сов-
местно с общими интегралами невозмущенной системы Т:р = с
дают искомую кривую переключений Пе в виде (6).
Обоснование методов малого параметра для построения кри-
вой переключений Пе в асимптотически большой по 8 области
Ge требует равномерной ограниченности производных функций
/, F по (х, y)^R2.
3. Исследование конкретных механических систем.
3.1. Слабовозмущенная динамическая система. Кривая пере-
ключений для неосциллирующего объекта вида
х = и + &F (х, х, и), и~^и^и+, и~ < 0, н+>0 (9.1.17)
па основе изложенного в п. 2 подхода получается интегрирова-
нием уравнений
dx = у ______ zFy
dy и и (u -|- eF) ’
и = z/T, у Jg 0.
(9.1.18)
Задача Коши (18) приводится к нелинейным интегральным
уравнениям относительно х = х^ (у):
у2_____е_ Г zF (х, z, и) dz
2и и J u-\-eF(x, z, и)1
и = и+ (у^0). (9.1.19)
о
§ 1. ВОЗМУЩЕННЫЕ НЕКОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
311
Решения уравнений (18) или (19) строятся разложениями по
степеням 8 или последовательными приближениями. В качестве
нулевого приближения кривой переключений, т. е. функций х+,
принимаются = ЧгУ2/1^, У^®- Рекуррентные схемы будут
равномерно сходящимися в асимптотически большой области
Се(.г~1/г, y~l/Ve), если функция F дифференцируема по х
и удовлетворяет равномерному условию Липшица. Рассматрива-
ются конкретные примеры.
1) Пусть lizl 1, F = Fq = const; тогда сре^ 0 и при elFol < 1,
(х, Ge= R2 следуют выражения для кривой переключений
Пе и времени быстродействия Те:
Пе(;г, у) = {х, у: х = + 1/2у2/и+, у^О]; (9.1.20)
Те (х, у) = S£ (х, У)+ &Е(Х, у), Se=—(y + ,
©е = [(У2 — 2u^z)/(u±2 — wfut)]1/2, < = 1 =F eF0.
2) Если возмущение — малая сила трения вида eF = —'к(\у\)у,
где X — неотрицательная функция, то сре = 0, (х, у)^ Ge = R2l
0 8 < °°, а кривая переключений находится квадратурами:
Пе(я, у) = рт, у: х =
у2
У
е С z2X (| Z I) dz
и J U^~— &zk (|z|) ’
< ие(х, у)^ и+.
(9.1.21)
Для частного вида функции X, характеризующей линейное и
квадратичное трение, кривые переключений суть
А 7 , у и^~, (л llF~ \
еХ = I = const, х = — -у------5- In 1-----г и ;
I I2 \ I & г
1 / «V
еХ = v | г/1, v = const, ^ = =Fo-ln|l=F--=i/2
(9.1.22)
Построение функции Веллмана связано с решением возму-
щенных трансцендентных уравнений. Соответствующее порожда-
ющее решение есть функция Т(х, у), определенная в (20); при
малых 8>0 добавки строятся методами возмущений (см. далее).
3) Рассматривается случай линейного по х возмущения F =
~Ах, А = const. Кривая переключений и картина синтеза для
такой системы хорошо изучены и построены для произвольных
(я, y)^R2, a — sA при —и~ = и+. Качественно различаются слу-
чаи: а > 0 — неколебательная система, а < 0 — колебательная.
Согласно пп. 1, 2 строятся кривая переключений и картина ешь
312 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
теза в асимптотически большой области Ge(.r~l/8, z/~ 1/Уе):
ере (л, у. и) = —еМуи, М>0,
G? = {х, у. —Ми2 — аМхи + ьМ2 (иу)2 — А С 0),
(9.1.23)
П£(х, у) =
= {х,у: —i/2a(x + u/a)2+l/2u2/a+i/2y2 = 0, и = ит, у^О}.
Кривая Пе (23) состоит из кусков эллипсов при А < 0 или ги-
пербол при А>0 (при Л =0— парабол; случай относится к рас-
смотренному выше). Следует отметить, что при А ^0 (см. п. 2.1)
условие (4) выполняется при (х, y)f=R2, если М = 0, т. е. фе = 0.
В первом приближении по е для кривой переключений Пе сле-
дует явное выражение:
2 Г 2 1
[‘-“IctJ + 0<“V)’
В случае осциллирующего объекта (а<0) при больших х,
у: \x\»hu/a+, lyl>Au/Va+, Аи = и+ — и~, как отмечалось в
п.1.2, для гашения колебаний можно применить квазиоптималь-
ный синтез вида u = l/2(u~ + и+) — 72Au sign у до значений
Ы ~ Au/a+, lyl ~ Аи/Уа+, а затем использовать синтез управле-
ния согласно (7), (23) (a+=lal).
3.2. Квазилинейная неколебательная система. Кривую пере-
ключений П для невозмущенной системы (13) можно предста-
вить в неявном виде (6):
тт/ X I (а Р1Р2 р1 V2
Щя, у) = ж, у: 1---X + у —
(\pi 1
1 —# —-г-У I = 0, г/^0?, р112 = — к ± (кг — <о2)1/2.
(9.1.24)
При со -> 0, т. е. при pi 1 0, для кривой хт(у) логарифмированием
получается первое выражение (22), отвечающее еХ = 2Аг. Более
удобным для дальнейшего применения метода возмущений ока-
зывается представление кривой II (а:, у) в параметрическом
виде (5):
х (0) = иы~2 (рг — р2)-1 [р2 (е Р10 — 1) — Pi (е Рг0 — 1)] = х,
(9.1.25)
у (0) = х' (0) = и (рг — р2)-1 (е Р1° — е ₽20) = у, и = и?, 0>О.
Определение времени оптимального быстродействия Т(х, у),
(х, y)<=R2 требует, согласно (8), решения трансцендентного
§ i. ВОЗМУЩЕННЫЕ НЕКОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
313
уравнения относительно неизвестной S = S(х, у), которое при-
водится к виду
1 In = 1 ln P2fe2~Al
Pl Рг~Р2 Р2 Рг-Рг'
, со2 ( Р,Я , P,S\ /\ .
1^6 + о2е 2 I + — — l (pj — р2),
k ' I j
, 1 ( P.S P2S\ 2
+ ^2^2^ J, P1P2 =
(9.1.26)
ai = у — P2x + u+p2(o 2, a2 = — у + ргх — u^p^ 2.
Если функция S(x, у) найдена из (26), то величины Q(x, у)
и Т(х, у) находятся элементарно:
Т(х, y) = S(x, у) + в(х, у), (9.1.27)
4 P-h^ — h. 1 Pnhn —
0 (я у) = — In 0 (х, у) = — In .
k ’ Pi P1-P2 ' P2 P1-P2
Возмущенная кривая переключений Пе(я, у) для системы
(13) при е>0 достаточно малом и (х, y)(=Ge, где область Gc
определяется согласно (14), представима в виде
ie(e)^z(e)+eXs(0) = ^ ее[0, е0],
г/е(0Н у(&)+ еУ8(0)=г/, 0>О. 1 '
Здесь функции а:(0), z/(0) определены в (25), а X, Уе равны
Х8(0) = [р2е^-р^ - Р1] [ф(Р1 - р2) - Ф'и^е-^] X
X [(А - р2) ер20 + еФ']-1 (Р1 - р2)-1 - р^е^Ф',
Ye (0) = Р1Р2 [е(р^в - 1] [Ф (Р1 - р2) - Ф'ию-2е-р2в] X ' ’
X [(Pi — р2) ер£ + еФ']-1 (/>! — р2)-1—е-Р10Ф', и = и^.
Функции Ф, Ф' определяются ниже на основе общего решения
уравнения (13) при u = uT. Это решение представляется в виде
системы интегральных соотношений при помощи импульсной пе-
реходной функции W(t — x) невозмущенной системы, т. е.
t
х = + c2ev^ + + е С W (t — т) F (х, у, й^) dx,
“ (9.1.30)
t
у = х = + c2p2epJ + z^W(t — x}F (х,у, u^) dxx
G = {C = (C1,C2): {х1У)^в2}. Ж(0 = (ер1‘-ера‘)(р1-Р2)“1.
314 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
Пусть искомые решения x(t, с, и, 8), y(t, с, и, е) в (30)'
определены, например, методом Пикара. Тогда Ф, Ф' в (29) равны
о
ф = ф (0, с, u, е) = J W (0 — т) F (х, у, и) dx,
о
Ф' = 5Ф(0, с, и, е)/д&, и = и\ (9.1.31)
Здесь параметры с1? с2 как функции 0, и, 8 находятся однозначно
из квазилинейной системы:
ci = р2^Р2~Р^е (и(о~2+еф) [ (рх — р2) ер^ — еФ']"1 —
- ерГ^"Р1@Ф', и = (9.1.32)
с2 = — Pi (нсо"2 + еФ) [(Pi — Р2) ер2° - еФ']”1.
Дифференцирование с1>2(0, н, е) (32) в (31) по 0 не произво-
дится. Система (32) удовлетворяет условиям существования и
единственности корней с1? с2 при 8 > 0 достаточно малом, кото-
рые вычисляются последовательными приближениями или мето-
дом Ньютона [86]. После подстановки Ф, Ф' (31) в (29), а за-
тем в (28) получается искомая кривая переключений в парамет-
рической форме: x = x(Q, и, е), у = г/(0, и, е), и = и*.
Построение функции Веллмана задачи Те(х, у) проводится
на основе порождающего решения (26), (27) методами возму-
щений аналогично, с помощью построенной картины оптималь-
ного синтеза для возмущенной системы. При этом используется
найденное возмущенное решение x(t, с, и, 8), у (t, с, и, 8).
4. Обобщение алгоритма построения синтеза возмущенной
задачи. Для прикладных целей важно дальнейшее развитие из-
ложенного подхода исследования систем, в которых возмущаю-
щая функция F зависит также от времени, для многомерных
управляемых систем, состоящих из звеньев типа (1), слабо свя-
занных между собой, и других более общих случаев.
Приводится обобщение алгоритма построения возмущенной
гиперповерхности переключений релейного управления на случай
системы вида
х = У, У = У, u)+sF(x, у, z, и), z = g(z),
х(Т) = у (Z) = 0, min. (9.1.33)
lul^i
Здесь (х, у) е Gz Т?2, 2 — вектор произвольной размерности
nz > 0; в частности z = функция g удовлетворяет условию Лип-
шица по z ^Gz<^ Rllz. Невозмущенная система относится к виду,
рассмотренному в п. 1. Поверхность переключений при 8 = 0 в
§ 1. ВОЗМУЩЕННЫЕ НЕКОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
315
расширенном пространстве (х, у, z) является цилиндрической по
переменной z; любое ее сечение z = const приводит к кривой
переключений вида (5) или (6) и к
синтезу (7). Наличие малых возму-
щений &F в (33), зависящих от z,
приводит к малой деформации по z
поверхности переключений; качествен-
ная картина синтеза приведена на
рис. 9.2.
Ставится задача при 8 > 0 доста-
точно малом построить синтез оптималь-
ного по быстродействию управления
и(х, у, z, 8), приводящего фазовую точ-
ку (х, у, z)^ GeXGz системы (33) на
многообразие (0, 0, z) в некоторой вы-
пуклой окрестности этого многообразия.
Как и в [61], применение принципа
максимума к задаче (33) приводит к со-
пряженной системе вида (р, q, г — со-
пряженные соответственно х, у, z переменные, Н — функция
Гамильтона)
* I $ / f , 77 \
= + <9Л'34>
’ дН \ dF* д < v / гру. п
Н = РУ + q(f + eF) +(r-g)->max,
|u|<l
и* = argmax H = argmax [<? (/ + eF)] = sign q.
|u|^l |u|<l
Из (33), (34) следует, что г = 0(8), поэтому наличие вектора z
слабо влияет на переменные р, q и тем самым на оптимальное
управление и*. Далее, как и выше, см. [61], предполагается су-
ществование функции ср(х, у, z, и, 8), гладкой по х, у, z, та-
кой, что
-<f^-(/+OT)-i(/+BF)]s;OA в_±1 (9.1.35)
в рассматриваемой области изменения аргументов х, у, z, 8. Диф-
ференцируя функцию г) = р + дер при и = ±1 и используя нера-
венство (35), методом от противного можно установить, что
переменная q 0 и меняет знак не более одного раза. Таким
316 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
образом, и в рассматриваемом, более общем случае оптимальное
управление и* имеет не более одной точки переключения. Функ-
ция ср при некоторых дополнительных предположениях, анало-
гичных сформулированным в п. 2, может быть конструктивно
построена.
Методами возмущений доказывается, что в малой окрестности
невозмущенной поверхности переключений, построенной в п. 1,
существует единственная поверхность П8(я, у, z), обращающаяся
в П(я, у) вида (5) или (6) при е = 0 (z^Gz). Эта поверхность
делит фазовую область Ge X Gz на две части и состоит из траек-
торий возмущенной системы (33), которые при z/ = ±l приходят
на «ось» z (а: = у = О), т. е. заданное конечное многообразие
я == У == 0, z — произвольно (z е Gz).
Возмущенная поверхность переключений релейного управле-
ния П8(.г, у, z) в неявной форме определяется следующим
образом:
П8 (х, у, z) = {х, у, z: xf (0, л, у, z) = О,
yf (0, х, у, z) == О, 0>О}. (9.1.36)
Здесь xf (f, ж0, у°, z°), yf (t, х°, у0, z°) — общее решение системы
(33) при 11 = ^1 соответственно, удовлетворяющее условиям
(0) = х° 0, yf (0) = у°5^0. Возмущенное решение может быть
построено методами малого параметра с заданной степенью точно-
сти. В явном виде поверхность
П8(х, у, z) = {x, у, z: хт(0, у, х, z, е) = 0, у^О) (9.1.37)'
строится интегрированием уравнений фазовой траектории:
х = хт(у, у\ х\ z°, е), z = zT(y, у\ х\ z°, е);
= = w = =Fl, (9.1.38)
dy / + eF’ dy f + eF’ ’ v 7
хт(у°) = я0 (=0, y° = 0)’, z*(y°) = z°, y°^0.
Возмущенная функция Веллмана задачи Тг(х, у, z) опреде-
ляется соотношениями
Те(х, у, z) = Ss(x, у, z)+08(z, у, z); S8, 08 0;
£ (S, X, у, z) = I, yf (S, X, у, z) = t], 2? (5, x, у, z) = С,
xt (0,1, n, Z) = o, yt (0, g, П, = 0. (9.1.39)
Здесь Ss — время движения из произвольной (начальной) точки
(х, у, z) до точки (£, ц, 5) пересечения с поверхностью переклю-
чений IlJ; 08 — время движения по поверхности nJ из точки
(g, ц, g) до конечного многообразия x = y = 0; z — произвольно.
§ 1. ВОЗМУЩЕННЫЕ НЕКОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ
317
Далее рассматриваются примеры возмущений системы (33)
при j = и, и~ и\ и~и+ < 0. Пусть F = тогда поверхность
переключений (t, х, у) задается соотношениями
у + ит (Т - t) + V2e (0 -1)2 + 2et (0 - t) = 0,
z + ^(0-f) + 72uT(0-O2 + (e/6) (0-O3 +
+ 72ef(0 -1)2 = 0; y^ 0. (9.1.40)’
При e = 0 поверхность переключения a: = 72z/2/uT, y^0 явля-
ется цилиндрической (не зависит от t) и определяет оптималь-
ный по быстродействию синтез для системы х = и, иг
(см. гл. 3). В первом приближении по е явное выражение для
поверхности переключения x = x*(t, у, е) получается после под-
становки выражения для (0 — t) =—у/ит — 42&у2/ (нт)3—
— 2e/z//(zzT)2, которое получается из первого уравнения (40).
Пусть теперь F = z— «выход апериодического звена», т. е.
z = ae”af, a>0; тогда поверхность П8(£, х, у) определяется вы-
ражениями
У ± (0 — 0 + 6 £-(е-“‘ — е~ав) = 0,: у^0 fluKl),,
(9.1.41)
х + У (0 - 0 ± 4-(© - О2 + «4(0 - 0 + е 4(е-“в-е-“‘)=0.
z а сс
Из первого уравнения (41) для параметра 0 получается прибли-
женное выражение
0 = t =F у =F е-^- (1 — e±av) + О (e2)f
которое после подстановки во второе уравнение позволяет полу-
чить в первом приближении по е явное выражение для «кривой
переключений» x = xT(t, у, е). При помощи формул (36) —(38)
поверхность переключений может быть представлена в перемен-
ных х, у, z.
Если lul^l, F = z = ae~ai sin (cot + 0)—«выход колебатель-
ного звена», то совершенно аналогично элементарным интегри-
рованием получается выражение для поверхности переключения
У ± (0 — 0 — е -у=^=====- e“aT sin (сот + 9 + 6) = 0, у 0,;
V а2+ со2
X + у (0 — t) ± 1/2 (0 — О2 + е —-;"~2 6?~ат sin(<°T + 0 + 26)|S® = 0,
ОС + СО
(9.1.42)
cos 6 = а/Уа2 + со2, sin 6 = со/Уа2 + со2, и = ±1,
0 = t Т у ± 8 “---. е~^ sin (сот + 0 + 6)
V а2 + ь>2
318 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
При со = О, 0 = л/2 для поверхности переключений (42) полу-
чается выражение, определяемое согласно (41). С помощью
результатов пп. 3, 4 может быть приближенно решен ряд нели-
нейных задач, для которых удается построить певозмущепный
синтез.
§ 2. Построение приближенного синтеза для гладких систем
на основе динамического программирования
1. Постановка задачи оптимального синтеза. Рассматривается
задача построения функции Веллмана V(t, х, е) и на ее основе
оптимального управления в форме синтеза н(£, х, е) для регу-
лярно возмущенной системы общего вида (см. Введение):
x = F(t, х, u, е), а:(^о) = ^0; х, xQ Dx, е [О, 80],
Ф (t, х, е) |т = О, J [и] = ф (£, х, е) |г -> min, и е U, (9.2.1)
и
х = (х{, .. ., хп), и = (и11 . . ., Um), Ф = (Ф1, . . ., Ф/).
Функции F, Ф, ф считаются достаточно гладкими в рассматри-
ваемой области изменения переменных £, х, и и параметра 8;
граница области U также достаточно гладкая. Свойства гладкости
определяются дальнейшими построениями. Момент времени
Т(Г ~ 1) окончания процесса управления может быть фиксиро-
ванным заранее или определяться в результате решения задачи.
Частные случаи задачи (1) рассмотрены в гл. 7.
Как и в гл. 7, искомое решение строится при помощи метода
возмущений на основе динамического программирования [53,
61], дающего необходимые условия оптимальности управления
в виде
Q + (Р-Р* (t, х, р, е)) = 0, 9 = ^, F* = F\u*,
u* = u(t, x, p, e) = argmin x, u, e)),
w=U
V(t, X, с)1т = ф(£, X, 8) It, Ф(£, X, 8)lr = 0. (9.2.2)
При выполнении ряда дополнительных условий, так называемых
достаточных условий оптимальности (например, в форме [61]),
решение V*(t, х, е) определяет регулярный синтез оптималь-
ного управления п*(£, х, Те, е), а тем самым и оптимальное
движение системы (1). Пусть при 8 = 0 такая функция V0(t, х, TQ)
известна; требуется аналогично гл. 7 найти конструктивные
достаточные условия существования и единственности функции
Веллмана V при 8 > 0 достаточно малом и построить ее с про-
извольной заданной степенью точности по 8.
2. Математический аппарат — метод характеристик Коши. Для
решения задачи Коши (2) методом характеристик нужно, как
и в математических методах принципа максимума, построить
§ 2. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ ГЛАДКИХ СИСТЕМ
319
решение двухточечной краевой задачи
dx ___ р dp.
dt
£^P-F*p
x(t0)=^, мп=& + ^-ф)Ь
V/ <А/ (у «Az J j
V |T = ф (£, x, e) |r, Ф (£, x, 8) |t = 0,
(9.2.3)
Здесь X — вектор множителей Лагранжа размерности вектора Ф.
Соотношения для скалярной переменной q при решении краевой
задачи (3) нужно учитывать, если величина Т не задана. Пере-
менные V (t) и q(t) находятся простыми квадратурами по t
после интегрирования гамильтоновой системы для х, р:
х = (t, t0, х°, р°, е), р = р* (t, t0, х°, р°, е),
с h dF\ (9-2’4)
V = V° + ](p^F^dT, q = qo-^p^d^dx.
*0 *0
Здесь xQ, р°, V°, qQ — значения соответствующих переменных при
t = tQ. Неизвестные р°, V°, q° (и Т) определяются из конечных
условий (3):
Ф(7\ х*(Т, t0, х°, р°, е), е) = Ф*|г = О,
Р* (Т, t0, х°, р», е) = + А (%.ф*) |г,
т
+ У (р* -^*) dx = ср (Т, х* (Т, t0, х°, р°, е), |т, (9.2.5)
*0
q° — У(р'лг) ^г==(^’) = ~(Р*,^’»)|т-
J \ dt \dt ]* Т \ dt /* Т */|J
*0
Неизвестные векторные параметры р°, X как функции задан-
ных или измеренных параметров to, xQ, Т, 8 находятся из первых
двух векторных уравнений (5). Если же момент времени Т
окончания процесса управления не задан заранее, то он опреде-
ляется как функция параметров to, х(\ 8 и подставляется в ранее
найденное выражение для р°. В результате будут определены
искомые параметры pQ, V°, qQ (и Те) как функции известных
величин:
Р° = Р* (t0, х°, Те, е), qO = (jl (t0, х°, Те, е),
V0 = 7°Л<о, х°, Те, е) (ГЕ= 7\(«0, ^°, е); Тг =.Т). <9-2-6)
320 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
Векторный множитель Лагранжа % исключается из линейной
системы: второе (и четвертое) уравнение (5). Предполагается
при этом, что матрица (дФ*/дх)т (и (5Ф*/5£)т) имеет макси-
мальный ранг Z.
На основе зависимостей (4) — (6) получаются искомые величи-
ны — решение V(t, х, Т, е) (или V (Z, х, Т* (Z, х, 8), 8)) нелиней-
ной задачи Коши (2), оптимальное управление и в виде синтеза,
оптимальная фазовая траектория, а тем самым и программное
управление (а также время Т& окончания процесса управления):
V (t, х, е) = V* (i, х, Т£,&)^= ф* |ге — J dx,
t
р (t, х, е) = р* (i, t, х, р® (t, X, Те, е), Те, е)= р® «, х, Т£, е),
(9.2.7)
q(t, х, е) = g® (t, х, Тг, е); Те = T*(t, х, е), ТЕ = Т,
u(t, х, г) = и* (Z, х, р (t, х, 8), 8),
z = x*(t,t0, х°, p°(t0, х°, Те°,е),е); Т°е = T*(t0, х°, е), Т"=Т.
Следует обратить внимание на особенность решения задачи
синтеза в случае фиксированного значения Т при f t Т, если
задано в (1) конечное множество Ф(/> 1). Программное опти-
мальное управление u*(Z, 8), отвечающее некоторым фиксиро-
ванным значениям (£0, а:0), получается из выражений (7) при
подстановке я* в и*.
Изложенная процедура построения решения задачи Коши (2)
предполагается корректной, т. е. считаются выполненными усло-
вия гладкости правых частей системы уравнений для характе-
ристик и условия существования и единственности решения
краевой задачи (3) в рассматриваемой области изменения пере-
менных и параметров задачи управления (1) Z, х, 8 (и Т). Та-
ким образом, по существу излагаемый подход эквивалентен при-
менению методов принципа максимума, т. е. сводится к построе-
нию решения двухточечной краевой задачи при произвольных
значениях tQ и xQ из рассматриваемой области.
3. Построение решения возмущенной задачи. Изложенная
в п. 2 процедура, основанная на методе характеристик Коши,
позволяет аналогично гл. 7 просто строить приближенные функ-
цию Веллмана, оптимальное управление и фазовую траекторию.
Предполагается, что решение невозмущенной (при 8 = 0) задачи
оптимального синтеза известно (Те = T^0(Z, х), Т& = Т):
V=V0(t,x), u = uQ(t,x), x = x0(t, t0, х°). (9.2.8)
Считается также, что в соотношениях (2) функции и* (t, х, р, е)
и F* (^ хл р, 8) определены с достаточной степенью точности
§ 2. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ ГЛАДКИХ СИСТЕМ
321
по 8. Некоторые приемы приближенного построения этих функ-
ций разработаны в гл. 7.
Тогда искомое решение (7) задачи Коши (2) строится на
основе решения двухточечной краевой задачи (3) в виде
V=V0 + eW, р = р0 + ег, q = q0 + es. (9.2.9)
Здесь W = W (t, х, е) — неизвестная функция, подлежащая опре-
делению, а г, 5 — частные производные W по х и t соответствен-
но. Подстановка выражений (9) в (2) приводит к слабо нели-
нейному уравнению в частных производных
5 + (r-F*Q(t, х, р0)) + g(t, х) + 8<?(f, X, г) = 0 (9.2.10)
и соответствующим конечным (при t = T) условиям. Выражение
F*q в (10) означает, что функция F* берется при 8 = 0; функ-
ции g и G известны и получаются стандартным образом анало-
гично гл. 7.
При выводе уравнения (10) используется свойство производ-
ной функции минимума [87, 189] (см. также § 2 гл. 1):
М = М (z) = min N (z, zz), u^U, z (= GZJ
и
= ’ «*(*) = arg min TV (z, u). (9.2.11)
oz OZ |u* ueC7
Из соотношений (И) следует, что (р0 • dF*o/dpo)=O. Поэтому урав-
нения характеристик для (10) приводятся к виду
х = х-> Ро ХУ) + 8 dGldr, x(tQ) = xQ,
•r__ ’ r(U_r«. (9.2.12)
dx v *u/ dx dx v u'
Приближенное построение характеристик на основе уравнений
(12) использует известное общее решение х0 порождающей за-
дачи. Искомые выражения для W и s получаются затем квадра-
турами. Интегрирование системы (12) позволяет определить пе-
ременные х, р в виде
X = xAt, tQ. Я°)+ 81/(L t0, х°. 8),
ll.Ul t г- г- в> (9-2ЛЗ>
р Po\Vj •Xoyl'j t'O? X ) )* ^0? Я 1 • 1 S') .
При помощи выражений (13) квадратурами вычисляются Гид.
Функции у, г находятся в результате приближенного реше-
ния задачи Коши для обобщенно квазилинейной системы:
У = fe)o V + У’ г)’ = 0’ (9.2.14)
г = — (г• (F*)o) + В (t) + eh (t, у, г), r(t0) = r°.
21 Л. Д. Акуленко
322 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
Выражения вида (^*)0 означают, что функция F*Q берется при
x = xQ(t, xQ). Решение задачи Коши (14) строится разложе-
ниями или последовательными приближениями по степеням
малого параметра. На каждом шаге уравнение для г линейно
и полностью определено. После его интегрирования переменная
г подставляется в уравнение для у, которое также интегрируется.
Следует отметить, что эти уравнения интегрируются в явном
виде, поскольку известно общее решение невозмущенной управ-
ляемой системы x = xQ(t, tQ, xQ). Фундаментальные матрицы ре-
шений для соответствующих линейных систем (14), согласно
(12) и § 2 гл. 2 (см. [69, 141, 222]), равны
д зс
У(0 = -?, 7?(i) = (yT(f))-1. (9.2.15)
дх
Обоснование методов малого параметра при соответствующих
предположениях относительно гладкости системы (14) проводится
стандартным образом (методом мажорантных функций Коши [78]
пли на основе теоремы Банаха об операторе сжатия [218]). Да-
лее на основе построенных с заданной степенью точности пере-
менных х, р как функций t, to, xQ, r°, 8 простыми квадратурами,
согласно (4), определяются переменные V и q. Затем из краевых
условий (5) методами возмущений с заданной степенью точности
па основе известного порождающего решения Хо, q%, То, Ко
вычисляются неизвестные параметры краевой задачи как функции
известных (измеряемых) переменных. При этом предполагаются
выполненными условия существования неявной функции, т. е.
невырожденности корня невозмущенной системы для всех х° из
рассматриваемой области. Параметры qQ, V0, согласно (5), опре-
деляются элементарно. В результате построен алгоритм прибли-
женного определения функции Веллмана задачи, синтеза опти-
мального управления, оптимальной фазовой траектории, про-
граммного оптимального управления, времени процесса управле-
ния (если 71 не фиксировано) и других характеристик задачи
оптимального управления.
Относительно точности получающихся выражений уместно
сделать следующее замечание. Для задач с фиксированным мо-
ментом окончания процесса управления и с заданным терминаль-
ным множеством функция Веллмана и оптимальное управление
имеют особенность вида V = К (х, t) (Т — t)~i и и = й (х, t) (Т —
(см. § 6 гл. 7), где К, й — гладкие функции, обращающиеся
в нуль при t = Т на оптимальных траекториях. Аналогичную
особенность будут иметь также добавки к невозмущенному ре-
шению. Поэтому коэффициент при соответствующей степени е
в выражении для погрешности будет зависеть от близости фазо-
вой точки (х, t) к терминальному множеству, т. е. оценка точ-
ности приближенного решения будет неравномерной.
§ 2. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ ГЛАДКИХ СИСТЕМ
323
4. Модельный пример. Рассматривается обобщение задачи
§ 6 гл. 7 о гашении экваториальной составляющей вектора угло-
вой скорости ((он (о2) вращения динамически симметричного
аппарата на случай произвольных возмущений:
(01 = — v (J)(o2 + Mi + ei/i (t, (Oi, (о2, Ui, u2), (Oi(T) = 0,
(9.2.16)
co2 = v(^)(0i + u2 + e/2(^, (01, (o2, Ui, u2), (o2(Z)=0,
т
J [u1? u2\ = J (и? + u2) dt -> min, u = (u1? z/2) R2.
*0
При 8 = 0 решение задачи (16) полностью построено в § 6 гл. 7
(р1? р2 — сопряженные (оь (о2 переменные):
«ю = Рю = — (71 — COS 9 — tocsin 0), ©10 = _(T — t)pu,
«20 = Р20 = ~ (^ — iof1 (w?sin 9 + “2 cos 0), ©20 = — (Г — t) р20,
0 = 0(f, i0) = Jv(T)dr, 0 e [0,0], = (9.2.17)
*0
В первом приближении по 8 оптимальное управление, со-
пряженные переменные и фазовая траектория, согласно принци-
пу максимума и изложенному выше, равны
Ui = Pi + +" + О(е2), i = 1,2; h = p1fl + pj2, (9.2.18)
Pi = Рю + + О (е2), ©; = ©го + + О (е2).
В функцию h (18) подставляются нулевые приближения пере-
менных (о, = (Ого, Pi = Рю, Ui = izi0 согласно (17). Сопряженные
переменные рг в первом приближении имеют вид
Pi = Рю + 8 (Л1 + а cos 9 — 6 sin 0) + О (в2),
р = р + в (л2 + a sin 0 + 6 cos 0) + О (е2), 0 = 0 (£, t0),
(9.2.19)
t
л, = f (— cos А0 + sin A©') dr, Д0 = 0 (t, t0) — 0 (т, t0),
1 JI 5(0- 5(0_ I ’ \ ’ и/ 4
\ 1 2 /
ro
t
л2 = — J f ^~sin A0 + cos A0^ dr, = Л; (t, t0, (oj, (o2).
t0 V W1 °2 '
Неизвестные постоянные a, b в формулах (19) определяются с
погрешностью 0(e) из условий обращения в нуль переменных
21*
324 гл. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
K2(Z) (см. (18)):
т
а = — jAj-j*(giCos9 —g2sin0)t?t, g1 = n1 + ^-,
zo
т
ь= — т±~Т Uisin0 + ^cosO)^, g2 = JT2 + f-,
°r0 2 (9.2.20)
t
?i = J (gi cos A0 — g2 sin A0) dr + (t — t0) (a cos0 — b sin 0),
*0
уz = J (gj sin A0 + g2 cos A0) dr + (t — t0) (asin0 + b cos0).
*0
Приведенные формулы (18) — (20) определяют полностью в пер-
вом приближении по е искомое решение задачи оптимального
управления (16) в виде программы и синтеза. Поскольку piQ^
~ (Г —£0)~\ то синтез оптимального управления будет иметь
особенность (Г — t)~l при t -> Т в нулевом и последующем при-
ближениях.
Следует отметить, что метод возмущений для квазилинейных
систем (квадратическая проблема, задача быстродействия и др.)
развивался ранее в [38—42, 54, 101, 107, 108, 115, 198, 204,
240, 251] и др. работах.
§ 3. Построение возмущенного синтеза с помощью
канонических преобразований
1. Декомпозиция в задачах оптимального управления. Изло-
женный в § 2 метод возмущений будет эффективным, если при
8 = 0 порождающая задача допускает достаточно полное решение.
В частности, можно рассмотреть многомерную управляемую си-
стему размерности п > 1, распадающуюся на большое число I
подсистем меньшей размерности при е = 0:
~ (^ ^fe) “Ь &fk (^ ^)» *^k (^о) ~
Xk = (4°, . •., к = i, ..., z, nx + ... + щ = n,
= .. + mi = m, (9.3.1)
u^U=UlX...XUl, uk^Uk.
Для определенности рассматривается движение управляемой си-
стемы (1) на фиксированном интервале времени t, t^[tQl Г].
§ 3. СИНТЕЗ ПРИ ПОМОЩИ КАНОНИЧЕСКИХ ПРЕОБРАЗОВАНИЙ 325
Ставится следующая задача оптимального управления:
Mh (xh (Т)) + еМк (х (Г)) = 0; Л [u] -> mint
< ~ ~ ~ (9.3.2)
Л[и] = 5 Л1М 4-е/[м], /ft = Ofe(xfe)|T, 7 = Ф(а:)|т.
й=1
При 8 = 0 задача оптимального синтеза для многомерной управ-
ляемой системы (1), (2) разбивается на I задач меньшей раз-
мерности, численное или аналитическое решение которых обычно
бывает существенно- проще, нежели исходной.
Итак, далее полагаются известными решения всех I невозму-
щенных задач оптимального синтеза вида
== h (Z? ^h, Xk(tQ) == %k, к = • • ., Z,
Mk (xh (Т)) = 0, Jh [щ] = Фк (xh (Г)) -> min , (9.3.3)
uk^uk
== *^k = ^0 0, *0, %h) •
Построение оптимального решения исходной задачи синтеза
(1), (2) с учетом 8 может проводиться при помощи методики,
изложенной в § 2, на основе динамического программирования.
Далее излагается другой подход, основанный на принципе мак-
симума Понтрягина и канонических преобразованиях. Примене-
ние метода характеристик Коши, по существу, эквивалентно
применению условий оптимальности принципа максимума [180].
Для невозмущенной задачи (3) они имеют вид
Hk = (Pk'Fk(t, ^ki ик))-+ max , к = 1, . .., Z;
uk^uh
= u° (t, xh, ph) = arg max Hk; H°h = H°h(t, xh, ph);
. 5Я» (9-3-4)
~ Л n = Pk), (^o) = Mfr (^h) |r = Q»:
°Ph
= = p»-W = \-d£r +зг(^-мЛ) .
Здесь Fk, Hl — функции Fh, Hk, в которые подставлены функ-
ции uk = Решения задач (4) предполагаются известными для
произвольных Zo и x*k из рассматриваемых областей определения
движения системы (3). Функция Гамильтона исходной системы
(1) и соответствующее оптимальное управление и* представимы
в виде
i
Н = 2 [Hk+E(ph-fk(t, х,и))]-^т&х, /ОЧК\
fe=1 usU (У.О.Э)
и* = и° (t, х, р) + w (t, х, р), и° = (и1г ..., щ).
26 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
Для 8 > 0 сопряженная система представима при помощи воз-
мущенной функции Гамильтона Н* в виде
X = = F°(t, х, р) + е/ (t, х, р),
Р=-д^=-^Р-р^-^ Х' Р^
Н* = Я* (t, х, р, е) = Я0 («, х, р) + еЯ (t, х, р), (9-3.6)
Я* = Я |и», Я0 = Я* |е=0 = 2 H°k, еН = Н*~ Н°.
k=l
Начальные и конечные условия и условия трансверсальности на
основе (2) записываются аналогично (4):
х (t0) = xQ, М (х (Z)) + еМ (х (Т)) = О,
(9.3.7)
р(7,) = ~^(ф + еФ)|т + ^-^0?И + еМ)')| .
C/vV I l/vC J I р
Решение возмущенной задачи (6), (7) предлагается строить
путем разделения переменных xh, к = 1,..., I, I 2, на основе про-
цедуры канонических преобразований [76] (см. гл. 2, п. 4). Мето-
дами возмущений находится унивалентное каноническое преобра-
зование, близкое к тождественному:
(f, х, р) (t, у, q), (9.3.8)
, до , до .
у = х + ед^ P = q + sd7' о = a(t, X,q,e),
такое, чтобы новые переменные у, q описывались распадающейся
системой уравнений, т. е. функция Гамильтона для (г/, q) имела
вид, аналогичный невозмущенному случаю (4):
i
K = K(t, У, q,e)= S Kk (t, ук, qh, е),
k=l
Kk = K°k + еЯ^ + e2... (9.3.9)
Неизвестная функция о (8) удовлетворяет уравнению в частных
производных
е^- + Я* (f, х, q + е^-, е) = K^t, х + е^, q, е), (9.3.10)
из которого сразу следует, что
Я°=2я^, K°h(t,xh,qh) = H°h(t,xh,q .3.11)
k=l
Последующие коэффициенты^^, / = 1, 2, ... могут быть вы-
браны произвольными, достаточно гладкими функциями своих
аргументов. В конкретных случаях они выбираются из соображе-
§ 3. СИНТЕЗ ПРИ ПОМОЩИ КАНОНИЧЕСКИХ ПРЕОБРАЗОВАНИЙ 327
ний удобства, в частности К$ = 0. В этом случае преобразован-
ная система будет иметь вид невозмущенной (4), для которой
предполагается известным общее решение
= 40) (л t0, 4, р°), x(h0) I, = 4,
(9.3.12)
Ph = Рь0) (t, t0, 4, Ph), Pk0)lt0 = p°.
При заданных функциях неизвестная o = o(Z, х, q, е) стро-
ится разложениями по степеням е:
о = а0 + £01 + ... + eJOj + ..., 7 = 1,2,...; (9.3.13)
до- XI / _Л / до Д
7? + 2 (*дх~) “
k=i \ ч
-2 ^7 Xh, 4h))-^\ = Wj(t, х, q).
k=l \ k 44
Здесь функции Wj известны и строятся на основе Я°, Я, задан-
ных К%\ i = 1, 2, . .., /, и функций of, вычисленных на предыду-
щих шагах (i = 1, ..., 7 — 1); в частности
W, = 2 W + Я.
h=l
Решения последовательности системы (13) находятся методом
характеристик на основе общего решения порождающей системы
(4), поскольку уравнения характеристик по предположению ин-
тегрируются в явном виде.
Изложенным выше приемом вычисляется искомая функция а
с заданной степенью точности по 8, определяемой гладкостью
функции Я* по х, р. Аналогично § 5 гл. 7, к слабо нелинейному
уравнению (10) может быть применен метод последовательных
приближений, требующий расширения пространства характери-
стик; дополнительно вводятся переменные X = dsJdx и Q =
= do/dq [172].
2. Приведение к оскулирующим каноническим переменным.
Метод вариации постоянных интегрирования (начальных значе-
ний) Ъ> = х°, ц = р° в решении пулевого приближения приводит
к гамильтоновой системе вида
g = гдй*/дх\, ^(tQ) = x\
ц = -8 ЗЯ°М, Т) (М = (9.3.14)
= x^(t, tQ, £, ц),р(0)а, £, ц)).
Общее решение системы (14) на ограниченном интервале време-
ни t, t^[tQ, Т], строится последовательными приближениями или
разложениями по степеням 8. Постоянный вектор затем вы-
328 ГЛ. 9- ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
бирается из конечных условий для х и условий трансверсально-
сти, согласно (7), как функция tQ, х°, которые в управлении и*
(5) считаются текущими, т. е. х" -> a:, to~+t (управление в форме
синтеза). Если р° = р0(£0, я0, Т, е) вычисляется неединственным
образом, то оптимальная ветвь р° выбирается из условия миниму-
ма функционала Je[u] (2). Дальнейшие построения в случае про-
стого корня р° не представляют затруднений для достаточно глад-
ких функций Н* (£, х, р, е) и Ф(я), Ф(я), М(х), М(х). Критиче-
ский случай кратного корня р° в порождающей краевой задаче,
когда соответствующий функциональный определитель относи-
тельно р°, X обращается в нуль для некоторых допустимых зна-
чений to, х°, Т и других параметров системы (е^О), требует до-
полнительного исследования и связан, как правило, с приближе-
ниями по дробным степеням 8 (см. § 2, 3 гл. 2, § 2 гл. 4, § 5
гл. 7 и § 2 гл. 9). Следует отметить, что слабоуправляемые систе-
мы в оскулирующих переменных приводят к виду (14) и в слу-
чае терминального функционала в первом по 8 приближении
приводят к так называемым локально оптимальным управлениям
[222, 229]. Можно также установить в случае, когда максимум
по uh Uh функций Нк находится строго внутри областей, т. е.
дНк/дик = 0 при uh = что минимум функционала Je [н] дости-
гается с погрешностью О(82) на управлении нулевого приближе-
ния. Таким образом, функционал вычисляется приближенно с по-
грешностью, степень по 8 которой на единицу больше, чем по-
грешностей определения управления u(t, &) и траектории x(t, 8).
Уточнение управления в первом приближении метода возмуще-
ний требуется для более точного выполнения краевых условий
и не влияет на минимум функционала. Аналогично для нахожде-
ния минимума функционала с погрешностью 0(8й+1) достаточно
найти оптимальное управление с погрешностью 0(&h); уточнение
управления с учетом слагаемых порядка 8*, т. е. с погрешностью
0(8а+1), может быть осуществлено для увеличения точности вы-
полнения конечных условий.
Возможен другой вариант приведения уравнений принципа
максимума к каноническим оскулирующим переменным на основе
невозмущенного синтеза u — uQ(t, х) и соответствующей невоз-
мущенной оптимальной траектории x = xQ(t, to, xQ) для произволь-
ных to, х°. В системе (1) и условиях (2) совершается замена
переменной х на £ по формулам
ж = х^ (t, tQ, ^), (£0) = х®,
• ( дх \—1
5 = j {l^ (*, z0, u) — F (t, х0, u0)] +
+ е/ (t, x0, и)} = F (t, x0, u, uQ, e)> (9.3.15)
Afe (x0) |t = 0, Je [«] = Фг (x0) |r -> min.
u<=U
§ 4. НЕКОТОРЫЕ СИНГУЛЯРНО ВОЗМУЩЕННЫЕ ЗАДАЧИ
329
При 8 = 0 решение задачи (15) равно u = u0(£, to, %), £ = z° =
= const. Применение принципа максимума к задаче (15) для
8 > 0 приводит к соотношениям
и* = и* (t, тр е) = arg max h,
ut=U
h F (^ xQ, u, u0, 8) j, (9.3.16)
dh I dh* ,rr\ \ d® f dM\l
Здесь v — множитель Лагранжа. Подстановка u* (16) в уравне-
ние для | (15) приводит к гамильтоновой системе. Решение крае-
вой задачи для этой системы строится методами возмущений.
В случае гладких функций fe* и М, Ф применимы разложения по
степеням 8:
g = XQ + 8gi + 82. . ., Г) = Г)° (х°, tQ) + 8Г)1 + 82. . .,
где ц° — известная функция, получаемая на основе известного
решения xQ(t, tQ, xQ) и uQ(t, х) невозмущенной задачи. Возможно
применение метода последовательных приближений типа Пикара,
использующего в качестве нулевого приближения величины £(0) =
= х\ г|(0) = r)°(z°, tQ). Сходимость последовательных приближений
п оценка близости при 8 > 0 достаточно малом, как и в соответ-
ствующей схеме для системы (14), имеет место в случае невырож-
денности решения нулевого приближения — функциональный
определитель матрицы Якоби по т)°, v должен быть отличен от ну-
ля для всех to, х°.
§ 4. Исследование некоторых сингулярно возмущенных задач
оптимального управления
1. Постановка задачи. Функционирование ряда технических
систем может быть описано в рамках моделей задач оптимального
управления движением сингулярно возмущенных систем:
x = f(t, х, у, и), x(to) = x°, t^[tQ, Г],
ьу = X, у, и), y(to) = y°, 8^(0, 8о], (9.4.1)
М (Т, х(Т)) = 0х J[u] = &(T, я(Т))->тш.
u^U
Здесь х Dx, у ^Dv — векторы произвольных размерностей (фа-
зовые переменные), где Dx, Dy суть открытые ограниченные обла-
сти; и е U — вектор управляющих воздействий из допустимого
класса. Величины tQ, я0, у" — заданные начальные значения,
Т — фиксированный или определяемый в процессе решения зада-
чи оптимального управления ограниченный момент времени окон-
чания процесса. Все функции в (1) предполагаются достаточно
330 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
гладкими относительно входящих в них аргументов, а область U
выпукла и имеет достаточно гладкую границу.
Требуется построить приближенное решение задачи (1) при
8 > 0 достаточно малом, т. е. найти приближенный синтез опти-
мального управления us(t, х, у, оптимальную траекторию
x = x(t, tQ, xQ, yQ, 8), y = y(t, to, x°, y\ 8) и тем самым програм-
мное управление up(t, tQ, х°, yQ, 8), а также минимальное значе-
ние функционала Лп1п = Ф(7\ х(Т, tQ, х°, yQ, 8)) и при нефикси-
рованное Т величину Т = T(tQ, х°, у\ 8).
2. Схема асимптотического решения. Если в системе (1) фор-
мально положить 8 = 0, то уравнение для у переходит в конечное
векторное соотношение. Оно предполагается однозначно разреши-
мым относительно у в рассматриваемой области изменения аргу-
ментов, т. е.
O = g(t, х, у, и), y = yQ(t, х, и). (9.4.2)
Предполагается, что yQ — изолированный корень, достаточно глад-
кая функция аргументов t, х, и. Функция yQ(t, х, и) подставляет-
ся в уравнение для я: (1) и далее рассматривается задача опти-
мального управления для вырожденной системы меньшей размер-
ности (см. Введение)
x = f(t, х, yQ(t, х, и), и), x(toy) = x°, t^[tQ, Т],
М(Т, я(Т)) = 0, J[u] =Ф(Т, rr(Z))->min. (9.4.3)
и
Вследствие упрощающего предположения о независимости М и Ф
от у(Т) вырожденная задача (3) получилась замкнутой. Считает-
ся, что ее решение существует, единственно и может быть по-
строено в виде
и = Itos (t, х), х = Xq (t, to, х°); и = Uop (£, tQ, х°),
Jo = ф (Г, Хо (Т, to, xQ)); Т = То (to, х°);
У = Уо{1, ocQ(t, to, х°), uQP(t, to, xQ)). (9.4.4)
Здесь у о — решение вырожденного уравнения (2), определенное
на решении задачи (3). Возникает проблема оценки близости по-
строенного решения (4) вырожденной задачи (2), (3) и искомого-
решения исходной сингулярно возмущенной задачи (1). Исследо-
вание этой проблемы в общем случае затруднено. Практический
интерес представляет также оценка близости решения (4) и ре-
шения сингулярно возмущенной системы (1), в которую под-
ставлено приближенное управление Uos(t, х) или uQp(t, tQ, <r°).
Пусть функция u=uQs(t, х) подставлена в (1):
x = /(f, х, у, u03(t, x)) = fos(t, х, у),
. /, /* \ \ /. \ (9.4.5)
ьу = g(t, X, у, UbAt, х))= gas(t, X, у}.
Предполагается, что равномерно асимптотически устойчива по>
§ 4. НЕКОТОРЫЕ СИНГУЛЯРНО ВОЗМУЩЕННЫЕ ЗАДАЧИ
331
первому приближению точка покоя у* присоединенной системы
[67, 199]:
у' = gos х. у). у* = у Q (t. х. uQs (t, х)). (9.4.6)
Здесь штрих означает производную по «быстрому» времени т =
= //е; аргументы t. х считаются фиксированными. Тогда при со-
ответствующих предположениях гладкости правых частей уравне-
ний (5) по (t, х. y)^[tQ. T]XDxXDy и указанной выше изолиро-
ванности корня yQ имеет место близость между неизвестным
решением х8. ys задачи (5) и известным решением xQ. yQ зада-
чи (4) [67]:
\xs(t, х°. у\ е) —<г0(£, я°)1 t^[tQ. Т],
(9.4.7)
I Уз (^ tQ. х°. у°, е) yQ (t, xQ. Uop) I (7c, t e= Ze cz [f0, 71].
Здесь множество 1Ъ не содержит точек t малой меры, в частности
t = tQ. Если управление uQP имеет конечное число точек разрывов,
то множество h не содержит их вместе с малыми окрестностями.
Вместо функции u = u08 в систему (1) можно подставить из-
вестное программное управление u = uop(f, to. xQ):
x = f(t. x. у, u0P(t, t0'. x°)) = f0P(t. to. x. x\ у). g
8?/=g(£, X. y. UoP(t, to, X°)) = gop(t, to. X. X°. y).
Аналогично устанавливаются оценки типа (7) для решения хр,
ур системы (8). В точках разрывов управления uQP оценка близо-
сти нарушается вследствие погранслоев, обусловленных разры-
вами Уо.
Таким образом, управление (4) вида uQs или uQP решает зада-
чу о приведении переменной х на многообразие М (1) с погреш-
ностью 0(e) в момент времени t = To(to. xQ). Вопрос об оптималь-
ности требует дополнительного исследования на основе принципа
максимума, аналогично § 5 гл. 2 и § 5 гл. 4. Более точные вы-
числения управлений и траекторий требуют учета погранслоев и
построения погранфункций [68].
3. Квазиоптимальное быстродействие в сингулярно возмущен-
ных линейных системах. В практических случаях иногда можно
ограничиться исследованием задачи оптимального по быстродей-
ствию управления линейными системами вида
х = АххХ + A xvy + Вхи + Fx(t). x(tQ) = х°.
e.y = Avxx + Avvy + Bvu + Fv(t), y(ta) = y0, (9.4.9)
х(Т) = х*. 7'->min, ut=U.
и
Здесь х. у — векторы произвольных размерностей, х* — заданный
вектор, U — выпуклое множество, в частности, для ряда приклад-
ных задач а:*=0 (FriV = 0), U—многогранник. В соответствии
332 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
с п. 2 матрица Ауу предполагается отрицательно определенной.
Считается далее, что вырожденная задача (9) оптимального
управления для переменной х
% = (-^ХХ Ауу Аух) & “Ь (-^Х Ауу By) U + (Fх Ауу Fу)1 (9.4.10)
х (tQ) = а:0, х(Т) = х*., 7-^ min, u^U
и
имеет оптимальное решение I
u = uQs (t, х), х = Xq (?, t0, xQ); и = uop (t, t0, x°),
(9.4.11)
T — Tq (£o, я:0), у = yQ = Ауу (АуХх0 4" Вуицр + F}.
(непрерывной) или кусочно-
гладкой (релейной) функ-
цией времени. Подстановка
управления пор (И) в исход-
ную систему (9) приводит
за время (То —t0) фазовую
точку (х, у) в е-окрестность
гиперплоскости х = х*, у.
Если х* = 0, Fx(t) = Fy(t) = О,
то при и = 0 для t > То за
время At = t — TQ ~ 8 In (1/е)
переменная у также придет
в 8-окрестность значения у ~
= 0. Для более точного ре-
шения задачи (9) требуется
учет пограничных слоев для
переменной у [68].
4. Пример. В качестве
простого модельного приме-
ра задачи (9) рассматрива-
ется система 2-го порядка
специального вида. Исследу-
ется малоинерционный объ-
ект с одной степенью свобо-
ды, приведенный в безразмерных переменных к виду
ex + x = u, х(0) = х°, х(0) = х°,
(9.4.12)
х(Т) = х* (=0), х(Т) = 0, 7 +min, |и|<1.
и
Решение задачи управления (12) для произвольного значения
параметра е > 0 строится элементарно, согласно [61], и приведено
в § 1. Картина синтеза при малых е приведена на рис. 9.3. Кри-
вая переключений П релейного управления близка к оси ординат
£==£*(=0), т. е. в пределе при 8 = 0 управление п =
§ 5. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ МАНИПУЛЯТОРОВ
333
= — sign (х — х*). Фазовые траектории в областях быстро до-
стигают малой окрестности O(e~i/S) прямых x = :Fl (при 8 = 0
«мгновенно» выходят на эти прямые), по которым фазовая точка
со скоростью х = — sign (я: — х*) + O(e~t/&) движется к оси орди-
нат х = х* = 0 и достигает ее 8-окрестности за время Zo=la:ol.
Если затем положить к = ±1, то за время £ — То ~ 8 In 8"1 она
придет в начало координат х = х = 0. Фазовая точка будет оста-
ваться в заданной конечной точке, если положить и ss 0 при
t^T(xQ, х°, 8), где Т — известное время быстродействия. Если
в 8-окрестности оси ординат положить и = 0, то за время t — TQ —
= 0(8 1п8~1) фазовая точка достигнет 8-окрестности конечной
точки х = х = 0.
Аналогичная (12) задача для сингулярно и регулярно воз-
мущенной системы третьего порядка рассматривается в § 5 при
исследовании задач управления движением манипуляционных ро-
ботов с помощью электромеханических приводов, основанных на
линейных двигателях постоянного тока с независимым возбуж-
дением.
§ 5. Приближенный оптимальный синтез для манипуляторов
антропоморфного типа с электромеханическими приводами
Рассматривается задача об оптимальном по быстродействию
управлении транспортным движением электромеханического ма-
нипуляционного робота с тремя степенями свободы. Построена
расчетная модель такого робота. Установлено, что для многих со-
временных промышленных манипуляторов взаимное влияние раз-
личных степеней свободы мало и может быть учтено методами
теории возмущений. В пренебрежении взаимным влиянием раз-
личных степеней подвижности определено оптимальное управле-
ние в форме синтеза, обеспечивающее наискорейшее приведение
робота в заданную конфигурацию с торможением движения
в конце процесса. Приведены оценки мощности тепловыделения
в обмотках роторов электродвигателей приводов, соответствующие
построенному управлению.
Результаты § 5 получены совместно с Н. Н. Болотником.
1. Расчетная модель манипулятора. Уравнения движения. Рас-
сматривается антропоморфный манипулятор типичной конструк-
ции [109, 110, 183], состоящий из подвижной платформы и меха-
нической руки со схватом G (рис. 9.4). Рука представляет собой
два абсолютно твердых тела (звена) 7, 2, соединенных шарни-
ром О2. Свободный конец звена 1 связан посредством шарнира
с платформой, а на конце звена 2 расположен схват с грузом.
Шарниры 01, О2 — идеальные цилиндрические, их оси горизон-
тальны и параллельны друг другу. Платформа может поворачи-
ваться вокруг неподвижной вертикальной оси. Управление тран-
спортными движениями манипулятора осуществляется при по-
334 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
мощи трех электромеханических приводов Д, Z = 0, 1, 2, каждый
из которых содержит линейный электродвигатель постоянного то-
ка с независимым возбуждением [231] и редуктор. Привод Do
управляет поворотом платформы, статор электродвигателя и кор-
пус редуктора этого привода закреплены на неподвижном основа-
нии. Приводы D2 управля-
ют соответственно поворотом
звена 1 руки относительно плат-
формы и звена 2 относительно
звена 1. Статоры электродвига-
телей и корпусы редукторов
приводов Z>i, D2 жестко связаны
с платформой и звеном 1 руки
манипулятора соответственно.
Для простоты расчетов пред-
полагается, что оси вращения
роторов электродвигателей и
оси выходных валов редукторов
приводов Z>i, D2 совпадают
с осями шарниров О2 соот-
ветственно; оси вращения рото-
ров электродвигателей суть их
главные центральные оси инер-
ции, которые также яв-
ляются осями динамиче-
ской симметрии. Предполагается также, что с достаточной сте-
пенью точности звенья руки можно считать тонкими прямолиней-
ными стержнями (не обязательно однородными), расположенны-
ми во вращающейся (вертикальной) плоскости л, перпендикуляр-
ной осям шарниров О2, в этой плоскости лежат также центры
инерции роторов электродвигателей D2. Инерционностью ре-
дукторов пренебрегается. Ориентационные движения груза, осу-
ществляемые посредством поворота схвата манипулятора относи-
тельно звена 2 руки, в работе не рассматриваются.
Для описания движения введем две прямоугольные системы
координат Oxyz и Ox'y'z с общим началом О и осью Oz, совпа-
дающей с осью вращения платформы (и вертикальной плос-
костью л). Система координат Oxyz неподвижная, a Ox'y'z жест-
ко связана с платформой, координатная плоскость Оу'z совпадает
с плоскостью руки манипулятора. Обозначены через <р0 — угол
поворота системы координат Ox'y'z относительно Oxyz (угол по-
ворота платформы), ср! — угол между первым звеном и осью Оу'
(угол поворота первого звена руки относительно основания), ср2—
угол между звеньями руки манипулятора, а — расстояние от оси
вращения платформы до оси шарнира L= I OiO2l — длина пер-
вого звена, Zi — расстояние от оси шарнира О{ до центра масс
первого звена, 12 — расстояние от оси шарнира О2 до центра масс
§ 5. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ МАНИПУЛЯТОРОВ
335
второго звена, g — ускорение силы тяжести, Zo — момент инерции
платформы относительно оси ее вращения, Zt, Z2 — моменты инер-
ции первого и второго звеньев относительно осей, проходящих
через точки О2 и перпендикулярных соответствующим стерж-
ням, Jo — момент инерции ротора электродвигателя привода Z)o
относительно оси его вращения, «Z(i2) — моменты инерции
роторов электродвигателей приводов D2 соответственно отно-
сительно осей их вращения, J(2\ — центральные моменты
инерции роторов электродвигателей приводов Dly D2 соответствен-
но относительно осей, перпендикулярных осям шарниров Oi, О2,
т2 — массы электродвигателей приводов Du D2 соответственно,
Ми М2 — массы первого и второго звеньев руки манипулятора со-
ответственно. Вводятся параметры, характеризующие привод Di
(i = 0, 1, 2): rii — передаточное число редуктора привода, щ —
момент электромагнитных сил, приложенных к ротору электро-
двигателя относительно оси его вращения, Li — коэффициент ин-
дуктивности обмотки ротора электродвигателя, Z?t — электрическое
(омическое) сопротивление обмотки ротора электродвигателя,
ki — коэффициент пропорциональности между электрическим то-
ком ji цепи ротора электродвигателя и моментом цг действующих
на него электромагнитных сил, щ — электрическое напряжение,
подаваемое на вход электродвигателя.
Для вывода уравнений движения механической системы ро-
бота используется метод Лагранжа. Кинетическая энергия меха-
нической системы равна
Е = */2 Moo + в cos2 <Pi + с cos epi + Z2 cos2 (epi + cp2) +
+ D cos (cpx + cp2) + 2F cos cpx cos (cpx + cp2)] cpo +
+ V2M11 + 2Z7 coscp2)cpi + 112А22^ +(Я12+ Fcoscp^cp^,
*4 00 = $0^0 J2 J"22^ 4" "b + M2 + + ^2) ^2>
( .5.1)
В = Zx + (M2 + m2) L2, C = 2a [Mrlr + (M2 + m2) A],
D — 2M2al2, F = M2Ll2,
-4ц = + «Ji2) + 1\ + Z2 + (M2 + m2) L?,
A22 = + Z2, Л12 = Л2)п2 + Z2.
Потенциальная энергия сил тяжести равна
П = g [MJi + (М2 + т2)L\ sin + gM2l2 sin (cpi + <p2). (9.5.2)
Движения манипулятора в рамках принятой модели описыва-
ются системой механических уравнений Лагранжа [76]
d дЕ дЕ дП , А . п
~ ~ + ”‘И<’ ,-0'1'2' 0-5-3)
336 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
и уравнений баланса напряжений в цепях роторов электро-
двигателей
Li + Rih + kin^i = щ, i = 0, 1, 2. (9.5.4)
Здесь ji — ток в цепи ротора электродвигателя i-ro привода.
Используя соотношение ц» = [231], уравнение (4) приводится
к виду
А + kln^i = км, i = 0, 1, 2. (9.5.5)
Из (1), (2) следует, что уравнения (3) имеют вид
Аоофо + /о (ср, ср, ф) = ПоЦо,
Лиф! + Al2q2 + fl (ср, ф, ф) = И1Ц1, (9.5.6)
А 12ф1 + Л22ф2 + /г (ф, ф, ф) = 7*2^2,
где символами /Дф, ф, ф), г = 0, 1, 2, обозначены нелинейные чле-
ны соответствующих уравнений. Функции Д зависят от обобщен-
ных координат ф1э ф2, обобщенных скоростей ф0, фи ф2 и ускоре-
ний фо, ф1, ф2.
2. Постановка задачи оптимального управления. Для системы
(5), (6) ставится следующая задача синтеза оптимального по
быстродействию управления. Найти зависимости управляющих
напряжений и» = иг(ф, ф, ц), f = 0, 1, 2, от фазовых координат
Ф = (фо, Ф1, Ф2), Ф, ц = (цо, Ц1, Цг) рассматриваемой электромеха-
нической системы, которые обеспечивают приведение манипуля-
тора за минимальное время Т из произвольной точки некоторой
области допустимых начальных состояний в заданное конечное
положение с торможением движения в конце процесса:
Фг(Л = фг> Фг(П = О, Цг(Т) = О, i = 0, 1, 2. (9.5.7)
На управляющие напряжения наложены ограничения [231]:
\ui(t)\ г = 0, 1, 2. (9.5.8)’
После перехода к новым безразмерным переменным
t = t[ Т *, = YlityiT Ац* U>i = Ui/Ui,
= АиЬ,/(к^и,Т1\ R\ =
к^к^ЩТ*),, 4 = 0, 1,2, (9.5.9)
§ 5. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ МАНИПУЛЯТОРОВ
337
с последующим опусканием штрихов уравнения (5), (6) и огра-
ничения (8) принимают вид
Zigi + + kityi = Ui, i = 0, 1, 2;
фо + /о (ф, ф, ф) = Цо (ф = (фо, Ф1, фг) ) ,
. .. (9.5.10)
Ф1+(Л1а/Л11)ф2 + /1(ф, <р, ф)=Ц1,
ф2+(Л1а/Л22)ф1 + /2(ф, ф, ф)=М'2.
В замене (9) Т* — принятое за единицу измерения характерное
время рабочей транспортной операции, осуществляемой манипу-
лятором, которое может быть конструктивно оценено (см. далее).
Нужно отметить, что фазовые переменные системы (10) суть
фъ фи Щ i = 0, 1, 2. Если управления u,, i = 0, 1, 2 известны как
функции времени и (или) фазовых координат, то для однознач-
ного решения системы дифференциальных уравнений (10) не-
обходимо в некоторый момент времени задать начальные значе*
ния углов поворота звеньев манипулятора, угловых скоростей и
моментов (или токов в обмотках роторов электродвигателей в си-
лу соотношений |ii = A\A)- Физически необходимость задания на-
чальных значений моментов (токов) объясняется ненулевой ин-
дуктивностью обмоток роторов электродвигателей, которая обу-
словливает возможность токов (сравнительно быстро затухаю-
щих) в обмотках роторов при нулевых значениях управляющих
напряжений. В большинстве практических случаев естественно
задавать нулевые начальные значения моментов электромагнит-
ных сил, если движение начинается из состояния покоя
(ф<(0) = 0, i = 0, 1, 2). В дальнейшем предполагается, что рабо-
чие углы поворота платформы и звеньев руки манипулятора суть
величины порядка единицы (ср£~ 1). Тогда для безразмерных
переменных и параметров (10) выполняются следующие соотно-
шения порядков: ~ 1, ц< ~ 1, ср, ~ 1, <р£ ~ 1. В дальнейшем пред-
полагается, что Li < Ri. В терминах исходных размерных физиче-
ских параметров последнее неравенство означает, что времена
Ti = LJRh f = 0, 1, 2 установления токов в цепях электродвигате-
лей много меньше времени Т* рабочей операции. Это предполо-
жение выполняется практически для всех типов современных
промышленных манипуляционных роботов.
3, Приближенный синтез оптимального управления. Рассмат-
ривается случай, когда параметры системы (10) удовлетворяют
следующим сильным неравенствам:
I/J < 1, i = 0, 1,2; Л12<СЛИ, Л12<сЛ22,
имеющим место, если постоянные слагаемые диагональных эле-
ментов матрицы квадратичной формы кинетической энергии (1)
22 л. Д. Акуленко
338 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
много больше всех других слагаемых. Такие соотношения типич-
ны для ряда современных промышленных манипуляционных ро-
ботов антропоморфного типа. При этих предположениях система
уравнений (10) записывается в виде
eL? рц + + k^i = щ, | щ | 1; (9.5.11)
ф, = р, +еЛ(ф, ф, ф); (9.5.12)
е <С 1, 0<7?гСЛ, 0<&2d, i = 0, 1, 2,
R~l, к~1, L?~l, Fi-1
и с математической точки зрения представляет систему сингуляр-
но и регулярно возмущенных дифференциальных уравнений с
малым параметром при старших производных [67, 135, 158, 199].
В нулевом приближении (е = 0) вырожденная система уравнений
(11), (12) распадается на три несвязанные системы второго
порядка:
+ А\фг- = Ui, I Ufl С1;
(9.5.13)
фг = 1 = 0, 1, 2.
Уравнения (13) удобно представить в виде трех скалярных диф-
ференциальных уравнений второго порядка:
Ritpi + kityi = Ui, luj < 1, i = 0, 1,2. (9.5.14)
Таким образом, в нулевом приближении отсутствует взаим-
ное влияние движений, отвечающих различным степеням свободы.
Далее, на основе [61] (см. § 1), строится синтез оптимальных
управлений для систем второго порядка, описываемых каждым
из уравнений (14), приводящих указанные системы из произволь-
ного начального состояния в состояние (7) при ограничениях
(10) за минимальное время. Поскольку функции щ входят в
уравнения (14) линейно, то в силу принципа максимума [180]
оптимальные управления и? релейны и имеют вид и% =
= sign 4^*2 (фг, Фг)- Корни характеристических полиномов уравне-
ний (14) вещественны (Хи = 0, Xi2 = —Аг/7?г), и, следовательно,
каждое из управлений и? имеет не более одной точки переклю-
чения на оптимальной траектории [61]. Отсюда вытекает, что
в общем случае оптимальная траектория на фазовой плоскости
(фг, фг) уравнения (14) состоит из отрезков двух фазовых кри-
вых, одна из которых отвечает значению Ui = +i, а другая —
щ = — 1. Один из отрезков фазовых кривых, составляющих опти-
мальную траекторию, проходит через конечную точку (фГ, 0).
Кривая переключения оптимального управления Ч\(фг-, фг) = 0
состоит из двух полутраекторий, приводящих изображающую
§ 5. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ МАНИПУЛЯТОРОВ
339
точку уравнения (14) в состояние (фГ, 0) при иг=—1 и иг=+1.
Общее решение уравнения (14) при нг = const имеет вид
фг = (Ui/ki) (t — т) +
+ (Ri/ki) (Ui/ki — (Ого) (exp [—(&г/7?г) (t — т)] — 1) + фю, (9.5.15)
срг = щ/ki — (ujki — сого)ехр [— (ki/Ri) (t — t)].
Здесь ерю, сою — значения переменных срг, фг- соответственно в неко-
торый момент времени t = т.
Исключение времени t из соотношений (15) приводит к урав-
нению семейства фазовых кривых уравнения (14) при щ = const
(величины cpio? (Ою — параметры указанного семейства):
R. и. — /г-ср- 7?.
<Pi = <РгО — щ -у In _ (со,о - <Pi) (9.5.16)
Уравнение (16) инвариантно относительно следующей замены
фазовых переменных и параметров: -> —нг, сог0 — сог0, фг -> —ф{.
Отсюда вытекает, что семейства фазовых траекторий, отвечающих
значениям управляющей величины щ = +1 и Ui = —1 симметрич-
ны относительно начала ко-
ординат. Ограничимся поэто-
му только исследованием
траекторий, соответствую-
щих и{ = +1. Поскольку вы-
ражение, стоящее под зна-
ком логарифма, должно быть
положительным, из (16) сле-
дует, что на любой фазовой
траектории семейства выпол-
няются неравенства ф< < 1//сг,
(Dio < 1/ki ИЛИ. (pi > 1/fci, СОю >
> 1/к(. Из выражения для
производной функции (16)
по срг- d^i/d^i = Rify/(1 — kitfi)
при Ui = +i следует, что в
области срг < 1/ki, сог0 < 1/fci
ФУНКЦИЯ ф1(фг) монотонно
тонно возрастает при фг >
убывает при <р< < 0 и моно-
0; в области ср» > 1/А<, coi0 > 1/ki
функция фг(фг) монотонно убывает. Кривые семейства (16) име-
ют асимптоту q)i = l/ki, причем прямая фг-= 1/Л?г- также является
фазовой траекторией уравнения (14) при Ui = +1, отвечающей
стационарному вращению соответствующего звена манипулятора
с постоянной скоростью. На рис. 9.5 изображены фазовые кривые
22*
340 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
уравнения (14), отвечающие значению нг = +1. Стрелками по-
казано направление движения изображающей точки.
Анализ фазовых кривых показывает, что единственной полу-
траекторией, приводящей изображающую точку системы (14)
в заданное состояние фг = сргЛ (р< = 0 при Ui = +1, является
кривая
Фг = —2[ln(l — Ajtpi) + Лгф,], ф»<0. (9.5.17)
В силу отмеченной центральной симметрии семейства фазовых
траекторий, отвечающих нг=+1 и щ = —1, единственной полу-
траекторией, приводящей изображающую точку в состояние
фг = фГ, фГ = 0 при Ui = —1, является кривая
Фг = фТ + Rih 2[1п(1 + ^фг) — А:{фг], ф.;>0. (9.5.18)
Уравнения (17), (18) в совокупности задают кривую переклю-
чения оптимального управления, которая изображена на рис. 9.5.
Оптимальное по быстродействию управление системой (14) имеет
вид
и° = signYi (фг, фг), ^(фг, ф0¥=0; « = 0,1,2,
И?= + 1, Тг(фг, фг) = О, ф; < 0; (9.5.19)
«• = — 1, Y; (ф{, ф{) = 0, ф; > 0;
(фг, фг) == (р? — фг + ^/с~2 [In (1 + h | фг | ) — | ф; | ] Sign ф{.
Соответствующее этому управлению минимальное время приве-
дения системы (14) из произвольного начального состояния
(фг, фг) в заданное конечное состояние фг = фГ, ф« = 0 (функция
Веллмана рассматриваемой задачи оптимального управления для
г-й степени свободы манипулятора, г = 0, 1, 2) вычисляется по
формулам:
(фг? фг) =
Т-1п
(1 + ^гТгфг)
*+0i(Tp Фг)
1 - 0г (ФрФг)-Г
0г (фг, фО = [!-(!+ hViQi) exp {h-Ri (фГ - ф{) — МгфО]1/2,
у( = —sign Тг(фг, фг), Тг(фг, фг)¥=О, (9.5.20)
Уг = +1, Тг(ф>, фг) = 0, фг =С О,
7г = —1, Тг(фг, фг) = О, фг > 0.
Функция Веллмана (20) вычисляется стандартным способом
(см., например, [61, 62] и § 1). Сначала рассчитывается время S<
§ 5. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ МАНИПУЛЯТОРОВ
341
движения изображающей точки из исходного положения (<р<, ср/)
на фазовой плоскости вдоль фазовой траектории, отвечающей
управлению (19), до пересечения с кривой переключения. Затем
вычисляется время в< движения по кривой переключения до точ-
ки назначения (<рГ, 0), полное время Т< = 5\ + 0<. Для определе-
ния величин S{, Qi используется вторая формула (15).
Следует отметить некоторые предельные случаи. Из (19),
(20) вытекает, что
Vj (ф|г фг) -» фГ — фг, Л (фг, фг)I Фг^ — Фг I *г. (9.5.21)
1, i = 0, 1, 2;
(фг, фг) фГ — фг “ ^г^гф? Sign ф;,
Л(фгг ф{)->^1 (?гфг + 2[^i — Тг(фгГ —фг)^гГ1]1/2|> (9.5.22)
Rt ~ 1, к, -> 0, I = 0, 1, 2.
Случай (21) имеет место, когда характерное время 0, =
=AiiRinY2kY2 установления стационарного значения угловой
скорости ротора электродвигателя i-ro привода много меньше
времени рабочей операции. В пределе (при -> 0) это соответ-
ствует кинематическому управлению степенью свободы, отвечаю-
щей обобщенной координате ср< (обобщенная скорость ср< пропор-
циональна управляющей величине щ, см. (14)). Этот случай со-
ответствует картине, представленной на рис. 9.3. Случай (22)
реализуется, когда, наоборот, время установления стационарного
значения угловой скорости ротора электродвигателя привода
много больше времени рабочей операции. В пределе (при -> 0)
уравнение (14) формально совпадает с уравнением прямолиней-
ного движения материальной точки, управляемой приложенной
к ней силой. Предельный переход (22) приводит к известным
выражениям для кривой переключений оптимального управления,
картине синтеза и функции Веллмана задачи оптимального по
быстродействию управления движением материальной точки при
ограниченном модуле силы [180].
Следует отметить, что формула (20) выражает минимальное
время, необходимое для приведения манипулятора в заданное ко-
нечное состояние по одной (Z-й) степени подвижности. Мини-
мальное время приведения всей системы в требуемое положение
с торможением движения в конце процесса, очевидно, равно
Т = Т (<р°, Ф°) = maxi Ti (ф?, <p?), i = 0, 1, 2.
4. Оценка тепловых потерь в электродвигателе. Одной из суще-
ственных характеристик режима работы электропривода являет-
ся количество «джоулевой» теплоты, выделяющейся в об»мотке ро-
тора электродвигателя при прохождении в ней электрического
342 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
тока. Известно [231], что количество теплоты q, выделяющееся
в проводнике в единицу времени, равно q = /27?, где / — сила то-
ка, R — омическое сопротивление проводника. Используя соотно-
шение jLii = kiji, связывающее ток в обмотке ротора электродвига-
теля привода Di с величиной момента электромагнитных сил, по-
лучим (в исходных размерных переменных) следующее выраже-
ние для количества теплоты, выделяющейся в единицу времени
в обмотке ротора электродвигателя Z-го привода:
Qi = PiRi/kt i = 0, 1, 2. (9.5.23)
При переходе к безразмерным переменным (9) величина пре-
образуется по формуле Qi = Qi,T2Jа соотношение (23) при-
нимает вид (штрихи опущены)
q, = i = 0,1,2. (9.5.24)
Подставляя щ из (11) при е = 0 в (24), можно получить вы-
ражение
?< = (и<-^Ф02/(ЛЛ), i = 0, 1,2. (9.5.25)
Во избежание сильного перегрева и перегорания обмотки двига-
теля допустимая величина д» ограничивается сверху (Qi^Qi\
что приводит к ограничениям на угловые скорости движения
звеньев манипулятора и на допустимые значения входных на-
пряжений:
/ = 0,1,2. (9.5.26)
Для прикладных целей важно оценить мощность тепловыделе-
ния qt (25) каждого привода при транспортных движениях мани-
пуляционного робота. Предполагается, что при выполнении робо-
том транспортных операций в начальный и конечный моменты
времени вся система находится в состоянии покоя (ср* = 0). Из
анализа фазовых траекторий системы (14) при управлении (19)
и формулы (25) вытекает следующая зависимость величины qt
от времени:
& (0 = (1 — | фг I )2/(&г#г), 0 < t < t*,
(9.5.27)
Qi (0 = (1 + &г I Фг | )2/(Мг), < Л Z = 0, 1, 2.
Здесь — момент переключения управления. Если в начальный
(t — О) и конечный (t = Т) моменты времени фя = 0, то |ф<1 < i/kt
для всех 0 С t Т, причем величина |ф<| монотонно возрастает
на интервале 0 t < t* и монотонно убывает при < t < Т.
Отсюда и из (27) вытекает, что минимальное и максимальное
§ 5. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ МАНИПУЛЯТОРОВ
343
значения величины g<(t) соответственно равны
(?i)min = (1 — &г | фг (^*) | )2/(^г^г)» 0 t Г,
(Зг)шах = (1 + Ш* (Q 1 )2/(Мг), J = 0, 1, 2,
I <Pi (<*)J= кТ'11 — ехР (— kiRT11 <рТ — ф? | )]1/2
и справедлива двусторонняя оценка мощности тепловыделе-
ния qt(t):
[1 — [1 — ехр(— к]НТг\ц>1 — ф?|)]1/2}2<^-йг9г<
< {1 + [1 _ exp (- W I фГ - Ф? I )]1/212 < 4. (9.5.28)
Далее, из (28) следует, что если максимально допустимая
мощность тепловыделения 4/(^7?г), то ограничение (26)
выполняется для любых значений ср?, фГ. С другой стороны,
из (27) вытекает, что ^г(0)= ^г(Г)= 1/(/сг7?г) и, следователь-
но, если q\ < 1/(^7?^, то управление (19) не удовлетворяет
ограничению на мощность тепловыделения ни при каких значе-
0 т
ниях начальных <р$ и конечных <р$ углов поворота звеньев мани-
пулятора.
5. Замечания.
5.1. Обычно для промышленных манипуляционных роботов
величины допустимых углов между звеньями ограничены;
фГ фг фЛ Эти ограничения обусловлены конструкцией мани-
пулятора (например, наличием жестких упоров). Для програм-
мных транспортных движений, когда в начале и в конце процес-
са система покоится, управление (19) обеспечивает удовлетворе-
ние неравенств ф; Ф; Ф1 , если начальные <pi и конечные <р$
значения углов между звеньями являются допустимыми. Это сле-
дует из вида фазовых траекторий системы (14) при управлении
(19), которые изображены на рис. 9.5. Из вида фазовых кривых
также следует, что если фГ < ф?, фГ < фЛ i = 0, 1, 2, то опти-
мальная программная фазовая траектория принадлежит допусти-
мой области вместе с некоторой окрестностью. В этом случае при
малых возмущениях программной траектории, например вслед-
ствие слабых ударов во время движения, управление в форме
синтеза (19) обеспечивает приведение системы в заданное конеч-
ное состояние без нарушений наложенных ограничений.
Для практики важно более детально изучить вопрос об обла-
сти практической применимости оптимального управления в фор-
ме синтеза (19). Пусть кроме ограничений на углы поворота
фГ Фг Ф1" наложены ограничения (26) на мощность тепло-
выделения в обмотках роторов электродвигателей, а также уело-
344 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
вия >0 при ф| «= <рГ или ф, 0 при фi = ф*. Последние со-
отношения будем называть условиями безударности движения,
так как их нарушение приводит к ударам, если манипулятор
имеет упоры, ограничивающие углы поворота звеньев. В соотно-
шениях (26) предполагается, что Qi > поскольку
в противном случае управление (19) не обеспечивает приведение
манипулятора в заданное конечное положение с торможением
движения в конце процесса без нарушения ограничений (26)
(см. п. 4). Из вида фазовых кривых системы (14) при управле-
нии (19) следует, что условия безударности движения удовлетво-
ряются, если (ф£, ф<)^2<, 1, где
= (фг. фг' фг < Ф1 < фг* + бг*1. фг > 0;
Фг + 6г,1<ф1 <ф*.
Фг < 0).
S*1 = ± Ri^i 2 [In (1 ± ki(pi) + АчЧЧЬ
i = 0, 1, 2.
Область i схематически представлена на рис. 9.6 (заштрихо-
вана) в случае фГ = 0.
Из характера поведения фазовых кривых системы (14) при
управлении (19) вытекает процедура построения области Si|2 на
фазовой плоскости (фг-, ф<),
обеспечивающей удовлетво-
рение ограничения на мощ-
ность тепловыделения в об-
мотке электродвигателя для
движений, начинающихся в
любой точке указанной об-
ласти. Проводятся прямые
Фг = ± Т (tiRi/ktY12, or-
L раничивающие допустимые
значения угловых скоро-
стей согласно (26). Если
< 2, то через
точки пересечения указан-
ных прямых с участками
переключения оптимального
управления, отвечающими
Ui = — 1 и щ == +1, проводятся
фазовые траектории 1\, Г2 для значений управления щ = +1 и
ut = —1 (соответственно). Множество точек фазовой плоскости,
ограниченное кривыми Г1? Г2 и отмеченными выше прямыми,
и есть область Si, 2 (показана на рис. 9.6 двойной штриховкой).
§ 5. ПРИБЛИЖЕННЫЙ СИНТЕЗ ДЛЯ МАНИПУЛЯТОРОВ
345
Аналитическое выражение для области 2 имеет вид
5^2 — {Фг? Фг* 6j,2 Фг фг ^г Фг “Ь
-2
1 ±
1п (2 — а.) *i<Pi ’
«г = - Uki + (д?7?г/^)1/2, i = 0, 1, 2.
Если а<>2, 1 = 0, 1, 2, то
Si, 2 = {фй ф<: —«г фг =С + coj.
Множество Si на фазовой плоскости (фг, ф,), удовлетворяющее
всем наложенным ограничениям, очевидно, есть 5г = 5», i П Sir 2.
На рис. 9.6 это множество совпадает с областью Sit 2.
5.2. После того как под действием управления (19) угловая
координата фг примет требуемое значение Фг(^г) = фГ при ну-
левой угловой скорости (практически попадает в достаточно ма-
лую окрестность конечного положения при малом значении |ф/1),
желательно, чтобы величина Фг = фГ в дальнейшем сохранялась
в отсутствие напряжения на клеммах электродвигателя при-
вода Di. Для этого необходимо предусмотреть возможность арре-
тирования отдельных степеней свободы манипулятора. Это может
быть обеспечено применением специальных тормозных устройств
или необратимых передаточных механизмов (типа червячных).
В противном случае часть обобщенных координат (углы фь ф2
для модели манипулятора) при нулевом значении управляющего
напряжения будет «уходить» от номинального значения вслед-
ствие постоянного действия силы тяжести. Для поддержания
в этом случае величин угловых координат вблизи номинальных
значений потребуется периодически включать электромеханиче-
скую систему управления, что приведет к неоправданному рас-
ходу энергии и перегреву обмоток роторов электродвигателей.
5.3. Наличие малых регулярных возмущений порядка 8,
а также возмущений, неучтенных в уравнениях (И), (12) на
интервале времени Т ~ 1, приведет к малой погрешности поряд-
ка 8 по времени быстродействия, фазовой траектории и точности
позиционирования. В малой окрестности конечного положения
следует предусмотреть режим стабилизации [126, 130, 145, 179,
182, 183, 191].
Сингулярные возмущения в системе (11), (12) для более точ-
ного решения задачи оптимального быстродействия требуют уче-
та погранслоев в начале и в конце процесса управления [68]. Это
потребует весьма высокого быстродействия системы управления
и системы измерений. Повышение точности позиционирования,
как и выше, может быть обеспечено дополнительным режимом
346 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
стабилизации. На рис. 9.7, 9.8 приведены типичные картины по-
ведения проекций.фазовых траекторий на плоскость (ср, ср) воз-
мущенной системы (И), (12), после подстановки приближенного
синтеза (19). Рис. 9.7 соответствует ситуации, когда 7?г, кг ~ 1
(платформа, i = 0), а рис. 9.8 — 7?, 1, кг ~ 1 (звенья, i = 1, 2)
и управлению (21).
5.4. Дальнейшее уточнение электромеханической модели ма-
нипулятора требует учета таких возмущающих факторов, как не-
идеальность (податливость) конструкции (см. § 6), наличие су-
хого и вязкого трения в шарнирах (редукторе), инерционности и
упругости редуктора, влияние внешних воздействий (вибраций);
требуется уточнение электрических цепей и учет влияния систе-
мы управления, в частности запаздывания в выработке управляю-
щих напряжений; необходим также учет ограничений различного
характера (конструктивных, технологических и др.).
§ 6. Управление транспортными движениями нагруженного
манипулятора с учетом упругости конструкции
1. Электромеханическая модель упругого двузвенного мани-
пулятора. Исследуются управляемые пространственные движения
антропоморфного манипулятора с упругими звеньями (рис. 9.9).
Перемещаемый груз G считается материальной точкой массой т.
Учет упругости конструкции — звеньев и редуктора — проводится
§ 6. УПРАВЛЕНИЕ МАНИПУЛЯТОРОМ G УЧЕТОМ УПРУГОСТИ
347
в так называемом квазистатическом приближении [25, 33, 124,
139, 152, 242]. Этот случай отвечает безынерционным звеньям и
редукторам двигателей.
Для вывода уравнений движения груза используется принцип
Лагранжа, аналогично § 5. Кинетическая энергия К груза G и
потенциальная энергия упругих деформаций стержней (звень-
ев) П равны
Х = 72тпг2, r = r0(a) + u, т = (х, у, z),
П = V2(C(a)u • и), и = (их, иу, uz).
Здесь г — радиус-вектор груза; и — упругое смещение, обуслов-
ленное податливостью звеньев; матрица жесткости упругого дву-
звенника обозначена через С (а) [33, 151], совокупность углов
а = (а0, ai, а2), где —углы в шарнирах (приводах), определя-
ет манипулятор с жесткими
звеньями, т. е. радиус-вектор г0(а)
(см. рис. 9.9). Следует отметить,
что матрица С (а) при а0 = 0, л
имеет особенность. Это связано
с потерей степени свободы упру-
гого манипулятора.
Кинетическая энергия Ki каж-
дого привода Di заключается во
вращении якоря (ротора) двигате-
ля, а потенциальная энергия П —
в упругой деформации механизма
редуктора; они равны
Кi = */2*7гф? = /2^г (фг ^г^г) ’
1 = 0, 1, 2. (9.6.2)
Здесь ф/ — углы поворота роторов (якорей) двигателей Di, Ji —
моменты инерции относительно осей вращений, п, — коэффициен-
ты редукции (обычно ^>1), ki — коэффициенты упругости ре-
дукторов. Кинетическая энергия движения двигателя D2 в инер-
циальном пространстве обычно является пренебрежимо малой.
Выражения для работы внешних сил на виртуальных перемеще-
ниях имеют вид
6Л=(Р-6г), бЛ = цгбфй i = 0, 1, 2, (9.6.3)
где F — вектор внешних сил, приложенных к грузу, цг- — моменты
электромагнитных сил, определяемые ниже. Считается, что функ-
ция F известна и удовлетворяет требуемым условиям гладкости
и ограниченности.
Уравнения движения груза и якорей двигателей определяются
стандартным образом на основе выражений (1) — (3). Учет кине-
матической связи (1) позволяет взять в качестве обобщенных
348 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
координат переменные г, или г, и, или а<, и (f = 0, 1, 2). Связь
между бесконечно малыми перемещениями имеет вид
2
бг = 2 &Ч + би. (9.6.4)
i=o dai
В случае необходимости предполагается, что линейная система
(4) разрешима относительно ба< в рассматриваемой области из-
менения переменных af, т. е. матрица (дг0/да) невырожденна.
Далее для описания движения берутся переменные г, oti, (pi, урав-
нения Лагранжа запишутся в виде
тг == F — С (а) (г — г0 (а)),
(С (а) (г — г0 (а)) drjdai) — 72 (дС(а)/доь (г — г0 (а)) • (г — г0 (а))) +
+ kiUi (Ф< — гцва) = 0, (9.6.5)
Лср< + ki(ф< — п&) = pit, i = 0, 1, 2.
Первое векторное уравнение (5) описывает движение груза, три
последующих — конечные уравнения равновесия упругих элемен-
тов; последние три уравнения описывают вращения якорей дви-
гателей.
Уравнения электрических цепей для якорей двигателей и об-
моток возбуждения определяют электромагнитные моменты р,<
аналогично § 5:
ДА + RJ. + Ф<Ф< = Ui9 = ФЛ i = 0, 1, 2. (9.6.6)
Здесь It — токи, Ui — напряжения, Lt — индуктивности, 7?< — оми-
ческие сопротивления, = —магнитные потоки, соз-
даваемые токами возбуждения Д, — коэффициенты взаимной
индукции. Величины Ф< считаются постоянными, т. е. влиянием
токов Ц в обмотках якорей Dt на токи возбуждения Ц пренебре-
гается, и значения I г считаются установившимися. Не учитыва-
ются механические потери при вращении осей и шарниров. Если
коэффициенты уравнений (5), (6), функции F, Ut и начальные
условия для переменных г, г, ф£, Ф< заданы, то электромеханиче-
ские движения системы полностью определены.
Моменты сил ЛА па выходе шарниров равны
Mi = ЗП/За< = — (С (а) (г — г0 (а)) • 5г0 (а)/да*) +
+ 1/2(5С(а)/За<(г-Го(а))-(г-го(а))), i = 0, 1, 2. (9.6.7)
Ha основе условий равновесия (5) и выражений (7) можно по-
лучить для величин Mt другие представления:
Mi = kiiii(q)f — n^i), i = 0, 1, 2. (9.6.8)
§ 6. УПРАВЛЕНИЕ МАНИПУЛЯТОРОМ С УЧЕТОМ УПРУГОСТИ
349
С помощью (8) уравнения (5) для вращений якорей перепишут-
ся следующим образом:
Лф< = щ “ Mi/ni, i = 0, 1, 2. (9.6.9)
Уравнения движения в виде (5) — (9) удобны для исследова-
ния различных предельных случаев: абсолютно жесткого редук-
тора (&г->°°), абсолютно жестких звеньев безынер-
ционной электрической цепи (Z< -> 0) и др. Нужно отметить, что
система дифференциальных уравнений для обобщенных коорди-
нат (г, и) или (а, и) будет вырожденной, поскольку между г, и, а
имеются конечные (недифференциальные) связи (1), (5). Поря-
док исследуемой системы (5) —(9), описывающей электромехани-
ческую модель манипулятора антропоморфного типа с безынер-
ционными звеньями и редукторами, равен 15; она содержит три
управляющих воздействия — напряжения [7:(^)е%. Как уста-
новлено в § 5, порядок дифференциальных уравнений манипуля-
ционного робота с жесткими элементами в более общем случае
инерционных звеньев меньше и равен 9. Это обусловливается ко-
нечной связью между и фь фг = ^«г, причем u(t) = O (см.
далее).
Задача управления движением системы (5), (6) ставится сле-
дующим образом: для заданных в момент времени t = t0 значений
переменных г, г, фг-, <ръ (f = 0, 1, 2) привести фазовую точку
при t = Т на некоторое множество оптимальным образом, т. е.
r(£0) = r°, r(Q = v°,
Фг (^о) = Фг> Фг(^о) = (йг» I (Jo) ~ I
Qk (Z, г, г, ф, ф, I) |т = 0, Ф [U] -> min, (9.6.10)
и&и
ф = (фо, фи фг), / = (/о, Л, Л), U = (UQ, Uh U2)
(г = 0, 1,2, * = 0,1, **<15).
Здесь T — момент времени, фиксированный или определяемый
в процессе решения задачи управления и оптимизации, Ф —
функционал, характеризующий качество управления движениями
системы (5), (6). В частности, функции Qh\T могут определять
фиксированную точку, например точку покоя, а Ф = Т — время
быстродействия. Управляемая система может быть подвергнута
фазовым ограничениям, геометрическим, по мощности и др.
(см. § 5).
Следует отметить, что система уравнений движения (5) суще-
ственно нелинейна, что обусловлено геометрической нелиней-
ностью. Уравнение для г имеет смысл, аналогичный уравнениям
для колебательных систем с управляемым положением равно-
350 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
весия Го (ос), рассмотренным в гл. 5 приближенно при помощи ме-
тодов усреднения. При выполнении ряда упрощающих предполо-
жений к системе (5), (6) применимы развитые в гл. 1—5 приемы
асимптотического решения задачи управления вида (10). В об-
щем случае требуется привлечение численных методов.
2. Некоторые предельные случаи.
2.1. Пусть редукторы близки к абсолютно жестким, т. е.
ki -> о©. Тогда в пределе между переменными фг и аг имеет место
простая конечная связь: срг- = пгаг, Z = 0, 1, 2. Если /сг асимптоти-
чески велики, т. е. 1/Аг — малые параметры, то формально систе-
ма (5) является сингулярно возмущенной. Уравнения движения
в первом приближении по параметрам \/к{ при помощи (5) —(9)
приводятся к виду
mr = F — С (а) (г — г0(а)), а =
~ (Г’ а)’ фг = г = О, 1, 2, (9.6.11)
LJi + RJi + = Ui, |Лг = Фг/i.
Здесь для переменных берутся выражения (7) при а = (3. Сле-
дующий член асимптотических разложений получается из конеч-
ных уравнений (5):
j / dr (В) \
+ И(Р)(г-Го(Р))‘Т F
- ~ го(Р)>)]+ = (9.6.12)
и подставляется в первое уравнение (И) и выражения (7).
Таким образом, для системы (5) проводятся регулярные раз-
ложения; порядок системы (11) является максимальным и ра-
вен 15.
2.2. Пусть теперь звенья манипулятора обладают высокой
жесткостью; тогда в пределе при С -> можно пользоваться со-
отношениями (ft, ~ 1)
u^O, r = r0(a), at = At(r), (9.6.13)
C(a)и = - ((5r0(а)/да)Т)= - (Ят) -W.
Уравнения движения (5), (6) тогда записываются в виде
тпг = F — C(a)u, Лер» = Hi-Mi/nh f = 0, 1, 2,
LJi + RJi + Фгсрг = Ui, n,iki(q)i — ПгОп) ~ M<.
(9.6.14)
Здесь предполагается, что для г и Си подставлены выражения
(13). Следующий член асимптотического разложения векторной
§ 6. УПРАВЛЕНИЕ МАНИПУЛЯТОРОМ С УЧЕТОМ УПРУГОСТИ
351
величины Си получается при помощи выражений (7):
Си = - + !/2 (Ят)-1 (СаС-1 (7?T)“1M-C-1(Z?T)"1M) +
+ O(C~2) = f(a, М, С-1), и = С-1(а)/. (9.6.15)
Дифференцирование выражения r = r0(cz) + u с учетом (15)
позволяет записать первое уравнение (14) через переменные
с требуемой степенью точности по степеням С"1. Как и выше,
для системы (5), которая формально является сингулярно воз-
мущенной, удается проводить регулярные разложения. Порядок
системы (14) сохраняется и равен 15.
2.3. Система (5) оказывается, по существу, сингулярно воз-
мущенной, если величины II67II, /ц асимптотически велики. В пре-
деле получается система более низкого, девятого порядка
(см. § 5):
mr0(a) = F + (7?т(а) )"W, срг = ntat-, 0 <= [£0, Г],
= ni\jLi — Ji^ai, = Ф{/ъ i = 0, 1, 2,
LJi + + ъФ&г = Uh Ui %. (9.6.16)
Более точные разложения требуют учета погранслоев в начале
и конце процесса управления (см. § 4, 5).
2.4. Кроме того, система (5), (6) может быть сингулярно воз-
мущенной по параметрам Ц в уравнениях для переменных It.
В пределе при Д 0 ее порядок уменьшается на три. Выражения
для моментов сил щ принимают вид
щ = ФДСЛ-Фф)/7?г, ^0с[^ Т] (9.6.17)
и подставляются в уравнения (5), (9), (И), (14) или (16). При
таком подходе начальные условия для токов Zt не учитываются,
поскольку на практике переходные процессы в электрических це-
пях якорей происходят весьма быстро. Поэтому приближение (17)
часто используется при исследовании движений манипуляцион-
ных роботов с электромеханическими приводами.
2.5. Процесс управления системой (5), (6) можно разбить на
два этапа: 1) движение в малую окрестность заданного состояния
покоя и 2) коррекция. Начальное и конечное состояния покоя,
согласно (10), запишутся следующим образом:
г1о,т = ГО’Т» г1о,т = О (Zo = O),
<Pi |о,Г = <Р?’Т, <йо.т = О, Л|о>т = О, I = 0,1,2. (9-6Л8>
Предполагается еще, что внешние силы отсутствуют (FЕ 0),
а движение груза G является квазистационарным. Это допущение
будет выполняться, если управления достаточно малы, т. е.
Ui = EVi, где 8 — малый параметр, Vf ~ 1. Время Т процесса
352 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
управления будет при этом асимптотически большим (Т ~ е *).
С точностью до и2 система (5) с учетом (17) перепишется в виде
тг = (RT (а)) “ W, Mi = (cpf — п^),
Лф*+ Мф<“" П^)= Щ, |li = Фг(еУг — Фгфг)/7?г, (9.6.19)
(С (а) (г — г0 (а)) • дго/дщ) = —кгЩ (срг- — тад), i = 0, 1, 2.
Поскольку в реальных условиях звенья манипулятора и ре-
дукторы обладают достаточно высокой жесткостью, то малые и
плавные управляющие воздействия приведут к малым того же
порядка упругим отклонениям груза от траектории, описываемой
системой (16), (17). При сделанных допущениях движение си-
стемы в первом приближении описывается уравнениями
[m(drJdai)T (drjdai) + =
= П|Фг(еРг — Ф^а^/Яг, i= 0, 1, 2,
аг|о,7 = а?’т, а?.|0}Г = 0, |УЛ0|<П (9.6.20)
Приближенное по 8 решение задачи управления (20), близкое к
решению оптимального быстродействия, можно получить, по-
лагая постоянными управляющие функции Vi(t). С погреш-
ностью 0(e) по траектории и ОЦпе"1) по функционалу — време-
ни Т ~ 8”1 управления Vi можно взять в следующем простом
виде:
У. (t) = V- = const, I у‘.| < V°i, V* = (af - afi/eT,
re [О, Т], Т= max 7\, Т{ = | af - a? |/sV?. (9.6.21)
2=0,1,2
За время Т ~ 8”1 фазовая точка системы (20) придет в 8-окрест-
ность заданного значения. При этом фазовая точка исходной си-
стемы (5), (6) также будет находиться в 8-окрестности заданной,
согласно (18), конечной точки. Дальнейшая коррекция может
проводиться на основе регулярной методики аналитического кон-
струирования регуляторов [62, 130, 182] (см. § 2, 3). При таком
подходе оптимальный регулятор может строиться для фиксиро-
ванной конечной конфигурации манипулятора, т. е. при
dr0(a)/dai = dr0(aT)/<?ai. Детальное исследование поставленной
задачи управления должно проводиться с применением методов
математического моделирования. Изложенные подходы могут при-
меняться для оценок и построения начальных приближений.
3. Однозвенный манипулятор. Для выяснения особенностей за-
дач типа (5) — (10) и нахождения способов построения рацио-
нальных законов управления рассматриваются плоские движения
упругого нерастяжимого однозвенника (рис. 9.10). Упругости
звена и редуктора аналогично п. 2 учитываются в квазистатиче-
§ 6. УПРАВЛЕНИЕ МАНИПУЛЯТОРОМ С УЧЕТОМ УПРУГОСТИ
353
ском приближении. В линейном приближении по упругим дефор-
мациям исходные уравнения управляемого движения имеют вид
7П5 =—си (F^O), 5 = 50(a)+u, 50(a) = Za,
М + clu = О, М = кп (<р — тга),
.. (9.6.22)
Лр = ц — М/п, р = Ф/,
ы+ш+Фу = и, \и\^и°.
Здесь 5 — длина дуги, отсчитываемая от оси Ох, и — упругое сме-
щение, I — длина стержня; остальные параметры и переменные
(без индекса i) имеют тот же смысл, что и в пп. 1, 2. Введением
угловых переменных 7 = sl~l = а + и/l и р = ср/тг система (22)
приводится к виду линейной системы пятого порядка:
•• кп2, г/2
у + а2 (?-₽) = О, = ---2,
Г W 17 ml2 с? + кг?
Р„2 и/2
Р+&2(р_7) = й b2==*_JL^l (9623)
Jn cl + kn 4 '
p, + vpi + xj} = ew, \w(t) [ 1
(W==U/U\ v = R/L, % = пФ2/Ь, е = и°Ф/Ь).
В реальных механизмах передаточное число п ~ 102 — 104 и жест-
кость к достаточно высока; поэтому кп2 > cl2 и в выражениях для
а2, Ъ2 можно перейти к пределу: а2 =
= с/т, Ъ2 = cl2/ (Jn2), т. е. ограничиться
случаем абсолютно жесткого редуктора.
Характеристическое уравнение пятого
порядка, как и следовало ожидать, допус-
кает один нулевой корень:
A(X) = %5 + v%4 +
+ (a2 + b2 + dx)^3+v (а2 + b2)X2 + a2d& = 0.
(9.6.24)
Поэтому при система (23) допускает решение, равное по-
стоянной 7 = р = const, 7 = р = ц = 0. Дифференцированием она
приводится к одному уравнению пятого порядка; например, для
переменной 7 это уравнение имеет вид
^(5) ^(4) (^2 + £2 _|_ j + V (#2 + fc2) 7 +
+ a2d%7 = a2dew, [ w (t) [ 1, (9.6.25)
7(0) =7°, у(О) = у°,
7 (0) = a2 - -f), V(0) = a2 ([J0 - 7°),
7<*> (0) == a2dg° - a2 (a2 + b2) (p° - .
23 л, д. Акуленко
354 ГЛ. 9. ЗАДАЧИ И МЕТОДЫ ИССЛЕДОВАНИЯ НЕКОТОРЫХ СИСТЕМ
Для приложений представляет определенный интерес решение
задачи синтеза оптимального по быстродействию приведения си-
стемы (23) в заданное состояние покоя
7(Т) = Р(Г) = ^(=Н,
у(71) = р(7’) = (л(7’) = 0, min. (9.6.26)
|w| <1
Для уравнения (25) конечные условия имеют вид
у (Т) = f, 7 (Т) = 7(Т) = {(Г) = (Т) = 0. (9.6.27)
При постоянном управлении w = const, I id 1 установившееся
значение скорости у = ew/^ w ~ 1, а время поворота на угол
(vT —7°)~1 ПРИ установившемся значении скорости оценивается
величиной т = %/е. Далее вводится единица времени, равная
т: Их = 0 — безразмерное время. В безразмерном времени 0,
0 е [0, 0] уравнение (25) приводится к виду
e3^v + e2T)7IV + " + у' = w,
e3^r-5(a2de)-‘, e2r| = vx~\a2de)~l,
е£ = (а2 + Ь2 + dx) т-3 (a2 de) (9.6.2«)
x = v(a2 + b2)r2(a2de)-1, т = %/е, е<1.
Корни соответствующего (28) характеристического уравнения
(24) в общем случае имеют представления
^1,2,3 = 5 + М?2,3 + С . . . , Х1>2*3 0;
Х4 = Х(4о) + 8..., 40)<0; Х5 = 0,
где коэффициенты разложений имеют порядок единицы. В при-
кладных задачах параметры системы (22) или (23) удается реа-
лизовать такими, что еЕ(0, е0] — малый параметр, а £, ц,
% ~ 1. Таким образом, управляемая система (28) оказывается
сингулярно возмущенной и может быть представлена в стандарт-
ном виде (4.1) или (4.7):
х[=х2, х2 = у1 (^=у),
Wi = y2, ^У2 = Уз (У1 = У")^
&>Уз + г]Уз + &/2 + иУ1 + Х2 = W, (9.6.29)
X, (Т) = ут, х2(Т) = y^T) = у2 (Т) = у3(Т) = 0,
Г-* min, | w (t) | CJ 1.
w
Построение точного решения задачи синтеза (четырехмерной
гиперповерхности переключений в пятимерном пространстве
(х, у)) представляет весьма трудную проблему. Еще более за-
§ 6. УПРАВЛЕНИЕ МАНИПУЛЯТОРОМ С УЧЕТОМ УПРУГОСТИ
355
труднительна реализация синтеза управления сингулярно возму-
щенными переменными. Приближенное по е решение получается
при помощи подхода § 4. Для данной задачи (29) соответствую-
щая ей вырожденная имеет вид
хг = х2, их2 = —х2 + 1^(01^1- (9.6.30)
Решение задачи оптимального быстродействия для системы (30)
строится согласно [61, 180] и может быть представлено в форме
(1.22) или (5.19). Картина синтеза приведена в § 5. Движение
фазовой точки (я, у) в пятимерном пространстве следующее: при
постоянном или достаточно гладком управлении iv°(x) фазовая
точка весьма быстро по закону ехр б) приближается
к асимптотически устойчивому многообразию:
Х1 — Х21 х2 — У^ У 2 = Уз — 0» (9.6.31)
хг/i + х2 = (х), х = (xi, х2).
По многообразию (31) точка (х1ч х2) приходит в заданное поло-
жение (чт, 0) за «время» 0°(гг?, гс®), оптимальное для систе-
мы (30). В момент 0 = 0° величины х^ х2, у2, у3 будут асимпто-
тически близкими к заданным значениям, а близко к значе-
нию 1/1 (0°) = г^°/х, где wQ = +1 или wQ = — 1. Если затем при
0 > 0° положить w = 0, то на интервале 0 — 0° ~ £ In е"1 величина
l?/i(0)l станет величиной О(е). Таким образом, построенное
управление wQ(x) дает асимптотическое решение задачи опти-
мального по быстродействию приведения фазовой точки (а:, у)
системы (29) в заданное положение — состояние покоя. Для бо-
лее точного решения задач управления требуется учет погран-
слоев в начале и конце процесса управления [68]. Однако изме-
рение быстрых (сингулярных) переменных и управление ими
представляет трудноразрешимую практическую проблему. Уточ-
нение процесса управления в заданную конечную точку, как от-
мечалось в § 5, требует дополнительного режима стабилизации
(см. § 2, 3), менее чувствительного к неточностям задания пара-
метров управляемой системы.
23*
СПИСОК ЛИТЕРАТУРЫ
1. Айзекс Р. Дифференциальные игры.— М.: Мир, 1967.
2. Акилов У. А. О принципе усреднения в математической теории опти-
мальных процессов Ц ДАН УзССР.— 1968.— № 9.
3. Акилов У. А., Филатов А. Н. О принципе усреднения в математической
теории оптимальных процессов Ц ДАН УзССР.— 1966.— № 7.
4. Акуленко Л. Д. Построение вращательных решений для невозмущен-
ных консервативных систем с одной степенью свободы по обратным
степеням «энергии» // Вести. МГУ. Сер. физ., астрон.— 1967.— № 3.
5. Акуленко Л. Д. О некоторых вращательно-колебательных системах,
подверженных высокочастотным возмущениям // ЖВМ и МФ.— 1968.—
Т. 8, № 5.
б. Акуленко Л. Д, Исследование некоторых оптимальных систем методом
усреднения/ПММ.— 1974.—Т. 38, вып. 3.
7. Акуленко Л, Д. Асимптотическое решение некоторых задач типа опти-
мального быстродействия Ц ПММ.— 1975.— Т. 39, вып. 4.
8. Акуленко Л. Д. Исследование установившихся режимов возмущенных
автономных систем в критических случаях Ц ПММ.— 1975.— Т. 39,
вып. 5.
9. Акуленко Л. Д. Оптимальное управление движением квазилинейной
колебательной системы при помощи малых сил // ПММ.— 1975.— Т. 39,
вып. 6.
10. Акуленко Л. Д, Резонансные движения в существенно нелинейной сис-
теме, содержащей устойчивые элементы // ПММ.— 1976.— Т. 40, вып. 5.
11. Акуленко Л, Д, Приближенное решение нелинейных задач оптимально-
го управления колебательными процессами методом канонического раз-
деления движений // ПММ.— 1976.— Т. 40, вып. 6.
12. Акуленко Л, Д, Вынужденные периодические движения в негамильто-
новых системах с одной степенью свободы Ц ПММ.—1977.— Т. 41,
вып. 5.
13. Акуленко Л. Д. Асимптотическое решение некоторых нелинейных за-
дач оптимального быстродействия // ПММ.— 1978.— Т. 42, вып. 1.
14. Акуленко Л, Д, Оптимальная по быстродействию стабилизация возму-
щенной системы с инвариантной нормой Л ПММ.— 1978.— Т. 42, вып. 4.
15. Акуленко Л. Д, Оптимальный синтез в некоторых задачах терминально-
го управления Ц ПММ.— 1978.— Т. 42, вып. 6.
16. Акуленко Л. Д. Приближенный синтез оптимальных по быстродействию
управлений в задачах, близких к сферически-симметричным // Изв. АН
СССР. МТТ.— 1978.— № 2.
17. Акуленко Л, Д, Управление движением нелинейной колебательной сис-
темы смещением положения равновесия // Изв. АН СССР. МТТ.—
1978.— № 4.
18. Акуленко Л. Д. Исследование индивидуальных вынужденных движе-
ний существенно нелинейной системы в окрестности устойчивого одно-
частотного интегрального многообразия произвольной размерности/
Теория устойчивости и ее приложения.— Новосибирск: Наука, 1979.
19. Акуленко Л. Д. Асимптотическое решение двухточечных краевых за-
дач / ПММ.— 1980.— Т. 44, вып. 4.
СПИСОК ЛИТЕРАТУРЫ
357
20. Акуленко Л. Д. Приближенный оптимальный синтез управления дви-
жением по части переменных Ц Изв. АН СССР. МТТ.—1980.— № 5.
21. Акуленко Л. Д. Оптимальная стабилизация несимметричного спутника Ц
Косм, исслед.— 1980.— Т. 18, вып. 5.
22. Акуленко Л. Д. Задачи оптимальной стабилизации и переориентации
спутника Ц Тр. IV Объединенных научных чтений по космонавтике.—
М.: ИИЕиТ, 1980.
23. Акуленко Л. Д. Применение методов усреднения и последовательных
приближений для исследования нелинейных колебаний // ПММ.—
1981.—Т. 45, вып. 5.
24. Акуленко Л. Д, Приведение упругой системы в заданное состояние по-
средством силового граничного воздействия // ПММ.— 1981.— Т. 45,
вып. 6.
25. Акуленко Л, Д. Задачи оптимального управления манипуляционным
роботом с учетом упругости конструкции Ц Тр. IX Осенней школы,
Херингсдорф, 24—27 ноября 1981 г.— Лейпциг: Изд-во Лейпцигской
высшей технической школы, 1982.
26. Акуленко Л. Д. Оптимальное управление элементами плоской орбиты,
близкой к круговой Ц Косм, исслед.— 1983.— Т. 21, вып. 1.
27. Акуленко Л, Д. Оптимальное по быстродействию управление движением
КА по слабоэллиптической орбите //Тр. VI Объединенных научных чте-
ний по космонавтике.— М.: ИИЕиТ, 1983.
28. Акуленко Л, Д. Приближенный синтез для возмущенных неколеба-
тельных систем с одной степенью свободы // ПММ.—1985.— Т. 49,
вып. 5.
29. Акуленко Л. Д., Болотник Н. Н. Об управляемом вращении упругого
стержня Ц ПММ.— 1982.— Т. 46, вып. 4.
30. Акуленко Л, Д., Болотник Н, Н. Об управлении поворотом упругого зве-
на манипулятора // Изв. АН СССР. Техн, кибернетика.— 1984.— № 1.
31. Акуленко Л. Д., Заремба А. Т. Синтез управления маятником перемен-
ной длины // Изв. АН СССР. МТТ.— 1981.— № 2.
32. Акуленко Л. Д., Лещенко Д. Д. Некоторые задачи движения твердого
тела с подвижной массой // Изв. АН СССР. МТТ.— 1978.— № 5.
33. Акуленко Л. Д., Михайлов С. А., Черноусько Ф. Л. Моделирование
динамики манипулятора с упругими звеньями // Изв. АН СССР.
МТТ.— 1981.— № 3.
34. Акуленко Л. Д., Рощин Ю. Р. Оптимальное управление движением сис-
тем «типа маятника» перемещением точки подвеса ]] Изв. АН СССР.
МТТ.— 1976.— № 1.
35. Акуленко Л. Д., Рощин Ю. Р. Оптимальное по быстродействию тормо-
жение вращений твердого тела управлениями, ограниченными эллип-
соидом // Изв. АН СССР. МТТ.— 1977.— № 1.
36. Акуленцо Л. Д., Черноусько Ф. Л. Метод осреднения в задачах опти-
мального управления Ц ЖВМ и МФ.— 1975.— Т. 15, № 4.
37. Алексеев К. Б., Бебенин Г. Г. Управление космическими летательными
аппаратами.— М.: Машиностроение, 1974.
38. Альбрехт Э. Г. Об оптимальной стабилизации нелинейных систем И
ПММ.— 1961.- Т. 25, вып. 5.
39. Альбрехт Э. Г. Об управлении движением нелинейных систем // Диффе-
рент уравнения.— 1966.— Т. 2, № 3.
40. Альбрехт Э. Г. Об оптимальном управлении движением квазилинейных
систем Ц Дифференц. уравнения.— 1969.—Т. 5, № 3.
41. Альбрехт Э. Г. О сближении квазилинейных объектов #ПММ.— 1970.—
Т. 34, вып. 4.
42. Альбрехт Э. Г, О встрече квазилинейных объектов в регулярном слу-
чае // ПММ.— 1971.- Т. 35, вып. 4.
43. Андронов А. А., Витт А. А., Хайкин С. Э. Теория колебаний.— М.: Нау-
ка, 1981.
44. Аноров В. П., Коровин В. Н. Оптимальный по быстродействию плоский
разворот твердого тела // АиТ.— 1970.— Т. 14, № 4.
358
СПИСОК ЛИТЕРАТУРЫ
45. Арнольд В. И. Малые знаменатели и проблемы устойчивости в класси-
ческой и небесной механике // УМН.— 1963.— Т. 18, вып. 6.
46. Арнольд В. И. Математические методы классической механики.—М.:
Наука, 1974.
47. Арнольд В. И. Дополнительные главы теории обыкновенных дифферен-
циальных уравнений.— М.: Наука, 1978.
48. Артюхин Ю. П., Каргу Л. И., Симаев В. Л. Системы управления
космических аппаратов, стабилизированных вращением.—М.: Наука,
1979.
49. Атанс М., Фалб П. Оптимальное управление.—М.: Машиностроение,
1968'.
50. Белецкий В. В. Движение искусственного спутника относительно цент-
ра масс.— М.: Наука, 1965.
51. Белецкий В. В. Об оптимальном приведении ИСЗ в гравитационно ус-
тойчивое положение // Косм, исслед.— 1971.— Т. 9, вып. 3.
52. Белецкий В. В, Очерки о движении космических тел.— М.: Наука, 1972.
53. Беллман Р. Динамическое программирование.— М.: ИЛ, 1960.
54. Белолипецкий А. А. Линейная задача оптимального быстродействия с
параметром // ЖВМ и МФ.— 1974.— Т. 14, № 5.
55. Бербюк В. Е. Об управляемом вращении системы двух твердых тел с
упругими элементами // ПММ.— 1984.— Т. 48, вып. 2.
56. Благодатских В. И. К теории достаточных условий оптимальности^/
ДАН СССР.— 1976.— Т. 231, № 5.
57. Блакьер О. Анализ нелинейных систем.—М.: Мир, 1969.
58. Боголюбов II. II., Митропольский Ю. А. Асимптотические методы в
теории не линейных колебаний.— М.: Наука, 1974.
59. Боголюбов II. II., Митропольсций Ю. А., Самойленко А. М. Метод уско-
ренной сходимости в нелинейной механике.—Киев: Наукова думка,
1969.
60. Болотник Н. Н. Оптимизация амортизационных систем.— М.: Наука,
1983.
61. Болтянский В. Г. Математические методы оптимального управления.—
М.: Наука, 1969.
62. Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления.—
М.: Мир, 1972.
63. Булгаков В. Б. Колебания.— М.; Л.: Гостехиздат, 1954.
64. Бурштейн Э. Л., Соловьев Л. С. Гамильтониан усредненного движе-
ния // ДАН СССР.—1961.-Т. 139, № 4.
65. Бутковский А. Г. Методы управления системами с распределенными
параметрами.— М.: Наука, 1975.
66. Вайнберг М. М., Треногин В. А. Теория ветвления решений нелиней-
ных уравнений.— М.: Наука, 1969.
67. Васильева А. Б., Бутузов В. Ф. Асимптотические разложения решений
сингулярно возмущенных уравнений.— М.: Наука, 1973.
68. Васильева А. Б., Дмитриев М. Г. Сингулярные возмущения в задачах
оптимального управления Ц Итоги науки и техники. Сер. Математиче-
ский анализ. Т. 20.— М.: ВИНИТИ, 1982.
69. Волосов В. М. Усреднение в системах обыкновенных дифференциаль-
ных уравнений // УМН.— 1962.— Т. 17, вып. 6.
70. Волосов В. М., Моргунов Б. И. Метод осреднения в теории нелиней-
ных колебательных систем.— М.: Изд-во МГУ, 1971.
71. Вязовик А. П. Применение метода усреднения к задаче синтеза управ-
ления // Изв. АН СССР. МТТ.— 1984.— № 4.
72. Габасов Р., Кириллова Ф. М. Качественная теория оптимальных про-
цессов.— М.: Наука, 1971.
73. Габасов Р., Кириллова Ф. М. Особые оптимальные управления.—М.:
Наука, 1973.
74. Гайцгори В. Г., Первозванский А. А. Метод возмущений в задачах оп-
тимизации // Динамика систем. Межвуз. сб.— Горький: Изд-во ГГУ.—
1978.-Вып. 14.
СПИСОК ЛИТЕРАТУРЫ
359
75. Ганиев Р. Ф., Кононенко В. О. Колебания твердых тел.—М.: Науца,
1976.
76. Гантмахер Ф. Р. Лекции по аналитической механике.—М.: Наука, 1966.
77. Геращенко Е. И., Геращенко С. М. Метод разделения движений и оп-
тимизация нелинейных систем.— М.: Наука, 1975.
78. Голубев В, В. Лекции по аналитической теории дифференциальных
уравнений.— М.; Л.: Гостехиздат, 1950.
79. Горбатенко С. А. и др. Механика полета: Инж. справочник.—М.: Ма-
шиностроение, 1969.
80. Горелов Ю. И., Титов Б. А. Об оптимальной переориентации вращаю-
щегося космического аппарата /Косм, исслед.—1980.— Т. 18, вып. 2.
81. Градштейн И. С., Рыжик И. М. Таблицы интегралов, сумм, рядов и
произведений.— М.: Физматгиз, 1962.
82. Гребеников Е. А., Рябов Ю. А. Конструктивные методы анализа нели-
нейных систем.— М.: Наука, 1979.
83. Григорьев К. Г., Иослович И. В. О некоторых задачах наискорейшей
переориентации космического аппарата // Косм, исслед.— 1978.— Т. 16,
вып. 6.
84. Гродзовский Г. Л., Иванов Ю. Н., Токарев В. В. Механика космического
полета: Проблемы оптимизации.— М.: Науца, 1975.
85. Демидович Б. П. Лекции по математической теории устойчивости.—
М.: Наука, 1967.
86. Демидович Б. И., Марон И. А. Основы вычислительной математики.—
М.: Наука, 1966.
87. Демьянов В. Ф. Минимакс: дифференцируемость по направлению.—
Л.: Изд-во ЛГУ, 1974.
88. Демьянов В. Ф., Рубинов А. М. Приближенные методы решения экстре-
мальных задач.— Л.: Изд-во ЛГУ, 1968.
89. Джакалья Г. Е. О. Методы теории возмущений для нелинейных сис-
тем.— М.: Наука, 1979.
90. Евтушенко Ю. Г. Приближенный расчет задач оптимального управле-
ния // ПММ.— 1970.— Т. 34, вып. 1.
91. Евтушенко Ю. Г. Методы решения экстремальных задач и их примене-
ние в системах оптимизации.— М.: Наука, 1982.
92. Емельянов С. В. Системы автоматического управления с переменной
структурой.— М.: Наука, 1967.
93. Еругин Н. П. Неявные функции.— Л.: Изд-во ЛГУ, 1956.
94. Ефимов Г. Б., Охоцимский Д. Е. Об оптимальном разгоне космического
аппарата в центральном поле // Косм, исслед.— 1965.— Т. 3, вып. 6.
95. Журавлев В. Ф. Исследование некоторых виброударных систем мето-
дом негладких преобразований // Изв. АН СССР. МТТ.— 1977.—
№ 6.
96. Журавлев В. Ф. Уравнения движения механических систем с односто-
ронними связями // ПММ.— 1978.— Т. 42, вып. 5.
97. Журавлев В. Ф. Метод рядов Ли в проблеме разделения движений в
нелинейной механике /ПММ.— 1983.— Т. 47, вып. 4.
98. Забрейко П. П. и др. Интегральные уравнения. СМБ.—М.: Наука, 1968.
99. Заремба А. Т. Синтез управления маятником / Изв. АН СССР. МТТ.—
1981.-№ 1.
100. Захаров Ю. А. Проектирование межорбитальных космических аппара-
тов.— М.: Машиностроение, 1984.
101. Зубов В. И. Лекции по теории управления.— М.: Науца, 1975.
102. Зубов В. И. и др. Управление вращательным движением твердого те-
ла.— М.: Изд-во ЛГУ, 1978.
103. Иослович И. В. Наискорейшее торможение вращения аксиально-сим-
метричного спутника /Косм, исслед.— 1964.— Т. 2, вып. 4.
104. Ишлинский А. Ю. Ориентация, гироскопы и инерциальная навигация.—
М.: Наука, 1976.
105. Каргу Л. И. Системы угловой стабилизации космического аппарата.—
М.: Машиностроение, 1973.
360
СПИСОК ЛИТЕРАТУРЫ
106. Квакернаак X., Сиван Р. Линейные оптимальные системы управления.—
М.: Мир, 1977.
107. Киселев Ю. Н. Асимптотическое решение задачи оптимального быст-
родействия для систем управления, близких к линейным // ДАН
СССР.— 1968.—Т. 182, № 1.
108. Киселев Ю. Н. Вычислительный формализм решения линейной задачи
быстродействия с регулярными возмущениями // Динамида управляе-
мых систем.— Новосибирск: Наука, 1979.
109. Козлов В. В. и др. Динамика управления роботами.—М.: Наука, 1984.
110. Козырев Ю. Г. Промышленные роботы: Справочник.—М.: Машиностро-
ение, 1983.
111. Комков В. Теория оптимального управления демпфированием колеба-
ний простых упругих систем.— М.: Мир, 1975.
112. Кононенко В. О. Колебательные системы с ограниченным возбуждени-
ем.—М.: Наука, 1964.
ИЗ. Красовский А. А., Буков В. Н., Шендрик В. С. Универсальные алгорит-
мы оптимального управления непрерывными процессами.— М.: Наука,
1977.
114. Красовский Н. Н. К теории оптимальных процессов // АиТ.— 1957.—
Т. 18, № И.
115. Красовский Н. Н. Теория управления движением.—М.: Наука, 1968.
116. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные иг-
ры.— М.: Наука, 1974.
117. Крементуло В. В. Стабилизация стационарных движений твердого тела
при помощи вращающихся масс.— М.: Наука, 1977.
118. Кротов В, Ф., Гурман В, И. Методы и задачи оптимального управле-
ния.— М.: Наука, 1973.
119. Крускал М. Адиабатические инварианты.—М.: ИЛ, 1962.
120. Крылов В. И. Приближенное вычисление интегралов.—М.: Наука,
1967.
121. Крылов Н. М., Боголюбов Н. Н. Введение в нелинейную механику.—
Киев: Изд-во АН УССР, 1937.
122. Кузмак Г. Е. Динамика неуправляемого движения летательных аппара-
тов при входе в атмосферу.— М.: Наука, 1970.
123. Лавровский Э. К. К задаче стабилизации спутника // Косм, исслед.—
1973.—Т. И, вып. 2.
124. Лакота Н. А., Рахманов Е. В., Шведов В. Н. Управление упругим ма-
нипулятором на траектории // Изв. АН СССР. Техн, кибернетика.—
1980.- № 2.
125. Ларин В. Б. Управление шагающими аппаратами.— Киев: Наукова дум-
ка, 1980.
126. Ларин В. Б., Науменко К. И., Сунцев В. Н. Синтез оптимальных линей-
ных систем с обратной связью.— Киев: Наукова думка, 1973.
127. Лебедев В. Н. Расчет движения космического аппарата с малой тягой.—
М.: Изд-во ВЦ АН СССР, 1967.
128. Левитан Б. М., Жиков В. В. Почти периодические функции и диффе-
ренциальные уравнения.—М.: Изд-во МГУ, 1978.
129. Лейтман Дж. Введение в теорию оптимального управления.—М.: Нау-
ка, 1968.
130. Летов А. М. Динамика полета и управление.— М.: Наука, 1969.
131. Ли Э. Б., Маркус Л. Основы теории оптимального управления.— М.:
Науда, 1972.
132. Лилов Л. Структура, кинематика и динамика систем твердых тел // Ус-
пехи механики.— 1983.— Вып. 1, 2.
133. Лилов Л. Уравнения движения твердого тела с учетом его упругости Ц
Доклады БАН.— 1983.— Т. 36, № 10.
134. Лионе Ж.-Л. Оптимальное управление системами, описываемыми урав-
нениями с частными производными.— М.: Мир, 1972.
135. Ломов С. А. Введение в общую теорию сингулярных возмущений.—
СПИСОК ЛИТЕРАТУРЫ
361
136. Лопатин А. К. Асимптотическая декомпозиция систем дифференциаль-
ных уравнений высокой размерности и ее приложения Ц Тр. IX Меж-
дунар. конференции по нелинейным колебаниям. Т. 1.— Киев: Наукова
думка, 1984.
137. Лоскутов Е. М. К задаче оптимальной переориентации космического ап-
парата // Косм, исслед.— 1973.— Т. И, вып. 2.
138. Лоскутов Е. М. Оптимальное приведение несимметричного аппарата в
стационарное вращение по заданному направлению Ц Некоторые за-
дачи управления и навигации движущихся объектов.— М.: Изд-во МГУ,
1978.
139. Лоуден Д. Оптимальные траектории для космической навигации.—М.:
Мир, 1966.
140. Лурье А. И. Аналитическая механика.—М.: Физматгиз, 1961.
141. Малкин И. Г. Некоторые задачи теории нелинейных колебаний.—М.:
Гостехиздат, 1956.
142. Мамалыга В. М., Черноусько Ф. Л. Управление перемещением грузов
в вертикальной плоскости // Изв. АН СССР. МТТ.—1977.— № 4.
143. Матвеев Н. М., Носов С. Л., Покровский А. Н. К вопросу о принципе
усреднения Ц Дифференц. уравнения.— 1978.— Т. 14, № 2.
144. Медведев В. С., Лесков А. Г., Ющенко А. С. Системы управления мани-
пуляционных роботов.—М.: Наука, 1978.
145. Мерриэм К. У. Теория оптимизации и расчет систем управления с об-
ратной связью.— М.: Мир, 1967.
146. Милушева С. Д., Байнов Д. Д. Обоснование метода усреднения для од-
ной нелинейной краевой задачи Ц Изв. вузов. Математика.— 1974.—
№ 12.
147. Митропольский Ю. А. Проблемы асимптотической теории нестационар-
ных колебаний.— М.: Наука, 1964.
148. Митропольский Ю. А. Метод усреднения в нелинейной механике.—
Киев: Наукова думка, 1971.
149. Митропольский Ю. А. Развитие метода усреднения // Тр. IX Междунар.
конференции по нелинейным колебаниям. Т. 1. Аналитические методы
теории нелинейных колебаний.— Киев: Наукова думка, 1984.
150. Митропольский Ю. А., Лыкова О. В. Интегральные многообразия в не-
линейной механике.— М.: Наука, 1973.
151. Михайлов С. А. Собственные колебания упругого двузвенника с то-
чечной массой И Изв. АН СССР. МТТ.— 1983.— № 2.
152. Михайлов С. А., Черноусько Ф. Л. Исследование динамики манипулято-
ра с упругими звеньями // Изв. АН СССР. МТТ.— 1984.— № 2.
153. Михайлов С. А., Черноусько Ф. Л. Динамика упругого манипулятора
при заданных управляющих моментах или движениях перемещаемого
груза /Изв. АН СССР. МТТ.—1984.—№ 5.
154. Моисеев Н. Н. Асимптотические методы нелинейной механики.— М.:
Наука, 1969.
155. Моисеев Н. Н. Численные методы в теории оптимальных систем.— М.:
Наука, 1971.
156. Моисеев Н. Н. Математические задачи системного анализа.— М.: Нау-
ка, 1981.
157. Моисеев Н. Н., Иванилов Ю. П., Столярова Е. М. Методы оптимизации.—
М.: Наука, 1978.
158. Найфэ А. Введение в методы возмущений.— М.: Мир, 1984.
159. Науменко К. И. Наблюдение и управление движением динамических
систем.— Киев: Наукова думка, 1984.
160. Небесное В. И., Плотников В. А. Математические методы исследования
режимов работы судовых комплексов. Ч. 1.—М.: Рекламинформбюро
ММФ, 1977.
161. Неймарк Ю. И. Метод точечных отображений в теории нелинейных ко-
лебаний.— М.: Наука, 1972.
162. Нейштадт А. И. Об осреднении в многочастотных системах Ц ДАН
СССР.— 1975.— Т. 223, № 2.
362
СПИСОК ЛИТЕРАТУРЫ
163 Нейштадт А. И. О прохождении через резонансы в двухчастотной за-
даче // ДАН СССР.— 1975.- Т. 221, № 2.
164. Нейштадт А. И. Прохождение через сепаратрису в резонансной задаче
с медленно изменяющимся параметром // ПММ.— 1975.— Т. 39, вып. 4.
165. Нейштадт А. И. Об эволюции вращения твердого тела под действием
суммы постоянного и диссипативного возмущающего моментов Ц Изв.
АН СССР. МТТ.— 1980.— № 6.
166. Нейштадт А. И. О точности сохранения адиабатического инварианта //
ПММ.— 1981.— Т. 45, вып. 1.
167. Нейштадт А. И. Оценки в теореме Колмогорова о сохранении условно-
периодических движений // ПММ.— 1981.— Т. 45, вып. 6.
168. Новоселов В. С. Аналитическая теория оптимизации в гравитационных
полях.—Л.: Изд-во ЛГУ, 1972.
169. Охоцимский Д. Е., Голубев Ю. Ф., Сихарулидзе Ю. Г. Алгоритмы уп-
равления космическим аппаратом при входе в атмосферу.— М.: Наука,
1975.
170. Панасюк А. И., Панасюц В. И. Асимптотическая оптимизация нелиней-
ных систем управления.— Минск: Изд-во БГУ, 1977.
171. Петров Б. Н., Боднер В. А., Алексеев К. Б. Аналитическое решение за-
дачи управления пространственным поворотным маневром // ДАН
СССР.- 1970.— Т. 192, № 6.
172. Петровский И. Г. Лекции по теории обыкновенных дифференциальных
уравнений.— М.: Наука, 1964.
173. Плотников В. А. Асимптотические методы в задачах оптимального уп-
равления.— Одесса: Изд-во ОГУ, 1976.
174. Плотников В. А, Метод частичного усреднения в задачах терминально-
го управления // Дифференц. уравнения.— 1978.— Т. 14, № 2.
175. Плотников В. А. Метод усреднения для дифференциальных включений
и его приложение к задачам оптимального управления // Дифференц.
уравнения.— 1979.— Т. 15, № 8.
176. Плотников В. А. Асимптотическое исследование уравнений управляе-
мого движения Ц Изв. АН СССР. Техн, киберника.—1984.— № 4.
177. Плотников В. А., Зверкова Т, С. Усреднение краевых задач в терминаль-
ных задачах оптимального управления Ц Дифференц. уравнения.—
1978.- Т. 14, № 8.
178. Плотников В. А., Зверкова Т. С. Метод усреднения для систем стан-
дартного вида с разрывными правыми частями // Дифференц. уравне-
ния.— 1982.- Т. 18, № 6.
179. Пол Р. Моделирование, планирование траекторий и управление движе-
нием робота-манипулятора.— М.: Наука, 1976.
180. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф.
Математическая теория оптимальных процессов.— М.: Наука, 1976.
181. Попов В. И. Системы ориентации и стабилизации космических аппара-
тов.— М.: Машиностроение, 1977.
182. Попов Е. П. Прикладная теория процессов управления в нелинейных
системах.— М.: Наука, 1973.
183. Попов Е. П., Верещагин А. Ф., Зенкевич С. Л. Манипуляционные ро-
боты: Динамика и алгоритмы.— М.: Наука, 1978.
184. Пуанкаре А. Избранные труды: В 3 т.—М.: Наука.—Т. 1.—1971; Т. 2.—
1972; Т. 3.— 1974.
185. Пшеничный Б. Н. Выпуклый анализ и экстремальные задачи.— М.: На-
ука, 1980.
186. Пшеничный Б. Н., Данилин Ю. М. Численные методы в экстремальных
задачах.— М.: Наука, 1975.
187. Раушенбах Б. В., Токарь Е. Н. Управление ориентацией космических
аппаратов.— М.: Наука, 1974.
188. Розенвассер Е. Н., Юсупов Р. М. Чувствительность систем управле-
ния.— М.: Наука, 1981.
189. Розоноэр Л. И. Принцип максимума Л. С. Понтрягина в теории опти-
мальных систем. Ч. 1—3 // АиТ.—1959.—Т. 20, № 10—12.
СПИСОК ЛИТЕРАТУРЫ
363
190. Рощин Ю. Р. К задаче оптимальной переориентации твердого тела //
Косм, исслед.— 1977.— Т. 15, вып. 6.
191. Румянцев В. В. Об оптимальной стабилизации управляемых систем //
ПММ.— 1970.- Т. 34, вып. 3.
192. Самойленко А. М. Обоснование принципа усреднения для дифференци-
альных уравнений с разрывной правой частью // Приближенные ме-
тоды решения дифференциальных уравнений.—Киев: Изд-во АН УССР,
1963.
193. Сарычев В. А. Вопросы ориентации искусственных спутников Ц М.:
ВИНИТИ, 1978. (Итоги пауки и техники. Сер. Исследование космическо-
го пространства.—Т. И.)
194. Смольников Б. А. Оптимальные режимы торможения вращательного
движения симметричного тела // ПММ.— 1964.— Т. 28, вып. 4.
195. Смольников Б. А. Обобщение эйлерова случая движения твердого те-
ла Ц ПММ.— 1967.— Т. 31, вып. 4.
196. Соловьев В. П. Об оптимальном развороте КА вокруг произвольной не-
подвижной оси // Косм, исслед.— 1969.— Т. 7, вып. 1.
197. Степанов В. В. Курс дифференциальных уравнений.— М.: Гостехиздат,
1953.
198. Субботин А. И. Об управлении движением квазилинейной системы //
Дифферепц. уравнения.— 1967.— Т. 3, № 7.
199. Тихонов А. И. Системы дифференциальных уравнений, содержащих
малые параметры при производных // Мат. сб.—1952.— Т. 31(73),
№ 3.
200. Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач.—
М.: Наука, 1979.
201. Тихонов А. Н., Васильева А. Б., Свешников А. Г. Дифференциальные
уравнения.— М.: Наука, 1980.
202. Тондл А. Нелинейные колебания механических систем.— М.: Мир, 1973.
203. Тонков Е. Л. Некоторые вопросы управления периодическими движе-
ниями Ц Динамика управляемых систем.— Новосибирск: Наука, 1979.
204. Третья^ А. И. Об асимптотическом решении некоторых задач оптималь-
ного управления // Проблемы аналитической механики, теорий устой-
чивости и управления.— М.: Наука, 1975.
205. Троицкий В. А. Оптимальные процессы колебаний механических сис-
тем.— Л.: Машиностроение, 1976.
206. Уткин В. И. Скользящие режимы и их применения в системах с пере-
менной структурой.— М.: Наука, 1974.
207. Федоренко Р. П. Приближенное решение задач оптимального управ-
ления. СБМ.— М.: Наука, 1978.
208. Федорченко А. М. Метод канонического усреднения в теории нелиней-
ных колебаний // Укр. мат. ж.— 1957.—Т. 9, № 2.
209. Фелъдбаум А. А. Основы теории оптимальных автоматических систем.—
М.: Наука, 1963.
210. Филатов А. Н., Шарова Л. В. Интегральные неравенства и теория не-
линейных колебаний.— М.: Наука, 1976.
211. Филиппов А. Ф. О некоторых вопросах теории оптимального регули-
рования Ц Вести. МГУ. Сер. Мат., механ., астрон., физ., хим.— 1959.—
212. Филиппов А. Ф. Дифференциальные уравнения с разрывной правой
частью Ц Мат. сб.— I960.— Т. 51, № 1.
213. Филиппов А. Ф. Классические решения дифференциальных уравнений
с многозначной правой частью /Вести. МГУ. Сер. Мат., механ.—
1967.—№3.
214. Филиппов А. Ф. О существовании решений многозначных дифферен-
циальных уравнений Ц Мат. заметки.—1971.—Т. 10, № 3.
215. Филиппов А. Ф. Дифференциальные уравнения с разрывной правой
частью.—М.: Наука, 1985.
216. Формальский А. М. Управляемость и устойчивость систем с ограничен-
ными ресурсами.— М.: Наука, 1974.
364
СПИСОК ЛИТЕРАТУРЫ
217. Фролов К. В. Уменьшение амплитуды колебаний резонансной системы
путем управляемого изменения параметров Ц Машиноведение.—
1965.— Ха 3.
218. Хартман Ф. Обыкновенные дифференциальные уравнения.— М.: Мир,
1970.
219. Хейл Дж. Колебания в нелинейных системах.— М.: Мир, 1966.
220. Чезари Л. Асимптотическое поведение и устойчивость решений обыкно-
венных дифференциальных уравнений.— М.: Мир, 1964.
221. Черноусько Ф. Л. О движении спутника относительного центра масс
под действием гравитационных моментов // ПММ.— 1963.— Т. 27, вып. 3.
222. Черноусько Ф. Л. Некоторые задачи оптимального управления с малым
параметром // ПММ.—1968.—Т. 32, вып. 1.
223. Черноусько Ф. Л. Движение твердого тела с полостями, содержащими
вязкую жидкость.— М.: Изд-во ВЦ АН СССР, 1968.
224. Черноусько Ф. Л. О движении твердого тела с подвижными внутренни-
ми массами // Изв. АН СССР. МТТ.— 1973.— № 4.
225. Черноусько Ф. Л. О движении твердого тела с упругими и диссипатив-
ными элементами Ц ПММ.— 1978.— Т. 42, вып. 1.
226. Черноусько Ф. Л. О движении вязцоупругого твердого тела относитель-
но центра масс Ц Изв. АН СССР. МТТ.— 1980.— № 1.
227. Черноусько Ф. JL Динамика управляемых движений упругого манипу-
лятора Ц Изв. АН СССР. Техн, кибернетика.— 1981.— № 5.
228. Черноусько Ф. Л. Динамика систем с упругими элементами большой
жесткости Ц Изв. АН СССР. МТТ.—1983.— № 4.
229. Черноусько Ф. Л., Акуленко Л. Д., Соколов Б. Н. Управление колеба-
ниями.— М.: Наука, 1980.
230. Черноусъцо Ф. Л., Баничук Н. В. Вариационные задачи механики и уп-
равления. Численные методы.— М.: Наука, 1973.
231. Чиликин М. Г., Ключев В. И., Сандлер А. С. Теория автоматизирован-
ного электропривода.— М.: Энергия, 1979.
232. Шкляр В. Н., Малышенко А. М. К задаче оптимального пространствен-
ного разворота КА относительно центра масс // Косм, исслед.— 1975.—
Т. 13, вып. 4.
233. Эдельбаум Т. Оптимальные задачи в механике полета маневрирующих
космических аппаратов // Современное состояние механики космиче-
ского полета.— М.: Наука, 1969.
234. Энеев Т. М. О применении градиентного метода в задачах оптимально-
го управления // Косм, исслед.— 1966.— Т. 4, вып. 5.
235. Янг Л. Лекции по вариационному исчислению и теории оптимального
управления.— М.: Мир, 1974.
236. Янке Е., Эмде Ф., Лёш Ф. Специальные функции. Формулы, графики,
таблицы.— М.: Наука, 1977.
237. Ярошевский В. А. Движение неуправляемого тела в атмосфере.— М.:
Машиностроение, 1978.
238. Akulenko L. D. и. a. Dynamik und optimale Schwingungstilgung in un-
wuchterregten Schwingsystemen.— Report R — 03/80.— Berlin: ZIMM Adw
DDR, 1980.
239. Balachandra M. On averaging theorem for two — point boundary value
problems with applications to optimal control // J. Math. Anal, and
AppL— 1976.— V. 55, № 1.
240. Baldwin J. F., Williams J. H. Sims. The use of a method of perturbations in
the synthesis of closed-loop optimal control laws for non-linear systems Ц
Automatica.— 1969.— V. 5, № 3.
241. Besjes J. G. On the asymptotic methods for non-linear differential equa-
tions Ц J. de Mecanique.— 1969.— V. 8, № 3.
242. Book W. J. Analysis of massless elastic chains with servo controlled
joints // Trans. ASME J. Dynamic Syst. Measurment and Control.— 1979.—
V. 101, № 3.
243. Edelbaum T. N. Propulsion requirments for controllable satellites Ц
ARS J — 1961.— V. 31, № 8.
СПИСОК ЛИТЕРАТУРЫ
365
244. Edelbaum Т. N. Optimal low-thrust transfer between circular and elliptic
orbits fl Proceedings of the Fourth U. S. National Congress of Applied
Mechanics.— New York: American Society of Mechanical Engineers, 1962.
245. Edelbaum T. N. Optimal low-thrust rendezvous and station keeping J
AIAA J.— 1964.— V. 2, № 7.
246. Falb P. L., Jong J. L. Some successive approximation methods on control
and oscillation theory.— New York; London: Acad. Press, 1969.
247. Hagedorn P. Canonical transformation in the optimal control of mechani-
cal systems fl Int. J. of Non-Linear Mechanics.—1978.— V. 13, № 2.
248. Hermes H. The generalized differential equation x^R(t, x) fl Adv.
Math.— 1970 — V. 4, № 2.
249. Jacobson R. A., Powers W. F. Asymptotic solution to the problem of
optimal low-thrust energy increase fl AIAA J.— 1972.— V. 10, № 12.
250. Jasper T. P. Low-thrust trajectory analysis for the geosynchrouous mis-
sion fl AIAA 10th Electric Propulsion Conference Lake Tahoe, Nevada,
October 31 — November 2, 1973.— AIAA Paper.— № 73—1072.
251. Kamel A. A., Hassan S. D. A perturbation treatment for optimal slightly
nonlinear systems with linear control and quadratic criteria fl J. Optimiz.
Theory and AppL— 1973.— V. 11> № 4
252. Kao У. Л"., Bankoff S. G. Singular perturbation analysis of free-time opti-
mal control problems fl Int. J. Syst. Sci.— 1974— V. 5, № 4
253. Kirchgraber U. On the Lie-series approach to the methods of averaging fl
Tp. IX Междунар. конференции по нелинейным колебаниям. Т. 1.—
Киев: Наукова думка, 1984.
254. Kokotovic Р. V., O'Malley R. Е. Jr., Sannuti Р. Singular perturbations in
control fl Automatical 1976.— V. 12, № 1.
255. La Salle I. P. Time optimal control systems fl Proc. Nat. Acad. Sci.
USA.— 1959.— V. 45, № 4
256. Lass H., Lorell J. Low acceleration takeoff from a satellite orbit fl ARS
J.— 1961.— V. 31, № 1.
257. Lions J. L. Perturbations singulieres daus les problemes aux limites et
en controle optimale fl Leet. Notes Math.— 1973.— № 323.
258. Moiseyev N. N. Methods of non-linear mechanics in the problems of dy-
namics of satellites fl Reports of the XIII International Congress on
Astronautics, Varna, 1962.—Vien, 1964
259. Moiseyev N. N., Shmidt A. G. Asymptotic methods in the theory of
optimum correction for systems with slowly varying parameters fl J. Op-
timizat. Theory and Applic.— 1969.— V. 3.— № 3.
260. O'Malley R. E. Jr. Singular perturbation of the time — invariant linear
state regulator problem fl J. Different. Equat.— 1972.— V. 12, № 1.
261. Powers W. F., Tapley B. D. Canonical transformation applications to
optimal trajectory analysis fl AIAA J.— 1969.— V. 7, № 3.
Леонид Денисович АКУЛЕНКО
АСИМПТОТИЧЕСКИЕ МЕТОДЫ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Редактор М. К. Ермолова
Художественный редактор Т. Н. Колъченко
Технический редактор В. Н. Кондакова
Корректоры Л. И. Назарова, Л. С. Сомова
ИБ № 12891
Сдано в набор 22.09.86. Подписано к печати 30.04.87. Т-12229. Формат 60Х90’/1б. Бу-
мага кн.-журнальная. Гарнитура обыкновенная новая. Печать высокая. Усл. печ.
л. 23. Усл. кр.-отт. 23. Уч.-изд. л. 24,99. Тираж 3550 экз. Заказ № 390. Цена 4 р. 10 к.
Ордена Трудового Красного Знамени издательство «Наука»
Главная редакция физико-математической литературы
117071 Москва В-71, Ленинский проспект, 15
4-я типография издательства «Наука»
630077 Новосибирск. 77, Станиславского, 25