ОБЩЕЕ ПРЕДИСЛОВИЕ К УЧЕБНИКУ
ПРЕДИСЛОВИЕ К 3-МУ ТОМУ
ЧАСТЬ IV. МЕТОДЫ СОВРЕМЕННОЙ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
ВВЕДЕНИЕ
СПИСОК ИСПОЛЬЗУЕМЫХ АББРЕВИАТУР
СПИСОК ИСПОЛЬЗУЕМЫХ ОБОЗНАЧЕНИЙ
ГЛАВА 1. СИНТЕЗ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ МЕТОДАМИ ДИФФЕРЕНЦИАЛЬНОЙ ГЕОМЕТРИИ
1.2. Группы и алгебры ли
1.2.2. Группы Ли
1.2.3. Инфинитезимальный оператор непрерывной группы преобразований
1.2.4. Алгебры Ли
1.3. Групповой анализ дифференциальных уравнений, однопараметрические группы преобразований
1.4. Векторные поля на многообразиях. Полные векторные поля
1.5. Связь системы обыкновенных дифференциальных уравнений и линейного уравнения в частных производных первого порядка. метод характеристик
1.6. Восстановление группы по ее инфинитезимальному оператору. Ряд Ли. Инварианты группы
1.7. Канонические координаты
1.8. Формула Хаусдорфа. Группы симметрии. Теорема Ли
1.9. Коммутативность однопараметрических групп и разделение движений в нелинейных системах
1.10. Управляемость нелинейных систем
1.11. Наблюдаемость в нелинейных системах
1.12. Линейные эквиваленты нелинейных систем. Синтез нелинейных регуляторов
1.13. Проверка инволютивности распределения векторных полей
ГЛАВА 2. ТЕОРИЯ КАТАСТРОФ. ХАОС. ФРАКТАЛЫ
2.1.2. От аналитичности к гладкости. К-струи и ростки функций
2.1.3. Регулярные и критические невырожденные точки гладких функций
2.1.4. Неморсовские функции. Лемма расщепления. Функции катастроф
2.1.5. Возмущение морсовских и неморсовских функций. Элементарные катастрофы
2.1.6. Устойчивость. Качественные изменения в системе
2.1.7. Трансверсальность и устойчивость
2.1.8. Многообразия катастрофы и бифуркационные множества
2.1.10. Инфинитезимальная устойчивость. Алгоритм Д. Мазера
2.1.12. Росток функции катастрофы
2.1.13 Пример исследования бифуркационного поведения летательного аппарата
2.2. Детерминированный хаос
2.2.2. Парадигмы хаоса: странный аттрактор Лоренца и логистическое уравнение
2.2.3. Бифуркация Хопфа и хаос. Критерий Рюэля - Такенса
2.2.4. Качественные и количественные признаки хаоса
2.3. Фракталы
2.3.2. Размерность Хаусдорфа - Безиковича
2.3.3. Принцип самоподобия. Самоподобные фракталы
2.3.4. Классические фракталы
2.3.5. Фрактальная размерность аттракторов. Применение теории фракталов в некоторых задачах управления
2.3.6. L-системы. Тертл-графика
2.3.7. Аффинные преобразования
2.3.8. Метрика Хаусдорфа
2.3.9. Система итерированных функций
2.3.10. Случайные фракталы
2.3.11. Множества Жюлиа
2.3.12. Множества Мандельброта
ГЛАВА 3. ПОСТРОЕНИЕ ОПТИМАЛЬНЫХ РОБАСТНЫХ РЕГУЛЯТОРОВ ПРИ ДЕЙСТВИИ ВНЕШНИХ ВОЗМУЩЕНИЙ
3.1.2. Построение Н∞-субоптимального регулятора для управления самолетом в условиях внешних возмущений
3.1.3. Моделирование
3.1.4. Обсуждение результатов моделирования
3.2. Построение анизотропийных регуляторов
3.2.2. Анизотропийный синтез систем
3.2.3. Сравнение систем управления с различными регуляторами
ГЛАВА 4. АДАПТИВНЫЕ СИСТЕМЫ
4.2. Постановка задачи синтеза адаптивной системы управления. Гипотеза о квазистационарности
4.3. Методы синтеза алгоритмов адаптации
4.4. Поисковые адаптивные системы
4.4.2. Поисковые алгоритмы непрямого адаптивного управления с настраиваемой моделью
4.5. Беспоисковые адаптивные системы управления
4.5.2. Схема скоростного градиента
4.5.3. Алгоритмы систем с переменной структурой
5.1.1. Общее определение игры. Частные классы игр
5.1.2. Математическая модель конфликтной ситуации в ММС
5.1.3. Методы получения стабильных и эффективных решений
5.1.4. О применении разработанных методов и алгоритмов стабильно-эффективного управления в практических задачах
5.2.1. Необходимое условие равновесия по Нэшу в форме двухуровневой структуры Пао
5.3. Стабильные и эффективные оптимальные решения на основе коалиционного равновесия
5.4. Стабильные коалиционные решения в ММС управления на основе метода «угроз и контругроз
5.4.2. Этап 1: выбор начальных приближений УКУ на основе построения ортогональной равномерной сети
5.4.4. Применение двухэтапного метода получения УКУ-оптимального управления прогнозом динамики конфликта ЛС СВН – ЛС ПВО
5.5. Оценка эффективности кооперативного компромисса и оптимизация решений в ммс на основе вектора дележа Шепли
5.5.2. Методы оптимизации дележей
5.5.3. Оптимизация дележа в форме вектора Шепли
5.5.4. Формирование двухэтапного алгоритма оптимизации решений в ММС на основе вектора дележа Шепли
5.5.5. Применение двухэтапного алгоритма для получения УКУ-Шепли оптимального управления прогнозом динамики конфликта ЛС СВН-ЛС ПВО
5.6.1. СТЭК на основе Парето-Нэш-УКУ-Шепли-комбинаций
5.6.2. Комбинированные методы в условиях е -равновесия по Нэшу, минимизации угроз и неполной информации о партнерах
5.6.3. Понятие о договорных компромиссах на основе комбинации обязательных и необязательных соглашений
5.7. Программно-корректируемое стабильно-эффективное позиционное управление нелинейной динамической двухкоалиционной системой на основе принципа «экстремального прицеливания» Н.Н. Красовского
5.7.2. Постановка и формализаия задач оптимального преследования и уклонения летательных аппаратов
5.7.3. Формирование нелинейных алгоритмов преследования и уклонения на основе принципа экстремального прицеливания Н.Н. Красовского
5.7.4. Алгоритм субоптимального позиционного преследования-уклонения
5.7.5. Формирование ПКЗУ в бескоалиционной конфликтной ситуации с антагонистическим ядром на основе принципа экстремального направления Н.Н. Красовского
Text
                    МЕТОДЫ ТЕОРИИ
АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ
Цикл учебников и учебных пособий
основан в 1997 г.
Под общей редакцией заслуженного деятеля науки РФ,
доктора технических наук, профессора
К А. Пупкова


МЕТОДЫ КЛАССИЧЕСКОЙ И СОВРЕМЕННОЙ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Учебник в трех томах ТОМЗ МЕТОДЫ СОВРЕМЕННОЙ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Под редакцией заслуженного деятеля науки РФ, доктора технических наук, профессора Н.Д. Егупова Рекомендовано Министерством образования Российской Федерации в качестве учебника для студентов высших учебных заведений, обучающихся по машиностроительным и приборостроительным специальностям Москва Издательство МГТУ им. Н.Э. Баумана 2000
УДК 681.5:681.3(075.8) ББК 14.2.6 М54 Рецензенты: 1. Академик РАН ЕЛ. Попов; 2. Кафедра автоматических систем Московского института радиотехники, электроники и автоматики (заведующий кафедрой, член-корреспондент РАН ЕЛ Теряев). Авторы: Д-р техн. наук, проф. К А. Пупков, д-р техн. наук, проф. НД. Егупов, д-р техн. наук, проф. А.И. Баркин, д-р техн. наук, проф. ЕМ. Воронов, канд. техн. наук, доц. Л.Г. Комарцова, канд. техн. наук, доц. В.Г. Коньков, д-р техн. наук, проф. Ю.П. Корнюгиин, канд. техн. наук, доц. В.И. Красно- щеченко, канд. техн. наук, доц. АЛ. Курдюков, канд. техн. наук, доц. А. В. Максимов, инженер ЮЛ. Мышляев, канд. техн. наук, доц. В Л. Пи- лишкин, канд. техн. наук, доц. В.И. Сивцов, д-р техн. наук, проф. А.И. Трофимов, д-р техн. наук, проф. Н.В. Фалдин М54 Методы классической и современной теории автоматического управления: Учебник в 3-х т. Т.З: Методы современной теории автоматического управления / Под ред. Н.Д. Егупова. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2000. - 748 с, ил. ISBN 5-7038-1632-7 (Т.З) ISBN 5-7038-1579-7 В третьем томе учебника изложены основные теоретические положения некоторых направлений теории автоматического управления, интенсивно развиваемых в последние десятилетия Рассмотрены методы расчета и проектирования систем, использующие аппарат дифференциальной геометрии Отражены центральные положения теории катастроф, теории хаоса; приведены понятия, связанные с теорией фракталов и их использованием В конце 70-х годов возникла теория робастного управления. Рассмотрены перспективные направления теории робастного управления, основанные на методах Н°° -оптимизаций. Значительное внимание уделено освещению вопросов оптимизации многообъектных многокритериальных систем на основе стабильно-эффективных компромиссов (игровые подходы в управлении) Достаточно полно рассмотрен класс адаптивных систем Впервые в учебной литературе с необходимой полнотой и глубиной отражены основные положения теории интеллектуальных систем В последней главе третьего тома рассмотрены вопросы применения нейрокомпьютеров в системах управления Материал является частью общего курса теории автоматического управления, читаемого студентам МГТУ им Н Э Баумана, ТулГУ, ОИАТЭ и других вузов. Учебник предназначен для студентов вузов; он может быть также использован аспирантами и инженерами, а некоторые положения - научными работниками, занимающимися автоматическими системами. УДК 681.5:681.3(075.8) ББК 14.2.6 ISBN 5-7038-1632-7 (Т.З) © Пупков К.А, Егупов Н.Д, Баркин А И. и др , 2000 I<sRN 5 7018 157Q 7 © МГТУ им. Н.Э. Баумана, 2000 i д огч э- / и jo- 1 э / у- i о Издательств0 МГТу им Н Э Баумана, 2000
Нашим учителям посвящается. ОБЩЕЕ ПРЕДИСЛОВИЕ К УЧЕБНИКУ I. Особенности учебника. Учебник издается в трех томах, с >стоящих из четырех частей и заданий для самостоятельной работы. Для него характерно следующее: 1. Учебник охватывает основные положения, составляющие содержание теории автоматического управления. Изложение материала начинается с основных понятий и определений (сущность проблемы автоматического управления, определение системы управления, фундаментальные принципы управления, основные виды и законы автоматического управления и др.) и заканчивается детальным рассмотрением содержания некоторых современных направлений теории автоматического управления. Поскольку курс теории автоматического управления включен в учебные планы различных инженерных специальностей и является одним из важнейших элементов общетехнического образования, учебник может быть рекомендован студентам, заново приобретающим знания в области теории автоматического управления, и специалистам, которым приходится эти знания восстанавливать. Учебником могут пользоваться также студенты тех специальностей, для которых курс является профилирующим, определяющим квалификацию инженера. При изучении курса студент или специалист должен сделать выборку материала, определяемого конкретной задачей и возможностями общего плана обучения. 2. Содержание учебника имеет инженерную направленность, поэтому изложение ведется с инженерной точки зрения: подчеркиваются главные идеи, лежащие в основе методов, но не всегда приводятся строгие математические доказательства. Учитывая, что без освоения технического аспекта изучение методов теории автоматического управления не приводит к нужному результату (часто имеют место трудности в постановке и решении инженерных задач даже при хороших знаниях теоретических положений), физическая и содержательная сторона дела подчеркивается в течение всего курса. Более того, значительное внимание уделено рассмотрению конкретных промышленных систем управления. Например, в главе 7 тома 2 рассмотрены системы управления теплоэнергетическими параметрами атомных электростанций; в заданиях для самостоятельной работы описаны системы управления, применяемые в атомной промышленности. Примеры, иллюстрирующие теоретические положения и методы расчета, тесно связаны с решением конкретных инженерных задач в таких отраслях, как атомная энергетика, производство летательных аппаратов и др. 3. Методы теории автоматического управления, рассмотренные в учебнике, в большинстве своем ориентированы на применение ЭВМ. Интенсивное развитие процессов автоматизации проектирования систем автоматического управления, обусловленное развертыванием высокопроизводительных вычислительных комплексов в проектно-конструкторских организациях, перемещение центра тяжести процесса проектирования от аппаратного обеспечения к алгоритмическому и программному обеспечению приводят к необходимости разработки нового методологического обеспечения, включая соответствующие вычислительные технологии ([156], том 1).
Предисловие Для содержания книги характерна, в известной мере, «вычислительная окраска», поскольку возможности современных ЭВМ позволяют значительно ускорить сроки проектирования САУ и, таким образом, налагают свой отпечаток на вычислительную часть ТАУ. Успех в решении поставленных задач расчета и проектирования с использованием ЭВМ зависит от многих факторов, основными из которых являются: степень адекватности математической модели системы; степень эффективности численных методов ТАУ, используемых в алгоритмическом обеспечении; наличие высококачественного программного обеспечения; от того, насколько успешно используется творческий потенциал исследователя-проектировщика. При этом решающий фактор остается за человеком, который может решать многие неформализованные задачи. Поскольку системы автоматизированного проектирования (САПР) являются в настоящее время одним из наиболее эффективных средств повышения производительности инженерного труда и научной деятельности, сокращения сроков и улучшения качества разработок, то в главе 8 (том 1) кратко отражены соответствующие положения, в том числе изложены численные методы (аппарат матричных операторов). Рассмотренное в трехтомнике методологическое обеспечение, ориентированное на применение ЭВМ, может служить базой для решения весьма сложных задач инженерного проектирования САУ. 4. В учебнике с единых позиций изложены как основные методы классической ТАУ, так и положения, определяющие содержание некоторых современных направлений теории управления. При рассмотрении материала учитывался тот факт, что периодизация развития ТАУ не является установившейся и общепринятой ([156], том 1). К классическим можно отнести положения, базирующиеся на рассмотрении линейных и нелинейных дифференциальных и разностных уравнении с постоянными и переменными коэффициентами применительно к описанию систем, исследованию их устойчивости и качества процессов. К классическим положениям также можно отнести и описание процессов в про- странствах состояний, поскольку в классической теории широко применялось описание движения в фазовом пространстве. В конце пятидесятых - начале шестидесятых годов появились известные работы Л.С. Понтрягина, Р. Белмана, Р. Калмана, в которых заложены основы теории оптимального управления: принцип максимума, динамическое программирование, функционально-аналитические методы и др. Хорошо известно, что многие идеи теории оптимального управления сформировались на инженерном уровне в классический период ТАУ. Важнейшие результаты теории оптимального управления можно отнести к классическим положениям ТА У. Все указанные положения с необходимой глубиной и полнотой изложены в первых двух томах учебника. Методы современной ТАУ, интенсивно разрабатываемые в настоящее время и включающие аппарат синтеза грубых систем автоматического управления в пространстве состояний, Н* -теория оптимального управления, задачи оптимизации многообъектных многокритериальных систем с использованием стабильно- эффективных компромиссов, синтез систем автоматического управления методами дифференциальной геометрии (геометрический подход), использование непро- компьютерных управляющих вычислительных систем, основные положения теории катастроф, фракталов, хаоса, а также задачи исследования и проектирования адаптивных и интеллектуальных систем отражены во 2-м и в 3-м томах учебника. Таким образом, учебник охватывает наиболее важные разделы теории автоматического управления; вместе с тем он не претендует на всесторонний охват проблема-
Предисловие как инвариантность, теория чувствительности, методы и алгоритмы оценивания динамических процессов, идентифицируемость и методы и алгоритмы идентификации (отражены лишь содержание проблемы и подходы к ее решению), системы со случайной структурой, стохастические системы, теория нелинейной фильтрации и др. 5. Основное содержание и структуру учебника определил коллектив авторов, включающий представителей разных российский школ науки об управлении: К.А. Пупков (МГТУ им. Н.Э. Баумана), А.И. Баркин (Институт системного анализа РАН), Е.М. Воронов (МГТУ им. Н.Э. Баумана), Н.Д. Егупов (МГТУ им. Н.Э. Баумана), В.Г. Коньков (МГТУ им. Н.Э. Баумана), А.П. Курдюков (Институт проблем управления РАН), Л.Т. Милов (Московский государственный автомобильно-дорожный институт (МАДИ)), В.Н. Пилишкин (МГТУ им. Н.Э. Баумана), В.И. Рыбин (Московский государственный инженерно-физический институт (МИФИ)), В.И. Сивцов (МГТУ им. Н.Э. Баумана), Я.В. Слекеничс (Обнинский институт атомной энергетики (ОИАТЭ)), А.И. Трофимов (Обнинский институт атомной энергетики (ОИАТЭ)), Н.В. Фалдин (Тульский государственный университет); этими авторами написана большая часть трехтомника. II. Методические вопросы. Необходимо указать, что никакой учебник не может дать окончательных рецептов для решения широчайшего спектра задач, порожденных практикой проектирования сложных систем автоматического управления. Изложенный в книгах материал призван служить базой, фундаментом, позволяющим с большей скоростью и эффективностью находить пути для решения задач практики. Вместе с тем материал излагается таким образом, чтобы читателю были видны пути практического применения рассматриваемых методов. В большинстве своем методы доведены до расчетных алгоритмов, приводятся таблицы и другой вспомогательный материал, облегчающий их применение. Положения, изложенные во всех разделах, иллюстрируются подробно рассмотренными примерами, связанными с задачами расчета и проектирования конкретных систем. Весьма важным является вопрос методики изучения курса «Теории автоматического управления» с целью стать специалистом в этой области, пользуясь циклом учебных пособий и учебников, издаваемых указанным выше коллективом авторов. Весь цикл учебников и учебных пособий можно условно разбить на три серии: 1-я серия - базовая; эта серия включает три тома настоящего учебника. 2-я серия - базовая повышенного уровня, в которой основное внимание уделено глубокому и достаточно полному изложению методов, определяющих содержание современных направлений теории автоматического управления. 3-я серия - серия учебных пособий, посвященная полному и глубокому изложению теоретических положений конкретных направлений ТАУ, например, статистической динамике нелинейных САУ и др. Сказанное выше иллюстрируется рис. В.1. Базовый уровень приобретается изучением предлагаемого учебника, в котором систематически изложены методы классической и современной теории управления и дано достаточно полное представление о проблематике и путях развития науки об управлении техническими объектами. Содержание каждого из томов учебника серии базового уровня иллюстрируется рис. В.2. После освоения базового уровня можно приступить к специализации в той или другой области теории автоматического управления, изучая соответствующие тома 2-й серии, а также статьи и монографии по специальным проблемам теории управления.
Цикл: Методы теории автоматического управления 1-я серия учебников "Методы классической и современной теории автоматического управления" - серия базового уровня Том 1: Анализ и статистическая динамика систем автоматического управления. М: Изд-во МГТУ, 2000. - 748 с. ♦ Том 2: Синтез регуляторов и теория оптимизации систем автоматического управления. М: Изд-во МГТУ, 2000. - 736 с. Том 3: Методы современной теории автоматического управления. М.: Изд-во МГТУ, 2000. - 748 с. ♦ 2-я серия учебников - серия повышенного базового уровня Том 1: Методы синтеза оптимальных систем автоматического управления. М.: Изд-во МГТУ, 2000. - 512 с. ♦ Том 2: Оптимизация многообъектных многокритериальных систем. М.: Изд-во МГТУ, 2001. ♦ Том 3: Адаптивные, робастные и интеллектуальные системы автоматического управления. М.: Изд-во МГТУ, 2001. 3-я серия - серия учебных пособий, в которых отражены конкретные направления ТАУ (специализация) К.А. Пупков, Н.Д. Егупов, А.И. Трофимов. Статистические методы анализа, синтеза и идентификации нелинейных систем автоматического управления. М.: Изд-во МГТУ, 1998. - 562 с. * К.А. Пупков, Н.Д. Егупов, В.Г. Коньков. Методы анализа, синтеза и оптимизации нестационарных систем автоматического управления. М.: Изд-во МГТУ, 1999.- 684 с. Рис. В.1. Структура цикла учебников и учебных пособий «Методы теории автоматического управления»
Предисловие 1 том: Анализ и статистическая динамика систем автоматического управления В этом томе изучаются* Математическое описание классов систем, отраженных на приводимой ниже структурной схеме 1 САУ, 2 Линейные САУ, 3 Нелинейные САУ, 4 Непрерывные САУ, S Дискретные САУ, 6 Непрерывно-дискретные САУ, 7 Стационарные САУ, 8 Нестационарные САУ, 9 САУ с сосредоточенными параметрами, 10 САУ с распределенными параметрами Анализ и статистическая динамика САУ Детерминированный анализ систем 1 Устойчивость, 2 Качество в переходном режиме, 3 Качество в установившемся режиме и др Статистический анализ линейных и нелинейных систем Линейная фильтрация (фильтры Винера - Колмогорова, фильтры Калмана - Бьюси), нелинейная фильтрация Идентификация объектов управления в классе линейных и нелинейных систем 2 том: Синтез регуляторов и теория оптимизации систем автоматического управления ^ -— Методы и задачи. *———^_^ Синтез систем по заданным показателям качества Методы синтеза регуляторов 1 Группа методов, основанная на принципе динамической компенсации, 2 Группа методов, использующая аппарат математического программирования, 3 Частотный метод, 4 Модальное управление, 5 Методы синтеза грубых систем управления 6 Метод моментов и др Синтез оптимальных систем Методы оптимизации 1 Вариационное исчисление, 2 Принцип максимума, включая управление при ограничениях на фазовые координаты, 3 Динамическое программирование, 4 Аналитическое конструирование регуляторов, S Нелинейное программирование, 6 Метод моментов, 7 Синтез оптимальных обратных связей и др 3 том: Методы современной теории автоматического управления: 1 Синтез систем методами дифференциальной геометрии, 2 Теория катастроф Детерминированный хаос Фракталы, 3 Я" -теория оптимального управления, 4 Адаптивные системы, 5 Оптимизация многообъектных, многокритериальных систем, 6 Интеллектуальные системы и др 7 Нейросетевые методы для решения задач проектирования вычислительных систем Рис. В.2. Структурная схема, иллюстрирующая содержание трехтомника «Методы классической и современной теории автоматического управления» (базовый уровень)
JO Предисловие Если специализация предусматривает расширенное изучение статистической динамики нелинейных систем автоматического управления, то можно воспользоваться учебным пособием К.А. Пупкова, Н.Д. Егупова, А.И. Трофимова «Статистические методы анализа, синтеза и идентификации нелинейных систем автоматического управления». - М: Издательство МГТУ им. Н.Э. Баумана, 1998. - 562 с. (под редакцией д-ра техн. наук, проф. Н.Д. Егупова), в котором систематически изложено содержание основных положений статистической теории нелинейных систем, методов их анализа, синтеза, оптимизации и идентификации. При специализации в области систем автоматического управления с переменными параметрами полезным может оказаться учебное пособие К.А. Пупкова, Н.Д. Егупова, В.Г. Конькова, Л.Т. Милова, А.И. Трофимова «Методы анализа, синтеза и оптимизации нестационарных систем автоматического управления». - М.: Издательство МГТУ им. Н.Э. Баумана, 1999. - 684 с. (под редакцией д-ра техн. наук, проф. Н.Д. Егупова). Этот труд представляет собой первое учебное пособие в отечественной литературе, специально посвященное рассмотрению методов математического описания, детерминированного и статистического исследования, синтеза и оптимизации нестационарных систем. Работа включает две части: в первой части изложена теория линейных систем с переменными параметрами; вторая часть посвящена разработке алгоритмов исследования, синтеза и оптимизации сложных нестационарных систем, поведение которых описывается скалярными и векторно-матричными дифференциальными уравнениями высокого порядка. Алгоритмы предназначены для решения задач, имеющих место в повседневной инженерной практике при расчете и проектировании систем управления одноконтурными и многоконтурными сложными объектами с переменными параметрами. Авторы выражают глубокую благодарность рецензентам - академику РАН Е.П. Попову и коллективу кафедры «Автоматические системы» Московского государственного института радиотехники, электроники и автоматики (МИРЭА), руководимой членом-корреспондентом РАН Е.Д. Теряевым, за ценные замечания, способствовавшие улучшению содержания книги. Авторы благодарят заслуженного деятеля науки и техники РФ, д-ра техн. наук, проф. А.С. Шаталова, заслуженного деятеля науки и техники РФ, д-ра техн. наук, проф. Б.И. Шахтарина (МГТУ им. Н.Э. Баумана), которые своими советами позволили значительно улучшить структуру учебника, углубить изложение отдельных теоретических положений, улучшить окончательный вариант рукописи. Авторы благодарят концерн «Росэнергоатом», научно-исследовательский центр космической системотехники, департамент образования и науки Правительства Калужской области, а также Издательский Дом «Манускрипт» за помощь в издании учебника. Большой объем книги и широта охваченного материала вызвали большие трудности при ее написании. Конечно, эти трудности не всегда удавалось преодолеть наилучшим образом. Читатели, вероятно, смогут высказать много замечаний и дать свои предложения по улучшению книги. Авторы заранее признательны всем читателям, которые не сочтут за труд указать на замеченные неточности, ошибки, на пути совершенствования структуры учебника и его содержания. К.А. Пупков Н.Д. Егупов
Предисловие 11 ПРЕДИСЛОВИЕ К 3-МУ ТОМУ Настоящая книга представляет собой 3-й том учебника «Методы классической и современной теории автоматического управления». Авторы ставили своей целью в 3-х томах изложить как единое целое положения классической и современной теории автоматического управления. Если в первом томе изучаются математические модели широкого класса систем и их динамические характеристики, методы детерминированного и статистического анализа, то второй том целиком посвящен изложению задач синтеза СА У при соблюдении противоречивых требований к устойчивости и качеству и теории оптимизации. В третьем томе отражены основные положения важных направлений теории автоматического управления, развиваемых в последние десятилетия. Назначение IV части третьего тома состоит не в том, чтобы студенты получили полное представление об изучаемой проблеме, а в том, чтобы познакомить их лишь с некоторыми актуальными направлениями и указать пути глубокого изучения их содержания. При этом изложенный во втором и в третьем томах круг вопросов, которые сами по себе имеют важное значение, может служить основой для последующего изучения монографий и статей, связанных с рассмотрением таких проблем, как применение в теории управления геометрических методов, теории катастроф и теории хаоса, Н"3-теории оптимизации, методов оптимизации многокритериальных систем, класса интеллектуальных систем и нейрокомпьютеров и др. В IV части введено понятие бифуркаций, рассматриваются соответствующие определения, для класса операторов определены точки бифуркации, т.е. точки, в которых в уравнении с соответствующим оператором происходит рождение нового, нетривиального решения этого уравнения. Показано также, что хаотическое поведение динамических систем определяется высокой чувствительностью к начальным условиям и невозможностью предсказания поведения на большом интервале времени. Рассмотрены некоторые положения Я00-теории оптимизации. Проектировщик часто не располагает полной информацией о моделях объектов, т.е. последние содержат неопределенности и, таким образом, имеют место информационные ограничения, например, при проектировании новых технологических процессов, объектов новой техники и др. Однако и в этих случаях задача обеспечения требуемых характеристик замкнутой системы должна получить необходимое решение. Сформулированную проблему называют проблемой робастного управления. При проектировании систем автоматического управления часто используют свойство адаптации, когда недостаточная' степень априорной информации восполняется обработкой по соответствующим алгоритмам текущей информации. Системы, обладающие свойством адаптации (что позволяет сократить сроки их проектирования, наладки и испытаний), называют адаптивными. С учетом сказанного можно поставить вопрос о решении проблемы оптимизации в условиях неполной априорной информации (адаптивное оптимальное управление). Подходы к решению указанных задач изложены в учебнике. Пятая часть учебника «Задания для самостоятельной работы и методические пояснения» играет важную роль и содержит 14 тем; она ориентирована на систематизацию, закрепление и расширение теоретических знаний и практических навыков при решении конкретные технических задач. Подчеркивается положение, что абстракт-
\2 Предисловие нов изучение теории автоматического управления без учета физических процессов, протекающих в проектируемой системе, недопустимо и может привести к полной беспомощности в постановке и решении практических задач [108, том 1]. При проведении расчетных работ с помощью ЭВМ студенты обязаны с необходимой глубиной освоить численные методы и иметь представление о реально используемых в вычислительной практике алгоритмах и таких понятиях, как корректность, устойчивость и обусловленность вычислительных задач; об особенностях поведения вычислительной погрешности и др. Другими словами, V часть является органической составляющей учебника и соответствующие темы должны быть освоены с необходимой глубиной: студент должен показать умение использовать теоретические знания, накопленные в результате изучения I - IV частей для решения конкретных задач и освоить в короткий срок соответствующие численные методы, алгоритмическое и программное обеспечение. Некоторые материалы, изложенные во всех томах учебника, могут быть использованы для самостоятельной работы, в частности, для написания рефератов, отражающих с необходимой полнотой содержание актуальных проблем с привлечением других источников. Соавторами отдельных разделов третьего тома являются: канд. техн. наук, доц. И.Г. Владимиров (глава 3 части IV), канд. техн. наук, доц. В.Н. Тимин (глава 3 части IV), инженер К.Ю. Савинченко (глава 4 части IV), канд. техн. наук, доц. Д.А. Аки- менко (часть V), инженер Э.Р. Ахундова (часть V), канд. техн. наук М.О. Габибулаев (часть V), канд. техн. наук, доц. А.К Карышев (часть V), канд. техн. наук, доц. A.M. Макаренков (часть V), инженер Д.В. Мельников (часть V), канд. техн. наук, доц. Я.В. Слекеничс (часть V); главы 3 и 5 части II второго тома и главы 1, 2 части IV третьего тома написаны кандидатом техн. наук, доцентом В.И. Краснощеченко. Авторы выражают признательность сотрудникам редакционно-издательского отдела Калужского филиала МГТУ им. Н.Э. Баумана К.И. Желнову, С.Н. Капранову, К.Ю. Савинченко, МЛ. Трубачеву за подготовку рукописи к изданию и создание оригинал-макета учебника.
ЧАСТЬ IV МЕТОДЫ СОВРЕМЕННОЙ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
14 Методы современной ТАУ. Часть IV ВВЕДЕНИЕ В IV части учебника отражены основные положения некоторых направлений, интенсивно развиваемых в настоящее время. Одно из них формулируется так: расчет и проектирование САУ с использованием методов дифференциальной геометрии. В учебнике изложены основные теоретические положения, в частности, теория алгебры и групп Ли для гладких векторных полей. Рассмотрены подходы к решению актуальных задач теории оптимальных систем, таких как управляемость и наблюдаемость нелинейных объектов. Значительное внимание уделено вопросам синтеза систем стабилизации со скалярным и векторным управлением. В современной теории управления широко применяются такие понятия, как бифуркации, катастрофы, фракталы, теория хаоса. Изучены особенности гладких отображений, приведены основные типы элементарных катастроф. Изучение основных положений теории катастроф направлено на их применение в теории систем управления, в частности, для рассмотрения свойств объектов, связанных с их управляемостью. В этой же главе введено понятие детерминированного хаоса; показано, что он возникает только в нелинейных системах; изучены парадигмы хаоса, приведены классические примеры, характеризующие хаос. Аттракторами хаотических систем являются фрактальные множества с дробной размерностью Хаусдорфа. В третьей главе отражены положения метода Я00 -теории автоматического управления и алгоритм построения робастных регуляторов. Некоторые положения одного из наиболее перспективных направлений теории робастного управления, основанного на методах Я00-оптимизации, изложены в 3-ей главе части. В IV части достаточно подробно рассмотрены методы оптимизации многокритериальных систем, составляющие содержание игровых подходов в управлении. Значительное внимание в IV части уделено рассмотрению теории нового класса систем - интеллектуальным системам. Подробно изложены модели и алгоритмы интеллектуальных систем, параллельные алгоритмы обработки информации, инструментальные средства и пути реализации интеллектуальных систем (глава 6). На решение сложных задач автоматического управления огромное влияние оказало появление вычислительное систем. Наиболее перспективным классом вычислительных систем являются распределенные вычислительные системы (РВС), состоящие, в общем случае, из большого числа удаленных вычислителей, образующих сетевую структуру. Распределенные вычисления позволяют полностью задействовать все ресурсы сети. Вычислительные системы на основе модели распределенных вычислений обладают такими свойствами, как масштабируемость, совместимость, мобильность, т.е. являются открытыми системами. В главе 7 рассмотрены процедуры проектирования РВС с использованием нейронной сети и ряд других вопросов, связанных с применением нейрокомпьютеров в системах управления.
Список используемых аббревиатур и обозначения 15 СПИСОК ИСПОЛЬЗУЕМЫХ АББРЕВИАТУР АдСУ - адаптивная система управления АСГ -алгоритм скоростного градиента АСУ ТП - автоматизированная система управления технологическими процессами БД - база данных БЗ - база знаний ВИ - внезапные изменения ВС - вычислительная система ДАЗУ - динамическое автоматическое запоминающее устройство ДЭС - динамическая экспертная система ИС - интеллектуальная система ИСУ - интеллектуальная система управления МВГ - метод ветвей и границ МВС - многопроцессорная вычислительная сеть ОНО - обобщенный настраиваемый объект ООУ - обобщенный объект управления ОУ - объект управления ПП - переменные переключения ППП - процессор параллельного представления СНС - самонастраивающаяся система СПС - система с переменной структурой СТР - среда транспьютерной реализации ЦУ - цель управления
п 16 Методы современной ТАУ. Часть IV СПИСОК ИСПОЛЬЗУЕМЫХ ОБОЗНАЧЕНИЙ ~, R - отношение эквивалентности = -отношение изоморфизма X,Y -векторные поля в естественном базисе как дифференциальные операторы для гладких функций, определенных на многообразии Мп X(x),Y(x) -координатные представления векторных полей в точке хеМ х -точка многообразия Мп , вектор состояния Мп -гладкое многообразие размерности п U(x) -окрестность точки jc e Мп Gr -r-параметрическая группа G - непрерывная группа преобразований, изоморфная своей г-параметрической группе Gr (группа Ли) ф(я,6) -групповая операция в группе Gr L(G) - алгебра Ли группы Ли G а,Ь,с - элементы г-параметрической группы Gr TaiTb - элементы группы преобразования G (действия группы Gr на многообразии Мп) Xt,Yt -однопараметрическая группа преобразований, фазовый поток для векторных полей X(x)9Y(x) [X,Y](x) -коммутатор, скобка Ли векторных полей X(x),Y(x) I(D) - наименьшая алгебра Ли, содержащая множество управляемых векторных полей D Lx -производная Ли вдоль векторного поля AT(jc) J (Т) - наименьшее линейное подпространство дифференциальных 1-форм, замкнутое относительно операции дифференцирования Ли функций множества функций / векторными полями алгебры /0(£>) у - вектор выхода размерности / х 1 и - вектор управления размерности т х 1 ClczRm - множество управлений (xl9...,xw) - координаты точки хеМп в Rn в исходном базисе (Уи—уУп) - координаты точки хеМп в Rn в новом базисе х' -точка многообразия Мп (х'еМп ), полученная преобразованием точки хеМп х - производная по / по функции x(t)
Глава 1. Синтез САУ методами дифференциальной геометрии 17 ГЛАВА 1. СИНТЕЗ СИСТЕМ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ МЕТОДАМИ ДИФФЕРЕНЦИАЛЬНОЙ ГЕОМЕТРИИ В 1872 г. Феликс Клейн в своей знаменитой Эрлангенской программе сформулировал идею классификации всех видов геометрий на основе симметрии, согласно которой каждая геометрия характеризуется преобразованиями, которые допускается в ней производить над геометрическими объектами, а также свойствами этих объектов, которые не изменяются, остаются инвариантными при этих преобразованиях. Каждая геометрия определяется группой преобразований (группой симметрии), оставляющих те или иные свойства геометрических фигур инвариантными. Так были классифицированы евклидова, аффинная, проективная геометрия и «резиновая геометрия» - топология. Эта идея применения группового подхода давно, широко и с успехом используется в прикладных науках: квантовой механике, кристаллографии, небесной механике и др. Два десятилетия назад геометрический язык проник и в теорию управления, где симметрия реализуется в виде непрерывных групп преобразований (групп Ли). О значении этого подхода говорит тот факт, что ведутся работы по созданию «Единой геометрической теории управления» (ЕГТУ) [38]. Автор ЕГТУ А.Г. Бут- ковский пишет [39]: «Каждое поколение говорит на своём языке: 30 - 40 лет назад в теории управления начался переход на язык функционального анализа, в механике ещё раньше происходил небезболезненный переход на векторный и тензорный языки. Сейчас, по-видимому, настало время переходить на язык современной геометрии. Причём это веление не только внутренних императивов науки. Можно указать, в частности, весьма актуальные научно-технические проблемы, для решения которых нужны более мощные, по сравнению с существующими, теоретические и технические средства. Такие средства нужны, например, для создания распределённых регуляторов для активных, нелинейных, неоднородных и неизотропных сплошных сред». Геометрический подход позволяет с гораздо более широких позиций взглянуть на фундаментальные проблемы теории управления: управляемость, наблюдаемость, инвариантность, декомпозицию и агрегирование. Особенно он полезен для исследования нелинейных систем управления, трудности анализа и синтеза которых общеизвестны. В данном разделе будут изложены основные математические понятия, теоремы и некоторые методы, используемые при геометрическом подходе к задачам синтеза систем управления. Рассмотрены геометрические аспекты управляемости, наблюдаемости, синтеза регуляторов для нелинейных систем управления, приведены многочисленные примеры. К сожалению, охватить все проблемы теории управления достаточно сложно. Более подробную информацию о применении дифференциально- геометрических методов в теории управления можно найти в прекрасном обзоре Ю.Н. Андреева [2]. 1.1. ГЛАДКИЕ МНОГООБРАЗИЯ И ИХ РОЛЬ В ИССЛЕДОВАНИИ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ Развитие теории для достаточно общих классов нелинейных систем требует применения класса пространств состояний более общих, чем линейные пространства. Об этом свидетельствуют следующие примеры [2]: О о~„ л л с
JUj Методы современной ТАУ. Часть IV 1) Множества достижимости билинейных систем (простейших нелинейных систем) подпространствами не являются. 2) При изучении задач управления ориентацией твёрдого тела в качестве пространства состояний фигурирует векторное расслоение (объединение касательных пространств) группы SO(3) (группа кососимметричных ортогональных матриц третьего порядка). Это расслоение не обладает структурой векторного пространства (сумма двух положительных поворотов может дать нулевой поворот). 3) Часто требуется рассматривать движение системы в открытой области Rn, которая не обладает структурой векторного пространства. 4) В задачах аналитического конструирования регуляторов целесообразно рассматривать движение системы не из определённого фиксированного состояния, а сразу из всех возможных состояний, принадлежащих некоторой области, т.е. изучать не отдельные траектории, а переходные отображения системы, заданные фиксированным управлением. При таком обобщении задачи, существенном с позиции приложений, «-мерное дифференциальное уравнение заменяется матричным, а в качестве пространства состояний рассматривается группа по умножению невырожденных квадратных матриц п-го порядка. Такой приём, называемый иногда подъёмом динамики системы из фазового пространства в группу, оказывается весьма полезным в различных задачах. Необходимое для изучения перечисленных ситуаций обобщение достигается применением в качестве пространств состояний дифференцируемых гладких многообразий. 1. Дифференцируемые многообразия. Основная идея дифференциальной геометрии состоит в применении математического анализа к решению геометрических задач. Поэтому объектами изучения должны быть топологические пространства, в которых имеют смысл такие понятия, как дифференцирование и интегрирование. Кривые и поверхности в трехмерном пространстве являются именно такими объектами. Основными инструментами их изучения являются криволинейные координаты. Рассмотрим, как они вводятся на произвольном топологическом пространстве. Введение координат. Если в окрестности U(x) топологического пространства MaRN введены координаты (xu...,xN), то каждую точку окрестности U можно отождествить с некоторой точкой у = (у\,—,у„) арифметического (координатного) пространства Rn(n<N), используя непрерывное взаимнооднозначное (т.е. гомео- морфное) отображение (р. Определение 1.1 [10]. Если задан гомеоморфизм: q>: U(x)-> R", n<N, удовлетворяющий условиям: 1) феС,г>1 (Сг - пространство r-непрерывно дифференцируемых функций), как отображение из RN в Rn\ 2) rank — = п для любой точки у е R" , то пара (U (х) ,ф) называется картой \ду ) точких в Мкласса Сг, или Сг -картой в М Замечание 1.1. Из определения 1.1 следует что карта (£/(л:),ф) точки х является картой любой точки z eU(x). Таким образом, задание карты означает локальное задание множества М (задание окрестности U(x)) в виде:
Глава 1. Синтез САУ методами дифференциальной геометрии 19_ ': (1.1) где ф;, / = 1,2,..,« (n<N) - функции класса Сг, определяющие гомеоморфизм ф. Окрестность точки U(x) часто называют координатной окрестностью ввиду того, что гомеоморфизм (1.1) определяет на множестве U(x) криволинейные координаты уи...,уП9 не связанные, вообще говоря, со стандартными координатами объемлющего пространства RN . Для линейных систем характерно то, что карта (£/(*), ф) взаимнооднозначно отображает всё множество М. Для нелинейных систем это несправедливо. Поэтому карт требуется несколько. Введём ещё одно определение. Определение 1.2. Множество М <zRN называется «-мерным подмногообразием в RN класса Сг(г>1), или Сг -подмногообразием, если каждая его точка имеет некоторую Сг -карту. Будем обозначать это подмногообразие через Мп . Другими словами, множество М в ¥?* - «-мерное подмногообразие, если для каждой его точки можно построить координатную систему; каждая координатная система определена локально (и называется локальной системой координат). Но всё множество координатных систем «охватывает» всё многообразие. Множество координатных систем определяет многообразие Мп с помощью атласа. Определение 1.3. Атласом многообразия Мп называют такое множество карт {(£/а,фа)} класса Сг, открытые множества {Ua} которых образуют покрытие Мп . Атлас {(Ua, фа)} многообразия Мп задает множество координатных систем, «обслуживающих» всё многообразие. Чтобы задать многообразие, достаточно задать какой-нибудь атлас. 00 Ясно, что Мп = [JUa и так как каждая окрестность Ua является открытой, то в а=1 окрестности отдельных карт Ua и U$ (Ua n Up) отображения фа и фр должны быть согласованы, т.е. должен существовать гомеоморфизм перехода от одной системы координат к другой. Пусть (£/,ф) (ф: U->R"% (F,v|/) (у:I/ -> R") - две карты Мп и U п V* 0. Тогда каждой точке Jce£/nF отвечают две системы координат: {^(л:),...,^(д:)} и {А, (л:),..., Aw(jc)} - координаты точек ф(л:)еф(£/пР) и v|/ (jc)gv|/ (UnV), которые, вообще говоря, различны. Обе системы координат равнозначны в том смысле, что существует гомеоморфизм перехода \\1Ц>'] :ц>(иnV)->\\j(UnV)9 связывающий обе системы координат и позволяющий первые координаты непрерывно выразить через вторые: (1.2)
20 Методы современной ТАУ. Часть IV и, наоборот, вторые непрерывно выразить через первые: А, =К,(4,,-..,4„), (1.3) В формулах (1.2) и (1.3) через Хь"-,Хт Viv» Vw обозначены координатные функции отображения q>V~l=(Xi.-.Xii). Если все карты Ua, Fp согласованы таким образом в атласе, то атлас называют согласованным. Для любого атласа А обозначим через Атах множество всех карт, согласованных с каждой картой атласа, и назовем Атах - максимальным атласом атласа А или гладкой структурой на М". Определение 1.4. Хаусдорфово пространство Мсо счетной базой и с заданной на нем гладкой структурой называется гладким (дифференциальным) многообразием. При этом число п (размерность образа карт) называется размерностью многообразия. Другими словами, дифференцируемое многообразие в окрестности каждой своей точки устроено как R", т.е. существует диффеоморфное (гладкий изоморфизм) отображение окрестностей каждой точки в Rn, причем дифференцируемые окрестности близких точек согласованы таким образом, что при помощи гладких замен переменных можно перейти с одной окрестности в другую. Графически это выглядит следующим образом. <V(Ur\V) #nF) Рис. 1.1. Гладкое многообразие и две его карты Пример 1.1. В качестве примера гладкого многообразия рассмотрим проективную плоскость RP2 и найдем максимальный атлас этого многообразия. Точками RP2 являются всевозможные прямые, проходящие через начало координат в R2. Каждая такая прямая однозначно определяется своим направляющим вектором а, а *■ 0. При этом векторы а и Ха, X * 0, являются направляющими для одной и той же прямой. Обозначим через (х\: х2: х») прямую с направляющим вектором а = (хх; х2, *3)т Будем считать, что (х\: х2: *з) = (у\ • Уг: Уз) в том и только том случае, когда ~_« Л „а„,тдВпА иырпп* что v, = Хлл. v->=Xx->. vi= A*3.
Глава 1. Синтез САУ методами дифференциальной геометрии zj_ Введём следующие координаты на RP2 Рассмотрим множество прямых U, (/ = 1,2, 3), у которых /-я координата направляющего вектора не равна нулю. Заметим, что если у одного направляющего вектора а какой-то прямой /-я координата не равна нулю, то это верно и для любого другого направляющего вектора этой прямой, т.к. этот (второй) вектор имеет вид Ха, \±0. Поэтому множества U\, U2> Иъ определены однозначно. А т.к. направляющий вектор прямой не равен нулевому вектору, то, по крайней мере, одна его координата не равна нулю, и, значит, r?,.\ Ut= RP2 Пусть (х\ : х2 : х3) 6 U\. Поставим в соответствие этой прямой точку R2 с координатами ух = x2lx^ у2 =хъ1хх. Числа у\ и у2 назовём координатами прямой (хь х2 x$) как точки RP2 в системе координат, связанной с U\. Таким образом, получено отображение фь (х\: х2 дгз) -> (у\ Уг) Отображение ф| должно иметь обратное, т.к. ф| - диффеоморфизм, имеем фГ1 {у\ у2)=-> (1 У\ )'i), что проверяется непосредственной подстановкой У\=х2/хь у2=х3/х{ и учетом х\ ф О Аналогично определяются диффеоморфизмы Ф2 : U2 -> R2 * (*i: х2. хъ) -> {хх1хг: x3fx1), y3:U3^>R2: (х]: х2 • хъ) -> (х{ 1хъ: хг1х£. Таким образом, на RP2 вводятся три локальные системы координат (три карты) и атлас на RP2 можно задать из 3-х карт (U,, ф,), / =1,2,3 ^i={*-*i*0}> 9iW = (^2/^i^3/^i). и2 = {х:хг*0}9 4>2{x) = (xl/x2ix3/x2)i U3 = {x:x3±0}, щ(х) = (х]/х3,х2/хъ). Найдём отображение перехода из одной системы координат в другую, в такую, где определены обе системы координат. Пусть /= (х{: х2: *з) е U\n U2. В системе координат (£Д, ф,) точка / имеет координаты У\-х21хх> У2=хъ1хь а в системе {и2^2)~У\ =х\1хг> У2~хз^х2- Легко видеть, что У\=\/у\, У2 - У2 I У\ • Эту же связь можно получить, записав в координатах отображениеугуСх. Действительно, {УиУг)-^-^^ У\'У2)-^-*{иУьУг1У\) Так как прямая / = (*,: х2: хъ) - (1: ух у2) лежит в(/|П U2i тоу\ * 0 и отображение ф2 ° фГ1 задается бесконечно дифференцируемыми функциями Аналогичное утверждение верно и для отражений Ф1°Ф21> Фз°Ф21» Фг^з1» Ф^Фз1. Фз°ФТ1- Многообразия - это наиболее общая формулировка пространства состояний (фазового пространства) для динамической системы. Для исследования поведения динамической системы важно знать, как взаимосвязаны точки этого многообразия. И здесь на первый план выходит нахождение группы преобразований, которая действует на заданном многообразии. К изучению свойств таких групп мы и приступаем. 1.2. ГРУППЫ И АЛГЕБРЫ ЛИ 1.2.1. Определение группы Множества и функции на них - вот два типа объектов, к изучению которых сводится, в конечном счете, любая математическая теория [48]. Если аргументы функции/пробегают множество М и она принимает при этом значения из того же самого множества, то / называется алгебраической операцией на множестве М. Наука, изучающая алгебраические операции, называется алгеброй. При этом алгебру интересует только вопрос, как действует та или иная алгебраическая операция, и вовсе не интересует вопрос, на чем она действует. Отвлечься от второго вопроса и сосредоточиться на первом позволяет понятие изоморфизма. Пусть заданы два множества с отмеченными на них алгебраическими операциями, и можно установить взаимно однозначное соответствие между самими множествами и между множествами операций на них, причем соответственные операции будут функциями одинакового числа аргументов и при соответствующих значениях аргументов будут принимать соответ-
22 Методы современной ТАУ. Часть IV ственные значения. Тогда эти множества с операциями называются изоморфными. Изоморфные объекты одинаково устроены в смысле операций, поэтому в алгебре их не различают. Каждый класс изоморфных объектов выделяет в чистом виде некоторый тип алгебраических операций. Это сводит задачу алгебры - изучение алгебраических операций - к более осязаемой задаче изучения множеств с операциями с точностью до изоморфизма. Один из самых распространенных типов алгебраических операций - бинарная (двуместная) операция, подчиненная некоторым аксиомам, которая стала самостоятельным разделом современной алгебры, - а именно разделом теории групп. Сразу заметим, что термин «алгебра», используемый выше, - это термин, используемый для названия одного из разделов современной математики. Далее, при введении понятий «группа Ли» и «алгебра Ли» термин «алгебра» трактуется в более узком смысле и будет раскрыт позднее. Чтобы понять всю мощь применения теории групп для решения задач математики и прикладных наук, достаточно упомянуть следующий факт: в 1830 г. Эварист Галуа, (который ввел термин «группа»), используя групповой подход, достаточно просто показал неразрешимость в общем случае алгебраического уравнения в радикалах при п > 5. Широкое применение эта теория в форме непрерывных групп преобразований получила в физике, в частности, в квантовой механике, в небесной механике и, в последнее время, в теории управления [2, 6, 14]. Непрерывные группы (преобразований) иначе называются группами Ли -в честь норвежского математика Софуса Ли, стоявшего у истоков этой теории и получившего в своих трудах на основе группового подхода основные теоремы о разрешимости системы дифференциальных уравнений в квадратурах. Прежде чем изучать группы Ли, дадим определение абстрактному понятию «группа». Пусть G - множество элементов произвольной природы. Введем на этом множестве бинарную операцию. Бинарная операция (также используется термин «групповая операция») на множестве G - это соответствие, при котором каждой упорядоченной паре элементов данного множества отвечает однозначно определенный элемент этого же множества. Бинарную операцию будем обозначать точкой •. Определение 1.5. Множество G с бинарной операцией • называется группой, если выполнены следующие 3 аксиомы: 1) Ассоциативность (a>b)-c = a-(b-c),Va,b,ceG; (1.4) 2) Существование единицы. В множестве G существует единственный элемент ее G, такой, что а-е = е-а = a,VaeG', (1-5) 3) Наличие обратного элемента. Для любого а е G существует в G элемент х, такой, что а-х = х-а = е. (1-6) Обратный к а элемент будем обозначать а'1. Если V а, Ь е G имеет место равенство a-b = b-a, тогда группа называется коммутативной, или абелевой. Изоморфизм, т.е. взаимно однозначное гомоморфное отображение, абстрактно равных групп позволяет распространить полученные результаты для одной группы на группу, изоморфную ей, т.к. изоморфные группы имеют одну и ту же групповую структуру. Напомним, что гомоморфным отображением (гомоморфизмом) называ-
Глава 1. Синтез САУ методами дифференциальной геометрии 23_ ется отображение одной группы, алгебраической структуры в другую, сохраняющее операции. Последнее означает, что образ результата операции (в частности бинарной), производимой над элементами исходного множества, можно получить, выполнив над образами элементов операцию, определенную на содержащем их множестве. Другими словами, если, например, рассматриваются две группы Gx и G2 с соответствующими бинарными операциями ®! для Gx и ®2 - G2, а/- гомоморфизм/: Gx -> G2, то V а, Ь е Gx имеет место равенство f{a®xb) = f(a)®2f{b), где f(a),f{b)eG2. Рассмотрим пример, где структуру одной плохо формализованной группы Н можно изучать по изоморфной ей хорошо формализованной группе G. Пример 1.2. Пусть элементами группы G служат корни уравнения jc4 — 1 = О, G = {\J-\-j}, где j = <fl . Групповая операция • - обычное умножение. Рассмотрим группу Я вращений квадрата в плоскости, где элементами служат повороты квадрата на соответствующие углы: д° .ф = 0 ; а . ф = 90; а2 • ф =180; а2: ф = 270°, те Я = {e,a = al,a2,a3} В группе G. единичный элемент е-\. Обратные элементы для 1->1; для j->-j ; для -1 -> -1, для -у->/ В группе Я единичный элемент е = а°. Обратные элементы, для а->а3, для а2-+а2, для аг -> а, для е -> е. Обозначим через/. Я -> G отображение группы Я на G а0 а а2 аъЛ 1 J -I -J) Легко проверить, что для любых элементов r,s e И f(rs) = f(r)of(s) Можно показать, что это отображение является изоморфным Например, г • ^ = а4 = а0 (поворот на 360°); /(г.5) = /К) = 1 = / = /(г)./(5) = ;.(-у). Таким образом, изучить структуру группы Я (группы вращения квадрата) можно с помощью более формализованной изоморфной ей группы G 1.2.2. Группы Ли Определение 1.6. Гладкое многообразие Gr размерности г называется группой Ли, если на Gr задана структура гладкого многообразия, т.е. групповые операции гладкие. Иначе говоря, группа Ли (или непрерывная группа преобразований) - это множество преобразований, которое наделено двумя структурами: 1) алгебраически - это группа; 2) топологически - это многообразие, причем обе структуры согласованы между собой. Что она преобразует, мы рассмотрим чуть ниже, а пока определим, в чем заключается согласованность двух этих структур. Пусть ao,bQeGr - некоторые элементы Gr. Существуют такие координатные окрестности Va^, Vbo, VCq точек а0, b0, со= а0- Ьо (• - групповая операция), соответственно с координатами (д1,...,аг),(61,...,6г),(с1,...,сг) - структура многообразия, - что Vao-VbodVCQ и координаты с,-=ф1(а1,...,аг;й,,...,6г) / = 1,г, точки c = a-beVCo являются гладкими функциями от координат точек aeVa),be VbQ, где КО|) • Vba = [а ■ Ыа е Vao,b e Vb<>} (см. рис. 1.2).
24 Методы современной ТАУ. Часть IV Рис. 1.2. Топологическая группа Gr и ее элементы Требование гладкости операции а-> а~х означает следующее. Пусть вблизи точки с0 = Oq1 есть карта Vc с координатами (сь..., сг). Тогда существует такая координатная окрестность VOq точки а0 с координатами (аи...,аг\ что Го~] с VCq и координаты с, =А|-(а1,...,аг), / = 1,г точек с = а"1еГС() - гладкие функции от координат точек ае FO(), где V~} = [a~l \aeV%) (рис. 1.3). Gr Рис. 1.3. К согласованности топологической и алгебраической структур группы С Иначе говоря, если а - групповой элемент вблизи а0, тогда а~] - групповой элемент вблизи uq {. Элементы a, be Gr называются параметрами и определяют группу Gr как r-параметрическую группу. Благодаря изоморфизму непрерывные группы Gr можно рассматривать как непрерывные группы преобразований (действий) на гладком многообразии Мп . Пусть Gr - группа Ли, Мп - гладкое многообразие размерности п. Скажем, что группа Ли Gr действует на многообразии Мп , если для любого элемента а е Gr, хеМ" задано гладкое отображение Та : Мп -> Мп . По другому: каждой паре (а, х), где aeGr, хеМ", соответствует точка ТахеМ", т.е. задано отображение h\Gr хМп -> М" .На отображение И накладываются следующие 3 ограничения (соответствующие аксиомам группы). 1) Отображение h: Gr xM" -> Мп - гладкое. Пусть (х\,...,х'п) - локальная система координат в окрестности Ua Мп точки Та^х0 e(J , где aoeGr, xQeM". Тогда найдутся такие координатные окрестности V, W точек aoeGr, хое М" соответственно, что VWcz{Tv W\v e V с: Gr, w e W аМ" }е U. Поэтому отображение Та : W -+ U можно записать в виде *' = У;(а1,...,аг;л:1,...,х/7), / = 1,л, (1.7)
Глава 1. Синтез САУ методами дифференциальной геометрии 25_ где яь..., аг- локальные координаты в окрестности V, а хь..., хп - локальные координаты в окрестности W, В (1.7) штрих « '» обозначает не производную, а служит для введения новой точки. Тогда требование гладкости отображения h заключается в том, что все функции xl = fl(al,...,ar;xb...,xn), i = \,n гладкие по а иjc. 2) Произведению двух элементов a, be С с групповой операцией (р(я, Ь) соответствует композиция соответствующих преобразований с групповой операцией •, т.е. Тф,ь)=Та.Ть. (1.8) 3) Единичному элементу eeGr отвечает тождественное преобразование id (от английского identity - тождество) многообразия Мп , т.е. Tex = id(x) = x. (1.9) В этом случае r-параметрическая группа Gr изоморфна непрерывной группе преобразований Gf (конечно, каждая группа имеет свою групповую операцию). Структурные свойства группы - это те, которые одновременно принадлежат всем изоморфным между собой группам, а также их алгебрам. Поэтому при изучении структуры группы преобразований G? можно ограничиться ее r-параметрической группой Gr. Исходя из этого, мы в дальнейшем G будем называть r-параметрической группой преобразований (действующей на гладком многообразии Мп) (G = Gr) и не делать между ними различий. Пример 1.3. Группа вращений плоскости. Действует в R2. Преобразование Та _ ( costf s\na\ V-sina cosoy параметр а е G1 (однопараметрическая группа преобразований). Действие в R2 (х'А-т Y-(cosa sina)(x^ х~\ II х'2) " y-sina соБаДд Композиция преобразований (cos a sinaVcos^ sinZ>^| (cos(a + b) sin(a-+-6)^ a b l^-sina cosaj^-sin6 cos^J [-sin(a + ^) cos(a + 6)J Отсюда делаем вывод, что групповая операция в G1 (p(a,b) = a + b соответствует обычному сложению, а групповая операция в O\'TaTh- обычному умножению матриц У данной группы есть специальное обозначение 50(2), что означает: специальная ортогональная, действующая в R2. Группа 50(2) интересна и тем, что здесь можно наглядно проанализировать две структуры (алгебраическую и топологическую). Покажем это: а) алгебраическая структура: cos a sin а} } :0<а<2п[; -sin a cos a) J б) топологическая структура. G1 можно отождествить с единичной окружностью (многообразие с 2-мя картами) Sl ={(cosa,sma):0<a<2n) в R2, что позволяет определить на S0(2) структуру многообразия.
26 Методы современной ТАУ. Часть IV Определение 1.7. Пусть задано действие группы Ли GrHa многообразии Мп. Орбитой точки хеМ" называется множество O(x) = {Tax\aeGr}cMn. Пример 1.4. Орбитой для любой точки х0 = (x]0,x2i))е ^2 группы SO(2) будет окружность радиуса г = ^xw + х20. Пример 1.5. Найдем орбиту действия группы линейных замен координат на множестве матриц линейных операторов. Пусть х - матрица линейного оператора размера nxn,aeG" - множество невырожденных квадратных матриц (пхп) Тогда О(х) = {тах оха"1, VaeG"2} является орбитой (матрицы) х и определяет множество матриц, подобных х . Определение 1.8. Функция co(jc), постоянная на орбитах, называется инвариантом группы преобразований, т.е. co(ro,jc) = co(jc) для всех aeGr,xeO(x)a M". 1.2.3. ИНФИНИТЕЗИМАЛЬНЫЙ ОПЕРАТОР НЕПРЕРЫВНОЙ ГРУППЫ ПРЕОБРАЗОВАНИЙ Рассмотрим преобразования (1.7), которые определяют действие г-параметриче- ской группы Gr на многообразии Мп. Пусть г = 1, тогда *;=/;(я;л:), / = 1Я (1.10) причем /(0;л:)=л:. Пусть z(xj,...,jt^) = z(jc') - произвольная функция от х'. Проведем линеаризацию группы (1.10) в окрестности ее единицы, т.е. разложим функцию z(x') по степеням а в окрестности точки а = 0. Имеем , ,, , . dz(x')\ a2 d2z(x') 2(x) = z(x) + a-^rl\ + — ■—^ da I _n 2 da2 \a=0 (1.11) a=0 Обозначим V да Ja=0 и запишем оператор Учитывая правило дифференцирования сложной функции, можем в первом приближении записать равенство (1.11) как z(x') = z(x) + aXz. (1.14) Равенство (1.14) называется инфинитезимальным преобразованием группы, а (1.13) - ее инфинитезимальным оператором.
Глава 1. Синтез САУ методами дифференциальной геометрии 2Л_ 1.2.4. Алгебры Ли Изучение структуры и свойств группы Ли G - достаточно сложная проблема, подчас неподдающаяся решению. Поэтому неоценимо открытие, сделанное С. Ли, который уже в первых работах установил, что многие свойства, связанные с группами преобразований, такие как инварианты, вопросы структуры, изоморфизм и др., выражаются в терминах алгебры Ли, порожденной данной группой. Алгебра Ли L является линеаризацией группы Ли G в окрестности ее единичного элемента. Поэтому вопросы, связанные с действиями группы Gr, на многообразии (фазовом пространстве) Мп в теории управления определяет управляемость, наблюдаемость, инвариантность, возможность декомпозиции. В силу локального изоморфизма между группой и алгеброй Ли эти групповые свойства можно исследовать по линеаризованной модели группы - ее алгебре Ли. Теория алгебр Ли играет при этом примерно ту же роль, какая отводится в теории линейных систем линейной алгебре. Дадим определение алгебры Ли. Определение 1.9. Алгеброй Ли L называется векторное пространство над вещественным полем R, для любой пары элементов которых а, Ь определена билинейная операция (умножение), удовлетворяющая определенным условиям, а-Ъ = с так, что полученный вектор с принадлежит этому же пространству. Иначе говоря, алгебра Ли - это векторное пространство, занкнутое относительно операции умножения. Это умножение называется коммутатором элементов a, b и обозначается с = [а,Ь]. (1.15) В теории управления коммутатор часто называют скобкой Ли [30, 31, 34, 36], в механике его называют скобкой Пуассона [17, 23]. Мы далее будем называть это умножение коммутатором (это наиболее общее название) либо скобками Ли - когда элементами алгебры Ли будут векторные поля. Введенный коммутатор (операция умножения) должен отвечать следующим условиям: 1) билинейности [сш + №9с] = [а{а,с)] + $[Ь,с], ^ ^ [а>о6 + Рс] = а[а,6] + Р[а,с]; 2) кососимметричности М=-М; (1.17) 3) для него справедливо тождество Якоби [[а,б],с] + [[6>с]>а] + [[с>а]>б] = 0 (1.18) для любых а,Ь,сеЬи a,$eR. • Из выражений (1.17) и (1.18) видно, что алгебра Ли является антикоммуникативной (формула (1.17)) и неассоциативной, где условие ассоциативности заменено тождеством Якоби (1.18). Из свойства 2) также следует, что [а,а] = 0. (1.19) Примеры алгебр Ли 1) Пространство R3 с обычным векторным умножением axb, a,beR3 является алгеброй Ли. Тождество Якоби следует из равенства а х (b х с) = b(a, с) - с(а, Ь), справедливого для произвольных трех векторов a,b,ce R
28 Методы современной ТАУ. Часть IV 2) Множество полиномов от вещественной переменной с коммутатором [p(x)M*)>P{*)fyQ-4{x)fyiy 3) В теории гладких многообразий алгебры Ли (над полем R) возникают как алгебры векторных полей. Векторные поля на гладких многообразиях (обобщение понятия поверхности) выступают как элементы касательных пространств к данному многообразию. Линейное пространство всех касательных векторов к многообразию Мп в точке х называют касательным пространством к многообразию Мп в точке jc и обозначают ТМпх (1.4). Рис. 1.4. Касательное пространство к многообразию Рассмотрим дизъюнктивное объединение всех касательных пространств к многообразию М", которое называется касательным расслоением. Свое название расслоение берет из свойств касательных пространств к многообразию: касательные пространства ТМпх Г\ТМп2 =0 не пересекаются, если х1 фх2, т.е. это объединение выглядит как слоеный вертикально стоящий пирог (см. рис. 1.5). ТМ\ ТМп2 / v - -гМ \ М" хх х2 Рис. 1.5. Касательное расслоение Можно показать [15], что на множестве ТМп можно также ввести структуру гладкого многообразия. Определение 1.10. Векторным полем на многообразии Мп называется отображение Х:М" ->.ТМ", такое, что Х(х)е ТМ" для каждого х е Мп.
Глава 1. Синтез САУ методами дифференциальной геометрии 29^ Векторное поле иногда называют сечением касательного расслоения ТМп. На рис. 1.5 это отображено сплошной волнистой линией на касательном расслоении ТМ" (подробнее см. [10, 17, 42]). Каждое векторное поле AT(jc) является инфинитезимальной образующей для од- нопараметрической (параметр /) группы непрерывных преобразований (диффеоморфизмов, т.е. гладких изоморфизмов) G = {Xt} на многообразии Мп. Выше было рассмотрено, как по действию группы получить ее инфинитезимальную образующую (инфинитезимальной оператор) X , и ниже будет показано, как по инфинитезималь- ному оператору восстановить группу. Векторное поле Х(х) для каждой гладкой функции z(x), определенной на многообразии Мп, является линейным дифференциальном оператором X (оператором дифференцирования вдоль векторного поля Х{х)). Будем придерживаться следующих обозначений: • Ar(jc) = (^1 (jc),...,£w(a:)) - это координатное представление поля в конкретной точке х. • X = ^^i(x)— - векторное поле как дифференциальный оператор для гладких функций, определенных на М". Векторные поля AT(jc), заданные на произвольном гладком многообразии М", образуют алгебру Ли L с коммутатором (скобками Ли) - дифференциальным оператором первого порядка, имеющим координаты [*,Г]Д*) = Лть(*)-И-,(дс), / = 1Я (1.20) где [X,F].(jc) - /-я координата векторного поля [Л',У].(л:) в точке jc. В координатной форме векторное поле (1.20) можно записать в виде [X,F]W = [|]xW-[|]fW, (1.21) fdQ] , ч где т— - матрица Якоби вектор-функции Q(x). 1.3. ГРУППОВОЙ АНАЛИЗ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ. ОДНОПАРАМЕТРИЧЕСКИЕ ГРУППЫ ПРЕОБРАЗОВАНИЙ Для исследования системы обыкновенных дифференциальных уравнений, где в качестве параметра используется время, важно рассмотреть так называемые однопараметри- ческие группы (локальных диффеоморфизмов - взаимно однозначных и непрерывно дифференцируемых отображений), часто называемые фазовыми потоками [17,18]. Пусть на «-мерном арифметическом координатном пространстве Rn задана группа G однопараметрических преобразований (параметр /?), связывающая две точки фазового пространства следующим соотношением (см. формулу (1.10)) х',=Ъ(х,р), (1.22)
jK) Методы современной ТАУ. Часть IV где Ft{x,p) - аналитическая функция по переменным (х,р) в некотором открытом множестве изменения переменной х и в некоторой окрестности параметра р0, соответствующего тождественному преобразованию (pQ — единичный элемент группы G, т.е. х = F(x, p0)). Для удобства сделаем следующее преобразование. Заменим Р = Ро+а, (1.23) где а - также скалярный параметр. Замена (1.23) позволяет свести преобразование (1.22) к следующему х;=^Д*,/?0 + я) = /,(л:,а), / = 1,л, (1.24) где тождественному преобразованию х\ = /; (х,а) соответствует ненулевое значение параметра а, т.е. единичный элемент а0 - 0. Инфинитезимальный оператор для преобразования (1.24) группы G имеет вид (см. пункт 1.2.3) *=!>ц£-> (125) /=1 где $/ = _Щх,а) да 'дх, >У({Х,а)\ _. _ да , / = 1,«. (1.26) 'о Так как группа G преобразований (1.24) является непрерывной, естественно рассмотреть постепенное преобразование точек пространства, по мере того, как мы изменяем непрерывным образом параметр а ота0=0. Итак, имеем *' = /(*,*). (1.27) Рассмотрим вариацию параметра а\а-* a + da. Соседнее значение параметра а л-da будет переводить х в jc' + atc', т.к. / - аналитическая функция параметра а. Но мы можем также найти значение параметра 5а очень близкое к 0 (т.е. преобразование очень близкое к тождественному), которое переводит точку х' в х' + dx'. Значит, мы имеем 2 пути перехода из точки х в х' + dx': а) x' + dx' = f(x,a + da), (1.28) б) *' = /(*,*); x' + dx' = f{x',8a). ' (1.29) Геометрически это выглядит следующим образом (рис. 1.6). f(x';5a) " > X f(x;a+5a) x+dxf Рис. 1.6. Действие однопараметрической группы в окрестности единичного элемента Разложим последнее соотношение (1.29) в ряд Тейлора в окрестности тождественного преобразования а0 = 0.
Глава 1. Синтез САУ методами дифференциальной геометрии 31 Имеем jc'+c&' = /(jc',O) + df{x\b) ЪЪ 6 = 0 5a+... = jc'+$(jc')6a+.... (1.30) В формуле (1.30) учтена зависимость (1.26). Если вариация параметра Ъа очень мала, можно принять ах' = ^(х')да. (1.31) С другой стороны, пользуясь определением группы Ли, имеем x' + ck' = f(x\8a) = f(f(x9a),8a) = f{xMa>4)> С1-32) где q>(a,b) - групповая операция параметрической группы Gj(cm. ниже). Сравнивая выражения (1.28) и (1.32), получим a + da = y(a,ba). (1.33) Найдём, как связан дифференциал da с вариацией параметра 5а. Разложим правую часть (1.33) в ряд Тейлора в окрестности а0 = 0 а + яя = ф(а,0) + S(p(fl,fr) 5b 6 = 0 5я + ... = а + 5q>(a,fr) ЪЬ 6 = 0 Ьа +. Если вариация Ъа мала, то можно принять ,_dq>(a,fr) da = - Откуда 8а = д^{а,Ь) дЪ дЪ 6 = 0 6 = 0 -1 5а. da- \y(a)da. Подставляя формулу (1.36) в (1.31), получим dx' = t,(x')\y(a)da. Если ввести новый параметр / а t = $\\f(a)da, т.е. dt = \\t(a)da, тогда из (1.37) можно определить dx^ dt = фс'),х'{0)=х. (1.34) (1.35) (1.36) (1.37) (1.38) (1.39) (1.40) Новый параметр / для однопараметрической группы преобразований G называется каноническим, т.к. в этом случае групповая операция имеет простейший вид 'з=ф('1>'2) = '1+'2- С1-41) Обратный элемент канонического параметра группы G rl=-t. (1.42) Свойства (1.41) и (1.42) очевидны, т.к. согласно (1.40) дифференциал преобразования dxr линейно связан с дифференциалом параметра / Лс' = $(х')Л, конечно же, при условии, что £(•) не является функцией параметра /. Если параметр t определить как время, то соотношение (1.40) можно трактовать следующим образом:
32 Методы современной ТАУ. Часть IV между однопараметрической группой преобразований в пространстве Rn и системой автономных обыкновенных дифференциальных уравнений с аналитическими правыми частями существует взаимно однозначное соответствие (с точностью до несущественной замены параметра). Интегрируя систему (1.40) мы полностью восстанавливаем группу по её инфинитезимальному оператору (с точностью до замены параметра). Связь однопараметрической группы преобразований G с введенным каноническим параметром / и автономными обыкновенными дифференциальными уравнениями позволяет дать следующее (широко используемое) её определение [3,5]. Определение 1.11. Локальная однопараметрическая группа G (диффеоморфных преобразований) {xt} в многообразии Мп - это отображение RxM в М, (t,x)e IxM -^ Xt(x)eMn ,1 = (-е,е)е R, которое удовлетворяет следующим аксиомам группы: 1) для каждого t e R Xt : х -» Xtx есть преобразование в Мп ; 2) для всех t,s e /, t + s e /, хеМ" Xt+sx = Xt \Xsx) = XtXsx\ (1.43) 3) обратное преобразование имеет вид: если х' = Xtx, то x = X~lx = X_tx'. (1.44) Замечание 1.2. Термин «локальная» показывает, что для нелинейной системы дифференциальных уравнений решение может существовать не для всех t e R . Ниже мы будем придерживаться этого определения, но прилагательное «локальная» для краткости опустим. Сопоставляя введенные аксиомы с аксиомами абстрактной группы (см. §1.2), мы видим, что: 1) параметр а здесь единственный и обозначен через t\ 2) групповой операцией параметрической группы G1 ц>(а,Ь)= a + b = t + s является обычное сложение; 3) умножением в группе преобразований G = {xt) является в общем случае композиция преобразований. Пример 1.6. Рассмотрим группу подобия G , действующую в пространстве R2(n = 2) х' = рх, peR, xeR2 (145) Найдем однопараметрическую группу преобразований и канонический параметр / для данной группы Представим параметр р в окрестности единичного элемента р0 -1 в виде р- ро + а = \ + а . Согласно аксиомам группы а) условие композиции преобразований х' = (\ + а)х, х" = (l + b)x' = (l + b){\ + a)x = (l + a + b + ba)x = (l + c)x Таким образом, групповая операция параметрической группы G1, где единичным элементом является я О = 0, имеет вид с - q>\a,b) = a + b + ab ; (146) б) обратный элемент группы G1 ф(д,а"1) = а + а"|+а"1а = ао = 0, (I 47) где а0 =0 - единственный элемент группы G1. Напомним, что единичным элементом группы G является р0 = 1 . Заметим, что в формуле (1.47) нельзя перемножать а~ха обычным образом, т.е. а~1а -1 , т.к. в этом случае получаемое значение а'1 = -(1 + а) не удовлетворяет групповой операции
Глава 1. Синтез САУ методами дифференциальной геометрии 33_ ф(д,я~1) = а + а~1 +а'1а = а-(\ + а)-(\ + а)а = -(\ + а + аа)* О . Выражала"1 из (1.47), получим а-'=--^-. (1.48) \ + а В этом случае ф(я,я~Ч = 0. Найдем инфинитезимальный оператор группы G . Имеем х\ = ft (х,а) = (1 + a)xh / = 1,2. Согласно формуле (1 26) _У,(х,д) да т.е. оператор группы подобия имеет вид 1.-'-« Ых) = ^РЩ =х„ / = 1,2. • (1.49) С*2 Определим функцию у(д) (см. (1.36)) *В*«ЖГ+*'ЖГ " (150) v(g)=l д. ; = (i + e)-'=-L А = 0J 1 + а Канонический параметр Откуда /-j9(flVfa-f—=ln(l + a) = lnp о ol + fl р = г/. (1.51) Подставляя (1.51) в (1.45), окончательно получим х;=в'х„ 1 = 1,2, (1.52) где / = 0 - единичный элемент параметрической группы G соответствует е = 1 единичному элементу группы преобразований G. Уравнения (1.52) - не что иное, как решение системы дифференциальных уравнений xt = xt, / = 1,2 с начальными условиями х, (о) = х, . Пример 1.7. Рассмотрим на плоскости группу вращения (параметр а - угол поворота): х\ = Xicosa + x2sma = / (х,а), 11 2 -М ' '' (1.53) хг2 = -х, sina + x2cosa = /2(х,а). Найдем инфинитезимальный оператор данной группы. По определению .5/,(д W* «--^ да |а = о 2 Таким образом, оператор имеет вид: *=<-<■ (U4) Найдем групповую операцию* xJ = x',cos^ + X2sina = (x1cosa + X2sina)cos^+(-A:,sina + X2COSa)sin6 = = х, cos(a + b) + x2sin(a + b); x\ = -x'j sinb + x'2cosb = -(xjcosa + x2sina)sin6 + (-XjSina+x2cosa)cos6 = = -x, sin (a + b) + x2 cos(a + b) Таким образом, групповая операция параметрической группы G есть с = ф(д,б)=д + 6. (1.55) А параметр а группы (1.53) является в то же время каноническим, т.е. а = t, преобразование самой группы G имеет вид *,=fC0S' ""'I 0.56) V sin ^ cos /)
М Методы современной ТАУ. Часть IV Можно заметить, что преобразование (1 56) однопараметрической группы вращения G - это переходная матрица состояния для системы дифференциальных уравнений, определяемых оператором группы (1.54) ^! = * т.е. 0(t, 0) = Xt.. Это же утверждение справедливо и для примера 1 6. 1.4. ВЕКТОРНЫЕ ПОЛЯ НА МНОГООБРАЗИЯХ. ПОЛНЫЕ ВЕКТОРНЫЕ ПОЛЯ С каждым элементом а е G группы Ли G связаны два гладких отображения: Ra\ Gr ->Gr ,La: G ->G группы Ли G , которые определяются равенствами Ra{b) = ba, (1.58) La{b)=ab. (1.59) Отображение La называется левым сдвигом, a Ra - правым сдвигом на элемент а е Gr. В координатах имеем: (Lab)t =ф|-(а1,...,аг,й,,...А). О-60) {Rab). =<pl{bb...9br,a]9...9ar), / = l,r, (1.61) где а имеет координаты (a\9...9ar)9 a (bu...,br) - координаты элемента b, La и Ra - гладкие отображения, которые имеют обратные. Формулы (1.60) и (1.61) определяют собой координатные представления групповой операции группы Ли G . Между левым La и правым сдвигом Ra имеют место следующие соотношения: a) LaLb =Lab, b)RaRb=Rab, (1.62) с) LaRb=RbLa. В дальнейшем при исследовании глобального поведения динамической системы на многообразии нам потребуется специальные векторные поля на группах Ли - так называемые лево инвариантные векторные поля. Определение 1.12. Векторное полезна группе Ли Gr называется левоивариант- ным, если оно переходит в себя при увлечении любым левым групповым сдвигом, т.е. L{a\x{Thx)=X{TJbx) (1.63) для произвольных элементов a,b e G . Здесь (La)+ - увлечение векторов Х(Тух) отображением La, т.е. {La)*:TGrb-*TGrab. (1.64) Иначе говоря, при рассмотрении группы G как многообразия увлечение (La)* определяет отображение касательного пространства элемента beG в касательное пространство элемента abe Gr, и это отображение определяется дифференциалом действия элемента а, т.е. (La)*=>dTa. (1.65) Графически левоинвариантность векторного поля X может быть показана следующим образом (рис. 1.7).
Глава 1. Синтез САУ методами дифференциальной геометрии 35 rju^V^ wax) Рис. 1.7. Графическая интерпретация левоинвариантного векторного поля Итак, соотношение (1.63) запишется следующим образом dTa(Tbx)=X(TJbx). (1.66) Это говорит о том, что левоинвариантные векторные поля многообразия Мп касательными отображениями группы переводятся в векторные поля этого же многообразия Мп. Другими словами, левоинвариантное векторное поле всюду на многообразии не имеет особенностей. Это свойство отражено в следующей лемме. л Лемма 1.1 [25]. Левоинвариантные векторные поля на группе Gr однозначно определяются своими значениями в единице группы. Это значит, что единица параметрической группы Gr a = О соответствует тождественному преобразованию: Тох =х (единица группы преобразований) и X{Tax) = (LalX{Tox) = {La),X(x) = dTa(x), (1.67) т.е. касательным отображением группы преобразований можно получить вектор Х(х) в любой точке jc е Мп , где 5с = Тах. Следствие (леммы 1.1) [25]. Пространство левоинвариантных векторных полей на группе Ли конечномерно и его размерность равна размерности группы Ли Gr. Определение 1.13. Алгеброй Ли L(Gr) группы Ли Gr называется пространство всех левоинвариантных векторных полей на группе Ли Gr с операцией умножения - коммутатором векторных полей [•,]. Пример 1.8. Покажем, что инфинитезимальный оператор X группы вращении формирует левоинвариантное векторное поле Х(х). Имеем: 1) оператор X = х2 xj ; дхх дх2 2) векторное поле в координатах х2 3) группа G1 (один параметр а = /) х\ = дг, cos г + дг2 sin r, х\ = —jr, sin/ +дг2 cos/; 4) действие группы Та = Х( х (cost sin/ ^ ' [-sin/ cos/J' Пусть в единице группы (/0 = О, Хо = Е ), дс(О) =дсь Имеем:
36 Методы современной ТАУ. Часть IV x10cos/ + :)C2osinO {-x]0sint + x20cost) Тогда векторное поле в точке Х#о X(TaXo) = X(XlXQJ **<f)U -*»*>' + *»*"'. I -*i(')J l,-(^ocos/ + jr20sin/)j С другой стороны, векторное поле в начальной точке Хо Касательное отображение группы G v " 1^-cos/ - sin /J что дает l^-COS/ -SlnfJ^20J ^-(ДС10С08» + *2051П/); Отсюда мы делаем вывод, X(X,xe)-dX,{xt), т.е. векторное поле Х(х) левоинвариантно. Важнейшее свойство левоинвариантных векторных полей - их полнота. Определение 1.14. Векторное поле Х(х) называется полным, если его однопара- метрическая группа G = (Xt) определена для всех /е(-оо,оо), т.е. решение дифференциального уравнения x(t) = X(x) (1.68) может быть продолжено неограниченно. Уравнение (1.68) с действием группы Xt может быть записано в следующем виде —(Xtx) = X(Xtx), XtxeM\ VxeM", teR]. (1.69) dt Полные векторные поля и их группы G = {х,} удовлетворяют уравнению (1.69) для любого /е (-оо,оо), для неполных это справедливо только в локальной окрестности. Пример 1.9 [17]. Рассмотрим дифференциальное уравнение х = 1. Пусть фазовым пространством (многообразием) для этого уравнения будет открытое подмножество R: M]={xeR:0<x<\}. (1.70) Группа преобразования G определяется действием Х( = (l + f), что приводит к тому, что для всех teO преобразование Xt не переводит фазовое пространство в себя, т.е. XtM] Ч> М] при teO, т.е. векторное поле Х{х) = 1 не имеет однопараметрической группы на этом фазовом пространстве (многообразии). Так как решение определено только для / = 0 - векторное поле не является полным. Причина этого - в некомпактности многообразия Мх (1.70). Имеет место следующая теорема о существовании однопараметрической группы преобразований для некоторого векторного поля Х{х). Теорема 1.1 [17]. Пусть М" - гладкое (класса С,г>2) многообразие, X: Мп -» ТМп - векторное поле. Пусть вектор Х(х) отличен от нулевого вектора ТМпх только лишь компактной части К многообразия Мп. Тогда существует однопа- раметрическая группа преобразований Xt :M" *->Mw, для которой поле Х(х) является полем фазовой скорости, т.е. удовлетворяет дифференциальному уравнению 4(ад=ед*)- (i.7i) at
Глава 1. Синтез САУ методами дифференциальной геометрии 37 1.5. СВЯЗЬ СИСТЕМЫ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ И ЛИНЕЙНОГО УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ ПЕРВОГО ПОРЯДКА. МЕТОД ХАРАКТЕРИСТИК Многие свойства групп преобразований могут быть изложены как решения уравнения в частных производных, поэтому важно знать, как соотносится система обыкновенных дифференциальных уравнений, которыми обычно описывается динамика систем управления, с уравнениями в частных производных. 1.5.1. Метод характеристик решения дифференциальных уравнений в частных производных -Рассмотрим простейший тип дифференциального уравнения в частных производных первого порядка - линейное однородное дифференциальное уравнение для одной неизвестной функции z = z(xl9x2) двух независимых переменных (п = 2) или где дх2 ох2 X -z(x). О, /=1 mi (1.72) (1.73) (1.74) - векторное поле, рассматриваемое как дифференциальный оператор, действующий на гладкую функцию z(x), определённую на поверхности z = v|/(*). (1.75) Уравнение (1.72) имеет тривиальное решение z = const, (1-76) которое мы не рассматриваем, а ищем нетривиальное решение вида (1.75). Дифференциальное уравнение (1.72) будем рассматривать в области 8(х), в которой коэффициенты £,•(*), / = 1,2 определены и непрерывны. Особенность дифференциальных уравнений в частных производных первого порядка состоит в том, что их решение вполне определяется интегральными кривыми некоторых систем обыкновенных дифференциальных уравнений. Для дифференциального уравнения (1.72) к этому результату можно прийти следующим путём. Любое решение z = \\f(x) изображается поверхностью в (z, xh x2) пространстве, лежащей над плоскостью хх0х2 (рис. 1.8). z = m>(a:)>^ линия УР°ВНЯ О (*! =Ф1(О,*2=Ф2(О) Рис. 1.8. К выводу метода характеристик
38 Методы современной ТАУ. Часть IV Точки этой поверхности, лежащие на одной и той же высоте С z = 4/(*) = C, (1.77) образуют некоторую кривую, называемую линией уровня. Уравнение линий уровня имеет вид *1 =Ф1(0» Х2 =Ф2(0» ^ = v(Pl(0» Ф2(0) = С» С1'78) где t - параметр. Дифференцируя соотношение Ч/(ф1(0>Ф2(')) = С по /, получим: f^M')> <P2(')H.(')+|rW')> Ф2('))-Ф2(') = °- (1-79) Так как функция vj/ удовлетворяет уравнению (1.72), то имеем: SiMO. v2(t))'^-M)'Ф2(О)+^(Ф.(О.ф2(0)~(ф.(0.ф2(')И. (1.80) ОХХ ОХ2 Если 5vj/ ас, 5v|/ > 0 всюду, то из соотношений (1.79), (1.80) следует, что <Pi ('Mi Ы')>Ф2 (>))>] Ф2 (0 = ^2 (Ф1 (0» Ф2 (^))-J Итак, проекции линий уровня на плоскости х\Ох2 заданы уравнениями (1.81) и для всех интегральных поверхностей одинаковы. На основании сказанного можно сделать вывод об отыскании интегральных поверхностей: находим интегральные кривые системы дифференциальных уравнений: *'м"!1(м1 <182> *2('M2(*)J Xj =9j(/), jc2 =ф2(^) и поднимаем эти кривые на подходящую высоту так, чтобы они образовали некоторую дифференцируемую поверхность z - v|/(jc). Каждая кривая *l=9l(')>*2=92(0>Z = C О'83) с произвольной константой С называется характеристической кривой или просто характеристикой дифференциального уравнения (1.72). Дифференциальные уравнения (1.82) по отношению к дифференциальному уравнению (1.72) называют характеристическими уравнениями. Интегральные кривыехх =yx{t), х2 =Фг(О в приложениях теории групп Ли называются орбитами действия однопараметрических групп диффеоморфизмов. Справедливы следующие утверждения [4]: 1) каждый интеграл z = \\f(x) уравнения (1.72) постоянен вдоль каждой характеристической кривой (орбиты), т.е. Ч>(ф1(0>Ф2(0) = сош*; С1-84) 2) каждая характеристика (орбита) (1.83), которая имеет хотя бы одну общую точку с интегральной поверхностью уравнения (1,72), целиком лежит на этой поверхности. Таким образом, каждая интегральная поверхность (в теории групп Ли - дифференцируемое многообразие) построена из характеристик (орбит);
Глава 1. Синтез САУ методами дифференциальной геометрии 39^ 3) если две интегральные поверхности уравнения (1.72) имеют общую точку, то они имеют и всю характеристику (орбиту), проходящую через эту точку. Пример 1.10. Найти решение уравнения *'£--*>£-=0- (185) Из характеристического уравнения (1.82) *1=*2' (1.86) х2 = -х, находим *1*1 = *\*2 х2х2 - -ххх2 хххх + х2х2 = 0 или х? +х2= const, т.е. все характеристические кривые являются концентрическими окружностями с центром в начале координат. Но можно подойти к решению этой задачи иначе. Рассмотрим действие векторного поля (оператора) *=*£■*£ (187) на функцию z(x). Тогда уравнение (1.86) примет вид Х-г{х)=0. (1.88) Уравнение (1.88) показывает, что функция z(x) является инвариантом (см. §1.6) группы вращения G, для которой X является инфинитезимальным оператором. Интегрируя уравнения (1.86) или используя ряд Ли (см. §1.6), восстановим эту группу G. Ее действие имеет вид ^ (cos/ sin^ ' ^-sin/ cost) а орбиты (характеристики) определяются выражением с константой уровня с- xf(o)+x2(6). Замечание 1.3. Для дифференциального уравнения (1.72) при п>2 все выводы, полученные для задачи с п - 2, остаются в силе. Замечание 1.4. Инварианты однопараметрических групп Xz(x) = 0 расслаивают пространство Rn на непересекающиеся между собой поверхности, что напрямую в задачах управления связано с управляемостью систем (это будет рассмотрено ниже). 1.6. ВОССТАНОВЛЕНИЕ ГРУППЫ ПО ЕЕ ИНФИНИТЕЗИМАЛЬНОМУ ОПЕРАТОРУ. РЯД ЛИ. ИНВАРИАНТЫ ГРУППЫ Рассмотрим однопараметрическую группу преобразований в окрестности ее единицы (формула (1.14) для z(x') = х') х5=х,+§,(х)-/ + ..., (1.90) где *'<*> = (ir] =i" / = I^ (L91) V ot jt=0 t - канонический параметр. Пусть z(jc) - некоторая функция. Рассмотрим, как преобразуется данная функция с помощью однопараметрической группы (1.90). Имеем z(jc') = z(xi+§1(jc)-/ + ...>x2+§2(jc)-/ + ...,x/i+§ii(jc)./ + ...) = 5(jc;/). (1.92)
_40 Методы современной ТАУ. Часть IV Найдём полную производную функции z(x') по параметру /: ± = ±?LK. (1.93) Учитывая, что (считаем поле левоинвариантным) |Ц,И. (1-94) формулу (1.93) можно записать в виде ^ = Xz(x'), (1.95) at где * = Ъм4т d-96) /=1 oxi - инфинитезимальный оператор. Уравнение (1.95) называется уравнением Лиувилля. Найдем связь преобразованной функции z(x;t) с исходной z(x) и оператором X . Разложим функцию z[x;t) по степеням / в ряд Тейлора в окрестности точки t = 0 . Получим + ... . (1.97) /=о Из выражения (1.92) ясно, что z(x;0) = z(x), а из уравнения Лиувилля (1.95) имеем dt dt v ' В формуле (1.97) это соотношение дает f =XZW- Обозначив Xz(x') = q(xr), т.е. вводя новую функцию, получим согласно уравнению (1.95) ^ = ХЯ(х') = Х(Щх'))=Х^(х'), т.е. dt2 dt2 v ; dt2, n = X2zW. Продолжая аналогичную процедуру, мы находим искомую связь л z(jc;/) = z(jc) + /-X-z(jc) + — -X2-z(jc) + ... . (1.98) Данный ряд называют рядам Ли. Формально рассматривая (1.98) как экспоненциальный ряд, можно записать z{x;t) = etxz(x)9 (1.99) где еа называется операторной экспонентой. Если z(x) = х, тогда формула (1.99) примет вид
Глава 1. Синтез САУ методами дифференциальной геометрии 41_ xi(x;t) = xl =etXxh i = \,n (1.100) или *;=*,.+/■£,.(*) + ..., i = ~n. (1.101) Формулы (1.100), (1.101) показывают, как можно с помощью ряда Ли восстанавливать группу по ее инфинитезимальному оператору X. Учитывая соотношение (1.101), формулу Лиувилля (1.95) можно записать в следующем виде: ИЛИ — = А5. (1.102) dt Дополнив (1.102) начальным условием z(x;0) = z(x), получаем задачу Коши для линейного управления в частных производных относительно искомой функции z(x\t), эквивалентную системе нелинейных дифференциальных уравнений (1.91), т.е. если решение системы (1.91) будет *;. = /;(*,/), /=п, (1.ЮЗ) тогда решение уравнения (1.102) имеет вид z(x;t) = z(/, (*;*), /2 (*;')>-> fn №)). (1.104) Пример 1.11. Рассмотрим группу вращений плоскости х\ =costtj +s'mtx2 (1.105) х2 = —sin/Xj + cosfic2,' которая порождается следующим инфинитезимальным оператором х=**х~ж«т-- (1106) СИГ] ОХ2 Пусть функция z(a:) имеет вид z(x) = Xlx2. (1107) Найдем, как будет изменяться функция z(x) при действии Xt группы вращений *,-(Т sin'l. см») ^-sin/ cos/J В точке д:' функция z(x') будет z{x') = x'vx2i (1.109) а функцию z(x\i) найдем подстановкой выражений (1.105) в (1.109). Получим Убедимся, что функция (1.110) удовлетворяет уравнению (1.102), а значит, является его решением, т.е. при подстановке выражения (1.110) в левую и правую часть (1.102) мы должны получить тождество. Итак, ~ = cos2/(x|-x12)-2sin2fic,x2; (1.111) Xz = \x2——xl^\\-s\n2t(xl-xf) + cos2lxlx2\ = cosb(xl-xf)--2sm2txlx2. (1.112) ^ dx] dx )\2 x ' ) y ' Из выражений (1.111), (1.112) видно, что соотношение (1.110) действительно является решением уравнения (1.102). Рассматривая ряд Ли (1.98), мы можем сделать вывод, что некоторая функция z(x') не изменяется при действии однопараметрической группы, т.е. 2(^;/) = 2(^') = (cos^l+sin^2)(-sin^1+cos^2) = -sin2/(x2-Jc12) + cos2ficix2. (1.110)
_42 Методы современной ТАУ. Часть IV z(x;t) = z(x), (1.113) если Xz(x) = 0. (1.114) Напомним, что такая функция называется инвариантом группы (см. §1.2). Однородное линейное уравнение в частных производных (1.114) позволяет найти орбиты действия Xt. Основное свойство инварианта группы: при умножении инварианта z(x) на произвольную функцию у(х) инвариант является константой для инфинитезимального оператора данной группы. Действительно, учитывая, что z(x) - инвариант, получим X{y(x).z(x)) = X(y(x))z(x) + y(x)X(z(x)) = z(x)X(y(x)). (1.115) Пример 1.12. Для группы вращений плоскости с инфинитезимальным оператором инвариантом группы является функция z(x) = xf+xl, что находится непосредственной проверкой. Инвариантное семейство. Если функция z(x) является инвариантом группы, то, приравнивая ее произвольной постоянной z(x) = c, получим семейство кривых, каждая из которых группой не изменяется, т.е. каждая кривая преобразуется сама в себя, т.е. любая кривая такого семейства является инвариантом кривой. Для практических применений важен иной случай. Пусть задано семейство кривых z(x) = c, причем функция z(jc) не является инвариантом группы G, т.е. преобразования (действия) группы Xt изменяют кривые семейства. Найдем условия, при которых действия группы преобразуют кривые семейства в другие кривые того же семейства. Такое семейство будем называться инвариантным. Задача: найти функцию z(x), которая определяет инвариантное семейство. Пусть zx (х) = с{ и z2(x) = c2 два представления одного и того же семейства. Это значит, что константы сх и с2 функционально связаны, т.е. c2=P(q), (1.116) тогда *2(*)=рЫ*)) 0-Ц7) и условие инвариантности семейства zx (х) = сх состоит в следующем zx(x'j) = ${zx{x)j). (1.118) Разложим lx(x\t) в ряд Тейлора по степеням /, получим z,(Jr,0 = 2l(*) + lpI[zI(*)] + ^p2[z1(*)] + .... (1.119) Сравнивая этот ряд с рядом Ли (1.98), находим необходимое условие инвариантности семейства Аг1(дс) = р(г1(дс)). (1.120) Это условие является и достаточным, т.к. если оно выполняется, то
Глава 1. Синтез САУ методами дифференциальной геометрии 43_ х\(х) = ХЬ(ъ(х)) = ^(21(х)) = р2(ф)) (1.121) azx (см. основное свойство инварианта), т.е. p,^^*)), P2(*i(*)) и т.д. являются инвариантами. Эти условия нахождения инвариантного семейства можно привести к более компактному виду, если учесть следующее. Так как некоторая функция Q(zj (x)) определяет то же инвариантное семейство, то ХО(21(дс)) = Л(2,(дс)). Отсюда следует f.X{zx{x)) = h{zx{x)). Пользуясь свободой в выборе функции Q, положим f-*('.W> Это приводит к условию Az,(*) = l, • (1.122) которое позволяет найти инвариантное семейство. Пример 1.13. Найдем инвариантное семейство для группы вращений плоскости. Инфинитезимальный оператор группы Из условия (1.122) получим *-Х2&Г*'&Г *&-x'a£=1- (1123) Уравнение (1.123) является неоднородным уравнением. Его можно привести к однородному, если воспользоваться следующим правилом. Пусть (рассматривается общий случай) (o(zux) = 0 (1.124) - неявное решение уравнения (1.122). Тогда имеем dxt oz{ oxt cbc; откуда После подстановки (1.126) в (1.122) получим однородное уравнение ±Ш£+Г-0, 0-127) где по-прежнему /=1 uxi Продолжим решение примера. С учетом (1.127) (п = 3) имеем *2- *! —+_ = 0. (1.128) дхх дх2 ozx
44 Методы современной ТАУ. Часть IV Этому однородному дифференциальному уравнению первого порядка в частных производных соответствует следующая система обыкновенных дифференциальных уравнений: Л, dt dt dt = *2> = 1. После исключения параметра t из системы (1.129) получим следующую систему уравнений dxx _ dx-y dzi 2) 1 ' . jc, x< => ou = z, -arcsm—- = z, -arcsin . ' 'af-x? ai >K^ x2 -X| которая имеет следующие первые интегралы: 1) *L.*l => (1.129) (1.130) a,=^?+^2; = 2,-arctg- x2 Общее решение уравнения (1.128) co = p(a1,a2) = pk/xf+:tL2i-arctg-L ' V х2; где р - произвольная функция от 2-х первых интегралов (у однородного уравнения должно быть п -1 первых интеграла: для (1 128) п = 3 ). Пусть \ / х2 Приравнивая р() = 0 , согласно (1 124) получим z^arctg^ + yUxf + xl). х2 \ / Для у^О z', =arctg—^- = 0, х2 определяет пучок прямых, для у = у]х* + х\ z\ = arctg— + yjxf +x\-c2 х2 - семейство спиралей Архимеда. Оба семейства zj, z\ являются инвариантными относительно действия группы вращений. На рис. 1.9 изображено инвариантное семейство arctg—*- = с] х2 arctg—- = c" х2 (второе инвариантное семейство) x' = Xtx JCi - arctg—L = c\ x2 (первое инвариантное семейство) ^ действие группы вращений Рис. 1.9. Инвариантное семейство для группы вращений
Глава 1. Синтез САУ методами дифференциальной геометрии 45_ 1.7. КАНОНИЧЕСКИЕ КООРДИНАТЫ Известно, что для линейных систем управления можно подобрать такой базис, при котором виды дифференциальных уравнений имеют особенно простой вид (диагональная или жорданова матрица общего вида). Такие координаты называют каноническими. В теории непрерывных групп преобразований вид инфинитезимального оператора также зависит от выбранного базиса, поэтому важно найти такую систему координат, при котором вид оператора будет наиболее простым. Попробуем определить ее. Без уменьшения общности рассмотрим однопараметрическую группу преобразований на двумерном многообразии М2. Пусть х = (хьх2)9 хеМ2 - исходные координаты. Введем новые координаты х[=х[{х), х'2=х'2(х). (1.131) Пусть в старых координатах х инфинитезимальный оператор X имеет вид Х = ф)^- + ф)^. (1.132) дхх дх2 Обозначим через X данный оператор в новых координатах X = Ux')^- + l2{x')-^r- (1-133) dXj ox2 Дифференциальному оператору (1.133) соответствует следующая система обыкновенных дифференциальных уравнений (см. §1.5): ., \ (1-134) Уравнение Лиувилля (1.95) здесь имеет вид *± = Хх'и^ = Хх'2. (1.135) at at Таким образом, имеем ' (1-136) где указано, что после применения оператора X необходимо перейти от старых координат к новым. Итак, в новых координатах оператор X имеет вид Х = (Ъ\)\х--х{хщНМ2)\х=х{х.щ. (1.137) Если найти такие координаты х\ что Ajc{ = 1, Х*;=0, (1.138) то в этом случае оператор (1.137) имеет вид х=4т- О-139) Назовем такие координаты дс', где оператор X имеет вид (1.139), каноническими. Для случая, когда п > 2, уравнения перехода к каноническим координатам *i = А (дс), х'2 = х'2 (х), ..., х'„ = *; (х)
46 Методы современной ТАУ. Часть IV выглядят следующим образом: Хх[=1, Л*;=0,..., Хх'„=0, (1.140) где х'2(х), ...,х'п(х) - представляет собой (п-\) функционально независимых инварианта группы инфинитезимального операторах. Функция х[(х) определяет инвариантное семейство группы. Инварианты х'2 (jc), ..., х'п (х) и функция х[(х) являются каноническими координатами группы. 1.8. ФОРМУЛА ХАУСДОРФА. ГРУППЫ СИММЕТРИИ. ТЕОРЕМА ЛИ В § 1.6 было рассмотрено действие Xt однопараметрической группы на функцию z(x). Основной же задачей непрерывных групп преобразований (групп Ли), ради которой и была разработана Софусом Ли теория непрерывных групп, является изучение- групповых свойств дифференциальных уравнений. Поэтому определим, как изменяется система дифференциальных уравнений при действии на нее некоторой однопараметрической группы преобразований. Без уменьшения общности будем рассматривать систему второго порядка: ах{ , ч ах2 с / \ хеМ2. (1-141) Пусть на многообразии М2 задана однопараметрическая группа преобразований: х\ =/j(a:,t),] It \ (1Л42) где т - канонический параметр преобразования. Согласно §1.3 уравнения (1.141) порождают однопараметрическую группу преобразований (диффеоморфизмов) с оператором А = ф)^- + ?>2{х)^-, (1.143) дхх ох2 а группа преобразований (1.142) определяется ее инфинитезимальным оператором Х = ф)-Ц- + г\2{хУ£-. (1.144) axi ох2 Необходимо найти, как изменится уравнения (1.141) при преобразованиях (1.142). В новых переменных х[, х2 уравнения (1.141) примут вид: 7, (1-145) ах2 z / , \ Этим дифференциальным уравнениям соответствует инфинитезимальный оператор группы л=^*'т)^2(*'т)^г (1Л46) Найдем связь между дифференциальными операторами А,Х,А . Для чего запишем преобразование группы (1.142) и обратное ему в виде рядов Ли (операторной экспоненты (1.99)). Имеем:
Глава 1. Синтез САУ методами дифференциальной геометрии 47 х[=е«хь х'2=ехХх2, хх=е хХх{, х2=е *хх2. (1.147) Воспользуемся формулами (1.147) и (1.136), для того чтобы представить оператор А в старых координатах. Имеем: "-(А'>1~(.>£+Ы~м5Г от Из формулы (1.148) находим (Ае-*х\)\х,=хЬ)=^(х), {Ае-*хх'2)\х.=Ах)=ЬП- Так как £, (x)(i = 1,2) не зависит от т (это параметр группы с оператором X), имеем (1.149) откуда — е~хХх[ - AXe~zXx\ + ХАе~хХх[ = 0 . di (1.150) В формуле (1.150) первые два слагаемых - это дифференцирование функций а(х\т) и е~хХ по т, а последний член определяется формулой Лиувилля (1.95) для функции z = Ае~хХх[. Аналогичная формула имеет место для координаты х2. Таким образом, из соотношения (1.150) имеем дифференциальные уравнения с начальным условием — = АХ-ХА = [А9Х\ А{х\т]Хж0=А{х'). (1.151) (1.152) Уравнение (1.151), определяющее преобразованный оператор А, является аналогом уравнения Лиувилля, определяющего преобразованную функцию. Из соотношения (1.151) можно дать другое определение коммутатора (скобки Ли): это есть производная преобразованного оператора А по параметру группы, определяемой оператором X . Решение задачи Коши (1.151), (1.152) осуществим разложением оператора а(х',т) в ряд Тейлора по степеням параметра т : А(х\ Из формул (1.151), Аналогично можнс и ряд примет вид о- --А(х')+х дА дх т2 Э2А т = о+2! di2 152)имеем дА dz ) показать, что д2А дг2 ^о = [[А,Х],Х], + ... . т = 0 (1.153)
(1.157) ^8 Методы современной ТАУ. Часть IV А = А + т[А,Х] + ^[[а,Х\х} + ... . (1.154) Данный ряд называется формулой Хаусдорфа, которая связывает операторы А,Х,А . Если в (1.154) имеет место равенство [Л,Х] = О, (1.155) тогда А = А, (1.156) т.е. преобразования группы с оператором X не изменяют оператора А (или системы дифференциальных уравнений (1.151)). Такая группа (1.142) называется группой симметрии и основная особенность ее преобразований заключается в том, что любое решение системы дифференциальных уравнений (1.141) она переводит в решение этих же дифференциальных уравнений. Основное назначение групп симметрии - это возможность понижения порядка системы дифференциальных уравнений и, в конечном счете, решение этой системы в квадратурах. Именно этой цели и добивался С. Ли при формировании своей теории групп непрерывных преобразований. Полученный результат справедлив для произвольной размерности п. Имеет место следующая теорема. Теорема 1.2 [24]. Пусть задана система обыкновенных дифференциальных уравнений Если известна группа симметрии этой системы, оператор которой Х=2>м^' (1Л58) т.е. [/4,х] = 0 , где А - оператор системы (1.157), тогда система (1.157) может быть понижена в порядке. Доказательство. Предположим, что известна полная группа инвариантов группы оператора (1.158), т.е. известны ее канонические координаты х{=х[{х), х' =х'(х) I в которых оператор X имеет наиболее простой вид (см. §1.7) Тогда условие [/4,x] = 0 переходит в условие [Л,х] = |Я-|г| = 0, (1.15S которое говорит о том, что все координаты оператора
Глава 1. Синтез САУ методами дифференциальной геометрии 49 не зависят от переменной х{, т.е. система уравнений (1.157) в новых координатах х' имеет вид ^i _ I ( \ ~Г -^п\х2>хЪ>"''>хп)- (1.160) Система уравнений (1.160) имеет порядок (п -1): л; 2 _ л -£>2\х2>хЗ>—>хп)> at (1.161) а решение первого уравнения (1.160) может быть получено после получения решения системы (1.161). Итак, было показано, что если рассматривается однородное дифференциальное линейное уравнение первого порядка в частных производных Az = 09 (1.162) где А = 1Ьъ{х)4г> хеМ" (1Л63) и на многообразии Мп задана однопараметрическая группа преобразований {xt} с инфинитезимальным оператором д *-Z*M£, (1.164) /=i то группа G = {Xt} является группой симметрии для дифференциального уравнения (1.162), если она переводит любое решение уравнения (1.162) в некоторое решение этого же уравнения. Необходимым и достаточным условием этого является выполнение равенства [Л,Х] = О. (1.165) Условие (1.165) довольно жесткое, а наличие оператора X , который переводит решение (1.162) в его же решение, можно ослабить, если ввести следующее определение. Определение 1.15. Скажем, что уравнение (1.162) допускает оператор (1.164), который переводит решения уравнения (1.162) в его же решения тогда и только тогда, когда [А,х] = Х{х)А, (1.166) где Х(х) - некоторая функция, зависящая от вида оператора X . Ясно, что если ш(л:) - решение (1.162), тогда [А, Х](о{х) = А{хф))- Х{А®{х)) = \(х)Аа>{х) = 0 . (1.167) Из этого следует, что А{х{(о{х))) = 09 (1.168) т.е. функция ^{х)=Х{4х)) (1.169) 5 Зак 416
_50 Методы современной ТАУ. Часть IV тоже является решением уравнения (1.162), а это значит, что оператор X переводит любое решение (1.162) в другое его решение. Тогда решение (1.162) ш(дс) = const (1.170) должно быть инвариантным семейством для однопараметрической группы преобразования {xt} оператора X (см. §1.6). Для практических приложений важно определить действие нескольких однопара- метрических групп. Но предварительно введем некоторые определения, которые расширяют известные понятия из линейной алгебры. Определение 1.16. Вектор-функции ф;(л:) =(ф;1(д:),...,ф/Л(д:)), / = 1,/и называются линейно связанными, если существуют такие ненулевые функции c,(jc), не все равные нулю, что т 2>,(*М*)=о. /=0 Если (1.170) справедливо только для c,(jc) = 0, / = 1,/и, тогда вектор-функции {ф, (х), / = 1, т) называются линейно несвязанными. Ясно, что введенные термины являются обобщением понятия линейной зависимости и независимости для векторных пространств. Если в (1.170) с, [х) = ch i = 1,т , т.е. это константы, тогда вектор-функции ф, (х) называются линейно зависимыми. Определение 1.17. Операторы Х} =У]£д(*) ,j = hw являются полной сис- к=\ &* темой, если в некоторой открытой области выполнены следующие два условия: 1) операторы Х} линейно не связаны, т.е. гапк{^,(л:)Д2(.х),...^„,(л:)}=/и; (1.171) 2) коммутатор любой пары операторов линейно связанно выражается через операторы системы г 1 т [x,,X,j = ]Tc,,iA (*)*,. (1.172) к=\ Полную систему в теории управления часто называют инволютивной [31, 43]. Если у полной системы операторы коммутируют, т.е. [Х7,Х;] = О, V/,y = lT^, (1.173) тогда такую систему называют инволюционной [4]. Каждую инволютивную систему подходящей заменой базиса можно привести к инволюционной [4] (см. также §1.13). Для инволютивных (инволюционных) систем имеется следующая важная теорема. Теорема 1.3 [13]. Инволютивные (инволюционные) системы характеризуются тем, что однопараметрические группы преобразований (диффеоморфизмов), определенные операторами системы, имеют (п-т) общих функционально независимых инвариантов (интегральный базис), т.е. система уравнений А> = 0, / = Cw (1.174) имеет (п-т) функционально независимых решения coj(jc),...,co/i_/ii(jc) , а любое другое решение является функцией от этих решений. При этом нахождение каждого инварианта позволяет понизить порядок системы на единицу.
Глава 1. Синтез САУ методами дифференциальной геометрии 51 Зная h частных интегралов (инвариантов) со, (л:),...,соЛ (л:), 1 <h<n-m , можно найти остальные (n — m — h) инвариантов посредством введения новых независимых переменных: У\=®\{х)> >>2=ю2(*)>-> Ун=®1,{х)>} Ун+\ ~х/1+\^—->Уп ~хп- В этом случае число переменных уменьшается на h, и переменные y\...yh pac- (1.175) сматриваются как параметры. Пример 1.14. Даны два дифференциальных оператора. OJCj U%2 3 В координатной форме а д / ч а а *,w= (1 176) ' 1 ^ 1 -2 . 0, х2 ~{х\+х2) Хл Коммутатор операторов [xt,X2lx)= <1 0 -1 .0 0 1 -1 0 0 0 0 0 (Г 0 0 1. г 1' 1 -2 о, -(о)= f 1 ^ 1 -2 о, = AT,W, те. система {Х1,АГ2} является инволютивной (полной), где С\г{х)- 1 Составим уравнения для нахождения инвариантов операторов (1 176) (л = 4, т = 2, число инвариантов-2) Аг,со(л-) = 0, Х2а(х) = 0. (1.177) Первый инвариант для (1.177): <й]{х)=х1+х2+х3. Введем новые переменные* У\ =*i +*2+*з> Уг =Х2> Уз =*з; ^4 =*4 (1.178) Обозначим преобразования (1.178) через У = ^(^) • Выразим старые координаты через новые: *1 =У\-У2~УЗ> Х2 =УЪ ХЪ =^3; Х4 =^4 (1 179) Тогда x = g-l(y)- Если в старых координатах х, каждое уравнение в частных производных X,со = 0 соответствует системе обыкновенных дифференциальных уравнений **= Sit (*),* = 1,2,3,4, / = U, то в новых координатах (у^} имеем • ±дук V,. = > -^-^-Х . = Ук U*j xj=r\,k{y) = xiyk{x) х=8'ЬУ В этом случае операторы Хх,Хг в новых координатах имеют вид УМ-хА^п-^-хЦ **к-\у) '' (\ 0 0 0 1 1 0 0 1 0 1 0 (Г 0 0 1 г п 1 -2 0 '<р 1 -2 0 , 5*
52 Методы современной ТАУ. Часть IV r1=JL-2J- ду2 дуъ (1.180) Аналогично, для оператора Y2 получим Уг(у) = Х2у(х) _»(*) *=к"'(у) Зх *,(*) ~«"<у) ■ '1 0 0 ,0 1 1 0 0 1 0 1 0 0^ 0 0 h Х] 1 х4 ) -{х]+х2 V х4 ) ) Х=*\У) ' 0 > Уг Уъ~У\ У2 = У2-г-+(уз-У1)т-+У4—- ду2 ду2 ду4 (1.181) Из соотношений (1.180), (1.181) видно, что в новых координатах понижен порядок системы, координата у{= const является параметром. Ищем второй инвариант (в координатах у ). Инвариант для (1 182): ±2.-2-^ = 0, ду2 ду3 «.М-2***-* (1.182) Заменяя новые координаты на старые получим второй инвариант в исходных координатах х4 Рассмотрим теперь действие нескольких однопараметрических групп. Пусть на многообразии Мп действует г однопараметрических групп преобразования G, (/ = 1, А (параметр /;) с инфинитезимальными линейно несвязанными операторами AT, (i = lr). В этом случае можно считать, что на многообразии Мп действует одна /--параметрическая группа Gr [45], где G, (/ = l,rj - однопараметрическая подгруппа группы Gr. Если г - п-\, то знаменитая теорема Ли о разрешимости уравнения (1.1) в квадратурах определяется следующим образом. Теорема 1.4 (С. Ли, 1873 г.) [8,23]. Если уравнение (1.162) и, соответственно, система обыкновенных дифференциальных уравнений (характеристические уравнения): *i=M*). ; (1.183) *i/i=ii(*). допускает (л-1) -параметрическую разрешимую группу G""1, операторы которой Х1,...,Хп_1 вместе с оператором А составляют линейно несвязанную систему, то уравнение (1.162) решается в квадратурах.
Глава 1. Синтез САУ методами дифференциальной геометрии 53_ Так как локальные свойства группы Ли (непрерывных групп преобразований) можно изучать по их линейному приближению - их алгебре Ли, то, не вдаваясь в подробное изложение термина «разрешимая группа» (детали см. в [45]), покажем, как эта теорема выглядит в алгебраической форме. Пусть {Х]9...,Хп_х} - базис алгебры Ли Ln_x (полная система операторов), т.е. \/Xi е Ln_x, / = 1, п -1, имеем и все другие Скобки Ли также принадлежат Ln_x. Составим новую подалгебру V алгебры Ln_x, которая состоит из элементов У*=[х,.,АД,и = пй * = 1,2... (1.185) и их линейных комбинаций. Из V получим новую подалгебру L\ где элементами являются операторы Zk=[Yi>Yj\> '>> = U-1, * = 1,2... (1.186) и т.д. Определение 1.18. Подалгебра Ls с Lr некоторой алгебры Lr называется идеалом в Lr, если для любых X eLriY e Ls справедливо включение [X,Y]gLs. Для алгебры разрешимой группы Gr (разрешимой алгебры) имеют место включения: Ln_x эГэГз...эО, (1.187) где каждое следующее L является идеалом предыдущего. Теорема 1.5. Уравнение (1.162) решается в квадратурах тогда и только тогда, когда алгебра Ли Ln_x группы Gn~l является разрешимой, т.е. имеет место включение (1.187). Эта теорема имеет важное значение в теории управления для синтеза регуляторов. Рассмотрим уравнение второго порядка Л =/,*!. (,.188) dt2 Ч'7* Если это уравнение допускает оператор Хх, то оно сводится к уравнению первого порядка ^- = v(/,x'). (1.189) at В свою очередь, если это последнее уравнение допускает оператор Х2, оно решается в квадратурах. Легко показать, что любая алгебра L2 = {X]9X2}IA разрешима, точнее, в ней можно выбрать базис так, что [хх, Х2 ] = ${х)Хх. Это означает , что Хх составляет в L2 идеал и мы имеем цепочку L2 zd Lx z>0, т.е. уравнение (1.25) допускает разрешимую группу и разрешимо в квадратурах. Пример 1.15. Рассмотрим уравнение Az = 0, (1190) где AJ± + -2—2-f\. (1191) {дх{ дх2 дх3) Уравнение (1 190) имеет («-l)= (3-l)= 2 интегралов а1(х),(а2(х) Найдем их с помощью групп симметрии. Уравнение (1.190) допускает оператор
_54 Методы современной ТАУ. Часть IV X = xt± + X2JL-(Xl+X2)±. (1192) ОХ\ 0X2 °х\ Действительно, коммутатор двух операторов [А,Х] = А (1.193) подтверждает это и, следовательно, оператор X является инфинитезимальным оператором группы симметрии Для перехода к каноническим координатам У-g(x), y = (yl,y]iy3)T найдем инварианты группы симметрии aj(A*),a2(jc) Имеем (см §1 7 о нахождении канонических координат)- ^ = ^ = _^_ (1 194) *1 Х2 -(Х\+Х2) Из уравнения dxx dx-y находим первый инвариант a,(jc) = -S- = const. (1.195) Х2 dx2 _ с^ъ Из уравнения х2 -(а1*2 + *г) получим второй инвариант a2(*)= ^i + х2 +х3 = const . (1.196) Найдем канонические координаты Составим систему уравнений A>,(x)=l, Ху2{х)=0, (1.197) *л(*)=о.. Две координаты у2(дс) = а,(дс) = ^-, уАх) = *2(х) = *х+*г + Хз d-^8) х2 известны Необходимо найти третью каноническую координату у\{х). Неоднородное уравнение ^>W=i соответствует следующему однородному уравнению *'аГ*21Г(*+*2)аГфГ0' (И99) из которого имеем следующую систему уравнений* dxL=dxL=dxL__dyL (1200) *1 Х2 (Х\+Х2) 1 первые два уравнения дали нам два инварианта cti(:c),a2(:c). Из уравнения ^1 = У] (1.201) х\ получим У\{х)= \пх} . Это и есть третья каноническая координата. Найдем, как будет выглядеть оператор А в новых координатах (канонических) Л = Лух(х)-1- + Луг(х)±-+Луг(х)-Ц- =-^-4--^)^-*0^-\ . (1.202) оу\ оуг оуъ -«-W *'*' V*2 X2j^2 ^3|«.f-W Найдем обратные преобразования д: = g~](y)'. Х2= > У2 >^2 J хъ = уъ-еу<-—. (1.203)
Глава 1. Синтез САУ методами дифференциальной геометрии 55 Заменяя старые координаты в (1 202) на новые (1.203), получим* ^е-л1 + в-л(Л-,|)1 (1.204) Заметим, что в выражении (1.202) это значит, что является интегралом уравнения (1 140), второй интеграл исходного уравнения определим из уравнения Лг = 0. (1205) Этому уравнению соответствует следующая система обыкновенных дифференциальных уравнений1 dt dt (у>-у1) (1 206) Данная система легко решается: j,=ln Уг Уг-\ + 1пс. Переход к исходным координатам определяет еще один интеграл уравнения (1.190) ©2(*)=*,-дг2. (1207) Проверим, что оператор X действительно является оператором группы симметрии: *©,(*)= 0, что уже показано выше, Лю2(дс)= х, —+ *2- (х, +х2)—- (х, -х2) = х{ -х2 , ^ дхх дх2 дх3) т.е. оператор X переводит решения уравнения (1.190) в его же решения 1.9. КОММУТАТИВНОСТЬ ОДНОПАРАМЕТРИЧЕСКИХ ГРУПП И РАЗДЕЛЕНИЕ ДВИЖЕНИЙ В НЕЛИНЕЙНЫХ СИСТЕМАХ Групповой подход к анализу систем-обыкновенных дифференциальных уравнений может быть весьма полезен, когда имеется возможность разделить общее движение системы на отдельные составляющие (эквивалент принципа суперпозиции для линейных систем). При этом не требуется восстанавливать всю группу, а вывод о разделимости можно сделать по их инфинитезимальным операторам. Рассмотрим две системы обыкновенных дифференциальных уравнений: (1.208) л dt d^_ di d-z = $„ = Л„ (*). (x). Этим системам уравнений соответствуют однопараметрические группы: Gx : x)=/)(x,/), / = l,w, (1.209) (1.210)
^6 Методы современной ТАУ. Часть IV G2: *; = ?,(*, т), / = п; (1.211) причем х'{0) = х. (1.212) Инфинитезимальные операторы этих групп: В = Тг\1(х)^-- С1-214) Выясним, как влияет последовательное действие каждой из групп на некоторую точку хе М", т.е. определим коммутацию преобразований из разных групп. Имеем: x' = f(x,t), 1 L (1 215) дс' = *(*',т) = *(/(дг,г),т),| т.е. это коммутация действий однопараметрических групп АпВх: х" = ВхА(х. (1.216) Теперь в другом порядке: x' = BxAtx. (1.217) Определим, при каких условиях х" = х", т.е. композиция преобразований не зависит от порядка выполнения преобразований: BxAt =AtBx. (1.218) Оказывается, коммутативное свойство (1.218) групп G, и G2 имеет место тогда и только тогда, когда коммутируют их инфинитезимальные операторы: АВ = ВА. (1.219) Связь между соотношениями (1.218) и (1.219) легко выявить из рядов Ли. Практическая значимость полученного соответствия определяется следующим утверждением. Утверждение [23]. Если группы G] и G2 коммутируют, то их коммутация является также группой при условии, что отождествляются параметры / и т обеих групп, т.е. q{f[x'9t)9t) = f(q(x,t),t) -группа. Доказательство. Согласно теореме о восстановлении однопараметрической группы G по ее инфинитезимальному оператору А с помощью ряда Ли имеем: q(f(xj)j) = e8teAtx = BtAtx9 f(q{x,t),t) = eAte8tx = AtBtx, тогда условие коммутативности дает BlAtx = AtBtx = (A + B)tx, (1.220) т.е. получена новая параметрическая группа с преобразованием Ct={A + B)t (1.221) и инфинитезимальным оператором С = А + В. (1.222) Из соотношения (1.222) вытекает следующая теорема. Теорема 1.6 (принцип суперпозиции в нелинейных системах) [23]. Если система дифференциальных уравнений
Глава 1. Синтез САУ методами дифференциальной геометрии 57 ~Л{х)^В(х) (1.223) такова, что операторы А и В коммутируют: [Л,/?] = 0, тогда решение системы (1.223) является суперпозицией решений систем (1.208), (1.209) * = ?(/(*o>')>')s/(tf(*o>')>0' где д:0 - начальные условия для систем (1.208), (1.209). Пример 1.16. рассмотрим следующую систему дифференциальных уравнений: Запишем ее в следующем виде: х4 = Зх? + Х\ х = А(х) + Х2+Х3. + В(х), (1.224) где ' 0 ^ 1 1 Г 1 Л 0 0 М+Х3> А(х) = Найдем коммутатор (скобку Ли) векторных полей (дифференциальных операторов) А и В: (1 225) дх2 дх3 дх4 ■i^+<= [А,В](х) = 0 0 0 01 0 0 0 0 0 0 0 0 6х, 0 1 0 ( 0 > 1 1 0 0 ь 0 0 0 1 0 0 0 0 0> 0 0 1 л 0 0 + x3j 0 0 т.е. операторы А и В коммутируют, поэтому можно рассмотреть две системы. 1. (Оператор А) i,=0, хг=1, *з=1, Х4 = JCj +Х2, решение которой x2(t) = t + x20, x3(t) = t + x2Q> ,2 x4(t) = xlQt + -j + x2Qt + x4Q, где xi0, i - 1,2,3,4 - начальные условия для системы (1.226). 2, (Оператор В) *,=1, х4 =3xf + x3, решение которой 4 Зак 416 (1 226) (1 227) (1.228)
_58 Методы современной ТАУ. Часть IV *2(') = *20, V6 ) (1.229) где xlQ, i= 1,2, 3,4 - начальные условия для системы (1.228) Общее решение системы дифференциальных уравнений (1.224) определяется композицией действий однопараметрических групп At,B(, причем в любой последовательности Пусть для определенности *'(') = Vo. т.е. *И') = *2<» *'з(') = *з<» Лз Л Х\ (') = 3 Т + /2ДГЮ + *">' -Y30/ + -Г4() I6 ) Действие однопараметрической группы А, на х' определяет общее решение *(/) = *"(/) = 4*r(/) = 4£,Xo, или покоординатно' x2(t) = t + x'2(t) = t + x20, x3{t) = t + x'3(t) = t + x3l), Г /2 Г/3 1 x4(t) = x\t + — + x2t + x\t = (t + xl0)t+ — + x2{{ + 3 — + t2xU)+x]{(\ + x3{1 + xAl> 2 * ч ч 1и/ 2 "г [в ) Изменение порядка действий однопараметрических групп x(t) = BtAtx0 даст тот же результат После введения основных понятий и теорем рассмотрим теперь, как применяются дифференциально-геометрические методы для решения конкретных проблем теории управления. И начнем мы с основной проблемы теории управления - проблемы управляемости систем управления. 1.10. УПРАВЛЯЕМОСТЬ НЕЛИНЕЙНЫХ СИСТЕМ В начале 60-х годов Р. Калман сформулировал понятия и критерии для управляемости и наблюдаемости. Аналогичные вопросы применительно к нелинейным системам были рассмотрены в начале 70-х годов. Опираясь на работы Чоу (Chow), Германа (Herman), Хеймса - Хермеса (Heymes - Hermes), Брокетта (Brockett [30]) и работая независимо, Лобри (Lobry [47]), Суссман - Джурджевич (Sussman - Jurdjevic [36]) и Кре- нер (Krener [37]) разработали нелинейный аналог линейной управляемости в терминах алгебры Ли /(D) векторных полей на многообразии Мп, генерируемых векторными полями /к иг1'), полученными при постоянных управлениях ir7' e Q,y = 1,2,.... 1. Постановка задачи. Рассматривается нелинейная система управления общего вида У: * = /(*'И)> (1.230) где ueQaR"\ хеМ" - гладкое многообразие размерности n,yeRl, / и g - гладкие функции.
Глава 1. Синтез САУ методами дифференциальной геометрии 59^ Ставится задача: найти алгебраические условия управляемости для системы ]Г . Замечание 1.5. Если рассматриваются неавтономные системы, то вид (1.230) сохраняется, если в качестве переменной состояния возьмем время / с уравнением состояния х0 = 1. Предположим, что у системы ^ векторные поля /к п^'\ являются полными, т.е. для каждого jc° e Ып существует решение дифференциального уравнения х- f[x[t)y*/(')), удовлетворяющего условиям x(t0) = x°,x(t) е Мп для всех te R . Обозначим через (z(/) ,[^o^i]) функцию, определенную на интервале [/0>'i] • Чтобы выяснить, какие возникают тонкости для определения условий управляемости, и найти алгебраические критерии управляемости, введем некоторые определения. Отношение эквивалентности. Термин «отношение» используется для обозначения некоторых видов отображений, заданных на одном и том же множестве. Пусть отображение (Н,#) является отношением, гдеН - некоторое множество, R - некоторое отношение между элементами этого множества. Будем говорить, что элемент у е Е находится в отношении R к элементу х е S, и запишем это в виде yRx. (1.231) Некоторые элементы множества можно рассматривать как эквивалентные в том смысле, что любой из этих элементов при рассмотрении может быть заменен другим. В этом случае говорят, что данные элементы находятся в отношении эквивалентности. Чтобы разбить множество Е на группы (классы эквивалентности) эквивалентных элементов, необходимо выполнить три условия: 1) каждый элемент эквивалентен сам себе, т.е. xRx - условие рефлективности; (1.232) 2) два элемента являются эквивалентными вне зависимости от их расположения в отношении эквивалентности, т.е. если xRy , то yRx - условие симметричности] (1.233) 3) два элемента, эквивалентные третьему, эквивалентны между собой, если xRy и yRz , то xRz - условие транзитивности. (1.234) Таким образом, отношение R является отношением эквивалентности, если оно рефлексивно, симметрично и транзитивно. Заметим, что свойства отношения эквивалентности в точности повторяют в более общем виде аксиомы группы. Действительно: 1) рефлексивность - соответствует наличию единичного элемента группы; 2) симметричность - соответствует наличию обратного элемента; 3) транзитивность - соответствует аксиоме ассоциативности. Вернемся к задаче управляемости. Определение 1.19. Для заданного подмножества U е М" точка д:1 является U -достижимой из начальной точки л:0 (обозначение х] Ах°), если существует ограниченное измеримое управление (w(/),[/0>^]) > удовлетворяющее условию u[t) e Q для t e[/0,/,], такое, что соответствующее решение (*(0>['o»'i]) дифференциального уравнения (1.230) удовлетворяет соотношению лг(/0) = х° , x(i}) = л:1 и jc(/) eU для всех / е [/0)/, ]. Мп -достижимость или достижимость любой точки многообразия jc1 e Мп из х° будем обозначать 4*
^0 Методы современной ТАУ. Часть IV А(х°)={х1еМп:х]Ах0}. Определение 1.20. Будем называть систему ]Г управляемой в точке л*°, если а(х°) = Мп , и управляемой, если Л[х) = Мп для любой точки х е М" . Данное определение управляемости характеризует глобальные свойства системы ]Г и отображает ее групповые свойства. К сожалению, в реальных условиях групповые отношение нам неизвестны, и мы можем воспользоваться только линеаризацией группы Ли, действующей на многообразии М" G = fra eG:xl =Тах°',х\х° е М"\ в окрестности ее единицы, и тем самым рассмотреть ее алгебру Ли. Это приводит к необходимости ввести понятие локальной управляемости. Определение 1.21. Динамическая система управления ^ называется локально управляемой в точке л:0 , если для каждой окрестности U точки л:0 множество достижимости A^jlx0) также является окрестностью точки л:0 (рис. 1.10). U {х1 еМп :х1Аих()} = Аи(х0) Рис. 1.10. Множество достижимости /^Д*0) Определение 1.22. Динамическая система управления ^ называется локально управляемой, если она локально управляема для любой точки х е Мп . Последние два определения также не в полной мере отражают возможность анализа алгеброй Ли динамической системы ^ для оценки управляемости, т.к. для достижимости выполняются условия рефлексивности, т.е. хАх и транзитивности х]Аих° и х2Аих1 следует х2Аих°, но в общем случае не удовлетворяется условие симметричности, т.к. нелинейные системы не обязательно должны быть симметричными, т.е. из х]Аих° не обязательно следует x°AiJxl\ симметричные системы характеризуются тем, что f(x,u) = -/(jc,w) , т.е. существует управление ueQ, позволяющее, сохраняя длину вектора скорости, изменить его на противоположный. По этой же причине вводится более слабое отношение. Для заданного открытого множества [/сЛ/ существует (если система ]£ управляема) единственное наименьшее отношение эквивалентности на U , которое содержит все U -достижимые точки и на которых выполнены все три аксиомы отношения эквивалентности: рефлексивность, симметричность и транзитивность. Будем называть это отношение слабой U -достижимостью и обозначим через WAy. Тогда легко заметить, что x'WAyx" тогда и только тогда, когда существуют точки л:0,...,** е U , такие, что л:0 = х'9...9хк = х", и либо х'Ах1~{, либо xl~xAxl для всех i = \,k. Пллпотто лллтилшриир vc*v ncn YanairTpnunvpT гтапйгтш! РИММРТПИЧНПГ.ТИ
Глава 1. Синтез САУ методами дифференциальной геометрии 61_ Определение 1.23. Система ]Г является слабо управляемой в точке л:0, если WA(x) = M" для всех хеМ". Заметим, что слабая управляемость является глобальной концепцией и не отражает локального поведения системы ^, рассматриваемого в окрестности точки х°, поэтому вновь вводится понятие локальности. Определение 1.24. Динамическая система уравнений ])Г называется слабо локально управляемой в точке л:0 , если для каждой окрестности U точки дс° множество WAy (x° J также является окрестностью точки д:0. Система ^ является слабо локально управляемой, если она локально слабо управляема для каждой точки хеМ". Связь между всеми введенными видами управляемости для нелинейных систем можно изобразить в виде коммутивной диаграммы (рис. 1.11). ]>] локально управляема => ^ управляема ^ локально слабо управляема => ]Г слабо управляема Рис. 1.11. Связь между типами управляемости для нелинейных систем Заметим, что для линейных стационарных систем все 4 вида управляемости эквивалентны [37]. Из всех видов управляемости мы рассматриваем только слабую локальную управляемость, преимущество которой перед остальными видами заключается в том, что она имеет аналог критерия управляемости для линейных стационарных систем, а именно алгебраический критерий управляемости. Пусть V\Mn\ определяет множество векторных полей на многообразии Мп. Введем на V\Мпj операцию умножения двух элементов множества, в качестве которой используем коммутатор (скобки Ли) X-Y = [X,Y] = XY-YX. Пусть D = |/(*>к ) • к £ Q,ir^ = const, / = 1,2, ...> - множество векторных полей для системы ]Г , каждое из которых получено введением некоторого постоянного управления ir ' e Q. Предполагается, что Da V\Mn\ Обозначим через l[D) наименьшую подалгебру V\Mn j, которая содержит D и все линейные комбинации произведений управляемых векторных полей ([*,]) всех порядков, полученных из элементов D . Типовыми элементами I(D) являются линейные комбинации вида где f'(x) = f(x,u ''М для некоторого постоянного управления ir' eQ, / = 1,2,.... Если l(D)(x) = {X(x):X e/(£>)}, тогда для каждого хеМ",I(D) .является ли-
62 Методы современной ТАУ. Часть IV нейным подпространством (в общем случае переменной размерности) касательного пространства ТМ" в точке JC,T.e. l(D)(x)aTM". Подпространство /(D)(jc) постоянной размерности связано с таким понятием теории гладких многообразий как распределение, которое позволяет строить интегральные подмногообразия на многообразии М", что, в свою очередь, связано с управляемостью, инвариантностью, декомпозицией динамических систем. Определение 1.25. Назовем р -мерным дифференциальным распределением (1 < р<п) (или дифференциальной системой размерности р) на многообразии М" отображение Ар:М" ->Tp(x)qTM" (где Тр(х) - р-мерное подпространство касательного пространства ТМ" Vjc е М" ), такое, что Ар = Тр (jc) с ТМ", р = const. Иначе говоря, распределение А^ размерности р на многообразии Мп есть сопоставление каждой точке дсиз М" р -мерного подпространства ^(jc) из ТМ" . Распределение Ар называется инволютивным, если [AT,F](jc)e Ар(х) как только два векторных поля Х(х) и У(х) принадлежат Ар для всех хеМ". Пусть Xl(x)(i = \,p) - гладкие векторные поля, такие, что в каждой точке хеМ" векторы Xl(x)(i = \,p) образуют базис в Ар(х). Требование инволютив- ности заключается в следующем: [xhXJ](x) = fjCl(x)Xk(x),k=\Tp (1.235) (т.е. скобка Ли любых векторных полей Xf (д:), Xj (л:) е Ар является линейно связанной комбинацией базисных векторов распределения), где С~ (х) - гладкие функции на М" . Условие (1.235) говорит о том, что если векторы Х{ (x)(i = \,p\ формируют базис в А^ инволютивного распределения, то их взаимодействие - умножение [у] - не изменяет данного базиса, т.к. нетрудно показать [6], если Xt (x)(i = l9pj порождают инволютивное распределение Ар и функции fl} (дс)еС°°Ши j таковы, что Vjc е Л/, det||/7 (д:) ^ 0, эти векторные поля Х{ {х) = 2^fy {x)Xj {x) порождают то 7=1 же распределение Ар, только с другой параметризацией. Отсюда можно записать, что инволютивное распределение формирует подалгебру Ли размерности р. Мы делаем вывод, что множество I(D) является инволютивным распределением для системы ^ , если dim l(D)(x) = dim Ар (дс) = /? = const, Vjc g M" . Инволютивное распределение на любом гладком многообразии формирует интегральные подмногообразия, связанные с управляемостью, наблюдаемостью, инвариантностью и другими важнейшими понятиями теории управления.
Глава 1. Синтез САУ методами дифференциальной геометрии 63_ Каждое гладкое полное (см. §1.4) векторное поле Х(х) на гладком многообразии формирует одномерное интегральное многообразие (однопараметрическую группу диффеоморфизмов {Xt}) y(t) = Xtx0, причем y(t) = X(Xtx0). Из этого можно заключить, что, в отличие от параметризованной кривой р(/): р: / -> М,I = [to,t{] на многообразии Мп, которая имеет самый общий вид, в том числе и самопересечения (в локальной окрестности), р('1 интегральная кривая y(t) (как одномерное многообразие) векторного поля Х(х) точек самопересечения иметь не может, y{t)=X{X,x0) а в каждой точке х касательным вектором к интегральной кривой у(/) будет Х(х). Инволютивность определяет, как должны быть связаны векторные поля Хх(х)9...9Хр{х)9 чтобы формировать интегральное многообразие размерности \<р<п. Определение 1.26 [3]. Связное подмногообразие Np размерности р в Мп называется интегральным многообразием распределения Ар, если Va: е Np AP = TN"X, т.е. интегральное многообразие Np в каждой точке хе Np касается распределения А^. Распределение Ар называется (вполне) интегрируемым, если для любых х е Мп существует р -мерное интегральное многообразие, проходящее через jc. Если не существует других интегральных многообразий для А^, которые содержат Np, то Np называется максимальным интегральным многообразием для Ар. Классическая теорема Фробениуса устанавливает связь между инволютивными распределениями и интегральными многообразиями. Эта теорема может быть сформулирована в нескольких вариантах, в зависимости от того, какой аспект важен. Теорема Фробениуса 1.7 [34]. Распределение А^ тогда и только тогда интегрируемо, когда оно инволютивно. Теорема Фробениуса 1.8 [3]. Пусть Ар - инволютивное распределение на многообразии Мп . Через каждую точку х е Мп проходит единственное максимальное
64 Методы современной ТАУ. Часть IV интегральное многообразие Np для Ар. Любое интегральное многообразие, проходящее через х, есть открытое подмногообразие в Мп . Теорема Фробениуса 1.9 [37]. Если размерность I(D) = p для каждых х, т.е. /(D) = Др, тогда существует разбиение многообразия Мп на максимальные интегральные многообразия, которые все имеют размерность р и либо не пересекаются, либо совпадают. Ранее мы показали, что действие однопараметрической группы преобразований G = {Xt) на многообразии Мп формирует орбиту (интегральную кривую) Xtx0. Теорема Фробениуса обобщает этот случай при действии нескольких однопараметри- ческих групп {^л,,* = hp\ и показывает, что для инволютивных распределений эти действия формируют орбиту (максимальное интегральное многообразие). Орбиты действия группы локальных диффеоморфизмов обладают очень важным свойством: все точки максимального интегрального многообразия (орбиты) могут быть соединены под действием этой группы, т.к. все точки орбиты находятся в отношении эквивалентности. А это уже определяет управляемость системы. При этом размерность инволютивного распределения Ap(x) = TNp является одной и той же для всех точек х, принадлежащих данной орбите 5,dim Ар (х) = р9 Va: e S . Сформируем теперь алгебраический критерий управляемости. Теорема 1.10 (достаточные условия управляемости). Если динамическая система управления ]Г удовлетворяет ранговому условию управляемости в точке л:0, т.е. RC: dim /(D)(a:°)= dim &„(х°)=п, (1.236) тогда ^ локально слабо управляема в точке л:0 . Замечание 1.6. Если правая часть ])Г является аналитической вектор-функцией, тогда ранговые условия (1.236) являются необходимым и достаточным условием локальной управляемости [37]. 2. Рассмотрим, как полученный критерий соотносится с известным алгебраическим критерием для линейных стационарных систем. В этом случае уравнения состояния ]Г определяют множество векторных полей Z) = {Ax + Bii:iieQ}, (1.237) так что алгебра Ли генерируется векторными полями Х1(х) = Ах,Х2{х) = Ь{9...,Хт+1{х) = Ьт, (1.238) где bj - /-ый столбец матрицы В , */ = 1,т рассматривается как постоянное векторное поле. Заметим, что управление и не входит в базисные векторные поля |Х;л(д:), f = 1,/и + 1>,т.к. система (1.237) линейна по управлению и, а как было сказано выше, умножение векторного поля на ненулевую функцию не измени интегральную кривую поля, а лишь изменит параметризацию векторного поля. Вычисляя скобки Ли (коммутаторы) векторных полей Хх (jc),...,ATm+1 (*), получим (в координатной форме) [Ax,bj](x)=-AbJ,[bi,bj](x)=0;
Глава 1. Синтез САУ методами дифференциальной геометрии 65 [Ax,[Ax,bj]](x) = -A2br [bj[Ax9bj]](x) = 0 и т.д. По теореме Кэли - Гамильтона алгебра Ли I(D) управляемых векторных полей включает в себя постоянные векторные поля A'bj9 i = 0, л -1, j = 1, т. Данная система является аналитической, так что согласно теореме Хермана - На- гано [37] существуют максимальные интегральные многообразия множества D, проходящие через каждую точку xeR". Ранговое условие управляемости (1&36) приводит к хорошо известному критерию Калмана гапк{В;АВ;...,Ап"1в} = л. Несмотря на то, что ранговое условие управляемости (1.236) определяет слабую локальную управляемость, для линейных систем оно определяет и их полную управляемость [37]. • 3. Рассмотрим линейную нестационарную систему x = A(t)x + B(t)u, xeR\ ueRm, (1.239) где A[t)yB[t) - гладкие функции переменной /. Введем дополнительную переменную х0 = t и перепишем уравнение( 1.239) в виде xQ = 1. х = А(хо)х + В(хо)и. (1.240) Построим алгебру для векторных полей D = {(l^(x0)x)T)(0,6l(x0))T,...,(0,ftm(x0))T} = {Xl(x0)Jc))...,Xm+I(x0^)}. Сформируем алгебру Ли I(D) 0 ['••*лм-[и^)Ц,. о о l—bJ(x0)-A(x0)bJ(x0) , j,k=\,m. ; y = i,w; Из этих выражений видно, что ранговое условие управляемости (1.236) для системы (1.240) эквивалентно следующему требованию (достаточное условие управляемости): rank(B{t);DAB{t);D2AB(t);...) = n (1.241) для каждого / е R , где DAB(t)=-B(t)-A(t)B(t), (1.242) (1.243) D'AB(t) = [j-rA(t)yA-lB(t). Условие (1.241) будет и необходимым, если A(t)x,bx(t)9...,bm[t) - аналитические векторные поля. Пример 1.17. Проанализируем управляемость линейной нестационарной системы вида Х = 2 2 й<" (1.244)
66 Методы современной ТАУ. Часть IV Решим задачу управляемости сначала классическим способом с использованием граммиана управляемости ^M)-Hwi)b(0bt(0*tM<*. о где Ф(*,*о) - (ф(/0,/))~ - переходная матрица состояния для системы (1.244). Для матрицы (1.245) А« = 1 / 2 I t1 0 2 t j переходная матрица управляемости имеет вид [1]: Ф(','о) = 'п U 4 ,0</0£/, что дает Ф('о.<) = 1 J к t 0 tl Кроме того, из (1.244) имеем в(0 = 0) Подставляя (1.246), (1.247) в формулу (1.245) получим И<о,'») = /о—*" 8 1 2/02 з"/о з/,3 is/о"/, arf'ftfj (1 246) (1.247) (1.248) Если система (1.244) управляема, то для /, > t0 матрица W(tQitx) должна быть положительно определенной. Чтобы проверить это, в формуле (1.248) сделаем подстановку /, =а/0 , где а>1 . После замены граммиан (1.248) примет вид ' 'о(а-0 W(tQiat0)-- 2^1 3 а + 3а3 ^З"а + 3а3 foll5 а + 3а3 5а5 J, Проверка матрицы W(tQiato) на положительную определенность по критерию Сильвестра дает: Д,=/0£(а-1)>0, л (8 7 7 1 W89 1 10 1 > Л д, = -—а+—+ j + —г - —+—7 + —г + —г >0- ~ \\5 За 15а4 5а5J \45 За2 9а3 9a6J Матрица W^ (/0, /,) - положительно определена (0 < г0 < /,). Это говорит о том, что система (1.244) полностью управляема. Проверим теперь управляемость системы (1.244) по алгебраическому критерию (1.236). Используя выражения (1.243), (1.247), получим •*)=(;> ед. ^в(0=|в(0-а(»)в(»)=- 'I о L 1 (i> ( П \t = Хг{х).
Глава 1. Синтез САУ методами дифференциальной геометрии 67 02в(О=Ц-А(,))о,в(,)=(4-а(о| ч/ V г ( 2 \ 10 u = р,Х1(дС)-р2Х2(л:) = [Х„Х2](д:) Отсюда делаем вывод, что базис алгебры /(D) составляют векторные поля Х^х) и Л^дг). Проверка рангового условия rank/(£>) = rank 1 -j = 2 = я , для / > 0, значит система полностью управляема, что совпадает с ранее полученным результатом. 4. Управляемость билинейных систем. Билинейные системы (БС) описывают динамику многих систем в науке и технике. Уравнения описывают динамику управляемых объектов электроники, химии, биологии, экономики, теплофизики, квантовой механики и имеют следующий вид: *(о4л+У>Л'и]*(>)> 1 ' [ U ) (1-249) y(*)=Cx(t)9 где xeR£ =R" -{0}, С -матрица /хя, ut{t) - скалярные функции, Л, В -матрицы пхп. Из уравнения (1.249) видно, что БС могут служить моделями систем с переменной структурой. В качестве гладкого многообразия для системы (1.249) рассматривается пространство Щ . Сформулируем алгебру Ли I(D) для совокупности векторных полей D = Iax,B,x, i = 1,/wl. Скобки Ли (коммутатор) имеют вид [Нх,Кх] = (НК-КН)х = [Н,К](х) для любых Нх,Кхе D . Тогда /(D) = {^^;ZJ2^;...;^^;[^^i]^;[^H,^]]^;[^H,^]]^;...}. (1.250) Вид алгебры /(£>) говорит о том, что все векторные поля получаются умножением некоторой матрицы размера пхп на один и тот же вектор дге R£ . Из этого можно заключить, что алгебра /(£>) изоморфна (взаимнооднозначный гомоморфизм) подалгебре L алгебры Ли gl (n,R) всех вещественных матриц размера пхп, где в качестве операции умножения (•) используется коммутатор квадратных матриц RrR2=[R,9R2] = R{R-R2R]9 (1.251) где /?,,/ = 1,я е gl(n,R) - произвольные матрицы. Восстановить группу G, которая действует на /^ , по ее алгебре I(D) можно с помощью экспоненциального отображения (см. §1.6) G = {exptX:Xel(D)}. (1.252)
j>8 Методы современной ТАУ. Часть IV Свойство управляемости для БС связано с транзитивностью группы G на R% . Говорят, что множество матриц Q транзитивно на R% , если для любых х, у е R£ существует матрица РeQ, такая, что Рх = у . Транзитивность матричной алгебры означает, что любой линейный базис этой алгебры C\,C2,...,CW,т < п удовлетворяет условию гапк/({С1д:;С2д:;...;Сшдс}) = « для всех хе/?£. (1.253) Для однородных билинейных систем (А = 0) транзитивность алгебры Ли является необходимым и достаточным условием управляемости на /?J [44]. Для неоднородной билинейной системы (1.249) транзитивность матричной алгебры L - это условие только необходимое. Во многих работах рассмотрены и достаточные условия управляемости для билинейных систем (подробнее см. обзор [2]). 5. Выделение базиса и проверка управляемости нелинейных систем общего вида. Рассмотрим систему уравнений ^- = fi(x9u), (1.254) at где х = (х{,...,хп)е Мп,u = (u]9...,um)eQ<z Rm . Функции fi(x9u) полагаем такими, что при каждом допустимом управлении u(t) существует единственное решение, проходящее через точку дс0. Ранее было показано, что движение системы происходит в том, что здесь есть управляющее воздействие и, которое входит нелинейно и параметризует векторное поле Х(х), координаты которого при фиксированном управлении и в каждой точке описываются вектор-функциями (yj (дс,£Г),/ = 1,...,л?). Иногда удается за конечное число шагов выделить базис и для параметризованных векторных полей. Рассмотрим процедуру построения такого базиса. Введем оператор Х = £/,{х>«)^- (1-255) и рассмотрим этот оператор как семейство, параметризованное управлением и. Придавая управлению и различные постоянные допустимые значения и е Q, получаем операторы семейства. Выделим в этом семействе базис, т.е. подставим в (1.255) такие допустимые управления ir1',ir',-,и , что операторы /=1 Я*/ где £>iJ(x)=fi(x9uu)}, п^ =lu{J\...9uJjA9 j = Up - линейно не связаны, а подстановка в формулу (1.255) любого другого допустимого уравнения приводит к оператору, который линейно связанно выражается через ХХ,Х29...>Хр Х = £ц,(*,1<)Х7.. (1.257) Процесс выделения базиса сводится к исследованию на линейную зависимость. Подставляем в (1.255) любое допустимое значение и1 и решаем задачу: найдется ли такое допустимое управление и, что ранг матрицы размера их2
Глава 1. Синтез САУ методами дифференциальной геометрии 69 (Л(х,и) /;(*>«(1)Л rank = 2. Если такое и = ir2' е Q находится, то решаем задачу нахождения такого и е Q, что ранг матрицы размера п х 3 '/,(*,«) а(х,^) fi(x,&f rank = 3 ^(дси) /Я(*,Я«) Л(*,В<2))^ . и т.д. Если на некотором шаге р для любого и е Q ранг матрицы '/,(*,«) /if*,*05) - A(x,n{p)f rank </> + !, то это означает, что левый ее столбец линейно связанно выражается через остальные. После выделения базиса Xj9 j = 1,2,...,р, он пополняется, в результате чего возникает полная система операторов Хх,Х2->~.,Хк\к <п (не путать с полным векторным полем). Таким образом, каждой точке х е Мп ставится в соответствие полная система операторов Хх,Х2,».<>Хк, но, вообще говоря, в разных точках может быть свое число операторов. Определение 1.27. Динамическую систему (1.230) будем называть регулярной [13], если в каждой точке jc e M" рассматриваемой области один и тот же набор постоянных допустимых управлений «'%..., lvp' выделяет базисные операторы и пополненная система X]fX29'.',Xk состоит из одного и того же их числа к операторов. Заметим, что полная система операторов для регулярной системы формирует конечномерную алгебру Ли и, более того, т.к. базис остается одним и тем же для всех х е Мп , можно сделать вывод о том, что полная система операторов для регулярной системы формирует инволютивное распределение А* размерностью к < п (см. определение 1.25). Пример 1.18 [13]. Рассмотрим систему управления d*\ 2 -^- = щххх2+х2ъи2, cbc7 - = «1*1. dt dx3 -£ = *2«2, Ы*1. |*2|<1. (1.258) Для такого класса систем, которые называются аффинными системами управления (т.е. системы, линейные по управлению), имеются другие критерии управляемости в случае, когда и,, / = 1,2 неограниче- ны. Здесь же мы рассмотрим предложенный выше алгоритм. Рассмотрим первый оператор для «W:«<"=0,5<"=l: -, 1 О \j 'а*
^70 Методы современной ТАУ. Часть IV Второй оператор для и® • ti^ = 1, п^ = 0: v _ д д Проверяем их линейную несвязанность: , f х-уХ-х 0 х71 п rank 23 2 =2,если хгх2*0. \Х\Хг х\ °) Третий оператор для i/(3): wf3) = -1, п^ = 0: v - д д Проверка линейной несвязанности: rank хгх\ 0 х2 ххх2 х, 0 = 3, если д:, • х2 * 0. -х{х2 х, 0 Система операторов ХЬХ2,ХЪ является полной. Действительно, при любых допустимых управлениях и,,и2 оператор X выражается линейно связанно через ХиХ2,Хъ (это инволютивная система для области х1х2 * 0) в виде Х = щХ, + Х-(их-и2)Х2-±{щ + и2)Хъ. Полная система операторов позволяет судить об управляемости системы (1.254) по наличию у нее первых интегралов. У системы уравнений Ху(о(^) = 0,у=п (1.259) имеется (n-к) функционально независимых инварианта, которые являются первыми интегралами для системы (1.254). Если у динамической системы (1.254) есть первый интеграл co(jc), тогда пространство Rn расслаивается на (п-\)-мерные инвариантные поверхности со(д:) = С: если начальная точка принадлежит поверхности со(д:) = Со , то при любом управлении u(t) траектория *(/) будет оставаться на этой поверхности. Следовательно, наличие у динамической системы первого интеграла исключает полную управляемость. Из этого следует следующая теорема. Теорема 1.11 [13]. Динамическая система управления (1.254) управляема тогда, когда система операторов Хх> АГ2,..., Хк , полученная в результате пополнения операторов Х\,Х2>—> Хр , содержит п операторов, т.е. к = п. Рассмотренный выше пример не имеет первых интегралов (инвариантов), поэтому она управляема в локальной окрестности некоторой точки хх ф 0,х2 * 0. Замечание 1.7. Фактически теорема 1.11 - это другая формулировка рангового условия управляемости (1.236), где полная система операторов {Х1,Х2,...9Хк,к = п) получена для системы управления общего вида: vwfc{XuX2,...,Xk}u=r*nkl(D) = n. 1.11. НАБЛЮДАЕМОСТЬ В НЕЛИНЕЙНЫХ СИСТЕМАХ 1. Рассматривается динамическая система управления общего вида
Глава 1. Синтез САУ методами дифференциальной геометрии 7j_ где и е Q с Rn\ х е М" - гладкое многообразие (фазовое пространство) размерности п, у е R\ f и g - гладкие функции. Наблюдаемость системы ^ отражает возможность по наблюдениям за вектором выхода y(t) однозначно восстановить вектор состояния x(t). Отсутствие полной наблюдаемости возникает в случае неоднозначности восстановления, т.е. когда одному и тому же выходу y(t) соответствует два и более состояния jc1 (/), х2 (/). Система ^ определяет следующее отображение: для каждого допустимого входа {и (0 > 1Уо А ]) и начального условия jc(/0 ) = х0 дифференциальное уравнение д: = /(л:,1/(/)) определяет решение (■*('), ['о >'il) с заданным начальным условием, которое, в свою очередь, формирует выход {у(*),[(о>*\]) согласно соотношению .КО = g{x{t)) • Обозначим это отображение как 2,0 :(«(<).['<>>'.])-*CK'UW.])- (1-261) Определение 1.28. Будем говорить, что пара точек х0 и Jc0 неразличима (обозначение: хо1хо), если для каждого допустимого управления (w(^),[^o,^]) имеем Ч (u(t),[t0A]) = 4 {«ШМ])> (1-262) т.е. при одном и том же входном воздействии и(/) и разных (в общем случае jc0 ф Jc0) начальных условиях выходные сигналы (j>(')>lA)>'i]) совпадают. Неразличимость / (как некоторое отношение на М") определяет на множестве Мп отношение эквивалентности. Действительно, это отношение удовлетворяет аксиомам эквивалентности: 1) a:0/Jc0 , рефлексивность, 2) jco/jco о хо1хо, симметричность, 3) если хо1хо, a jco/Jco , то jco/jco , транзитивность. Данный подход позволяет нам дать следующее определение наблюдаемости. Пусть 1(х0) обозначает класс эквивалентности (т.е. множество элементов МЛ, которые эквивалентны по отношению / элементу jc0 ) х0 е Мп. Определение 1.29. Говорят, что система ^ наблюдаема в точке д:0, если 1(хо) = {хо), т.е. класс эквивалентности (неразличимости точек) состоит из одной точки д:0. Если /(*) = {jc} Va: е Мп, то система ]Г называется наблюдаемой. В отличие от линейных стационарных систем, где понятие наблюдаемости является глобальным понятием и определяется только видом матриц А и С (jc = Ax + Bu;y = Cx + Du)9 для нелинейных систем необходимо ввести локальное понятие наблюдаемости. Определение 1.30. Пусть U - это некоторое подмножество Мп и xo,xoeU. Будем говорить, что точка х0 U -неразличима от хо(хо1ихо), если для каждого управления (w(/),[/o^il) траектории (*(/),I/o>'i])> (Jc(/),[/0,/1 ]), начинающиеся
12 Методы современной ТАУ. Часть IV соответственно в точках хои х0, обе лежат в £/,т.е. x(t)eU , x(t)eU для [/0,'i], и при этом Me(').[<o.'i]) = Me('MWi])- (1-263) ^/-неразличимость 1и в общем случае не является отношением эквивалентности (в отличие от глобального отношения /). И в основном не выполняется аксиома о транзитивности [37]. Поэтому вводят понятие локальной наблюдаемости. Определение 1.31. Система ]Г является локально наблюдаемой в точке х0, если для каждой открытой окрестности U точки дс0, 1и (xQ) = {x0) . Система ^ является локально наблюдаемой, если она локально наблюдаема в каждой точке х е Мп. С другой стороны, понятие «наблюдаемость» можно ослабить, т.к. на практике достаточно различать точку дс0 не от всех точек многообразия М", а только от ее соседей. Поэтому введем следующее определение. Определение 1.32. Система ]Г называется слабо наблюдаемой в точке jc0, если существует окрестность U точки д:0, такая что l(xo)nU(xo) = {xQ). Система ^ - слабо локально наблюдаема, если это условие выполнено в каждой точке л: е Мп. Локальный вариант этого вида наблюдаемости может быть определен следующим образом. Определение 1.33. Система ^ -локально слабо наблюдаема в точке д:0, если существует открытая окрестность U точки jc0 , такая, что для каждой открытой окрестности V[x0) точки х0, V(xo)q U(x0), Iy (x0) = {xq} , и называется локалъно слабо наблюдаемой, если это условие выполнено для каждой точки х е Мп. Другими словами, ^Г является локально слабо наблюдаемой, если можно мгновенно различить каждую точку от соседней. Между различными видами наблюдаемости существует следующая связь (рис. 1.12). ^ локально наблюдаема => ]Г наблюдаема ]Г локально слабо наблюдаема => ^ слабо наблюдаема Рис. 1.12. Виды наблюдаемости в нелинейных системах Эти соотношения справедливы для нелинейных систем, но для линейных стационарных систем можно показать, что все 4 вида наблюдаемости совпадают [37, 47]. Как для локальной слабой управляемости нелинейных систем ранее был получен алгебраический критерий, так и для проверки локальной слабой наблюдаемости имеет место простой алгебраический критерий. Обозначим через Lx производную Ли вдоль векторного поля Х(х), т.е. для вел* кой гладкой функции q>(je), определенной на многообразии Мп, имеем Хф(*).А»(»(*))-ЙЙ,ДГ(лг)1 (1.264) *м - («. м.ь м i. «)т .*£Ч*& ^1. дх [ дх{ дхп
Глава 1. Синтез САУ методами дифференциальной геометрии 73^ (v) - скалярное произведение векторов. Обозначим через dq> градиент —.Пусть fJ (x) = f(x,u^ ) определяет вектор- ное поле на многообразие М" для некоторого постоянного управления sO)=fc0) jiWf / = 12 Из теории линейных систем известна дуальная связь между управляемостью и наблюдаемостью. Для нелинейных систем эта связь проявляется как дуальность между векторными полями и дифференциальными 1-формами (подробнее см. [18]). Покажем, как наблюдаемость определяется через 1-формы. Пусть F0 обозначает подмножество гладких функций на многообразии М", состоящее из функций g\(x),...,gl(x):Jr° = {g, (*),/ = 1,/} , и пусть Т определяет наименьшее линейное подпространство гладких функций С00 \М" J, которое замкнуто относительно дифференцирований Ли векторными полями I(D) множества Т . Элемент Т является линейной комбинацией функций вида V(-(M*'■))••)■ (1265) Если обозначить fl =Xuf2 = Х2,..., то для любых Xi9Xj e I(D), [Xi9Xj]e I(D) имеем LXi (LXi (ф))-1Х2 (LXi (ф)) = V,^] (ф)' С-266) где [AT,, АГ2 ] - скобка Ли (коммутатор) операторов Xl9X2. Ранее нами получено, что l(D)(x) = Ap(x)<zTMnx, (1.267) где A/7(jc) - распределение размерности /? в точке jc, TM" - касательное пространство к многообразию Мп в точке х. Элементами ТМ" являются касательные векторы Х(х) (х - фиксировано). Если рассмотреть действие оператора X (мы отождествляем касательные вектора с соответствующими им дифференциальными операторами) на функцию (p(jc) е С00 \Мп\ и зафиксировать ф, то возникает линейный функционал на пространстве ТМ" :Х(х)-+ Х(ц>)(х). Этот функционал обозначается символом d<p(x). По определению d<p(X)(x) = X(<p)(x). (1.268) Элемент d(p(x) принадлежит ТМ"* - сопряженному с ТМ" пространству. ( д Т Пусть — - базис в ТМ" , a dx - дифференциал функции х; (х), тогда согласно (1.268) имеем ( Y7 ( \ dxt = х, = 8„ (символ Кронекера). (1.269)
_74 Методы современной ТАУ. Часть IV Следовательно, {А,}"=1 - двойственный к < — > базис в ТМ"*. Отсюда следу- ет, что ТМ"* (х - фиксировано) состоит из всевозможных линейных комбинаций ^tf/A, \ с вещественными коэффициентами. Для произвольной функции ф(д:) е С00 Шп ) и оператора X = ^£, (д:)— имеем соотношение d9(X)(x) - Х(Ф)(х) -1§, (x)^i . (1.270) Это соотношение, названное нами выше производной Ли функции ф(дс) применительно к дифференциальным формам, называется значением линейной дифференциальной 1-формы со = af(p на векторе X в точке д:: со(Х) = ^ф(Лг)(д:) [18]. Найдем явную формулу для dq>. Имеем *=&/(*)■£■• о-271) Используя соотношения (1.268), (1.269), получим dxt (X)(x) = dx, {fj-j (x)^-\ = %t (х). (1.272) Подставляя левую часть (1.272) в (1.270) вместо £7 (х), найдем МХ)(х)-\±^Ь,ух)(х). (1.273) В силу произвольности Х(х)еТМ" имеем Получен полный дифференциал функции ф(дс). Полный дифференциал функции Лр является частным случаем более общего дифференциального геометрического объекта, а именно дифференциальной 1-формы, общий вид которой следующий ю-!>,(*) А,, О-275) где а, (х) - гладкие функции на М". Элементы множества ТМ"* называются ко- векторами в точке х е Мп . Вернемся к рассмотрению слабой локальной наблюдаемости. Обозначим подпространство J(F)(x)<zTMnx* -подпространство дифференциальных 1-форм (с/ф:фе^*). Производная Ли Lx(ty){x) показывает, как воздействует векторное поле (дифференциальный оператор) X на гладкую функцию ф(:к).
Глава 1. Синтез САУ методами дифференциальной геометрии 75_ Рассмотрим, как действует дифференцирование Ли на дифференциальные 1-формы. Пусть со - дифференциальная 1-форма вида (1.275), тогда имеет место формула [3] Lx (со)(д:) = d((o(X))+ d<x>(X). (1.276) Если со = ^ф, т.е. это полный дифференциал или точная форма, то согласно лемме Картана[12] d(u = d(dy) = 0. (1.277) Поэтому формулу (1.276) с учетом (1.277) можно записать как Lx(dq) = d(Lx(<p))9 (1.278) т.е. операции дифференцирования Ли Lx и d (так называемое внешнее дифференцирование) перестановочны. Из этого следует, что J^F) является наименьшим линейным подпространством дифференциальных 1-форм, которое замкнуто относительно операции дифференцирования Ли элементами I(D). Элементы J^) - конечные линейные комбинации дифференциальных 1-форм для функций множества Т d{lf (...(l,. (&))••))= Lfl (...(Lft (dg,))..), (1.279) где по-прежнему /' (jc) = f(xfu^1' j для некоторых постоянных управлений и>1' е Q. Ковекторное пространство J[Jr)(x) определяет локальную слабую наблюдаемость системы ]|Г в точке д:0. Определение 1.34. Говорят, что ^ удовлетворяет ранговому условию наблюдаемости в точке jc0 если размерность пространства J(Jr)(x0)равна и. ^ удовлетворяет ранговому условию наблюдаемости, если это условие справедливо для каждого jc е Мп. Теорема 1.12 [37] (о локальной слабой наблюдаемости). Если ]Г удовлетворяет ранговому условию наблюдаемости в точке д:0, тогда ]Г локально слабо наблюдаема в точке д:0. Доказательство. Для доказательства теоремы используем следующую лемму. Лемма 1.2 [37]. Пусть V - некоторое открытое множество Мп . Если д:0, jco e V; хо1ух0, тогда ф(л:0) = ф(jco) для всех ф е Т. Если размерность dimУ(^*)(д:0) = «, тогда существует п функций ф^фз,..., ц>пе!Г, таких что дифференциалы dty (xo),dq>2{xo)>—>^Фи(-^о) линейно независимы. Определим отображение: Ф:д:-^(ф1(д:)...фДд:))Т. Якобиан отображения Ф в точке д:0 невырожден, т.е. .д(Ф.(*)-фД*)) rank- d(Xl...xn) X=Xq поэтому по теореме о неявной функции [10] отображение Ф взаимнооднозначно отображает открытую окрестность U точки д:0. Если V(xQ)czU(x0) - открытая
76 Методы современной ТАУ. Часть IV окрестность точки jc0, тогда по лемме 1.2 1у(хо) = {хо}9 так что ^ является локально слабо наблюдаемой. 2. Рассмотрим хорошо известную задачу наблюдаемости для линейных стационарных систем. Имеем систему управления д: = Ах + Ви9] у-СХ. } (1280) Обозначим через С,* - /-ю строку \хп матрицы С, т.е. д>,=С,.*, / = п. (1.281) В соответствии с (1.260) имеем ft(jc) = C^Jc, i = M 0.282) При выводе условий управляемости получено, что алгебра Ли I(D) для системы (1.280) формируется векторными полями <Ах, Albj : / = 0, п -1, j = 1, т |, где bj - у-столбец матрицы В. Пусть /o(D)(jc) = span{Ac,^*y:i = O,/i-l,y = ui}, (1.283) где span - линейная оболочка векторов Ax,A'bj ... в точке д:. Найдем линейное пространство J(P) дифференциальных 1-форм, получаемых дифференцированием множества функций ^ = {a(*),..,g,(*)}={c,.x, / = U} (1-284) векторными полями /0 (D)(x). Имеем М^*) = Е1Х*У^ £СЛ | = ZS^A =С/И^ / = U (L285) Тогда общая формула дифференцирования Т вдоль векторного поля Ах будет L^ (ct.AJx)= СрА'+1х, j = 0,1,... • (1.286) По аналогии получим выражение для дифференцирования вдоль векторных полей A'bj. Имеем ЬА^{с^Акхус^кЬг (1.287) что приводит к следующему результату L^faA'bj^CpA'bj =0, / = 0,1,.... (1.288) Тогда пространство гладких функций Т, замкнутое относительно дифференцирований Ли Lx (Х е /0 (D)), с учетом теоремы Кэли - Гамильтона имеет вид Т = span fcj*Akx, C^Akbi :/ = Ц j = ппЛ =0,«~l|. Построим алгебру дифференциальных 1-форм для функций пространства Т . Для каждой точки х е Мп имеем j(f)(x) = df(x) = span{Cl.Ak :i = V, *=0f/i-l}f (1.289) т.к.
Глава 1. Синтез САУ методами дифференциальной геометрии 77_ d(ci*Akx) = Cl*Ak; В силу того что базис пространства (1.289) не зависит от jc , то он имеет постоянную размерность. Ранговый критерий наблюдаемости (теорема 1.12) rankJ(F) = rank\с^Лк : / = U, к =0,«-l} = п (1.290) приводит к известному критерию наблюдаемости Калмана. Замечание 1.8. Элементами J(Jr) как ковекторного пространства являются дифференциальные 1-формы-вида А^)==\^(Сф4)^Л-0^Л, / = UL (1.291) [7=1/7=1 J где akpi -элемент apj(p = \,n, j = 1,л)) матрицы Ак, к = 0,л-1. Всего в J{F) nx\ дифференциальных 1-форм. 3. Линейные нестационарные системы. Как и в задаче управляемости, добавим к вектору состояния дополнительную переменную х0 =t, получим х = А(хо)х + В(хо)и, У = С{хо)х. Рассмотрим два векторных поля: (1.292) Дифференцирование функции yi=Ci(x0)xf / = 1,/ вдоль векторного поля Х}(х) дает нам | ( rs П П Я | /1 | П Я LxC,(x0)x= _ + ^^(xo)xy— ХСф(^о)^ =£т-С/рЫ*л + ^ar0 M>l ar^j^, j л.,&о (1294) Аг=1 у=1 Обозначим через П П ( Q \ + miakj{xo)xjCik{xo)=\^-Ci'(xo) + C,(x0)A{x0) \х, i = l,l. k=\j=i K^o ) DAC(x0)J-£-C(x0) + C(x0)A(x0)\ (1.295) Тогда (1.294) можно переписать в виде LXi(C(x0)x) = DAC(x0)x. (1.296) Дальнейшее дифференцирование функции DAC(x0)x приводит к реккурентной формуле (LXi(...(LxC(xo)x))) = LkXiC(xo)x = DkAC(xo)x = * (1.297) = {^-DA->C(xo) + DA->(c(xo)A(xo))y
78 Методы современной ТАУ. Часть IV Так как векторное поле Х2 (х) не зависит от х, то при формировании линейного пространства J{F) (кораспределения) дифференциальных 1-форм J(F)(x) = dF(x) необходимо учитывать только функции вида (1.297) (см. формулу (1.289) для стационарного случая), поэтому ранговый критерий наблюдаемости (теорема 1.12) для системы (1.292) приводит к следующему критерию наблюдаемости: DAC(x0) D2AC(xQ) rankj(^*) = rank DkAC{x0) -п. (1.298) Перепишем условие наблюдаемости (1.298), заменив переменную jc0 на /. Получим ( c(t) ) DAC(t) D\C{t) гапкУ(^г) = гапк DkAC{t) = n, где /)^c(/)-Jc(0+c(/H(/), ^с(/) = -|(^-1с(/))+(1)Гс(/))^(0, (1.299) Л = 1,2,... . 4. Рассмотрим практический пример применения рангового критерия наблюдаемости для нелинейной системы. Пример 1.19. Наблюдаемость в нелинейной системе. Рассмотрим следующую систему 3-го порядка: Х2=-*1Х3, *з=0, >> = *!• Определим необходимые элементы (л = 3, / = 1). Векторное поле (как дифференциальный оператор), определяющее динамику системы дх} дх2 дхъ Множество функций Т* = {g, (x)} ={х1}. Сформируем пространство функций Т : , ( \ ( д д) ^ йх, дх2) (д д ^ *2*3 д ХХХЪ— кдг3 =~Х]Хз, ах{ ахг )
Глава 1. Синтез САУ методами дифференциальной геометрии 79^ 4',(gl(*)H*2*3-I *1*3— (-*!*>)= *2*?; ^ охх dx2) 4,(g,(A:)) = U^^--^^— 1(-*2*з) = *1*з3; Сформируем из полученных функций Т пространство J(F) дифференциальных 1-форм ^{^В1(х)) = х3сЬс2+х2сЫ3- d[L2Xtgl(x)) = -x3dxl-xldx3; d{^xxS\ (*)) = -*? А* -2хъх2сЬсъ\ d(L%gl(x)) = xldxl+3xlx23ch3- d[L5Xy g, (*)) = x\dx2 + 4x2x3dx3; Для проверки рангового условия сформируем матрицу Мс из коэффициентов (гладких функций) полученных дифференциальных 1-форм: 'О ,3 -дг3 0 -д;, К с- О -*J -2хъх2 х\ О Здг^з2 . О х$ Ах2х\ w Из анализа данной матрицы видно, что rank Мс < 3, если либо дг30 = 0 , либо дг10 = х20 = 0 , где Xjo,jc,0,jc20 -точка, в окрестности которой рассматривается наблюдаемость данной системы. Исходя из полученных соотношений можно определить области слабой локальной (в том числе м локальной) наблюдаемости. Например, I: дг30 >0;х10 > 0; II: jc3o <O;*io >0- 1.12. ЛИНЕЙНЫЕ ЭКВИВАЛЕНТЫ НЕЛИНЕЙНЫХ СИСТЕМ. СИНТЕЗ НЕЛИНЕЙНЫХ РЕГУЛЯТОРОВ Проблема построения регуляторов для нелинейных систем в отличие от линейных все еще далека от решения. Тем не менее идея использования хорошо разработанной теории построения линейных регуляторов для нелинейных систем остается весьма притягательной и актуальной. Главная сложность здесь - найти диффеоморфизм (гладкий изоморфизм) между исходной нелинейной системой и некоторой линейной системой. Здесь будет показано, что наличие преобразования, позволяющего перейти от нелинейной системы к линейной, сводится к условию существования группы симметрии для нелинейной системы управления. В [7] получено, что для автономных управляемых систем dx/dt = f(x,u) группа симметрии действует на множестве решений данной системы, если диффеоморфизм имеет следующую структуру: и' = и'(х,и), х' = х'{х) , где (х,и) - старые локальные координаты и управление, (х\и') - соответственно новые. 1. Постановка задачи. Рассматривается класс нелинейных динамических систем линейных по управлению, класс так называемых аффинных систем
$0 Методы современной ТАУ. Часть IV dx/dt = X(x) + uY(x)9 хеМ", ueR\ Y(xo)*O9 (1.300) где Мп - гладкое многообразие размерности л, д:0 - равновесная точка, Х(х), Y(y) - гладкие векторные поля на М\ Х(х) = [Ъ(х),...Л„(х)]\ ¥(х) = [щ(х),..,Цп(х)]7 ■ Если векторные поля рассматриваются как дифференциальные операторы g гладких функций, определенных на многообразии Мп , то они представляются в виде (см. пункт 1.2.4) х-±ь(х)±;Гш£ц,(х)±. ы\ dxi /=1 о^- Ставится задача: найти преобразования для гладкой замены координат у = у{х) и управления v = v(jc,w) (статическая обратная связь), такие, что система (1.300) приводится к некоторой изоморфной ей системе вида dy/dt = Acy + Bcv, (1.301) где Ас, Вс -матрицы канонической формы Бруновского [19, 32]. 2. Линейные эквиваленты. Каноническая форма Бруновского имеет следующий вид dy\/dt^y29 , _ (1.302] dyn^/dt = yn9 dynldt-\. Таким образом, если известно некоторое преобразование ух = 7J (х), то последующие преобразования yi = 7](дс), / = 2,а? можно получить последовательным дифференцированием функции Т{(х) вдоль векторного поля (Х(дс) + иК(дс)),т.е, нахожде нием производных Ли функции 7] (*) вдоль векторного поля (X(x) + uY(x)). Система дифференциальных уравнений, определяющих преобразование 7] (*) Имеем т.к. у2=Т2(х) не зависит от управления и и поэтому У(Г,(дс)) = О. (1.304 Аналогично получаем dy2 Idt = у, - LX+H,X(TX (*)) - X2 (Г, (х))+и¥(х(Ц (*))) = X2 (Г, (*)). (1.305 соответственно F(JV(7J (*))) = 0. (1.306 Заметим, что в формуле (1.305) и ниже под ^(^(дс)) понимается производна Ли/-го порядка функции 7j(:t) вдоль векторного поля Х[х)
Глава 1. Синтез САУ методами дифференциальной геометрии 81_ Х'(7|(х))-Л'(х(..ЛГ(7'1(х))...)) Продолжая находить производные Ли более высоких порядков, получим dyn-ildt = yn = Lx+uYXn-2(Tx{x)) = = Х»-'{Тх{х)) + иУ(х»-*{Тх(х))Ух^{Тх{х)). (1'307) Итак, из (1.304), (1.306) и (1.307) имеем ■ Y(x'(Tl[x))) = 0, i = 2,и-2, (1.308) dyn/dt = v = Lx+uYXn-i(Tl{x)) = Xn{Tl{x)) + uY(x"-\T,(x))). (1.309) Для того, чтобы из (1.309) определить и, необходимо обязательно выполнить условие Г^""1 (7] (*)))* 0. (1.310) Из анализа (1.308) - (1.310) можно сделать следующие выводы. Преобразование (невырожденная замена координат) ух = 7] (дс) определяется из решения системы линейных дифференциальных уравнений в частных производных (1.308), (1.310), т.е. y(xi(T1(x))) = 09 1 = 2^=2, (1.311а) Г^""1 (7] (*)))* 0. (1.3116) Остальные координаты получим из (1.303), (1.305), (1.307), т.е. Л=ХМ(ВД),1=2^. (1.312) Формулу (1.312) можно записать в более привычной форме yi=Tl(x)=X(ri_l(x))=(dTi_l(x)/dxiX{x)),i = 2^9 (1.313) где (d,r) - скалярное произведение векторов dи г. Теорема 1.13. Для аффиных систем (1.300) система дифференциальных уравнений в частных производных (1.311), из которой находится преобразование 7^(л:), эквивалентна системе дифференциальных уравнений в частных производных первого порядка, определенных последовательным дифференцированием векторного поля Y[x) вдоль векторного поля Х[х) и последующим дифференцированием функции Тх[х) вдоль полученных векторных полей, т.е. (ad',F)(7i(*))=0, / = M^2, (1.314а) (ad7lF)(r1(^))^0, (1.3146) где ad^F - производная Ли векторного поля аё/^1К(д:) вдоль векторного поля Х[х), причем для / = 0: ad°xY{x) = Y(x), , = i adxY(x) = LxY(x)=(XY-YX)(x)={X,Y](x) = = ((dY(x)/dx)X(x)-(dX(x)/dx)Y(x))(x), i = k: adxY(x)=Lxad^Y(x)=[xMlx1Y(x)], здесь [X,F](x) - скобка (коммутатор) Ли векторных полей Х(х) nY(x). 7 Зак 416
J$2 Методы современной ТАУ. Часть IV Доказательство. Доказательство проведем по индукции. Для / = 0: ad^ Y(Tx (л:)) = К(Г1 (л:)) = 0 и первые уравнения (1.311) и (1.314) совпадают. Для (ad^F)(7-1(*)) = IrF(7-I(*))-(^-Hf)(7-,(JC)) = ^(хХг(т1(х)))уг(х(т1{х)))ш-г(х(т1{х))). т.к. К(Г,(д:)) = 0. Выше было использовано свойство производной Ли ^](Г.(*)) = [^,^](7-1(*))[3]. Исходя из определения скобок Ли и непосредственными вычислениями можно показать, что для (аЧхг)(Тх(х)) = 1х(^г)(Т,(х)) = = t(-iyc)Ar^KY^(7'1(x))=(-i)iKv:i(r1(x))=o, ■(1315) 7=о т.к. YXj(Tx(x)) = 0, j = O,k-l, (1.316) причем в (1.315) с)=км(р.{к-]у). Формулы (1.315), (1.316)справедливы для к = 0,п-2. Для к-п-\ (ай"х-'¥)(Т,(х)) = (-1)п-1¥Х"-х{Тх(х))^0. (1.317) Эквивалентность формул (1.311), (1.314) доказана. Функция Тх (л:) определяется из системы линейных дифференциальных уравнений в частных производных первого порядка (1.314), но при этом векторные поля adlxY(x) п = 0,л-2] должны подчиняться условию их совместной интегрируемости - условию инволютивности. Заметим, что при Y(x) = Y = const (ad'<fF)(7-1(*)) = (-l)'(FY')(7-1(jC)), / = 0^1, (1.318) и формулы (1.311) и (1.314) полностью совпадают. Инволютивность. Инволютивность является краеугольным камнем при выводе условий интегрируемости уравнений в частных производных и фактически при этом является синонимом термина «интегрируемость». Подробно этот вопрос мы рассмотрели в §1.10. Говорят, что множество векторных полей ^Xl(x),.,.,Xm(x)] инволютивно, если существуют скалярные поля (функции) aijk[x)y такие, что В этом случае совокупность ^X](x),...iXm(x)] определяет алгебру Ли {х1(д:),...,Лгш(д:)} относительно бинарной операции [•,•]. Фробениус показал [6] (см. теоремы 1.7-1.9), что система векторных полей тогда и только тогда интегри-
Глава 1. Синтез САУ методами дифференциальной геометрии 83^ руема, когда она инволютивна. Сначала рассмотрим только класс так называемых инволюционных систем. Система векторных полей S = (Х} (л:),...,Хт (jc)) находится в инволюции, т.е. векторные поля попарно коммутируют, если XiXJ{z{x)) = XjXl{z{x))i ij = ui или [XhXJ](x) = (XrXJ-Xj-Xi)(x) = O (1.320) для любой дважды и более дифференцируемой функции z[x) [4], т.е. условия (1.320) совпадают с (1.319) для а^ =0. Покажем, что любая инволютивная система векторных полей имеет в качестве канонического (исходного) базиса инволюционную систему, из которой она определяется умножением на некоторые гладкие функции, определяя тем самым то же самое гладкое инволютивное распределение Ая (подпространство касательного пространства ТМ" постоянной размерности, базисные векторные поля которого замкнуты относительно бинарной операции [•,]) размерности/?, что и исходная инволюционная система. Пусть S = {Х1(х),...,Хп_1 (*)} - инволюционная система на подмногообразии V. Пусть из системы S получена новая система 5' = {F1(a:),...,Fw_1(a:)} умножением векторных полей Хх на гладкие функции £,(*), i = \,n-\, не обращающиеся в нуль в окрестности точки xQ. В этом случае Sx определяет то же распределение \_х , но с другой параметризацией [6]. Например, для «-1 = 2 имеем Yx = gx(x)X], Y2 =82{X)X2- ТогДа [К1,К2]/(л:)=(у1(^)К1+у2(л:)К2(л:)+Уз(л:)[Х1,Х2])/(л:) = = Ых)Ух+У2{х)У2(х))А*)> т.к. из (1.320) [Х{,Х2] = 0 . Функции у, (*), / = 1,2,3 находятся из следующих соотношений yl{x)^(-g2{x)X2(gl{x)))/gl(x)9 y2(x)=[gi(x)Xx(g2(x)))/g2(x)9 Уз(*) = g\(x)-g2{x). Видим, что если S = {Хх,...,Хп_1) - инволюционная система на подмногообразии V, то Sx ={F1,...,FW_1} определяет инволютивную систему на том же подмногообразии. Что касается исходной системы S = {Xx(x),...,Xn_x(x)} ={ad^ У(х), / = 0,л-2|, определяющей систему (1.314а), то из вывода уравнений (1.311а) следует, что в общем случае это инволютивная система на подмногообразии V, т.к. из условия Гл^Л^ ]/(*) = 0, \/Xt е Ап_{ не обязательно следует, что Гх,, X Л = 0. Группы преобразований. Вопрос о существовании преобразования у = Т(х), v = v( x9u) для исходной системы (1.300) сводится к проблеме наличия группы симметрии - группы диффеоморфизмов, переводящих решения управляемой системы 7*
JS4 Методы современной ТАУ. Часть IV (1.309) в решения системы (1.301) и наоборот. Здесь основную роль играет теорема С. Ли (аналог теоремы Руффини - Абеля - Галуа о разрешимости алгебраического уравнения в радикалах) о разрешимости линейного дифференциального уравнения в частных производных Az = 0, рассмотренная в §1.8. Эта теорема приводит к следующим условиям наличия у (1.300) группы симметрии: 1) Х,(Т1(х)) = 0, i = l,/i-l, (1.321а) Хп(Т{(х))*0; (1.3216) 2) система S = {Xl(x),...,Xn_l(x)} = ladlxY(<x)j = 0,n-2\ -является инволю- тивной; 3) векторные поля {^(д:),...,^., (д:)} =|ас!/хУ(д:), / = 0,л-1| - линейно независимы в окрестности равновесной точки х0. Формулы (1.321а), (1.3216) в точности повторяют условия (1.311а), (1.3116) или (1.314а), (1.3146), условия 2) выполнены для S и единственным дополнительным условием существования является 3). Если равновесная точка х0 &Q , тогда преобразование ^=7](*)-7iW (1.322) позволяет получить интегральное многообразие, проходящее через данную точку х0. Суммируя вышесказанное, сформулируем основную теорему о наличии линейных эквивалентов у системы (1.300). Теорема 1.14. Нелинейная система (1.300) тогда и только тогда имеет линейный эквивалент - систему (1.301) в окрестности равновесной точки х0, когда выполнены следующие условия: а) система 5' = |ad/v У{х), i = 0,и-2} - инволютивна; б) ad^"1 Y(х) * 0 в точке равновесия и ее окрестности; с) векторы ad'jf Y[x), / = 0, л -1 линейно независимы в точке равновесия и ее окрестности; д) преобразование 7] (л:), полученное из системы дифференциальных уравнений (1.314а), связано с переменной ух соотношением (1.322), остальные преобразования находятся из (1.303), (1.305), (1.307); е) статическая обратная связь определяется из уравнения (1.10) v = X"-I(7'1(x)) + W.ad"x-IF(7i(^))) откуда после нахождения v = v(j») и замены у = Т(х) получим обратную связь в исходной системе и(х)= У l 'J. . /'; ". (1.323) Рассмотрим пример синтеза регулятора. Пример 1.20 [27]. Задан нелинейный объект управления *1=*2> х2 =sinjt, +х3. (1 324)
Глава 1. Синтез САУ методами дифференциальной геометрии 85^ Математическая модель (1.324) описывает движение математического маятника в верхнем неустойчивом положении, при этом хх - угол отклонения маятника от вертикали, х2 - скорость отклонения, х3 - момент, приложенный к маятнику. Уравнениями (1.324) описываются многие электромеханические объекты: синхронные генераторы, двигатели с асинхронным пуском и др. Поставим задачу синтеза регулятора для системы (1.324). Для этого проверим, можно ли свести данную систему к канонической форме Бруновского заменой координат и введением статической обратной связи. Имеем векторные поля ( Ч ) (0] X(x) = \sinXl+xA Y(x) = \o\. (1.325) Для получения невырожденного преобразования 7* = (7],Г2,Г3) и статической обратной связи v проверим все условия теоремы. Имеем. (°1 (°1 (Ч 1) ad°xY(x) = Y(x) = \ О , аЛхГ(х) = [Х,Г](х)-\-\ \, аЛхГ(х) = [Х,вЛхГ] = \ О Ы loj [о) rank{ad'rK(jc),J! = 0,1,2} = 3 в точке равновесия дго=О,- условие с) выполнено 2) Так как все векторные поля ad'^ Y(x), i = 0,1,2 не зависят от х, то система |ad'v Y(x), / = 0,1,2} векторных полей инволютивна (полная система), - условие а) выполнено Р1 3) ad^ Y(x) =0*0 - условие б) выполнено. W Таким образом, преобразование Т(х) существует и статическая обратная связь v(T(x)) также может быгь получена. Приведем исходную систему к канонической форме Бруновского Находим компоненту преобразования ух = 7] (*). Согласно (1314) \дх ) obc, дх2 дхъ ^,ad,KW] = 0;H.0 + ^.(-l) + ^.0 = 0, дх'"л'""') " дхх " дх2 v '' дх3 ' " ° 326) ?Ь.МхУ(х))*0. ^.1 + ^04-^.0*0. дх х v }) дхх дх2 дхъ Данной системе дифференциальных уравнений в частных производных, в частности, удовлетворяет следующее решение И =7; (*) = *,. Остальные компоненты преобразования Т2(х),Тъ(х) и статическую обратную связь v найдем из выражений (1.303), (1 305), (1.308), (1.309) гйт ^ *2 ^ У2 = Г2(х) = (°±,Х(х)у(\А0) sin xx +х3 =д:2, о Уз = Гз(лг)=(1г'х(л:))=5'п*|+*3' (1327) [8Т \ —-,X(x) + uY(x) =cos x, -x2+u дх ) Проверим невырожденность преобразования у-Т(х) в окрестности равновесной точки Имеем ( 1 0 Q\ б4—\А о 1 оUо, {дх) U^oiJ а это значит, что существует взаимооднозначная связь между решениями исходной системы (1 324) и ее линейным эквивалентом в форме Бруновского
L = v. 86 Методы современной ТАУ. Часть IV а/ Ввиду диффеоморфности систем (1 324) и (1.328) синтезируем регулятор для линейной системы (1 328), а из уравнения (1 327) найдем синтезируемое управление для исходной системы. Пусть для определенности для системы (1.328) был синтезирован регулятор по известным методам синтеза ч(у)=К\У1+К2У2+КзК, где Кх = -1, К2 - Къ = -3. Тогда уравнение и(х) для исходной системы будет м(дг) = v(r(:c))-cos хххц =-х, -3*2 — 3(sin ^ +^)-cos xlx2. Замечание, если управление и в уравнении (1.300) будет векторным, тогда вид его линейного эквивалента является блочно-диагональным, где каждый блок - клетка Бруновского. Пример такого синтеза приведен в [24]. 1.13. ПРОВЕРКА ИНВОЛЮТИВНОСТИ РАСПРЕДЕЛЕНИЯ ВЕКТОРНЫХ ПОЛЕЙ При получении линейных эквивалентов нелинейных систем и нахождения общих инвариантов для нескольких однопараметрических групп необходимо определить, является ли заданная система инфинитезимальных операторов инволютивной, т.е. составляет ли она базис алгебры Ли векторных полей. Рассмотрим достаточно простой, аналитический метод решения данной проблемы, основанный на взаимно однозначном соответствии между инволютивным семейством векторных полей V и инволюционным (с попарно коммутирующими векторными полями) семейством векторных полей V-\хп / = 1,/и|, полученном из V некоторым невырожденным преобразованием. Пусть на гладком многообразии Мп задано множество векторных полей в естественном базисе Xi=^lJ(x)^r;i = ut;\<m<n-\. (1.329) 7=1 VXj Теорема 1.15. Для того, чтобы независимые векторные поля Х1(х),...9Хт(х), \<т<п-\, где п - размерность вектора хеМп, определяли инволютивное распределение Дда(дс), необходимо и достаточно, чтобы базис Х{(х),...,Хт(х), полученный из Хх (х),...,Хт ( jc), был инволюционным. Доказательство. Необходимость. Пусть векторные поля Хх (х),...,Хт(х) определяют инволютивное распределение &т(х) касательного пространства ТМ" многообразия Мп, т.е. m [*,,Ху](*)=2>91А(*)**(*). (1.330) *=1 где atJ k [х] - гладкие функции на Мп . Кроме того, по теореме Фробениуса, выраженной через дифференциальные 1-формы [6], для инволютивного распределения Ат(х) существуетанну^ятор Ann(Am)
Глава 1. Синтез САУ методами дифференциальной геометрии 87 Ann(Aw) = {со, = dzt:со, (*,) = 0, / = 1,л-т\ j = 1,w], где со, - дифференциальная 1-форма, здесь, в частности, дифференциал функции (скалярного поля) z,- (х). Пусть некоторый дифференциал dz e Ann (Ат). В этом случае с учетом (1.329) имеем д_ dz{x)(xJ) = XJz{x)=Y4^k{x)—z = 0i y = l,да> (1.331) к=\ °Хк т.е. (1.331) определяет систему однородных дифференциальных уравнений в частных производных первого порядка. Пусть (без уменьшения общности) в системе уравнений (1.331) первые т координат каждого из векторных полей Xj[x) lj = \,m\ определяют невырожденный минор Л[х) порядка т в области решения (1.331). Представим (1.331) в виде п .... .... ■z-A(x)- ' д " ах, д •z- i=m+\ О*! Z = 0, где |Чц(*) - кМ) А(х)= \ \ I Запишем уравнение (1.332) следующим образом: я \ ( » я \(У Л .... .... -А(х). ' д ' дх, д [дхт) - \\ /=/и+1 z = 0. Домножим слева левую и правую часть (1.333) на А~х [х) и, обозначая М*1 -л-Чху /=/и+1 ^ z^w^-, V/=m+l ^ j = ^-'(х). (1.332) (1.333) (1.334) (1.335) получим
88 Методы современной ТАУ. Часть IV '*N \famj \\ ,=m+i ca< z = 0. (1.336) Умножение слева невырожденной матрицы Л"1 (х) на столбец векторных полей (Xl9...9Xm) определяет столбец векторных полей (xl9...9Xm) , которые также удовлетворяют условию (1.331), т.е. dz{x)(Xj) = Xjz[x)=09j=ui9 (1.337) где ~ д vp z i \ д . -— ,. „ -,-. (1-338) Л7 i=m+\ ^i Выразим из уравнений (1.338) постоянные независимые векторные поля (естественный базис (репер)): ~J /=/И + 1 Из отношения (1.338) имеем д ~ А: мй . г (1.339) */=5Х* (*)**. ^=l (1.340) Тогда скобка Ли (коммутатор) векторных полей XhXj через векторные поля Xt, t = 1,/и выразится следующим образом: mm mm /=1 JU1 /=1 Л=1 m m -§>Л*/^)**)=ХЕ(§^/[**"*/]+ (1.341) /=1 A=l С другой стороны, учитывая (1.338), получим v=m+lji=m+l^ OXv ^ ал:ц ал:у д (I \ ' д д (£ \ д (1.342) Из выражений (1.338) и (1.342) замечаем, что скобка Ли [х^,^/] не может быть выражена в виде линейно связанной комбинации векторных полей Xt, t = 1,/и , т.к. Гх^АГЛ зависит только от последних [п-т) координат, а первые т координат
Глава 1. Синтез САУ методами дифференциальной геометрии 89 равны нулю. Подставляя в (1.341) вместо Хп t = \,m правую часть (1.338) и учитывая (1.330), получим т т т ш (1.343) к=\ /=1 к=\ <И где P^W^ZZ^i^^^K'-^y^^^J^OW^^^^bw (1.344) /=i к=\ и А~] (x)-(t,s) -элемент обратной матрицы А~1(х). Равенство (1.343) в силу сделанного выше замечания и формулы (1.338) будет иметь место тогда и только тогда, когда *«ЛХ) = К(*)> Ш = п^> (1.345) [xk,Xt] = 0, kj = lm. (1.346) Последняя формула указывает на то, что векторные поля Xt(x), t = \,m являются инволюционными (т.е. попарно коммутирующими). Достаточность. Пусть для совокупности полей Xnt = \,m справедливо соотношение (1.346), т.е. это инволюционные векторные поля, причем векторные поля Xnt = \,m связаны с векторными полями Xnt = \,m матричным уравнением (1.334). Подставляя (1.334) и (1.346), получим 0 = Ш III q=\ q=\ t=\ (1.347) ^=i u=i J /=i U=i ) Уравнения (1.347) определяют систему С% линейных алгебраических уравнений относительно скобок Гх^^хЛ; qj = \,m, решая которую, получим т [Xq,Xt] = Y,a4t,v{x)Xv>cl = ^c]<t^m> v=l т.е. инволюционность векторных полей Хп t = \,m определяет инволютивную систему Хп t = \,т в области, где матрица А(х) невырождена Таким образом, алгоритм проверки инволютивности семейства векторных полей Хи...,Хт сводится к получению семейства Хп t = \9m и проверки последнего на инволюционность (попарную коммутируемость). Если условие инволюционности выполнено, то исходная система инволютивна. Пример 1.21. Рассмотрим 2 векторных поля Х1(х),Х2(х) гладкого распределения Am(x)(zTMl, инволютивность которого традиционным путем проверить достаточно сложно Векторные поля в координатном представлении: вд= *2 . вд= <(х{+хъ)х2) Скобка Ли этих векторных полей имеет вид 1 (1 348) 6 Зак 416
90 Методы современной ТАУ. Часть IV -(*,+*2) [ХиХ2](х) = -1 , (1.349) <-xl-x2(xl+x2)j и сказать что-либо определенное об инволютивности Хх (х) и Х2 (х) сразу нельзя Тем не менее они действительно инволютивны в области, где хъ * х2 и их скобка Ли может быть выражена в виде линейно связанной комбинации векторных подлей Х] (х) и Х2 (х): [Х1,Х2](х)= V =И*.+*2)ад+*(*+*)-*ад = ^(х)ад> (135о) (-X]-x2(Xl+X2)} Х>-Х> а это значит, что векторные поля Хх(х) и Х2(х) формируют инволютивное распределение и соответственно интегральное подмногообразие. Функции а, (*)(/ = 1,2) имеют сложный вид, и определить их методом проб и ошибок непросто . Рассмотренный подход позволяет найти функции чисто формально. Покажем это. Исходные векторные поля в естественном базисе согласно (1.329) имеют вид- 1 1 (хх+х2) ) & (Х*+Х*)]£Г i = А(х) дхх д дх2 j_ {дх3) дхх _5_ [дх2) ■(? ?) дх, дхг) (1.351) Домножая (1.351) слева на Л 1 (д:) и считая, что определитель <\е\(А(х)) = хъ-х2*0, получим ' а ^ дх, д [дх2 + ( д\ а или в координатном представлении *,(*)= ° L*2W= 0 (1.352) (1.353) Проверка Гх1,Л'2](д:) = 0 показывает, что Х^х), Х2(х) образуют инволюционную систему Найдем связь между X, и Х2 (/ = 1,2), а затем определим функции а, (*)(/ = 1,2) инволютивности Х{,Х2 . Из (1 352) выделим естественный базис: дх2 Подставляя (1.354) в (1.351), получим 3 _i> a ^ '3 J (1.354) X, =х3 Хх -х2— \ + х2\ Х2-хх— \ + (х] +хъ)х2—- = хъХ{ +х2Х2 (1.355) Формулы (1.335) определяют связь между инволютивными л", (/ = 1,2) и инволюционными Л".,(/ = 1,2) векторными полями Теперь найдем функции а, (*)•(/= 1,2). Из (1.335) имеем
Глава 1. Синтез САУ методами дифференциальной геометрии 91 х2) U i)[xj Тогда X, 1 -х-у хъ-х2 хъ-х2 -1 *з \хъ-х2 х3-х2) {% Ранее было получено Подставляя в (1.358) выражения (1.354), имеем [XuX2} = -(xl+X2)±-JL--(X] + X2(xl+x2))±. -(*, +х2(Х] +х2))— = -(хх +х2)Х1 -Х2. 0ХЪ И, наконец, сделав замену в (1.359) инволюционных векторных полей Xt (/ = 1,2) на X, (/ формуле (1.357), окончательно получим х3-х2 хъ-х2 /=, что и доказывает инволютивность распределения Ат (х). (1 356) (1 357) (1.358) (1.359) = 1,2) по 6*
_92 Методы современной ТАУ. Часть IV ГЛАВА 2. ТЕОРИЯ КАТАСТРОФ. ДЕТЕРМИНИРОВАННЫЙ ХАОС. ФРАКТАЛЫ 2.1. ТЕОРИЯ КАТАСТРОФ 2.1.1. Введение Теория катастроф родилась на стыке двух дисциплин - топологии и математического анализа, ее источниками являются теория особенностей гладких отображений X. Уитни и теория устойчивости и бифуркаций динамических систем А. Пуанкаре, А. Ляпунова, А. Андронова. Оба эти направления слились, благодаря усилиям французского математика Р. Тома, в единую теорию, которая получила название - теория катастроф. При изучении свойств решений дифференциального уравнений сначала необходимо явно оценить полное множество решений и лишь потом анализировать их свойства. Проблем не возникает, если это линейная, лучше стационарная система дифференциальных уравнений. Для нелинейных систем полное множество решений можно построить для уравнений второго порядка (например, методом фазовой плоскости). Что же -касается уравнений третьего и более высокого порядка, то здесь известны решения только частных задач. Как же поступать в этом случае? Выдающийся французский ученый Анри Пуанкаре убедительно показал, что во многих случаях необходим лишь ограниченный объем информации качественного характера, которая, в конечном итоге, и представляет интерес при изучении конкретных динамических систем. Основы современного подхода к определению качественных изменений в поведении решений обыкновенных дифференциальных уравнений были заложены А. Пуанкаре в конце 19 века. Он впервые ввел такие понятия, как структурная устойчивость, динамическая устойчивость и критические множества. Особенно интересовало Пуанкаре, как качественно меняется поведение динамической системы при изменении описывающих ее параметров. Перестройка качественной картины движения динамической системы при изменении ее параметров получила название бифуркации (буквально, раздвоение). Работы А. Пуанкаре по исследованию структурной (топологической) устойчивости динамических систем в 30-е годы XX века продолжили советские ученые А.А. Андронов и Л.С. Понтрягин. Структурно устойчивые системы они назвали грубыми [1]. В это же время Марстон Морс исследовал структуру некоторой функции (которую теперь называют морсовской) в окрестности изолированной точки многообразия, которое содержит траектории динамической системы. Он показал, что невырожденные критические точки такой функции являются изолированными точками, что определяет структурную устойчивость данной динамической системы к возмущениям. Одновременно Хаслер Уитни описал особенности гладких отображений. Рене Том заметил (в конце 50-х годов), что эти две теории - особенности гладких отображений и структурная устойчивость динамических систем - могут быть объединены в одну общую теорию. Он ввел важное понятие «трансверсальность», которое стало основным при описании структурной устойчивости. Позднее Р. Том использовал его при описании канонических форм определенных особенностей отображений R" -> R1 (функций), которые он назвал катастрофами.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 93_ Предмет теории катастроф - изучение зависимости качественной природы решений уравнений от значений параметров, присутствующих в заданных уравнениях. Для данной теории требуется определенный математический аппарат, с изучения которого и начинаем изложение. 2.1.2. От аналитичности к гладкости. К-струи и ростки функций Рассмотрим некоторую дифференцируемую функцию f:R->R и разложим ее в ряд Тейлора в окрестности некоторой точки xQ f(xo+x) = ao+alx + a2x2+.... (2.1) По традиции представление этим рядом считается полезным только в том случае, если он сходится в некоторой окрестности UX) и сумма его равна f(xo+x). В этом случае /(*) называют аналитической в точке х0. Ряд можно дифференцировать в некоторой (возможно) меньшей окрестности VXq и его коэффициенты равны 1_ /! Z)'/l = *Х I ° ax1 где х=х0 Для дальнейшего анализа нам потребуется ввести некоторые определения и обозначения. Пусть Мп с Rn ,Nm с: Rm - гладкие многообразия (подробнее см. главу 1) и имеется некоторое отображение /: Мп -> Nm . Определение 2.1. а) Будем говорить, что отображение / является дифференцируемым класса к и обозначается f eCk(M"9Nm), если каждая их функций fi(x\ / = 1,/и является к раз дифференцируемой вещественной функцией на Мп ; б) Отображение / называется (вещественно) аналитическим и обозначается /еС®(Мп,Nm), если каждая из функции /Дх), / = 1,/й является аналитической, т.е. может быть разложена в сходящийся ряд Тейлора; в) отображение / называется гладким (или бесконечно дифференцируемым, или принадлежащим классу С00) и обозначается f еС™(Мп,Nm), если для всякого неотрицательного целого к отображение / является дифференцируемым класса Ск . Справедливо включение: С03 с С00 с... с С1 е С0. Рассмотрим теперь функцию f(x) = sin x . Данная функция является аналитической, т.е. f(x) e С03(/?,[-1,1]) и ее ряд Тейлора имеет вид А , х(2*+1) На рис. 2.1 показаны графики полиномиальных функций, которые получаются, если ограничиться первыми к членами к < 13 . Из рис. 2.1 отчетливо видна сходимость ряда Тейлора. Однако замечаем, что даже при очень большом числе членов разложения приближение очень плохое вдали от начала координат. Но, с другой стороны, вблизи начала координат приближение очень хорошее. С увеличением числа членов разложения интервал, на котором точность приближения улучшается, также растёт. Это принципиальное отличие аналитических функций от другого класса функций, а именно гладких функций.
94 Методы современной ТАУ. Часть IV Рис. 2.1. Усечение ряда Тейлора для аналитической функции y = sinx (цифры определяют число членов разложения) Для гладких функций ряд Тейлора может расходиться или сходиться, но не к той сумме. Рассмотрим пример. / е С00 (/?, R), [О, х = 0, [е Ux , х*0. Данная функция имеет следующий вид (рис. 2.2). Рис. 2.2. Гладкая функция f(x) = e 1/х Легко проверить, что для любого к *->0 Действительно, например, для к = 1 имеем 2 , Hi (*-'"1 HmD1 fl=\\mA-e~Ux =21im^ ^=lim^ ^- = ... = 0. lim D /L- ..п. --. x-+0 -\lx Это значит, что функция е очень «плоская» вблизи начала координат, причем более «плоская», чем любой одночлен xJ, у = 3,5,7,.... Так как D*/10= 0 для любого к , ряд Тейлора вблизи начала координат имеет вид 0 + 0х2 +0х3+ (2.4)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 95^ Он, конечно, сходится, но не к /(*), а к /(х) = 0, т.е. f(x) является гладкой, но не аналитической функцией. Следует ли из этого, что гладкие функции не могут использоваться для приближений. Отнюдь! Как остроумно заметил Зиман (один из теоретиков теории катастроф), пора, когда сходимость остаточного члена R0(x) = f(x0+x)-(a0 + alx + ... + akxk) при к -> оо являлась основным инструментом приближений и когда «было дозволено, чтобы «хвост» (ряда Тейлора) вилял собакой», явно прошла. Например, ряд Тейлора (2.4) хотя и не сходится к /(*), прекрасно приближает эту функцию в начале координат с качественной точки зрения. Он чётко улавливает, что /очень плоская в нуле. Чего он не улавливает, так это то, что начало есть локальный минимум для/ Для любой гладкой функции /е С00 (R,R) определим ряд Тейлора в начале как формальный ряд /(*) = Zj^V !<>*'• (2-5) <=о/! Ограничиваясь членами степени не выше к, получаем Л-струю. Определение 2.2. к-струей гладкой функции fe С00 (R,R) в точке л:0 (обозначение j\ f(x)) назовем усеченный ряд Тейлора данной функции в окрестности точки /=0 ' • Если ввести замену переменных у = х-х0 и перейти от функции /(*) к функции /(у), т.е. Дх) = Ах(у)) = Яу+хо) = Ау), то Д/оо-Е-^аУ- (2-7) /=0 1' Поэтому без снижения общности точку л:0 можно считать началом координат и в дальнейшем мы считаем, если нет особой оговорки, что л:0 = 0, а формулу (2.6) мы запишем в следующем виде (индекс «О» у jkf опущен) /Л*) = 1Т[Я71о*'. (2-8) Замечание 2.1. Обозначение jkf(x) для £-струи взято по первой букве английского слова «jet» - «струя». Замечание 2.2. Определение (2.8) для Л-струи, вообще говоря, не совсем математически строгое, а является представлением Л-струи в некоторой координатной системе; в данном случае это координаты х0,*1,*2,...,** . Строгое же определение дается в бескоординатной форме, но мы всегда будем рассматривать £-струи в некотором координатном представлении, поэтому выражение (2.8) принимаем за определение. Усеченный ряд Тейлора (2.8) представляет собой многочлен, задающий полиномиальные функции
% Методы современной ТАУ. Часть IV //: R -> R (2.9) независимо от того, сходится или нет ряд Тейлора. Напомним некоторые определения. Определение 2.3. Степенью одночлена назовем сумму степеней всех переменных, входящих в данный одночлен. Например: х[х\х™ - многочлен 26-й степени. Определение 2.4. Степенью многочлена (полинома) р(х) назовем наивысшую из степеней одночленов, входящих в данный многочлен. В случае, когда х е R1, степень многочлена определяет наивысшая степень переменной х. Определение 2.5 [20]. Порядком многочлена (полинома) р{х) назовем наинизшую из степеней одночленов, входящих в данный многочлен. Для xeR1 порядок многочлена определяет наинизшая степень переменной х. Определение 2.6. Будем говорить, что функция f:R->R имеет в начале координат (т.е. в точке х0 = 0) порядок к, если /(O) = D/|o=D2/lo=- = ^"1/lo = O. (2.10) Если jkf(x) многочлен степени к, то многочлен f(x)-jkf(x) имеет порядок (к+\). Другими словами, /-е производные в нуле для jk f(x) и f(x) совпадают для / = 0Д. Тем самым ряд Тейлора и его усечение в виде Л-струи оказывается удобным формальным средством для получения информации о производных функции/и, значит, о ее форме вблизи начала координат, т.е. х0 = 0. 2.1.3. Регулярные и критические невырожденные точки гладких функций Ниже мы будем рассматривать только гладкие функции, т.е. /: Мп -» N с: Rl, либо семейство гладких функций / :М" хАр -» N1 qR\M" qR" ,Ар с Rp - множество параметров, Мп,Ар - гладкие многообразия. Рассмотрим, какие особенности присущи функциям. В свое время П. Монтень тонко заметил, что «функции, как и живые существа, характеризуются своими особенностями» (цит. по [4]). Именно особенности гладких функций (а в общем случае, гладких отображений) позволяют выявить качественные изменения фазовых траекторий динамических систем на основе их особенностей анализа на данном фазовом пространстве. И здесь большую роль играют критические точки гладких функций. Определение 2.7. Пусть задана гладкая функция / на гладком многообразии М" c:Rn ; /: М" -> N czR1. Точка х0 е Мп называется регулярной (некритической) точкой функцииДх), если _ df а/ —I ...... .5*1 dxnyxQ *0. (2.11) Для регулярных точек известна теорема о неявной функции, которая определяется следующим образом. Теорема 2.1 [8] (теорема о неявной функции). Пусть U с R", V a Rm - открытые множества и (xo,yo)eUxV с: R"+m. Если f:UxV->Rm-Cl - отображение, Дхо>Уо) = 0 и det — ф 0, то существует такая открытая окрестность W(\0)dU
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 97 точки х0 и такое отображение g:W(xo)-> V , что g(xo) = yo и /(x,g(x)) = 0 для любого х е W(xq) , причем такое отображение g единственно. Кроме того, g e С1 и (2.12) dg) R-iA — =-В А, дх) (fif • ^ (fif Л где матрицы В и А получаются из матриц —(х,у) и —(х,у) соответственно \ду ) \дх ) при замене аргумента у на g(x). Используя теорему о неявной функции, для регулярных точек можно провести гладкую замену координат у = у(х), при которой данную функцию в точке х0 и ее окрестности можно представить в канонической форме /(х) = Xj, т.е. /(x) = /(x(x)) = /(x) = x,. (2.13) Соотношение (2.13) не что иное, как отображение того факта, что / и / являются эквивалентными функциями (ниже дается строгое определение этому отношению). Покажем один из возможных вариантов такой регулярной замены. Пусть /(х) и /(х) две функции, которые описывают один и тот же физический процесс в различных системах координат. Сделаем следующую замену х = х(х) в окрестности точки л:0: x2=a2lx]+... + a2nxl9 Ху, =аи,х,+... + аиихи. (2.14) Матрица Якоби этого преобразования в данной регулярной точке х0 не вырождена при условии, что дхх ' ' дх„ det \dxt = det x=xoeR" Л2\ *n\ <*2n 9tO. (2.15) Если Df Ц * 0 , то вещественные числа ay-(i = 2,n, j = l,ri) можно выбрать таким образом, чтобы якобиан был отличен от нуля. В этом случае преобразование (2.14) обратимо и по теореме о неявной функции имеет место равенство (2.13). Пример 2.1. Пусть в системе координат (xltx2) функцияJ[\) имеет вид /(х) = 2х,х2. (2.16) Сделаем замену переменных *,=2х,д:2, (2.17) х2=х2. (2.18) Рассмотрим окрестность точки *0 = (x,o,*2o)T » причем дг20 * 0 . В этом случае якобиан преобразования det ы= = det 2х20 2xh О . 1 = 2х2о*0. Перепишем уравнение (2.17) и (2.18) в следующем виде* /|(х,х) = (5,-2х|дг2) = 0, /2(х,х>(*2-х2) = 0. (2.19) (2.20)
98 Методы современной ТАУ. Часть IV Согласно теореме 2.1 о неявной функции выделим из (2.19) и (2.20) координаты х1 и х2 как функции от переменных (х\,х2). Хотя это легко можно сделать и алгебраически, но мы сделаем полные выкладки. Имеем *i=gi(*h (2.21) *2 = *2(*). (2-22) Тогда (2.19) и (2.20) примут вид: /,(g(x),x) = 0, (2.23) /2Wx),x) = 0. (2.24) Взяв полную производную в (2.23) и (2.24) по х, получим 4Г(^(х)>х) = У(ж,ж) dx дх lx=g(x) lx=g(x) М)ш0> дх (2.25) где / = [/|,/2]т. Разрешая (2.25) относительно . , получим ^ Эх ; Ж, а*, foffl dg2(x) аг, аг. = 2g,(i) I о или в координатной форме: х=К(х) 1 0 0 1 £fci(x)=__L_; а^, 2g2(x)' dg,(x)= gl(ic). ag2(x) = 0; ag2(x)_1 dx2 Интегрируя (2.29), с учетом (2.28) получим *2=£2(*) = *2+С|. (2.26) (2.27) (2.28) (2.29) (2.30) С учетом того, что /(g(x),x) = 0, из (2.18) получим С, =0 . В этом случае два уравнения (2.26) и (2.27) в частных производных приводятся к следующему виду dgl(x)_ 1 . dx, 2x2 Из (2.31), (2.32) легко находим 3gi(*)= gi(*) 5^2 х2 *l=g|(« = ^- ^Х2 (2.31) (2.32) (2.33) Ранее было получено *2=g2(*) = *2+e|- ' (2-34) Выражения (2.33), (2.34) определяют переход от координат (х,,*2) к {х\,х2), причем в координатах (jcj,jc2) имеем /(х) = /(х) = 2ххх2 = /(g(x)) = 2^-х2 = х,. ix2 т.е. получен канонический вид (2.13).
"лава 2. Теория катастроф. Детерминированный хаос. Фракталы 99^ В том случае, если в некоторой точке х0 £>/|Х(=0, а /(х) имеет смысл потенциальной функции, то эта точка характеризует состояние равновесия (устой- швого или неустойчивого) и ее называют критической. При этом тип равновесия определяется собственными значениями матрицы устойчивости, или матрицы Гессе в точке х0 G/(xo) = 9V(x) (2.35) J х„ dxfixj Так как Df |Xq = 0, то условия применимости теоремы о неявной функции не выполняются, поэтому /(х) не может быть представлена в канонической форме (2.13). Однако если det(G/(xo))*O, (2.36) то лемма Марстона Морса гарантирует существование гладкой замены переменных, такой, что /(х) локально (в окрестности Ux ) может быть представлена квадратичной формой Дх) = /(х(у)) = /(у) = /(Хо)-у? -у\ -:.:-yl + у2ш +... + у2п. (2.37) Число отрицательных членов /(у) называется индексом функции Морса, саму функцию называют h-м морсовским седлом и обозначают МЦу). Если й = 0, то в точке х0 = 0 достигается минимум /(х), если И = я, то соответственно максимум. Такого рода точки х0 , где Df\x = 0, detG/*(xo):?tO, называют критическими невырожденными точками. Если все критические точки функции /(х) являются критическими невырожденными, то функция /(х) называется морсовской. Далее мы рассмотрим лемму Морса, но прежде нам необходимо ознакомиться с широко используемой в дифференциальной геометрии и топологии леммой о представлении гладких функций. Лемма 2.1 (о представлении гладких функций) [8, 21]. Пусть f-Cr+] -функция (г > 0 ) (имеет производные до (г+1) порядка), заданная на выпуклой окрестности Vx точки х0 в R" . Тогда существуют С -функции gt:Vx ->Rl, / = 1,л, такие, что причем /(х) = Дхо) + £&(хХ*, -*,<>), (2-38> /=1 ft(xo) = |r(xo). (2*39) дх, Доказательство. Положим ftW = J-J-(xO+^-xo))A (2.40) Это всегда можно сделать, т.к. х е VXq ,аКХ() - выпуклая окрестность точки х0 . Применяя элементарные преобразования анализа, получаем
100 Методы современной ТАУ. Часть IV /(»)-/(».)-Jy('°'"('~Ko)df-}ft(»i-^.)|L(»o-b<(»-».)V- 0 Ut (Л/=1 °Xi ) п г df n = Y<(xi-xio)\j-(xo+t(x-4)dt = Y,(xi-xio)gi(xl i=\ о dxi i-l что и требовалось доказать. Пример 2.2. Рассмотрим гладкую функцию f:R->R Дх) = хъ + 3х2 (2.41) и найдем ее представление (2.38) в окрестности точки дг0 = 1. Имеем дх dx Найдем функцию g\(x). Согласно (2.40) получим i gi(x) = J3(\+t(x-l))2+6(\ + t(x-\))dt = (x-\)2+6(X'\) + 9i о тогда f(x0) = /(1) = 4 и представление имеет вид /М = 4 + ((х-1)2 + 6(х-1) + 9)(;с-1). ' (2.42) Это точное представление, т.к. раскрытие скобок формулы (2.42) дает (2.41). Лемма 2.2 (лемма Морса [8, 9, 19]). Пусть Мп - гладкое многообразие (обобщенное понятие поверхности, см. подробнее главу 1) и пусть /: Мп -> R{ и х0 - невырожденная критическая точка функции/ Тогда в некоторой окрестности VXq точки х0 существует такая локальная система координат у\,...,у„9 что ^(хо) = О, / = 1,и и в КХ() справедливо тождество /(х) = /My)) = /(У) = Дхо)-*2 -...-yl +y2h+1 +... + У2п , (2.43) где У)9~.,у„ - координаты точки у, а А - индекс функции /в точке х0, т.е. число отрицательных членов в формуле (2.43). Доказательство. Применим лемму 2.1 о представлении гладких функций к функции Дх). Имеем /00 = /M+Za(x)(*i -*.«). (2-44) /=1 где 1 причем g,(x) = J-^(xo+/(x-xo)A, (2.45) 0 ™i а(хо) = -^(хо),/ = п (2.46) Так как х0 - критическая точка, то а(хо) = О,/ = п. (2.47) Применим к g/(x) вновь лемму о представлении гладких функций. Имеем
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 101 П rsr Дх) = /(х0) + ЕтЧхо)(**-*-о) + •_i OXi '-' (2.48) +SS VXK*i ~Xio){Xj ~Xjo)> i=l 7=1 где l ^(х)=№(хо+/(х-хо))А, /,У = 1,«. (2.49) С учетом (2.47) представление (2.48) имеет вид /(x) = /(xo) + ZZ^(x)(*/-*/o)(^-^o) (2-50) /=1 7=1 Сделаем замену переменных yt =xi-xi09 / = l,/i. (2.51) Тогда (2.50) можно записать в следующем виде: /(х) = Д*(у)) = /(у) = Дхо) + ZS^, (У)Л^- (2-52> i=i j=\ Обозначим /(У) = /(У)-/(ХО). (2.53) Тогда ку) = ££~Ь0{у)у>Уу (2.54) /=1 7=1 Матрицу вторых частных производных £//(.?) сделаем симметричной, вводя замену 4 =^ft+W'"л=ь* (2-55) После чего получаем Лу) = ЕЕ4(у)^г (2.56) /=1 7=1 Отметим, что 1 а2/ 2%9Р7 и по определению матрица р,7(0) невырождена, соответственно матрица б/ДО) тоже невырождена. Если бы функции by (у) были константами, то для доказательства теоремы (леммы Морса) нам было достаточно привести квадратичную форму (2.56) к каноническому виду. В общем же случае процедура приведения состоит в следующем. д2? Пусть для определенности —у (0)^0 (это не снижает общности, т.к. линейным дух изменением координат всегда можно добиться этого), т.е. 6ц(0) ф 0 . Тогда в некоторой окрестности точки у0 = 0 можно записать %(0) = ^г^<0) (2-57)
102 Методы современной ТАУ. Часть IV /(у)=ZS4 Ш& = Si (у)ti+ 2Z5i {уУуГух +ZI4 (у)яру = i-l 7=1 />1 />1 У>1 = sign6n(0) '»sign4i,(0)Vii,(y) J Mfl ZZ5i (y)5y (y)A^+ZZ4 (у)луу = (2.58) Ы ;>i />i y>i = sign^(0)7l2+XZ ;>1 >>1 ^(У)- WiMl, Ь,|(У) V^y где новая координата ух зависит от координат уи...,у„ У\ =Ku)\*+±-—i Матрица ы signal (0)^, (у). ■ ш- 5.(у)*л(у) ш\ , \<ij<n (2.59) (2.60) невырождена в точке у0 = 0 и симметрична. Следовательно, мы сможем применить приведенное выше рассуждение к функции ЕЕ />l j>\ ш- шш ш УгУ, (2.62) и т.д., как в классическом алгоритме Лагранжа приведения квадратичной формы к каноническому виду. Пример 2.3. Рассмотрим функцию Дх) = х\ -4х, + х{х2 -х\ + х2. (2.61) Градиент этой функции grad/(х) = 0x1 - 4 + х2;-2х2 + х, + 1)т. Критические точки функции: grad/(х) = 0, => У- = 0; $- = 0; дхх дх2 х0 -(1,1) ,х0 -^ 6, i2j. Рассмотрим критическую точку х0 = х^. В данной точке гессиан функции/*) det(G/(x)) = det^ _У = -Щ-2 невырожден detG(xo) = -14^O, поэтому данная критическая точка является невырожденной и изолированной, а по лемме Морса ее можно представить некоторой квадратичной формой в каноническом виде. Получим это представление. Сначала найдем функции g,(x), / = 1,2 (формула (2.40)) &« = Яг(*о+'(1-*о))Л. [^ (2.63)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 103 Имеем х7 5 g1(x) = {3(l + ^!-l))2-4 + (l + ^2-l))^ = xI2+x1+^-^. о 1 1 Согласно (2.48) найдем коэффициенты для квадратичной формы: bu(x) = \f&.(x0 + t(x-x0))dt = \(2(\ + t(xl-\)) + l)dt = xl+2; № М*) = )|£Ч*о + Ф'-*о))<* = }^' = |; Jo*2 *21(х) = |^-(х0+'(х-х0))Л = )1л = 1; b22(x) = \^(x(t+t(x-xa))dt = \(-l)dt = -l. Итак, имеем матрицу >2 В(х) = х, +2 1 1 2 Г 2 -1 ) Заметим, что *(*„)= = fG/(x0). Получено следующее представление функции^Дх) (с учетом g/(x0) = 0, / = 1,2, /(х0) = -2) /(х) = -2 + (х1 +2)(Xi -1)2 +(х, -1)(*2 -1)>(^ -I)2 (2.64) Если раскрыть скобки в (2.64), то получим искомое выражение (2.61), т.е. представление квадратичной формы (2.64) выполнено верно. Введем замену переменных: U=*! -*!0 =*1 "I (2-65) У2=х2-х2О=х2-\ (2.66) Тогда *1 = Л + 1;*2=Л + 1- (2-67) Подставляя (2.67) в (2.64), получим f(y) = -2 + (yl+3)yf+yry2-yl. Матрица *(У) = ^ -. (2.68) является симметрической, поэтому Z?(y) = В(у). Обозначим /(У) = 7(У) + 2. Тогда имеем ку) = (п+1)у?+У1У2-У22. (2-69) Приведем квадратичную форму (2.69) к каноническому виду. Согласно (2.59) введем замену координат Ч^Л+^Ч (2.70) где sign £ц(0) = I. После замены имеем
104 Методы современной ТАУ. Часть IV /(**) = >?+ -1" у1 Обозначив окончательно получим /(у) = у\-у1 (2 71) (2.72) С точностью до перестановки индексов (сначала идут положительные, затем отрицательные члены) мы получили каноническую квадратичную форму индекса 1. Если сделать обратную замену, то имеем следующую цепочку: /(У) = /ОЧУ) = /(У) = /(У) + 2 = /(Ях» + 2 = /(х) + 2 . Действительно, (2 70),(2 71) /СКУ)) = sign bu(0)\ 1 = U+3)>f + yry2 + - У\ |Л+3|] I1 + 4|j>,+3| 1 Й = Т~>>2 "ТГ^ (2 65), (2 66) = (х, + 2)(х1-1)2 + 4|*+3| "2 4|й+3| + (xl-\)(x2-\)-(x2-\)2=f(x)-f{x0)=f(x) + 21 т е. представление выполнено верно. Следствие 2.1 (леммы Морса) [19]. Всякая невырожденная критическая точка функции/ изолирована в множестве всех критических точек этой функции, т.е. обладает окрестностью, свободной от других критических точек. Критические точки имеют большую ценность, чем регулярные (некритические), т.к. именно они в основном характеризуют глобальные качественные изменения в поведении функции/*). Рассмотрим морсовскую функцию fM{x\xe R], имеющую вид (рис. 2.3). Здесь три критические изолированные точки, причем точки х§\х^ имеют по морсовской классификации индекс 0, а х^ - индекс 1. Точки j$\jcJ2) являются аттракторами (множествами притяжения; в данном случае каждый состоит из одной точки), причем каждый со своим «бассейном» (областью притяжения) [3]. Важность критических точек состоит в том, что при переходе из одного «бассейна» в другой всегда необходимо проходить через критическую точку, имеющую другой морсовский тип. Следовательно, если/х) имеет лишь изолированные критические точки (является морсовской) и координаты всех этих точек известны, можно определить все качественные изменения в поведении функции/*) при условии, что известен тип каждой морсовской точки. Рис. 2.3. Морсовская функция с двумя «бассейнами» (областями притяжения) и аттракторами Xq\x^
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 105^ Немалую роль в поведении некоторых динамических систем играют критические вырожденные точки, наличие которых подчас приводит к внезапному качественному изменению состояния систем. Появление критических вырожденных точек Df \ч = 0, det||G/(xo)|| = O обычно связано с погружением данной функции fix) в параметрическое семейство функций, т.е. / = /(х,а),где а = (а{,...,аку - вектор параметров. Перестройки качественной картины движения динамической системы, появление особенностей отображения у функции fix, а) при плавном изменении параметров изучают теория бифуркаций (бифуркация - раздвоение), теория особенностей гладких отображений, а приложения этих теорий к исследованию скачкообразных реакций механических, физических, химических, биологических, экономических систем, систем управления и иных систем на плавное изменение внешних условий (управляющих параметров) получили название теории катастроф [4]. 2.1.4. Неморсовские функции. Лемма расщепления. Функции катастроф Определение 2.8. Критические точки функции fix), в которых гессиан det(G/(x0)) = 0, являются неизолированными вырожденными, или неморсовскими критическими точками. Если функция fix) зависит от одного или более управляющих параметров ах,...,ар, то матрица Гессе Gfix) и ее собственные значения зависят от этих параметров. В этом случае возможно, что при некоторых значениях управляющих параметров одно (или несколько) собственных значений матрицы G может (могут) обратиться в нуль. Если это так, то det(G/(x0)) = 0 и, следовательно, условие, необходимое для леммы Морса Df\Xo = O, det(G/(xo))*O, не выполняется и в точке равновесия функция fix) не может быть представлена в канонической форме (в виде квадратичной формы). Но, оказывается, можно найти каноническую форму функции /(х), х е Rn ив неморсовской критической точке. Пусть в критической точке х0 = 0 (для определенности и без снижения общности) D/Lo = O Hdet(G/(xo)) = O. Пусть rank G/(x) = («-/), (2.73) т.е. матрица Гессе Gfix) имеет / нулевых собственных значений (/ > 1). В этом случае лемма Морса не применима, т.е. представление fix) в виде квадратичной формы Г и Л ~Х-У'2+ X у) невозможно. Рене Том [31] показал, что в этом случае функцию fix) можно также привести к некоторой канонической форме. Лемма 2.2 (лемма расщепления). Пусть / собственных значений матрицы Гессе G/(xo,a°) обращаются в нуль в точке (хо,а°), х0 =(х10,...,*л0)Т, а0 =(а10,...,^) . Тогда можно найти такую замену переменных х = я(х).,.лто функция fix) может быть представлена в виде суммы двух функций: неморсовской fm, зависящей от координат
106 Методы современной ТАУ. Часть IV *!,...,х,, которые являются гладкими функциями переменных (хь...,хп) и параметров а^,...,а°р , и морсовскойум зависящей от х1+{9...,хп, которые являются гладкими функциями только искомых координат [х},..., хп), т.е. Дх,а°) = /(*(х),а) = /(х,а) = Л /о о \ Л Q-74) = /мм{х\(х'>* ),-..,*/(х,а )))+/м(х1+](х),...,хп(х)). Назовем координаты х = (хх,...,хе) - неморсовскими, х = (х/+1,...,х„) -соответственно морсовскими. Более того, если / = /(х,а), х е Rn, a e Rp , то при р < 5 (т.е. когда число параметров семейства не более 5), Р. Том показал [31], что (2.74) может быть представлено в следующем виде: /(х, а) = /(х, а) = /(х, х; а) = Cat (x, a) + fM (x), (2.75) где x = (i,,...,5/)T, x = (x/+1,...,*w)T, a = (a1,...,a/7) , Cat(x,a) = [Cat](x) + /7(x,a), (2.76) fM(x) = ±xf+{±xj+2±...±x2n (2.77) (знак ± в (2.77), означает, что тип морсовского седла в точке х0А/£(х0) может быть любым). Функцию Cat(x,a) называют функцией катастрофы, или просто катастрофой, I - число нулевых собственных значений матрицы Гессе G/(x0) (число не- морсовских координат),/? - число управляющих параметров, [Cat]0(x) - росток катастрофы в точке х0 =0 (определение ростка функции будет дано ниже), р(х,а) - возмущение ростка. Из представления (2.75) и названия функций можно сделать предварительный вывод о том, что именно неморсовские функции «создают катастрофы», в чем мы далее убедимся. 2.1.5. Возмущение морсовских и неморсовских функций. Элементарные катастрофы В чем же качественное отличие морсовских и неморсовских функций в их критической точке х0 ? Прежде всего в их реакции на возмущение. Пусть х0 = 0 - критическая точка /(х). Пусть /(хо,а°) характеризует для критической точки х0 и некоторого значения вектора параметров а0 состояние равновесия. Для удобства возьмем х0 = 0, а0 = 0 (это всегда можно сделать, вводя соответствующую замену переменных для сдвига начала координат). Возмущенная функция F(x, а) в окрестности точки (хо,а°]е Rn xRp определяется следующим образом: F(x,a) = /(x)+/>(x;a), (2.78) где/дс) - значение функции/в окрестности точки х0 = 0,/?(х;а) - возмущение данной функции. ' Посмотрим, как ведет себя морсовская функция при возмущении. Пусть хе R1 (скалярный аргумент) и Дх) = Хх2(Х*0). (2.79)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 107 Разложим возмущение р(х, а) по степеням х в окрестности точки х0 = 0, а е Уо - окрестность точки а0 = 0 . р(х;а) = р(0,а)Л\ -хА КО/») э*2 •X +... . (0/1) Объединяя (2.79) и (2.80), получим возмущенную функцию F(x;a) = p(0,a) + др\ дх 0,а) •JC+ Л.+ Обозначим для удобства Р\ дх (0,о) дгр дх (0,о) д'р ■;р'=-д7 (2.80) (2.81) (2.82) (0,а) Сделаем замену переменных х = у + В2у2+В3у3+...9 (2.83) в результате которой из ряда (2.81) можно исключить члены выше второй степени. Покажем это. Сделав подстановку (2.83) в (2.81), с учетом (2.82) получим: у '. Произвольная константа = /?j \ у '. Произвольная константа = Р\В2 + (А, + р2 )\ y3:0 = PlB2+(X + p2)-2B2+p3- j. (2.84) / :0 = PlBA +(X + p2)-(2B3 + В\)+ ръ -ЗВ2+рл; Если р\ = 0, то система уравнений, определяемая при членах выше второй степени уг,у*,..., является линейной и может быть легко решена: Ръ В2=- 2(\ + р2У в,-^- рА (2.85) &(\ + p2f 2(X + p2y В этом случае все коэффициенты В2,В3,... определены корректно, т.к. единственный множитель, который встречается в знаменателях, - это отличная от нуля сумма (к + р2). Если же рх *0, система уравнений может быть также разрешена и коэффициенты 52(р1),53(/?1)... зависят от рх непрерывным образом. Существенным моментом является то, что, если X Ф 0, всегда может быть найдено гладкое обратимое преобразование (2.83), удаляющее все члены выше второй степени. Таким образом, в новых координатах возмущенная функция F(x, а) примет вид F(x(y),a) = P(0;a) + Ply + {(\ + p2) + PlB2}y2 = p(0;a) + Ply + iy2. (2.86) Сделав замену переменных у -» у = \Ц2 у и перенося начало координат А У = V+ Д^, у = у + 2#|
108 Методы современной ТАУ. Часть IV имеем Пу,а) = \р(0;а)-Я\ + \у2. (2.87) Таким образом, возмущение функции одной переменной в морсовской критической точке не влияет на качественную природу этой функции и, хотя при этом критическая точка сдвигается, тип критической точки остается без изменения (рис. 2.4), т.е. морсовские функции структурно {качественно) устойчивы. Рис. 2.4. Возмущение функции в морсовской критической точке Можно показать, что для xeR" возмущение морсовского/i-седла М£(у) также не приводит к локальным качественным изменениям. Рассмотрим, что происходит, если возмущение действует в окрестности немор- совской критической точки. Из леммы расщепления (лемма 2.2) следует, что невозмущенная функция имеет вид /М = /ш 00+ /*(*)■ (2.88) где х = (х,,...,*,),х = (х/+1,...,х„). Напомним, что матрица Гессе в точке xo-G/(xo) имеет / нулевых собственных значений. Самое общее возмущение функции/задается следующей формулой (считаем, что р(0,а) = 0): F(x;a) = /(х) + /?(х;а) = £аЛ +£Ё(±8(/ + Py)xixj +/ш00 + + члены 3-й степени и выше, (2.89) (0/1) R ГI ' = J, dp dp где5/7=<! . . Pi=—\ ; Ау=т-г- Можно показать [9, 10], применяя описанную выше процедуру нелинейного преобразования координат, что каноническая форма возмущенной неморсовской функции имеет вид F(x(y);a) = F(y;a) = FNM (y;a) + FM (y;a), (2.90) где / / / Ш=ЕМ+Е±^ (2-93) /=/+1 /=/+1
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 109 у = (yl(xia)9...,yl(x,a))T9 у = (yl+l(xl.,.,yn(x)). (2.94) Напомним, что знак ± в (2.93) указывает на любой тип морсовского //-седла М% в данной критической точке. Из выражений (2.91) - (2.94) можно сделать следующие важные выводы. Если в семействе функций fix; а) встречается функция /(х,а°), имеющая немор- совскую критическую точку в х0, то согласно (2.90) для любой другой точки fix; a) а Ф а0 близкой к fix; а) можно найти такую координатную систему, что возмущенная функция /(х;а) = /(х;а°) + /?(х) может быть получена отдельным возмущением п морсовской ^Г ±xf и неморсовской fNM части функции / Мы уже выяснили, что /=/+1 возмущение морсовской функции (морсовской части) не вызывает качественных изменений. Возмущения же неморсовской части функции fix) - кардинально меняет топологию этой функции. Покажем это. Но прежде обратим внимание на то, что fNM (ух,...,.у()не содержит члены 1-м и 2-й степени, т.к. по определению точка х0 - критическая и вырожденная, т.е. /м/(>'!»•♦•>>'/) = /ла/(у) включает члены 3-й степени и выше. Р. Том изучил неморсовские критические точки с одной (/= 1) и двумя (/ = 2) степенями вырождений и показал, что в канонической форме FNM(y;u) может быть представлена в виде ростка неморсовской функции, называемого ростком катастроф, [Cat]0(y) и возмущения этого ростка. Если число управляющих параметров /?<5, то для (/= 1, / = 2) Р. Томом были получены следующие элементарные катастрофы (табл. 2.1). Элементарные катастрофы Р. Тома Таблица 2.1 1 1 2 Тип катастрофы Л2 4з А, As А Д+4 о5 р 1 2 3 4 5 3 3 4 5 5 5 Росток [<*].(*) хъ ±х4 х$ ±х6 х1 v2v г5 *i хг ~ хг х\хг+х\ х\±4 Возмущение Р(х;а) ахх а^х + а2х ахх+а2х2 + аъхъ ахх + а2х2 + аъхг + а4х4 ахх+а2х2 + а3х3 + а4х4 + аьхь аххх+а2х2+аъх\ ахх+а2х2 + аъх2 ахх + а2х2 + аъх2 + аАх2 ахх + а2х2 + аъх2 + аАх2 + аъх\ ахх + а2х2 + а3х2 + а^х\ + аьх\ а\х\ + агхг + аъх\х2 + а*х\ + а5х\х\ Пример 2.4. Рассмотрим неморсовскую функцию одной переменной х (/= I) в 1-м параметрическом семействе, т.е. рассмотрим росток элементарной катастрофы А2 (по табл. 2.1) /м/« = *3=[Са1]0(х) (2 95)
110 Методы современной ТАУ. Часть IV Покажем, что каноническим возмущением для этого ростка является ахх. Действительно, возмущение p(x;a) = po + plx + p2x2+p3x3+p4xA + ., (2.96) где ро = р(0;а), А=-ТТ Тогда / = 1,... . :о,«) (2.97) Если сделать замену переменных х = у + В1у2+В3у3+..9 (2.98) то, так же как и в (2.84), в силу того, что коэффициенты (1 + р3) не являются малыми, а р^р^рг считаем малыми вблизи а0 = 0 , можно подстановкой (2.98) в (2.97) и выбором соответствующих коэффициентов pi9 i = 2,3,... исключить все члены ряда (2.97), начиная сх4.В этом случае имеем /nm (У) + возмущение = ро + Р\У + Р2У2 + /• (2.99) Сделаем замену переменных в (2.99) (как в методе решения уравнения 3-й степени) "*-f. получим /nm (z) + возмущение = qo+qxz + z3. (2.100) Постоянная составляющая q0 не влияет на качественные изменения неморсовской функции, поэтому можно принять q0 = 0 . Таким образом, возвращаясь к исходным обозначениям, имеем: каноническое возмущение [Cat]()(x) = x3 -> x3 + alX. (2.101) Проанализируем свойства этого 1-параметрического семейства функций F(x\a) (рис. 2.5): 1) при ах = 0 F(jc;O) имеет критическую вырожденную точку в х0 = 0; 2) при ах < 0 F(x;a) имеет в плоскости две изолированные морсовские критические точки. При возрастании ах эти две критические точки стремятся друг к другу и становятся вырожденной точкой при ах = 0; 3) при а} > 0 F(x;a) не имеет критических точек. А 1 S 1 а s а -5 1 0 1 S Ь F(x\a) ■—^ У -^ а, <0 Рис. 2.5.1-параметрическое семейство функций F(x\a) = х3 +ахх
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы Ш_ В общем случае возмущение ростка катастрофы, имеющего вырожденную критическую точку, вызывает расщепление вырожденной точки на ряд невырожденных критических точек («морсификация»). Максимальное число изолированных критических точек, получаемых при возмущении ростка катастрофы, указывается в нижнем индексе ростка. Например, росток А2 может при возмущении иметь 2 изолированные критические точки. Отсюда можно сделать вывод: возмущение функции f(x) в неморсовской критической точке вызывает качественное изменение в поведении f(x) в окрестности данной критической точки. 2.1.6. Устойчивость. Качественные изменения в системе Теория катастроф с самого начала пыталась дать ответ на вопрос: почему при плавном изменении некоторых параметров динамические системы вдруг качественно меняют свою динамику? Чтобы понять, почему данная наука смогла ответить на многие такие вопросы, необходимо сказать, что ее фундаментом стали следующие теории: • теория особенностей устойчивых гладких отображений (Уитни); • теория бифуркаций. В теории катастроф теория особенностей гладких отображений используется при изучении качественных изменений гладких функций, т.е. отображений /еС°°(мп,я\, а теория бифуркаций позволяет рассмотреть целое семейство таких функций, зависящих от управляющих параметров, которые могут плавно изменяться на некотором многообразии. Качественное изменение поведения динамической системы прежде всего связано с понятием устойчивости гладких отображений. Поэтому изложение мы начнем с раскрытия этого понятия. Здесь необходимо сказать, что такие изменения возможны только с изменением топологической картины фазовых траекторий. Топология, или как ее еще называют, «резиновая геометрия» не делает, например, различия между устойчивыми фокусом и узлом на плоскости. Здесь важно, что поведение двух систем с такими фазовыми портретами качественно одинаковое. Как же выразить на языке математики такую эквивалентность! Введём определения. Определение 2.9 [И]. Пусть/ и / -два элемента С00 (мп, Nm V Назовем/и / эквивалентными, если существуют такие диффеоморфизмы (взаимно-однозначные отображения, дифференцируемые вместе со своими обратными) g: Мп -»Мп и h\Nm -> Nm , что диаграмма (2.102) коммутативна. На языке локальных координат это трактуется следующим образом: если х = g(x) - гладкая замена независимых координат на многообразии Мп (подробнее о многообразиях см. главу 1), у = h(y) - гладкая замена зависимых координат, тогда коммутативность диаграммы (2.102) означает, что справедливы следующие соотношения: м" gi мп f f -» N i N
112 Методы современной ТАУ. Часть IV /00 = *(/(*"'(*)))> или (2.103) (2.104) f(x) = h-\f(g(x))). Выражения (2.103), (2.104) говорят о том, что два отображения f \Мп —» Nm и /: Мп -» Nm эквивалентны, если можно одно отображение преобразовать в другое при помощи гладкой замены независимых и зависимых переменных. Пример 2.5. Пусть М2 -двумерное многообразие (плоскость), вложенное в пространство R3 с координатами: 1) (х,,х2) и 2) (*1»*г) (рис 2.6) Отобразим многообразие М2 в R3 в многообразие N3 с /?3 (седло), используя отображения/ и / : М2 : (хьх2) eR2->N2\ [хьхъ-х2 +х\) е Л3, M2:(xlix2)eR2^N3:(xlix2i2xlx2)eR2. Уз=Уз Рис. 2.6. Изображение морсовского 1-седла М2 зависит от выбранной системы координат Покажем, что отображения / и / являются эквивалентными. Для этого, согласно формулы (2 103), надо найти диффеоморфизмы h и g. Определим g. Л/2 -> Л/2 следующим образом Замена координат в пространстве независимых переменных. , ч Хг+Х2 - / ч ~Xi+X2 ^l=gl(x)=-J-7rJ-, X2=g2(x)=—V-2-. V2 V2 Отображение /: Л/2 -> //3 ^=yi(x) = x,, ;уз = /з(х) = -*|2+*2- В координатах (^1,^2'^з) многообразие Л^3 задается уравнением у3=-у?+у1 (седло) Отображение /: М2 -> Л^3 55i=/i(^) = ^i, Уг =Л(*) = *2. >)3=/з(^)=2^2 В координатах (i'l,^,^) многообразие /V3 задается уравнением .Рз^йй (седло). Найдем теперь отображение A N3 -> /V3 (замена координат в пространстве зависимых переменных)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы ИЗ Й=*(У> = ^. Уз=*>2(у) = -у}+у1 Убедимся теперь, что полученные отображения действительно удовлетворяют, например, первому выражению (2.104). Имеем g"l00: _ хх - х2 Jc,+jc2 /(«"'(5)) = У\ Уг Х\ ~ Х2 1 I Х\ + Х2 I -» - - :,х2 и, наконец *(/(*-(*)))= Уг = !Г = *: V2 - \2 = ^2> - \2 = /(*), что подтверждает правильность найденных преобразований. Перейдем к понятию устойчивости отображений. Определение 2.10 [1]. Пусть feC00 \Mn ,Nm Y Отображение/называется (c/w/ту/с- турно) устойчивым, если существует такая окрестность Wj точки/в С00 (мп, Nw Y что всякое отражение f ^Wf эквивалентно/ Иными словами, отображение/устойчиво, если всякое достаточно близкое отображение / может быть превращено в/с помощью подходящих замен координат в прообразе и образе / . Как же определить, когда для гладких отображений и, в частности, для гладких функций имеет место устойчивость? И здесь, прежде всего, необходимо найти тот атрибут отображения (функции), который отвечает за устойчивость. Таким атрибутом является росток отображений (функции), о котором мы ранее уже упоминали, теперь дадим ему определение. Определение 2.11 [11]. Пусть М" - гладкое многообразие их- точка Мп. а) Две гладкие вещественные функции / и g, определенные в некоторых окрестностях Ux и Vx точки х, называются эквивалентными вблизи х, если они совпадают (/ = g) в некоторой окрестности GxczUxnVx. Замечание. Это отношение эквивалентности отлично от того, что дано в определении 2.9, и относится к определению ростка функции, а неустойчивости отображений. 9 Зак 416
114 Методы современной ТАУ. Часть IV Пусть f \UX-+ R - гладкая функция, где Ux - некоторая окрестность точки х. Тогда ростком функции f в точке х (обозначение [f]x) называется класс эквивалентности функции по отношению к эквивалентности, введенному в пункте а). Про две функции из одного класса говорят, что они имеют общий росток в точке х. Графически это определение можно отобразить следующим образом (рис. 2.7). Рис. 2.7. Функции/и g с общим ростком в точке jc Таких функций/и g, имеющих общий росток в точке х, может быть бесконечное множество, поэтому росток [/] определяют как класс, т.е. как множество однотипных (эквивалентных) функций по определенному выше отношению эквивалентности. По аналогии с эквивалентностью функций введем эквивалентность ростков функций. Определение 2.12 [4]. Два ростка [f]x и Г/1 гладких функций f:M"^>R и /: М" -> R называются эквивалентными, если существуют ростки диффеоморфизмов прообраза [g]x и образа [h] , переводящие первый росток во второй [/l-MH'L-IV'l- Определение 2.13 [4]. Росток [f]x гладкой функции f\Mn-*R в точке хеМп называют устойчивым, если для сколь угодно малой окрестности Ux точки х существует окрестность Wf функции / в С00 (мп ,/Л, в которой для любой функции feWj в Ux найдется точка х, такая, что росток [/]. эквивалентен ростку [f]x- Устойчивость функции в точке - это свойство ростка, а не функции [4]. Это свойство не теряется при изменении/ не затрагивающих хоть как-нибудь окрестность точки х. Правила нахождения ростков функции и определение их устойчивости будет рассмотрено ниже. 2.1.7. Трансверсальность и устойчивость Теперь мы приступаем к изучению вопросов о том, что определяет структурную устойчивость, как определить ростки функций и найти наиболее универсальное возмущение для данного ростка функции. Начнем с фундаментального понятия, введенного Р. Томом, а именно с понятия «трансверсальность». Г.Э. Винкелькемпер назвал трансверсальность «ключом к открытию секретов многообразий». Существуют различные виды трансверсальности: трансверсальность многообразий, трансверсальность отображений и многообразий, трансверсальность отображе-
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 115 ний. В дальнейшем для нас наиболее важную роль будет играть трансверсальность отображений и многообразий, поэтому мы дадим определение именно этому понятию (по остальным видам трансверсальности см., например, [9, 10, 11, 20]). Определение 2.14 [10]. Пусть Мп и Nm - гладкие многообразия и f\Mn-+Nm - гладкое отображение Мп ci?w,iVm ci?m . Пусть W - подмногообразие в N"1 и х е Мп . Тогда говорят, что отображение/трансверсально многообразию We точке хеМ" (обозначается f rhW в х), если выполняется одно из двух условий: а)/(х)*Ж, (2.105) б) f(x)eW и TNm(f(x)) = TW(f(x)) + (Df)TM"(x). (2.106) Условие б) говорит о том, что если /(х) е W , то касательные пространства к W и f\Mn \ в точке х порождают пространство Rm . Введенные условия трансверсальности позволяют определить структурную устойчивость или неустойчивость отображений и, в частности, функций. А именно: если отображение/трансверсально W в точке х, то оно будет трансверсальным W при малых возмущениях этого отображения [11,31]. Сформулируем это в виде следующего факта. Утверждение 2.1 [11]. Если зависящее от параметра семейство отображений (функций) трансверсально данному многообразию, то для плотного множества значений параметра индивидуальные отображения (функции) также трансверсальны этому многообразию. Рассмотрим пример определения трансверсальности отображений и многобразий. Пример 2.6. Пусть W- одномерное многообразие (прямая), вложенное в Я3 и задаваемое координат- но: W = {xeR3:xx =\ух2= 2,х3}<=>(1>2,х3)• Пусть M2 = R2 - двумерное многообразие в R3 (плоскость) Отобразим М2 = R2 в R2, используя следующее отображение: /: (xj,jc2) e R2 Ц 2хь3х2>е~^+xlA e R3. Тогда /(м2) и Wпересекаются в точке хо=(1;2;еч)'694)еЛ3. В касательном пространстве к^в точке х0 можно взять базисный вектор V3 = (0,0,1) . В касательном пространстве к f\M2) в точке х0 можно взять базисные векторы (рис. 2.8) *3ь / W = (l,2,x3) Рис. 2.8. Определение трансверсальности/и УУк примеру 2.6
116 Методы современной ТАУ. Часть IV Так как det 2 О ,,-0,694 О 3 ~е* О 0 1 = 6*0, то векторы V,,V2,V3 порождают пространство R3. Следовательно, /(^2) трансверсально W в любой точке их пересечения. Пример 2.7. Пусть М = R = W,W <zR2 и / R->R2, /(x) = (x,*2). Тогда f cf\W для всех ненулевых х f можно возмутить сколь угодно мало и сделать / трансверсальным к V/ для всех х А именно: f(M)rfiW = 0 (рис. 2.10, а\ f(M)nW в точках пересечения *„ / = 1,2 (рис. 2.10, б). L f(M) R* Л") w Рис. 2.9. Определение трансверсальности/и Wk примеру 2.7 f(M) ./ f(M) w a) f(M)nW = 0=*f(M)rfiW б) f(M)(t\W в точках дг„/ = 1,2 Рис. 2.10. Возмущение отображения/(к примеру 2.7) Видно, что здесь fix) является морсовской функцией, и теперь мы наглядно видим, а ранее показали это аналитически, что морсовские функции являются структурно устойчивыми. 2.1.8. Многообразия катастрофы и бифуркационные множества Рассмотрим семейство функций f:MnxAp^R9 (2,107) где Мп - гладкое многообразие, Мп с Rn; Ар - другое гладкое многообразие, Лр е Rn ; Rn - пространство состояний; Rp - пространство управляющих параметров (управлений). Определение 2,15 [20]. Многообразие катастрофы М* назовем подмножество в Rn xRp, определяемое уравнением М#: D/(x;a) = 0, (2.108)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы П7^ т.е. это пересечение п гиперповерхностей в Rn xRp: М#:-^-(х;а) = 0, /=п. (2.109) dxt Определение 2.16. Отображением катастрофы % называется ограничение на Мп естественной проекции n:RnxRp->Rp, т.е. п(х,Ар)=Ар. Определение 2.17. Особым множеством S называется подмножество в Мп , сб- стоящее из особых точек отображения х> те- точек (х,а)еМиА где х является особым, т.е. rank D% < p. Определение 2.18. Образ особого множества %(S)<zAp называется бифуркационным множеством и обозначается JB. Особое множество S с Ми и бифуркационное множество JB с Ар имеют меру нуль в соответствующих пространствах, о чем свидетельствует следующая теорема. Теорема 2.2 (теорема Сарда) [11]. Пусть Мп и Nm - гладкие многообразия и f\Mn-±Nm - гладкое отображение. Тогда множество критических значений/имеет меру нуль в Nm . Из введенных определений, в частности, следует, что S - это множество точек (х,а) € М , в которых /(х;а) имеет вырожденную критическую точку, а значит JB - место, где меняется число и природа критических точек; ввиду структурной устойчивости (устойчивость относительно малых возмущений) морсовских функций такое изменение может произойти лишь при переходе через вырожденную критическую точку. Рассмотрим подробно пример, где определим все отображения и множества, которые были введены выше. Пример 2.8. Катастрофа Аъ (катастрофа «сборки»): /(*;а) - [Cat]0 (х) + каноническое возмущение = -х4 + ахх + -а2х2. (2 110) Замечание. Коэффициенты 1/4 и 1/2 взяты для удобства. Итак, последовательно определяем: 1) Многообразие катастрофы (множество критических точек) M*:Df(x;*) = x* + a2x + al=Oy (2 111) ах=-а2х-х\ (2.112) Любая точка реМ* имеет следующие координаты: (хуа2,щ) = (х,а2-а2х-х3). (2 113) Это отображение: Д2->М, (хуа2)->(х,а2,-а2х-х3). (2 114) 2) Множество критических вырожденных точек (особое множество Sa Ми): 3x2+a2=0, D2/(x;a) = 0, (2.115) 6х = 0, D3/(*;a) = 0. (2.116) Из (2.115) получаем точки пространства управляющих параметров, которые определяют вырожденную критическую точку на S с М*(1 = 1):
118 Методы современной ТАУ. Часть IV (2Ш) а2=-3х , => я, =2*. 3) Если исключить xeS из (2.117), то получим \3 / \2 т) ♦(?) -' (2.117) (2.118) Уравнение (2 118) определяет часть бифуркационного множества JB. Оставшуюся часть найдем из выражения (2 116) для дважды вырожденных точек (/ = 2). „ Точка сборки Многообразие катастрофы Л/* а2 Рис. 2.11. Многообразие катастрофы и бифуркационное множество элементарной катастрофы А3 А"2 . +/(*) /м ЧУ U м \ V7 /н ^ ♦ /W «1 Рис. 2.12. Бифуркационное множество JB и вид функции /(х;а) при разных значениях параметров (аьа2): I - 1 критическая точка, II - 2 критические точки, III -3 критические точки
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 119 Имеем: (2 115) (2 111) 6х = 0=>х = 0 => д2 = 0 => д,=0 (2 119) Итак, бифуркационное множество (сепаратриса управляющих параметров) JB состоит из точки (я,,я2) = (0,0) (точка сборки) и-кривой складок, описываемой уравнением (2.118) (рис. 2.11). Функция /(х;а) в разных областях пространства управляющих параметров А2 имеет вид (рис. 2.12). 2.1.9. Топология Уитни. Эквивалентность (устойчивость) функций С ТОЧКИ ЗРЕНИЯ ТЕОРИИ НЕПРЕРЫВНЫХ ГРУПП Цель этого параграфа - ввести топологию на множестве гладких отображений (гладких функций). Все понятия эквивалентности отображений (функций), которые мы ввели ранее, определялись тем, что нелинейной заменой координат можно одно отображение перевести в другое. Но конечные нелинейные преобразования достаточно сложны и трудно реализуемы. Можно ли найти какой-нибудь инфинитезимальный, т.е. работающий с бесконечно малыми преобразованиями, аналог такой нелинейной процедуры, который бы позволил относительно просто решать задачу приведения гладкой функции к каноническому виду? Такой анализ был найден, для чего использовались i-струи гладких отображений (функций). Напомним (см. §2.1), что i-струя в точке х0 =0 (для определенности) jkf(\) - это усеченный ряд Тейлора отображения/в точке х0 = 0 до членов порядка к включительно. Определение 2.19 [11]. Пусть Мп и Nm - гладкие многообразия и хоеМ". Пусть f,g: Мп -> Nm - гладкие отображения, удовлетворяющие условию /(х0) = = £(*о) = Уо- 1) /имеет касание первого порядка с g в точке х0, если Df \Xo = Dg |^ как отображение ТХ()Мп -+TyQNm (т.е. как отображение касательных пространств). 2) /имеет касание к-то порядка с g в точке х0, если Df: ТМп -> TNm имеет касание (к -1) порядка с отображением (Dg) в каждой точке ТХМ" . Этот факт записывается следующим образом: « / ~к g в точке х0 » (к - положительное целое число). 3) Обозначим через Jk [Mn,Nm) множество классов эквивалентности по от- ношению « ~к в точке х0 » в пространстве отображений /: Мп -> Nm, удовлетворяющих условию /(х0) = у0. 4) Сформулируем множество Jk(Mn,Nm)= u Jk (м",Nm ) Элементами множества Jk (Mn,Nm\ являются Л-струи в любой точке \0еМп9 причем каждый элемент j4f можно рассматривать как некоторый класс эквивалентности, т.е. набор элементов, которые эквивалентны друг другу по признаку «все функции, входящие в данный класс, имеют одинаковый усеченный ряд Тейлора до к-й степени включительно в данной точке х0 ». Теперь на множестве гладких отображений можно ввести топологию.
120 Методы современной ТАУ. Часть IV Определение 2.20. Пусть Мп и Nm - гладкие многообразия. 1) Обозначим через С™ (M",Nm j множество гладких отображений из М" в Nm . 2) Фиксируем неотрицательное целое число к. Пусть U некоторое подмножество в Jk(M\Nm}. Обозначим M(U) = {feC-(M\Nm):jkf\x€Mnc:u}. 3) Семейство множеств {M(U)}, где U - открытое множество в Jk (мп,Nm\ образует базис некоторой топологии на С00 [Мп\Nm). Эта топология называется Ск -топологией Уитни. Обозначим через Wk множество открытых подмножеств в С™ \Мп,Nm j в Ск -топологииУитни. 4) С*-топологией Уитни называется топология, базисом которой является w = [}wk. к=0 Введем на Jk \Mn\Nm j метрику d, совместимую с топологией. Открытая окрестность элемента/в пространстве С00 \Мп\Nm\ в Ск -топологии Уитни Bb(f)^{geC^(M\Nm):d(jkf(x)Jkg(x))<5(x)yxeMn]. Семейство {#§(/)} образует базис окрестности точки / в С00^",^) в Ск -топологии Уитни. Мы можем представить себе Bb(f) как множество гладких отображений, у которых к частных производных 5 близки к соответствующим производным/ После введения топологии в пространстве Cco(Mn,Nm ) его можно рассматривать как многообразия Фреше [И]. Более детально структуру и свойства этого многообразия мы рассматривать не будем (подробнее см. [II]). Главная же цель введенных понятий и множеств - это сформулировать инфинитезимальный критерий устойчивости отображений Джона Мазера, который позволит получить конструктивный алгоритм поиска ростка и деформации функции. Так как С00 Шп\Nmj - гладкое многообразие, то можно рассмотреть на C°°(Mn,Nm) действие непрерывных групп преобразований (диффеоморфизмов) (подробнее о группах см. главу 1) где Diff\Mn\ (соответственно Diff\Nm\) - группа всех диффеоморфизмов многообразия Мп (соответственно Nm ). Это действие знакомо нам по диаграмме, определяющей эквивалентность двух отображений/и / е С00 (мп, Nm \
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 12^ мп —£-> Nm gi ih Мп —£-> Nm9 geDiff(Mn\heDiff(Nm\ {gih)eG. Действие G на элемент f еС*{мп,Nm\ определяется равенством (#,/*)•/ = = h-f-g~l = f, т.е. элемент группы G, действуя на/ переводит его в /. Напомним определение (подробнее см. главу 1). Определение 2.21. Орбитой точки f еС*[мп ,Nm\ называется множество G.f = {feC«(M\Nm):f = {g,h).fy{g,h)eG}9 т.е. орбита точки/- это всевозможные элементы, принадлежащие Cco(MniNm)i которые могут быть получены действием на/всеми элементами группы G. Лемма 2.3 (об устойчивости) [11]. Пусть feC°° (Mn,Nm). Отображение/является устойчивым тогда и только тогда, когда орбита / под действием группы G = DifflM") х DiffyN™) является открытым множеством в С00 (Мп, Nm 1. Это лемма говорит о том, что / лежит в орбите/тогда и только тогда, когда / эквивалентно/ Применение этого критерия для нахождения эквивалентных функций также затруднительно, в силу того что весьма сложно определить элемент группы G. Но можно линеаризовать группу, рассмотрев ее инфинитезимальные преобразования в окрестности тождественного преобразования В этом случае решение во многих случаях будет намного проще. Используя фундаментальное свойство устойчивости трансверсальных к многообразиям отображений, Джон Мазер дал инфинитезималь- ный критерий устойчивости отображений (замены переменных). 2.1.10. Инфинитезимальная устойчивость. Алгоритм Д. Мазера Изложим алгоритм Д. Мазера [20, 27, 28]. Предположим, что мы имеем Острую jkf(\) ряда Тейлора функции/в окрестности х0 = 0 . Ясно, что jk f{\) - это полином k-й степени. Если считать, что функция (полином) 7(х) = //(х), (2.120) то задачей является определение всех функций geCco(Mn,Nm)i эквивалентных данной функции /. Если сама функция/будет эквивалентна /, тогда усечение ряда Тейлора не влияет на качественные изменения в поведение данной функции. Пусть xeR. Рассмотрим однопараметрическую замену (действие однопарамет- рической группы Xt) координат (параметр t). Пусть Xtx = х + tq(x)9 Xox = х, где Я(0) = М =0, dxL т.е. полином порядка 2. Функция 8 Зак. 416
122 Методы современной ТАУ. Часть IV foXt:x^f(Xtx) начинает изменяться с Л Мы хотим привести ее к более простому виду. Для этого рассмотрим как начинает смещаться (£+1)-струя jk+\foXtx). Чтобы найти независимые смещения (&+1)-струи в точке jk+lf(x), используем бесконечно малые преобразования. Имеем вектор касательного пространства в точке jk+lf(x) /-►о t в пространстве (£+1)-струй, который будем считать выходящим из точки jMf(x). Из свойств линейного разложения Тейлора вытекает, что Если положить F{x,t) = foXtx = f{Xtx\ то v limJk+\nx,t)-F(x,0)) Компонентами вектора jk+l (F(x9t)-F(x90)) являются различные производные по х. Так как F гладко (по построению), порядок дифференцирования можно изменить v = /♦« r,im^,Q-F(,,O)-| = /+1 СшЛх + *х))-Ю\ V'->o t ) V^o t ) Рассмотрим разложение в ряд Тейлора функции f(x + tq(x)>j по степеням / в точке х. Имеем f(x + tq(x)) = f(x) + tq(x)Df\x -И2/(х,0, (2.122) где /(л:, 0 - гладкая функция (это не зависит от того, сходится этот ряд Тейлора или нет). Поэтому (2.121) с учетом (2.122) примет вид v = /+1 {\im±(nx) + tq(x)Df\x +t2l(x,t)-f(*)fj = /+1 (q(x)Df \x). (2.123) Таким образом, для (М1 = Rl) v является конструкцией функции q— = qDf \x, т.е. ^ dxJ \ (2.124) <7(0) = ^(0) = 0. ах Для дальнейшего анализа алгоритма Мазера нам необходим некоторый дополнительный математический аппарат. Имея дело со струями, часто приходится производить «усеченные» алгебраические операции. Для данного многочленар(\), где х = (хх,...,хп), мы назовем его усечением до степени к (включительно), многочлен, образованный всеми членами к /?(х), степени которых равны или меньше к. Это усечение обозначим через р[\) . Например: г 2 Ъх-2у + 1ху + 9х j+43jc^ = Зх - 2у + 7ху. Фактически (напоминаем х0 = 0)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 123^ Щк=/р(х). (2.125) (Проверить!). Фиксируем какое-нибудь значение &, и пусть р и q - произвольные многочлены. Тогда p + q =pk+qk. (2.126) Для произведений соответствующая формула имеет вид РЯ=ркЯк . (2.127) На основании этого анализа мы сможем рассмотреть операции над ^-струями: j\p + q) = jkp + jkq, (2-128) 7* jk{pq) = (jkp)(jkq) > (2.129) JkUoq) = jkjojkgk (2.130) (струйный аналог «цепного правила»). «Цепное правило» - обобщенное правило дифференцирования сложных функций, суть которого состоит в следующем. Если / :Rn -» Rm - дифференцируемое отображение в точке, a g\Rm —» Rp - дифференцируемое отображение в точке /(х), то композиция отображений gof:Rn^Rp9^gof = g(f(x)) также является дифференцируемым отображением в точке х и ее производная находится по формуле D{gof)\x=Dg\f{x)oDf\x. С А:-струями функций связан ряд векторных пространств (пространства /:-струй), где элементами векторов являются соответствующие коэффициенты ряда Тейлора в точке х0 = 0: Ek={jkf:BCQf:Rn^R}9 (2.131) 4={//:все/:ЛЛ^/?с/(0) = 0}, (2.132) /*={//:Bce/:^->«c/(0) = 0,zy|0=0}, (2.133) Мк = {jkf: все/: R" -+ R порядка к(к> 2); (2 ] щ ряд Тейлора начинается с &-го элемента}. Короткий комментарий. Пространство Ек совпадает с пространством Jk(Rn,R) в обозначениях предыдущего параграфа; Jk не требует комментария; 1к - множество £-струй функции с критическими точками; Мк - множество Л-струй функций, у которых отсутствует начальный участок ряда Тейлора С учетом алгебраических операций (2.128) - (2.130) вектор v (2.124) касательного пространства можно записать следующим образом: v = /+I(**)f)-/+W/+If'+1. (2-135) Струи jk+]q(x) образуют векторное пространство /j*+1, которое можно представить себе как пространство всех многочленов со степенями одночленов, заключен- 8*
124 Методы современной ТАУ. Часть IV ных между 2 и (£+1). Выбрав какой-нибудь i тересующего нас касательного пространства iep, странстве jk+lf(x) будет ных между 2 и (£+1). Выбрав какой-нибудь базис в /j*+1, мы можем найти базис ин- Например, если полиномы р{(х),...,рг(х) в 1хк+], тогда базис в касательном про- /+1(Л(*)01£«-£г. (2.136) Из них можно отбросить те, которые после усечения оказываются линейными комбинациями других. Очевидно, базис в IXM: jc2,jc3,...,jc*+i . Возьмем для примера 1хк+\к = 3). Предположим, что ff{x) = px2+qx3+rx4. Тогда /[ — I (х) = 2рх + Зрх2 + 4гх3 + ах4, \dx) где а зависит от 5-й производной/ которую нельзя определить по 4-струе. Выбирая x2,*3,*4 в качестве базиса для 1хк+х, приходим к следующей системе образующих для касательного пространства к орбите струй f f под действием группы замены переменных: рх = / Г*2 (2рх + 3qx2 + 4пс3 + осе4 )1 = 2рх3 + 3qx4; р2 = / [х3(2рх + 3qx2 + 4гх3 + осе4)] = 2рх4; ръ = f [V (2рх + 3qx2 + 4гх3 + осе4 )] = 0. Для/? Ф 0 получаем 4 1 ' -тР»_ Д. Мазер показал, что, если базис phi = l,r позволяет получить любой одночлен степени (Л+1) в виде линейной комбинации базисных элементов phQ= Ь^) с постоянными коэффициентами, тогда Л-струя jkf(x) эквивалентна множеству функций jkf(x) + g(x)» гДе &(*) ~ полином порядка (к+1). В этом случае такую функцию называют ^-определенной. Дадим точное определение. Определение 2.22. Функцию /(х) назовем к-определенной в точке х0 (здесь принято х0 = 0), если для любой другой функции / с той же самой Л-струей существует гладкая замена переменных, такая, что Дх) = /(*(х)). Нахождение ^-определенности функции /(х) позволяет найти (если, конечно, это возможно) полином конечной и достаточно небольшой степени, эквивалентный/ Из этого следует, что если jkf(x) = f(x) и /(х) эквивалентна /(х), то возможно усечение ряда Тейлора для функции /(х) до &-й степени включительно.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 125^ В случае функций многих переменных f:Rn-+R общий касательный вектор к орбите (£+1)-струи jk+]f(x) будет [4] где Qj - произвольный полином из Ixk+l. Так как любой член порядка к и (£+1) в jk\ — исчезает после умножения на элементы QXx) порядка >2 и усечения до [dxj *+i. (Л+1)-й степени, касательное пространство к орбите j f зависит только от много- членов jk+l -I- . Итак, ^-определенность функции /(х),х е R" означает, что каж- [dxj дое направление в Mnk+l (см. (2.134)) фяд Тейлора начинается с (&+1)-й степени) лежит в этом касательном пространстве. Алгоритмически это означает, что Ht+i Л taW/+1(^J :flW6//+1 • (2-138) Если (2.138) выполнено, то каждая гладкая функция g: Rn —> R порядка (k+\) может быть представлена в некоторой окрестности нуля (х0 = 0) в виде %^ь ■ где <?Дх) - гладкие функция порядка < 2 . Алгоритм Д. Мазера для вычисления ^-определенности функции //-переменных [9, 27, 28]. 1. Вычислить полиномы: RiJ(x) = jM\jj-pJ(x)\ /,7 = 1,2,..., (2.139) где {pj(x)) - базис пространства |//+l :х,2,...,^, ххх2,..., ^i^...}. 2. Функция f{x) будет k-определенной, если все одночлены (к + \) степени могут быть записаны в виде линейных комбинаций полиномов Ry(x) с постоянными коэффициентами, т.е. выполнено включение (2.138). Пример 2.9. Вычислить определенность функции (х0 = 0) Предположим, что к - 3, тогда Найдем полином Rlt(x): /(x) = i(JCl+jt2)2+iX|. (2 140) +(6*,+2*2)|^=ол;?+4^^ х} + хх\ х,+ (2 141)
126 Методы современной ТАУ. Часть IV где знак = означает равенство с точностью до некоторых постоянных множителей, не влияющих на базовый полином Ru(x). Представление (2.141) говорит о том, что если разложение в ряд Тейлора производится в нуле хо = О, то (А+1)-струя для всех полиномов со степенью s<,k + \ будет совпадать с самим полиномом. Это было показано для полинома (х, + x2)xf . Рассмотрим случай, где s > к +1. Например, 1 В табл. 2.2 приведены полиномы R,j(x) для функции /(*) = — (х, +х2) +—х\. Таблица 2.2 j 1 2 3 4 5 6 7 8 PjM *!*2 4 х\х2 ххх\ 4 (хх+х2)х1 (xl+x2)xlx2 (xt+x2)xl (x{+x2)xl (x]+x2)xfx2 (*1+*2)*2*1 (Xi+x2)x\ 0 1 дхх J _ Rij(x) = / ~fPjw _dx2 J (xt + x^xf+xfxl (xl+x2)xlx2 + xlxl (x{+x2)xl + xt (Х,+Л2)х,3 (хх + х2)х^х2 (*!+*2>*2*l (xi+x2)xl 0 I Все множество одночленов степени k+\ = 3+1 = 4 может быть выражено через Яу(х). Действительно: x42=R23(x)-Rn(x), xlxl = R12(x)-Rl2(x), xtxl = R2i(x)-Rn(x), xlx2=R25(x)-(R2l(x)-Rn(x)), xf = R24{x) - {R25(x) - (R2l(x) - Rx ,(x)). Таким образом, функция fix) в нуле является 3-определенной. 2.1.11. Деформация (универсальные возмущения) функции Функции с неморсовскими критическими точками, к которым относится и ростки функции катастроф, могут устойчиво встречаться лишь в семействах функций, зависящих от одного или более управляющих параметров. Поэтому можно изучить возмущения на данную функцию с вырожденной критической точкой, вложив немор- совскую функцию/х) в семейство функций F(x\a): / = /(х),х = (*!,...,*„), (2.142) F = F(x;a),a = (a1,...,a;?) (2.143) - вектор параметров /(x) = F(x;0). (2.144) Определение 2.23. Семейство функций F(x\ а) называетсяр-мерной деформацией функции^х). Чем больше семейство функций, тем больше общие возмущения могут быть описаны. Можно ли найти такое семейство, которое, с одной стороны, достаточно велико, чтобы с его помощью можно было описать все возможные качественно различ-
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 127_ ные возмущения X*), а с другой стороны, достаточно мало, чтобы с ним было легко работать? Такие возмущения были найдены. Определение 2.24 [20]. Заданная р-мерная деформация F(x;a) называется вер- сальной, если любая другая деформация F(x\a) функции Дх) может быть получена из нее путем гладкой замены переменных: (2.145) uj =aj(a),j = lp, где р не обязательно равно р. Определение 2.25. Деформация F(x\ а) называется универсальной деформацией /(х), если она является версальной и имеет минимальную размерность. Д. Мазер [27, 28] предложил алгоритм определения универсальной деформации (возмущения) функции (в теории катастроф - это ростки функции катастроф). Алгоритм требует найти число ^-определенность функции/*), для того чтобы ра- боть лишь с полиномом f(x) = jkf(\). При этом предполагается, что • иу-последовательность одночленов от переменных xl,x2,...ixl (/ - число не- морсовских переменных) степеней 0, 1, 2... rij : l\xl9X2,..,xl\Xx,xlx2.. ; (2.146) • F(x:a) является/?-мерной деформацией полинома f(x). Определим многочлены Г,(х) =—jk+lF(x-a)\a__o. (2.147) aj Кроме того, должны быть перечислены все многочлены вида: 5(/(х) = /|^-«у(х)1. (2.148) Тогда, если все одночлены степени не выше к могут быть выражены в виде: любые одночлены степени < к = ^s^Sy (x) + ^tjTj(x), (2.149) U J (где Sy-ytj - вещественные числа), то это означает, что F(jc; а) является версальной деформацией /(х); если 7}(х) минимально, то F(x;a) - универсальная деформация полинома /(х). Полиномы Tj(x) образуют минимальное множество тогда и только тогда, когда они линейно независимы. При нахождении канонической линейной (по 7)(х)) формы универсальной деформации полинома f(x) F(x;a) = /(x) + f>y7}(x) 7=1 для определения параметров деформации яу может быть применена теорема о неявной функции. Пример 2.10. Вычислить универсальную деформацию функции (ростка катастрофы D^ , см. табл. 2.1) Дх) = х?х2+х1/3. Ясно, что полином
128 Методы современной ТАУ. Часть IV /« = /А*) = /« = *12*2+*23/3. Функция /(*) является 3-определенной (проверить!). Имеем Найдем полиномы S,j(x) (формула (2.148)). . |4*) = 2*,*2,£-(x) = *? + **. Таблица 2.3 j 0 1 2 3 "j 1 х2 sly(x) = / f*;(x)~ ax, ; xfx2 х\4 0 *|(*|2 + *2> X2(X,2+X22) 0 Ни один из одночленов первой степени х{,х2 не может быть выражен в виде линейной комбинации S,j , поэтому полагаем 7J(x) = xly Т2(х) = х2. Для одночленов второй степени в качестве базисных можно использовать Su(x) = xlx2, S2l(\) = дг,2 + х\. Множество полиномов второй степени является линейным вектором пространства размерностью 3. Два базисных вектора Su{\\ S2X{\) уже есть. В качестве третьего вектора можно взять х2,*2 или х2 -х\ . Возьмем Т3(х) = х\. Все одночлены х\,х\хъххх\,х\ (А: = 3) могут быть выражены с помощью полиномов Si}{x). Например xl = Sl3(x)-Sn(x). Таким образом, универсальной деформацией (с точностью до гладкой замены координат).Дх) будет х3 F(x\alia2ia3) = xtx2+-Z- + a]xi + a2x2+ajc22. 2.1.12. РОСТОК ФУНКЦИИ КАТАСТРОФЫ Росток функции в точке х0 представляет собой результат двух процессов: использование управляющих параметров для удаления начальных членов разложения функции в ряд Тейлора и использование гладкой замены переменных для удаления крайних членов разложения. В действительности росток лежит между двумя линейными векторами пространства, конструируемыми в алгоритмах вычисления определенности и деформации (возмущений). Алгоритм нахождения ростка функции можно определить следующим образом [10,28]: 1) найти ^-определенность функции, после чего можно работать с полиномом /(х) = //(х); 2) пусть Vk - линейное векторное подпространство, порождаемое всеми одночленами от хх,...,хе (переменные неморсовской функции степени) не выше к, при этом ,. .. (* + /)! dimK*=^7T; 3) пусть VR - линейное векторное подпространство Vk, порождаемое всеми многочленами R,j(x), получаемыми в алгоритме нахождения определенности;
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 129 4) пусть VD - линейное векторное подпространство, порожденное минимальным множеством 7}(х), получаемых в алгоритме деформации. Тогда Vk-(VR®VD) = Vkl(yR®VD) является линейным векторным пространством, порожденным первыми частными производными ростка/ Пример 2.11. Найти канонический (простейший) росток [/]0(х)> связанный с функцией Л*1,х2) = х2х2 + х\/3 + х\/2, (/ = 2). Наша задача: найти определенность данной функции, что позволяет отбросить «хвост» порядка (А+1) всех функций, имеющих такую же Дг-струю, а затем в Дг-струе извлечь информацию об универсальной деформации. Остаток и есть росток данной функции. Прежде всего найдем полиномы /?^(х) и 5^(х), связанные с нахождением ^-определенности и деформации (возмущения). Данные функции приведены в табл. 2.4. Сразу заметим, что в данной таблице помещены полиномы RtJ{\) и для базисных одночленов хьх2, которые не используются для нахождения к- определенности данной функции, но необходимы в дальнейшем для определения размерности пространства VR . Функция Дх) является 4-определенной, 5 членов 5-й степени х[х{, (/ + / = 5, / = 0,5) из 6 непосредственно совпадают с отдельными полиномами Rtj{x) (они заключены в штриховую рамку, например х\ = #2,1зОО), а оставшийся одночлен х\ = Rlb{\)- Rxl{\)- Ru{\) является линейной комбинацией ^;(х). Полиномы для нахождения ростка функций f(x) = х2х2 + х\ /3 + х\ 12. Перейдем к определению пространств VkiVRyD. Пространство Ук = У4 имеет размерность (/ = 2) * kill 4!2! Таблица 2.4 j 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 - xi Х2 хххг 4 *? х\*г х\*\ 4 х]хг *\*\ х\хг А А 1 ^i Х2 *i ххх2 4 Х1хг ххх\ 4 xi - - - - — - х\х2 х\4 4хг 44 х\4 \xfx2 \x\x\ \44 "о"" 1 х\хг х\хг х\4 4Х2 44 х\4 0 1 Л2у(х) = - дг,3 + хх2х2 + ххх2 ^^2 +Х1Х2+ Х{ Х% 44+4^) х\+х\х\+х]х2 х*х2 + х1х\ + х\х\ х]х\ + ххх\ + ххх\ Х\ Х2 ~^" Х2 "^V^2 У г-4-"« \Х\Х2\ '3 2' \Х\4\ ! x{2xl! 1 d • \Х\Х2\ • 5 ; 0 1 S2j(x) = ■ASM 4+4+х2 х,3 + ххх\ + хх х2 Х2ХХ2 + ^2+^2 х\4+х12х1+х12х2 xx2x2+xlxl + xlxl x2xl+x\ + x\ 4Х2 44 xi4 4 0
130 Методы современной ТАУ. Часть IV Для нахождения размерности пространства VRcV4i базисом которого являются полиномы /^(х), представим базис пространства V4 в виде узлов некоторой сетки, где узлы определяют базисные одночлены V4 (произведения x[x'2(i + j < 4, ij= 0,4)) (рис. 2.13). Х2 \ 0^ 4 £$- *г 4 О Ш -& \ *1 v° X] V2 Y3 4 JC| * JC| Л] -Xj Рис. 2.13. Базисные элементы пространства У4 Прежде всего, найдем полиномы (одночлены) /^(х), которые в точности совпадают с некоторыми базисными одночленами У4 . Это одночлены /fy(jc), /= 1,5 (они обведены сплошной тонкой рамкой в табл. 2.4 и отмечены на рис. 2.13 черными кружками). Следующие базисные одночлены подпространства VR получены в виде линейной комбинации полиномов /fy(x), в табл. 2.4 они обведены кружком, а на рис. 2.13 представлены белыми кружками. Имеем х< = Д29(х)-Д2|2(х)-Я214(х). Заметим, что полином Л28(х) = Л2,4(х) + Л2>13(х)+ /?i5(x)' те* является линейной комбинацией других полиномов. Далее 4 = Я25(Х) - ДмЮ - (*29« " Я2,12(Х)Я2.14М); xi=R23(x)-Rl4(x)-Rn(x); 4 = Д22(х) - Л, ,(х) - (Я25(х) - Л14(х) - (Я29(х) - R2,M - R 2tlix))). Других базисных одночленов мы получить больше не можем, но к 9 базисным одночленам мы можем добавить линейно независимый многочлен R2\(x) = xl + xlxj+ Х\Х2. Таким образом, размерность сИтКл = 10. Для определения размерности пространства VD необходимо дополнить базисные одночлены (черные и белые кружки на рис. 2.13) пространства VR независимыми полиномами 5^(х) и получить размерность пространства полиномов ^(х). Это два одночлена х|х2 = 5|0(1), x* = S2l(x)-Sl2(x)-Sw(x). На рис. 2.13 эти базисные элементы показаны треугольниками. Линейное подпространство V4, порождаемое полиномами Sy(x), определяется 11 базисными одночленами (черные и белые кружки и треугольники) и многочленом S20(x) = х\ + х\ + х2. Дополнение к этому пространству в V4 имеет размерность 15 - 12 = 3 и порождается многочленами Tj (x). В качестве базисных векторов этого пространства VD выбираем три одночлена, l,xt, x? (показаны на рис. 2.13 прямоугольниками).
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 131 Тогда пространство VR®VD порождается одночленами, изображенными на рис. 2.13 белыми и черными кружками и квадратами вместе с многочленом R2l(х) = х,3 + х,х\ + х,х2 . Пространство V4 -(VD @Vr) имеет размерность 15 - (10+3) = 2 и порождается двумя линейно независимыми комбинациями из трех одночленов х3, х{х2, х2, которые также линейно независимы от Л21(х) • В качестве базисных векторов удобно взять пару одночленов х2, х,3. Первые производные ростка [/]0(х) порождают двумерное пространство ^-[/]о«~*?,^-[/]о«~*2- <ХС| ОХ2 Следовательно, [/]0W = cucf + Px22,a^0, р*0 и /является 4-определенной. Как только определим знаки а и р, то с помощью обычного преобразования масштабов получим канонический росток вида ±х,4 ± х\ . Матрица Гессе функции.Дх) в точке х0 = 0 имеет вид «1-е г так что коэффициент р, связанный в ростке [/]0(*) с х\, должен быть положительным. Коэффициент a одночлена х\ должен быть отрицательным. Это может быть определено путем решения уравнения J{\) = 0. Линия корней и знаки функций в трех открытых областях, на которые эти линии корней разбивают пространство R2, изображены на рис. 2.14. Если взять <х>0 , т.е. сделать [/]0(х) и соответственно /(х) положительно определённой функцией, то из рис. 2.14 видно, что область G+ = {lUH:/(*)>0} состоит из двух компонент связности и любая деформация, соединяющая две точки из области I и II, например, С и D, должна проходить через границу /(х) = 0. Это обстоятельство не позволяет сдеформировать любой росток ax,4 + Px2,a>0,р>0 непрерывным образом в функцию /(х). Напротив, в области G" = {III :/(х) < 0} любые две точки, например А и В, могут быть продеформированы друг в друга, поэтому эта связная область и росток ax,4 + pX2,a<0,*p>0 можно продеформировать непрерывно в /(х). Таким образом, необходимо взять росток [/]о(х) < 0, т.е. отрицательно определенную функцию, и, следовательно, a < 0 . I /W<o Рис. 2.14. Корни уравнения /(х) = 0: /(x) = xfx2+x23/3 + xf/2 = 0 = x2 hc,2+ifx2+|j -~ Итак, окончательно канонический росток функции
132 Методы современной ТАУ. Часть IV имеет вид 2.1.13 Пример исследования бифуркационного поведения летательного аппарата Рассмотрим поведение симметричного реактивного летательного аппарата, для которого потеря устойчивости соответствует одной элементарной катастрофе [10,29]. Переменные состояния: три компоненты угловой скорости xx=(bxi х2=(йу, х3 = cdz, х4 = а (угол атаки), х5 = р (угол скольжения), xeR5. Управляющие параметры: а е R2. В данном случае мы их обозначим так, как принято в теории управления - через и и назовем управлением. Итак, И1=Д1=5э=-(8э.л+5э.п), где 5ЭЛ, 5ЭП - отклонение соответственно левого и правого элеронов; 1 (2.150) и2=а2=5в=--(5вл+5вп), (2.151) 5BJ1,5ВП - отклонение соответственно левого и правого рулей высоты. Таким образом, имеем х € R5, u(= a) e R2. Уравнения движения летательного аппарата имеют следующий вид: х,=/,(х;и), / = U чеД2, (2.152) стационарное решение которого х/0 = 0, / = U; Uj0 = 0, j = п. . (2.153) Разложим систему уравнений (2.152) в ряд Тейлора в окрестности стационарной точки (х0 = 0, и0 = 0). Имеем ,=y^,y+Z^My+ZZ. л'Ы %диЛ J %^^М XjXk,i = 1,3; (2.154) *.Л& ~l JU У-1&У ху+Е ди, uj, / = 4,5. (2.155) 7=1 ^J В разложении (2.154), (2.155) первая сумма представляет линейные аэродинамические составляющие, вторая сумма - линейные управляющие воздействия, третья сумма (2.154) учитывает инерционные параметры. Стационарные решения системы (2.154), (2.155) находим, полагая *,=0, / = ТЗ"; 5 Я/* I 2 Я/* I 3 3 Я2 /* I >1&Ло ,=.'9«, >1*>^А*|0 Ьо, J J—lb,. j.\ ди, Uj. (2.156) (2.157) Обозначим для удобства
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 133 Щ = ^;/=4,5,у=1,5; дх J\o Щ ;у= 1,2,1=1,5; ди */, 1 _ dxjdxk\ = Bijk- (2.158) (2.159) (2.160) Два уравнения (2.157) линейны по переменным хь...,х5. Используя их, выразим переменные х4, х5 с учётом ((2.158) - (2.160)) в виде линейной комбинации управляющих параметров и остальных переменных jc,,...,jc3 . Подставляя эти выражения в (2.156), получим 3 нелинейных алгебраических уравнения 2 ~ 5 0 = Z^iywy + 1LKXJ + *1,23*2*з> 7=1 у=1 2 5 0 = Z^27W7 + Z А^у + ^2,31^3^1, [ (2Л61) 7=1 7=1 2 5 0 = Z^37W7' +ZAy*>^3,12*1*2. 7=1 7=1 Константы UiJ9F\j получены при подстановке хА и х5 в (2.156) и приведении подобных членов. Инерционные члены не изменяются, т.к. в их сумму не входят переменные JC4, JC5- Решим систему алгебраических нелинейных уравнений (2.161). Выразим из второго и третьего уравнений (2.161) переменные х2,х3 через переменную хх где 2 а(х)' 3 a(x,W)j а(X) = (F23 + ^3^,)(F32 + Я3,21*1)-^22^33 . (2.162) (2.163) &(*.и) = ч£#зу«у+£лХ^ (2.164) 7=1 >1 &(X,U) = -(Z^27W7^ +^2Л)(^23 +*2,31*l) + ^22(Z*V7 +^l^l)- (2-165) 7=1 7=1 Подстановка (2.162) - (2.165) в первое уравнение (2.161) приводит к следующему алгебраическому уравнению: o=Z^7w7a2w+^ia2(^u)+ 7=1 (2.166) +F12a(x,u)e2(x,u)+/;3a(^«)e3(^»)+^a(^»)a(^»)- Это уравнение 5-й степени относительно переменной х = хх. Заметим, что Q\(x) не завит от управляющих параметров (управлений).
134 Методы современной ТАУ. Часть IV Рассмотрим конкретный числовой пример. Пусть (2.166) имеет вид (напомним, здесь обозначено и = а) 5 0 = Zfl*x* =grad0(x;u) = 0;(x;u); (2.167) *5=-21,6; *4=-326,44и,; аъ = 50,Зм2 +358,9; сзг2 = 5412,6^; ^=11752,81/2-1525,9; а0 =-23015г/!. Выражение (2.167) определяет двумерное многообразие (гиперповерхность), погруженное в трехмерное пространство R3 с координатами (х; щ; и2). Определим бифуркационное множество Ув для функции Ф(х; и), т.е. множество меры нуль в пространстве управляющих параметров (u e R2), точки которого параметризуют функцию Ф(х\ и) с вырожденными критическими точками. Для этого нам необходимо найти пересечение 2-х гиперповерхностей Ф;(х;и) = 0, (2.168) <J£(x;u) = 0. (2.169) Используем переменную х для параметрического представления управляющих параметров (управлений) (щ(х),и2(х)) на бифуркационном множестве Ув. Запишем <p;(*;u) = 2>,(u)*'=o, /•=0 /«о v.0-1) - = 0 (2.170) (2.171) в матричном виде. Имеем 1 5jc5 4jc4 3jc3 2jc2 1 0 0 0 50,3 0 -21,6 0 358,9 0 11752,8 -1525,9 0 0 = 0. (2.172) 0 -326,4 0 5412,6 0 -23015 Каждому значению х в (2.172) соответствует пара совместных уравнений для управлений (щ;и2). Решение этих уравнений единственно при условии, что определитель системы не равен нулю. Параметрическое представление кривых складки (цх(х)\и2(х)) показано на рис. 2.15. Эта проекция многообразия катастрофы на плоскость управляющих параметров (управлений) м1=5э;м2=5в формирует бифуркационное множество Ув. Множество Ув 3-х делит плоскость R2 управляющих параметров на открытые непересекающиеся области, в которых функция Ф{х\ и) имеет различное число (1, 3, 5) критических точек, а динамическая система соответственно 1, 3, 5 устойчивых или неустойчивых состояний равновесия.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 135 0.12 0.1 0.08 0.06 0.04 0.02 0 -0 02 -0.04 -0.06 "2 =SB(рад) -1 -0.5 0 0.5 1 м,=5э(рад) Рис. 2.15. Бифуркационное множество Jb многообразия катастрофы реактивного летательного аппарата в плоскости управляющих параметров 63,5B(w,,w2). Цифры указывают на число состояний равновесия (устойчивых и неустойчивых) Рассмотрим случай, когда управление производится только элеронами 5Э, т.е. щ при фиксированном положении руля высоты и2 =5В =0,01 рад «0,6° (сечение А, рис. 2.15). Пусть щ\ы0 = 0, и мы начинаем медленно увеличивать угол 5Э = щ . Сначала переменная х{(=юх) линейно реагирует на.изменение щ (рис. 2.16), но при достижении точки а(~ 6°), т.е. при попадании на бифуркационное множество Ув, скачком переходит на нижний лист (точка 5, рис. 2.16). На этом листе состояние летательного аппарата по координате х = х} = ®х совершенно неуправляемо при отклонении элеронов (-25° <их< 25°). Другими словами, если пилот попытается вернуть летательный аппарат в состояние х = 0, уменьшая щ при и2 = const, он потерпит неудачу. Летательный аппарат не будет реагировать на изменение щ до тех пор, пока не достигнет значения щ «-25° (точка в, рис. 2.16), при котором происходит скачкообразный переход на верхний лист. Последующее увеличение щ вновь сопровождается отсутствием необходимой реакции вплоть до значения щ = +25° (точка д), при котором точка* вновь перескочит на нижний лист (точка е). Средний лист остается недостижимым при и2 = const = 0,6° . Заставить систему вернуться на средний лист (в том числе в состояние х = х{ = 0 ) можно только изменив оба управления щ и и2.
136 Современные методы ТАУ. Часть IV X = Xi -40 -30 -20 -10 10 20 30 40 «1=8, С) Рис. 2.16. Зависимость координаты х, = сох от угла поворота элеронов при постоянном отклонение руля высоты 0,6° (сечение А, рис. 2.15) Если взять другое сечение, и2 = const, например, увеличить и2 до и2 =1,2° (сечение Б, рис. 2.15), то точки скачкообразного перехода с нижнего листа на верхний и наоборот еще более сдвинутся (точка г'« -60°). Таким образом, на основе использования теории катастроф возможно качественное изучение особенностей поведения динамических управляющих систем, в том числе получение бифуркационных множеств и устойчивых компонент многообразия систем. liX = X и -60 -40 -20 20 40 60 Мв) Рис. 2.17. Зависимость координаты х, = шх от угла поворота элеронов при постоянном угле отклонения рулей высоты 1,2° (сечение Б, рис. 2.15)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 1Т7 2.2. ДЕТЕРМИНИРОВАННЫЙ ХАОС 2.2.1. Бифуркации и хаос При рассмотрении функций катастроф мы установили, что фундаментом их изучения являются теория особенностей гладких устойчивых отображений и теория бифуркаций. Изменение качественной картины фазовых траекторий при наличии бифуркаций иногда приводит к возникновению нового типа движений, которое получило, и вполне обоснованно, название «хаос». Совсем недавно было обнаружено, что движение некоторых очень простых динамических систем не всегда можно предсказать на большой интервал времени. Такие явления были названы хаотическими. В чем же различие между случайным и хаотическим движением? При случайном движении мы имеем ситуации, когда неизвестны действующие силы, а известны, например, случайные характеристики некоторых параметров. При хаотическом движении мы рассматриваем задачу как детерминированную, где отсутствуют случайные или непредсказуемые силы или параметры, а характер движения динамической системы в значительной степени зависит от начальных условий. Такая динамика возможна только в нелинейных системах. А. Пуанкаре, стоявший у истоков нелинейной механики, в очерке «Наука и метод» писал: «иногда небольшая разница в первоначальных состояниях вызывает большие различия в окончательном явлении. Небольшая погрешность в первом вызвала бы огромную ошибку в последнем. Предсказание становиться невозможным». В современной литературе термин «хаотический» применяется к таким движениям в детерминированных физических и математических системах, траектории которых обнаруживают сильную зависимость от начальных условий. Системы с хаотической динамикой иногда еще называют системами с нерегулярной динамикой. Подчеркивая детерминированность задачи, хаос иногда называют детерминированным [25]. Следует ли считать хаотические движения исключительным случаем в реальных физических задачах или они встречаются в широком диапазоне изменения параметров (что напрямую, как мы видели ранее, связано с возможностью появления бифуркаций)? При проектировании систем управления необходимо уметь предугадывать их поведение. Выбрав параметры, при которых могут возникнуть хаотические колебания, проектировщик лишается возможности предсказывать поведение системы. До недавнего времени основным инструментом при расчетах системы управления была линейная теория. Но потребности современных технологий приводят к тому, что рабочие значения параметров переместились в область нелинейных режимов, что увеличивает возможность возникновения явлений хаотической динамики. В каких динамических системах могут возникнуть хаотические колебания? Прежде всего в системах, где присутствуют сильные нелинейности [17]: 1) колебания изогнутых упругих структур; 2) механические системы с зазором или мертвой зоной; 3) динамика колесо - рельс; 4) системы с трением скольжения; 5) системы управления с нелинейными обратными связями] 6) лазеры и нелинейные оптические системы. Хаотические звенья обладают новым геометрическим свойством, называемым фрактальной структурой, что нельзя наблюдать в классической нелинейной механике. Фракталы, фрактальные размерности, странные аттракторы будут подробно рассмотрены в данной главе, но начнем ее мы с парадигм хаоса, потому что, как за-
138 Современные методы ТАУ. Часть IV метил Томас Кун (цит. по [17]), «крупные изменения происходят в науке в общем не тогда, когда выдвигаются новые теории, а когда меняются простые модели, с помощью которых ученые формируют и осваивают новую теорию». Парадигма (греч. paradigma - пример, образец), как известно, - это концептуальная теория, модель или задача, которая охватывает основные свойства целого класса задач. Известны парадигмы: теории колебаний - модель, состоящая из массы и пружины; нелинейной динамики - движение маятника или задача 3-х тел. Парадигмами хаоса являются странный аттрактор Эдварда Лоренца и логистическое уравнение, к изучению которых мы и приступаем. 2.2.2. Парадигмы хаоса: странный аттрактор Лоренца и логистическое уравнение 2.2.2.1. Аттрактор Лоренца В 1963 г. специалист по физике атмосферы Э.Н. Лоренц из Массачусетского технологического института предложил простую модель тепловой конвекции в атмосфере, которая, как затем выяснилось, стала хорошей моделью для изучения турбулентности. Представим себе слой жидкости, находящийся под действием сил тяготения, который подогревается снизу. Пусть То - температура в верхней части слоя жидкости, Тх - соответственно нижней (рис. 2.18). 2 ,У g 11 Тепловой поток Рис. 2.18. Модель тепловой конвекции Лоренца ttt Когда эта разность становиться достаточно большой, возникают циркулярные, подобные вихрям, движения жидкости; жидкость, подогреваемая снизу становится легче и всплывает, а более тяжелая опускается под действием гравитации (рис. 2.18). В общем случае тепловые процессы и конвективные течения жидкости описываются уравнением теплопроводности и уравнением Навье - Стокса, которые являются уравнениями в частных производных. Э. Лоренц сделал ряд допущений и получил 3-х мерную модель тепловой конвекции в обыкновенных дифференциальных уравнениях: xl=c(x2-xl)9 (2.173). x2=pxl-x2-xlx3, (2.174) *з=*1*2"Р*з> (2.175)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 139 где хх - безразмерная переменная, пропорциональная амплитуде скорости, с которой жидкость циркулирует в жидком кольце; *2,х3 ~ безразмерные переменные, которые отражают распределение температуры по каналу. В уравнениях (2.173) - (2.175) присутствуют 3 параметра: а, р - связаны с числами Прандтля и Рэлея соответственно, а р описывает геометрию системы: а = 10, р = 8/3, р>1 - набор значений, которые предпочитают специалисты в данной области. В дальнейшем при исследовании два параметра р, р считались постоянными, а изучалось влияние р на динамику описываемых конвективных процессов (р > 0). Рассмотрим состояние равновесия для уравнений Лоренца (2.173) - (2.175). Имеем 0 = а(*2-х,), (2.176) 0 = рхх-х2-хххЪ9 (2.177) О = х1лг2-рлг3. (2.178) Уравнения (2.176) - (2.178) имеют 3 решения, т.е. существует три положения равновесия: 4° = (0;0;0), (2.179) 42) = (>/P(p-1Wp(/-1);p-1) (2-18°) х® = (-7р(р-1); -VP(P-I); Р -1) (2.181) Первая неподвижная точка х{/ соответствует состоянию теплопроводности без движения жидкости (происходит диффузионная форма передачи тепла, без конвекции). Линеаризируя уравнения (2.173) - (2.175) в точке х|,', получим: f-a с 0Л р -1 0 . (2.182) ,0 0 -р, дО)_ Ао - Sft дх, .о Матрица Ау имеет собственные значения: Чг =-^-±^(ст+1)2+4(р-1)^^з =-Р- (2-183) Таким образом, при принятых параметрах: а = 10,р = 8/3 и 0 <р < 1, состояние Х51' устойчиво. При а = 1 начинается конвекция Бенара, т.к. Хх = 0 и именно в этот момент «принимают эстафету» равновесные точки Х5 \ X5' (которые соответствуют движущимся валам). Линеаризация (2.173) - (2.175) в этих точках дает: А(2)_ Ао - дЛ dXj х(2) Х0 д(3)_ Ао - df, dXj х(3) -с 1 -а 1 -л/Р(р"О о -1 VP(p-0 -1 -л/Р(р-0 0 л/Р(р-0 0 -VP(p-i) -Р (2.184) (2.185)
140 Современные методы ТАУ. Часть IV Характеристические уравнения для матриц Ау и Ау совпадают и имеют вид <р(\) = \3+(а + $ + 1)Х2+$(а + р)\ + 2$а(р-1)=0. (2.186) При р = 1Д] =0Д2 =-р = -8/ЗД3 =-(а + 1) = -11, т.е. «конвективная» равновесная точка находится на границе устойчивости. Рассмотрим движение корней характеристического уравнения (2.186) при изменении параметра р(а = 10, р = 8/3, р>1). Траектории движения корней А>,(р), / = 1,2,3 на комплексной плоскости изображены на рис. 2.19. При 1 < р < рв = 1,3456 все корни левые и вещественные; при р = рв =1,3456 два корня сливаются в один двойной Хх (рв) = Х2 (рв) = -1,2894 (точка А, рис. 2.19) - устойчивый узел переходит в устойчивый фокус; дальнейшее увеличение р(р>рв) приводит к появлению пары комплексно-сопряженных корней, которые движутся к мнимой оси. При р = рс = 24,7368 (критическое значение р) имеется пара чисто мнимых корней: возникают структурно и динамические неустойчивые периодические орбиты - циклы. При р > рс имеет место неустойчивый фокус и появление устойчивых периодических движений - предельных циклов, т.е. имеет место бифуркация Хопфа. Ниже о ней будет подробно изложено. плХ +/' j Mp>pJ / ММ +1 = А,2(1,3456) = -1,29) \'-7 МрЛ Д10 Мр>Рс) Рис. 2.19. Траектории движения корней матриц линеаризации А^, А(о3) в равновесных точках \^\ х^ при изменении параметра р Критическое значение параметра р = рс можно определить по формуле: а + 6 + 3 Рс=с с-Ь-1 = 24,7368 (для а = 10, р = 8/3). (2.187)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 141 На рис. 2.20 и рис. 2.21 показаны траектории модели Лоренца для р = 10 и р = 23 , т.е. р < рс . Аттрактором (притягивающим множеством) в этих двух случаях является некоторая точка, определяемая выражениями (2.179) - (2.181), причем устойчивыми являются точки х^ и ц\ ху - неустойчивое седло. 30 Рис. 2.20. Фазовая траектория модели Лоренца (а = 10; р = 10; р = 8/3), устойчивый фокус 50 40 30 20 -10 Ю Рис. 2.21. Фазовая траектория модели Лоренца (а = 10; р = 23 < рс =24,7368; р = 8/3), устойчивый фокус При р > рс два положения равновесия Х5 ' и ху становятся неустойчивыми фокусами, и сложная хаотическая траектория блуждает между 3-мя неустойчивыми равновесными точками (рис. 2.22), наступает хаос (нерегулярная динамика). Первая особенность нового качественного движения системы заключается в том, что каждая из точек равновесия не является притягивающей, однако траектория не уходит далеко от 3-х точек равновесия и занимает ограниченную область, которая в
142 Современные методы ТАУ. Часть IV отличие от случаев р < рс уже не является точкой; аттрактором является множество точек, внутри которых содержатся 3 точки равновесия. Рис. 2.22. Точки равновесия и фазовые траектории в модели Лоренца при р > рс 40 30 -10 20 10 -20 0 Рис. 2.23. Странный аттрактор Лоренца (р = 25 > рс = 24,7368; р = 8/3) Вторая особенность: внутри аттрактора Лоренца (рис. 2.23) невозможно точно предугадать поведение траектории на длительный интервал (траектория очень чувствительна к начальным условиям), движения ее блуждающие. Такие аттракторы получили название странных аттракторов. Третья особенность: аттрактор, т.е. множество, к которому притягиваются траектории в модели Лоренца, не является ни двумерной поверхностью, ни спаянным двумерным многообразием. По существу он представляет собой топологический объект патологической природы. Он имеет дробную хаусдорфову {фрактальную) размерность: df = 2,06. Подробнее о фракталах и фрактальных множествах см. §2.3. Заметим, что все обнаруженные в настоящее время странные аттракторы имеют дробную хаусдорфову размерность, т.е. являются фрактальными множествами. Об-
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 143 щую картину качественных изменений, свойств аттрактора Лоренца можно проследить на следующей диаграмме [9, 10], (рис. 2.24). Бифуркация Хопфе: Рс « метастабильный хаос Изолированные глобальные аттракторы узлы-фокусы Р^ =1,35 Бифуркация А+3 и 24,74 13,93 Аттрактор Лоренца (фрактальное множество) Бесконечно много периодически замкнутых траекторий и бесконечно много неустойчивых турбулентных замкнутых траекторий фокус седло фокус узел седло узел i 1 \ \ I f 3 точки равновесия 1 точка J ^— равновесия t (Узел) Рис. 2.24. Качественные изменения свойств аттрактора Лоренца при варьировании параметра р 2.2.2.2. Логистическое уравнение Второй парадигмой хаоса (хаотического поведения) является так называемое логистическое уравнение, или уравнение роста популяций xn+l=axn-bx2n, (2.188) где ахп - рост или рождение популяции за и-й период, Ъх\ - ограничения роста, связанные с ограниченностью энергетических и пищевых ресурсов, хп+] - число популяций к началу (л + 1)-го периода. Перепишем (2.188) в безразмерном виде, вводя , Ь а' , _ замену переменных х4 =— хп\ хп=—хп . Тогда а Ъ <+1=<+1К) = ^^-^К)2=у^0-<) = К0-^)Д = у. (2Л89) Запишем (2.189) в исходных обозначениях хп+{=1хп{\-хп). (2.190) Это и есть логистическое уравнение, где X является параметром. При этом, для того чтобы относительное значение численности популяций (например, насекомых) находилось между 0 и 1, следует ограничить X е [0,4].
144 Современные методы ТАУ. Часть IV Для того, чтобы оценить влияние параметра X на численность популяций, рассмотрим рост численности за два цикла. Имеем хп+1=1хп{\-хп) = /{х„), (2.191) *п+2=^п+{{\-хп+1) = f{xn+]) = f(f{xn)) = /2{хп). (2-192) Если хп,хп+1>хп+2,— принадлежит некоторому множеству М <zRx, то данная функция / отображает множество М в себя, т.е. /:М->М. (2.193) В связи с этим введем некоторые определения. Отображения (2.191) и (2.192) можно рассматривать как итеративный процесс воздействия функции / на начальную точку х0. Ясно, что для произвольного п имеем rw=/or'U)=/(r'U))- Поскольку каждая точка х0 е М функции / как-то перемещается по множеству М, то функция (2.191) задает дискретную динамику системы. Если для некоторой точки х0 е М определены все итерации fn (*0), то множество {fn(x0) neN - множество натуральных чисел} называется орбитой точки х0 под действием функции f (мы имеем еще одну наглядную интерпретацию действия группы на многообразии). Определение 2.26. Точка хе называется неподвижной точкой функции (а в общем случае отображения) /, если fn (хе) = хе, \/neN . Определение 2.27. Неподвижная точка хе функции / называется притягивающей, если p(/"(*6.*«))<p(r"'U.*.)). (2-194) где р(х,у) - расстояние между точками х и уеМ ; в частности, (2.194) может иметь вид \/"Ы-хе\<\/"-1(х0)п-хе\. (2.195) В этом случае отображение / \М -» М называют сжимающим. Для того, чтобы точка хе была притягивающей, а отображение (функция) / сжимающим, достаточно, чтобы функция / в окрестности точки хе (включая саму точку) удовлетворяла условию Липшица [13] |/Ы-/(*.)ИЬ-*.| (2-196) с константой к<\\ хих2 принадлежат окрестности точки хе. В частности, условие сжатия выполнено, если функция в окрестности точки хе Шх^ \ имеет производную f'(x), причем |/'(ф*<1. (2.197) Естественно, условие (2.197)должно быть выполнено и в точке хе, т.е. |/'(*е)|<1. (2.198)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 145 На рис. 2.25 и рис. 2.26 изображен ход последовательных приближений в случае О< f'(x) < 1 и в случае -1 < /'(*) <0 (М - \а,Ь\). Это так называемые диаграммы Ламерея. 1 Хе /2 *1 =/(*b) Х0 Ь X *2=/(*,)=7ым Рис. 2.25. Притягивающая точка хе при 0 < /'(*) < 1 > х е М , f:M->M9 M = UXf ь . м< ГЫ /м A*hy 7 *,*l=f{*o)j> Х Рис. 2.26. Притягивающая точка при -1 < /'(*) <0, хеМ , j:M -> М 9 М = УХе Если в окрестности Ux , включая саму точку хе, имеем |/'(*)| > 1, то такую точку назовем отталкивающей точкой. Определение 2.28. Точка хр называется периодической точкой функции / периода А:, если /* (хр ) = хр при f'{xp)*xp для /< к . Орбита периодической точки состоит из к точек и называется циклом периода к. Определение 2.29. Точка хр является периодической точкой функции f периода к, если она является неподвижной точкой функции / периода к, но не является неподвижной точкой итераций с меньшим номером. 11 Зак. 416
146 Современные методы ТАУ. Часть IV Теперь вернемся к логистическому уравнению (2.190) и рассмотрим как изменяется его динамика при гладком изменении параметра X. Прежде всего найдем неподвижные точки отображения fx (мы используем индекс X для того, чтобы подчеркнуть зависимость / от параметра X). Имеем хе=1хе(\-хе),Х>0. (2.199) Неподвижные точки: 4')=0, 42)= —• • (2-200) А, Оценим тип неподвижных точек: Л(0) = Х; (2.201) A'(ir)=2~x- (2-202) Приравняв их к ±1, получаем, что неподвижные точки теряют гиперболичность при X = 1 и X = 3. Потеря гиперболичности приводит к качественному изменению динамики, т.е. при X = 1 и X = 3 имеют место бифуркации. Построим диаграммы Ламерея при изменении 0 < X < 3. 1. 0< X < 1 (рис. 2.27). Две неподвижные точки. Для X = 0,5, ху =0, х[' = -\. Диаграмма Ламерея показывает, что ху = 0 - притягивающая точка, ху = -1 - отталкивающая. Рис. 2.27. Диаграмма Ламерея логистического уравнения для X = 0,5 2. Х^0' = 1 (первая бифуркация). Смена типа неподвижных точек. Неподвижная точка хе = 0 - ни притягивающая, ни отталкивающая, а является бифуркационным седлом. 3. 1 < X < 3. Теперь неподвижная точка л^1' = 0 является отталкивающей, а точка ху = становится притягивающей. На рис. 2.29 показана диаграмма Ла- X мерея для X = 2 .
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 147 Рис. 2.28. Бифуркационное седло (А.'0' = 1), две неподвижные точки слились в одну ху = х) -О *'о 1 х Рис. 2.29. Диаграмма Ламерея для X = 2. Точка х® = О становится отталкивающей, х»-^1- притягивающей На первый взгляд при 0 < А, < 1 и 1<^<3 отображение fx:M -+М принципиально не изменилось, разве что поменялись местами притягивающая и отталкивающая точки. Но в этом и состоит основное различие. На участке 0 < X < 1 притягивающей является точка jc^ = 0, поэтому при большом количестве генераций f\ (Jce1))=Jc^) =^' те* ПРИ 0<^<1> относительного роста числа популяций не наблюдается. Совершенно другая картина наблюдается при 1 < X < 3. В этом случае 11*
148 Современные методы ТАУ. Часть IV притягивающей точкой будет х^ = >0, поэтому f"(x^)=x^ и наблюдается рост популяций. Эту зависимость можно наблюдать на бифуркационной диаграмме (рис. 2.30). х h 0,5 х -► 0 1 2 3 X Рис. 2.30. Бифуркационная диаграмма логистического уравнения для периода 0 < X < 3 Еще одной особенностью является то, что на этом интервале сначала х^, а затем х^Р являются периодическими точками периода 1 (Т = \). При Х = 3 |Л'(*в)| = 1 и наступает вторая бифуркация. 4) Х^ = 3 (вторая бифуркация) - бифуркация удвоения периода: притягивающая неподвижная точка х^Р = (период Т = 1) превращается в отталкивающую, а ря- X дом с ней появляется цикл вдвое большего периода (Г = 2), fx{xe) = xe (рис. 2.31). При Х>3 все точки интервала (0,1) притягиваются к этому циклу (рис. 2.32). На интервале (0,1) отображение /х2 (х) = /х (/х (х)) имеет 3 неподвижные точки, причем 2 из них притягивающие х^ и х^ , и одна х^ - отталкивающая. |Л(*).Л2М 1 X Рис. 231. Неподвижные точки д£!) = 0, д£2) =-; периоды Г = 1, Г = 2. X = 3 - бифуркация удвоения периода
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 149 Увеличение Х(Х > 3) происходит до некоторого Х(2), при котором происходит третья бифуркация: бифуркация удвоения периода 2 (Т = 4). Эта бифуркация имеет место при (Л2)'(*) = 1, что соответствует Х(2) = 3,45. > \Л(*Ш*) Рис. 2.32. Неподвижные точки циклов 1,2 (Т = 1;2) х^1\ х™ - отталкивающие (цикла 2, Т = 2), *е3)>44) - притягивающие (цикла 2) для Я. = 3,2, хе[0,1] При X > Х^ для отображения f£ (*) вблизи каждой из точек х£3) и х£4) появится еще две неподвижные точки, т.е. возникает цикл периода 4 (Т = 4), причем устойчивый. Дальнейшее увеличение \>\^ =3,45 приводит к появлению бесконечной последовательности (Х^"\ « = 3,4,5) значений параметра X: при Х = Х^ происходит потеря устойчивости цикла периода 2п~1 и возникает устойчивый цикл периода 2п . Этот процесс удвоения периода происходит до тех пор, пока X не достигнет значения ^=3,56994. Вблизи этого значения последовательные значения параметров, при которых происходит удвоение периода, подчиняются закону __ —- _> 5 = 4,66920 (число Фейгенбаума). При Х>Х<О могут возникнуть хаотические колебания (рис. 2.33). Отображение, соответствующее X > Х^, имеет инвариантное множество канторовского типа F (подробнее о канторовском множестве см. в разделе «фракталы»), окруженного бесконечным числом неустойчивых циклов периода 2". При этом все точки интервала [0,1], кроме точек этих циклов и их прообразов, притягиваются к множеству F, которое является фрактальным и его дробная (фрактальная) разность равна df « 0,518. Для X = 4 уравнение (2.190) может быть решено путем замены переменных, что позволит увидеть чрезвычайную зависимость решения от начальных условий. Покажем это [2]. Итак, сделаем следующую замену 1-COS27C0W (2.203) х„ =- (2.204)
150 i 0.9 о.а 0.7 o.e 0 S 0.* 0 0 02 0 1 0 X Бифуркация удвоения \v периода N4 ^^^^ Г = 1 2.S /,\ Современные методы ТАУ. Часть IV V т ДЦ Хаос /МЛ T = 2 '.ЯП Э S Рис. 2.33. Бифуркационная диаграмма логистического уравнения, X е [2,4] При такой замене уравнения (2.190) преобразуется следующим образом (X = 4 ): I(l-cos2rten+1) = 4^(l-cos2uen)^l-i-(l-cos27ren)jl = i(l-cos47ten). (2.205) т.е. Одним из решений уравнения (2.205) является е„+1=2е„, е =2Леп. (2.206) (2.207) Можно непосредственно убедиться в том, что это решение соответствует хаосу в системе. Действительно, поскольку хп связано с 0„ функцией cos27T0n, добавление целого числа к 0„ (или замена знака) приводит к тому же самому значению хп . Поэтому, если записать 0„ в обычной десятичной системе, например, положив вп =11,2693..., то можно просто отбросить 11. Еще лучше использовать двоичную систему для 0О , положив, например, ео=- + - + — + —+ ... = 0,101101.... (2.208) 0 2 8 16 64 При этом умножение на два (переход от п -»(п +1)) означает просто сдвиг запятых в «десятых» вправо на 1 знак, так что 0, =0,01101... ,02 =0,1101...,03 =0,101...,04 =0,01.... Таким образом, значения 0„ , порождаемые любыми начальными 0О , зависят от п -го и следующего разрядов 0О . Это позволяет дать одно из возможных определений хаотического поведения (о чем мы уже выше говорили): динамическая переменная хп при больших п принимает значения, которые чрезвычайно сильно зависят от точного начального значения х0. В рассматриваемом случае предложим, что имеется два начальных значения х0 и х'о, которые различаются на малое число 6 и порождают две последовательности популяций хп и х'п , начинающиеся соответственно с х0 и х'о. Тогда после п шагов разница между ними увеличивается до значения 2" г.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 151 2.2.2.3. Производная Шварца и бифуркация удвоения периода Бесконечная последовательность бифуркаций удвоения периода, как это имело место для логистического уравнения, соответствует не всем унимодальным (одномо- дальным) функциям, т.е. непрерывно дифференцируемым отображениям единичного интервала [0,1] (в частности всем, имеющим один максимум при х = — и монотонным при 0<д:< —, — <л:<1). Кроме свойств унимодальности, необходимо, чтобы производная Шварца функции / (обозначается Sf) [4] была отрицательна на всем интервале [0,1]. Это справедливо для логистического уравнения, т.к. для него fm(x) = 0. Отметим, что из условия Sf < 0 следует Sf" < 0 длявсех итераций /. 2.2.3. Бифуркация Хопфа и хаос. Критерий Рюэля - Такенса Бифуркация Хопфа является одним из возможных путей зарождения хаоса в системе, поэтому йайсно изучить ее подробнее. Рассмотрим линейную систему 2-го порядка: х1=7ах-ш29 (2.209) Л д£ = гох, + Хха , . (2.210) где X является параметром. Собей^ённые значения матрицы А: ^ ' (X -CDN * А-[» * - два комплексных корня Slf2 =X±j®. При X = 0 (два чисто мнимых корня) фазовые траектории системы (2.209), (2.210)-это круговые орбиты (центры) (рис. 2.34). В этом случае система (2.209)," &Щ 10) является как статически, так и динамически неустойчивой системой, поэтому значение параметра X = 0 определяет множество (точку) бифуркаций. \ 1 v( Рис. 2.34. Фазовые траектории для чисто мнимых корней матрицы А (X = 0)
152 Современные методы ТАУ. Часть IV Рассмотрим, как влияют возмущения (деформации) на центры. Для этого удобно перейти от декартовой к полярной системе координат: *!=rcos0, (2.211) *2=rsin0. (2.212) Тогда (2.209), (2.210) примут вид: г = Хг, (2.213) ё = ш. (2.214) На бифуркационном множестве JB = {X = 0} происходит изменение динамической устойчивости, что сопровождается появлением качественно новых решений. Рассмотрим возмущение (деформацией) вырожденной (для Х = 0) системы (2.213), (2.214). Для этого запишем: г = fr (г, 0) = Хг + члены более высокой степени, • (2.215) 0 = /е (г, 0) = ю + члены более высокой степени. (2.216) На бифуркационном множестве JB первые члены, разлагаемые /е(г,0) в ряд Тейлора, отличны от нуля (со Ф 0); поэтому можно ожидать, что члены более высокой степени несущественны и ими можно пренебречь [9]. В первом приближении можно ограничиться только возмущениями, инвариантными относительно вращения (деформации радиальные), т.е. fr(r,Q) = fr(r). (2.217) Радиальная функция fr(r) может включать только члены с нечетными степенями г, поскольку из инвариантности относительно вращения следует, что замена хх -» -хх, х2 -» -х2 дает it -» -хх, х2 -> -х2. Эта симметрия нарушается, если fr (г) содержит члены с четными степенями г. Таким образом, достаточно общая деформация (возмущение) динамической системы (2.213), (2.214) имеет вид r = \r + Ar3 + Br5+..<, (2.218) 0 = ш. (2.219) Ограничившись первыми двумя членами разложения (2.218), т.е., считая г*0 при Х = 0, ==> АфО, и вводя замену переменных г ->|А\ 2 г, получим следующий канонический вид деформированной системы (в старых обозначениях): r = Xr±r\ (2.220) 0 = со. (2.221) Рассмотрим стационарные значения (неподвижные точки) для данной динамической системы. Пусть r = Xr-r\ (2.222) Очевидно, что ге = 0 всегда является стационарным значением. Это есть точка притяжения (устойчивая) при \<0 и отталкивающая (неустойчивая) точка при X > 0. При X > 0 имеется устойчивый предельный цикл с радиусом r = yjx. (2.223) Решение (2.221) тривиально 0(/) = 0о+со/, (2.224)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 153 именно поэтому радиальное решение уравнений (2.220), (2.222) ответственно за появление качественно новых решений. Итак, имеем следующую картину качественных изменений в начале координат: • X < 0 (Sl2 = Х± ую) - устойчивый фокус. • X = 0 - фокус теряет устойчивость и становится неустойчивым. • X > 0. - неустойчивый фокус переходит в устойчивый предельный цикл радиуса г = \Х . Такой бифуркационный переход называется суперкритической бифуркацией Хопфа. Фазовый портрет такой бифуркации показан на рис. 2.35. устойчивый х = о Х<0 устойчивый фокус предельный цикл неустойчивый фокус Рис. 2.35. Суперкритическая бифуркация Хопфа в точке ге = 0 Для динамической системы r = Xr + r3 (2.225) точка ге = 0 всегда является равновесной. Она устойчива при 1<0 и неустойчива при X > 0. При X < 0 имеется неустойчивый предельный цикл с радиусом г = урХ. (2.226) Если X подходит к нулю снизу, отталкивающее множество (неустойчивый предельный цикл) «наползает» на устойчивый фокус в начале координат и, наконец, полностью вытесняет его при X = 0. Это явление называется субкритической бифуркацией Хопфа, Фазовый портрет этой бифуркации показан на рис. 2.36. Х<0 устойчивый предельный4^ цикл неустойчивый фокус Рис. 236. Субкритическая бифуркация Хопфа в точке ге = 0 10 3ак.416
154 Современные методы ТАУ. Часть IV Другими словами суперкритическая (субкритическая) бифуркация Хопфа определяет наличие периодических решений (предельных циклов) при X < Хо, где Хо - точка бифуркации (здесь Хо = 0). В 1971 г. Рюэль и Такенс предложили путь перехода к хаосу в динамических системах на основе бифуркаций Хопфа. Изучая поведение динамических систем при бифуркациях Хопфа, они пришли к выводу, что даже после двух бифуркаций Хопфа регулярное движение может стать сильно неустойчивым и переходит в хаотическое движение на странном аттракторе [30]. При этом подразумевается, что хаотическое движение становится возможным только после двух бифуркаций Хопфа, когда траектория выходит в дополнительное измерение, т.к. двухпериодическое движение соответствует траектории на торе, на котором появление хаоса запрещается теоремой Пуанкаре - Бендиксона [25]. Однако после двух бифуркаций Хопфа появление странного аттрактора не только возможно и неизбежно (критерий Рюэля - Такенса). Переход к хаосу по модели Рюэля - Такенса - Ньюхауса имеет следующий вид (рис. 2.37). Л А Ас dim Aq = 0 странный аттрактор с большой размерностью "Ч J dim Al = 1 (1-я бифуркация Хопфа; предельный цикл) dimA2=2 (2-я бифуркация Хопфа; движение на торе) dim Ar > 2 Рис. 2.37. Переход к хаосу через 2 бифуркации Хопфа по модели Рюэля - Такенса - Ньюхауса 2.2.4. Качественные и количественные признаки хаоса Прежде всего необходимо еще раз напомнить, что хаотические колебания могут возникнуть в системе, содержащей нелинейный элемент. В линейной системе хаотические колебания отсутствуют. Какие же качественные признаки могут сигнализировать о возможности появления хаотических компонент? Мы их уже рассмотрели выше, теперь только суммируем полученные результаты: 1) высокая чувствительность к изменению начальных условий; 2) растущая сложность регулярных движений по мере изменения некоторых параметров; 3) фрактальные свойства движения в фазовом пространстве, которые указывают на присутствие странного аттрактора (странный аттрактор Лоренца); 4) наличие в непрерывной системе бифуркаций Хопфа; 5) наличие в дискретной системе бифуркаций удвоения периода (логистическое уравнение). Количественные признаки хаоса определяются ее показателями: 1) положительный показатель Ляпунова; 2) фрактальная размерность аттрактора. Рассмотрим подробнее каждый из показателей.
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 155 2.2.4.1. Показатель Ляпунова Хаос в детерминированных системах подразумевает высокую чувствительность к изменению начальных условий. Это означает, что две траектории, близкие друг к другу в фазовом пространстве в некоторый начальный момент, экспоненциально расходятся за малое в среднем время. Если р0 - мера начального расстояния между двумя исходными точками, то, спустя малое время /, расстояние между траекториями, выходящими из этих точек, становится равным р(О = Ро^- (2-227) Для дискретных систем соответственно имеем Pn=Po^. (2.228) Величина а называется показателем Ляпунова. Критерий хаоса в терминах показателя Ляпунова: сс>0 - хаотичное движение, сс<0 - регулярное движение-J Рассмотрим процедуру экспериментального определения показателя Ляпунова. Вычисление показателя Ляпунова а: 1) начинается с выбора опорной траектории, точки на соседней траектории и из- Р(') (2.229) мерения величины L-^-L (рис. 2.38); Ро 2) интегрируются уравнения движения вдоль соседней траектории и определяется ро(0; 3) когда расстояние p(t) становится слишком большим и рост его отклоняется от экспоненциального поведения, находим новую соседнюю траекторию и определяем новое начальное расстояние р0 (/) и т.д.; 4) показатель Ляпунова находится осреднением: сс = - 1 ■2>^ (2.230) 'to-'ом Po('*-i)' где N - число точек на опорной траектории, равное числу соседних траекторий, взятых для получения экспоненциального показателя Ляпунова а. опорная траектория Рис. 2.38. Геометрические построения, характеризующие определение показателя Ляпунова для непрерывных систем 10*
156 Методы современной ТАУ. Часть IV Для дискретных систем *„+1 =/(*„) (2.231) - показатель Ляпунова характеризует среднюю потерю информации за одну итерацию [4]. Рассмотрим разность между итерированными отображениями fn (х0) и fn (*0 + е), где 8 - малая величина. Имеем: Ро = е> df рН/(*о+*)-/Ы|=?- dx •£, *0 рп=\Г(хо+е)-Г(хо)\ = ге"а^\ Тогда а(х0) = lim lim — In «->оое->0« fn(xo+z)-fn{xo) ГЫ = lim —In л-»оо п 4ГМ dx* (2.232) Выражение (2.232) определяет показатель Ляпунова для дискретных систем при итерированных отображениях. Рассмотрим пример: известное нам логистическое уравнение (2.190) и найдем показатель Ляпунова для X = 4 . В этом случае, используя замену переменных (2.204), мы получим соотношение между хп -» вп и х0 -» 0О (формула (2.207)) е„=2"е0. Используя (2.232), получим a(eo)=limilnf^iMl = in2>O, /7->сол ^ dQ0 ) это значит, что для X = 4 имеет место хаос, в чем мы еще раз убедились. 2.3. ФРАКТАЛЫ 2.3.1. Понятие о фракталах Знакомство с фракталами начнем с экскурса в историю. В 1890 г. итальянский математик и логик Джузеппе Пеано построил кривую (кривую Пеано), областью определения которой является отрезок (dim = l), а областью значений - квадрат (dim = 2). Было показано, каким образом одна точка, двигаясь непрерывно по квадрату, может (за бесконечное время) пройти, по крайней мере, один раз через каждую точку квадрата и его границы. Кривая Пеано, ее потом окрестили «монстром», является непрерывной кривой, но нигде (ни в одной точке) не дифференцируема. В 1904 г. шведский математик Хельга фон Кох, используя итерированные отображения, получила фигуру, названную позднее «снежинкой Кох», особенностью которой является бесконечная протяженность границы при ограниченных размерах самой снежинки. Были получены и другие монстры. В 1919 г. немецкий тополог Феликс Хаусдорф решил проблему размерности извивающихся кривых, приписав им дробную размерность. Систематическое изучение объектов такой необычной группы было начато французским математиком Бенуа Мандельбротом. Термин «фрактал» (английское «fractal»)
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 157 был введен Б. Мандельбротом в 1975 году. Он был получен от двух латинских глаголов: frangere - ломать и fractus - дробный. Дадим теперь два определения фрактала. Определение 2.30 [22]. Фракталом называется множество, размерность Хаус- дорфа - Безиковича (ниже будет показано вычисление этой размерности), dHB которого строго больше его топологической размерности dT (dHB > dT) . Кривая Пеано, имея топологическую размерность dT = 1 (одномерная кривая), имеет фрактальную размерность 1 < df < 2 . Определение 2.31 [22]. Фракталом называется структура, состоящая из частей, которые в каком-то смысле подобны целому (именно самоподобные объекты стали основным инструментом Б. Мандельброта для исследования фракталов). Определение 2.30 является строгим и наиболее точно отражает суть фракталов, а именно их дробную размерность. Однако, при всей правильности и точности, оно слишком ограничено, т.к. исключает многие фракталы в различных технических и физических задачах. Определение 2.31 содержит еще один отличительный признак: фрактал выглядит одинаково, в каком бы масштабе его не наблюдать. Ниже мы подробно познакомимся с самоподобными объектами. Несмотря на данные выше определения, по признанию даже самого Б. Мандельброта, строгого и полного определения фракталов пока не существует [22], тем не менее мь! будем придерживаться следующего определения. Определение 2.32 [23]. Фракталами называются масштабно-инвариантные множества, обладающие дробной размерностью Хаусдорфа - Безиковича. Это определение объединяет отличительные признаки фракталов, данные определениями 2.30 и 2.31. 2.3.2. Размерность Хаусдорфа - Безиковича Фракталы сложно рассматривать как множество точек, вложенных в пространство. Когда речь идет об обычных геометрических объектах: линия, поверхность, шар, то их топологические размерности dT известны и являются целыми числами. Рассмотрим, как вводится мера некоторого множества точек G, вложенного в пространство при определении размерности Хаусдорфа - Безиковича (dHB). Простой способ измерить длину кривых, площадь поверхности или объем тела состоит в том, чтобы разделить пространство на небольшие кубы с ребрами г (рис. 22). Р' Р Q Рис. 2.39. Измерение «величины» различных множеств точек с помощью кубов с ребрами г
158 Методы современной ТАУ. Часть IV Пусть для некоторой кривой (3 (рис. 2.39) длиной Lq получено N(r) количество прямолинейных отрезков длиной г, аппроксимирующих данную кривую. Тогда ^(')т->А/ = Аи 0.233) Г->0, где г - длина прямолинейного отрезка. В пределе г -» О мера L становится равной длине кривой Lq и не зависит от г. Множеству точек кривой (3 можно поставить в соответствие и площадь. Если N(r) - число квадратов, г2 - площадь каждого из них, то площадь кривой р определяется как A = N(r)r2->Lorl9 (2.234) г->0. Аналогично, объем V кривой (3 может быть найден как V = N(r)r2=L0-r\ (2.235) г->0. Разумеется, что для обычных кривых р площадь А и объем V обращаются в нули при мОи единственной представляющей интерес мерой является длина кривой Р . Теперь перейдем к поверхности р (см. рис. 2.39), для которой в качестве меры множества точек возьмем площадь Л = ЛГ(г)г2->4/ = 4>. (2236) г->0. Можно ли для поверхности р в качестве меры взять объем? Формально это выглядит следующим образом: У = М(гУ^А0-г\ (2237) г->0, при г -> 0 этот объем для обычной (!) поверхности также равен нулю. Поставим другой вопрос: можно ли поверхности р поставить в соответствие какую-нибудь длину? Формально мы можем принять за такую длину величину L = N(r)-r^>A0-r\ (223g) г-»0, которая расходится при г -> 0. Этот результат имеет смысл, т.к. поверхность невозможно покрыть конечным числом прямолинейных отрезков. Вывод: единственной мерой множества точек, образующих поверхность в трехмерном пространстве является площадь, однако «монстры», подобные кривой Пеано, «снежинке Кох» и другие, требуют обобщить меру величины множества точек. До сих пор, определяя меру величины множества точек G в пространстве, мы выбирали некоторую пробную функцию h(r) [17,22] (элементарную меру) h(r) = y(d)rd, (2.239) где y(d)- геометрический коэффициент, зависящий от пробной функции: у (d) = 1 - для прямолинейных отрезков, кубов, квадратов;
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы Ij59^ y(d) = для круга; y{d) = --- для сферы; 6 d - размерность меры. После выбора пробной функции h(r) множество G покрывается N{r) пробными функциями (элементарными мерами) и определяется мера этого множества N(r) Л/„=$>(г). (2.240) /=i Отсюда можно сделать вывод: при г -> 0 мера Md равна нулю или бесконечности в зависимости от выбора d - размерности меры. Определение 2.33 [22]. Размерность Хаусдорфа - Безиковича dHB данного множества точек G есть критическая размерность, при которой мера Md изменяет свое значение с нуля на бесконечность Ясно, что когда d = dHB, мера Md должна быть конечной, она и определяет размерность Хаусдорфа - Безиковича dHB . Приняв y(d) = 1, т.е. покрыв множество точек прямолинейными объектами (отрезок, квадрат, куб) и приравняв (2.241) некоторой конечной величине, .например 1, мы получим: N(r)rd»B =\, (2.242) откуда размерность Хаусдорфа - Безиковича определим как \n(N(r)), ч dHB =— ,\[=dfi если dHB -дробное число]. (2.243) Если dHB является дробной, то размерность Хаусдорфа - Безиковича будем обозначать df и называть фрактальной размерностью Хаусдорфа - Безиковича. Теперь перейдем к построению и изучению самоподобных фракталов. 2.3.3. Принцип самоподобия. Самоподобные фракталы Рассмотрим несколько примеров на построение множеств с использованием формулы (2.243). Возьмем отрезок прямой единичной длины (это можно сделать для любого отрезка, приняв длину этого отрезка за единицу, т.к. размерность длины в данном случае не играет никакой роли). Разделим отрезок на Nx (г) равных частей, где г- длина каждой части. Каждую часть можно считать копией исходного отрезка, уменьшенной в 1/г раз. Очевидно, что Nx(r)-r = l. Назовем исходный отрезок сегментом 0-й итерации (0-го поколения [22]). Ясно, что если мы используем формулу (2.243), то получаем 1и(АГ,(г)) ЫК,(г)
160 . Методы современной ТАУ. Часть IV т.е. исходный отрезок без дополнительных преобразований имеет размерность Хаус- дорфа - Безиковича, совпадающую с размерностью топологической. Поступим теперь по-другому: от исходного отрезка АВ (сегмента 0-й итерации) (рис. 2.40, а) перейдем, например, к образующей 1-й итерации самоподобного фрактала CD, где число сегментов равно 7, а длина каждого отрезка по-прежнему равна г = 1/3, (рис. 2.40, б). 1 А ( | | ^| В сегмент 0-й итерации 8=1/3 1/3 1/3 *,(г) = 3 1/3 (А) 1/3 С\ ~± 1/3 1/3 (В) образующая 1-й 1/3 D итерации 1/3 ЛГ(г) = 7 сегмент 1 -й итерации б Рис. 2.40. Построение образующей самоподобного фрактала с г = 1/3, N(r) = l Если теперь использовать формулу (2.243), то получим Таким образом, величина </у=1,81 (фрактальная размерность самоподобного фрактала с образующей CD) показывает, что кривая CD в 1,81 раза «более извилистая» на отрезке АВ, чем сам отрезок АВ. Можно провести и обратную процедуру, выкидывая, например, часть отрезков длины г из сегмента АВ. В этом случае размерность образующей будет меньше размерности сегмента АВ, т.е. df e (0,1). Построение самого фрактального множества (самоподобного фрактала) производят последовательным использованием сегмента /-й итерации для образующей (/ + 1) итерации. При / -> оо получим предельное (фрактальное) множество. Аналогичный алгоритм используется и для двумерных объектов, например, квадратов. Возьмем квадрат единичной площади (квадрат 0-й итерации) и, разделив каждую сторону на Nx (г) равных частей длиной г, получим N2 (r) квадратов, подобных исходному, но имеющих сторону в 1/г раз меньше исходной (рис. 2.41, а). Сформируем образующую 1-й итерации самоподобного фрактала, выкидывая из исходного квадрата N3 (r) e (l, #2 (г)) квадратов (рис. 2.41, б). На рис. 2.41, б r = i,^(r) = 4,^2(r) = 16,^3(r) = 10. Если теперь определить число копий исходного квадрата в образующей 1-й итерации, то оно равно N(r) = 6 = N2(r)-N3(r).
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 161 1/4 1/4 1/4 1/4 Рис. 2.41, я. Квадрат 0-й итерации, N2 (r) = 16 Рис. 2.41, б. Образующая самоподобного фрактала N(r) = 6 1-й итерации Найдем фрактальную размерность получаемого множества ' 1пГП In4 J'39 Совершенно аналогичную процедуру можно производить над геометрическими объектами размерности п > 2. Из проведенного анализа следует, что для того, чтобы найти размерность самоподобного фрактала, необходимо определить число элементарных мер (пробных функций) N(r) образующей 1-й итерации (число подобъектов), вычислить коэффициент подобия г и использовать формулу (2.243). Рассмотрим построение некоторых классических фрактальных множеств. 2.3.4. Классические фракталы [14] Примерами классических фракталов, построенных задолго до появления данного понятия, являются снежинка Кох, ковер Серпинского, губка Менгера, пыль Кантора и множество других. Снежинка Кох представляет собой замкнутую кривую, составленную из трех одинаковых фракталов, каждый из которых строится на стороне равностороннего треугольника. Процедуру построения рассмотрим на примере одной из сторон треугольника. Она выполняется для каждой из сторон. Пусть Ко - исходный отрезок (одна сторона треугольника). Разделим его на 3 части и уберем среднюю часть. Вместо средней части добавим два новых отрезка той же длины так, чтобы в центре отрезка образовался новый (маленький) равносторонний треугольник, но без основания. В результате получим новое множество Кх (см. рис. 2.42). Данную процедуру можно выполнять многократно над каждым из отрезков, получая все новые и новые множества К2,К3 и т.д. В результате на и-м шаге итерационного процесса получим снежинку Кох (рис. 2.43). Поскольку N = 49з. г = -, то размерность фрактала £/,= — «1,2618. f 1пЗ Особенностью данного фрактала является бесконечная длина предельной кривой, 4 описывающей его границу. Действительно, длина кривой Кх - 1Х = —, длина кривой
162 Методы современной ТАУ. Часть IV 42 4" К2 -12 = —> на и-м шаге итерационного процесса длина кривой /„ = —. При п -> оо 4" длина предельной кривой для одной стороны фрактала / = lim > оо . л->оо 3" ^j\a_ ^aJ 1л, Рис. 2.42. Построение снежинки Кох: a —Kq\ б —К\\ в —Кг\ г —Ку Рис. 2.43. Снежинка Кох Алгоритмы построения таких фракталов, как ковер Серпинского, пыль Кантора и других, во многом сходны с алгоритмом построения снежинки Кох. Принцип построения ковра состоит в разбиении некоторой замкнутой области (исходного множества) на непересекающиеся подобласти (пересекающие подмножества), обязательно содержащие внутреннюю подобласть, и последующем удалении именно внутренней подобласти. Процедура итеративно повторяется с каждым из оставшихся подмножеств. Наиболее иллюстративно это видно на примере ковра, построенного на базе прямоугольного треугольника (рис. 2.44), хотя ковер можно строить, взяв за основу квадрат или другую плоскую фигуру. Пусть исходным множеством SQ является равносторонний треугольник вместе с областью, которую он замыкает. Разобьем его на четыре меньших треугольника и удалим внутренний треугольник без замыкающих его сторон. Получим множество «Sj. Выполним аналогичную операцию над оставшимися треугольниками. В результате будет иметь место множество S2. Продолжая итерационный процесс, на п -м шаге получим множество Sn (см. рис. 2.45). Предельное множество и образует ковер Серпинского. ▲ЛА Рис. 2.44. Ковер Серпинского Рис. 2.45. Построение ковра Серпинского
«/, =^«1,585. Глава 2. Теория катастроф. Детерминированный хаос. Фракталы \63_ Так как коэффициент подобия г = —, а количество элементов, участвующих в итерационном процессе N = 3, то размерность фрактала (ковра), построенного на основе треугольника, 1пЗ 1п2 Так же как и снежинка, данный ковер имеет свою особенность, а именно то, что предельное множество S имеет площадь нулевой меры. Действительно, на первом шаге удаляется 1/4 площади треугольника, на втором шаге 3 треугольника площадью l/42 от исходного и т.д. Поскольку то имеет место меры нуль. К множествам нулевой меры относится и пыль Кантора (фрактальная пыль). Принцип построения этого множества состоит в следующем. На первом шаге отрезок единичной длины [0,1] разбивается на три части и удаляется средний, открытый ин- теграл -,— . На последующих шагах вновь удаляются центральные части оставшихся отрезков, не включая их концы (рис. 2.46). Предельным множеством является пыль Кантора. Рис. 2.46. Построение пыли Кантора Так как N = 2, а коэффициент подобия г = -, то размерность фрактала d ,= — «0,6309. f In3 Подсчитаем длину выбрасываемых интервалов. На первом шаге выбрасывается интервал длиной 1/3. На втором шаге выбрасываются два интервала длиной 1/32 от длины исходного единичного отрезка. На и-м шаге выбрасываются 2п~{ интервалов, каждый длиной —. Таким образом, общая длина выбрасываемых интервалов для предельного множества
164 Методы современной ТАУ. Часть IV Как видим, пыль Кантора относится к множествам нулевой меры Лебега. Множества типа «пыль Кантора» могут быть построены и на основе плоских фигур, путем выбрасывания отдельных частей. В отличие от снежинки Кох или ковра Серпинского фрактальная пыль является разрывным множеством. Множества Кантора, являющиеся самоподобными фракталами, могут иметь различную размерность, в зависимости от того, на какое количество частей разбивается отрезок (фигура) и какое количество частей выбрасывается при переходе от одного множества к другому. Если Канторова пыль образуется путем деления отрезка на N частей, то при выбрасывании одной части размерность фрактала составит in(N-l) '"■' \n{N) ' при выбрасывании N -1 частей (одна пылинка) соответственно d ~ 1П0) А \n(N)' При N -» оо, dfN i -> 1, d^ -> 0. Таким образом, различные фракталы, относящиеся к множествам Кантора, построенных на основе отрезка, могут иметь размерность rfy, принадлежащую интервалу (0,1). Если при построении пыли Кантора за основу взять плоские фигуры, то размерность фракталов может меняться в более широких пределах. Отметим, что различные множества Кантора обладают тремя основными свойствами: они компактны, совершенны и вполне разрывны. 2.3.5. Фрактальная размерность аттракторов. Применение теории фракталов в некоторых задачах управления Существуют три альтернативных подхода к определению фрактальной размерности аттракторов [17]: 1) поточечная размерность; 2) корреляционная размерность; 3) информационная размерность. Мы рассмотрим две из них, поточечную и корреляционную, причем последняя будет использована нами для нахождения фрактальных характеристик динамики объектов управления. Поточечная (фрактальная) размерность. Рассмотрим какую-нибудь траекторию в фазовом пространстве на протяжении длительного времени (рис. 2.47). Проведем выборку точек на траектории (достаточно большое число Л^) произвольным образом. Опишем вокруг какой-нибудь точки х0 на траектории сферу диаметра 8 (или куб с ребром 5) и подсчитаем число выборочных точек N(b), попавших внутрь сферы. Вероятность того, что выборочная точка окажется внутри сферы, определяется выражением Р(5) = ^й, (2.244) где #0 - общее число точек на траектории. Размерность траектории в точке х^' (где х^' - вектор в фазовом пространстве), полученная путем измерения доли времени, проведенного траекторией внутри малой сферы, имеет вид
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 165 *i *3 dfp- \с < ■ с. С In Р\ У0) 11ГП — 5->0 In 8 Траектория в фазовом пространстве ж • • <• • • :; у - . 1 1 \ / .' X Вь / » 1 у бор< г энные точки (2.245) Рис. 2.47. Геометрические построения для нахождения поточечной (фрактальной) размерности Несмотря на то, что формула (2.245) отличается от общей формулы (2.243) по определению фрактальной размерности, тем не менее выражение (2.245) можно привести к (2.243). Покажем это. Вернемся к рис. 2.47. Пусть длина всей кривой L равна 1 (уже говорилось ранее, что это всегда можно допустить). Пусть г - расстояние между отдельными точками. Тогда N[r)r (где N(r) - число точек, попавших в сферу) определяет длину кривой L(b) в сфере диаметра 5, a Nor = 1. Имеем /Vо -Г Рассмотрим отрезок 8 (диаметр сферы). Если вновь принять длину этого отрезка за 1, т.е. 6 = 1, то число отрезков, покрывающих длину 6 = 1, определится как 1/г, в то же время число отрезков, покрывающих 1(8), равно Тогда N(r)-r-- = N(r). , \nN{r) dfp = \\m s-t "До. (П 1пЫ и мы получим исходную формулу (2.243). Как мы видим, здесь вновь использовался основной принцип - принцип самоподобия фракталов. Для многих аттракторов это определение не зависит от х^, но для других аттракторов dfp зависит от х^, поэтому лучше воспользоваться усредненной поточечной размерностью.
166 Методы современной ТАУ. Часть IV Выберем случайным образом множество точек М <N0 ив каждой точке вычислим dfp nr' V Усредненная поточечная размерность определяется как ъ-ЬЫ*)- ми Корреляционная (фрактальная) размерность [17]. Эта размерность широко используется для определения меры упорядоченности движений и является нижней оценкой хаусдорфовой размерности странного аттрактора. На первом этапе определяется корреляционный интеграл С (5) по формуле c(s)->™^|l'h|»w-»(1} оме где \[z] - функция Хевисайда; Ц...Ц - какая-либо норма. Фактически двойная сумма в (2.246) определяет число пар х''',х^', расстояние х^'-х'7' между которыми не превышает 5. Предполагается, что х*1' - вектор, описывающий положение изображающее точки х^' = х(/,) в фазовом пространстве в момент времени, где tt =t0 +iT, i = 1,2,...,TV, T- некоторый заданный промежуток времени. При малых 5 корреляционный интеграл С(5)~8/с, поэтому корреляционную размерность dfc можно определить по наклону зависимости In С (5) от In 8 или rf =IimlL£i*i. (2.247) fC 5н>0 In 5 В случае изучения скалярной динамической системы или одной координаты вектора состояния х, размерность странного аттрактора можно определить с помощью процедуры Паккарда - Такенса [17]. Пусть х, - реализация одной из координат фазового пространства систем, х,=х(/,). Введем в рассмотрение новое фазовое пространство (пространство вложения размерности р\ точки которого определяются векторами уу^ ={*/,*/+i,-.,*/+/7-i}> сконструированными из последних значений величин x(j = \,2,...9п = N-р + \). При изменении / получим в этом пространстве траекторию, воспроизводящую некоторое множество, корреляционная размерность которого dyy может быть вычислена через корреляционный интеграл CW(6)= Km\±±lk-W-№fl (2-248) *->0°" J=\k=\ V " П/ по наклону зависимости In Ор' (5) от In 5 или J 8->0 In 8 Изменяя размерность р векторов у, проанализируем зависимость dyy от р и назовем ее кривой Паккарда - Такенса. Оказывается, при малых р размерность dy с ростом р увеличивается. Однако если регистрируемый сигнал есть проявление
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 167 детерминированного хаоса, то при некотором р = р0 величина djp перестает расти (!). Достигнутое при этом значение df*' принимается за размерность djc странного аттрактора исходной системы. Если же рост dyy продолжается без насыщения, то это свидетельствует о том, что наблюдаемый сигнал шумовой (!). Таким образом, обычный случайный процесс можно рассматривать как движение системы на аттракторе бесконечной размерности. Конечная размерность аттрактора означает, что данный сигнал можно воссоздать с помощью динамической системы. При решении задач управления важно отличать детерминированный хаос от обычных шумов и помех. Дело в том, что наличие внутреннего порядка в детерминированном хаосе позволяет в принципе управлять им, в то же время как шумовой хаос неуправляем [23]. Покажем [17], что минимальное число динамических переменных, необходимое для описания наблюдаемого хаотического движения оценивается как Г^с1 + 1, где [z] - целая часть z. Эта оценка может быть использована, в частности, для решения одной из самых сложных задач, возникающих при идентификации модели рассматриваемой системы, - задачи определения ее сложности. Рассмотрим примеры, связанные с применением процедуры Паккарда - Такенса для: 1) идентификации размерности математической модели и 2) диагностики объекта управления. Пример 2.12 [23]. Обработка записей пульсаций давления, вызванных работой штангового глубинного насоса (данные с тензодатчиков с глубины 390 м). На рис. 2.48 представлены графики пульсации давления глубинного насоса для различных жидкостей. yu/ivwi я- 1^=> Рис. 2.48. Пульсация давления в скважине: Р - давление, ц - вязкость, Рст - статическое давление', а - ц * 1,0 ц, Па-с (вязкость пластовой воды), б — \х* 50\х , Пас (дегазированнаянефть)', в - ц«500ц, Пас (водоэмульсионнаясмесь)
168 Методы современной ТАУ. Часть IV Как видно из рис. 2.48, при большой вязкости начинаются периодические колебания с периодом, равным продолжительности одного цикла качания насоса. С уменьшением вязкости ц движения усложняются и, можно предположить, устанавливаются хаотические колебания при малых ц (рис 2.48, а) Проверим эту гипотезу процедурой Паккарда - Такенса На рис. 2 49 построена зависимость корреляционной размерности dyy от размерности р вектора у. 15 20 Рис. 2.49. Построение кривой Паккарда - Такенса для выявления хаоса и определения фрактальной размерности (ц «1,0ц Па с) Из рис. 2.49 видно, что при р «12 наступает насыщение dyy . Следовательно, в данном случае действительно наблюдается детерминированный хаос, причем [^1 = 3 , поэтому минимальное число динамических переменных, необходимых для описания наблюдаемых колебаний, равно 4. Пример 2.13 (диагностика объекта управления) [23] При бурении скважины одной из важнейших технических задач является оценка степени износа долота с целью его своевременной замены. Косвенная оценка состояния бурильного инструмента по изменению механической скорости проходки не всегда надежна, поскольку изменение скорости проходки может быть связано с изменением свойств породы, а не с износом долота. Для диагностики состояния долота предложена оценка значения корреляционной размерности пульсаций давления промывочной жидкости. На рис. 2.50 представлены графики рассчитанных корреляционных размерностей для изношенного и неизношенного инструментов. 4<'> 1 5 9 13 17 Рис. 2.50. Кривые Паккарда - Такенса, характеризующие неизношенное (1) и изношенное (2) долото
Глава 2. Теория катастроф. Детерминированный хаос. Фракталы 169^ Видно, что неизношенное долото характеризуется конечной фрактальной размерностью dfC « 4,5 , в то время как фрактальная размерность изношенного инструмента не ограничивается конечной величиной и определяет случайный процесс, а не детерминированный хаос. 2.3.6. L-системы. Тертл-графика Для рассмотренных выше классических фракталов характерен единый принцип построения - добавляются либо выбрасываются отдельные линии или области. Процесс повторяется многократно (итерационно). Этот процесс лег в основу L -систем, позволяющих создавать отдельную, достаточную большую группу самоподобных фракталов (предложены в 1968 г. А. Линденмайером). С помощью L -систем, использующих подсистему графического вывода под названием тертл-графика (ТГ) (от английского turtle - черепах