Text
                    

жй§£*2? *
ww
®
:	WirM*
X' &saswk - '&
«IW
&Жж
< tTX* Л f a -v<	•,Л 5 < »
www
ж<ж^
W <£Г>*Т- -»Л'^':
SS^wm
ЙШЖ
-?^’TV‘*
&> x-4	3(t»f r;
«ьГ^лУ^
KW$
Ь^^^-’йй-й
'  : .. ‘ -
'?.>-Лйй^	l?**o=«Vr2l‘:<y
Ъ'.?% ’X-7
жжж<^Ж
.•'?Л-А .?.•;	:< > ;\-
Wt-i!?W*^'‘;л’ 'l *^i-,'<tfi
i Д a\W^ «8*^’
ЙШШИ
ж<Ж





УДК 007 ББК 22.213 П49 Ответственный редактор доктор технических наук А.П. Курдюков Рецензенты: академик ФЛ. Черноусько академик НА. Кузнецов 3 96 77 5~? Поляк Б.Т. Робастная устойчивость и управление / Б.Т. Поляк, П.С. Щерба- ков. - М.: Наука, 2002. - 303 с. ISBN 5-02-002561-5 В работе дано описание современной теории автоматического управления, включа- ющее новые основные разделы, возникшие в последние годы. Изложены как фундамен- тальные идеи, лежащие в основе теории, так и техника получения результатов. Большое внимание уделяется робастному подходу, т.е. методам анализа и синтеза систем управле- ния при наличии неопределенности. Дана классификация типов неопределенности и возникающих задач стабилизации и оптимального управления. Приведены алгоритмы их решения. Для специалистов по теории управления и практиков-инженеров, а также студентам и аспирантам, изучающим основы теории управления. ISBN 5-02-002561-5 © Российская академия наук, 2002 © Издательство “Наука” (художественное оформление), 2002
ОГЛАВЛЕНИЕ ПРЕДИСЛОВИЕ................................................. 6 ВВЕДЕНИЕ..................................................... 7 СПИСОК ОБОЗНАЧЕНИЙ............... . ....................... 14 Часть 1. ПОЛНОСТЬЮ ОПРЕДЕЛЕННЫЕ СИСТЕМЫ Глава I. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ ......................... 16 1.1. Пространство состояний.............................. 16 1.2. Передаточная функция............................... 19 1.3. Операторный подход . . ............................ 26 1.3.1. Нормы сигналов (26). 1.3.2. Нормы операторов (28). 1.3.3. Нормы передаточных функций (30). 1.4. Одномерные системы................................. 34 1.5. Выводы.............................................. 42 Глава 2. ВИДЫ УПРАВЛЕНИЯ ................................. 45 2.1. Программное управление. Управляемость .............. 45 2.2. Обратная связь по состоянию......................... 51 2.3. Обращая связь по выходу. Наблюдаемость ............. 53 2.4. Частотные методы................................... 55 2.5. Выводы............................................ 60 Глава 3. УСТОЙЧИВОСТЬ . . .................................. 64 3.1. Устойчивость линейных непрерывных систем............ 64 3.1.1. Невозмущенные системы (64). 3.1.2. Возмущенные системы (71). 3.2. Устойчивость линейных дискретных систем........... 73 3.3. Критерии устойчивости полиномов .................... 76 3. 3.1. Графические критерии (77). 3.3.2. Алгебраические критерии (82 ). 3.3.3. Устойчивость дискретных полиномов (84). 3.4. Частотные критерии устойчивости замкнутых систем.... 87 3.5. Множества достижимости для устойчивых систем ....... 93 3.5.1. Ьг-норма (94). 3.5.2. Loo-норма (96). 3.5.3. Интегральные опенки (100). 3.6. Сверхустойчивость.................................. 102 3.6.1. Сверхустойчивость линейных стационарных систем (103). 3.6.2. Нестационарные системы и другие вопросы сверхустойчи- вости (105).
4 ОГЛАВЛЕНИЕ 3.7. Выводы.............................................. 109 Глава 4. СТАБИЛИЗАЦИЯ........................................ 114 4.1. Стабилизация с помощью регуляторов низкого порядка . 114 4.1.1. П-регулятор (115). 4.1.2. D-разбиение (119). 4.1.3. Дискрет- ные системы (122). 4.2. Общий вид стабилизирующих регуляторов.............. 123 4.3. Размещение полюсов.................................. 128 4.4. Квадратичная стабилизация......................... . 134 4.5. Сверхстабилизация................................... 136 4.6. Выводы.............................................. 140 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ.............................. 143 5.1. Линейно-квадратичный регулятор...................... 143 5.1.1. Принцип максимума (144). 5.1.2. Уравнение Риккати (147). 5.1.3. Функция Ляпунова и линейные матричные неравенства (148). 5.2. Яоо-оптимизация..................................... 151 5.2.1. Решение в частотной области (153). 5.2.2. Решение в про- странстве состояний (155). 5.3. Подавление ограниченных возмущений.................. 158 5.3.1. Ь-оптимизация (159). 5.3.2. Использование сверхустойчиво- сти (164). 5.3.3. Использование инвариантных множеств (167). 5.4. Выводы.............................................. 169 Часть 2. СИСТЕМЫ С НЕОПРЕДЕЛЕННОСТЬЮ (РОБАСТНАЯ ТЕОРИЯ) Глава 6. ВИДЫ НЕОПРЕДЕЛЕННОСТИ............................... 173 6.1. Параметрическая неопределенность.................... 173 6.2. Частотная неопределенность.......................... 177 6.3. Нестационарные и нелинейные возмущения.............. 181 6.4. Вероятностный подход к робастности.................. 181 6.5. Выводы.............................................. 182 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ.............................. 186 7.1. Робастная устойчивость полиномов.................. . 186 7.2. Робастная устойчивость матриц....................... 197 7.3. Робастная устойчивость при неопределенных передаточных функ- циях .............................................. ••• 204 7.4. р-анализ.......................................... 212 7.5. Вероятностный подход к робастной устойчивости........216 7.5.1. Метод Монте-Карло (216). 7.5.2. Вероятностные аппрокси- мации критериев робастной устойчивости (218). 7.5.3. Свойства случайных матриц (221). 7.6. Выводы.............................................. 221 Глава 8. РОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ .................226 8.1. Робастная стабилизация с помощью регуляторов низкого порядка . 226
ОГЛАВЛЕНИЕ 5 8.2. Робастная квадратичная стабилизация....................231 8.3. Робастный линейно-квадратичный регулятор...............232 8.4. Робастная стабилизация с помощью Ноо-оптимизации.......234 8.5. д-синтез.............................................. 239 8.6. Выводы................................................ 241 Глава 9. НЕРЕШЕННЫЕ ЗАДАЧИ................................... 243 9.1. Стабилизация регулятором заданной структуры........... 243 9.2. Одновременная стабилизация............................ 249 9.3. Линейно-квадратичная оптимизация: регуляторы заданной струк- туры и робастность..................................... 252 9.4. Другие проблемы....................................... 255 ПРИЛОЖЕНИЕ............................................... . . 256 1. Определитель, характеристический полином, след.........256 2. Положительно-определенные матрицы......................257 3. Елочные матрицы и лемма Шура......................... 257 4. 5-теорема............................................. 258 5. Нормы матриц.......................................... 258 6. Матричные разложения.................................. 261 6.1. Приведение к диагональной форме (261). 6.2. Приведение к жордановой форме (261). 6.3. Приведение к фробениусовой форме (262). 6.4. Приведение к вещественной блочно-диагональной форме (263). 6.5. Сингулярное разложение (263). 6.6. Канони- ческая управляемая форма. Управляемость (264). 7. Функции от матриц .................................... 265 7.1. Функции от матричного аргумента (265). 7.2. Матричная экс- понента (267). 8. Решение полиномиальных и родственных уравнений........ 268 9. Матричные уравнения и неравенства..................... 270 9.1. Уравнение Ляпунова (270). 9.2. Уравнение Риккати (272). 10. Теория возмущений .................................. 273 10.1. Непрерывная зависимость корней полинома от коэффициен- тов (273). 10.2. Непрерывная зависимость собственных значений матрицы от ее элементов (274). 10.3. Линейная теория возмущений (275). 10.4. Круги Гершгорина (275). 11. Одна теорема двойственности........................... 276 БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ..................................277 СПИСОК ЛИТЕРАТУРЫ............................................. 286 РУССКО-АНГЛИЙСКИЙ СЛОВАРИК ПО УПРАВЛЕНИЮ.......................295 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ ......................................... 299
ПРЕДИСЛОВИЕ За последние 20 лет в теории автоматического управления произо- шли революционные изменения. Возникли такие новые концепции, как робастность, Нх -оптимальное управление, 1\ -подход, д-анализ и синтез, LMI-техника и т.д. Им соответствует новый математический аппарат и новый взгляд на теорию линейных систем. К сожалению, вся эта тема- тика весьма слабо освещена в литературе на русском языке. Большинство учебников по теории автоматического регулирования отражает состояние предмета на 1960-70-е годы. Таким образом, российскому читателю не- легко разобраться в потоке современных западных публикаций, где новый взгляд на теорию управления предполагается исходно известным. Отсут- ствие переводов современных зарубежных монографий и учебников и их труднодоступность усугубляет ситуацию. Авторам настоящей книги хотелось восполнить этот пробел и изло- жить некоторые новейшие результаты теории управления в простой и доступной форме. Мы основываемся как на известных результатах зару- бежных ученых, так и на собственных исследованиях в области робастной устойчивости и управления. Конечно, мы понимаем всю трудность поста- вленной задачи и поэтому сознательно ограничиваем рамки изложения. В книге нет материалов, относящихся к нелинейным системам, стохасти- ческим возмущениям, задачам идентификации, адаптивному управлению; мы совершенно не рассматриваем вопросы практической реализации си- стем управления. Многие математические вопросы излагаются на воз- можно более простом уровне. Авторы будут признательны читателям за любые замечания по содер- жанию книги.
ВВЕДЕНИЕ Теория автоматического управления — молодая наука, которая нахо- дится в процессе интенсивного развития. При этом существенно меняются взгляды на предмет и основные проблемы данной дисциплины, равно как и используемый математический аппарат. В XIX веке главным объектом исследования были автоматические ре- [уляторы производственных процессов, такие как регулятор Уатта для паровой машины. Было введено важнейшее понятие устойчивости ре- гулируемого процесса и получены первые критерии устойчивости ли- нейных систем, выражаемые в терминах характеристического полинома (Максвелл, Раус, Вышнеградский, Гурвиц, Стодола). В работах А. М. Ля- пунова были получены первые результаты по устойчивости нелинейных систем, опирающиеся на фундаментальную идею введения функции Ляпунова. В ЗО-е годы XX века, с появлением телефонии и радиосвязи, основ- ным аппаратом теории становятся частотные методы и соответствующие частотные критерии устойчивости (Найквиста, Михайлова). Эти методы в 1940-50-е годы распространяются на импульсные и дискретные системы (Цыпкин, Джури) — такие системы приобретают особую роль в связи с появлением цифровой вычислительной техники, — а также на некоторые классы нелинейных систем (теория абсолютной устойчивости — Лурье, Айзерман, Попов). Однако в конце 1950-х годов происходит очередное обновление в те- ории управления. В связи с развитием ракет и космонавтики возникает совершенно новый аппарат описания систем управления — описание в пространстве состояний. Иначе говоря, движение системы подчиняется обыкновенному дифференциальному уравнению (вообще говоря, нели- нейному), в правой части которого стоит функция, которая может выби- раться проектировщиком (управление). Более того, возникла фундамен- тальная идея оптимальности — выбор управления должен оптимизировать некоторый показатель качества. В такой постановке задача управления имеет много общего с классическими задачами вариационного исчисле- ния. В дело исследования систем управления включились математики; результатом явилась разработка «принципа максимума Понтрягина» —‘ необходимого условия оптимальности управляемой системы. Работы спе- циалистов по управлению (Калман, Беллман, Летов) помогли инжене-
8 ВВЕДЕНИЕ рам осознать важность и продуктивность созданной теории оптимального управления. В то же время постепенно выяснилось, что такая теория адекватно описывает лишь сравнительно узкий круг практических задач, таких как управление космическим полетом или наведение ракет. В остальных си- туациях имеется масса факторов, препятствующих применению красивой математической теории оптимального управления. Во-первых, в каждой задаче имеется неизбежная неопределенность, связанная либо с наличием внешних возмущений, либо с невозможностью точно определить пара- метры модели. Во-вторых, в теории оптимального управления решение ищется в виде функции от времени (программное управление). Ясно, что необходимость строить стратегию управления заранее является крайне не- желательной. Для инженера гораздо более естественно выбирать управле- ние в форме обратной связи, как функцию от выхода системы в текущий момент (задача синтеза). Подобное критическое отношение вызвало ревизию теории управле- ния в 1970-е годы. В инженерной практике происходит возврат к клас- сическим способам регулирования с помощью простых регуляторов (типа ПИД) и к простым методам их настройки. В теории восстанавливается интерес к частотным методам; они обобщаются на случай многомерных систем (Розенброк). Однако подлинная революция произошла в 1980-е го- ды. Возникла так называемая Д»-теория (Зеймс, Френсис, Дойл, Гло- вер); она позволила объединить частотные методы и методы пространства состояний и по-новому ставить оптимизационные задачи. Эта же поста- новка позволила рассматривать задачи с неопределенностью (робастное управление), именно задачи, в которых частотная характеристика объ- екта имеет неопределенность, ограниченную в Д» -норме. Появились и другие постановки задач робастного управления, в которых неопределен- ность может быть задана иначе — либо как параметрическая, либо как ограниченная в матричной норме при описании в пространстве состоя- ний. При этом были найдены многие красивые решения отдельных задач; например, задача о робастной устойчивости интервального полинома до- пускает очень простой ответ (теорема Харитонова). Был создан математи- ческий аппарат, позволяющий единообразно исследовать различные виды неопределенностей — д-анализ (Дойл). Помимо Яоо-теории и робаст- ности, новое решение получил ряд других разделов теории управления. Так, задача о подавлении внешних возмущений привела к появлению так называемой Ц-оптимизации (Барабанов-Граничин, Пирсон-Далех). Но- вый математический аппарат, оказавшийся чрезвычайно удобным, связан с линейными матричными неравенствами. Эти неравенства возникли еще в 1960-е годы в ряде задач управления (Якубович, Виллеме); позже выяс- нилось (Бойд), что они представляют собой очень общий метод анализа и синтеза линейных систем. Наличие эффективных программ решения
ВВЕДЕНИЕ 9 линейных матричных неравенств (Нестеров-Немировский) сделало этот аппарат весьма эффективным с вычислительной точки зрения. Как видит читатель, за последние 20 лет теория управления претер- пела очень большие изменения. К сожалению, они слабо отражены в отечественной учебной литературе. Замечательная книга А. А. Первозван- ского [58] дает полное представление о положении в теории управления к началу 1980-х годов. Вышедшие за последние годы учебники затрагивают, как правило, лишь отдельные стороны современной теории. Некоторую информацию можно извлечь из статей и обзоров на русском языке, однако все это дает лишь мозаичную картину предмета. Мы попытаемся в этой книге дать более систематическое (но неиз- бежно краткое) изложение современного состояния теории управления. Книга построена следующим образом. Часть I посвящена задачам уп- равления, в которых отсутствует неопределенность в описании объекта (однако допускается неопределенность внешних воздействий). В первой главе описываются основные способы задания линейных систем — с по- мощью систем линейных обыкновенных дифференциальных уравнений первого порядка (описание в пространстве состояний), с помощью одного линейного дифференциального уравнения п-го порядка (системы с одним входом — одним выходом), с помощью передаточных функций. Наиболее общий современный подход описывает систему как линейный оператор, преобразующий входные сигналы в выходные. При этом в пространстве сигналов могут вводиться различные нормы, индуцирующие соответству- ющие нормы в пространстве операторов. Указаны приемы, позволяющие переходить от одного описания к другому. Рассмотрены также дискрет- ные системы, в которых вместо дифференциальных уравнений фигури- руют разностные. Глава 2 знакомит со способами задания управления в линейных систе- мах. В некоторых случаях можно выбирать управление как функцию от времени (программное управление). Однако такой способ непригоден при наличии неопределенности в объекте или во внешних сигналах, поэтому традиционно в инженерной практике используется управление в форме обратной связи. Это может быть либо управление по состоянию (когда вектор состояний доступен), либо управление по выходу (если текущая информация о системе дается ее выходом). Здесь же вводятся такие важ- нейшие термины теории управления, как управляемость и наблюдаемость. Обсуждаются особенности задания управления при описании системы в частотной области. В главе 3 исследуется ключевое понятие устойчивости систем управле- ния. Для одномерных систем (с одним входом и одним выходом) условия устойчивости формулируются особенно просто, так как характеристиче- ский полином выписывается явно. Проверка устойчивости полинома про- изводится с помощью простых критериев Рауса-Гурвица (в численном
10 ВВЕДЕНИЕ виде) или Михайлова (в графическом виде). Особую роль в теории упра- вления играет критерий Найквиста. Для многомерных систем критерии устойчивости формулируются с помощью собственных значений матрицы состояний. Другой подход к устойчивости связан с введением квадратич- ной функции Ляпунова; она может быть построена путем решения урав- нения Ляпунова. В ряде случаев удобны простые достаточные условия устойчивости («сверхустойчивость»), которые легко проверяются как ли- нейные ограничения на коэффициенты матриц. Для устойчивых систем представляет интерес по возможности более точное описание множества достижимости, т.е. всех состояний, в которые может быть переведена система с помощью ограниченных в той или иной норме управлений. Начиная с главы 4 исследуются основные задачи управления линей- ными объектами. Простейшая из них — стабилизация, т. е. обеспечение устойчивости замкнутой системы с помощью обратной связи. Мы на- чинаем с проблем стабилизации простыми регуляторами. Здесь использу- ются такие методы, как годограф Найквиста и D-разбиение, позволяющее выделить все значения одного или двух параметров, при которых система устойчива. Если не задаваться видом регулятора, то можно описать все стабилизирующие регуляторы для данного объекта (так называемая пара- метризация Юлы). Важная идея стабилизации связана с использованием квадратичных функций Ляпунова. Наконец, можно использовать условия сверхустойчивости для построения стабилизирующих регуляторов. Еще одному ключевому понятию теории управления — оптимально- сти — посвящена глава 5. Здесь формулируются основные типы крите- риев качества в задачах управления. Простейший квадратичный функци- онал был изучен еще в 1950-60-е годы в работах Калмана, Веллмана, Летова, Виллемса. Решение задачи оптимального управления с таким показателем (задача о линейно-квадратичном регуляторе или задача об аналитическом конструировании регуляторов) удается получить в явном виде с помощью уравнения Риккати. Приведены и другие способы реше- ния — сведение к краевой задаче или к линейным матричным неравен- ствам. Следующие параграфы этой главы посвящены более современным постановкам задачи оптимального управления. Первой из них является задача -оптимизации, строго сформулированная Зеймсом в начале 1980-х годов (частные случаи задачи рассматривались и в более ран- них публикациях). Она допускает несколько трактовок. Можно исхо- дить из задачи оптимального подавления внешних возмущений, ограни- ченных в Ь2-норме (т.е. возмущений с ограниченной суммарной энер- гией). Можно говорить о равномерно-частотном управлении (частота гар- монического внешнего воздействия неизвестна; управление должно хо- рошо подавлять все такие воздействия). Задача Hoo-оптимизации перво- начально решалась в частотной области с помощью тонких методов тео- рии функций комплексного переменного (теорема Нехари, интерполяция
ВВЕДЕНИЕ И Неванлинны-Пика). Позже было найдено решение в пространстве состо- яний, оно по форме напоминает решение задачи линейно-квадратичной оптимизации и также связано с уравнением Риккати. Заключительный параграф главы 5 описывает еще одну оптимальную задачу — о подавле- нии ограниченных внешних возмущений. Для дискретных систем огра- ниченные сигналы связаны с Zoo-нормой, а оператор, преобразующий та- кие сигналы, ограничен в Z]-норме. Поэтому принято сейчас называть указанную задачу h -оптимизацией. Мы рассматриваем различные под- ходы к таким проблемам как для дискретных, так и для непрерывных систем. Вторая часть книги посвящена управлению в условиях неопределен- ности, т. е. проблеме робастности. Здесь мы имеем дело не с одной систе- мой, а с целым семейством систем. Это семейство может задаваться либо с помощью некоторого множества параметров (параметрическая неопре- деленность), либо с помощью «полосы» в частотной области (частотная или неструктурированная неопределенность), либо с помощью некоторого допустимого множества матриц состояния (матричная неопределенность). Есть и общая схема записи, охватывающая все упомянутые виды неопре- деленности — так называемая М-Д-конфигурация. Наконец, в рамках вероятностного подхода к робастности рассматриваются ситуации, когда неизвестные параметры являются случайными (вероятностная неопреде- ленность). Все эти способы задания неопределенностей обсуждаются в главе 6. В главе 7 исследуется проблема робастной устойчивости, т. е. устойчи- вости систем при наличии неопределенности. Простейшей является задача о робастной устойчивости полиномов при параметрической неопределен- ности. Предполагается, что характеристический полином системы зависит от параметров; условие робастной устойчивости сводится к проверке гур- вицевости этого полинома при всех допустимых значениях параметров. Критерии этого иногда весьма просты. Если параметрами являются сами коэффициенты полинома и они могут изменяться в некотором параллеле- пипеде, то теорема Харитонова утверждает, что робастная устойчивость гарантируется, если устойчивы четыре специальных полинома из данного семейства. Для этого же случая фафический критерий Цыпкина-Поляка позволяет не только проверять робастную устойчивость, но и находить радиус устойчивости — максимальный размах неопределенных параме- тров, при котором все полиномы устойчивы. Более сложная (но И более реалистическая) ситуация встречается, когда неопределенные параметры входят в полином нелинейным образом. Принципиальное решение во- проса дается здесь с помощью принципа исключения нуля, однако кон- структивное построение требуемых для этого «областей значений» воз- можно лишь в частных случаях. Далее обсуждается проблема робастной устойчивости при иных видах неопределенности — частотных, матрич-
12 ВВЕДЕНИЕ ных, вероятностных. Для частотной неопределенности ситуация наиболее проста. Для одномерных систем можно построить робастный критерий Найквиста; в многомерном случае робастную устойчивость гарантирует теорема о малом коэффициенте усиления. При матричной неопреде- ленности необходимые и достаточные условия робастной устойчивости удается получить лишь в исключительных случаях; общая задача оказы- вается NF-сложной. Здесь весьма плодотворен вероятностный подход. Другим удобным инструментом является переход к проблеме квадратич- ной устойчивости — построению единой функции Ляпунова для всего семейства матриц. Общая неопределенность рассматривается в рамках так называемого //-анализа. Наиболее важная задача робастного синтеза рассматривается в главе 8. Она заключается в выборе регулятора (в форме обратной связи по со- стоянию или по выходу), который, во-первых, обеспечивает робастную устойчивость замкнутой системы, а во-вторых, гарантирует некоторое желаемое значение показателя качества при всех возможных неопре- деленностях. Мы рассмотрим робастные версии задач стабилизации и оптимального управления, исследовавшихся в главах 4 и 5. Ситуация с ними оказывается весьма различной. Уже задача о линейно-квадратичном ре!уляторе при наличии неопределенности в матрице состояний доста- точно трудна; иногда ее решение возможно с помощью линейных ма- тричных неравенств. В то же время робастный вариант Ноо-Оптимизации может быть исследован аналитически. Далее рассматриваются некото- рые специфические задачи оптимального управления, например, задача о максимальной робастности. Здесь же предлагаются робастные обоб- щения методов синтеза регуляторов низкого порядка, обсуждавшихся в главе 4. Наконец, в заключительную главу 9 включены проблемы, которые представляют большой интерес для теории управления, но еще не полу- чили полного решения. Первая — известная задача о стабилизируемое™ по выходу: существует ли стабилизирующий регулятор в форме обратной связи по выходу? Близкая задача о стабилизации по состоянию допускает простое решение (в терминах управляемости системы); однако данная за- дача представляет большие трудности. Родственная задача: как проверить, существует ли в данном аффинном семействе полиномов устойчивый по- лином — также далека от решения. Еще одна задача из того же круга: найти ближайший (в смысле какой-либо нормы в пространстве коэф- фициентов) устойчивый полином к данному неустойчивому. На первый взгляд похожая задача о радиусе робастной устойчивости (найти ближай- ший неустойчивый полином к данному устойчивому) хорошо исследована и полностью решается с помощью годографа Цыпкина-Поляка. Другой цикл проблем связан с робастной устойчивостью матриц; среди них оста- ется много нерешенных (одновременная стабилизация нескольких систем;
ВВЕДЕНИЕ 13 робастная устойчивость интервального семейства матриц и т.д.). Обсу- ждаются полученные в этой области результаты и перспективы решения подобных задач. Параллельно с теоретическим исследованием в книге часто упомина- ется система Matlab — важное и удобное программное средство реше- ния многих задач теории управления [7,52,69]. В конце каждого па- раграфа приводится список сопутствующих процедур, реализованных в версии Matlab 6.1. Заключительная часть книги состоит из Приложения, содержащего требуемые сведения из нескольких областей математики. Большинство из них относится к линейной алгебре и полиномам. Здесь освещаются такие вопросы, как приведение матриц к той или иной форме, нормы векторов и матриц, теория возмущений, непрерывная зависимость кор- ней полинома от его коэффициентов, матричные уравнения Ляпунова и Риккати. Приведены также такие результаты, как S-процедура, решение полиномиальных уравнений и т. д. Список литературы в книге не претендует на полноту. Мы включили в него основные западные учебники по современной теории управления, журнальные работы, сыгравшие важную роль в становлении этой теории. Литературу на русском языке мы пытались представить более подробно. Наряду с несколькими учебниками прошлых лет даны достаточно деталь- ные ссылки на журнальную литературу, имеющую отношение к тематике книги. Для удобства читателя, которому придется читать зарубежную литера- туру или переводить собственные работы на английский язык, мы привели краткий русско-английский словарик по современной теории управления. Нам кажется, что нужда в таком словарике существует, поскольку терми- нология в этой области только складывается, а переводы русских статей на английский нередко грешат серьезнейшими ошибками из-за незнания этой терминологии. В заключение — несколько слов о возможном читателе книги. Книга не является учебником (в ней мало примеров, нет упражнений, не все затронутые вопросы изложены достаточно подробно). В то же время нам кажется, что на основе книги могут читаться курсы для студентов по со- временной теории управления. Основными же читателями нам предста- вляются студенты, желающие углубить свои знания, аспиранты и специа- листы по теории управления. В принципе, знание «классической» теории автоматического управления не требуется для чтения, однако такое зна- комство весьма полезно для понимания особенностей новых подходов к теории.
СПИСОК ОБОЗНАЧЕНИЙ R, С — множества вещественных и комплексных чисел. signa; — знак числа х 6 R. Rez, Imz — вещественная и мнимая части комплексного числа г € С, z = Re z + jlm z, j = z* — комплексное сопряжение z G С, т.е. если z = Rez + jlmz, то z* = Rez — jlmz. arg z — ар1умент комплексного числа z G С. ft”, C” — пространства n-мерных векторов x с вещественными и ком- плексными координатами: х = (a?i,..., жп)т. |ж[ — норма конечномерного вектора х G R" или х е С”, в частности: модуль х при п = 1; г ”, , . \ Vp /p-норма: ]х\р = ( $2 Rr ) > 1 4 Р < °о; в том числе: г п \ 1/2 при р = 2 — евклидова норма: |ж|2 = ( |®»|2 ) ; 4=1 7 при р = оо: |ж|оо = max IxJ; l<i!gn ’ при р = 1: kli = Е kil- г=1 (а,Ь) — скалярное произведение векторов из R” или С”. Rnxm, Qrtxm —, пространства п х т матриц А с вещественными и ком- плексными элементами щ-,, i = 1,...,п, j = 1,...,т. I — единичная матрица. АТ — транспонирование А = ((о.^)): АТ = ((а/О). А* — комплексное сопряжение и транспонирование матрицы A G Спхп, т.е. если А = ((ву)), то А* = ((a*j))- rank А — ранг матрицы А. Аг(Л) — г-е собственное значение матрицы A G Спхп, i = 1,..., п. tiA — след матрицы А = ((а^)) 6 Спхп: 1тА =^,аи- г-=1 det А — определитель матрицы А. р(А) — спектральный радиус матрицы A G Спх", т.е. максимум модуля ее собственных значений: р(Л) = тах|Аг|. i сг{(А) — i-e сингулярное число матрицы A G Cnxm: стДЛ) — А^2(Л*Л), г = 1,... ,т.
СПИСОК (НАЗНАЧЕНИЙ 15 д > О (Л > 0) — матрица А е Rnxn симметрична и положительно (неотрицательно) определена. ц . || — норма функции (сигнала), или норма матрицы (оператора), или норма передаточной функции; если не указана явно, то подразу- мевается любая норма или 2-норма (для сигналов) и индуциро- ванная норма (для матриц); в частности, для матриц А е Rnxm или А е Спхт: спектральная норма (2-норма): ЦЛЦ2 = max Л*/2(Л*Л) = max ст, (Л); г X строчная норма (1-норма): Л|h = max ( У, ау ); столбцовая норма (оо-норма): ||Л||оо = max f52lavll« / n xl/2 фробениусова норма: ||Л||р = ( lavl2) (A,B) — скалярное произведение в пространстве матриц; Для А, В 6 Спх”: {А, В) = tr Л*В; в частности, для А, В G Rnxn, А = Лт, В = Вт: {А,В) = 1тАВ. degP(.s) — степень полинома P(s). RHou — пространство устойчивых реализуемых дробно-рациональных функций, т.е. функций вида G(s) = A(s)/B(s), гае Л —по- лином, В — гурвицев полином, и deg Л С deg В. Если М(з) — матрица с элементами my(s), то запись M(s) G RH^ означает, что mij(s) 6 RHqo для всех г, j. = — равно по определению. CST — пакет Control System Toolbox системы Matlab. LMIC — пакет LMl Control Toolbox системы Матъав. PAST — пакет p-Analysis and Synthesis Toolbox системы MATLAB. ОТ — пакет Optimization Toolbox системы MATLAB. RCT — пакет Robust Control Toolbox системы Matlab. SMT — пакет Symbolic Math Toolbox системы MATLAB.
Часть 1 ПОЛНОСТЬЮ ОПРЕДЕЛЕННЫЕ СИСТЕМЫ В первой части книги предполагается, что доступно полное математи- ческое описание системы управления, т. е. она не содержит неопределен- ности. В то же время входные сигналы (внешние возмущения) могут быть известны не полностью. Глава 1 ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ В первой главе будут рассмотрены различные способы задания линей- ных систем, соотношения между ними, их сравнительные достоинства и недостатки. Мы будем параллельно исследовать как непрерывные, так и дискретные системы. 1.1. Пространство состояний Линейная стационарная непрерывная управляемая система описыва- ется векторным линейным обыкновенным дифференциальным уравнением первого порядка: х — Ax + Bu + Diw, . у = Сх + Dzw. ' ' Зцссъ x(t) е R” — вектор, называемый состоянием системы, u(t) G Rm — управление, y(t) G Rz — выход системы, w(t) € Rmi — входные сигналы (внешние возмущения) или задающие воздействия. Матрицы A G Rnx”,B G R”xm,D1 G Rnxmi,C G R'x”,r»2 € R'xmi не зависят от времени t. Системы, в которых эти матрицы изменяются во времени, называются нестационарными-, мы почти не будем рассматривать этот случай. Форму записи системы в виде (1.1) принято называть описанием в пространстве состояний. Обычно предполагается, что проектировщик знает лишь выход си- стемы y(t); в некоторых случаях у — х, т.е. известно и состояние си-
1 I. ПрЧС1раНС1ВЧ состояний 17 стемы. В данной части книги будет считаться, что система полностью определена, т. е. матрицы 4, В, С, D\, D2 заданы. Во второй части будут исследованы системы при наличии неопределенности, когда эти матрицы известны не полностью. Управление при наличии неопределенности на- зывается робастным. Относительно внешних воздействий w(t) могут делаться самые разно- образные предположения: они могут отсутствовать или быть полностью известными; могут быть произвольными детерминированными и ограни- ченными в некоторой норме; могут быть случайными. Последняя си- туация — случайные возмущения с заданными вероятностными свой- ствами — в этой книге изучаться не будет. Более подробно классы возможных возмущений будут описаны ниже. Целью управления является выбор таких u(t) (или и(х)~), которые при- дают системе (1.1) заданные свойства (например, устойчивость, оптималь- ность по некоторому показателю качества и т. д.). Более четко постановка задачи управления будет сформулирована позже. Система, в которой управление отсутствует, может быть записана в том же виде (1.1), но без члена Ви: х = Ах + Diw, у = Cx + D2w. Ц ’ Такие системы называются открытыми. Отметим, что если в (1.1) упра- вление и уже выбрано в форме u(t) или и = Кх (т. е. как программное управление или в форме обратной связи по состоянию, см. ниже), то мы также получаем уравнение в форме (1.2), но с иным внешним возму- щением (равным Bu(t) + Z>iw, если задано u(t)) или иной матрицей А (равной А + В К в случае и = Кх; при этом говорят о замкнутой си- стеме). Решение открытой системы (1.2) может быть записано в явном виде: < * x(t) = еЛ*а:(0) + еА^~Т^ Diw(r)dr. (1.3) о Здесь х(0) — значение x(t) в начальный момент t = 0, a eAt — матричная экспонента (см. Приложение, п. 7.2). Таким образом, если я(0) и w(t) известны, то можно найти x(t) для всех моментов t. Вообще, в дальнейшем уравнение состояния (первое из уравнений (1.1)) при наличии лишь одного неоднородного члена будем для едино- образия иногда записывать в виде х = Ах 4- Ви,
18 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ подразумевая различную природу неоднородного члена. Например, одна и та же математическая задача описания множества •р:(Т): х — Ах + Ви, а:(0) = 0, ||гв|| с| может интерпретироваться либо как описание всех состояний системы, достижимых к моменту Т из начала координат с помощью ограниченых в какой-то норме управлений и, либо как описание возможной неопре- деленности в состоянии системы, накопившейся к моменту Т под воз- действием ограниченных возмущений и. Физическую постановку задачи будем оговаривать в каждом конкретном случае. Наряду с непрерывными системами (1.1) будем рассматривать дис- кретные системы, описываемые не дифференциальными, а разностными уравнениями xk - Axk-i + Buk-i + Diwk~i, ук = Схк + D2wk. (1.4) Здесь индекс к играет роль времени (дискретное время), а смысл всех остальных векторов и матриц тот же. Дискретные системы могут возни- кать как при дискретной аппроксимации непрерывных систем, так и в других случаях. Например, к может обозначать номер итерации в ите- рационном процессе или время в дискретных процессах, связанных с цифровым управлением. Открытая дискретная система приобретет вид хк = Ахк^ + D^Wk-i, . ук = Cxk+D2wk, { ' а ее решение также выписывается в явной форме: к— 1 хк ^xo + ^A^-'D^i. (1.6) i=0 Сопутствующие функции Matlab: ss (CST) — задание системы в пространстве состояний и переход от других описаний (см. ниже) к пространству состояний; ss2ss (CST) — переход к другим координатам при описании в простран- стве состояний; ssdata (CST) — извлечение данных (вычисление матриц системы) с пред- варительным преобразованием (если необходимо) к простран- ству состояний; c2d (CST) — дискретизация непрерывной системы; ехрт — матричная экспонента; f unm — вычисление функции общего вида от матрицы.
(lepe; Ы i < i4 пая функция 19 1.2. Передаточная функция Проведем некоторые формальные преобразования уравнений в про- странстве состояний. Введем оператор дифференцирования по времени: s ----- d/dt\ на гладкие функции x(t) он действует по правилу sx(t) = i(t). (1.7) Будем относиться к s как к комплексной переменной и рассматривать различные функции от нее; им нетрудно придать содержательный смысл. Например, если R(s) = ао + ajs + ... + то B(s)a:(t) = aox(t) + ai±(t) 4- • • + akX^(t). Тогда, подставив s = d/dt в (1.1) (при x(0) = 0) и формально разрешая первое уравнение относительно х, получим х = (si — А)"1 (Ви + £>iw) и для выхода получаем выражение y = C(sI- А)~1Ви+ ^C(sI — A)~1Di +£>2]w. (1.8) Матричная функция комплексной переменной s Hyu(s) = C(sI -A)-XB называется передаточной функцией от управления и к выходу у, а ана- логичная функция Hyw(s) = C(sl - А)"1!»! +D2 называется передаточной функцией от возмущения w к выходу у. Рассмотрим эти функции подробнее. Элементами матриц H(s) явля- ются дробно-рациональные функции от переменной s, которые имеют общий знаменатель P(s) = det (si — А) (1.9) — характеристический полином матрицы А. Этот полином от перемен- ной s будем называть характеристическим полиномом системы, так как в дальнейшем увидим, что от расположения его корней зависят такие важ- ные свойства системы, как устойчивость и др. С учетом обозначения (1.9) Hyn(s) (и, аналогично, Hyw(s)) представима в виде Hyu(s) = H(s) = ^W(s), (1.10)
20 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ где 1У(в) — матрица, элементы которой полиномы от з. Действи- тельно, для любой невырожденной матрицы М € Rnxn ще М = ((т^)) — матрица, состоящая из алгебраических дополнений (присоединенная матрица): Шу = (— 1)г+^ det Mji', здесь Mji — матрицы, получающиеся из М вычеркиванием j-й строки и г-го столбца. Поэтому если М = (si — А), то — полиномы от з, откуда и следует выражение (1.10). Нули si характеристического полинома Р(з) называются полюсами передаточной функции H(s)t Si : P(si) = 0, i = 1,... ,n. Таким образом, полюса Н(з) совпадают с собственными числами Ма- трицы А; для всех остальных s матрица II (з) определена. В частности, если Р(з) устойчив (см. ниже, гл. 3), т. е. все его корни лежат в откры- той левой полуплоскости, то H(s) — матричная функция, аналитичная в правой полуплоскости. Мы будем неоднократно пользоваться этим в дальнейшем, и такие передаточные функции называем устойчивыми. Возвращаясь к (1.8), на языке передаточных функций выход системы как функцию от управления и внешних входов можем записать в следую- щем виде: у = Нуи(з)и + Hyw(s)w. (1.11) Строгое обоснование перехода от записи (1.1) системы в пространстве состояний к форме (1.11) может быть сделано с помощью преобразова- ния Лапласа; мы сейчас не будем этим заниматься, а будем рассматри- вать (1.11) просто как иную форму записи дифференциальных уравне- ний (1.1). Разумеется, описание (1.11) системы с помощью передаточных функ- ций может быть и исходным; иногда оно возникает более естественно, чем описание в пространстве состояний. Рассмотрим для простоты ситуацию, когда внешние возмущения и ошибки измерения выхода отсутствуют: у = H(s)u, ueRm, yen1. (1.12) В этой записи под передаточной функцией H(s') будем понимать матрицу I х т, элементы которой есть дробно-рациональные функции от з, т. е.
1.2. Передаточная функция 21 7/(s) представима в виде H(s) = 1 F(S) W(s), (1.13) где элементы I х т матрицы 1У(з) являются полиномами от s. Поли- ном Pfs) — общий знаменатель элементов матрицы Я(з) — будем назы- вать характеристическим полиномом системы, а его корни — полюсами передаточной функции (системы). Такое определение характеристиче- ского полинома и полюсов системы не вполне точно, поскольку могут возникнуть неприятности, связанные, например, с возможным сокраще- нием неустойчивых полюсов (см. обсуждение в п. 3.4). Более строгое определение дается следующим образом. Формально умножив обе части (1.12) на P(s), с учетом (1.13) получим P(s)y = W(s)u (1-14) и, рассматривая теперь s как оператор дифференцирования, приходим к системе дифференциальных уравнений высокого порядка относительно y(t) е л1, u(t) е R™. На элементы матрицы H(s) естественно наклады- вать дополнительное условие реализуемости: степень полинома в числи- теле не превосходит степени полинома в знаменателе (см. также ниже, п. 1.4); такие передаточные функции будем называть правильными или реализуемыми. Тогда, вводя «искусственные» переменные — состояния, можно привести уравнение (1.14) к виду, аналогичному (1.1). Иными словами, от записи системы с помощью реализуемой передаточной функ- ции можно перейти к эквивалентному описанию в пространстве состо- яний, которое принято называть реализацией передаточной функции в пространстве состояний. При этом используют запись Я(в) = А В С D (1.15) или H(s) = (A,B,C,D), которые означают, что система у = H(s)u эквивалентна системе х = Ах + Ви, ж(0) = О, у = Сх + Du и при этом H(s) = C(sI~ А)-1 В + D. Переход от Я(з) к (Л, В, С, D)-реализации может быть осуществлен раз- личными способами, и таких реализаций много. Среди них существуют такие, в которых размерность А (т. е. размерность вектора состояний х)
22 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ минимальна; они называются минимальными реализациями. Соответству- ющая размерность А называется степенью Мак-Миллана для передаточ- ной функции. Эта степень может быть найдена с помощью специального алгоритма — приведения H(s) к так называемой форме Мак-Миллана. Если (А, В, С, D) — минимальная реализация H(s), то P(s) = det (si - А) представляет собой характеристический полином системы, а его кор- ни — собственные значения А — называются полюсами матричной пе- редаточной функции (полюсами системы). В дальнейшем мы увидим, что запись с помощью передаточных функ- ций чрезвычайно удобна; сейчас проиллюстрируем это на простом при- мере. Пусть имеется несколько объектов соответствующих размерностей, соединенных последовательно, так что выход ук каждого служит вхо- дом Uk+\ последующего (см. рис. 1.1), причем каждый объект имеет свою передаточную функцию Hk(s): yk = Hk(s)uk, к — 1,,..,т\ мы для простоты полагаем, что имеется единственный входной сигнал и, а ошибки измерения v отсутствуют. ?/2 = Из Ут — 1 — “Um Hm(s) Ут У Рис. 1.1. Последовательное соединение объектов Подставляя последовательно, получаем для связи общего входа и = щ и выхода у— ут-. у = Ут = #i(s)ui = H(s)u, т. е. передаточная функция последовательного соединения равна произве- дению передаточных функций объектов: H(s) = Hm(s)---H1(s). (1.16) Выразить такое соотношение на языке пространства состояний было бы гораздо труднее. Поэтому в инженерной практике, где нередко рассма- триваются сложные соединения простых звеньев (блок-схемы системы), язык передаточных функций является общепринятым. При этом суще- ствуют простые правила, позволяющие рассчитать итоговую передаточ- ную функцию блок-схемы по передаточным функциям звеньев (подобные правилу (1.16) для последовательного соединения).
1.2. Переда i очн;ш функция 23 Обсудим еще одно важное свойство передаточных функций, поясня- ющее удобство такого способа описания систем. Предположим, что си- стема (1 .1) имев! вид х = Ах + Ви, У = Сх, а входное воздействие w(t) — комплексный гармонический сигнал-. u(t) = а,е?ш*, где а — некоторый постоянный вектор, аш — частота колебаний (напо- мним, что в теории управления мнимую единицу принято обозначать j, а не i, как обычно в математике). Из формулы (1.3) для решения си- стемы x(t) получим x(t) - eAtx(0) + eAt I e^l-A}TBadr = о = ел‘х(0) + (jwl - A)~1Baejut - (jul - Ay1eAtBa, (1.17) и через x(t) обозначим установившееся значение вектора состояния x(t) = ~ A^~xBu{t). (1-18) Предположим, что матрица А устойчива, т. е. все ее собственные значения Хг лежат в левой полуплоскости: ReАг < 0, i — 1,...,п (подробнее вопрос об устойчивых матрицах и системах обсуждается ниже, в главе 3). Можно показать, что для устойчивых матриц eAt —► 0 при t —♦ оо. Тогда из (1.17)-(1.18) следует: |x(t) - x(t)| —» 0 при t -+ оо. Таким образом, для установившегося значения выхода имеем у(£) Cx(t) = C(jwl - A)~lBu(t), \y(t) - y(t)\ —> 0 при t —> oo, или, иначе говоря, y(t) = H(jw)u(t), (1.19) где матричная функция H(jix) называется частотной характеристикой системы. Поясним смысл полученного соотношения (1.19). Пусть все компо- ненты входного вектора w(t) равны нулю, кроме i-й, которую представим в виде m(t) = acoswt + jasinwt (где а — число). Тогда fc-я компонента установившегося значения выходного сигнала равна yk(t) = |/ix-i(jw)|acos(wt + <р) + j\hki(jw)\a sin (wt + tp),
24 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ гае hkt(jw) — (&,г)-й элемент матрицы Я(уси), а <р = arg/iki(jcu). В силу линейности Я(-) отклик системы на сумму вещественной и мнимой составляющих u(t) равен сумме откликов на каждую из них, т. е. если в качестве взять вещественную гармонику a cos cut, то установившееся значение на fc-м выходе будет cos (cut + tp). Приходим к важному выводу: если на г-й вход системы с устойчивой матрицей А подается гармонический сигнал с частотой си, то на к-м вы- ходе в пределе получается также гармонический сигнал с той же частотой. Его амплитуда в \hki(jcu)| раз отличается от амплитуды входного сигнала (т.е. |/ifci(jcu)| имеет смысл коэффициента усиления входного гармониче- ского сигнала), а фаза изменяется на arg/ifci(Jcu). Это свойство исполь- зуется на практике для определения частотной характеристики системы экспериментальным путем. Таким образом, в терминах передаточных функций очень удобно опи- сывать трансформацию гармонических сигналов, проходящих через ли- нейную систему. Введем теперь передаточные функции для дискретных систем. Опре- делим оператор сдвига назад z: zxk = Xk-i (1-20) и аналогично непрерывному случаю будем рассматривать его как фор- мальную переменную. Тоща при хо = 0 уравнение (1.4) запишется в форме хк = гАхк + гВик + zDiWk, т. е. хк = z(I - zA)~xBuk + z(I — zAY^D^Wk, Ук = zC(I - zA)~1Buk + - zAy^Di + Z^]^. Передаточные функции теперь выражаются через переменную z по фор- мулам Hyu(z) = zC(I - zAY^B, Hyw(z) = zC(I - zA^Dr + Z>2, (1.21) и характеристическим полиномом системы так же, как и раньше, будем называть общий знаменатель элементов матричных передаточных функ- ций, т. е. полином P(z) = det (I ~ zА)
25 1 2. Передач очндя функция от переменной z. Соответственно, передаточные функции (1.21), как и в непрерывном случае, имеют вид Я(2) = * ^(z), r\z) где И'(~) - матрица, элементы которой являются полиномами от z. По- этому если P(z) не имеет нулей внутри единичного круга, т.е. является устойчивым по Шурух (эквивалентно, матрица А дискретно устойчива, т.е. |Ai| < 1 да всех собственных значений А), то H(z) аналитична в этом круге. Аналогично тому, как это сделано для непрерывных систем, можно показать, что если у открытой системы (1.5) без ошибок в наблюдении выхода (/Л = 0) матрица А дискретно устойчива, а на вход подается гармонический сигнал то выход стремится к установившемуся значению, записываемому форму- лой yk = = - е>шА)~1В, т.е. и в этом случае гармонические сигналы преобразуются в пределе в гармонические, с амплитудой, измененной в |Я(е’“)| раз, и сдвигом по фазе, равным — argH(eJiJ) (знак «—» соответствует оператору z сдвига назад). Мы вновь видим, что язык передаточных функций хорошо приспосо- блен к описанию прохождения гармонических сигналов, имеющих фик- сированную частоту. Поэтому методы, основанные на таком подходе, обычно называют частотными. Сопутствующие функции Matlab: tf (CST) — задание системы с помощью передаточных функций и пере- ход от других форм записи к передаточной функции; tf data (CST) — извлечение данных (числителя и знаменателя передаточ- ной функции) с предварительным преобразованием (если необ- ходимо) к частотной форме; pole (CST) — вычисление полюсов системы; append, connect, feedback, parallel, series (CST) —различные соединения звеньев, заданных как передаточной функцией, так и в пространстве состояний; freqresp (CST) — вычисление частотной характеристики; minreal (CST) — построение минимальной реализации передаточной функции; 'Вопреки дискретной устойчивости полиномов и матриц подробно рассматриваются в 3 2. 3.5J и 4.1.3.
26 Глава I. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ poly — вычисление характеристического полинома матрицы; det — вычисление определителя матрицы; inv — обращение матрицы. 1.3. Операторный подход В последние годы все большее распространение получает еще один способ описания линейных систем, опирающийся на язык функциональ- ного анализа. Рассмотрим непрерывную открытую систему х = Ах + Ви, а:(0) = 0, п у = Сх при нулевых начальных условиях и отсутствии ошибок на выходе w = 0. Тогда сигнал на выходе (у) линейно зависит от сигнала на входе (и): У = Си, (1.23) где £ — некоторый линейный оператор, действующий в соответствую- щих пространствах функций. В данном случае, в соответствии с форму- лой (1.3), этот оператор является линейным интегральным оператором и имеет явное выражение t t y(t) = j CeAtt~T)Bu(r)dr = f h(t - т)и(т)<1т-, (1-24) о о функция h(t) называется (матричной) весовой функцией системы, см. ниже, в п. 1.4. Однако можно рассматривать и более общие линейные операторы С (1.23), задающие соответствие входа и выхода; при этом система не обязательно приводима к виду (1.22). На такие операторы следует наложить естественные ограничения, например, требование при- чинности-. значение выхода y(t) в момент t не может зависеть от значений входа и(т) в будущем, при т > t. Очень важно также, чтобы оператор С был ограниченным. Чтобы строго определить это понятие, нам нужно ввести функциональные пространства, в которых определены сигналы, и нормы в них. 1.3.1. Нормы сигналов Будем считать, что все сигналы определены на полуоси 0 < t < ос. Основные пространства, с которыми придется иметь дело, следующие. 1) L2 — пространство ограниченных с квадратом функций, в котором рассматриваются измеримые функции u(t), заданные на 0 < t < со и
। з Операторный подход 27 имеющие ограниченную 2-норму: / оо Л 1/2 ||и||2 = I УI < оо. (1-25) \о / Здесь |и(0|г — евклидова норма вектора u(t) G Rm. Во многих фи- зических приложениях ||u(t)||2 означает энергию сигнала, поэтому £2 — пространство сигналов ограниченной энергии. Отметим, что если и € £2, то из конечности интеграла в (1.25) следует u(t) —► 0 при t -+ оо. По- этому, например, функция u(t) = 1 не принадлежит L?, равно как и функция u(t) = sinwt при любом и / 0. 2) f-oo — пространство существенно ограниченных функций. В него входят измеримые функции u(t) с ограниченной оо-нормой: Ihlloo = sup |ti(t)| < ОО, 0^t<oo гае |u(t)| — какая-нибудь векторная норма в R"1 (как правило, это оо- или 2-норма). Заметим, что более правильно было бы писать ||и||оо = ess sup O^tCoo me css sup — существенная верхняя грань функции, получающаяся при пренебрежении множествами нулевой меры. Мы, однако, будем считать, что функция u(t) уже изменена на множестве нулевой меры так, что величина sup|u(t)| оказалась минимальной. Например, вместо u(t) = 0, t / 1, u(L) = 1, мы рассматриваем эквивалентную ей u(t) = 0; для обеих функций ЦиЦоо = 0. Обычно ||иЦоо измеряет интенсивность сигнала, так что £«, — про- странство сигналов ограниченной интенсивности. Функции u(t) = 1 и «(О = smut принадлежат £<», однако ... ( l/ta 0 «U 1 _ «(t) [ о f > 1 ’ 0 <а < V2> не принадлежит £«> (она не ограничена), но принадлежит £2 (||u(t)ll2 = 1/х/Г^2Й). 3) Li — пространство абсолютно интегрируемых функций, для ко- торых ограничена 1-норма: ОО ||u||i = У|u(i)|dt < 00, о
28 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ где также |u(t)| — норма вектора w(t) € Rm (как правило, 1-норма). Функция принадлежит L\ (||u(t)||i = 1/(1 — а)), но не L2 (интеграл от l/t2a расходится в нуле при а > 1/2) или Loo- Рис. 1.2. Пространства Li,Lz,Ьоо Условно соотношение между рассмотренными пространствами можно изобразить в виде диаграммы (см. рис. 1.2). В частности, из ограниченно- сти функции в Li-норме и Loo -норме следует ограниченность в Ь2-норме: 13.2. Нормы операторов Нормы функций дают возможность определить и нормы линейных операторов. Если линейный оператор £ (1.23) переводит функции из Lp в функции из Lq, где p,q = 1,2 или оо (т.е. если Lu G Lq при и G £р), то его (р,д)-индуцированная норма равна Н/Ч1 • и/* и ||£||p,g = sup .. = sup ||£u||g. 1Ы1р/о ll«llp ||u||Pci (1.26) Заметим, что аналогичным образом определяются и индуцированные нор- мы для матриц (см. Приложение, п. 5). Некоторые из операторных норм особенно важны; в частности, случаи p = q = 2np = q = oo. Мы увидим в дальнейшем, как вычисляются эти нормы через передаточные функции системы. Так, мы покажем, что ||£||2,2 = II H(s)||oo,
11/(01 < / |7i(t-T)||u(-r)|dr 13. Операторный подход 29 гае ||Я(в)||оо означает Ноо-норму передаточной функции системы (см. ниже). Можно вычислять норму оператора и с помощью весовой функции, т.е. представления (1.24). Несколько забегая вперед, рассмотрим про- стейший пример. Пусть (1.22) — устойчивая система (подробнее см. гл. 3) с одним входом и одним выходом. Тогда ее весовая функция h(t) = CeAtB е Llt оо так как |Сел‘В| const-e-CTt, а > 0, и поэтому f |СеЛгB\dt < оо. Пока- о жем, что имеет место формула для оператора С, задающего систему (1.24): ||£||1 = ||£||оо,оо — ll^lli- (1-27) Действительно, для ||u||oo 1 имеем Вии!® t i \h(t — r)|dr < ||/i||i, о о поэтому ||y||oo ll^lli- С другой стороны, зафиксировав t и взяв uq(t) = sign h(t — т) при и uo(r) = 0 при r > t, имеем t t oo j/(t) = У h(t — т)ио(т)<1т = J" \h(t — r)\dT = — J \h(r)\dr. 0 0 t Отсюда следует, что y(t) сколь угодно близко к ||/i||i при больших t, т.е. sup|y(t)l = ||Л||1- । Норма оператора является мерой того, насколько он «усиливает» вход- ные сигналы, измеряемые в соответствующей норме. Обычно желательно выбрать управление так, чтобы эта норма была по возможности мала; это означает, что выход системы будет мал при любых возмущениях, ограни- ченных в соответствующей норме. Аналогичные пространства и нормы вводятся для дискретного случая. Здесь нужно рассматривать не функции y(t) на [0, оо), а последователь- ности уо, У1,..., уг,..., где уг е йг. Для них вводятся пространства 1Р, и нормы в них определяются следующим образом: / оо \ 1)/-2; ||у||2 = (52|з/г|г I > \г=0 / О ^оо: ЦуНоо = SUp |у;|, 0^г<оо
30 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ оо W IMi = J>l- i=0 Например, если yi = 1 или = sign (-1)’, то у G 1^, но у $ 12, у $ li, а для у{ - 1/(г + 1)° будет у G 1Х при любом а > 0, у G 12 при а > 1/2, у G Zi при а > 1. Для линейного оператора £, переводящего последовательности в по- следовательности (у = Си), можно аналогично определить индуцирован- ные нормы. Если Z3: Zp —> lq, то его (р,д)-индуцированная норма равна ||£||p,q SUp ||£u||g. |МР<1 Например, если рассмотреть оператор, задаваемый линейным разностным уравнением (1.4) при w = 0, х0 = 0: хк — Axk~i yk = Cxk, то в соответствии с формулой (1.6) к-1 к-1 ук = = ^hk-iUi. Здесь hk_i = CAk~i~1B является весовой функцией дискретной си- стемы (1.28). Это соотношение задает линейный оператор С, переводя- щий входные последовательности и в выходные у. Можно показать, что если А дискретно устойчива (|Aj| < 1 для всех собственных значений А), то оператор С ограничен в (оо, оо)-ицдуцированной норме и имеет место факт, аналогичный (1.27). Именно, для системы с одним входом и одним выходом при устойчивой А справедлива оценка ||£||йО,со ” SUp lll/Hoo ~ ll^lll- (Е29) Ihllood Доказательство проводится так же, как и в непрерывном случае. Более подробно оценки норм линейных операторов, соответствующих непрерывным и дискретным системам управления, будут рассмотрены ниже. 1.3.3. Нормы передаточных функций Нам понадобится еще один вид норм — не для функций от времени, а для передаточных функций. Пусть М(з) — матрица п х п, элементы которой являются аналитическими функциями комплексной переменной s в правой полуплоскости.
j.3. Операторный подход 31 Определим Н^-норму этой функции как ЦМЦоо = sup ||M(s)||2 = sup ||M(ja>)||2, (1.30) Res^O —oo<w<oo где ||Лф) || 2 означает спектральную норму фиксированной матрицы M(s) (см. Приложение, п. 5): ||M(s)||2 = (Araax(M*(s)M(s)))1/2. Второе равенство в (1.30) (супремум достаточно искать не по всей правой полуплоскости, а лишь по ее границе — мнимой оси) следует из принципа максимума для аналитических функций. В частном случае, когда М (s) — скалярная функция (n = 1), определение Д»-нормы приобретает вид ||1И||оо= sup |ЛД/ш)|. —oo<u><oo Например, для M(s) = -1- (1.31) s +1 (эта функция имеет единственный полюс в s = — 1 и потому аналитична в правой полуплоскости) получаем В дальнейшем мы познакомимся с различными способами вычисления 11ЛГЦхх) в многомерном случае. Оказывается, если наша система записана с помощью передаточных функций, т.е. исходная система (1.22) х = Ах + Ви, х(0) = 0, у = Сх записана в форме у = H(s)u, H(s) = C(sl - А)-1 Д (1.32) то при условии, что А устойчива, имеем 1Ы1г =% ||ДГ(з)||оо||«||2, (1-33) ГДе индекс 2 для функций означает 2-норму, а ||Д(з)||оо означает Ноо- норму, которая (в предположении устойчивости А) является конечной.
32 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ Более того, Нж-норма является точной верхней границей отношения энергий выход/вход: Лемма 1.1. Для системы (1.32) с устойчивой А справедливо ||JT(s)||00 — sup ~ - = ||£||2,2) ||«||а#о ||«||2 (1.34) где С — входо-выходной оператор, соответствующий системе (1.32). Этот результат доказывается с помощью теоремы Парсеваля и тре- бует знания свойств преобразования Лапласа, поэтому мы не приводим доказательства. Таким образом, -норма передаточной функции приобретает про- стой физический смысл — она показывает, во сколько раз может изме- ниться энергия сигнала при прохождении через данную линейную систему. Если вспомнить, что другая трактовка передаточной функции характери- зовала H(jw) как коэффициент усиления системы для гармонического входа заданной частоты ш, то мы получаем, сравнивая формулы (1.19) и (1.34), что Hoo-норма является также равномерно-частотной характе- ристикой системы. Эти два результата относительно двух типов входных сигналов (ограниченные в 2-норме и гармонические с произвольной ча- стотой) различны, так как гармонические сигналы (см. выше) не принад- лежат L-2- Другая норма, которую можно ввести для тех же матричных функций Af(s), — это Н^-норма: В частности, для скалярных функций определение принимает вид / оо \М2 ||М||2 = I У |M(»|2dw ) . \— оо / В примере (1.31) имеем Все вышеприведенные понятия и результаты имеют дискретные ана- логи. В этом случае вместо матриц M(s), аналитичных в правой по-
1.3. Операторный подход 33 луплоскости, фигурируют матрицы M(z), аналитические внутри единич- ного круга. Hoo-норма таких матричных функций равна ||М||оо = sup ||Af(z)||2 = sup ||M(e?u')||2 = |z|$l 0^<2тг / \ 1/2 sup (Amax(M‘(^)M(^))) , а для скалярных функций IIM Iloo = sup |M(ejiu')|. Для системы xk - Ахк-1 + Buk-i, yk — H(z)uk, H(z) = zC(I - zA)~lB, yk = Cxk с устойчивой А справедливо соотношение (аналогичное лемме 1.1) и Нгх -норма передаточной функции дискретных систем приобретает тот же физический смысл, что и для непрерывных систем. Сходным образом справедлив и аналог соотношения (1.29) для дис- кретных систем. Именно, пусть система описывается с помощью устой- чивой передаточной функции yk = H(z)uk, H(z)=^, (1.36) p(z) me g(z) и p(z) — полиномы, и p(z) не имеет корней внутри единичного круга (т. е. дискретно устойчив). В этом случае функция H(z) аналитична внутри единичного круга и представима там в виде абсолютно сходящегося бесконечного ряда: ОО H(z) = ho + h\z |Л»| < сю. г=0 Определим Hi-норму передаточной функции H(z) следующим образом: ОО ||Я(2)||1 = ]Г|/4 (1.37) 1=0 2. В.Т. Поляк, П.С. Щербаков
34 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ Тогда для выхода у системы (1.36) и любого входа и, ограниченного в 1Ж, справедлива оценка ||3/||оо ll^(z)||1||и||оо> (1.38) причем существует такой вход, что равенство в (1.38) достигается. Сопутствующие функции Matlab: norm — вычисление матричных и векторных норм; norm (CST), normhinf (RCT), h2norm (/г AST), hint norm (/rAST) —вы- числение различных норм передаточных функций. 1.4. Одномерные системы Особо важный (и простой) случай представляют системы, у которых скалярный вход и скалярный выход. Мы будем называть их одномерными, в отличие от общего многомерного случая. Раньше говорили обычно об односвязных и многосвязных системах. На Западе общеупотребительны термины SISO (Single-Input, Single-Output) и MIMO (Multi-Input, Multi- Output), т. е. системы с одним входом — одним выходом и с многими входами — многими выходами соответственно. На примере одномерных систем рассмотрим способы описания, приве- денные в предыдущих параграфах (а также обсудим так называемое входо- выходное описание во временной области), и их соотношения и приведем общепринятую терминологию, используемую в инженерной практике. Рассмотрим’ сначала задание одномерных систем в пространстве со- стояний. Пусть х = Ах + Ви, У = Сх, (1.39) где u(t) е R1, y{t) е R1, x(t) е Rn. Тогда В и Ст — векторы из R”, а передаточная функция Hyu{s) = Я(з) = C(sl - А)-1 В — скалярная функция от з. Для удобства перепишем (1.39) в виде Перейдем от записи в пространстве состояний к описанию в виде одного соотношения, связывающего вход и с выходом у напрямую, без использования понятия состояния. С этой целью продифференцируем п раз второе уравнение в (1.40), подставляя выражение для х из первого
1.4. Одномерные системы 35 уравнения. В результате получим т у = С1Х, у — стАх + стЬи, у = стА2х + стАЬи + стЬй, yW = cTAkx + cTAk~1bu + cTAk~2bii +... + cTbu^k~1\ у(п) сгАпх + стАп~1Ьи + сгАп~2Ьй + ... + сгАп~кЬи^к’~1^+... + стЪи<-п~1\ Сложим уравнения, предварительно умножив первое на а$, второе — на аь и т.д., последнее — на единицу, где а, — коэффициенты ха- рактеристического полинома матрицы А. По теореме Кэли-Гамильтона (теорема П.1 из Приложения), матрица удовлетворяет своему характери- стическому уравнению, поэтому члены с х в правой части исчезнут; в результате приходим к обыкновенному дифференциальному уравнению п-го порядка относительно входного и выходного сигналов: t/(n) + +... + сцу + аоу = 0n-iu(n~^ +... + Д й + /Зои, (1-41) гае /Зк=ст^Лп к 1+an-iAn к 2 +... + йк+ъА + afc+iJ^b, к = 0,... ,п - 1. Вспомним, что мы ввели оператор дифференцирования s (1.7); с его по- мощью (1.41) записывается в компактной форме p(s)y = Q(s)u, P(s) = y'akS1', an = 1, Q(s) = V0ksk, k=0 fc=O или У = H(s)u, = *\s) Ute передаточная функция H(s) — скалярная дробно-рациональная (в от- личие от общего многомерного случая), а ее знаменатель — полином р(з) = det (si — А) — является характеристическим полиномом нашей системы. Если P(s) устойчив (т. е. все его корни лежат в левой полуплос- кости), то передаточная функция аналитична в правой полуплоскости. 2*
36 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ В и. 1.2 мы уже говорили, что всегда предполагается выполненным условие реализуемости — степень т полинома в числителе передаточной функции не превосходит степени п полинома в знаменателе. В (1.41) это условие выполнено: т С п - 1. Итак, система в пространстве состояний сведена к эквивалентной за- писи на языке передаточных функций. Обратно, пусть теперь доступно описание в форме одного дифференциального уравнения n-го порядка, т. е. исходным является описание с помощью передаточной функции. То- гда, действуя в «обратном порядке», такое дифференциальное уравнение y(n) + + ... + сцу + аоу = + ... 4- Дй + /30и, п т, (1.42) можно привести к эквивалентной записи в пространстве состояний. На- пример, пусть в уравнение (1.42) входит лишь входной сигнал, но не его производные: у(п) +ап_1у(”_1) + ... +а^у + аоу = и, (1.43) или в операторной записи Р(з)у = и, P(s) = sn + an_isn-1 + ... + ais + a0. Вводя новые переменные Xt — состояния — по правилам XI = у, х2=у, ..., хп = у{п 1}, с учетом (1.43) получим х\=х2, ±2 = хз, ..., хп =-aoXi - aix2 — — ап-!Хп+и, или х = Ах + Ьи, т У = С X — реализацию в пространсте состояний с (1.44) ст = (10 ... 0).
I 4. Одномерные системы 37 Нетрудно проверить, что для матрицы А (1.44) det (si — Л) = Р(з) — характеристический полином нашей системы. Отметим, что (1.44) (с вектором с произвольного вида) — так назы- ваемая каноническая управляемая форма записи системы в пространстве состояний (при этом говорят, что матрица А приведена к фробениусо- вой форме, см. Приложение, пп. 6.3 и 6.6). Оказывается, линейными заменами переменных при некоторых предположениях можно привести исходную систему (1.42) к такому виду (см. лемму П.П из Приложения). Рассмотрим коротко еще один способ входо-выходного описания, ко- торый основан на предположении, что известна реакция системы на «ти- повой» входной сигнал. Например, пусть 5(t) обозначает 5-функцию; определим функцию h(t) в момент времени t как значение выхода си- стемы в момент времени t, если на вход в момент t = 0 была подана 6- функция, а начальное состояние — нулевое. Назовем h(t) импульсной ха- рактеристикой системы (иногда ее называют весовой функцией системы). Тогда для произвольного входа u(t) получаем соотношение г y(t) = У Zi(r)u(t — т)с?т; (1.45) ‘ ‘ ’ : о это и есть желаемое входо-выходное описание системы; его вид проясняет название функции h(t) — весовая. Выражение (1.45) для y(t) предста- вляет собой свертку функций h(t) и ц(£); для нее используют обозначение у = h * и. Мы уже встречались с формулой (1.45) для систем, описывае- мых в пространстве состояний (см. (1.24)). В качестве другого типового входного сигнала часто рассматривается единичный скачок (функция Хевисайда): _ J 0 ПРИ 4 < °- ' (1 при t 0. Реакцию системы (при нулевых начальных условиях) на такое входное воздействие называют переходной характеристикой тг(£) (переходной функцией); она связана с импульсной характеристикой следующим обра- зом: " ; : S л t 7r(t) = У h(r)dT. Способ описания систем, основанный на использовании весовой или переходной функций, часто применяется при моделировании сложных физических устройств неизвестной структуры, а указанные характери- стики снимаются экспериментально.
38 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ При таком описании (как и при описании в форме дифференциального уравнения (1.42)) говорят, что входо-выходные соотношения заданы во временной области. Часто удобнее бывает перейти в частотную область, используя преобразование Лапласа: ОО о которое определено для функций, растущих не быстрее экспоненты: |/(t)| < Cest. Термин «частотный» объясняется тем, что поскольку st — безразмерная величина, то s имеет смысл частоты (см. п. 1.2). Функция f(t) называется оригиналом, a F(s) —ее изображением по Лапласу. Из определения следует, что при /(0) = 0 L{^} = sL{/(t)}, l at J т.е. дифференцированию оригинала соответствует умножение изображе- ния на з — вспомним введенный формально оператор дифференцирова- ния s = d/dt (1.7). Наконец, нетрудно видеть, что для свертки справед- ливо L{/*p} = L{/} -ВД- Таким образом, в частотной области уравнение (1.45) приобретает вид y = H(s)u, H(s) = L{A(t)}, где Я(з) — передаточная функция, определенная в п. 1.2. Отметим, что с помощью (1.45) можно описать гораздо более широкий класс линейных систем, чем с помощью дифференциального уравнения — второй способ по определению накладывает ограничения на структуру системы. В самом деле, не всякой импульсной характеристике отвечает дробно-рациональная передаточная функция, например, для системы с запаздыванием p(t) = u(t—1) имеем h(t) = 5(t — 1) и H(s) = е~я; в таких случаях говорят о распределенных системах. Мы будем рассматривать только дробно-рациональные передаточные функции, что соответствует конечномерным системам. В многомерном (MIM0) случае импульсная характеристика стано- вится матричной импульсной характеристикой — матрицей I х т, эле- мент (г, к) которой есть функция — отклик г-го выхода системы в момент времени t на единичный импульс, поданный на к-й вход в мо- мент t = 0 (импульсная характеристика пары (г, к)).
1 4. Одномерные системы 39 Аналогичным образом входо-выходное описание вводится для дис- кретных систем; аппаратом перехода в частотную область является дис- кретное преобразование Лапласа: ОО = = m (1-46) fc=O обладающее теми же свойствами, что и непрерывное*. Мы видим, что все формы записи — в пространстве состояний, в виде входо-выходных соотношений во временной области, с помощью переда- точных функций (в частотной области) — в определенной степени экви- валентны. Использование того или иного способа описания при решении конкретной задачи — вопрос удобства. Закончим этот параграф кратким обзором классических частотных методов исследования одномерных систем. В инженерных приложениях различным физическим устройствам — звеньям — соответствуют так на- зываемые типовые передаточные функции; они имеют специальные на- звания. Звено с передаточной функцией называется апериодическим (инерционным), при этом к = Н(0) > 0 — коэффициент усиления, а Т > 0 — постоянная времени. Передаточная функция Я(5) = T^ + Tts + l’ k> °’ отвечает апериодическому звену второго порядка при Tj > 2Тг > 0 (тогда корни характеристического полинома 1 + Tjs + Т^з2 вещественны) и колебательному звену при 0 < Т\ < 22г (случай комплексных корней). Простейший элемент с H(s) =k, к > О, называется идеальным интегратором, а с Н(з) = к — идеальным усилителем. 00 Обычно дискретное преобразование Лапласа записывают как Z{/t} — при и™ к=0 «ом z имеет смысл оператора сдвига вперед: если же под z понимать оператор сдвига назад (см. определение z в п. 1.2), то приходим к записи (1.46).
40 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ (И) Рис. 1.3. Частотные характеристики типовых звеньев (IV) Для приведенных выше простых звеньев легко нарисовать и их ча- стотные характеристики H(jw). На рис. 1.3 показаны H(jw) для апери- одического звена первого (I) и второго (II) порядка, для колебательного звена (III) и интегратора (IV). Часто удобно отдельно рисовать амплитуду и фазу частотной характе- ристики (вспомним их физический смысл, описанный в п. 1.2, как реак- ции системы на гармоническое воздействие). Функция А(о>) = |H(jw)| называется амплитудной частотной характеристикой, она дает коэф- фициент усиления устойчивой линейной системы на входной сигнал час- тоты со. Функция <р(со) = argH(jco) называется фазовой частотной характеристикой, она характеризует сдвиг по фазе входа и выхода. Наконец, во многих случаях удобно применять логарифмические ча- стотные характеристики (диаграммы Боде), когда величины A(w) и ср(со)
1.4- Одномерные системы 41 Gm = 3.1302 dB (at 0.22996 rad/s), Pm = 49.68 deg (at 0.15801 rad/s) Рис. 1.4. Диаграммы Боде откладываются в логарифмической шкале. Именно, величина Lm(w) = 20 log А(си) называется логарифмической амплитудной характеристикой (ЛАХ); она измеряется в децибелах. Дело в том, что, как мы видели в п. 1.2, при последовательном соединении элементов их передаточные функции пе- ремножаются. Поэтому Я(з) = Я!(з)...Ят(з), |Я(^)| = |Я1(»|---|Ят(^)|, A(w) = Ai(w) Ат(ш), Lm(w) == Lmi(w) + ... + Ьтт{ш), т.е. логарифмические амплитудные характеристики при таком соедине- нии складываются. При построении ЛАХ по оси абсцисс откладывается частота ш в логарифмической шкале; единицей измерения при этом явля- ется декада — отрезок, на котором частота увеличивается в 10 раз. По оси ординат откладывается величина Lm(w), единицей измерения кото- рой является децибел. Точка пересечения ЛАХ с осью абсцисс называется частотой среза шс, т. е. 201og|ff(jo>c)| = 0, |Я0'о/с)| = 1.
42 Глава I. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ При построении логарифмической фазовой характеристики (ЛФХ) по оси абсцисс откладывается частота ш в декадах (т. е. в логарифмической шкале), а по оси ординат — утлы <р в градусах в равномерной шкапе. На рис. 1.4 показаны ЛАХ и ЛФХ системы, построенные с помощью процедуры bode (CST) системы Matlab. Частотная теория одномерных систем представляет собой хорошо раз- работанный раздел теории управления со своей терминологией и мето- дами. Мы не будем подробно заниматься этой техникой, а уделим больше внимания многомерным системам. Сопутствующие функщщ Matlab: canon (CST) — приведение системы к канонической управляемой форме; compan — матрица Фробениуса для данного полинома; polyvalm — вычисление полинома от матрицы; impulse (CST) — построение импульсной характеристики системы; step (CST) — построение переходной характеристики системы; Isim (CST) — расчет отклика системы на произвольный входной сигнал; conv — свертка; laplace, ilaplace; ztrans, iztrans (SMT) — прямые и обратные непрерывное и дискретное преобразования Лапласа; bode (CST) — вычисление ЛАХ, ЛФХ и частоты среза (построение диа- граммы Боде). 1.5. Выводы • Под описанием системы в пространстве состояний понимаем век- торное дифференциальное уравнение x(t) = Ax(t) + Bu(t) + Diw(t), t > О, y{t) = Cx[t) + D2w(t), с постоянными матричными коэффициентами A,B,C,Di,D2, где x(t) € Rn — состояние системы, u(t) e Rm — управление, y(t) e R1 — выход системы, w(t) € RTO1 —< внешние сигналы (возмущения) или задающие воздействия. При отсутствии управления система называется открытой; явный вид решения открытой системы: t x(t) = елгх(0) + у* ел^~г) о где т(0)—начальное состояние. Аналогичное описание вводится для дискретных систем: xt = Axk-i + Buk-i + DiWk-i, к > О, ук = Схк + D2wk;
|.5 ВЫ»' ; 43 д.и»дй вид решения открытой системы: fe-i хк ~ Акх° + DiWi. i=0 • Под описанием системы с помощью передаточных функций (описа- ние в частотной области) понимают запись у = Hy^(s^u -J- да H„u(s) и Hyw(s)— матрицы соответствующих размерностей, эле- менты которых есть дробно-рациональные функции от комплексной пе- ременной я, причем предполагается выполненным условие реализуемо- сти: степень полинома в числителе не превышает степени полинома в знаменателе. В этом случае существуют эквивалентные записи системы в пространстве состояний — реализации передаточной функции; те из них, которые имеют минимальную размерность матрицы А (степень Мак- Миллана), называются минимальными реализациями. Общий знаменатель элементов матричной передаточной функции на- зывается характеристическим полиномом системы; его корни— полюса передаточной функции. Если непрерывная система задана в пространстве состояний, то передаточные функции выписываются явно через матрицы системы: H„u(s) = C(sl - А)-1 В, Hyw(s) = C(sl - A)~lDi + D2, а характеристический полином равен det (si — A). Если fl(s)— передаточная функция системы, то H(jw) называется частотной характеристикой; ее физический смысл — изменение ампли- туды гармонического входного сигнала частоты и> в раз (при этом |//(дц)| называют коэффициентом усиления) и сдвиг его по фазе на argHQui). • При операторном описании выход линейной системы связывается со входом посредством линейного оператора £: У = Си, Действующего из нормированного пространства сигналов (функций) Lp Э л в пространство Lq Э у; рассматриваются значения р, q — 1,2, оо. Нормы сигналов определяют (р, д)-ивдуцированные нормы операторов: 11^'11р><? ~ SUP IKuIU- Естественно требовать ограниченности операторной нормы, тоща выход соответствующей системы будет ограниченным при любых ограниченных
44 Глава 1. ОПИСАНИЕ ЛИНЕЙНЫХ СИСТЕМ входах. В частотной области оператор £ приобретает смысл передаточ- ной функции системы; для нее также требуется ограниченность в какой- либо Н-норме: в непрерывном случае используются Д»-норма, определя- емая (1.30), и Д-норма (1.35). Аналогичные пространства сигналов 1Р и нормы операторов и передаточных функций вводятся для дискретных си- стем, для которых, кроме того, часто используют Д-норму передаточной функции, определяемую с помощью (1.37). • Задание одномерной системы первого порядка (1.40) в пространстве состояний эквивалентно записи в виде одного дифференциального уравне- ния высокого порядка относительно входа и и выхода у: P(s)y = Q(s)u, где Q(s),P(s) — полиномы от оператора дифференцирования (deg Q С deg Р), или, иначе, записи с помощью передаточных функций у = H(s')u, H(s) = Q(s)/P(s). При определенных условиях одномерная система в пространстве состояний приводится линейной заменой переменных к ка- нонической управляемой форме (1.44); при этом говорят о фробениусовой форме матрицы А. • Реакцию одномерной системы на входной единичный импульс (й-функцию) называют весовой функцией, а реакцию на единичную сту- пенчатую функцию (функцию Хевисайда) — переходной функцией. • В инженерной практике простейшие физические устройства назы- вают звеньями; им соответствуют типовые передаточные функции. Напри- мер, звено с передаточной функцией к Ts + \ называется апериодическим или инерционным, при этом к = Н(0) > 0 — коэффициент усиления, а Т > 0 — постоянная времени.
Глава 2 ВИДЫ УПРАВЛЕНИЯ Предыдущая глава была посвящена описанию открытых систем, в ко- торых управление либо отсутствует, либо уже выбрано. В настоящей главе обсуждаются способы задания управления в замкнутых системах. 2.1. Программное управление. Управляемость Вернемся к общей линейной модели системы х = Ax + Bu + Dxw, у = Cx + D2w и попробуем ответить на вопрос: в каком виде ищется управление и в данной модели? В этом параграфе обсуждается способ выбора управления как функции от времени, т.е. в виде u(t). Такой способ выбора назы- вается программным управлением', на первый взгляд он представляется наиболее естественным. Здесь, прежде всего, следует уточнить, в каком классе ищутся функ- ции u(t) и какие на них накладываются ограничения. Так, управления могут быть либо гладкими, либо непрерывными, либо произвольными из- меримыми функциями времени. Чаще всего задача ставится именно в последней формулировке, т. е. допускаются и разрывные управления. Од- нако нередко оказывается, что доя некоторых задач оптимальное упра- вление достигается на дифференцируемых функциях от времени. Кроме того, на класс управлений обычно накладываются дополнительные усло- вия типа ограниченности управлений. Типичным является условие u(t) е U для всех t G [О, Т], где U — заданное замкнутое ограниченное множество в Rm. Другим типом ограничений являются интегральные, например J(u) = J \u(t)\2dt < с2, (2.2) ^^111’' ° где Т — заданная длительность процесса управления.
46 Глава 2. ВИДЫ УПРАВЛЕНИЯ После выбора программного управления и подстановки его в систе- му (2.1) мы получаем систему обыкновенных дифференциальных урав- нений, в которых фигурируют лишь внешние воздействия. Например, уравнение состояния приобретает вид i = Ax + wt, Wi(t) = Bu(t) + и если ж(0), A,B,Di и w(t) известны, то x(t) может быть рассчитано по формуле t x(t) = e4fx(0) + J eA^~T^wi(T)dr о для всех значений t. Подчеркнем, что для этого требуется знание всех указанных выше величин. Разумеется, программное управление может применяться и в дискрет- ных системах (ufc выбирается заранее как функция от к)-, никаких прин- ципиально новых моментов при этом не возникает. Используем программное управление для анализа важного понятия управляемости; именно, система х = Ах + Ви, х€Й", (2.3) называется управляемой, если для любого конечного х(0) и 0 < Т < оо найдется такое ограниченное кусочно-непрерывное u(t) на интервале [О, Т], что решение системы (2.3) принимает нулевое значение в мо- мент Т. Иначе говоря, в управляемой системе начальное отклонение может быть устранено за (любое) конечное время. Очевидно, что, поменяв направление времени, мы получим, что упра- вляемая система переходит из х(0) = 0 в любое заданное х(Т). Более общо: система управляема, если для любых x0,zi ей" и любого Т > О найдется управление u(t) переводящее систему из х(0) = хо в х(Т) = Xj. Часто в литературе такие системы называют вполне управляемыми, но мы будем пользоваться более простой терминологией. Трудность задачи состоит в том, что обычно количество управляю- щих воздействий (размерность m пространства управлений) меньше ко- личества управляемых величин (размерности п пространства состояний), однако она разрешается следующим образом. Пара матриц (А, В) называется невырожденной (управляемой) парой, если ранг матрицы U — [В АВ ... Ап~1В] равен п. Матрица U называется матрицей управляемости.
47 2 I Ito’ip.iMMHoe управление. Управляемость Мат рица U составлена из п блоков, каждый из которых — матрица п х тп, т. е. в целом U — матрица п х пт. Например, если т = 1 (система с одним входом), В = b € R”, то U — матрица п х п, столбцы которой являются векторами b,АЬ,ДП-1Ь, и пара (А,6) управляема, если эти векторы линейно независимы (ср. лемма П.8 из Приложения). Следу- ющая теорема дает конструктивное необходимое и достаточное условие управляемости; другие, также полезные условия сформулированы в При- ложении (теорема П.З). Теорема 2.1 (управляемость). Система (2.3) управляема тогда и только тогда, когда пара (А, В) невырождена. Доказательство. Необходимость. Пусть rank U < п. Тоща найдется вектор v 6 Rn, v / 0, такой, что VхВ = vTAB = ... = vTAn~1B = 0. По теореме Кэли-Гамильтона (теорема П.1 из Приложения) матрица А удовлетворяет своему характеристическому уравнению AiA + an_jXn 1 + ... + o,qI = 0, откуда итАпВ = -an_iuTЛ”"1 В - ... - aovTB — 0. Умножая последнее равенство на к = 1,2,..., получим, что vTAmB = 0 и для всех т = п +1, п + 2,... Но тогда vTe~ArB = vT(j - Ar + ^А2т2 - .. .^B = 0. С другой стороны, решение системы (2.3) имеет вид (1.3) т / т \ eA(T~r') Bu(r)dr = еАТ I ж(0) + У e~ATBu(r)dr j , о \ о / поэтому для х(Т) = 0 имеем ШкШя' Т ' Г 0 = цта:(0) + ИВ : : о < Для любого управления и(т). Ясно, что равенство цтш(0) = 0 не может выполняться при произвольных х(0) (например, при ж(0) = v). Достаточность. Мы укажем конкретный вид управления, которое переводит систему из х(0) = xq в х(Т) = 0. Именно, возьмем u*(t) = ВТеАГ^Т~^о, х(Т) = еАТх(0) + vTe ATBu(r)dr = итх(0)
48 Глава 2. ВИДЫ УПРАВЛЕНИЯ где вектор v подлежит выбору из условия ж(Т) = 0, я(0) — Хо, т. е. f т О = еАТхо + У еА<т~т^ Bu*(r)vdr = о (т \ JеА(т-^ВВтеА^т-гЫт\ v. о / Покажем, что матрица т Т Ж(Т) = У eA{T-T}BBTeAT(-T-r)dT = j еАгВВтеАГЧт (2.4) о о невырождена (она называется грамиан управляемости). Прежде всего, Гт (Wc(T)d,d) = I \dreATB\2dr для любого d е Я”, т.е. эта матрица Jo неотрицательно определена. Если (Wc(T)d,d) = 0 для некоторого d / О, то 9?(т) = </геЛтВ = 0 для всех 0 т Т. Тогда и все производные этой функции равны нулю, и, в частности, <р(0) = </(0) = ... = <Р(П~1} (0) = 0, (0) = dyAkB, т.е. d?AkB = 0, к = 0,1,... ,п - 1. Это означает, что dTU = 0, что противоречит условию rank U = п. Таким образом, И£(Т) > 0, поэтому уравнение ел*хо + Wc(T)v = 0 имеет решение v = -W~\T)eATXQ при любом xq. Тем самым мы нашли управление w*(t) = -ВтелТ(г“4)Игс’’1(Т)елгх0, (2.5) которое переводит систему (2.3) из состояния х(0) = х0 в состояние х(Т) = 0. Сделаем несколько замечаний. Во-первых, если известно, что rank В — г, то условие управляемости уточняется: rank [В АВ ... Ап~гВ] = п. Во-вторых, мы не просто доказали, что найдется управление, кото- рое переводит систему из произвольного начального состояния в начало координат, но указали явно одну такую функцию u*(t). Более того, пред- ложенное управление оказалось гладкой функцией, в то время как в опре- делении управляемости требуется лишь кусочная непрерывность. В-третьих, указанное управление u*(i) к тому же является оптималь- ным по критерию энергии (2.2) среди всех кусочно-непрерывных упра- влений, которые переводят систему из заданного начального состояния в нуль (управление с минимальной энергией), т. е. если u(t) — любое другое
49 2 I. Программное управление. Управляемость допустимое управление, то J(u*) < J(u). Действительно, вычитая друг из ДРУга решения системы при u(t) и при u*(t), получим ИМК т j eA(T~t}B(u(t) - u*(t))dt = О, о откуда, домножив на И^-1(Т)елтхо: т = У (u(t) - BTeA'T(-T-t}W~1(T)eATxodt = о т т u(t) — u*(£)^ u*(t)dt. Поэтому т т J(u) — У |u(t)|2dt — \u(t) — u*(t) +w*(t)|2dt = о о т — У J|u(t) - u*(t)|2 + |u*(t)|2 + 2^u(t) — u*(t)^ u*(t)]dt = 0 T T = У |u(t) — u*(t)|2dt + У |u*(t)|2dt о о T > I |u*(t)|2d« = J(u*). 0 Пользуясь формулами (2.5) и (2.4), нетрудно посчитать и само значение энергии J(u*): / т \ -1 J(u‘) = 4 I У е-АтВВте“лТт<(т ) гг0, \о / откуда видно, что чем меньше время Т процесса, тем большие управления приходится применять, так что ограничение (2.2) может нарушиться.
50 Глава 2. ВИДЫ УПРАВЛЕНИЯ Для произвольных z(0) = х0 и х(Т) = Xi управление, переводящее систему из хд в х\ и минимизирующее функционал энергии (2.2), имеет вид u(t) = -ВтелТ(т-‘)1Ус-1(Г)(еАТя:о - zi); в частности, при хд = 0 получаем u*(t) =ВтеАТ(т-‘)Ж~1(Т>1 (2.6) — управление минимальной энергии, переводящее систему из нуля в за- данное состояние Xi. Аналогичные результаты имеют место для дискретных систем, именно, дискретная система Xk = Axk-i + Buh-i, Xk G R”, Uk € Rm, (2.7) называется управляемой, если для любого хд и некоторого к > 0 найдутся такие ограниченные управления ид,..., Uk-i, которые переводят систему в начало координат: z* = 0. Согласно (1.6) решением системы (2.7) является fc-i Хк = АкХд + »=0 и требование управляемости приобретает форму: для всякого а G R” найдется к > 0 и векторы ид,...,ut-i такие, что к-1 '^Ak-i-1Bui = a. (2.8) i=0 Отсюда вытекает критерий управляемости для дискретных систем. Теорема 2.2. Система (2.7) управляема тогда и только тогда, когда пара (А, В) невырождена. Действительно, взяв к = п, перепишем уравнение (2.8) в виде Uu = а, где обозначено U = [В АВ ... Ап~1В] G Rnxmn и и = (ид ... uJ_i)T G Rmn. Видим, что это уравнение имеет решение при любом а тогда и только тогда, когда ранг матрицы U равен п. Заметим, что в отличие от непрерывных систем дискретное время не может выбираться произвольно — требуется конечное число шагов, чтобы «накопить» ранг матрицы U. Если ранг В больше единицы, то систему можно привести в начало координат за число шагов, меньшее п; в частности, если В невырождена, то мы достигаем цели за один шаг. Подход с точки зрения программного управления допустим, когда нет внешних возмущений (w = 0, и = 0), матрицы А, В, С известны и задан
2 2. Обратная связь по состоянию 51 дАкпторый критерий оптимальности (типа (2.2)). Например, в линейно- квадратичной задаче оптимального управления (см. подробнее в главе 5) т min У ^(Rx,x) + (Su,u)jdt, х(0) = хо, о х = Ах + Ви при известных матрицах А, В, R, S и времени Т можно найти оптималь- ное решение u*(t), 0 t Т. Однако в более общих ситуациях — при наличии неопределенных внешних возмущений или неопределенности в описании системы — применение программного управления может приве- сти к резкому ухудшению качества процесса либо к полной катастрофе. Представим себе, например, процесс управления самолетом, рассчитан- ный заранее, до начала полета, и не предусматривающий использования поступающей текущей информации о скорости ветра, высоте и т. п. Вряд ли кому-нибудь придет в голову управлять самолетом таким образом. Это же относится и к подавляющему большинству иных ситуаций, связанных с управлением производственными процессами, транспортом, системами связи, финансами и т.д. Лишь в очень небольшом числе случаев (рас- чет оптимального режима космического полета или модели, в которых t не играет роль времени, например, расчет оптимальной трассы дороги) решение з виде u(t) является удовлетворительным. В свя >и с этим в данной книге мы почти не будем иметь дела с про- граммным управлением. Ниже будут рассмотрены иные подходы к выбору управления. Сопутствующие функции Matlab. rank — вычисление ранга матрицы; ctrb (CST) — построение матрицы управляемости; gram (CST) — построение грамиана управляемости (и наблюдаемости, см. ниже). 2.2. Обратная связь по состоянию Другой подход к проблеме управления связан с идеей обратной связи. Управление не выбирается заранее, а корректируется в каждый текущий момент на основании информации о состоянии системы. Выбор управления в форме функции от состояния и момента времени называется синтезом управления'. и = <р(х, t). (2.9)
52 Глава 2. ВИДЫ УПРАВЛЕНИЯ Функция <р(х, t), в принципе, может быть нелинейной по г; существуют различные подходы (например динамическое программирование), позво- ляющие решать задачу оптимального синтеза при некоторых постанов- ках задачи оптимального управления. Однако после выбора управления в форме (2.9) уравнение состояния становится нелинейным и нестацио- нарным. Поэтому в данной книге мы ограничимся случаем статической линейной обратной связи по состоянию: и = Кх, (2.10) где матрица усиления К € RTOXn не зависит от t. Оказывается, во многих задачах управления такого типа обеспечивают наилучшее значе- ние критерия оптимальности в классе любых управлений, т.е. переход к нелинейным нестационарным обратным связям не улучшает критерия качества. Подставим управление (2.10) в уравнение (2.1), тогда получим уравне- ние замкнутой системы: х = Асх + Diw, Ас = А + ВК, у = Сх -I- D2W. Таким образом, после замыкания системы обратной связью вида (2.10) мы опять получаем линейное уравнение состояния, но уже с измененной матрицей состояния Ас = А+ВК. В дальнейшем мы покажем (гл. 4), что за счет выбора матрицы усиления К можно улучшить свойства системы, например, сделать матрицу устойчивой, тогда как А таковой не является. Управления вида (2.10) называются линейными регуляторами. Боль- шинство используемых на практике регуляторов являются именно линей- ными; они легко реализуются технически. Отметим, что возможности линейных регуляторов в некоторых отно- шениях ограничены. Так, линейный регулятор в системе без возмущений х = Ах + Ви не может устранить начальное отклонение за конечное время, т. е. не может перевести систему из х(0) 0 в начало координат за конечное время даже при выполнении условия управляемости. Действи- тельно, из уравнения замкнутой системы х = Асх и условия х(Т) = 0 следует, что x(t) = 0, поэтому то управление, которое выбиралось выше при доказательстве теоремы 2.1 об управляемости, не было стационарной обратной связью. В дискретных системах линейная обратная связь имеет вид uk = Kxk и уравнения замкнутой системы приобретают вид xk = Acxk-i + .DiWfc-i, Ас = А + ВК, у к = Cxk + D2Wk.
2 3- Обратная связь по выходу. Наблюдаемость 53 Таким образом, матрица состояний Ас замкнутой дискретной системы пересчитывается по той же формуле, что и в непрерывном случае. 2,3. Обратная связь по выходу. Наблюдаемость Состояние системы не всегда доступно измерению; часто единственная информация о системе предоставляется ее выходом у. Попытка построить регулятор в форме статической линейной обратной связи по выходу и = Ку, где К — матрица т х I, как правило, бывает неудовлетворительной; обычно систему даже не удается сделать устойчивой с помощью упра- влений такого вида. Например, если система х = Ах + Ви, у = Сх — одномерная, т.е. и,у & R1, то К = к — скалярная величина и матрица замкнутой системы имеет вид А + ВКС — А + кВС. Нетрудно построить пример неустойчивой матрицы А и матрицы ВС такой, что их линейная комбинация А + кВС неустойчива при всех значениях коэффициента к. Иными словами, мы имеем слишком мало возможностей воздействовать на систему. Поэтому обычно поступают иначе. Например, в простейшей ситуации без внешних возмущений х = Ах + Ви, У = Сх мграьтение ищется в виде, аналогичном обратной связи по состоянию: и = Кх, но геперь вместо неизвестного состояния х берется его оценка х по на- блюдаемым значениям выхода системы. Прежде чем переходить к конкретным способам построения оценок x(t), обсудим принципиальную возможность восстановления состояния по выходу. Для этого рассмотрим еще более простую ситуацию — открытую систему с выходом: Система (2.11) называется ненаблюдаемой, если разным траекториям могут отвечать одинаковые выходы, т. е. найдутся такие х0 / х'о, что для соответствующих траекторий х,х' и выходов у, у1 будет у = у'. В про- тивном случае система называется наблюдаемой. Мы покажем, что если система наблюдаема, то можно точно восстано- вигь -качение x(t) по значениям y(t),y(t),... ,y^n~^(t), т.е. достаточно
54 Глава 2. ВИДЫ УПРАВЛЕНИЯ знать значения выхода и его производных в тот момент времени, когда производится оценка состояния. Теорема 23 (наблюдаемость). Система (2.11) наблюдаема тогда и только тогда, когда ранг матрицы наблюдаемости С СА е й'"хп САп~1 равен п. В этом случае пара (А, С) называется наблюдаемой парой. Заметим, что V1' = [С^ ЛТСТ ... (ЛТ)П-1СТ] — матрица управля- емости для системы х = АТх + С^и, у = ВТх, которая называется двойственной к системе х — Ах + Ви, у = Сх, поскольку управляе- мость одной из них эквивалентна наблюдаемости другой. Необходимые и достаточные условия наблюдаемости, аналогичные сформулированным в теореме 2.1, получаются заменой Л —» Лт, В —»С^. Доказательство. Необходимость. Пусть rank У < п. Тогда найдется вектор v е R”, v / 0, такой, что Cv = С Av = ... = САп~ги = 0. Как и при доказательстве необходимости в теореме 2.1 об управляемости, отсюда следует, что CAmv = 0 для всех тп > 0 и, следовательно, CeArv = 0. Поэтому при rr(O) = v имеем y(t) = Cx(t) = CeAtv = 0. С другой стороны, при г(0) = 0 также имеем y(t) = 0. Таким обра- зом, разным начальным условиям отвечают одинаковые выходы и система ненаблюдаема. Достаточность. Имеем y(t) = Cx(t), y(t) = CAx(t), ... , CA^xit), т.е. Y = Vx, где Y = (y(t), y(t), ..., € R"z, x = x(t). Эта линейная система имеет решение, если выход y(t) порожден систе- мой (2.11) в силу установленной выше связи x(t) и производных выхода, и это решение единственно, так как ранг V равен п. Способ оценивания состояния, вытекающий из приведенного выше доказательства теоремы 2.3 о наблюдаемости, неудовлетворителен — он требует вычисления п — 1 производных от выхода. Меньшим числом про- изводных обойтись нельзя, если выход скалярный; конечно, если размер- ность I выхода больше, то число требуемых производных можно умень- шить (например, если матрица С квадратная невырожденная, то можно
2А Частотные методы 55 просто взять x(t) — C~ly(t)). Поэтому для оценивания состояний ис- пользуют другой подход, не требующий вычисления производных. Он дряпнан на построении наблюдателя, т. е. оценки х вектора состояния, описываемой линейным дифференциальным уравнением, в которое вхо- дит рассогласование выхода у и его прогноза у = Сх'. x(t) — Ах + F(y — Сх). Здесь F — некоторая матрица размера п х I, которую можно выбирать. Возвращаясь к задаче при наличии управления х = Ах + Ви, У - Сх, возьмем наблюдатель в форме x(t) = Ах + Ви + F(y — Сх). Тогда, очевидным образом, невязка e(t) = x(t) — x(t) описывается линей- ным дифференциальным уравнением e = (A-FC)e. Мы покажем в дальнейшем, что можно так выбрать матрицу F, что его решение e(t) —» 0 при t —♦ оо для любого начального рассогласования е(0). Иными словами, получим x(t) —» x(t), и оценка x(t) может ис- пользоваться для построения обратной связи и = Кх. Анализ таких алгоритмов будет проведен позже, в п. 4.3. Сопутствующие функции Matlab: obsv (CST) — построение матрицы наблюдаемости. 2.4. Частотные методы Предыдущие параграфы данной главы были посвящены выбору упра- вления при описании систем в пространстве состояний; обсудим теперь эти вопросы на языке передаточных функций. Начнем со случая одномер- ных непрерывных систем. Запишем уравнение системы в виде P(s)y = Q(s)u + R(s)w, где P(s),Q(s),R(s) — полиномы от оператора дифференцирования в: Р(з) = P0+P1S + ...+рпвп, Q(s) = go + qi3 +... + qmsm, R(s) = To + ris + ...+ ris1,
56 Глава 2. ВИДЫ УПРАВЛЕНИЯ I п, т п (т.е. выполнены условия реализуемости), а скалярные функции y(t), u(t), w(t) имеют смысл выхода, управления и внешнего входа соответственно. Напомним, что такая запись эквивалентна (1.11): У — Ч" Hyw(s)w, (2.12) где Hyu(s),Hyw(s) — передаточные функции P(S)’ P(s) Руи.'У) — W а также записи в виде одного дифференциального уравнения РпУМ + ... + Роу — qmU<m> + ... + qou+ riwtl> + ...+ruw в предположении, что u(t) и w(t) дифференцируемы соответственно т и I раз. Выбор управления в форме обратной связи означает, что оно ищется в виде ^(8) х,, х и=-пйу = -с^у’ (2.13) где 7V(s), D(s) — полиномы )V(s) = По + П18 + ... + nasa, D(s) = do + dis + ... + dps@, P a, a C(s) — передаточная функция регулятора. Подставляя это соотноше- ние в (2.12), мы получаем связь входа и выхода в замкнутой системе: и = н (s)w Н (s) = Hyw(s) ______________________P(s)-D(s)______ У cl) > d ) 1 + я9„(з)С(8) Q(s)N(s) + P(s)D(s)’ (2.14) Таким образом, характеристический полином Pc(s) замкнутой системы равен Pc(s) = Q(s))V(s) + P(s)P(s), а ее передаточная функция Hc(s) легко определяется по передаточным функциям разомкнутой системы и регулятора. Здесь мы еще раз убежда- емся в удобстве языка передаточных функций при таких операциях, как замыкание системы с помощью обратной связи. Замкнутую систему можно записывать в виде блок-схемы, изображен- ной на рис. 2.1, где G(s) и C(s) — передаточные функции объекта и регулятора, значок ® обозначает суммирующее устройство, а знак «-»
2-1 Чл ичные методы 57 Рис. 2.1. Блок-схема замкнутой системы соответствует минусу в формуле (2.13) (отрицательная обратная связь). Таким образом, передаточная функция замкнутой системы объект-регуля- ирРа."а = 1 + G(s)C(8)' <2Л5> Такого рода язык блок-схем очень нагляден и широко распространен в инженерной практике. Чаще используется конфигурация системы, изображенная на рис. 2.2 (она рассматривается при исследовании качества системы, в робастной Рис. 2.2. Блок-схема замкнутой системы теории и т. д.), где входной сигнал w имеет смысл задающего воздействия, С и G — передаточные функции регулятора и объекта, а и — выход ре- гулятора - имеет смысл управления. В этой конфигурации передаточная функция замкнутой системы (от w к у) равна Т( ) 1 + G(s)C(s) ’ ( ' } а передаточная функция от w к невязке е = w — у называется чувстви- тельностью: sW=1 + G(8)CW <2J7) Происхождение этого термина следующее. Пусть AG — возмущение пе- редаточной функции объекта и AG/G — относительное возмущение; едогвекчвенно, ДТ — вызываемое им возмущение передаточной функ- ции Т замкнутой системы и ДТ/Т — относительное возмущение. Ве- личина ДТ/Т дс“о AG/G
58 Глава 2. ВИДЫ УПРАВЛЕНИЯ характеризует чувствительность передаточной функции замкнутой систе- мы к бесконечно малым возмущениям передаточной функции объекта. Рассматривая Т как функцию от G, получаем, что эта величина равна S. Поскольку S(s) + T(s) = 1, то Т(з) также называют дополнительной чувствительностью. Функция 1 + G(s)C(s), стоящая в знаменателе (2.15), называется воз- вратной разностью. Позже мы увидим, что основные свойства замкну- той системы (в частности, ее устойчивость) формулируются в виде условий на возвратную разность или на обратную к ней величину — чувствитель- ность. Конфигурация на рис. 2.2 является простейшей. Существует много других блок-схем, описывающих системы с обратной связью. Значительно более полная конфигурация показана на рис. 2.3. В ней регулирование Рис. 2.3. Блок-схема замкнутой системы с двумя степенями свободы объекта G осуществляется с помощью префильтра (иначе, корректирую- щего фильтра) К и регулятора С, поэтому применяется термин система с двумя степенями свободы (в отличие от системы с одной степенью сво- боды на рис. 2-2). На систему воздействует задающее воздействие r(t), внешние возмущения w(t) и ошибки измерения v(t). Для выходного сиг- нала y(t) такой системы нетрудно получить следующее выражение: у = S(s)w + R(s)r — T(s)v, (2.18) где S(s) и T(s) — чувствительность и дополнительная чувствительность, описываемые теми же формулами (2.17) и (2.16), а передаточная функция от г к у равна R(s) = K(s)T(s). Если мы хотим, чтобы влияние возмущения w на выход было мало (так называемая задача подавления внешних возмущений), то из (2.18) видно, что для этого нужна малость S в том или ином смысле (более точные постановки таких задач будут рассмотрены ниже). Аналогичным образом, чтобы ошибки измерения v мало влияли на выход (задача фильтрации
2.4. Частотные методы 59 измерения), нужна малость Т. Обе эти задачи не могут быть решены одновременно, так как 5(в)+Т(в) = 1 (2.19) при всех s. Обычный компромисс заключается в том, что эти задачи рассматриваются на разных частотных интервалах, т.е. S(jw) должно быть мало для малых w, a T(jw) — для больших ш. Все вышеприведенные выкладки были достаточно формальными. Что- бы придать им корректность, нужно, чтобы получаемые передаточные функции удовлетворяли условию реализуемости (см. п. 1.2), т.е. чтобы степень полинома в числителе не превосходила степени знаменателя. На первый взгляд кажется, что это условие выполняется в силу реализуемости передаточных функций объекта. Например, в знаменателе (2.14) содер- жится член PD, а в числителе — RD; поскольку I = deg R deg Р = п, то deg RD deg PD. Однако может оказаться, что старшие коэффици- енты у слагаемых QN и PD в знаменателе (2.14) имеют разные знаки, старшие члены сокращаются, и условие реализуемости нарушается. По- этому надо наложить дополнительные требования во избежание подобного сокращения. Лемма 2.1. Если в (2.14) 1 + Н3/„(оо)С(оо) / 0, (2.20) или в (2.15) l + G(oo)C(oo)/0, (2.21) то соответствующие передаточные функции (2.14) или (2.15) — реали- зуемые. Эти условия часто называют корректностью замкнутой системы. Отметим теперь, какие особенности возникают при переходе к мно- гомерным системам. В этом случае передаточные функции являются ма- тричными, а сигналы — векторными (п. 1.2). Имея это в виду, мы можем рассматривать те же блок-схемы на рис. 2.1, 2.2, 2.3. При этом, разу- меется, (2.15) и последующие формулы требуют модификации (хотя бы потому, что деление на матрицу не имеет смысла, а перемножение матриц некоммутативно). Из блок-схемы на рис. 2.2 имеем у = G(s)C(s)e, e = w — у. Исключая отсюда е или у и рассматривая получающуюся систему линей- ных уравнений, находим у = (I + GCy-'GCw = Tw, е = (I + GCy^w = Sw.
60 Глава 2. ВИДЫ УПРАВЛЕНИЯ Матричные функции S(s) = (/ + G(s)G(s))“\ (2.22) T(s) = (/+ G(s)G(s))-1G(s)G(s) (2.23) по-прежнему носят название чувствительности и дополнительной чувстви- тельности; они являются передаточными функциями от входа w к не- вязке е и от входа w к выходу у соответственно. По-прежнему верно и соотношение, обобщающее (2.19): S(s) + T(s) = L Аналогичным образом вводятся передаточные функции многомерной системы, соответствующей рис. 2.3. Требование реализуемости (лем- ма 2.1) передаточных матриц приобретает следующую форму: матрица J + G(oo)C(oo) должна быть обратимой — это есть условие корректности для многомер- ной системы. Наконец, заметим, что критерии управляемости и наблюдаемости тес- но связаны с понятием минимальной реализации многомерных передаточ- ных функций (см. п. 1.2). Справедлив следующий результат. Теорема 2.4. Реализация ' А \ В ' . С | D _ минимальна тогда и только тогда, когда пара (А, В) управляема, а пара {А,С) наблюдаема. Сопутствующие функции Matlab. tf (CST) — задание системы с помощью передаточных функций и пере- ход от других форм записи к передаточной функции; minreal (CST) — построение минимальной реализации передаточной функции. 2.5. Выводы • Если в системе х = Ах + Ви управление ищется как функция от времени: и = u(t), то говорят о про- граммном управлении. Система управляема, если для любых двух состо- яний хо и Xi найдется управление, переводящее ее из хо в Xi за (про- извольное) конечное время Т. Критерий управляемости: ранг матрицы
2.5. Выводы: 61 управляемости U = [В АВ ... Ап~гВ] равен п (теорема 2.1). Про- граммное управление применимо при полной информации о матрицах Л В, С и отсутствии внешних возмущений. • Если управление не выбирается заранее, а строится как функция от текущего состояния системы, то говорят об управлении в форме обрат- ной связи по состоянию. Рассматриваем статическую линейную обратную связь и = Кх, в которой К G Rmxn — матрица усиления. Управления такого вида называются линейными регуляторами; матрица замкнутой системы при- обрсии-г вид Ас = А + ВК. • Если в системе х = Ах + Ви, у = Сх измерению доступны лишь выходы, но не состояния, то можно искать управление в форме обратной связи по выходу. Так как статическая обратная связь и = Ку, как правило, не приводит к успеху, то регулятор ищут в форме динамической обратной связи и = Кх, использующей оценку х вектора состояний по наблюдаемому выходу си- стемы; эта оценка описывается уравнением наблюдателя х = (А + ВК)х + F(y - Сх). Такой подход приемлем, лишь если система обладает свойством наблю- даемости: разным траекториям x(t) £ x'(t) соответствуют разные выходы y(t) y'(t), что позволяет восстановить состояние по выходу. Критерий наблюдаемости: ранг матрицы наблюдаемости С ' СА V = . G R'nxn С А71-1 равен п (теорема 2.3). • Если одномерная система записана с помощью передаточных функ- ций Q(s) R(s) y~P^U + W)W' degF degQ, deg P deg R,
62 Глава 2. ВИДЫ УПРАВЛЕНИЯ гае P,Q,R — полиномы, то управление в форме обратной связи ищется как “=Ш=-С(^’ гае N(s), D(s) — полиномы, a C(s)— передаточная функция регулятора. При таком управлении передаточная функция замкнутой системы рис. 2.1 имеет вид н(ч} = l + G(s)G(s)’ а ее характеристический полином равен Q(s)N(s) +P(s)D(s). В конфи- гурации рис. 2.2 передаточная функция от внешнего входа w к невязке е называется чувствительностью: l + G(s)G(s)’ а от входа к выходу у — дополнительной чувствительностью: .. <Ш) l + G(s)C(s)' при этом функция 1 + G(s)G(s) называется возвратной разностью. Если конфигурация рис. 2.2 отвечает многомерной системе, то чув- ствительность и дополнительная чувствительность — матричные переда- точные функции S(s)= (l-l-G(e)G(s))’1, T(s)= (/ + G(s)G(s))-1G(s)G(s). • Для обеспечения реализуемости передаточных функций замкнутой системы накладывается условие корректности (лемма 2.1): l + G(oo)C(oo) /0; в многомерном случае оно приобретает следующую форму: матрица I + G(oo)G(oo) должна быть обратимой. • Одна из наиболее полных конфигураций, описывающих системы с обратной связью, приведена на рис. 2.3. Это система с двумя степенями свободы (соответствующими префильтру (или корректирующему филь- тру) К и регулятору G). Выходной сигнал y(t) такой системы выражается через внешнее возмущение w(t), задающее воздействие r(t) и ошибки измерения v(t): у = S(s)w + R(s)r — T(s)v,
63 гае S(s) = l+G(s)G(s) ’ = l+G(s)C(s)’ = К^Т^- Поскольку S(s)+T(s) = l при всех з, то невозможно одновременное решение задачи подавления внешних возмущений (малость влияния возмущения w на выход) и задачи фильтрации ошибок измерения (малость влияния ошибки измерения v на выход). Поэтому обычно эти задачи решаются на разных частотных ин- тервалах: S(jw) минимизируется для малых и>, a T(jw) — для больших ш. • Связь управляемости и наблюдаемости с понятием Минимальной ре- ализации многомерных передаточных функций дается теоремой 2.4: реа- лизация Н(з) = (А, В, С, D) минимальна тогда и только тогда, когда пара (А, В) управляема, а пара (A, С) наблюдаема.
Глава 3 УСТОЙЧИВОСТЬ В этой главе исследуется важнейшее понятие теории управления — понятие устойчивости. Приводятся различные критерии устойчивости — как алгебраические, так и графические. Для нелинейных нестационарных систем имеется множество определе- ний устойчивости: устойчивость точки равновесия и устойчивость движе- ния; устойчивость по Ляпунову и асимптотическая устойчивость; устойчи- вость «в малом» и «в большом»; устойчивость по начальным условиям и по возмущению. Для линейных стационарных систем все эти определения совпадают, и мы будем говорить просто об устойчивости. 3.1. Устойчивость линейных непрерывных систем Начнем с простейшей ситуации — открытой невозмущенной системы в пространстве состояний. 3.1.1. Невозмущенные системы Линейная непрерывная система х = Ах, x(t) е R”, (3.1) где А — матрица п х п, не зависящая от t, называется устойчивой, если x(t) —> 0 при t —» оо для любого яг(О). Теорема 3.1. Для устойчивости системы (3.1) необходимо и доста- точно, чтобы все собственные значения Ai матрицы А лежали в левой полуплоскости: ReA; < 0, г = 1,...,п. (3.2) При этом для всякого 0 < о < а = min{—ReAj} существует такое С = С(А, о), что |x(t)| sj C\x(Q)\e~t't (3.3)
3 | Устойчивость линейных непрерывных систем 65 Отметим, что матрица А, удовлетворяющая условиям (3.2), в дальней- шем называется гурвицевой или устойчивой. Соответственно, собственное значение с отрицательной вещественной частью также будем называть устойчивым. Если А устойчива, то величина о = min {-Re АДА)} назы- вается степенью устойчивости (матрицы или соответствующей системы), т. е. это минимальное из расстояний от собственных значений устойчивой матрицы до мнимой оси. Доказательство. Необходимость. Пусть условие (3.2) не выполнено, т.е. найдется некоторое собственное значение матрицы А, например Ль такое, что ReAi 0. Если Ai вещественно, то возьмем ж(0) = ei, где Аех = Aid, d — веще- ственный вектор и |ei| = 1. Тогда решение с таким начальным условием имеет вид x(t) = eAltd. и потому x(t) 0 при t -» оо. Если Ах — комплексное число Ах = и + jv, то найдется и сопряженное собственное значение А2 = А{ = и - jv, причем если d = g + jh — собственный вектор, отвечающий Aj: Aei = A^i, |ff|2 + |/i|2 = 1, то e2 = g—jh — соб- ственный вектор, отвечающий А2: Ае2 = А2е2. При этом Ад = ид - vh, Ah = vg + uh. Возьмем x(0) = aog + 0oh, где a0,/30 6 R1, тогда x(t) остается в том же двумерном подпространстве: x(t) = a(t)g + /3(t)h, где a(t),/3(t) описываются дифференциальными уравнениями а = ua + v/З, а(0) = /3 = -va + u/3, /3(0) = /Зо- Обозначая p(t) = a2(t) + /32(t), легко получаем р = 2ир, т.е. p(t) 0 при t —» оо и и 0. Достаточность. В силу важности теоремы дадим несколько доказа- тельств достаточности; каждое использует технику, которая неоднократно будет применяться в дальнейшем. При этом в ряде случаев доказательство не будет исчерпывающе строгим — для нас важна главным образом идея, заложенная в нем. Доказательство достаточности 1 (оценка матричной экспоненты). Пусть мшрица А диагонализируема (например, все ее собственные значе- ния различны), т.е. существует такая невырожденная матрица Т, что А = Т~1АТ, A = diag(A1,...,A„). В этом случае имеем 1®(01 =: |eT-1ATix(0)| = IT-^TxCO)! ||Т“1|| ||ел‘|| ||Т|| |х(0)| = = ||Т-1|| е-|Г1 ||Т|| |ж(0)|, 3- Б. Г. Поляк, П.С. Щербаков
66 Глава 3. УСТОЙЧИВОСТЬ что и доказывает оценку (3.3) для устойчивой матрицы А (в этом случае а > 0), причем можно взять v = а, а константа С выписывается явно: О' = НГЦ ||Т-1||. В матричной форме полученный результат можно записать как оценку матричной экспоненты: ||еЛ‘|| < Ce~at, С = ||Т|| ЦТ-1!!. (3.4) Случай диагонализируемой А особенно прост потому, что, сделав замену переменной £ = Тх, мы сводим систему к виду ё=м, е(о) = тх(о), или, иначе говоря, & = А$&, i = 1,т.е. (3.1) распадается на п независимых уравнений с решениями Если Xi = Ui+jvi и все щ < 0, то а > 0 и |еА<‘ | — |e“‘te?v,t| = е“‘‘ < е at для всех Xi, поэтому |f(t)| |£(0)|е—crt. В общем случае матрица А приводится преобразованием подобия не к диагональной, а к блочной жордановой форме: А = Т-1 JT, J = diag (Ji,.. -, Jm) и система распадается на m независимых подсистем, соответствующих блокам Ji. Для одного жорданового бдока Ji размерности I х I ( X 1 ... 0 \ : •• 1 \ 0 ................. А )
j । усщйчимхчь линейных непрерывных систем 67 имеем еА* ieAt еЛ/ = 0 еА< < О О t2 м —е 2 teAt _____ем teAt еА« £ 2 (1-1)! О 1 t t/-1 = еА< О 1 t t 1 о О —а < 0, то найдется полином R(t) степени I — 1 поэтому если Re А < такой, что для любого 0 < и < а; здесь С = max R(t)e~^a~^t < оо. Учитывая 0<t<oo ||еЛ|| = шах» \]eJit||, можно прийти к оценке (3.3). Доказательство достаточности 2 (приведение к фробениусовой фор- ме). Пусть матрица А имеет фробениусову форму: / 0 1 0 0 0 0 1 0 А = * • 0 1 — ао — ai - ап-2 1 / Тогда, как мы знаем (п. 1.4), система уравнений (3.1) эквивалентна одному Дифференциальному уравнению п-го порядка относительно у = Xi: Vм + ан-ц/1"-1’ +... + аоу = 0, т/(0) = xi(0), ..., p<”-1>(0) = ж„(0), (3.5) см. (1.44) с Ь — 0 и (1.43). Его решение, как известно из теории обыкно- венных дифференциальных уравнений, имеет вид y(t) = Pi(t)eA,t +... + P„,(t)eXmt, *Яе Ai,... ,А„, — корни характеристического полинома P(s) = в" + an_isn~l + ... + а0,
68 Глава 3. УСТОЙЧИВОСТЬ a p(t) — полиномы от t, степень которых на единицу меньше кратно- сти А,. В частности, если все корни Р(з) различны и равны Ai,.. .,АП, то y(t) = cieAlt + ... + cTleA"t, где константы с, (или полиномы Pi(t)) находятся из начальных усло- вий (3.5). Например, для случая различных корней уравнения для сг имеют вид C1 + . . . + Сп = у(0) ciAi+...+с„Ап = у(0) с1АГ1 + ---+СпАГ1 У(п-1)(0). Это система линейных уравнений с невырожденной матрицей Вандер- монда ( 1 Ai \ АГ1 поэтому с = 5-1ж(0), с = (ci,..., с»)т. Таким образом, в этом случае для устойчивой матрицы с Re Xi С — а < О имеем п п ki(0l = |у(01 £>1|еА“| Ce~at|ш(0)|1, г=1 г=1 С = ||S’-1||oo- Отсюда немедленно следуют аналогичные оценки для Sfc(t) = к — 2,... ,п. Схожим образом проводятся выкладки и для случая кратных корней. В общей ситуации, как мы знаем, систему можно преобразовать к фробе- ниусовой форме с помощью подобных преобразований1, не изменяющих собственные значения матрицы А. Доказательство достаточности 3 (построение функции Ляпунова). Рассмотрим уравнение (относительно матрицы Р): ЛТР + РА = —Q, (3.6) 'Только если матрица А циклическая, см. лемму П.8 из Приложения.
3.1. Устойчивость линейных непрерывных систем 69 Гое А — устойчивая матрица, a Q > 0 — некоторая положительно опреде- ленная матрица; это уравнение называется матричным уравнением Ляпу- нова' . Доказано (лемма ПЛЗ из Приложения), что при сделанных предпо- ложениях (А устойчива, Q > 0) оно имеет единственное решение Р > 0. Построим теперь квадратичную функцию Ляпунова V(x) = хТРх и покажем, что она монотонно убывает на решениях x(t) уравнения (3.1). Запись V(x) означает дифференцирование V(x(t)) по t. Имеем: V(x) = хтРх + хтРх = (Ах)тРх + хтРАх = хт (АТР + РА)х = -xTQx < -£хтх < --^~хтРх = -~;V = -pV, М М где I > 0 — наименьшее собственное значение Q, а М > 0 — наибольшее собственное значение Р. Таким образом, для v(t) = V(z(t)) имеем v —pv, ст(0) = xT(0)Pa:(0), v(t) 0, откуда v(t) < v(0)e-Mt и |z(t)|2 = xT(t)x(t) — хтРх = 771 mm m где ттг > 0 — наименьшее собственное значение Р. Таким образом, MOI « CW0)|e-, C=v/f, Т. е. мы получили экспоненциальную оценку типа (3.3) для решений урав- нения (3.1). При этом показатель экспоненты и не связан напрямую с величиной ст, а выражается через максимальные и минимальные собствен- ные значения матриц Р и Q в уравнении Ляпунова. Можно показать, что Для Maiрицы А с ст > 0 справедливо _ I _ -^min(Q) _ ---------------- 2М ~ 2Лтах(Р) " а Ино1да уравнение Ляпунова записывают в виде АР + РАТ = — Q (в частности, именно такая форма рассматривается в системе Matlab). Переход от одной формы записи к другой В^игаезся переобозначением А —► Ат, и оба уравнения одновременно либо имеют, либо Не имеют решения.
70 Глава 3. УСТОЙЧИВОСТЬ и, более того, выбором Q величину и можно сделать сколь угодно близ- кой к а. Итак, теорема 3.1 дает условия устойчивости для невозмущенной си- стемы, заданной в пространстве состояний. Ниже (п. 3.4) мы сформули- руем частотные критерии устойчивости систем, описываемых с помощью передаточных функций. Этот параграф завершим изучением простейшей одномерной системы == 0» 1/(0) = «о, s(0) = ai, ..-, у(”-1)(0) = ап_1, (3.7) где Р(в) — полином от оператора дифференцирования s = d/dt: P(s) = зп + an-is^1 +... + ajs + ao- Эта система задана с помощью передаточной функции; сформулируем для нее определения и условия устойчивости, которые понадобятся нам в дальнейшем; при этом используем переход к описанию в пространстве состояний. Назовем систему (3.7) устойчивой, если у^ —»0, к = 0,1,..., п — 1, при t -+ оо для любых «!,... ,ап‘- Такая система, как мы уже видели, эквивалентна системе, записанной в пространстве состояний (п. 1.4): xi = у Х2 = у Хп = у(п~г) с помощью матрицы А в канонической (фробениусовой) форме. Харак- теристический полином такой матрицы совпадает с Р(з), поэтому ее соб- ственные значения — корни P(s). Таким образом, теорема 3.1 приводит к следующему результату. Теорема 3.2. Для того, чтобы система (3.7) была устойчива, необ- ходимо и достаточно, чтобы все корни полинома Р(з) лежали в левой полуплоскости: ReAi <0, г = 1,... ,п. ‘Это условие эквивалентно y(t) —» 0 (см. решение уравнения (3.7)); мы подчеркиваем здесь стремление к нулю первых п производных, так как именно они выбираются в качестве состояний при эквивалентном описании системы в пространстве состояний.
J I. Усюичнвость линейных непрерывных систем 71 Такие полиномы мы будем называть гурвицевыми или устойчивыми, радии как и соответствующие им системы (3.7). Теорему нетрудно до- начать и непосредственно. Впрочем, мы это уже делали при доказатель- стве теоремы 3.1, опирающемся на приведение матрицы к фробеииусовой форме. 3.1.2. Возмущенные системы Используя результаты предыдущего параграфа, мы можем оценить и решения системы при наличии внешних возмущений: х = Ах + и. (3.8) Теорема 33. Для того, чтобы решение x(t) системы (3.8) при х(0) = О было ограниченным для всех ограниченных внешних возмущений u(t) (|u(t)| 1 для всех t), необходимо и достаточно, чтобы А была устой- чива. Доказательство. Необходимость. Пусть условие (3.2) не выполнено: ReAi > 0, Aei = AiCj, |ei| = 1 для некоторого собственного значе- ния А и соответствующего собственного вектора. Если Aj вещественно, то возьмем u(t) = ei, тогда t t z(«) = - J^'dr = ЛГ V - D«, 0 0 при A! / 0, поэтому |x(t)| = lAj4! |eAlt — 1| —» оо при t —> оо. Если же Ai = 0, то x(t) = ei Jo4 dr = tei, и вновь |x(t)| —»оо при t —» oo. Если Ai комплексно, A] = rj+jo, ei = g+jh, то уравнение движения на двумерной плоскости, порожденной векторами g я h, принимает вид а = r)a + v0 + fi, а(0) = 0, (3 = -1/а + т]0 + /2, 0(0) = 0, *№ (см. доказательство необходимости в теореме 3.1) x(t) = a(t)g + a u(t) выбрано в виде u(t) = fi(t)g + f2(t)h. Теперь для p(t) = 4- 02(t) имеем р = 2rjp + faa + /2Д Выберем fi(t) = signa(t), Л(0 = siga0(t) (где sign 0 = 1), тогда p > 0 я p неограниченно возра- стает, т.е. и в этом случае можно так выбрать (ограниченное) внешнее воздействие u(t), что |ж(4)| оо при t —► 00. Достаточность. Как и в предыдущей теореме, доказательство доста- точности проведем несколькими способами, использующими различные
72 Глава 3. УСТОЙЧИВОСТЬ идеи. Кроме того, мы будем рассматривать систему формально более об- щего вида, чем (3.8): х = Ах + Ви (3.9) и покажем, что устойчивость матрицы А достаточна для ограниченности решений такой системы. Доказательство достаточности 1 (явный вид решения). В соответ- ствии с формулой (1.3) при ж(0) = 0 имеем t x(t) = У Bu(r)dr. о Поэтому, используя оценку для матричной экспоненты (3.4), получаем t t k(t)| «= У ||eA(t-r)|| ||jB|||u(t)|c(t С||В|| j c^^dr < ^С||В||- о о (3.10) Этот же способ мы применяли (в одномерном случае) при выводе выра- жения для нормы оператора вход-выход (1.27). Доказательство достаточности 2 (построение функции Ляпунова). Пусть, как и ранее, V(x) = хтРх, где Р > 0 — решение уравнения Ляпунова АТР + РА = —Q, Q > 0, и V =. V(x(f)). Тогда V = (Ах + Ви)т Рх + хтР(Ах + Ви) = = — xTQx + игВтРх + хтРВи < — pV + -ит Вт РВи + 7хтРх, 7 где р = Amin(Q)/A„iax(P) > 0, а 7 > 0 произвольно. Здесь мы применили стандартный прием дополнения до полного квадрата: итВтРх + хтРВи = /1 \т/ 1 = - (——Р^2Ви - у/уР1/2х ) { 4=Р1/2Вп \у/7 / + —итВтРВи + 7хтРх -итВтРВи -I- 7хтРх 7 7 для любого 7 > 0. Продолжая полученное выше неравенство, имеем V с -nV + -||ВТРВ|| + 7V. 7
Ч > устойчивость линейных дискретных систем 73 Выберем теперь 0 < 7 < р. Тогда дляа = д~7>0и/3 = i || ВТРВ || 7 получаем v(t) < -av(t) + /3, v(t) = Инте1рируя это неравенство (с учетом и(0) = 0, v(t) 0), находим v(t) |x(t)|2 < —хтРх = — v(t) , т = Amin(P) а т т та что и гарантирует ограниченность решения. Итак, мы получили, что гурвицевость матрицы А необходима и до- статочна для того, чтобы решение невозмущенной системы стремилось к нулю при любом начальном приближении и чтобы решение возмущенной системы оставалось ограниченным для ограниченных возмущений. Первое свойство иногда называется устойчивостью по начальному приближению, второе — устойчивостью по входу. В западной литературе системы со вторым свойством называются BIBO (Bounded-Input, Bounded-Output, т. е. ограниченный вход~ограниченный выход). Мы еще раз убеждаемся, что для линейных стационарных систем все определения устойчивости экви- валентны. Сопутствующие функции Matlab: eig — нахождение собственных значений матрицы; ехрт — матричная экспонента; , norm — вычисление матричных норм; lyap (CST) — решение матричного уравнения Ляпунова (непрерывный случай); jordan (SMT) — приведение матрицы к жордановой форме; canon (CST) — приведение матрицы к фробениусовой форме; sqrtm — вычисление квадратного корня от матрицы. 3.2. Устойчивость линейных дискретных систем В простейшем случае уравнение невозмущенной открытой линейной системы имеет вид хк=Ахк-1, (3.11) хк е Rn, А — матрица п х п. Как и в непрерывном случае, эту систему будем называть устойчивой, если хк —> 0 при к —> оо для любого начальною х0. Напомним, что спектральным радиусом р(А) матрицы А называется максимум модуля ее собственных значений: р(Л) = max [Af |.
74 Глава 3. УСТОЙЧИВОСТЬ Теорема 3.4. Для устойчивости системы (3.11) необходимо и доста- точно, чтобы все собственные значения А, матрицы А принадлежали внутренности единичного круга: р = р(А)<1. (3.12) При этом для любого е>0, р + £<1 существует такая константа С = С(А, е), что \xk | < С|хо | (р + е)к. (3.13) Матрицу А, для которой выполняется (3.12), будем называть муров- ской (или просто устойчивой, когда из контекста ясно, что речь идет о дискретной, а не непрерывной системе). Доказательство. Необходимость. Пусть р 1, тогда найдется соб- ственное значение Ai с |АХ | > 1. Выбирая начальные условия хо / 0 в собственном подпространстве, отвечающем А] (одномерном, если Aj ве- щественно, или двумерном, если Ai комплексно), получаем, что |зд| = |Ai|*|xo|, т.е. |аг*| 0 при к —♦ оо. Достаточность. Вновь, ввиду важности теоремы, приведем несколь- ко доказательств достаточности условия (3.12). Доказательство достаточности 1 (соотношение спектрального ради- уса и нормы). Известно (см. лемму П.4 из Приложения), что р(А) = lim ||Afe||1/fc, к-too поэтому для любого е > 0 и для всех достаточно больших к имеем \хк\ = |Afcxo| < ||Afc|| |хо| {р + е)к|хо|, а следовательно, для всех к выполняется (3.13). Доказательство достаточности 2 (оценка Ак). Доказательство со- вершенно аналогично непрерывному случаю: если А диагонализируема, то существует невырожденная матрица Т такая, что А ~ Т~ХАТ, гае А = diag (Ai,..., А„). Имеем |xfc| = |Afcx0| = \Т~1КкТх0\ ||Т-1|| ||Afe|| ||Т|| |x0| = = рк \\Т\\\хо\, и, таким образом, оценка (3.13) справедлива с е = О, С = |]Т|| ||Т-1|| (ср. с непрерывной устойчивостью). В общем случае матрица приводится к блочной жордановой форме, и для одного блока J размерности I х I
^2. Устойчивость линейных дискретных систем 75 / А* J* = 0 А* Ct-1Afe-z+1 \ С£А*-1 А* / где G™ = fc!/(m!(m - fc)!) при т < к и С™ = 0 при т > к. Поэтому для любого е из условий теоремы найдется такое С = С(А,е), что ||Jfc|| к k +- е ) . Оценивая норму блочно-диагональной матрицы, получим того же типа. Доказательство достаточности 3 (приведение к фробениусовой фор- ме). Если матрица А имеет фробениусову форму /010... 0 \ 0 0 1 ... 0 : : 0 1 \ —do —ai ... - ап~2 -On-i / то система (3.11) эквивалентна скалярному разностному уравнению п-го порядка Ук + ап-11/fc-i + • • + аоУк-п = 0, к п, с начальными условиями у0 = хОъ yi = х02.....Уп-i - х&п, где хОу — у-я компонента х&. Вспомнив введенный в п. 1.2 оператор z сдвига назад, перепишем уравнение в виде Р(г)рк = 0, P(z) = 1 + On-iz +... + aizn~x + aozn. В простейшем случае, когда корни А» полинома P(z) различны, его ре- шение записывается как Ук = ClApfe + ... + CnA„fe, ПЮ постоянные Ci находятся из начальных условий. Корни полинома P(z) заимно обратны собственным значениям матрицы А, поэтому, рассуждая Дальше так же, как в непрерывном случае, получаем требуемое утвер- ждение теоремы. Случай кратных корней анализируется, как для непре- РЧвных систем. Наконец, для матрицы общего вида, если она цикличе- ская, можно сделать замену переменных, приведя ее к фробениусовой
76 Глава 3. УСТОЙЧИВОСТЬ Доказательство достаточности 4 (функция Ляпунова). Введем функ- цию Ляпунова У(х) = хтРх и обозначим vk == V(xk). Тогда Vfc+1 = хк+1Рхк+1 = х^АтРАхк. Если выбрать Р > 0 как решение дискретного уравнения Ляпунова1 АТРА — Р =-Q с некоторой матрицей Q > 0 (положительно-определенное решение та- кого уравнения существует для устойчивой матрицы А, см. лемму П.19 из Приложения), то мы получим Wfc+i = ж* (Р - Q)xk = vk -xkQxk < vk - avk, a = ^m‘n^ > 0, ^maxV ) т.е. vk v0(l - o)fc, или, продолжая, I i z-,1 I к /•^max(P) Д— , kfc| sj C\x$\q , C=J-----r—, q = Vl-a<l. у ) Таким образом, ]ят*| убывает со скоростью геометрической прогрессии. Аналогично непрерывному случаю можно показать, что для дискретно- устойчивой А справедливо . /. \nin(Q) л\ и, более того, выбором Q можно добиться сколь угодной близости вели- чины q к р. Сопутствующие функции Matlab: dlyap (CST) — решение матричного уравнения Ляпунова (дискретный случай). 3.3. Критерии устойчивости полиномов Мы видели, что проверка устойчивости систем в пространстве со- стояний сводится к проверке расположения собственных значений ма- трицы А (или, что то же, корней ее характеристического полинома). Именно, устойчивость имеет место тогда и только тогда, когда Re Аг < 0, г = 1,...,п (в непрерывном случае) или |А{| <1, г = (в дис- кретном случае), где Aj — собственные значения А. Точно так же для Иногда используют запись АРАТ — Р = — Q, см. сноску на с. 69.
77 33 Критерии устойчивости полиномов устойчивости систем, заданных с помощью передаточных функций, ана- логичные условия нужно проверять для корней характеристического по- линома системы — знаменателя передаточной функции. Разумеется, при огромных возможностях современной вычислитель- ной техники и математического обеспечения проверка подобных условий не представляет никакой проблемы. Достаточно одной команды roots(P) или eig(A) в системе MATLAB, чтобы вычислить (практически момен- тально для разумных значений п) все корни полинома или собственные значения матрицы и тем самым проверить устойчивость. Тем не менее нам бутуз интересны другие критерии, не требующие вычисления корней или собственных значений. Дело в том, что матрица А или полином Р обычно не заданы численно, а зависят от параметров или содержат не- определенности. Например, даже если матрица А в системе х = Ах + Ви задана точно, а управление выбирается в виде обратной связи и = Кх, то матрица замкнутой системы Ас = А + ВК зависит от параметров регуля- тора К. Поэтому нас может интересовать вопрос, при каких значениях параметров система устойчива. Известно много различных критериев устойчивости. Рассмотрим пре- жде всего графические критерии, которые по поведению некоторых кри- вых (обычно называемых годографами) позволяют делать выводы об ус- тойчивости полиномов. 33.1. Графические критерии Пусть задан полином P(s) ~ <lq 4* U]_s 4“... 4- ansn с вещественными коэффициентами аг, причем ап > 0 (этого всегда можно добиться, так как P(s) и -Р(з) имеют одинаковые корни). Рассмотрим его значение при мнимом значении аргумента s = jcu: P(ju) - а0 — О2Ш2 4- адси4 — • • + Jw(ai — азси2 4- а$и>4 — ...) = = U((J2) + jwV(w2), ПК обозначено (7(t) == ao — o-it 4- a-it2 —V(t) = ai — a^t + a$t2 — ... Годографом функции P(jw) называется кривая, описываемая точкой г = P(jw) на комплексной плоскости при изменении си от 0 до оо. Теорема 3.5. Следующие условия эквивалентны: Полином P(s) гурвицев.
78 Глава 3. УСТОЙЧИВОСТЬ 2. Годограф P(ju) проходит через п квадрантов последовательно, начиная с первого, не проходя через начало координат. 3. Аргумент годографа arg P(ju) определен, монотонно возрастает и меняется от нуля до яп/2. 4. Полиномы U(t) и V(t) имеют только положительные веществен- ные корни, которые перемежаются, т. е. найдутся О < tj < t2 < < tn-i такие, что tJ(tj) = U(ts) = -... = О, У(4г) = У(М = ... =0, и, кроме того, U(0) >0. Условие 2 называется критерием Михайлова (а годограф P(Ju) — годографом Михайлова), а условие 4 — критерием Эрмита-Билера. Доказательство. Прежде всего, исключим случай чисто мнимых кор- ней полинома P(s). так как при этом argP(jw) не определен и графиче- ский критерий неприменим. Представим полином в виде P(s) = a„(s-Ai)---(s-А„); тогда P(jw) = an(jw-Ai)---(jw-A„), «п>0, и поэтому п arg P(ju) = 52 arg (Ju - Afc). fc=i Отсюда при и — 0 получаем argP(O) = arg (-~At). Поскольку корни полинома с вещественными коэффициентами встречаются комп- лексно-сопряженными парами, то в случае гурвицевости Р(з) имеем arg Р(0) = 0 (или, иначе, ао > 0). Обозначим tpk = arg(jw - At) и рассмотрим случай, когда А^ веще- ственно. Если Аь < 0, то у* монотонно-возрастает, а Ду^ — приращение аргумента комплексного числа (Ju — Xk) при изменении и от 0 до оо — равно тг/2 (см. рис. 3.1, слева). Если же А* > 0, то Дуч- = —тг/2. ju Рк + <р*к = 0 при и — 0 <Рк + <Рк — * ПРИ ш — °° Re Рис. 3.1. Приращение аргумента arg (ju — А*) при изменении и Аналогично, если Хк— комплексное число, то найдется сопряженный корень Х*к. Обозначим <рь = arg (Ju — А*) и р*к = argfjw — Хк). Тода
79 jj Критерии устойчивости полиномов &рк + = 7г при Re At < 0 и Д^Ч- + £ср*к — — тг при ReAfc > О (рис. 3.1, справа). Таким образом, получаем, что если Р(з) не имеет ото мнимых корней, то приращение аргумента P(jo>) равно Д arg P(jw) - ~т — ^-(п — т), (3.14) 4b At дот — число корней с отрицательной вещественной частью (в дальней- шем будем называть такие корни устойчивыми). В частности, если т = п (полином гурвицев), то Д argP(jw) = тгп/2, и argP(ju>) монотонно воз- растает от нуля до тгп/2 с ростом ш от 0 до оо (как сумма монотонных функций). Обратно, если argP(jw) определен при всех w и монотонно возрастает от argP(j 0) = 0 до argP(j оо) = тгп/2, то полином P(s) не имеет чисто мнимых корней, а из формулы (3.14) заключаем, что т = п. Таким образом, доказана эквивалентность условий 1 и 3. Если Р(в) гурвицев, то в силу условия 3 имеем Д arg P(ju>) = тгп/2, т.с. arg P(jw) монотонно меняется от arg Р(0) = arg од = 0 до iml2, по- этому годограф последовательно проходит через п квадрантов. Обратно, если P(jw) последовательно проходит через п квадрантов, то AargP(jw) (п — 1)тг/2. Из формулы (3.14) (она применима, так как P(jw) не проходит через начало координат, т.е. Р(в) не имеет мнимых корней) следует, что т = п. Итак, условие 2 эквивалентно 1 и 3. Наконец, условие 4 является просто алгебраической формулировкой условия 2: последовательное прохождение квадрантов эквивалентно по- следовательному пересечению вещественной и мнимой осей, т. е. наличию положительных перемежающихся корней у полиномов U(t) и V(t). При этом никаких других корней у этих полиномов нет, так как нетрудно со- считать, что сумма степеней U(t) и V(t) равна n— 1 — числу пересечений с осями. Таким образом, теорема доказана полностью. Рассмотрим несколько примеров. 1. Полином второй степени: Р(з) = од + ацз + а2з2, аг > 0. Имеем = од- O2W2 +jaiu>, t7(t) = од-a2t, V(t) = ar, ti=a0/a2. Годограф P(jw) — парабола (см. рис. 3.2); условие того, что она проходит через квадранты I и П: щ > 0, од/од > 0, т.е. для п = 2 необходимое и достаточное условие устойчивости — положительность всех коэффи- циентов: од > 0, ai > 0, а2 > 0. Вообще, положительность коэффициентов является необходимым ус- ловием гурвицевости полинома — это так называемый критерий Сто- ллы, который следует из представления P(s) —ап (в - At) fj (в2 - 2sReAj + |AJ2), ап > 0,
80 Глава 3. УСТОЙЧИВОСТЬ Рис. 3.2. Годограф Михайлова для устойчивого полинома второй степени и если А* < 0, ReAj < 0, то все коэффициенты полинома положи- тельны. При п > 2 положительность коэффициентов перестает быть до- статочным условием устойчивости и требуется проверка дополнительных условий. 2. Полином третьей степени: P(s) = ао + ajs +a2s2 + азв3, аз > 0. Имеем P(jw) = ао - азш2 + jw(ai — азш2), [7(О=ао-а24, V(t) = ai - a3t; t\—ao/a2, £2 = а1/аз. Годограф устойчивого полинома изображен на рис. 3.3. Критерий Ми- хайлова выполняется, если ао > 0, ai > 0, 0 < ti = ао/а2 < t2 = ai/аз. Эти условия эквивалентны следующим: ао >0, ai > 0, а2 > 0, аз > 0, aja2 > аоаз- Таким образом, здесь к условию положительности коэффициентов доба- вляется еще одно условие aja2 > аоаз- 3. Полином четвертой степени: P(s) = ao+ais+a2s2 + a3s3 + a4s4, a.t > 0.
3 3. Критерии устойчивости полиномов 81 Рис. 3.3. Годограф Михайлова для устойчивого полинома третьей степени Имеем P(jw) — ао — O2<v2 + ада;4 + ju)(ai — азш2), U(t) = ао — a2t + a4t2, V(t) = ai - a^t; аг - У аз — 4aoa4 ai аг + \/a2 ” 4a0a4 ч =---------й--------, 12 = —, 13 =-----------7Г---:---- 2a4 аз za4 Условие вещественности ti дает а?,—4a4ao > 0, а условие 0 < 4j < 4г < 4з выглядит так: аг — \jo% — 4aoa4 < < аг + \]а2 — 4ооа4. Нетрудно проверить, что эти условия (вместе с аг > 0) равносильны следующим: аг > 0, г = 0,...,4, агагаз > аоа2+ а2а4. Отметим, что критерий Эрмита-Билера дает возможность генериро- вать устойчивые полиномы. Именно, зададимся числами 0 < 41 < 42 < • . < 4„_! и со > 0,ci > 0, и построим полиномы 1/(4) = со(4 - 41) • (4 — 43) ..., V(4) = ^(4 -42) • (4 — 44) ...; Тоща полином P(s), определяемый условием P(jw) = U (си2) + jwVfa2), будет гурвицсвым. При этом мы не задаемся числом вещественных и ком- плексных корней, как пришлось бы делать, определяя P(s) через его корни.
82 Глава 3. УСТОЙЧИВОСТЬ 33.2. Алгебраические критерии Алгебраические критерии устойчивости формулируются в терминах коэффициентов полинома. В примерах предыдущего параграфа мы без труда выписали в явном виде необходимые и достаточные условия гурвицевости полиномов степени п < 4; обычно их называют условиями Рауса-Гурвица. Однако для более высоких степеней такой подход (осно- ванный на критерии Эрмита-Билера) или громоздок, или нереализуем. Поэтому приведем другой способ проверки устойчивости. Наряду с полиномом P(s) = апзп +ап-1вп~1 +... +ао, ап > О, рассмотрим полином <Э(а) = On-is" 4- Оп-зД”-2 + • • - и их линейную комбинацию .F\(s) = P(s) + XQ(s) = (ад + Aan—x')sn + an-isnl 4- 4-(ап~2 4- Аоп-з)дп~2 + вп-зд”-3 +... Если выбрать Л — —an/an-i, то соответствующий полином Р(в) = Оп-хв”"1 + [Оп-2----—ап-з^ в”-2 + ап-38п~3 + ... (3.15) \ <*п-1 / будет полиномом степени п — 1. Лемма 3.1. Если ап, ап-г > 0 и полином Р(з) устойчив, то и полином Р(з) устойчив; в противном случае Р(з) неустойчив. Проведем доказательство для наглядности для п = 5 (в общем случае оно совершенно аналогично). Тогда для t = ш2 P(jw) = оо — й2Ш2 4- а4ш4 4- j<o(ai — а3ш2 4- а5ш4) = U(t)+ juiV{t), Q(ju) = ju(ao - a2w2 + а4щ4) = jwU(t), P(jw) = P(jw) - — Q(jw) = a4 = U(t) 4- >(v(t) - ^(t)) - U(t) 4- jwV(t). Полином P(s) устойчив, поэтому по критерию Эрмита-Билера най- дутся такие 0 < ti < t2 < t3, что (7(ti) — V(t2) = U(t3) = 0, и при
3J- Критерии устойчивости полиномов 83 ЭТОМ V(t 1) > 0, U(t2) < О, V(t3) < 0. Следовательно, в силу равенств tf(t) = U(t), V(t) = V(t) + — U(t) имеем [ф1) = 0, V(tx) = V(*1) > 0, U(t3) = 0, V(t3) = F(t3) < 0. Полином V(t) меняет знак в интервале [ti, t3], поэтому существует точка tj, ti < t'2 < t3 такая, что V(t^) = 0. В этой точке U(t2) < 0, так как U(t) отрицателен между своими двумя нулями й, t3. Итак, 0 < h < t2 < t3 являются перемежающимися нулями полиномов U(t) и V(t). Более того, так как V(t3) < 0, a V(t) = «и —a3t+a3t2 —» +оо при t —> оо (поскольку по предположению а5 > 0), то V(t) имеет еще один корень t4 > t3. Итак, мы нашли положительные перемежающиеся корни 0 < tj < t2 < t3 < t4 полиномов U(t),V(t). Вновь применяя критерий Эрмита-Билера, делаем вывод об устойчивости P(s). Таким образом, задача проверки устойчивости полинома Р(з) сте- пени п свелась к проверке знаков a„,an_i и к проверке устойчивости полинома P(s) степени п — 1. Продолжая последовательно этот процесс и вспоминая формулы пересчета коэффициентов полиномов при переходе от Р(я) к Р(з), приходим к следующему критерию устойчивости. Алгоритм Рауса 1. Полагаем bi 62 — —i, • • *, —оо, ^n-t-2 —В, к — п + 1. 2. Полагаем А = —61/62 (если 63 = 0, то полином неустойчив), пересчитываем коэффициенты по формулам 61 = 62, &2 = 63 + Л64, 63 = 64, 64 = Ь3 + АЬб, Ь3 == Ьб, ... , bk ~ 0, и полагаем к = к — 1. 3. Если к > 2, bi > 0, &2 # 0, возвращаемся к пункту 2. Если к = 1 и bi > 0, то полином устойчив. В остальных случаях полином неустойчив. Алгоритму Рауса часто придают табличную форму: коэффициенты 41,...,6п+2, полученные на первом шаге, записывают в первую строку таблицы. Каждая последующая строка содержит на один элемент меньше; она получается из предыдущей при помощи пересчета на основе лем- **ы 3.1 (шаг 2 алгоритма). В результате получают треугольную таблицу Рвуса, и для устойчивости необходимо и достаточно, чтобы элементы первого с голбца таблицы были положительны (условие bi > 0 на шаге 3). Существуют и иные, несколько более экономные схемы вычислений в алгоритме Рауса. Покажем работу алгоритма на примерах, пользуясь непосредственно способом понижения степени (3.15) и леммой 3.1.
84 Глава 3. УСТОЙЧИВОСТЬ 1. п = 3: P(s) — азз3 + а^з2 + агз + ао- Получаем В/ \ 2 . ( аз \ . Р(з) = а2з + ai------ао s + a0. к “2 / Можно не проводить вычисления дальше и воспользоваться критерием гурвицевости полинома второй степени, заключающимся в неотрицатель- ности его коэффициентов, т. е. а3 аг >0, ai------ао >0, ао > 0. а-2 Тем самым мы пришли к тем же условиям, что и с помощью критерия Михайлова. 2. п'= 4: P(s) = 04s4 + аз«3 + а2з2 + агз + ао- Получаем \ 3 ( йд \ 2 Р\з) = азз 4- I аг---ai I з + ajs + ао, к аз / и, пользуясь полученными выше условиями устойчивости при п = 3, при- ходим к условиям (U4 1 02 — —О1 > ОзОо- аз / Существует и много других алгебраических критериев устойчивости. Самый известный из них — это критерий Гурвица, формулируемый с помощью детерминантов. Он, однако, гораздо менее удобен с вычисли- тельной точки зрения, чем алгоритм Рауса, и мы на нем останавливаться не будем. Алгоритм Рауса также предоставляет возможность генерировать устой- чивые полиномы. Именно, запишем произвольные положительные числа в первом столбце таблицы Рауса, а затем заполним ее всю, идя «обратным ходом» по отношению к алгоритму Рауса. Тогда в первой строке окажутся коэффициенты устойчивого полинома. 33.3. Устойчивость дискретных полиномов Приведем теперь аналоги этих же условий устойчивости для дискрет- ных систем. Задан полином с вещественными коэффициентами P(z) = ао + ajz + ... +anzn, ао > 0; (3.16) нас интересует, когда он является устойчивым по Шуру, т.е. когда его корни находятся вне единичного круга. Аналогом критерия Михайлова является следующий критерий. Теорема 3.6. Полином (3.16) муровский тогда и только тогда, когда годограф 0 < ш 2тг, не охватывает начала координат.
3 3- Критерии устойчивости полиномов 85 Действительно, п п P(z) = а„ П(г - Ai), Р =апц (е^ - Аг) , i=l г=1 и если Xi находится вне единичного круга, то приращение аргумента - А,) равно нулю, когда пробегает единичную окружность. Если же А( лежит внутри единичного круга, то приращение аргумента (eJU'-Ai) равно 2тг; таким образом, годограф F(e'u') охватывает начало координат к раз, если к — число неустойчивых корней P(z). При пользовании графическими критериями удобство соглашения от- носительно корней устойчивого полинома (|z,| > 1) налицо: никакого труда не составляет определить по графику, охватывает ли кривая на- чало координат, в то время как посчитать число оборотов вокруг нуля бывает сложно или невозможно, например, если P(z) = zn. При иных подходах бывает проще проверить принадлежность корней внутренности единичного круга, \zi\ < 1; для этого можно воспользоваться следую- щим соображением. При изменении порядка коэффициентов полинома на обратный, аь —* ап-к, fc = 0,..., п, его корни переходят во взаимно обратные: А; —► А^1. Приведем теперь аналог алгоритма Рауса для дискретного случая (на- зываемый дискретным критерием Рауса-Шура). Наряду с полиномом P(z) рассмотрим полином с теми же коэффициентами, но записанными в обратном порядке: Q(z') = znP = aozn+a^zn~1 + ...+ап, а0 > 0, (3.17) и возьмем их линейную комбинацию P(z) = P(z) + AQ(z), А = -ап/а0. Полином P(z) будет иметь степень п — 1, т. е. на единицу меньше сте- пени Р(г). Утверждение, аналогичное лемме 3.1, заключается в следую- щем (приведем его без доказательства). Лемма 3.2. Если ао > 0, а0-(а„/а0)ап > 0 и полином P(z) устойчив, то и P(z) устойчив; в противном случае P(z) неустойчив. Таким образом, рекуррентно понижая степень полинома, придем к полиному первой степени вида ао + aiz; он устойчив при ]а0/а11 > 1. Тем самым получаем простой алгоритм проверки устойчивости дискрет- ных полиномов. Известно и много других критериев устойчивости (Шура, Джури). Если корни P(z) (3.16) лежат вне единичного круга, то P(z) не меняет Знак для всех -1 z 1. С учетом Р(0) = ао > О это дает Р(1) > О
86 Глава 3. УСТОЙЧИВОСТЬ и Р(-1) > 0. Приходим к следующим простым необходимым условиям устойчивости: оо + ai + ... + ап > 0, ао ~ . + (—1)пОп > 0. (3.18) Отметим еще, что имеется также простое достаточное условие: £Н1<|ао|; (3.19) 4=1 и дискретный полином P(z), удовлетворяющий этому условию, называ- ется сверхустойчивым. Мы обсудим понятие сверхустойчивости ниже, в п. 3.6. Приведем пример: P(z) = a2Z2 +агг + ао, Q(z) = aoz2 + a^z + аг, ло > 0, = H(w)+jV(w); U(co) — a0cos2w + aicosw + o2; V(w) = aosin2w+aisinw. Устойчивость P(z) эквивалентна расположению нулей Q(z) внутри еди- ничного круга, т. е. годограф Q(e,<*') должен совершить два оборота во- круг начала координат. Это, в свою очередь, эквивалентно последова- тельному прохождению четырех квадрантов при изменении ш от 0 до тг (поскольку w < тг и w 2тг симметричны от- носительно вещественной оси). Корни V(w): wi = 0; W3 определяется условием cosw3 = -ai/2a0, поэтому должно быть |ai| < 2ao (так как оо > 0); w5 = тг. Корни U(u>) и V(w) перемежаются, т.е. у U(w) име- ются корни о>2 и w4 такие, что wi < w2 < w3 < w4 < ws- Поскольку U(wi) = ao + ai -Наг > 0 (см. (3.18)), то (7(шз) должно быть отрица- тельно: аг — ад < 0, а (7(w5) =ao — ai+a2 >0. Анализ условий на знаки V(w) в корнях I7(w) показывает, что дополнительных ограничений на коэффициенты не добавляется, поэтому, собирая вместе полученные выше ограничения, приходим к следующим необходимым и достаточным условиям устойчивости P(z): Оо + О1 + 02 > 0, Оо — О1 + 02 > 0, Оо — 02 > 0. Те же условия получаем, понижая степень на основе леммы 3.2. Генерировать устойчивые полиномы можно как на основе леммы 3.2 (применяя ее «в обратном направлении», т.е. повышая степень полино- мов), так и пользуясь следующей параметризацией.
ЗД Частотные критерии устойчивости замкнутых систем 87 Лемма 33. Любой устойчивый полином P(z) степени п с -Р(О) —1 xffprem быть получен с помощью рекуррентной процедуры po(z) = 1, Pk+l(z) = Pk(z) + tfczfe+1Pfc(z-1), |tfc| 1, fc = 0,. ,.,n — 1. Числа tk иногда называют параметрами Фама-Медича. Таким обра- зом, каждой точке единичного куба в Rn ставится во взаимно однозначное соответствие устойчивый полином. Таким образом, мы нашли графические и алгебраические критерии устойчивости (гурвицевой и шуровской) для полиномов. Следующим есте- ственным шагом было бы установление таких же критериев для матриц, т.е. способов проверки требуемого расположения собственных значений матрицы без их явного вычисления. К сожалению, такие методы отсут- ствуют. Единственный известный подход — для заданной матрицы А построй) ь ее характеристический полином P(s) = det (si—А) (для этого существуют эффективные алгоритмы — они совпадают с методами при- ведения матриц к фробениусовой форме), а затем применить критерии устойчивости полиномов. Сопутствующие функции Matlab: poly — вычисление коэффициентов полинома по его корням; roots — нахождение корней полинома; angle — вычисление аргумента комплексного числа; rss, drss (CST) — случайное генерирование устойчивой системы в про- странстве состояний (непрерывный и дискретный случаи). 3.4. Частотные критерии устойчивости замкнутых систем Пусть теперь описание системы задано не в пространстве состояний, а с помощью передаточных функций. Как в этих терминах проверить устойчивость, не вычисляя явно характеристический полином? Начнем со случая одномерных систем. Пусть передаточная функция объекта (либо объекта совместно с регулятором) в непрерывной системе имеет вид Где A(s),B(s) — взаимно простые полиномы степеней тип соответ- ственно. причем т п (т. е. выполняется условие реализуемости). Объект замкнут единичной обратной связью (рис. 3.4); тогда передаточная функ- Чия замкнутой системы равна Gc(s) = 1 f й ) = А( гй*Г 1 + G(s) A(s) + B(s)
88 Глава 3. УСТОЙЧИВОСТЬ Таким образом, характеристический полином равен P(s) = A(s) + В(з) и в случае, если Ап В заданы явно, проверка его устойчивости не вы- зывает проблем. Однако во многих случаях нам доступна лишь частотная ЧЯ-----► G(s) Рис. 3.4. Отрицательная единичная обратная связь характеристика разомкнутой системы, т.е. функция G(jw) (вспомним, что во многих практических задачах именно частотная характеристика доступна измерению, см. главу 1). Точка G(jw) при изменении ш от О до оо описывает некоторую кривую на комплексной плоскости, кото- рая называется годографом Найквиста. Задача заключается в том, чтобы по поведению этой кривой сделать выводы об устойчивости замкнутой системы, т.е. о гурвицевости Р(з). Ее простое решение дается нижесле- дующим критерием Найквиста. Теорема 3.7. Пусть передаточная функция G(s) разомкнутой систе- мы имеет р неустойчивых полюсов и п — р устойчивых и не имеет мни- мых полюсов. Тогда замкнутая система (3.20) устойчива, если и только если G(jw) не проходит через точку —1 и делает вокруг нее р/2 оборо- тов против часовой стрелки. Доказательство. Для замкнутой системы P(jw) = A(jw) + B(jw) = B(jw)(G(Jw) + 1), поэтому при изменении ш от 0 до оо AargP(yw) = AargB(jo>) + Д arg (G(J w) + 1). По условию 3 теоремы 3.5 полином P(s) устойчив тогда и только тогда, когда AargP(jw) = тгп/2, P(jta) / 0. В силу предположений о пере- даточной функции G(s) имеем B(jw) / 0 и Д argB(jw) = тгп/2 - пр (см. формулу (3.14)). Таким образом, должно быть G(jw) + 1 / 0 и Д arg(G(jw) + 1) = тгр. Это и означает, что G(jo>) делает р/2 оборотов вокруг точки —1. При этом подразумевается, что 1/2 оборота — это приращение аргумента на тг. Заметим, что при ш = 0 имеем G(jw) = ао/Ьо, а при ш = сю имеем G(jw) = ап/Ъп, если т = п, и G(ju>) = 0, если т < п, т.е. годограф G(jw) начинается и заканчивается на вещественной оси. В частности, если B(s) — устойчивый полином, то критерий Найкви- ста принимает простейший вид: годограф G(jai) не должен охватывать точку —1.
34 Частотные критерии устойчивости замкнутых систем 89 В связи с годографом Найквиста введем понятия, широко употребля- емые в инженерной практике (см. рис. 3.5). Рис. 3.5. Годограф Найквиста. Запасы устойчивости по амплитуде и по фазе Запасом устойчивости по амплитуде L называется величина, обрат- ная расстоянию от нуля до ближайшего к критической точке —1 пересе- чения годографа с отрицательной вещественной полуосью. Запасом устойчивости по фазе <р называется угол между отрицатель- ной вещественной полуосью и той точкой, в которой |G(jo>)| = 1. Ясно, что чем больше эти величины, тем дальше годограф от точки — 1, поэтому они мотуг служить некоторой мерой устойчивости. Напомним, что частоту среза ис, для которой |G(yu>) | = 1, мы уже ввели в п. 1.4 при рассмотрении логарифмической амплитудной характеристики. Таким образом, janac устойчивости по фазе — это значение <р(шс) + л. При рассмотрении проблем устойчивости систем, заданных переда- точными функциями, надо иметь в виду одно обстоятельство, связанное с возможным сокращением нулей и полюсов, т.е. наличием общих корней у числителя и знаменателя передаточной функции. Рассмотрим, например, последовательное соединение объекта с передаточной функцией и ршуляюра Поступая формально, вычисляем передаточную функцию 1 я — 1 1 Я(а) = G(s)G(s) = —Ц- • —г =-------- v к v ' s-1 s + 1 s + 1
90 Глава 3. УСТОЙЧИВОСТЬ и эта передаточная функция устойчива (единственный полюс —1 лежит в левой полуплоскости). Однако соответствующие дифференциальные урав- нения имеют вид и = C(s)w, у = G(s)u, у = H(s)w, й + и = w — w, у — у = и, C{s) G(s) Я откуда, подставляя и в первое уравнение, получаем у — у = W — W. Такое дифференциальное уравнение даже при нулевом входе w = 0 (т. е. у — у = 0) неустойчиво. Действительно, его решение y(t) = cie‘ + с2е^‘, ci = (2/(0) + у(0))/2, C2 = (1/(0) — у(0))/2 растет с ростом t при сколь угодно малом у(0) = е, у(0) = 0. Аналогичным образом даже при нуле- вых начальных условиях при малых w = е решение возрастает. Это про- тиворечие возникло вследствие сокращения неустойчивого корня s = 1. Таким образом, мы приходим к важному выводу: сокращение общих не- устойчивых нулей и полюсов передаточной функции недопустимо. В то же время выводы об устойчивости передаточной функции, имеющей об- щие устойчивые нули и полюса, можно делать и после сокращения этих множителей. Перейдем теперь к случаю многомерных систем. Как мы видели в п. 1.2, передаточная функция системы х — Ах + Ви, У — Сх (3.21) имеет вид B(s) = C(sI-A)-1B = ^, где 1У(з) — матрица, все элементы которой являются полиномами от s, а P(s) = det (si—А) — характеристический полином матрицы А, т. е. P(s) является общим знаменателем всех элементов Я(з). Если задана лишь ма- трица H(s), а не реализация в пространстве состояний (3.21), то критерий устойчивости звучит так: Теорема 3.8. Система с матричной передаточной функцией H(s) ус- тойчива тогда и только тогда, когда полюса H(s) лежат в левой полу- плоскости. Эта теорема есть обобщение теоремы 3.2 на многомерный случай. На- помним, что в п. 1.2 такие матричные передаточные функции мы назвали устойчивыми.
Частотные критерии устойчивости замкнутых систем 91 Многомерный аналог критерия Найквиста отвечает следующей задаче. чапяма матричная передаточная функция G(s) открытой системы; будет ям устойчива замкнутая система, получающаяся путем введения единиц- ей обратной связи? Возникающая конфигурация показана на рис. 3.6 Рис. 3.6. Многомерная система, замкнутая единичной обратной связью (двойные линии отвечают векторным сигналам). Передаточная функция от входа и к выходу у вычисляется так: и — у = е, у = Ge, у = (I+ G)~lGu = Ни. Таким образом, H = (/ + G)-1G, (3.22) и нас интересует устойчивость этой передаточной функции. Рассмотрим годограф g(jw) = det^I + G(Jw)j, 0 ш < оо, и пусть р — число неустойчивых полюсов G(s). Теорема 3.9. Для устойчивости замкнутой системы рис. 3.6 необхо- димо и достаточно, чтобы годограф g(ju>) не проходил через точку 0 и делал вокруг нее р/2 оборотов против часовой стрелки. Доказательство этой теоремы достаточно сложно, и мы его опускаем. Покажем лишь, что в одномерном случае теорема 3.9 совпадает с обыч- яым критерием Найквиста. В самом деле, тогда G{jio) € С и g(jw) = 1 + G(ju'), т. е. g(jw) — сдвинутый на единицу вправо годограф G(jw). Поэтому точка (—1, 0) в теореме 3.7 заменяется на точку (0, 0) в тео- реме 3.9. Проблема устойчивости многомерных систем, заданных передаточ- ными функциями, имеет некоторые особенности по сравнению с одно- мерным случаем. Например, для системы, изображенной на рис. 2.3, мы мели несколько передаточных функций (от входа к выходу, от входа к ошибке и т.д.), однако все они одновременно были или устойчивы, или ««Устойчивы. В многомерном случае это может быть не так. Кроме того, •опрос о сокращении нулей и полюсов матричной передаточной функции
92 Глава 3. УСТОЙЧИВОСТЬ отнюдь не прост, так как само понятие нуля такой функции может быть определено различными способами. Напомним, что мы обозначили через RHqo пространство матричных функций, все элементы которых — вещественные дробно-рациональные реализуемые функции с устойчивыми знаменателями. Открытая система с матричной передаточной функцией H(s) является устойчивой тогда и только тогда, когда H(s) G RH<x>- Чтобы сформулировать условия устойчивости замкнутых систем, рассмотрим конфи1урацию на рис. 3.7, Рис. 3.7. Конфигурация, порождающая четыре матричных передаточных функции где G(s) и K(s) — матричные передаточные функции объекта и регуля- тора, a ci, е2, wi, W2 — векторные сигналы ошибок и входов. Заметим, что здесь мы используем положительную обратную связь1 и изменили обозначение для регулятора. Имеем в1 = W1+ Кв2, 62 = W2+GC1, откуда получаем четыре передаточных функции (от Wi к e-j, i,j = 1,2) (J-KG)"1, (I — KG)~XK, (I-GK)~XG, (J — GK)~X. (3.23) Принято говорить, что система на рис. 3.7 внутренне устойчива, если все функции (3.23) принадлежат RH^, а конфигурация корректна, т.е. матрица / — K(oo)G(oo) (3.24) обратима. Конфигурация рис. 3.7 может быть удобно интерпретирована в тер- минах реализации передаточных функций (см. п. 1.2). Пусть реализации ^Переход к отрицательной обратной связи производится изменением знака регулятора с соответствующими изменениями знака в передаточных функциях.
j 5 Множества достижимости для устойчивых систем 93 объекта и регулятора имеют вид А I В с Ь А В ' К = С D Тогда, обозначая через х и х векторы состояний для G и К, имеем И||111|ВйВ х = Ах + Bei, ' е2 х = Сх + Dei + w2 5 = Ах + Ве2, : ei = Сх + De2 + wi, и для всех передаточных функций могут быть найдены их реализации. Например, ’ А ВС BD ' GK = 0 А В С DC DD Поскольку G(oo) = D, К(оо) = Д то в терминах реализаций условие корректности приобретает вид det (I — DD) / 0. Сопутствующие функции Matlab: margin, allmargins (CST) — вычисление запасов устойчивости по ам- плитуде и по фазе и частоты среза; nyquist (CST) — построение годографа Найквиста. 3.5. Множества достижимости для устойчивых систем Мы видели, что устойчивые системы являются устойчивыми по входу (BlBO-устойчивыми), т. е. их состояния (и выходы) ограничены при огра- ниченны х входах. В этом параграфе мы дадим более точное описание Достижимого множества (т. е. всего множества возможных состояний си- стемы) для входов, ограниченных в норме L% или Ьоо! такое описание нам Неоднократно понадобится в будущем при решении задач оптимального Управления.
94 Глава 3. УСТОЙЧИВОСТЬ 33.1. Ьз-норма Начнем с непрерывной системы со входами, ограниченными в £2- норме: х — Ах + Ви, х(0) = 0, х € R", ueR"1, 7 (3.25) ЦиЦз = / uT(t)w(t)dt 1. о Функция u(t) интерпретируется как внешнее возмущение, однако можно считать ее и управлением. Условие х(0) = 0 не является ограничитель- ным, поскольку при х(0) / 0 решение x(t) представляется в виде x(t) = eAtx(0) + xo(t), где x0(t) — решение при нулевых начальных условиях. Множество S(T) '= |х(Т) : x(t) есть решение (3.25) при некотором и, ЦиЦг 1} называется множеством достижимости в момент Т > 0, а их объедине- ние для всех Т > О S=JS(T) т>о — просто множеством достижимости. Теорема 3.10. Пусть пара (Л, В) управляема, тогда S(T) — элли- псоид S(T) = {ж : хтИгс-1(Т)х 1}, где матрица WC(T) > 0 имеет вид (2.4) т WC(T) = jeArBBTeATTdr. о Если А устойчива, то S — эллипсоид S == : xTiy_1a: где W > 0 — грамиан управляемости ОО w = J еАгВВгеАТт(1т, (3.26) о т. е. решение уравнения Ляпунова AW + WA1, = -ВВт. (3.27)
3.S- Множества достижимости для устойчивых систем 95 Доказательство уже по существу было получено в п. 2.1 при обосно- вании теоремы 2.1 об управляемости. Действительно, там было показано, tfro /’ | > 0 и что управление (2.6) u(t) = переводит точку х(0) = 0 в точку х(Т) — а. Если при этом а е S(T), то, доопределив u(t) на всей полуоси: w(t) = 0 при t > Т, получим ОО I|u(t) Иг = У uT(t)u(t)dt = о ; т = У(а'гЖс-1(Т)еЛ(Г-е)ВВтелТ(т-‘)1Ус-1(Т)а)^ = о = aTWc-\T)a 1, (3.28) т.е. такое управление является допустимым. С другой стороны, там же мы убедились, что приведенное выше управление минимизирует Крите- ОО рий J uT(t)u(t)dt; отсюда и из (3.28) следует, что если a £ S(T), т.е. о ОО aTW-l(T)a > 1, то не существует управления с J wT(t)w(t)dt 1, о переводящего х(0) = 0 в х(Т) = а. Наконец, если А устойчива, то *К(Т) —» W > 0 при Т —» оо, гае W дается формулой (3.26) или, эквива- лентно, является решением уравнения Ляпунова (3.27) (см. Приложение, п. 9.1). Таким образом, достижимое множество для устойчивых систем с огра- ниченным в L2 управлением (или внешним возмущением) имеет очень простой вид — оно является эллипсоидом. Очевидно, что если нас инте- ресует выходная величина у = Сх, ТО достижимое множество выходов У = 0 t < 00 J также является эллипсоидом У=~-[у. yT(CWCT)~ly < 1} (Здесь CWC? > 0, если С — матрица полного ранга). В частности, в Системе с одним выходом у = стх, с 6 Rn, множество У — отрезок |р| (ст1Ус)1/2. (3.29)
96 Глава 3. УСТОЙЧИВОСТЬ В дальнейшем (см. главу 5) нас будет интересовать синтез управления, обеспечивающего минимум выхода при тех или иных допустимых возму- щениях. В частности, оценка (3.29) показывает, что в системах с ограни- ченными в Ь2 возмущениями величина cTWc может служить в качестве критерия оптимальности при выборе обратной связи. Аналогичный результат верен и для дискретных систем. Пусть Xk = Axk-i + Buk~i,, xq = 0, Xk G Rn, Uk G Rm, ~ (3.30) hili = zlu"kUk 1- k-0 Через Sk обозначим множество всех достижимых значений Xk, а через S — их объединение, т.е. множество всех точек, которые могут быть достигнуты из начала координат с помощью допустимых управлений и. Теорема 3.11. Если пара (А, В) управляема, то Sk при k п — эллипсоид: fc-i Sk = {ж : 1}, Wk = А*ВВТ(АТ)\ к>п, г=О а если А устойчива, то S — эллипсоид S = : xTW-1x < 1|, где W = '^А1ВВ'Т(АТ)г, г=0 . т. е. решение дискретного уравнения Ляпунова AWAT -.W = -ВВГ. Доказательство проводится по той же схеме, что и выше, с использо- ванием результатов п. 2.1, относящихся к дискретным системам. 3.5.2. Loo-норма Опишем теперь достижимое множество для управлений (или возмуще- ний), ограниченных не в Дг-норме, а в Loo-норме. В этом случае картина оказывается более сложной. Для задачи х = Ах + Ви, ||u||oo = supfuT(t)u(t)) ^1 (3.31)
j 5 Множества достижимости для устойчивых систем 97 сохраним те же обозначения S(T),S для достижимого множества. Дадим характеризацию этих множеств с помощью опорной функции. Напомним, что для множества X с Rn и вектора с G R” опорной функцией называ- ется ¥>х(с) = шахста:. хЕХ Замкнутое ограниченное выпуклое множество однозначно восстанавлива- ется по опорной функции (т.е. по </?х(с) для всех |с| = 1). Именно, X = {я : стх ¥’х(с), |с| = 1} — пересечение опорных полупро- странств. В нашем случае замкнутость и выпуклость S(T) и S очевидна; множество S(T) всегда ограниченное, а множество S ограничено при предположении об устойчивости системы (см. п. 3.1). Поскольку т а;(Т) = eA(T~r} Bu(r)dT, о то т cTeA(T~T}Bu(r)dr = о т т = J'^B'reAT^T~T^c^dr = |втеАТ’гсрт, о о а при устойчивой А ОО 97s(c) = У |втелТгсрт. о Множества S(T) и S, вообще говоря, не эллипсоиды, но это цент- рально-симметричные выпуклые множества, и их удобно аппроксимиро- вать эллипсоидами. Рассмотрим случай устойчивой системы и назовем эллипсоид 8 = : xTQx 1| с Центром в нуле и матрицей Q > 0 инвариантным эллипсоидом, если из ®(0) е 8 следует, что x(t) G £ для всех t 0, где x(t) удовлетворяет си- стеме х -- Ах + Ви, х(0) 6 8, wT(t)u(t) < 1. Опишем такие эллипсоиды, содержащие все достижимые точки, а затем выделим в некотором смысле «минимальные» из них. Введем V(x) = xTQx; *•>111<>,1як, П.С. Щербаков
98 Глава 3. УСТОЙЧИВОСТЬ тогда V(x) = (Ax+Bu)TQx+xrQ(Ax + Bu) = xT(ATQ + QA)x+2uTBTQx. Если будет V(x) О для всех х таких, что V(x) 1, uT(t)u(t) 1, то траектории системы х = Ах + Ви не смогут выйти из эллипсоида, ибо на его границе V(x) 0, т.е. траектории направлены внутрь £. Итак, £ будет инвариантным эллипсоидом, если из неравенств xrQx 1, uTu 1 следует a:T(ATQ + QA)x + 2urBTQx 0. В соответствии с S-теоремой (теорема П.2 из Приложения), условия ко- торой выполнены, необходимым и достаточным условием справедливости этой системы неравенств является существование таких а /3 0, что a:T(ATQ + QA)x + axTQx — 0иги + 2urBTQx 0 для всех х,и. Иначе говоря, / ATQ + QA + aQ QB \ ] <0. \ BTQ -(31 ) По лемме Шура (лемма П. 1 из Приложения) это эквивалентно неравенству A^Q + QA + aQ + p^QBBpQ^O, 0 > 0. Умножая слева и справа на Р = Q-1, получаем РАТ + АР + аР +/3~1ВВТ ^0. (3.32) Итак, если для каких-то а > /3 > 0 нам удастся найти матрицу Р > О, удовлетворяющую линейному матричному неравенству (3.32), то элли- псоид £ = : хТР~гх 11 будет инвариантным. Обратно, все инвариантные эллипсоиды являются решениями (3.32) при некоторых а > /3 > 0. Заметим, что нас инте- ресуют «минимальные» эллипсоиды (т.е. среди матриц вида рР, удовле- творяющих (3.32), нас интересуют матрицы с минимальным р). Поэтому следует взять максимально возможное Д оно равно а-. Более того, в (3.32) неравенство можно заменить на равенство (лемма П.15). Среди таких эл- липсоидов можно выбрать эллипсоид с минимальным следом trF (или
3 5. Множества достижимости для устойчивых систем 99 trCPC1. если мы имеем дело с выходом у = Сх). Итак, мы пришли к следующему утверждению. Теорема 3.12. Пусть матрица А устойчива, пара (А, В) управляема, а С — матрица полного ранга. Тогда множество достижимых y(t) в системе х = Ах + Ви, i(0) = О, у = Сх, иТи С 1, 0 С t < оо, содержится в эллипсоиде £ = {у: уТ(СРСТ)~1у С 1}, где Р = Р(а), а > 0, — решение уравнения Ляпунова АР + РАТ+ аР + а~1ВВТ = 0, Р > 0. Более того, решая однопараметрическую задачу минимизации mintrCP(a)CT, а>0 получаем эллипсоид, обладающий минимальным следом среди всех элли- псоидов, содержащих достижимое множество по выходу. Случай дискретной системы анализируется практически так же. Пусть xk = Axk-i + Buk-i, х0 = 0, Xk 6 Rn, ик € Rm, Cl, k = 0,1,... Тоща для достижимых множеств Sk,S возможно описание с помощью опорной функции: k— 1 оо •РвДс) = 12|вТ(лТГс|> ^s(c) = 52|вт(Лтус|, 1=0 1=0 но они (как и для непрерывных задач) не являются эллипсоидами. Инва- риантный эллипсоид £ = : хТР~гх С 1 содержащий достижимое множество S для устойчивой А, описывается линейным матричным неравенством —АРАТ -Р+ -^—ВВТ С 0 а 1 — а при а* < а < 1, а* — р2(А), а минимальный эллипсоид находится путем Решения задачи min trP(a), а’<а<1 4‘
100 Глава 3. УСТОЙЧИВОСТЬ где Р(а) — решение дискретного уравнения Ляпунова -АРАТ -Р+ -^—ВВ1 = 0. a 1 — ct 3.5.3. Интегральные оценки Рассмотрим несколько иную постановку задачи о достижимости. Вер- немся к системе (3.25): х = Ах + Ви, гг(О) = 0, ЦиЦг 1, (3.33) но будем интересоваться не множеством значений x(t) в момент t, а интегральной характеристикой системы: ОО J = j xTRxdt, о где R > 0 — некоторая матрица. В частности, при R— I этот показатель совпадает с L2-нормой решения: ОО J == У xTxdt = ЦжЦг- о Нас интересует, какие значения может принимать J для решений си- стемы (3.33) при всевозможных ||u||2 < 1. Ясно, что Jmjn = 0 при и = О (тогда х = 0), поэтому важно найти Jmax — максимальное значение J. Теорема 3.13. Пусть А устойчива, пара (А, В) управляема и при не- котором 7 > О уравнение Риккати АТР + РА + \РВВГР + R = 0 (3.34) 72 имеет решение Р > 0. Тогда I < -у2 Доказательство. Рассмотрим квадратичную форму V (ж) = хТРх с некоторым Р > 0, и пусть для каких-то 7 > 0 и и, ||и||2 < 1> на решениях системы (3.33) выполнено У(а:) — xTRx + 72utu. (3.35)
3 5. Множества достижимости для устойчивых систем 101 Тогда, интшрируя это неравенство от 0 до Т, с учетом того, что V (ж(0)) = 0, получим т т v(x(T)j ~ j xTRxdt+~f2 j uTudt. о о Поскольку V(x(T)) 0, то, переходя к пределу при Т —> оо (что воз- можно в силу устойчивости А), получим ОО оо J = У xTRxdt 72 j uTudt < 72. о о Таким образом, число 72 дает верхнюю оценку J. Покажем теперь, как удонлс торить неравенству (3.35). На решениях (3.33) имеем V(x) = (Ах + Ви)тРх 4- хтР(Ах + Ви), поэтому (3.35) принимает вид х1 (АТР 4- РА + R)x + хтРВи 4- итВтРх — 72uTu 0. Оно будет заведомо выполнено, если мы потребуем его выполнения для любых пар х, и, а не только тех, которые являются решением (3.33), т. е. если / АТР 4- РА 4- R РВ \ I С 0. (3.36) \ ВТР -72/ / Иначе говоря, если линейное матричное неравенство (3.36) имеет решение Р > 0, то J < 72. В свою очередь, (3.36) эквивалентно в силу леммы Шура (лемма П.1 из Приложения) квадратичному матричному неравенству гг. 1 гтл ЛТР 4- РА 4- -хРВВтР + R 0, 72 которое имеет решение Р > 0, если уравнение Риккати (3.34) имеет решение Р > 0. Можно показать, что таким образом получается точная (а не завышен- ная) оценка Jmax, т.е. что существует такое и, ||u||2 1, что /пш = min {72 : уравнение (3.34) имеет решение Р > 0}. Алгоритм подбора такого минимального 7 легко построить, последо- вательно проверяя существование положительно-определенного решения Уравнения (3.34) при различных 7.
102 Глава 3. УСТОЙЧИВОСТЬ Отметим, что величина для выхода у = Сх системы (3.33) в соответствии с (1.34) равна Нто- норме передаточной функции: шах ||у||2 = ||Я(в)||оо = ||С(Я - 4)~1В||ОО, поэтому вычисленная выше величина Jmax равна Лпах = ||Я(8)||^ для С = R42 (поскольку J = ||у||2, у = R^2x). Иначе говоря, при- веденный способ позволяет вычислять Д»-норму передаточной функции линейной системы. Сопутствующие функции Matlab: f easp (LMIC) — решение линейных матричных неравенств общего вида; lyap, diyap (CST) — решение уравнения Ляпунова в непрерывном и дискретном времени; care, dare (CST) — решение уравнения Риккати (непрерывный и дис- кретный случаи); sqrtm — вычисление квадратного корня от матрицы. 3.6. Сверхустойчивость Устойчивость — асимптотическое свойство; оценки (3.3), (3.13), (3.10), справедливые для всех моментов времени, включают некоторую константу С, которая может быть весьма велика. В таком случае на на- чальном участке траектории может наблюдаться эффект «всплеска» — резкого роста траектории. Мы увидим впоследствии, что такие явления часто возникают при стабилизации системы. Чтобы их избежать, выде- лим класс «сверхустойчивых» систем, для которых норма решения мо- нотонно убывает. Кроме того, преимущество такого перехода к более узкому классу систем заключается в том, что сверхустойчивость сохраня- ется и для нестационарных систем, а также при наличии нестационарных и нелинейных возмущений. Наконец, в главах 4, 5 и 7, где будут рассмо- трены вопросы стабилизации по выходу, подавления ограниченных возму- щений и робастной устойчивости при матричной неопределенности, мы покажем, что для сверхустойчивых систем эти задачи допускают простое решение методами линейного программирования. Подчеркнем особо, что всюду в этом параграфе используем оо-норму для векторов.
3.6- Сверхустойчивость 103 3.6.1. Сверхустойчивость линейных стационарных систем Матрица А = ((ay)) G Rnxn непрерывной системы х = Ах + Ви (3.37) называется сверхустойчивой, если у нее на диагонали стоят отрицатель- ные числа и они по абсолютной величине превосходят сумму модулей ^диагональных членов по строке1: minf-a» - Iflijl) = <г(А) = <т > 0. (3.38) Такие матрицы, как нетрудно показать, являются устойчивыми (т.е. шах, {Re А,} < 0, где А, — собственные значения А), но не наоборот. На- 1 5 \ 0 _1 ) 8ВЛяется устойчивой (Ai = Аг = М), но не сверхустойчивой (<т = —4). Систему (3.37) со сверхустойчивой ма- трицей А также будем называть сверхустойчивой. Теорема 3.14. Если система (3.37) сверхустойчива, то а) при u(t) = 0 справедлива оценка |x(t)| k(0)|e-<Tt; (3.39) б) при sup|u(t)| 1 и любом начальном |х(0)| < 7 = ||B||i/o- имеем t>0 ' для всех t 0 |x(t)| 7. (3.40) Доказательство. Покажем, что для сверхустойчивой А ||ел‘||1 e~at. Для малых t = 5t справедливо eASt « I+A5t, т.е. для матрицы М = eASt с элементами ту имеем mu « 1 + flu6t > 0, TTlij (Lij 8t, так что 1-МЦ1 - тахУ\|тп,7| «тах01 +au8t\ + 5tlaol) = j j^i = max^l + {an + l — o8t < e~aSt. j& *Такие матрицы часто называют матрицами с отрицательным диагональным доминиро- ^нием. а иногда — А называют матрицами Адамара.
104 Глава 3. УСТОЙЧИВОСТЬ Поэтому для произвольного t = NSt, 5t мало, справедливо z \ N и-At и _ «< I a—cr6t \ _ —at це ||1 = це ||i це Hi Iе J —е Отсюда, используя явные формулы для решения (3.1) и (3.9), получаем оценки теоремы. Свойство а) — это устойчивость системы по начальному приближе- нию. Из (3.39) следует, что у сверхустойчивой системы существует функ- ция Ляпунова, не являющаяся квадратичной, именно: V(x) = |я|. Такая функция растет линейно по любому направлению: V(Arr) = AV(x) для любого х и любого А > 0; она является кусочно-линейной и недиф- ференцируемой. В то же время у нее есть свойства и обычных функций Ляпунова: V(x) 0, причем V(x) =0 только для х = 0, она выпукла и растет на бесконечности. Функция v(t) = V(x(t)), где x(t) — решение системы х = Ах, ж(0) = х0, монотонно убывает; она, вообще говоря, не- дифференцируема, но у нее существует левая и правая производные v_ (t), i>+(t), причем V- — av, v+ < — av. Это может быть показано так же, как в доказательстве теоремы 3.14. Важно отметить, что отличие от просто устойчивых систем заключа- ется в том, что для устойчивых матриц оценка (3.39) заменяется на (3.3): |ге(£)| С(А, iz)|a;(0)|e—, 0 < v < min{—Re А,}, г где константа C(A,v) может быть весьма большой. При этом норма x(t) не убывает монотонно с ростом t, а может возрастать при малых t. На- пример, для той же матрицы А = ( q ПРИ х(0) = (1'> !)Т будет т(1) « (2,207; 0,368)т, т.е. |х(1)| возрастает более чем вдвое по сравнению с |ж(0)| (см. подробнее в п. 4.3). Для сверхустойчивых си- стем нет этого нежелательного эффекта всплеска на начальном участке траектории. Свойство б) — это устойчивость системы по входу (В1ВО-устойч- вость). При этом куб {х € Rn : |i| < ||В||i/сг} называется инвариантным множеством для (3.37), т. е. траектории, начинающиеся в этом множестве, остаются в нем при всех допустимых возмущениях и. Изложенное относилось к непрерывному случаю, однако аналогичное понятие вводится и для дискретных систем. Матрица А = ((агз)) € RnX" дискретной системы Xk = Axk-i + Buk-i (3.41)
3.6. Сверхустойчивость 105 называется (дискретно) сверхустойчивой, если Q = Hili < 1- Как и в непрерывном случае, такие матрицы устойчивы (т.е. р(Л) = tnaxt |At(^)l < 1), но не наоборот. Аналог теоремы 3.14 для дискретных сверхустойчивых систем дается следующим результатом. Теорема 3.15. Пусть система (3.41) сверхустойчива. Тогда а) если ик = 0, то для любого fc > 1 |xfe| С ko|; (3.42) б) если |itfc| 1 для всех к 1, то при |хо| 7 = ||-B||i/(l -q) будет kfc|^7, к = 1,2,... (3.43) Доказательство. Утверждение а) следует из того, что для любого к 1 к*|, HAiiikfc-ii = 9kfc_i|. В случае б) имеем для любого А: > 1 |xfe| MUikfe-il + ||B||i|ufc_i| < ?kfc_i| + ||B||i, и если !a\-i| < ||В||i/(l — q), то из последнего неравенства получаем I I IMII1 II „и kfcl + Mill = откуда по индукции приходим к (3.43). Как и для непрерывного времени, полученные оценки говорят о моно- тонности убывания нормы решения сверхустойчивой системы и наличии инвариантного множества — куба {х 6 Rn : |х| ||B||i/(1 - ||Л||i)}. Выше отмечалось (конец п. 3.3), что эффективных методов проверки устойчивости матриц не существует. В то же время проверка сверх- устойчивости матриц не вызывает никаких проблем, так как эти условия формулируются непосредственно в терминах элементов матрицы, а не ее собщвенных значений. 3-6.2. Нестационарные системы и другие вопросы сверхустойчивости В отличие от устойчивости, сверхустойчивость сохраняется и в неста- Чионарнпм случае, а также при наличии нестационарных и нелинейных Смущений. Рассмотрим более общую систему, чем (3.41): хк+1 = Акхк + }к(хк),
106 Глава 3. УСТОЙЧИВОСТЬ где матрицы Ак могут зависеть от времени, а возмущения fk(xk) — и от времени к, и от состояния. Теорема 3.16. Пусть для всех к выполнено 11Л111 Г < 1, \fk(xk)\ < а +0\хк\, ОЛ0<1-г. Тогда а) при а = 0 справедливо \xk\ Q*ko|, q = r + 0<l, к = 1,2,...-, б) при а > 0 и |яч>| 7 = а/(1 — ч) справедливо кк| ^7, к = 1,2,... Доказательство дословно повторяет доказательство теоремы 3.15. Важно отметить, что для устойчивых систем аналогичная теорема не- верна; в частности, для них не выполняется свойство а): решения системы xjt+i = Акхк могут не стремиться к нулю, даже если все матрицы Ак „ л л / 0 2 \ . устойчивы. Например, пусть Ао = = ... = I g I, Ai = Аз = ... = ( 2 2 ); тогда при х0 = (0; 1)т будет x2k = (0; 22fc)T -* оо, \ kJ U у хотя все матрицы Ак устойчивы, р(Ак) — 0. Непрерывным аналогом теоремы 3.16 служит следующий результат. Теорема 3.17. Пусть для всех t > 0 система i(t) = A(t)x(t) + /(t,x(t)) удовлетворяет условию ст(А(4))>ст>0, < а + Да:(£)|, 0 /3 < ст. Тогда а) при а = 0 справедлива оценка |or(t)| е~(<т~/^*|а:(0)|, 0 t < оо, б) при а > 0 для любого |х(0)| 7 = а/(ст - Д) выполняется |x(t)| 7> 0 t < оо. Рассмотрим некоторые дополнительные свойства сверхустойчивых систем.
3.6. Сверхустойчивость 107 1. Спектральные свойства. Сверхустойчивые матрицы образуют под- множество устойчивых матриц. Накладывает ли сверхустойчивость какие- либо ограничения на расположение собственных значений? Лемма 3.4. Если матрица А G Rnxn непрерывной системы сверх- устойчива, то ее собственные значения лежат в секторе Sn = {X G С : | argX — тг| (1 — п_х)тг/2}. В частности, при п = 2 собственные значения лежат в прямом угле, биссектриса которого совпадает с отрицательной полуосью: Xi G S2 = {А = и 4- jv : и < 0, — и > а при росте п сектор стремится к полной левой полуплоскости. Если же матрица А дискретно сверхустойчива, то при п = 2 ее соб- ственные значения принадлежат ромбу Xi G 7£2 = {А € С : |A|i < 1}, (т.е. |ut| + |и,| < 1, Xi = Ui+jvi); при n > 2 характеризация расположе- ния собс i венных значений более сложна. Устойчивость инвариантна относительно линейного преобразования координа г (так как А и ТАТ-1 имеют одни и те же собственные значе- ния). Напротив, поскольку сверхустойчивость формулируется в терминах элементов матрицы, а не ее собственных значений, то это свойство может теряться или, что важнее, приобретаться при переходе к другой системе координат. Одна из простейших ситуаций, когда устойчивая матрица ста- новится еверхустойчивой в новых координатах, описывается следующей леммой. Лемма 3.5. Пусть матрица A G RraX” дискретной системы имеет различные собственные значения, которые принадлежат ромбу 7?г- То- гда невырожденным вещественным линейным преобразованием коорди- нат она может быть сделана сверхустойчивой. Доказательство. Согласно лемме П.9 (см. Приложение) матрица А вещественно подобна блочно-диагональной матрице (П.6) с 2 х 2 веще- ственными блоками ( U1 Vt ) и 1 х 1 блоками Aj 6 R. Поскольку \ Vi tli J l^»| < 1 для Xi G R и |uj| + |vi| <1 для Aj = щ+jvi G С, то это и означает (Дискретную) сверхустойчивость матрицы А в новых координатах. Совершенно аналогичный результат справедлив в непрерывном случае, *•0 вместо ромба 75-2 фигурирует сектор $2- 2. Сверхустойчивость одномерных систем. Рассмотрим одномер- аналог сверхустойчивости. Пусть вместо многомерной дискретной
108 Глава 3. УСТОЙЧИВОСТЬ системы (3.41) задана скалярная система, описываемая разностным урав- нением n-го порядка: Хк = Р1Хк-1 +Р2Хк-2 + • • • +РпХк-п + ик, (3.44) где Xk G R1, Uk 6 R1. Вводя оператор сдвига zxk = xk-i, приходим к записи P(z)xk = Uk, P(z) = \-pXZ~ p2Z2 - ... - pnZn, и система устойчива (т.е. хк —> О при любых начальных условиях Х-п,х~п+1, - • ,x-i и Uk = 0), если полином P(z) устойчив, т.е. его корни лежат вне единичного круга. Скажем, что полином P(z) сверхустойчив, если п £>|<1. (3.45) г=1 Вспомним, что в п. 3.3.3 это условие приводилось как достаточное условие устойчивости дискретного полинома. Для одномерных систем со сверх- устойчивым P(z) имеют место результаты, аналогичные теоремам 3.15 и 3.16. Теорема 3.18. Пусть задана скалярная система P(z)xk = G(z)uk, где G(z) = g^z + ... + gmzm, а полином P(z) = 1 + piz + ... + pnzn сверхустойчив. Тогда а) при Uk = Q справедлива оценка / \ fc/n+l Ы <U||P(z) - l||ij max Jzi|, fc = 0,l,...; б) при |ufc | 1, k = 0,1,..., и любых начальных |ж_п[ 7,..., < 7, где IRII- 7 1-||P(z)-l||1’ будет к*| < 7, к = 0,1,... Отметим, что стандартный переход от скалярной системы (3.44) n-го порядка к эквивалентной записи в пространстве состояний (т.е. к канонической управляемой форме) не приводит к сверхустойчивой матрице.
3.7. Выводы 109 Открытым остается вопрос об одномерном аналоге сверхустойчиво- сти для непрерывных систем. По-видимому, не существует никакого ра- зумного варианта сверхустойчивого полинома, корни которого должны лежать в левой полуплоскости. 3. Точность оценок. Еще одна проблема связана с тем, насколько за- вышены оценки, полученные в теоремах 3.14, 3.15, которые дают лишь верхние границы для соответствующих величин. Не вполне ясно» сколь сильно они отличаются от истинных значений. Нетрудно построить при- меры, показывающие, что разница может быть очень велика. Например, О 0 ) ’ < l,:Efe+1 == будет Xk = 0, к 2 при любом хо, тогда как (3.42) дает \xk\ < |<?|fc|xo|- Однако для этой же матрицы в неоднородной системе х*+1 = Ахь + «ь, |и&| 1, из (3.43) следует |zjt| 1/(1 — kl)> тогда как sup|х*| = 1 + |g|, т.е. разница не столь драматически велика, если |д| не слишком близко к 1. Численное мо- делирование (генерировались сверхустойчивые случайно распределенные матрицы, и для них вычислялись оценки (3.43) и supfc |хь|) показало, что отношение составляет 1,53; 2,51; 3,41 и 4,32 при п = 2; 5; 10 и 20 соответственно. Сопутствующие функции Matlab: cdf2rdf — приведение матрицы к вещественной блочно-диагональной форме (П.6). 3.7. Выводы • Непрерывная система, заданная в пространстве состояний х — Ах + и, называется устойчивой, если x(t) —> 0 при t -> оо для любого х(0) при и = 0 При наличии внешнего входа и система называется устойчивой, если Xi t) остается ограниченным при любом ограниченном входе u(t) (BIBO ус гойчивость). Необходимое и достаточное условие устойчивости сисгемы. Re А, (А) < 0 (матрица А турвицева). При этом если и = 0, то Для всякого 0 < и < а = min{—ReAj} существует такое С = С(А,и), что * |x(t)| С С'|я;(0)|е-*'*, т-е. имеет место экспоненциальная скорость стремления x(t) к нулю; если же возмущение u(t) ограничено для всех t, то турвицевость А до- статочна .щя ограниченности решений х = Ах + Ви (теоремы 3.1 и 3.3). Величина о = <т(А) называется степенью устойчивости системы. В дискретном случае устойчивость определяется так же, как и в непре- рывном: Xk —» 0 при к —юо для любого хо- Необходимое и достаточное
110 Глава 3. УСТОЙЧИВОСТЬ условие устойчивости: р(А) = max|A,(A)| < 1 (матрица А — шуров- ская или дискретно-устойчивая). При этом для любого £ > О, р + е < 1 существует такое С = С(А,е), что |xfc| < С|х0|(р + e)fc, т.е. стремление к нулю происходит со скоростью геометрической про- грессии (теорема 3.4). Устойчивость линейной системы эквивалентна существованию квадра- тичной функции Ляпунова вида V = хгРх, Р > 0, которая положительна и монотонно убывает на решениях x(t) системы. • Полином называется гурвицевым (устойчивость в непрерывном вре- мени), если Re Aj < 0 для всех его корней, и шуровским (устойчивость в дискретном времени), если |AJ > 1. Графические критерии позволяют делать выводы об устойчивости по- линома Р(-) по поведению годографа P(jw) в непрерывном случае (кри- терий Михайлова) и Р(е’ш) в дискретном случае. Алгебраические критерии устойчивости формулируются в терминах коэффициентов полиномов. Алгоритмы проверки устойчивости основаны на понижении степени полинома: в непрерывном случае — это алго- ритм Рауса, лемма 3.1; в дискретном случае — алгоритм Рауеа-Шура, лемма 3.2. • При описании в частотной области выводы об устойчивости за- мкнутой системы можно делать по поведению годографа передаточной функции разомкнутой системы. Критерий Найквиста (теорема 3.7) дает необходимые и достаточные условия устойчивости одномерной Системы, замкнутой единичной обратной связью. При анализе устойчивости систем, заданных передаточными функци- ями, не допускается сокращение общих неустойчивых нулей и полюсов. • В многомерном случае система, заданная матричной передаточной функцией, устойчива тогда и только тогда, когда ее полюса лежат в левой полуплоскости; иными Словами, когда она принадлежит РНЖ (поскольку рассматриваются лишь реализуемые передаточные функции). Если ма- тричная передаточная функция разомкнутой системы равна G(s), то со- гласно многомерному аналогу критерия Найквиста (теорема 3.9) устойчи- вость замкнутой системы с передаточной функцией Н(з) = (I + G')~1G определяется по поведению годографа = det(/ + G(jw)). • Устойчивость многомерных замкнутых систем формулируют как внутреннюю устойчивость; при этом обычно используют конфигурацию на рис. 3.7. В такой системе присутствуют четыре передаточных функции (l-KG)~\ {I — GK)~lG, (I-KG)~'K, (I-GK)-1, где G(s) и K(s) — матричные передаточные функции объекта и ре- гулятора. Говорят, что система внутренне устойчива, если все четыре
j_7 Выя>’111 111 функции принадлежат ЯНоо, а конфигурация корректна, т.е. матрица / _ K(oo)G\oo) обратима. • Множеством достижимости системы х = Ах + Ви, у = Сх называй п. я множество S С R” ее возможных состояний для всех вход- ных сигналов, ограниченных в какой-либо норме. Для устойчивых систем множества достижимости ограничены и допускают простое описание. В случае Z/2-нормы (||u||2 1) множество достижимости — эллипсоид, описываемый теоремой 3.10: если А устойчива и пара (А, В) управляема, то , , S = |х : хт\У~гх 1 где W >0 — решение уравнения Ляпунова AW + WАт = -ВВТ. При этом достижимое множество выходов У = |y(t) = Cx(t), 0 t < оо| также является эллипсоидом У={у- yT(CWCTr1y^l}. Аналогичный результат верен и для дискретных систем, с той лишь раз- ницей, что матрица W, задающая эллипсоид достижимости, является ре- шением дискретного уравнения Ляпунова AW АТ + ВВТ = W. В системе с одним выходом (у — стх) множество Y — отрезок |у| (стИлс)1^2, поэтому величина crWc может служить показателем качества управле- ния (при минимизации выхода) при выборе обратной связи в системах с возмущениями, ограниченными в £г-норме. В случае £2-нормы можно интересоваться не множеством значений, а интегральной оценкой: ОО J = j xTRxdt, о *Яе R > 0 — некоторая матрица. При R = I этот показатель совпадает с ^2-нормпй решения: J = ЦагЦг. поэтому величина J характеризует «раз- мер*. множества достижимости, и нас интересует Jmax — максимальное Зйачение J. Ответ дается теоремой 3.13: если А устойчива, пара (А, В) Управляема и при некотором у > 0 уравнение Риккати АТР + РА 4- ±;РВВТР + R = 0 72
112 Глава 3. УСТОЙЧИВОСТЬ имеет решение Р > 0, то Jmax 72 (причем эта оценка — точная, т. е. су- ществует такое ЦиЦг 1, что Jmax = min{72 : уравнение Риккати имеет решение Р > 0}). Последовательно проверяя существование положитель- но-определенного решения уравнения Риккати при различных 7, нахо- дим минимально допустимое 7 и «истинное» Jmax. С помощью та- кого алгоритма вычисляется Ноо-норма передаточной функции H(s) = C(sl — А)"1 В системы с выходом у = Сх при С = Я1/2. В случае -нормы (ЦнЦоо 1) множество S не является эллипсои- дом, но может быть хорошо аппроксимировано эллипсоидом (поскольку оно оказывается выпуклым и центрально-симметричным). Пусть А устой- чива; тогда £ = {я : x^Qx 1J называется инвариантным эллипсоидом, если из х(0) е £ следует, что x(t) е £ для всех t 0, где х{£) — решение системы при ||u||oo 1. Если А устойчива, пара (А, В) управляема, а пара (А, С) наблюдаема, то теорема 3.12 дает описание минимального инвариантного эллипсоида (в смысле следа матрицы, его задающего), содержащего множество дости- жимых выходов системы. • Матрица А = ((а^)) € Rnxn непрерывной системы называется сверхустойчивой, если ац < 0, min^—ац — = o' > О, при этом и саму систему называем сверхустойчивой. В сверхустойчивой системе х = Ах + Ви при отсутствии возмущений (и = 0) справедлива оценка k(t)|oo k(0)|ooe~<Tt, а при наличии ограниченных возмущений ||u||oo С 1 — оценка |x(t)|oo < -||В||1 при |х(0)|оо -||В||1 а ст (теорема 3.14). Сверхустойчивость представляет собой простые достаточ- ные условия устойчивости, выделяющие класс систем, Для которых норма решения x(t) монотонно убывает — в отличие от просто устойчивых си- стем, для которых норма убывает в асимптотике, а при малых t возможен всплеск (резкий рост траектории). Аналогичными свойствами обладает и дискретная система, матрица А = ((ay)) которой дискретно сверхустойчива, т. е. для которой || А|| 1 < 1 (теорема 3.15). Для дискретного случая имеется одномерный аналог
3.7. Выводы________113 сверхустойчивости, именно, полином P(z) = pnzn + ... +ptz + р0 на- зывается сверхустойчивым, если 52"= i |pd < |Ро|; при этом для скаляр- ной системы, заданной разностным уравнением, соответствующим поли- ному Р(г), аналогичные результаты даются теоремой 3.18. Если в нестационарной системе i(t) = A(t)x(t) матрица A(t) сверх- устойчива при любом фиксированном t, то система сверхустойчива, тео- рема 3.17 (этот вывод совершенно неверен применительно к устойчиво- сти). Поскольку сверхустойчивость формулируетсая в терминах элементов матриц, то она неинвариантна относительно преобразования координат, т. е. может теряться или, наоборот, приобретаться в новых координатах.
Глава 4 СТАБИЛИЗАЦИЯ В предыдущей главе обсуждалось важнейшее понятие устойчивости линейных систем. Однако открытая система может быть неустойчивой; тогда можно пытаться добиться устойчивости замкнутой системы путем введения обратной связи. Различные способы подобной стабилизации ис- следуются в настоящей главе. 4.1. Стабилизация с помощью регуляторов низкого порядка Пусть одномерный объект записывается с помощью передаточной функции G(S) = A(s) B(s)’ A(s) = ao+ais+...+amsm, B(s) = b0+bis+.. .+bnsn, m^n. Мы хотим замкнуть систему с помощью регулятора (см. рис. 4.1) ( } D(s) так, чтобы замкнутая система была устойчивой. Как мы знаем, характе- ристический полином имеет вид P(s) = A(s)AT(s) + B(s)Z>(s). Таким образом, нужно выбрать полиномы N(s) и £>(s) так, чтобы P(s) был гурвицевым. В такой постановке мы исследуем задачу в п. 4.2, а сейчас рассмотрим ситуации, когда C(s) имеет простейший вид и зависит от одного-двух параметров. Рис. 4.1. Стабилизирующий регулятор
4.J Стабилизация с помощью регуляторов низкого порядка 115 4,1.1. П-регулятор Наиболее элементарным представляется случай, когда С(з) — про- порциональный регулятор (П-регулятор): С(з) = к и выбору подлежит коэффициент усиления к > 0. Характеристический полином имеет вид Р(з)=В(з)+кА(з), и его корни являются функциями от к (при к = 0 они совпадают с кор- нями В(з), а при к = оо — с корнями 4(a)). Можно исследовать поведе- ние этих корней графически; такой метод называется методом корневого годографа. Однако в двух важных частных задачах решение находится проще. а) Устойчивый объект (полином В(з) устойчив). Тогда разомкнутая система устойчива и в принципе нет нужды во введении обратной связи. Однако в ряде задач обратная связь вводится для других целей; более того, важно иметь как можно более высокий коэффициент усиления. Ха- рактеристический полином P(s) = B(s) + kA(s) устойчив при малых к (поскольку В(з) устойчив); вопрос заключается в том, каково критиче- ское значение А:криг, при котором происходит потеря устойчивости. Ответ на него немедленно следует из критерия Найквиста. Действительно, там мы рассматривали объект с передаточной функцией G(s) и единичную обратную связь, а вышеприведенная задача эквивалентна объекту с переда- точной функцией fcG(s) и также единичной обратной связью. Вспоминая формулировку критерия Найквиста для устойчивого объекта и проводя «масшт абирование» вещественной оси, получаем критерий устойчивости. Теорема 4.1. Объект с устойчивой передаточной функцией G(s) и коэффициентом усиления к в цепи обратной связи устойчив тогда и только тогда, когда годограф Найквиста G(jw) не охватывает точки -l/k. Таким образом, один и тот же годограф решает вопрос об устойчиво- сти для любых значений к. Более того, немедленно решается и задача о максимальном &хрит: ккрт ~ > /С Чв к — точка самого левого пересечения G(jw) с отрицательной ве- щественной полуосью (рис. 4.2, слева). Это объясняет термин «запас по амплитуде», введенный в гл. 3. Отметим, что в некоторых случаях — если G(jw) не пересекается с отрицательной полуосью — йхриг = оо (рис. 4.2, справа), т.е. возможны сколь угодно большие коэффициенты усиления, сохраняющие устойчи- аость замкнутой системы.
116 Глава 4. СТАБИЛИЗАЦИЯ Рис. 4.2. Критический коэффициент усиления п Рис. 4.3. Последовательное соединение звеньев первого порядка с П-регулятором в цепи обратной связи Пример 4.1. Рассмотрим цепочку п одинаковых звеньев первого по- рядка с передаточной функцией PK(s) = 1/(1 +Ts), Т > 0, соединенных обратной связью с П-ретулятором (рис. 4.3). Тогда передаточная функция разомкнутой системы (см. правило (1.16) для последовательного соединения) равна GW=(nW Полином B(s) = (1 + Ts)n очевидно устойчив (все его корни равны -1/7* <0) и = (1 + Т»п = z = 1 + Tjw, \z\ = \/1 + Т2ш2, ср = arctgTw,
4.1 CiаПи-1 изация с помощью регуляторов низкого порядка 117 G(ju>) = (1 + T2w2) п/2 (cosnip - j sin пр). Точки пересечения годографа с вещественной осью отвечают значени- ям для которых sin пр = 0, т. е. пр = l-к, где I = 0, ±1,... При этом ReG(jw) дня таких точек равно ±(Ц-Т2а>2)~п/2. Нас интересуют точки с отрицательной вещественной частью и та из них, для которой -Re G(jw) ирулммяльна: при п > 2 она соответствует I = 1. Тогда р = тг/п, arctgТшкрит = тг/п, Тшкрт = tgrr/n, т.е. к = -(1 + Т2ш2рит)~п/2 = _(1 + tg27r/n)-”/2 = — (cos тг/п)". Окончательно получаем значение максимального коэффициента усиления fcKpm = (cos тг/п)"’ П > 2- (4Л) Нетрудно проверить, что при п = 1,2 замкнутая система устойчива при любом к > 0 (действительно, характеристический полином P(s) = (1 + Те)" + к при п — 1,2 и любом к > 0 гурвицев). Например, при п = 3 из формулы (4.1) получаем /скр1ГГ = 1/(0,5)3 = 8; это же следует из критерия устойчивости для кубического полинома P(s) = (1 + Ts)3 + к : 9Т3 > (1 + fc)T3, и к < 8. б) Минимально-фазовый объект. Так называется объект, для кото- рого полином A(s) устойчив, ат > 0. Как и ранее, характеристический полином равен F(s) = B(s) + M(s) = fc(A(s)+eB(s)), е = 1/к, (4.2) поэтому Р(з) устойчив тогда и только тоща, когда P£(s) = A(s)+eB(s) устойчив. На первый взгляд ситуация аналогична рассмотренной выше — A(s) уеюйчив, и можно ожидать, что при 0 < е < екриг сохраняется устойчивость. Однако в действительности такой вывод, вообще говоря, не верен. Дело в том, что т — степень полинома А — может быть меньше п — степени В, и даже при малых е > 0 устойчивость может теряться. Более точный результат учитывает этот эффект. Построим обращый годограф Найквиста я0и)“зЙ)' »«“<«>• Он всюду определен, так как A(s) устойчив, и потому A(jw) / 0 при любом ш. Найдем ш* из условия 1тЯ(уш) = 0, ReB(jw)<0, ReB(jw)-»max
118Глава 4. СТАБИЛИЗАЦИЯ (т. е. найдем корни уравнения Im H(ju>) = 0 и среди них найдем тот, для которого Re отрицательно и наиболее близко к нулю) и поло- жим и -Re H(jw*) (если такого ш* нет, и = 0). Теорема 4.2. Пусть выполнено любое из условий а) п = т, б) п = т + 1, Ьп > 0, в) п — т 4” 2, Ьп > 0, b^-i > 0, Ojnbn—1 Дщ—ibn- Тогда при 0 С £ < £Криг = и (т. е. при к > 1/р) замкнутая система (4.2) устойчива. В остальных случаях полином Ре(з) неустойчив при малых е. Доказательство. При п = т доказательство остается таким же, как и для устойчивого случая, лишь А и В меняются ролями. При п = т + 1 покажем, что полином P£(s) = 4(s) + eB(s) = ao + ebo + ... + (an_i + ebn-Js”-1 + ebnsn устойчив при малых £ > 0, если bn > 0. В самом деле, понижая степень Р£(з) с помощью леммы 3.1, приходим к полиному степени п — 1, коэф- фициенты которого лишь членами порядка е отличаются от коэффициен- тов Л(в) и который, следовательно, устойчив в силу устойчивости 4(s). Для п = т + 2 имеем P£(s) = ao + еЬо 4- ... 4- (an_2 4- sbn_2)sn 2 + Ebn-isn 1 + ebnsn. Понижая степень Ре(з) с помощью леммы 3.1, приходим к полиному сте- пени п - 1, у которого старший коэффициент равен ebn-i, следующий равен an~2 + £bn_2 — («п-з + £Ьп-з) , и оба они по условиям по- L on-i J ложительны (второй — в силу малости е). Вновь применяя лемму 3.1 и пользуясь алгоритмом Рауса, получаем, что последующие элементы пер- вого столбца таблицы Рауса для полинома A(s) + eB(s) отличаются от соответствующих Элементов таблицы Рауса для A(s) лишь членами по- рядка е, т.е. положительны для малых е в силу устойчивости Л(з). Отсюда следует утверждение теоремы в случае в). Более того, если в случаях б) или в) соответствующие неравенства не выполнены, то коэф- фициенты Р£(з) имеют разные знаки (например, при п = т 4- 1, Ьп 0, старший коэффициент равен ebn < 0, а младший a0 4- еЬо > 0) и потому Р£(з) неустойчив по критерию Стодолы (см. п. 3.3). Наконец, при п > т 4- 2 полином P£(s) имеет т корней, близких к корням А(з) (и потому лежащих в левой полуплоскости) и п — т 3 корней, уходящих в бесконечность при е —» 0 под равными углами. Такие корни не могут все оставаться в левой полуплоскости, поэтому при п - т 3 устойчивости при малых е не может быть. Таким образом, в двух случаях можно заведомо стабилизировать си- стему с помощью П-регулятора: для устойчивых объектов (с помощью
Стабилизация с помощью регуляторов низкого порядка 119 калого коэффициента усиления) и для минимально-фазовых объектов (с помощью большого коэффициента усиления). 4.1 >2* Р-разбиение Стабилизировать объект с помощью П-регулятора можно лишь в ред- ких случаях; как правило, приходится прибегать к помощи регуляторов более сложной структуры. Простейшим из них является пропорциональ- но-интегральный регулятор (ПИ-регулятор): C(s) = ki + кг/s. (4.3) Иногда рассматривают и другие аналогичные формы регуляторов, на- пример, C(s) = _*l_ C(s) = — ' s + кг ' ' 1 + и т.д. Важно, что они зависят лишь от двух параметров кг, к2, поэтому и характеристический полином будет зависеть линейно от этих же двух парамшров: Р(з, к) = Р0(з) + *1P1(s) + кгРг(з), к = (кц кг). (4.4) Например, для ПИ-ре1улятора (4.3) будет Po(s) — B(s)s, Pi(s) = A(s)s, AW = А(а). Оказывается, для характеристического полинома вида (4.4) можно указать области на двумерной плоскости {fci, к2}, в которых он будет обладать заданным количеством корней в левой и правой полуплос- кости (и, в частности, область, отвечающая всем корням в левой по- луплоскости, соответствует устойчивой системе). Этот метод называется D-разбиением плоскости параметров; его идея заключается в следующем. Пусть при каком-либо значении к степень полинома P(s, к) равна п и он имеет т п корней в левой полуплоскости и п — т корней — в правой. Как при изменении к может измениться расположение корней? Ясно, что Это может произойти только в одном из следующих случаев: а) изменится степень многочлена P(s,k); б) вещественный корень P(s, к) перейдет из одной полуплоскости в Сфугую, т. е. станет равным нулю; в) пара комплексных корней перейдет из одной полуплоскости в дру- гую. т. е. P(s, к) будет иметь пару чисто мнимых корней ±ja>. Таким образом, границы областей D-разбиения описываются параме- трическим уравнением P(jw,fc) = 0 (4.5)
120 Глава 4, СТАБИЛИЗАЦИЯ (соответствующим случаям б) и в)) и уравнением ап(&) = 0, (4.6) где ап(к) — старший коэффициент Р(з, к) (случай а)). Уравнение (4.5) при фиксированном ш — это два линейных уравнения (отвечающих ве- щественной и мнимой частям P(jw,fc)) относительно двух переменных ki,k2. В общей ситуации его решение определяет одну точку к(ш) на плоскости параметров, при изменении о; от 0 до оо она описывает не- которую кривую. Кроме того, в вырожденном случае (когда линейные уравнения в (4.5) линейно зависимы) возникают так называемые особые прямые: одному значению ш отвечает прямая на плоскости параметров. Наконец, условие (4.6) также определяет прямую линию. Итак, процедура £>-разбиения следующая. Проводится кривая к(ш) (4.5), прямая, отвечающая условию (4.6), и особые прямые; они разбивают плоскость к на области. Каждая из этих областей соответствует опреде- ленному расположению нулей полинома Р(з, к). Среди этих областей на- ходится и область устойчивости; впрочем, она может оказаться пустой — тогда характеристический полином неустойчив при любом значении к. «Расшифровку» расположения нулей в каждой из областей можно делать по-разному. Например, начать с конкретного полинома P(s,k°) и для него выяснить, сколько его нулей лежит в левой, а сколько — в пра- вой полуплоскости, а затем из соответствующей ему области переходить к соседним, пользуясь тем, что кривой к(ш) соответствует переход пары корней через мнимую ось, а особым прямым — переход одного корня через начало координат. Впрочем, можно в каждой из областей выбрать по точке и найти корни соответствующих полиномов; то же располо- жение корней сохраняется и для всех остальных полиномов из области. Покажем, как эта техника работает на примере. Пример 4.2. Требуется стабилизировать объект второго порядка з — 1 s2 +1 (он не является ни устойчивым, ни минимально-фазовым) ПИ-регулятором С'(д) = Л1 + —. S Характеристический полином равен Р(з, к) = s(s2 +1) + (з - 1)(&1« + кг) = s3 + kis2 + (1 - fci + кг)з - кг- Его старший коэффициент не зависит от к, поэтому прямая (4.6) отсут- ствует. Равенство P(jw, к) = 0 принимает вид —кг ~ к\ш2 = О, о>(1 — fci + кг — w2) = 0.
4 1. Стабилизация с помощью регуляторов низкого порядка 121 Если ш — О» т0 решением является особая прямая fc2 = 0. При и> / 0 точка fc(cv) определяется однозначно. При этом нет необ- ходимости находить эту зависимость, а можно просто исключить и>2 = 1 _ fcj + к2 из второго уравнения и подставить в первое, тогда уравнение кривой будет задано в явной, а не параметрической форме: fc2 — fci к2 - kt + £2) =0, к2 = -1 1 + fci Эго уравнение гиперболы, однако условие fc2/fci = —ш2 < 0 выделяет ее часть, лежащую во II и IV квадранте, она вместе с прямой к2 = 0 осуществляет D-разбиение плоскости к на четыре области (рис. 4.4). Рис. 4.4. 73-разбиение Обозначения .0(0), .0(1), 0(2), 0(3) показывают, сколько корней в левой полуплоскости у всех полиномов, у которых параметры к лежат в Данном области. Небольшая область 0(3) отвечает устойчивым поли- номам. Взяв любые значения коэффициентов ПИ-регулятора внутри этой области, получим устойчивую замкнутую систему. Для данного примера удалось найти стабилизирующий ПИ-регулятор. Однако в целом проблема синтеза стабилизирующих регуляторов задан- ной структуры весьма сложна; сказать заранее, можно ли данный объект сделать устойчивым с помощью регулятора низкого порядка, не удается.
122•Глава 4. СТАБИЛИЗАЦИЯ 4.13. Дискретные системы Рассмотрим, как видоизменяются вышеприведенные методы в случае дискретных систем. Пусть дискретный объект задан в виде передаточной функции s'// С(2) “ B(z)’ гае z обозначает оператор сдвига назад, и под устойчивостью полинома понимается расположение его корней вне едининого круга, |Aj| > 1. Ре- гулятор C(z) = W- ' ОД в цепи обратной связи приводит к характеристическому полиному замкну- той системы P(z) = A(z)N(z) + B(z)D(z); в частности, при C(z) = к имеем P(z) = Pk(z) = kA(z) + B(z). Теоремы 4.1 и 4.2 приобретают следующий вид. Теорема 43. Если объект G(z) устойчив (т. е. полином B(z) устой- чив), то при 0 < к < fcKpirr полином Pk(z) устойчив. Если объект G(z) минимально-фазовый (т.е. полином A(z) устойчив), то при к &Крнт полином Pk(z) устойчив. При этом ккрт — min {—1/С(е*ш) : ImG(e'u') = 0, ReG(e7“) < 0} в первом случае и fcKpm = max{-l/G(eJU'): ImG(e>) = 0, ReG(e*“) < 0} во втором случае. Таким образом, аргумент ja> в непрерывном случае заменяется на е'"' в дискретном; с этим мы уже встречались и раньше (гл. 3). Более суще- ственно, что в теореме 4.3, в отличие от ее непрерывных аналогов, нет никаких требований к степеням полиномов А и В. Дело в том, что в дискретном случае у полинома Р£ = А + еВ, deg А = т, deg В = п> т, при малом е любого знака т корней близки к корням А, а п — т кор- ней «приходят из бесконечности» (т.е. велики по модулю). Поэтому если А — устойчивый полином, то и Р£ будет устойчивым при малых £
*2 Обший вид стабилизирующих регуляторов 123 (именно щесь мы пользуемся определением устойчивости полиномов в форме |At | > 1 — «приходящие из бесконечности» корни являются устой- чивыми). В остальном доказательство теоремы 4.3 проводится так же, как я в непрерывном случае. Дискретное D-разбиение осуществляется так же, до и для непрерывных полиномов, с заменой аргумента ju на . Сопутствующие функции Matlab: tf (CST) — задание системы с помощью передаточной функции; rlocus (CST) — построение корневых годографов; nyquist (CST) — построение годографа Найквиста. 4,2. Общий вид стабилизирующих регуляторов В п 4.1 отмечалось, что проблема стабилизации регулятором задан- ной структуры не всегда имеет решение и достаточно сложна. Ситуация иная, если не ограничивать порядок регуляторов. Именно, в предположе- нии управляемости системы проблема стабилизации всегда имеет решение и все стабилизирующие регуляторы имеют простое описание. Ниже мы займемся этим кругом вопросов. Пусть одномерный объект задан с помощью передаточной функции ПК Л(«}. B(s) — полиномы; deg А = т deg В = п. Требуется описать все регуляторы с(.} _ ВД C()~D(S)’ для которых замкнутая система рис. 4.1 устойчива, т.е. для которых ха- рактеристичекий полином Р(з) = A(s)JV(s)+B(s)D(s) (4.7) является гурвицевым. Изменим несколько точку зрения: зафиксируем гур- вицев полином Р(з) и постараемся найти полиномы 7V(s),D(s), удовле- творяющие уравнению (4.7). Можно ожидать, что эта задача разрешима, •Спи степени полиномов ЛГ(з), D(s) достаточно велики — ведь (4.7) явля- ется линейным уравнением относительно коэффициентов этих полино- мов. Ока 1ывается, что это действительно так для любых взаимно простых (т-е. не имеющих общих корней) полиномов A(s),B(s) (можно показать, Что взаимная простота A(s) и В(з) эквивалентна управляемости системы, вписанной в пространстве состояний). Напомним сначала полезную тео- рему П.4 (см. Приложение).
124 Глава 4. СТАБИЛИЗАЦИЯ Теорема 4.4. Пусть полиномы A(s),B(s) взаимно просты. Тогда по- линомиальное уравнение АХ + BY = 1 (4.8) всегда имеет решение Х°, Y° с deg Х° deg В — 1, deg У0 deg 4-1, причем общее решение имеет вид X = X° + BR, Y = У0 - AR, где R = R(s) — произвольный полином. Отсюда нетрудно получить общее решение уравнения (4.7): N = РХ° + BR, D = PY° - AR. (4.9) Действительно, поскольку произведение полиномов коммутативно, то AN + BD = АРХ° + ABR + ВРУ0 - BAR = Р(АХ° + ВУ°) = Р. Казалось бы, мы получили общий способ построения стабилизирую- щих ре1уляторов: находим частное решение Х°, У0 уравнения (4.8), выби- раем любой устойчивый полином Р и произвольный полином R и строим N, D по формулам (4.9). Тогда регулятор С — N/D стабилизирует си- стему, а характеристический полином замкнутой системы равен Р, т. е. он устойчив. Однако такой вывод, будучи формально правильным, не вполне корректен. Дело в том, что каждое из выражений AN и BD — поли- ном более высокой степени, чем Р. Например, если А, В — полиномы степени п, а Р — полином степени р, то deg Х° = deg У0 = п — 1, и при любом R имеем degN = deg В > р + п — 1, deg AN = deg BP > p + 2n — 1 > p для всех n 1. Поэтому при суммировании AN и BD обязательно сокращение старших членов, однако оно небезобидно. Если реальный объект G(s) немного отличается от номинального (или фактиче- ский регулятор C(s) несколько отличается от планируемого), то полного сокращения старших членов не произойдет, и мы получим характеристи- ческий полином вида P£(s) = P(s) + ePi(s), где Р — устойчивый полином степени р, Pi содержит члены степени выше р, а е — малый параметр. Но такой полином никогда не бывает устойчив при сколь угодно малых е любого знака (это не противоречит тому, что в теореме 4.2 утверждается устойчивость некоторых таких по- линомов при положительных малых е). Таким образом, приведенный выше способ стабилизации нуждается в корректировке; ее нетрудно произвести. Запишем G(s) в эквивалентном
42. Общий вид стабилизирующих регуляторов 125 виде = v(.)=w, «io, де F(s) — произвольный устойчивый полином степени п. Вместо (4.8) упишем теперь уравнение UX + VY = 1, (4.11) де U, V G RHoo, a RHoo — пространство устойчивых реализуемых дроб- но-рациональных функций. Такое уравнение, подобно полиномиальному уравнению, имеет решение X,Y G ЯНоо (см. лемму П.12), и с его помо- щью может быть описано все семейство стабилизирующих регуляторов. Теорема 4.5. Пусть полиномы A(s), B(s) взаимно просты. Тогда уравнение (4.11) имеет решение X,Y G RHoo и все стабилизирующие регуляторы имеют вид см - <412> где Q G RH-ю произвольно. Доказательство. Прежде всего проверим, что регуляторы вида (4.12) действительно являются стабилизирующими. Передаточная функция за- мкнутой системы равна „ _ GC U{X + VQ) _ U(X + VQ) _ 1 + GC U(X + VQ) + V(Y - UQ) ~ UX + VY = ЩХ + VQ). Поскольку U, X, V, Q — все функции из RH^, то их суммы и произведе- ния тоже принадлежат RHoo, т. е. Н — реализуемая дробно-рациональная функция с устойчивым знаменателем, что и означает устойчивость замкну- той системы. Обратно, пусть С = Uc/Vc — какой-то стабилизирующий регулятор, Ц;»К е RHoo- Тогда для передаточной функции замкнутой системы имеем H=_GC_ = __UU^_^UUW 1 + GC UUC + VVC c ’ ПК обозначено W = {UUC + Wc)-1- Поэтому если H,U,UC G RHoo, то И IV e RHoo (в противном случае было бы Н $ RHoo). Возьмем теперь П • Y~V<W 4 U ’ Тода 1 ® WUUC + WVVC = WUUC + V(Y - UQ) = WUUC +1 - UX - VUQ,
126 Глава 4. СТАБИЛИЗАЦИЯ откуда UCW = X + VQ. Поэтому Uc = UCW = X + VQ Vc VCW Y — UQ Остается показать, что Q € ЯЯоо- Действительно, VCW = Y - UQ, UCW = X + VQ; поэтому, умножая первое уравнение на X, второе на Y и вычитая первое из второго, получаем VCWY- UCWX = YVQ + XUQ = Q. Поскольку левая часть принадлежит RH^, то и Q € ЯНоо- Заметим, что при таком подходе не происходит никаких неприят- ностей типа сокращения старших членов полиномов в полиномиальном подходе (формула (4.9) для стабилизирующих регуляторов). Вниматель- ный анализ приведенных выше выкладок показывает, что здесь нет со- кращения неустойчивых нулей и полюсов (об опасности этого говорилось в п. 3.4); дело в том, что мы всюду предполагали, что числители и знаме- натели функций из RHao взаимно просты. В заключение — несколько слов о специфике дискретных систем. Как мы видели (см. теорему 4.3), добавление малых членов старшего порядка в полином P(z) не нарушает его устойчивости. Именно, если P(z) = Oq + a^z + ... + anzn имеет все корни вне единичного круга, то и полином P(z) + En+izn+1 + ... + emzm устойчив при достаточно малых |£г|, г = п + 1,... ,тп, и любых т > п. Поэтому сокращение старших членов в таких полиномах не представляет опасности. Таким образом, мы заключаем: Теорема 4.6. Все стабилизирующие регуляторы для дискретного объ- екта B{zY где A(z),B(z) — взаимно простые полиномы, даются формулой РХ° + BR PY° — AR’ где X°(z),Y°(z) — полиномы, являющиеся решением уравнения AX + BY = 1, (4.13) Р = P(z) — дискретно-устойчивый полином, a R = R(z) — произволь- ный полином.
Общий вид стабилизирующих регуляторов 127 В качестве X°,Y° можно выбрать решение уравнения (4.13) мини- мальной степени, т. е. deg Х° < deg В — 1, deg У0 deg А — 1. Кроме того, разделив числитель и знаменатель в формуле для C(z) на P(z). получим общий вид стабилизирующего регулятора в форме од “ (4Л4> Jr — /1ЦГ t»Q(z) — произвольная устойчивая дробно-рациональная функция (т. е. ие имеющая полюсов в единичном круге). Важно отметить, что приведенный выше способ описания стабилизи- рующих регуляторов переносится почти полностью на случай многомер- ных систем. Небольшое различие заключается в том, что произведение шприц некоммутативно, поэтому небезразлично, в каком порядке они записаны. Приведем окончательный результат без доказательства. Назовем матричные передаточные функции U, V 6 RHoo несократи- мыми слева, если уравнение UX + VY = I имеет решение X, Y е ЯЯоо- Аналогично матричные передаточные функции U, V е RHoo несократимы справа, если уравнение XU+YV=1 имеет решение X,Y G ЯЯоо (см. п. 8 Приложения). Пусть реализуе- мая передаточная функция G(s) объекта записана в виде несократимого Левого или правого разложения'. G(s) = U(s)V^l(s) = V~l(s)U(s), (4.15) Ще U. U — несократимые слева, a U, V — несократимые справа матрич- ные передаточные функции из ЯЯоо- Мы рассматриваем конфигурацию рис. 3.7 (изменяя обозначение K(s) на привычное C(s)) и ищем общий ИД стабилизирующих регуляторов (обеспечивающих внутреннюю устой- чивость системы, см. п. 3.4), т. е. таких матриц C(s), что четыре переда- точные функции (/-CG)-1, {I-CG^C, (I-GCy'G, (I-GCy1 Чишадлежат RHoo (см. (3.23)). Теорема 4.7. Все стабилизирующие регуляторы имеют вид С = (X + VQ)(y + UQ)~X = (У + <ЭЯ)-1(Х 4- QV), (4.16) ЯЯоо.
128 Глава 4. СТАБИЛИЗАЦИЯ Ясно, что для одномерного случая U = U, V = V, X = X, Y = Y, и этот результат совпадает с теоремой 4.5. Представление всех стабилизирующих регуляторов, даваемое теоре- мой 4.7, называется параметризацией Юлы, а матрица Q — параме- тром Юлы, Основное преимущество, даваемое такой параметризацией, заключается в том, что передаточные функции замкнутой системы, как показывают приводимые ниже формулы: (7-CG)-1 = I + (X+ VQ)(Y — UV~1X)~1UV~'1, (I-CGy'C = (X + VQ)(Y -UV-'X)-1, (I — GC)~lG = (Y+ UQ)(Y- UV~1X)~1UV~1, (I-GCy1 = (У + UQ)(Y — UV~1X)~1, линейно зависят от Q, в то время как регулятор С входит в них нелиней- ным образом. Поэтому разного рода задачи оптимального управления, ко- торые мы будем решать в следующей главе, приводят к выпуклым задачам относительно параметра Юлы, а попытка рассматривать непосредственно регулятор С в качестве переменной приводит К трудным невыпуклым за- дачам. Сопутствующие функции Matlab: youla (RCT) — параметризация Юлы. 4.3. Размещение полюсов Во многих случаях с помощью обратной связи можно не только стаби- лизировать систему, но и добиться любого заданного размещения полюсов замкнутой системы. Иначе говоря, можно получить любой желаемый ха- рактеристический полином замкнутой системы. Приведем основной ре- зультат такого типа для систем с одним управлением, заданных описанием в пространстве состояний: х = Ах + Ьи, ж ей”, tigR1, бей”. (4.17) Мы ищем управление в форме статической обратной связи по состоянию и = кТх, к G Й”, тогда матрица замкнутой системы равна Ас = А + ЬкТ. (4.18) Пусть Л — произвольный набор из п точек А, е С, i = 1,... ,п, удо- влетворяющий единственному условию: если Aj € Л, то и А* € Л. Тогда
129 s'4.3. Размещение полюсов Ж*--------------—............................................ с -.ПОЛИНОМ Ж п ^о(8) = JJ(s - Aj) = sn + pnSn-1 + . . . + P2S + Р1 Ж i—1 имеет вещественные коэффициенты. Обратно, любому полиному с веще- ственными коэффициентами отвечает множество Л его корней. Теорема 4.8. Пусть пара (4, Ь) управляема. Тогда найдется такое k & R”, что у матрицы Ас (4.18) собственные значения совпадают с Л. Доказательство. Мы знаем (см. лемму П.11 из Приложения), что упра- вляемую систему с одним управлением можно привести к канонической форме путем невырожденного преобразования переменных, т.е. найдется невырожденная матрица Т вида (П.9) такая, что для х = Тх система (4.17) , приобретает вид x = Ax + bu, А = ТАТ~\ Ъ = ТЪ, Если искать управление в форме и = ктх, к = (fcj,..., fcn)T € Rn, то матрица замкнутой системы выглядит так: ° \ О 1 On "Ь kn / :.и ее характеристический полином имеет вид j sn + (—an + kn)sn 1 +... + (—ai + fci). Шыбирая ki = рг + ai, i — l,...,n, получаем, что его коэффициенты «овпадают с коэффициентами полинома Fo(s), т.е. собственные значения совпадают с Л. Наконец, взяв к = Ттк, имеем | bk'r = ТЬктТ~\ Ac = T(A + bfcT)T-1 =ТАСТ~1, ж.е. матрицы Ас и Ас подобны и их собственные значения совпадают. Б.Т. Поляк, П.С. Щербаков
130 Глава 4. СТАБИЛИЗАЦИЯ Следствие. В предположениях теоремы 4.8 замкнутая система мо- жет быть сделана устойчивой с любым расположением полюсов в левой полуплоскости. Аналогичный результат верен и для систем с многими управлениями; приведем его без доказательства. Теорема 4.9. Пусть пара (А, В) управляема, тогда система х = Ах + Ви (4.20) путем выбора обратной связи по состоянию и = Кх может приобрести любое расположение собственных значений матрицы Ас = А + ВК; в частности, замкнутая система может быть сделана устойчивой. Заметим, что утверждение теорем 4.8 и 4.9 справедливо и в обратную сторону: если выбором матрицы К можно добиться любого расположения собственных значений матрицы А + ВК, то пара (А, В) управляема. Совершенно аналогично эти теоремы формулируются (и доказыва- ются) для дискретного случая. Единственная разница — непрерывная система (4.20) заменяется дискретной хк ~ Ахк-1 -vBuk-i. Некоторый новый эффект, которого можно здесь добиться, связан с тем, что у матрицы Ас = А + ВК все собственные значения можно сделать нулевыми, т. е. ее характеристический полином будет иметь вид zn — 0. В силу теоремы Кэли-Гамильтона тогда А" = 0. Иными словами, мы можем добиться конечной продолжительности процесса. Теорема 4.10. Пусть пара (А, В) управляема. Тогда существует та- кая обратная связь и = Кх, что для замкнутой системы хк = (А + ВК)хк-1 будет хп = 0 при любом xq. Может показаться, что приведенные выше теоремы решают не только задачу стабилизации, но и все разумные задачи теории управления. На- пример, если в непрерывной управляемой системе мы хотим как можно быстрее устранить начальное отклонение, то в соответствии с теоре- мой 4.9 можно было бы выбрать стабилизирующую обратную связь и - Кх так, чтобы сдвинуть собственные значения А» матрицы Ас = А + В К далеко влево: Re А, < — < О, о велико. Действительно, тогда для реше- ния замкнутой системы х = Асх, гс(О) = хо, имеем (см. (3.4)) |z(t)| < ||еЛс‘||ко| Се-^|х0|, С = С(Ас,и), для любого 0 < v < ст. Выбирая большие и, за счет экспоненциального члена e.~vt мы на первый взгляд можем получить сколь угодно малые
4,3. рашетение полюсов 131 значения |x(i)| для всех t Т, где Т > 0 сколь угодно мало. Однако за все приходится платить; не является исключением и данная ситуа- ция. Во-первых, матрица усиления К, для которой собственные значения матрицы Ас удовлетворяют условию Re А, -а, а велико, может ока- заться очень большой. Поэтому и управление и = Кх может принимать очень большие значения, в то время как в практических задачах обычно есть ограничения на величину управления. Вторая неприятность связана с константой С в приведенной выше оценке. Оказывается, с ростом ст эта величина возрастает; это проявляется в том, что значения x(t) на на- чальном интервале не убывают, а возрастают, причем весьма значительно. Количее! венное описание этого эффекта «всплеска» дается следующим результатом. Теорема 4.11. Существует константа С, зависящая от матрицы А и вектора Ъ, но не зависящая от а, такая, что справедлива оценка max max |x(t)| > Ccr”-1. |xol=l Здесь x(t I — решение замкнутой системы x = (A + bkT)x, z(0) = x0, для которой Re А,(Д + bkT) < — a < 0. Иначе говоря, если собственные значения матрицы Ас замкнутой си- стемы сильно сдвинуты влево, то заведомо найдется такое начальное зна- чение хи, |io| = 1. для которого решение замкнутой системы прини- мает значения большие, чем Сст”"1; последняя величина тем больше, чем больше сип. Более того, с ростом а этот всплеск проявляется на все меньшем временном интервале 0 < t < 1/а. Приведем простой пример, показывающий, сколь велики могут быть эти нежелательные эффекты. Пусть п = _10, а система уже записана в канонической форме (4.19) с a.i = 0, i = 1,...,10. Мы хотим, чтобы у характеристического полинома замкнутой системы все корни были равны —2 (т. е. <г = 2 — сравнительно небольшая величина); иными словами, P0(s) = (s + 2)10, и к{ должны выбираться равными коэф- фициентам этого полинома: fc, — CJo1211-1. Наибольший из них = = 15360. Таким образом, коэффициенты усиления в цепи обратной связи превышают 1,5 • 104. Более того, например, при х0 = (1, 1, ..., 1) Десятая компонента X(io)(t) решения x(t) замкнутой системы достигает значения X(10)(t) « 2030 при t = <peak « 0,4275, т.е. начальное значение озрас гас г более чем в 2000 раз, прежде чем начать убывать (это не про- тиворечит устойчивости системы — x(t) действительно стремится к нулю •фи больших t, см. рис. 4.5). Таким образом, влияние плохих начальных условий на поведение не- озмущенной системы проявляется в виде всплеска. Этот эффект имеет ЗУ Же природу, что и хорошо известное в теории управления перерегули- ItotOHue, т. е. всплескообразная реакция системы с нулевыми начальными
132 Глава 4, СТАБИЛИЗАЦИЯ Рис. 4.5. Эффект всплеска: рост x(t) на начальном интервале О t 0,5 при хо = (1, 1, . . . , 1) условиями на единичное входное воздействие «ю=вд=(° 4 ' ' (1 при t > 0. В самом деде, обозначим решение устойчивой системы х = Ах + Ь l(t), х(0) = 0, (4.21) через хк'. a:B(t) = — A~1b + eAtA~1b, и хв — — А~*Ь — его установившееся значение, т. е. xs(t) —► хв при t —> оо. Перерегу- лированием называют величину С = sup t |rEB(t) - жв| |Жв| она характеризует максимальное отклонение траектории возмущенной си- стемы от установившегося значения. Пусть теперь |хо| = 1 — началь- ные условия невозмущенной системы, которые в соответствии с теоре- мой 4.11 выбраны так, чтобы вызвать большой всплеск ее траектории
4.3. Размещение полюсов 133 ^(t) = eAtxo. Положив в (4.21) b = Ахо, получаем хе = -х0 и С — sup |хв(0 - жв| = sup |e'4t2?o|, t t т.е. перерегулирование в системе (4.21) велико. Перейдем теперь к другой задаче — стабилизации с помощью обрат- ной связи по выходу. В этом случае для той же системы х — Ах + Ви, ж(0) = хо, доступен лишь выход У = Сх. Можно было бы думать, что если система управляема и наблюдаема, то статическая обратная связь и = К у (4.22) может стабилизировать систему. Однако легко видеть, что это совер- шенно не так (см. п. 2.3). Покажем, что стабилизация все же возможна, если брать не статический регулятор (4.22), а динамический, т. е. исполь- зующим наблюдатель и обратную связь по оценке состояния, описанные в п. 2.3. Итак, наряду с системой х = Ах 4- Ви, .. 9 = Сх (4'23) запишем дифференциальное уравнение для наблюдателя х = Ах + Ви + F(y — Сх) (4.24) и будем искать обратную связь в ваде и = Кх. Тоща, исключая и и у из уравнений, получаем х = Ах + ВКх, х = (А - FC)x + FCx + ВКх » вводя невязку е = х — х, перепишем эти уравнения в виде х = (А + ВК)х — ВКе, ё = (Л-ГС)е или z = Acz, z = [ Х ).
134 Глава 4. СТАБИЛИЗАЦИЯ ' Здесь блочная матрица . ( А + ВК -ВК \ Ас ~ \ О А - FC ) имеет те же собственные значения, что и стоящие на диагонали матрицы А + ВК, А - FC. По теореме 4.9 они могут быть выбраны произвольно (см. также замечание после теоремы 2.3). Итак, мы пришли к следующему результату. Теорема 4.12. Пусть система (4.23) управляема и наблюдаема. Тогда можно выбрать матрицы К и F так, что обратная связь и = Кх с наблюдателем х (4.24) стабилизирует систему. Таким образом, для управляемых систем всегда Можно добиться ста- билизации в виде статической обратной связи по состоянию, а для упра- вляемых и наблюдаемых систем — с помощью динамической обратной связи по выходу с использованием наблюдателя. Сопутствующие функции Matlab: place (CST) — решение задачи о расположении корней; acker (CST) — решение задачи о расположении корней для систем с одним входом (4.17); initial (CST) — расчет отклика невозмущенной системы на начальные условия. 4.4. Квадратичная стабилизация Другой подход к задаче стабилизации основан на том, что если система устойчива, то у нее есть квадратичная функция Ляпунова вида V(x) = хТРх, Р: >0. (4.25) Таким образом, для задачи х = Ах Л-Ви (4.26) с обратной связью по состоянию и = Кх (4.27) замкнутая система имеет вид х = Асх, Ас = А + ВК, и функция (4.25) является для нее функцией Ляпунова тогда и только тогда, когда (см. п. 3.1) А?Р + РАС <0,
4^ Квадрагичная стабилизация 135 t<e. если найдутся К и Р > 0 такие, что (А +ВК)ТР +Р(А +ВК) <0. (4.28) В этой соотношении две матричных переменных Р и К, и они входят • неравенство нелинейным образом. От этого можно избавиться, сделав дмену переменных У = KQ, Q = Р~\ Умножив матричное неравенство (4.28) слева и справа на Q = Р-1 (см. Приложение, п. 2), получим QAT + AQ + YrBr + BY < О, Q > 0. (4.29) Это неравенство является уже линейным по переменным У, Q. Оказыва- ется, из него можно исключить матрицу У. В самом деле, квадратичная ^°РМа f(x) = x^Y^BF + BY)x = (Вт®, Yx) обращается в нуль на подпространстве Втх = 0. По лемме Финслера (лемма П.2 из Приложения) найдется такое 7 > 0, что f(x) +71|Втг||2 > 0 для всех х, т. е. УТВТ + BY > —7ВВТ. (4.30) Поэтому если выполняется неравенство (4.29), то тем более QAr + AQ - уВВт < 0. (4.31) Обратно, если мы решим линейное матричное неравенство (4.31), то, взяв У = — 2ВТ, мы получим равенство в (4.30), и тем самым и неравен- ство (4.29) будет удовлетворено. Поскольку К = YQ~* не меняется при выборе 7, можно взять 7 = 2. Окончательно приходим к следующему результату. Теорема 4.13. Если Q — решение матричного неравенства Ляпунова QAT + AQ - 2ВВТ <0, Q > 0, регулятор (4.27) с матрицей K = -BrQ~1 символизирует систему (4.26), а квадратичная форма V(x)=xTQ~1x Шляется функцией Ляпунова для замкнутой системы.
136 Глава 4. СТАБИЛИЗАЦИЯ Описанный выше подход, основанный на поиске квадратичной функ- ции Ляпунова (и потому называемый квадратичной стабилизацией) на первый взгляд выглядит довольно искусственным. Он не дает решения в явном виде, а сводит задачу к решению линейных матричных неравенств. Однако впоследствии (см. п. 8.2) мы убедимся, что именно такая техника особенно эффективна для задач робастной стабилизации, когда требуется стабилизировать систему при наличии неопределенности. Сопутствующие функции Matlab: lyap, dlyap (CST) — решение уравнения Ляпунова в непрерывном и дискретном времени. 4.5. Сверхстабилизация Все приведенные выше методы ставили целью сделать систему устой- чивой путем введения обратной связи. Однако можно решать более жест- кую задачу и пытаться обеспечить сверхустойчивость замкнутой системы (см. п. 3.6). Оказывается, что этой цели не всегда можно добиться (на- пример, не всякая управляемая система может быть сделана сверхустой- чивой), в то же время если решение существует, то оно легко может быть найдено. Мы начнем сразу с более трудной задачи стабилизации по выходу. Задана система х = Ах + Ви, У = Сх; ищется статический регулятор в форме обратной связи по выходу и = Ку, (4.32) обеспечивающий сверхустойчивость замкнутой системы. Напомним, что для задачи стабилизации по выходу мы исследовали динамический регуля- тор, использующий наблюдатель (п. 4.3); задача о статическом регуляторе остается открытой (см. обсуждение этой проблемы в п. 2.3 и ниже, в гл. 9). Вопрос о существовании и отыскании регулятора К (4.32), гаран- тирующего сверхустойчивость, решается очень просто. Матрица замкну- той системы (которую мы в этом параграфе обозначим М, а не Ас, как ранее) равна М = А + В КС. Ее элементы i,j = 1,...,п, являются аффинными функциями от К = TTlij — Q>ij “F b^-KCj j
4.5. Сверхстабилизация 137 гае bt — i-я строка матрицы В, Cj — j-й столбец матрицы С. Например, в задаче стабилизации по состоянию для системы с одним входом имеем у я= х, т — 1, т. е. С = I, В = (bi,..., 6П)Т — вектор-столбец, а К = (fci,..., кп) — вектор-строка, поэтому М = А + ВК, mij = aij + bikj, rmsb, — г-й элемент В, a kj — j-й элемент К (матрица ВК — первого ранга). Условие сверхустойчивости матрицы М имеет вид -mii > \rriij |, г = 1,..., п. Введем искусственные переменные ст, Пу, i, j == 1,... ,п; тогда условие сверхустойчивости можно записать так: а > О, - тц(К) - Пу ст, г = 1,..., п, i,j = l,...,n, г / j. Если эта система линейных неравенств имеет решение kij,n,ij, i,j = при некотором ст > 0, то система сверхустойчива. Чтобы про- верить существование решения, можно перейти к задаче линейного про- фаммирования max ст, - тц(К) i = 1, • ,n, (433) — Путпу (К) Пу, i,j = l,...,n, i^j; «ей переменными являются матрицы K,N = ((пу)) и скаляр ст. Теорема 4.14. Если К, а — решение задачи (4.33) и ст > 0, то обрат- ’•я* связь и = Ку обеспечивает сверхустойчивость замкнутой системы. же а 0, то сверхстабилизация регулятором вида (4.32) невоз- можна. Этот результат дает полное решение задачи о сверхстабилизирующем ^атическом регуляторе.
1 138 Глава 4, СТАБИЛИЗАЦИЯ Рассмотрим простой пример. Пусть п = 2, тп = 1, т. е. х = Ах + Ви, А=( 012 Y В = b = ( J1 Y \ 021 «22 / \ °2 / и = Кх, К^к = (ki fc2)- м=а+вк^ ( ап t*1*1 а12*ь,г*2} \ 021 Т 02^1 °22 + 02^2 / и условие сверхустойчивости принимает вид Oii+biAli < —|О12 + blfeh 022+62^2 < — |O21 +z»2^1|- Возьмем для определенности bi = 62 — 1; нас интересует, существуют ли fci, кг, удовлетворяющие неравенствам O11+&1 < —|О12+А:2|> 022 + ^2 < ~|О214"&1|- Каждое из неравенств выделяет прямой угол на плоскости {ki, кг} (рис. 4.6). Эти прямые углы содержат общую точку (т.е. решение су- Рис. 4.6. Коэффициенты сверхстабилизирующего регулятора шествует), если и только если вершина одного из них лежит в другом, т. е. удовлетворяется одно из неравенств 011—021 < -|O12 — O22I, 022 -012 < -|О21 — Оц|. Эго возможно тогда и только тогда, когда Т = Оц — <121 4" 022 “ 012 < 0. Итак, если г < 0, то сверхстабилизация возможна, если т > 0, то она невозможна. Мы видим, что не для любой матрицы А можно обеспечить сверхустойчивость; в то же время для любой А, для которой b = (1 I)1
4.5. Снср^-л абилизация 139 ре является собственным вектором, пара (А,Ь) управляема и (обычная) стабилизация с помощью обратной связи и = кх возможна (теорема 4.8 и следствие из нее). Легко выявить и случаи, когда сверхстабилизация заведомо невоз- можна. Пусть в общей задаче х = Ах + Ьи, и — кх, х € Rn, ueR1, вектор b имеет некоторые координаты нулевыми, например, bi = 0. Тогда М = А + Ьк имеет такую же первую строку, как и Д; если эта строка не удовлетворяла условию сверхустойчивости, т.е. -ац < laijl> т0 матрица М не будет сверхустойчивой ни при каком к. Отсюда, в частно- сти, следует, что для системы, записанной в канонической управляемой форме (см. п. 1.4), заведомо нельзя добиться сверхустойчивости с помо- щью обратной связи по состоянию. Ситуация может измениться, если произвести замену переменных — в новых координатах сверхустойчи- вость, возможно, удастся обеспечить, см. с. 107. Все сказанное выше относилось к непрерывным системам; при пере- ходе к дискретному случаю изменения минимальны. Они связаны с тем, что для системы хк = Ахк-1 + Вик-1, ук = Схк с обратной связью Цс ~ Кук условие сверхустойчивости матрицы М = А + В КС записывается как ЦЛГЦ1 < 1, т.е. ^2|ту(К)| < 1, г = 1,...,п. 7=1 Относительно элементов матрицы К эти условия также записываются как линейные неравенства. Задача линейного программирования, анало- пиная (4.33), имеет вид min <т, nij г = 1,...,п, (4.34) -пи < mij(K) nij, i,j = l,...,n, i^j, возможность сверхстабилизации дается следующим результатом. Теорема 4.15. Пусть К,а — решение задачи линейного программи- рования (4.34). Если а < 1, то регулятор и = Ку обеспечивает сверх- устойчивость матрицы М = А + ВКС замкнутой системы: ||Af||i < V tCAu же о >1, то М не является сверхустойчивой ни при каком К.
140 Глава 4. СТАБИЛИЗАЦИЯ Сопутствующие функции Matlab: linprog (ОТ) — решение задачи линейного программирования. 4.6. Выводы • При задании одномерного объекта с помощью реализуемой переда- точной функции G(s) = A(s)/B(s) в ряде случаев возможно использова- ние регуляторов низкого порядка в цепи обратной связи. При использовании простейшего пропорционального регулятора (П- ретулятора) C(s) — к выбору подлежит один параметр — коэффициент усиления к > 0. В случае устойчивого объекта (полином В(з) устойчив) вопрос о критическом коэффициенте усиления &крит — минимальном зна- чении к, при котором характеристический полином F(s) = B(s) + fcA(s) замкнутой системы теряет устойчивость, решается с помощью годографа Найквиста (теорема 4.1). При этом говорят о малом коэффициенте уси- ления. Если годограф G(jw) не пересекает отрицательную полуось, то устойчивость замкнутой системы сохраняется при сколь угодно больших коэффициентах усиления. В случае минимально-фазового объекта (полином A(s) устойчив) во- прос о /сКрит — минимальном значении к, при котором P(s) = B(s) + &A(s) приобретает устойчивость, решается с помощью обратного годо- графа Найквиста; при этом решение существует, лишь если степень В(з) превышает степень A(s) не более чем на 2 (теорема 4.2). При этом гово- рят о большом коэффициенте усиления. В дискретном случае картина та же, но нет требований на степени B(z) и A(z) (теорема 4.3). • При использовании регулятора, зависящего от двух параметров (на- пример, ПИ-регулятора), исследовать устойчивость замкнутой системы можно с помощью техники D-разбиения. При этом на плоскости па- раметров явно выделяются области D(p), для которых характеристиче- ский полином замкнутой системы имеет ровно р устойчивых корней, и, в частности, область устойчивости, отвечающая всем устойчивым корням. Техника D-разбиения равно применима и в дискретном случае. В целом сказать заранее, можно ли данный объект стабилизировать с помощью регулятора низкого порядка, не удается. • Все регуляторы C(s) (без ограничения на структуру), стабилизиру- ющие непрерывную одномерную систему с передаточной функцией G(s) = degA^degB, где полиномы A(s),B(s) взаимно просты, описываются теоремой 4.5: C(S) = X + V® 4 ' Y-UQ'
4 ft Выводы 141 ' — ------------------------------------------------------------ Здесь Q(s) G RHoo — произвольна, a X = X(s), Y = Y(s) e RHX — ре- шение уравнения UX+VY = 1, да 17 = U(s) = A(s)/F(s), V = V(s) = B(s)/F(s), a F(s) — произвольный устойчивый полином, deg F deg B. В случае дискретной системы ад = Л(г) задача упрощается и все стабилизирующие регуляторы С(г) описываются через решение X(z),Y(z) полиномиального уравнения АХ + BY = 1 (оно существует, если полиномы A(z},B(z) взаимно просты) следующим образом: c(z} = РХ + ВД ' PY-AR’ где Р = P(z) — дискретно-устойчивый полином, a R = R(z) — произ- вольный полином (теорема 4.6). • В многомерном случае рассматривают матричную передаточную функцию G(s), задаваемую с помощью несократимого левого или пра- вого разложения: G(s) = UtsyV'1^) = V~1(s)G(s), где 17, У и U, V —^матричные функции из RH^ — таковы, что уравнения UX • IT = I и XU + УУ = I разрешимы в RH^. Тогда все стабилизи- рующие регуляторы <7(s) (т. е. обеспечивающие внутреннюю устойчивость замкнутой системы) имеют вид С = (X + УС)(У + C7Q)-1 = (У + QU)~\X + QV), ВДВ Q g RHoo — произвольно (теорема 4.7). Такое представление всех стабилизирующих регуляторов называется параметризацией Юлы, а ма- трица Q — параметром Юлы. Преимущество такой параметризации в том, что передаточные функции замкнутой системы линейно зависят от Q, то время как регулятор С входит в них нелинейным образом. • Если в системе х = Ах 4- Ви пара (А, В) управляема, то с помо- щью статической обратной связи по состоянию и — Кх можно добиться прои гво. ц,кого расположения собственных значений матрицы замкнутой системы Ас = А + В К — это задача о размещении полюсов, — в част- ности, можно сделать систему устойчивой (теорема 4.9). Однако попытка Увеличип, таким образом степень устойчивости (отодвинуть Аг(Ас) как «О*но более влево) требует больших управлений и приводит к эффекту всплеска траектории — резкому росту на начальном этапе (тео- ₽ема 4.11). В системах с единичным входным воздействием u(t) — l(t) *|от эффект называется перерегулированием.
142 Глава 4. СТАБИЛИЗАЦИЯ Аналогичный результат о размещении полюсов справедлив в дискрет- ном случае, но, кроме этого, выбором матрицы усиления можно добиться конечной продолжительности процесса, сделав нулевыми все Аг(Ас). • Если в управляемой системе х = Ах +Ви доступен лишь выход у = Сх и пара (А, С) наблюдаема, то такую систему можно стабилизировать с помощью динамической обратной связи по оценке состояния и = Кх с использованием наблюдателя х = Ах + Ви + F(y — Сх) (теорема 4.12). • Квадратичная стабилизация заключается в поиске квадратичной функции Ляпунова для замкнутой системы с матрицей Ас = А + ВК. При этом стабилизирующий регулятор и = Кх ищется не в явном виде, а через решение неравенства Ляпунова (теорема 4.13). Такой подход плодотворен в задачах робастной стабилизации. • При замыкании системы обратной связью по выходу и = Ку эле- менты матрицы Ас = А + ВКС замкнутой системы представляют со- бой линейные функции от Элементов Матрицы усиления К = ((k-tj)) и условие сверхустойчивости Ас формулируется в терминах линейных не- равенств относительно ку. Поэтому если соответствующая задача ли- нейного программировайия имеет решение, то разрешима задача сверх- стабилизации непрерывной системы по выходу с помощью статического регулятора и = Ку (теорема 4.14). Аналогично решается задача о сверх- стабилизации по состоянию. Результат для дискретных систем дается теоремой 4.15. Сверхстабилизация — более жесткое требование, чем стабилизация, поэтому не всякая стабилизируемая система (например, управляемая и наблюдаемая) сверхстабилизируема. Ситуация может измениться при пе- реходе к другим координатам.
Глава 5 ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ Условие устойчивости замкнутой системы, исследовавшееся в пре- дыдущей главе, является необходимым требованием при выборе закона управления. Однако стабилизирующих управлений много, и мы можем выбрать среди них то, которое оптимально с точки зрения некоторого критерия, характеризующего качество управления. В этой главе мы рас- смотрим ряд важнейших критериев оптимальности и обсудим технику получения оптимального управления. 5.1. Линейно-квадратичный регулятор Задана линейная стационарная система в пространстве состояний: ± = + А € йгахп, В е Rnxm, (5.1) С фиксированным начальным условием ж(0) = х0. (5.2) Требуется найти закон управления в форме линейной обратной связи по состоянию и = Кх, KtW"™, (5.3) который минимизирует квадратичный критерий качества ОО J = j [(Rx,x) + (Su,u)^dt. (5.4) о Здесь fteRnxn,56Rmxm — положительно-определенные матрицы, так fro J > 0. Очевидно, что для того, чтобы функционал J был конечен, ясобходимо, чтобы замкнутая система была устойчива; это же условие и Достаточно для конечности J. Критерий (5.4) гарантирует малость как состоянии замкнутой системы, так и применяющихся управлений (за счет больших управлений можно добиться, чтобы x(t) быстро убывал, однако ’onia член (Su, и) будет велик). Матрицы Rn S играют роль весовых ко- эффициентов, учитывающих оба указанных фактора. Приведенная выше
144 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ задача является одной из основных в теории управления; в отечественной литературе она иногда называется задачей об аналитическом констру- ировании регуляторов, в западной — задачей о линейно-квадратичном регуляторе (LQR — Linear Quadratic Regulator). Существуют также по- становки задачи LQR и в частотной области; методы решения используют параметризацию Юлы, и в них проводится оптимизация критерия по па- раметру Юлы Q. Ввиду важности задачи рассмотрим несколько подходов к ее реше- нию. Каждый из них представляет самостоятельный интерес и может быть обобщен на другие постановки задачи; кроме того, аналитическая форма получаемого решения также различна. Всюду далее принято сле- дующее предположение: пара (А, В) управляема, а матрицы RnS поло- жительно определены. Это предположение может быть ослаблено, но мы проанализируем задачу в этом простейшем случае. Сопутствующие функции Matlab: Iqr, dlqr (CST) — построение линейно-квадратичного регулятора для непрерывной и дискретной системы. 5.1.1. Принцип максимума Видоизменим несколько постановку задачи, считая конечной продол- жительность Т процесса; при этом не будем требовать, чтобы управление имело вид (5.3), а будем искать его в форме программного управления u(t): min JT(u), и JT(u) = J x) + (Su,u)jdt, о (5.5) x = Ax + Bu, x(0) = xo> 0 t C T. Нетрудно показать, что в силу условий функционал JT(u) имеет един- ственную точку минимума uT(t) на гильбертовом пространстве U функ- ций u(t) в L2(0,Т)1. Пусть xT(t) — решение системы (5.1), соответству- ющее этому управлению uT(t): xT(t) = AxT(t) + BuT(t), xT(Q) = io- Дадим оптимальному управлению uT(t) некоторое приращение A’t(t) и = ит + би-, тогда оптимальная траектория xT(t) также получит прира- 1 Аналогично пространству Lj, введенному в п. 1.3,1/г(0, Т) — пространство измеримых функций u(t), определенных при t € [0, Г] и имеющих ограниченную 2-норму: ||u||2 = /<оо.
5 I. Линеино-квадратичный регулятор 145 щение 6x(t): х = хт +8х, которое будет описываться дифференциальным уравнением с нулевым начальным условием: 5х = Абх + В8и, <5х(0) = 0, (5.6) а функционал JT будет иметь вид т JT(u) = JT(uT) + 2 j ^(Яхт,<5х) + + е, о где остаточный член е допускает оценку |е| здесь ||<Ju||2 '= [f(5u,6u)dtj — норма в Ь2(0,Т). Поскольку ит — точка мини- мума JT(u), то JT(uT) JT(U) И®1 любого и, и из вышеприведенного выражения следует, что при малых ЦйиЦг имеем т 6J = J , 6х) + (SuT, би)j dt 0. о Рассмотрим теперь так называемую сопряженную систему ip = -~АТ‘ф — RxT, ip(T) = 0. Поде i аил яя в 8J значение RxT из этой системы и проводя преобразова- ния, получаем 6J = у J(—— ATip,6x) + (SuT,5u)jdt = т ~ J ~~ ($Ut’ ^u)] = 0 = У Вби) 4- (Sur,6u)jcft = т = У (BTV> + SuT, 6u)dt. о Здесь мы осуществили интегрирование по частям с учетом граничных №ювии = 0, &г(0) = 0 и подставили 6х из уравнения (5.6). Линей- ный функционал f(a, 8u)dt может быть одного знака для всех малых 8и, й&Ж
146 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ лишь если а = 0. Поэтому из условия 5J > 0 получаем + SuT = 0, т. е. ит = -3~1В'тф. (5.7) Итак, оптимальное решение ит,хт является решением краевой задачи Хт = Ахт — В8~1Втф, хт(О)=хо, ф = — Атф — Вхт, ^(Т) = 0. (5’8) Таким образом, отыскание оптимального программного управления ит (Z) задачи (5.5) свелось к решению краевой задачи (5.8) для системы 2п ли- нейных обыкновенных дифференциальных уравнений относительно пере- менных хт,ф; тогда ит находится из (5.7). Если вернуться к исходной задаче (5.1), (5.2), (5.4) на интервале [0, оо), то можно ожидать, что ее решение Uoo^oo находится из системы Xqo — ^4iCoo BS В ф^ 3*00 (б) “ *^01 ф = — Атф — ЙХоо, ф(оо) = О, однако предельный переход Т —♦ оо нуждается в обосновании (мы дадим его несколько позже, в следующем параграфе). Описанный выше подход может быть применен для гораздо более общей задачи оптимального управления с нелинейным нестационарным уравнением, неквадратичным функционалом и при наличии ограничений на управление: г min F(x,u,t)dt о х = f(x,u,t), х(0) = xq, u(t) е U, 0 t Т. В этом случае рассматривается сопряженное уравнение ф = ~fx(x°,u0, £)TV> + Fx(x°,u°, t), ф(Т) = 0, (5.9) где нижний индекс х означает дифференцирование по х, и составляется функция (часто называемая гамильтонианом) H(x,u,t) = /(х,и,1)тф — F(x,u,t). Тогда, если х°,и° — решение задачи (5.9), то H(x°,u°,t) — maxH(x°,u,t) (5.10) u&U для всех 0 < t < Т. Это утверждение называется принципом макси- мума; его применение к линейно-квадратичной задаче (5.5) приводит к оптимальному решению (5.7), (5.8).
i 1. Линеино-квадратичный регулятор 147 5.1 J- Уравнение Риккати Задача (5.8) представляет определенные трудности. Это не обычная Коши для линейных дифференциальных уравнений, а краевая за- дача. так как условия для xT(t) и заданы в граничных точках t = О 81 = Т. Попробуем ее решить с помощью специального приема; такой же прием применяется в методе прогонки, используемом в вычислительной математике для решения линейных краевых задач. Именно, попробуем искать линейную зависимость между фих: = P(t)x(t), (5.11) me симметричная матрица P(t) G Rnxn подлежит определению. Подста- вляя это в уравнения (5.8), получаем х = Ах — BS~1B7Px, х(О)—хо, Рх + Рх = — АтРх — Rx, Р(Т)х(Т) = 0. Исключая х, находим Px + PAx-PBS~1BTPx + ArPx + Rx = O, Р(Т)х(Т) = 0. Такое уравнение заведомо выполняется (при любых х), если P + A'rP + PA-PBS~1BTP + R = 0, Р(Т) = 0. (5.12) Это матричное обыкновенное дифференциальное уравнение (с начальным условием при t = Т). Оно называется дифференциальным матричным уравнением Риккати. Отметим, что это уравнение нелинейно по Р. Таким образом, процедура построения оптимального управления иТ в данном подходе следующая. а) Решается уравнение (5.12) и находится P(t). б) Управление ит находится из (5.7), (5.11): uT(t) = —S~lBTP(t)x(t) = K(t)x(t). (5.13) Итак, в данном случае оказалось, что оптимальное программное упра- вление можно выразить в форме обратной связи по состоянию, однако Матричный коэффициент усиления K(t) зависит от времени t. Можно оказать (см. теорему П.5 из Приложения), что при сделанных предпо- ложениях (пара (А, В) невырождена, R > 0, S > 0) решение уравнения Ркккати обладает следующими свойствами. 1. При любом Т > 0 оно существует и единственно для всех t е [0,Т]. 2. P(t) > 0 для любых 0 Т. 3. Если PT(t) — решение уравнения при заданном Т, то Pr2(t) < Рт\ (t) при Т2 > Г1.
148,Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ 4. При Т —> оо будет Py(t) —> Poo. где (не зависящая от t) матрица Роо является единственным положительно-определенным решением алгебраического матричного уравнения Риккати PA + ATP-PBS-iBTP + R = O. (5.14) С учетом свойств 3 и 4 и формулы (5.13) мы получаем, что при Т = оо оптимальное управление приобретает форму стационарной обратной связи u(t) = Kx(t), К = -S^B^P, (5.15) где F — решение (5.14). Итак, для решения исходной задачи (5.1), (5.2), (5.4) о линейно-квадратичном регуляторе достаточно решить алгебраиче- ское уравнение Риккати (5.14) и с помощью найденной матрицы Р > О построить оптимальную обратную связь в виде (5.15). Оптимальность управления (5.15) может быть доказана и «в лоб»; именно, если обозначить его через то для любого другого (даже программного) управления u(t) можно путем несложных преобразований получить формулу ОО J = XqPxq + У |w(t) — u*(£)| dt. о Отсюда следует важный вывод: оптимальное значение функционала J равно ^min = Д-о РД"О и является квадратичной функцией от начальных значений состояния. Сопутствующие функции Matlab: care, dare (CST) — решение алгебраического уравнения Риккати в непрерывном и дискретном случаях. 5.13. Функция Ляпунова и линейные матричные неравенства Результат предыдущего параграфа можно интепретировать с иной точ- ки зрения. Рассмотрим функцию У(®) = хтРх-, (5.16) тогда для оптимальной замкнутой системы х = Ах + Ви, u=—S~lBTPx (5.17)
J.I. Линейно-квадратичный регулятор 149 значение этой функции на траектории x(t) равно оо V(t) = V + uTSuj dr, * т.е. монотонно убывает. Таким образом, (5.16) является функцией Ляпу- нова для оптимальной системы. Попробуем, не связывая Р с уравнением риккати (5.14), найти такие матрицы Р > 0, что для системы, замкнутой той же обратной связью, что и выше, и = —S~1BTPx, ^пядратичная функция V(x) = хтРх являлась бы функцией Ляпунова. Тогда х = (А - BS~1 ВтР)х = Асх V = ^V(x(ty) = ((РАС + А?Р)х,х), условие V < 0 выполняется, если PAc + AjP<0. Раскрывая это соотношение, получаем РА + АТР - 2РВ5-1ВТР < 0. Умножив это выражение слева и справа на Q = Р~1 (неравенства U < 0 nQUQ<0 эквивалентны для невырожденной матрицы Q), получаем AQ + QAT-2BS-1BT <0, Q > 0. (5.18) Итак, чтобы найти любую функцию Ляпунова (5.16) для замкнутой системы (5.17), нужно найти матрицу Q, удовлетворяющую (5.18), и взять Р = Q 1. Таким образом, мы вновь решили задачу стабилизации исход- ной линейной системы х = Ах+Ви (см. теорему 4.13). Выражение (5.18) является линейным матричным неравенством. В нем переменной явля- ется симметричная матрица Q, а неравенства понимаются в матричном смысле. Мы будем оперировать линейными матричными неравенствами на пртяжении всей книги; в частности, мы уже встречались с ними в нп. 3.5 и 4.4. Попытаемся теперь оценить, какое значение критерия J мы получим при выборе того или иного стабилизирующего управления. Для ’Того введем параметр 7 > 0 и рассмотрим более сильное неравенство, чем (5.18), включающее квадратичные члены: AQ + QAT - ZBS-'BF + 7(BS“1BT + QRQ) 0, Q > 0 (5.19)
150____________________________Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ (оно совпадает с (5.18) при 7 = 0). Если мы возьмем какое-либо реше- ние Q этого неравенства и выберем обратную связь и = — S~1BTQ~lx, то можно воспользоваться леммой П.14 из Приложения: если матрица А устойчива, x(t) — решение системы х = Ах, х(0) = хо, то значение ОО функционала J = f xTWxdt (при W > 0) равно xJXxo, где X — реше- о ние уравнения Ляпунова АТХ + ХА = —W. Заменяя здесь А на матрицу замкнутой системы Ас = A—BS~1B'rQ~r и ТУ на R+Q~lBS~xBTQ~\ получаем J — Хю, AlX + XAc = -(R + Q_1BS~1BTQ-1). (5.20) С другой стороны, если умножить неравенство (5.19) слева и справа на <2-1, то получим Q~1A + ATQ~1 — 2Q~1BS~1BTQ~1 -"f(Q~1BS~1BTQ~1 + R), что может быть переписано как Ас «£ -Я- Q-1BS-1BrQ-1. Вычитая теперь отсюда равенство (5.20) для X, получаем Alf-Q-1 -Х) + (-Q-1 -Х)ас 0. '7 ) \7 ) Матрица Ас устойчива (это было доказано выше для матрицы Q, явля- ющейся решением (5.18), но решение (5.19) тем более удовлетворяет (5.18)). Поэтому (см. лемму П.15 из Приложения) Q-1/T — X > 0, т. е. X <Э-1/7- Таким образом, Итак, для любого решения Q неравенства (5.19) и обратной связи и = -S-'BrQ- лх мы получили оценку функционала J 7-1Хо <2-1хо. Сделаем еще один шаг —- заменим квадратичное неравенство (5.19) ли- нейным с помощью леммы Шура (лемма П.1 из Приложения): / AQ + QAT + (7 - 2)BS-1BT 71/2Q«1/2 \ < 0, Q > 0. \ 71/2B1/2Q -1 ) (5.21)
fj. Ноо'0,,тимизац'*я 151 Окончательно получаем следующий результат. Решим линейное матрич- ное неравенство (5.21). Если для данного 7 > О найдется его решение Q, то, взяв обратную связь и = -S-1BTQ-1x, мы обеспечим в исходной задаче (5.1)-(5.4) значение функционала ОО J = 7_1xjQ_1xo. о Таким образом, решение линейно-квадратичной задачи при данном под- ходе сводится к решению линейных матричных неравенств. Величина 7 играет роль параметра; ее оптимальное значение (отвечающее минимуму функционала J) можно найти с помощью одномерного поиска. Конечно, такой путь выглядит более громоздким, чем описанные выше способы ре- шения, но, как мы увидим позже (п. 8.2), он допускает «робастизацию» задачи — обобщение на случай неопределенных систем. Сопутствующие функции Matlab: feasp (LMIC) — решение общей задачи линейных матричных неравенств; lyap (CST) — решение уравнения Ляпунова; eqrtm (CST) — вычисление квадратного корня от матрицы. 5.2. -оптимизация Проблема Нж-оптимизации возникает при различных постановках за- дач управления. Сейчас мы познакомимся с двумя из них; другие будут рассмотрены позже, в части II, в связи с идеями робастности. Пусть на вход устойчивой системы х = Ах + Bw, у - Сх подается гармонический сигнал w(t) = аеГ*. Тоща, как мы знаем (п. 1.2), установившийся сигнал на выходе будет равен j/(t) = H(ju)w(t), H(s) = C(sl - A)~lB. Если мы хотим, чтобы амплитуда этого сигнала была достаточно мала для всех частот ш, то мерой этого может служить величина Ц/ sup|#(jo;)| = ЦН^Цоо,
152 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИИ т.е. Ноо-норма передаточной функции (см. п. 1.3). Несколько более общая задача возникает, когда нам желательна малость выхода в какой- то полосе частот или, более общо, когда есть весовая функция W(s), и критерий качества процесса имеет вид sup ш Иначе, пусть на вход той же системы поступает любое возмущение, ограниченное в Дг-норме: ОО ||w||2 = j' wT(t)w(t)dt 1. (5.22) о Тогда, как мы знаем (см. (1.34) и п. 3.5), sup Нуй = ||Я(в)||0о, где супремум берется по всем входным возмущениям, удовлетворяющим (5.22). Итак, в обеих постановках задачи естественным показателем ка- чества процесса является величина J = ||Я(в)||оо. Пусть теперь в системе присутствует управление: х = Ах + Ви + Dw, у = Сх. Тогда задача Я»,-оптимизации заключается в выборе регулятора в форме обратной связи по состоянию и = Кх, который минимизирует Я»-норму передаточной функции H(s) замкну- той системы, т. е. min ||Я(в)||то, Я(в) = C(sl - (А + BK^D, К в предположении, что К — стабилизирующий регулятор. Мы дадим два различных решения этой важной задачи. Одно будет проведено в пространстве состояний и будет опираться на описание до- стижимого множества из п. 3.5. Другое будет связано с описанием исход- ной системы с помощью передаточных функций и будет дано в частотной области.
5Д. Яоо-опгимизация 153 j 11. Решение в частотной области Начнем с последнего подхода; для простоты ограничимся одномерным случаем. Задана линейная непрерывная система (см. п. 2.4): a(s)y(t) = b(s)u(t) + w(t), ще a(s),6(s) — полиномы от оператора дифференцирования s = d/dt; ищется регулятор в форме линейной обратной связи u(t) = —C(s)y(t) = — 9\s) (Я№ /(«)> ?(s) — полиномы), который, во-первых, стабилизирует систему, а во-вторых, минимизирует Д»-норму передаточной функции Н(з) от входа w к выходу у. Прежде всего, мы знаем, как записать все стабилизирующие регуля- торы. Именно, введем некоторый устойчивый полином <р(з), удовлетво- ряющий условию deg <р = max {deg a, deg 6} и рассмотрим . a(s) . b(s) . 1 Л(в) = —rv, Bls) = —т-т, D(s) — — <p(s) ¥>(s) <p(s) -- функции из RHoo (напомним, что RHoo — пространство устойчивых реализуемых дробно-рациональных функций). Предположим, что поли- номы a(s) и Ь(з) взаимно просты, т.е. функции 4(s) и В(з) не имеют Общих нулей. Тогда по теореме 4.5 уравнение АХ + BY = 1 имеет решение Х0(д),У°(з) е RHoo, и общий вид стабилизирующего регуля гора дается выражением Y« + AQ C(s> = X^=BQ' (5'23) Q(s) — произвольная функция из RHoo- Передаточная функция Иашей системы, замкнутой таким регулятором, примет вид (см. (2.14)) ч = g(s) = ВД = W a(s)g(s) + b(s)f(s) A(s) + B(s)C(s) = ад(х°(д) - B(s)Q(s)) = = X°(s) - B(s)Q(s), (5.24)
154 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ где обозначено Х° = DX° = —“Х°, В = DB = -у-гВ (подчерк. ¥>(s) ¥>(«) нем, что y>(s) — устойчивый полином). Итак, для всякой Q € RH^ регулятор (5.23) является стабилизирующим. Следовательно, задача ми- нимизации ||jff(s)||oo свелась к минимизации min ||X°(s) - B^Q^Hoo по Q 6 RHoo. Вспоминая определение Я» -нормы (п. 1.3), эту задачу можно рассматривать как задачу наилучшего приближения: заданы функ- ции X°(jw), B(jw), найти Q(jco), минимизирующую max |X°(jw) - B(ju>)Q(jw)\. В некоторых случаях решение находится совсем просто. Пусть, например, полином b(s) устойчив (иначе говоря, разомкнутая система — минималь- но-фазовая), тогда можно взять . Х»(в) X°(s) Q( ) В(з) В(з) Действительно, тогда Q(s) имеет устойчивый знаменатель и Q(s) G RHoo, при этом || Я(в)||о0 = 0. Явное решение можно найти и в случае, когда b(s) имеет один не- устойчивый корень so, Re so > 0. Для этого выберем ew - —“ —BW—• <5И) Тогда Q 6 RHoo (считаем, что в (5.25) единственный неустойчивый корень so знаменателя сокращен с корнем so в числителе) и H(s) = X°(so) = const, т.е. ||.ff(s)||oo = |X°(so)|. С другой стороны, при любой Q G RHqc H(s) аналитическая функция в правой полуплоскости (по построению, ибо С (5.23) — стабилизирующий регулятор), поэтому, по известной теореме теории аналитических функций, ее максимум модуля достигается на границе, т.е. для любой Q будет ||ff(s)||oo |H(so)| = |X°(so)| (последнее равенство следует из (5.24), поскольку B(sq) = 0). Поэтому Q(s) (5.25) минимизирует Ноо-норму передаточной функции. Общий случай произвольных нулей полинома b(s) анализируется сле- дующим образом. Пусть si,... ,sn — корни &(s), лежащие в правой по- луплоскости: B(sj) = 0, i = l,...,n, ReSj>0. Введем число у > 0; нас интересует, можно ли найти Q € RHoo такое, что ||Х° - BQ))*, < 7. (5.26)
jj.Яде-оптимизация 155 Обозначим G7 = i(X° - BQ), (5.27) тогда G-, € RHoo, и G>y (sj) = (sj) 71 j, i — 1,..., 7i; 7 1 - остальном G7(s) произвольна. Поэтому задача записывается так: найти (если таковое существует) G-, & RHoo из условий 11^'гНоО (5.28) G-y(Si) = П{, 7 = 1,..., 77. Решение этой проблемы дается следующей теоремой Неванлинны-Пика. Теорема 5.1 (Неванлинна-Пик). Составим матрицу Р размерности я х 77 (матрицу Пика) с элементами _ 1 - П{П* это эрмитова матрица. Задача (5.28) разрешима тогда и только тогда, когда Р^О. Существует также простой рекуррентный алгоритм, позволяющий в случае Р 0 построить G7, удовлетворяющее (5.28). Тогда из фор- мулы (5.27) можно найти Q, для которой верно (5.26), а затем и регуля- тор С из формулы (5.23). Подбором у можно решить и задачу отыскания минимального у, для которого задача (5.28) разрешима; соответствующий регулятор будет обеспечивать минимум ||Я(в)||оо. Существуют и иные способы решения задачи минимизации Ноо-нормы систем, заданных с помощью передаточных функций. Не будем на ИИХ останавливаться, а перейдем к иному подходу — решению задач Нж- оптимизации в пространстве состояний. &2.2. Решение в пространстве состояний Итак, мы рассматриваем систему с внешним возмущением w, ограни- ^СНным в £2-норме: х = Ax + Bu + Dw, ||w||2 < 1, ж(0) = О, . (5.29) у — Cx + Biu
156 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ и ищем управление и = Кх, (5.30) которое минимизирует J = sup ||у|||. W Обратим внимание, что в (5.29) управление и включено в уравнение для выхода для того, чтобы ограничить величину используемого управления. В противном случае можно добиться сколь угодно маленького значения J с помощью достаточно больших и (с той же целью управление было введено в критерий J (5.4) в задаче о линейно-квадратичном регуляторе из п. 5.1). Как мы знаем, J = ||Я(§)||^О, где Я(я) — передаточная функция за- мкнутой системы от возмущения w к выходу у, т. е. минимизация J экви- валентна задаче Я»,-оптимизации. Преобразуем предварительно ||j/|||: ОО ||у||2 = j(Cx + Bi«)T(Cx + BlU)dt = о = j (хтСтСх + 2uTB^Cx + uTBf B\u)dt. о Предположим, для простоты выкладок, что BjC = 0, тогда смешанное произведение отсутствует: Ц2/Ц2 — j\xTCTCx + urSu)dt, S^BlB,. о Таким образом, задача записывается так: х = Асх + Dw, ||w||2 С 1, х(0) = 0, Ас = А + ВК; ОО J = j xTRxdt, где R = CTC + KTSK, S = BlBY. о На основании теоремы 3.13 заключаем, что если неравенство A^P + PAe + ^PDD^P + R^Q (5.31) 72
53- Нее -оптимизация 157 да<еет решение Р > 0, то J 72. Умножим это неравенство слева и справа на Q = Р"1: Q(A + ВЯ)Т + (А + BK)Q + ^DDT + QCTCQ + QKTSKQ 0 и сделаем замену Y = KQ: QAT + AQ + QCTCQ + YTBT + BY + УтSY + A DDT 0. (5.32) Преобразуем члены, зависящие от Y (дополнением до полного квадрата): YTBT + BY + YTSY = = (31/2Г + S-1/2BT)T(S1/2r + S’-1/2BT)-BS~1BT > -BS-1BT, причем равенство достигается при Y = —S~1BT. Итак, неравенст- во (5.32) выполняется при некоторых Q > 0, Y тогда и только тогда, когда выполняется неравенство относительно Q > 0: QAT + AQ + QCTCQ - BS^lBT + С 0. 72 В свою очередь, оно имеет положительно-определенное решение Q > 0, если такое решение имеет уравнение Риккати, полученное заменой нера- венства на равенство (лемма П.23 из Приложения). По этому решению Q ин можем восстановить соответствующий регулятор: K = YQ~r = -S~1BTQ~1, и этот регулятор будет стабилизирующим, т. е. Ас = А + В К устойчива. Итак, мы пришли к следующему результату. Теорема 5.2. Пусть В^С = 0, S = BfBi > 0. Если уравнение Риккати QAT +AQ + QCTCQ^BS~}BT + ^DDT = 0 имеет решение Q > 0 при данном у, то найдется регулятор К = —S~1BTQ~1 ^кой, что в задаче (5.29)-(5.30) будет ЦЯ(в)Ноо < 7, 7/(.ч) — (С + BiK)(sI - (А + BKjy^D — передаточная функция зал>кнутой системы.
158 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИИ Отсюда следует алгоритм подбора 7, который позволяет оценить ми- нимальную Ноо-норму передаточной функции системы и синтезировать соответствующий оптимальный регулятор. Он основан на пересчете 7 и последовательном решении уравнения Риккати. Выше мы рассматривали задачу Ноо-оптимизации в предположении, что известно состояние системы. Аналогичная техника возможна и в за- даче управления по выходу. В этом случае для отыскания Ноо -оптималь- ного регулятора приходится решать два уравнения Риккати. Кроме того, возможен и ряд других, более общих постановок задачи, а также ее дискретные аналоги. Не будем на этом останавливаться, так как вы- кладки становятся значительно сложнее, а идейная сторона решения мало меняется. Сопутствующие функции Matlab: [hinf, linf, hinfopt (RCT)] — Ноо-оптимальный синтез; [care, dare (CST)] — решение уравнения Риккати. 5.3. Подавление ограниченных возмущений Обратим внимание на то, какого рода внешние возмущения счита- лись допустимыми в приведенных выше постановках задач оптималь- ного управления. В Линейно-квадратичной задаче (п. 5.1) внешние воз- мущения предполагались отсутствующими (в действительности возможно обобщение на задачу со случайными гауссовскими помехами; это так на- зываемая линейно-квадратичная гауссовская задача — LQG). Проблема Ноо-оптимизации (и. 5.2) была связана либо с синусоидальными внеш- ними воздействиями, либо с ограниченными в £2 помехами (т.е. убы- вающими с течением времени). Впрочем, возможна формулировка Ноо- оптимизационных задач и в ситуации со случайными гауссовскими поме- хами. Итак, во всех рассмотренных выше подходах внешние воздействия предполагались либо случайными, либо гармоническими, либо затухаю- щими на бесконечности. Однако во многих случаях возмущения являются просто ограничен- ными; какая-либо иная информация о них отсутствует. В такой ситуации требуется выбрать закон управления, который давал бы наилучший воз- можный результат при наихудшем ограниченном возмущении. Это свя- зано с минимизацией Li-нормы (в непрерывном случае) или ?!-нормы (в дискретном случае) оператора, задающего замкнутую систему. По- этому выбор наилучшего управления по такому критерию называется h (или [^-оптимизацией. При этом иногда говорят о проблеме подавления ограниченных возмущений. Рассмотрим эти задачи подробнее.
159 jj. По.|‘Чче11ие ограниченных возмущений jj,l. ^-оптимизация Начнем с одномерных дискретных систем, описываемых скалярным a(z)yk = b(z)uk + wk, (5.33) a(z) = 1 +aiz + ... + anzn, b(z) = bjz + ... + bmzm (5.34) — полиномы (согласно практике, установившейся в ?i-теории, в этом па- ррграфе будем обозначать полиномы строчными буквами), az — оператор сдвига на ад, т.е. zlyk = yk-i. Отметим, что 6(0) = 0, т.е. ук зависит от Uk-i,--- ,Uk-m, Уь-i,- ,Ук-п, а полином a(z) всегда можно отнорми- ровать так, чтобы a(0) = 1. Относительно помехи w будем предполагать лишь ее ограниченность для всех моментов к, т. е. |wfc| г, к = 0,1,..., (5.35) де г > 0 — некоторая константа, или, иначе говоря, ||w||oo С г. Нас интересует выбор управления и в форме обратной связи: /(*) Uk =----- 9{z) иными словами, ик находится из разностного уравнения g(z)uk = -f(z)yk, — некоторые полиномы от z. Обратим внимание, что сте- 88НИ этих полиномов могут быть любыми — во всех случаях ик выража- ет» через предыдущие управления и выходы, а при подстановке этого ик • (5.33) благодаря условию 6(0) = 0 окажется, что выход ук замкнутой Системы выражается только через прошлые значения входов и выходов. Йтак, имеем , ч /(z),, Л V 2 + д&У 2 / Ук = Wk’ ук = h(z)wk, o-(z}g(z} +b(z)f(z)' (5.36)
IJli 160____________________________________Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ Прежде всего, нам нужно, чтобы замкнутая система была устойчивой, т. е чтобы характеристический полином p(z) = a(z)g(z) + Z>(z)/(z) имел все корни вне единичного круга. В этом случае Zi(z) аналитична внутри круга, представима там в виде ряда A(z) = ho+hiz+.. -+hkzk+... (см. п. 1.3), и справедлива оценка 111/11 ОО 1|Л(-г)||1 М ОО Тпадь где ОО ii/i(z)||i = 1^1 < °°- i=0 Таким образом, минимизируя критерий J = ||/l(2)l|l = SUP lll/lloo, мы тем самым минимизируем Zoo-норму выхода при любых входах w, удо- влетворяющих Zoo-ограничениям (5.35). Задача оптимального управления свелась к проблеме минимизации ||/i(z) || i по регулятору при условии, что этот регулятор является стабилизирующим. В некоторых случаях решение такой задачи находится без труда. Пусть, например, b(z) = z, т. е. исходная задача имеет вид Ук — О^Ук—Г • • • О-пУк—п 4" Bfe-1 4 Wk- Если взять Uk-1 = ai3/fe—1 + • + ОпУк-п, ТО будет ук = wk, т.е. |j/fc| |tofe| г, ||г/||оо г. Ясно, что лучшего результата достичь нельзя — каким бы ни было управление uk_i, оно не может зависеть от wk (потому что оно зависит лишь от yk-i,... ,ук-п, а те не зависят от wk). Поэтому для любой величины ек = uk_i — aiyk-i — ... — апук„п / 0 можно взять Wfe = rsignEfc и тогда |yfc| = |е&| + г > г. Аналогичное простое решение получается, если z-1Z>(z) — устойчи- вый полином; тогда достаточно взять Wfe = z ^afc)-!) z-1b(z) Ук-
iffikjl Подавление; ограниченных возмущении 161 Р(г) = z~1b(z) устойчив, a yk = Wk- Однако в общем случае для 'яроизвольного полинома 6(z) решение более сложно. Чтобы его полу- ялть. нам потребуется, во-первых, общий вид стабилизирующего регуля- Юра (см. п. 4.2) и, во-вторых, некоторые факты из теории оптимизации. Запомним, что все стабилизирующие регуляторы даются формулой (4.14): С(г) y°(z) + g(z)q(z) x°(z) — b(z)q(z) ’ (5.37) да x°(z),y°(z) — полиномы минимальной степени, являющиеся реше- нием уравнения by + ax = 1, (5.38) »«(=) — произвольная устойчивая дробно-рациональная функция (т.е. не имеющая полюсов в единичном круге). Вычисляя передаточную функ- по формуле (5.36), получаем h(z) =х° — bq. Пусть полином 6(z) не имеет нулей на единичной окружности, тогда он цредставим в виде b(z) = i>+(z)6_(z), (5.39) Яне все нули 6+(z) лежат вне, а все нули 6_(z) — внутри единичного Круга. Обозначим fc(z) = g(z)6+(z), тогда fc(z) — произвольная устой- чивая дробно-рациональная функция (по fc(z) восстанавливается g(z) = также являющаяся устойчивой). Итак, наша задача принимает ЗДД min ||x°(z) — fc(z)b_(z)||i, (5.40) *(г) fflea:0 — заданный полином (решение уравнения (5.38) минимальной сте- Вени), i..(z) — полином со всеми нулями внутри единичного круга, а Минимум берется по всем устойчивым fc(z). В силу устойчивости функ- МИя k{z) аналитична в единичном круге, а потому она допускает разло- fc(z) = ко + kiz + ... + ktzl +... Относительно коэффициентов разложения к, задача (5.40) является зада- "•*4 оптимизации вида min ||с - Д&||1, (5.41) В.Т. Поляк, П.С. Щербаков
162 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЯ где коэффициенты полиномов a;0(z) = со + ciz +... 4- Cnz", порождают вектор с и матрицу А: Здесь к — бесконечномерный вектор, А — матрица с бесконечным чи- слом строк и столбцов. Рассмотрим конечномерный вариант задачи, в котором берутся N + 1 компонент вектора к и N х (N+ 1) усеченная матрица А: N min ^2 \ci — i=0 где к = (ко,.. .,kN)T, a Ai — первые N + 1 элементов г-й строки ма- трицы А. Эта задача эквивалентна обычной конечномерной задаче ли- нейного программирования: N min i=0 (5.42) -ti Ci - Aik ti. Численное решение может быть получено с помощью любого пакета ли- нейного программирования, например, процедуры linprog в пакете Op- timization Toolbox системы Matlab. Обозначим решение этой задачи через kN, а минимальное значение целевой функции — как JN', ясно, что > Л+1 для любого i. Теорема 53. Существует такое N, что Ji > JN для всех г; иначе говоря, решение бесконечномерной задачи (5.41) достигается на коне» номерном векторе kN. Доказательство. В силу теоремы двойственности для задач вида (5.42) (см. Приложение, п. И) имеем min||c- Afc||i . 1 min llulloo u& 1 " U = {u: cTu = 1, ATu = 0}.
Подавление ограниченных возмущений 163 «ьмг говоря, двойственной к (5.42) является задача mm||u||oo, cTu = l, ATu = 0, ^угорая с учетом вида матрицы А в нашем случае записывается как N minu max( |uf |, £ = 1, d(z)ut = О, » ‘=° (5.43) d(z)=dm+dm-iz + ...+dizm-1. Здесь — полином, получающийся из b-(z) изменением порядка пе- ременных. Поэтому у d(z) корни обратны корням b_(z) и, следовательно, до лежат вне единичного круга. Отсюда следует, что ut -»0 при t —* оо. Таким образом, тах|и*| достигается для некоторого конечного t = N, * значение минимума в (5.43) не меняется при достаточно больших N. В силу соотношения двойственности это же относится и к задаче (5.42). Подытожим полученный алгоритм решения задачи ^-оптимизации. Алгоритм 1. Произведем факторизацию (5.39) полинома b(z). 2. Решим полиномиальное уравнение (5.38), найдем решение х°,у° наименьшей степени. 3. Решим задачу линейного программирования (5.42) для достаточно большого 2V; убедимся, что решение не изменяется при увеличе нии N. 4. По полученному kN = (1$, к$)т построим kN(z) = kg + k?z + ... + k$zN и найдем , х kN(z) <&) = -г—г. 5. Оптимальный регулятор дается формулой (5.37): = V°(z)+a(z)<l(z) W x°(z) — b(z)q(z) Отметим, что если на шаге 3 алгоритма решать двойственную за- (5.43), то требуемое N удается найти сразу; при этом, однако, воз- ^сает небольшое усложнение, связанное с переходом от решения двой- В^енной задачи к исходной. Ж-’Игак, решение проблемы -оптимизации удается получить численно, решения задач линейного программирования. К сожалению, чи- Цг* JV (и, тем самым, порядок оптимального регулятора C(z)) нельзя
164 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ оценить заранее. Существуют примеры, для которых этот порядок очень велик для совсем простых объектов. Например, можно показать, что для дискретной системы Ук - £Ук-1 = Uk-i + еик-2 + wk порядок оптимального регулятора неограниченно возрастает при е 0. Один из способов преодолеть этот недостаток заключается в поиске субоптимального решения — мы можем заранее ограничить порядок Д' полинома k(z) и решить задачу линейного программирования для фик- сированного N; тогда порядок субоптимального регулятора тоже будет априори ограничен. Еще хуже ситуация для непрерывных одномерных систем a(s)y(t) = b(s)u(t) 4- w(t), |w(t)| < г. Здесь оптимальный (в смысле минимума ||j/||oo) линейный регулятор u(t) = C(s)y(t) может оказаться бесконечномерным, т.е. оптимальная функция C(s) не является дробно-рациональной. Мы не будем более подробно изучать эту задачу (называющуюся Li -оптимизацией), равно как и многомерные ана- логи li и Li, а обсудим иные подходы к проблеме подавления ограничен- ных возмущений. 53.2. Использование сверхустойчивости Один из. подходов связан с использованием сверхустойчивости вместо устойчивости и возникающих при этом оценок выхода системы. Рассмо- трим ту же модель (5.33)-(5.35) дискретной одномерной системы, что и ранее: a(z)yk = Ь(г)ик + wk, |wfc| sj г, a(z) = l + aiz +... + anzn, b(z) = biz + ... + bmzm и линейный регулятор g(z)uk = -f(z)yk. Как уже отмечалось, характеристический полином равен p(z) = a(z)g(z) + b(z)f(z), а замкнутая система принимает вид P(z)yk = ff(z)wk.
Подавление ограниченных возмущений 165 Д|И>поп1чно a(z) мы можем отнормировать полином g(z) так, чтобы ^0) = 1; в сочетании с условиями а(0) = 1, Ь(0) = 0 это дает р(0) = 1, характеристический полином равен p(z) - 1 + P]Z + ... + pnzn. Потребуем, чтобы он был сверхустойчивым (см. (3.45)), т. е. 4=1 (другой форме записи это означает, что ||p(z) — l||i < 1), тогда согласно теореме 3.18 имеем " 1-Цр-1111 для всех к. Таким образом, чтобы минимизировать ||у||оо — максимум Модуля выхода, можно минимизировать (по /(z) и g(z)) величину 7(/,g)=-:..И1 (5.44) в предположении, что знаменатель этого выражения положителен. Вводя параметр р, 0 р < 1, мы приходим к задаче min ||р||1/(1 -р), f,9 (5.45) \\ag + bf - 1||! < р, g(0) = l Вели зафиксировать степени F и G полиномов /(z) и g(z): /(z) = fo + fiz + ... + fFzF, g(z) = 1 + giz + ... + gGzG, to при фиксированном p задача (5.45) с помощью стандартных приемов Иожет быть преобразована в задачу линейного программирования отно- СИТельно переменных /о> /1, • •, /у, gi, • • •, gG (см. п- ^.5). Решая ее при различных 0 < р < 1 и оптимизируя по р, мы находим минимум 7* •ОВичины (5.44), а сам peiy-лятор C(z) = f(z)/g(z) гарантирует оценку (5.46) замкнутой системы. Может оказаться, что при слишком малых F и G Решение задачи (5.45) не существует даже при р » 1, т.е. полином p(z) 86 Можег быть сделан сверхустойчивым; тогда порядки F и G полиномов 1**Улян>ра следует увеличить. Отметим, что здесь не возникает проблем с
166 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ высокими порядками, так как в предположении взаимной простоты a(z), b(z) уравнение ад + bf — 1 = 0 разрешимо с G С п — 1, F < т - i (см. теорему П.4 из Приложения), и ограничения в (5.45) совместны при д = 0, т. е. задача (5.45) заведомо имеет решение при G = п - 1, F = т — 1. Описанный способ проще, чем h -оптимизация. Более того, он позво- ляет строить оптимальный регулятор заданного порядка. Однако оценка (5.46) является лишь верхней гранью ||у||оо> поэтому h-оптимизация мо- жет дать лучшее значение этого критерия. Отметим, что такой подход к задаче подавления ограниченных возму- щений допускает обобщение на многомерные системы, причем охваты- ваются случаи и дискретного, и непрерывного времени. Например, рас- смотрим непрерывную систему, заданную в пространстве состояний (везде ниже используем оо-норму для векторов): х = Ах + Ви 4- Diw, х(0) = хо, (5-47) у = Сх 4- D2W, lw(0l 1» t > 0. Ищем регулятор по выходу и = Ку и прежде всего требуем, чтобы он сверхстабилизировал замкнутую систему х = Асх + Dw, Ас = А + ВКС, D = D\ 4- BKD%, т.е. чтобы <т(Ас) > 0, где а(Ас) определяется (3.38). Среди всех таких регуляторов ищем тот, который минимизирует критерий J= max maxh:(t)| llwlloo^l t (в более общей постановке можно интересоваться не состоянием x(t), а какой-нибудь линейной функцией от него). Воспользуемся оценкой (3.40), справедливой для сверхустойчивых си- WDi+BKD^ ^^^аТвксГ и будем минимизировать ее по всем К при условии, что регулятор К — сверхстабилизирующий. Вводя параметр а > 0, приходим к задаче min |l£l±.ggg2.|li. (5.48) а(А + ВКС)^а>0. (5.49)
Подавление ограниченных возмущений 167 Как и выше, при фиксированном а такую задачу нетрудно преобра- ггь к системе линейных неравенств относительно элементов матрицы ритора К. Теорема 5.4. Если задача параметрического линейного программи- ания (5.48)-(5.49) имеет решение К, а с оптимальным значением критерия (5.48), то регулятор и = Ку сверхстабилизирует си- жу (5.47) и при любых начальных условиях |х(0) | J* будет |х(0| < , t > 0. Таким образом, полученный регулятор минимизирует норму вектора гояннй равномерно по t, что предотвращает нежелательные эффекты а всплеска (см. п. 4.3). Выше (п. 4.5) отмечалось, что не всякая система может быть сверх- 5илизирована. Поэтому решения в задаче (5.48)-(5.49) может и не су- ггвовать, однако если она и разрешима, то величина J* дает лишь хнюю оценку оптимального значения критерия. 3. Использование инвариантных множеств Совсем другой подход связан с оценками множества достижимости, ученными в п. 3.5. При этом сложный случай многомерных непре- шых систем также анализируется легко. Напомним (несколько изменяя обозначения), что в теореме 3.12 мы учили следующий результат. Пусть замкнутая система имеет вид х = Acx + Dw, х(0) =0, (5.50) у = Сх, wT(t)w(t) < 1, 0 < t < оо, матрица С — полного ранга и для простоты считаем, что матрица D цратная и невырожденная. Тогда в предположении устойчивости Лс всех t выполняется неравенство рт(«)срсМ) < 1, Р = Р(а) > 0 — решение задачи mintr СР(а)Ст, а>0 (5.51) ACP + PAJ+ aP + a~1DDT 0, Р>0 теореме 3.12 неравенство было заменено на равенство в соответствии еммой ПЛ 5, но мы сделаем это чуть позже). Пусть теперь исходная ^гема содержит управление и: х = Ах + Ви + Dw, ,, -7, у = Сш,
168 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ и это управление ищется в форме статической обратной связи по состоя нию: и = Кх. Тогда замкнутая система принимает вид (5.50) с Ас = А + ВК. Под- ставляя это выражение в (5.51), получаем матричное неравенство для Р и К: АР + РАТ + РКТВТ + ВКР + аР + a~1DDT 0. Здесь две матричных переменных Р и К, которые входят нелинейным образом. Введем новую матричную переменную Y = КР\ тогда получаем линейное матричное неравенство АР + РАТ + УТВТ + BY + аР + a~1DDT 0. Таким образом, если мы хотим найти минимальный эллипсоид (в смысле следа соответствующей матрицы), в котором содержатся выходы y(t) при любых ограниченных возмущениях w(t). то нужно решить следующую задачу: min 1тСРСт, а,Р,У АР + РАТ + УТВТ + BY + aP + a~1DDT 0, а > 0, В > 0. (5.53) На основе лемм П.18 и П.16 из Приложения заключаем, что решение в задаче (5.53) достигается на У = -уВт и при замене знака неравен- ства на знак равенства. Таким образом, Р — Р(а,'у) является решением уравнения Ляпунова АР + РАТ - 7ВВТ + аР + cY1DDr = 0, Р > 0. (5.54) Окончательное решение находится путем минимизации min у>(а,7), = trCP(a,7)CT, (5.55) а,7>0 при этом рассматриваются такие значения а, 7, что Р(а,7) > 0. Пред- положим, что мы решили задачу (5.55) и нашли оптимальные а, у, а тем самым и Р, У. Тогда регулятор u = YP^x обеспечивает неравенство yT(t)CPCry(t) С 1
Выводы jga выхода y(t) системы (5.52) с таким регулятором при любом ЦшЦк, С 1, причем ло неравенство — наилучшее из возможных такого типа. В част- ности, если выход y(t) — скалярный (т = 1), то С = ст —вектор- строка, и мы получаем т.е. Х-1/2 IMloo < (cTPcj g величина в правой части оценивает ||т/||оо- Иначе говоря, решение «дачи (5.54)-(5.55) дает наилучший регулятор по состоянию, оптимизи- рующий эту оценку. Сформулируем окончательно полученный результат для скалярного выхода (т. е. для т = 1, С — ст). Теорема 5.5. Пусть Р{а,у) — решение уравнения Ляпунова (5.54); рассматриваются лишь такие а, у, что Р(а, у) > 0. Решим двумерную задачу оптимизации (5.55) и обозначим ее решение через ао,7о- Вычи- слим Ко = -7оВтР(ао,7о) 1 Тогда управление и = Kqx обеспечивает оценку для системы (5.52) с т = 1, С = сТ при любых ||w||oo 1, и эта Оценка — наилучшая из возможных при произвольных обратных связях вида и Кх. Нужно ясно представлять возможности и ограничения предлагаемого ЯОДХода. С вычислительной точки зрения он не очень сложен. В то же Ч*мя инвариантный эллипсоид — лишь оценка для выхода системы; эта оценка может быть и завышенной. Практически почти без всяких изменений метод переносится и на ®*скрегпые системы, и мы не будем на этом останавливаться. Сопутствующие функции Matlab: Uaprog — решение задачи линейного программирования. Выводы •г • Задача оптимального управления заключается в построении такого ^Типизирующего управления, которое минимизирует некоторый крите- качества.
170 Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНЦА • Одной из основных является LQR — задача о линейно-квадратично^ регуляторе (иначе — задача об аналитическом конструировании регуля- торов), возникающая при описании системы в пространстве состояний х = Ах + Ви, я(0) = хд, и выборе управления в форме линейной обратной связи по состоянию и = Кх, которое минимизирует квадратичный критерий ОО J = j[(Rx,x) + (Su,u^dt о с некоторыми весовыми матрицами R > 0, S > 0. Для ее решения можно пользоваться следующими методами. 1) Исходя из принщща максимума, решить краевую задачу х = Ах — В8~1Вгф, х(0) = хо, •ф = -Атф — Rx, V’(oo) = 0, относительно х,ф. Оптимальным будет программное управление и = -З-'ВГф. 2) Решить уравнение Риккати АТР + РА- PBS-'BFP + R = Q и взять статическую обратную связь и = —3~1ВтРх. При этом опти- мальное значение критерия равно Jmjn = xj Bxq. 3) Решить задачу минимизации с ограничениями в форме линейных матричных неравенств min'Y~tx'(jQ~1xo, / AQ + QAT+ ('y-2)BS~1BT ^2QR^2 \ I I <0, Q>0 \ y/2Ri/2Q -if и взять обратную связь и = —S~1BTQ~1x. • Задача Я» -оптимизации заключается в построении стабилизирую- щего регулятора для систем с возмущениями, ограниченными в £2-норме< а показателем качества является величина Яте-нормы передаточной функ- ции замкнутой системы. При описании системы в частотной области a(s)p(t) = b(s)u(t)+w(t), ||w(t)||2 1,
Выгоды В выборе регулятора в форме обратной связи и = C(s)y пользуется параметризация всех стабилизирующих регуляторов с после- дующей оптимизацией критерия по параметру. В ряде частных случаев (рплином Ь(з) устойчив либо имеет один неустойчивый корень) решение дожет быть найдено в явной форме. Для общего случая решение дается feopeMOM Неванлинны-Пика (теорема 5.1), и имеются конструктивные оделенные алгоритмы построения Ясс-оптимального регулятора, опираю- щиеся на этот результат. При описании в пространстве состояний х = Ах + Bu + Dw, ||w||2 < 1, ж(0) = О, у = Сх + Biu ищется управление и = Кх, которое минимизирует критерий J=||H(s)||oo= sup |М|2, ||w||2<l ДО Ц(в) = (С+В1К)(з1 — (Л+BK))~1D — передаточная функция за- Мкщпгой системы. Решение дается теоремой 5.2, которая использует связь между величиной ||р||2 и существованием положительно-определенного решения уравнения Риккати QAT + AQ + QCTCQ - BS-'bF + ±DDT = 0, S = В^Вц > именно, если при некотором значении 7 уравнение имеет положительно- прсделенное решение Q, то использование регулятора К = -S~1BTQ~1 ЛКт оценку J < 7. Наилучшую оценку можно получить, последовательно ^сбирая 7 и решая соответствующее уравнение Риккати. • Если о присутствующем в системе возмущении известно лишь то, ^0 оно ограничено, то стабилизация такой системы и минимизация оо- Аормы выхода (состояния) приводит к задаче h-оптимизации. В случае одномерной дискретной системы a(z)yk = b(z)uk + wk, |шь | < r, k = 0,1 a(z),6(z) — полиномы от оператора задержки, а ||ш||оо < г, ищем Управление в форме
172_______________________________Глава 5. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ которое минимизирует оо-норму выхода ||y||oo- Решение основано на па раметризации всех стабилизирующих регуляторов с последующей опти мизацией по параметру (функции из RHoo). Задача сводится к беско- нечномерной задаче линейного программирования; решение достигается на конечномерном векторе (теорема 5.3), по которому восстанавливается оптимальный регулятор. Основная трудность — высокий порядок полу- чаемого оптимального регулятора. • Если встать на позиции сверхстабилизации, то задача упрощается, так как сводится к обычному линейному программированию (теорема 5.4), и легко анализируется случай многомерных непрерывных и дискретных систем. При этом решение (если оно существует) будет субоптимальным, однако такой субоптимальный регулятор — регулятор фиксированной структуры и, кроме того, он гарантирует монотонность убывания нормы состояния, т. е. предотвращает нежелательные эффекты всплеска. При использовании оценок множества достижимости также возможно обобщение на многомерный случай и непрерывное время. Регулятор по состоянию выражается через решение уравнения Ляпунова, зависящего от двух параметров; это решение определяет размер инвариантного мно- жества. Последующая оптимизация регулятора по параметрам дает ми- нимальный размер инвариантного множества (теорема 5.5). Такой под- ход прост с вычислительной точки зрения, но приводит лишь к оценкам нормы выхода системы, т. е. получаемый регулятор также субоптимален.
Часть 2 СИСТЕМЫ С НЕОПРЕДЕЛЕННОСТЬЮ (РОБАСТНАЯ ТЕОРИЯ) В первой части книги рассматривались системы управления, для ко- торых было доступно точное математическое описание. Однако, как уже (юоднократно указывалось, такая ситуация является идеализированной. В реальных задачах неизбежно присутствует неопределенность, а исполь- зуемое управление должно быть работоспособно при наличии неопреде- ленности. Такое управление называется робастным, и мы переходим к изучению робастной теории управления. Глава 6 ВИДЫ НЕОПРЕДЕЛЕННОСТИ 6.1. Параметрическая неопределенность Если модель описывает физический объект (механический, электриче- ский, экономический и т. п.), то, как правило, его параметры не известны Точно, причем во многих случаях их значения в принципе не могут быть Доступны, поскольку они могут меняться в процессе эксплуатации. На- вример, при управлении автомобилем мы не знаем заранее его массу (она зависит от загрузки), скорость, коэффициент трения (он зависит от состояния дороги и износа шин) и т.д. При этом сами уравнения, опи- сывающие движение, известны точно. В таких ситуациях можно говорить о параметрической неопределенности. Линейная система (1.1) при этом Заменяется на семейство систем (иногда используют термин неопреде- ленная система) х = A(q)x + B(q)u + D\(q)w, q&Q, n у = C(q)x + D2(q)w, все матрицы А, В, C, Di, D2 зависят от параметров q 6 Rz, которые Врннадпежат заданному допустимому множеству Q С Rf (множеству
174 Глава 6. ВИДЫ НЕОПРЕДЕЛЕННОСТИ неопределенности). Подчеркнем, что система (6.1) остается стационар- ной — параметры q не меняются во времени, однако априори известно лишь то, что они лежат во множестве Q. Аналогичным образом при описании системы с помощью передаточ- ных функций ее элементы могут зависеть от параметров, т. е. передаточная функция объекта (пусть, для простоты, в одномерном случае) приобретает вид H(s,g) = ^^, qeQ, (6.2) где A(s,q), B(s,q) — неопределенные полиномы, коэффициенты аДд), bi(q) которых зависят от q е Q. В этом случае говорят о неопределенном объекте H(s,q). Например, при последовательном соединении I простых звеньев с передаточными функциями fc</(l + Т(в) и неопределенными постоянными времени Т{ и коэффициентами усиления ki мы получаем семейство передаточных функций н(*,т,к) = -—-hph-—, (1 +Tis)---(1 + Tts) Т = (Т1,...,Те)т eQT, к^(к1,...,ке)т eQk,. где роль параметров играют постоянные времени и коэффициенты уси- ления. Заметим, что в Н(з,Т,к) числитель и знаменатель зависят ка- ждый от своего вектора параметров, что на первый взгляд не укладыва- ется в модель неопределенности (6.2). Однако, объединяя Т и к в вектор q = (Т к) е R2€, придем к записи (6.2), которая, таким образом, является общей моделью.' Мы будем рассматривать различные виды ограничений на неопреде- ленные параметры, т.е. на форму множества Q. В принципе, допустимое множество может иметь произвольный вид и даже совпадать с но чаще всего (по соображениям природы задачи, когда неопределенные фи- зические параметры имеют некоторые допуски) мы будем иметь дело с параллелепипедом, когда каждый из параметров меняется независимо в своем диапазоне (интервале неопределенности): Q = {q 6 : qf < qi gj, (6.3) в частности, с единичным кубом в оо-норме: Q = {qetf: |g|«, 1}. (6.4) При этом вершинным элементом семейства (или просто вершиной) назы- вается элемент (матрица, полином, передаточная функция), определяемый
Параметрическая неопределенность 175 Луайними допустимыми значениями параметров: д, = д, либо & = qit 4 * 1,.. •, 4 в случае (6.3) или q, = ±1, i = I,..., I, в случае (6.4). Та- лли образом, всего имеется 21 вершинных элементов — по числу вершин ^-мррного параллелепипеда (куба) Q. Однако параметры могут не быть независимыми, а иметь некоторые совместные ограничения; простейший из таких случаев: допустимое мно- жеств Q является шаром {g G : |д|з 1} в 2-норме или эллипсоидом ЩЩД Jf-', Q = {<? € R£ : q^M-'q < 1, М > 0} Q = G R£ : (6.5) Bf?° = («?»• ••>«?) — некоторое значение параметра, соответствую- щее номинальной системе, а, — масштабные множители. В этом случае говорим о сферических (эллиптических) ограничениях на параметры. Во- обще, в качестве Q обычно рассматривается множество, ограниченное в какой-нибудь норме. Мы будем рассматривать также различные структуры неопределен- ности, т. е. типы функциональной зависимости от параметра q; главным образом, линейную неопределенность. При этом коэффициенты ai(q) Яеопределенного полинома (или элементы atj(q) матрицы A(q)) есть ли- нейные функции от q. Особо выделяют следующие случаи. 1. Интервальная неопределенность. Например, интервальный поли- ном задается так: Р(а) = {р(а) = ао + ais +... 4- апвп Qi^a^^at, ап > 0, i = 0, ...,nj; (6.6) * Нем сами коэффициенты являются неопределенными параметрами, кото- рые могут независимо принимать значения в своих интервалах неопреде- яевности fcti, а,]. Условие ап > 0 обычно накладывается для того, чтобы обеспечить неизменность степени п полинома при всех ап ап < ап. Иногда бывает удобнее следующая форма записи интервального семейства ЖМнномов: Р(в) = ^P(s) = ао + ais + • • • + апзп : 1<х* - а°| 7а<, г = 0,1,... ,п}. (6.7)
176 Глава 6. ВИДЫ НЕОПРЕДЕЛЕННОСТИ Здесь а° — коэффициенты номинального полинома Ро(з) = + ... + а° зп, а, > 0 — масштабы изменения коэффициентов а,, 7 > 0 — размах неопределенности. В этой записи аг = а — 7а,, а, = а? + 7аг. Таким же образом определяется интервальное семейство матриц-. = ((Оу)) ' Stfj (6.8) которое часто записывают в форме, аналогичной (6.7): 4 = Ло+7Д, (6.9) где, соответственно, Ао — ((а?)) — номинальное значение, Д = ((Ду)), |Ду| 6ij — неопределенность, матрица 6 = ((<5у)) задает масштабы изменения элементов Оу матрицы Л, а 7 > 0 — размах неопределенности. 2. Аффинная неопределенность. Описанная выше ситуация, когда не- определенными параметрами являются сами коэффициенты полиномов, достаточно редкая, ибо обычно коэффициенты характеристического по- линома не имеют непосредственного физического смысла и зависят от параметров q более сложным образом. Аффинная неопределенность явля- ется простейшей моделью такой зависимой структуры неопределенности. Аффинное семейство полиномов задается так: P(s,Q) = {P(s,g) - P0(s)+gi-Pi(s) + ... + qePt(s), q&q}, где полиномы Pt(s), i — О,..., Л фиксированы и известны (P(s,0) = P0(s) также называют номинальным полиномом семейства). В этом слу- чае коэффициенты ai{q) полинома P(s,q) зависят аффинным образом от параметров q: t. ai(q) + '£/qja1i, где — коэффициент P>(s) при s'. Иными словами, коэффициенты ai(q) не Moiyr меняться независимо друг от друга при изменении q. Ана- логично задается и матричное аффинное семейство: А(?) = Aq + 91Д1 + ... + qgAf, q € Q, где Ai, i — 0,..., t, — известные матрицы. Линейная зависимость от неопределеных параметров представляет со- бой удобную модель параметрической неопределенности; чаще, однако, встречается случай мультилинейной зависимости. Скалярная функция «(?), q € называется мультилинейной, если она линейна по каждой компоненте при фиксированных значениях всех остальных компонент.
6.2. Частотная неопределенность 177 Мы уже встречали характеристические полиномы, коэффициенты кото- рых являются мультилинейными функциями. Таковым, например, будет характеристический полином уже упоминавшейся цепочки простых зве- ньев вида ki/(l +Tjs), замкнутой единичной обратной связью: P(B,T>*) = (l+T1s).i..(l+T£s) + jfe1...fc£, (6.10) если рассматривать постоянные времени Ti и коэффициенты усиления кг как неопределенные параметры (Т, к) € Q. Характеристический полином интервальной матрицы (6.9) также является мультилинейной функцией переменных Д^. Отметим также встречающуюся полиномиальную зависимость от па- раметров; примером может служить характеристический полином аффин- ного матричного семейства: i P(s,q) = det(sl - A(g)), A(q) = Ao + ^4^, q&Q, l~ 1 И др При описании в пространстве состояний часто используется модель матричной неопределенности, когда не физические параметры, а непо- средственно матрицы, описывающие систему, допускают неопределен- ность. Например, х = Ах, А = Ао + Д, те Ао — известная матрица, а Д — возмущение, удовлетворяющее усло- вию типа НДКт |йесь || • || означает некоторую норму матрицы, а 7 — диапазон возмож- ных возмущений. Типичной является модель, иногда называемая струк- турированной матричной неопределенностью. Например, при наличии неопределенности в матрице усиления К = Ко + Д, ||Д|| 7, соот- ветствующая неопределенность в матрице замкнутой системы А + ВКС будет иметь структурированную форму ВАС, ||Д|| 7, а номинальное значение матрицы замкнутой системы равно А + BKqC. 6*2. Частотная неопределенность В тех случаях, когда исходным является описание системы с помощью ^нстотных характеристик, естественно описывать и неопределенность в же терминах. Так, передаточная функция одномерной системы может иметь вид Я(в) = Я0(а) + ДЯ(в),
178 Глава 6. ВИДЫ НЕОПРЕДЕЛЕННОСТИ где частотная неопределенность ДЯ(з) принадлежит тому или иному классу. Например, нередко считают, что |ДЯС?ш)| \W(ju>)\ для всех ш при заданной функции VK(s), W-1(s) ё RHoo- Иными сло- вами, Ни^дяИоо < 1. Кроме того, предполагается, что число неустойчивых полюсов Яо(«) + ДЯ(з) одинаково для всех допустимых ДЯ(з). Для матричной передаточной функции существует гораздо большее разнообразие форм, в которых может быть задана неопределенность. На- пример, передаточная функция может иметь вид Я(а) = Я0(в) + ^(а)Д(з)1Г2(в), где ^(з), W2(s) € RHoo — заданные функции, а Д^ё ЯЯоо, ||Д(в)||00 < 1, — это так называемая аддитивная модель ошибок. Наряду с ней может рассматриваться мультипликативная Модель: Я(з) = Я0(з)(/ + Wi(s)A(s)W2(s)) и ряд других. Несколько иная модель связана с записью объекта в виде G(s) = N(s)M~1(s), где N(s),M(s) & RHoo (см. (4.15)); тогда неопре- деленность может быть учтена в форме G(s) = (Я(а) + ДЯ(в)} (М(з) + ДМ(в))"1. Наконец, весьма общий способ учета неопределенностей связан с так называемой дробно-линейной формой. Пусть М — матрица, которая имеет блочную форму: w _ ( Мц М12 \ “ \ М21 М22 ) ’ где матрицы Мц,М22 — квадратные (возможно, разных размерностей). Нижним (соответственно верхним) дробно-линейным преобразованием на- зываются матрицы + (6.Н) Ги(1И,Ди) = М^ + Мп^Г-Мп^иГ'Ми (6.12)
AC-1 B — AC~1D\ С-1 -C^D ) ^,2- Частная неопределенность\Т9 цри условии, что обратные матрицы существуют. Модели, использую- щие Ti и Тц, могут охватывать большое число способов учета неопреде- ленности Д. Например, можно показать, что если A, B,C,D — матрицы соответствующих размерностей и С-1 существует, то (А + ВД)(С + РА)-1 = Ti(M, Д), М = (6.13) Дробно-линеййое описание неопределенности весьма естественно воз- никает в задачах с так называемой М-А-конфигурацией. Это общая схема анализа задач с неопределенностями, получившая широкое распро- странение в современных исследованиях. Она заключается в том, что система приводится к виду, изображенному на рис. 6.1, где w — внешние Рис. 6.1. 1И-Д конфигурация Коды, г — выход, М = M(s) — матричная передаточная функция, а Д(в) — матричная функция, отвечающая разного рода неопределенно- стям. Иначе говоря, неопределенность включается в цепь обратной связи. Более подробно система записывается в виде 61 = Мцв2 + M12W, в2 = Дех, Z = М21Ё2 + M22W. Формально исключая отсюда ei,e2, получаем: 61 = Л/цДб1 + M12W, 61 = (1 — МцД)-1М12Щ, Z = Л/21 Дв1 + M22W = ^Л/21 Д(/ ~ 1ИцД)_ 1ЛГ12 + Af22^wi •ИИ, иначе говоря, 2 = Л(ЯД)«>. (6.14) ® Невозмущенной системе Д = 0 и Та(1И,Д) = М22, т.е. Мг2(з) — . йеРедаточная функция невозмущенной системы.
180________________________________Глава 6. ВИДЫ НЕОПРЕДЕЛЕННОСТИ С другой стороны, техника таких преобразований бывает полезна и в задачах без неопределенности. Например, в системе х = Ах + Ви, у = Сх + Du передаточная функция от и к у G(s) = C(sl - А)-1 В + D может быть записана в виде = М = Если же рассматривать систему с внешним возмущением х — Ах + Ви + w, у = Сх + Du А В \ С D )' и решать задачу Нх-оптимизации, т. е. искать регулятор и — Кх, который минимизирует Ноо-норму передаточной функции замкнутой системы G(s) = (С + DK)(sI -А- ВК)-1, то, пользуясь (6.13), G(s) можно записать как „ Г C(sl-A)-1 D + C(s/~A)-'B 1 Тогда задача Д»-оптимизации приобретает вид тт||Я(М,К)||оо. (6.15) К Аналогичным образом полином Р(з) = ао + ais + ... + ansn представим в виде P(s) = Kt(M,sI), ( Ло аг . • dn—i ап \ 1 0 . 0 0 \ о 0 1 0 / где Мц — ао, М12 = (аг,..., ап), М21 = (1, 0, ..., 0)т. Заметим, что М представляет собой одну из форм записи матрицы Фр0' бениуса для полинома, ср. с (1.44). Сопутствующие функции Matlab: 1ft (CST) — дробно-линейное преобразование
£3. Нестационарные и нелинейные возмущения 181 63. Нестационарные и нелинейные возмущения В рассмотренной выше модели х = (Ао + Д)х мы предполагали, что Д — постоянная матрица. Однако иногда возму- щения меняются во времени, и мы приходим к модели нестационарных возмущений Д = Д(4). При этом предполагается, что для всех t матрицы Д(£) принадлежат какому-либо заданному семейству, например, 1|Д(*Ж7 для некоторой матричной нормы || • || или интервальному семейству Дгу Д^(^) Дij 1 “ 1, • • , И. Более того, в ряде случаев возмущения зависят и от состояния системы, и мы можем рассматривать системы типа i = (Ао + Д(4,ж(4)))а: и множество других вариантов вхождения нелинейных и нестационарных возмущений. Хотя в этой книге мы в основном ограничиваемся линей- ными стационарными задачами, тем не менее в ряде случаев развитый ап- парат (например, квадратичная стабилизация, п. 4.4; сверхустойчивость, п. 3.6) позволяет решать задачи и при наличии нестационарных и нели нейных возмущений. 6.4. Вероятностный подход к робастности Для всех описанных выше моделей неопределенности в последующих парафафах будет применяться минимаксный подход. Нас будут интересо- вать вопросы типа: можно ли гарантировать какое-либо свойство системы Для всех допустимых значений неопределенности? Например, будут ли все возмущенные системы устойчивыми (робастная устойчивость)? Или: обеспечивают ли они все некоторое заданное значение выбранного по- казателя качества (робастное качество)? Можно ли выбрать такой ре- Чиятор, который для всех систем гарантирует устойчивость (робастная С1гюбилишция)? Однако можно встать и на несколько иную точку зрения. Пусть мы ***еем дело с параметрической неопределенностью; будем считать, что
182 Глава 6. ВИДЫ НЕОПРЕДЕЛЕННОСТИ параметр q выбирается из допустимого множества Q случайным образом, в соответствии с некоторым заданным на Q вероятностным распределе- нием (например, равномерным). Тогда можно оценить вероятность того, что выбранная случайно система будет обладать требуемым свойством. Если эта вероятность близка к единице, то с практической точки зрения поведение системы будет удовлетворительным (мы пренебрегаем малове- роятными событиями). Есть несколько причин, по которым такой подход кажется оправдан- ным. Во-первых, точное решение проблемы о робастности часто сложно или вообще невозможно. Например, для задачи о робастной устойчивости интервальных матриц алгоритм решения отсутствует. Равным образом очень трудны задачи робастного синтеза при параметрической неопре- деленности. Вероятностный подход часто позволяет снять эти трудности. Во-вторых, детерминированный подход часто является слишком пессими- стическим — рассчитывая на самые худшие ситуации, мы занижаем раз- мах допустимых возмущений. Если же пренебречь событиями малой ве- роятности, то диапазон неопределенности можно значительно увеличить. В-третьих, во многих практических задачах неопределенные параметры действительно имеют вероятностную природу по своему происхождению или по способу их оценки. Например, параметры стандартных элемен- тов электрической сети (емкости, сопротивления и т.д.) имеют разбросы, подчиняющиеся вероятностным законам. Значения параметров могут быть также получены в результате идентификации по измерениям, содержащим случайные ошибки, или они связаны с процессом производства и допус- кают случайный разброс вокруг номинальных значений и т.д. Ясно, что тогда и сами оценки имеют вероятностный смысл и вероятностные пока- затели точности, и устанавливать жесткие верхние и нижние границы для параметров в этих условиях представляется неоправданным. Вероятностные модели для неопределенностей могут быть различ- ными, мы познакомимся с ними детальнее позже. 6.5. Выводы • При параметрической неопределенности под семейством систем (неопределенной системой) понимают запись вида х = A(q)x + B(q)u + Di(q)w, qeQ, У = C(q)x + D2(q)w, где все матрицы зависят от параметров q е R€, принадлежащих допусти- мому можеству (множеству неопределенности) Q с Rf. При этом говорят о параметрических семействах матриц {Л(д), q 6 Q} (неопределенной
А.$. Выводы 183 цятрице). Аналогичное понятие вводится для полиномов P(s,q) и пере- моточных функций H(s,q), коэффициенты (элементы) которых зависят де параметров. Допустимое множество Q, как правило, задается в виде ограничений па норму вектора q неопределенных параметров. Наиболее часто исполь- зуемая оо-норма приводит к кубу или параллелепипеду в R£, при этом каждый параметр меняется независимо в своем интервале неопределен- ности: qi < qi 9,- В этом случае вершинным элементом семейства называется элемент, определяемый крайними допустимыми значениями щарамегров. Часто используется 2-норма, приводящая к шару или элли- псоиду — сферическая неопределенность. Рассматриваются различные структуры неопределенности — типы функциональной зависимости от параметра q. При линейной зависимо- сти коэффициенты а,(д) неопределенного полинома являются линейными функциями от q. Особо выделяют случаи интервальной неопределенности аффинной неопределенности. Под интервальным полиномом понимают P(e) = {p(s) = ао + а\8 +... + апзп : а* аг а<, ап > О, г = 0, ...,nj; нота используют другую форму записи: P(e) = |p(s) = ao+ais+.. .+ansn |а<—а°| < уац, i = 0,1,... ,nj, где а, — коэффициенты номинального полинома Po(s) = а® + a®s + ... + в", А, > 0 — масштабы изменения коэффициентов at, 7 > 0 — размах неопределенности. Таким же образом определяется интервальное семейство матриц: А = ((ац)): ац < ац С Sy, i,j = 1,... ,n, или А = Ао+7Д, 1Дс Ao = ((а?-)) — номинальное значение, A = ((Ду)), |Ду| <5у — Неопределенность, 6 = ((5ц)) задает масштабы изменения элементов ац Матрицы А, а 7 > 0 — размах неопределенности. Под аффинным семей- ством полиномов понимают ?№) = {P(s,g) = Ро(в) + 91Р1(в) +... +«ЛЙ), q & Q}, Ч® полиномы РДв), г = 0,... ,£, фиксированы и известны. Аналогично 3ВДастся и матричное аффинное семейство.
184 Глава 6. ВИДЫ НЕОПРЕДЕЛЕННОСТИ О мультилинейной структуре неопределенности говорят, когда коэф- фициенты полинома являются мультилинейными функциями от q е Q -~ они линейны по каждой компоненте q при фиксированных значениях всех остальных компонент. • Часто используется модель матричной неопределенности, ограни- ченной по норме: А = Ао + Д> ||Д|| ^7, где Ао — номинальное значение, Д — возмущение, а 7 — диапазон возмущений. Типичным является случай структурированной матричной неопределенности вида А = Ао + ВДС, ЦДК7- • Неопределенность в передаточной функции учитывается в аддитив- ной или мультипликативной форме: Я(а) = H0(s) + W1(s)A(s)W2(s) или Я(а) = Я0(в)(/ + Wi(s)A(s)W2(s)), где матричные функции Wi(s), lV2(s) G RHoo заданы, a A(s) G RHoo удовлетворяет ||A(s)||oo 1. В одномерном случае типичной является форма записи Я(в) = Я0(я) + ДЯ(в), НИ^ДЯИоо < 1, где Tr(s) — заданная функция, W-1(s) G RHoo- При записи объекта в виде G(s) = N(s)M~1(s), где N(s),M(s) G RH„o, неопределенность может быть учтена в форме G(s) = (я(в) + ДЯ(в)} (м(а) + ДМ(з))-1. • Нижним и верхним дробно-линейным преобразованием матриц М и Д, где М имеет блочную структуру _ / Мп Mi2 \ V М21 М22 ) (Мц,М22 — квадратные матрицы), называются матрицы Ji(M,A) = Мн+М12Д(/-М22Д)-1М21, J-U(M,A) = М22 + М21Д(/— МцД)_1М12.
45 Выводы____________________________________________________185 Такой способ учета неопределенности А назывется дробно-линейной фор- мой; он возникает в задачах с М-Д-конфигурацией, при которой неопре- деленность включается в цепь обратной связи. Дробно-линейное преобразование применяется и в задачах без неопре- деленности. В частности, для системы х — Ах + Ви + w, у = Сх + Du дшаче Ноо -оптимизации можно придать вид С(з1 - Л)-1 D + C(sl- А)~'В V (sf-Л)-1 (з1 — А)~1В ) • В рамках вероятностной модели параметрической неопределенно- сти считают, что параметр q имеет некоторое заданное вероятностное распределение на допустимом множестве Q. Тоща задачи робастности можно ставить не в минимаксном смысле, а оценивать вероятность того, что неопределенная система обладает требуемым свойством. Если эта ве- роятность близка к единице, то с практической точки зрения поведение системы можно считать удовлетворительным.
Глава 7 РОБАСТНАЯ УСТОЙЧИВОСТЬ В отличие от главы 3, где исследовалась устойчивость одной заданной линейной системы, здесь мы будем заниматься устойчивостью целого се- мейства систем, соответствующих исходной (номинальной) системе при наличии неопределенности. 7.1. Робастная устойчивость полиномов Задано семейство полиномов P{s,Q) = = ао(в) + <*г(«> + • - - + an(q)sn, q € Q}, (7.1) коэффициенты а»(д) которых зависят от параметров q е изменя- ющихся в допустимом множестве Q С Это семейство называется робастно устойчивым, если P(s,q) устойчивы при всех q е Q, т.е. Rest(g)<0, i = l,...,n, q 6 Q, где Si(q) — корни P(s,q). Таким образом, здесь мы имеем дело с непре- рывной устойчивостью; проблема дискретной устойчивости будет обсу- ждена ниже. Ясно, что в данной ситуации мы не можем непосредственно воспользоваться критериями устойчивости из главы 3, так как множе- ство Q, вообще говоря, содержит бесконечно много элементов. Наша цель — получить робастные аналоги этих критериев. Приведем сначала один общий принцип (часто называемый принци- пом исключения нуля), позволяющий строить конструктивные алгоритмы проверки робастной устойчивости. Теорема 7.1 (принцип исключения нуля). Пусть P(s,q°) устойчив для некоторого g° е Q, множество Q связно, и an(q) / 0 для всех q&Q- Тогда условие О $ <S(o>) = {P(jw,q): q ё Q}, V 0 < w < оо (7.2) необходимо и достаточно для робастной устойчивости семейства (7.1)'
7.1' Робастная устойчивость полиномов 187 Множество S(w) называется областью значений полиномиального се- цейства (7.1); это двумерный образ множества Q при преобразовании P0w.)- Доказательство. Необходимость условия (7.2) очевидна: если 0 = P(jw*,<r) ДО* некоторого ы’ и некоторого q* & Q, то полином P(s,q*) имеет чисто мнимый корень jw* и потому не является устойчивым. До- кажем достаточность условия (7.2); пусть оно выполняется, но найдется полином P(s,ql), q1 е Q, являющийся неустойчивым. Рассмотрим непре- рывную кривую q(t) eQ, О О С 1» q(Q) = q°, g(l) = q1; она существует в силу связности Q. Пусть 8i(t) — корни полинома P(s,q(t)). Поскольку Оп(9(0) / О» то п0 теореме о непрерывной зависимости корней полинома п-й степени от параметров (см. Приложение, п. 10.1) корни могут быть занумерованы так, что функции si(t) непрерывны. Однако по меньшей мере один корень (например, первый) полинома РСз.д1) лежит в пра- вой полуплоскости: Resi(l) > 0, в то время как Resi(0) < 0 в силу устойчивости P{s,(f). Поэтому найдутся 0 < t* 1 и g* = q(t*) б Q Такие, что Re si (Г) = 0. Но это значит, что P(s,q*) имеет чисто мни- мый корень jw*; можно считать, что ш* 0 (так как если ш* 0, ТО имеется два сопряженных корня Итак, мы получили, что 0 = P(jw*,q*) для некоторых q* е Q и ш* 0; это противоречит условию (7.2). Идея доказательства теоремы очень проста: при переходе от устойчи- вости к неустойчивости один из корней должен пересечь мнимую ось, при Этом нарушится условие (7.2). Заметим, что мы уже пользовались такого рода рассуждениями при осуществлении D-разбиения (п. 4.1). Там точка 'Зрения была несколько иной — нас интересовала вся область устойчиво- СТИ в пространстве двух параметров. При исследовании робастной устой- чивости мы пытаемся выяснить, лежит ли заданная область Q целиком в области устойчивости. При этом, как будет вид но из дальнейшего, удается Рассмотреть случай большого числа параметров. Для того, чтобы конструктивно пользоваться теоремой 7.1, нам нужно, •о-первых, строить множества S(w), а во-вторых, уметь эффективно про- верять условие (7.2). И то, и другое возможно для рада важных частных евучаев задачи о робастной устойчивости. Приступим к их анализу. Начнем с интервального полинома Р(з) = {Р(з) = ao + ais + ... + ansn, i = 0,...,n, Qq>0, an>0}, (7.3) ^•Раметрами которого являются сами коэффициенты полинома, изменя- ®ЯЩеся в параллелепипеде. Рассмотрим четыре полинома, составленных *»Крайних значений коэффициентов, чередующихся парами (два нижних
188 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ значения — два верхних): Pi(s) = йо + tijS 4- агз2 4- a3s3 4-... , P2(s) = йо 4-ajS 4-a2s2 4-63S3 4-.. , Рз(з) = ao 4~ a^ s 4* Й2®^ 4" йз®3 4-• • • , Pt(s) = ag+ais+ a2s2 + a3s3 +... Эти полиномы называются полиномами Харитонова. Теорема 7.2 (Харитонов). Для робастной устойчивости интерваль- ного семейства (7.3) необходимо и достаточно, чтобы все полиномы Харитонова были устойчивы. Доказательство. Необходимость устойчивости полиномов Харитонова тривиальна, так как они входят в интервальное семейство. Чтобы доказать достаточность, воспользуемся теоремой 7.1 и построим множество 5(ш). Представим P(jw) = U(ш) 4-jwV'(w), U(со) = ао — а2ш2 4-а4ш4 — ... ; V(со) = ai — a$w2 4-agw4 — ... Ясно, что Щсо) С U(u) й(ш), V(w) V(w) < У(ш), где Щсо) = а0 — Й2Ю2 4- ОдШ4 — ... , U(со) = йо — а2ш2 4- йдш4 — ... , V(w) = Oj — й3со2 4- й5ш4 — ... , V(w) = Й! — йз^2 4- Й5СО4 — ... Иначе говоря, P(jiv) может изменяться в прямоугольнике, вершинами которого являются точки zi = Щы) 4- jwV(w), z2 = P(w) 4- ja>V(co), > Z3 = U(u/) 4- jwV(w), z4 = U(w) + jwV.(u). Нетрудно видеть, что z4 = Pt(ju), i = 1,... ,4, т.е. 5(co) — прямоуголь- ник, вершины которого соответствуют харитоновским полиномам. Пока- жем, что 5(со) не содержит начала координат при любом О С w < 00 Действительно, при w = 0 имеем 0 5(0) (иначе было бы Р(0) = ао = что противоречит условию йо > 0), поэтому если 0 G 5(<ло) при каком- то со0 > 0, то должно произойти пересечение границы прямоугольника 5 (со) с началом координат при некотором 0 < coj со0. Это пересе- чение не может произойти ни в какой вершине прямоугольника 5(о/)« так как вершины соответствуют устойчивым харитоновским полиномам. Пусть это пересечение произойдет с некоторым ребром, например в точке z = Xzi 4- (1 — Xz2), 0 < А < 1. Поскольку Pi(з) и Рг(з) устойчивы, то а
? I pirfkn. i н.ш устойчивость полиномов 189 ряду критерия Михайлова (теорема 3.5) аргументы Pi (jw) и P^jw) моно- тонно строго возрастают с ростом ш, однако это противоречит тому, что дорона Z1Z2 прямоугольника 5(ш) остается вертикальной (см. рис. 7.1). Рис. 7.1. Движение области значений <S(w) Таким образом, выполнены все условия теоремы 7.1, т.е. из устойчи- аости харитоновских полиномов следует робастная устойчивость интер- Мяьного семейства. Теореме Харитонова можно придать графическую форму. При этом достаточно проверять поведение лишь одного (а не четырех) годо1рафов, н, кроме того, одновременно можно найти максимальный размах неопре- деленности, при котором сохраняется робастная устойчивость. С этой целью запишем интервальное семейство в форме (6.7): P(s) = {P(s) — а0 + ais + ... + ansn, \a,i - а°\ С 7«г, г = 0,1,... ,п}, (7.4) вричем считаем ао,с*1 > 0, и введем следующие величины: Po(jw) = Uo(w) + JcjVo(w); $o(w) = — a^2 + a°u’4 ~ > Vb(w) = a? — a°w2 + a°a?4 — ... ; Я(ш) = a0 + a2w2 4- адш4 + ... , T(w) = a± + owa2 4- agw4 4- • Построим годограф z(w) = x(w) +jy(u), 0 < W < oo, Po(w) , , И)(ш) = W "(") = W *°*орый часто называется годографом Цыпкина-Поляка. (7.5)
190 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ Теорема 73 (графический критерий). Для робастной устойчивости семейства (ТА) необходимо и достаточно, чтобы ао > Т<*о, а° > 7<*п (7.6) и годограф z(w) при изменении ш от 0 до оо проходил последовательно через п квадрантов против часовой стрелки и не пересекал квадрата с вершинами (±7, ±7). Доказательство. Очевидно, что область значений семейства (7.4) — это прямоугольник 5(ш) = {z = х + jy: \x — Uo(ip)l < -уЩш), \у — оЛо(ш)) < а условие 0 S(u) эквивалентно тому, что |l/o(w)| 7-R(w), |1о(ш)| 7T(w), т.е. |x(w)| 7, |j/(w)| 7. Поэтому непересечение годо- графа z(w) с квадратом {z = x+jy: |х| 7, \у\ 7} эквивалентно усло- вию 0 £ S(w). Далее, по критерию Михайлова полином Po(s) устойчив тогда и только тогда, когда годограф Po(jw) проходит последовательно через п квадрантов, но Po(ju>) = Uo(w)+jwVo(u) лежит в каком-либо ква- дранте тогда и только тогда, когда z(w) = (Uo(u>) / R(u)) +j(Vo(w)/T(w)) лежит в том же квадранте. Итак, г(ш) проходит через п квадрантов тогда и только тогда, когда Ро(з) устойчив. Наконец, условие (7.6) требуется для обеспечения положительности коэффициентов а0 и ап для всех по- линомов семейства. Тем самым теорема 73 эквивалентна принципу ис- ключения нуля (теорема 7.1) для данного семейства. Таким образом, построив годограф z(a>), можно не только проверить робастную устойчивость при фиксированном 7 > 0, но и найти наиболь- шее 7 = 7тах. для которого робастная устойчивость сохраняется при всех 7 < Ттах- Такое 7тах называется радиусом устойчивости интервального семейства; оно находится по формуле 7max = min {7*, 70, 7оо}, (7-7> где 7* — размер наибольшего квадрата {|аг| 7*, |р| 7*}, вписанного в годограф z(w), 70 = а%/а0, а = а°/ап. Пример. Задан номинальный полином 6-й степени с коэффициентами а0 = (433,5 667,25 502,72 251,25 80,25 14 1) и размахами коэффициентов а = (43,35 33,36 25,137 15,075 5,6175 1,4 0,1). На рис. 7.2 показан вид годографа z(io) и вписанный в него наибольший квадрат; из него находим 7тах «1,2372.
7.1- Р00‘к~тнаЯ устойчивость полиномов 191 Рис. 7.2. Годограф Цыпкина-Поляка Отметим, что годограф (7.5) существенно отличается от годографа Ми- хайлова — он начинается внутри первого квадранта, а не на вещественной ОСИ и заканчивается в конечной точке z(oo), а не уходит на бесконечность (поскольку дробно-рациональные функции имеют одинаковые степени числителя и знаменателя). Для семейств (7.3), (7.4) неопределенными параметрами являются сами коэффициенты полиномов. Перейдем теперь к изучению более сложной Ситуации — аффинному семейству полиномов = {P0(s) + q1Pi(s) + ... + qgPe(s), |g»|<7, г = 1,...,£} (7.8) с параметрами, изменяющимися в кубе Q = |9|ОО<7}- (7.9) Одномерное семейство вида {P(s,g): |qi|=7, i/fc, |qfe| ^7} зовем реберным полиномом. Напомним (см. п. 6.1), что вершинными биномами мы назвали полиномы вида P(s,q), qi = ±"f, i = Геометрически вершинные и реберные полиномы соответствуют верши- м и ребрам куба (7.9), т.е. реберный полином «соединяет» два «сосед- X» вершинных полинома (соответствующих соседним вершинам куба), всего имеется €2г-1 реберных полиномов. Справедлива следующая
192 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ Теорема 7.4 (реберная теорема). Пусть deg Pi < deg Ро = п, г = 1,..., €, (7.10) t t 7£К1 < 1““!’ 752laol < laol’ (7-11) i=l i=l где alk, i = 1,...,£, — коэффициенты при sk полиномов Pi(s). Пусть полином F0(s) устойчив. Тогда для робастной устойчивости семей- ства (7.8) необходима и достаточна устойчивость всех реберных по- линомов. Доказательство. Мы воспользуемся теоремой 7.1 с q° = 0; тогда нера- венства (7.10)-(7.11) гарантируют условие an(q) / 0, q G Q, для старшего коэффициента полинома P(s,q) (7.8). Нам остается проверить принцип исключения нуля (7.2). Область <S(a>) имеет вид г 5(w) = G С: z = Po(j^) + |q|oo 7}, <=1 т. е. это аффинный двумерный образ ^-мерного куба. Такой образ является многоугольником, стороны которого — образы ребер куба Q. Поскольку 0 $ 5(0) (в силу (7.11)), то может оказаться 0 G 5(ш), лишь если О будет принадлежать границе <S(a>) для некоторого ш > 0. Однако это невозможно, так как граница соответствует реберным полиномам, а они по предположению устойчивы. Реберная теорема позволяет получить эффективную формулировку критерия робастной устойчивости, лишь если число £ неопределенных параметров мало. В этом случае следует проверить все реберные поли- номы. Они представляют собой однопараметрические семейства вида XM(s) + (1 — A)7V(s) (где M(s),N(s) — два соседних вершинных по- линома), и в соответствии с критерием Найквиста (роль точки -1 здесь играет -(1 - А)/А) их устойчивость при 0 А 1 эквивалентна тому, что полиномы M(s),N(s) устойчивы, а годограф G(ju>) = не пересекает отрицательной вещественной полуоси. Однако если £ велико, то число таких проверок значительно (даже для £ = 5 нужно проверить £2£-1 = 80 реберных полиномов). Можно предложить другой способ, основанный на более конструктивном описании множества 5(ш); мы ис- пользуем этот подход позже, при исследовании робастной устойчивости дискретных полиномов. До сих пор мы рассматривали семейства с линейно входящими не- определенными параметрами, которые изменялись независимо в кубе (па- раллелепипеде). Перейдем теперь к анализу сферических семейств. Пре верку робастной устойчивости и определение радиуса устойчивости так*6
j Робастная устойчивость полиномов 193 ложно осуществить с помощью графических критериев типа теоремы 7.3. рассмотрим эллиптические ограничения (6.5): P(s) — |P(s) = а0 + ajs + ... + ans”, ~(7-12) »=о ПР, как и раньше, а° — коэффициенты номинального полинома Po(s), сч 2 О — масштабы изменения коэффициентов а, (при а, = 1 ограниче- ния переходят в сферические), причем ао,<*1 > 0, а 7 > 0 — общий раз- мах неопределенности. Как и в теореме 7.3, введем следующие величины: Po(ju) = %(w) + jwVo(w); {70(w) == a° — a^2 + a°w4 Vo(w) = a° — afjw2 + a°w4 — ... ; = (ад+а%со4+а1а>8+... )1/2, T(w) = (a2+a2cu4+a2w8 + ... )1/2 и нос 1 роим годограф z(a>) = x(w) + jy(w), 0 < w 00, . . lZ0(w) . ... V0(w) (7.13) *<“’ = km ' s(“> = tm ' Теорема 7.5. Для робастной устойчивости семейства (7.12) необхо- димо и достаточно, чтобы а° > 7«о, а« > 7а« и годограф г(ш) при изменении ш от 0 до оо проходил последовательно через п квадрантов против часовой стрелки и не пересекал круга радиуса 7 с центром в нуле. Доказательство в точности повторяет рассуждения теоремы 7.3 (т. е. основано на принципе исключения нуля), с той лишь разницей, что область значений <S(a>) — эллипс 5(w) = {(z - P0(jw))TM“1(z - Pob’w)) 72}, гае M = M(a>) = А(щ)Лт(а’), Л( \ ( а° 0 —«2^2 0 сцш4 О ... \ W у О 0 —«за,3 О СИ^Ш5 J Таким образом, радиус устойчивости эллиптического семейства (7.12) вычисляется следующим образом: 7тах = min {7*, 70, 7оо}, *Де 7* — радиус наибольшего круга, вписанного в годограф z(w), 70 = . 7оо — а^/а-п. ~ 7- Б.Т. Поляк, П.С. Щербаков
194 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ Для того же семейства 6-й степени из рассмотренного выше при. мера получаем 7тах » 2,8380, т. е. больше, чем величина радиуса устой- чивости (7.7) соответствующего интервального полинома, что неудиви- тельно, так как ограничения на неопределенность в семействе (7.12) более жесткие, чем в семействе (7.4): эллипсоид {а — (ai,...,an)T . п У, (а;-а°)2/а2 С 72} содержится в параллелепипеде {а = (ai,..., ап)т : i=0 |а, — а°| 7Oi, i — 0,1,..., п}. Отметим, что для сферических семейств не существует аналогов те- оремы Харитонова: робастная устойчивость семейства не определяется устойчивостью конечного числа элементов семейства. Остановимся кратко на задаче о робастной устойчивости полинома, мультилинейно зависящего от параметров, например (6.10): P(s, Т, fc) = (1 + T1S) (1 + Tts) + &!•• ке при _ _ Q = {T,keRe: T^Ti^Ti, k^ki^kt}. Эта задача существенно более сложна, чем рассмотренные выше. Так, область <S(w) оказывается, вообще говоря, невыпуклой; ее границы поро- ждены не только ребрами Q и являются криволинейными. В некоторых частных случаях, однако, задача значительно упрощается. Например, если интервалы неопределенности для Т, не перекрываются: Тг < Т1 < Г, < Т2 < • • < Те < Те (порядок следования интервалов может быть любым), то 8{ш) — много- угольник с 2£ ребрами, допускающими явное описание. Поэтому задача робастной устойчивости в этой ситуации может быть эффективно раз- решена. В заключение рассмотрим проблему робастной устойчивости дискрет- ных полиномов. Семейство полиномов P(z,Q) = {P(z,q) = oo(q) +ai(q)z + ... +an(q)zn, q&Q} (7.14) робастно устойчиво, если для всех значений параметра q € Q С полиномы P(z, q) дискретно устойчивы, т. е. (zi(g)l > 1, i = l,...,n, q 6 Q, где Zi(q) — корни P(z,q). Принцип исключения нуля принимает следу- ющий вид. Теорема 7.6. Пусть P(z,q°) устойчив для некоторого q° € Q и Q связно, тогда условие 0 £ 8(ш) = {P(e^,q); qCQ}, V 0 ш < 2тг
7.1. Робастная устойчивость полиномов 195 .. ................. UffiAxoduMO и достаточно для робастной устойчивости семейства (7.14). Доказательство проводится точно так же, как в теореме 7.1, й мы до опускаем. Разница лишь в том, что границей между устойчивыми и деусгой чивыми корнями в непрерывном случае являлась мнимая ось ju, а в дискретном случае — это окружность е7", 0 < ш < 2тг. Отметим дакже некоторое различие в формулировках теорем — в дискретном слу- чае не требуется, чтобы все полиномы F(z,g) имели одинаковую степень (отсутствует условие an(g) =/= 0). Это связано с тем, что полином вида Pe(z) — fo(z) + szn+1 (где Po(z) — устойчивый полином степени ri) устойчив при малых £ (см. п. 4.1.3). Для эффективного использования теоремы 7.6 нужно уметь строить область значений <S(w). Начнем с интервального семейства P(z) — а0 + aiz + ... +anzn, |а4 - а°| < 7а,, а, > 0, t = 0,...,n. (7.15) Для непрерывного случая область <$(о>) была прямоугольником. В дис- кретном случае S(w) = {Ро(е?“) J = со + fc=0 fc=0 гае со = Zk = 7а*:е,“*:, a /Tfc — произвольные числа, изменяющи- еся от 1 до +1. Отсюда следует, что 8(ш) — многоугольник с центром * Со и сторонами, параллельными Zk, к = 0,...,п; всего у этого мно- гоугольника 2п + 2 ребер и столько же вершин. Исключением являются значения j = 0 и ш = тг, для которых 5(ш)— отрезок. Условие 0 5(w) можно записать в аналитической форме, оно эквивалентно условиям In I 52 aicos (» — ^)w| 7 < 7(0») = max , w / 0, тг; * 52 “«I cos (i — k)w I i=0 .9 |Ё«?| 7 < 7(0) = -!?—; c: i=0 • Ib-wl 7 < 7(%) = -i-—---------. 52 ai i=0 J-
196 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ Таким образом, радиус устойчивости (в предположении устойчивости по- линома P0(z)) вычисляется так: 7max= min 7(ш). 0<ц><2тг Эти формулы отличаются от тех, которые были получены для непрерыв- ного случая (7.7). Более того, в дискретном случае нет никакого аналога теоремы Харитонова — устойчивость даже всех вершинных полиномов не гарантирует робастной устойчивости интервального семейства (7.15). Дело, как уже отмечалось, заключается в различии геометрии области значений 5(ш) — в непрерывном случае это прямоугольник с заданными направлениями сторон, тогда как в дискретном это многоугольник с 2п+2 вершинами и меняющимися направлениями сторон. Для аффинного семейства дискретных полиномов верна реберная те- орема; впрочем, радиус устойчивости для такого семейства можно вы- числять и иначе, используя представление области <$(ш) в виде много- угольника, подобно тому, как это было сделано выше для интервального семейства. Отметим другое семейство дискретных полиномов, для которых об- ласть <S(w) имеет простой вид. Именно, рассмотрим P(z) = |p(z) = а0 +aiz + ... +anzn, ^2|afc -а°| С 7, k=0 n = 0,l,...J. (7.16) В этом семействе отклонения коэффициентов ограничены в 1г -норме, а степень полиномов P(z) не ограничена. Оказывается, для всех ш та- ких, что о>/тг иррационально (т.е. для почти всех ш) замыкание мно- жества 5(w) — круг радиуса 7 с центром в Р0(е?ш). Отсюда следует выражение для радиуса устойчивости этого семейства: 7max= min |р0(еН. 0<5U><27Tl I Здесь P0(z) — аналитическая функция в круге |z| 1, ОО P0(z) = а% + a%z + ... + a°nzn + ... , |ag| < оо, fc=O и Po(z) / 0 при |z| < 1. Мы видим, что различные структуры неопределенности и различные виды ограничений на неопределенные параметры приводят к большому разнообразию форм областей значений; тем не менее многие задачи могут решаться единообразно на основе принципа исключения нуля и примене- ния графических критериев устойчивости типа критерия Михайлова.
12. Робастная устойчивость матриц 197 jjju... ' ' - .... 7.2. Робастная устойчивость матриц Обратимся теперь к параметрическим семействам матриц, таким как интервальное семейство, задаваемое в форме Л = ((а0)), &ij ^ai:h i,j = l,...,n, (7.17) или Л=Л0 + Д, Д = ((Ду)), |Д0|<7, i,j = l,...,n, (7.18) либо аффинное семейство г Л(д) = Ло + ^д^, 1^1 г = 1,...,£. (7.19) «=1 Семейство называется робастно устойчивым, если устойчивы Все его элементы, т. е. Re А, < 0, i = 1,... ,п, при всех q (Д для семейства (7.18)) из допустимого множества, где А< — собственные значения Л. При этом, как и для семейств полиномов, наибольшее 7 = 7П1ах, для которого робастная устойчивость сохраняется при всех 7 < 7тах, называется радиусом устойчивости матричного се- мейства. Можно было бы ожидать, что проблемы робастной устойчивости та- ких матричных семейств решаются приблизительно так же, как и для соответствующих семейств полиномов. Однако оказывается, что ситуация с матрицами значительно более сложная. Так, для интервального семей- ства (7.17) нет никакого аналога теоремы Харитонова (все вершинные Матрицы могут быть устойчивы, однако робастная устойчивость отсут- ствует), для аффинного семейства (7.19) неверна реберная теорема и т.д. Формальное пояснение этого Заключается в том, что в характеристиче- ский полином P(s,q) = det(s/ - Л(д)) параметры q входят нелинейно (мультилинейно для интервального семейства (7.17) и полиномиально для аффинного семейства (7.19)), поэтому применить реберную теорему или какой-либо иной результат предыдущего параграфа мы не можем. В связи с этим обсудим совсем иные подходы к проблеме. Первый из них основан на идеях теории возмущений. Пусть нам известны собственные числа АДО) и собственные векторы е,(0) матри- цы Л(0). Как они изменятся при малом возмущении A(q) этой матрицы? Звесь g f R{ — векторный параметр, причем матрица A(q) зависит от з^ого параметра дифференцируемым образом, так что существуют и из- Q Л / \ Иестны матрицы Di = —-— . Например, для семейства (7.19) имеем
198 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ А(0) = Ао. А = Ai- Ответ дается следующей основной теоремой теории возмущений (см. также пп. 10.3 и 10.2 Приложения). Теорема 7.7. Пусть все собственные значения Afc(0) матрицы А(0) различны, axkuyk — соответствующие им правые и левые собственные векторы: A(0)xk = Afc(0)a:fc, ^А(О) = *к(О)Ук, l®fcI = llffcl = 1. * = 1. • • , n. Тогда собственные значения матрицы A(q) имеют вид Afc(g) = Afe(0) + ^«^gi+O(g). s Укхк Этот результат дает возможность оценить, насколько чувствительны собственные числа матрицы A(q) к изменению параметра q. Пусть, напри- мер, матрица А(0) устойчива, а А — ее собственное значение, имеющее наибольшую вещественную часть. Если х и у — соответствующие правый и левый собственные векторы, а семейство матриц аффинное (7.19), то для матрицы A(q) это собственное значение переходит в t А.~х для малых q, поэтому ReA(q) « Re А + У} a,qit где а, = Re - ..., и »=1 У я maxReA(q) по |$| 7, г = достигается при q, = 7signer е и равен приближенно ReA + 7 |а,|. Итак, можно ожидать, что при ; '5.1=1 ; 5 5 t 7* = -ReA/J2 |а»| матрица A(q) потеряет устойчивость (ReA(q) станет «=1 равным нулю), т.е. 7* — оценка радиуса устойчивости для A(q). Ра- зумеется, этот анализ лишь приближенный, и никаких гарантированных выводов о робастной устойчивости семейства (7.19) при фиксированном 7 на этом пути получить нельзя. Другой подход связан с использованием достаточных условий робаст- ной устойчивости. Можно потребовать, чтобы у всего семейства матриц A(q), Я € Q, была общая функция Ляпунова V(x) = хТРх, Р > 0. Мы знаем (см. Приложение, п. 9.1), что существование решения матричного неравенства АТР+РА <0, Р > 0, гарантирует устойчивость матрицы А; тем самым существование решения системы линейных матричных нера- венств AT(q)P + PA(q) < 0, Р > 0, q е Q, (7.20)
jl. Робастная устойчивость матриц 19? гарантирует робастную устойчивость матричного семейства A(q).Если А(«) — семейство интервальных матриц (7.17) или аффинное семей- ство (7.19), то неравенства (7.20) достаточно решить лишь для вершин множества Q (обозначим их через V); поскольку любая точка q G Q пред- ставляется как выпуклая комбинация вершин, то из выполнения (7.20) для вершин будет следовать, что (7.20) удовлетворяется (с данным Р) и для любого q е Q. Итак, достаточно решить конечное число матричных неравенств AT(qv)P + PA(qv) < 0, Р > 0, qv G У, (7.21) где A(qv) — вершинные матрицы: в случае семейства (7.17) это те матрицы, в которых все ау принимают крайние значения (либо ay, либо ач), а в случае семейства (7.19) это матрицы, для которых |д,| = -у, i = 1,..., I. Ясно, что число неравенств в (7.21) достаточно велико, даже если п и t не слишком большие числа. Впрочем, существуют простые итеративные методы решения неравенств (7.21), работоспособные даже дня больших размерностей. В то же время нужно ясно понимать, что мы получили лишь достаточ- ный критерий робастной устойчивости. Если система линейных матрич- ных неравенств (7.20) не имеет решения, то это не значит, что робастная устойчивость нарушена — могут существовать робастно устойчивые се- мейства, для которых нет общей квадратичной функции Ляпунова. Другое достаточное условие заключается в использовании сверхустой- чивости вместо устойчивости. Покажем, как такой подход работает на примере интервального матричного семейства, записанного в виде (6.9): А = ((оу)), dij = + Ду, |ду| = 1 • • ,n, (7.22) Где номинальная матрица Ao = ((a? )) сверхустойчива, т. e. ст(Ао) = min(-a£ - |a? |) > 0. Потребуем, чтобы условие сверхустойчивости сохранялось для всех ма- Чмц семейства: + А») ~ 521а« + Д«1 > °, i = 1, • • •, п. Ясно, что это неравенство будет выполнено для всех допустимых Ду Тоща и только тогда, когда -а°ц - ути - УУ|в«1 +Ттоу) >0, i = 1,... ,п,
200 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ т.е. при 7 < 7* = min ——------------. j В частности, если my = 1 (масштабы изменения всех элементов матрицы одинаковы), то . <г(А0) 7 =-------- п Таким образом, мы в явном виде находим радиус сверхустойчивости ин- тервального семейства. Аналогичные формулы справедливы и в дискретном случае: если ||А0|| i < 1, то семейство матриц (7.22) остается сверхустойчивым при 7 < 7* = min , j а в случае my = 1 * _ 1 ~ ||A)||1 n Известны и другие достаточные условия, дающие оценки снизу для радиуса устойчивости аффинного или интервального семейства матриц. Перейдем теперь к другому типу матричных неопределенностей, зада- ваемых с помощью матричных норм. Пусть А = Ао + Д, ||Д|| 7, где матрица Ао устойчива, и || • || означает спектральную норму. Нас интересует радиус устойчивости такого семейства, т. е. 7max = sup {7: Ао + Д устойчива при всех || Д|| 7}. Оказывается, такая задача очень трудна; ее решение было найдено лишь недавно, и мы его приведем далее. В то же время проблема существенно упрощается, если считать возмущения Д комплексными. До сих пор мы рассматривали в основном матрицы с вещественными элементами, по- этому упомянем о некоторых изменениях, возникающих при переходе в комплексную область. Как и ранее, матрица A G СпХп называется устой- чивой, если все ее собственные значения Aj, i = 1,... ,п, лежат в левой полуплоскости: ReAi < 0, i = 1,...,п. Характеристический полином P(s) = det (s/ — А) такой матрицы имеет, вообще говоря, комплексные коэффициенты. Спектральная норма матрицы А равна IIА|| = max |Ах|2 = (АП1ах(А*А))1/2, 1^12^1
12 ~ная устойчивость матриц 201 а |х|г Л™ комплексных векторов х вычисляется как |®|2 = (я:*®)1/2. Комплексным радиусом устойчивости устойчивой матрицы А € спХп называется величина 7max = sup{7: А + Д устойчива при всех Д еСпхп, ||Д|| < 7}. Теорема 7.8. Комплексный радиус устойчивости определяется фор- мулой с _ 1 _ 1 7max ||(з/ - ЛНИоо sup||(jwl- A)-i||’ о> Доказательство основывается на двух важных утверждениях, которые мы выделим в виде лемм. Лемма 7.1. Если А устойчива, а А + В неустойчива, то найдется такое 0 < А 1, что А+ХВ имеет чисто мнимое собственное значение, т.е. det(jw7 - (А + АВ)) = 0 для некоторого ш G R. Доказательство. Действительно, полином P(s, А) = det (si - (А + АВ)) непрерывно зависит от параметра А, его степень всегда равна п, и мы можем воспользоваться теоремой о непрерывной зависимости корней полинома от параметра. При переходе от всех устойчивых корней (при А - ()) к (по крайней мере одному) неустойчивому (при А = 1) траектория корня должна пересечь мнимую ось. По существу, мы уже пользовались этим рассуждением при доказа- тельстве принципа исключения нуля для полиномов. Лемма 7.2. Если матрица В G. СпХп невырождена, то при любом Д G С"х", ||Д|| < 1/ЦВ"11|, матрица В + Д также будет невырожденной, а при 7 1/||В-1|| найдется такая Д G Спх", || Д|| 7, что В + Д вырождена. Доказательство. Если ||Р|| q < 1, то (I + Р)-1 существует и ||(I + Я)'1!! (1 - q)-1, поскольку ||(Z + D)~11| = ||I — D 4- D2 - ... || 14- q — q2 +... = (1 — q)-1. Поэтому при ||Д|| q/||B_ 11|, q < 1, имеем ЦВ-1Д||^ди Ц(В 4-Д)-1)! = 11(7 + В"1Д)~1В-1|| < ||В-1||||(1 + В-1Д)-1|| Ье. В+Д невырождена. Если же 7 > 1/||В ^Ц, то возьмем такое а, |а| = I. что IB-1 а| = ||В 11| |а| (такое а существует по определению спектраль- «(В^а)* [в-1!!2 *°й нормы матрицы), и Д = Тогда |]Д|| = 1/||В“11| 7 (так
202 Глава 7, РОБАСТНАЯ УСТОЙЧИВОСТЬ как для матрицы ранга один вида ху*, х,у € Сп, имеем ||х^*|| = |х| |у|), С другой стороны, для Ь = В-1а / 0 будет (В + Д)Ь = а - (В~1а)*(В-1а) = а - а = 0, ||Х5 т. е. матрица В + Д — вырожденная. Доказательство теоремы 7.8. Предположим, что ||Д|| < 7^, но А + Д неустойчива. Тогда по лемме 7.1 найдутся Дх = АД, ||Д1|| < 7щах> и ш е R такие, что матрица В+Дг, В = — А+jul, вырождена. Однако это противоречит первому утверждению леммы 7.2 (так как |[Д1|| < 7а1ах < 1/||В~1|| при любом ы). Обратно, если 7 > 7тах«то найдется такое ш, что для В = -A +jul будет 7 > ЦВ-1)!. Применяя вторую часть леммы 7.2, найдем такое допустимое Д, что det(—А +• jul + Д) = 0; это означает, что матрица А+Д имеет чисто мнимое собственное значение jw и потому неустойчива. Заметим, что в ходе доказательства мы обнаружили, что дестабилизи- рующее возмущение Д при 7 > 7^ах может быть взято в виде матрицы ранга один. Приведем без доказательства (оно подобно вышеприведенному) анало- гичную формулу для радиуса комплексной устойчивости для более общей схемы неопределенности — так называемой структурированной неопре- деленности (см. п. 6.1). Пусть матрица А € С"хп устойчива; нас инте- ресует наибольшее число 7^^ такое, что все матрицы вида А + ВДС, Дё Стх', ||Д|| «£ 7, (7-23) являются устойчивыми. Здесь В 6 Спхт,С е Cixn — заданные матрицы. Такие задачи естественно возникают, когда есть неопределенность в цепи обратной связи. Ясно, что при В = С = I мы имеем предыдущую задачу. Теорема 7.9. Комплексный радиус устойчивости семейства (7.23) ра- вен 7тах = :.ПТ, G(s) C(sl - А)'1 В. 110(8)1100 SUp||G(jw)||’ К } V > u> Вспоминая связь между Boo-нормой и решением соответствующего уравнения Риккати (см. лемму П.22 из Приложения), мы заключаем, что уравнение Риккати РА + А*Р - 7СГС - РВВ*Р = О имеет эрмитово решение Р = Р* > 0 тогда и только тогда, когда 7 < 7тах- Более того, решение Р этого уравнения позволяет построить обшу10
yj Робастная устойчивость матриц функцию Ляпунова V{x) = х*Рх для всех систем i = (А + ВДС)®, ||Д|| 7 < 7тах- Ситуация с вещественным радиусам устойчивости = sup {у: А + ВАС устойчива при всех Д е Rmxi, ||Д|| у}, (7.24) де А, В,С — вещественные матрицы и А устойчива, гораздо более сложна. Конечно, мы имеем оценку 7таХ 7тах (поскольку комплексные возмущения включают в себя вещественные). Однако уже простые примеры (с п = 2, В = С = I) показывают, что отношение 7max/7max может быть сколь угодно велико, т. е. вышеприве- денная оценка может быть плохой. Известны и другие достаточные условия робастной устойчивости ве- щественного семейства А + ВАС, однако и они обладают тем же не- достатком. Выражение для 7^ах было получено лишь недавно; для его формулировки напомним определение сингулярных чисел матрицы (см. также Приложение, п. 6.5). Для п х п матрицы А упорядоченные соб- ственные числа 0 Ai ••• < Ап симметричной матрицы АТА (эти собственные числа вещественны и неотрицательны, так как АТА 0) Определяют сингулярные числа А: аДА) = А*/2, » = 1,...,п. Нетрудно видеть, что ||А|| = сгп{А) и 1/||А~1|| = си (А), так что результат теоремы 7.8 может быть записан следующим образом: = sup.„(,w: л) з = “<'<*’' - ») П-ад ш В терминах сингулярных чисел записывается и выражение для веществен- •ого радиуса устойчивости. Теорема 7.10. Обозначим и(из) = Be>{ju3l — A)-1, V(w) = Im(jW- Л)'1 и составим блочную матрицу / U{из) - aV{u>) Н(ш,а) = \ а~1У{из) и(из) Зависящую от двух вещественные параметров из, а. Тогда 7max = “f inf сгп_1 (н(из, а)}. а€(0,1] \ /
204 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ В отличие от теоремы 7.8 (в форме (7.25)) здесь фигурируют два (а не один) скалярных параметра, по которым нужно проводить оптими- зацию; кроме того, нужно вычислять не крайнее, а второе по порядку сингулярное значение матрицы. Ясно, что в вычислительном смысле на- хождение вещественного радиуса устойчивости — более трудная задача, чем комплексного. Отметим также, что дестабилизирующими возмущени- ями являются матрицы второго ранга, а не первого. В заключение заметим, что все результаты данного параграфа есте- ственно обобщаются на случай дискретных систем. Например, если ма- трица А дискретно устойчива, то комплексный радиус устойчивости се- мейства А + Д, ||Д|| < 7, равен С = 1 = __ - 7max ||(s/_ Д)-!^ отах ||(е>"/-А)-1|| = min от (е?ш1 — А^, 0С^<2тг \ / что является дискретным аналогом теоремы 7.8. Сопутствующие функции Matlab: svd — сингулярное разложение матрицы и вычисление сингулярных зна- чений 7.3. Робастная устойчивость при неопределенных передаточных функциях В пп. 6.1 и 6.2 обсуждались возможные виды неопределенности при описании объектов с помощью передаточных функций; приведем крите- рии робастной устойчивости соответствующих семейств замкнутых си- стем. Начнем с простейшей задачи об устойчивости одномерных систем, заданных передаточной функцией^ зависящей от параметров. Объект опи- сывается передаточной функцией b(s,q) где a(s,q),b(s,q) — полиномы, зависящие от параметров q € Q, а регу- лятор в цепи обратной связи ймеет передаточную функцию с<’) - м ’
7.3. Робастная устойчивость при неопределенных передаточных функциях 205 где /(s),g(s) — заданные полиномы (в этом параграфе полиномы обозна- чаются строчными буквами). Нас интересует робастная устойчивость (г. е. устойчивость при всех q е Q) замкнутой системы. Характеристический полином в данном случае равен p(s, q) = a(s, q)f(s) + b(s, q)g(s), и задача сводится к проблеме устойчивости параметрического семейства полиномов, изученной в п. 7.1. Мы отметим лишь некоторые особенности возникающих задач. Во-первых, если a(s,q),b(s,q) — интервальные полиномы, то p(s,q) таковым не является, и никакого аналога теоремы Харитонова в общей ситуации нет. Однако в некоторых специальных случаях «вершинные» теоремы все же имеют место. Назовем харитоновскими 16 передаточных функций Gj(s), i = 1,..., 16 (соответствующих харитоновским объек- там}. которые получаются из G(s,q), когда в числителе и знаменателе берутся харитоновские полиномы. Теорема 7.11. Если a(s,q),b(s, q) — интервальные полиномы, а регу- лятор C(s) — первого порядка С(з) = 9о + gis и он < табилизирует 16 харитоновских объектов, то он стабилизирует все интервальное семейство. Доказательство достаточно сложно, и мы его не приводим. В более общем случае, для регулятора произвольного порядка, можно воспользоваться тем фактом, что область значений полиномаp(s,q) (т.е. S(u) = {p(jw,q), q 6 Q}, см. n. 7.1) является восьмиугольником. Дей- ствительно, области значений интервальных полиномов a(s,q), b(s,q) яв- ляются прямоугольниками, потому сумма f(jw)a(jw,q) + g(ja))b(jw,q) является восьмиугольником. На этой основе нетрудно выписать эффек- тивный критерий робастной устойчивости. Во-вторых, если a(s,q),b(s,q) — аффинные семейства то и p(s,q) будет аффинным семейством полиномов, и мы можем применить резуль- таты п. 7.1 для установления его робастной устойчивости. В частности, справедлива реберная теорема, и Мы получаем следующий результат. Теорема 7.12. Если a(s,q),b(s,q) — аффинные семейства и все ре- Е объекты (получающиеся, когда q пробегает ребро параллелепи- ) устойчивы, то имеет место робастная устойчивость. ь и несколько других частных случаев, когда, используя конкрет- д p(s,q), можно получить специальные критерии робастной устой- h. Не будем на этом останавливаться, а перейдем к непараметриче- еопределенности одномерных передаточных функций.
206 Глава 7, РОБАСТНАЯ УСТОЙЧИВОСТЬ Пусть открытая система описывается семейством скалярных переда- точных функций Я(з) = Я0(з) + Д(з), где частотная неопределенность Д(з) удовлетворяет условию |A(jw)| < (7.26) при всех ш для некоторой функции Ж(з), W~ 1(s) € RHoo, что эквива- лентно условию ||1У-1(з)Д(в)1|оо р. Нас интересует, будет ли робастно устойчива такая система, замкнутая единичной обратной связью. Как известно (см. п. 3.4), при отсутствии не- определенности вопрос решается с помощью годографа Найквиста. При- ведем его робастную модификацию. Теорема 7.13. Пусть неопределенности Д(з) удовлетворяют (7.26) и все H(s) == Я0(я) + Д(з) имеют одинаковое число N неустойчивых полюсов при всех допустимых Д(з). Построим годограф й,- ч Я0(уы) + 1 , п . 11 0"'w<o°- Замкнутая^ система робастно устойчива тогда и только тогда, когда годограф H(jw) охватывает круг Си с центром в точке —1 и радиуса v N/2 раз против часовой стрелки, не пересекая его (рис. 7.3). Рис. 7.3. Робастный критерий Найквиста. Поведение годографа H(jw)
207 Iе " 73 Робастная устойчивость при неопределенных передаточных функциях \ Доказательство. Покажем; что при сделанных предположениях для ка- ждой допустимой функции H(s) выполняется критерий Найквиста. Дей- ствительно, условие, что H(jw) не пересекает Cv, означает [Я(_)ол) +1| > у, т.е. |Яо0'ш) + 1| > для всех ш. Поэтому для любого допу- стимей о Я(з) имеем |Яи’щ) +1| = l-Ho(jw) + 1 + A(jw)| > |Ho(Joj) + 1| - |A(jtu)| > > b'|W(jw)| — r,|IV(jw)| = 0, T.e. H(ju) не проходит через точку -1. Далее, годографы H0(Jw) и пересекают луч (-1, -оо) одинаковое число раз и в одинаковых направлениях (сверху вниз или снизу вверх). Действительно, если Яо(уш) тг ,. . , . . Hn(jw) +1 вещественно и Я0(уш) < -1, то H(jw) = ..............-----1 < -1; при атом, если Яо(» = Uo+ 3V0, H(ju) = U+ jV, то V = т.е. знаки мнимых частей H(jw) и Я0(.)ш) совпадают. Поэтому число оборотов вокруг точки -1 для H(jw) и одинаково. Но все годо- графы делают одинаковое число оборотов вокруг точки —1 (число оборотов может измениться только при прохождении одного из годогра- фов семейства ET(jw) через точку —1, однако, как было доказано, H(jw) » проходит через -1 для всех допустимых Я(з)). Итак, все годографы ЯоО-’). H{jw) делают N/2 оборотов вокруг точки —1 против часовой стрелки. По критерию Найквиста отсюда следует устойчивость замкнутой системы с передаточной функцией Я(з), т. е. робастная устой- чивость рассматриваемого семейства. _ Теперь докажем обратное утверждение: если годограф Я(jw) пересе- кает круг Cv или делает вокруг него число оборотов, отличное от jV/2, то устойчивость нарушается. Действительно, вторая возможность исключа- ется, так как мы доказали выше, что если H(jw) не пересекает Се, то ’ввело оборотов Я(уш) и одинаково, а последнее равно N/2. Если Же H(jw) пересекает Cv, то при некотором ш будет |Я(уш) +1| = и, т. е. |Ho(ju-) +1| = p|Wr(jw)|. Тогда, взяв Д(з) = vW(s)e?e, 6 = —тг + argWr-1(jw)(ffo(ja’) +1), Оолучим ||Wr-1A||0O = г, Д 6 ЛЯ,» (так как W € RHX), и все Щз) = Я0(з)+Д имеют то же число неустойчивых полюсов, что и Я0(з). Поэтому Д — допустимое возмущение. Однако +1| = |Яо(уш) + vW(ja>)e>e +1| = 0 fr-к. |ЯоО‘ш)+1| = v\W(jw)e?e\, arg(#o(jw)+l) = - arg(i/IV(jw)e?s)), е. Я(уш) проходит через точку —1, и тем самым (по обычному критерию Найквиста) соответствующая замкнутая система является неустойчивой*
208 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ Отметим, что полученной теореме можно придать и аналитическую форму: если номинальная система (с передаточной функцией H0(s) разо- мкнутой части) устойчива, то робастная устойчивость рассматриваемого семейства эквивалентна условию |Я0(» + 1| > v\W(ju>)\ для всех о; или IIW-4s)(H0(s) + 1)1100 > и. (7.27) Действительно, условие непересечения H(ju>) с кругом Си означает, что + 1| > и, что в свою очередь эквивалентно (7.27). Перейдем теперь к анализу робастной устойчивости многомерных си- стем при частотной неопределенности. Мы начнем с важного вспомога- тельного результата, играющего роль теоремы 7.13 для матричных пере- даточных функций. Теорема 7.14 (о малом коэффициенте усиления). Пусть M(s) € RHoo. Матрица (I + М(в)Д(з))1 определена и принадлежит RHoo при всех Де RHoo, ||Д(з)||оо < i тогда и только тогда, когда ||M(s)||oo <7- Доказательство. Необходимость. Поскольку Д е RHoo и М е ТЩ», то и МД 6 RHoo. Поэтому по теореме 3.8 (I + МД)-1 G RHoo тогда и только тогда, когда det (7 + МД) не имеет корней в правой полуплос- кости. Но при ||М||оо < 7 имеем (обозначая от и оп наименьшие и наибольшие сингулярные числа соответствующих матриц): inf o-i(J + М(з)Д(з)) > 1 — sup о-п(М(з)Д(з)) = 1 — ЦМДЦоо > Res^O ' Res>0 > 1 - нмЦооНдНоо > 1 - ч- = о, 7 т.е. действительно матрица I + М(з)Д(з) невырождена при Res 0. Достаточность. Пусть ||М||оо > 7, тогда найдется такое ш, что ||М(jco) || > 7. Пусть сингулярное разложение матрицы M(jw) (см. п. 3.5 Приложения) имеет вид M(jw) = U SV*, где U,V — унитарные комплексные матрицы, a S = diag(ar,...,0n); здесь 0 ат о-2 < ... o-n = ||M(jw)|| —сингулярные числа
1.3- Робастная устойчивость при неопределенных передаточных функциях 209 ' ..... . Обозначим через и и v последние столбцы матриц U и V; тогда если нам удастся построить Д(з) е RHoo такое, что ||Д(з)||оо < 1/7, A(jw) = „-i-uu*, то матрица IД будет вырожденной. Действительно, исполь- ffn зуя равенство det(/ + ху*) = 1 + у*х для х,у G С” (см. Приложение, п. 1), получаем det(/ + М(»Д(;ш)) = det(/ - UCV*—vu*\ = ' On ' = 1 - u*USV*v— = 1-^=0 Cn ffn (в последнем равенстве использовалось u*U = V*v = en = (0,..., 0,1)T). Требуемое Д(з) построим следующим образом: а) Нели ш = 0 или ш = оо, то М(jeu) вещественно, потому и U, V вещественны и можно взять Д(з) =----vuT, т. е. Д(з) в этом случае не завися I от s. Очевидно, что тогда ||Д(з)||то = ||Д|| = — = - <тп ||M(jw)(( 7 и Д & RHoo- б) Если 0 < ш < оо, то найдем а, > 0, > 0 из условий Pi-ju at- ju arg .......= arg Ui arg----—- = arg Vi, °Pi + 3w °ai+3w где u„ Vi — компоненты векторов и, v, а аргумент в данном случае пони- мается как угол от —тг до 0. Теперь возьмем <Гп а(з) = [ai(з), ..., а„(з)]т, ft(s) = [Ъг(s), ..., 6т(з)]т; ai - s 0i - s “•(a) = т. az, II a — s 11 I a — jw 1 • опта такое Д(з) — желаемое, так как ---- = max-------=7— = 1, 11<х4"311оо ш I а 4- jeu I о - .4 .11 6 RHoo при а > 0, поэтому Д(з) € RHoo^ ||Д||оо = — а « + 3 <7п 7 Равенство Д(уо») =---vu* проверяется прямой подстановкой (в силу On определений a(s), Ь(з)). Итак, теорема доказана полностью. Отметим некоторые частные случаи теоремы о малом коэффициенте Усиления и ее связь с предыдущими результатами.
210 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ Прежде всего, теорема 7.13 (в форме неравенства (7.27), а не в графи- ческой интерпретации) является одномерным вариантом этого утвержде- ния. Действительно, устойчивость замкнутой системы, рассматриваемой в теореме 7.13, определяется устойчивостью ее передаточной функции S(s) = (1 + Я(з))-1. Обозначая (1 + Я0(з))-1 = М(з) 6 RHoo, по- лучаем 5(з) = М(з)(1 + М(з)Д(з)) \ т.е. условие 5(s) € RHoo экви- валентно условию (1 + М(з)Д(з))-1 е RHoo’, именно это условие и рассматривается (в матричном варианте) в теореме о малом коэффици- енте усиления. Для VT(s) = 1 требование ||Af(s)||0O 7 в последней в точности эквивалентно (7.27), а ограничения на Д в обеих теоремах совпадают при и = 1/7. В то же время в скалярном случае было дока- зано несколько более общее утверждение — там не предполагалось, что Д е RHqo, а требовалось лишь, чтобы Я0(з) + Д(«) и Яо(з) имели оди- наковое число неустойчивых полюсов. Иначе говоря, класс возмущений в теореме 7.13 — несколько более общий, чем в многомерном случае. Попробуем теперь сравнить результат, даваемый теоремой о малом коэффициенте усиления, с формулой для комплексного радиуса устойчи- вости. Поскольку матрица устойчива тоща и только тогда, когда обратная существует и устойчива, а (Л + Д)"1 = А~\1 + Л-1Д) = А~1(1 + МД), М = Л"1, то устойчивость Л + Д эквивалентна устойчивости I + МД. Поэтому на первый взгляд кажется, что из теоремы о малом коэффициенте усиления следует, что радиус устойчивости равен 1/||М|| = 1/|[Л-1||, тогда как в действительности он равен ||(з7 — А)-1||оо > 1/|| А~11|. Дело в том, что в двух теоремах рассматривались разные классы возмущений: в теореме о радиусе устойчивости возмущения Д были постоянными матрицами, тогда как в теореме о малом коэффициенте усиления рассматривались динамические возмущения Д(з). Этот класс более широк, поэтому радиус устойчивости получается меньшим. Из теоремы о малом коэффициенте усиления можно получить много следствий для различных типов неопределенности и различных структур объектов. Мы приведем их без доказательств, которые Сводятся к преобра- зованию в форму, описываемую теоремой 7.14, и проверке ее условий. Всюду далее G(s) — матричная передаточная функция объекта; Go (в) — ее номинальное значение; С(з) — матричная передаточная функция ре- гулятора; Д(з) — матричная неопределенность, причем предполагается, что Д(з)еЯЯоо, ||Д||ооС1; (7-28) IVi, W? — заданные матричные весовые функции; S = (7 + GoG)-1, Т = I — S — GqC(I + GqC)-1
УЗ. РнСмешая устойчивость при неопределенных передаточных функциях 211 чувствительность и дополнительная чувствительность номинальной си- стемы, показанной на рис. 7.4 слева (она предполагается устойчивой). Рис. 7.4. Различные типы неопределенности и структур объектов Теорема 7.15. . а) Если неопределенность входит аддитивно: G = Go + (С«. рис. 7.4, в центре), то условие робастной устойчивости имеет вид 11^2(7$^! Цао < 1. б) Если неопределенность входит мультипликативно: G = (I + Wi£xW2)G0 (см. рис. 7.4, справа), то условие робастной устойчивости записывается IIWTWMioo < I. В простейшей ситуации при = W2 условия робастной устой- чивости при всех возмущениях, удовлетворяющих (7.28), принимают вид licsu < 1 > аддитивном случае и или < 1 • мультипликативном случае. Аналогичные результаты можно получить и Ляя других моделей неопределенности. Сопутствующие функции Matlab: • vd — сингулярное разложение матрицы и вычисление сингулярных зна- чений
212___________________________ Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ 7.4. /z-анализ Можно предложить единую схему, которая обобщает анализ робаст- ной устойчивости при разнообразных типах неопределенности, рассмо- тренных выше. Она называется p-анализом, поскольку в ее основу по- ложено понятие так называемого структурного сингулярного числа ма- трицы, обозначаемого р. Методология д-анализа предполагает, что структура системы, содер- жащей объект, регулятор, обратные связи, неопределенности, может быть преобразована к общему виду, называемому М-^-конфигурацией, пока- занному на рис. 7.5; мы уже встречались с частным случаем такой кон- фигурации в п. 6.2 (см. рис. 6.1). Рис. 7.5. М-Д-конфигурация Здесь М — номинальная система (предполагающаяся устойчивой), а Д — все относящееся к неопределенности. Заметим, что неопреде- ленность здесь включена в цепь обратной связи. Приведение системы, в которой первоначально структура совсем иная (см., например, рис. 7.4 в центре и справа), к М-Д-конфигурации может быть выполнено с по- мощью специальных приемов, хотя часто это отнюдь не простая задача. При этом предполагается, что матрица Д(з), задающая неопределенность, имеет специальную структуру, которая будет описана позже. В качестве допустимых возмущений рассматриваются устойчивые Д(в), сохраняю- щие эту структуру и ограниченные в норме Нх: ||A(s)||oo = sup ||Д(уо>)|| у. Нас интересует верхняя грань тех 7, при которых сохраняется робастная устойчивость системы при описанных выше возмущениях. Поскольку система устойчива, если матрица (Л-М(з)Д(з))"1 существует при Re s 0, то задача сводится к проверке условия det (7 + М(з)Д(з)) / О
|.4. р-анализ 213 дои всех допустимых Д(з) и всех s : Re s 0 (достаточно проверять лишь шачения s, лежащие на границе левой полуплоскости, т.е. s = jw). Условие det(/ + M(jui)A(jw))/0 Vw можно зроверять «поточечно», меняя ш. Поэтому возникает вопрос: как для постоянных матриц М и Д проверить условие det (1 +МД)/ О УД: ||Д|Ю, причем имеются в виду Д, обладающие специальной структурой. Все это мотивирует введение следующих понятий. Пусть М еСпХп, т.е. М — постоянная квадратная матрица с ком- плексными элементами. Предположим, что все матрицы Д имеют следу- ющую структуру: Д ' diag j . j 51/ш4-1, • • • , ^s^tn+s i Дь ..., Др, Др4-1, ..., Д/1-ь/> где г, — вещественные числа, 5, — комплексные числа, Д,, i = 1,..., р, — вещественные квадратные матрицы, Дг, i = р + 1,... ,р + /, — комплексные квадратные матрицы, а Ц,..., 1т+я — единичные матрицы некоторых фиксированных размерностей. Таким образом, матрицы Д имени блочно-диагональный вид: сначала идут блоки, пропорциональные единичным матрицам (они называются вещественными и комплексными скалярными блоками), затем идут квадратные матрицы, у которых все элементы могут меняться (вещественные и комплексные полные блоки). Например, Д может иметь следующую структуру: < П \ д = \ <51 51 Гц Г12 Г21 Г22 <511 512 5г1 522 > *Де ri,Tij — вещественные числа, а 51,5у — комплексные. Размер- ность Д при этом равна п х п (в данном примере п = 7). Число р, соот- ветствующее данной структуре матриц (что будет обозначаться Д G Д), определяется так: р(М) = [min (||Д||: Д G Д, det (I + МД) = о}1 (7.29)
214 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ причем если I+ МД невырождена при всех Д, то д(М) = 0. Напомним, что ||Д|| здесь обозначает спектральную норму, т.е. ||Д|| = ап(Д) ~ (Атах(Д*Д))1//2, где сгп — наибольшее сингулярное число, а Лтах _. наибольшее собственное значение эрмитовой матрицы. Часто употре- бляют также обозначение дд(М), чтобы подчеркнуть зависимость от заданной структуры матриц А, но обычно из контекста ясно, о какой структуре идет речь, и мы будем опускать индекс А. В простейших случаях д(М) совпадает с известными из линейной алгебры величинами. Например, если есть лишь один скалярный комплексный блок: А = {61, б е С}, то Дд(М) = |Атах(М)| = Р(М), т. е. д равно спектральному радиусу М. Действительно, det (I + МД) = det(Z + Мб) = 0 только для 6 = — 1/А,, гае А, — собственные значе- ния М. Поэтому минимальное ||Д|| = |<5|, при котором возможно такое равенство, равно 1/|Атах(М)|. Если же есть лишь один полный ком- плексный блок, т. е. А = {Д € Спх”}, то дд(М) = ап{М) — ||М||. Это следует из леммы 7.2: матрица 2+МД невырождена, если ||Д|| < 1/ЦМЦ, и она может потерять невырожден- ность при больших ||Д||. Интересно отметить, что д(М) не меняется при некоторых преобра- зованиях подобия. Именно, введем D = ^Р = diag {2>i,..., 2>m, J\,..., Ja, di,... ,dp+j) J, rae Li — вещественные матрицы (той же размерности, что и /,), Li - Lj >0; Ji — комплексные матрицы (той же размерности, что и Im+i), Ji = J* > 0; di — положительные вещественные числа. Лемма 73. Для любого D е D справедливо р(М) = p{DMD~l). Действительно, любые D е D и Д е А коммутируют: РД = Д#> поэтому det (I + МД) = det (I + МР~*РД) = det (2 + МР"1 ДР) = = det(Z + PMP"1A). Последнее равенство использует тождество det (2 + AD) = det (I + DA) (см. Приложение, n. 1).
анализ 215 Обозначим еще U={/7e A: UU* = I}, т е. U — множество унитарных матриц той же структуры, что и А. Обязывается, для д можно получить верхние и нижние границы, используя динейные преобразования из U и О. Теорема 7.16. Справедлива оценка sup р(ПМ) = р(М) inf \\DMjD-4|. (7.30) ueu DeO Мы не будем доказывать эту теорему; она является основой для чи- сленного нахождения д(М). Минимизация по D в правой части (7.30) — сравнительно простая задача (она может быть сведена к выпуклой опти- мизации). В некоторых частных случаях (когда нет полных вещественных блоков и 2s + / ^ 3, где s — число скалярных, a f — число полных комплексных блоков) в правой части (7.30) достигается равенство, т.е и этом случае д может быть вычислено эффективно. В общей ситуации верхняя и нижняя границы для д различаются. Особенно трудно вычисле- ине р для вещественных блоков, которые соответствуют параметрическим неопределенностям. В системе Matlab существует специальный пакет р-Analysis and Synthesis Toolbox, где собраны эффективные алгоритмы шчисления д и его использования для анализа робастной устойчивости. Подобное использование опирается на следующий результат. Приведем замкнутую линейную систему, содержащую неопределен- ность, к Af-Д-форме (рис. 7.5), где М(з) — передаточная функция Номинальной системы (предполагающаяся устойчивой, M(s) € RHoo), * A(s) описывает все виды неопределенности в системе, которые заданы блочно-диагональной структурой А. Это могут быть параметрические не- определенности (им отвечают вещественные скалярные блоки), матрич- ные неопределенности (им отвечают вещественные полные блоки), ча- стотные неопределенности в Ноо-норме (им отвечают комплексные пол- ные блоки). При этом предполагается, что A(s) е RHoo и А е А для «Сех s: Res <0. Теорема 7.17 (критерий робастной устойчивости). Рассматриваемая Система устойчива при всех допустимых Д, ||Д(в)||оо < 7- тогда и только тогда, когда 8ирд(ЛГ0'у)) (7.31) ш 7 Действительно, этот результат, по существу, следует из теоремы о ма- коэффициенте усиления и из определения д; новым элементом явля- егс» лишь структура неопределенности (теорема 7.14 относилась к одному
216 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ полному комплексному блоку). Однако схема доказательства остается во всех случаях прежней. Итак, критерий робастной устойчивости, даваемый теоремой 7.17, предполагает выполнение следующих операций. 1. Система приводится к М-Д-конфигурации. 2. Для каждого ш вычисляется /z(Af(jw)). 3. Проверяется условие (7.31). Здесь наиболее трудоемким может оказаться второй этап; в случае веще- ственных неопределенностей он особенно труден. Поэтому нельзя счи- тать, что теорема является универсальным способом проверки робастной устойчивости. 7.5. Вероятностный подход к робастной устойчивости Как объяснено в п. 6.4, возможен и часто целесообразен не минимакс- ный, а вероятностный подход к робастности. Мы рассмотрим лишь задачи с параметрической неопределенностью (не вполне ясно, как ввести веро- ятностную меру в частотную неопределенность). Итак, мы изучаем либо полиномы P(s,q), либо матрицы A(s,q), зависящие от параметров q. По-прежнему будем предполагать, что параметры принадлежат множе- ству Q с однако теперь на этом множестве задана вероятностная мера. Для простоты будем считать, что задана плотность вероятности p(q), q е Q. Если эта плотность не задана по физическому смыслу задачи (см. замечания выше), то для ограниченного множества Q естественно брать равномерную плотность на Q. Можно показать, что такое распределение обладает рядом экстремальных свойств. 7.5.1. Метод Монте-Карло Простейший путь оценки вероятности устойчивости при заданной плотности p(q) заключается в применении метода Монте-Карло. Именно, генерируется выборка g1,...,Q7V независимых случайных величин, име- ющих плотность р(д). Для них вычисляются полиномы P(s,ql),--> P(s, qN) (или матрицы Л^1),..., A(qN)) и (с помощью критериев устой- чивости либо путем прямого вычисления корней или собственных значе- ний) проверяется их устойчивость. Пусть число устойчивых полиномов (матриц) оказалось равным М N-, если М близко к N, то можно наде- яться, что вероятность устойчивости высока. Чтобы формализовать такой подход, надо уметь более строго решать каждую из задач — генерацию выборки q1,... ,qN и оценки вероятности по частоте М/N. Остановимся на этих вопросах подробнее.
$ £5. Вероятностный подход к робастной устойчивости 217 a) lent рация равномерно распределенных векторов q eQ. Если Q — куб Q = {ggR^: О S; q С 1, г = fp равномерное распределение генерируется чрезвычайно просто — до- статочно независимо равномерно генерировать каждую компоненту q, век гора </. В Matlab такая генерация вектора q производится одной командой q = rand(^, 1). Аналогично генерация равномерного распре- деления матриц в семействе интервальных матриц п х п, 0 < ay 1, производится командой rand(n). Разумеется, если Q — параллелепипед {|ф -<7?| П, г = 1, то нужно добавить к этому масштабирование я сдвиг вектора q. Если Q — шар Q={96R£: то равномерно распределенные в Q случайные величины проще всего генерировать так: q = JL Я И’ где q е — нормально распределенный вектор с нулевым средним и единично» ковариационной матрицей, а £ — равномерно распределенная на [0, 1] случайная величина, независимая от г). На языке Matlab это Записывается так: q = randn(£, 1), q — rand*(l/£) ♦ q/norm(q). Таким же образом можно генерировать матрицы, ограниченные по фробениусовой норме. Так, матричное семейство А = Ао 4- Д, ||A||f 7, A G R”x", запас кя командами ц — randn(n), А = АО + гахкГ(1/п~2) * 7 * q/noxa(q, 'fro'). Существуют и способы генерации матриц, равномерно распределен- вих на шаре || Д|| < 7, где || • || — спектральная норма. б) Пусть задана последовательность бернуллиевских случайных вели- Чин^, i = 1,..., N (т. е. £i взаимно независимы, & = 1 с вероятностью р, С< = 0 с вероятностью 1 -р) и SN = YliLi Тогда удобная оценка р по Часто re pv _ Sn/N задается границами Чернова Prob|p pN — eJ 1 — e-2e2jv, Prob||p - pN\ 1 - 2е“2£2'\ Применяя этот результат к проблеме робастной устойчивости, получаем ^йлуюшии способ оценки вероятности устойчивости. Пусть P(s, q) или ^(9), q Е Q, — полиномиальное или матричное семейство, зависящее йт веыорного параметра q G Q С Rf; <f, i = 1,... ,N, —- равномерно
218 Глава 7. РОБАСТНАЯ УСТОЙЧИВОС ть распределенная на Q выборка, М — количество устойчивых полиномов (матриц) из N выборочных, р — истинная вероятность устойчивости, т.е. р = Vol (Qs)/Vol(Q), где Qs — область устойчивости, a Vol (•) означает объем множества. Тогда Prob< — — e>>l-e2eN, г N ) т. е. отношение М/N отклоняется от р больше, чем на е, с вероятностью, не превосходящей е-2^. В частности, если М/N близко к единице, a N достаточно велико, то с большой вероятностью можно заключить, что доля неустойчивых полиномов в Q мала. Сопутствующие функции Matlab: rand, randn — генерация равномерно распределенных и нормально рас- пределенных случайных чисел. 7.5.2. Вероятностные аппроксимации критериев робастной устойчивости Для многих критериев робастной устойчивости, рассматривавшихся в пп. 7.1 и 7.2, можно построить их вероятностные аналоги. Продемонстри- руем эти способы и получающиеся при этом возможности на нескольких типах задач. Для аффинного семейства полиномов t р(в,д) = р0(3) + У^р<(в) i=l мы ранее предполагали, что параметры qi ограничены: q 6 Q == {q & R* ' Iftl 7. i — !»•••>/}> a критерий устойчивости для всех q € Q заключался в том, что область значений z <S(w) = |z6C: z- PoO’w) + q G 1=1 не содержит нуля (в предположении, что Po(s) — устойчивый полином), см. теорему 7.1. Множество <S(w) — многоугольник, и возможно его точное описание (которое и приводит к теореме 7.4). Станем теперь на вероятностную точку зрения и будем считать qt независимыми равно- мерно распределенными на [—7, 7] случайными величинами. Если t личество I параметров достаточно велико, то сумма z = ао + £ а&’ г=1
Вероятностный подход к робастной устойчивости 219 » P«(jw), ведет себя приблизительно как двумерная гауссовская слу- «йная величина со средним а0 и матрицей ковариаций W = у ага^ i= 1 {здесь и далее комплексное число а$ понимается как двумерный вектор (Rea,, Imaj)T G R2). Поэтому <S(o>) хорошо описывается доверитель- ном эллипсом £г(ы) = [z G R2: (z - ao^W-^z - а0) о), П» т задает доверительный уровень (ясно, что размер £т(и) зависит также от размаха 7 неопределенности). Иными словами, если рт — соответству- ющая доверительная вероятность, то Prob|F(jw) € £г(ш) | « рт дая данного ш. Важно отметить, что эллипс £т(ш) часто существенно меньше, чем ка область значений S(w). Таким образом, если мы, опираясь на вероятностный аналог прин- ципа исключения нуля (нуль не принадлежит £т(ш) для всех ш), оценим вероятностный радиус устойчивости, т. е. максимально допустимое 7p = max^7: 0^£T(w)VwJ, ТО окажется, что 7Р > 7, где 7 —- «точный» (детерминированный) радиус устойчивости. Иначе говоря, если пренебрегать событиями малой вероят- ности, то можно значительно увеличить размах неопределенности пара- МСтров. Поскольку данный способ оценки радиуса устойчивости — при- ближенный, то окончательную проверку вероятности устойчивости при Шбранном 7 можно провести с помощью метода Монте-Карло. Аналогичный способ можно применить в случае матричной неопреде- ленности. Пусть матрица A G Rnx" устойчива, а ее возмущения Д G Rnxn Офаничсны во фробениусовой норме: ||Д||Г < 7. Для робастной устой- чивости семейства А + Д требуется, чтобы det (А — jw/+ Д) /0 (7.32) ЛИ всех ш G R и ||Д||Г 7. Поскольку det (А — jwl + Д) = det(A — (I + (А — jw/)-1 Д) = = det (А - jul) det (7 + (A - jul)-1 Д), 10 условие (7.32) эквивалентно условию к det(7 + (А - / О
220 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТк для всех ш е R и ||Д||F 7. Но для малых по фробениусовой норме матриц X имеем det (/ + X) » f[(l + хц) « 1 + tr X, i=l поэтому det(/ + (A - jw/)”1 Д) и 1 + tr ((A - Jwl)’1 Д). Иными словами, когда Д пробегает шар ||Д||Г 7, точки z = 1+tr ((А- _7<л/)-1Д) заполняют эллипс LeR2:(z - z0)T ~W((jj)(z - zo) 1|, I 1 J 2O = (l,0)T, W(w) = (BBT)-1 € R2x2, я _ R(l л _ ( A p o2x»2 В - B(w) - Imуест(л _ jW)-i J 6 R (здесь vecM = (mn,..., m„i,..., mjn,..., mnra)T — n2-мерный вектор, получающийся вытягиванием в столбец п х n-матрицы М), который хо- рошо аппроксимирует область S(o>) = |z = det (I 4- (А — ||Д||р 7}. Если теперь считать, что матрица Д равномерно распределена в шаре Н д11к < 7, то можно показать, что при фиксированной комплексной матрице (А - yW)"1 двумерная случайная величина = 1 + tr((A - jw/)-1 Д) имеет распределение с центром в z0 — (1, 0)т, линиями уровня которого являются эллипсы £т (ш): 8т[ш) = [z G R2: (z — z0)T-^5IV(w)(z - zq) t| , 1 j где т задает доверительный уровень. Таким образом, приближенно можно считать, что 0 det (А — jul + Д) с вероятностью р = рт (соответству- ющей уровню т), если zJW(u)z0 > 72т = 7р(^), что дает максимальное значение 7р(ш) при данной частоте ш: 7Р(щ) = (1Г11(Ч))1/2.
Выводы 221 дДииимизируя по ш, мы получаем приближенное значение вероятностного рдяиуса устойчивости 7Р = пйп7р(ш). Обычно 7Р существенно больше, чем детерминированный радиус робаст- ной усюйчивости. Вновь отметим, что заключительная оценка вероятно- сти устойчивости при выбранном 7 может быть получена методом Монте- Карло. 7J3. Свойства случайных матриц Приведем еще один подход к робастной устойчивости матриц, осно- ванный на некоторых теоремах о поведении случайных матриц. Теорема 7.18. Пусть элементы Ац матрицы Д размерности пхп независимы и имеют равномерное распределение на [—7, 7]. Тогда при УЗ а Я —+ оо спектральная норма матрицы —7= Л почти наверное стремится 'Уу/п К 2, а ее собственные значения стремятся к равномерному распределе- нию на единичном круге. Можно показать, что отсюда следует соотношение между вероятност- иым радиусом устойчивости интервального семейства А + Д (Ду незави- симы и равномерно распределены на [—7, 7]) и вещественным радиусом устойчивости 7„ах (7.24) матрицы А: случайное интервальное семейство робастно устойчиво с вероятностью 0,99, если 0,82 Г Jn 7max’ Рассмотрим простейший пример, когда А = —I. Тогда интервальное семейство — I + Д робастно устойчиво при 7 < 1/п, а при 7 > 1/п устойчивость может потеряться (дестабилизирующей является матрица с Ду = 1/п). В то же время собственные значения матрицы -I + Д для Случайного интервального семейства лежат приближенно равномерно в Лруге с центром в —1 и радиуса 7^/п/З, поэтому при 7 < д/3/n они ®УДут находиться в левой полуплоскости. Таким образом, соотношение Рюмахов допустимых возмущений для вероятностного и детерминирован- ного подходов равно \/Ъп. u Выводы • Семейство полиномов у ^(8,(2) = |p(s,q) = a0(g)+ai(?)s + ...+ an(g)sn, q е Q С
222 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ называется робастно устойчивым, если P(s, q) устойчивы при всех q е Q Областью значений полиномиального семейства называется множество 5(w) = {p(jw,q): q 6 Q J, т.е. <S(w) — двумерный образ Q при отображении P(jw,-). Многие критерии робастной устойчивости основаны на принципе исключения нуля: семейство робастно устойчиво тоща и только тогда, когда Q связно, an(q) / 0, в семействе существует устойчивый полином, и <S(w) не со- держит нуля при всех значениях w (теорема 7.1), Принцип справедлив и в дискретном случае, но здесь не требуется, чтобы все полиномы P(z, q) имели одинаковую степень (отсутствует условие an(q) / 0). Доказатель- ство основано на том, что при пересечении одним из корней границы устойчивости (мнимая ось либо единичная окружность) нарушается усло- вие 0 S(w). Для робастной устойчивости интервального семейства в непрерывном случае необходима и достаточна устойчивость четырех специальных вер- шинных полиномов — харитоновских полиномов (теорема 7.2 — теорема Харитонова). Область S(w) в этом случае — прямоугольник, вершины ко- торого соответствуют харитоновским полиномам, и доказательство осно- вано на принципе исключения нуля и критерии Михайлова. В дискретном случае аналогов теоремы 7.2 нет. Робастная устойчивость интервального полинома может быть устано- влена с помощью графического критерия (теорема 7.3). Здесь доста- точно проверять поведение лишь одного годо1рафа (годографа Цыпкина- Поляка); при этом определяется максимальный размах 7тах неопреде- ленности, при котором сохраняется робастная устойчивость — радиус устойчивости. Аналогичный результат имеет место для сферической не- определенности, в дискретном случае и т.д. Критерий робастной устойчивости аффинного семейства полиномов P(s,Q) = {P(s,q) = P0(s) +qiPi(s) + ... +qePe(s) : |q,| < 7, i = дается реберной теоремой (теорема 7.4): если полином Pq(s) устойчив и deg Pi С degPo, i = то (при некоторых дополнительных усло- виях ре!улярности) для робастной устойчивости необходима и достаточна устойчивость всех реберных полиномов, т.е. всех одномерных семейств вида {P(s,q): |ф| = 7, i / к, \qk\ < 7}- Реберная теорема эффективно применима, лишь если число I неопреД6 ленных параметров мало.
Выводы 223 • Задача робастной устойчивости параметрических семейств матриц иного сложнее задач для полиномов. Например, для интервального ма- тричного семейства отсутствуют аналоги теоремы Харитонова (устойчи- вость вершинных матриц не гарантирует робастной устойчивости), для аффинного семейства неверна реберная теорема. Поэтому используют приближенные методы или формулируют достаточные условия робаст- нос™. Один из приближенных методов использует идеи теории возмущений; оя основан на теореме 7.7, в которой оцениваются изменения собствен- ных значений матрицы A(q), зависящей дифференцируемым образом от вектора неопределенных параметров q, вызванные малыми изменениями q. В ряде случаев (например, для аффинного матричного семейства) это по- виляет приближенно оценить величину минимального q, приводящего к вотере устойчивости невозмущенной матрицы Л(0). Среди достаточных условий робастной устойчивости матричных се- мейств применяется подход, основанный на поиске общей квадратичной функции Ляпунова для всего семейства A(q), q е Q, т.е. на решении системы линейных матричных неравенств AT(q)P + PA(q) < О, Р > О, q е Q; существование решения гарантирует робастную устойчивость A(q). В слу- чае интервального или аффинного семейства такую систему неравенств Достаточно решать лишь для вершин множества Q (для вершинных ма- 1риц семейства), т. е. число неравенств конечно и равно 2е. Другое достаточное условие заключается в использовании сверхустой- Чнюсти вместо устойчивости. Например, если в интервальном семействе А ~ ((Oij)), Q-ij = -f" Aijy 7» i,j — 1 . . . , 71, Номинальная матрица Ao = ((п°Д) сверхустойчива: ст(Ло) = min^-a° - £ 1а?,I) > 0, то все семейство робастно сверхустойчиво, т.е. як > -(“° + Дг!) - + Aij| > 0, г = 1,...,тг, IJf ®ри всех | Aij | < 7, тогда и только тогда, когда * • п 7 <7 этом радиус сверхустойчивости 7* находится в явном виде. Анало- гичные формулы справедливы и в дискретном случае: если ||Ло||1 < 1, то
224 Глава 7. РОБАСТНАЯ УСТОЙЧИВОСТЬ семейство матриц остается сверхустойчивым при • При задании матричной неопределенности в виде ограничений на спектральную норму возмущения А — т4о + Д, ||Д|| ^7 нахождение радиуса устойчивости — максимального значения 7 = 7тах, при котором все возмущения ||Д|| < 7тах не нарушают устойчивости Ао, — зависит от типа возмущений. Если возмущения Д комплексные, то выражение для комплексного радиуса устойчивости 7max =i= 7^ах дается теоремой 7.8. При этом де- стабилизирующее возмущение при 7 7тах может быть взято в виде матрицы ранга один. Если допускать лишь вещественные возмущения Д, то нахождение вещественного радиуса устойчивости 7тах = 7тах усложняется; выраже- ние для 7^ах дается теоремой 7.10. Дестабилизирующими возмущениями являются матрицы второго ранга. Аналогичные результаты справедливы для дискретных систем, т. е. ма- триц, устойчивых по Шуру. • Для одномерных систем с частотной неопределенностью вопрос о робастной устойчивости решается с помощью робастного аналога крите- рия Найквиста (теорема 7.13). Для многомерных систем основным техническим аппаратом исследо- вания устойчивости при частотной неопределенности является теорема о малом коэффициенте усиления. Пусть М(s) — матричная передаточная функция из RH<x>, Д(а) — матричное частотное возмущение из RHoo, ограниченное в Ноо-норме: ||Д(в)||0о 1/7. Тоща матричная функция определена и принадлежит RHoo тогда и только тогда, когда ||М(s)Цоо 7 (теорема 7.14). Отсюда можно получить разнообраз- ные критерии робастной устойчивости при частотной неопределенности. Типичные результаты приведены в теореме 7.15. Пусть объект имеет аддитивную неопределенность: G = Go + WiДИ^, а регулятор C(s) по- мещен в цепи обратной связи. Тогда замкнутая система устойчива при всех ||Д(з)||оо 1. если ЦТУгСЗУР-гНоо < 1, где S = (I + б?оС)-1 — чувствительность номинального объекта. • Общая схема исследования робастной устойчивости дается так назы- ваемым //-анализом. Он основан на понятии структурного сингулярного числа матрицы. В //-анализе система приводится к стандартной Af-Д* конфигурации, где все неопределенности Д включены в цепь искусствен- ной обратной связи, а М — номинальная замкнутая система (включающая
7.6. Выводы 225 номинальный объект, регулятор и обратную связь). Матричная неопре- деленность Д(з) имеет некоторую структуру (в ней могут быть блоки, отвечающие вещественной или комплексной параметрической или ма- тричной неопределенности, частотной неопределенности). Число д(М) определяется как обратное к минимальной норме А заданной структуры, при которой матрица 7 + МД становится вырожденной. Для вычисления ^(М) существуют численные методы, основанные на верхних и ниж- них границах для д(М). Общий критерий робастной устойчивости для jVf-Д-конфигурации дается теоремой 7.17, обобщающей теорему о малом коэффициенте усиления. • Теория робастной устойчивости опирается на минимаксный под- ход — требуется сохранение устойчивости при любой допустимой не- определенности. Однако можно считать неопределенность случайной, а систему робастно устойчивой, если она сохраняет устойчивость с вероят- ностью, близкой к единице Такой вероятностный подход имеет ряд пре- имущест в. В частности, можно применить метод Монте-Карло для прямой проверки вероятностной устойчивости. Вероятностный радиус устойчиво- сти часто оказывается заметно большим, чем детерминированный. 8-Б.Т. Поляк, П.С. Щербаков
Глава 8 РОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ В этой главе мы проанализируем, каким образом методы стабилиза- ции и оптимального управления, рассмотренные в главах 4 и 5, могут быть обобщены на задачи с неопределенностями различных видов. Разумеется, не все описанные там методы допускают «робастизацию». Например, подход с помощью размещения полюсов системы (п. 4.3) имеет смысл только для фиксированной системы; С другой стороны, возможны и спе- циальные постановки задач, связанные с робастностью, например, задача о максимальной робастности (и. 8;4). 8.1. Робастная стабилизация с помощью регуляторов низкого порядка Как и в п. 4.1, мы займемся вначале задачей стабилизации одномер- ного объекта с передаточной функцией \__А(д) G(s) - ад с помощью скалярного коэффициента усиления к в цепи обратной связи. Рис. 8.1. Стабилизация неопределенного объекта скалярной обратной связью Однако здесь, в отличие от п. 4.1, G(s) не предполагается фикси- рованной, а содержит некоторую неопределенность. Для примера будем считать, что А и В — интервальные полиномы: A(s) = ао +ais + ... +атзт, а^аг^а,, г = 1,...,тп; •В(з) = bo + b\s +... + bnsn, bt bi bi, г = 1,...,п.
3,1. Робастная стабилизация с помощью регуляторов низкого порядка 227 Характеристический полином замкнутой системы Р(в) = Л(в) + kB(s) при фиксированном коэффициенте усиления к также будет интервальным полиномом с коэффициентами р; = о, 4- kbi, i = 1,...,п (мы предпо- лагаем, что n > m и дополняем а, = О для т < i < п). По теореме Харитонова 7.2 Р(з) устойчив в том и только в том случае, когда устой- чивы четыре харитоновских полинома Pi(s) = Л»(в) 4-kBi(s), г = 1,...,4, Где Л,(в),Вг(8) — харитоновские полиномы для интервальных семейств Л(«). B(s) (см. п. 7.1). Используя теоремы 4.1 и 4.2 о стабилизации устой- чивых и минимально-фазовых объектов, получаем их робастные аналоги. Теорема 8.1. Пусть полиномы Bi(s), i = 1,... ,4, устойчивы. Тогда система на рис. 8.1 робастно стабилизируется при 0 к < ккрит = min ki, где ki — -l/«i, a Ki — точка самого левого пересечения i-го годографа Найквиста Gi(ju>) = At(jw)/Bi(jw) с отрицательной веще- ственной полуосью. Теорема 8.2. Пусть полиномы Ai(s), i = 1,... ,4, устойчивы, ат > О и выполнено любое из условий а)п = т, п = т 4- 1, Ьп > О, в} п = т + 2, bn>0, ambn_i > ат-гЬп. Тогда система на рис. 8.1 робастно стабилизируется при к > /скрит = шах к,, где ki = —l/vi, a v, — точка самого левого пересечения i-го обратного годографа Найквиста Hi(ju>) — Bi(jw)/Ai(ju) с отрица- тельной вещественной полуосью. Таким образом, робастно устойчивые и робастно минимально-фазовые объекты мсжно робастно стабилизировать с помощью постоянной обрат- ной связи (в первом случае с помощью малого, а во втором случае — боль- шого коэффициента усиления). При этом для отыскания критического значения коэффициента усиления fcKpirr достаточно построить четыре ха- ритоновских годографа, соответствующих либо прямым, либо обратным Годографам Найквиста. Сходным образом допускает робастное обобщение и техника, осно- ванная на D-разбиении по двум параметрам, описанная в п. 4.1. Как мы •Идели, для регуляторов, зависящих от двух параметров ki, кг, характери- стический полином принимает вид (4.4): Р(в, к} = Р0(в) 4- fciPi(s) 4- fc2P2(s), к = (fci, кг),
228 Глава 8. РОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ где полиномы F0(s), Fj(s), Р2(«) линейно зависят от A(s) и B(s). На- пример, для ПИ-регулятора C(s) = fci + kifs получаем Р(з, к) — B(s)s + kiA(s)s + &2-A(s). Чтобы выявить более четко идею метода, рассмотрим простейший случай, когда полиномы Pi и Р2 фиксированы, а Ро — интервальный полином. В приведенном выше примере ПИ-регулятора это соответствует случаю, когда числитель объекта A(s) фиксирован, а знаменатель B(s) — интервальный полином. Тогда, как мы знаем (п. 7.1), Po(Jw) изменяется в некотором прямоугольнике на комплексной плоскости (его вершины определяются харитоновскими полиномами), поэтому при фиксирован- ном ш решения системы fciPi(jw) + &2P2GW) =-ВоО'ш) относительно к\,къ изменяются в параллелограмме, вершины которого определяются решениями четырех харитоновских систем. Таким обра- зом, каждая точка границы D-разбиения размывается в параллелограмм. Точки внутри области устойчивости, не накрываемые ни одним из этих параллелограммов, определяют значения ki,ki, гарантирующие робаст- ную стабилизацию. Рассмотрим робастный вариант примера 4.2 из п. 4.1. Для объекта с интервальным знаменателем G(s) =------—-------х, ao + ais + a2s 0,8 <а0^1,2; -0,1 at С 0,1; 0,8 С аг 0,2, мы ищем ПИ-регулятор C(s) = fci +fc2/s, гарантирующий робастную устойчивость. Характеристический полином замкнутой системы имеет вид F(s, к) = oqs + ais2 + аге3 + kis(s — 1) + fc2(s — 1), и уравнение границы D-разбиения P(jw) = 0 записывается следующим образом: —kiu>2 -кг = aiw2, (8.1) -fci + = -ao 4- a2w2,
4 g.l. Робастная стабилизация с помощью регуляторов низкого порядка 229 откуда ао — (ах + а2)ш2 а>2(—ао — ах + а2а>2) «1 =------г'' - -g-»2 =-------------——g---------- 1+ш- 1+ш2 Задавая значения а — (ao ai аг), отвечающие четырем харитонов- ским полиномам: а1 = (0,8 -0,1 1,2), а2 = (1,2 -0,1 0,8), в3 = (1,2 0,1 0,8), а4 = (0,8 0,1 1,2), мы при фиксированном ш полу- чим четыре точки к\ i = 1,... ,4, лежащие в вершинах параллелограмма. При изменении ш эти параллелограммы зачертят полосу, в которую раз- моется граница D-разбиения для невозмущенного объекта a0 = (1 0 1) (на рис. 8.2 она показана жирной линией). Особая прямая fc2 = 0 не за- висит от параметров а, и остается одной прямой. Таким образом, область Drob робастной устойчивости на плоскости {fci, fc2} приобретает вид, по- казанный на рис. 8.2. Разумеется, эта область меньше, чем в случае невозмущенного объекта (ср. с рис. 4.4). -1 -0,5 0 0,5 1 1,5 2 Рис. 8.2. Робастное D-разбиение. Область робастной устойчивости В данном случае (и в других аналогичных) можно было поступить и иначе, воспользовавшись теоремой 7.11 (регулятор первого порядка ста- били шрует интервальный объект тоща и только тоща, коща он стабили- зирует все харитоновские объекты). Иными словами, можно построить •D-разбиение по двум параметрам , Агг для всех харитоновских объек- тов; югда пересечение всех областей устойчивости даст область робаст- ной устойчивости. Для данного примера D-разбиение дается гиперболами, Получающимися после исключения ш2 из уравнений (8.1): (ki — ао)(кг +ai) = —---— ai + a2 + ki
230 Глава 8. РОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ и особой прямой кг — 0. Четыре области устойчивости (для четырех харитоновских полиномов с коэффициентами <?, i = 1,... ,4) показаны на рис. 8.3; их пересечение определяет ту же область робастной устойчи- вости, что и на рис. 8.2. Идея робастного D-разбиения может быть при- Рис. 8.3. Робастное D-разбиение. Область робастной устойчивости как пересече- ние областей устойчивости четырех харитоновских объектов менена и в более общем случае, когда полиномы А(з),В(з) принадлежат семействам, отличным от интервальных, однако при этом техника постро- ения границы усложняется (граница порождается не параллелограммами, а более сложными множествами). Изложенные выше методы относились к стабилизации непрерывных систем. Их можно отчасти перенести и на дискретный случай, но мы на этом не будем останавливаться. Возможны совсем другие подходы к синтезу робастных регуляторов низкого порядка, опирающиеся на численные методы. Пусть характери- стический полином замкнутой системы имеет вид P(s,q,k), q&Q. Здесь, как и ранее, q — вектор неопределенных параметров, изменяю- щийся во множестве Q с R€, а к — коэффициенты регулятора. Будем считать, что к & R2, т. е. мы проектируем регулятор, зависящий от двух параметров. Тогда для некоторого номинального q° & Q можно с помо- щью D-разбиения найти область устойчивости в пространстве {fci, кг}< т. е. построить D° = {fc е R2 : P(s,g°,fc) устойчив}.
g,2. Робастная квадратичная стабилизация 231 Ясно, что множество всех робастно стабилизирующих регуляторов •Prob = {& G R2 : P(s,q,k) робастно устойчив для всех q € Q} является подмножеством D°- £>гоЬ с £>°. Генерируя точки fc’ е D° К пользуясь критериями робастной устойчивости из п. 7.1. можно про- верять, будет ли fc* е Drob. Ясно, что можно не только организовать перебор точек из Р°, но и построить более эффективные метода поиска. 8.2. Робастная кьадратичная стабилизация Рассмотрим ту же задачу, что и в п. 4.4, но в робастном варианте. Для семейства систем х = A(q)x + Ви, q eQ, (8.2) мы пытаемся найти общий регулятор вида и = Кх так, чтобы у замкнутых систем х = Ac(q)x, Ac(q) = A(q) + ВК, q&Q, была общая квадратичная функция Ляпунова У(о;)=а:тР®, Р>0. Зависимость матрицы А от параметров q может быть любой, например, это может быть интервальное или аффинное семейство матриц (см. п. 6.1). Как было показано в теореме 4.13, решение задачи для фиксированной А определяется решением одного линейного матричного неравенства. В слу- чае неопределенной матрицы появляется набор соответствующих нера- венств, отвечающих всевозможным значениям параметра q. Теорема 8.3. Если X — решение системы линейных матричных нера- венств XAT(q) + A(q)X -2ВВТ < 0, q е Q, X > 0, (8.3) то регулятор с матрицей К^-ВТХ~1 Робастно стабилизирует систему (8.2), а квадратичная форма V(x) = хТХ~гх является общей функцией Ляпунова для замкнутой системы при всех 9GQ.
232 Глава 8. РОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ Доказательство дословно повторяет доказательство теоремы 4.13; за- метим лишь, что мы несколько изменили обозначения во избежание пу- таницы. Таким образом, проблема сведена к решению линейных матричных неравенств. Их может быть конечное число, если зависимость A(q) ли- нейна, a Q —многогранник. Действительно, если A(q), например, аф- финное семейство е Д(д) — Ао + q е Q = {д 6 : |g|oo 1}> »=1 то неравенства (8.3) выполняются для всех q €. Q тогда и только тогда, когда они выполняются для всех вершин qv е V = {g е Q '- |g»| = 1, г = куба Q. В частности, если Л(д) — интервальное семейство матриц, то достаточно решить систему линейных матричных неравенств, соответствующих вершинным матрицам, т. е. тем, у которых все элементы принимают максимальные либо минимальные значения. Для численного решения конечных систем линейных матричных неравенств существуют мощные вычислительные методы; их можно найти, в частности, в пакете LMI Control Toolbox системы Matlab. Тем не менее число неравенств может быть слишком велико: скажем, в случае интервальной матрицы _„2 _ п х п число неравенств равно 2П , и уже при п = о применение таких методов наталкивается на трудности. В этих случаях могут применяться более простые итеративные методы, которые на каждом шаге имеют дело лишь с одним случайно генерируемым неравенством. При этом общее число неравенств может быть бесконечным. Мы рассмотрели лишь ситуацию, когда матрица А включает неопреде- ленность, в то время как матрица В известна точно. Более общий случай неопределенной матрицы В также может быть сведен к линейным ма- тричным неравенствам. Сопутствующие функции Matlab: quadstab (LMIC) — нахождение общей квадратичной функции Ляпунова и радиуса квадратичной устойчивости для аффинного семейства на основе решения системы линейных матричных неравенств. 8.3. Робастный линейно-квадратичный регулятор Для той же модели неопределенности, что и в предыдущем параграфе, х = A(q)x + Ви, q е Q, х(0) = Хо, рассмотрим задачу о линейно-квадратичном регуляторе. Мы хотим с по- мощью обратной связи и = Кх
, Робастный линеиноквадратичный регулятор 233 ировать некоторый уровень д квадратичного критерия оптималь- J = J^(Rx,x)+ (Su,u)^dt, J fi, о при всех значениях параметров q G Q. Для простоты мы рассматриваем лишь случай, когда матрицы В, R > О, S > 0 известны точно, а неопреде- ленность присутствует лишь в матрице А. В п. 5.1 были описаны различ- ные способы решения задачи о линейно-квадратичном регуляторе. Один из них (основанный на решении линейных матричных неравенств (5.21)), допускает робастное обобщение. Теорема 8.4. Пусть Х(у) — решение системы линейных матричных неравенств / A(q)X + XAT(q) 4- (7 - 2)BS~1BT -y^XR1/'2 \ 1^0, \ 71/2jri/2x -I J X>Q, qeQ. (8.4) Решим одномерную задачу минимизации 7* = arg min 93(7), ^(7) = 7'1IqX(7)i0, 7 где минимизация ведется по всем 7 > 0, для которых решение Х(у) существует. Тогда для обратной связи m = -S-1Bt(X(7*))-1x гарантируется оценка критерия оптимальности для всех значений параметра q & Q. Этот результат непосредственно следует из соответствующего резуль- тата при фиксированной матрице А из п. 5.1. Таким образом, здесь Необходимо решать (при фиксированном 7) системы линейных матрич- ных неравенств (8.4) при всех q G Q. Как уже отмечалось, если A(q) — аффинное семейство, a Q — многогранник, то достаточно решить ко- нечное число систем неравенств, отвечающих вершинам Q. Если таких Першин слишком много, можно использовать специальные итеративные г’ Методы.
234 Глава 8. ГОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ 8.4. Робастная стабилизация с помощью Яое-оптимизации В п. 7.3 были приведены результаты, показывающие связь между ро- бастной устойчивостью замкнутой системы и условиями на ограничен- ность некоторых передаточных функций в Яоо-норме. Например, из тео- ремы 7.14 следует, ,что если передаточная функция объекта имеет вид G(s) = G0(s) + Ж(з)Д(8)Ж2(з), то робастная устойчивость при всех ЦД^Цо, т имеет место при усло- вии 7 где S = (I + GoG)-1 — чувствительность. Далее, пользуясь резуль- татами об общем виде стабилизирующих регуляторов (теорема 4.7), мы заключаем, что С = (X + VQ){Y ~UQ}~\ S = (У - UQ)(Y + UV-^X), где Q — параметр Юлы (произвольная матричная функция из ЯЯТО), а матрицы X, Y,U,V 6 RH<x определяются условиями Go = UV~l, UX + VY = I. Таким образом, условие робастной устойчивости записывается в терминах параметра Юлы: ||Т1 +T2QT3||to < 1, 7 Ti = W2X(Y + UV~1X)W1, T2 = W2V, T3 = (Y + UV~1X)W1. , (8-5) В частности, задача о максимальной робастности (т.е. о нахождении максимального уровня неопределенности 7, допускающего робастную ста- билизацию) сводится к задаче Ято -оптимизации min Н^+ГяОТзи (8-6) способы решения которой обсуждались в п. 5.2. Таким образом, с прин- ципиальной точки зрения решение задачи о максимальной робастности выглядит так. 1. Для номинального объекта Go(s) находим его представление в виде Go = UV-1, U, V 6 RHoo', решаем уравнение UX + VY = I и находим X, Y; на их основе вычисляем Ti, Т2, Т3 по формулам (8.5).
8,4. Робастная стабилизация с помощью Нрр-оптимизации 235 2. Решаем задачу Нж-оптимизации (8.6), и пусть Q € RHoo —• ее решение, a ||7i +T2QT3II00 = 7*- 3. Строим регулятор С = (X+ VQ)(Y -UQ)-1; он является робастно стабилизирующим при всех 0 7 < 7*. Каждый из этапов может быть выполнен с помощью соответствующих процедур в системе Matlab. Приведем еще несколько частных случаев, когда неопределенность задается не в частотной, а в параметрической форме, однако возможно применение техники Ноо -оптимизации. 1. Комплексные параметры. Пусть передаточная функция одномер- ного объекта имеет вид 4>(g) + £f=1 qiAj(s) Bo(*) + ELi9^(S)’ где Ai, Bit i = 0,1,.... £, — заданные полиномы, a qi, i = 1,... ,£, — комплексные параметры, изменяющиеся в шаре пространства С£: 9«€С. (8.8) i=l Задача заключается в построении регулятора C(s) = N(s)/D(s), который робастно стабилизирует объект (8.7)-(8.8). Отметим, что и в числителе, и в знаменателе стоят одни и те же неопределенные параметры qe, это, однако, не является ограничением (см. рассуждения в главе б). Необычно здесь то, что qi предполагаются комплексными; впрочем, существуют за- дачи, в которых такая модель возникает естественным образом. Пусть передаточная функция номинального объекта Go (в) = = Ло(в)/Во(а) реализуемая (т е deg Ао < deg Во), полиномы Ло,Во вза- имно просты, deg Ai < deg -Ao, deg Bi < deg Bq, i = 1,... ,£. Составим матрицу W(s) размерности £ x 2 ( ВЦа) \ Ао(8) В0(а) W(s) = Ае(з) Be(s) \ Л>(«) В0(з) / первый столбец которой обозначим Wi (s), а второй Жг(в). Обозначим еще, как обычно, через S(s) и Т(в) чувствительность и дополнительную
236 Глава 8. РОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ чувствительность номинального объекта: 1 + G0(s)C(s) ’ т(я} = _£аШ±_ l + G0(s)G(s)' Пусть 7* — решение задачи ~ И£п IIW1S + И^ТИоо- (8.9) Эта задача эквивалентна задаче Д»-оптимизации стандартного вида (см. (6.15)) mmllJKP.CJUoo О для условного объекта ( Wi(s) G0(s)(w2(s) -^(s)) \ \ 1 -Go(s) ) и ее решение может быть найдено описанными в п. 5.2 средствами. Теорема 8.5. Пусть -у*,С — решение задачи (8.9). Тогда при 7 < 7* регулятор С робастно стабилизирует объект (8.7)-(8.8). Мы не будем приводить всех технических деталей доказательства; под- черкнем лишь основную идею. Характеристический полином замкнутой системы имеет вид е . е 4l(s,q) = (a0(s) + ]ГдгЛ(з)}Д(«) + (Во(з) + 52g*Bi(e))p(s) = «=1 г=1 г = Ф0(з) + £> (А(в)ВД + , i=l и если регулятор стабилизирует номинальный объект, то Фо(«) Гурви- цев, и в соответствии с принципом исключения нуля (п. 7.1) робастная устойчивость имеет место при +g*----------------------------* ° для всех w > 0 и всех удовлетворяющих (8.7). Заметим, что для любых фиксированных Ci € С, i = 1,..., I, множество z г 5={z=zEZ9iCi’ zLtoi2^72’ ^еС}
8.4. Робастная стабилизация с помощью Ндо-оптимизации 237 является кругом с центром в нуле и радиусом 7^52 на комплекс- ной плоскости. Итак, робастная устойчивость имеет место тогда и только тогда, когда С помощью несложных преобразований последнее условие может быть записано в стандартной Яоо-форме, что и сделано в теореме. 2. Дискретные системы с ^-неопределенностью. Пусть передаточная функция дискретного объекта имеет вид ад = A(z) + ДА(д) B(z) + ^B(zY (8.10) где неопределенности — полиномы ДА(г),ДВ(х)— ограничены в h- норме, но их степени не ограничены: ||ДА||? + ||ДВ||1 С 72- (8-И) Такие неопределенности уже рассматривались в п. 7.1, см. (7.16). Мы упоминали там, что области значений таких полиномов — круги на ком- плексной плоскости. Используя этот факт и рассуждая примерно так же, как при доказательстве теоремы 8.5, приходим к следующему результату. Составим g(z) z.______1______ T(z} = &о(г)С(2) 1 + G0(z)C(z) ’ k ’ 1 + GoWC(^) ’ где G(z) — искомая передаточная функция регулятора, Go (г) == = A{z)/B(z) —• передаточная функция номинального объекта, и поло- жим B\z) A(z) Робастная устойчивость имеет место тогда и только тогда, когда WiS W2T оо 1 7 Таким образом, если мы решим задачу Я.»-оптимизации 2 7* С WiS W2T оо
238 Глава 8. РОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ и обозначим полученный оптимальный регулятор через С, то при у < у* этот регулятор робастно стабилизирует объект (8.10)-(8.11). 3. Вещественная неопределенность. Мы вновь возвращаемся к не- прерывным системам и рассматриваем ту же модель объекта, что и (8.7), но с вещественными параметрами: £>i|2<G2, Qi ей- i=l (8.12) Такую задачу не удается свести к стандартной Яю-задаче, но тем не менее ее удается записать в виде некоторой выпуклой задачи родственного типа. Именно, составим Л(8) Я1(я) = Я2(в) = где Р(в) — устойчивый полином, такой что P(-s)P(s) = A(-s)A(s) + В(-в)В(в), найдем X, Y как решение уравнения НхХ + Я2У = 1 и составим матрицу / Ai(s) В1(в) < А€(з) Ве(з) Теорема 8.6 (Ранцер-Мегрецкий). Если найдутся Qi,Q?е RH<x, удовлетворяющие неравенству -ЯгО) \ / Qi(jw) \ 1 Ягб'ш) J V Q2(jw) ) J 2 <ReQ1(ju) (8.13) для всех со 0, то регулятор YQ1 ~ H2Q2 XQ! - HiQ2 робастно стабилизирует систему (8.12).
g.5. p-синтез 239 Мы не приводим доказательство этого результата, так как оно до- статочно сложно. Неравенство (8.13) выпукло относительно переменных Q1.Q2 G RHgo, играющих ту же роль, что и параметр Юлы. Не со- всем ясно, как решать выпуклую систему неравенств такого типа — ведь переменными являются не конечномерные векторы, а устойчивые переда- точные функции. Один из возможных путей заключается в конечномерной аппроксимации таких функций. &5. ^-синтез В п. 7.4 мы видели, что устойчивость системы при фиксированном регуляторе и различных видах неопределенности можно исследовать с по- мощью /г-анализа. Именно, теорема 7.17 дает необходимое и достаточное условие робастной устойчивости системы, имеющей М-Д-конфигурацию (рис. 7.5), в терминах структурного сингулярного числа д(М): при всех возмущениях ЦД^Цсо < у заданной структуры робастная устойчивость имеег место тогда и только тогда, когда sup/i(M(jw)) i. ш^о 7 (8 14) В этом параграфе мы будем решать задачу выбора регулятора С, ко- торый обеспечивает выполнение условия (8.14). Вспомним, что M(s) соответствует передаточной функции схемы, изображенной на рис. 8.4. Рис. 8.4. М-Д-конфигурация для задачи д-синтеза Здесь G — который удобно представлять в виде блочной матрицы / Сц G12 \ Сг21 6*22 * С — регулятор; тогда M = Gu+ GUC(I- G^C}-lG2i = Fi(G,C),
240 Глава 8. РОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ гае Ji обозначает нижнее дробно-линейное преобразование (см. п. 6.2). Таким образом, задача свелась к выбору регулятора С, обеспечивающего выполнение условия а задача о максимальной робастности (т. е. о нахождении наибольшего у, для которого можно обеспечить робастную устойчивость) — к минимиза- ции g^Ji(G,C)^ по С. mmM(ji(G,G)). К сожалению, прямые методы решения этой задачи неизвестны, и используется косвенный путь, не всегда гарантирующий нахождение ре- шения. Вспомним, что для д известна верхняя граница (теорема 7.16): д(М)^ шуЯМ£Г1||, гае D — блочно-диагональные матрицы той же структуры, что и Д. При фиксированном D задача минимизации по С min||PJi(G>G)I?-1||0o (8.15) С — это стандартная задача H^ -оптимизации (п. 5.2), и для ее решения существуют хорошо разработанные методы (использующие либо переход к пространству состояний и уравнение Риккати, либо теорему Неван- линны-Пика). С другой стороны, при фиксированном С и ш решение задачи min || DMD~11|, М = М( jw) = Ji (G(jw), G(jw)) может быть сведено к выпуклой конечномерной задаче оптимизации, для которой также известны эффективные методы. Таким образом, в общих чертах метод решения задачи д-синтеза, называемый D-С-итерациями, имеет следующий вид. 1. D-итерации: для найденного приближения С и сетки по частотам 0 < он < о>2 < • • • < Wjv с помощью методов выпуклой минимиза- ции решаются задачи min ||Z>MiD-1||, Mi = MfjwA, i = l,...,N, Deo решения которых обозначаются через Di. Затем находится функция D(s) 6 RHoo, D G О, которая хорошо аппроксимирует найденные решения на сетке D(jWi) « D,.
g.6. Внводы 241 И- —— ---------- " .-n,,,. . .....—..... ..................... 2. С-итерации: для найденного Z>(s) методами Нх-оптимизации ре- шается задача (8.15) и находится очередное приближение дам регу- лятора С, после чего переходят к пункту 1. Нет нужды говорить, что каждый из пунктов алгоритма достаточно сложен и требует уточнения. Более того, в общей ситуации нет никакой гарантии, что в результате удастся найти решение исходной задачи (8.15). Тем не менее указанный подход реализован в пакете ^-Analysis and Syn- thesis Toolbox в системе Matlab и успешно применяется для решения практических задач. 8.6. Выводы • Задача стабилизации с помощью обратной связи, рассмотренная в главе 4, может быть обобщена на случай систем с неопределенностью (робастная стабилизация). Д|я одномерного интервального объекта проблема стабилизации с помощью большого или малого коэффициента усиления решается для робастно минимально-фазовых или робастно устойчивых систем (тео- ремы 8.1 и 8.2). Для двухпараметрических регуляторов робастная стаби- лизация проводится на основе робастного Р-разбиения. Однако в целом задача робастной стабилизации с помощью регуляторов низкого порядка не имеет простого решения. • Удобным аппаратом робастной стабилизации является техника, осно- ванная на построении общей квадратичной функции Ляпунова. Так, для сисн-мы х = A(q)x + Ви с магрицей А, зависящей от параметров q G Q, можно решить систему линейных матричных неравенств ХАт(9) + A(q)X - 2ВВТ <0, q ё Q, X > 0, и если ее решение X > 0 существует, то обратная связь и = —ВтХ~1х является робастно стабилизирующей. • Аналогичным образом, путем сведения к линейным матричным не- равенствам, решается задача о гарантированном значении квадратичного показателя качества для систем с параметрической неопределенностью (робастный линейно-квадратичный регулятор). • Результаты о робастной устойчивости при частотной неопределен- ности, приведенные в п. 7.3, сводят отыскание регулятора C(s), робастно стабилизирующего объект, к решению неравенств типа 11^2(751^1 Ноо < i S = (I + GoC)-1
242 Глава 8. РОБАСТНАЯ СТАБИЛИЗАЦИЯ И УПРАВЛЕНИЕ (см. теорему 7.14). При переходе к параметру Юлы Q в описании всех регуляторов C(s), стабилизирующих номинальный объект Go(s), это не- равенство переписывается в форме ||Т1+Т2(?Тз||оо<-, 7 где матричные передаточные функции Т»(з) легко вычисляются. Таким образом, нахождение робастно стабилизирующего регулятора сводится к решению стандартной задачи Ноо-оптимизации и находится максимально допустимое у, при котором возможна робастная стабилизация. Методы Ноо-оптимизации могут быть использованы и в некоторых задачах робастной стабилизации при параметрической неопределенно- сти в передаточных функциях. Три примера иллюстрируют эффектив- ность такого подхода: комплексные параметры; дискретные системы с 11 -неопределенностью; выпуклая параметризация при вещественной не- определенности. • На основе д-анализа (п. 7.4) могут быть построены процедуры ц- синтеза. Они сводятся к поочередной минимизации верхней грани для /х по регулятору С и минимизации этой верхней грани при найденном С (О-С-итерации). При этом, однако, нет гарантии, что оптимальный мак- симально робастный регулятор будет найден.
Глава 9 НЕРЕШЕННЫЕ ЗАДАЧИ В данной главе мы обсудим некоторые важные задачи, допускающие простую формулировку, но эффективные методы решения которых неиз- вестны. Эти проблемы относятся как к робастной теории, так и к класси- ческой теории линейных полностью определенных систем. О многих из них уже упоминалось в предыдущих главах; там обсуждались методы их решения в частных случаях. 9.1. Стабилизация регулятором заданной структуры Рассмотрим простейший класс задач такого типа. Задан одномерный линейный объект (»(s) = .И’ A(s) = ao+ais+—+amsm, B(s) = 6o+bi®+- • --i-bnsn, Можно ли его стабилизировать регулятором ® ( } D(s) * цепи обратной связи (рис. 9.1), если порядки числителя и знамена- теля регулятора не превосходят заданных чисел? С математической точки G(s) = A(s)/B(s) C(s) = N(s)/D(s) Рис. 9.1. Стабилизирующий регулятор запанной структуры ения вопрос сводится к следующему: можно ли выбрать полиномы (s),£)(s) заданных порядков так, чтобы характеристический полином P(s) = A(s)N(s) + B(s)D(s)
244 Глава 9. НЕРЕШЕННЫЕ ЗАДАЧИ был гурвицевым? Если отказаться от условия ограниченности порядка регулятора, то полное решение задачи было приведено в п. 4.2: стабили- зация всегда возможна, если A(s) и B(s) не имеют общих неустойчивых корней. В п. 4.1 приводились различные ситуации, когда стабилизация за- ведомо возможна с помощью простого коэффициента усиления C(s) = k (это случаи устойчивого или минимально-фазового объекта). Обсуждался также случай, когда регулятор C(s) содержит лишь два параметра (на- пример, является ПИ-регулятором); здесь полное решение проблемы воз- можно найти с помощью D-разбиения Однако что происходит в общем случае, когда регулятор содержит £ > 2 параметров? Если представить N(s),D(s) в виде 7V(s) - Qi +•• + ЧкЗк~\ D(a) = l + qk+is + ...+qe&e~k, где к, £ заданы, то задача сводится к проверке, существует ли в аффинном семействе полиномов (9.1) устойчивый полином. Здесь Р0(з) = В(д), Pits) = s’-1A(s), i = l,...,k, Pi^s) = s*~kB(s), i = k + l,...,£. Если задавать структуру регулятора иначе (например, ПИД-регулятор вида C(s) = qi + qz/s + qss), то задача вновь сведется к проблеме (9.1). Та- ким образом, общей схемой для исследования вопроса стабилизируемости регуляторами заданной структуры является Проблема 1. Существует ли в аффинном семействе (9.1) хотя бы один устойчивый полином? Можно предположить, что на параметры регулятора наложены неко- торые ограничения q е Q. (9.2) Например, это могут быть интервальные ограничения: Q = {gGR*: д^дг^д,, г = (9.3) или ограничения на близость g к номинальному значению д° в какой-либо норме: Q = {geRz:|g-g°|<7}; (9.4) тогда получаем ограниченный вариант проблемы 1:
245 9J. Стабилизация регулятором заданной структуры ” г' ..................... ,т1тт Проблема 2. Существует ли в семействе (9.1)-(9.2) хотя бы один устойчивый полином? На первый взгляд проблема 2 очень близка к задаче о робастной устойчивости полиномов, эффективные методы решения которой были описаны в п. 7.1. Единственная разница в том, что в задаче о робастной устойчивости речь шла о существовании хотя бы одного неустойчивого полинома в семействе (9.1)-(9.2), тогда как в проблеме 2 ищется хотя бы один устойчивый полином в том же семействе. Эта на первый взгляд незначительная разница приводит к кардинальной перемене в сложности задачи. Оказывается, проблема 2 является ЛГР-сложной, причем даже в просгейших случаях, таких как поиск устойчивого полинома в интерваль- ном семействе. Поэтому для нее не существует методов решения полино- миальной сложности (т. е. таких, в которых число операций полиноми- ально зависит от степени полинома P(s, </)). Более того, для таких задач неверны и результаты типа теоремы Харитонова или реберной теоремы (см. п. 7.1). Иначе говоря, все вершины и все ребра многогранника Q мо- iyr быть неустойчивы, однако некоторому q е Q может соответствовать устойчивый полином. Разумеется, можно предложить некоторые доста- точные условия, которые гарантируют положительный или отрицательный отвс! в проблеме 2. Однако эти условия далеки от необходимых. Друга м возможным путем решения мог бы быть вероятностный под- ход, который применялся в п. 7.5 к задаче о робастной устойчивости. Так, можно попытаться генерировать случайные точки ql из Q и проверять на устойчивость полиномы P(s, д1). Однако эффективность такого подхода невелика — обычно устойчивые полиномы в семействе P(s, Q), даже если они существуют, составляют очень небольшую по объему долю. Напри- мер, в интервальном семействе полиномов степени п с коэффициентами между 0 и 1 доля устойчивых полиномов и(п) оценивается как ( - 1 W(n)^ [(n + l)/2]i (хогя эта оценка сильно завышена) или асимптотически ц(п) « е“с”2, те С — некоторая константа; для п = 10 численное моделирование дает v(n) и 10~9. Таким образом, вероятность получить устойчивый поли- ном степени 10 при случайной генерации коэффициентов, равномерно распределенных на [0, 1], ничтожно мала. Существуют и численные методы решения проблемы 2. Введем функ- цию q(q) = max Re (q), i ГДе s,(g) —корни полинома P(s,g). Ясно, что для устойчивого полинома имеем 77(g) < 0, а для неустойчивых T}(q) 0. Поэтому можно решать
246____________________________________Глава 9. НЕРЕШЕННЫЕ ЗАДАЧИ задачу тшд(д). (9.5) Функция 77(g) — дифференцируемая, если все з,(д) различны; с помо- щью теории возмущений (см. п. 10 Приложения и обсуждение в п. 7.2) нетрудно выписать ее градиент в таких точках. После этого естественно применить метод типа проекции градиента для решения задачи оптимиза- ции (9.5). К сожалению, такой подход не гарантирует получения правиль- ного ответа в проблеме 2. Дело в том, что функция т?(д) — невыпуклая, и метод может привести к локальному (а не глобальному) минимуму. Кроме того, дополнительные трудности возникают в случае кратных корней. При этом искомый устойчивый полином, возможно, не будет найден, хотя он и существует. Этим же недостатком обладают численные методы, основанные на ис- пользовании алгебраических критериев устойчивости типа Рауса-Гурвица. Именно, будем оперировать с полиномом P(s,g) с помощью алгоритма Рауса, проводя вычисления в аналитической форме (например, с помощью пакета для символьных вычислений в системе Matlab). Тогда условие положительности элементов первого столбца таблицы Рауса примет вид Ь,(д) > 0, i= l,...,n, q & Q. (9.6) Следовательно, проверка наличия устойчивого полинома в семействе сво- дится к выяснению разрешимости системы неравенств (9.6). Однако ме- тоды решения таких невыпуклых неравенств очень сложны. Таким образом, эффективные методы решения проблем 1 и 2, гаранти- рующие получение точного ответа в общей ситуации, в настоящее время неизвестны. Заметим еще, что проблема 2 в частном случае (когда Qi являются коэффициентами Р(з,д)) может быть записана в следующей форме. Проблема 3. Дан неустойчивый полином Pq(s). Найти ближайший устойчивый полином той же степени. Здесь расстояние между полиномами А(з) = ао + ais +... + ansn и B(s) = bo+bi з+...+Ьпзп понимается как diet (Л, В) == ]а - 6|, где а, b € R"+1 — векторы коэффициентов А(з),В(з), а | • | — некоторая норма в z п г 1/2 R"+1, например, |а -1>| = max |а^ - Ь»| или |а - Ь| = (£ (а» - М2) » \=о 7 Тогда если mm dist (Р0(з),Р(з,д)) = 7* «S 7. 'V^iwG'Py где Py — множество устойчивых полиномов, то решение проблемы 2 с Q вида (9.4) и P(s,q) = qo + qis + ... + qnsn существует; в противном
0Д, Стабилизация регулятором заданной структуры 247 случае — не существует. Вновь проблема 3 получается перестановкой терминов «устойчивый» и «неустойчивый» в простой задаче об отыска- нии радиуса устойчивости полинома. Однако эта замена принципиально усложняет задачу. До сих пор мы рассматривали одномерные задачи, описываемые с по- мощью скалярных передаточных функций. Однако совершенно аналогич- ный круг трудных проблем возникает при описании систем в простран- стве состояний. Типичной является задача о статическом регуляторе по выходу: для системы х = Ах + Ви, у = Сх выяснить, можно ли ее стабилизировать обратной связью вида и = Ку. Алгебраическая формулировка той же задачи: существует ли матрица К такая, что при данных А, В, С матрица Ас = А + ВКС устойчива? Рас- сматривая элементы матрицы АГ как параметры q, заключаем, что задача о статической стабилизации по выходу является частным случаем более общей проблемы. Проблема 4. Дано аффинное семейство матриц t л(д) = л0+$2^’ <9-7> где Aq,...,At — заданные п х п матрицы. Существует ли в этом семействе хотя бы одна устойчивая матрица? К этой же проблеме сводятся и другие задачи стабилизации регуля- торами заданной структуры, отличные от статического регулирования по выходу. Более того, в эти же рамки укладываются аналогичные задачи для дискретных систем — просто термин «устойчивая матрица» понимается 8 этом случае как матрица Шура. Теоретическое решение проблемы 4 неизвестно. Более того, оно не может быть простым, так как проблема 1 для полиномов, очевидно, явля- ется частным случаем проблемы 4 (достаточно в качестве А, рассматри- вать матрицы во фробениусовой форме). Аналогичным образом перено- сятся на матричный случай проблемы 2 и 3: Проблема 5. Существует ли в семействе A(q) (9.7), q е Q (например, яри Q вида (9.3)), хотя бы одна устойчивая матрица? Проблема 6. Задана неустойчивая матрица А. Найти ближайшую устойчивую матрицу. Для некоторых частных случаев все эти проблемы допускают простое решение. Например, пусть матрицы Ао,..., At симметричны. Тогда и все
248 Глава 9. НЕРЕШЕННЫЕ ЗАДАЧИ матрицы A(q) симметричны. Для симметричной матрицы устойчивость эквивалентна отрицательной определенности. Таким образом, проблема 4 сводится к линейному матричному неравенству: найти q G й£, удовлетво- ряющее условию £ А$ + ^qjAj < 0. г=1 Это выпуклая задача, и для нее существуют хорошо разработанные ме- тоды решения (в частности, соответствующий пакет в системе Matlab). Таким образом, проблема 4 (и родственная ей проблема 5) допускает эффективное решение для симметричных матриц. Для этого же случая удается найти явное решение проблемы 6. Именно, пусть А — симметрич- ная матрица, и нас интересует ее расстояние до множества устойчивых симметричных матриц. Приведем Л к диагональному виду с помощью не- вырожденного преобразования Т (это всегда возможно для симметричных матриц): TAT-1 = A = diag(Ai,...,Xn), где А, — вещественные собственные значения А. Построим матрицу А_, заменив положительные собственные значения нулями: А_ =diag(A7,...,A~), А“ =min{0, AJ. Тогда матрица А_ = Т^А-Т — это ближайшая (в смысле фробениусовой нормы) к А симметричная неотрицательно-определенная матрица. Поэтому расстояние от А до мно- жества устойчивых симметричных матриц равно 7* = ||А — A_||F. Таким образом, все задачи резко упрощаются, если иметь дело лишь с симметричными матрицами. Один из возможных подходов к проблемам 4-6, связанный с концеп- цией сверхустойчивости, мы уже обсуждали ранее (п. 3.6). Он основыва- ется на достаточном условии устойчивости, формулируемом как «сверх- устойчивость» матрицы. Напомним, что мы ввели обозначение <т(А) = minf-ajj - и если <т(А) > 0, то А называется сверхустойчивой матрицей; отсюда следует и ее устойчивость (гурвицевость). Для семейства (9.7) элементы
9-2- Одновременная стабилизация 249 ev(t/l матрицы A(q) являются аффинными функциями от q, и система неравенств min(-ац(д) - |«0(«)1) > О, (9.8) \q- g°|oo«S7 сводится к обычной системе линейных неравенств относительно q (мы предполагаем, что множество Q в проблеме 5 имеет вид (9.4)). Таким образом, если система (9.8) имеет решение q*, то матрица A(q*) является сверхустойчивой, а тем самым и устойчивой. В этом случае вопрос о су- щее I ковании устойчивой матрицы в семействе (9.7) (проблема 5) заведомо имеет положительный ответ. Покажем еще, как решается проблема 6 при замене устойчивости на сверхустойчивость, Пусть — элементы A, a x,j — элементы иско мой матрицы X, принадлежащей замыканию множеству сверхустойчивых матриц и ближайшей к Л во фробениусовой норме. Тогда X является решением задачи квадратичного программирования тшУ^(агз - Xjj)2, (9.9) хц + С 0, г = 1, Если обозначить минимум в этой задаче через 7*, то ясно, чтто 7 С 7*, Где — расстояние от А до множества устойчивых матриц. 9.2. Одновременная стабилизация Задача об одновременной стабилизации возникает во многих практи- ческих ситуациях. Пусть объект может работать в нескольких режимах. Переход от одного режима к другому происходит независимо от нашего желания, и информация об этом может отсутствовать, например, такой Переход может вызываться отказом какого-либо элемента объекта. Цель Управления — выбрать регулятор, обеспечивающий работоспособность (и ь первую очередь устойчивость) системы в любом из возможных режимов. Формализацией такой задачи может служить следующая проблема. Проблема 7. Имеется т одномерных объектов с передаточными Функциями „ , л A(s) . , G'w = w , = l.........”*
250 Глава 9. НЕРЕШЕННЫЕ ЗАДАЧИ Существует ли регулятор N(s) D(S)\ который одновременно стабилизирует все эти объекты? Иначе говоря, можно ли найти полиномы AT(s),.D(s) так, чтобы все характеристические полиномы Pi(s) = Л(«)ад + В((«)Д(в), i = были гурвицевыми? Как мы знаем (п. 4.2), для т = 1 при Ai,Bi, не имеющих общих неустойчивых корней, решение всегда возможно, более того, можно описать все стабилизирующие регуляторы с помощью пара- метризации Юлы. Для двух объектов решение также может быть получено; оказывается, проблему можно свести к задаче стабилизации одного объекта с помо- щью устойчивого регулятора. В свою очередь, последняя задача допускает полное решение в терминах перемежаемости нулей и полюсов объекта. Более общая многомерная проблема одновременной стабилизации двух объектов также поддается исчерпывающему исследованию. Однако уже для т = 3 методы решения проблемы неизвестны. Бо- лее того, существуют косвенные подтверждения отсутствия «простого» решения. Задача об одновременной стабилизации возникает и в матричном ва- рианте. Проблема 8. Даны т линейных систем в пространстве состояний: x = AiX + Btu, г = 1,...,т. (9.10) Существует ли один регулятор в форме обратной связц по состоянию и = Кх, (9.1D стабилизирующий все эти системы? Иначе говоря, существует ли матрица К такая, что все матрицы А’ = Ai + BiK, i = устойчивы? Совершенно аналогично формулируется задача для дискрет- ных систем; единственное отличие в том, что устойчивость понимается как устойчивость дискретных систем, т. е. матрицы Агс должны быть шу- ровские. Общий метод решения проблемы 8 неизвестен; ясно лишь, что он не может быть простым, поскольку трудная проблема 7 является здесь частным случаем. Простое достаточное условие существования решения
;" Одновременная стабилизация 251 (для случая Bi = В) основывается на идее квадратичной робастной ста- билизации и дается теоремой 8.3: если у системы линейных матричных неравенств AiX + XAj - 2ВВТ < 0, i = X > О, существует решение X, то обратная связь вида (9.11) с К = -втх~1 Одновременно стабилизирует все системы (9.10). Однако одновременная стабилизация может быть возможна и тогда, когда не существует общей квадратичной функции Ляпунова, так что приведенное решение является лишь достаточным. Еще одно достаточное условие разрешимости проблемы связано с по- нятием сверхустойчивости. Именно, если удается найти матрицу К, кото- рая делает все замкнутые системы сверхустойчивыми, то проблема од- новременной стабилизации имеет решение. В свою очередь, проверка одновременной сверхстабилизации возможна на основе линейного про- (раммирования (см. п. 4.5). Действительно, используя обозначение ст(А) нз п. 3.6 и замечая, что условие ст(А + В К) > 0 является системой ли- нейных неравенств относительно элементов К, мы заключаем, что если у системы линейных неравенств cr(A + BiK) >0. i = 1,..., m, Имеется решение К, то регулятор и = Кх одновременно стабилизирует все тп систем. Заметим, что проблема одновременной стабилизации является част- ным случаем задачи робастной стабилизации, упоминавшейся в главе 8: Ддя семейства полиномов P(s,q, к), зависящих от параметров q е Q и коэффициентов к регулятора, выяснить, (ется ли такой к*, что все полиномы P(s,q,k*), q&Q, гчивы. Задача одновременной стабилизации соответствует случаю, 1 множество Q конечно, а размерность вектора коэффициентов к не зичена заранее. Аналогичным образом более общая задача робастной ичной стабилизации относится к семейству матриц A(q) + B(q)K, q&Q. шема 8 соответствует случаю конечного множества Q. Для решения к задач можно применять численные методы, основанные на идеях «и возмущений (ср. выше (9.5)), однако они не дают гарантии отыс- 1.»-адия решения. Ьик
252 Глава 9. НЕРЕШЕННЫЕ Задачи 9.3. Линейно-квадратичная оптимизация: регуляторы заданной структуры и робастность В предыдущих параграфах речь шла о проблемах стабилизации; от- мечалось, что некоторые из них очень трудны. Предположим, однако, что стабилизация возможна, тогда естественно предъявить требования к качеству системы, т. е. поставить задачу оптимального управления. Будем для определенности говорить о простейшей задаче линейно-квадратичной оптимизации, рассмотренной в п. 5.1. Она была решена там в ситуации, когда описание системы задано полностью, а состояние системы предпо- лагается известным (тогда регулятор ищется в виде и = Кх). Обсудим возможный отход от каждого из этих предположений. Прежде всего, пусть доступен лишь выход системы у, а не ее состоя- ние х: х — Ах + Ви, у ~ Сх, и требуется минимизировать стандартный квадратичный показатель ка- чества ОО J = / [(Я®, ®) + (Su,u)Jdt. (9.12) о Решение такой задачи (часто называемое Н2 -оптимизацией) может быть получено с помощью динамической обратной связи вида и = Кх, где х — оценка вектора состояния х, получаемая с помощью наблюдателя (см. пп. 2.3, 4.3). Предположим, однако, что структура регулятора задана, например, ищется статическая обратная связь и = Ку. (9.13) Таким образом, нужно найти К в (9.13), которое стабилизирует систему и для которого показатель качества (9.12) принимает наименьшее значение: J —-> min. Мы уже знаем (п. 9.1, проблема 4), что даже вопрос о существовании ста- билизирующего К весьма сложен. Пусть, однако, выполнены какие-либо достаточные условия, гарантирующие наличие стабилизирующих регуля- торов вида (9.13) (или найден какой-либо стабилизирующий регулятор Ко). Тогда возникает проблема выбора оптимального по критерию (9.12) регулятора.
4’ 9.3- Линейно-квадратичная оптимизация 253 Проблема 9. Найти регулятор и = Ку, который стабилизирует систему х = Ах + Ви, у — Сх и минимизирует функционал (9.12). Покольку для системы х = Асх, Ас = А + ВКС, х(0) = хо, при устойчивой матрице Ас значение квадратичного функционала ОО J = j(Qx,x)dt, Q = R + CTK'TSKC о ' sl • .сп - равно (см. лемму П.14) J = xlX~xx0, A^X + XAC = -Q, (9.14) то для каждого стабилизирующего К можно найти значение J(K) из (9.14), решив уравнение Ляпунова для X. Далее можно вычислить гра- диент J(K): VJ(K) = 2(ВТХ + SKC)VCT, (9.15) гае V о — решение другого уравнения Ляпунова: VA^ +ACV = -x0Xq, и, в принципе, можно применить градиентный метод минимизации J(K). Однако такой путь не гарантирует отыскания решения. Во-первых, J(K) — невыпуклый по К функционал, и градиентный метод может при- вести к локальному (а не глобальному) минимуму. Во-вторых, множество стабилизирующих регуляторов также невыпукло, т.е. область определе- ния функционала J(K) невыпукла, поэтому градиентный метод следует модифицировать так, чтобы не выходить из указанной области. Послед- »ее, впрочем, нетрудно обеспечить — если J(K) монотонно убывает, то каждое новое полученное К автоматически является стабилизирующим. Выше мы рассматривали задачу оптимального управления для статиче- скою регулятора по выходу. Однако сходные проблемы возникают и при Вопытках решить линейно-квадратичную задачу для других регуляторов заданной структуры. Например, если в одномерной системе A(s)x — и с устойчивым полиномом Л(з) степени п выбирать регулятор в виде и = к\Х + к%х,
254 Глава 9. НЕРЕШЕННЫЕ ЗАДАЧИ то замкнутая система будет заведомо устойчива при малых к\,к% и ква- дратичный функционал вида Ж 2 dt о — можно выразить через коэффициенты полинома А(з) и регулятора к i (fci, &г). Однако и в этой постановке как зависимость J(fc), так и область определения J(k), вообще говоря, невыпуклы, и минимизация по к пред- ставляет трудности. Эти трудности можно обойти, если к G R2 (как в вышеприведенной задаче), но с ростом размерности к они существенно возрастают. В связи с задачей о линейно-квадратичном регуляторе рассмотрим близкую задачу оптимального управления, в которой показатель каче- ства т- Li -норма от состояния и управления. Проблема 10. Найти линейную обратную связь по состоянию и = Кх, которая стабилизирует систему х = Ах + Ви, х(0) = хо, и мини- мизирует функционал СО J — j^\x[ + a\u\jdt. о Такую задачу естественно называть задачей о линейно-линейном ре- гуляторе', она возникает, например, в некоторых постановках задачи Ц- оптимизации, но систематические методы ее решения неизвестны. Од- нако, как и во многих проблемах, рассмотренных выше, решение легко получить, заменив устойчивость на сверхустойчивость. Действительно, потребовав, чтобы матрица Ас = А + В К замкнутой системы была сверх- уСтойчивой, и воспользовавшись оценкой |x(t)| < e-cr^c^|xo| (см. (3.39)), получаем (1 + a||A'||iJ|xo| 7 а(А + В К) ' Теперь можно минимизировать по К правую часть этого неравенства, представляющую собой верхнюю границу для J. Эта задача, в свою оче- редь, сводится к параметрическому линейному программированию (см. п. 5.3.2): . 1 /, I, А mm — 1г+« л h | К,а О \ 7 о(А +ВК) а > 0.
9.4. Другие проблемы 255 9.4. Другие проблемы 11е нужно думать, что приведенными выше проблемами исчерпывается круг трудных и нерешенных задач линейной теории управления. Эта теория — живая и динамичная область исследований, и в ней постоянно возникают многие новые постановки задач и соответствующие проблемы. Более того, многие вопросы классической теории управления остаются открытыми. Прежде всего, большинство инженерных требований к качеству реаль- ных систем управления формулируются не в терминах современной тео- рии оптимального управления (линейно-квадратичная оптимизация, Ноо- теория и т. д., см. гл. 5), а в терминах простых свойств желаемой системы, таких как перерегулирование, время установления, степень устойчиво- сти, колебательность процесса и т.д. (некоторые из этих терминов были определены выше). Существует множество инженерных приемов синтеза регуляторов, позволяющих приближенно достигать желаемого качества проектируемой системы по этим показателям. Однако четкие аналитиче- ские методы решения таких задач (подобных, например, «аналитическим мегодам синтеза регуляторов», т. е. методам линейно-квадратичной опти- мизации), как правило, отсутствуют. Кроме того, мы в основном рассматривали задачи, в которых стави- лась лишь одна цель управления (стабилизация, робастная стабилизация, оптимизация по какому-либо критерию и т.д.). Однако обычно имеется ряд |ребований к качеству системы, которые должны быть выполнены (например, обеспечить при данной неопределенности заданный уровень критерия качества). Такие задачи часто весьма трудны, и их аналитиче- ское решение доступно лишь в немногих случаях. Наконец, сами линейные задачи управления — лишь маленький остро- вок в океане нелинейных проблем. Как правило, линейные модели явля- ются лишь аппроксимацией реальных задач, которым всегда свойственны отклонения от линейности. Задачи управления для нелинейных систем значительно труднее, чем в линейном случае, но мы не имеем возможно- сти даже затронуть эти темы.
ПРИЛОЖЕНИЕ 1. Определитель, характеристический полином, след Свойства определителя матриц из СпХп: 1. det АВ = det В А = det A det В. 2. Если А невырождена, то det А"1 = (det А)- . 3. det А = Ai... Ап, где А, — собственные значения А. 4. Для любых А € Cmxn, В е Cnxm справедливо det(/ + АВ) = det(7 + BA). 5. Для любых х, у € С" выполняется det (Z + ху*) = 14- у*х. 6. Объем эллипсоида £ = {х G R” : хтР~хх 1, Р > 0} равен Vol(£) = с„, det Р, гае Сп — объем единичного шара в R”. Характеристическим полиномом матрицы А € С”хп называется по- лином Р(Х) — det (А/— А) = Ап 4- ап— iАп . + ojА 4- ао, корни А, которого — собственные значения А. Важное свойство характеристического полинома матрицы А заключа- ется в том, что он является аннулирующим для А, т. е. имеет место Теорема П.1 (Кэли-Гамильтон). Матрица A G Rnx” удовлетво- ряет своему характеристическому уравнению: если Р(А) = det (А/ - А) = Ап 4- an_iAn * 4- • • 4- ajA 4- ао, то Р(А) = Ап+ ап.М"-1 4-. -. 4- а0/ = 0. Следствие. Видно, что An, а следовательно, и Ат при m > п выража- ется как линейная комбинация низших степеней Ak, k = 0,1,..., п - 1- Для данной матрицы существует много аннулирующих полиномов; тот из них, который имеет наинизшую степень р (и старший коэффициент, равный единице), называется минимальным полиномом. Соответственно, любая степень А представима как линейная комбинация I, А,..., А*'"1- Из других свойств характеристического полинома выделим 1. an-i = —tr А. 2. ао det А.. Свойства следа матриц из Спхп: 1. tr АВ = tr ВА.
ПРИЛОЖЕНИЕ 257 2. trX = Ai 4-... + Ап, где А, — собственные значения A. 3. tr(A 4- В) = tr A + trB. 2. Положительно-определенные матрицы Матрица А называется положительно- (неотрицательно-) определен- ной, если (Аа:,а:)>0 0) для всех х G Rn, х / 0. Это обозначается А > 0 (А > 0), а запись А > В означает, что А - В > 0. Без ограничения общности можно счишгь, что А = Ат (поскольку квадратичная форма (Ах, х) не меня- ется при замене А на симметричную матрицу (А + Ат)/2). Всюду в книге запись А > 0 (или А 0) подразумевает и равенство А = Ат. У положительно-определенных матриц все собственные значения веще- ственны и положительны. Некоторые свойства таких матриц: 1. Для А G Rnxm имеем АТА > 0, ААТ > 0, при этом если п = т и А невырождена, то АТА > 0, ААТ > 0. 2. Если А > 0 и В невырождена, то ВАВТ > 0, т. е. матричное неравенство можно умножать слева на В и справа на Вт. 3. Если А > В > О, то обратные матрицы существуют и 0 < А-1 < в-1. 4. Для матрицы А > 0 существует единственная матрица В > 0 такая, что В В = А; она называется квадратным корнем из А и обознача- ется В = А1/2. 3. Блочные матрицы и лемма Шура Лемма П.1 (Шур). Пусть А — ( & \ с Йпхп А~V D Е ) 6 и ’ где В G RmXm, Е & Rix', п = т +1. 1. Если Е невырождена, то А невырождена, если и только если Д = В - CE~1D невырождена, при этом det А = det Е det Д. 2. Если В = ВТ, D = CfT, Е = ЕТ, то А>0 <=> Е > 0, Д>0. Отметим, что в пункте 2 леммы нестрогое неравенство А > 0 при С 0, Е = /31 справедливо тогда и только тогда, когда /3 > 0, Д > 0. Б.Т, Поляк, П.С. Щербаков
258 ПРИЛОЖЕНИЕ 4. 5-теорема Заданы квадратичные формы fi(x) = (А{Х, х), i = 0,1,..., иг, где х е R”, А, = Aj е R"xn, и числа а0, сц,..., ат. Пусть неравенства fi(x)^ai, г = 1,...,тп, (П.1) влекут неравенство /о(ж) «о, (П.2) т.е. для всякого х, удовлетворяющего (П.1), выполняется и (П.2). Нас ин- тересует соотношение между матрицами At и числами а», г = 0,1,..., т. Теорема П.2 (S-теорема). Если найдутся А; > 0, г — 1,... ,т, та- кие, что т т ^0 *0 * (ПЗ) i=l i=l то из (П.1) следует (П.2). Обратно, если из (ПЛ) следует (П.2) и выполняется любое из условий а) т = 1; б) т = 2, п > 3 и существуют хй е R" ДьДг такие, что < «1, /2(я°) < «2, Р1А1 + р2А2 > О, то найдутся А, > 0, г = 1,... ,т, такие, что справедливо (П.З). Нетривиальной частью этого утверждения является, конечно, необхо- димость условия (П.З) при т = 1,2. Можно показать, что при т > 2 аналогичный результат не имеет места. Частным случаем S-теоремы является Лемма П.2 (Финслер). Пусть (Aqx, х) > 0 для всех х е Rn, х / О, таких, что (Aix,x) = 0 для некоторой Ai. Тогда найдется такое 7 € Я что Ао + 7Л1 > 0. 5. Нормы матриц Рассматриваются квадратные матрицы А = (а^) G Спх". Функция || • || : СпХ” —» R называется матричной нормой, если для любых А, В б Спхп выполнены следующие аксиомы: 1. ||Л||>0. 2. ||Л|| = 0 <=> А = 0.
ПРИЛОЖЕНИЕ 259 3. ||аА|| = |of| |(Л|| доя любого a G С. 4. ||А + ВК||А|| + ||В||. 5. ||АВ\\ ||А|| • ||В||. Два полезных свойства, вытекающих непосредственно из аксиомы 5: 1) ||/|| 1 и 2) если А обратима, то ||А|| • ||А~11| 1. Наиболее употребимы следующие явно задаваемые нормы: — спектральная норма: IIА||2 = max Аг1/2(А*А); — строчная норма: mih = iavi J=1 — столбцовая норма: п И1оо = та* (£>, «=1 — фробениусоеа норма: между ними имеются следующие соотношения: 1 у/п :1И||1 г НАЦг г $ v'nIIAIIi; _1_ у/п' |-^||оо ; И112 * ^^ll-^llooi 1 у/п ||A||f ; иц2 * % imilf*; 1 п |>М|оо « ; ИИ1 < % пЦАЦоо; 1 у/п I|a||f ; mill * $ a/^MIIf; 1 у/п Mik г miloo s $ -у/пЦАЦр, и эти оценки достижимы (т. е., например, max = МР- = у/п). AytO ||А||2 ||1|12 9*
260 ПРИЛОЖЕНИЕ Если в С”Хп ввести скалярное произведение по правилу (А, В) = tr А*В, то оно порождает фробениусову матричную норму: Mllr = (Л,А)1/2 = (trA*A)1/2 = (22 Ы2)^ i,J=l в частности, при А — Ат е Rnxn будет ||АЦр- = tr li/2A2. Пусть задана векторная норма | • |; функция ||All = max = max\Ax\ = max\Ax\ . |i|5>so |ar| |®|^i |x|=i удовлетворяет всем аксиомам и поэтому является матричной нормой. Она называется подчиненной данной векторной норме | | (индуцированной нормой). Иногда используют термин операторная норма (в частности, для таких норм ||/|| = 1). Матричные нормы || • Щ, || ||2, || ||оо подчинены векторным нормам | • |оо» I • |г» I • |г соответственно1, т.е. ЦАЦя = max |Ах|2, ||A||i = max (Ailoo, ||АЦ^ = max |Ax|i, |х|2 = 1 = l a || • || f не является подчиненной нормой. Матричная норма || • || называется согласованной с векторной нормой | • |, если |Аа:| С ||А|| |х|; это свойство удобно при оценивании сходимости векторных последова- тельностей. Подчиненные нормы согласованы с соответствующими (инду- цирующими их) векторными нормами и поэтому наиболее употребимы. Величина р(А) = max|Ai(A)| г называется спектральным радиусом матрицы А. Для любой матричной нормы справедливо неравенство р(А) < ||А||. Хотя спектральный радиус и не является матричной нормой, он оказывается точной нижней гранью значений всевозможных матричных норм: Лемма ПЗ. Для любой А е Спхп и любого е > 0 существует норма || • ||, удовлетворяющая р(А) < ||А|| < р(А) + е. *В «матричной» литературе строчную матричную норму обычно обозначают через )| • ||<» > а столбцовую— через ||-||i (втаких обозначениях Ц-Цоо индуцируется векторной оо-нормой, а || • ||1 — векторной 1-нормой). Мы же следуем обозначениям, принятым в li -оптимизации (п. 5.3), гае 1-норма оператора определяется через оо-нормы сигналов.
ПРИЛОЖЕНИЕ 261 Следующая лемма характеризует асимптотическое поведение степе- ней Ак. Лемма П.4. Для любой матрицы А € Спхп и любой нормы || • || спра- ведливо р(А) = lim ||Afc||!/fc. к—*оо 6. Матричные разложения 6.1. Приведение к диагональной форме Лемма П.5. Если все собственные значения Ai матрицы А 6 Rnxn различны, то она приводится преобразованием подобия к диагональному виду, т.е. найдется невырожденная матрица Т € СпХ” такая, что T~1AT = A = diag(Ai,...,An). При этом Ai — собственные значения А, Т — матрица, столбцы xi которой являются правыми собственными векторами A: Axi = AtXi, а строки yi матрицы Т~1 являются левыми собственными векторами А; у*А = Aiy*, i = 1,..., п*. В действительности этот результат верен и для некоторых матриц с кратными собственными значениями (именно для так называемых матриц простой структуры, все п собственных векторов которых линейно не- зависимы). В частности, для симметричных матриц верно гораздо более сильное утверждение. Лемма П.6. Если А = Ат е Rnxn, то она приводится к диагональ- ной форме вещественным ортогональным преобразованием подобия, т. е. найдется такая U € Rnxn, что U'r — U-1 и UTAU = A = diag(Ai,...,An), и все собственные значения Аг вещественны. 6.2. Приведение к жордановой форме Лемма П.7. Для любой матрицы А € Спхп существует невырожден- ная матрица Т € С”хп такая, что T~lAT = J, Отметим, что левые собственные векторы иногда удобнее определять как правые соб- ственные векторы матрицы А*.
262 ПРИЛОЖЕНИЕ где J — жорданова форма матрицы А: /Xi 1 J — diag (Ji, .. •, «Лп)» Ji — ТП £ QTliXni V Здесь Х, — собственные значения A, a J, — жордановы блоки; при этом одному собственному значению может соответствовать, вообще го- воря, больше одного блока и размерности этих блоков могут быть различны. Например, в качестве J может возникнуть матрица 1 А > она имеет одно собственное значение А кратности 6, которому соответ- ствуют три жордановых блока размерностей 1, 2 и 3. 63. Приведение к фробениусовой форме Если для матрицы А € Спхп найдется такой вектор b е Сп, что век- торы Ь, АЬ, А”-16линейно независимы, то А называется циклической матрицей (а вектор b — ее циклическим генератором). Говорят, что матрица А € Спхп приведена к фробениусовой форме, если она имеет вид 0 1 .. 0 0 0 0 А = Г , (П.4) 1 1 —ао -О1 • —an_i где ао,... ,an-i G С. Нетрудно проверить, что характеристический по- лином А равен Р(А) = А” + ап-гА”-1 + ... + агА + а0. (П.5) Иногда матрицу вида (П.4) называют матрицей Фробениуса для полинома (П.5).
ПРИЛОЖЕНИЕ 263 Лемма П.8. Матрица может быть приведена к фробениусовой форме невырожденным преобразованием подобия с матрицей Т 6 Спхп тогда и только тогда, когда она циклично. Матрица является циклической тогда и только тоща, когда каждому ее собственному значению соответствует ровно один жорданов блок; эквива- лентно, когда ее характеристический полином совпадает с минимальным. 6.4. Приведение к вещественной блочно-диагональной форме Отметим, что в леммах П.5 и П.7 как матрица Т, так и матрицы А и ./ могут быть комплексными, даже если А вещественна. Более того, эти матрицы заведомо комплексные, если у А есть комплексные собственные значения. Оставаться в области вещественных чисел позволяет следую- щий результат. Лемма П.9. Пусть собственные значения X?k-i = «к + jvk, X2k = Uk - jvk, Vk / 0, k = 1,... ,p, Xi G R, i = 2p + 1,..., n, матрицы A G R" *n различны. Тогда существует невырожденная матрица Т G Rnxn такая, что Т~1АТ = А = diag(Ji,..., Jp, A2p+i,..., A„), (П.6) где матрицы Jk G R2x2, к = 1,... ,p, имеют вид j = ( Чк Vk \ k \ -Vk Uk J ' При этом говорят, что А имеет вещественную блочно-диагональную форму. Это есть частный случай приведения произвольной матрицы к веще- ственной жордановой форме с помощью преобразования подобия с ве- щественной матрицей Т. 6.5. Сингулярное разложение Напомним, что унитарной матрицей называется матрица V G Спхп, удовлетворяющая условию V*V = I. В вещественном случае (V G Rnxn) для таких матриц VTV = I и они называются ортогональными. Лемма П.10. Пусть A G Cmxn. Тогда найдутся унитарные матрицы U е Cmxm и V G Спхп такие, что U*AV = А, А = "q1 q , Al = diag(aj,... ,стр), р = min{т,п}. (П.7)
264 ПРИЛОЖЕНИЕ Представление (П.7) называется сингулярным разложением матрицы А. Здесь 0 < ai Стр — сингулярные числа А, т.е. ст, = ст<(А) = aV2(A*A), где Ai — собственные значения неотрицательно-определенной матрицы А* А. Если при этом A е R’"x", то U и V — ортогональные матрицы. Наконец, если т = п, то А = diag (стх,..., <тп). Если обозначить (транспонированные) строки матриц U и V через Ui,Vi, то из (П.7) следует A*Avi = АА*щ = сг^щ, т.е. сг2 — собственные Числа матриц А*А и АА*, a Vi,ut — соответ- ствующие собственные векторы. В частности, для вещественных А будет АТА О, ААТ > 0, a V{,Ui — вещественные взаимно ортогональные собственные векторы. Наименьшее и наибольшее сингулярные числа выражаются через спек- тральную норму матрицы А е Спх”: сгп(А) — max |Аа:| = ||А||, cri(A) = min |Аж| = 1/ЦА-11|. |х|=1 |х|=1 Второе равенство справедливо лишь для невырожденных матриц; в выро- жденном случае ai = 0. 6.6. Каноническая управляемая форма. Управляемость Рассмотрим систему X = Ах + bu, Ае Rnxn, be Rn, ueR1, и пусть P(s) = sn + an-isn 1 4-... + ao — характеристический полином матрицы A. Лемма П.11. Если векторы b, АЬ, ..., Ап~1Ь линейно независимы (т. е. пара (А, Ь) управляема), то линейной заменой переменных х = Тх, Т-1 = (А^Ь ... Ab b 02 О1 О On—1 1 / (П.9)
ПРИЛОЖЕНИЕ 265 система (П.8) приводится к канонической управляемой форме х — Ах + Ьи, у = сгх. А~ТАТ~1, Ъ = ТЬ, с1 — стТ~г, (П.10) (П.11) При этом матрица А преобразованием подобия приведена к фробени- усовой форме. Теорема П.3 (управляемость). Следующие условия эквивалентны: 1. Система х = Ах + Ви, х € Rn, и € Rm, управляема. 2. Грамиан управляемости t Wc(t) = JeATBBTeATTdr о является положительно-определенной матрицей для любого t > 0. 3. Матрица управляемости U = [В АВ ... Ап~1В] имеет ранг п. 4. Матрица Хаутуса [А — XI В] имеет ранг п для любого А 6 С. 5. Для любого левого собственного вектора v матрицы А (т. е. нену- левого вектора v 6 С”, удовлетворяющего v* А = Xv* при некото- ром А € С) справедливо и* В /0. 6. Выбором матрицы К € RmXn можно добиться произвольного рас- положения собственных значений матрицы А + В К. 7. Функции от матриц 7.1. Функции от матричного ар1умента Для функции f (s) комплексной переменной s определим соответству- ющую функцию от матричного аргумента А е Rnxn. Если p(s) — полином степени т с вещественными коэффициентами p(s) — amsm + ... + ais + ао,
266 ПРИЛОЖЕНИЕ то положим р(А) = атАт + ... + aj Ai + clqI. Заметим, что согласно следствию из теоремы Кэли-Гамильтона для любой п х п матрицы А и любого полинома р\ степени п и выше существует полином р2 степени п — 1 такой, что pi(A) = Рг(А). Для числовой функции /(з) общего вида (не полинома) имеется не- сколько способов определения соответствующей функции от матрицы. Дадим лишь два наиболее употребимых; оба они представляют /(А) в виде полинома от А. Первый способ основан на теореме Кэли-Гамильтона и определяет /(А) как значение интерполяционного полинома от матрицы А. Предпо- ложим, что функция / : С —> С определена на спектре матрицы А, т. е. она аналитична в собственных значениях А. Пусть, как и раньше, А,, г = 1,..., т, — все различные собственные значения матрицы А, а щ, i = 1,. ,.,т, — их кратности. Для функции f(s) построим полином g(s) степени п — 1 = 7о + 718 + ... + 7n_1sn-1, коэффициенты которого найдем из следующих условий: 5(М(А1) =/(fc)(Ai), к = 0,1... ,щ - 1, i = l,...,m, где правые части равенств определены в силу аналитичности /(з) в точ- ках Аг. Эти условия представляют собой систему п линейных уравне- ний относительно п неизвестных 7/, можно показать, что матрица этой системы невырождена, так что всегда существует единственное реше- ние 7o,...,7n-i- Таким образом, построенный интерполяционный по- лином д(з) и функция /(з) совпадают на спектре матрицы А, т.е. в точках А, совпадают их значения и значения их производных вплоть до (щ — 1)-й. Определим теперь /(А)=д(А). Итак, функция от матрицы определяется как значение конечного степен- ного ряда от матрицы. Отметим, что /(А) можно было бы определять исходя не из характеристического полинома, а из минимального, степень которого ниже, однако соответствующие интерполяционные условия (по- рядки производных) сформулировать сложнее. Впрочем, оба определения приводят к одному результату. Иногда бывает удобно определять функцию от матрицы в виде беско- нечного степенного ряда. Так, пусть /(з) аналитична в з = во с радиусом сходимости г = г(зо); тогда для всех з из круга сходимости, т.е. для |з — зо| < г, выполнено ОО f(s) = ^2ak(s-s0)k, k-0
ПРИЛОЖЕНИЕ 267 причем ряд сходится аболютно. Пусть все собственные значения А, ма- трицы А лежат в круге сходимости: |Aj — з0| < г; тогда определим ОО /(A) = £>fc(A-So/)fe, fc=O причем сходимость матричного ряда — абсолютная (в смысле матричной нормы). В частности, при so = О ОО }(А}^акАк. fc=O В приложениях часто г = оо, т.е. /(з) аналитична на всей плоскости и /(А) определена для всех А. Такое представление функций от матриц часто предпочтительнее с вычислительной точки зрения (в практических задачах соответствующие степенные матричные ряды, как правило, сходятся быстро); кроме того, оно позволяет пользоваться многими удобными свойствами матричных функций. Разумеется, значения /(А), полученные двумя описанными способами, совпадают (для тех матриц, на которых оба эти способа определены). 7.2. Матричная экспонента При анализе дифференциальных уравнений наиболее часто встреча- ющейся матричной функцией является экспонента. Поскольку f (з) = е® аналитична на всей комплексной плоскости, то бывает удобнее пользо- ваться определением матричной экспоненты в виде ряда: еА 1 л2 1 ,3 2!А +3!Л +’" Приведем несколько свойств этой функции. оо 1. е° = У =. I. fc! fc=O 2. Если А = diag (си,..., ап), то еА = diag (eai,..., e“n). В частно- сти, если А = al, то еА = eaI. 3. Если матрицы А и В коммутируют, то елев = еА+в (обратное, вообще говоря, неверно). С другой стороны, если е^л+в^ = eAteBt для всех t е (ti, t2)» то АВ = В А. 4. еАе~А = еА~А = е° = I вследствие коммутативности. Поэтому, в частности, (ел)“1 2 3 4 = е~А для любой (вырожденной или нет) ма- J трицы А.
268 ПРИЛОЖЕНИЕ 5. AeAt —eAtA вследствие коммутативности; 6. 1еА* = Лел‘. at 7. Если А обратима, то jeAtdt = А~лем + С, где С — некото- t рая постоянная матрица. В частности, jeArdr = А-1(ем - и о ОО eArdr = - Л-1 для устойчивых А. о 8. Решение полиномиальных и родственных уравнений Пусть полиномы а(з),6(з) — взаимно просты (т.е. не имеют общих корней). Теорема П.4 (теорема Безу). Полиномиальное уравнение ax + by=l (П.12) (где неизвестные — полиномы ж(з),у(з)) всегда имеет решение х°, у° такое, что dega;0 deg& — 1, degy0 dega — 1, причем общее решение (П.12) имеет вид х = х° + Ьг, у = у° — аг, (ПЛЗ) где r(s) — произвольный полином. Решение минимальной степени х°, у0 можно найти с помощью любого из следующих алгоритмов. Алгоритм 1 (решение системы линейных уравнений). Возьмем x(s) = Х0 + ®1S + ... + xNsN, y(s) = Уо + У18 + ... + yM8M, где N = degb — 1, M = dega — 1. Тогда, приравнивая в (П.12) ко- эффициенты полиномов ах + by и 1 от свободного члена до степени N + М + 1, получим систему N + М + 2 линейных уравнений относи- тельно N + М + 2 переменных • ,xN,yo,yi, • • • ,ум. Эта система невырождена в силу взаимной простоты а и Ь. Алгоритм 2 (использование корней а и Ь). Пусть нам известны корни Xi полинома a(s) и корни рг полинома Ь(з). Рассматривая уравне- ние (П.12) в точке з = Xi, получаем b(Xi)y(Xi) = 1, i = l,...,dega.
Относительно коэффициентов уо,..., ум это дает нам М+1 уравнение с JVf + 1 переменной. Аналогично, подставляя в (П.12), получаем N + 1 уравнение относительно переменных хо,... ,xN. . Алгоритм 3 (Евклида). Используем алгоритм Евклида для нахождения наибольшего общего делителя полиномов a(s) и Ь(з) — он полностью совпадает с таким же алгоритмом для целых чисел. В силу предположе- ния наибольший общий делитель равен единице. Зная получающиеся в процессе применения алгоритма частные и остатки, легко восстановить Л «А Близкие результаты можно получить, когда уравнение (П. 12) отно- сится не к полиномам, а к элементам какого-либо иного кольца. В запад- ной литературе такое уравнение называют равенством Безу; в отечествен- ной литературе часто используют термин диофантово уравнение. В част- ности, важным для теории управления является случай, когда а, Ь,х,у — устойчивые правильные дробно-рациональные функции (скалярные или матричные), т.е. элементы пространства RHoo. При этом, однако, за- метно более трудно записать условие взаимной простоты а и Ь, и часто оно формулируется просто как разрешимость в RHoo уравнения (П.12). В одномерном случае имеется конструктивное определение: скалярные функции a(s) и b(s) из RHoo называются взаимно простыми, если они не имеют общих неустойчивых нулей и одновременно не обращаются в нуль на бесконечности.1 Отсюда, в частности, следует, что если функции а и Ь взаимно просты, то по крайней мере у одной из них степень числителя равна степени знаменателя. Нетрудно показать, что эти условия необ- ходимы и достаточны для разрешимости в RHoo уравнения (П.12), т.е. имеет место следующий аналог теоремы П.4. Лемма П.12. Пусть а и b — взаимно простые скалярные функции из Rll.a, тогда уравнение (П.12) имеет решение х°, у° е RHoo, а общее решение имеет вид (П.13), где г(з) — произвольная функция из RHoo- Заметим, что здесь, в отличие от теоремы П.4, не говорится о решении минимальной степени. Что касается многомерных функций А, В е RHoo, то для них уравнение (П. 12) приобретает вид АХ + BY = I и ею разрешимость в ЯЯоо берется за определение взаимной простоты А и В. *В литературе также используется следующее эквивалентное определение взаимной про- стоты. Функции а, Ь е RHoo называются взаимно простыми, если любой общий дели- тель а и Ь обратим в ЯЯоо, т.е. из h € RHoo, ah-1 е RHoo, bh~y € RHoo следует Ь-1 e RHoo- Оно, однако, представляется менее удобным.
270 ПРИЛОЖЕНИЯ 9. Матричные уравнения и неравенства 9.1. Уравнение Ляпунова Лемма ПЛЗ (непрерывный случай). Матричное уравнение Ляпунова АР + РАТ =—Q (П.14) при Q = QT имеет единственное решение Р = РТ тогда и только то- гда, когда Re (А, + А7) /0 для всех собственных значений Хг матрицы А. При этом ОО Р = j eAtQeATtdt > О (П.15) о тогда и только тогда, когда А гурвицева и либо 1) Q > 0 (если Q > 0. то существует положительно-полуопределен- ное решение Р > 0), либо 2) Q = ВВТ и пара (Л, В) управляема. Отсюда, в частности, следует, что если уравнение (П. 14) с Q > 0 имеет решение Р > 0, то А устойчива; мы часто пользуемся этим выводом. Поскольку решение системы х = Ах, ге(О) = хо, есть x(t) = eAtxo, то получаем следствие: Лемма П.14 (значение квадратичного функционала). Пусть x(t) — решение системы х = Ах, х(0) — хо, с устойчивой матрицей A, a Q > 0 — некоторая положительно-определенная матрица. Тогда значение ОО функционала J = j xTQxdt равно х$ Wxq, где W — решение уравнения о Ляпунова ATIV + WА = — Q. Лемма П.15 (неравенство Ляпунова). Пусть А гурвицева, пара (А, В) управляема и Р- > 0 — решение уравнения Ляпунова (П.14) с Q = ВГВ. Тогда матричное неравенство Ляпунова АР + РАТ ^-ВВГ (П.16) разрешимо, причем для любого решения Р неравенства (П. 16) справед- ливо Р Р- (т. е. Р- — минимальное решение (П.16)). Получаем следствие: Лемма П.16. При сделанных предположениях для любой матрицы С решение задачи mmtr(CPCT)
ПРИЛОЖЕНИЕ 271 при ограничении АР + РАТ + ВВ'Г достигается на решении Р- уравнения Ляпунова АР + ВАТ + ВВТ = 0. Иногда представляет интерес неравенство Ляпунова с неотрицатель- но-определенной правой частью. Лемма П.17. Если Re (А, + Aj) /0 для всех собственных значений Xi матрицы А и пара (А, В) управляема, то неравенство Ляпунова АР + РАТ ВВТ имеет решение Р > 0. Если в неравенстве Ляпунова не накладывать требования к симме- трии решения, то всегда некоторое решение может быть найдено в явной форме. Лемма П.18. Если решение матричного неравенства YTBT + BY существует, то оно достигается при У = —уВТ, т е решение суще- ствует, если при некотором 7 > 0 выполняется —уВВТ < Q. Лемма П.19 (уравнение Ляпунова, дискретный случай). Дискретное матричное уравнение Ляпунова АРА? — Р =—Q при Q = QT имеет единственное симметричное решение Р = РТ тогда и только тогда, когда A,Aj / 1 для всех собственных значений А. При этом ОО P = ^AkQ(AT)k >0 fc=0 тогда и только тогда, когда А — шуровская матрица (| А, | < 1) и либо 1) Q > 0 (при Q > 0 будет В > 0), либо 2) Q = ВВТ и пара (А, В) управляема. 9.2. Уравнение Риккати Теорема П.5 (дифференциальное уравнение Риккати). Если пара (А, В) управляема, а матрицы R > 0, S > 0, то решение дифферен- циального уравнения Риккати Р + АТР + РА —PBS~1BTPR — 0, Р(Т) = 0
272 ПРИЛОЖЕНИЕ обладает следующими свойствами: 1) при любом Т > 0 оно существует и единственно для всех t е [О, Т\; 2) P(t) > 0 для любых 0 t Т; 3) если PT(t) — решение уравнения при заданном Т, то Рт2(£) < PTl (t) при Т2>Т}; 4) при Т —» оо будет Pr(t) —* Рх» где (не зависящая от Т и t) матрица Роо является единственным положительно-определенным решением алгебраического матричного уравнения Риккати АТР4 РА-PBS-1BTP + R = 0. (П.17) Алгебраическое уравнение Риккати (П.17) часто возникает в несколь- ко иной форме АТР + РА - РВВТР + СТС = 0. (П.18) Лемма П.20. Если пара (А, В) управляема, а пара (А, С) наблюда- ема, то уравнение (П.18) имеет единственное решение Р > 0, причем матрица А — ВВТР устойчива. В уравнениях (П.17), (П.18) перед квадратичным членом стоит знак минус, а перед свободным членом — плюс. Однако можно изменить знаки. Лемма П.21. В предположениях теоремы П.5 уравнение QAT + AQ + QRQ - BS~1BT = 0 (П.19) имеет единственное решение Q > 0, причем Q — Р~~\ где Р > 0 — решение (П.17). Действительно, достаточно умножить (П.17) слева и справа на Q = Р-1. Уравнения (П.17) и (П.19) называются двойственными. Можно рассмотреть и уравнение Риккати с отрицательным коэффи- циентом при свободном члене АТР + РА-РВВТР-уСТС = 0. (П.20) Лемма П.22. В предположениях леммы П.20 уравнение (П.20) имеет решение Р > 0 тогда и только тогда, когда 7< ||^\ц , G(s) = C(sI — А)"1 В. (П.21) IIPa^/IIoo Имеется связь между решениями уравнения и неравенства Риккати; следующая лемма аналогична лемме П.15.
ПРИЛОЖЕНИЕ 273 Лемма П.23 (неравенство Риккати). 1. Пусть Я > О, пара (A, R) управляема и матричное неравенство Риккати АТР + РА + PRP + L О (П.22) имеет решение. Тогда уравнение Риккати АТР + РА + PRP + L = О (П.23) имеет решение Р~, причем Р~ — минимальное решение (П.22), т. е. для любого решения Р неравенства (П.22) справедливо Р Р— Кроме того, матрица А + RP- устойчива. 2. Пусть R 0, пара (A, R) управляема и матричное неравенство Риккати Ат Р + РА + PRP + L > О (П.24) имеет решение. Тогда уравнение Риккати (П.23) имеет решение Р+, при- чем Р+ — максимальное решение (П.24), т. е. для любого решения Р не- равенства (П.24) справедливо Р Р+. Кроме того, матрица А + RP+ устойчива. 10. Теория возмущений 10.1. Непрерывная зависимость корней полинома от коэффициентов Пусть P(s,q) — полином n-й степени, коэффициенты которого не- прерывно зависят от параметров q 6 P(s,q) = a0(q) + ai(g)s + ... + an(q)sn, причем an(0) / 0. Обозначим его корни через Si(q), i = 1,... ,n. Теорема П.6. Для всякого е > 0 найдется 6 > 0 такое, что при |<?| < 5 корни Si(q) полинома P(s,q) можно перенумеровать так, чтобы |вг(?) - s,(0)|< £, i = l,...,n. Этой теореме можно придать следующую форму для случая одномер- ного параметра q G [0, 1]. Лемма П.24. Пусть an(q) ± 0 для всех q € [0, 1]. Тогда корни s2(q) можно так упорядочить, что Si(q) — непрерывная функция на [0, 1] для всех г = 1,... . ,п. 10. Б.Т. Поляк, П.С. Щербаков
274 ПРИЛОЖЕНИЕ Часто представляет интерес более конструктивная оценка близости корней по близости коэффициентов. Типичным является следующий ре- зультат об относительной погрешности. Теорема П.7. Пусть е > 0, е < (1/4п)п и |аДд) — аД0)| е|а»(0)|, i = 1,... ,п. Тогда корни Si(q) можно перенумеровать так, что < 8nIV". Si(0) Этот результат выглядит не очень обнадеживающим — во-первых, он справедлив лишь для очень малых в, во-вторых, близость корней оказы- вается порядка е1/п, т. е. медленно убывает как функция от в. Однако в общем случае кратных корней лучших оценок, вообще говоря, получить нельзя. Ситуация значительно упрощается лишь в случае простых корней, см. ниже. 10.2. Непрерывная зависимость собственных значений матрицы от ее элементов Пусть А(д) — матрица из Спхп, элементы а,Дд) которой непрерывно зависят от параметров q € й£. Обозначим через АДО), г = 1,...,п, собственные значения матрицы Л(0). Теорема П.8. Для всякого е > 0 найдется 6 > 0 такое, что при |q| S собственные значения АДд) матрицы A(q) можно упорядочить так, что |АДд) ~ А,(0)| < е, i - 1, • • •, п. Близость АДд) к АДО) в общем случае можно оценить. Приведем типичный результат. Теорема П.9. Пусть А = ((ау)), |ац| <1, В = |&у| С е, г, j = 1,..., п, и пусть А, — собственные значения А, а А, — собственные значения А + В. Тогда последние можно упорядочить так, чтобы |Aj — АД < 2(п + 1)2(п2е)Уп, г = 1,...,п. Вновь эта оценка показывает очень сильное влияние возмущения ма- трицы на ее собственные значения (порядка в1/”), однако в общем случае от множителя е1/” избавиться нельзя, как показывает следующий пример:
ПРИЛОЖЕНИЕ 275 при 1 0 е \ А В = 0 1 \0 .... о/ к-1 . . к - I cos----тг 4- з sin-% п п к = 1,... , п. получаем Хк = Х 10.3. Линейная теория возмущений Для случая простых (не кратных) корней и собственных значений предыдущие оценки могут быть существенно уточнены. Лемма П.25. Пусть Si — простой корень полинома Ро(з) й Pi(s) — некоторый полином. Тогда полином P(s,q) = P0(s) +gPi(s), qSR1, имеет корень Si(q), удовлетворяющий условию P^Si) SiW = Si - + 0{q). Аналогичный результат для матриц формулируется следующим обра- зом. Лемма П.26. Пусть А — простое собственное значение матрицы А е Спхп, а х и у — соответствующие ему левый и правый собственные векторы: Ах — Ад, у* А = Ху*. Тогда для матрицы A(q) = А + qB найдется собственное значение A(q) такое, что А(д) = А + <?^^+о(д). У х 10.4. Круги Гершгорина Теорема П.10 (Гершгорин). Любое собственное значение матрицы А = ((aij)) е Спхп лежит в одном из кругов с центрами в ац и радиу- сами lavl-
276 ПРИЛОЖЕНИЕ Следствие. Пусть все собственные значения Xi матрицы A G СпХп различны, Т~гАТ = А = diag (Ai,..., Ап) и |ЬУ| 1, i, j, — 1,... ,п, для элементов матрицы В G Спхп. Тоша для собственных значений А,(е) матрицы А + еВ при достаточно малом е справедливы оценки А,(е)-Л,| 4 pi| Si = ViXi, где Xi — г-й столбец матрицы T, a yi — г-й столбец матрицы Т-1, причем они нормированы условиями |оД = = 1, г = 1,... ,п. Можно получить и более точный результат (ср. с леммой П.26). Лемма П.27. В условиях леммы П.26 АДе) - Xi - y*xt 2n2(n — l)s2 -----:—i----r max tt , ।. . |Aj Aj | I Si I 11. Одна теорема двойственности Пусть A G Rmxn, Ь G Rn, х G Rn, у 6 Rm, р, q G R — сопряженные числа, т.е. 1/р + 1/q =1, l^p^oo, l^g^oo, a |rr|p, \y\q — n / \ i/p соответствующие lp и lq нормы векторов, т.е. \x\p = £д |ж;|р) , |г/|9 = Теорема П.11. Рассмотрим прямую задачу выпуклого программиро- вания а = min LAarl,, Ьтг=1 1 W и двойственную к ней 0 = Ж- А™у~Ъ : Тогда их оптимальные значения а и /3 связаны соотношением а = 1//3. Если взять р = 1, q = оо, b = (1, 0,..., 0)т, первый столбец ма- трицы А обозначить через с G Rm, вектор (ж2, хз,... ,хп)Т вновь обо- значить через х, а оставшуюся после удаления первого столбца часть матрицы А — вновь через А, то получим Лемма П.28. . .Л 1 minAr + ch = ---------———— х „ mU2 Ыоо Хт|/=0, сту=1
БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ На русском языке в 1955-1985 годы было издано большое число учеб- ников и монографий, достаточно полно отражавших состояние теории управления в тот период. Так, много учебников посвящено частотному подходу к линейным системам [17,24,39,53,67,82]; оригинальные работы собраны в сборнике [123]. Описание в пространстве состояний и задачи оптимального управления освещены в работах [2,3,5,23,24,30,34, 36,38, 40,45,46,70,76,77]. Большое внимание уделялось управлению дискрет- ными системами [18,22,28,31,41,73,78,81]. В целом основные резуль- таты теории управления на начало 1980-х годов отражены в справочнике под редакцией А. А. Красовского [72] и в фундаментальном учебнике А. А. Первозванского [58]. За последние годы издано относительно не- много учебной и научной литературы на русском языке [6-8,29,55]; как правило, эти книга посвящены отдельным проблемам теории. Совершенно иная ситуация с публикациями на Западе. Помимо стан- дартных учебников по линейным системам, которые выходят все но- выми изданиями [108,132,139], появляются публикации, которые отра- жают прогресс в развитии науки об управлении за последние десятиле- тия. Одним из первых стал учебник [144]; кроме того, издано много книг, которые можно рассматривать и как учебники, и как моногра- фии [105,117,120,125,127,146,147,166,183]. Наиболее интересные статьи из журналов, связанные со становлением новых направлений, переизданы в сборниках [162,163]. Выпущена энциклопедия по управлению [172] и справочник [174], содержащий обзорные статьи по всем основным разде- лам теории и практики управления. К главе 1 Содержание пп.1.1, 1.2 и 1.4 достаточно стандартное. Язык переда- точных функций стал общеупотребительным в 1930-х годах, после работ X. Боде и Г. Найквиста. Описание в пространстве состояний широко распространилось в конце 1950-х годов, под влиянием пионерских работ Л. С. Понтрягина [66] и Р. Калмана [33,133]. Взгляд на линейную си- стему как на линейный оператор, преобразующий пространство входных сигналов в пространство выходных сигналов, стал основным значительно позже, в 1970-е годы, главным образом благодаря трудам М. Ввдьяса-
278 БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ тара [114,176]. До середины прошлого века исследовались в основном одномерные (односвязные) системы, интерес к многомерным (многосвяз- ным) системам возник позже, причем основным аппаратом для их анализа и синтеза стало описание в пространстве состояний. Техника многомер- ных (матричных) передаточных функций для таких систем получила зна- чительный импульс благодаря исследованиям Г. Розенброка [165], позже эта техника стала доминирующей. Первые работы по дискретным им- пульсным системам принадлежат Я. 3. Цыпкину [81] и Э. Джури [28]. Сейчас параллельное исследование всех основных подходов теории ли- нейных систем как для непрерывного, так и для дискретного случая явля- ется общепринятым. К главе 2 Идея программного управления появилась сравнительно поздно, в 1950-е годы, в связи с интересом к задачам космонавтики и управления ле- тательными аппаратами. До этого доминировал подход, основывающийся на идеях обратной связи, наиболее естественный в задачах электротех- ники и радиотехники, исследовавшихся в то время. Понятия управляемости и наблюдаемости введены Калманом [33]; те- перь они стали ключевыми в теории линейных систем. К главе 3 Условия устойчивости линейных дискретных и непрерывных систем, заданных в пространстве состояний, известны давно, см., например, [13, 44, ПО]; их основы заложил еще А. М. Ляпунов [50] в работе 1892 г. Мы приводим несколько различных доказательств, так как используемая при этом техника очень важна и применяется в гораздо более общих ситуациях. Графический критерий устойчивости полиномов в форме условия 2 теоремы 3.5 предложен А. В. Михайловым в 1938 г.; в форме условия 4 он был получен Ш. Эрмитом и Билером гораздо раньше, в 1856 г. Алге- браический критерий устойчивости был предложен в 1896 г. А. Гурвицем и доведен до удобной вычислительной формы Э. Раусом. На дискретный случай алгоритм был перенесен И. Шуром (1920). Достаточное условие устойчивости (3.19) было предложено Коном в 1922 г. Много сопутствую- щих результатов и обобщений можно найти в [68,145]. Знаменитый кри- терий Найквиста (1932) оказал большое влияние на развитие частотной теории. Многомерный аналог критерия Найквиста был сначала получен Розенброком в 1974 г. [165] в форме так называемого корневого годо- графа; теорема 3.9, в которой фигурирует лишь один годограф, доказана Видьясагаром [176].
БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ 279 Структура множества достижимости для различных ситуаций описы- вается в книгах А. Б. Куржанского [42], Ф. Швеппе [168] и С. Бойда с соавторами [106]. Термин «сверхустойчивость» является новым. Теорема 3.14 впервые получена, по-видимому, С. М. Лозинским в 1953 г. [47]. Использование матриц с «отрицательным диагональным доминированием» (в нашей тер- минологии — сверхустойчивых) для анализа линейных систем управления встречалось ранее в ряде работ, см., в частности, [24,134,150,165,169]. Более подробно материал п. З.бизлагается в [155]. К главе 4 Стабилизация минимально-фазовых систем с помощью большого ко- эффициента усиления (теорема 4.2) была обоснована М. В. Мееровым в 1947 г., см. также [53]. Идея 77-разбиения в частном случае полино- мов третьей степени была высказана еще И. А. Вышнеградским в 1896 г. («диаграмма Вышнеградского», см. [51]); в полной общности технику 17- разбиения развил Ю. И. Неймарк [56]. Описание всех стабилизирующих регуляторов обычно называется «па- раметризацией Юлы» или «параметризацией Юлы-Кучеры», при этом ссылаются на работы [104,138,181]. Однако история этого открытия заметно выходит за пределы данных работ. Прежде всего, в [104] дана лишь параметризация в форме (4.9); мы отмечали ее недостатки. Со- временная формулировка (теорема 4.5) была придана этому результату в статье [113]. Кроме того, В. М. Ларин, К. И, Науменко и В. Н. Сун- цев получили близкие результаты несколько раньше, в 1971 г. [43], см. комментарии в [4]. Для дискретных систем описание всех стабилизиру- ющих регуляторов (теорема 4.6) использовалось Л. Н. Волгиным еще в 1962 г. [21], см. также [22]. Самая ранняя ссылка, которую нам удалось разыскать, — это статья А. М. Каца [35] 1955 г., в которой предложена параметризация (4.9). В настоящее время параметризация Юлы излага- ется во многих зарубежных учебниках [120,144,176,183]; на русском языке ей посвящены книги [4,71]. Теорема 4.8 о возможности произвольного размещения полюсов для управляемой системы обычно связывается с именем Калмана, хотя сам Калман [34] указывает на приоритет Дж. Бертрама. Теорема 4.11, харак- теризующая эффект «всплеска» при удалении полюсов в левую полуплос- кость, принадлежит Р. Н. Измайлову [32]. Способ оценки состояния, приведенный в теореме 4.12, часто называется наблюдателем Люенбер- гера; он был предложен в [142], см. также [34,143]. Идея квадратичной стабилизации была выдвинута в 1980-е годы Дж. Лейтманом и Б. Бармишем [92,140]; впрочем, корни этой идеи могут
280 БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ быть прослежены много раньше. Техника сведения к линейным матрич- ным неравенствам описана в книге [106]. Использование сверхустойчи- вости для целей стабилизации предложено в [155]. К главе 5 Идея оптимальности в теории управления возникла сравнительно позд- но, в 1950-е годы. До этого в центр исследований ставились задачи ана- лиза систем и обеспечения их устойчивости; проблемы качества процес- сов играли меньшую роль. Ситуация кардинально изменилась к 1960-м годам, когда вся наука об управлении стала ассоциироваться с оптималь- ным управлением, тогда как раньше она обычно называлась теорией ав- томатического регулирования. В таком смещении акцентов ключевую роль сыграли работы Веллмана, Калмана, Понтрягина, А. А. Фельдбаума и других крупных ученых того времени [15,34,66,77]. Задача о линейно-квадратичном регуляторе (в русской литературе ча- сто называвшаяся задачей об аналитическом конструировании регуля- торов) была одной из первых решенных задач оптимального управле- ния; основной вклад в ее решение внесли Р. Калман [133] и А. М. Ле- тов [45]. Это решение было воспринято специалистами по теории ав- томатического регулирования, так как оно формулировалось в привыч- ных для них терминах обратной связи (в отличие от задачи о релей- ном быстродействии, в которой решение является программным управ- лением). В настоящее время теория линейно-квадратичной оптимизации раз- вита очень глубоко, включая анализ всевозможных вырожденных случаев; есть ряд монографий, специально посвященных этому направлению, на- пример [36,90]. Подход, приводящий к краевой задаче (5.8), опирается на принцип максимума [66]. Способ решения последней путем подстановки (5.11), широко применяется в вычислительной математике под названием «метод прогонки». Уравнение Риккати играет ключевую роль в линейно- квадратичном регулировании и неоднократно встречается в последующих главах; подробные сведения о нем и его связи с LQR-задачей можно найти в [179,180]. Подход, описанный в п. 5.1.3 и основанный на ис- пользовании функций Ляпунова, тесно связан с методом динамического программирования [14]. Термин «линейные матричные неравенства» введен в теорию управле- ния В. А. Якубовичем [86] (хотя первым линейным матричным неравен- ством может считаться неравенство Ляпунова, сформулированное в 1892 г. в связи с анализом устойчивости [50]). В настоящее время этот аппарат получил широкое развитие; в [106] дано его систематическое изложение и показано, что многие задачи теории управления могут формулироваться
БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ 281 в виде линейных матричных неравенств. Мощные и эффективные числен- ные методы решения таких неравенств разработаны Ю. В. Нестеровым и А. С. Немировским [149]. Использование Нж-нормы в оптимальном управлении обычно свя- зывают с работой Дж. Зеймса 1981 г. [182], однако в частных случаях подобные равномерно-частотные критерии использовались и ранее. В на- стоящее время Ноо -оптимизация составляет ядро теории управления [12, 60.96,115,117,120,124,127,128,144,146,147,183]. Первоначально за- дача была решена в частотной области с использованием таких средств теории функций комплексного переменного, как теорема Неванлинны- Пика [117,120,146]. В 1989 г. появилась статья [118], в которой было дано полное решение в пространстве состояний (так называемый «2-Риккати подход»). Этот метод в основном и используется сейчас для численного решения проблемы Нх -оптимизации в пакетах Control System Toolbox и Robust Control Toolbox системы Matlab. Задача об оптимальном подавлении внешних возмущений является од- ной из основных в теории управления. Однако ею занимались преимуще- ственно в стохастической постановке, ше решением является LQG (Linear Quadratic Gaussian — линейно-квадратично-гауссовский) регулятор, ана- логичный линейно-квадратичному регулятору из п. 5.1; мы не останавли- ваемся на стохастических задачах в этой книге. Другая модель внешних возмущений — гармонические с неизвестной частотой; в этом случае их подавление возможно с помощью Нх -оптимизации. Задача же о произ- вольных ограниченных помехах, рассматриваемая в п. 5.3, была решена сравнительно недавно. Еще в 1940-е годы возникла так называемая задача о накоплении возмущений Б. В. Булгакова [19], однако основной интерес проявлялся к проблеме анализа: каково максимальное отклонение, вызы- ваемое произвольными ограниченными внешними воздействиями. Такая задача, по сути, является задачей программного оптимального управления, в которой внешние возмущения рассматриваются как управления. Позже появились работы по компенсации ограниченных возмущений, не содер- жавшие, впрочем, общих методов синтеза оптимальных регуляторов [75]. Задача об оптимальном подавлении произвольных ограниченных возму- щений для дискретных одномерных систем была четко поставлена в [87] (на Западе — в [177]); позже она получила название 1\ -оптимизации. Ее решение для частных случаев было получено в [9,87,177]. Полное решение было построено в [11] и затем в [112]. В несколько модифици- рованном виде этот результат приведен в теореме 5.3. Развитие теории и методов (1-оптимизации дано в книгах [10,111,167]. Синтез регулято- ров заданного порядка для задач с ограниченными помехами осуществлен в [20,99,155]. Результаты, использующие множество достижимости для синтеза регуляторов, можно найти в [106]; теорема 5.5 является уточне- нием этих результатов.
282 БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ К главе 6 Идея о необходимости учета неопределенности при конструировании систем управления являлась фундаментальной в теории управления на всех ее этапах. Если бы объект и внешние сигналы были бы известны точно, возможно было бы программное управление или использование прямой (а не обратной) связи. Об основополагающей роли неопределенно- сти и преимуществах обратной связи в те периоды успехов оптимального управления, когда значение этих факторов несколько забывалось, неод- нократно напоминал И. Горовиц [27]; Одна из первых моделей неопре- деленности (нелинейная секторная) была предложена в теории абсолют- ной устойчивости в пионерских работах А. И. Лурье, М. А. Айзермана, Ф. Р. Гантмахера [1,48,49]. Модели параметрической неопределенности в линейных системах по- явились значительно позже; по-ввдимому, их систематическое исследова- ние начал также Горовиц [27], впоследствии создавший специальные по- луэвристические методы для работы с ними — так называемую QFT (Qual- itative Feedback Theory) —- качественную теорию обратной связи [130]. Важное направление в анализе неопределенности связано с моделью «неизвестных, но ограниченных» («unknown-but-bounded») возмущений, восходящей к [168]; большой вклад в развитие этого направления внес- ли отечественные ученые А. Б. Куржанский [42] нФ. Л. Черноусько [84]. Близкие идеи использовались в минимаксной теории управления [10,85,96]. Модели частотной неопределенности, использующие Д»-норму для возмущений, интенсивно разрабатывались в 1980-е годы. Все развитие Яоо-оптимизации и робастной теории происходило параллельно, с ис- пользованием одного и того же аппарата [109,116,118,121,126,166,182]. Вероятностный подход к робастности получил распространение в по- следние годы, когда выяснились теоретические и вычислительные труд- ности, стоящие перед детерминированным (минимаксным) описанием не- определенности [65,94,170,173]. Очень полный обзор результатов по робастности содержится в моно- графии [178]. К главе 7 Впервые задачу об устойчивости интервального семейства полиномов рассмотрел С. Фаедо в 1953 г. [119]. Он предложил достаточные условия робастной устойчивости, основанные на интервальном аналоге алгоритма Рауса. Еще один ранний результат по робастной устойчивости приве- ден в книге Заде и Дезоера [30] (гл. 9, с. 481). Теорема 7.2 доказана
БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ 283 В. Л. Харитоновым в 1978 г. [79], но несколько лет не привлекала к себе внимания. После 1984 г., когда этот результат стал известен на Западе, начался настоящий бум публикаций на тему робастной устойчи- вости при параметрической неопределенности. Общая теорема 7.1 (прин- цип исключения нуля) тесно связана с идеями D-разбиения [56], но, по- видимому, она восходит к работе [122] 1929 г. Теорема 7.3 (графический критерий робастной устойчивости полиномов) доказана в [63]. Ребер- ная теорема получена в работе [95]. В настоящее время опубликовано несколько книг, специально посвященных проблеме робастной устойчи- вости полиномов [89,91,98,137]. Эти проблемы освещены в ряде сбор- ников [162-164]. На русском языке имеется обзор [83]. После появления теоремы Харитонова казалось, что ее обобщение на случай интервальных матриц должно последовать немедленно, и такие работы действительно появились. Однако они оказались ошибочными; были построены контрпримеры, показывающие, что устойчивость всех вершин или ребер семейства не обеспечивает робастной устойчивости. Позже было доказано [148], что эта задача NF-сложная. Теорему о возмущениях (теорема 7.7) можно найти, например, в книгах [74,80]; основанный на ней численный метод проверки робастной устойчивости матриц предложен в [156]. Переход к робастной квадратичной устой- чивости (линейное матричное неравенство (7.20)) и методы решения по- следнего предложены в [106,107]. Оценки радиуса сверхустойчивости интервальных матриц приведены в [61]. Формула для комплексного радиуса устойчивости матриц (теорема 7.8) получена Хинриксеном и Причардом [ 129]. Для вещественного ради- уса устойчивости в течение долгого времени существовали лишь оценки снизу; наконец, в 1995 г. эта проблема была разрешена совместными усилиями шести авторов [160]; этот результат приведен в теореме 7.10. Теорему 7.11 (о стабилизации интервального объекта регулятором пер- вого порядка и ряд близких результатов) можно найти в [93]. Робастный критерий Найквиста по существу получен Розенброком [165]; графиче- ская интерпретация в форме теоремы 7.13 ему придана в [64]. Тео- рема 7.14 о малом коэффициенте усиления — один из фундаментальных результатов робастной теории — была получена в [176]; ее обобщения и варианты (в частности, теорема 7.15) могут быть найдены в [183]. Понятие структурного сингулярного числа (д) матрицы было введено Дойлом [116]; основанная на этом техника //-анализа (включающая верх- ние и нижние границы для //, критерий робастной устойчивости и ал- горитмы вычисления оценок для д) могут быть найдены в книге [183] и ряде статей, см., например, [151]. Вероятностный подход к анализу робастной устойчивости, как уже от- мечалось, стал весьма популярным в последние годы. Метод Монте-Карло для этих целей применили Стенгел и Рэй [170]. Оценки числа требуе-
284 БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ мых испытаний приведены в [173]. Подход, связанный с вероятностной аппроксимацией условий устойчивости (п. 7.5.2), предложен в [94]. На- конец, теорема 7.18 использована для анализа робастной устойчивости интервальных матриц в [62]. Из работ, посвященных вероятностным ме- тодам синтеза, отметим [157,158]. К главе 8 Задача о робастной стабилизации с помощью регуляторов низкого по- рядка в общем виде весьма трудна (см в п 9.1). Здесь приводятся ее решения лишь для частных случаев. Теоремы 8.1 и 8.2 (робастная стаби- лизация с помощью малых и больших коэффициентов усиления) можно найти в [175]. Техника робастного D-разбиения описана в [59]. Числен- ный подход к синтезу робастных регуляторов, зависящих от двух параме- тров, развит в [37,89,93]. Другие подходы к робастной стабилизации при параметрической неопределенности можно найти в [97,98* 135]. Задача о робастной квадратичной стабилизации, вероятно, впервые рассматривалась А. М. Мейлахсом [54]; более подробно техника, осно- ванная на линейных матричных неравенствах, описана в книге [106]. Све- дение проблемы о гарантированном квадратичном показателе качества для систем с неопределенностью к линейным матричным неравенствам (тео- рема 8.4) осуществлено в ряде работ, см., например, [106,153,154]. Робастная стабилизация при неопределенностях, заданных Ноо-нор- мой, сводится к стандартной задаче Ноо-оптимизации. Это было осуще- ствлено еще в первых работах, посвященных Ноо-теории, см. [120,136, 146,182]. То, что другие виды неопределенностей также могут учиты- ваться с помощью техники Ноо, показано в различных исследованиях. Случай комплексных параметров (теорема 8.5) изучен в [88]. Модель с вещественными неопределенностями, ограниченными в -норме (дис- кретный случай), предложена в [155]. Возможность сведения проблемы стабилизации для интервальных объектов к выпуклой задаче (теорема 8.6) обоснована в [161]. Проблемам д-синтеза посвящен ряд работ [151,183]; соответствующие алгоритмы включены в пакет fj,-Analysis and Synthesis Toolbox системы Matlab. К главе 9 Нерешенным задачам теории управления посвящена книга [102]; на интернетовском сайте, посвященном ей, можно найти обсуждение содер- жащихся в ней задач и последние результаты в их решении. Впрочем,
БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ 285 большинство проблем в [102] относятся к нелинейной теории и к другим областям, не затрагиваемым в нашей книге. Теория сложности задач управления обсуждается в большом обзо- ре [103]; там можно найти пояснение таких терминов, как «NF-сложные задачи» и ссылки на литературу. Задача о стабилизации линейного объекта регулятором заданной струк- туры и родственные ей задачи возникают во множестве разделов теории управления и в разнообразных приложениях. Однако ни аналитического решения, ни эффективных методов для них не известно (за исключе- нием некоторых частных случаев). Стабилизации с помощью статической обратной связи по выходу посвящено много работ, см., например, [171]. ДгР-сложность проблемы доказана в [148]. Задача об одновременной стабилизации линейных систем (проблема 7 или 8), давно привлекает внимание исследователей; последние результаты см. в [131]. Результат об одновременной стабилизации двух объектов получен в ряде работ; по- дробности можно найти в книге [100], специально посвященной этому кругу вопросов. Случай трех объектов рассмотрен в [101] и признан очень трудным; в частности, в [101] приведен конкретный пример, за решение которого (т. е. за ответ на вопрос, стабилизируемы ли три данных объекта) авторы предлагали бутылку хорошего французского шампанского. Задача о робастной неустойчивости интервального семейства полино- мов (проблема 2) впервые поставлена в статье [152]. Ее NP-сложность доказана А. С. Немировским [148]. Однако попытки ее решения продол- жаются [159]. Приведенные оценки вероятности устойчивости заимство- ваны из [57]. Градиентный метод (9.15) решения проблемы 9 предложен в статье [141]. К Приложению Хорошими справочниками по теории матриц являются [16,25,26,74, 80]
СПИСОК ЛИТЕРАТУРЫ 1. Айзерман М. А., Гонтмахер Ф. Р. Абсолютная устойчивость регулируемых систем. М.: Изд-во АН СССР, 1963. 2. Александров А. Г. Оптимальные и адаптивные системы. М.: Высш, шк., 1989. 3. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. М.: Наука, 1979. 4. Алиев Ф. А., Бордюг Б. А., Ларин В. Б. Яг-оптимизация и метод про- странства состояний в задаче синтеза оптимальных регуляторов. Баку: Элм, 1991. 5. Андреев Ю. Н. Управление конечномерными линейными объектами. М.: Наука, 1976. 6. Андриевский Б. Р., Фрадков А. Л. Избранные главы теории автоматического управления. СПб.: Наука, 1999. 7. Андриевский Б. Р., Фрадков А. Л. Элементы математического моделирования в программных средах MATLAB 5 и SC1LAB. СПб.: Наука, 2001. 8. Афанасьев В. Н., Колмановский В. Б., Носов В. Р. Математическая теория конструирования систем управления. М.: Высш, шк., 1998. 9. Барабанов А. Е Оптимальное управление неминимально-фазовым дискрет- ным объектом с произвольным ограниченным шумом // Вести. ЛГУ, сер. мат. 1980. Т. 13. С. 119-120. 10. Барабанов А. Е. Синтез минимаксных регуляторов. СПб.: Изд-во С.-Петерб. ун-та, 1996. 11. Барабанов А. Е., Граничил О. Н. Оптимальный регулятор для линейных объектов с ограниченным шумом И Автом. телемех. 1984. №5. С. 39-46. 12. Барабанов А. Е., Первозванский А. А. Оптимизация по равномерно- частотным показателям И Автом. телемех. 1992. №9. С. 3-32. 13. Беллман Р. Теория устойчивости решений дифференциальных уравнений. М.: ИЛ, 1954. 14. Беллман Р. Динамическое программирование. М.: ИЛ, 1960. 15. Беллман Р., Гликсберг И., Гросс О. Некоторые вопросы математической теории процессов управления. М.: ИЛ, 1962. 16. Беллман Р. Введение в теорию матриц. М.: Наука, 1969. 17. Бесекерский В. А., Попов Е. Ц. Теория систем автоматического регулирова- ния. М.: Наука, 1966. 18. Болтянский В. Г. Оптимальное управление дискретными системами. М.: Наука, 1973. 19. Булгаков Б. В. О накоплениях возмущений в линейных колебательных си- стемах с постоянными параметрами И Докл. АН СССР. 1946. Т. 5, вып.5. С. 339-342.
СПИСОК ЛИТЕРАТУРЫ 287 20. Вишняков А. Н„ Поляк Б. Т. Синтез регуляторов низкого порядка для дис- кретных систем управления при наличии неслучайных возмущений // Автом. телемех. 2000. № 9. С. 112-119. 21. Волгин Л. Н. Элементы теории управляющих машин. М.: Сов. радио. 1962. 22. Волгин Л. Н. Оптимальное дискретное управление динамическими систе- мами. М.: Наука, 1986. 23. Воронов А. А. Устойчивость, управляемость наблюдаемость. М.: Наука, 1979. 24. Воронов А. А. Основы теории автоматического управления. Автоматическое регулирование непрерывных линейных систем. М.: Энергия, 1980. 25. Гантмахер Ф. Р. Теория матриц. М.: Наука, 1967. 26. Голуб Дж, Ван Лоун Ч. Матричные вычисления. М.: Мир, 1999. 27. Горовиц И. Синтез систем с обратной связью. М.: Сов. радио, 1970. 28. Джури Э.Импульсные системы автоматического регулирования. М.: Физ- матгиз, 1963. 29. Емельянов С. В., Коровин С. К. Новые типы обратной связи. М.: Наука, 1997. 30. ЗадеЛ., Дезоер Ч. Теория линейных систем. М.: Наука, 1970. 31. Изерман Р. Цифровые системы управления. М.: Мир, 1984. 32. Измайлов Р. Н. Эффект «всплеска» в стационарных линейных системах со скалярными входами и выходами И Автом. телемех. 1987. №8. С. 56-62. 33. Колман Р. Е. Об общей теории систем управления // Труды Междунар. Конгресса ИФАК. М.: АН СССР, 1961. Т. 2. С. 521-547. 34. Калман Р„ Фалб П., Арбйб М. Очерки по математической теории систем. М.: Мир, 1971. 35. Кац А. М. Определение параметров регулятора по желаемому характеристи- ческому уравнению системы регулирования И Автом. телемех. 1955. №3. С.269-272. 36. Квакернаак X., Сиван Р. Линейные оптимальные системы управления. М.: Мир, 1977. 37. Киселев О. И, Поляк Б. Т. Синтез регуляторов низкого порядка по критерию Н°° и по критерию максимальной робастности И Автом. телемех. 1999. №3. С. 113-119. 38. Красовский И. Н. Теория управления движением. М.: Физматгиз, 1968. 39. Красовский А. А., Поспелов Г. С. Основы автоматики и технической кибер- нетики. М.: Госэнергоиздат, 1962. 40. Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. М.: Наука, 1974. 41. Куо Б. Теория и проектирование цифровых систем управления. М.: Маши- ностроение, 1986. 42. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. 43. Ларин В. М., Науменко К. И, Сунцев В. Н. Спектральные методы синтеза линейных систем с обратной связью. Киев: Наук, думка, 1971. 44. Ла-Салль Ж., Лефшец С. Исследование устойчивости прямым методом Ля- пунова. М.: ИЛ, 1964.
288 СПИСОК ЛИТЕРАТУРЫ 45. Летов А. М. Аналитическое конструирование регуляторов I—IV // Автом. телемех. 1960. №4. С.436-441; №5. С.561-568; №6. С.661-665; 1961. №4. С. 425-435. 46. Ли Э., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972. 47. Лозинский С. М. Оценка погрешностей приближенного решения систем обыкновенных дифференциальных уравнений И Докл. АН СССР. 1953. Т. 92, вып.2. С. 225-228. 48. Лурье А. И. Некоторые нелинейные задачи теории автоматического регули- рования. М.: Гостехиздат, 1951. 49. Лурье А. И., Постников В. Н. К теории устойчивости регулируемых систем // Прикл. матем. мех. 1944. Т. УШ, вьш. 3. 50. Ляпунов А. М. Общая задача об устойчивости движения. Л.-М.: ОНТИ, 1935. 51. Максвелл Д. К., Вышнеградский И. А., Стодола А. Теория автоматического регулирования. М.: АН СССР, 1949. 52. Медведев В. С., Потемкин В. Г. Control System Toolbox: Matlab 5 для студентов. М.: Диалог-МИФИ, 1999. 53. Мееров М. В. Исследование и оптимизация многосвязных систем управле- ния. М.: Наука, 1986. 54. Мейлахс А. М. О стабилизации линейных управляемых систем в условиях неопределенности И Автом. телемех. 1975. №2. С. 182-184. 55. Методы классической и современной теории автоматического управления / Под ред. Н. Д. Егупова. М.: Изд-во МГТУ им. Н. Э. Баумана, 2000. Т. I: Анализ и статистическая динамика систем автоматического управле- ния; Т. П: Синтез регуляторов и теория оптимизации систем автомати- ческого управления; Т. Ш: Методы современной теории автоматического управления, 56. Неймарк Ю. И. Устойчивость линеаризованных систем. Л.: ЛКВВИА, 1949. 57. Немировский А. С., Поляк Б. Т. Необходимые условия устойчивости поли- номов и их использование // Автом. телемех. 1994. №11. С. 113-119. 58. Первозванский А. А. Курс теории автоматического управления. М.: Наука, 1986. 59. Петров Н. П., Поляк Б. Т. Робастное D-разбиение // Автом. телемех. 1991. №11. С. 41-53. 60. Позняк А. С., Серебряков Г. Г., Семенов А. В., Федосов Е. А. 77°°-теория управления: феномен, достижения, перспективы, открытые проблемы. М.: ГосНИИАС, 1990. 61. Поляк Б. Т„ Щербаков П. С. Сверхустойчивые линейные системы управле- ния I, П И Автом. телемех. 2002. №8,9. 62. Поляк Б. Т„ Панченко О. Б. Вероятностный подход к проблеме устойчивости интервальных матриц// Докл. РАН. 1997. Т. 353, вып. 4. С. 456-458. 63. Поляк Б. Т„ Цыпкин Я. 3. Частотные критерии робастной устойчиво- сти и апериодичности линейных систем // Автом. телемех. 1990. №9. С. 45-54. 64. Поляк Б. Г,, Цыпкин Я. 3. Робастный критерий Найквиста И Автом. телемех. 1992. №7. С. 25-31.
СПИСОК ЛИТЕРАТУРЫ 289 65. Поляк. Б. Т„ Щербаков П. С. Вероятностный подход к робастной устойчи- вости систем с запаздыванием // Автом. телемех. 1996. №12. С. 97—108. 66. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1961. 67. Попов Е. П. Теория линейных систем регулирования и управления. М.: На- ука, 1989. 68. Постников М. М. Устойчивые многочлены. М.: Наука, 1981. 69. Потемкин В. Г. Система инженерных и научных расчетов Matlab 5.x. Т. I, П, М.: Диалог-МИФИ, 1999. 70. Ройтенберг Я. И. Автоматическое управление. М.: Наука, 1978. 71. Соколов В. Ф. Стабилизация линейных непрерывных систем. Сыктывкар: СыктГУ, 2001. 72. Справочник по теории автоматического управления / Под ред. А. А. Кра- совского. М.: Наука, 1987. 73. Стрейц В. Метод пространства состояний в теории дискретных линейных систем управления. М.: Наука, 1985. 74. Уилкинсон Дж X. Алгебраическая проблема собственных значений. М.: На- ука, 1970. 75. Уланов Г. М. Динамическая точность и компенсация возмущений в системах авоматического управления. М.: Машиностроение, 1971. 76. Уонзм М. Линейные многомерные системы управления. М.: Наука, 1980. 'll. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М.: Физматгиз, 1963. 78. Фомин В. Н. Методы управления линейными дискретными объектами. Л.: Изд-во Ленингр. ун-та, 1985. 79. Харитонов В. Л. Асимптотическая устойчивость семейства систем линейных дифференциальных уравнений // Дифференциальные уравнения. 1978. Т. 1, вып. 11. С. 2086-2088. 80. Хорн Р„ Джонсон Ч. Матричный анализ. М.: Мир, 1989. 81. Цыпкин Я. 3. Переходные и установившиеся процессы в импульсных цепях. М.: Госэнергоиздат, 1951. 82. Цыпкин Я. 3. Основы теории автоматических систем. М.: Наука, 1977. 83. Цыпкин Я. 3., Поляк Б. Т. Робастная устойчивость линейных систем// Итоги науки и техники, сер. Технич. киберн. Т.32. М.: ВИНИТИ, 1991. С.3-31. 84. Черноусько Ф. Л. Оценивание фазового состояния динамических систем. М.: Наука, 1988. 85. Черноусько Ф. Л., Меликян А. А. Игровые задачи управления и поиска. М.: Наука, 1978. 86. Якубович В. А. Решение некоторых матричных неравенств, встречающихся в теории автоматического регулирования И Докл. АН СССР. 1962. Т. 143, вып. 6. С. 1304-1307. 87. Якубович Е. Д. Решение задачи оптимального управления для линейных дискретных систем И Автом. телемех. 1975. №9. С. 73-79. 88. Abrishamchian М„ Barmish В. Reduction of robust stabilization problem to standard H°° problems for classes of systems with unstructured uncertainty // Automatica. 1996. V. 32, No. 8. P. 1101-1115.
290 СПИСОК ЛИТЕРАТУРЫ 89. Ackermann J. Robust control: systems with uncertain physical parameters. New York: Springer-Verlag, 1993. 90. Anderson B. D. O., Moore J. B. Optimal control: linear quadratic methods. Englewood Cliffs, NJ: Prentice-Hall, 1989. 91. Barmish B. R. New tools for robustness of linear systems. New York: MacMil- lan, 1995. 92. Barmish B. R., Corless M„ Leitmann G. A new class of stabilizing controllers for uncertain dynamical systems H SIAM J. Control Optimiz. 1983. V. 21, No. 2. P. 246-255. 93. Barmish B. R., Hollot С. V., Kraus F. J., Tempo R. Extreme point results for robust stabilization of interval plants with first-order compensators // IEEE Trans. Autom. Control. 1992. V.37, No. 6. P. 707-714. 94. Barmish B. R., Polyak B. T. A new approach to open robustness problems based on probabilistic prediction formulae // Proc. 13th World Congress of IF AC. 1996, San Francisco С A. V. H.P. 1-6. 95. Bartlett A. C„ Hollot С. V., Un H. Root location of an entire polytope of polynomials: it suffices to check the edges // Mat. Contr. Sig. Syst. 1988. V. 1. P. 61-71. 96. Bagar T., Bernhardt P. Hoo-optimal control and related minimax design prob- lems: a dynamic game approach. Boston: Birkhauser, 1991. 97. Bhattacharyya S. P. Robust stabilization against structured parameters. Berlin: Springer-Verlag, 1987. 98. Bhattacharyya S. P., Chapellat H„ Keel L H. Robust control: the parametric approach. Upper Saddle River, NJ: Prentice Hall, 1995. 99. Blanchini F., Sznaier M. A convex optimization approach for fixed-order con- troller design for disturbance rejection in SISO systems // IEEE Trans. Autom. Control. 2000. V. 45. P. 784-789. 100. Blondel V. Simultaneous stabilization of linear systems. London: Springer, 1995. 101. Blondel V., GeversM. The simultaneous stabilization of three linear systems is rationally undecidable // Math. Contr. Sig. Syst. 1994. No. 6. P. 135-145. 102. Blondel V., Sontag E., Vidyasagar M„ Willems J. Open problems in mathematical systems and control theory. London: Springer, 1999. 103. Blondel V., Tsitsiklis J. A survey of computational complexity results in systems and control // Automatica. 2000. V.35. P. 1249-1274. 104. Bonjomo J. J., Youla D. C. On the design of single-loop single-input-output feedback control systems in the complex frequency domain // IEEE Trans. Autom. Control. 1977. V. 22, No. 3. P; 416-423. 105. Boyd S„ Barratt C. Linear controller design — limits for performance. Engle- wood Cliffs, NJ: Prentice Hall, 199L 106. Boyd S. L, El Ghaoui L., Feron E., Balakrishnan V. Linear matrix inequalities in systems and control theory. Philadelphia: SIAM, 1994. 107. Calqfiore G., Polyak В. T. Stochastic algorithms for exact and approximate feasibility of robust LMIs // IEEE Trans. Autom. Control. 2001. V.46, No. 11. P. 1755-1759. 108. Chen С. T. Linear system theory and design. New York: Holt, Rinehart and Winston, 1984.
СПИСОК ЛИТЕРАТУРЫ 291 109. Chen М. J., Desoer С. A Necessary and sufficient condition for robust stability of linear distributed feedback systems // Intern. J. Control. 1982. V. 35, No. 2. P.255-267. 110. Coppel W. Stability and asymptotic behavior of differential equations. Boston: D. C. Heath, 1965. 111. Dahleh M., Diaz-Bobillo I. J. Control of uncertain systems: a linear program- ming approach. Englewood Cliffs, NJ: Prentice-Hall, 1995. 112. Dahleh M., Pearson J. B. li optimal feedback controllers for MIMO discrete systems // IEEE Trans. Autom. Control. 1987. V.32, No. 4. P. 314-322. 113. Desoer C. A., Liu R.-W., Murray J., Sacks R. Feedback system design: the frac- tional representation approach to analysis and synthesis // IEEE Trans. Autom. Control. 1980. V. 25, No. 3. P. 399-412. 114. Desoer C. A., Vidyasagar M. Feedback systems: input-output properties. New York: Academic Press, 1975. 115. Djaferis 7'. E. Robust control design: a polynomial approach. Boston: Kluwer, 1995. 116. Doyle J. C. Analysis of feedback systems with structured uncertainties H IEE Proc.. 1982. Pt. D. V. 129. P. 242-250. 117. Doyle J. C., Francis B. A., Tannenbaum A. R. Feedback control theory. Engle- wood Cliffs, NJ: MacMillan, 1992. 118. Doyle J. C„ Glover R., Khargonekar P. P., Francis B. A. State-space solutions to standard Яг and Яоо control problems // IEEE Trans. Autom. Control. 1989. V. 34, No. 8. P. 831-847. 119. Faedo S. Un nuova problema di stabilita per le equazione algebriche a coeffi- cient! reali // Ann. Scuola Norm. Super. Piza, Ser. sci. fis. e mat. 1953. V. 7, No. 1-2. P. 53-63. 120. Francis B. A. A course in Яоо control theory. Berlin: Springer-Verlag, 1987. 121. Francis B. A., Zames G. On Я°°-optimal sensitivity theory for SISO feedback systems H IEEE Trans. Autom. Control; 1984. V.29. P. 9-16: 122. Frazer R. A., Duncan W. J. On the criteria for stability for small motions // Proc. Roy. Soc., Ser. A. 1929. V. 124. P. 642-654. 123. Frequency-response methods in control systems / Ed. A. G. J. MacFarlane. New York: IEEE Press, 1979. 124. Freudenberg J. S., Looze D. P. Frequency domain properties of scalar and multivariable feedback systems. Berlin: Springer-Verlag, 1987. 125. Glad T.,Ljung L Control theory. Multivariable and nonlinear methods. London- New York: Taylor & Francis, 2000. 126. Glover K. Robust stabilization of linear multivariable systems: relations to approximation П Intern. J. Control. 1986. V. 43, No. 3. P. 741-766. 127. Green M.. Limebeer D. J. H. Linear robust control. Englewood Cliffs, NJ: Prentice Hall, 1995. 128. Helton J. W., Merino O. Classical control using Я°° methods. Philadelphia: SIAM, 1998. 129. Hinrichsen D., Pritchard A. Stability radius for structured perturbations and the algebraic Riccati equation // Syst. Control Lett. 1986 V 8 P. 105-113;
292 СПИСОК ЛИТЕРАТУРЫ 130. Horowitz I. Survey on qualitative feedback theory (QFT) // Intern. J. Control. 1991. No. 53. P. 255-291. 131. Jia Y„ Ackermann J. Some new results on simultaneous stabilizaton of linear plants // Proc. 14th World Congress of IFAC. Beijing, 1999. P. 219-224. 132. Kailath T. Linear systems. Englewood Cliffs, NJ: Prentice-Hall, 1980. 133. Kalman R. Contributions to the theory of optimal control // Bol. Soc, Mat. Mex. 1960. No. 5. P. 102-199. 134. KaszJcurevich E., Bhaya A. Matrix diagonal stability in systems and computation. Boston: Birkhauser, 2000. 135. Keel L. H., Bhattacharyya S. P. Robust stability and performance with fixed- order controlers // Automatica. 1999. V.35. P. 1717-1724. 136. Khargonekar P. P., Petersen I. R., Zhou R. Robust stabilization and Hoo-optimal control // IEEE Trans. Autom. Control. 1990. V. 35. No. 3. P. 356-361. 137. Kogan J. Robust stability and convexity. London: Springer-Verlag, 1995. 138. Kucera V. Discrete linear control. New York: John Wiley, 1979. 139. Kuo В. C. Automatic control systems. Englewood Cliffs, NJ: Prentice Hall, 1991 (sixth edition). 140. Leitmann G. Guaranteed asymptotic stability for some linear systems with bounded uncertainties // J. Dyn. Syst. Meas. Control. 1979. V. 101. P. 212-216. 141. Levine W. S., Athans M. On the determination of the optimal constant output- feedback gains foi linear multivariable systems // IEEE Trans. Autom. Control. 1970. V. 15, No. 2. P. 44-48. 142. Luenberger D. G. Observing the state of a linear system // IEEE Trans. Military Electronics. 1964. No. 8. P. 74-80. 143. Luenberger D. G. An introduction to observers // IEEE Trans. Autom. Control. 1971. V.35. P.596-602. 144. Maciejowski J. M. Multivariable feedback design. Wokingham: Addison- Wesley, 1989. 145. Marden M. Geometry of polynomials. Providence, RI: Amer. Math. Soc., 1966. 146. McFarlane D. C., Glover K. Robust controller design using normalized coprime factor plant description. New York: Springer-Verlag, 1990. 147. Morari M., Zafiriou M. Robust process control. Englewood Cliffs, NJ: Prentice- Hall, 1989. 148. Nemirovskii A. A. Several VF-hard problems arising in robust stability analy- sis // Math. Contr. Sig. Syst. 1994, No. 6. P. 99-105. 149. Nesterov Y., Nemirovski A. Interior-point polynomial algorithms in convex pro- gramming. Philadelphia: SIAM, 1994. 150. Ogata K. Modem control engineering. Englewood Cliffs, NJ: Prentice-Hall, 1990. 151. Packard A., Doyle J. C. The complex structured singular value // Automatica. 1993. V. 29. P. 71-109. 152. Padmanabhan P., Hollot С. V. Complete instability of a box of polynomials // IEEE Trans. Autom. Control. 1992. V. 37, No. 8. P. 1230-1233. 153. Petersen 1. R., Hollot С. V. A Riccati equation approach to the stabilization of uncertain linear systems // Automatica. 1986. V. 22, No. 4. P. 397-411.
СПИСОК ЛИТЕРАТУРЫ 293 154. Petersen I. R., McFarlane D. C. Optimal guaranteed cost control and filtering for uncertain linear systems // IEEE Trans. Autom. Control. 1994. V.39. P. 1971— 1977. 155. Polyak B., Halpern M. Optimal design for discrete-time linear systems via new performance index // Intern. J. Adaptive Control Sig. Proc. 2001. V. 15, No. 2. P. 129-152. 156. Polyak В. T., Shcherbakov P. S. Numerical search of stable or unstable element in matrix or polynomial families: A unified approach to robustness analysis and stabilization // Robustness in Identification and Control / Eds. A. Garulli, A. Tesi, A. Vicino. Berlin: Springer-Verlag, 1999. P. 344-358. 157. Polyak В. T, Shcherbakov P. S. Random spherical uncertainty in estimation and robustness // IEEE Trans. Autom. Control. 2000. V. 45, No. 11. P. 2145-2150. 158. Polyak В. T, Tempo R. Probabilistic robust design with linear quadratic regula- tors//Syst. Control Lett. 2001. V. 43. P. 343-353. 159. Pujara L. R. Some necessary and sufficient conditions for low-order interval polytopes to contain a Hurwitz polynomial // Proc. Conf. Dec. Control Phoenix, AZ, 1999. P. 5024-5029. 160. Qiu L, Bemhardsson B., Rantzer A., Davison E. J., Young P. M., Doyle J. C, A formula for computation of the real stability radius // Automatica. 1995. V. 31, No. 6. P. 879-890. 161. Rantzer A., Megretski A. A convex parametrization of robustly stabilizing con- trollers // IEEE Trans. Autom. Control. 1994. V. 39, No. 9. P. 1802-1808. 162. Recent advances in robust control / Eds. P. Dorato, R. Yedavalli. New York: IEEE Press, 1990. 163. Robust control / Ed. P. Dorato. New York: IEEE Press, 1987. 164. Robustness of dynamic systems with parameter uncertainties / Eds. M. Mansour et al. Monte Verita: Birkhauser, 1992. 165. Rosenbrock H. H. Computer-aided control system design. London: Academic Press, 1974. 166. Safonov M. G. Stability and robustness of multivariable feedback systems. Cam- bridge, MA: MIT Press, 1980. 167. Sanchez-Pena R., Sznaier M. Robust systems: theory and appplications. New York, Wiley, 1998. 168. Schweppe F. C. Uncertain dynamic systems. Englewood Cliffs, NJ: Prentice- Hall, 1973. 169. Siljak D. D. Large-scale dynamic systems: stability and structure. New York: North-Holland, 1978. 170. Stengel R F., Ray L. R. Stochastic robustness of linear time invariant control systems // IEEE Trans. Autom. Control. 1991. V. 36. P. 82-87. 171. Syrmos V. L., Abdallah С. T, Dorato P., Grigoriadis K. Static output feedback: a survey // Automatica. 1997. V.33, No. 2. P. 125-137. 172. Systems and control encyclopedia I Ed. M. G. Singh. V. 1-8. Pergamon Press, 1987. 173. Tempo R., Bai E. W., Dabbene F. Probabilistic robustness analysis: explicit bounds for the minimum number of samples H Syst. Control Lett. 1997. V. 30. P. 237-242.
294 СПИСОК ЛИТЕРАТУРЫ 174. The control handbook / Ed. W. S. Levine. CDC Press, IEEE Press, 1996. 175. Tsypkin Ya. Z., Polyak В. T. High-gain robust control П Eur. J. Control. 1999. V. 5, No. 1. P. 3-9. 176. Vidyasagar M. Control system synthesis: a factorization approach. Boston, MA: MIT Press, 1985. 177. Vidyasagar M. Optimal rejection of persistent bounded disturbances // IEEE Trans. Autom. Control. 1986. V.31. P.527-535. 178. Weinmann A. Uncertain models and robust control. Wien: Springer, 1991. 179. Willems J. C. The analysis of feedback systems. Boston: MIT Press, 1971. 180. Willems J. C. Least squares stationary optimal control and the algebraic Riccati equation // IEEE Trans. Autom. Control. 1971. V. 16, No. 6. P. 621-634. 181. Youla D. C., Jabr H. A., Bongiomo J. J. Modem Wiener-Hopf design of optimal controllers. Part П // IEEE Trans. Autom. Control. 1976. V.21. P.319-338. 182. Zames G. Feedback and optimal sensitivity: model reference transformations, multiplicative seminorms, and approximate inverses // IEEE Trans. Autom. Con- trol. 1981. V.26. P. 301-320. 183. Zhou K., Doyle J. C., Glover K. Robust and optimal control. Upper Saddle River, NJ: Prentice Hall, 1996.
РУССКО-АНГЛИИСКИИ СЛОВАРИК ПО УПРАВЛЕНИЮ А амплитуда — magnitude Б блок-схема — block diagram В возвратная разность — return differ- ence возмущение — disturbance, perturbation возмущение неизвестное, но огра- ниченное — unknown-but- bounded perturbation возмущение, подавление — disturbance rejection, disturbance atten- uation всплеск — peak effect вершина — vertex, extreme point Г годограф Найквиста — Nyquist plot, Nyquist diagram грамиан — gramian грамиан наблюдаемости — observabil- ity gramian грамиан управляемости — controllabil- ity gramian Д D-разбиение — D-partition, D-decom- position дополнение по Шуру — Schur comple- ment дробно-линейное преобразование — linear fractional transformation (LFT) дробно-линейное верхнее (нижнее) преобразование — upper (lo- wer) LFT E единичный круг — unit circle, unit disk 3 задающее воздействие — reference sig- nal, command signal запас устойчивости по амплитуде — gain margin запас устойчивости по фазе — phase margin звено — block звено апериодическое — aperiodic block звено колебательное — oscillatory block звено, соединение — connection звено, соединение в цепи обратной связи— feedback connection звено, соединение параллельное — parallel connection звено, соединение последователь- ное — series connection И интервал неопределенности — uncer- tainty interval К корректность — well-posedness корректирующий фильтр — prefilter коэффициент усиления — gain коэффициент усиления большой — high gain
296 РУССКО-АНГЛИЙСКИЙ СЛОВАРИК ПО УПРАВЛЕНИЮ коэффициент усиления критиче- ский — critical gain коэффициент усиления малый — low gain критерий качества (функционал) — performance index, cost func- tion критерий качества Рауса-Гурвица — Routh-Hurwitz test критерий качества Эрмита-Билера — Hermite-Bieler test Л линейное матричное неравенство — linear matrix inequality (LMI) логарифмическая частотная характе- ристика — Bode plot, Bode diagram M матрица — matrix матрица Адамара — Hadamard matrix матрица, фробениусова форма — com- panion form matrix матрица циклическая — cyclic matrix метод корневого годографа — root lo- cus метод пространства состояний — state space approach многогранник — polytope, polyhedron множество — set, domain множество допустимое -r- admissible set множество достижимости — reachabil- ity set, attainability set множество значений •— value set множество инвариантное — invariant set множество неопределенности — uncer- tainty domain H наблюдаемость — observability наблюдатель — observer невязка — residual неопределенность — uncertainty неопределенность аддитивная —addi- tive uncertainty неопределенность аффинная — affine uncertainty неопределенность интервальная — in- terval uncertainty неопределенность мультилинейная — multilinear uncertainty неопределенность мультипликатив- ная — multiplicative uncer- tainty неопределенность неструктурирован- ная — unstructured uncer- tainty неопределенность, область — uncer- tainty domain неопределенность параметрическая — parametric uncertainty неопределенность, структура — uncer- tainty structure неопределенность структурирован- ная — structured uncertainty неопределенность сферическая — spherical uncertainty неопределенность эллипсоидальная — ellipsoidal uncertainty несократимый — coprime несократимыйслева (справа) — left (right) coprime неустойчивый —unstable О обратная связь — feedback обратная связь отрицательная (поло- жительная)— negative (pos- itive) feedback обратная связь по выходу — output feedback обратная связь по состоянию — state fedback обратная связь статическая —static feedback объект — plant объект интервальный — interval plant объект минимально-фазовый — mini- mum phase plant объект неминимально-фазовый — nonminimum phase plant
РУССКО-АНГЛИЙСКИЙ СЛОВАРИК ПО УПРАВЛЕНИЮ 297 объект неопределенный — uncertain plant объект харигоновский — Kharitonov plant оператор — operator оператор сдвига вперед — shift opera- tor, forward shift operator оператор сдвига назад — delay opera- tor, backward shift operator отрицательное диагональное домини- рование — negative diagonal dominance ошибка измерения — measurement er- ror П параметризация — parametrization параметризация Фама-Медича — Fam-Meditch parametrization параметризация Юлы — Youla para- metrization перерегулирование — overshoot переходный процесс — time response, transient response полином — polynomial полином вершинный — vertex polyno- mial полином реберный — edge polynomial полином характеристический —- char- acteristic polynomial полиномы взаимно простые — coprime polynomials полюс — pole постоянная времени — time constant преобразование Лапласа — Laplace transform преобразование Лапласа дискрет- ное — z-transform преобразование Лапласа обратное — inverse Laplace transform принцип исключения нуля — zero ex- clusion principle причинность — causality Р равенство Безу — Bezout identity разложение на простые множители— coprime factorization размещение поляков — pole placement рассогласование — error реализация в пространстве состоя- ний — state-space realization реализация минимальная — minimal realization, irreducible realiza- tion регулятор — regulator, controller регулятор линейно-квадратичный — linear quadratic regulator (LQR) регулятор линейно-квадратичный га- уссовский — linear-quadratic Gaussian (LQG) regulator П-, ПИ-, ПИД-регулятор — P-, PI-, PID-regulator робастность — robustness робастность, радиус — robustness mar- gin C свертка — convolution сверхустойчивость — superstability сингулярное разложение — singular value decomposition (SVD) синтез — design, synthesis система — system система, вход — input система, выход — output система дискретная — discrete-time system система замкнутая — closed-loop sys- tem система линейная — linear system система линейная нестационарная — linear time varying (LTV) sys- tem система линейная стационарная — linear time invariant (LTI) sys- tem система многомерная (многосвяз- ная) — multi-input multi- output (MIMO) system система непрерывная — continuous- time system
298 РУССКО-АНГЛИЙСКИЙ СЛОВАРИК ПО УПРАВЛЕНИЮ система одномерная (односвязная) — single-input single-output (SISO) system система открытая — open-loop system система с одной степенью свободы — 1-DOF (1 degree of freedom) system система с двумя степенями свободы — 2-DOF (2 degrees of freedom) system система устойчивая — stable system слежение — tracking сокращение нулей и полюсов — pole- zero cancellation состояние — state стабилизация — stabilization стабилизация квадратичная — quadratic stabilization стабилизация одновременная— simul- taneous stabilization стабилизация робастная — robust sta- bilization степень устойчивости — degree of sta- bility структурное сингулярное число — structured singular value, ц Т таблица Рауса — Routh array теорема о малом коэффициенте усиле- ния — small gain theorem У управление — control управление в виде обратной связи — feedback control управление оптимальное — optimal control управление программное — program control управление робастное — robust control управляемость — controllability уравнение — equation уравнение Ляпунова — Lyapunov equa- tion уравнение Риккати — Riccati equation установившееся значение — steady state response устойчивость — stability устойчивость в дискретном времени — Schur stability устойчивость в непрерывном вре- мени — Hurwitz stability устойчивость внутренняя — internal stability устойчивость по выходу — bounded- input bounded-output (BIBO) stability устойчивость, радиус — stability mar- gin, stability radius Ф функция — function функция весовая — weighting function функция весовая, импульсная харак- теристика — impulse re- sponse функция единичного скачка — step function функция Ляпунова — Lyapunov func- tion функция передаточная — transfer func- tion функция передаточная дробно- рациональная — rational transfer function функция передаточная, замкнутой си- стемы — closed-loop transfer function функция передаточная матричная — matrix transfer function, trans- fer matrix функция передаточная (строго) реа- лизуемая — (strictly) proper transfer function функция переходная — step response 4 частота среза — crossover frequency частотная характеристика — fre- quency response чувствительность — sensitivity чувствительность дополнительная — complementary sensitivity
предметный указатель Алгоритм Рауса 83, 85 Аффинное семейство матриц 176 полиномов 176 вероятностная робастность 218 Вершинный элемент семейства 174 Весовые коэффициенты 143 Внешнее возмущение 16, 58, 158 Возвратная разность 58 Выход системы 16, 58 Гамильтониан 146 Гармонический сигнал 23-25, 151 Годограф 77 Михайлова 78 Найквиста 88, 115 обратный 117 Цыпкина-Поляка 189 Грамиан управляемости 48, 265 Границы Чернова 217 Диаграммы Боде 40 Дробно-линейное преобразование 178 Задающее воздействие 16, 57, 58 Запас устойчивости по амплитуде 89, 115 по фазе 89 Звено 39 апериодическое (инерционное) 39 апериодическое второго порядка 39 идеальный интегратор 39 идеальный усилитель 39 колебательное 39 последовательное соединение 22, 116,174,177 частотные характеристики 40 Инвариантное множество 104 Инвариантный эллипсоид 97 минимальный 98 Интервал неопределенности 174 Коэффициент усиления 32, 39, 115 большой 115, 119 критический 115 малый 119 Критерий Гурвица 84 Михайлова 78, 189, 190 Найквиста 88, 115, 207 дискретный случай 122 многомерный случай 91 робастная модификация 206 Рауса-Шура 85 Стодолы 79 Цыпкина-Поляка 190 Эрмита-Билера 78, 83 качества квадратичный 143 оптимальности 48, 51, 96, 143 Лемма Финслера 135, 258 Шура 98, 150, 257 Линейное программирование 11 -оптимизация 162 сверхстабилизация 137, 139, 165, 167 Масштабы изменения коэффициентов 176 Матрица вещественная блочно-диагональная форма 107, 263 гурвицева 65 жорданова форма 66, 74, 262 замкнутой системы 53, 128, 129
300 ПРЕДМЕТНЫЙУКАЗАТЕЛЬ интервальная 176 наблюдаемости 54 неопределенная, номинальное значе- ние 176 ортогональная 263 сверхустойчивая 103 дискретный случай 139 сингулярное разложение 264 сингулярное число 203 структурное сингулярное число 212 унитарная 263 управляемости 46 усиления 52, 131 фробениусова форма 37, 67, 68, 70, 75,262 Хаутуса 265 циклическая 262 шуровская 74 Метод корневого годографа 115 Множество допустимое 173 достижимости 93, 94 для входов, ограниченных в Лг-норме 94 для входов, ограниченных в Loo -норме 96 интегральная оценка 100 неопределенности 174 Наблюдаемая пара матриц 54 Наблюдаемость 53 критерий 54 Наблюдатель 55, 133 уравнение 133 Невязка 55, 57, 133 Неопределенность М-Д-конфигурация 179 в матричной норме 177, 200 радиус устойчивости 200 матричная структурированная 177 параметрическая 173, 181, 216 мультилинейная 176 полиномиальная 177 сферическая 175 частотная 178 аддитивная модель ошибок 178 дробно-линейная форма 178 мультипликативная модель оши- бок 178 Неравенство Ляпунова матричное 135, 270 Риккати 101, 273 линейное матричное 98, 149, 198 Норма 28 линейного оператора 28 (р, д)-ивдуцированная 28 дискретный случай 29 матричная 258 индуцированная 260 подчиненная 260 согласованная 260 спектральная (2-норма) 200, 259 столбцовая (оо-норма) 259 строчная (1-норма) 259 фробениусова 259 передаточной функции Я2-норма 32 Ноо-норма 31, 32, 102 дискретной, Ноо -норма 33 Область значений 187 аффинного семейства 192 интервального семейства 188, 190 дискретный случай 195 мультилинейногр семейства 194 сферического семейства 193 Обратная связь 51, 56, 115 отрицательная 57 по выходу 53 по оценке состояния 54, 133 по состоянию 51. 128, 143 статическая линейная 52 Объект минимально-фазовый 117 неопределенный 174 устойчивый 115 харитоновский 205 Оператор дифференцирования 19 линейный 26 интегральный 26 причинность 26 сдвига назад 24
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 301 Опорная функция множества 97, 99 Параметр Юлы 128 Параметризация Юлы 128 Параметры Фама-Медича 87 Передаточная функция 19, 55, 56 дискретной системы 24 замкнутой системы 87 матричная 20 номинальное значение 210 номинальной системы 215 объекта 56 от возмущения к выходу 19 от управления к выходу 19 полюсы 20-22 последовательного соединения 22 разомкнутой системы 56 регулятора 56, 210 скалярная 35 сокращение нулей и полюсов 89 устойчивая 20 харитоновская 205 Перемежаемость корней 78 Перерегулирование 131 Подавление возмущений 58 ограниченных 158 сверхстабилизация 164 Полином гурвицев 71 интервальный 175 неопределенный 174 номинальное значение 176 реберный 191 сверхустойчивый 86 харитоновский 188 шуровский 84 Постоянная времени 39 Потеря устойчивости замкнутой систе- мы 117 Префильтр (корректирующий фильтр) 58 Принцип исключения нуля 186 вероятностный аналог 219 дискретный случай 194 максимума 146 Пространство сигналов абсолютно интегрируемых 27 дискретных h 30 /2 29 Zoo 29 ограниченной интенсивности 27 ограниченной энергии 27 ограниченных с квадратом 26 существенно ограниченных 27 Равенство Безу 269 Радиус сверхустойчивости (матричный) 200 Радиус спектральный 73, 260 Радиус устойчивости 190 вероятностный 219, 221 вещественный 203 интервального полинома 190 дискретный случай 196 комплексный 201, 210 дискретный случай 204 структурированная неопределен- ность 202 матричного семейства 197 сферического семейства полиномов 193 Размах неопределенности 176 Размещение полюсов замкнутой си- стемы 128 дискретный случай 130 многомерный случай 130 Рассогласование 55 Реализация в пространстве состояний 21 минимальная 22 Регулятор линейно-квадратичный 51, 144 П-регулятор (пропорциональный) 115, 116 ПИ-регулятор (пропорционально-ин- тегральный) 119 ПИД-регулятор (пропорционально- интегральный дифференци- альный) 244 оптимальное управление 143 функция Ляпунова 149
302 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ линейный 52 стабилизирующий 114 Робастная стабилизация 181 интервального минимально-фазового объекта 227 интервального устойчивого объекта 227 Робастная устойчивость 181 матриц 197 достаточные условия 198 сверхустойчивость 199 полиномов 186 дискретный случай 194 Робастное качество 181 Робастность вероятностный подход 181, 216 максимальная 234 минимаксный подход 181 Сверхстабилизация 137 дискретный случай 139 нестационарные и нелинейные воз- мущения 181 Синтез управления 51 Система амплитудная частотная характери- стика 40 блок-схема 22 весовая функция 37 внутренняя устойчивость 92 дискретная 18 решение 18 замкнутая 17, 52, 114 импульсная характеристика 37 матричная 38 каноническая управляемая форма 37, 129, 139, 264 корректность 59 логарифмическая амплитудная ха- рактеристика (ЛАХ) 41 многомерная (MIM0) 34 неопределенная 173 непрерывная 16 решение 17 нестационарная 16 сверхустойчивость 105 номинальная 175, 211, 212 одномерная (SISO) 34 описание в пространстве состояний 16 описание с помощью передаточной функции 20 открытая 17 переходная характеристика 37 с двумя степенями свободы 58 с одной степенью свободы 58 сверхустойчивая 102 кусочно-линейная функция Ляпу- нова 104 оценка решения 103 сопряженная 145 управляемая 46 управляемая (дискретная) 50 устойчивая 71 фазовая частотная характеристика 40 характеристический полином 22 частотная характеристика 23 эквивалентная форма записи в виде дифференциального уравне- ния высокого порядка 34 Состояние системы 16 Стабилизация 114 дискретных систем 126 квадратичная 136 нестационарные и нелинейные возмущения 181 минимально-фазового объекта 118 многомерных систем 127 по выходу 133, 134 регулятором низкого порядка 114 Стабилизирующие регуляторы параметризация 124, 125 дискретный случай 126 многомерные системы 127 потеря устойчивости 124 Степень устойчивости 65 Таблица Рауса 83 Теорема Безу 268 Кэли-Гамильтона 256 Неванлинны-Пика 155 о малом коэффициенте усиления 208, 210, 215
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 303 реберная 192, 197 Харитонова 188, 197 Теория возмущений 197, 198 Управление 16, 42 в форме обратной связи 51 минимальной энергии 48 оптимальное 45, 143, 147 программное 45, 144 робастное 17, 173 Управляемая пара матриц 46 Управляемость 46 критерий 47, 50, 265 Уравнение диофантово 269 Ляпунова 69, 94, 270 дискретное 76, 96, 271 Риккати 100 алгебраическое матричное 148, 272 дифференциальное 147, 272 Условие реализуемости 21, 36 Условия Рауса-Гурвица 82 Устойчивость 64 BIBO 73 дискретный случай критерий 74 определение 73 спектральный радиус 74 матричная экспонента 65, 72 наличие возмущений 71 непрерывный случай критерий 64 определение 64 по входу 73 по начальному приближению 73 полиномов алгебраические критерии 82 графические критерии 77 дискретный случай 84, 122 понижение степени 82, 83, 85 приведение к фробениусовой форме 67 функция Ляпунова 68, 72, 76 частотные критерии 87 Фильтрации ошибок измерения 59 Функция весовая 26, 152, 210 дискретной системы 30 единичного скачка 37 Ляпунова 69 квадратичная 134 общая для семейства 198, 203 мупьтилинейная 176 от матрицы 265 Характеристический полином дискретной системы 24 замкнутой системы 114, 122, 124 матрицы 19, 256 системы 19, 21, 35 Цель управления 17 Частота среза 41, 89 Частотные методы 25 Чувствительность 57, 211 дополнительная 58, 211 Экспонента матричная 17, 267 Эллипс доверительный 219 Эллипсоид достижимости 94-96 Эффект всплеска 131 D- С-итерации 240 D-разбиение 119 дискретное 123 особые прямые 120 робастное 227 Яоо-оптимизация 152 h -оптимизация 158 М-Д-конфигурация 179, 212 ^-анализ 212 S-теорема 98, 258