/
Author: Квакернаак Х. Сиван Р.
Tags: регулирование и управление машинами, процессами теория автоматического управления
Year: 1977
Text
Йу.;-'<ч .' >,:,, , Щ Щ w ШШП шштш ы ¦ 'л 'Р ¦V Ч •lit I .W Ш'№ «и жлгс. жШ ДМ !» ti»,l »i: i" "hi к t i Л: !:'>i': i'>: ii1 W! .t^'M. Ш
LINEAR OPTIMAL CONTROL SYSTEMS HUIBERT KWAKERNAAK RAPHAEL SIVAN WILEV-INTERSCIENCE, A DIVISION OF JOHN WILEY & SONS, INC. NEW YORK • LONDON • SYDNEY • TORONTO 1972
X. КВАКЕРНААК, ж- Р. СИВАН ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ Перевод с английского канд. техн. наук В. А. ВАСИЛЬЕВА, каид. техн. наук Ю. А. НИКОЛАЕВА Предисловие академика Б. Н. ПЕТРОВА Издательство «Мир» Москва 1977
УДК 62-501.12 В книге на основании современной теории фильтрации и управления рассмотрены аспекты анализа и синтеза линейных оптимальных систем управления: проектирование детерминиро- детерминированных и стохастических регуляторов, оптимальная оценка со- состояния, чувствительности и оптимальности систем, управление дискретными системами. Книга отличается логичностью постро- построения, детальным обсуждением поставленных вопросов, ясным и и четким изложением материала на высоком научном уровне. Книга имеет прикладной характер и представляет большой интерес для широкого круга инженеров и научных работников, специализирующихся в области автоматического управления. Она может служить также учебным пособием для аспирантов и студентов старших курсов соответствующих специальностей. Редакция литературы по вопросам новой техники ^30501—169 1в9_7б © Перевод на русский язык, «Мир», 1977
Предиеловив к русскому, изданию Для современного этапа развития науки и техники характерны быстрый прогресс технической кибернетики и значительное рас- расширение сферы ее практического применения.Если ранее, в конце 40-х годов, когда заканчивался начальный период формирования теории автоматического регулирования, выдвигаемые практикой задачи заключались в автоматизации отдельных производствен- производственных процессов и управлении стационарными установками или движущимися объектами, то в настоящее время основными черта- чертами задач управления являются большая сложность объектов, не- необходимость управления совокупностью объектов, а также высо- высокие требования к точности и динамике управления. Так, например, развитие авиации и ракетно-космической техники обусловило по- постановку и необходимость решения принципиально новых проб- проблем: управление многосвязными объектами, построение оптималь- оптимальных систем стабилизации и терминального управления, управле- управление системами при неполной информации, построение цифровых систем управления и т. д. Это привело к интенсивной разработке и широкому практиче- практическому применению таких разделов теории, как оптимальное уп- управление (детерминированный и стохастический варианты задач) и адаптивное управление (в том числе теория экстремальных и самонастраивающихся систем). Наряду с разработкой новых разделов теории и принципов по- построения систем дальнейшее развитие получила теория линейных систем автоматического управления, в которой достигнуты весьма важные результаты. В значительной мере достижения в этой об- области связаны с работами Р. Калмана и Р. Бьюси по оптимальной линейной фильтрации, а также с работами А. М. Летова и Р. Кал- Калмана по синтезу линейных систем, оптимальных по квадратичному критерию качества; последняя задача известна также как задача аналитического конструирования оптимальных регуляторов. Следует отметить, что в линейной теории систем за последнее, время произошли существенные качественные изменения, связан- связанные с применением новых математических методов, которые широ- широко проникают в теорию управления и обогащают ее новыми идея- идеями. Полное признание получил подход с использованием понятия пространства состояний, применяющий методы линейной алгебры и теории дифференциальных и разностных уравнений. С уверен- уверенностью можно считать, что при построении оптимальных систем дальнейшее развитие получат подходы, основанные на методах
6 Предисловие к русскому изданию функционального анализа, теории случайных процессов и матема- математической статистики, математическом программировании. Широкий диапазон проблем управления сложными техниче- техническими системами, оснащенными информационными приборами и средствами вычислительной техники, а также возможность по- построения адекватных моделей на основе методов современной тео- теории управления привлекают к работе в данной области наряду с ин- инженерами широкий круг математиков, что способствует получе- получению новых важных результатов. Теория линейных систем автоматического управления является наиболее разработанным разделом технической кибернетики. Тра- Традиционными аспектами исследования линейных систем являются анализ устойчивости, исследование качества управления при нали- наличии управляющих и возмущающих воздействий, анализ динами- динамической точности при наличии случайных воздействий и синтез регуляторов, обеспечивающих выполнение заданных требований. За последние годы эти разделы обогатились новым содержанием, в результате чего в инженерной практике все шире находят при- применение анализ и синтез многосвязных систем, методы оптималь- оптимального оценивания состояния систем, методы детерминированной и стохастической теории оптимального управления. Основная тенденция развития теории линейных систем, несом- несомненно, определяется идеей оптимизации, разработке которой посвя- посвящено большое количество публикаций. В связи с этим представ- представляет большой интерес изложение в рамках одной книги теорети- теоретических и прикладных аспектов оптимального управления линей- линейными системами с учетом последних достижений в этой области. Эту задачу в достаточно полной мере удалось решить X. Квакер- нааку и Р. Сивану — авторам предлагаемой советскому читателю монографии «Линейные оптимальные системы управления». В кни- книге, посвященной в основном теории оптимальных систем с обратной связью, на высоком научном уровне ив доступной форме с единых позиций рассмотрен широкий круг вопросов анализа и синтеза таких систем. Самостоятельный интерес представляет гл. 1, в которой кроме вводных разделов и изложения традиционных аспектов анализа систем с использованием концепции пространства состояний дает- дается систематическое изложение теории устойчивости, управляемос- управляемости и восстанавливаемости. Приведенные в этой главе результаты можно рассматривать как обобщение и развитие идей, содержа- щихся в ранее опубликованных работах Р. Калмана, Л. Заде и Ч. Дезоера. „ Рассмотренные в гл. 2 вопросы анализа и проектирования ли- линейных систем с учетом влияния возмущений, шума наблюдений и неопределенности в знании параметров объекта базируются на концепции частотных характеристик. Полученные здесь резуль-
Предисловие к русскому изданию таты и рекомендации очень наглядны и имеют ясный физический смысл. В последующих трех главах излагается теория линейных не- непрерывных оптимальных систем с обратной связью. Гл. 3 посвящена построению оптимальных линейных систем при наличии полной информации о состоянии системы. При этом достаточное внимание уделяется всем основным задачам, таким, как синтез детерминированного регулятора с исследованием его свойств, синтез стохастического регулятора, построение следящих сис- систем и систем стабилизации. В гл. 4 рассматривается самостоятельная проблема оценива- оценивания фазового состояния линейной системы управления, решение которой осуществляется при наличии как шума, возбуждающего состояние системы, так и шума наблюдений. Оптимальное вос- восстановление состояния системы обеспечивается посредством най- найденных алгоритмов наблюдения (оптимальных наблюдателей). Здесь же плодотворно используется идея о том, что задача восстановле- восстановления состояния является двойственной (дуальной) задаче оптималь- оптимального управления. И наконец, с использованием результатов, полученных в пре- предыдущих двух главах, в гл. 5 излагаются методы построения оптимальных линейных систем при условии неполной и искажен- искаженной шумами информации о состоянии системы. Рассмотрением всего комплекса задач (таких, как задачи слежения и стабилиза- стабилизации с учетом наличия шумов) завершается теория непрерывных оптимальных систем. Заключительная глава посвящена теории линейного оптималь- оптимального управления для дискретных систем, в которой, по существу, рассматривается дискретный вариант всех аспектов теории, из- изложенных в гл. 1—5. При этом получены как результаты, анало- аналогичные непрерывному случаю, так и результаты, характерные только для дискретных систем и подчеркивающие их специфику. Следует отметить, что вопросы теории дискретных систем име- имеют особо важное значение. Это связано, в первую очередь, с широ- широким применением цифровых вычислительных машин (ЦВМ) в управлении различными процессами, что позволяет обеспечить решение широкого круга задач и реализацию сложных алгоритмов в реальном масштабе времени. Далее, необходимо иметь в виду, что универсальные ЦВМ в настоящее время являются основным и наиболее мощным инструментом для исследования проектируе- проектируемых систем на этапе математического моделирования; при этом исследуемые системы описываются..дискретными моделями. И на- наконец, особую актуальность приобретают вопросы'эффективности инженерных исследований при проектировании систем управления, что связано с разработкой для дискретных моделей вычислитель- вычислительных методов и алгоритмов, ориентированных на применение средств
8 Предисловие к русскому изданию современной вычислительной техники,' с целью автоматизации проектирования. Систематическое изложение методов линейной теории систем и оптимального управления в настоящей книге привлечет к ней внимание широкого круга специалистов. Инженеры и научные работники, специализирующиеся в об- области автоматического управления, найдут в ней разработку идеи оптимального управления, доведенную до алгоритмов, и могут использовать приведенные результаты для исследования и проекти- проектирования линейных моделей многих реальных систем. Кроме того, несомненный интерес вызовет изложение основных положений современной теории линейных динамических систем. Преподаватели вузов также найдут, в книге много полезного. Книга поможет им составить курс по теории автоматических сис- систем в свете современных представлений, а при работе с ней они от- отдадут должное стройности и методической направленности изло- изложения. Книга также может быть использована аспирантами и сту- студентами старших курсов с целью углубленного изучения разделов современной теории управления. В русское издание авторы книги внесли ряд уточнений и исправлений, которые приняты с благодарностью. Б. Н. Петров
Предисловие авторов За последние годы современная линейная теория управления. получила быстрое развитие и теперь она по общему признанию является мощным практическим инструментом для решения за- задач построения линейных замкнутых систем управления. Основ- Основными аспектами современной линейной теории управления явля- являются: описание систем посредством пространства состояний, опти- оптимизация в терминах квадратичного критерия качества и теория оптимального восстановления состояний Калмана — Бьюси. Зна- Значительное преимущество современной линейной теории управления над классической теорией состоит в ее применимости к задачам уп- управления различными системами, включая многомерные системы и системы с переменными параметрами; классическая теория огра- ограничена рассмотрением систем с одномерными входной и выходной переменными и постоянными параметрами. Использование термина «современная» теория управления мо- может внушить пренебрежение к «классической», или «обычной» теории управления, а именно теории, состоящей из.методов проек- проектирования, основанных на удобном аппарате передаточных функ- функций и изучении полюсов и нулей. Однако мы не разделяем таких убеждений; напротив, мы считаем, что классический подход, хо- хорошо разработанный и проверенный практикой, характеризуется комплексом разумно поставленных и полезных целей и задач. В данной книге предпринимается попытка примирить совре- современную линейную теорию с классической теорией управления. Одна из главных задач, поставленных в книге, заключалась в том, чтобы представить методы проектирования, которые при исполь- использовании современных методов приводят к созданию систем, удов- удовлетворяющих требованиям, разработанным в классической теории управления. Поэтому одна глава полностью посвящается ана- анализу управления на основе классических концепций. В последую- последующих главах книги, в которых разрабатываются современные ме- методы синтеза, имеются .также разделы по анализу. Более того, особое внимание уделяется вопросам, которые являются обычными в классической теории управления, но часто опускаются при сов- современном рассмотрении; это, например, системы управления с не- ненулевой заданной точкой, следящие системы и системы регулиро- регулирования при постоянных возмущениях. При этом подчеркивается стохастическая природа задач управления; для такого подхода стохастические аспекты являются весьма существенными. Мы считаем, что современную и классическую теории управле-
10 Предисловие авторов ния можно успешно изучать одновременно, так как они рассмат- рассматривают различные аспекты одних и тех же проблем. Этот подход нашел отражение в настоящей книге. Книга построена следующим образом. Около половины мате- материала, содержащего большинство методов анализа и синтеза, а также большое количество примеров представлено в разделах, не отмеченных звездочкой. Более детальные аспекты, такие как условия существования и результаты, касающиеся сходимости установившихся решений, рассматриваются в разделах, заглавия которых отмечены звездочкой. Не отмеченные разделы написаны таким образом, "чтобы они могли составить учебник для двухсе- местрового курса но теории управления. Отмеченные разделы составляют метериал для углубленного изучения. Инженер по управлению, интересующийся прикладными вопросами, найдет большинство методов в неотмеченных разделах, но также может обращаться к остальным разделам с целью получения сведений по более сложным вопросам. Предполагается следующая подготовка. Читатель должен пред- предварительно прослушать курс по линейным системам или линейным цепям, а также знать основы теории стохастических процессов. Рекомендуется также, чтобы читатель имел некоторый опыт по программированию и пользованию ЦВМ. Мы не считаем, что чи- читателю необходимо быть знакомым с классической теорией управ- управления перед изучением этой книги. Содержание книги разделяется по главам следующим образом. В гл. 1 «Элементы теории линейных систем» исходным пунктом является описание линейных систем в терминах их состояний, а концепции матричной передаточной функции и частотной харак- характеристики вытекают из описания состояния..Детально обсуждаются свойства, важные для анализа линейных оптимальных систем в установившемся состоянии: управляемость, стабилизируемость, обнаруживаемость и дуальность. Два последних раздела этой гла- главы посвящены описанию векторных стохастических процессов, при этом особое внимание уделяется представлению стохастиче- стохастических процессов как выходных переменных линейных дифференци- дифференциальных систем, возбуждаемых белым шумом. В последующих гла- главах этот материал часто используется. В гл. 2 «Анализ линейных систем управления» дается общее описание задач управления. Далее, она включает последователь- последовательный анализ различных аспектов анализа качества систем управле- управления. Системы управления, одномерные и многомерные, исследу- исследуются на основе единого подхода с использованием понятий Сред- Средних значений квадрата ошибки слежения и квадрата входной переменной. В гл. 3 «Оптимальные линейные системы управления с обрат- обратной связью» рассматривается обычное развитие задачи построе-
Предисловие авторов И ния линейного оптимального регулятора, а также дается доста- достаточно полный обзор установившихся свойств уравнения Риккати и оптимального регулятора. Днализируется численное решение уравнений Риккати и исследуются оптимальные стохастические регуляторы, оптимальные системы слежения, регуляторы при постоянных возмущениях и с ненулевыми заданными точками. В качестве специального вопроса обсуждаются асимптотические свойства установившихся законов управления и максимально достижимая точность систем регулирования и слежения. В гл. 4 «Оптимальное линейное восстановление состояния» дан вывод фильтра Калмана — Бьюси с позиций теории наблюдения. Изучаются также различные специальные случаи1, такие, как сингулярные задачи наблюдений, и исследуются задачи со сме- смешанным шумом наблюдений. Анализируются различные установив- установившиеся и асимптотические свойства оптимальных наблюдателей. В гл. 5 «Оптимальные линейные системы управления с обрат- обратной связью по выходной переменной» регуляторы с обратной связью по состоянию из гл. 3 объединяются с наблюдателями из гл. 4. Представлено эвристическое и относительно простое дока- доказательство принципа разделения, основанное на концепции об- обновления, которая обсуждается в гл. 4. Дана последовательность синтеза различных типов систем управления с обратной связью по выходной переменной и приведен обзор методов синтеза регуля- регуляторов пониженной размерности. ' В гл. 6 «Линейная теория оптимального управления для дис- дискретных систем» дается сжатое изложение теоретических резуль- результатов гл. 1—5 применительно к линейным дискретным системам управления. Особое внимание уделяется апериодическим по сос- состоянию и выходной переменной системам управления и вопросам синхронизации измерений и управления. На протяжении всей книги наиболее важные концепции вклю- включены в определения, а основные результаты представлены в форме теорем. Почти каждый раздел заключается одним или нескольки- несколькими примерами, многие из которых являются численными. Эти примеры предназначены для закрепления теоретического материа- материала и чтобы подчеркнуть практическую применимость результатов .теории. Большинство примеров является продолжением примеров, введенных в начале книги, поэтому каждая задача рассматрива- рассматривается в нескольких разделах и даже главах. При использовании численных значений уделяется внимание соответствующим раз- размерностям. В примерах используется система единиц СИ, которая сейчас принята в международном масштабе. Полный обзор систе- системы СИ можно найти.в Рекомендациях Международного совета по стандартизации. Книга включает около 50 задач, которые разделяются на две категории: элементарные упражнения, непосредственно иллюстри-
12 Предисловие авторов рующие материал текста, и дополнительные задачи, расширяю-, щие материал текста. В некоторых задачах необходимо использо- использовать цифровую вычислительную машину. Предполагается, что за- задачи, отмеченные звездочкой, не относятся к основному материалу книги. Соответствующие курсовые работы могут состоять из на- написания и испытания подпрограмм для ЦВМ, перечисленных в разд. 5.8. На протяжении всей книги даются многие ссылки на литера- литературу, однако при этом не делается попытки достичь определен- определенной степени полноты отражения имеющихся работ или осветить историю вопроса. Тот факт, что упоминается та или иная публи- публикация, просто означает, что она используется как источник и что в этой работе можно найти соответствующий материал. X. Квакершгак, Р. Сивсш
ЭЛЕМЕНТЫ ТЕОРИИ ЛИНЕЙНЫХ СИСТЕМ 1.1. Введение Настоящая книга посвящена анализу и синтезу линейных сис- систем управления. Необходимым условием для исследования линей- линейных систем управления является знание теории линейных систем. В связи с этим в настоящей главе дается обзор важнейших поло- положений теории линейных систем, а рассмотрение задач управления откладывается до гл. 2. Основная цель данной главы состоит в том, чтобы установить основные понятия, ввести обозначения и представить основные положения теории линейных систем. Отправной точкой является описание линейных систем методом пространства состояний. За- Затем рассматриваются решения линейных дифференциальных урав- уравнений состояния, устойчивость линейных систем и анализ таких системе помощью преобразования Лапласа. Последующие разделы затрагивают более сложные темы; в них рассмотрены вопросы уп- управляемости, восстанавливаемости и дуальности, а также кано- канонические формы фазовых переменных линейных систем. Глава заканчивается обсуждением векторных стохастических процессов и анализом реакции линейных систем на белый шум. Указанные темы играют важную роль в разработке теории. Поскольку предполагается, что читатель этой главы знаком с основами теории линейных систем, доказательства некоторых хорошо известных теорем опущены; при этом даются ссылки на соответствующие учебники. Некоторые разделы, касающиеся, в частности, управляемости, восстанавливаемости, дуальности и канонических форм фазовых переменных, обозначены звездоч- звездочками. Звездочка означает, что соответствующие темы являются более сложными; при этом полученные результаты используются только в разделах, отмеченных аналогичным образом. 1.2. Описание состояния линейных систем 1.2.1. ОПИСАНИЕ СОСТОЯНИЯ НЕЛИНЕЙНЫХ И ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ Многие системы^могут быть описаны системой дифференциаль- дифференциальных уравнений вида .x(t) = f[x(t),u(t),t]. A.1)
14 Глава 1 Здесь t — переменное время, x(t) — действительный п-мерный переменный во времени вектор-столбец, который обозначает состоя- состояние системы, a u(t) — действительный /с-мерный вектор-столбец, который обозначает входную переменную, или переменную управле- управления. Функция / является действительной и векторной. Для многих систем выбор состояния естественно следует из физического уст- устройства системы, а уравнение A.1), называемое дифференциаль- дифференциальным уравнением состояния, обычно непосредственно следует из элементарных физических законов, которым подчиняется сис- система. Пусть y(t) — действительная Z-мерная переменная системы, которая может быть наблюдаема или с помощью которой система воздействует на окружающую обстановку. Такая переменная называется выходной переменной системы, которая часто может быть представлена следующим образом: • y(t) = g[x(t), u(t), t]. A.2) Это уравнение называется уравнением выходной переменной сис- системы. Система, описываемая уравнениями A.1) и A.2), называется конечномерной дифференциальной системой или, короче, дифферен- дифференциальной системой. Вместе уравнения A.1) и A.2) называются уравнениями системы. Если векторная функция g определенно содержит и, говорят, что система имеет прямую связь. В данной книге рассматривается главным образом случай, когда / и g являются линейными функциями. В этом случае гово- говорят о (конечномерной) линейной дифференциальной системе, урав- уравнение состояния которой имеет вид x(t) = A(t)x(t) + B(t)u(t), . A.3) где A(t) и B(t) — переменные матрицы соответствующих размер- размерностей. Размерность п вектора х есть размерность системы. Урав- Уравнение выходной переменной такой системы имеет вид y{t) = C{t)x{t)+D{t)u{t). A.4) Если матрицы А, В, С и D постоянны, то система называется сис- системой с постоянными параметрами. 1.2.2. ЛИНЕАРИЗАЦИЯ В настоящем разделе будет показано, что если uo(t) — задан- заданная входная переменная системы, описываемой дифференциальным уравнением состояния A.1), a xo(t) — известное решение диффе- дифференциального уравнения, то можно найти приближенные решения для небольших отклонений от начального состояния и входной пе-
Элементы теории линейных систем 15 ременной из нелинейного дифференциального уравнения состояния. Предположим, что xo{t) удовлетворяет уравнению «о@ =/[*<»(*). «o(Oi *L to<t<tv A.5) Пусть и0 — номинальное значение входной переменной, а х0 — номинальная траектория. Часто можно предположить, что систе- система функционирует в условиях, близких к номинальным, т. е. и и х мало отличаются от и0 и х0 соответственно. Поэтому справедливо представление x(tj = xo(t9) + x(to), A.6) где и(?) и x(t0) — малые возмущения. Соответственно введем x{t) = xoft)+'x(t), *0 <«<*!. A.7) Подставим теперь х и ы. в дифференциальное уравнение состоя- состояния и применим разложение в ряд Тейлора. Тогда получим xo(t)+~x(t) = f[xo{t), uo(t), t]+Jx[x0(t), uo{t), t)Z(t) + + Ju [x0 (t), u0 (t), t] Z{t) + h (t), to<t< ti. A.8) Здесь J хш Ju — матрицы Якоби функция / относительно х и и соответственно, т. е. Jх — матрица, (г, /)-й элемент которой имеет вид где fi — i-компонента вектора /, а |у — j-я компонента вектора х. Матрица Ja определяется аналогичным образом. Пусть величина h(t) по предположению «мала» по сравнению с х ши. Пренебрегая этой величиной, видим, что х и и приближенно удовлетворяют линейному уравнению x(t) = A(t)'x(t)+B(t)Z(t), to*?t<tv A.10) где A(t)—Jx [xo(t), uo(t), 1], a B(t)=Ju[z0(t), uo(t), t]. Уравнение A.10) называется линеаризованным дифференциальным уравнением состояния. Начальным условием уравнения A.10) является x(t0).- Указанная процедура линеаризации представляет собой самый обычный метод, применяемый при решении задач управления. Часто удобно линеаризовать дифференциальные уравнения системы перед
16 Глава 1 представлением их в форме уравнений состояния. Это, естественно, приводит к тем же самым результатам (см. примеры разд. 1.2.3). Из учебников по дифференциальным уравнениям (см., например, [150]) следует, что аппроксимация x{t), полученная таким спосо- способом, может быть сделана с произвольной точностью, при условии что функция / обладает частным^производными по компонентам векторов х и и относительно номинальных значений х0, и0, интер- интервал [t0, ij] конечный, а начальное отклонение x(tQ) и отклонения входной переменной и выбираются достаточно малыми. В разд. 1.4.4 представлено дальнейшее обоснование широкого использования линеаризации при исследовании процессов уп- управления. 1.2.3. ПРИМЕРЫ В данном разделе приводится несколько примеров, иллюстри- иллюстрирующих, как уравнения физических явлений превращаются в дифференциальные уравнения состояния и как выполняется про- процедура линеаризации. Эти примеры обсуждаются довольно под- подробно, так как в дальнейшем они широко используются для ил- иллюстрации многих положений теории. Пример 1.1. Система управления положением перевернутого маят- маятника. Рассмотрим перевернутый маятник, показанный на рис. 1.1 (см. также в связи с этим примером работы [34, 55]). Ось маятника Маятник Телетка Рис. 1.1. Система управления положе- \—у нием перевернутого маятника.
Элементы теории линейных систем. 17 монтируется на тележке, которая может перемещаться в горизон- горизонтальном направлении. Тележка приводится в движение неболь-, шим мотором, который в момент времени t прикладывает к те- тележке силу [i(t), являющуюся входной переменной системы. На рис. 1.2 представлены силы и перемещения. В момент вре- времени t перемещение оси характеризуется функцией s(t), а угловое Рис. 1.2. Перевернутый маятник: силы и перемещения. отклонение маятника — функцией <р(?). Масса маятника' обозна- обозначена буквой тп, L — расстояние между осью и центром тяжести, / — момент инерции относительно центра тяжести и М — масса тележки. К. маятнику приложена сила mg в центре тяжести, а так- также горизонтальная H(t) и вертикальная V(t) силы реакции у оси маятника. Здесь g — ускорение силы тяжести. Для системы справедливы следующие уравнения: m -5— [s (t) + L sin ф (t)] = H (t), dt* m ¦ d«a dt A.11) A.12) A.13) A.14) .Трение учитывается только при движении тележки; в уравне- уравнении A.14) F — коэффициент трения. Трение оси маятника не учи- учитывается. После преобразования дифференциальных уравнений A.11) и A.12) имеем
18 Глава 1 m's(t) -\-mL<p(t) cosy (t) — mLy2 (t) sin у (t) = #(?). A.15) — mLy (t) sin ф (t) — mLy2 (t) cos ф (t) == V (t) — mg, A.16) / Ф (t) = LV (t) sin ф (t) —LH (t) cos ф (t), A.17) M's(t) = \i(t)—H(t)—Fs{t). . A.18) С целью упрощения уравнений предположим, что масса т мала по сравнению с М, и поэтому пренебрежем горизонтальной реакцией H(t) на движение тележки. Это позволяет заменить A.18) уравнением A.19) Исключая H(t) и V(t) из уравнений A.15)—A.17), получим (/ + mL2) ф (t) — mgL sin ф (t) + mLs (t) cos ф (t) = 0. A.20) Производя почленное деление яа,1-\~тЬ2, найдем Ф @ ГГ sin Ф @ + "тг s @-CO8 Ф @ = 0, A.21) где L'= / + mL2 . ¦ A.22) Эта величина называется эффективной длиной маятника, так как движение математического маятника длиной L' также описывает- описывается уравнением A.21). Выберем в качестве номинального решение |j,(?)=0, s(?)=0, <р(?)=0. Линеаризацию легко выполнить, разлагая sin ф(?) исоэф(?) в ряды Тейлора и подставляя в уравнение A.21) только первые чле- члены рядов. Линеаризация A.21) приводит к уравнению Ф @ - -jr Ф @ + -jr s @ = °- С1-23) В качестве компонент вектора состояния z(t) выбираем A.24) Третья компонента состояния представляет собой линеаризо-
Элементы теории линейных систем 19 ванную аппроксимацию перемещения точки маятника, находя- находящейся на расстоянии L' от оси. Функцию | 3@ рассматривают как перемещение маятника. При выбранных обозначениях из A.19) и A.23) определим линеаризованное уравнение состояния A.25) которое в векторно-матричных обозначениях имеет вид *@= ¦ Z n л x{t)+ " MO- A.26) 0 0 0 g V F M 0 0 0 0 0 g L' 0 0 1 0 x(t) + 0 1 M 0 0 где i@ = col[g1@, 12@, E8@. |4@b Ниже параметрам системы присваиваются следующие числен- численные значения: F _ M ~ 1 _ V ~ L' = 1 c-1 1 КГ 11,65 0,842 с, M. A.27) Пример 1.2. Смесительный бак. В данном примере исследуется типичная система управления процессом. Рассмотрим смесительный бак, схема которого пред- представлена на рис. 1.З.' Бак наполняется с помощью двух потоков, имеющих переменные мгновенные расходы F{(t) и F2(t). Оба вход- входных потока содержат растворимое вещество с постоянными вели- величинами концентрации ct и с2. Выходной поток имеет массовую
20 Глава 1 скорость истечения F{t). Предполагается, что содержимое бака перемешивается так, что концентрация выходного потока равна концентрации c(t) в баке. Клапаны Расход Ft Концентрация с, Высота h Расход Fz Концентрация сг Мешалка ^ Объем V Концентрация с' J Выходной расход F Концентрация с Рис. 1.3. Смесительный бак. Уравнения баланса масс для бака имеют вид —-— = ^i @ + F2 (t) —F (t), at — [с (t) V {t)] = CjFj (t) + c2F2 (t) —c(t)F (t), At A.28) A.29) где V(t) — объем жидкости в баке. Мгновенный расход выходного потока F(t). зависит от высоты h(t) следующим образом: F(t) = kVW), A-30) где к — экспериментальная константа. Если бак имеет постоян- постоянную площадь поперечного сечения S, то можно написать F(t) = тогда уравнения баланса масс примут вид A.31) A.32)
Элементы теории линейных систем 21 = ciFi(t) + c2F2(t) ~c (t) к Y^~. A-33) Рассмотрим сначала случай установившегося состояния, когда все величины являются постоянными: Fi0, F20 и Fo — расходы, Vo — объем и с0 — концентрация в баке. Тогда имеют место сле- следующие соотношения: 0 = ^0 + ^0-^, A.34) ^0 = При заданных Fi0 и F2o эти уравнения могут быть решены от- относительно Fo, V 0 и с0. Предположим теперь, что возникли не- небольшие отклонения от установившегося состояния. Напишем A.37) где ц\ шц2 рассматриваются как входные переменные, а ?4 и^2 — переменные состояния. В предположении, что указанные четыре параметра являются малыми, линеаризация A.32) и A.33) приво- приводит к уравнениям Ut) = ъ @ + ^ @ - -ж^ /-§-,6. @. A-38) A.39) Подставляя A.36) в эти уравнения, получим L @ = Vi @ +1»2 @ — \ -у- li (t), iz (t) Vo + c0 Ei @ = e^ (t) + с2[л2 (f) :_ i- c0 A- Uty Введем параметр -?- = et A.42)
22 Глава 1 называемый временем заполнения бака. Исключение |j из A.41) приводит к линеаризованному дифференциальному уравнению состояния i 29 0 0 1 где *(t) = col[ |,(*), gг(«) 1 и | ц( Если определить выходные переменные в виде то можно дополнить уравнение A.43) линеаризованным уравне- уравнением выходной переменной = 26 \x{t)> 0 гДе y(t) = col \fli(t), т]г(^M- Примем следующие численные зна- значения параметров: ^ю = 0,015 м3/с, F20 = 0,005 м3/с, Fo = 0,02 м3/с, ci — 1 кмоль/м3, ,A.46) с2 = 2 кмоль/м3, с0 = 1,25 кмоль/м3, Vo = 1 м3, е = 50 с. В результате линеаризованная система уравнений примет вид )*& + ( 0 —0,02; W 1,-0,25 0,75) A.47)
Элементы теории 'линейных систем 23 1.2.4. ПРЕОБРАЗОВАНИЯ УРАВНЕНИИ СОСТОЯНИЯ Иногда оказывается полезным использовать преобразованное представление уравнений состояния. В данном разделе кратко рассматриваются линейные преобразования линейных дифферен- дифференциальных систем с постоянными параметрами. Уравнения систе- системы имеют вид x(t) = Ax(t)+Bu(t), A48) Определим новую переменную состояния x'{t)=Tx(t), A-49) где Т — постоянная неособая (невырожденная) матрица преобразо- преобразования. Подставляя x(t)=T~lx'(t) в {1-48), получим A.50) или x'(t) = TAT-1x'(t)+TBu{t), A>51) г/@ = СТ-1 ж' (*). Таким образом, получены дифференциальное уравнение сос- состояния и уравнение выходной переменной системы для состояния x\t). Очевидно, что новое представление полностью эквивалентно первоначальной системе, так как всегда можно восстановить по- поведение системы в терминах первоначального состояния с помощью соотношения x(t)=T~lx'{t). Выбор состояния до некоторой степени является произвольным, и поэтому может быть произведен с уче- учетом той или иной цели. Многие свойства линейных систем с посто- постоянными параметрами остаются неизменными после преобразова- преобразования состояния (задачи 1.12.3, 1.12.6, 1.12.7). 1.3. Решение дифференциальных уравнений состояния линейных систем 1.3.1. ПЕРЕХОДНАЯ МАТРИЦА И МАТРИЧНАЯ ИМПУЛЬСНАЯ ПЕРЕХОДНАЯ ФУНКЦИЯ __^ Ниже рассматривается решение линейного дифференциального уравнения состояния
24 Глава 1 Для этого необходимо изложить несколько теорем [50, 190]. Теорема 1.1. Рассмотрим однородное уравнение x(t) = A(t)x(t). ' A.53) Если A{t) в этом уравнении является постоянной величиной для всех t, то оно всегда имеет решение х (t) = Ф (t, t0) х (t0) для всех t. A.54> Переходная матрица ф(?, t0) является решением матрич- матричного дифференциального уравнения —- Ф (t, t0) = A (t) Ф (t, t0) для всех t, dt A.55) где I — единичная матрица. Для системы с переменивши параметрами общего вида эта матри- матрица редко может быть выражена элементарными функциями, в^связи с чем приходится использовать методы численного интегрирова- интегрирования. Для систем с постоянными параметрами низкой размерности или простой структуры переходная матрица может быть вычисле- вычислена одним из методов, рассматриваемых в разд. 1.3.2, 1.3.3 и 1.5.1. Для более сложных систем с постоянными параметрами следует применять численные методы, описанные, например, в разд. 1.3.2. Можно показать, что переходная матрица обладает следующи- следующими свойствами [190]. Теорема 1.2. Переходная матрица ф(/, t0) линейной дифференци- дифференциальной системы уравнений имеет следующие свойства: а) Ф (t2, tt) Ф (tit t0) = Ф (t2, t0) для всех t0, tu t2; A.56) б) Ф(?, if0) является неособой для всех t, to\ A-57) в) Ф-Х(г, tQ) — ФA0, t) для всех t, t0; A.58) г) — ФТ (t0, t) = —АтA)ФтЦ0,г) для всех t, t0, A.59). dt где верхний индекс Т обозначает транспонирование. Свойство «г» означает, что система x{t)*= —AT (t)x(t) имеёт- переходную матрицу фт'(?0; t). Доказательство следует из диф- дифференцирования тождества <b(t,to)<b(to, t) = I.
Элементы теории линейных систем 25 Если переходная матрица найдена, то решения дифференци- дифференциального уравнения состояния A.52) могут быть легко получены. Теорема 1.3. Рассмотрим линейное дифференциальное уравнение состояния x(t) = A (t) x(t) + B(t)u (t). A,60) Тогда, если A{t) — непрерывная функция, a B(t) и u(t) — ку- кусочно-непрерывные функции для,всех t, решение уравнения A.60) имеет вид t хA)=Ф (t, t0) x (t0) + Г Ф (t, ч) В (т) и {z) dz для всех t. A.61) Этот результат легко проверить непосредственной подстанов- подстановкой в дифференциальное уравнение состояния [190]. Рассмотрим теперь систему с дифференциальным уравнением состояния A.60) и уравнением выходной переменной y(t) = C(t)x(t). A.62) Ддя выходной переменной имеем t у (t) = С (t) Ф (*, g;r(*0) + С @ j Ф (*, х) В (х) и (z) dz. A.63) и Если система имеет нулевое начальное состояние, т. е. x(to)=0, то реакция выходной переменной записывается в форме t ¦ y(t)= j K(t,*)u(x)di, *>*o. A-64) to где K(t,z) = C(t)O{t,z)B(z), *»т. A.65) Матрица K(t, %) называется матричной импульсной переходной функцией, потому что (i, ;)-й элемент матрицы является реакцией в момент времени t г-й компоненты выходной переменной на им- импульс, приложенный к /-й компоненте входной переменной в мо- момент времени % > t0, тогда как другие компоненты вектора входной переменной нулевые и начальное состояние также нулевое. Мат- Матричная переходная функция S{t, т) определяется следующим об- образом: ')йт', *>т. A.66) Здесь (г, /)-й элемент матричной переходной функции является реакцией в момент времени t i-ш компоненты выходной переменной,
26 Глава 1 когда 7-я компонента входной переменной является ступенчатой функцией, приложенной в момент времени % >tB, а все другие- компоненты вектора входной переменной равны нулю и началь- начальное состояние также нулевое. 1.3.2. ПЕРЕХОДНАЯ МАТРИЦА СИСТЕМЫ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ Переходная матрица системы с постоянными параметрами может быть вычислена точно [50, 139, 190]. Теорема 1.4. Система с постоянными параметрами x(t)=Ax(t) A.67) имеет переходную матрицу Ф(Мв) = «А('~''\ A.68) где экспоненциал квадратной матрицы М определяется как ряд ем= I + M + — М2+ — М3 + ..., ( который сходится для всех М. При малых размерах или простой структуре матрицы А этот результат может быть использован для точного представления переходной матрицы с помощью элементарных функций (см. при- пример 1.3). При большой размерности матрицы А теорему 1.4 впол- вполне можно использовать для вычисления переходной матрицы на ЦВМ, так как все требуемые алгебраические действия весьма прос- просто запрограммировать и выполнить. Такие программы должны включать в себя алгоритм остановки с целью ограничения беско- бесконечного ряда конечным числом членов. Обычный алгоритм оста- остановки заключается в ограничении ряда, когда добавление но- нового члена изменяет каждый из элементов частичной суммы меньше, чем на заданную величину. При слишком больших М могут возникнуть вычислительные трудности; это связано с тем, что приращение t — ta в уравнении A.68) не мо- может быть выбрано слишком большим [88, 91 ]. Наличие программы для вычисления матричного экспоненциала необхо- необходимо каждому исследователю, моделирующему линейные системы с постоянными параметрами. Существуют многочисленные работы по вычислению матричного экспоненциала и моделированию линейных систем, в частности можно рекомендовать работы [17, 56, 58, 100, 109, 111-114, 124, 136, 148, 173, 177-7179]. Мелса [127 1 приводит программу вычислений на ФОРТРАНе.
Элементы теории линейных систем 27 С учетом уравнения A.68) выражение A.63) в случае постоян- постоянных параметров принимает вид y{t) = CeMi-M x (t0) + С J eA(t~z) Bu (т) dz. A.70) to Сравнивая A.64) и A.70), можно видеть, что матричная им- импульсная переходная функция линейной- дифференциальной сис- системы с постоянными параметрами зависит только от it — т и может быть представлена как K(t—x) = CeMt-') В, *>т. A.71) Пример 1.3. Смесительный бак Однородное уравнение, соответствующее линеаризованному дифференциальному уравнению состояния бака из примера 1.2, имеет вид " С 0 -f Нетрудно найти, что его переходная матрица есть Ф {t, t0) = eMt~U) , A.72) A.73) где №1 Ступенчатое изменение расхода F, на 0,002 м3/с 0,002 100 200 t.c Ступенчатое Изменение расхода Fz на 0,001м3 1с 100 200 t, с ^ о 200 t, с S 0,1 100 200 t, с Рис. 1.4. Реакция смесительного бака на, ступенчатое изменение расхода.
28 Глава 1 e ' 2! V e, A.74) Матричная импульсная переходная функция системы равна —СО „-(/—О/в С2—?о -(/-¦О/в A.75) Теперь найдем матричную переходную функцию бака (а — (i — т:)/29 . , _((_-)/2Э s ct-c0 A g-(^)/B) С2~1 A с_(^)/8) ]• A-76) ^о Л> . / На рис. 1.4 представлены переходные функции для численных значений параметров из примера 1.2. 1.3.3. ДИАГОНАЛИЗАЦИЯ Точная форма переходной матрицы системы с постоянными параметрами может быть получена с помощью диагонализации матрицы А. Известен следующий результат [1331. Теорема 1.5. Предположим, что постоянная п ХпХматрица А имеет различные характеристические числа Хи %2, ..., Кп. Пусть еъ е2,..., еп — соответствующие собственные векторы. Определим п х п-матрицы Т = {еи е2, ... , еп), A.77а) i\. = diag(A.j, Х2, ... , А,„). A.776) Тогда Т является неособой и А может быть представлена как А^ТАТ-\ A.78) Здесь в уравнении A.77а) векторы е4, е2,..., еп являются столб- столбцами матрицы Г, а в уравнении A.776) Л — диагональная мат- матрица, где A,j, ^2>--ч ^п. — диагональные элементы. В этом случав говорят, что Т диагонализирует А. Кроме того, нетрудно убедиться в следующем факте.
Элементы теории линейных систем. 29 Теорема 1.6. Рассмотрим матрицу А, которая удовлетворяет допущениям теоремы 1.5. Тогда а)' ем = Тем Т1; A.79) б) ем = diag ( eXlt, ev, ... ехп'). A.80) Этот результат упрощает вычисления exp {At), если матрица А. диагонализирована. Поучительно представить тот же результат в иной форме. Теорема 1.7. Рассмотрим систему с постоянными параметрами x{t)=Ax{t), A.81), где А удовлетворяет допущениям теоремы 1.5. Запишем матрицу T~i в форме A.82) т. е. векторы-строки /ь /2,-.., fn являются строками матрицы Т~г. Тогда решение A.81) при ^„=0 может быть записано в виде *Ч/,*@). A-83) Это можно показать, выражая- аг(^)=7'ехр (Л^)Г ^@) через еь fi и exp(X;i), i = l,2,..., п. Запишем A.83) в виде где [it — скаляры /гаг(О), г —1,2,...,п. Отсюда видно, что реакция системы A.81) является комбинацией движений по собственным векторам матрицы А. Назовем такое движение модой системы: Каждая мода, имеющая компоненты по соответствующим собствен- собственным векторам, возбуждается соответствующим выбором началь- начального состояния. Очевидно, что характеристические числа Xt, i = i,2,...,n, в зна- значительной степени определяют поведение системы. Часто эти числа называют полюсами системы.
30 Глава 1 Даже в случае кратных характеристических чисел матрица А может быть диагонализирована при условии, что число линейно независимых собственных векторов для каждого характеристиче- характеристического числа равно кратности характеристического числа'. Более сложный случай, когда матрица А не может быть диагонализи- диагонализирована, обсуждается в разд. ,1.3.4. Пример 1.4. Перевернутый маятник. Однородное уравнение, соответствующее дифференциальному уравнению состояния маятниковой системы из примера 1.1, имеет вид x(t)=. О О О 1 ?_ М О О .0 -¦ь ° - g V о о 1 о x(t). A.85) Характеристические числа и собственные векторы матрицы А выражаются следующим образом: I, - П У - — 1 _ l/ e 1 0 1 0 1 1 F . ~~ М а F 0 0 1 ' У 17 0 0 1 -Vi- A.86) где g V A.87) g F* L' ~ M* и по предположению знаменатель а отличен от нуля. Матрица Т и обратная ей имеют вид Т = x 1 0 1 0 1 F ~ м. а F — а М 0 0 1 0 0 1 — 1/
Племс.пты теории линейных систем 31 1 0 1 2 1 2 F M F M ¦ F M F 1 2 + V V 1 2 0 0 1 2 1 ?, о о Модами системы являются A.88) 1 О 1 О J 1 F ~ М а F — а М 0 0 1 1 и о о 1 A.89) Первая мода показывает безразличие системы по отношению к горизонтальным перемещениям, тогда как третья мода иллюст- иллюстрирует неустойчивый характер перевернутого маятника. 1.З.4.* ЖОРДАНОВА ФОРМА В предыдущем разделе показано, что нахождение переходной матрицы может быть упрощено использованием диагонализа- ции матрицы А. Эта диагонализация невозможна, если га х га-мат- га-матрица А не имеет п линейно независимых собственных векторов. И этом случае, однако, можно привести матрицу А к так называе- называемой канонической форме Жордана, которая является квазидиаго- нпльной и из которой можно легко получить переходную матрицу. Сначала вспомним некоторые положения линейной алгебры. Кепи М — матрица, то нулъ-прострапство М определяется как множество ЛГ(М) = {х:х?Сп, Мх = 0}, A.90) Где Сп — га-мерное комплексное векторное пространство. Далее, * Смысл звездочки при обозначении раздела объясняется во введении.
32 Глава 1 ¦ . , если o/fli и з#2 — Два линейных подпространства n-мерного прост- пространства, то говорят, что линейное пространство М* = М&Мъ _ A.91) является прямой суммой о/К,г тз-qMz, если любой вектор x3^.aS Зжотет быть записан только единственным образом, как x3=xt-\-x2, где X^aSi И Х2€а#2- В связи с этим имеем следующий результат [190]. Теорема 1.8. Положим, что п х п-матрица А имеет к различных характеристических чисел kt, i = l,2,...,k. Пусть mt — кратность каждого характеристического числа Kt в характеристическом поли- полиноме матрицы А. Определим Mt = (A — XtI)mi A.92) и положим jrt = ЛГ {Mt). A.93) Тогда а) размерность линейного подпространства Jf'\ равна mt, i= I, 2,..,,к; б) полное п-мерное комплексное пространство Сп является прямой суммой нуль-пространств jft, i = l, 2,...,к, т. е. С^^ФЛ©...©^. A.94) Если матрица А имеет п различных характеристических чисел, то нуль-пространства jft трансформируются в одномерные под- подпространства, каждое из которых порождается собственным век- вектором матрицы А. Имеем следующий результат [133]. Теорема 1.9. Рассмотрим матрицу со свойствами, указанными в теореме 1.8. Тогда всегда можно найти неособую матрицу пре- преобразования Т Т = (ТиТг,...,Тк), A.95) для которой A = TJT~l, A.96) •где / = diag(/1,/2, ...,/,). A.97) Блок Ji имеет размерность mi x Щ, i== 1, 2,...,k, и каждому блоку Т\ соответствует своя матрица Jt. Столбцы матрицы Tt образуют специально выбранный базис для нуль-пространств «#*;, г = 1, 2,..., к. Блоки Jt могут быть представлены следующим обра- образом: Jt = diag (Jti, Ji2, ..., Jtli), A.98)
Элементы теории линейных систем 33 •¦<>е каждый подблок имеет форму г- 0 о . 0 . 1 Xi 0 1 .0 0 Xi 0 1 Xi A.99) Матрица / называется жордановой нормальной формой матрицы А. Выражение A.96) дает практический метод вычисления матри- матрицы преобразования [133]. Из этого выражения следует AT = TJ. A.100) Обозпачим столбцы матрицы Т как qlt q2, ..., qn. Тогда из формы матрицы / с учетом A.100) получим Aqt = Xqt + Ys^i-i i A.101) где Yz принимает значение 0 или 1 в зависимости от /, а К — ха- характеристическое число матрицы А. Пусть разбиение блока Tt матрицы Т, соответствующее разбиению A.98) блока Jt, имеет |шд Тii, Ti2, ..., Тцг. Тогда число Yj равно нулю, когда соответ- соответствующий столбец qt матрицы Т является первым столбцом под- подблока. Так как при Yz= 0 вектор q-b является собственным векто- вектором матрицы А, очевидно, что можно найти первые столбцы каж- каждого подблока как собственные векторы матрицы А. Оставшиеся столбцы каждого подблока тогда получаются из A.101) при yt = 1. Такие оставшиеся столбцы известны как обобщенные соб- собственные векторы. Этот процесс останавливается, когда A.101) не обеспечивает получения решения. Пример 1.5 в конце данного раздела иллюстрирует эту процедуру. Если матрица А представлена в жордановой нормальной форме, т<> нетрудно найти экспоненциал матрицы А. Теорема 1.10. Рассмотрим матрицу А со свойствами, указанными <¦ теоремах 1.8 и 1.9. Тогда а) И' = б) *" = и) e i = diag^e fi , e A' .V A.102) A.103) A.104)
34 Глава 1 1 t 2t 0 1*. , A.105) где и^ — размерность матрицы /г;.. Из этой теоремы следует, что реакция системы x(t) = Ax(t) A.106) может содержать кроме чисто экспоненциальных членов вида ехр (К^) также члены вида t exp(X^), t% ехр(^г?) и т. д. По аналогии с результатом из разд. 1.3.3 справедливо следую- следующее утверждение [190]. Теорема 1.11. Рассмотрим линейную систему с постоянными пара- параметрами x(t) == Ax(t). Выразим начальное состояние х@) ]шк Напишем к. 2 .1=1 A.107) A.108) A.109) где разбиение соответствует разбиению матрицы Т в теореме 1.9. Тогда реакция системы может быть выражена как x(t)= У A.110) Из этой теоремы следует, что, если начальное состояние принад- принадлежит одному из нуль-пространств J/'t, характер движения систе- системы из этого начального состояния полностью определяется^соот- определяется^соответствующим характеристическим числом. По аналогии с простым случаем из разд. 1.3.3 назовем движение системы из любого на- начального состояния, принадлежащего одному из нуль-пространств, модой системы.
Элементы теории линейных систем 35 Пример 1.5. Перевернутый маятник Рассмотрим пер'евернутый маятник из примера 1.1 в предполо- предположении, что трением тележки можно пренебречь, так что F = 0. Однородное уравнение, соответствующее линеаризованному диф- дифференциальному уравнению состояния, теперь имеет вид x(t) = =Ax(t), где1 , A.111) 0 0 0 g V 1 0 0 0 0 0 и g V о. 0 1 0 Характеристические числа матрицы А равны л a j a j 1/ « j \/ s (\ 112^ Нетрудно найти, что существует только один собственный вектор 1 51, ¦ A.ИЗ) соответствующий двукратному характеристическому числу 0. Числам К3 и Х4 соответствуют собственные векторы 0 0 1 У v о о 1 A.114) Так как характеристические числа К3 и ^ являются единствен- единственными, то соответствующие нуль-пространства имеют размерность, равную единице, и порождаются собственными векторами. Пос- Поскольку нуль представляет собой двукратное характеристическое число, соответствующее" нуль-пространство является двумерным. Имеет место лишь один подблок в жордановой форме размерами 2x2, поскольку не существует двух линейно независимых соб- собственных векторов. Пусть характеристический вектор A.113) является первым столбцом q{ матрицы преобразования Т. Тогда второй столбец д2 должен определяться из уравнения = 0 • q2 + qt. A.115)
36 Глава 1 Нетрудно найти, что общее решение этого уравнения имеет вид 1/ До A.116) где Р — произвольная константа. Примем {3 = 0. Поскольку q3 и qt должны быть собственными векторами A.114), найдем матри- матрицу преобразования Т Т = 1 о 1 о 1 о 0 1 о о 1 о о 1 V-t A.117) Соответствующая жордавова нормальная форма матрицы А имеет вид /== О О 1 О о о о о V о о о \ -VJ A,118) Экспоненциал матрицы А нетрудно найти из уравнений A.102), A.117) и A.118). 1.4. Устойчивость 1.4.1. ОПРЕДЕЛЕНИЕ УСТОЙЧИВОСТИ В настоящем разделе рассматривается поведение дифференци- дифференциальных систем на длительном интервале времени. Пусть нелиней- нелинейное дифференциальное уравнение состояния имеет вид x(t)=*f\x(t), u(t), t]. • A.119) Важно установить, обладают ли решения дифференциального уравнения состояния свойством неограниченно возрастать при t->-oo. Для упрощения вопроса предположим, что имеем дело с ав- автономной системой, т. е. в системе отсутствует входной сигнал и или, что эквивалентно, входной сигнал является фиксированной
Элементы теории линейных систем 37 величиной. Таким образом, перейдем к системе x{t) = f[x(t),t]. ¦ A.120) Так же как в разд. 1.2.2 при выполнении линеаризации, вве- введем понятие номинального решения xo(t), которое удовлетворяет дифференциальному уравнению состояния: х (Л = f[x (t) t). A 121) Особый интерес представляет случай, когда xo(t) является пос- постоянным вектором хе; в этом случае говорят, что хе характеризует состояние равновесия системы. Исследуем вопросы устойчивости решений дифференциальных уравнений состояний. Сначала дадим следующее определение (в связи со всей последовательностью приводимых ниже определе- определений см. также [24, 89, 190]).. Определение 1.1. Рассмотрим дифференциальное уравнение сос- состояния x(t) = f[x(t),t] A.122) с. номинальным решением xo(t). Номинальное решение этого уравнения является устойчивым в смысле Ляпунова, если для любого t0 и для любого е > 0 существует б(е, t0) >> 0 (зависящее от & и, возможно, от t0), такое, что при\\ x(t0) — 2о(^о)|| ^ б удов- удовлетворяется неравенство^ x(t) — ^о@|| < е &ля всех t >- t0. ¦ Здесь \\x\\ обозначает норму вектора х, которой может быть эв- эвклидова норма H*li=l/ У.1*, A-123) где lt, i =1,2, ..., п, — компоненты х. Можно использовать также и другие нормы. Устойчивость в смысле Ляпунова гарантирует, что состояние не отклоняется слишком далеко от номинального решения при начальном состоянии, достаточно близком к номинрльному реше- решению. Устойчивость в смысле Ляпунова является довольно слабой формой устойчивости. Поэтому расширим понятие устойчивости. Определение 1.2. Номинальное решение xo(t) дифференциального уравнения состояния x(x)=f[.r(t),t] A.124) является асимптотически устойчивым, если
38 Глава 1 а) оно устойчиво в смысле Ляпунова; б) для всех t0 существует такое p(t0) > 0 (возможно, завися- зависящее от t0), что в случае \\x(t0) — ?o(^o)l|<f>4 имеем || х (t) —x0 (t) || -> О при Таким образом, асимптотическая устойчивость в дополнение к устойчивости в смысле Ляпунова приводит к тому, что решение всегда приближается к номинальному решению при начальном отклонении, удовлетворяющем неравенству .11 *(*„) — x0(t0) |[<.р. Асимптотическая устойчивость не всегда дает информацию при больших начальных отклонениях от номинального решения. Сле- Следующее определение соответствует случаю произвольных пачаль- ных отклонений. Определение 1.3. Номинальное решение xo(t) дифференциального уравнения состояния x(t) = f[x{t),t\ A.125) является асимптотически устойчивым « целом {большом), если а) оно устойчиво в смысле Ляпунова; б) для любого x(t0) и любого t0 \\x(t) — xo(t)\\-+O A.126) при t—*-oo. К решению, асимптотически устойчивому в целом,, в итоге приближаются все другие решения. Пока что обсуждалась только устойчивость решений. Для нели- нелинейных систем это необходимо вследствие сложности явлений, характерной для этих систем. В случае линейных систем, однако, ситуация проще, и целесообразнее говорить об устойчивости сис- систем, а не об устойчивости решений. Поясним это утверждение. Положим, что xo(t) — любое номинальное решение линейного дифференциального уравнения x(t) = A(t)x(t), A.127) a x(t) — любое другое решение уравнения A.127). Поскольку и ;ro(t), и x(t) являются решениями дифференциального уравнения ^1.127), x(t) — xo(t) также является решением, т. е. 4- [x(t)~-x0 @1 = A(t)[x (t)-x0 (*)]• A.128) at
Элементы теории линейных систем, 39 Очевидно, что для анализа устойчивости номинального решения xo(t) можно исследовать устойчивость тривиального решения, т. е. решения x(t) = 0. Если нулевое решение устойчиво в любом смыс- смысле (по Ляпунову, асимптотически или асимптотически в целом), любое другое решение будет также устойчивым в том же смысле. Поэтому введем следующую терминологию. Определение 1.4. Линейная дифференциальная система x{t) = A(t)x(t) A.129) устойчива в определенном смысле (по Ляпунову, асимптотически или асимптотически в целом), если тривиальное решение oro(t) = -~ 0 устойчиво в этом смысле. В дополнение к тому, что все номинальные решения линейной дифференциальной системы обнаруживают одинаковые свойства устойчивости, для линейных систем пет необходимости делать раз- различие между асимптотической устойчивостью и асимптотической устойчивостью в целом, что утверждается в следующей теореме. Теорема 1.12. Линейная дифференциальная система x(t) = A(t)x(t) A.130) асимптотически устойчива тогда и только тогда, когда она асим- асимптотически устойчива в целом. Эта теорема следует из того, что для линейных систем решения могут быть продолжены без изменения их поведения. Завершим этот раздел введением другой формы устойчивости, которую определим только для линейных систем [24]. Определение 1.5. Линейная дифференциальная система с перемен- переменными параметрами является экспоненциально устойчивой, если существуют положи- положительные константы а и §, такие, что x(t) = A(t) x(t) ' A.131) '•о устойчивой, если существуют положи- Р, такие, что :¦ || x(t) || < ае~г<*~^ il x(t0) \\, t>t0, _ A.132) г'ля каждого начального состояния x(t0). Экспоненциально устойчивая система обладает тем свойствам, что текущее состояние экспоненциально сходится к нулевому сос- состоянию независимо от начального состояния. Поясним понятия, введенные в этом разделе, несколькими примерами.
40 Глава 1 Пример 1.6. Перевернутый маятник Положение равновесия s{t) = 0, ф@ = 0, \i(t) = 0 переверну- того маятника из примера 1.1 (разд. 1.2.3), очевидно, не является устойчивым в любом смысле. Пример 1.7. Обычный маятник "Рассмотрим маятник, описанный в примере 1.1 (разд. 1.2.3). Положим [i(t) = 0. Из физических соображений ясно, что решение s(t) = 0, ср(О = я (соответствующее обычному подвешенному маят- маятнику) является устойчивым в смысле Ляпунова; выбором достаточ- достаточно малых начальных отклонений и скоростей можно добиться, что- чтобы движения системы оставались произвольно малыми. Система, однако, не является асимптотически устойчивой, так как не пред- предполагается наличие трения в маятнике; однажды возникая, дви- движение маятника не прекращается. Более того, если придать тележ- тележке начальное перемещение; она не вернется в нулевое положение без помощи внешней силы. • Пример 1.8. Смесительный бак Рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3). При u(t) = 0 линеаризованная система описывается уравнением ¦ JL о о —- которое имеет решения i,@ = e-</23|1@), *>o, A.134) 52@ = e-"9g2@), *>о. Очевидно, ?t@ и ?2@ всегда приближаются к нулевому зна- значению при возрастании t, так как 6> 0. В результате линеаризо- линеаризованная система асимптотически устойчива. Более того, поскольку сходимость к положению равновесия является экспоненциальной, система экспоненциально устойчива. Из разд. 1.4.4 видно, что если линеаризованная система асим- асимптотически устойчива, то положение равновесия, относительно которого была произведена линеаризация, является асимптоти- асимптотически устойчивым, но не обязательно асимптотически устойчи- устойчивым в целом. Из физических соображений, однако, следует ожидать, что в данном случае система является асимптотически устойчивой в целом.
Элементы теории линейных систем 1.4.2. УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ В этом разделе определяются условия, при которых линейные системы с постоянными параметрами обладают той или иной из рассмотренных выше форм устойчивости. Рассмотрим систему x(t) = Ax(t), A.135) где А — постоянная матрица п X п. В разд. 1.3.3 мы видели, что, если А имеет различные характеристические числа Xv K2, •¦•, Я„ и соответствующие собственные векторы еи е2, • •-, еп, реакция системы на произвольное начальное отклонение может быть пред- представлена как V где скаляры цг, i = 1, 2, ..., п, определяются из начального сос- состояния х@). Для систем с педиагонализируемой матрицей А это выражение содержит добавочные члены вида ?*ехр (Х,?) (разд.1.3.4). Ясно, что устойчивость системы в обоих случаях определяется характеристическими числами Х;. При этом имеем следующий результат. Теорема 1.13. Линейная система с постоянными параметрами x{t)=Ax{t) .A.137) является устойчивой в смысле Ляпунова тогда и только тогда, а) все характеристические числа А имеют неположительные действительные части и б) любому характеристическому числу' на мнимой оси кратнос- кратности т точно соответствует т собственных векторов матрицы А. Условие (б) необходимо для ограничения членов, которые воз- возрастают как tk (разд. 1.3.4). Это условие всегда удовлетворяется, вели А не имеет кратных характеристических чисел на мнимой оси. Для асимптотической устойчивости необходимы несколько бо- более жесткие условия. Теорема 1.14. Система с постоянными параметрами x(t) = Ax(t). A.138) является асимптотически устойчивой тогда и только тогдаг когда все характеристические числа матрицы А имеют строго отрица- отрицательные действительные части.
42 Глава 1 ' Этот результат нетрудно доказать. Более того, видно, что, если линейная система с постоянными параметрами является асимпто- асимптотически устойчивой, сходимость текущего состояния к нулевому состоянию экспоненциальная. Этот результат формулируется в следующей теореме.' Теорема 1.15. Система с постоянными параметрами x(t)=Ax(t) ¦ A.139) является экспоненциально устойчивой тогда и только тогда, когда она асимптотически устойчива. Поскольку асимптотическая устойчивость системы определяет- определяется матрицей А, удобно использовать следующую терминологию. Определение 1.6. Постоянная матрица А размерности п X п является асимптотически устойчивой, если все ее характеристи- характеристические числа имеют отрицательные действительные части. Характеристические числа матрицы А являются корнями ха- характеристического полинома XI — А. С помощью хорошо извест- известного критерия Рауса—Гурвица (см., например, [159]) устойчи- устойчивость матрицы А может быть непосредственно исследована по ко- коэффициентам характеристического полинома, без вычисления корней. При рассмотрении систем, не являющихся асимптотически устойчивыми, удобно <выделять те' характеристические числа мат- матрицы А, которые имеют строго отрицательные действительные час- части, как устойчивые полюсы системы, а оставшиеся характеристи- характеристические числа — как неустойчивые полюсы. Завершим этот раздел простым примером. Дополнительный пример приводится в разд. 1.5.1. Пример 1.9. Смесительный бак Матрица А линеаризованного дифференциального уравнения, состояния из примера 1.2 имеет характеристические числа — A/29) и —A/9). Как показано выше (пример 1.8), линеари- линеаризованная система асимптотически устойчива, так как 8>0. 1.4.З.* ПОДПРОСТРАНСТВА УСТОЙЧИВЫХ И НЕУСТОЙЧИВЫХ СОСТОЯНИЙ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ В этом разделе показывается, как пространство состояний линей- линейной дифференциальной системы с постоянными параметрами мо- может быть разбито на такие два подпространства, что движение системы из начального состояния, принадлежащего первому под- подпространству, всегда сходится к нулевому состоянию, тогда как
Элементы теории линейных систем ¦ 43 движение из ненулевого начального состояния, принадлежащего другому подпространству, никогда не сходится. Рассмотрим систему с постоянными параметрами • x(t)=,Ax(t) A.140) и предположим, что матрица А имеет различные характеристи- характеристические числа (более общий случай обсуждается в данном разделе ниже). Тогда, как было показано в разд. 1.3.3, реакция этой сис- системы может быть представлена в виде где At, лг, .,., А„ — характеристические числа, а еи ..., еп — со- соответствующие собственные векторы. Коэффициенты \it, \i2, ¦¦. ..., H,t показывают, как осуществляется декомпозиция начального состояния по векторам еъ е2, •••, еп. Предположим теперь, что система не является асимптотически устойчивой, что соответствует случаю, когда некоторые характе- характеристические числа имеют неотрицательные действительные час- части. Ясно, что текущее состояние будет сходиться к нулевому'сос- тоянию только в том случае, когда начальное состояние имеет компоненты только цо таким собственным векторам, которые соответствуют устойчивым полюсам. Если начальное состояние имеет компоненты только по соб- собственным векторам, соответствующим неустойчивым полюсам, реакция системы будет состоять из неубывающих экспонент. Это приводит к следующей декомпозиции пространства состояний. Определение 1.7. Рассмотрим п-мерную систему x(t) = Ax(t) где А — постоянная матрица. Положим, что А имеет п различ- различных характеристических чисел. Определим подпространство ус- устойчивых состояний этой системы как действительное линейное подпространство, порожденное теми собственными векторами ма- матрицы А, которые соответствуют характеристическим числам со строго отрицательными действительными частями. Для такой системы подпространством неустойчивых состояний является действительное подпространство, порожденное теми соб- собственными векторами, которые соответствуют характеристиче- характеристическим числам с неотрицательными действительными частями. Распространим это понятие на линейные системы g постоян- постоянными параметрами более общего вида. В разд. 1.3.4 было показано, что реакция системы может быть представлена в виде * it)Uivit A.142)
44 Глава 1 где vt находятся в нуль-пространствах Л\, i = 1, 2, ..., к. По- Поведение выражения exp (/;i) определяется характеристическим числом Лг; только в том случае, если Kt имеет строго отрицательную действительную часть, соответствующая компонента состояния стремится к нулевому состоянию. По аналогии с простым случаем, данным в определении 1.7, получаем следующую декомпози- декомпозицию. Определение 1.8. Рассмотрим п-мерную линейную систему с пос- постоянными параметрами. Определим подпространство устойчи- устойчивых состо яний этой системы как действительное подпространство прямой суммы тех нуль-пространств jft, которые соответству- -ют характеристическим числам матрицы А со строго отри- отрицательными действительными частями. Аналогичным образом определим подпространство неустойчивых состояний матрицы А как действительное подпространство прямой суммы тех нуль- пространств JPi, которые соответствуют характеристическим числам матрицы А с неотрицательными действительными час- частями. ' В соответствии с этим определением все действительное и-мер- ное пространство Мп есть прямая сумма подпространств устой- устойчивых и неустойчивых состояний. Пример 1.10. Перевернутый маятник В примере 1.4 (разд. 1.3.3) показано, что матрица А линеари- линеаризованного дифференциального уравнения состояния переверну- перевернутого маятника имеет следующие характеристические числа и векторы: ? Y Yjr. A.143) ei =r 1 0 1 n 1 F ~ М а F м , ея = 0 0 1 ¦t/~f { V V о 1 V A.144)
Элементы теории линейных систем 45 Очевидно, что подпространство устойчивых состояний этой сис- системы порождается векторами е2 и е4, тогда как подпространство неустойчивых состояний порождается векторами е{ и е3. Пример 1.11. Перевернутый маятник без трения В примере 1.5 (разд. 1.3.4) была рассмотрена жорданова нор- нормальная форма матрицы А для перевернутого маятника без тре- трепня и найдены двукратное характеристическое число 0 и простые характеристические числа ]/g/L' и —|/g/L/. Нуль-пространство, соответствующее характеристическому числу 0, порождается пер- ш.ши двумя столбцами матрицы Т, т. е. A.145) Эти два вектора вместе с собственным вектором, соответствую- соответствующим числу Vg!U, т.е. О О 1 и A.146) порождает подпространство неустойчивых состояний системы. Под- Подпространство устойчивых состояний порождается оставшимся собственным вектором ( О О 1 A.147) L' ) 1.4.4.* ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ НЕЛИНЕЙНЫХ СИСТЕМ НО ЛИНЕАРИЗОВАННОЙ МОДЕЛИ Настоящая книга посвящена в основном синтезу линейных сис- систем управления. Первоочередной задачей при этом является обес- обеспечение устойчивости. В последующих главах разрабатываются эффективные методы построения устойчивых лннейных замкдутых систем управления.
46 "Глава 1 Однако, как ранее было показано, реальные системы никогда не бывают линейными, а используемые линейные модели получают- получаются после линеаризации. Таким образом, целесообразно - разрабатывать лишь те еис- темы, линеаризованные модели которых обладают хорошими свойствами. При этом возникает вопрос: какие из этих свойств сохраняются у функционирующей реальной нелинейной системы? Здесь оказывается полезным следующий результат. Теорема 1.16. Рассмотрим систему с постоянными параметрами, состояние которой описывается дифференциальным уравнением i@ = /[*(*)]¦ A-148) Предположим, что система имеет положение равновесия хе, а функция f имеет, частные производные по компонентам х прихе. Предположим, что линеаризованное относительно хе диффе- дифференциальное' уравнение состояния имеет вид x(t)=Ax(t), .A.149) где постоянная матрица А является якобианом функции / по отно- отношению к хе. Тогда, если матрица А асимптотически устойчива, x{t) = хе является асимптотически устойчивом решением урав- уравнения A.148). Доказательство читатель мо5кет найти в работе [150]. Заметим, что по линеаризованному дифференциальному уравнению состоя- состояния нельзя, Конечно, сделать заключения об устойчивости. Приведенная теорема подтверждает сделанный вывод. Поло- Положим, что первоначально система является неустойчивой, и линеа- линеаризованные уравнения используются для синтеза регулятора, обеспечивающего устойчивость линеаризованной системы. Тогда на основании теоремы следует, что реальная нелинейная система с этим регулятором будет, по крайней мере, асимптотически ус- устойчивой для небольших отклонений от положения равновесия. Заметим, однако, что теорема справедлива- только тогда, когда в системе имеются «гладкие» пелинейности. Если имеются эле- элементы с разрывными характеристиками (зоны нечувствительнос- нечувствительности, сухое трение), теорему применять нельзя. В заключение заметим, что, если некоторые из характеристи- характеристических чисел матрицы А имеют нулевые действительные части, а все другие характеристические числа имеют строго-отрицатель- строго-отрицательные части, никаких выводов об устойчивости относительно хе не может быть сделано в результате анализа линеаризованной "системы. Если А имеет несколько характеристических чисел с
Элементы теории линейных систем 47 положительными действительными частями, то хе не является устойчивым в любом смысле [150]. В гл. 2 (разд. 2.4, пример 2.6) приводится пример применения этой теоремы. L.5. Анализ систем с постоянными параметрами на основе преобразования Лапласа 1.5.1. РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНОГО УРАВНЕНИЯ СОСТОЯНИЯ С ПОМОЩЬЮ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА Часто весьма удобно исследовать линейные системы с постоян- постоянными параметрами с помощью преобразования Лапласа. Опреде- Определим преобразование Лапласа вектор-функции z( t) следующим об- ра.чом: со Z{s) = X[z(t)]= f e~slz{t)dt, A.150) где s — комплексная переменная. Символ Jjf обозначает операцию преобразования Лапласа функции, стоящей в квадратных скоб- скобках. Преобразование Лапласа определяется для тех значений s, при которых интеграл A.150) сходится. Очевидно, что преобразова- преобразование Лапласа вектор-функции z{t) является вектором, компоненты которого являются преобразованиями Лапласа компонент вектора z(t). Рассмотрим сначала однородное дифференциальное уравнение состояния x{t) = Ax{t), A.151) где А — постоянная матрица. Выполняя преобразование Лапласа , получим ос-ссы?и.+^ -> •?, X(s)— x@) = AX(s), A.152) так как все обычные теоремы преобразования Лапласа для ска- скалярных выражений справедливы и в" векторном случае [139]. Решение относительно X(s) имеет вид X (s) = {si — Л) х @). ¦ A.153) Во временной области этому соответствует выражение x{t) = eAt х{0). ' , A.154) Таким образом, имеем следующий результат.
48 Глава 1 Теорема 1.17. Пусть А является постоянной матрицей п X п., Тогда (si — А)'1 — X[eAi] или, что эквивалентно, eAt = X~l [(si — —А)гЦ. Преобразование Лапласа матричной функции выполняется по- посредством преобразования каждого ее элемента. Теорема 1.17 особенно удобна для получения точного выражения переходной матрицы, если величина п не является слишком большой, незави- независимо от того, является ли матрица А диагонализируемой. Матричная функция (si — ^d) называется резольвентой ма- матрицы А. В связи с этим имеет место следующий результат [13, 190]. Теорема 1.18. Рассмотрим постоянную матрицу А размерности п X п с характеристическим полиномом det (si — А) = sn + a^is"'1 + ... -f сця + a0. A.155) Тогда резольвента матрицы А может быть записана в виде п (si—А)'1 = - V s'-i Rit A.156) *=i . где матрицы Rt определ яются как п Rt= У a>jA>-1, i = 1, 2, ... , п, A.157) а ап = 1. Коэффициенты at и матрицы Rt, i = 1, 2, ..., п, мо- могут быть определены с помощью следующего алгоритма. Пусть ' а„=1, Д„ = 7. A.158) Тогда A.159) A.160) для к = 1,2, ..., п. При к = п имеем Д0 = 0. A.161) Здесь используется обозначение П tr (M) =
Элементы теории линейных систем 49" если М — матрица размерности п X п с диагональными элемен- элементами Мп, i =1,2, ..., п. Алгоритм теоремы следует из алгоритма Леверъе [13]. Он также известен как метод Сурьё, или метод Фад- деевой [190]. Условие Яо = 0 можно использовать для проверки. Алгоритм очень удобно реализовать на ЦВМ. Однако следует отметить, что алгоритм довольно чувствителен к ошибкам округ- лепия [61], поэтому обычно при вычислениях требуется двукрат- двукратная точность. Мелса [127] приводит вычислительную программу по этому алгоритму на ФОРТРАНе. Рассмотрим теперь неоднородное уравнение x(t) = Ax(t) + Bu(t), A.163) где А ж В — постоянные матрицы. Выполняя преобразование Лап- Лапласа, получим sX (s) — х @) = АХ (s) + BU (s)\ A.164), откуда найдем X (s) = (si — A)~l x @) + (si — A)-15U (s). A.165) Пусть уравнение относительно выходной координаты системы имеет- вид . y(t) = Cx(t), A.166). где С — постоянная матрица. Выполняя преобразование Лапласа и подставляя A.165), получим Y(«) = CX(s) = C(sI—A)-1x@) + С (si —A)~l EM (s), A.167) что эквивалентно преобразованию Лапласа выражения A.70) при 1о=0, t y(t) = CeAt x@) + C j eA{t~z) Bu (x) dx. A.168) о При х@) = 0 выражение A.167) принимает вид Y(s) = ff(s)U(s), A.169). где •H(s) = C(8l—A)-iB. • A.170) Матрица H(s) называется матричной передаточной функцией системы. Если H(s) и U(s). известны, реакция системы при нулевом начальном состоянии может быть найдена посредством обратного преобразования Лапласа выражения- A.169). На основании теоремы 1.17 из уравнения A.170) следует, что матричная передаточная функция H(s) является преобразованием Лапласа матричной функции K(t) = Cexy(At)B, t>- 0. Из A.168) очевидно, что K(t — т.), t>-x, является матричной импульсной: переходной функцией системы.
50 Глава 1 Принимая во внимание теорему 1.18, матричную передаточную функцию 'можно представить в форме Я(в)= P{s), A.171) W det(s/ — A) W y ' где P(s) — матрица, элементы которой являются полиномами от s. Следовательно, элементы матричной передаточной функции H(s) является рациональными функциями s. Общим знаменателем алементов H(s) является выражение det (si — А), если не про- происходит сокращения множителей видав — Kt, где Kt— характери- характеристическое число матрицы А во всех элементах матрицы H(s). Корни общего знаменателя H(s) называются полюсами матрич- матричной передаточной функции H(s). Если сокращения не происходит, полюса матричной передаточной функции являются полюсами системы, т. е. характеристическими числами матрицы А. Если как входная u(t), так и выходная y(t) переменные явля- являются скалярными, то матричная передаточная функция переходит в скалярную передаточную функцию. Для многомерных систем каждый элемент Н^(в) матричной передаточной функции H(s) является передаточной функцией от /-Й компоненты входа к ?-й компоненте выхода. Пример 1.12. Недиагоналйзируемая система Рассмотрим систему = (о AЛ72) Нетрудно проверить, что эта система имеет двукратное харак- характеристическое число 0, но единственный собственный вектор; поэ- поэтому она не является диагонализируемои. С помощью преобразования Лапласа вычислим матричную пере- передаточную функцию. Резольвента системы может быть найдена следующим образом: t Обратное преобразование Лапласа дает ел = D' M. A.174) Vo о/ у , Заметим, что эта система не является устойчивой в смысле Ляпунова.
Элементы теории линейных систем 51 Пример 1.13. Смесительный бак Смесительный бак из примера 1.2 описывается линеаризован- линеаризованным уравнением состояния x(t) = ¦--L о 29 о —L 9 \x(t) + 1 — с0 \u(t). A.175) а уравнение выходной переменной имеет вид x(t). A.176) 0 Резольвента матрицы А определяется выражением I 1 !+ 29 ¦1 A.177) Система имеет матричную передаточную функцию 26 1 I — с0 1 s+ Г A.178) Матричная импульсная переходная функция A.75) системы определяется посредством, обратного преобразования Лапласа A.178). 1.5.2. ЧАСТОТНАЯ ХАРАКТЕРИСТИКА В данном разделе рассматривается частотная характеристика системы с постоянными параметрами и определяется реакция системы на входной сигнал вида A.179)
¦32 Глава ] где ит— постоянный вектор. Представим решение дифференци- дифференциального . уравнения состояния ' x(t) = Ах (t) + Bu (t) A.180) как сумму решения однородного уравнения и частного решения. Сначала найдем частное решение в форме xp{t)=xme«\ A.181) где хт— постоянный вектор, который следует определить. Нетруд- Нетрудно найти, что частное решение описывается выражением хру) = 0<й1—А)-1Витем <>0. A.182) Общее решение однородного уравнения x(t) = Ax(t) может быть представлено в виде xh(t) = eMa, A.183) где а — произвольный постоянный вектор. Таким образом, общее решение неоднородного уравнения A.180) имеет вид х (t) = eAt a + (j&I ~ А)~1Витеы, t^O. A.184) Постоянный вектор а может быть определен из начальных ус- условий. Если система., описываемая уравнением A.180), явля- является асимптотически устойчивой, то первый член решения при возрастании t затухает, а второй член характеризует установившееся состояние при входном воздействии A.179). Соот- Соответствующее установившееся значение выходной переменной A.185) определяется выражением = Н{^)итеы. A.186) Заметим, что в это выражение входит матричная передаточная функция H(s), где s заменяет /со. HQa) называется матричной частотной характеристикой системы. Получив реакцию системы на комплексный периодический сиг- сигнал вида A.179), нетрудно определить установившуюся реакцию при действительном синусоидальном входном сигнале. Предположим, что k-я компонента fifi(?) вектора входной пере- переменной u(t) имеет вид ?й*+фА), *>0. A.187)
.'>.пмснты теории линейных систем 53 iдо II:h(jw) является (г, /г)-м элементом матрицы Hjw, a Предположим, что все другие компоненты вектора u(t) равны пулю. Тогда установивгаееся значение'/-й компоненты ij t(t) век- •iiipa выходной переменной y(t) описывается выражением A.188) A.189) Скалярные частотные характеристики удобно представлять методом асимптотических логарифмических характеристик [49]. Г> работе [1271 приводится ФОРТРАН-программа для построения лмплитуды и фазы скалярной частотной характеристики. В заключение отметим, что установившееся значение выходной переменной асимптотически, устойчивой системы с матричной час- частотной характеристикой ff(ja>) при постоянном входном сигнале u(t) = um A-190) определяется как = H@)u A.191) Пример 1.14. Смесительный бак Смесительный бак из примера 1.2 имеет матричную передаточ- передаточную функцию (пример 1.13) H(s) = 1 29 '¦+т A.192) Эта система асимптотически устойчива, в связи с чем имеет «•мыел матричная частотная характеристика. При числовых зна- челшях из примера 1.2 получим 0,01 0,01 II (/">) = /<о + 0,01 — 0,25 /со+ 0,02 /ш+0,02 A.193)
54 Глава 1 - > 1.5.3. НУЛИ МАТРИЧНЫХ ПЕРЕДАТОЧНЫХ ФУНКЦИЙ Рассмотрим систему со скалярными входной и выходной пере- переменными х (t) = Ах (t) + iy it), ^ 194^ ч@ = с* (о, где ц(?) и ц{1) — скалярные соответственно входная и выходная переменные, Ъ — вектор-столбец, с — вектор-строка. Матричная передаточная функция этой системы трансформируется в переда- передаточную функцию, которая определяется следующим образом: H(s) = c(sI—A)-1b. ' A.195) Характеристический полином матрицы А имеет вид det(s/— Л) = (jp(s). A.196) Тогда H(s) можно записать как #(s) = -iifL A.197) <р (s) где cp(s) — полином степени п, a '-j>(s) — полиномЧтепепи, но боль- большей чем п — 1, если матрица А имеет размерность п X п. Корни полинома ф(я) называются нулями системы A.194). Заметим, что нули определяются до возможного сокращения общих множителей в полипомах i]j(s) и <f(s). Нули выражения H(s), которые остаются после сокращения, называются нулями передаточной функции. В случае многомерной системы H(s) является матрицей, при этом каждый элемент матрицы H(s) представляет собой передаточ- пую функцию, которая имеет собственные нули. В данном случае не очевидно, как определяются нули. fr(s). В конце этого раздела дается определение, которое обосновывается результатами разд. 3.8; при этом рассматриваются только квадратичные матричные передаточные функции. ( Сначала изложим следующий результат. Теорема 1.19. Рассмотрим систему x(t) = Ax(t) + Bu(t), A.198) где состояние х имеет размерность п, а входная и и выходная у переменные имеют размерность т. Пусть H(s) = C(sl — A)'lB является матричной передаточной функцией системы. Тогда
'Кименты теории линейных систем 55 A.199) где (jp(s) = det(s/—Л), A.200) « J'f'sj является, полиномом от s степени, не большей чем п.— т. Докажем это утверждение, так как оно не является общеизвест- общеизвестным. Сначала установим следующий факт из теории матриц. . 1емма 1.1. Пусть М и N являются матрицами соответственно размерности т X п и п X т, а 1т и 1п обозначают соответственно античные матрицы размерности т X т и п X п. Тогда а) ЫAт + MN) = det(In + NM). A.201) - б) Предположим, что det (Im X MN) 4= 0. Тогда (Im + MNP = Im-M (In + NM)-i N. A.202) Доказательство положения (а) следует из рассмотрения ха- характеристических чисел матрицы /m + MN [138, 154]. Справедливость положения(б) нетрудно проверить. Для доказательства теоремы 1.19 рассмотрим выражение det[XIn + C(sIn-A)^B). A.203) гЛе % — ненулевой произвольный скаляр, который позднее будет устремлен к нулю. Используя часть (а) леммы, получаем det [Um+ С (sln - A)-4B] = Aet (KIJ det|^m + j-C (sln - A)'^ #] = = Kmdet [/„ + ± (sln ~ A)-* 5CJ = lm det Г sln — A + — Bc\ = != =L '. A.204) det (sln -A) V Полиномы от Х, находящиеся в правой и левой частях выраже- выражения A.204), равны при всех ненулевых %; откуда, положив %-*¦ 0, получим det [С (si — А)-1 В\ = -A^L , /1.205) ср (s)
56 Глава 1 где (s) = lim Ят det (sln — A + — BC), A.20R) x->o \ X ) и, следовательно, 'i(s) является полиномом от s. Определим сте- степень этого полинома. При )ф->-оо из теоремы 1,18 следует lim s{sl |S|-»OO Таким образом m lim i j sd |s|-»co <f (s) |s|-*oo = lim det[Cs(s/—^)-1JB] = det(C5/. A.208) Отсюда видно, что степень cp(s) больше,1 чем степень ф(я), по крайней мере на т; поэтому ty(s) имеет степень, не превышающую п — т. Если det(C5) Ф 0, то степень fy(s) точно равна п — т. Этим доказательство теоремы 1.19 заканчивается. Введем следующее определение. Определение 1.9. Нулями системы , Bu(t), A.209) y(t) = Cx(t), где состояние х имеет размерность п, а входная и и выходная у координаты имеют размерность т., являются нули полинома- ty(s); где det [H (s)] = -i-^-. A.210) Cf (S) Здесь H(s) — C(sl — A)~XB — матричная передаточная функ- функция, a (p(s) = det(sl — A) —характеристический полином сис- системы. Таким образом, /г-мерная система с m-мерными входной и вы- выходной переменными имеет самое большее п — т нулей. Заметим^ что для систем со скалярными входной и выходной переменными определение нулей системы трансформируется в определение, данное в начале этого раздела. В этом случае система имеет нв' больше чем п — 1 нулей. Вычисление полинома ф(х) для системы средней сложности вы- вызывает трудности. Одним из возможных путей преодоления их является запись числителя в виде ф(*) = Ф(*) det [#(*)], A.211)
•Элементы теории линейных систем i де ф(г>) является характеристическим полиномом системы. Коэф- Коэффициенты ф($) могут быть найдены подстановкой п — т -\- 1 соответствующих значений для s в правую часть'A.211) и решением полученных линейных уравнений. Другой, возможно, более прак- практичный подход заключается в использовании полученного из A.206) соотношения где A.212) A.213) Анализ выражения A.213) показывает, что можно написать где «;(«), i —0, 1, ..., т, являются полиномами от s. Эти полино- полиномы могут быть вычислены расчетом ty(s, X) для т различных зна- значений X. Искомый полином (f(s) в точности соответствует oco(s). Проиллюстрируем результаты этого раздела следующим при- примером. • Пример 1.15. Смесительный бак Смесительный бак из примера 1.2 (разд. 1.2.3) имеет матрич- матричную передаточную функцию ( J_ J_ 29 29 #(*) = 2в 1 \ s + ~7Г у и vj Характеристический полином системы равен 1 A.215) Ф (s) = s + 29 в A.216) Определитель матричной передаточной функции записывается виде 20 1 2в A.217)
.58 Глава 1 Очевидно, что матричная передаточная функция не имеет пу- пулей. Этого следовало ожидать, так как в данном случае п — т = = 0; следовательно, степень полинома ф(х) нулевая. 1.5.4. СОЕДИНЕНИЯ ЛИНЕЙНЫХ СИСТЕМ Ниже рассматриваются соединения линейных систем. Наибо- Наиболее важными и часто встречающимися примерами соединения сис- систем являются последовательное соединение (рис. 1.5) и соединение и, (t) Система 1 y1(t)=uz(t) Рис. 1.5. Последовательное соединение. r(t) "N и, It) Система 1 Система 2 yf(t)-u2(t) Рис. 1.0. Соединение ¦ посредством обратной связи. посредством обратной связи, или замкнутая система (рис. 1.6). Соединения систем обычно описываются с помощью метода расширения фазового Пространства. Пусть отдельные системы в последовательном соединении (рис. 1.5) описываются следующими дифференциальными уравнениями состояния и уравнениями вы- выходных переменных: t (t) x, (t) + Bt (t) щ (t) 1 (система 4)> j = C2(t)x2(t) -B2(t)u2{t) D2(t)u2(t) . A-218) (система 2).
Элементы теории линейных систем ' 59 Вводя расширенный вектор состояния объединенную систему можно описать следующим дифферен- дифференциальным уравнением состояния: где используется равенство u2(t) — ух@. Принимая y2(t) за выход- выходную переменную объединенной системы, получим уравнение Уг @ = Юг (t) С, @, С2 (*)] а; (*) + Я2 (*) ^ @ ^ (*). A.221) В случае систем с постоянными параметрами соединение сис- систем удобно .описать при помощи матричных передаточных функций. Предположим, что H^s) и H2(s) являются матричными передаточ- передаточными функциями соответственно систем 1 и 2. Тогда общая передаточная матрица равна 'H2(s)H1(s), что сле- следует из соотношения: Y2 (s) = tf2 (s) ВД = Я2 (s) Я, (s) U, (s). ' A -222) Заметим, что порядок Н2 и Н± в общем случае не может быть изменен. В системе с обратной связью (рис. 1.6) r(t) является входным сигналом. Предположим, что отдельные системы описываются следующими дифференциальными уравнениями состояния и урав- уравнениями выходных переменных: -~ xt (t) = A, (t) Xt (t) + В, (t) щ (t) 1 (система 1)t . J/1(«) = C1(*)a:i(*). J A.223) x2(t) = A2(t)x2(t) + B2(t) u2(t) \ (система 2). 1 Заметим, что система 1 не имеет прямой связи. Это позволяет избежать неявных алгебраических уравнений. С помощью расши- расширенного вектора состояния x(t) =:po\[xi(t), oc2(t)] система с обрат- обратной связью может быть описана дифференциальным уравнением состояния B2(t)Ct(() A2(t) ) A.224)
60 Глава 1 где используются равенства u.2(t) = y^t) и щ{1) = r(t) — y2{t)- Если yL(t) — выходная переменная объединенной системы, то ее- уравнение имеет вид yi(t) = lCdt),O\x{t). . A.225) Рассматривая систему с постоянными параметрами, имеем Yl(s)^Hi(s)[R(s)~H2(s)Yl(s)}, A.226) где #x(s) и H2(s) — матричные передаточные функции отдельных систем. Разрешая A.226) относительно Y1(s), найдем Y, (s) = [/ + Я4 (з) Н2 (s)] Я4 (s) R (s). A.227) Выражению / ^|- H^sjH.^s) удобно дать специальное опре- определение. Определение 1.10. Рассмотрим объединенную систему с обратной связью (рис. i.G), в которой системы \и1с постоянными парамет- параметрами имеют матричные передаточные функции H^s) и И\.(s) соответственно. Матричная функция для такой системы J(s) = I + Hl{s)H2(s) A.228) называется матрицей возвратной разности, а мат,ричная Ь(а) = Нх(8) H2{s) A.229) функция называется матрицей усиления понт ура. Термин «возвратная разность» может быть пояснен с помощью рис. 1.7, на котором показана система при наличии разрыва сое- соединительной цепи. В случае r(t) = 0 имеем Yj (в) = — #4 (в) Я2 (s) U2 (s). ' A.230) -i h Рис. 1.7. Иллюстрации термина «возвратная разность».
Элементы теории линейных систем 61 Разность выражений «возвратной переменной» y^t) и «введен- «введенной переменной)) u2(t) равна U2 (*) - Y4 (,) =[1 + Щ (s) Нг (*)] U2 is) = J (g) U2 (s). A.231) Заметим, что при наличии разрыва контура в каком-либо дру- другом месте матрица возвратной разности будет иметь другой вид. Тем не менее будем строго придерживаться определения, данного выше. Термин «матрица усиления контура» достаточно ясен. Определяющее значение для автоматического управления име- имеет вопрос об устойчивости соединений систем. Для последова- последовательного соединения получаем следующий результат, который не- немедленно вытекает из рассмотрения характеристического поли- полинома 'дифференциального уравнения расширенного состояния A.220). Теорема 1.20. Рассмотрим последовательное соединение (рис. i.b), где системы {и 2 являются системами с постоянными параметрами'и характеристическими полиномами q>i(s) и (f.z(s) соответственно. Соединение имеет характеристический поли- полином fxfs) ty.ifs). Поэтому объединенная система является асимп- асимптотически устойчивой в том и только том случае., когда системы i и 2 асимптотически устойчивы. В терминах матричных передаточных функций устойчивость систем с обратной связью (рис. 1.6) может быть исследована с помощью следующего результата [36,- 75]. Теорема 1.21. Рассмотрим систему с обратной связью (рис. 1.0J, в которой системы 1 и 2 являются системами с постоянными па- параметрами и имеют матричные' передаточные функции H^s) и H,z(s) соответственно; при этом в системе 1 нет прямой связи. Тогда характеристический полином замкнутой системы равен. щ (*) ср2 (s) det [7 + Щ (s) H2 (,)]. A.232) Поэтому замкнутая система является устойчивой тогда и только тогда, когда полином (\.2Ъ2) имеет нули со строго отрицатель- отрицательными действительными частями. Перед доказательством результата нужно отметить следую- следующее. Выражение det[7 + H^H^s)] является рациональной функцией от s. Если не происходит сокращения, знаменатель этой функции равен <Pi(s)(p2(s)> так что числитель выражения det [/ — ff1(s)//2(s)] является характеристическим полиномом объе- объединенной системы. Выражение A.232) часто называют характе- характеристическим полиномом замкнутого контура: Теорему 1.21 можно доказать следующим образом. Для слу- случая постоянных параметров из выражения A.224) следует диффе-
62 Глава 1 ренциальное уравнение состояния замкнутой системы Покажем, что характеристический полином этой системы в точ- точности соответствует A.232). Для этого необходим следующий ре- результат из теории матриц. ¦Лемма 1.2, Пусть М — квадратная блочная матрица вида M= '"* . A.234) \М3 Mj Тогда^при de\(M1) =? 0 имеем det (M) — det (М4) det (М4 — М3 М М2), A.235) а при detfM4j ^= 0 получаем det (М) = det (M4) det (М4 — Мг М^ Мя). A.236) Лемма просто доказывается посредством элементарных действий со строками и столбцами матрицы М. С помощью лемм 1.2 и 1.1 (разд. 1.5.3) характеристический полином A.233) может быть записан следующим образом: I А± -\- Г>1 и% Ui JD{ls2 = det (si — Л2) det {si — Л4 + i51ZJC1 + 5tC2 (s/ — A2)~l BZCV\ = == det (s/ — As) det (s/ — Az) X X det {/-f Ct (s/— Л054 [C2 (s/— Azyi Bz+D2\) . A.237) Так как det (si—Ad — <?i{s), det (s/ — A2) — Фг(?). с1(»/-л1)в1 = я1(«), A238) C2 (s/ — Л2)-г В2 + D2 '= Я2 (s), выражение A.237) может быть переписано в виде ¦q>1(s)q>2(s)det[/ + tf1(s)tf2(s)l. • ' A.239) Отсюда следует, что A.232) является характеристическим поли-
•Элементы теории линейных систем 63- помом замкнутой системы; таким образом, устойчивость непосред- непосредственно определяется корнями выражения A.232). , Этот метод проверки устойчивости замкнутых систем обычно- более удобен для систем со скалярными входной и выходной пере- переменными, чем для многомерных систем. Для случая одномерных систем имеем Я1(*)=А^-, tfa(S)=i*M-, A.240) где фДя) и <]>2(s) — полиномы числителей. На основании теоремы 1.21 устойчивость определяется корнями полинома Ф1 (*) Фа (?) f 1 + Ь®^ ] = ф1 (s) ф2 (s) + ф4 (s) ф2 (s). A.241) L <Pl (s) ?2 (s) J При проектировании линейных автоматических систем часто- имеет место ситуация, когда коэффициент усиления в обратной связи или в прямой цепи остается неопределенным до последнего этапа синтеза. Возьмем в качестве примера Я1E) = р-^, A.242) 1 v 1,0 р — неопределенный коэффициент усиления. Характеристи- Характеристические числа замкнутой системы являются в этом случае корнями пыражепия <Pi (*) Фг (*) + Р Ь (*) <Ь (*)• A-243) Возникает интересная задача, состоящая в построении годо- 1 рафа корней этого полинома как функции скалярного параметра р. ¦ Ь'о частньш случай более общей задачи нахождения на комплек- комплексной плоскости годографа корней выражения - Ф(*) + Р<!>(*) ¦ A-244) при изменении параметра р, где <p(s) и t]»(s) — произвольно задан- заданные полиномы. Правила построения такого годографа приводятся н следующем разделе. Пример 1.16. Перевернутый маятник Рассмотрим задачу стабилизации маятника из примера 1.1 (разд. 1.2.3). Ясно, что, если маятник начинает падать вправо, толежка также должна двигаться вправо. Поэтому попытаемся использовать для управления приложенную к тележке силу |i(/), которая пропорциональна углу ф(?). Этот угол можно изме- измерить потенциометром, установленным на оси; сила \i(t) приклады- прикладывается с помощью небольшого сервомотора. Таким образом, имеем ky(t), - ' A.245),
64 Глава 1 где к — константа. Нетрудно найти, что передаточная функция от \i(t) к ц>A) равна A.246) Передаточная функция звена в обратной связи определяется из A.245) как H2(s) = —k. A.247) Характеристический полином системы управления положением имеет вид ф1 (s) =s(s + -Lj (s* - -pj , A.248) тогда как характеристический полином звена в обратной связи равеп ф2(*) = 1. A-249) Из A.24С) и A.247) имеем з i « F , i k 8 \ F g S3 Ц_ S2 —— 4. s ,,„,,„,, М ' V L'M U ML' .. огп. 1 + Я, (s) 7/2 (s) = : —— '— ,• A.250) ((f тог^да как из A.248) и A.249) получаем ф1 (s) ф2(*) = s(s + ^-)^2 —?-) . A.251) Заметим, что в данном случае знаменатель выражения 1 [- Jff1(s)JH(s) не является произведением характеристических полиномов A.251) и что множитель s был сокращен. Поэтому числи- числитель A.250) не является характеристическим полиномом замкнутой системы. Вычисляя произведение выражений A.250) и A.251), найдем, что характеристический полином замкнутой системы имеет вид М \ L' M L' ) ML') Очевидно, что одно из характеристических чисел замкнутого контура равно нулю. Более того, поскольку другой множитель содержит член с отрицательным коэффициентом, согласно хорошо
Элементы теории линейных систем 65 известному критерию Рауса—Гурвица [159] существует по край- крайней мере один корень с положительной действительной частью. Это означает, что система не может быть стабилизирована данным способом. В примере 2.6 (разд. 2.4) рассматривается более сложная схема управления, с помощью которой удается добиться стабили- лации системы. Пример 1.17. Смесительный бак Рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3). Положим, что требуется установить такой режим работы системы, при котором поддерживаются постоянный расход F(t) и постоян- постоянная концентрация c(t). Один из методов достижения этой цели состоит в регулировании расхода F путем изменения расхода основного потока F1 и регулировании концентрации с посредством изменения расхода другого потока F2. Пусть выбраны следующие законы изменения входных пере- переменных: M*) M(*) A253) Это означает, что система имеет в цепи обратной связи матрич- матричную передаточную функцию При численных значениях параметров из примера 1.2 матрич- матричная передаточная функция системы в прямой цепи равна 0,01 0,01 0,25 0,75 s+0,02 s+0,02 Тогда матрица возвратной разности имеет вид s + 0,01^ + 0,01 ' 0,01 к2 \ г S + 0'01 ' s + 0-01 \ A.256) — 0,25^ s + 0,75 А:2 +0,02 I s + 0,02 s + 0,02. / Найдем характеристические полиномы двух систем: ф1 («) = (s + 0,01) (s + 0,02), 3-394
66 Глава 1 Из A.256) следует L J det \j (s)] = (* + °'olfei + °'01) (* + 0.75fc2 +.0,02) + 0,0025 frfr ( L J (s + 0,01) (s +0,02) , • I Так как знаменатель этого выражения представляет собой произведение <Pi(s)cp2(s), его числитель является характеристичес- характеристический полиномом замкнутой системы. Выполняя дальнейшее пре- преобразование выражения для характеристического полинома, по- получим s2 + s @,01fct + 0,75/с2 + 0,03) + @,0002*! + 0,0075*2 + + 0,01 kjet + 0,0002). A.259) Это выражение показывает, что для положительных значений кг и к2 замкнутая система является устойчивой. Выберем следую- следующие значения для коэффициентов усиления: кх — 10 и к2 = 0,1. Тогда характеристический полином имеет вид s2 + 0,205s + 0,01295. A.260) Характеристические числа равны — 0,1025 ±/0,04944. A.261) • Эффективность схемы управления A.253) исследуется в при- примере 2.8 (разд. 2.5.3). 1.5.5.* КОРНЕВОЙ ГОДОГРАФ Из предыдущего раздела следует, что иногда представляет интерес построение на комплексной плоскости годографа корней выражения вида ФE) + РФ(*), -A-262) где ep(s) и i])(s) — полиномы от s при изменении скалярного пара- параметра р. В настоящем разделе приводятся некоторые правила, относя- относящиеся к построению годог.рафа, которые позволяют определять некоторые специальные точки годографа и, в частности, асимпто- асимптотическое поведение. Эти правила позволяют довольно легко вы- вычертить годограф для простых задач; в более сложных задачах для вычисления корневого годографа совершенно необходимо исполь- использование ЦВМ. Мелса [127] приводит ФОРТРАН-программу для вычисления корневого годографа. Примем, что полиномы cp(s) и Ц$) имеют следующий вид:
Элементы теории линейных систем 67 / \ I—[ / \ Ф IS) = I I (S —TCj), i=1 - A.263) m . , \ i—r / \ TV/ 1 1 *¦ "' ч где л4, i = 1, 2, ..., n, — полюса разомкнутого контура, a v4, i = 1, 2, ..., т, — его кули. Корни A.262) назовем полюсами замкнутого контура. Объяснение этим терминам можно найти в разд. 1.5.4. Предположим, что т -^ п. Это не является ограниче- ограничением, так как при яг >¦ п функции q>(s) и <b(s) можно поменять ро- ролями, выбрав в качестве параметра 1/р. Приведем следующие основные свойства корневого годог- годографа. а) Число корней. Число корней выражения A.262) равно п. Каждый из. корней имеет свой непрерывный годограф при изме~ нении р от —• оо до оо. б) Начало годографа. Годограф берет начало для р = О в полюсах itj, i = 1, 2,..., п. Это вытекает из того факта, что при р = 0 корни A.262) являются корнями cp(s). в) Поведение годографа при р—»- ± оо. При р-> rfc.oo. т годографов приближается к нулям Vj, г =1, 2, ..., т. Ос» тальные п — т годографов стремятся к бесконечности. Это следует из того, что корни A.262) также являются кррнями выражения —<Р(») + «К»)- ' A.264) . Р г) Асимптоты годографов. Указанные п — т годографов, стремящихся к бесконечности, асимптотически приближаются к п — т прямым, которые составляют углы к = 0,1 п —те —1, A.265) п — т с положительной действительной осью при р -> + °° и углы к 2п — , fc = 0,l,..., п —те —1, A.266) п — т при р ->— оо. Эти п— т асимптот пересекаются в одной точке на действительной оси, определяемой выражением п т ^^ i ^ ^^ i -^ — . A.267) п — т
68 Глава 1 Отмеченные свойства объясняются следующим образом. Для больших s выражение A.262) можно приближенно заменить выражением sn + psm.. A.268) Корни этого полинома (—p)I/("-m) A.269) дают первое приближение в определении истинных корней. Более точный анализ показывает, что лучшее приближение дает выра- выражение п т у - Д>, A.270) Это подтверждает перечисленные выше свойства асимптотичес- асимптотического поведения. д) Части корневого годографа на действительной оси. Если предположить, что р принимает только положительные значения, любая часть действительной оси, справа от которой располагается нечетное количество полюсов и нулей на дейст- действительной оси, является частью корневого годографа. Если р при- принимает только отрицательные значения, то любая часть дей- действительной оси, справа от которой на действительной оси ле- лежит четное число полюсов и нулей, является частью корневого годографа. Это можно показать следующим образом. Корни выражения A.262) могут быть найдены из решения уравнения ' -f?J- = -p. A.271) Если предположить, что р положительное, то|уравнение A,271) эквивалентно действительным уравнениям ——— = % + 2nk, A.273) + («) где k — произвольное целое число. Если s — действительное число, то всегда существует р, для которого A.272) удовлетворяет- удовлетворяется. Чтобы удовлетворялось также уравнение A.273), должно быть нечетное число нулей и полюсов справа от s. Подобные рассужде- рассуждения справедливы и для случая отрицательного р. Могут быть установлены также некоторые другие свойства кор- корневых годографов, облегчающие их построение [49], однако мы
Элементы теории линейных систем 69 -*-»» -114. -«-*- -1 Im, С -J О —j 3,14 Re, с .-г Рис. 1.8. Корневые годографы перевернутого маятника. X полюса разомкнутого контура; О нуль разомкнутого контура. ограничимся перечисленными выше правилами, поскольку этих правил достаточно для достижения целей данной книги. Пример 1.18. Перевернутый маятник Рассмотрим предложенную схему с пропорциональной обрат- обратной связью из примера 1.16, для которой характеристический полином замкнутой системы записывается в виде s\ s F М c« . L'M A.274) Здесь &_изменяется от 0 до оо. Полюса равны О, —F/M, Vg и —VgIL'; в точке 0 имеется двукратный нуль. Асимптоты состав- составляют углы я/2 и —л/2 с действительной осью при к -> оо, так как п. — т = 2. Асимптоты пересекаются в точке —1/2 (F/M). Части действительной оси между У gIL' и 0 и между — FIM и —УцШ принадлежат годографу. Полюс в 0 совпадает с нулем; это означает, что 0 всегда является одним из полюсов замкнутого контура. Го- Годографы остальных корней для численных значений, заданных в примере 1.1, показаны на рис. 1.8. Очевидно, что замкнутая систе- система не является устойчивой при любых к, что уже было показано и примере 1.16. '
70 Глава 1 1.6*. Управляемость 1.6.1.* ОПРЕДЕЛЕНИЕ УПРАВЛЯЕМОСТИ Для решения задач управления важно знать, обладает ли дан- данная система свойством быть управляемой в смысле перевода из любого заданного состояния в любое другое заданное состояние. Это приводит к введенному Калманом [86] понятию управляемос- управляемости, которое обсуждается в данной главе. Дадим следующее опре- определение. Определение 1.11. Линейная система с дифференциальным урав- уравнением состояния x{t) = A (t) x(t) + B (t) и (t) A.275) считается полностью управляемой, если она может быть переве- переведена из нулевого состояния в момент t0 в любое конечное состояние x(tx) = х1 за конечное время tx — t0. Здесь имеется в виду, что су- существует кусочно-непрерывная входная переменная u(t), to<^. < t <: tx, которая переводит систему из одного состояния в другое. Определение 1.11 кажется отчасти ограниченным; так, един- единственное требование заключается в том, что система может быть переведена из нулевого состояния в другое состояние. Однако дальше будет видно, что определение предполагает большее. Дви- Движение системы из произвольного начального состояния, как сле- следует из уравнения A.61), описывается выражением х (tt) = Ф (tlf *0) х (t0) + ( Ф (*„ т> В (т) и (т) А, A.276) I так что" х (tt) - Ф (tit g x (t0) = j' Ф (h, x) В (х) и (х) й-.. A.277) Это показывает, что перевод системы из состояния x(tQ) = х0 в состояние x(tx) = хг достигается при той же самой входной пере- переменной, которая переводит систему из состояния x(t0) = 0 в состояние x(tx) = хх — Ф^., to)xo. Отсюда имеем следующий ре- результат. Теорема 1.22. Линейная дифференциальная система x(t) = A (t) z(t)+B (t) u (t) A.278) является полностью управляемой тогда и только тогда, когда она может быть переведена из любого начального состояния х0 в про-
Элементы теории Линейных систем 71 изволъный начальный момент t0 в любое конечное состояние x(tx) — = хх за конечное время tx— t0. Пример 1.19. Смесительный бак Предположим, что оба потока, поступающие в смесительный бак (пример 1.2, разд. 1.2.3), имеют равные концентрации сх = = с% = с. Тогда установившаяся концентрация в баке с0 также равна с, а линеаризованное дифференциальное уравнение состоя- состояния имеет вид Из этого уравнения видно, что-приращение концентрации, яв- являющееся второй компонентой состояния, не может управляться посредством вектора входной переменной, компонентами которого являются приращения втекающих потоков. Физически это также ясно, так как по предположению втекающие потоки имеют равные концентрации. Поэтому очевидно, что система не является полностью управ- управляемой, если ct = c2. При с4 ^= с2 система полностью управляема, что будет показано в примере 1.21. 1.6.2.*. УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ В этом разделе рассматривается управляемость линейных сис- систем с постоянными параметрами. Сначала получим следующий важный результат. Теорема 1.23. п-мерная линейная система с постоянными парамет- параметрами х (t) = Ах (t) + Bu (t) A.280) является полностью управляемой тогда и только, тогда, когда вектор-столбец матрицы управляемости Р = (В, АВ, А2В А"'1 В) A.281) порождает п-мерное пространство. Этот вывод может быть доказан формально следующим обра- образом. Если в момент времени t0 система находилась в нулевом сос- состоянии, то состояние в момент ^определяется следующим образом: h j eMu^Bu(x) Л., A.282) x(tt)= j
72 Глава 1 Представляя экспоненциал в виде ряда Тейлора, найдем П h х (tt) = В Г u(x)dx + AB j (ti — x)u (x) dx + f n A.283) Видно, что конечное состояние принадлежит линейному под- подпространству, порожденному вектор-столбцами бесконечной по- последовательности матриц В, АВ, А2В, ... . В этой последователь- последовательности должна появиться матрица, скажем А1В, все вектор-стол- вектор-столбцы которой линейно зависят от комбинации вектор-столбцов предыдущих матриц В, АВ,..., А1~1В. Такая матрица должна иметь место, так как в /г-мерном пространстве не может быть более чем п линейно независимых векторов. Это также предполагает, что I < п. Рассмотрим теперь А1+1В = А{А1В). Поскольку вектор-столб- вектор-столбцы матрицы А1В линейно зависят от комбинации вектор-столб- вектор-столбцов матриц В, АВ, ..., А1'1 В, можно написать А'В = ВА0 + ABAt + ... + Л'15Л;_4, A.284) где Лг, I = 0, 1, ..., Z — 1, являются матрицами, которые содержат коэффициенты, позволяющие выразить каждый вектор-столбец матрицы А1В через вектор-столбцы матриц В, АВ, ..., А1'1 В. Следовательно, имеем А1+1В = АВА0 + A2BAi + ... + А1ВЛМ , A.285) откуда видно, что столбцы матрицы А1+1В также линейно зависят от вектор-столбцов В, АВ, ..., А1~1В. Подобным же образом можно показать, что вектор-столбцы всех матриц AkB для к > I линейно зависят от вектор-столбцов матриц В, АВ, ..., А1~ХВ. Возвращаясь к выражению A.283), можно видеть, что конечное состояние x(ti) принадлежит линейному подпространству, порож- порожденному вектор-столбцами матриц В, АВ, ..., А1'ХВ. Поскольку I <J n, можно также сказать, что ж(^) принадлежит подпростран- подпространству, порожденному вектор-столбцами матриц В, АВ, ..., Ап~^В. Теперь ясно, что, если эти вектор-столбцы не порождают /г-мерное пространство, можно достичь только тех состояний, которые при- принадлежат линейному подпространству меньшей размерности, поэтому система не является полностью управляемой. Это дока- доказывает, что, если система полностью управляема, вектор-столбцы управляемости Р порождают /г-мерное пространство. Чтобы доказать другое утверждение теоремы, положим, что вектор-столбцы матрицы Р порождают «-мерное пространство. Тогда соответствующим выбором входной переменной и(т), t0 -<C ¦^С т -С h (включая, например, ортогональные полиномы), всегда
Элементы теории линейных систем 73 можно выбрать такие векторы коэффициентов ч 1 и(-) A.286) в уравнении A.283), что правая часть A.283) будет равна любому заданному вектору в пространстве, порожденном столбцами мат- матрицы Р. По предположению столбцы матрицы Р порождают все п- мерное пространство, а это означает, что любое конечное состояние может быть достигнуто, и, следовательно, система является пол-/* ностью управляемой. На этом заканчивается доказательство тео- теоремы 1.23. Управляемость системы A.280), конечно, полностью опреде- определяется матрицами А и В. Поэтому удобно ввести следующую тер- терминологию. Определение 1.12. Пусть А и В — соответственно матрицы размерности п X п и п X к. Тогда говорят, что пара {А, В} полностью управляемая, если система x(t) = Ax(t)-\-Bu(t) . A.287) является полностью управляемой. Пример 1.20. Перевернутый маятник Перевернутый маятник из примера 1.1 (разд. 1.2.3) является системой с единственной входной переменной, которая описывает- описывается дифференциальным уравнением состояния *(*) = 0 0 _?_ V 1 F_ О О о о J_ V 0 о 1 о *(*) < о j_ О 0 !*(*). A.288) Матрица управляемости системы имеет вид 0 J_ м 1 м F М м м F_ М 1 м , м ) м \ м ) g V 1 М М } М g 1 L' ЛГ j_ _? i_ VMM A,289)
74 Глава 1 Нетрудно видеть, что ранг матрицы Р равен четырем для всех значений параметров, поэтому система является полностью управ- управляемой. 1.6.З.* ПОДПРОСТРАНСТВО УПРАВЛЯЕМЫХ СОСТОЯНИЙ В этом разделе анализируется структура линейных систем с постоянными параметрами, которые не являются полностью уп- управляемыми. Если система не является полностью управляемой, то, очевидно, представляет интерес определение части пространст- пространства состояний, которая может быть достигнута. В связи с этим вводится следующее определение. Определение 1.13. Подпространство управляемых состояний линейной системы, с постоянными параметрами x(t) = Ax{t)+Bu(t) A.290) является линейным подпространством, состоящим из состояний, которые могут быть достигнуты из нулевого состояния за конечное время. В связи с ролью, которую играет матрица управляемости Р, является закономерным следующий результат. Теорема 1.24. Подпространство управляемый: состояний п-мерной линейной системы с постоянными параметрами x(t) = Ax(t)+Bu(t) A.291) является линейным подпространством, порожденным столбцами матрицы управляемости Р = (В, АВ, ..., А"-1 В). A.292) Эта теорема непосредственно следует из доказательства теоре- теоремы 1.23, где показано, что любое состояние, которое может быть достигнуто из нулевого состояния, принадлежит подпространству, порожденному вектор-столбцами В, АВ, ..., Ап~1В, а любое сос- состояние, не принадлежащее указанному подпространству, не может быть достигнуто. Подпространство управляемых состояний обла- обладает следующим свойством. Лемма 1.3. Подпространство управляемых состояний системы x(t) = Ax(t) + Bu(t) инвариантно по отношению к матрице А, т. е. если вектор х принадлежит подпространству управляе- управляемых состояний, то вектор Ах также принадлежит этому подпро- подпространству. Доказательство этой леммы проведем по схеме доказательства
Элементы теории линейных систем ' 75 теоремы 1.23. Подпространство управляемых состояний порождает- порождается вектор-столбцами матриц В, АВ, ..., Ап~хВ. Таким образом, вектор Ах, где х — вектор, принадлежащий подпространству управляемых состояний, принадлежит линейному подпростран- подпространству, порожденному вектор-столбцами матриц АВ, АгВ, ..., Ап В. Вектор-столбцы матрицы Ап В, однако, линейно зависят от вектор- столбцов матриц В, АВ, ..., Ап~хВ; поэтому Ах принадлежит под- подпространству, порожденному вектор-столбцами матриц В, АВ, ... ..., А"-1В,что означает принадлежность вектора Ах подпростран- подпространству управляемых состояний. Следовательно, подпространство управляемых состояний инвариантно по отношению к матрице А. Понятие подпространства управляемых состояний можно пояс- пояснить следующим фактом. Теорема 1.25. Рассмотрим линейную систему с постоянными пара- параметрами x(t) = Ax(t) + Buft). Тогда система из любого началь- начального состояния, принадлежащего подпространству управляемых состояний, может быть переведена в любое конечное состояние, принадлежащее подпространству управляемых состояний, за ко- конечное время. Докажем этот результат, для чего запишем выражение для состояния системы в момент t^. А{h~U) x + f eA itl~T) = еА{hU) x + f eA itl~T) Bu (x) fc. A.293) п Теперь заметим, что если х0 принадлежит подпространству уп- управляемых состояний, то вектор exp [Afti- to)]xo также принад- принадлежит ему, так как подпространство управляемых состояний ин- инвариантно по отношению к матрице A, a exp lA(tt — t0)] = = / + A(ti — t0) + 1/2A2(ti — t0) + ... . Поэтому если х^ при- принадлежит 'пространству управляемых состояний, то х^ — ехр \A(tt — ^0)^0 также принадлежит ему. Выражение A.293) пока- покапывает, что любой вектор входной переменной, который переводит нулевое состояние в состояние Zj^expfA (tt—to)]xo, также пе- переводит х0 в Zj. Поскольку xt — exp [A (ti — t0)] x0 принадлежит подпространству управляемых состояний, такой входной вектор существует; таким образом, теорема 1.25 доказана. Найдем теперь матрицу преобразования состояния с целью представления системы в'канонической форме, которая облегча- облегчает исследование свойетв "управляемости системы. Предположим, что Р имеет ранг т -^Г. п, т. е. матрица Р имеет т линейно независимых вектор-столбцов. Это означает, что под- подпространство управляемых состояний системы A.290) имеет раз- размерность т. Примем векторы е1; е2, ..., ет в качестве базиса под- подпространства управляемых состояний. Далее, выберем п — т
76 Глава 1 линейно независимых векторов em+1, em+2, ..., еп, которые вмес- вместе с векторами е1( е2, ..., ет порождают все re-мерное пространство. Сформируем теперь неособую матрицу преобразования . Т={Т,,Т2), A.294) где Г, = (е„ е2, ..., ет), . A.295) 212 = (em+1)em+2, ...,е„)- A-296) Наконец, введем преобразованную переменную состояния x'{t), определяемую соотношением ZV @ =•*(<)• A.297) Подставляя A.297) в дифференциальное уравнение состояния A.290), получим Tx'{t) = ATx' (t) + Bu{t), A.298) или х' (t) = Г ATx' (t) + Г1 Ви (t). A.299) Разобьем Т~г на подматрицы следующим образом: A.300) при этом разбиение Т'1 соответствует разбиению Т в том смысле, что Ui имеет тп строк, а'?/2 содержит п — m строк. В результате имеем откуда UzTl = 0. A.302) Матрица Ti состоит из векторов еи ег, ..., ет, которые порож- порождают подпространство управляемых состояний. Это означает, что из A.302) следует. U 0 A.303) для любого вектора х, принадлежащего подпространству управляе- управляемых состояний. С учетом разбиений A.294) и A.300) напишем Г AT = ( Ul )а (Г„ Т2) = ( UiATi UiATz) A304) 1 U2 ) К { U2AT, U2AT2 ) <5>
Элементы теории линейных систем 77 Все столбцы матрицы Tt принадлежат подпространству управ- управляемых состояний. Это означает, что все столбцы матрицы ATi также принадлежат указанному подпространству, так как под- подпространство управляемых состояний инвариантно по отношению к матрице А (лемма 1.3). Однако тогда из A.303) вытекает U2ATi = 0. A.306) Очевидно, что все столбцы матрицы В принадлежат подпро- подпространству управляемых состояний, так как В является частью матрицы управляемости. Поэтому также получаем U2B = 0. A.307) Подведем итоги обсуждения следующим результатом. 'Георема 1.26. Рассмотрим п-мерную систему с постоянными параметрами. x{t) = Ax{t) + Bu(t). A.308) Сформируем неособую матрицу преобразования Т = (Ти Т%), где вектор-столбцы матрицы Т\ образуют базис т-мерного (т <^л) подпространства управляемых состояний системы A.308), а век- вектор-столбцы матрицы Т2 вместе, с вектор-столбцами матри- матрицы Гг образуют базис всего п-мерного пространства. Определим преобразованное состояние в виде х' (t) = Г1 х (t). A.309) Тогда дифференциальное уравнение состояния A.308) преобра- преобразуется в каноническую форму управляемости Ап А\ *'(*)= Здесь Ап'— матрица т Хт, а пара [А1ХГ, Bt'} является пол- полностью управляемой. Разбивая вектор A.311) где .г/ имеет размерность т, а х2 — размерность п — т, и прини- принимая во внимание теорему 1.26, легко установить, что преобразован- преобразованную систему можно представить в виде, показанном на рис. 1.9. Отметим, что поведение х2' полностью независимо, тогда как на
78 Глава 1 х-l оказывают влияние как х{, так и входная переменная и. Тот факт, что пара {Ац' ,В^} полностью управляема, следует из того, что любое состояние вида col (x0', 0) принадлежит подпростран- подпространству управляемых состояний системы A.310). Доказательство оставляем читателю в качестве упражнения. Следует отметить, что каноническая форма управляемости не является единственной, так как матрицы Ti и Т2 могут быть выбра- ult) *г т.* а)=А'ггх'га) Рис. 1.9. Каноническая форма управляемости линейной дифференциальной системы с постоянными параметрами. ны до некоторой степени произвольно. Однако нетрудно убедить- убедиться, что, какой бы ни была матрица преобразования Т, характерис- характеристические числа обеих матриц А^' и А22 всегда являются такими же, как в исходной системе (задача 1.12.5). Вполне естественно назвать характеристические числа мат- матрицы Ац' полюсами управляемости системы, а характеристические числа матрицы А ц' полюсами неуправляемости. Предположим теперь, что все характеристические числа системы A.310) являются различными (это ограничение несущественно). Тогда нетрудно по- показать (задача 1.12.5), что подпространство управляемых состояний системы A.310) порождается собственными векторами, соответ- соответствующими полюсам управляемости системы. Это утверждение также справедливо и для исходного представления A.308) системы. Тогда естественно определить подпространство неуправляемых состояний (что пока еще не сделано) как подпространство, порож- порожденное векторами, соответствующими полюсам неуправляемости системы. Пример 1.21. Смесительный бак Смесительный бак из примера 1.2 (разд. 1.2.3) описывается диф*- ференциальным уравнением состояния
Элементы теории линейных систем 79 -@=1 |*@+l ^ с2_с„ ]»(*). A-312) и его матрица управляемости имеет вид I I !_ Р = | _с ^^ ™ с_с ~ с_с ]• A-313) Ранг матрицы Р равен двум при условии ct ^ сг- Следовательно, система является полностью управляемой, если с4 -ф с2. Если с4 = с2 = с, то с0 = с, и матрица управляемости прини- принимает вид- л _± L\ 26 28 |. A.314) 0 0 0 / Следовательно, подпространство управляемых состояний по- порождается вектором col(l, 0). Это означает, как было видно из при- примера 1.19, что можно управлять только объемом жидкости в баке, по не концентрацией. В заключение отметим, что при ct=c2 — с0 = с дифференциаль- дифференциальное уравнение состояния A.312) принимает вид A.279), что яв- является уже канонической формой управляемости. Значение — 1/2е соответствует полюсу управляемости, а —Ve — полюсу j юуправляемости. 1.Й.4.» СТАБИЛИЗИРУЕМОСТЬ В данном разделе рассмотрим понятие стабилизируемости |(»(), 185]. Соответствующая терминология будет объяснена в разд. •4.2. В разд. 1.4.3 были определены подпространства устойчивых и неустойчивых состояний для систем с постоянными параметрами. •II юбое начальное состояние а;@) может быть единственным образом представлено в следующем виде: х @) = xs @) + хи @), A.315) гдо xs @) принадлежит подпространству устойчивых состояний, а ;г„@) — подпространству неустойчивых состояний. Очевидно, что для правильного управления системой требуется, чтобы неустой- Ми иая компонента была полностью управляемой.
80 Глава 1 Определение 1.14. Линейная система с постоянными параметрами x(t) = Ax(t)+Bu{t) A.316) является стабилизируемой, если подпространство неустойчи- неустойчивых состояний содержится в подпространстве управляемых состоя- состояний, т. е. любой вектор х; принадлежащий подпространству не- неустойчивых состояний, принадлежит также подпространству управляемых состояний. Иногда удобно использовать следующую упрощенную терми- терминологию. Определение 1.15. Пара {А, В} называется стабилизируемой, если система x(t) = Ax(t)+Bu(t) A.317) является стабилизируемой. Имеем следующий очевидный результат.-^ Теорема 1.27. Любая асимптотически устойчивая система с постоянными параметрами является стабилизируемой. Любая полностью управляемая система является стабилизируемой Стабилизируемость системы удобно исследовать, если диффе- дифференциальное уравнение состояния представлено в канонической форме управляемости. Это вытекает из следующего результата. . Теорема 1.28. Рассмотрим линейную систему с постоянными пара- параметрами x(t) = Ax(t)+Bu(t). A.318) Предположим, что уравнение A.318) преобразовано согласно теореме 1.26 в каноническую форму управляемости x'(t)=[U'(t) + [ \u(t), A.319) V?4 V ) где пара {Ап',Bt'} полностью управляемая. Система A.318) явля- является полностью стабилизируемой в том и только том случае, когда матрица А22 асимптотически устойчива. Другими словами, система' является стабилизируемой тогда и только тогда, когда ее полюса неуправляемости являются ус- устойчивыми. Докажем теорему следующим образом. а) Из стабилизируемости следует асимптотическая устойчи- устойчивость матрицы Аг{. Предположим, что система A.318) стабилизируемая. Тогда преобразованная система A.319) также
Элементы теории линейных систем 81 является стабилизируемой (задача 1.12.6). Пусть имеет место раз- разбиение x'(t) = [ , • A.320) где размерность пг вектора Xi'{t) является размерностью подпро- подпространства управляемых состояний исходной системы A.318). Предположим, что матрица А22 является неустойчивой. Вы- Выберем (п — т)-мерный вектор х2 в подпространстве неустойчивых состояний, соответствующем матрице А22 . Тогда очевидно, что //-.мерный вектор-столбец col@, х2) принадлежит подпространству неустойчивых состояний системы A.319). Ясно, однако, что этот пектор не принадлежит подпространству управляемых состояний системы A.319). Это означает, что существует вектор, который принадлежит подпространству неустойчивых состояний, но не принадлежит подпространству управляемых состояний, что про- противоречит предположению о стабилизируемости. Это доказывает, что если система A.318) является стабилизируемой, то матрица Л-,-1 должна быть устойчивой. б) Из устойчивости матрицы А22' следует стабилизируемостъ. Допустим, что матрица А22 устойчивая. Тогда любой вектор, кото- который принадлежит подпространству управляемых состояний сис- системы A.319), должен иметь форму соЦх^, 0). Однако, поскольку пара {414'", Bi'} является полностью управляемой, этот вектор иноке принадлежит подпространству управляемых состояний системы A.319). Это показывает, что любой вектор из подпростран- сгна неустойчивых состояний системы A.319) также принадлежит подпространству управляемых состояний, поэтому система A.319) ииляется стабилизируемой. Следовательно (задача 1.12.6), исход- пая система A.318) является также стабилизируемой. Пример 1.22. Смесительный бак Смесительный бак из примера 1.2 (разд. 1.2.3) при условии г, . с2 = с0 = с описывается дифференциальным уравнением сос- ¦юяния Как было показано выше, эта система не является полностью управляемой. Дифференциальное уравнение состояния уже имеет каноническую форму управляемости. Матрица А22' имеет харак- 1 394
82 Глава 1 теристическое число —1/9, откуда следует, что система является стабилизируемой. Это означает, что. даже если приращение кон- концентрации ?2@ первоначально имеет неправильное значение, оно в итоге будет стремиться к нулю. 1.6.5. УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ Исследование управляемости на основе теоремы 1.24 для ли- линейных систем с переменными параметрами является невозможным. Для таких систем имеем следующий результат, который не будем доказывать. Теорема 1.29. Рассмотрим линейную систему с переменными па- параметрами, дифференциальное уравнение состояния которой имеет, вид x(t) = A(t)x(t) + B(t)u(t). A322) Запишем неотрицательно определенную симметрическую мат- матричную функцию в виде W (t0, t)= f Ф (t, ~) В (т) Вт (т) Фт (*, х) d-г,. A..323) h где Ф(г, t0) — переходная матрица системы. Система является ¦ полностью управляемой тогда и только тогда, когда для всех t^ существует такой момент времени tx (t0 < ^i < °°)i что матрица W(t0, ti) является неособой. Доказательство этой теоремы читатель может найти в книге Калмана, Фалба и Арбиба [92}. Матрица VF^,,, t^} связана g минимальной «энергией управ- управления», необходимой для перевода системы из одного состояния в другое. «Энергия управления» измеряется в соответствии с вы- выражением f uT(t)u(t) dt, A.324) to При определенных дополнительных ограничениях, наложенных на матрицу W(t0, t), может быть введена более сильная форма уп- управляемости [86]. Определение 1.16. Линейная система с переменными параметрами A.322) является равномерно полностью управляемой,
• >.¦!( менты теории линейных систем 83 если, существуют положительные константы or, а0, оц, ро и р",, такие, что а) а0/ <: W (t0, t0 + о) < сц/ для всея iQ; A.325) G) ft,/ « Ф (t0, to + a)W (t0, t0 + а) Фт (t0, t0 + I a) « $J для всех t0, A.326) ,'de W(t0, t) — матрица A.323), a<$)(t, t0) — переходная матрица системы. Равномерная управляемость предполагает не только то, что гистема может быть переведена из любого состояния в любое дру- другое состояние, но также и то, чтв энергия управления, связанная с :>тим переходом,,и время перехода практически не зависят от лачального момента. В-связи с этим замечанием не является нео- неожиданным следующий результат. 'Георема 1.30. Линейная система с постоянными параметрами x(t) = Ax{t)+Bu(t) A.327) мнляется равномерно полностью управляемой тогда и только тог- (iii, когда она полностью управляема. 1.7. Восстанавливаемость 1.7.1*. ОПРЕДЕЛЕНИЕ ВОССТАНАВЛИВАЕМОСТИ В гл. 4 рассматривается задача восстановления поведения сис- системы цо неполным и, возможно, неточным наблюдениям. Перед изучением такой проблемы важно знать, обладает ли данная сис- система свойством, позволяющим определить ее состояние по пове- поведению выходной переменной. Это приводит к понятию восстанав- .шваемости [921, которое обсуждается в данном разделе. Ппедем сначала следующее определение. Определение 1.17. Пусть y(t; t0, x0, и) описывает изменение вы- .ю()ной переменной y(t) линейной дифференциальной системы . A.328)- y(t) = C(t)x(t) и.i начального состояния x(t0) = хп. Тогда система называется полностью восстанавливаемой, если для всех tt существует такой -г
84 Глава 1 момент t0, — оо < tn < tu что из равенства У (t; t0, х0, и) = у (t; t0, xQ , и) to^t<.tit A.329) для всех u(t), t0 ¦*< <-'. t <^ tlt следует x0 — x0'. Определение показывает, что, если система является полностью восстанавливаемой и выходная переменная наблюдается до про- произвольного момента tit всегда существует момент t0 <; t{, при ко- котором состояние системы может быть определено единственным образом. Если x(t0) известно, значение x(t^) также может быть оп- 'ределено. Следующий результат показывает, что для исследования вос- восстанавливаемости системы A.328) можно ограничиться рассмотре- рассмотрением упрощенной ситуации. Теорема 1.31. Система A.328) является полностью восстанавли- восстанавливаемой в том и только том случае, если для всех ti существует такой момент t0> — оо< t0 < tu что из равенства y(t;to,xo,O) = O, to<.t<tlt A.330) следует хп = 0. Этот результат нетрудно доказать. Конечно, для полностью восстанавливаемой системы A.328) из определения следует, что если A.330) справедливо, то хп = 0. Это доказывает одно утверж- утверждение теоремы. Однако, поскольку It ф (*, g х0 + f ф (t, -) в (т) и (х) dx , A.331) и . ¦ равенство имеет место при . C(tL>(t,to)xo=C(t)<I>(t,tJxo, *„<*<*!. C.333) Это в свою очередь эквивалентно соотношению C(t)<b{t,to)(xo—xo) = O, to<t<Ztt. A.334) Очевидно, если из A.334) следует, что х0 — х^' ¦— 0, т.е. х0 = х0', то система является полностью восстанавливаемой. На этом завершается доказательство другого утверждения теоремы 1.31. Определение восстанавливаемости введено Калманом [92]. Следует отметить, что восстанавливаемость дополняет понятие на- наблюдаемости. Говорят, что система вида A.328) полностью наблю-
Элементы теории линейных систем 85 даема, если для всех t0 существует такое время tt < оо, что из равенства y(t; tQ, xQ, и) = у (t; t0, x'o, и), to<t <. tt A.335) для всех u(t), tQ <^ t -< tu следует xn = x0'. Наблюдаемость озна- означает, что имеется возможность определить состояние в момент t0 по будущим значениям выходной переменной. В задачах управ- управления и фильтрации, однако, имеются обычно только прошлые зна- значения выходной переменной. Поэтому более естественно рассмат- рассматривать восстанавливаемость, которая ставит задачу определения настоящего состояния по прошлым наблюдениям. Нетрудно обна- обнаружить, что для систем с постоянными параметрами из полной посстанавливаемости следует полная наблюдаемость и наоборот. Пример 1Л23. Перевернутый маятник Рассмотрим перевернутый маятник из примера 1.1 (разд. 1.2.3) и примем в качестве выходной переменной угол q>(t). Сравним сос- состояния A.336) Второе состояние отличается от первого (нулевого) тем, что и тележка, и маятник перемещаются на расстояние d0; иначе говоря, система находится в покое. Если приложенное входное воздейст- воздействие равно нулю, система остается в прежнем положении и ср(?) = О в обоих случаях. Ясно, что, если наблюдается только угол q(t), невозможно решить, в каком из этих двух состояний находится система в настоящее время; таким образом, система не является полностью восстанавливаемой. 1.7.2*. ВОССТАНАВЛИВАЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ В этом разделе обсуждается задача о восстанавливаемости ли- линейных систем с постоянными параметрами. Основной результат заключается в следующем. Теорема 1.32. п-мерная линейная система с постоянными па- параметрами 0 \ 1 0 о/ и /do / 0 1 do \0 = Cx(t)
86 Глава 1 является полностью восстанавливаемой в том и только том случае, если вектор-строки матрицы восстанавливаемости порождают п-мерное пространство С- СА СА2 A.338) Это может быть доказано следующим образом. Сначала пред- предположим, что система A.337) является полностью восстанавливае- восстанавливаемой. Тогда из теоремы 1.31 следует, что для всех f4 существует та- такой момент tu, для которого из равенства CeMt~*°)x0 = Q, to<.t<.tit A.339) получаем х0 = 0. Представляя ехрЫ(? — ?<j)] B виДе Ряда Тейлора, находим, что выражение A.339) эквивалентно равенству 2! t0 ¦< t С А2 3! + ...]*„ = 0. A.340) Если .матрица восстанавливаемости Q не имеет полного ранга, су- существует такое ненулевое х0, что Сх = 0 С Ах = 0 С Ап~^ х =¦ 0 A 3411} Используя теорему Кэли—Гамильтона, нетрудно видеть, что СА'х0 = 0 для I >- п. Таким образом, если Q не имеет полного ранга, существует такое ненулевое х0, для которого справедливо A.340). Ясно, что в этом случае из A.339) не следует х0 — 0, и система не является полностью восстанавливаемой. Это противоре- противоречит нашему допущению, откуда следует, что матрица Q должна иметь полный ранг. Докажем теперь другое утверждение теоремы 1.32. Допустим, что Q имеет полный ранг. Предположим, что y(t)=CeMt~t>)x0 = 0, *„<*<*!. . A.342) Многократно дифференцируя y(t), получаем y(to) = Cxo = O, у' (д = С Ах, = 0, A.343)
Элементы теории линейных систем 87 или Qxo = O. A.344) Поскольку Q имеет полный ранг, из A.344) следует, что х0 = 0. Отсюда на основании теоремы 1.31 имеем, что система является полностью восстанавливаемой. На этом заканчивается доказатель- доказательство теоремы 1.32. Поскольку восстанавливаемость системы (.1.337) зависит толь- только от матриц А и С, удобно использовать следующую термино- терминологию. Определение 1.18. Пусть А и С — матрицы размерами пХп, и I X п соответственно. Тогда пара {А, С} называется полно- полностью восстанавливаемой, если система x(t) = Ax(t), y(t) = Cx{t) A.345) A.346) является полностью восстанавливаемой. Пример 1.24. Перевернутый маятник Перевернутый маятник из примера 1.1 (разд. 1.2.3) описывает- описывается дифференциальным уравнением состояния 0 0 0 g_ V 1 F M 0 0 0 0 0 g и 0 0 1 0 x(t) = Если в качестве выходной переменной ti (t) принять угол получим (b){t)- (L348) *(*) + ¦ 0 1 M 0 0 A-347) Матрица - 1 L' 0 g V 0 восстанавливаемости имеет 1 L' — F M — ¦ 0 1 V g T' l l 17" i V 0 g I f \2 i ~[~m) U вид 1 V 0 1 L' 0 ¦g V 1 . A.349)
Глава 1 Эта матрица имеет ранг, равный трем; следовательно, система . не является полностью восстанавливаемой. Это подтверждает вывод примера 1.23. Если добавить в качестве второй компоненты выходной переменной перемещение тележки s{t), получим —L о J- v 1 о и о о о \x(t). A.350) Это приводит к матрице восстанавливаемости J_ V О Q = 1 и 1 0 0 g V 0 0 0 0 0 1 ~~ V 1 F 1 ~М~ ~~L' F ~^~ L' 1 Л/ 1 V О _?_ L' О О о о о 7 о о о g о A.351) При данной выходной переменной система является полностью восстанавливаемой, так как матрица Q имеет ранг, равный четырем. 1.7.3*. ПОДПРОСТРАНСТВО НЕВОССТАНАВЛИВАЕМЫХ СОСТОЯНИЙ В этом разделе анализируется структура систем, которые не являются полностью восстанавливаемыми. Если система не яв- является полностью восстанавливаемой, то по выходной переменной . невозможно однозначно установить, в каком состоянии система находится. Ясно, что представляет интерес вопрос, какая мера неопределенности остается. Это приводит к следующему опре- определению. Определение 1.19. Подпространство невосстанавливае- мыж состояний линейной системы с постоянными параметрами A.352)
Элементы теории, линейных систем 89 является линейным подпространством состояний х0, для которых y(t;to,xo,i)) = O, t>t0. A.353) Следующая теорема характеризует подпространство-невосста- павливаемых состояний. Теорема 1.33. Подпространство невосстанавливаемых состояний п-мерной линейной системы с постоянными параметрами ( = Cx(t) является нуль-пространством матрицы восстанавливаемости Q = \ CA* \ A.355) Доказательство этой теоремы непосредственно следует из до- доказательства теоремы 1.32, где показано, что любое начальное состояние, принадлежащее нуль-пространству матрицы Q, по- порождает выходную переменную, которая идентична нулевой ре- реакции при нулевом входном сигнале. Любое начальное состояние, пе принадлежащее нуль-пространству матрицы Q, вырабатывает ненулевую реакцию, показывающую, что нуль-пространство ма- матрицы Q является подпространством невосстанавливаемых сос- состояний. Подпространство невосстанавливаемых состояний обла- обладает следующим Свойством. Лемма 1.4. Подпространство невосстанавливаемых состояний системы x(t) = Ax(t), y(t) = Cx(t) инвариантно по отношению к матрице А. Доказательство этой леммы предоставляем в виде упражнения читателю. Понятие подпространства невосстанавливаемых состояний можно пояснить следующим результатом. Теорема 1.34. Рассмотрим систему с постоянными параметрами x(t) = Ax(t)+Bu(t), ( y(f) = Cx(t). Предположим, что выходная y(t) и входная u(t) переменные известны на интервале t0 ^ t -^ tt. Тогда начальное состояние
¦Q0 Глава 1 системы в момент t0 определяется с точностью до произвольного вектора, принадлежащего подпространству невосстанавливаемых состояний. В результате конечное состояние в момент tt также определяется с точностью до произвольного вектора, принадле- принадлежащего подпространству невосстанавливаемых состояний. Чтобы доказать первую часть теоремы, надо показать, что если два начальных состояния x(t0) = х0 и x(t0) — х0' производят одну и ту же самую выходную переменную y(t), t0 ^ t <^ tlt при любой входной переменной u(t), t0 <! t ^ tv то х0 — ха' принадлежит под- подпространству невосстанавливаемых состояний. Это, очевидно, справедливо, так как вследствие линейности системы условие у (t' t х и) = у (t~ t x u\ t < t <: t A 357) эквивалентно условию y(t; t0, хй — x'0,Q) = 0, to<t<tit A.358) откуда следует, что х0 — х0' принадлежит подпространству невос- невосстанавливаемых состояний. Вторая часть теоремы доказывается следующим образом. Ре- Результатом добавления произвольного вектора х0", принадлежа- принадлежащего подпространству невосстанавливаемых состояний, к векто- вектору х0 является добавление выражения ехр[Л(^ — ^0)]ж0" к конеч- конечному состоянию. Поскольку выражение ехр[4(^ — t0)] может быть разложено в степенной ряд матрицы А и подпространство невосстанавливаемых состояний инвариантно по отношению к матрице А, то exp [A(tl — to)]xo" также принадлежит подпростран- подпространству невосстанавливаемых состояний. Более того, поскольку мат- матрица exp [4(it — ?0I неособая, это означает, что конечное состо- состояние определяется с точностью до произвольного вектора, принад- принадлежащего подпространству невосстанавливаемых состояний. Рассмотрим теперь преобразование состояния, которое пред- представляет систему в канонической форме с целью простого выяв- выявления свойств- восстанавливаемости системы. Предположим, что Q имеет ранг т <^ п, т. е. Q имеет т линейно независимых вектор- строк. Это означает, что нуль-пространство Q и, следовательно, подпространство невосстанавливаемых состояний имеют размер- размерность га — т. Вектор-строки матрицы Q порождают иг-мерное ли- линейное подпроетранство; положим, что вектор-строки /lt /2, :..,/m образуют базис этого подпространства. Очевидно, за базис следу- следует принять т независимых вектор-строк матрицы Q. Далее пусть fm+u fm+z, ¦•-, in являются п — т линейно „независимыми вектор- стррками, которые вместе с /1? ..., fm порождают все га-мерное пространство. Составим неособую матрицу преобразования ' и = [и„Л, A.359)
Элементы теории линейных систем 91 где •' /тп+1 \ /т+2 1 . A.360) fm/ \ln ) Наконец, введем преобразованную переменную состояния х' (t) = Ux(t). A.361) Подставляя A.361) в A.356), получим V1 х' (t) = AU-i х' (t) + Ви (t), A 362) у (t) = CU-1 x' (t), ¦ или , A363) = CU-1x'(t). ¦ Представим матрицу U в виде U-1 = G\, Т.г), A.364) что соответствует Такому разбиению U, при котором Tj имеет гп, а Т2 — п — m столбцов. Имеем откуда следует UiT2 = Q. A.366) Строки "матрицы [74 дополняются линейными комбинациями линейно независимых строк матрицы восстанавливаемости Q. Ото означает, что любой вектор х, который удовлетворяет усло- условию UiX = 0, также удовлетворяет условию Qx — 0 и поэтому, принадлежит подпространству невосстанавливаемых состояний. Поскольку UiT2 = 0,' A.367) «се вектор-столбцы матрицы Tz должны принадлежать подпро- странству невосстанавливаемых состояний. Тгш как Т2 имеет п — тп линейно независимых вектор-столбцов и подпространство невосстанавливаемых состояний имеет размерность п — тп, век- вектор-столбцы матрицы Т2 образуют базис подпространства. Поэто- Поэтому из A.367) следует U^x = 0 для любого х, принадлежащего под- подпространству.
92 Глава 1 При разбиении A.359) и A.364) имеем в CU-1 = (CTlt СТ2). A.369) Все вектор-столбцы матрицы Т2 принадлежат подпространству невоестанавливаемых состояний; поскольку подпространство ин- инвариантно по отношению к матрице А (лемма 1.4), столбцы матри- матрицы А Т2 также принадлежат подпространству, и из A.367) имеем UtAT2 = 0. A.370) Поскольку строки матрицы С являются строками матрицы восстанавливаемости Q, а столбцы матрицы Тг принадлежат под- подпространству невосстанавливаемых состояний и, следовательно, нуль-пространству матрицы Q, получаем СТг = 0. A.371) Подведем итоги следующим образом. Теорема 1.35. Рассмотрим п-мерную линейную систему с постоян- постоянными параметрами x(t) = Ax(t) + Bu(t), A.372) y(t)=Cx(t). Сформируем неособую матрицу преобразования A.373) где т строк матрицы [74 образуют базис т-мерного (т ^ п) под- подпространства, порожденного строками матрицы восстанавливае- восстанавливаемости системы, п—т строк матрицы \]г вместе с т строками матрицы U1 образуют базис всего п-мерного пространства. Определим преобразованную переменную состояния как „I /f\ TJr lf\ (А Он/Л С использованием преобразованной переменной состояния сис- система представляется в канонической форме восстанав- восстанавливаемости Ап 0 \ ( В\ 4. x'(t) = A.375) y(t) = (C[, 0)x'(t).
Элементы теории линейных систем 93 Здесь Ап' — матрица размерами m X m, а пара .является полностью восстанавливаемой. При разбиении х (t) = A.376) где xt' имеет размерность т, а х2' — размерность п — т, из тео- теоремы 1.35 следует, что система может быть представлена в виде, показанном на рис. 1.10. Заметим, что никакого суждения о пере- u(t) Xjftj = A'21 x{ [t) + A\ zx'z[t)+B'zu(t) 1 'ii<-, 1.10. Каноническая форма восстанавливаемости линейной дифференци- дифференциальной системы с постоянными параметрами. менной х{ не может .быть сделано по наблюдению выходной пере- переменной у. То, что пара {AXir, С4} является полностью восстанав- восстанавливаемой, вытекает из следующего: если начальное состояние ¦'¦'('о) ПРИ нулевом входном сигнале производит нулевую реакцию, оно должно иметь вид x'(t0) = col@, х2о'). Полное доказательство читатель может провести сам в качестве упражнения. В заключение отметим, что каноническая форма восстанавли- шюмости не является единственной, так как матрицы Ui и Ui могут быть выбраны до некоторой степени произвольно. Однако, |,;\кое бы преобразование ни выполнялось, можно показать, что характеристические числа матриц Atl' и А22.' всегда являются те- теми же самыми, что и в исходной системе. Это приводит к определе- определению характеристических чисел матрицы Аи' как полюсов восста- восстанавливаемости, а характеристических чисел матрицы AZ2 как полюсов невосстанавливаемости системы A.372). Для простоты по- положим, что все характеристические числа системы являются раз- различными. Тогда можно доказать, что подпространство невосста- навливаемых состояний системы порождается теми собственны- собственными векторами системы, которые соответствуют полюсам невос-
94 Глава 1 станавливаемости. Это справедливо как для преобразованного A.375), так и для исходного A.372) представления системы. Впол- ¦не естественно теперь определить подпространство восстанавли- восстанавливаемых состояний системы A.372) как подпространство, порож- порожденное собственными векторами системы, соответствующими полюсам восстанавливаемости. Пример 1.25. Перевернутый маятник В примере 1.24 было показано, что перевернутый маятник не является полностью восстанавливаемым, если в качестве наблю- наблюдаемой переменной выбран угол ц>(?). Определим теперь подпро- подпространство невосстанавливаемых состояний и каноническую форму восстанавливаемости. Нетрудно видеть, что строки матрицы вос- восстанавливаемости Q, определяемой выражением A.349), порож- порождаются^ вектор-строками (-1,0,1,0), @,-1,0,1), @,1,0,0). A.377) Любой вектор х = соЦ?!, %%, %3, ?4), принадлежащий нуль- пространству Q, должен удовлетворять условиям = 0, A.378) Это означает, что подпространство" невосстанавливаемых сос- состояний порождается вектором col A, 0, 1, 0). A.379) Любое начальное состояние, пропорциональное этому вектору, является неотличимым от нулевого состояния, как показано в примере 1.23. Чтобы привести уравнение системы к канонической форме восстанавливаемости, выберем вектор-строки A.377) в качестве первых трех строк матрицы преобразования U. Четвертую строку выберем до некоторой степени произвольно: A, 0, 0, 0). A.380) Найдем матрицу преобразования U и соответствующую ей обратную матрицу / — 1 0 1 0\ /0 0 6 0 _1 0 l\ [/-i/oO 0 1 0 0 Г I 1 0 0 1 0 0 0/ \ 0 1 1
Элементы теории линейных систем 95 Преобразованная < (t) = 0 g V 0 0 ,1 0 0 0 система 0 F M F M 1 уравнений имеет . 01 * 0 • 0 . 0 *'(*) + вид 0 1 М 1 М о V-it), A.382) = (-L 0, 0, O)ar'(t). Как следует из A.24), компонентами преобразованного состоя- состояния являются A.383) В этом представлении положение и скорость маятника отно- относительно тележки, так же как скорость тележки, могут быть вос- восстановлены по наблюдаемой переменной, но нельзя восстановить' положение тележки. Нетрудно видеть, что полюсами восстанавливаемости являются —FIM и ±V gIL'. Полюс невосстанавливаемости равен 0. 1.7.4*. ОБНАРУЖИВАЕМОСТЬ В предыдущем разделе было показано, что при наблюдении Л1.1ходной переменной не полностью восстанавливаемой системы ж-игда существует неопределенность в определении действитель- действительного состояния системы, так как к любому возможному состоянию можно добавить произвольный вектор, принадлежащий подпро- подпространству невосстанавливаемых состояний (теорема 1.34). Самое лучшее, на что можно рассчитывать в данной ситуации, состоит к следующем. Любое состояние, принадлежащее подпространству невосста- невосстанавливаемых состояний, обладает тем свойством, что дйижение системы из этого состояния при нулевом входном сигнале сходится и нулю. Это соответствует случаю, когда любое состояние, принад- принадлежащее подпространству невосстанавливаемых состояний, при- принадлежит также подпространству устойчивых состояний системы. Тогда, что бы ни было принято в качестве невосстанавливаемой
96 Глава,1 х .... компоненты состояния, ошибка никогда не будет неограниченно возрастать. Систему, обладающую таким свойством, будем назы- называть обнаруживаемой [185]. Определим это свойство следующим образом. Определение 1.20. Линейная система с постоянными параметрами x(t) = Ax(t) + Bu(t), A.384) y(t)=Cx(t) является обнаруживаемой, если ее подпространство невосстанав- ливаемых состояний содержится в подпространстве устойчивых состояний. Удобно использовать следующую упрощенную терминологию. Определение 1.21. Пара {А, С} является обнаруживаемой, если система x(t) = Ax(t), A385) у (t) = Cx (t) является обнаруживаемой. Следующий результат непосредственно вытекает из опреде- определения. Теорема 1.36. Любая асимптотически устойчивая система вида A.384) является обнаруживаемой. Любая полностью восстанавли- восстанавливаемая система вида A.384) является обнаруживаемой. Обнаруживаемые системы обладают следующим свойством. Теорема 1.37. Рассмотрим линейную систему с постоянными параметрами x(t) = Ax(t), ( y(t)=Cx(t). Предположим, что, согласно теореме 1.35, система преобра- преобразована к виду A.387) y(t) = (C\,O)x'(t), где пара {Ацг С/} является полностью восстанавливаемой. Тогда
Элементы теории линейных систем • ' 97 система является обнаруживаемой в том и только том случаег если матрица А^г асимптотически устойчивая. Теорему можно подытожить следующим утверждением: сис- система является обнаруживаемой тогда и только тогда, когда ее полюса невосстанавливаемости являются устойчивыми. Докажем теорему следующим образом. а) Из обнаруживаемости следует асимптотическая устойчи- устойчивость А22 ¦ Пусть вектор преобразованной переменной состояния разбит следующим образом: / х\ (t) где размерность т вектора xt'(t) равна рангу матрицы восстанав- восстанавливаемости. То, что система является обнаруживаемой, обусловли- обусловливает следующий факт: любое начальное состояние, принадлежащее подпространству невосстанавливаемых состояний, дает реакцию, сходящуюся к нулю. Любое начальное состояние, принадлежащее подпространству невосстанавливаемых состояний, имеет в преоб- преобразованном представлении вид °) A389) Изменение преобразованного состояния из этого начального состояния определяется выражением x'(t) = l . ). A.390) V*22*2(°)/ Поскольку эта реакция должна сходиться к нулю, матрица /122' должна быть устойчивой. б) Из асимптотической устойчивости А22 следует обнаружи- ваемостъ. Любое начальное состояние х@), принадлежащее под- подпространству невосстанавливаемых состояний, должно в преоб- преобразованном представлении иметь вид A-391) Движение из этого состояния описывается выражением 22 х2@)
«8 Глава 1 Поскольку матрица А22 является устойчивой, такая реакция сходится к нулю. Это показывает, что состояние х@), которое по предположению принадлежит подпространству невоестанавли- ваемых состояний, также принадлежит и подпространству устой- устойчивых состояний. Из этого следует, что система является обнару- обнаруживаемой. Пример 1.26. Перевернутый маятник. Рассмотрим перевернутый маятник в преобразованном представ- представлении из примера 1.25. Матрица А^' имеет характеристическое число 0, откуда следует, что система не является обнаруживаемой. Это означает, что, если первоначально существует неопределен- неопределенность в определении положения тележки, такая ошибка будет ос- оставаться постоянной. 1.7.5*. ВОССТАНАВЛИВАЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ Восстанавливаемость линейных систем с переменными napaJ метрами можно исследовать следующим образом. Теорема 1.38. Рассмотрим линейную систему с переменными па- параметрами x(t) = A(t)x(t)+B(t)u(t), A393) y(t) =C(t)x(t). Запишем для нее неотрицательно определенную матричную функцию ts Рг(~, t) CT (i) С (i) Ф (т, t)dk, A.394) где Ф(% t0) — переходная матрица системы. Система является полностью, восстанавливаемой в том и только том случае, если для всех ti существует такой момент времени t0, —со < t0 < ti7 для которого матрица M(t0, tj является неособой. Доказательство читатель может найти в работах [29, 92]. Более сильная форма восстанавливаемости приводит в результате к на- наложению дополнительных условий на матрицу М [86]. Определение 1.22. Система с переменными параметрами A.393) является равномерна полностью восстанавливаемой, если существуют такие положительные константы <у, осо, ai7 po и р4, что
Элементы теории линейных систем 99 а) а0/ < М (ti —0, i4) < aj для всех tu A.395) б) р0/ < Фг(^ —а, tj M (ti — о, tt) Ф (tt — a, t^ < а,/ для всех- tit A.396) где M(t, tj — матричная функция A.394). Равномерная восстанавливаемость гарантирует, что идентифи- идентификация состояния всегда возможна приблизительно в пределах оди- одинакового интервала времени. Для систем с постоянными парамет- параметрами справедливо следующее. Теорема 1.39.' Линейная система с постоянными параметрами ( y(t)=Cx(t) является равномерно полностью восстанавливаемой в том и только в том случае, если она является полностью восстанавливаемой. 1.8*. Дуальность линейных систем При изучении свойств управляемости и восстанавливаемости нетрудно было заметить симметрию свойств, которую можно ис- исследовать более полно, использовав принцип дуальности (двой- (двойственности) [86, 92]. Определение 1.23. Рассмотрим линейную систему с переменными параметр ами ( y(t)=C(t)x(t), а также систему >(*)= AT(t* — t)x*(t) + CT(t* — t)u*(t), ¦ A.399) y*(t)=BT(t*—t)x*(t), где t* — произвольный фиксированный момент. Система A.399) называется дуальной системе A.398) относительно момента t*. Цель введения дуальных систем становится очевидной в гл. 4, где обсуждается дуальность задач линейного оптимального уп- управления и задач линейного оптимального наблюдения. В связи с этим имеем следующий результат. Теорема 1.40. Система, дуальная системе A.399) относительно момента t*, является исходной системой A.398).
100 ¦ Глава 1 Существует тесная связь между восстанавливаемостью и уп- управляемостью исходной и дуальной систем. Теорема 1.41. Рассмотрим систему A.398) и дуальную ей систему A.399), где время t*, произвольное. а) Система A.398) является (равномерно) полностью управ- управляемой в том и только том случае, если дуальная система (равно- (равномерно) полностью восстанавливаемая. б) Система A.398) является (равномерно) полностью восста- восстанавливаемой в том и только том случае, если дуальная система (равномерно) полностью управляемая. в) Предположим, что система A.398) имеет постоянные пара- параметры. Тогда система A.398) является стабилизируемой в том и только том случае, если дуальная система обнаруживаемая. г) Предположим, что система A.398) имеет постоянные пара- параметры. Тогда она является обнаруживаемой, если дуальная сис- система стабилизируемая. Приведем доказательство только для систем с постоянными параметрами. Матрица восстанавливаемости дуальной системы имеет вид ?* = В1 ВТ(АТ) уВТ(Ат) Г \л-1 = РТ A.400) где Р — матрица управляемости исходной системы. Это сразу до- доказывает утверждение (а). Утверждение (б) теоремы доказывается подобным же образом. Матрица управляемости, дуальной системы определяется выраже- выражением Р* = (СГ , АТСГ, ..., (A7)'1-1 CT) = QT, A.401) где Q'— матрица восстанавливаемости исходной системы. Отсюда следует справедливость утверждения (б). Утверждение (в) может быть доказано следующим образом. Исходная система с помощью преобразования х = Т~1х, согласно теореме 1.26 (разд. 1.6.3), может быть приведена к канонической форме управляемости х' (t) = \x'{t) В, \u(t), X22 , = (C[, C2)x'(t). A.402)
Элементы теории линейных систем 101 Если система A.398) стабилизируема, то пара {Аи', Z?/} яв- является полностью управляемой, а А 1г^~устойчивой. Система, . дуальная преобразованной системе, имеет вид A.403) Поскольку пара {Ац1, Вн'} является полностью управляемой, пара {Ац'т, 5ц'7*} полностью восстанавливаемая [утверждение (а)\. Поскольку матрица А22 является устойчивой, А%2'т также ус- устойчивая. Отсюда следует, что система A.403) обнаруживаемая. С. помощью преобразования Ттх* = х'* (см. задачу 1.12.8) система A.403) преобразуется в дуальную систему по отношению к исход- исходной. Следовательно, поскольку система A.403) обнаруживаемая, inстема, дуальная исходной, также является обнаруживаемой. Повторяя основные шаги доказательства, нетрудно доказать тео- теорему, обратную теореме 1.41 (в). Утверждение (д) может быть до- i;n:mno аналогичным способом. Доказательство утверждений (а) и (б) для случая систем с переменными параметрами оставляем читателю в качестве упражнения. Завершим этот раздел установлением следующего результата, относящегося к устойчивости исходной и дуальной систем. Теорема 1.42. Система A.398) является экспоненциально устойчи- iioi'i в том и только том случае, если дуальная система A.399) .тспоненциалъно устойчивая. Этот результат нетрудно доказать, сначала удостоверившись, что дуальная система имеет переходную матрицу Фг (t*—10, t*— t),, сени система A.398) имеет переходную матрицу Ф(?, t9), а затем используя определение 1.5 (разд. 1.4.1). 1.9*. Канонические формы фазовой переменной При рассмотрении линейных систем с постоянными парамет- параметрами и скалярной входной переменной иногда бывает удобно ис- использовать так называемую каноническую форму фазовой перемен- переменной. Определение 1.24. Линейная система с постоянными параметра- параметрами и скалярной входной переменной представлена в канони- чесмои форме фазовой, переменной, если уравнения системы имеют вид
102 Глава 1 x(t) = О 1 О О 0 1 .0 . о о .0 1 — а, i x(t) + ) 0 0 0 1 11@. A-404) y{t) = Cx(t). Заметим, что никаких особых ограничений на матрицу С это определение не накладывает. Нетрудно видеть, что числа at , i=0,...,n — 1, являются коэффициентами характеристичес- характеристического полинома . ' п 2° 1=0 A.405) системы, где а„= 1. Нетрудно показать, что система A.404) всегда полностью управ- управляема. Действительно, любая полностью управляемая система со скалярной входной переменной может быть преобразована к канонической форме фазовой переменной. Теорема 1.43. Рассмотрим полностью управляемую систему с постоянными параметрами и скалярной входной переменной х @ = Ах (t) + bp (t), A,406) y(t) = Cx(t), где Ъ — вектор-столбец. Пусть Р — матрица управляемости системы • Р = (Ь, АЬ, А% ... , Ап-Щ, A.407) и пусть det (si — A) = A.408) где ап = 1 является характеристическим "полиномом матрицы А. Тогда система преобразуется к канонической форме фазовой пере- переменной преобразованием x(t) = Tx'(t). Здесь Т — неособая мат- матрица преобразования Т = РМ, где o-i (h а„ -а„ 0 x. 0 A.409)
• ).п'менты теории линейных систем •* 103 Если система A.406) не является полностью управляемой, та- ного преобразования не существует. Этот результат может быть доказан следующим образом [3]. Нетрудно установить, что матрица преобразования Т неособая: /' является неособой матрицей из-за допущения о полной управ- управляемости, a det(M) = 1, потому что а„ = 1. Теперь докажем, что Т преобразует систему к канонической форме фазовой перемен- переменной. После умножения Р на М нетрудно видеть, что Т можно записать в виде Т = fo, h U. A-410) где вектор-столбцы tt матрицы Т определяются выражениями ti = afi + azAb + as42b + ... + а„ А"-1 Ъ, ... + аПА»-2Ъ, ¦ A.411) Ил A.411) получаем Ati = tt_l—al-1ta, J = 2,3,...,n, A.412) так как Ъ = tn. Теперь дифференциальное уравнение состояния системы запи- запишем с помощью новой переменной: х'(t) =.T-1 AT x'(t)+ 1-^4.A). A.413) j 1'ассмотрим матрицу Т'гАТ. Обозначим "строки матрицы Т'1 через rt, i =1,2, ..., п. Тогда при i = 1, 2, ..., пи/ = 2, 3, ..., п (i, /)-й элемент матрицы Т'^АТ определяется выражением (Г AT)tj = rt (At,) = г, (tM -aM tn) = 1 при i — j ¦— 1, -а;_, при i = п, A.414) 0 в остальных случаях. Это доказывает, что последние п — 1 столбцов матрицы Тг~А Т имеют вид, соответствующий канонической форме фазовой пере- моиной. Чтобы определить первый столбец, из A.411) найдем aAi =—аф = —а„*в, A.415) так как, согласно теореме Кэли—Гамильтона, справедливо соот- соотношение ...+anAn = 0. A.416)
104 Глава 1 Следовательно, для i = 1, 2, ..., п имеем — а0 при i = п, О в остальных A.417) случаях. Подобным же образом можно показать, что Т~гЪ имеет требуе- требуемую форму; на этом заканчивается доказательство первой части теоремы 1.43. В справедливости последнего утверждения теоре- теоремы 1.43 нетрудно убедиться: если система A.406) не является пол- полностью управляемой, никакое неособое преобразование не может привести систему к канонической форме фазовой переменной, так как неособые преобразования сохраняют свойства управляе- управляемости (см. задачу 1.6). Другой метод нахождения канонической формы фазовой переменной рассматривается в работе [145]. Вы- Вычислительные аспекты задачи описываются в работах [82, 146, 169]. Для систем со скалярной входной переменной, представлен- представленных в канонической форме фазовой переменной, некоторые за- задачи линейного оптимального управления решаются намного про- проще, чем в случае, когда система представлена в общей форме (см., например, разд. 3.2). Аналогично некоторые задачи фильтрации, включая восстановление состояния по наблюдениям выходной переменной, более просто решаются, когда система представляется в канонической форме дуальной фазовой переменной. Определение 1.25. Линейная система с постоянными парамет- параметрами и скалярной выходной переменной представляется в кано- канонической форме дуальной фазовой переменной, если, уравнения системы имеют вид ' *(*) = 0 1 0 о 0 0 1 0 0 0 0 = @00 0 -а0 0 — сц 0 —-сц. 0 Bu(t)f A.418) Заметим, что определение не накладывает никаких особых ог- ограничений на матрицу В. Рассматривая теорему 1.43 с позиций дуальности, нетрудно найти преобразование, позволяющее пред- представить полностью восстанавливаемые системы в дуальной ка- канонической форме. Соответствующие канонические формы могут быть получены и для многомерных систем [3, 80, 118, 181].
¦ i.irменты теории линейных систем 105 НО. Векторные стохастические процессы 1.10.1. ОПРЕДЕЛЕНИЯ В следующих главах в качестве математических моделей воз- возмущающих и шумовых воздействий используются стохастические процессы. На исследуемые системы весьма часто оказывают одно- лрсменное действие как возмущения, так и шумы. В связи с этим ткшикает необходимость рассмотреть векторные стохастические процессы, что и составляет предмет изучения данного раздела. Стохастический процесс может быть представлен как семейство Функций времени. Каждую функцию времени будем называть реализацией процесса. Предположим, что vt(?), v2(?), ..., vn(?) лиляются п скалярными стохастическими процессами, которые, ионможно, взаимно зависимы. Тогда назовем р(г) = со1К(г), v2(f), ...; vn(*)] A.419) «гкторным стохастическим процессом. Всегда будем предполагать, что каждая компонента вектора v{t) принимает действительные s .чмачения и что t >- t0, где t0 задано. Стохастический процесс может быть охарактеризован посред- ¦спмш совместного распределения вероятностей Р {v (t{) < vlt v (t2) «? v2, ..., v (О < vm) A.420) 'i.i»r всех действительных v\, v2, ..., vm, для всех tl4 t2, ..., tm ^: t0 и для каждого натурального числа т. Здесь векторное неравенст- IIO v(tj) -^ vi по определению удовлетворяется, если неравенства M*f)<v«. 7-1, 2, .... п, A.421) удовлетворяются одновременно. Значения v| являются компо- игитами вектора Vi т. е. vt = col (vfl, vf2, ..., vln). Особый класс стохастических процессов составляют те процес- 11.1, стохастические свойства которых не изменяются .с течением прсмени. Определим их более точно. Определение 1.26. Стохастический процесс v(t) является стацио- нарны.ч, если = P{v(ty + 9) < vit ... ,v(tm + Q)< vm) A.422) <).ih всех tl7 t2, .,., tm, для всех vt, ..., vm, для каждого целого поло- положительного числа т и для всех В. Совместное распределение ве-
106 Глава 1 роятностей, которое характеризует стационарный стохастический процесс, является, таким образом, инвариантным относительно изменения начала отсчета времени. Во многих случаях представляют интерес только свойства пер- первого и второго порядков стохастического процесса, а именно среднее значение и ковариационная матрица или, что эквивалент- эквивалентно,, матрица смешанных моментов второго порядка. Определим эти термины следующим образом. Определение 1.27. Рассмотрим векторный стохастический про- процесс v(t). Тогда m{t) = E{v{t)} ' A.423) назовем вектором средних значений (средним значе- значением) процесса, Rv {tlt tz) = Е {[v (tt) - т (*,)] lv (t2) -m (t2)f } A.424) ковариационной матрицей, а Г A-425) матрицей смешанных моментов второго порядка. Мат- Матрица Rv(t,t)=Q(t) называется матрицей дисперсий, a Cv(t,t) — =¦=(?'(?)— матрицей моментов второго порядка. Здесь Е — оператор математического ожидания. В дальней- дальнейшем часто будем предполагать, что рассматриваемый стохастичес- стохастический процесс имеет нулевое среднее, т. е. m(t) = 0 для всех t; в этом случае ковариационная матрица и матрица смешанных моментов второго порядка совпадают. Матрица смешанных момен-- тов второго порядка в рассмотренном виде записывается следую- следующим образом: A.426) Каждый элемент матрицы С„{1и t2) является скалярным смешан- смешанным моментом. Подобным же образом каждый элемент матрицы Rv(ti' ^2) является скалярной ковариационной функцией. Нетруд- Нетрудно доказать следующее. Теорема 1.44. Ковариационная матрица Rv(ti, tz) и матрица, смешанных моментов второго порядка Cv(tit t%) векторного сто- стохастического процесса v(t) имеют следующие свойства:
Пименты теории линейных систем ' ' 107 а) Rv{t%, tl) = Rl{t1, tz) для всех tlt t2 и A.427) Cv{h, h) = CTv{tu Q для всех tlt t2; A.428) б) Q (t) = Rc (t, t) > 0 для всех t и A.429) Q' (t) = Cv (t, *) :» 0 для всех t; A.430) в) Ce(tlttz) = RB{ti, tj+mitjm7^) для всех tu t4y A.431) .i)e m(t) — среднее значение процесса. Здесь М > 0 — квадратная симметрическая неотрицательно «предеденная действительная матрица, т. е. хтМх>-0 для всех действительных х. A.432) Теорему нетрудно доказать на основании определений Rv(t^, t2) ii СоA{, t2). Поскольку свойства второго порядка стохастических процессов в равной мере хорошо характеризуются как ковариаци- ковариационной матрицей, так и матрицей смешанных моментов, обычно Г>удем рассматривать только ковариационную матрицу. Для ста- стационарных процессов имеем следующий результат. Теорема 1.45. Предположим, что v(t) — стационарный, стоха- ппический процесс. Тогда его среднее значение m(t) является пос- постоянным, а его ковариационная матрица Rv(tl,t*) зависит только cm tx— t3. Это нетрудно показать, используя определение стационарности. Иногда имеют место стохастические процессы с постоянным средним и ковариационной матрицей, зависящей только от t-y — /,. тогда как другие статистические свойства не являются свойст- пами стационарных процессов. Поскольку часто представляют ин- интерес только свойства первого и второго порядков стохастичес- стохастического процесса, введем следующее определение. Определение 1.28. Стохастический процесс vft) называется ста- стационарным вгиироком смысле если матрица моментов второ- <•() порядка Cvft, t) является конечной для всех t, среднее значение m(t) постоянно, а ковариационная матрица R^t^, t2) зависит только от tx— t.A. Очевидно, что любой стационарный процесс с конечной 'мат- 'матрицей моментов второго порядка является также стационарным и широком смысле. Пусть v±(t) и v2(t) — два векторных стохастических процесса. Тогда vx и v2 называются независимыми процессами, если {v^t^, rjtj, ..^ViftJ} и {vz(tk'), vz(t2'), ,.., v2(tm)} являются незави- сииыии множествами стохастических переменных для всех tu t2, ..., tt, 1г', t2', ..., tm' ^> tо и для всех натуральных чисел т и I. Далее, v1 и и2 называются некоррелированными стохастическими
108 Глава 1 процессами, если у1(/1) и v2(tiZ) являются .некоррелированными векторными стохастическими переменными для всех tt, t2 > t0, т. е. Е \{Vi (t{) — m, (tt)] [v2 (t2) — т2 (t2)f } = О для всех ti и t2, Tjnejrii является средним процесса vt, а тг — сред- средним процесса v2. Пример 1.27. Гауссовские стохастические процессы Гауссовский стохастический процесс v является стохастичес- стохастическим процессом, где для каждого множества моментов времени t-y, t2, ..., tm ^> ^0 я-мерный вектор стохастических переменных v(tt), v(t2), ..., v(tm) имеет гауссовское совместное распределение вероятностей. Если составная ковариационная матрица ,t2) . . . RAh,tm) I _ A.433) является неособой, то соответствующая функция плотности ве- вероятностей может быть записана в виде т п\ , vт \— гг- ех р ) [Bл)тп det (R)] '2 (_ 2 1=1 у = 1 . — иг(*г)]г Лг/[уу— т(^)]} • A.434) Матрица Л^ размерности п X п получается разбиением Л = = R~l, соответствующим разбиению матрицы R, а именно -Ml -42 ¦ • ¦ -Мш ¦ л = | л« -^ • ¦ ¦ л2т |_ A435> \ Л Л 'mi -1т2 " ¦ " iVmn Заметим, что этот процесс полностью характеризуется его средним и ковариационной матрицей; таким образом, гауссовскийг процесс является стационарным в том и только том случае, если он стационарный в широком смысле. Пример 1.28. Экспоненциа,гъно коррелированный шум. Широко известным видом стохастического процесса, стацио- стационарного в широком смысле, является так называемый окспопен- циалыю коррелированный шум. Это скалярный стохастический
.'Кимгпты теории линейных систем 109 процесс v(?) с ковариационной функцией i?v (т) = ст2 ехр /— ill \ , ' A.436) где о2 — дисперсия процесса, а 9 ¦— «постоянная времени». Та- Такую ковариационную функцию имеют многие известные в прак- практике процессы. Пример 1.29. Процессы с некоррелированными ¦ приращениями Процесс v(t)H t ~>- t0, с некоррелированными приращениями может быть определен следующим образом. 1. Начальное значение v(to) = O. A.437> 2. Для любой последовательности моментов t1, .t2, ts, t±, гд& /» : t1 >• t2 ^. t3 -^ t4, приращения v{t^ — ufa) и и((^ —v(t:i) име- имеют нулевые средние и являются некоррелированными, т. е. E{v(h)~v(t3)} = 0, A.438). . . E{lv(t? — v{ti))lv(ti) — v{t3)]T\ =0. Нетрудно найти сроднее такого процесса: m{t) = E{v{t)} = E{v{t)—v{tJ} = 0, t>to. A.439). Предположим, что L ^> ^. Тогда ковариационная матрица имеет вид Л„ (tiy t2) = E{v (*,) vT (t2)} = E {[v (*t) —i> (*0)l [v (t2) —v(tt) -t- + и («,) - v (to)f \ = E{[v (tt) - v (to)\ [v (tj—v (to)f } = • • = ^{w(«,)/(Ol=9('i). <2>*i>'o. A.440). где является матрицей дисперсий процесса. Аналогичным образом для t^tz^t0. A.442). Ясно, что процесс с некоррелированными приращениями не является стационарным или стационарным в широком смысле, :ta исключением тривиального случая, при котором Q{t) == О, Рассмотрим теперь матрицу дисперсий процесса. Для t^ ^ > t1 ^ t0 можно написать :
110 Глава 1 (t2)} = + Q{h). A.443) Очевидно, Q(t) является монотонно неубывающей матричной функцией от t в том смысле, что Q (h) > Q (h) Для всех t2 ><j > t0. A.444) Здесь, если А ж В — две симметрические действительные мат- матрицы, запись А>.В A.445) предполагает, что матрица А — В неотрицательно определен- определенная. Предположим теперь, что матричная функция Q(t) абсолют- абсолютно непрерывная, т. е. можно написать Q(t)= ('F(x)dx, A.446) где V(t) — неотрицательно определенная симметрическая матрич- матричная функция. Тогда из A.443) следует, что матрица дисперсий приращения v(t2) — у(^) определяется выражением t, E{[v{t2)~v{ti)\\v{t2)--v{ti)\r\=Q{t2)—Q{ti)= fV»ch. A.447) и С учетом A.440) и A.442) видно, что если справедливо выра- выражение A.446), то ковариационная матрица процесса может быть выражена следующим образом: min {tit tt) ' Д„(<1. *S)= f V(x)fc. A.448) h Одним из широко известных процессов с некоррелированными приращениями является процесс броуновского движения, также из- известный как процесс Винера^ или процесс Винера — Леей. Это процесс с некоррелированными приращениями, где каждое из приращений v(t2) — у(<г) является гауссовским стохастическим вектором с нулевым средним и матрицей дисперсий (t2) — tx) I, a / — единичная матрица. Обобщением данного процесса Является процесс, для которого каждое приращение v(t^) — у(^) является гауссовским стохастическим вектором с нулевым средним и мат- матрицей дисперсий вида A.447). Так как приращения в процессе броуновского движения некоррелированные и гауссовские, они
Элементы теории линейных систем ¦ 111 являются независимыми. Очевидно, что броуновское движелие является гауссовским процессом. В теории стохастических про- процессов рассмотренные процессы занимают важное место. 1.10.2. МАТРИЦЫ СПЕКТРАЛЬНЫХ ПЛОТНОСТЕЙ ЭНЕРГИИ Для скалярных стохастических процессов, стационарных в широком смысле,-функция спектральной плотности энергии опре- определяется как преобразование Фурье ковариационной функции. Подобным же образом введем определение для векторных стохас- стохастических процессов. Определение 1.29. Матрица спектральных плотностей энергии 1:v(w) векторного стохастического процесса, стационар- стационарного в широком смысле; определяется как преобразование Фуры (если оно существует) ковариационной матрицы RD(tt—12) процесса, т. е. V/<KBBCO<fr. A.449) Отметим, что в записи ^ковариационной матрацы переменные 11 и'?2 заменены одной переменной tx — tt. Матрица спектральных плотностей энергии имеет следующие свойства. Теорема 1.46. Предположим, что %v(u>) является матрицей спектральных плотностей стационарного процесса v(t), стацио- стационарного в широком смысле. Тогда 2„(ы) — комплексная матрица, которая имеет следующие свойства: а) 2» (—<°) = И.» И для всех <о; A.450) б) % И = 2о И для всех <°; A.451) в) 2« («') > ° для всех м- " A.452) Здесь звездочка обозначает' комплексно-сопряженное транспо- транспонирование, тогда как М > 0, где М — комплексная матрица, оз- означает, что М является неотрицательно определенной матрицей, т. е. х*Мх > 0 для всех комплексных х. Доказательство утверждений (а) и (б) следует непосредственно из определений 2в (со) и теоремы 1.44. Чтобы доказать утверждение- (в), надо распространить на векторный случай доказательство Да- венпорта и Рута [43, гл. 6]. Смысл термина «матричная спектраль- спектральная плотность энергии» станет ясным в разд. 1.10.4. Пример 1.30. Экспоненциально коррелированный шум
112 Глава 1 В примере 1.28 рассматривался экспоненциально коррелиро- коррелированный шум — скалярный стационарный процесс v(?), стационар- стационарный в широком смысле, с ковариационной функцией A.453) Используя преобразование Фурье, найдем, что функция спек- спектральной плотности энергии имеет вид у (о,) = 2g2e A.454) при условии 6>0. 1.10.3. РЕАКЦИЯ ЛИНЕЙНЫХ СИСТЕМ НА СТОХАСТИЧЕСКИЕ ВХОДНЫЕ ВОЗДЕЙСТВИЯ В данном разделе рассматриваются статистические свойства реакции линейной системы при входном воздействии, представляю- представляющем собой реализацию стохастического процесса. В связи с этим имеем следующий результат. Теорема 1.47. Рассмотрим линейную систему с матричной импуль- импульсной переходной функцией K(t, %), находящуюся в момент t0 в нуле- нулевом состоянии. Предположим, что входное воздействие на систему является реализацией стохастического процесса u(t) с нулевым сред- средним mu(t) и ковариационной матрицей Ru(t1, tz). Тогда выходная переменная является реализацией стохастического процесса y(t) со средним my@ = j" K(t,z)mu(v)d*^ A.455). to и ковариационной матрицей Ry (ti7 t2) = f' d4 j2 К (tu x4) Ru (xlf x2) KT (t2, 4) dx2 A.456) и <» при условии, что интегралы существуют. Рассмотрим формальное доказательство этих результатов. Вы- Выгодная переменная у, соответствующая стохастическому процес- процессу, описывается выражением y{t)= j K(t, x)u(x)dx. A.457)
Элементы теории линейных систем 113 Определяя математическое ожидание обеих частей уравнения A.457) и меняя местами порядок выполнения операций интегри- интегрирования и математического ожидания, нетрудно получить выраже- выражение A.455). Подобным же образом можно написать (предполагая для прос- простоты mu(t) — 0) = E \ f dzt ( d^ К (tu т.) и (x,) мг (x2) KT (t2, x2) 1 = = j dx, f dx2 Z («lf Ч) Е {и(т,)ит (x2)) Z7" (t2, т2) = f dx2 я: («lf xt) i?u (,lf x2) Zr(i2, ij. A.458) Для системы с постоянными параметрами и стационарным в широком смысле процессом имеем следующий результат. 'Георема 1.48. Предположим, что линейная система, рассмотрен- рассмотренная в пъеореме 1.47, является асимптотически устойчивой системой с постоянными параметрами и матричной импульсной переходной функцией K(t — х) и что входной стохастический процесс u(t) чиляется стационарным в широком смысле с ковариационной мат- матрицей Rufh — t-i)- Тогда, если входное воздействие на систему является реализацией процесса u(t), который приложен с момента -оо, выходная переменная является реализацией стационарного i широком смысле стохастического процесса y(t) с ковариационной матрицей 6 Заметим, что в обозначении матричной импульсной переходной функции К и ковариационной матрицы Яц допущена некоторая не- тчпость. Как было видно из разд. 1.3.2, матричная импульсная пгреходная функция системы с постоянными параметрами зависит ¦т.чько от t — т. Результат A.459) может быть найден из A.456) при устремлении to->- — ср и некоторых простых подстановках. :. 394
114 Глава 1 Для стационарных в широком смысле процессов представляет интерес определение матрицы спектральных плотностей. Теорема 1.49. Рассмотрим асимптотически устойчивую линейную систему с постоянными параметрами и матричной передаточной функцией Н($). Предположим, что входная переменная является реализацией стационарного в широком смысле стохастического' процесса u(t) с матрицей спектральных плотностей Ъа(ы), кото- который приложен с момента времени —оо. Тогда выходная переменная является реализацией стационарного в широком смысле стохасти- стохастического процесса у ft) с матрицей спектральных плотностей Этот результат нетрудно получить, если осуществить преобра- преобразование Фурье A.459) после замены 'tt — t2 на переменную % и использования того факта, что H(s) является преобразованием Лапласа К(х). Пример 1.31. Смесительный бак Рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3.) и предположим, что имеют место флуктуации концентраций с1 и с2. Поэтому напишем где с10 и с20 являются средними концентрациями, a vx(?) и v2(?) — флуктуациями относительно средних. Нетрудно показать, что уравнения линеаризованной системы могут быть приведены к виду x(t) = \ " |z(*) +I ' |«@ A.462) y(t) = \ Если положить входную переменную равной нулю, u(t) = 0, то матричная передаточная функция от возмущений v{t) =
Элементы теории линейных систем 115 - col[v1(<), ч2(?I к выходной переменной y(t) может быть найдена следующим образом: О 0 F10/v0 F20/v0 s + 1/9 s + 1/9 Очевидно, что возмущения действуют только на вторую компо- 11 опту выходной переменной тJ@ =ё а(^)- Предположим, что Vj(<) и v2(?) являются двумя независимыми экспоненциально коррели- коррелированными шумовыми процессами, при этом ковариационная мат- матрица процесса v(t) имеет следующий вид: Найдем, что матрица спектральных плотностей процесса v(t) равна Из A.460) следует, что матрица спектральных плотностей энер- энергии выходной переменной, обусловленная возмущением v(t), име- имеет вид 0 0 1.10.4. КВАДРАТИЧНЫЕ ФОРМЫ Часто целесообразно использовать среднее значение квадрата стохастического процесса. Для векторных стохастических процес- процессов введем квадратичную форму E{vT(t)W(t)v(t)}, A.467) где W(t) — симметрическая весовая матрица. Если v(t) = col[v1(f), ..., vn(t)], a W имеет элементы Wtj, i, j — 1. 2, ..., n, •u> выражение A.467) может быть записано в виде, (t)\, A.468) J
116 Глава 1 что является математическим ожиданием квадратичной формы от- относительно компонент v;(?) вектора v(t). Матрица W(t) выбирает- выбирается неотрицательно определенной, так что выражение принимает только неотрицательные значения. Квадратичные формы данного типа используются при записи выражений, содержащих ковариационную матрицу и матрицу спек- спектральных плотностей процесса v(t). В связи с этим имеем следую- следующий результат. w Теорема 1.50, Пусть v(t) — векторный стохастический процесс. Тогда, если W(t) — симметрическая матрица, то Е {vT(t)W(t)v(t)} = tr[W(t)Cv(t, t)\, A.469) где Cv(ty, t.2) — матрица смешанных моментов второго порядка процесса v(t). Если v(t) — стационарный в широком смысле про- процесс с нулевым средним и ковариационной матрицей Rv(t^ t.J, a W — постоянная матрица, то E{vT(t)Wv(t)}=lr[WRv(O)}. A.470) Если v(t) имеет нулевое среднее и матрицу спектральных плотностей 2,/со), то- где Кроме - Запись Е того, ЩА) 1 °° vT(t) Wv {t)\ = tr [ W V,o (со) df ¦ L-- ~ R» @) = \ 2» И df. — CO означает след матрицы Л, т. е. A.471) A.472) A.473) (Л) = 2 а». С1-474) tr (A) = где аГп i -- 1; ..., п, являются диагональпыми элементами мат- матрицы. Проверим справедливость первого утверждения теоремы: vT I Е ! vT (t)W(t) v {t)\ = Е I 2 ^ (*) Wu (t) v; (t)\ = «,/=?! - './=1 = tv[W(t)CB(t,t)], ., A-475)
Элементы теории линейных систем • 117 где CPijj (t, t) является (j, /)-м элементом матрицы Cv(t, t). Второй результат A.470) следует при допущениях, устанавливающих (-\(t, t) = Bv@). Третий результат может быть доказан с учетом того факта, что матрица спектральных плотностей 2„(со) является преобразованием Фурье функции Rv{t), и, следовательно, Вь{т:) является обратным преобразованием 2„(со): = f 20 При т = 0 получаем A.471) и A.473). Равенство A.471) позволяет интерпретировать термин «матри- «матрица спектральных плотностей энергии». Очевидно, «общая энергия» E{vT (t)Wv(t)} стационарного в широком смысле процесса v(t) с нулевым средним получается при интегрировании trlJPSj, (со)] по всем частотам. Таким образом, выражение tr[VFS,,(co)] может быть1 рассмотрено как мера «плотности» энергии на частоте со. Весовая матрица W определяет долю участия каждой компоненты процесса v(t). Пример 1.32. Смесительный бак Продолжим пример 1.31, где была вычислепа матрица спек- спектральных плотностей выходной переменной y(t), обусловленной возмущениями v(t) концентраций потоков, поступающих в бак. Предположим, что требуется вычислить среднее значение квадрата флуктуации г] z(t) концентрации вытекающего потока. Это выраже- выражение может быть записано в следующем виде: A.477) где весовая матрица имеет простую форму Найдем, таким образом, среднее значение квадрата ошибки Е {/ (t) Wy (t)} = j tr [W vy N1 df = J A479) oo _К»+1/в. (Fio/УоI 1 + ш! 9 - fl ГоJ ^ 2 2 o2o2 ^
118 Глава 1 При вычислениях квадратичных форм, рассмотренных в данном разделе, часто встречаются интегралы от рациональных функций, например вида A.479). Таблицы таких интегралов могут быть най- найдены в приложениях книг [132, 160]. 1.11. Реакция линейных дифференциальных систем на белый шум 1.11.1. БЕЛЫЙ ШУМ Довольно часто в практике встречаются скалярные стохасти- стохастические процессы с нулевым средним, обладающие таким свойством, что величины w^j) и w(t.2) являются некоррелированными даже при малых значениях |Z2 — tt |, т. е. Дж (*„ *i) =* 0 при |*2 —*2|>ё, A.480) где е — «малое» число. Ковариационная матрица таких стохасти- стохастических процессов в идеализированной форме записывается сле- следующим образом: Здесь 8(^2 — tj) — дельта-функция, a V(t) рассматривается как интенсивность процесса в момент t. Такие процессы называются ¦ процессами белого шума; ' смысл термина объясняется позднее. Распространим это понятие на векторные процессы. Определение 1.30. Пусть w(t) — векторный стохастический про- процесс с нулевым средним и ковариационной матрицей Rw(h,ti) = V(ti)^(t2-tl), A.482) где V(t) :> 0. Тогда говорят, что iv(t) является стохастическим процессом типа белого шума интенсивности V(t). В том случае, когда интенсивность белого шума постоянна, процесс является стационарным в широком смысле и может быть определена матрица спектральных плотностей. Осуществляя фор- формально преобразование Фурье функции У6(т), можно видеть, что стационарный в широком смысле процесс типа белого шума имеет матрицу спектральных плотностей
Элементы теории линейных систем 119 Отсюда следует, что стационарный в широком смысле процесс типа белого шума имеет равную плотность энергии на всех часто- частотах. Вот почему по аналогии со светом такие процессы называют- называются процессами типа белого шума. Этот результат также согласует- согласуется с физической интуицией. Процесс с малой корреляцией между двумя близкими значениями w(^) и w(t.,) является весьма нерегу- нерегулярным и, таким образом, содержит энергию на довольно высоких частотах. К сожалению, при вычислениях общей энергии процесса типа белого шума на основании равенств A.470) и A.471) получается бесконечная величина. Это показывает, что, хотя с процессами типа белого шума удобно иметь дело, в природе они не существу- существуют. С математической точки зрения процессы типа белого шума действительно не являются строго определенными. Как будет по- показано в примере 1.33, белый шум является «производной» процес- процесса с некоррелированными приращениями; однако можно пока- покапать, что такой процесс не имеет производной. Тем не менее, если белый шум по крайней мере один раз проинтегрирован, снова име- имеется строгое математическое обоснование и могут быть доказаны следующие правила интегрирования. Теорема 1.51. Пусть w(t) — векторный процесс типа белого шума интенсивности V(t), a A1(t), A.,(t) и A(t) — заданные пе- переменные матрицы. Тогда а) Е\[ A(t)w(t)dt\ = O, 1 *) I A.484) lj (t) w (t) dt W Az(t')w(t')dt' I = f tr [V (t) A\{t) WA2 (t)\ dt, A.485) где I — пересечение [tx, t2] и U3, i4], a W — любая весовая матрица; t, и ~т A2(t')w(t')dt' в) Е где I определено выше. Формально положение (а) можно доказать на основании того, что w(t) является процессом с нулевым средним, тогда как (б)
120 Глава 1 можно подтвердить следующим образом: j' Y f \ Е J Г j' A, (t) w (t) dtY W f \ A2 (?) w (?) **']} = = E f dt j d?wT(t)ATl(t)WA.i(t')w(?)\= A.487a) [ tt[w(?)wT(?)ATl(t)WAi(?)]d?\= A.487 6) J U[V(t)ATl{t)WAt(?)]&(t — ?)df= A.487r) и и = j dt \ tt.[E{w(?)wT(t)}ATl(t)WAt(?)]d? = A.487b) = \ dt\ U[V(t)AT = J tr [F (О Л[ (f) ^42 @1 di. A.487 д) Переход от A.487в) к A.487г) осуществляется с помощью A.482), а переход от A.487г) к A.487д) следует из свойств дельта- функции. Использовалось также соотношение tr(AB) -= ir(BA), где А и В — матрицы совместимых размеров. Положение (в) доказывается аналогично положению (б). Пример 1.33. Белый шум как производная процесса с некоррелиро- некоррелированными приращениями. > В примере 1.29 (разд. 1.10.1) рассматривались процессы v(t), t >- t0. с некоррелированными приращениями, которые, как по- показано, являются процессами с нулевыми средними и ковариацион- ковариационными матрицами вида для fj > i2 > i0. Поступая формально, покажем, что ковариационная матрица производной v{t) = ±l?L7 ¦ t>tot A.489) at состоит из дельта-функции. Для среднего значения процесса A.489) имеем E{v(t)} = -l-E{v(t)} = 0, t>to. . "A.490) at
Элементы теории линейных систем . 121 Запишем формальное выражение для ковариационной матрицы процесса A.489): ; = ^-^Rv(tuh), tut2>t0. A.491) Определив частные производные, получим #p('i' ^) = <? (*i) 8 (<i — h), tittz>.t0, A.492) где Это показывает, что производная процесса с некоррелирован- некоррелированными приращениями является процессом типа белого шума. Если каждое приращение v(t,) — у(?,) процесса имеет матрицу диспер- дисперсий вида U f V (t) dt, A.494) h то интенсивность белого шума, который является производной процесса с некоррелированными приращениями, равна V(t), так как (см. пример 1.29) <?(*)= \.V(i)dz. A.495) to Значительный интерес представляет 'случай, когда процесс v(t), производная которого — белый шум, является броуновским движением (см. пример 1.29). Процесс типа белого шума, получае- получаемый в данном случае, называется часто гауссовским белым шумом. В строгой теории процесс типа белого шума никогда не опре- определяется. Вместо этого развивается теория, основанная на про- процессах с некоррелированными приращениями. В частности, интег- интегралы, рассматриваемые в теореме 1.51, определяются в терминах этих процессов. Рассмотрим интеграл и \ A(t)w(t)dt. A.496) Он заменяется выражением f А @ dv (t) = lim У А (т,) [v (тж) -v Ы], A.497)
122 ]\гава I где v(t) — процесс с некоррелированными приращениями, произ- производная которого — белый шум w(t). и где 11 =то<т1< ... <т„ = = U, а з = тах | TM—xt | A.498) есть разбиение интервала Ux, tz}. Предел в выражении A.497) может быть определен таким образом, что существует соответствую- соответствующая стохастическая переменная, удовлетворяющая свойствам теоремы 1.51. Детальное изложение вопроса читатель может найти в работах [6, 53, 67, 103]. Глубокое и строгое изложение понятия белого шума сделано в работе 1731. Материал этого примера в дальнейшем не используется. Для целей, преследуемых данной книгой, достаточно знать теорему 1.51. 1.11.2. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ СИСТЕМЫ; ВОЗБУЖДАЕМЫЕ БЕЛЫМ ШУМОМ В дальнейшем будет показано, что линейные дифференциальные системы, возбуждаемые белым шумом, являются очень удобными моделями для формулирования и решения задач линейного управ- управления с учетом возмущений и шумов. В данном разделе рассмат- рассматриваются некоторые статистические свойства состояния линейной дифференциальной системы при наличии процесса типа белого шума в качестве входной переменной. В частности, вычисляются среднее значение, ковариационная матрица, матрица смешанных моментов, матрицы дисперсий и моментов состояния х. Теорема 1.52. Предположим, что x(t) — решение уравнения x(t) = A(t)x(t) + B(t)w(t), A499) я (*о) = ^о» где w(t) — белый шум интенсивности V(t), а х0 — стохастичес- стохастическая величина, независимая от w(t) со средним значением т0 и мат- матрицей дисперсий Qo = Е{(х0— то)(хо — то)Т}- Тогда x(t) имеет среднее значение {t) Q(tt0)m0, A.500) где Ф (t, t0) — переходная матрица системы A.499). Ковариаци- Ковариационная матрица процесса x(t) имеет вид ¦+ Y " .' Ф (*„ ¦:) В (х) V W ВТ (?) Фт (*2, х) dx. A.501)
Элементы теории линейных систем 123 Ковариационная матрица Q(t) = Rx(t, t) удовлетворяет мат- матричному дифференциальному уравнению Q(t) = A (О Q (О + Q (О АТ (О + B(t)V (t) Вт (*); A.502) Q Кроме того, [Q{t)*T{ttd *1>'1> A.503) Матрица смешанных моментов второго порядка процесса x(t) имеет вид сх (tlt t2) = е[х (tо хГ (*2)} = ф (<„ <0) сж (*0> g фт (t2, t0) + min(f,, tt) + J ФA{>г)В(-:)У(х)ВТ^)ФТA.2,,)^. A.504) (в Mатрица моментов Cx(t, t) — Q'(t) удовлетворяет матрич- матричному дифференциальному уравнению t) + Q'(t)AT(t)+B(t)V(t)BT(t), A.505) }. A.506) JS заключение имеем lQ'{t^T^^ h>h> A-507) *2)^'(*2) *i>'«- Эти результаты нетрудно доказать, используя правила интег- интегрирования, приведенные в теореме 1.51. Поскольку x(t) = Q> (t, t0) x0 + j Ф (*, .) В (т) w (х) с?х, A.508) из A.484) следует, что mx(t) определяется формулой A.500). Чтобы найти ковариационную матрицу и матрицу смешанных мо- моментов, рассмотрим уравнение Е [х (*,) xT(t2)) = Ф (tlf g ? {^0 а:ог} ФТ (t2, t0) +
124 Глава 1 Е\ Г Ф (*„х) В(х) и> (х) dx [Ф(t2, g *0 4- X A.509) Вследствие независимости хи и w(t) итого факта, что w(t) имеет нулевое средпео, второй и третий члены в правой части выраже- выражения A.509) равны нулю. Принимая во внимание A.486), четвертый член можно упростить так, что из A.509) следует A.504). Подобным же образом устанавливается справедливость выражения A.501). Дисперсия Q(t) получается, если положить tl = tz = t в A.501): + Г Ф (*, х) В (х) V (х) Вт (х) Фт (t, x) dx. A.510) Дифференциальное уравнение A.502) находится дифференци- дифференцированием Q(t) в A.510) относительно ^.Начальное условие A.502) определяется при t — t0. Дифференциальное уравнение для CJf, t) —Q'{t) находится аналогичным образом. Наконец, A.503) и A.507) cлeдyюf непосредственно.из выражений A.501) и A.504). Кстати заметим, что если х0 — гауссовская стохастическая величина и белый шум w(t) — гауссовский (см. пример 1.33), то x{t) является гауссовским стохастическим процессом. В заключе- заключение отметим, что для анализа линейных систем полезно иметь вычис- вычислительную программу с целью моделирования линейной дифферен- дифференциальной системы, возбуждаемой белым шумом (см., например, [126]). Пример 1.34. Дифференциальная система первого порядка, воз- возбуждаемая белым шумом Рассмотрим стохастическое дифференциальное уравнение пер- первого порядка ?(<)=--l|(t)+ffl(t), A.511) где <о(г) — скалярный белый шум интенсивности it. Предположим, что |@) =Ejo- гДе ?о " скалярная стохастическая величина с ну- нулевым средним и дисперсией /?(?о2) = О2- Нетрудно установить, что | (t) имеет ковариационную функцию
Элементы теории линейных систем 125 ¦ tu t2>0. A.512) Дисперсия процесса равна e-*>9+*l, t>0. A.513) 1.11.3. УСТАНОВИВШЕЕСЯ ЗНАЧЕНИЕ МАТРИЦЫ ДИСПЕРСИЙ ДЛЯ СЛУЧАЯ ПОСТОЯННЫХ ПАРАМЕТРОВ В предыдущем разделе найдено выражение [уравнение A.510)] для матрицы дисперсий состояния линейной дифференциальной системы, возбуждаемой белым глумом. В настоящем разделе рас- рассматривается асимптотическое поведение матрицы дисперсий в случае постоянных параметров, т. е. когда А, В и V являются постоянными матрицами. В этом случае A.510) может быть запи- записано в виде Q @ = eA(t~U) Qo /"('-'j) + j eMt~'] BVBT /«-^ di. A.514) Нетрудно видеть, что Q(t) при произвольном Qo имеет предел Hm Q (t) = lim Q (t) = Q = f eM BVBT e^x dz A.515) t-+CX> t»-^ CO *J тогда и только тогда, когда матрица А асимптотически устойчива. Поскольку матрица Q(t) является решением дифференциального уравнения A.502), ее предел Q также должен удовлетворять этому уравнению, так что AQ + QAT +BVBT =0. A.516) Нетрудно установить, что это матричное алгебраическое урав- уравнение имеет единственное решение, которое должно определяться выражением A.515). Это вытекает из следующего результата тео- теории матриц [63]. Лемма 1.5. Пусть Мг, Мг и Мъ — действительные матрицы раз- размерами п X п, т X т и п X т соответственно. Пусть %h i = = 1, 2, ..., п,и \ij, / — 1, 2. ..., т, обозначают характеристичес- характеристические числа матриц Mv и Mt соответственно. Тогда матричное уравнение MtX + XMl = M3 A.517)
126 Глава 1 имеет единственное решение X в том и только том случае, если для всех i, ) A.518) Црименяя эту лемму к уравнению A.516), положим Мх —А, Мt = Аг. Отсюда следует, что т — п и цу = %j, j = 1, 2, ..., т. Поскольку по допущению А является асимптотически устойчивой, все характеристические числа имеют строго отрицательные дей- действительные части и неизбежно %. + %;фО A.519) для всех i, j. Таким образом, A.516) имеет единственное решение. Обобщим изложенное. Теорема 1.53. Рассмотрим стохастическое дифференциальное уравнение x(t) = Ax(t)+Bw(t), A520) z (*о) = жо. где А и В — постоянные матрицы, a w(t) — белый шум постоян- постоянной интенсивности V. Тогда, если матрица А ^асимптотически устойчивая и tu—*- —оо или t-^-oo. матрица дисперсии процесса x(t) стремится к постоянной неотрицательно определенной матрице Q = j* eAt BVBT елТ< dt, A.521) которая является единственным решением, матричного урав- уравнения 0 = AQ + QAT+BVBT. A.522) Матрица Q, таким образом, может быть найдена как предел решения дифференциального уравнения A.502) при начальном условии @0 из интеграла A.521) или из алгебраического уравнения A.52^); здесь (H — произвольная положительно полуопределен- полуопределенная матрица. Матричные уравнения вида A.522) также имеют место в теории устойчивости и известны как уравнения Ляпунова. Хотя матричное уравнение A.522) линейно относительно Q, его решение не может непосредственно быть получено с помощью простого обращения матриц. В работах [38, 121] даются полезные предложения по сос- составлению линейных уравнений, из которых может быть найдена матрица Q. Другие возможные подходы рассматриваются в рабо-
теории линейных систем 127 тах [9, 47, 78, 95, 115, 130, 149, 164, 165]. В работе [691 сделано сравнение различных методов решения, но рекомендации к при- применению какого-либо одного метода не дается. Обзор некоторых методов решения выполняется также в работах [10,152]. Заметим, что, если матрица А асимптотически устойчивая и /0 -.= —оо, выходная переменная дифференциальной системы A.499) является стационарным в широком смысле процессом. Спектральная плотность состояния х равна 2, (со) = (/со/ — A)'1 BVBT (— /со/ — А7)'1. A.523) Тогда,* используя A.473), можно получить другое выражение для Q, а именно Q= |" (joiI~-A)-1BVBT(~jbiI~AT)'1df. A.524) Как было показано в настоящем разделе, установившееся зна- значение матрицы дисперсий Q является асимптотическим решением дифференциального уравнения дисперсий при t0 -> —оо или t ->oo. Предположим теперь, что в качестве начальной дисперсии в момент /0 выбрано установившееся значение матрицы дисперсий, т. е. положим Q0 = Q. A.525) Согласно A.502), это ведет к равенству Q, »>*,.. . ' A.526) Полученный таким образом процесс x(f) имеет все свойства стационарного в широком смысле процесса. Пример 1.35. Установившиеся значения дисперсии и ковариацион- ковариационной функции системы первого порядка. Рассмотрим (см. пример 1.34) скалярное дифференциальное уравнение SW = -k (*)+«>(*). A-527) о где скалярный белый шум со(?) имеет интенсивность ц,, а 6 >0, Обозначая через Q предел Q(t) при ?-»-оо, из A.513) получаем Ъ=Ц-. A,528) Уравнение Ляпунова A.522) сводится к следующему: --fe + t* = O, A.529)
128 Глава 1 .что согласуется с A.528). Из A.521) следует тот же самый резуль- результат ё = |1 ^e-*l*dt = J!±. A.530) 6 „ Наконец, можно проверить, что из A.524) следует Q = +Г & df = Л!'. A.531) V J, (Ш2 I 1/92) 2 V ' — оо " Заметим, что ковариационная функция Щ (?4, ?2)> определяемая выражением A.512), сходится к |^|) " A.532) при ti + <2~*"°° и конечном отрезке времени <4 — ?2- Матрица ¦^5 (*i> h) равна этому пределу при конечных tt и t2, если дисперсия начального состояния равна ' Таким образом, выражение A.527) представляет собой экспо- экспоненциально коррелированный шум при условии, что ?,(t0) является стохастической величиной с нулевым средним и дисперсией A-533). 1.11.4. МОДЕЛИРОВАНИЕ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ В последних главах настоящей книги стохастические процес- процессы почти всегда представляются с использованием линейных диф- дифференциальных систем, возбуждаемых белым шумом. Это пред- представление стохастического процесса v(t) обычно имеет следующую -форму. Предположим, что v{t) = C{t)x(t), ' A:534) гДе . x(t) = A{t)x{t)+B(t)w(t), A.535) a w(t) — белый шум. Выбирая такое представление стохасти- стохастического процесса V, его можно моделировать. Использование та- таких моделей может быть обосновано следующим образом. а) В природе часто встречаются стохастические явления, свя- связанные с воздействием быстро меняющихся флуктуации на инер- инерционную дифференциальную систему. Типичным примером бе- белого шума, действующего на дифференциальную систему, являет- является тепловой шум в электронной цепи.
Элементы теории линейных систем ' '••.¦. 129 б) Как будет видно из дальнейшего, в линейной теории управ- управления почти всегда рассматриваются только среднее значение и. ковариация Стохастического процесса. Для линейной модели ксегда можно аппроксимировать любые полученные эксперимен- экспериментально характеристики среднего значения и ковариационной матрицы с произвольной точностью. в) Иногда возникает задача моделирования стационарного стохастического процесса с известной спектральной плотностью энергии. В этом случае всегда имеется возможность генерировать стохастический процесс как процесс на выходе линейной диффе- дифференциальной системы; при этом матрица спектральных плотностей анергии аппроксимирует с произвольной точностью матрицу спек- спектральных плотностей энергии исходного стохастического процесса. Примеры 1.36 и 1.37, так же как и задача 1.11, иллюстрируют метод моделирования. Пример 1.36. Дифференциальная система первого порядка . Предположим, что измеренная ковариационная функция сто- хастического скалярного процесса ч, о котором известно, что он является стационарным, описывается экспоненциальной функцией ' Д, ('!.',) = °2 е-"'11/в'- ' ' A-536) Этот процесс можно моделировать при t > t0, как состояние дифференциальной системы первого порядка (см. пример 1.35) С(*)= JU (*) + ©(*), - A.537) где (o(t) —г белый шум интенсивности 2<т2/9, a v(i0)¦¦— стохастичес- стохастическая величина с нулевым средним и дисперсией аг. Пример 1.37. Смесительный бак Рассмотрим смесительный бак из примера 1.31 (разд. 1.10.3) и вычислим для него матрицу дисперсий выходной переменной y.(f). 15 примере 1.31 предполагалось, что флуктуации концентраций в потоках описываются экспоненциально коррелированными шума- шумами и, таким образом, могут быть смоделированы как решение сис- системы первого порядка, возбуждаемой белым шумом. Добавим теперь к дифференциальному уравнению смесительного бака уравнения моделей стохастических процессов vt(?) и v2(f). Получим где ?.(*)=-т" *»(')+«МО- A-539) • !десь a>i(t) — скалярный белый шум интенсивности щ; чтобы
130 Глава 1 получить дисперсию процесса v4(<) равной (Т42, примем ц4 = = 2<т12/61. Для процесса v2(f) = ?4(?) используем аналогичную модель. Таким образом, получим систему уравнений i- 0 •о 0 *! — 1 v, 0 0 0 0 0 с — 1 0 0 1 6 0 0 -i- 0 о L -f A.540) где w(t) — col[o)j(i), ш2(<)]. Двумерный белый шум w(t) имеет интен- интенсивность V = 0 0 2а* A.541) Предположим, что в A.540) u(f) = 0; тогда решение урав- уравнения A.522) относительно матрицы дисперсии Q имеет вид 0 0 0 0 > 0 = 0 о? где A.542) A.543) A.544) A.545)
Элементы теории линейных систем 131 Дисперсия процесса т]г@ = 1г@ равна q22, что согласуется с результатом примера 1.32 (разд. 1.10.4). 1.11.5. КВАДРАТИЧНЫЕ ИНТЕГРАЛЬНЫЕ ФОРМЫ Рассмотрим линейную дифференциальную систему x(t) = A(t)x{t) + B(t)w(t), A.546) где w(t) -¦- белый шум интенсивности V(t) и предполагается, что начальное состояние x(t0) является стохастической величиной с матрицей моментов второго порядка E{x(t0)xT(t0)) = Q0. . A.547) В последующих главах часто используются квадратичные интег- интегральные формы вида Е J хт@ ft @ х(t) at -V * (*,)PiS(ti)|, A-548) где R(t) — симметрическая неотрицательно определенная весовая матрица для всех t0 < t <: tu a Pi — симметрическая неотрица- неотрицательно определенная матрица. Эти формулы, конечно, применимы также и в детерминированном случае, где w(t) = 0.' t > ^0, x(t0) — детерминированная величина, а символ математического ожидания не используется. Для решения линейного дифференциального уравнения A.546) напишем х (t) = Ф (t, t0) x (t0) + j Ф (t, т) В (т) w (т). dT, A.549) to так что h U Г *г @ ft (о х (t) dt + *r (t,) p,^,) = j xr (g Фг и V (т) ВГ (т) ФГ (t, t) d J • ft @ I Ф (*, *0) X (t0) J Ф (t, т) В (т) u; (t) dt d* + Г а-т.(/0) ФГ (tu t0) + ' WT (T) 5Г (Т) ФГ (tlt T) dx I />4 [ Ф (tu t0) X (t0) + ic A.550)
132 Глава 1 Определяя математическое ожидание этого выражения и ис- используя правила интегрирования из теоремы 1.51, получим Е I ('' хт (t) R (t) x (t) dt + / (tt) Pvx Ц = = tr f фг (t, g r (t) ф (t, у dt + фт (tu t0) p± a>(tlf gj <?0 + J V (x) Вт (х) Фг (t, x) R (t) Ф (t, t) В (x) ch i, lit + f' F (x) BT (z) Фт (tu x) Pi Ф (tu x) В (х) Ц ¦ A.551) to j Тогда, если М и N — произвольные матрицы соответствующих размеров, нетрудно показать, что tr(MN) = tr(NM). Примене- Применение этого результата к двум последним членам выражения A.551) и изменение порядка интегрирования в третьем члене дает tr j J [ f V (x) BT (x) Фг (t, x) R (t) Ф (t, x) В (х) d^dt + U. Li. J + j' F (x) S7" (x) ФГ (tu x) P, Ф («„ x) В (x) dx | = = tr j f | j В (x) 7 (x) Sr (x) Фг (t, x), Д (*) Ф (*, x) rfx 1 dt + + (' В (x) F (x) S7" (x) ФГ (*]f x) P4 Ф («lf x) dx 1 = = tr J (' 5 (x) F (x) Sr (x) Г f' Фг («, x) R (*) Ф (t, x) rf* + A.552) Подстановка этого выражения в A.551) показывает, что можно написать Е П хт (t) R(t) x (t) dt + хт (*,) Pt x (*,) 1 = Ли . J = tv\p(t0)Q0 + ^B(t)V(t)BT(t)P(t)dt\, A553)"
¦ Ки'менты теории линейных систем 133 i до симметрическая матрица P(t) определяется выражением Р (t) = f Фг (t, t) R (*) Ф (*, *) dx + Фг (tu t) P, Ф (tlf t). A.554) Используя теорему 1.2 (разд. 1.3.1),- дифференцированием не- i рудно показать, что P(t) удовлетворяет матричному дифферен- дифференциальному уравнению - Р (t) = Ат (t) P(t) + P (t) A(t) + R (*)¦ A-555) Полагая в A.554) t — tu получим конечпое условие P{U) = P,. A.55G) Подведем итоги следующим образом. 'Георема ,1.54. Рассмотрим линейную дифференциальную систему x{t) = A{t)x(t) + B(t)w{t), A.557) ,-<>(' w(t) — белый шум интенсивности Vft}, a x(t0) = х0 — сто- .китическая величина с матрицей моментов второго порядка J'{'ioxo} =Qo- Пусть матрицы R(t)—симметрическая неотрица- неотрицательно определенная при t0 <^? <: ti: a Pt — постоянная симмет- симметрическая неотрицательно определенная, Тогда имеем И I j'1 xT (t) R (t) x (t) dt + xT (td PiX (tt) 1 = = tv\p(to)Qo+ ^B(t)V(t)BT(t)P(t)dt\, A.558) .¦tit- P(t) — симметрическая неотрицательно определенная мат- матрица Р (t).= \ ФТ (., t) R (z) Ф (,, t) fc + Фт (h, t) P, Ф (*lf *). A-559) t • 1<*есъ Ф(г, t0) — переходная матрица системы A.557). P(t) удов- удовлетворяет матричному дифференциальному уравнению — Р @ = АТ (*) P{t) + P (t) A(t)+R (t) A.560) с конечным условием P(ti) = Pi. A.561)
134 Глава 1 В частности, если дифференциальная система A.557) имеет вид x(t) = A(t)x\t), A.562) ¦ соответствующий однородной системе, т. е. V(t) = 0, a x(t0) —'. детерминированная функция, то [ / (О R (t) х (Q dt + хТ (f,) PiX (tt) = / (g P (g x (t0). [A.563) и Закончим этот раздел обсуждением асимптотического пове- поведения матрицы P(t) при стремлении момента времени ^ к бес- бесконечности. Ограничимся рассмотрением случая; когда матрицы А, В, V и R являются постоянными, так что выражение A.559) принимает вид Р it) = J* ИГ(^° ДеЛ('-° d, + /<''-" Р\ еми~{). A.564) t Если матрица А асимптотически устойчивая, при tt—voo най- найдем предел P(Q-*P= [ eA {'~f) ЯеА^п d^. A.565) • Заменяя переменную интегрирования, Р можно записать в виде ; Р= Г елГ'' ReAt'dt', A.566) 6 откуда следует, что Р- является постоянной матрицей. Поскольку Р удовлетворяет матричному уравнению A.560), имеем 0 = 4гР + Р4 + 7?. A.567) Поскольку по допущению А асимптотически устойчивая, лемма 1.5 (разд. 1.11.3) гарантирует, что это алгебраическое уравнение имеет единственное решение. В случае постоянных параметров из A.558) нетрудно пока- показать, что при ?4 »?0 можно аппроксимировать Е | f xT (t) Rx {t)dt + хт (t4) Pj .r( ~ tr { P~QQ + (tt — g BVBT P } . A.568)
Элементы теории линейных систем 135 Это показывает, что при tx -> оо критерий A.558) асимптоти- асимптотически увеличивается со скоростью br(BVB Р). Пример 1.38. Смесительный бак Рассмотрим модель смесительного бака, учитывающую возму- возмущения (см. пример 1.37). Положим, что u(t) = 0 и представляет интерес определение интегрального выражения A.569) Этот интеграл характеризует среднее отклонение концентра- концентрации |2@ от нулевого значения, где среднее берется как статисти- статистически, так и по времени. Его формула следует из общего вида вы- выражения A.548), если положить г> Решение алгебраического уравнения 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 даст установившееся решение 0 0 0 0 р = | ° Р22 Р23 Р24 0 Ргз Рзз Рз4 О Р24 Р34 Р44 i-Де Р22 — — » Ри = 6 17 г 20 _2 Vo_ 1 1 Рзз = 8 2 1 в Fw ) 2 A.570) A.571) A.572) 1 1 Ри = V,, вх в2 , A.573)
136 Глава 1 1 1 Если выразить V в виде A.541), как это делалось в примере 1.37, то можно найти, что скорость, с которой интегральный кри- критерий A.569) асимптотически увеличивается при возрастании t{ [см. A.568)], равна tr (BVBTP) = о ' а 8 + 82 A.574) Неудивительно, что это в точности соответствует вычисленному в примере 1.37 установившемуся значению величины ?{|22@}- 1.12. Задачи 1.12.1. ВРАЩАЮЩИЙСЯ СПУТНИК Рассмотрим спутник, который вращается относительно своей оси симметрии (рис. 1.11). Угловое положение спутника в момент ^=ва±=аЫ? Ось Рис. 1.11: Вращающийся спутник. t обозначим через ф(?), а постоянный момент инерции спутника:— через /. С помощью газовых струй к спутнику может быть при- приложен вращающий момент .\n{t), который рассматривается как входная переменная системы. Трение отсутствует. а) Возьмите в качестве компонент состояния угловое поло- положение ф(?) и угловую скорость ср(?). Пусть г] @ = ф(?) — выход- выходная переменная. Покажите, что дифференциальное уравнение состояния и уравнение выходной переменной могут быть представ- представлены в виде A.575> где р= Ш.
Элементы теории линейных систем 137 0) Вычислите переходную матрицу, импульсную переходную функцию и переходную функцию системы. Начертите график им- ттульсной переходной и переходной функций. в) Является ли система устойчивой в смысле Ляпунова? Яв- Является ли она асимптотически устойчивой? г) Определите передаточную функцию системы. д) Рассмотрите задачу поворота спутника из одного положе- положения в другое. В терминах состояния это означает, что система должна быть переведена из состояния x(t0) = col(cp0, 0) в состоя- I 5 -а i'nc. 1.12. Входной момент для пере- перемещения спутника. ние x(t{) = col((pi, 0) где ср0 и ф4 — заданные углы. Предположим, что имеются две газовые струи; они прикладывают моменты в противоположных направлениях, так что входная переменная при- принимает только значения —а, 0 и +а, где а — фиксированное за- шнное число. Покажите, что спутник может быть повернут с помощью входной переменной, график которой показан на рис. 1.12. Вычислите время переключения ts.vi конечное время tt. Начертите траекторию состояния на фазовой плоскости. 1.12.2. АМПЛИДИН Я, ?, Статор Якорь Рис. 1.13. Схема амплидина. Статор Якорь
138 Глава 1 Амплидин является электрической машиной, предназначае- предназначаемой для управления постоянным током большой мощности пос- посредством маломощного напряжения постоянного тока. На рис. 1.13 показана упрощенная схема амплидина [49]. Два яко- якоря вращаются с постоянной скоростью (в действительности они располагаются на одном валу). Выходное напряжепие каждого якоря пропорционально соответствующему току. Пусть Lt и Rt обозначают соответственно ипдуктивность и сопротивление об- мотки якоря, a L2 и Л2 — те же параметры обмоток первого и вто- второго якорей вместе. Индуктированные напряжения определяются соотношениями ei==iVi, A57Г)) &2 ~~ <^2 ^2* Используются следующие численные значения: RjLi = 10 с, R2/L2 = 1 с, й, = 5Ом, * . Д2=10Ом, A.577) к, = 20 В/А. А-2 = 50 В'А. а) Примите в качестве компонент состояния \x{f) — i^t) и |2(i) == 1г@ и покажите, что система уравнений имеет вид \ L A.578) где \i(i) =eo(i) и ц (t) =e2(t). б) Вычислите переходную матрицу, импульсную переходную функцию и переходную функцию системы. Начертите графики им- импульсной и переходной функций для заданных численных зна- .чений. в) Является ли система устойчивой в смысле Ляпунова? Яв- Является ли она асимптотически устойчивой? г) Определите передаточную функцию системы. Для заданных значений параметров начертите логарифмические частотные ха- характеристики системы. д) Вычислите моды системы.
Элементы теории линейных систем 139 1.12.3. СВОЙСТВА СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ ПРИ ПРЕОБРАЗОВАНИЯХ СОСТОЯНИЯ Имеем линейную систему с постоянными параметрами Bu(t), A.579) y(t)=Cx(t). Рассмотрим эффект преобразования состояния х = Тх. а) Покажите, что переходная матрица Ф(?, t0) системы A.579) и переходная матрица Ф'(^> *о) преобразованной системы связаны соотношением Ф'(и^ = ГФ(и»)П A-580) б) Покажите, что матричная импульсная переходная функция II матричная переходная функция системы не изменяются при преобразовании состояния. в) Покажите, что характеристические числа системы не изме- изменяются при преобразовании состояния. г) Покажите, что преобразованная система является устойчи- устойчивой в смысле Ляпунова тогда и только тогда, когда исходная сис- система A.579) устойчива в смысле Ляпунова. Докажите также, что преобразованная система является асимптотически устойчивой тогда и только тогда, когда исходная система A.579) асимптоти- асимптотически устойчива. д) Покажите, что матричная передаточная функция не изме- изменяется при преобразовании состояния. 1.12.4. УСТОЙЧИВОСТЬ АМПЛИДИНА, ОХВАЧЕННОГО ОБРАТНОЙ СВЯЗЬЮ Рассматривается схема с пропорциональной обратной связью, которую можно представить как результат попытки улучшить характеристики амплидина (задача 1.12.2). Имеем Здесь п ДО — внешнее эталонное напряжение, а А. — постоян- постоянный коэффициент, подлежащий определению. а) Найдите матричную передаточную функцию от эталонного напряжения r\.r{t) до выходного напряжения г|@ в замкнутой схе- схеме управления амплидином. б) Определите значения постоянного коэффициента X, для которых замкнутая система асимптотически устойчива. ¦
140 Глава 1 1.12.5*. СТРУКТУРА ПОДПРОСТРАНСТВА УПРАВЛЯЕМЫХ СОСТОЯНИЙ Рассматривается каноническая форта управляемости из тео- теоремы 1.26 (разд. 1.6.3). а) Докажите, что, каким бы способом ни была выбрана матрица преобразования Т, характеристические числа обеих матрицС4 и' и А22 всегда такие же, как в исходной системе. б) Определите характеристические числа матрицы А и' как- полюса управляемости и характеристические числа матрицы А22' как полюса неуправляемости системы. Докажите, что подпростран- подпространство управляемых состояний систе.мы A.310) порождается соб- собственными векторами и обобщенными собственными векторами системы, которые соответствуют полюсам управляемости. в) Подтвердите, что при исходном представлении системы;. A.308) подпространство управляемых состояний порождается собственными векторами и обобщенными собственными векторами, соответствующими полюсам управляемости. 1.12.6*. УПРАВЛЯЕМОСТЬ И СТАБИЛИЗИРУЕМОСТЬ СИСТЕМЫ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ ПРИ ПРЕОБРАЗОВАНИИ СОСТОЯНИЯ Рассматривается преобразование состояния х = Тх в линей- линейной системе с постоянными параметрами x(t) = Ax(t) + Bu(t). A.582) а) Докажите, что преобразованная система является полно- полностью управляемой в том и только том случае, если исходпая сис- система A.582) полностью управляемая. б) Докажите непосредственно (не используя теорему 1.26)v что преобразованная система является стабилизируемой в том и только том случае, если исходная система A.582) стабилизируем мая. х 1.12.7*. ВОССТАНАВЛИВАЕМОСТЬ И ОБНАРУЖИВАЕМОСТЬ СИСТЕМЫ, С ПОСТОЯННЫМИ ПАРАМЕТРАМИ ПРИ ПРЕОБРАЗОВАНИИ, СОСТОЯНИЯ . Рассматривается преобразование состояния¦ х' = Тх в систе- системе с постоянными параметрами x(t) = Ax(t), y(iy=Cx(t). A.583)- а) Докажите, что преобразованная система является полно-
Элементы теории линейных систем, ,141 стыо восстанавливаемой в том и только том случае, если исход- исходная система A.583) полностью восстанавливаемая. б) Докажите непосредственно (не используя теорему 1.35), что преобразованная система является обнаруживаемой в том и только том случае, если исходная система A.583) обнаруживае- обнаруживаемая. 1.12.8*. СИСТЕМА, ДУАЛЬНАЯ ПРЕОБРАЗОВАННОЙ СИСТЕМЕ Рассматривается система с постоянными параметрами x(t) = Ax{t)-\-Bu(t), A.584) Преобразуйте эту систему, используя соотношение x'(t) = — Tx(t), где Т — неособая матрица преобразования. Покажите, что система, дуальная A.584), переходит в систему, дуальную пре- преобразованной системе, с помощью преобразования x*(t) = TTx'*(f). 1.12.9. «ДЕМПФИРОВАНИЕ» СМЕСИТЕЛЬНОГО БАКА Рассматривается бак для перемешивания с флуктуациями концентраций с{ и с2, как описано в примерах 1.31 и 1.32 (разд. 1.10.3 и 1.10.4). Полагается u(t) ~ 0. Наличие объема жид- жидкости в баке ведет к тому, что флуктуации в концентрациях ci и С2 уменьшаются. Определите «показатель демпфирования» бака как квадратный корень из отношения среднего значения квад- квадрата флуктуации в концентрациях c(t) вытекающего потока и среднего значения квадрата флуктуации, когда входящие потоки смешиваются непосредственно вне бака (Fo = 0). Вычислите по- показатель демпфирования как функцию Vo. Положите <л = а2, Oj = 62 — 10 с и используйте численные значения из примера 1.2 (разд. 1.2.3).-Начертите график зависимости показателя демпфиро- демпфирования от Vo. 1.12.10. СОСТОЯНИЕ СИСТЕМЫ, ВОЗБУЖДАЕМОЙ ГАУССОВСКИМ БЕЛЫМ ШУМОМ, КАК МАРКОВСКИЙ ПРОЦЕСС • Стохастический процесс v{t) является марковским процессом,, ос л и Р {о (О < v.n | v (tt), v (t2), ...,v (*„_,)} = P {v (tn) < vn I vit^)} A.585) для всех п, всех tu t2, ..., tn, {tn > tn_i > tn_2, ..., > t{) и всех vn. Покажите, что состояние x(t) системы
142 ¦ Глава 1 {t), A586) х (Ч) == хо-> где w(t) — гауссовский белый шум, & х0 — заданная стохастичес- стохастическая переменная, является марковским процессом при условии, что х0 не зависит от w(t), t > t0. 1.12.11. МОДЕЛИРОВАНИЕ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ ВТОРОГО ПОРЯДКА Рассматривается система ° 1 W) + (°W). A.587) Для удобства выбрана система, представленная в каноничес- канонической форме. Пусть соB) — белый шум интенсивности 1. Выходная переменная системы записывается в виде v(*) = (Yi, ¦?*)*(<)¦ (!-588) а) Покажите, что если система A.587) асимптотически устой- устойчивая, то функция спектральной плотности энергии процесса y(t) определяется выражением X И = A.589) )* +ai (И+ б) Скалярный стационарный стохастический процесс задает- задается одним из следующих двух типов ковариационных функций: Д, ft = Pi «Г*'" +M-"tM A-590) или /?v (т) = 84 е"'0' '¦' cos (со0т) ¦+¦ ^ге~'т' cos (<oo -), A.591) где х =-<1 — ^2- Покажите, что система, описываемая уравнения- уравнениями A.587) и A.588), может быть использована для моделирования таких процессов. Найдите выражения, связывающие константы в уравнениях A.587) и A.588) с константами выражений A.590) или A.591). в) Атмосферная турбулентность проявляется-в виде стохасти- стохастически изменяющихся скоростей воздушного потока. Скоростные флуктуации в направлении, перпендикулярном главному потоку, могут быть представлены как скалярный стохастический процесс « ковариационной функцией Д(т) = о2е-м/9('1--1--Ь-1), . A.592) где т = ^i — h- Смоделируйте этот процесс.
9 АНАЛИЗ ЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ <?./. Введение Во введении дается краткое описание задач управления и со- содержание данной главы. Система управления является динамической системой, которая ведет себя желаемым образом, как правило, без вмешательства человека. Теория управления рассматривает вопросы анализа и синтеза систем управления. Основными компонентами системы управления (рис. 2.1) яв-- ляются: 1) объект, которым система должна управлять, 2) датчик Желаемая величина Рис. 2.1. Схема системы упраиления. (или несколько датчиков), который обеспечивает получение ин- информации об объекте, и 3) регулятор — важнейший компонент системы управления, который сравнивает измеренные и желае- желаемые значения и регулирует входные переменны* объекта. Примером системы управления является саморегулируемая система отопления дома, которая поддерживает внутри дома прак- практически постоянную температуру при существенных изменениях температуры окружения. Система работает без вмешательства человека, за исключением тех случаев, когда надо установить же- желаемую температуру. В этой системе управления объектом являются дом и тепловая установка. Роль датчиков обычно выполняют термодатчик, находящийся внутри дома, и (иногда) датчик наружной температуры. Регулятор обычно объединяется с
144 Глава 2 внутренним термодатчиком в термостат, который включает либо выключает по мере необходимости тепловую установку. Другим примером системы управления является следящая ан- антенна, которая без помощи человека все время направлена на дви- движущийся объект, например на спутник. Здесь объектом являют- являются антенна и исполнительный двигатель. Датчик состоит из по- потенциометра или другого чувствительного элемента, который изме- измеряет перемещение антенны и, возможно, включает в себя тахоге- нератор для измерения угловой скорости антенны. Регулятор состоит из электронной аппаратуры, которая обеспечивает подачу соответствующего входного напряжения на исполнительный дви- двигатель. ' Хотя на первый взгляд эти системы управления кажутся раз- различными, более глубокое изучение показывает, что они имеют много общего, Во-первых, объект и регулятор описываются диффе- дифференциальными уравнениями. Поэтому математический аппарат, необходимый для анализа поведения системы управления в обо- обоих случаях, состоит из совокупности методов, обычно называемых теорией систем. Во-вторых, обе системы управления имеют ха- характерную особенность, состоящую в наличии обратной связи, суть которой заключается в том, что действительное состояние системы управления сравнивается с желаемым состоянием и на основании этого сравнения вырабатывается входной сигнад на объект управления. Обратная связь имеет несколько важных свойств. Поскольку действительное состояние непрерывно сравнивается с желаемым состоянием, системы управления с обратной связью способны удов- удовлетворительно функционировать и в неблагоприятных условиях, таких, как возмущения, которые действуют на систему, или изме- изменения свойств объекта. В системе отопления дома возмущения вы- вызываются изменениями окружающей температуры и скорости вет- ветра, а изменения в свойствах объекта могут иметь место вследствие соединения либо разъединения частей отопительной системы дома. В системе управления антенной на объект действуют воз- возмущения в виде порывов ветра, а изменение свойств объекта про- происходит вследствие зависимости коэффициента трения от темпе- температуры. В настоящей главе рассматриваются задачи управления и опи- описываются возможные решения этих задач, анализируются эти/ решения и формулируются основные принципы проектирования. В последующих главах задачи управления рассматриваются как задачи математической оптимизации и полученные результаты используются для синтеза систем управления. Указанные основ- основные принципы проектирования в основном устанавливаются для линейных систем управления с постоянными параметрами. Обычно они разрабатываются с использованием частотных харак-
Анализ линейных систем управления 145 теристик, так как в этом случае может быть достигнуто наиболее ясное и наглядное изложение. Описание систем управления во временной области посредством уравнений состояния также ши- широко используется, поскольку во временной области часто более удобно выполнять численные расчеты. Настоящая глава построена следующим образом. В разд. 2.2 дается общее описание задач слежения, регулирования и терми- терминального управления. В разд. 2.3 рассматриваются замкнутые регуляторы. В последующих разделах обсуждаются различные свойства систем управления, такие, как устойчивость, точность слежения в установившемся режиме, свойства переходного про- процесса, влияние возмущений и шума наблюдений, влияние изме- изменений свойств объекта. Рассматриваются как одномерные, так и многомерные системы. ?.?. Формулирование задач управления 2.2.1. ВВЕДЕНИЕ В настоящем разделе рассматриваются два вида задач управ- управления: 1) задачи слежения и как частный случай задачи регулиро- регулирования; 2) задачи терминального управления. В последующих разделах приводится детальное описание воз- возможных схем управления и обстоятельно анализируются эти схе- схемы. В частности, значительное внимание уделяется следующим нопросам: вычислению среднеквадратической ошибки слежения и среднеквадратического значения входной переменной, анализу устойчивости, передаточных свойств и поведения в переходном процессе, подавлению возмущений и шума наблюдений, а также компенсации изменения параметров объекта. 2.2.2. ФОРМУЛИРОВАНИЕ ЗАДАЧ СЛЕЖЕНИЯ И РЕГУЛИРОВАНИЯ Рассмотрим с общих позиций один из важнейших классов задач управления — задачи слежения. Пусть имеется система, обычно называемая объектом, изменять которую не допускается. С объек- объектом связаны следующие переменные (рис. 2.2): 1. Входная переменная u(t), которая воздействует на объект и может быть регулируемой. 2. Возмущающая переменная vp (t), которая воздействует на объект и не может быть регулируемой. 3. Наблюдаемая переменная у(t), которая измеряется датчи- датчиками и используется для получения информации о состоянии объекта; наблюдаемая переменная обычно искажается шумом наблюдений vm(t). (,—394,
146 Глава 2 4. Управляемая переменная z(t), которой требуется управлять. 5. Эталонная переменная r(t), которая представляет собой требуемое значение управляемой переменной. Задача слежения, говоря кратко, заключается в следующем. Для заданной эталонной переменной нужно найти такую подхо- Возмущающая переменная vp Входная переменная и Эталонная переменная г Датчики Управляемая переменная z Наблюдаемая переменная у Шум наблюдений vm Рис. 2.2. Объект. дящую входную переменную, чтобы управляемая переменная сле- следила за эталонной, т. е. t>t0, B.1) где t0 — момент времени, начиная с которого осуществляется управление. Как правило, зараннее эталонная переменная не известна. Кроме того, диапазон изменения входной переменной u(t) практически ограничен. Расширение этого диапазона ведет к замене объекта на более мощный, что является неэкономичным. Как будет видно из дальнейшего, это ограничение имеет очень большое значение и не позволяет получать идеальные системы слежения. При проектировании следящих систем, удовлетворяющих ос- основному требованию B.1), должны быть приняты во внимание следующие аспекты: 1. На объект действуют неконтролируемые возмущения. 2. Параметры объекта могут быть в точности не известными и изменяться. 3. Начальное состояние объекта может быть неизвестным. 4. Наблюдаемая переменная, может не давать непосредственной формации о состоянии объекта и, более того, может быть иска- искажена шумом наблюдений. Входной сигнал для объекта вырабатывается устройством, кото-
Анализ-линейных систем управления 147 рое назовем регулятором. Различаются два вида регуляторов: разомкнутые и замкнутые. Разомкнутые регуляторы вырабаты- вырабатывают сигнал u(i) на основе только прошлых и текущего значений эталонной переменной (рис. 2.3), т. е. Эталонная переменная г Регулятор Входная переменная и Возмущающая переменная vp Объект Управляемая переменная z Рис. 2.3. Разомкнутая система управления. Замкнутые регуляторы имеют дополнительную информацию об объекте, которая содержится в наблюдаемой переменной; указан- указанный принцип может быть представлен (рис. 2.4) в виде Эталонная переменная г регулятор Входная переменная и Возмущающая переменная vp ЧпрпЯпярмап Объект переменная ъ Датчики нпПпюЯлрипг —Г Шум набпюдений переменная у vm Рис. 2.4. Замкнутая система управления. и It) = у t\, t0. B.3) Заметим, что ни в B.2), ни в B.3) для получения входной переменной не используются будущие значения эталонной и на- наблюдаемой переменных, поскольку они не известны. Объект и регулятор составляют систему управления. Уже на данной стадии заметим, что замкнутые регуляторы об- 6*
148 Глава 2 ладают намного большими возможностями, чем разомкнутые. Замкнутые регуляторы могут накапливать информацию об объек- объекте в процессе его функционирования и таким образом могут соби- собирать информацию о начальном состоянии объекта, могут умень- уменьшать влияние возмущений и компенсировать неопределенность и изменение параметров объекта. Разомкнутым регуляторам, оче- очевидно, не доступна какая-либо информация об объекте, за исклю- исключением того, что известно до начала управления. То, что разомкну- разомкнутые регуляторы не испытывают влияния шума наблюдения, пос- поскольку они не используют наблюдаемую переменную, не возме- возмещает указанного пробела. Важный класс задач слежения составляют задачи, в которых эталонная переменная является постоянной в течение продолжи- продолжительного периода времени. В таких случаях обычно принято на- называть эталонную переменную заданной точкой системы и гово- говорить о задачах регулирования. Главная задача обычна здесь сос- состоит в том, чтобы поддерживать управляемую переменную в задан- заданной точке при наличии возмущений. В настоящей главе задачи слежения и регулирования рассматриваются параллельно. Данный раздел завершаетея двумя примерами. Пример 2.1. Система управления положением В данном примере описывается задача управления, которая детально разбирается позже. Представим объект, движущийся, в плоскости. В центре плоскости располагается вращающаяся ан- антенна, которая, как предполагается, отмечает направление объекта во все моменты времени. Антенна приводится в движение электро- электродвигателем. Задача управления заключается в таком воздействии на двигатель, при котором в(*)~е,(*), г>г0, B.4) где 6@ обозначает угловое положение антенны, а 6Дг) — угловое положение объекта. Предположим, что угол Qr(t) доступен для из- измерения с помощью визирного устройства. Объект состоит из антенны и двигателя. Возмущением являет- является момент ветровой нагрузки, приложенный к антенне. Наблюдае- Наблюдаемой переменной является выходной сигнал потенциометра или другого преобразователя на валу антенны, определяемый выра- - жением *i(O = e(*) + v(*), B.5) где v(i) — шум измерений. В данном примере углом Q(t) необ- необходимо управлять, и, следовательно, он является управляемой переменной. Эталонной переменной является направление на объект Qr(t). Входным сигналом на объект является входное на- напряжение ц, поступающее на двигатель.
Угловое положение визира и объекта Потенциометр Электрический сигнал Регулятор Дифференциальный усилитель и усилитель мощности входное напряжение на двигатель Ветробое дозмушше Объект Электрический сигнал Двигатель и антенна , Датчик Потенциометр Угловое полотенце двигателя Шум наблюдений Рис. 2.5. Система управления положением.
150 Глава 2 Возможный метод разворота антенны в точку, соответствующую положению объекта, заключается в следующем. Оба угла, как ан- антенны Q(t), так и объекта Qr(t), преобразуются в электрические переменные с помощью потенциометров или других преобразова- преобразователей, установленных на валах антенны и визира. Затем Q(t) вычитается из Qr(t); разность усиливается и служит в качестве входного сигнала для двигателя. В результате, когда разность Qr(t) — Q(t) положительна, вырабатывается положительный входной сигнал, который вызывает вращение антенны в положи- положительном направлении таким образом, чтобы разность между dr(t) и 6@ уменьшалась. На рис. 2.5 представлена такая схема управ- управления. Очевидно, что такая схема предполагает замкнутый регулятор. Разомкнутый регулятор вырабатывал бы управляющее напря- напряжение A,B) только на основе эталонного угла Qr(t). Такой регулятор не имеет возможностей компенсировать влияние возмущений, та- таких, как ветровой момент, изменения параметров объекта или различные коэффициенты трения при разных температурах. Как будет показано, в случае замкнутого регулятора представляется возможность защиты от таких явлений. Данная задача является типичной задачей слежения. Пример 2.2. Система регулирования смесительного бака Предыдущий пример — относительно простой, так как объект имеет скалярные входную и управляемую пере- переменные. Многомерные задачи управления, в которых объект име- имеет несколько входных и несколько управляемых переменных, намного сложнее. В качестве примера многомерной системы рас- рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3). Бак имеет два подвода питания; соответствующие потоки могут регулиро- регулироваться клапанами. Концентрация растворимого вещества в каж- каждом из потоков постоянна и не может быть изменена. Бак имеет одно выходное отверстие, и задача управления состоит в проек- проектировании установки, которая бы автоматически регулировала расходы через клапаны питания с тем, чтобы поддерживать рас- расход п концентрацию выходного потока постоянной в соответствии с заданными эталонными значениями (рис. 2,6). Это типичная задача регулирования. Компонентами входной переменной являются расходы входящих потоков. Компонента- Компонентами управляемой переменной являютея выходной расход и концен- концентрация выходного потока. Заданная рабочая точка также имеет две компоненты: желаемый выходной расход и желаемую выход- выходную концентрацию. Могут иметь место следующие возмущения: флуктуации входных концентраций, флуктуации входных расхо- расходов вследствие флуктуации давлений перед клапанами, потерь жидкости из-за утечек и испарения и т. д. Для хорошего управле-
Эталонный расход Эталонная концентрация Управляющий сигнал Управляющий сигнал на клапан 1 Входной потоп 1 Регулятор на клапан 2 Управляющее устройство клапана 1 Управляющее устройство клапана 2 Клапан 1 Клапан 2 Входной потоп 2 Датчик расхода Датчик ¦ концентрации Выходной поток Рис. 2.6. Система управления смесительным баком.
152 Глава 2 пия системой должны измеряться и выходной расход, и концен- концентрация; тогда они явятся компонентами наблюдаемой переменной. Замкнутый регулятор использует как эти изменения, так и значе- значения заданных уровней расхода и концентрации для вырабатыва- вырабатывания пневматического или электрического сигнала, который ре- регулирует клапаны. 2.2.3. ФОРМУЛИРОВАНИЕ ЗАДАЧ ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ Хотя задачи терминального управления в основном подобны задачам слежения и регулирования,тем не менее здесь преследуется несколько иная цель. Как и в предыдущем случае, задан объект с входной переменной и, возмущением vp, наблюдаемой переменной у и управляемой переменной z. При этом типичная задача терми- терминального управления, коротко говоря, заключается в следующем. Найти такое u{t), t0 < t < tu чтобы выполнялось условие z(tj) =* ^ г, где г — данный вектор, а конечное время t1 может быть как задано, так и не задано. Практическое ограничение состоит в том, что диапазон входных амплитуд ограничен. Входной сигнал дол- должен вырабатываться регулятором, который также может быть замкнутого или разомкнутого типа. В настоящей книге подробно эти задачи не разрабатываются и их рассмотрение ограничивается следующим примером. Пример 2.3. Управление положением как задача терминального управления Рассмотрим задачу унравления положением антенны из приме- примера 2.1. Предположим, что в определенное время t0 антенна непод- неподвижна и занимает угловое положение 80. Тогда задача перемещения антенны в угловое положение Qlf в котором она должна остановить- остановиться, за минимально возможное время без перегрузки двцгателя яв- является примером задачи терминального управления. 2.3. Замкнутые регуляторы: основной принцип проектирования В данном разделе даются детальные описания объекта и зам- замкнутых регуляторов. Эти описания составляют основу для после- последующего материала, излагаемого в настоящей главе. Далее опре- определяются среднее значение квадрата ошибки слежения и среднее значение квадрата входной переменной и показывается, как эти величины могут быть вычислены. В данной главе и почти во всей книге предполагается, что объект можэт быть представлен линейной дифференциальной системой; при этом некоторые компоненты входной переменной являются
Анализ линейных систем управления 153 стохастическими процессами. Дифференциальное уравнение сос- состояния системы имеет вид x(t) = A(t)x(t) + B(t)u(t) + vp(t), B6) x(t0) = x0. Здесь x(t) — состояние объекта, a u(t) — входная пе- переменная. Начальное состояние х0 — стохастическая величина, а возмущающая переменная vp(t) — но предположению стохасти- стохастический процесс. Наблюдаемая переменная y(t) определяется вы- выражением y(t) = C(t)x(t) + vm(t), B.7) где предполагается, что шум наблюдений vm(t) является стохасти- стохастическим процессом. Управляемая переменная определяется в виде z(t) = D(t)x(t). B.8) Наконец, предполагается, что эталонная переменная r(t) является стохастическим процессом той же размерности, что и управляемая переменная z(t). В общем виде замкнутый регулятор также будет представлен как линейная дифференциальная система с эталонной переменной r(t) и наблюдаемой переменной y(t) в качестве входных воздействий и входной переменной объекта u(t) в качестве выходной величины. Дифференциальное уравнение состояния замкнутого регулятора будет иметь вид q(t) = L (t) q (t)+ Kr (t) r (t) - К, (t) у (t), B 9) q (h) = ?o. тогда как уравнение выходной переменной регулятора представ- представляется следующим образом: u(t) = F(t)q (t) + Hr (t) r (t) - Hf (t) у (t). B.10) Здесь индекс г относится к эталонной переменной, а индекс / — к обратной связи. Переменная q(t) характеризует состояние регулятора. Начальное состояние q0 является либо заданным век- вектором, либо стохастической величиной. На рис. 2.7 показаны связи объекта и регулятора, которые составляют систему управ- управления. При Kj{t) = 0и Hj{t) = 0 замкнутый регулятор преобра- преобразуется в разомкнутый регулятор (рис. 2.8). Система управления с замкнутым регулятором представляет собой замкнутую систему управления, а система управления с разомкнутым регулятором — разомкнутую систему управления. Определим два критерия качества системы управления,'кото-
j [_^1BH!IL. Замкнутый регулятор | Рис. 2.7. Замкнутая система управления.
/л. г 1 I L t F ! i Or" m^ ) I A X n Разомкнутый регулятор j ^Объект .. | Рис. 2.8. Разомкнутая система управления.
156 Глава 2 рые будут характеризовать, насколько успешно работает система управления. Определение 2.1. Среднее значение квадрата ошибки слежения Сe(t) и среднее значение входной переменной Cu(t) определяются выражениями Ce(t) = E{eT(t)We(t)e(t)), t>t0, B.11) Ca{t) = E\uT{t)Wu(t)u(t)), t>t0. Здесь ошибка слежения равна e(t) = z(t) — r(t), t>t0, B.12) a We(t) и Wu(t), t :> t0,— заданные неотрицательно определенные симметрические весовые матрицы. Если матрица We(t) является диагональной, что обычно и бы- бывает, то Ce{t) представляет собой взвешенную сумму средних зна- значений квадратов ошибок слежения каждой из компонент управ- управляемой переменной. Если ошибка e(t) — скалярная переменная и We— 1, то 'У Ce(t) — среднеквадратическая ошибка слежения. Аналогичным образом, если входная переменная u(t) — скаляр и \Уи — 1, то Y Cu(t) — среднеквадратическое значение входной пере- переменной. Основной целью при проектировании системы управления яв- является уменьшение до возможно меньшего уровня среднего зна- значения квадрата ошибки слежения. Уменьшение Ce(t) обычно пред- предполагает увеличение среднего значения квадрата входной пере- переменной Cu(t). Поскольку максимально возможное значение Cu(t) определяется мощностью объекта, должен быть найден компромисс между требованием к малому среднему значению квадрата ошиб- ошибки слежения, и необходимостью ограничения среднего значения квадрата входной переменной до приемлемого уровня. Основной принцип проектирования. При проектировании систем управления следует добиваться.Самого низкого из вбзможных сред- среднего значения квадрата ошибки слежения, не допуская превышения среднего значения квадрата входной переменной выше заданной величины. В последующих разделах приводятся более конкретные пра- правила проектирования, вытекающие из основного принципа, в частности для случая систем управления с постоянными парамет- параметрами. Рассмотрим способ вычисления среднего значения квадрата ошибки Ce{t) и среднего значения квадрата входной переменной Cu(t). Сначала для получения дифференциального уравнения сос- состояния системы управления используем метод расширения про-
Анализ линейных систем управления ' 157 странства из разд. 1.5.4. Из уравнений состояния и выходной переменной найдем * (*) \ U (*) ~B{t) Hf (t) C(t). В (t) F (t)\ (x (t) q(t)J \ -Kf(t)C(t) L(t) )\q.(t) -Kf(t) J\vm(t) Для ошибки слежения и входной переменной имеем e(t)~[D(t), O]lx®\-r{t), V q (*) / B.14) и (t) = [-Hf (t) С (t), F (*)] ( X B ) + Я, (*) r @ - Hf (t) vm (t). Вычисление Ce(t) и Cu(t) выполняется в два этапа. Сначала оп- определяется, среднее, или детерминированная часть процессов e(t) и u(t), которые описываются выражениями 7= Я {«(*)}, u(t) = E{u(t)}, t>t0. B.15) Средние значения вычисляются с использованием расширен- расширенного уравнения состояния B.13) и соотношения B.14), где стохас- стохастические процессы r(t), vp(t) и vm(t) заменяются своими средними значениями, а в качестве начального состояния принимается Среднее значение вектора со1[х(?0), q(ta)]. Обозначим через x(t), q(t) и т. д. переменные, которые получают- получаются вычитанием из x(t), q(t) и т.д. их средних значений z(t),'q(t) и т. д., т. е. Z(t) = x(t)—x(t), g(*) = g(*)—?_(*)" т.д. *>*0. B.16) Используя эти обозначения, запишем выражения для среднего значения квадрата ошибки слежения и среднего значение квад- квадрата входной переменной. Имеем Ce(t)=E{eT(t)We(t)e(t)}=-eT(tjWe(tO(t) + + E{~eT(t)We(t)~e(t)}, B.17) Си (t) =E{uT(t) Wu (t) и (t)) = uT (t) Wu (Л и Ц) + *-E{ZT(t)Wu(t) Z(t)}
158 Глава 2 Члены Е {ет (t)We(t)e~(t)} и Е{йт (t)Wu(t)u{t)) могут быть легко найдены, если известны матрица дисперсий процесса col[x(i), q(t)}. Чтобы определить эту матрицу дисперсий, необходимо смоде- смоделировать составляющие процессов r(t), vp(t) и vm(t), соответствую- соответствующие нулевому среднему значению, как выходные переменные ли- линейных дифференциальных систем, возбуждаемых белым шумом (разд. 1.11.4). Тогда вектор col[x(t), q(t)] расширяется за счет сос- состояний моделей, генерирующих различные стохастические про- процессы, а матрица дисперсий результирующего расширенного сос- состояния может быть вычислена с использованием дифференциаль- дифференциального уравнения для матрицы дисперсий из разд. 1.11.2. Полная процедура иллюстрируется примерами. Пример 2.4. Система управления положением Продолжим рассмотрение примера 2.1 (разд. 2.2.2). Движение антенны может быть описано дифференциальным уравнением J /в(«)+Вв(*) = т(*)+тЛ(*). B.18) Здесь / — момент инерции всех вращающихся элементов кон- конструкции, включая антенну; В — коэффициент вязкого трения, t(i) — момент, развиваемый двигателем, a ra(t) — возмущающий момент, вызываемый ветром. Предполагается, что момент, разви- развиваемый двигателем, пропорционален входному напряжению \x(t), т. е. т (t) = /qx (*). Определяя переменные состояния |х(?) = 0(?) и|а(?) = 0(?), за- запишем дифференциальное уравнение состояния в виде где *(*) = col &(*),&(*)], о=-|-, * = -j., Y = -y- B.20) Управляемой переменной ?(?) является угловое положение ан- антенны С (*) = A,0) *(«).• B.21) Параметрам присваиваются следующие численные значения: <х=4,6с-1, х = 0,787 рад/(В-с2), /=10кг.м2. B.22)
Анализ линейных систем управления 159 Вариант 1. Обратная связь по положению посредством регулятора нулевого порядка. В качестве первой попытки спроектировать систему управле- управления рассмотрим схему, намеченную в примере 2.1. Единственной измеряемой переменной является угловое положение Q(t), поэто- поэтому уравнение наблюдаемой переменной имеет вид Ч(*) = A, 0) *(*)+'v(*), B.23) где v(<) — шум измерений. Предполагаемый регулятор может быть описан соотношением Р(О = М8Г(*)—Ч(*I. B.24) где Qr(t) — эталонный угол, а X — постоянный коэффициент уси- усиления. На рис. 2.9 показана упрощенная блок-схема системы уп- Возмущающий момент t^ Эталонный +, угол вг О Входное напряжение Коэффициент усиления Двигатель Угловое положение Шум + наблюдений Наблюдаемая переменная п Гис. 2.9. Упрощенная блок-схема замкнутой системы унравления ноложением с регулятором нулевого порядка. равления, откуда видно, что напряжение, подаваемое на двигатель, пропорционально разности между эталонным углом Qr(t) и наблю- наблюдаемым угловым положением^ (<). Знаки выбираются таким обра- образом, чтобы положительное значение разности <br(t) — y\(t) приводи- приводило в результате к положительному моменту, прикладываемому к валу антенны. Вопрос о том, каким выбрать %, пока остается от- открытым; он будет рассмотрен в.примерах последующих разделов. Из B.19), B.23) и B.24) следует дифференциальное уравнение состояния замкнутой системы B.25)
160 Глава 2 Заметим, что регулятор B.24) не увеличивает размерности зам- замкнутой системы по сравнению с размерностью объекта, поскольку он не имеет динамики. Регуляторы этого типа относятся к регуля- регуляторам нулевого порядка. В последующих примерах будет показано, как могут быть вы- вычислены среднее значение квадрата ошибки слежения и среднее значение квадрата входной переменной при наличии стохастичес- стохастических процессов 0ДО, Td@ и Ч') в системе уравнений замкнутой системы. Вариант 11. Обратные связи по положению и скорости посред- посредством регулятора нулевого порядка. В последующих главах-будет показано, что чем больше инфор- информации о состоянии системы имеется в системе управления, тем лучше. Поэтому введем в систему, кроме потенциометра, измеряю- измеряющего угловое положение, тахогенератор, устанавливаемый на валу антенны, который измеряет угловую скорость. Таким обра- образом, имеется полная информация о состоянии, хотя, конечно, ис- искаженная шумом. Тогда наблюдаемая переменная приобретает вид y(t)=(i \x(t)+v{t), B.26) \0 1/ где y(t) — col [r|iB), г)а@1, а КО — с°1 lvi(i)(' va@1 является шумом наблюдений. Предложим теперь, следующую простую схему управления (рис. 2.10): возмущающий Рис. 2.10. Упрощенная блок-схема замкнутой системы управления положены ем и скоростью с регулятором нулевого порядка.
Анализ линейных систем управления 161 р (*) = X [Эг @ - га (*I - %рЪ (t). ' B.27) При таком способе управления входное напряжение двигателя содержит не только составляющую, пропорциональную ошибке слежения Qr(t) — Q(t), но также и добавочную составляющую, про- пропорциональную угловой скорости Q(t). Эта составляющая играет следующую роль. Допустим, что в данный момент разность Qr(t) — Q(t) положительна v а также имеет место положительная и значи- значительная по величине угловая скорость Q(t). Это означает, что ан- антенна с большой скоростью движется в требуемом направлении. Поэтому может оказаться желательным не продолжать переме- перемещение антенны, а начать торможение и таким образом избежать перерегулирования (перехода через желаемое положение). Если р выбрано правильно, то управлением B.27) можно эго осущест- осуществить в противоположность управлению B.24). Позже будет пока- показано, что данная схема может обеспечить более высокие показа- показатели регулирования, чем схема, рассмотренная в варианте I. Вариант 111. Обратная связь по положению посредством регуля- регулятора первого порядка. При данном подходе так же, как и в варианте I, предполагает- предполагается, что измеряемым является только угловое положение Q(t). Если наблюдения не содержат какого-либо шума, можно для полу- получения производной Q(t) из.координаты 0(?) использовать дифферен- дифференцирующее звено и продолжить построение системы в соответствии с вариантом II. Однако, поскольку всегда присутствует шум изме- измерений, использовать дифференцирование нельзя, так как это ве- ведет к значительному увеличению уровня шума. Поэтому попытаем- попытаемся использовать приближенное дифференцирующее звено (рис. 2.11), которое в определенной степени может «фильтровать» шум. Такое приближенное дифференцирующее звено можно реа- Возмущаюишй момент Эталонный Входное напряжение коэффициент усиления Двигатель УглоЙде почтете в Приближенное значение угловой скорости 4>-дийм Ноярашццент усиления п- Приближенный Набнядимая переменная 9(V Рис. 2.11. Упрощенная блок-схема замкнутой системы управления положени- положением с регулятором первого порядка.
162 Глава 2 лизовать с помощью устройства, имеющего передаточную функцию , B.28) где Td— (малая) положительная постоянная времени. Чем больше величина Td, тем в меньшей степени это звено является дифферен- дифференцирующим, но тем меньше усиливается шум. Входная переменная объекта может быть представлена в виде Н0 = ме,(*)-1(*I—W). B-29) где r\(t) — наблюдаемое угловое положение, как и в B.23), а b(t) — «приближенная производная», т. е. b(t) удовлетворяет диф- дифференциальному уравнению ТйЩ +§@ = ^@- B-30) В данном случае регулятор является динамической системой первого порядка. Детальный анализ качества рассматриваемой системы управления также откладывается до последующих раз- разделов, где будут выбраны соответствующие значения постоянной времени Td и коэффициентов X и р. Как будет видно, показатели качества этой системы занимают промежуточное значение между показателями качества систем вариантов I и II; данная система может достичь лучших показателей, чем в варианте I, хотя и не таких хороших, как в варианте II. 2.4. Устойчивость систем управления В предыдущем разделе были введены функции Ce(t) и Cu{t) как меры качества системы управления. Поскольку, вообще говоря, ожидается, что система управления будет функциониро- функционировать в течение продолжительного времени, по крайней мере сле- следует потребовать, чтобы функции Ce(t) и Ctt{t) оставались ограни- ограниченными при увеличении t. Это непосредственно приводит к не- необходимости исследования устойчивости системы управления. Если система управления является неустойчивой, то рано или поздно некоторые переменные начнут неограниченно возрастать, что, конечно, являэтся неприемлемым в любой системе управления, которая функционирует на некотором интервале времени (т. е. в течение периода, большего, чем постоянная времени возрастаю- возрастающего экспоненциала). Если система управления неустойчива, то Ce(t) или Ca{t) либо обе функции неограниченно возрастают. Та- Таким образом, приходим к следующему принципу проектирования. Принцип проектирования 2.1. Система управления должна быть асимптотически устойчивой.
Анализ линейных систем управления 163 В предположении о постоянстве параметров системы управле- управления принцип проектиро'вания 2.1 эквивалентен требованию, что- чтобы все характеристические числа расширенной системы B.13), т. е. характеристические числа матрицы -Kfi L j имели строго отрицательные действительные части. В соответст- соответствии с теоремой 1.21 (разд. 1.5.4) характеристический полином матрицы B.31) можно записать в виде det (si — A) det (si — L) det [1 + H (s) G (s)], B.32) где матричная передаточная функция от входной переменной и до наблюдаемой переменной у обозначается через Н (s) = С (si — А)-1 В, . B.33) L)-1Kf + H/ B.34) есть матричная передаточная функция регулятора от у до ~и. Одной из функций регулятора является перемещение полюсов объекта на лучшие местоположения в левой комплексной полу- полуплоскости, чтобы таким образом достичь улучшения качества системы. Если сам объект неустойчив, то главной задачей регулятора является стабилизация системы посредством передвижения полю- полюсов замкнутой системы в соответствующие места левой комплек- комплексной полуплоскости (пример 2.6). Пример 2.5. Система управления положением Исследуем устойчивость системы управления с позиционной обратной связью нулевого порядка, предложенной для переме- перемещения антенны из примера 2.4 (вариант I). Передаточная функция объекта (передаточная функция от управляющего напряжения до положения антенны) задана в виде H(s) = . B.35) Передаточная функция регулятора равна G(s) = K. B.36) В соответствии с B.32) полюса замкнутой системы являются корнями выражения s (s + а) |~1 -| —1 = s2 + as + /Я- B.37> L ( + ) J
164 Глава 2 -10 . -5 Я«Я/7) 5/ -5/ Рис. 2.12; Корневой годограф системы управления положением. - годограф системы второго порядка; модификация годографа из-за наличия полюса в точке —10 с. На рис. 2.12 показан корневой годограф полюсов замкнутой системы, где % — параметр, а численные значения остальных пара- параметров взяты из B.22). Видно, что в идеальном случае система управления устойчива при всех положительных значениях %. На практике, однако, при больших X система становится неустойчивой. Причина этого, кроме всего прочего, заключается в том, что не была учтена элек- электрическая постоянная времени Те двигателя. G учетом ее переда- передаточная функция системы двигатель — антенна записывается сле- следующим образом: Я (s) = - .. B.38) В результате характеристический полином замкнутой сисгемк приобретает вид На рис. 2.12 показана модификация корневого годографа при значении Те = 0,1 с. B.40 Для X Ж*,П(, где B.41
Анализ линейных систем управления 165 замкнутая система является неустойчивой. В данном случае Хт = 85,3 В/рад. Пример 2.6. Стабилизация перевернутого маятника В качестве примера неустойчивого объекта рассмотрим пере- перевернутый маятник из примера 1.1 (разд. 1.2.3). Из примера 1.16 (разд. 1.5.4) было видно, что с помощью обратной связи по углу <$(?) посредством регулятора нулевого порядка вида I* (*) = Л.Ф @ • ' ' B.42) невозможно стабилизировать систему при любых значениях ко- коэффициента X. Однако можно стабилизировать систему с помощью обратной связи по полному состоянию x(t), а именно {«,(*) = —fcc(*). B.43) Здесь к — постоянная вектор-строка, которую требуется найти. Заметим, что построение этого регулятора требует измерения всех четырех переменных состояний. В примере 1.1 было получено линеаризованное дифференциаль- дифференциальное уравнение состояния системы, которое имеет вид B.44) где Ъ — вектор-столбец. Подставляя B.43), имеем x(t) = Ax(f) — bkx(t), B.45) или x(t) = (A—bk)x(t). B.46) Устойчивость этой системы определяется характеристическими числами, матрицы А — Ьк. В гл. 3 обсуждаются методы определе- определения, оптимальных регуляторов вида B.43), которые стабилизиру- стабилизируют систему. Используя эти методы, при численных значениях па- параметров из примера 1.1 можно найти, например, что к = (86,81; 12,21; —118,4; —33,44) B.47) стабилизирует линеаризованную систему. При таком к характе- характеристические числа замкнутой системы равны —4,706 ±/1,382 и -1,902 +/3,420. Для исследования устойчивости реальной (нелинейной) зам- замкнутой системы рассмотрим нелинейные уравнения состояния B.48)
166 Глава 2 , M co, -МОП > У где компоненты |x, |2, |3 и ?4 определяются так же, как и в линеа- линеаризованных уравнениях. Подстановка выражения B.43) для [л(?) в B.48) приводит к дифференциальному уравнению состояния замкнутой системы. На рис. 2.13 показаны реакции замкнутой системы по углу ф(?) при различных начальных значениях <р@) и нулевых начальных условиях по другим координатам. При ф@) = 10° движение не отличается от движения, которое было най- найдено для линеаризованной системы. При ф@) = 20° имеет место некоторое отклонение, тогда как при ф@) = 30° значения B.47) не обеспечивают стабилизацию системы. Рис. 2.13. Поведение угла <f{t) в стабилизированном перевернутом маятнике. о) 9 @) =0°; б) <р„ = 20°; " в) <р,@) = 30°. Этот пример также иллюстрирует теорему 1.16 (разд. 1.4.4), которая устанавливает, что если линеаризованная система явля- является асимптотически устойчивой, то нелинейная система, из ко- которой она получена, также асимптотически устойчивая. Очевидно, что в настоящем случае диапазон, в котором линеаризация дает положительные результаты, достаточно велик.
Анализ линейных систем управления- 167 2.5. Анализ точности слежения в установившемся режиме 2.5.1. УСТАНОВИВШИЕСЯ СРЕДНИЕ ЗНАЧЕНИЯ КВАДРАТОВ ОШИБКИ СЛЕЖЕНИЯ И ВХОДНОЙ ПЕРЕМЕННОЙ В разд. 2.3 были введены среднее значение .квадрата ошибки слежения се и среднее значение квадрата входной переменной са. Из уравнений системы управления B.13) и B.14) можно видеть, что все три процесса r(t), vp(t) и vm(t), т. е. эталонная переменная, возмущающая переменная и шум наблюдений, оказывают влия- влияние на Се и Си. С этого момента до конца главы предположим, что r(t), vp{t)- и vm(t) — статистически некоррелированные стохасти- стохастические процессы, так что их влияние на Се и Си может быть изу- изучено по отдельности. В настоящем и последующем разделах рас- рассматривается влияние эталонной переменной r(t) отдельно на Ce(t) и Cu(t), Влияние возмущений и шума наблюдений исследуется в последующих разделах. Разделим продолжительность процесса управления на два периода: переходный и установившийся. Эти два периода могут быть охарактеризованы следующим образом. Переходный период начинается с началом процесса и оканчивается, когда интересую- интересующие нас величины (обычно средние значения квадрата ошибки сле- слежения и входной переменной) Приблизительно достигают своих установившихся значений. С этого времени обычно говорят, что процесс находится в установившемся состояний. Предполагается, конечно, что интересующие величины стремятся с течением вре- времени к определенному пределу. Продолжительность переходного периода называется временем установления. При проектировании систем управления должны приниматься во внимание характеристики системы как в переходном, так и в установившемся периодах. Настоящий раздел посвящается ана- анализу свойств следящих систем в установившемся режиме. В сле- следующем разделе рассматривается анализ переходных процессов. Для данного и следующего разделов делаются следующие допу- допущения: 1. Принцип проектирования 2.1 удовлетворяется, т. е. система управления асимптотически устойчивая. 2. Система управления имеет постоянные параметры, а ве- весовые матрицы We и Wa постоянные. 3. Возмущение Vp(t) и шум наблюдений vm(t) равны нулю. 4. Эталонная переменная r(t) может быть представлена в виде r(t)=ro + rn(t), BЛ9)
168 Глава 2 где rQ — стохастический вектор, a rv(t) — стационарный в ши- широком смысле и при этом некоррелированный с г0 векторный сто- стохастический процесс с нулевым средним. Здесь стохастический вектор г0 является постоянной частью эталонной переменной и фактически представляет собой заданную точку управляемой переменной. Процесс rv(t) с нулевым средним является переменной частью эталонной переменной. Предполо- Предположим, что матрица моментов второго порядка вектора г0 задана в виде E{r0/0} = R0, B.50) а переменная часть rv(t) имеет матрицу спектральной плотности энергии 2Дю). При установленных допущениях среднее значение квадрата ошибки слежения и среднее значение квадрата входной переменной- при увеличении t сходятся к постоянным величинам. Тогда опре- определим e(t) B.51) как установившееся среднее значение квадрата ошибки слежения, а Cae,= HmC1u@ B-52) как установившееся среднее значение квадрата входной переменной. Для вычисления Сесо и Сиоо обозначим через T(s) передаточную функцию замкнутой системы управления, т. е\ матричную переда- передаточную функцию от эталонной переменной г до управляемой переменной г. Далее обозначим через N(s) матричную передаточ- передаточную функцию замкнутой системы от эталонной переменной г до входной переменной и. Чтобы найти выражения для установившихся средних значе- значений квадратов ошибки слежения и входной переменной, рассмот- рассмотрим отдельно составляющие, обусловленные постоянной частью г0 и переменной частью rv(t) эталонной переменной. Постоянная часть эталонной переменной приводит к устано- установившимся значениям управляемой и входной переменной, опре- определяемым соответственно выражениями - • lim z (t) = Т @) r0 B.53) и lim и («) = N @) г0. B.54)
Анализ линейных систем управления 169 Соответствующие части средних значений квадратов ошибки слежения ж входной переменной равны [Т @) г0 - ro]T We [Т @) г0 - г0] = tr {r0 rT0 [T @) - — I]TWe[T@)-l]} B.55) B.56) Отсюда следует, что составляющие от постоянной части эта- эталонной переменной в общей величине установившихся средних значений квадратов ошибки слежения и входной переменной соот- соответственно равны tt {Ro\f@)-if We[T@)-I]), tv{R0NT@)WuN@)]. B.57) Составляющие от переменной части эталонной переменной в общей величине установившихся средних значений квадратов ошибки слежения и входной переменной могут быть легко опре- определены при использовании результатов разд. 1.10.3 и 1.10.4. Установившееся среднее значение квадрата ошибки слежения оказывается равным Се а = tr {й0 [Т @) - if We[T @) - /] + + f 2, И IT (~ /<») - I\T We [T W -1] df\ , B.58) а установившееся среднее значение квадрата входной переменной принимает вид Са „ = tr (i?0 NT @) Wu N @) + J2r (<в) Л'г (-/со) Wu N (/«) df\ .B.59) Эти формулы служат отправной точкой для формулирования принципов проектирования. Следующий раздел ограничивается рассмотрением случая единственной входпой и и единственной выходной z переменных, т. е. случая, когда и входная, и управ- управляемая переменные являются скалярными, а интерпретация фор- формул B.58) и B.59) становится очевидной. В разд. 2.5.3 рассмат- рассматривается более общий многомерный случай. В заключение получим выражения для T(s) и N(s) в терминах различных матричных передаточных функций объекта и регуля- регулятора. Обозначим через K(s) матричную передаточную функцию объекта B.6) — B.8) (в предположении постоянства парамет- параметров) от входной переменной и до управляемой переменной z, a передаточную функцию от входной переменной и до наблюдаемой
170 Глава 2 Г " г 1 Р IS) 1 г 1 Объект К is) His) Gisy z — —i ¦ Замкнутый .регулятор ¦ Рйс. 2.14. Блок-схема линейной замкнутой системы управления с постоянны- постоянными параметрами. переменной у — через H(s): Обозначим, кроме того, матричную передаточную функцию регулятора B.9), B.10) (также с постоян- постоянными параметрами) от эталонной переменной г до и через P(s), а матричную передаточную функцию от наблюдаемой переменной у до — и через G(s). Таким образом, имеем K(s) = D (si — А)'1 В\ Н (8) = С (si — А)-1 В, B.60) P{s) =F(sI — L)-1Kr + Hr, G(s) =F{sI — L)-xKf + Hf. Из блок-схемы, представленной на рис. 2.14, можно опреде- определить соотношения между некоторыми переменными системы в тер- терминах матричных передаточных функций. Отсюда видно, что, если R(s) является преобразованием Лапласа функции r(t), справедли- справедливы следующие соотношения в терминах преобразованнй Лапласа: l)(8) = P(8)R(8)-G{8)Y(8), y(s) = H(s)U(s), B.61) Z(s)=K(s)U(s). Исключая некоторые переменные, имеем Z (*) = Т (8) R (*), B.62) U(s)^N(s)R(s), где B.63)
Анализ линейных систем управления . . 171 Выражения T(s) и N(s) связаны соотношением T(s) = K(s)N(s). B.64) 2.5.2. СЛУЧАЙ СКАЛЯРНЫХ ВХОДНОЙ И ВЫХОДНОЙ ПЕРЕМЕННЫХ В данном разделе предполагается, что входная и и управляе- управляемая z переменные, а следовательно, и эталонная переменная г являются скалярными. Без потери общности можно принять We — 1 и Wa = 1. В результате установившееся среднее значение квадрата ошибки слежения и установившееся среднее значение квадрата входной переменной логут быть выражены в виде Се„ = #оI Г @) -112 + f 2, (со) | Т (/со) - 1 fdf, B.65а) Си « = #0\N @)|2 + j 2, NIN (/со) |2 df. B.656) Из анализа выражения B.65а) вытекает, что, поскольку при проектировании следящих систем стремятся к малому установив- установившемуся среднему значению квадрата ошибки слежепия, нужно придерживаться следующего принципа. Принцип проектирования 2.2. Чтобы обеспечить малое устано- установившееся среднее значение квадрата ошибки слежения, передаточ- передаточную функцию T(s) линейной системы управления с постоянными параметрами следует выбирать таким образом, чтобы выражение 2г(со)|Г(/со)-1J B.66) принимало малые значения для'всех действительных со. В частнос- частности, если заданные точки нулевые, то Т@) должно быть близким к 1. Замечание, касающееся Г@), можно пояснить следующим об- образом. В некоторых прикладных задачах весьма важным яв- является точное выдерживание заданной рабочей точки системой управления. В частности, это имеет место в задачах регулирова- регулирования, где переменная часть эталонной переменной полностью от- отсутствует. В этом случае может возникнуть необходимость, чтобы Г@) в точности равнялось 1. Рассмотрим теперь составляющие интеграла B.65а) по различ- различным частотным диапазонам. Обычно при возрастании со величина 2г(со) уменьшается и стремится к нулю. Таким образом, из B.65а) следует, что достаточно сделать малым значение |Г(/(со) — 1|
172 Глава 2 в том диапазоне частот, где 2f(co) принимает . большие значения. Поскольку эти замечания весьма важны, введем понятия по- полосы частот системы управления и полосы частот эталонной пе- переменной. Полосой частот системы управления, грубо говоря, является диапазон частот, в котором величина T(ja>) близка к 1. Определение 2.2. Пусть T(s) — скалярная передаточная функ- функция асимптотически устойчивой линейной системы управления \T(Ju)-1\ О Полоса частот Полоса пропускания системы управления Частота среза Рис. 2.15. Иллюстрации определения полосы частот, полосы пропускания и частоты среза одномерной системы управления с постоянными параметрами. Предполагается, что Т (/ш) -»0 при ш -» оо. с постоянными параметрами и скалярными входной и управляе- управляемой переменными. Тогда полоса частот системы управления определяется как множество частот со, со >- 0, для которых |Г(/т)-1|<е, B.67) где г — заданное число, малое по сравнению с 1. Если полоса частот представляет собой интервал [(оь а>2], то разность а>2 — a>i является полосой пропускания системы управления. Если полоса частот представляет собой интервал [О, шс], то <йс назы- называется частотой среза системы. Рис. 2.15 иллюстрирует понятия полосы частот, полосы про- пропускания и частоты среза. В данной книге обычно рассматриваются низкочастотные сис- системы, полоса пропускания которых представляет собой диапазон частот от нуля до частоты среза шс. Точное значение частоты среза, конечно, в значительной степени зависит от числа е. При е = 0,01 определим сос как 1%-ную частоту среза. Подобную терминоло-
Анализ линейных систем управления 173 гию будем использовать для различных значений е-'Часто, однако, удобно говорить о частоте срыва системы управления, которую определяют как угловую частоту, при которой асимптотическая логарифмическая частотная характеристика |J(/o>)| начинает рез- резко отходить от единицы. Так, частота срыва передаточной функ- функции первого порядка гр _ ^ s -\- a B.68) равна а, а частота срыва передаточной функции второго порядка гх, ш0 з + B.69) равна ©0. Заметим, однако, что в обоих случаях частота среза значительно меньше, чем частота срыва, которая зависит от е (а в случае системы второго порядка — от параметра демпфиро- демпфирования С). В табл. 2.1 приведены частоты среза 1 и 10% для раз- различных случаев. Таблица 2.1 Соотношение между частотой срыва и частотой среза для скалярных передаточных функций первого и второго порядков Частота среза 1% ю% Система первого порядка с час- частотой срыва а 0,01а 0,1а Система второго порядка с частотой срыва га0 С = 0,4 0,012<о0 0,12о>0 С = 0,707 0,0071иH 0,071ш0 С = 1,5 0,0033«>о 0,033м0 Определим полосу частот эталонной переменной как диапазон частот, в котором 2,@)) значительно отличается от нуля. Определение 2.3. Пусть г — скалярный стационарный в широком смысле стохастический процесс со спектральной плотностью энергии 2г(ш). Полоса частот Q процесса r(t) определяется как множество частот ш, со > 0, для которых 2, о. B.70) - Здесь а выбирается таким образом, чтобы полоса содержала заданную часть 1 — е (е <С 1) половины энергии процесса, т.е. =(! -8) B.71)
174 Глава 2 Если полоса частот представляет собой интервал [©4, ©2], то разность ©2 — Wj определим как полосу пропускания процесса. Если полоса частот представляет собой интервал [О, <ос], то сдс представляет собой частоту среза процесса. Рис. 2.16 иллюстрирует понятия полосы частот, полосы пропус- пропускания и частоты среза стохастического процесса. Обычно будут рассматриваться низкочастотные типы стохас- стохастических процессов, у которых полосой частот является интервал Полоса частот Частота среза Полоса пропускания стохастического процесса Рис. 2.16. Иллюстрация определения полосы частот, полосы пропускания и частоты среза скалярного стохастического процесса г. вида [0, сос]. Точная величина частоты среза, конечно, во многом зависит от величины g • Если е = 0,01, то говорят об 1%-ной час- частоте среза; это означает, что в интервале [0, сос] содержится 99% от половины энергии процесса. Подобная терминология исполь- используется и для других значений е- Во многих случаях, однако, удобно говорить о частоте срыва процесса, которую определим как угловую частоту, при которой асимптотическая логарифми- логарифмическая частотная характеристика, соответствующая 2Г(©), начи- начинает резко отходить от низкочастотной асимптоты, т. е. от 2г@). Возьмем в качестве примера экспоненциально коррелированный шум со среднеквадратическим значением ст и постоянной времени G. Этот процесс имеет функцию спектральной плотности энергии
Анализ линейных систем управления 175 I Полоса" частот i системы управления I I X ч Полоса частот эталонного сигнала Диапазон частот, который -обусловливает I появление большей части среднего значения квадрата 1 ошибки слежения Рис. 2.17. Иллюстрация принципа проектирования 2.2А. так что его частота срыва равна 1/9. Поскольку эта функция спек- спектральной плотности очень медленно уменьшается с увеличением 01, 1%- и 10%-ная частоты среза намного больше, чем 1/8: эти ве- величины равны 63,66/0 и 6,314/0 соответственно. Рассмотрим вновь интеграл B.65а). Используя введенные по- понятия, заметим,, что основная часть этого выражения определяет- определяется теми частотами, которые образуют полосу частот эталонной пе- переменной, а не полосу частот системы (рис. 2.17). Переформули- Переформулируем принцип проектирования 2.2 следующим образом. Принцип проектирования 2.2А. Для получения малого устано- установившегося среднего значения квадрата ошибки слежения необхо- необходимо, чтобы полоса частот системы управления содержала как можно большую часть полосы пропускания переменной части эта- эталонной переменной^ Если заданные точки не являются нулевыми, то следует стремиться, чтобы Т@) было близким к 1. Важный аспект этого правила проектирования состоит в том, что оно является также полезным в случае, когда об эталонной переменной ничего не известно, за исключением грубых оценок ее полосы частот. Рассмотрим теперь второй аспект проектирования — устано- установившееся среднее значение квадрата входной переменной. Рас- Рассмотрение выражения B.656) позволяет сформулировать следую- следующий принцип управления.
176 Глава 2 Принцип проектирования 2.3. Для получения малого установивше- установившегося среднего значения квадрата входной переменной в асимптоти- асимптотически устойчивой линейной системе управления со скалярными входной и выходной переменными и постоянными параметрами необходимо, чтобы выражение ХИ1^(/о))Г B.73) принимало малые значения для всех действительных ю. Этого можно достичь, делая \N(ja>)\ малым в полосе частот эталонной переменной. Следует заметить, что этот принцип не рекомендует оставлять N@) малым, как это могло бы следовать из рассмотрения первого члена выражения B.656). Указанный член представляет собой сос- составляющую от постоянной части эталонной переменной, т. е. от заданной рабочей точки, во входной.переменной. Заданная точка определяет желаемый уровень управляемой переменной и, следо- следовательно, входной переменной. Можно предположить, что объект спроектирован таким образом, что он способен выдерживать этот уровень. Второй член в выражении B.656) важен для динамичес- динамического диапазона входной переменной, т. е. для допускаемых изме- изменений входной переменной относительно заданной точки. Пос- Поскольку этот динамический диапазон ограничен, амплитуда второго члена в B.65 б) должна быть ограничена. Не представляет особого труда спроектировать систему управ- управления так, чтобы один из принципов проектирования — 2.2А или 2.3 — полностью удовлетворялся. Однако, поскольку T(s) и N(s) связаны соотношением Т (s) = K(s) N (*), B.74) звено T(s) влияет на N(s) и наоборот. Рассмотрим это несколько подробнее и покажем, что принципы 2.2 и 2.3 могут противоречить друг другу. Амплитудно-частотная характеристика объекта \K(je>)\ обычно уменьшается при частотах, превышающих определенную частоту, скажем <ар. Если характеристика \T(j<a)\ остается близ- близкой к 1 за частотой © из B.74) следует, что 1-/V(;co)| должно уве- увеличиваться за частотой ар. То что \T(j<a)\ не должно уменьшаться за частотой ©р, означает, что полоса частот эталонной переменной распространяется за частоту сор. В результате |./V(/co)| будет боль- большим в том частотном диапазоне, в котором 2г(со) не является ма- малым, что может означать большой вклад в среднее значение сиг- сигнала входной переменной. Если это приводит в результате к пере- перегрузке объекта, то либо должна быть уменьшена полоса пропус- пропускания системы за счет возрастания ошибки слежения, либо объект должен быть заменен на более мощный. Конструктор должен найти технически разумный компро-
Анализ линейных систем управления , 177 мисс между требованиями малого среднего значения квадрата ошибки слежения и среднего значения квадрата входной перемен- переменной, что характеризует динамический диапазон объекта. Этот компромисс должен быть основан на таких показателях системы, как максимально допустимая среднеквадратическая ошибка сле- слежения или максимальная мощность объекта. В последующих гла- главах, рассматривающих задачу синтеза, находится оптимальный компромисс этой дилеммы. Здесь уместно дать краткое пояснение вычислительных аспек- аспектов. В разд. 2.3 обсуждались методы, основанные на временных характеристиках, пригодные для вычисления среднего значения квадрата ошибки слежения и среднего значения квадрата входной переменной. В случае постоянных параметров интегральные вы- выражения B.65а) и B.65 б) предлагают другой вычислительный под- подход. Точные решения интегралов были табулированы для систем низких порядков (см., например, [132, 160]). При вычислениях, однако, обычно предпочитают подход, основанный на операциях во временной области, так как это удобно для расчетов на ЦВМ. Тем не менее выражения в частотной области чрезвычайно важны, поскольку они позволяют формулировать принципы проектиро- проектирования, которые не могут быть так просто установлены во времен- временной области. Пример 2.7. Точность системы управления положением Рассмотрим задачу управления положением из примеров 2.1 (разд. 2.2.2) и 2.4 (разд. 2.3) и предположим, что эталонная пере- переменная представляется в виде экспоненциально коррелированного шума с нулевым средним, среднеквадратическим значением а и постоянной времени Тг. Используем численные значения о- = 1 рад, Тг = 10 с. B.75) Из B.72) и численного значения постоянной времени следует, что частота срыва эталонной переменной равна 0,1 рад/с, 10%-ная частота среза соответствует 0,63 рад/с, а 1%-ная частота — 6,4 рад/с. Вариант I. Рассмотрим сначала вариант I из примера 2.4, где предложена обратная связь нулевого порядка по положению. Не- Нетрудно найти, что передаточные функции T(s) и N(s) имеют вид Т (s) = - , s* -J- as -J- %К B.76) N(s)= ls{s + a) s2 + as + хХ 7—394
17 8 Глава 2 — ш> 100 рад/с 0,0001 Рис. 2.18. Логарифмические частотные характеристики системы управления положением. Вариант I при различных значениях коэффициента X. откуда имеем где T(s) = °- -, • B.77), s2 -j- Ж «оs + шо coo = yHx B.78) есть частота собственных колебаний в отсутствие демпфирования, а Г = 2V4I B.79) — параметр демпфирования. На рис. 2.18 показан, график [Г(/со)| в функции частоты для различных значений коэффициен- коэффициента X. В соответствии с принципом проектирования 2.2А коэффи- коэффициент А должен быть не меньше 15 В/рад, поскольку в противном случае частота среза системы управления будет слишком малой по сравнению с 1%-ной частотой среза эталонной переменной, равной 6,4 рад/с. Однако частота среза, видимо, не увеличивается далее с ростом коэффициента из-за наличия пика, который ста- становится все более и более резко выраженным. Значение коэффи- коэффициента 15 В/рад соответствует случаю, когда параметр демпфиро- демпфирования с, приблизительно равен 0,7. Остается удостовериться, приводит ли это значение к прием- приемлемым значениям среднеквадратической ошибки слежения и сред- неквадратического входного напряжения. Вычислим обе величи-
Анализ линейных систем управления 179 ны. Эталонная переменная может быть смоделирована следую- следующим образом: 6,(*) = ±-Q,(t) + u>tt), B.80) где w{t) — белый шум интенсивности 2аУТг. Из B.19), B.24) и B.80) следует объединенное уравнение состояния системы управ- управления и эталонной переменной L oi о \/Ei()\ /\ И 1 \w(t). B.81) Используя это уравнение, нетрудно составить и решить урав- уравнение Ляпунова относительно матрицы установившихся диспер- дисперсий Q расширенного состояния col [?i@> Ег(*)» 9^@1 (теорема 1.53, разд. 1.11.3). В результате имеем у.ХТг B.82) ^ -+Г, .. (хХ)« Gt 1 а2 1 + —- 1 г Выражение для установившегося значения среднего. квадрата ошибки слежения получим в виде С =limE{[0(t)— 0Г| 1 хХ - 2qa +~q33 = B.83) где q(J — элементы матрицы Q. График установившейся ореднеквад- ратической ошибки слежения приведен на рис. 2.19. Заметим, что возрастание К выше значений 15—25 В/рад уменьшает среднеквад- 7*
180 Глава 2 i i Z5 50 15 Коэффициент X, ВI pad 100 20 ii fi I I 25 . 50 75 Коэффициент 1, В/рад 100 Рис. 2.19. Среднеквадратическая ошибка слежения и среднеквадратнческое входное напряжение как функции коэффициента А, в системе управления по- положением (вариант I). ратическую ошибку очень незначительно. То, что Сеоо не умень- уменьшается до нуля при X—>- сю, обусловлено пиком в частотной харак- характеристике системы, который при больших Л становится все более резко выраженным. Установившееся среднее значение квадрата входного напряже- напряжения определяется выражением [9 (t) - Qr = V Се B.84) Рис. 2.19 показывает то, что чувствуется интуитивно, а именно среднеквадратическое значение входной переменной возрастает с увеличением коэффициента Л. Сравнивая поведение среднеквадра- тической ошибки слежения и среднеквадратического входного напряжения, убеждаемся в том, что не имеет большого смысла увеличивать коэффициент сверх 15—25 В/рад, так^как увеличение среднеквадратического входного напряжения не приводит к ка- какому-либо ощутимому уменьшению среднеквадрагической ошиб- ошибки слежения. Однако рассматриваемый вариант системы не яв- является достаточно хорошим, поскольку среднеквадратическая ошибка слежения достигает значения 0,2 рад, что сравнимо со среднеквадратичесКим значением эталонной переменной 1 рад.
Анализ линейных систем управления 181 Вариант II. Второй вариант, предложенный в примере 2.4, дает лучшие результаты, поскольку в этом случае коэффициент тахомет- рической обратной связи р может быть выбран таким, чтобы зам- замкнутая система была демпфированной в желаемой полосе пропус- пропускания, что устраняет влияние резонансного пика. Для данного варианта передаточная функция Т (в) = B.85) сходна с выражением B.76), за исключением того, что а заменяет- заменяется на а + хЛр. В результате собственная частота системы равна B.86) а параметр демпфирования имеет вид B-87) Частота срыва системы равна ш0, которая посредством выбора достаточно большого X может быть сделана большой. Выбором р, обеспечивающего значение параметра демпфирования ~0,7, частота среза системы- управления может быть сделана соответ- соответственно большой. Установившееся среднее значение квадрата ошибки слежения записывается в виде Се m = = ^ о\ B.88) (а + *Хр) [а + хХр + — -Ji xlTr а установившееся среднее значение квадрата входного напряже- напряжения равно а хлр iia\ B.89) ~ Величина Се<а может быть сделана произвольно малой посред- посредством выбора больших значений X и р. Для заданного среднеквад- ратического входного напряжения можно получить меньшую, чем в варианте I, среднеквадратическую ошибку слежения. Зада- Задача выбора коэффициентов X и р такими, чтобы получались заданные среднеквадратическое значение входной переменной и минималь- минимальная среднеквадратическая ошибка слежения, является задачей математической оптимизации. В гл. 3 показывается, как может быть решена эта задача. Сей- Сейчас ограничимся следующим общим рассуждением. Предположим,
182 Глава 2 что для каждого значения X коэффициент тахометрической связи р выбирается таким, чтобы параметр демпфирования С равнялся 0,7. Далее предположим заданным условие, что установившееся среднеквадратическое входное напряжение не должно превышать 30 В. Тогда методом проб и ошибок, используя формулы B.88) и B.89), можно найти, что при X = 500 В/рад, р = 0,06 с B.90) установившаяся среднеквадратическая ошибка слежения равна 0,1031 рад, а установившееся среднеквадратическое входное на- напряжение равно 30,64 В. Эти значения коэффициентов обеспечи- обеспечивают близкую к минимальной среднеквадратическую ошибку сле- слежения для заданной среднеквадратической входной перемен- переменной. Отметим, что этот вариант лучше, чем вариант I, где была получена среднеквадратическая ошибка слежения ~0,2 рад. Одна- Однако вариант II не является еще достаточно хорошим, так как сред- среднеквадратическая ошибка слежения 0,1 рад не очень мала по сравнению со среднеквадратическим значением эталонной пере- переменной 1 рад. Положение можно исправить либо использованием более мощного двигателя, либо снижением полосы пропускания эталонной переменной. 10%-ная частота среза рассматриваемой замкнутой системы равна 0,071 соо =0,071 j/x\ ~ 1,41 рад/с, где соо — частота срыва системы (табл. 2.1). Эта частота среза зна- значительно меньше 1%-ной частоты среза эталонной переменной, равной 6,4 рад/с. Вариант 111. Третий вариант, . предложенный в примере 2.4, занимает промежуточное положение: при Тd = 0 он переходит в вариант II, а при jfd= оо — в вариант I. Для заданного значения Тй можно ожидать, что его показатели качества также находятся между показателями указанных двух вариантов, т. е. при задан- заданном среднеквадратическом входном напряжении среднеквад- среднеквадратическая ошибка слежения может быть получена меньше, чем в варианте I, и больше, чем в варианте II. G точки зрения качества слежения величина Td, конечно,' дол- должна быть выбрана как можно меньшей. Однако слишком малое значение Та будет способствовать неблагоприятному влиянию шума наблюдений. В примере 2.11 (разд. 2.8), который завершает раздел о влиянии шума наблюдений в системе управления, опре- определяется наиболее подходящая величина Td. 2.5.3. СЛУЧАИ МНОГОМЕРНОЙ СИСТЕМЫ В данном разделе вернемся к случаю, когда входная, управ- управляемая и эталонная переменные являются многомерными, и об- обобщим принципы проектирования, сформулированные в разд.2.5.2.
Анализ линейных систем управления 183 Из рассмотрения среднего значения квадрата ошибки слежения в виде B.58) становится очевидным, что принцип проектирования 2.2 следует модифицировать в том смысле, что выражение tr { 2г(о) 1Т-(~Щ—1)Т We\T(/©) -/]} B.91) должно быть малым для всех действительных со >¦ 0 и что при ненулевых заданных рабочих точках должно быть малым выра- выражение tr {Ro [T@)~lf We[T@)-~I]\ . B.92) Очевидно, что это условие выполняется, если T(ja>) равно единичной матрице для всех частот. Достаточно, однако, чтобы ТЦ(о) было близким к единичной матрице на всех частотах, для которых 2Дсо) значительно отличается от нуля. Чтобы более строго обосновать это утверждение, нужно принять следующие допущения. 1. Переменная часть эталонной переменной является стохас- стохастическим процессом с некоррелированными компонентами, для которого матрица спектральной плотности энергии может быть выражена в виде- 1(<o), x,2 И 2,. «И1- B-93) 2. Постоянная часть эталонной переменной является стохас- стохастической величиной с некоррелированными компонентами, так что ее матрица моментов вторрго порядка может быть выражена в виде i?0 = diag(tf0>1, #0,2>-.#o,m)- B-94) С практической точки зрения эти допущения не накладывают существенных ограничений. Используя B.93) и B.94), нетрудно найти, что установившееся среднее значение квадрата ошибки слежения может быть выражено в виде т ЦТ {Щ-If We[T@)-!))„ + ^T(-M-lfWe[TO^)~I])udf. B-95) 1 2 f /1 где КГ (-/со) -I\TWe\T№)-~I\\u B.96) обозначает i-й диагональный элемент матрицы [Т(—/со) — IV We[T(ja) - Л-
184 Глава 2 Рассмотрим теперь один из членов правой части выражения B.95): f 2г. i(Сй) [{Т {~1(Л) -I]T We {Т (/Сй) ~/1}"df- B-97) 00 Выражение B.97) описывает составляющую ошибки слежения от i-й компоненты эталонной переменной при прохождении ее через систему. В связи с этим удобно ввести следующее понятие. Определение 2.4. Пусть T(s) есть т X т-матричная переда- передаточная функция асимптотически устойчивой линейной системы управления с постоянными параметрами. Определим полосу час- частот i-го звена системы управления как множество частот со, со > О, для которых Здесь е — заданное число, малое по сравнению с 1, We— весовая матрица для среднего значения квадрата ошибки слежения, а Wetii обозначает i-й диагональный элемент матрицы We. Установив полосу частот i-ro звена, можно, конечно, опреде- определить полосу пропускания и частоту среза i-ro звена, если они су- существуют, как это было сделано в определении 2.2. Заметим, что определение 2.4 также справедливо для недиагональной весовой матрицы We. Причиной, по которой величина {[Г(—/со)—/JrWe|r0Jo»)—/И» сравнивается с Wetli, заключается в том, что имеет смысл сравни- сравнивать составляющую B.97) от ?-й компоненты эталонной переменной в среднем значении квадрата ошибки слежения с составляющей в отсутствие управления, т. е. при T(s) = 0. Эта последняя сос- составляющая определяется выражением И We, U V- ~B-") Нормированную функцию {[Т(—/со)—7]г We[T(ja) — Л}гг/ eiii будем рассматривать как разностную функцию i-ro звена. В случае скалярных входной и выходной переменных эта функ- функция равна \T(j(o)— 1|2. Расширим теперь принцип проектирования 2.2А следующим образэи. Припцип проектирования 2.2Б. Пусть T(s) есть т X т-матрич- т-матричная передаточная функция асимптотически устойчивой линейной
Анализ линейных Систем управления 185 системы управления с постоянными параметрами, для которой как постоянная, так и переменная части эталонной переменной имеют некоррелированные компоненты. Тогда для обеспечения малого установившегося значения среднего квадрата ошибки сле- слежения полоса частот каждого из т звеньев должна содержать по возможности большую часть полосы частот соответствующей ком- компоненты эталонного сигнала. Если i-я компонента, i =1,2, ..., т, эталонной переменной имеет ненулевую заданную рабочую точку, значение {[T(Q) — I]T We[T(O) — 1]}ц должно быть сде- сделано малым по сравнению с Weia. Уточняя это правило, можно' показать, чтб если составляющая выражения Се т, от какого-либо одного члена в выражении B.95) много больше, чем составляющая от остальных членов, то ука- указанный принцип проектирования должен быть применен в большей степени к соответствующему звену, чем к другим звеньям. Имея в виду допущения 1 и 2, имеет смысл предположить, что весовая матрица We диагональная, т. е.~~ We = uiag(Wen,We<22,..,,We_mm). B.100) Тогда можно написать [Г(/со)-/]}„ = e i m = ^\{T(M~I}n\2Wei[n « = 1.2 то. B.101) /=i где {T(j(u)— 1}п обозначает (I, i)-& элемент матрицы ТЦа) — /. Отсюда видно, что полоса частот i-го звена определяется i-ьтм столбцом передаточной функции T(s). Легко заметить, особенно в случае, когда матрица We диаго- диагональная, что принцип проектирования требует от элементов частотной характеристики Г(/со), чтобы они были близки к 1 в со- соответствующей полосе частот, тогда как недиагональные элементы должны быть достаточно малыми. Если все недиагональные эле- элементы матрицы Т(](й) равны нулю, т. е. матрица T(j(o) диагональ- диагональная, говорят, что система управления является полностью раз- развязанной. О системе, не полностью развязанной, говорят, что она испытывает взаимовлияние. Хорошо спроектированная система характеризуется малым взаимовлиянием. Систему управления, у которой матрица 7"@) диагональная, будем называть статичес- статически развязанной. В заключение рассмотрим установившееся среднее значение квадрата входной переменной. Если компоненты эталонной пе- переменной не коррелированы (допущения 1 и 2), то можно напи- написать
186 Глава 2 2 f 2 f Si(co){лгГ(~^)w«N^]"df' B-102) l—\ — 00 где {Лгг(—/a>)FFuiV(;cu)}H — i-й диагональный. элемент матрицы NT (—7u))WuiVGCu). Отсюда непосредственно вытекает следующий принцип проектирования. Принцип проектирования 2.3А. Для получения малого установив- установившегося среднего значения квадрата входной переменной в асимпто- асимптотически устойчивой линейной системе управления с постоянными параметрами и т-мерной эталонной переменной с некоррелирован- некоррелированными компонентами необходимо, чтобы выражение {NT(-jd)WuN{^))ti B.103) принимало малые значения в полосе частот i-u компоненты эта- эталонной переменной при i =1,2, ..., т. Снова, как и в принципе 2.3, не накладывается специальных ограничений на выражение {NT @)WuN@)}u, даже если у i-й ком- компоненты эталонной переменной может быть ненулевая заданная точка, поскольку необходимо ограничивать флуктуации только относительно заданной точки. Пример 2.8. Управление смесительным бакам Поставим задачу управления смесительным баком, описанным в примере 2.2 (разд. 2.2.2). Линеаризованное уравнение состоя- состояния, полученное в примере 1.2 (разд. 1.2.3), имеет вид W) + ( W). B.Ю4) 0 —0,02,/ W 4-0,25 0,75/ W V ' В качестве компонент управляемой переменной z(t) выберем расход и концентрацию выходного потока, поэтому напишем Таким образом, компонентами эталонной переменной r(t) яв- являются pi@ ира(О — желаемые выходной расход и выходная кон- концентрация соответственно. Рассмотрим следующий простой регулятор. Если выходной расход слишком мал, будем регулировать расход потока 1 пропор- пропорционально разности между действительным и желаемым расхо-
Анализ линейных систем управления 187 дами; таким образом, положим МО = *,№,(*)-<:. (*н, B-106) Однако, если выходная концентрация отличается от желаемо- желаемого значения, расход потока 2 регулируется следующим образом: МО = *2[Р2(<)-С2(*)]- B.Ю7) На рис. 2.20 показана блок-схема системы управления. Ожи- Ожидается, что эта схема окажется работоспособной, так как поток 2 имеет более высокую концентрацию, чем поток 1; таким образом, концентрация более чувствительна к регулированию второго потока. В результате, расходом первого потока более удобно ре- регулировать выходной расход. Однако, поскольку расход второго потока также воздействует на выходной расход, а расход первого потока — на его концентрацию, в этой схеме неизбежным оказы- оказывается определенное взаимовлияние. В рассматриваемой схеме управления матричные передаточные функции, указанные на рис. 2.14, могут быть представлены в виде О,Of 0,01 , s + 0,01 s-j-0,01 , K(s) = H(s) = \ ^ ^ , B.108) — 0,25 0,75 s+0,02 s + 0,02 \д к2 В примере 1.17 (разд. 1.5.4) было найдено, что характеристи- характеристический полином замкнутой системы имеет вид Фс (S) = s2 + s @,01 к{ + 0,75 к2 + 0,03) + @,0002 кх + + 0,0075 к2 + 0,01 ki К + 0,0002), B.109) откуда следует, что замкнутая система асимптотически устойчива для всех положительных значений коэффициентов./ct и /с2. Передаточная функция системы может быть представлена с помощью выражения Т (s) = К (s) [/ + G (s) H (s)] P (s) = W.01 Ms + *2 + 0,02) 0,01/c2(s +0,02) \ ,(*)(— 0,25 ^ (s + 0,01) к2 @,75s + 0,01 fc, + I + 0,0075)/
Г" Эталонное значение расхода Р, Ш Эталонное значение концентрации Коэффициент | усиления ОН юн Входной расход 1 Коэффициент усиления | Регулятор Л Входной расход Z ИгШ Объект Выходной расход Выходная концентрация Рис. 2.20. Схема замкнутой системы управления смесительным баком.
Анализ линейных систем управления • 189 В результате получим T(s) -I = /—[s2+s@,75fc2+0,03) + 0,01 к2 (s + 0,02) 1 j +0,0075Л2+0,0002] ~" Фс (s) I — 0,25 Art (s + 0,01) —[s2+«@,01^+0,03)+ \ + 0,0002 ft, + 0,0002] B.111)" Нетрудно видеть, что, если /ct и к2 одновременно устремляются к бесконечности, выражение T(s) — / стремится к нулю и обеспе- обеспечивается слежение, близкое к идеальному. Матричная передаточная функция N(s) может быть найдена в виде /Ar1[s2+s@,75/c2+0,03)+ — 0,01 к,. k2 (s + 0,02) = 1 j + O,O075fc2 + 0,0002] ~~ 4c W I 0,25 lah (s + 0,01) /c2[s2+s@,01/c1+0,03) + \ + 0.0Q02/CJ+0,0002] B.112) Если ki и к2 одновременно приближаются к бесконечности, то 75 (. + 0,01) -.(. + 0,02)N 25 (s +0,01) 5 + 0,02 ) У ' откуда следует, что установившееся среднее значение квадрата входной переменной Сиаа будет бесконечно большим, если элемен- элементы матрицы 2Дсо) уменьшаются не достаточно быстро с уве- увеличением со. Чтобы найти приемлемые значения коэффициентов /ct и к2, применим принцип проектирования 2.2Б и попытаемся определить Такие значения -fet и к2, при которых полосы частот двух звеньев системы содержат полосы частот эталонной переменной. Однако это является сложной задачей, и для решения ее используем метод проб и ошибок, который является типичным методом ре- решения задач управления в многомерных системах. Этот подход заключается в следующем. При определении к{ допускаем, что вторая обратная связь еще не подключена. Аналогично при опре- определении к2 допускаем, что первая обратная связь разомкнута. Та- Таким образом, получены две системы с одномерными входной и вы- выходной переменными, для которых решение задачи синтеза упро- упрощается. Затем анализируется система управления с обеими об-
190 Глава 2 ратными связями, и, если необходимо, процесс проектирования повторяется. Если размыкается вторая обратная связь, то передаточная функ- функция от первой входной переменной до первой управляемой пе- переменной равна HH(s)= °'01 . B.114) 11 w s + 0,01 Пропорциональная обратная связь, согласно B.106), дает передаточную функцию от р i(t) до Ci(?) в виде Очевидно, что частотная характеристика в нуле отличается от 1; это можно исправить включением коэффициента /i в цепи пер- первой компоненты эталонной переменной следующим образом: Jh(«) = A1l/lPl(O-C1(t)]. B.116) Тогда передаточная функция B.115) приводится к виду 0,01 А^Д +0,01 B.117) Для каждого значения ki можно выбрать такое /4, что частот- частотная характеристика в нуле будет равна 1. Теперь значение &J за- зависит только от желаемой частоты среза. При &j = 10 10%-ная частота среза равна 0,011 рад/с (табл. 2.1). Допустим, что этого достаточно для удовлетворения требований, предъявляемых к_ системе управления. Тогда для fi должно быть выбрано значение 1.1. Изучая аналогичным образом второе звено, можно найти, что при управлении M') = M/2P2(*)-C2(')] B-118) передаточная функция замкнутой системы от р 2(t) до Сг(О (в пред- предположении, что первая обратная связь разомкнута) равна s + 0,75 /c2 + 0,02 При к2 = 0,1 и /2 = 1,267 частотная характеристика в нуле равна 1, а 10%-ная частота среза составляет 0,0095 рад/с. Исследуем теперь работу многомерной системы управления, где • °W10 ° ) B.120) ,0 v lo од/
Анализ линейных систем управления 191 П -kt 1 10 0 1967'- BЛ21) Можно показать, что передаточная функция системы управ- управления равна ТО- 1 / 0,11s 4- 0,0132 0,001267s+0,00002534 \ (s> ~ S2+O,2O5S+O,O1295( —2,75s—0,0275 0,09502s + 0,01362 J ' B.122) тогда T (s) — / = X v ' s» + 0,205s+ 0,01295 s2 — 0,095s 4- 0,00025 0,001267s 4- 0,00002534 \ . ¦2,75s—0,0275 — s2 — O.HOOs+0,00067/ Теперь, чтобы определить полосы частот двух звеньев системы управления, сначала необходимо выбрать весовую матрицу We. Двумя управляемыми переменными являются выходной расход и выходная концентрация. Расход имеет постоянное номинальное значение 0,02 м*/с, тогда как постоянное номинальное значение концентрации равно 1,25 кмоль/м8. Поэтому 10%-ное изменение расхода соответствует 0,002 м*/с, а 10%-ное изменение концентра- концентрации ~0,1 кмоль/м3. Предположим теперь, что весовая матрица We диагональная с элементами We>i и И^2, а 10%-ные изменения в расходе либо в концентрации дают одинаковые составляющие среднего значения квадрата ошибки слежения. Тогда получаем Wel = 0,l2We2, B.124) или W -i-i- = 2500. B.125) Поэтому выберем FPe=diagE0, 0,02). B.126) Поскольку матрица We диагональная, можно использовать вы- выражение B.101) для определения полосы частот ?-го эвена. По- Полоса частот первого звена (цепи расхода), таким образом, опреде- определяется из рассмотрения неравенства 50 О»J + 0,095(/ш) — 0,00025 я (;о)J-|-0,205 (;<о) + 0,01295 4- 0 02 I 2,75 (/<¦>)+0.0275 О»J +.0,205 (/ш) + 0,01295 50е2. B.127)
192 Глава 2 После преобразований получим |0'<о)а + 0,095 (/о) - 0,00025 1' + 0,00041 2,75 (fo) + 0,02751» +0,205 ,01295 | 2 „ На рис. 2.21 показан график логарифмической частотной ха- характеристики для левой части неравенства B.128), что точно со- соответствует разностной функции первого звена. Очевидно, что ве- Рис. 2.21. Разностные функции первого и второго звеньев системы управле- управления смесительным баком. личина е не может быть выбрана произвольно малой, поскольку левая часть неравенства B.128) ограничена снизу. Горизон- Горизонтальная часть кривой в области низких частот главным образом обусловлена вторым членом числителя левой части неравенства B.128), который образуется из недиагонального элемента в пер- первом столбце матрицы T(ja) — /. Этот элемент характеризует часть взаимовлияния, существующего в системе. Рассмотрим теперь второе звено (цепь концентрации). Его полоса частот определяется из неравенства 50 0,001267 (/с*) + 0,00002534 + 0,02 J + 0,205 (;о>) + 0,01295 (j<oJ _{_ 0,1100 (}а>) — 0,00067 ¦<0,02ва. B.129) (/«>)* + 0,205 (Н + 0,01295 После преобразований получим | (;и>J + о,цоо (/<¦>)"— 0,00067 I2 + 2500 | 0,001267 (/<о) +0,0000253412 205 (/о 0,01295 | B.130)
Анализ линейных систем управления 193 0,002 5 t, с 50 0,1 «Si tew Р I Г t,c 50 Рис. 2.22. Матрица реакций на ступенчатое воздействие системы управления смесительным баком. Слева — реакции выходного расхода и концентрации на ступенчатое изменение расхода 0,002 ы?[с; справа — реакции выходного расхода и концентрации на ступенчатое измене- изменение концентрации 0,1 нмоль/м1. Логарифмическая частотная характеристика, соответствующая левой части неравенства B.130), которая является разностной функцией второго звена, также показана на рис. 2.21. В этом слу- случае горизонтальная часть кривой в области низких частот также обусловлена взаимовлиянием в системе. Если требования к е не слишком жесткие, то значение частоты среза второго звена сос- составляет ~0,01 рад/с. Полученные частоты среза с приемлемой точностью близки к 10%-ным частотам среза отдельных контуров @,011 и 0,0095 рад/с). Более того, оказывается, что взаимовлияние в системе невелико. В заключение на рис. 2.22 представлены графики элементов мат- матрицы переходных функций. Графики подтверждают, что система обнаруживает умеренное взаимовлияние (и динамическое, и ста- статическое). Каждое звено имеет переходную функцию системы пер- первого порядка с постоянной времени, приблизительно равной 10 с. Грубое представление об амплитуде входной переменной может быть получено следующим образом. Из выражения B.116) на- находим, что ступенчатое изменение расхода на 0,002 м3/с (типовая
194 Глава 2 величина) приводит в результате к изменению начального расхода потока 1 на kjl-0,002 =0,022 м^с. Аналогично ступенчатое изменение концентрации на 0,1 кмоль/м3 приводит в результате к изменению начального расхода потока 2 на к^-О,! =0,01267 м3/с. В сравнении с номинальными величинами расходов входящих потоков (соответственно 0,015 и 0,005 м3/с) эти величины слишком большие, откуда следует, что либо должна быть выбрана меньшая амплитуда скачка входной переменной, либо должна быть более плавной желаемая переходная характеристика. Последнее можно обеспечить, проектируя систему с меньшей полосой пропускания. В задаче 2.2 рассматривается более сложный вариант регуля- регулятора смесительного бака. 2.6. Анализ переходных процессов в следящих системах В предыдущем разделе подробно обсуждались свойства сле- следящих систем в установившемся состоянии. Данный раздел содер- содержит исследование поведения следящих систем в переходном про- процессе, в частности исследование поведения среднего значения квадрата ошибки слежения и среднего значения квадрата входной переменной. Определим время установления опреде- определенного процесса (среднего значения квадрата ошибки слежения, среднего значения квадрата входной переменной или какой- либо другой переменной) как время, в течение которого пере- переменная достигает установившегося значения в пределах заданной точности. Если эта точность равна, скажем, 1 % максимального отклонения от установившегося значения, то говорят об 1%-ном времени установления. Для других значений используется ана- аналогичная терминология. Обычно в момент начала работы системы управления началь- начальная ошибка слежения и соответственно начальное значение вход- входного сигнала бывают большими. Очевидно, желательно, чтобы среднее значение квадрата ошибки слежения достигало своего установившегося значения как можно быстрее после включения системы. Таким образом, сформулируем следующую рекоменда- рекомендацию. Принцип проектирования 2.4. Система управления должна быть спроектирована так, чтобы время установления среднего значе? ния квадрата ошибки слежения было по возможности малым. Как было показано в разд. 2.5.1, среднее значение квадрата ошибки слежения, соответствующее эталонной переменной, сос- состоит из двух составляющих, одна из которых обусловлена пос- постоянной частью эталонной переменной, а другая — ее переменной
Анализ линейных систем управления 195 частью. Поведение составляющей от переменной части в переход- переходном режиме должно быть найдено из решения (довольно трудоем- трудоемкого) матричного дифференциального уравнения относительно матрицы дисперсий состояния системы управления. Поведение в переходном режиме составляющей от постоянной части найти намного проще; это можно сделать, вычислив реакцию системы управления иэ ненулевых начальных условий и на ступенчатое изменение эталонной переменной. Как правило, вычисление этих реакций дает очень хорошее представление о поведении системы управления в переходном режиме. Для асимптотически устойчивых линейных систем управления с постоянными параметрами некоторая информация относительно времени установления часто может быть получена из расположе- расположения полюсов замкнутой системы. Это следует из того факта, что все реакции представляют собой экспоненциально демпфированные движения с постоянными времени, которые являются отрицатель- отрицательными обратными величинами действительных частей характерис- характеристических чисел замкнутой системы. Поскольку 1 %-ное время уста- установления процесса <Гг/\ г>0, B.131) равно 4,69', граница для 1%-ного времени установления ts какой- либо переменной определяется неравенством ts< 4,6max( i—) , , B.132) t 11 Re (A;) | J ' У ' где %г, i = 1, 2, ..., n,— характеристические числа замкнутой системы. Заметим, что для квадратпических переменных, таких, как среднее значение квадрата ошибки слежения и среднее значение квадрата входной переменной, время установления равно поло- половине времени установления самой переменной. Определение границы с помощью выражения B.132) иногда может ввести в заблуждение, поскольку всегда может случиться, что реакция данной переменной не зависит от некоторых харак- характеристических чисел. Позднее (разд. 3.8) рассматривается случай, где время установления среднеквадратической ошибки слежения определяется самыми отдаленными от начала координат полюсами замкнутой системы, а не близкими полюсами, тогда как время уста- установления среднеквадратического значения входной переменной зависит лишь от близких Полюсов замкнутой системы. Пример 2.9. Время установления ошибки слежения в системе управления положением Рассмотрим систему управления положением с вариантом I регулятора из примера 2.4-(разд. 2.3). Из анализа установивше- установившегося состояния в примере 2.7 (разд. 2.5.2) найдено, что с увели-
196 Глава 2 чением коэффициента А установившаяся среднеквадратическая ошибка слежения продолжает уменьшаться, хотя увеличение этого коэффициента выше 15—25 В/рад приводит лишь к очень небольшому улучшению среднеквадратической ошибки слежения, тогда как среднеквадратическое значение входного напряжения непрерывно возрастает. Рассмотрим теперь время установления ошибки слежения. На рис. 2.23 представлена реакция управляе- 100 Рис. 2.23. Реакции системы управле- управления положением (вариант I) на сту- ступенчатое изменение 0,1 рад эталон- эталонной переменной для различных зна- значений коэффициента Я,. мой переменной из нулевых начальных условий для различных значений % на ступенчатое изменение эталонной переменной. Оче- Очевидно, что время установления реакции на ступенчатое воздей- воздействие (в данном случае ошибки слежения) сначала быстро умень- уменьшается с ростом А, но затем после значения К ~15 В/рад почти не уменьшается из-за усиливающихся колебаний реакции. В этом случае оказывается, что самое подходящее значение X находится около 15 В/рад, что соответствует параметру демпфирования С «0,7 (пример 2.7). Из графика |Г(/©)| на рис. 2.18 Ьидим, что при этом значении коэффициента получается самая, большая полоса пропускания, а нежелательный пик частотной характерис- характеристики отсутствует. 2.7. Влияние возмущений в скалярном случае В разд. 2.3 указывалось, что система управления часто подвер- подвергается воздействию возмущений, в результате чего ухудшаются показатели качества слежения. В данном разделе устанавливают- устанавливаются выражения, определяющие возрастание установившихся сред- средних значений квадрата, ошибки слежения и квадрата входной пе- переменной за счет действия возмущений, и формулируются прин-
Анализ линейных систем управления 197 ципы проектирования, которыми можно руководствоваться при проектировании систем управления, способных противодейство- противодействовать возмущениям. Для данного раздела принимаются следующие допущения. 1. Возмущающая переменная vp(t) является стохастическим процессом, который не коррелирован с эталонной переменной r(t) и шумом наблюдений vm(t). Это позволяет определить возрастание значения среднего квад- квадрата ошибки слежения ^ среднего значения квадрата входной перемепиой, положив r(t) и vm(t) равными нулю. 2. Управляемая переменная является также наблюдаемой пе- переменной, т.е. С =D. Это означает, что можно написать y{t) = z(t) + vm(t), B.133) и что в случае постоянных параметров = K(s). B.134) Допущение о том, что управляемая переменная является также наблюдаемой переменной, вполне правомерно, так как интуитив- интуитивно ясно, что обратная связь является наиболее эффективной, если она осуществляется по самой управляемой переменной. 3. Система управления является асимптотически устойчивой и имеет постоянные параметры. 4. Входная и управляемая переменные и, следовательно, эта- эталонная переменная являются скалярными, а весовые матрицы We и Wu равны 1. Выводы данного раздела могут быть распространены на слу- случай многомерных систем; такие обобщения приводятся в конце настоящего и последующего разделов. 5. Возмущающая переменная v (t) может быть записана в виде МО^о + ^рЛО. BЛ35> где постоянная часть v^ возмущающей переменной является сто- стохастическим вектором с заданной матрицей вторых моментов, а переменная часть vpv (t) возмущающей переменной является стацио- стационарным в широком смысле некоррелированным с VpQ стохастичес- стохастическим процессом с нулевым средним и матрицей спектральных плот- плотностей энергии Hvp(a>). Матричная передаточная функция от возмущающей переменной v-p(t) до управляемой переменной z(t) может быть найдена из сле- следующего соотношения (рис. 2.24): Z(s) = -H(S)G(s)Z(s) + D(sr-A)-*Vp(s), B.136)
198 Глава 2 где Z(s) и Vp (s) обозначают преобразования Лапласа переменных z(t) и vp(t) соответственно; отсюда "Z(*) = D (si — А)-*\ D(s). B.137) w 1 + Я (s) G (s) . v ' "w v 7 Здесь использован тот факт, что управляемая переменная яв- является скалярной, поэтому величина 1 + H(s)G(s) также является скалярной функцией. Введем функцию g /s\ \ B 138) Рис. 2.24. Блок-схема матричной передаточной функции замкнутой системы управления при наличии приложенного к объекту возмущения Ур. которую назовем функцией чувствительности системы управле- управления; смысл ее объясняется позднее. Вычислим составляющую от возмущающей переменной в уста- установившемся среднем значении квадрата ошибки слежения как сумму двух членов, первый из которых обусловлен постоянной частью, а второй — переменной частью возмущений. Поскольку Z(s) = S (s) D {sI — A^Vpls), B.139) установившаяся реакция управляемой переменной от постоянной части возмущений определяется следующим образом: lim z(t) = S @) D (— A)-1 Vpo = S @) v, oo- B.140) Здесь предполагается, что Матрица А неособая (случай, когда А — особая матрица, рассматривается в задаче 2.12.4), а также использовано обозначение vw = D{-A)-iV[A. B.141) В результате из B.140) следует, что составляющая от постоян-
Анализ линейных систем управления 199 ной части возмущении в установившемся среднем значении квад- квадрата ошибки слежения равна Я{ | S @) »оо|«> = | S @)l*Vo , B.142) где Fo — момент второго порядка величины у00, т. е. Fo = #{i>ooa}. На основании методов разд. 1.10.3 и 1.10.4 из B.139) следует, что составляющая от переменной части возмущений в установившемся среднем значении квадрата ошибки слежения может быть выраже- выражена в виде S (/ш) D (/to/ — A)~l V (<o) (— /со/ — Ат У1 DT df = B.143) Здесь принято обозначение Следовательно, увеличение установившегося среднего значе- значения квадрата ошибки слежения от действия возмущений опреде- определяется выражением С т (с возмущением) — С (без возмущения) = B.145) Перед обсуждением задачи о том, как сделать это выражение малым, рассмотрим его более подробно. Пусть имеет место ситуа- ситуация, показанная на рис. 2.25, где переменная vo(t) действует на Объект G(s) Рис. 2.25. Блок-схема матричной передаточной функции замкнутой системы- управления при наличии эквивалентного возмущения vo управляемой пере- переменной.
200 Глава 2 замкнутую систему. Эта переменная добавляется к управляемой переменной. Нетрудно установить, что при нулевых начальных условиях и нулевой эталонной переменной преобразование Лап- Лапласа управляемой переменной определяется в виде ' Z(*) = S(*)Ve», B.146) где V0(s) обозначает преобразование Лапласа переменной vo(t). Отсюда непосредственно следует, что, если vo(t) — стохастический процесс, постоянная часть которого является стохастической ве- величиной с моментом второго порядка Fo, а переменная часть — стационарным в широком смысле стохастическим процессом с ну- нулевым средним и спектральной плотностью энергии 2„о(со), уве- увеличение установившегося среднего значения квадрата ошибки сле- слежения точно определяется выражением B.145). Поэтому назовем процесс vo(t) с такими свойствами эквивалентным возмущением- управляемой переменной. Исследование B.145) приводит к следующему правилу проек- проектирования. Принцип проектирования 2.5. Чтобы уменьшить прирост ус- установившегося среднего значения квадрата ошибки слежения, обус- обусловленный возмущениями, в асимптотически устойчивой линейной системе управления с постоянными параметрами и скалярной управляемой переменной, которая является также наблюдае- наблюдаемой переменной, абсолютное значение функции чувствительнос- чувствительности S (]<?>) нужно сделать малым в полосе частот эквивалентного возмущения управляемой переменной. Если особое внимание уде- уделяется устранению постоянных ошибок, то S@) должно быть сде- сделано малым, предпочтительно нулевым. Последнее утверждение данного правила проектирования не является справедливым без допущения о том, что матрица А объекта является леособой; этот случай обсуждается в задаче 2.12.4. Заметим, что, поскольку S(/c°) определяется выражением S (/со) = , B.147) малое значение SQw) обычно достигается при большом коэффи- коэффициенте усиления1 цепи H(ja>)G(J<a) системы управления в соответ- соответствующем диапазоне частот. Это противоречит принципу проек- проектирования 2.1, относящемуся к устойчивости системы управления (пример 2.5, разд. 2.4). Следовательно, должен быть найден компромисс. Уменьшение, постоянных ошибок представляет' собой задачу особой важности в системах регулирования и слежения, где за- заданная точка управляемой переменной должна выдерживаться с 1 Имеется в виду динамический коэффициент усиления.— Прим. перев.
Анализ линейных систем управления 201 большой точностью. Постоянные возмущения часто возникают^ системах управления, особенно из-за ошибок, сделанных при уста- установлении номинального входного сигнала. Постоянные ошибки могут быть полностью ликвидированы при S@) = 0, что обычно достигается введением интегрирующего действия регулятора, т. е. установлением в передаточной функции регулятора G(s) по- полюса в начале координат (см. задачу 2.3). Займемся рассмотрением установившегося среднего значения квадрата входной переменной. Нетрудно найти, что в терминах преобразования Лапласа можно написать (рис. 2.24) U(s) = =^ DisI—A^V.is), B.148) i + H(s)G(s) V ; pK V ' где U(s) преобразование Лапласа переменной u(t). Отсюда следует, что увеличение установившегося среднего значения квадрата входной переменной, используя введенные в данном разделе обозначения, можно представить в следующем виде: Сиса (с возмущениями) — Сисо (без возмущений) = 6@) 1 + Н @) G @) fl ^ 2S (»)d/. B.149) J I 1 + Д (/<o) G (/«.) AiOv ^ Это выражение позволяет сформулировать следующую реко- рекомендацию. Принцип проектирования 2.6. Чтобы получить малый прирост установившегося среднего значения квадрата входной переменной, обусловленного возмущениями, в асимптотически устойчивой линей- линейной системе управления с постоянными параметрами и скалярной управляемой переменной, которая является и наблюдаемой пере- переменной, и скалярной входной переменной, необходимо, чтобы вы- выражение G (/<-) 1 + Н (/<¦>) G (/а.) B.150) принимало малые значения в полосе частот эквивалентного возму- возмущения управляемой переменной. В этой рекомендации не уделяется внимания постоянной части входной переменной, поскольку, как предполагалось при обсуж- обсуждении принципа 2.3, объект должен обладать способностью вы- выдерживать эти постоянные отклонения. Принцип проектирования 2.6 противоречит принципу 2.5. Увеличение коэффициента усиления цепи H(j(a)G(ja>), как требует принцип проектирования 2.5, обычно приводит к малым значе- значениям выражения B.150). Здесь снова должен быть найден компро- компромисс.
202 Глава 2 Пример 2.10. Влияние возмущений на систему управления поло- положением В этом примере исследуется влияние возмущений на вариант I системы управления положением из примера 2.4 (разд. 2.3). Не- Нетрудно найти, что функция чувствительности системы управления определяется выражением S(s) = S2 B.151) На рис. 2.26 представлены логарифмические характеристики I)! при некоторых значениях коэффициента X. Очевидно, что при больших значениях % полоса частот, в которой подавляют- IU ,. 1 0,1 0,01 nnm 0,1 %^^^^ fc~^-— ы.радк Рис. 2.26. Логарифмические частотные характеристики функции чувствитель- чувствительности системы управления положением (вариант I) при различных значениях коэффициента X. ся возмущения, также становится шире. Если, однако, эквивалент- эквивалентное возмущение управляемой переменной имеет большую энергию вблизи частоты, соответствующей пику характеристики ^(/са)], то можно рекомендовать меньшее значение коэффициента. В примере 2.4 предполагалось, что возмущение представляет собой возмущающий момент %d(t), приложенный к валу двига- двигателя. Если переменная часть этого возмущающего момента имеет функцию спектральной плотности 2rd (со), то переменная часть эквивалентного возмущения управляемой переменной имеет функцию спектральной плотности a) B.152) Спектральная плотность составляющей от возмущающего мо- момента в управляемой переменной находится умножением B.152) на |5(/оо)|2 и, таким образом, равна
Анализ линейных систем управления 203 V (ш). B.153) Предположим, что переменная часть возмущающего момента может быть представлена как экспоненциально коррелированный шум со среднеквадратическим значением ard и постоянной време- времени Trd, так что V (со) = ЧлТ'й , B.154) Прирост установившегося среднего значения квадрата ошибки слежения, обусловленный возмущающим моментом, может быть вычислен интегрированием B.153) или путем моделирования воз- возмущения, т. е. расширением состояния дифференциальной системы и решением уравнения относительно матрицы установившихся дис- дисперсий расширенного состояния. Тем или другим способом на- находим Сесо (с возмущающим моментом)—Се да (без возмущающего Отсюда видим, что слагаемое в Сею, обусловленное возмуще- возмущением, монотонно убывает до нуля при увеличении "К. Таким обра- образом, чем больше %, тем в меньшей степени возмущающий момент оказывает влияние на точностные свойства. В отсутствие эталонной переменной имеем \i(f) =—\i\(t), так что прирост среднего значения квадрата входного напряже- напряжения, обусловленный возмущающим моментом, в X2 раз больше прироста среднего значения квадрата ошибки слежения Си ot (с возмущающим моментом) — Са т (без возмущающего момента) = -—5— ' °1* • B.156) l + aTrd-\- %XT2rd <rx. rd \ При X -*¦ со величина Саоа монотонно возрастает до значения д + ^Н2 дЗ B.157) Из B.25) нетрудно найти, что постоянный возмущающий момент То приводит к установившемуся отклонению управляемой пере- переменной на. величину -12L. B.158)
204 Глава 2 Очевидно, что при достаточно большом коэффициенте X это отклонение может быть сделано как-угодно малым. 2.8. Влияние шума наблюдений в скалярном случае В любой замкнутой системе в некоторой степени ощущается влияние шума наблюдений. В настоящем разделе анализируется составляющая от шума наблюдений в среднем значении квадрата ошибки слежения и среднем значении квадрата входной перемен- переменной. В данном разделе принимаются следующие допущения. 1. Шум наблюдений vm(t) является стохастическим процессом, некоррелированным с эталонной переменней r(t) и приложенным к объекту возмущением vp(t). Таким образом, приращения среднего значения квадрата ошиб- ошибки слежения и среднего значения квадрата входной переменной, обусловленные.шумом наблюдений, могут быть вычислены,-.если положить r(t) и vp(t) равными нулю. 2. Управляемая переменная является также наблюдаемой пере- переменной, т. е. С =2), так что = z(t)+vm(t), а в случае постоянных параметров Я («) = * B.159) B.160) 3. Система управления является асимптотически устойчивой и имеет постоянные параметры. 4. Входная и управляемая переменные и, следовательно, эталон- эталонная переменная являются скалярными, а весовые матрицы We и Wu равны 1. Здесь также анализ может быть распространен на случай мно- многомерных систем, однако это почти не дает дополнительной инфор- информации. Рис. 2.27. Блок-схема матричной передаточной функции замкнутой системы управления при наличии шума наблюдений.
Анализ линейных систем управления ' 205 5. Шум наблюдений является стационарным в широком смысле стохастическим процессом с нулевым средним и функцией спек- спектральной плотности 2,ит(&). На рис. 2.27 показана блок-схема системы, которая полу- получается после принятия указанных допущений. В терминах пре- преобразований Лапласа имеем Z (s) = - Я (s) G (s) [Vm (s) + Z («)], B,161) так что Z(s) = g(s)G(s) -Vm(»). B.162) w i + я (s) G (s) m W V ' Следовательно, прирост установившегося среднего значения квадрата ошибки слежения, обусловленный шумом наблюдений, может быть записан в виде Се т (с шумом наблюдений) — Се т (без шума наблюдений) = =, f _^M?i^I_2y {<a)dfm B.163) J 1 + Я(,Ъ) G(/<o) ^JomV ' V ; В связи с этим может быть сформулирован следующий принцип проектирования. Принцип проектирования 2.7. Чтобы уменьшить прирост устано- установившегося среднего значения квадрата ошибки слежения, обуслов- обусловленный шумом наблюдений в асимптотически устойчивой линей- линейной системе управления, с постоянными параметрами, со скалярной управляемой переменной, которая является также наблюдаемой переменной, систему следует спроектировать так, чтобы значение Н (Н G (/<¦>) B.164) 1 + Я (/со) G (/со) было малым в полосе частот шума наблюдений. Очевидно, что этот принцип противоречит принципу 2.5, по- поскольку- увеличение коэффициента усиления цепи H(i&)G(i(si), как этого требует принцип 2.5, приводит к значению B.164), близкому к 1, что означает появление в ошибке слежения неподав- неподавленного шума наблюдений. Это происходит в результате того, что в случае большого коэффициента усиления цепи H(Ja>)G(j а>) вместо переменной z(t) за эталонной переменной следит сумма переменных z(t) + vm(t). Очевидно, что передаточная функция от шума наблюдений де входной переменной объекта имеет вид ?i>Vm (s), B.165) + G(s)H(s)
206 Глава 2 откуда следует, что прирост установившегося среднего значения квадрата входной переменной, обусловленный шумом наблюде- наблюдений, равен Сисо (с шумом наблюдений)—Са да (без шума наблюдений) — B.166) 1 + G (/со) Я (jco) СО Это приводит к следующему правилу проектирования: чтобы прирост установившегося среднего значения квадрата входной переменной, обусловленный шумом наблюдений, был малым, выражение B.167) должно принимать малые значения в полосе частот шума наблю- наблюдений. Ясно, что это правило также противоречит принципу 2.5. Пример 2.11. Система управления положением с единственной об- обратной связью по положению Рассмотрим снова систему управления положением из приме- примера 2.4 (разд. 2.3) с предложенными иремя различными схемами управления (варианты I — III). В примерах 2.7 (разд. 2.5.2.) и 2.9 (разд. 2.6) был проанализирован вариант I и выбрано % — = 15 В/рад как наилучшее значение этого коэффициента. В при- примере 2.7 было найдено, что вариант II обеспечивает лучшие показатели качества благодаря добавочной обратной связи по уг- угловой скорости. Теперь, однако, предположим, что по некоторой причине (финансовой или технической) тахогенератор не может быть установлен. Тогда мы обращаемся к варианту III, в котором предпринимается попытка приблизиться к варианту II, исполь- используя приближенное дифференцирующее звено с постоянной време- времени Td. Если шум наблюдений отсутствует, можно выбрать Тd = = 0, и вариант III будет сведен к варианту II. Предположим, од- однако, что имеется шум наблюдений и он может быть представлен как экспоненциально коррелированный шум с постоянной време- времени Гт=0,02с B.168) и среднеквадратическим значением ст = 0,001 рад. B.169) Наличие шума наблюдений вынуждает выбрать Td>0. Что- Чтобы определить приемлемое значение Td, предположим сначала,
Анализ линейных систем управления 207 о), рад/с 1000 Рис. 2.28. Влияние величины Td на частотную характеристику системы управ- управления положением (вариант III). что Td оказывается достаточно малым, и поэтому коэффициенты р и X могут быть выбраны в соответствии с вариантом II. Тогда легко установить, насколько большим может быть выбрано Т(„ обеспечивающее достаточное подавление шума наблюдений без ухудшения качества варианта II. Нетрудно найти, что передаточная функция системы управле- управления варианта III имеет вид (?> + 1) Td *3 + (*Td + 1) s2 + (a + xXTd + -f Ь. B.170) Чтобы определить приемлемо малое значение Td, поступим следующим образом. Замкнутая система варианта II причислен- причисленных значениях параметров X и р, полученных в примере 2.7, имеет собственную частоту со0, близкую к значению 20 рад/с, а параметр демпфирования составляет ~0,707. Теперь, чтобы не замедлять движение системы, постоянная времени Тd устройства дифференцирования должна быть выбрана малой по отношению к обратной величине собственной частоты, т. е. малой по сравнению с 0,05 с. На рис. 2.28 представлены графики частотной характерис- характеристики, соответствующие выражению B.170), для различных зна- значений Тd. Видно, что при 7^=0,01 с частотная характеристика почти не изменяется от приближенной операции дифференциро- дифференцирования, а при 7^=0,1.0 наблюдается значительное отличие. Рассмотрим влияние шума наблюдений. Моделируя vm(t) обычным образом* из матрицы дисперсий расширенного состояния
208 Глава 2 можно вычислить добавочные части установившихся средних зна- значений квадратов ошибки слежения и входной переменной. Числен- Численные результаты графически изображены на риС. 2.29. Эти графики показывают, что для малых Тd установившееся среднее значение квадрата входной переменной в значительной степени увеличивает- 0.001Z Рис. 2.29. Графики функций от Тd, равных квадратным корням из составляю- составляющих в установившихся средних значениях квадратов ошибки слежения и входного напряжения, обусловленных шумом наблюдений (вариант III сис- системы управления положением). ся. Приемлемое значение Td, видимо, находится около 0,01 с. Для этого значения величина квадратного корня из прироста уста- установившегося среднего значения квадрата входной переменной сос- составляет только 2<В, величина квадратного корня из прироста уста- установившегося среднего значения квадрата ошибки слежения 0,0008 рад является очень малой и частотная характеристика меняется незначительно. 2.9. Влияние неопределенности параметров объекта в скалярном случае Довольно часто при проектировании системы управления воз- возникает ситуация, в которой разработчику точно не известны пара- параметры объекта. На практике может также оказаться, что непрерыв- непрерывное изменение параметров объекта и соответствующая настройка регулятора представляются весьма трудоемкими. Замкнутые регуляторы, как будет показано, могут быть спроек- спроектированы так, что, несмотря на существенное различие между дей- действительными параметрами объекта и номинальными значениями
Анализ линейных систем управления 209 {т. е. значениями параметров, принятыми при проектировании регулятора), качество системы ухудшается весьма незначительно. Далее исследуется прирост установившегося среднего значения квадрата ошибки слежения, обусловленной отклонениями пара- параметров. В данном разделе приняты следующие допущения. 1. Система управления является асимптотически устойчивой и имеет постоянные параметры. 2. Управляемая переменная является также наблюдаемой пе- переменной, т.е. С — D, поэтому K(s) =H(s). 3. Входная и управляемая переменные, а следовательно, и эталонная переменная являются скалярными, а весовые матрицы We и Wu равны 1. Обобщение на многомерный случай возможно, однако это прак- практически не дает дополнительной информации. 4. Исследуется влияние изменений параметров только на ка- качество слежения; характеристики подавления возмущений и шумов не рассматриваются. 5. Эталонная переменная имеет как постоянную часть г0, которая является стохастическим вектором с моментом второго порядка Ro, так и переменную часть, которая является стацио- стационарным в широком смысле стохастическим векторным процессом с нулевым средним и спектральной плотностью И,г(<л). Обозначим через H0(s) номинальную передаточную функцию объекта, а через H^s) действительную передаточную функцию. Аналогично обозначим через T0(s) — передаточную функцию сис- системы управления с номинальной передаточной функцией объекта, а через T^s) передаточную функцию с действительной передаточной функцией объекта. Предположим, что. передаточная функция G(s) в цепи обратной связи и передаточная функция P(s) в цепи эта- эталонной переменной (см. блок-схему рис. 2.14, разд. 2.5.1) точно известны и не подвергаются изменению. Используя B.63), получим выражения для номинальной пере- передаточной функции TO(S)= д°(*>р(*> B.171) oW 1 + G(S)#O(S) v ' и действительной передаточной функции = H1(s)P(s) B 172) 1W l + G^ff^s) Для действительной системы управления установившееся среднее значение квадрата ошибки слежения равно —аз 8—394
210 Глава 2 Найдем оценку прироста установившегося среднего значения квадрата ошибки слежения, обусловленного изменением переда- передаточной функции. Примем обозначение B.174) Подставляя 7\(s) =,T0(s) + AT(s) в B.173), получим + 2 [То @) -1] AT @) i?0 + 2 Re { j [Го (/ш) - -1] AT (- уев) Sr И df) + | АГ @) |» Ro + B-175) Теперь предположим, что номинальная система управления спроектирована хорошо, так что частотная характеристика T0(ja>) очень близка к 1 в полосе частот эталонной переменной. В данном случае можно пренебречь первыми четырьмя членами выражения B.175), поэтому приближенно имеем Се в ~ | АГ @) |2 Ra + f | AT (/'со) |2 2, И df. B.176) —со Эта аппроксимация предполагает, что для всех © в полосе частот эталонной переменной. Далее выразим AT(s) с помощью AH(s), где В результате получим B-177) = Я1(в)— #0(s). B.178) = fl" w *(s) = Si(s)AH(s)N0(s), B.179) где 5i(S)=——^7Г 'B.180)
Анализ линейных систем управления 211 есть функция чувствительности действительной системы управ- управления, а ?Ф B.181) — передаточная функция номинальной системы от эталонной пе- переменной г до входной переменной и. Теперь, используя аппрок- аппроксимацию в,(/в))~50(/а). B-182) где 50(s) = -—-4-777 B-183) 1 + Я о (s) G (s) есть функция чувствительности номинальной системы управления (которая известна), запишем выражение для установившегося среднего значения квадрата ошибки слежения Cem~(Sa@)\*\AH@)N0@)\*R0-M | So (/со) |2 | АЯ (/со) No (/со) |2 2, И d/. B.184) Сформулируем следующий принцип проектирования. Принцип проектирования 2.8. Рассмотрим асимптотически ус- устойчивую линейную замкнутую систему управления с постоянными параметрами и скалярной управляемой переменной, которая яв- является также наблюдаемой переменной. Тогда для уменьшения установившегося среднего значения квадрата ошибки слежения, обусловленной вариацией AH(s) в передаточной функции объекта H(s), необходимо, чтобы функция чувствительности системы уп- управления S0(i&) была малой в полосе частот характеристики \AH(j(u)N0(j<u)\2 2Г (<й). Если особую важность имеют постоянные ошибки, значение S0@) должно быть, сделано малым (предпочти- (предпочтительно нулевым) при значении AH(O)NO(O), отличном от нуля. Этот принцип надо понимать следующим образом. Обычно пе- передаточная функция объекта определяется из условия компромис- компромисса между средним значением квадрата ошибки слежения и средним значением квадрата входной переменной. Если выбрана T0(s), то передаточная .функция N0(s) от эталонной переменной до вход- входной переменной объекта является фиксированной. Заданные T0(s) ж N0(s) могут быть реализованы различными путями, напри- мер желаемую функцию T0(s) можно получить, если сначала выб- выбрать передаточную функцию G(s) в цепи обратной связи, а затем подстроить передаточную функцию P(s) в цепи эталонной пере- 8*
212 Глава 2 менной. Принцип проектирования 2.8 устанавливает, что эта реа- реализация должна быть выбрана так, чтобы функция 50(/т)= - г- B.185) 1 + Я(/«)С(Н v принимала малые значения в полосе частот функции \&H(ja>} ¦^o(/(B)l22r((o). Последняя функция известна, если имеются неко- некоторые сведения о &H(j®), a T0(j(o) была найдена. Заметим, нто для подавления влияния -возмущений в системе управления малые зна- значения функции чувствительности 50(/со) также являются необхо- необходимыми, что было установлено в разд. 2.7. Как было отмечено в разд. 2.7, функция S0@) может быть приведена к нулю путем интег- интегрирующего действия регулятора (задача 2.12.3). Завершим данный раздел интерпретацией функции SJs). Из B.171) и B.179) следует ^i?L = 5l(s)^?i?l B.186) Г, («) W Яо (s) Таким образом, функция 51(s) связывает относительное изме- изменение передаточной функции объекта H(s) с получающимся вслед- вследствие этого относительным изменением передаточной функции системы управления T(s). Если амплитуда изменений передаточ- передаточной функции объекта невелика, то можно считать S^ca) с^ ~ iS0(/to). Эта интерпретация функции S0(s) является классичес- классической и принадлежит Боде (см., например, [74]); S0(s) называется функцией чувствительности замкнутой системы, поскольку она дает информацию о чувствительности передаточной функции сис- системы управления к изменениям передаточной функции объекта. Пример 2.12. Влияние изменения параметров системы управления положением Проанализируем чувствительность к изменениям параметров в варианте I системы управления положением (пример 2.4, разд. 2.3). Функция чувствительности для этой системы опреде- определяется выражением Графики функции |?(/(о)| для различных значений коэффи- коэффициента % были приведены на рис. 2.26. Очевидно, что при % = = 15 В/рад (самое благоприятное значение коэффициента) подав- подавление влияния изменений параметров обеспечивается при значе- значениях до 3 рад/с. Для большей конкретности предположим, что изменения параметров вызываются изменениями момента инер- инерции /. Поскольку параметры объекта а и х определяются выра- выражениями (пример 2.4)
Анализ линейных систем управления 213 в ~7 к J B.188) нетрудно найти, что при малых изменениях Д/ параметра / мож- можно написать B.190) есть передаточная функция объекта. -Отметим следующее. 1. При нулевой частоте независимо от значения Д/ имеем Я@) B.191) Поскольку Г@) = 1, следовательно, ДГ@) = 0. Это означает, что независимо от инерционной нагрузки реакция системы на изме- изменение заданной точки всегда является правильной. 2. Из выражения B.189) видно, что функция со влияния изме- изменения момента инерции на передаточную функцию объекта возрас- 0,1 1 Рис. 2.30. Влияние изменений парамет- параметров на реакции системы управления положением (вариант I) при ступенчатом изменении эталонной переменной на 0,1 рад. 1 — номинальная инерционная нагрузка; 2 — инерционная нагрузка, равная 1,3 номиналь- номинальной; з — инерционная нагрузка, равная 0,7 номинальной. t,c тает до частоты срыва а = 4,6 рад/с и остается далее постоянной. Из поведения функции чувствительности следует, что при низких частотах (до 3 рад/с) влияние изменения момента инерции на пере- передаточную функцию системы невелико, причем с уменьшением частоты это влияние ослабляется. Чтобы иллюстрировать чувствительность системы управления, на рис. 2.30 показаны реакции замкнутой системы на ступенчатое изменение эталонной переменной для случаев -у- = 0; -0,3; +0,3. B.192)
214 Глава 2 С учетом того, что ступенчатому сигналу соответствует довольно большая полоса частот, система управления компенсирует изме- изменение параметров вполне удовлетворительно. 2.10*. Разомкнутая установившаяся эквивалентная схема управления Потенциальные преимущества управления по замкнутой схеме могут быть достаточно ясно освещены при сравнении замкнутых Разомкнутый. . регулятор Объе«т Рис. 2.31. Разомкнутый уста- установившийся эквивалент систе- системы управления. схем управления с их так называемыми разомкнутыми установив- установившимися эквивалентами. Ниже мы рассмотрим такие эквивалент- эквивалентные разомкнутые системы управления, при этом ограничимся слу- случаем постоянных параметров.' Рассмотрим замкнутую систему управления с постоянными па- параметрами и обозначим матричную передаточную функцию от эта- эталонной переменной г до входной переменной объекта и через N(s). Для такой системы всегда можно построить разомкнутую систему управления (рис. 2.31), которая имеет такую же матричную передаточную функцию AT(s) от эталонной переменной г до входной переменной объекта и. В результате передаточная функция как замкнутой системы, так и вновь построенной разомкнутой системы управления имеет вид T(s) = K(s)N(s), B.193) где K(s) — матричная передаточная функция объекта от входной переменной объекта и до управляемой переменной z. По причинам, которые будут объяснены ниже, назовем разомкнутую систему установившимся эквивалентом данной замкнутой системы. В боль- большинстве случаев оказывается, что разомкнутый установившийся эквивалент является худшим, чем замкнутая система управления Часто, однако, имеет смысл исследовать разомкнутый эквивалент данной системы, поскольку он описывает некоторые свойства, которые надо улучшить. Последовательно сравним замкнутые системы управления и их разомкнутые эквиваленты по следующим показателям качества систем управления: устойчивости, точ-
Анализ линейных систем управления 215 ностпи слежения в установившемся режиме, поведению в переходном режиме, влиянию возмущений, приложенных к объекту, влиянию шума наблюдений и чувствительности к изменениям объекта. Рассмотрим сначала устойчивость. Мы сразу же обнаружим, что характеристические числа эквивалентной разомкнутой систе- системы управления состоят из характеристических чисел объекта, на- наряду с характеристическими числами регулятора (ср. разд. 1.5.4). Это означает, между прочим, что неустойчивый объект не может быть стабилизирован разомкнутым регулятором. Поскольку устойчивость является основным принципом проектирования, не имеет смысла рассматривать разомкнутые эквиваленты, если объект не является асимптотически устойчивым. Предположим, что объект и разомкнутый эквивалент являются асимптотически устойчивыми. Рассмотрим характеристики точно- точности обеих систем управления в установившемся режиме. Поскольку передаточные функции и матричные-передаточные функции от эта- эталонной переменной до входной переменной объекта рассматривае- рассматриваемых систем соответственно равны, их установившиеся средние зна- значения квадратов ошибок слежения и установившиеся средние значения квадратов входных переменных также равны. Это обстоя- обстоятельство объясняет название «установившийся эквивалент». Оно также означает, что с точки зрения качества слежениянетнеобхо- слежениянетнеобходимости прибегать к управлению по замкнутому принципу. Перейдем к рассмотрению свойств переходного процесса. По- Поскольку среди характеристических чисел разомкнутой эквивалент- эквивалентной системы управления находятся неизмененные характеристи- характеристические числа объекта, очевидно, что улучшение свойств переходно- переходного процесса не может быть достигнуто посредством разомкнуто- разомкнутого управления, в противоположность управлению по замкнутому принципу. Под переходным процессом понимается реакция систе- системы управления на ненулевые начальные условия объекта. Затем рассмотрим влияние возмущений. Как и в разд. 2.7, пред- предположим, что возмущающая переменная может быть записана как сумма постоянной и переменной частей. Поскольку в многомерном случае составляющая управляющей переменной замкнутой сис- системы, обусловленная возмущением, представдяется в виде r1D(SI-A)^\p(s), B.194) составляющую среднего значения квадрата ошибки слежения замкнутой системы от возмущающей переменной можно записать следующим образом: Се ш (с возмущением) — Се ш (без возмущения) == = tr \sT @) Vo S @) W'e + J S (/со) 2„ о И ST(-ja) Wtdf. B.195)
216 Глава 2 где использованы результаты разд. 1.10.3. и 1.10:4, и S(s) = [I + H(s)G(s)]-\ ^)2орИ(-/©/-^Т)^Г. B-196) По аналогии со скалярным случаем S(s) называется матрицей чувствительности системы. Предполагается, что матрица А не- неособая. Рассмотрим теперь эквивалентную разомкнутую систему. Составляющая управляемой переменной от возмущения опреде- определяется в виде Z(s) = D(sI~Ar-\p(s). B.197) Полагая, что разомкнутая эквивалентная система управления асимптотически устойчива, можно найти, что прирост установив- установившегося среднего значения квадрата ошибки слежения, обусловлен- обусловленный возмущением, в разомкнутой системе может быть определен выражением Се га (с возмущением) —Се от (без возмущения) = Из B.198) видно, что прирост установившегося среднего зна- значения квадрата ошибки слежения не зависит от регулятора, и на него не оказывает влияния схема разомкнутой системы управле- управления. Ясно, что в разомкнутой системе подавление возмущений не- невозможно. Поскольку матрица спектральных плотностей 2„о(о)) может быть известна с недостаточной точностью, представляет опре- определенный интерес установить, существуют ли условия, кото- которые гарантируют, что в замкнутой системе управления возмуще- возмущения подавляются по сравнению с разомкнутым эквивалентом без- безотносительно к 2„0. Перепишем выражение B.195) для прироста среднего значения квадрата ошибки слежения замкнутой системы следующим образом: Се да (с возмущением) — Се от (без возмущения) = = trlsr @) We S @) Vo + j° ST (-/со) WeS (.до) 2re H dfi B.199) где S (s) — матрица чувствительности системы. Сравнение этого выражения с B.198) приводит к следующему утверждению.
Анализ линейных систем управления 217 Теорема 2.1. Рассмотрим асимптотически устойчивую замкнутую систему управления с постоянными параметрами, в которой управ- управляемая переменная является также наблюдаемой переменной и объ- объект является асимптотически устойчивым. Тогда прирост устано- установившегося среднего значения квадрата ошибки слежения, обуслов- обусловленный приложенным к объекту возмущением, по крайней мере меньше аналогичного значения установившегося разомкнутого эк- эквивалента безотносительно к свойствам возмущения в том и толь- только е том случае, если S (—j(i>)WeS(j(u)*?We для всех действительных со. B.200) Доказательство этой теоремы основано на том, что если заданы две неотрицательно определенные эрмитовы матрицы Mi и Мг, то из Mi >¦ М2 следует tr(MiN) > ti{MzN) и наоборот для любой неотрицательно определенной эрмитовой матрицы N. Условие B.200) особенно удобно для систем со скалярными входом и выходом, где S(s) — скалярная функция, так что B.200) сводится к неравенству | ?(/со)| ¦< 1 для всех действительных ©. B.201) Обычно это условие проще проверить с помощью функции воз- возвратной разности J (*) = -щ = 1 + Я(*) G (*). B.202) Учитывая это, выражение B.201) можно переписать в следую- следующем виде: [ /(/со) [ з> 1 для всех действительных со. B.203) Для многомерных систем часто также более удобно проверить справедливость выражения B.200) с помощью матрицы возвратной разности / (s) = S-1 (s)*=I + H (s) G (s). B.204) В связи с этим представляется полезным следующий рееультат. Теорема 2.2. Пусть J(s) = S^). Тогда эквивалентны три сле- следующих утверждения: а) Sr\~)(o)WeS{j<a)<We; б) JT(-jn)WeJVa)>Wt-t- B.205) . в) J(f&)W-1 JT{-jw) > W~l. Доказательство оставляем для упражнения.
218 Глава 2 Таким образом, видно, что разомкнутые системы хуже замкну- замкнутых с точки зрения подавления возмущений. Справедливости ради следует заметить, что в разомкнутых системах управления возму- возмущения, приложенные к объекту, не увеличивают среднего значе- значения квадрата входной переменной. > Следующим предметом рассмотрения является влияние шума наблюдений. Очевидно, в разомкнутых сиетемах управления шум наблюдений не воздействует ни на среднее значение квадрата вход- входной переменной, ни на среднее значение квадрата ошибки слеже- слежения, поскольку не имеется обратной связи, которая вводит шум наблюдений в систему. В этом отношении разомкнутый эквивалент превосходит замкнутую систему. В заключение рассмотрим чувствительность к изменениям объекта. Рассмотрим сначала скалярный случай и выразим сред- среднее значение квадрата ошибки слежения, обусловленной измене- изменениями в объекте, для разомкнутой системы управления. Посколь- Поскольку разомкнутая система имеет единичную функцию чувствитель- чувствительности, из выражения B.184) следует, что при допущениях разд. 2.9 среднее значение квадрата ошибки слежения, обусловленной изме- изменениями в объекте, определяется выражением Се т (разомкнутой системы) ~ | АН @) No @) |2 Ro + B.206) Полагая, что N0(s) определяется путем рассмотрения номиналь- номинальных средних значений квадратов ошибки слежения и входной пе- переменной, из этого выражения можно заключить, что на чувстви- чувствительность разомкнутой системы управления к изменениям пере- передаточной функции объекта не влияет схема системы управления. Очевидно, что защита от изменений в объекте не может быть обес- обеспечена посредством управления по разомкнутой схеме. Для замкнутых систем среднее значение квадрата ошибки сле- слежения, обусловленной изменениями объекта, определяется выра- выражением B.184) Се т (замкнутой системы) ~ | So @) |2 \АН @) iV0 @) |2 Ro + S0(ja>) р | АН (j<o) No (/©) р 2, И df. B.207) Сравнение B.206) и B.207) показывает, что замкнутая система всегда менее чувствительна к изменениям объекта, чем эквивалент- эквивалентная разомкнутая система, независимо от того, каков характер из-
Анализ линейных систем управления 219 менений и каковы свойства эталонной переменной, если функция чувствительности удовлетворяет неравенству | S0(Ja) | < 1 для всех со. B.208) Таким образом, видно, что условие, которое гарантирует, что замкнутая система менее чувствительна к возмущениям, чем разом- разомкнутая, также делает систему менее чувствительной к изменениям объекта. Для многомерного случая условие B.208) подавления возмуще- возмущений обобщается следующим образом: Sl(—j(o)We So (/со) < We для всех со; B.209) Таблица 2.2 Сравнение замкнутых и разомкнутых схем Характерное свойство, параметр Замкнутая система Разомкнутый установив- установившийся эквивалент Усто-йчиеость Установившиеся сред- средние значения КЕадра- та ошибки слежения и квадрата входной переменной, обуслов- обусловленные эталонной переменной Поведение в переход- переходном режиме Влияние Еозмущений Влияние дений шума наблю- Влияние изменений объекта управления Неустойчивый объект может быть стабили- стабилизирован Неустойчивый объект не может быть стаби- стабилизирован Идентичные характеристики, если объект _ асимптотически устойчив Возможно значительное улучшение реакции на начальное откло- отклонение Среднее значение квад- квадрата ошибки слеже- . вия может быть в зна- значительной степени уменьшено; среднее значение квадрата входной переменной возрастает Средние значения квад- квадрата ошибки слеже- слежения и входной пере- переменной возрастают Влияние на среднее зна- значение квадрата ошиб- ошибки слежения может быть в значительной степени уменьшено Невозможно улучшить реакцию системы на начальное отклонение - Полное влияние на сред- среднее значение квадрата ошибки слежения; на среднее значение квадрата входной пе- переменной действие не оказывается Не оказывает влияния на средние значения квадратов ошибки слежения и входной переменной Полное влияние на среднее значение квадрата ошибки сле- слежения
220 Глава 2 Условие B.209) гарантирует [41, 97], что прирост установив- установившегося среднего значения квадрата ошибки слежения* из-за (малых) изменений объекта в замкнутой системе никогда не превышает аналогичного значения для разомкнутого установившегося эквива- эквивалента независимо от характера изменений объекта и свойств эта- эталонной переменной. Завершим зтот раздел табл. 2.2, которая подытоживает сход- сходные и отличные показатели замкнутых схем управления и их ра- разомкнутых установившихся эквивалентов. 2.11. Заключение В данной главе описаны задачи управления и различные аспек- аспекты качества систем управления. Показано, что замкнутые схемы управления могут обладать очень хорошими свойствами. Разрабо- Разработаны различные правила, которые могут быть использованы при проектировании системы управления. Однако были рассмотрены лишь некоторые варианты схем ре- регуляторов. Эта задача более подробно рассматривается в следую- следующих главах. Будет сформулирована задача нахождения приемле- приемлемого компромисса между требованием малого среднего значения квадрата ошибки слежения без значительного увеличения сред- среднего значения квадрата входной переменной как задача математи- математической оптимизации. Эта задача оптимизации будет поставлена и решена по этапам в гл. 3—5. Ее решение позволяет точно опреде- определить приемлемые схемы управления. 2.12. Задачи 2.12.1. УПРАВЛЕНИЕ УГЛОВОЙ СКОРОСТЬЮ ДВИГАТЕЛЯ Рассмотрим двигатель постоянного тока, описываемый диффе- дифференциальным уравнением ?LBc(t) = m(t), ^ '¦ B.210) J+Bc(t) m(t), dt где c{t) — угловая скорость двигателя; m(t) — момент, прило- приложенный к валу двигателя; / — момент инерции; В — коэффи- коэффициент трения. Выберем выражение для m(t) в виде т (t) = ku (t), ¦ B.211) где u(t) — электрическое напряжение, подаваемое на двигатель, & к — коэффициент пропорциональности между моментом и нап-
Анализ линейных систем управления 221 ряжением. Подставляя B.211) в B.210), напишем дифференциаль- дифференциальное уравнение системы -^_ + ас (t) = ш (t). B.212) dt Используются следующие численные значения: 0=0,5 0-', х=150 рад/(В-еJ, / = 0,01 кг-м2. B.213) Предполагается, что угловая скорость является как наблюдае- наблюдаемой, так и управляемой переменной. Исследуем простую пропор- пропорциональную схему управления, в которой входное напряжение задается в виде м (*) = —-Хс (f) + рг (*). B-214) Здесь r(t) — эталонная переменная, а % ир — коэффициенты, которые следует определить. Задача состоит в проектировании сле- следящей системы. а) Определите значения коэффициента в обратной связи %, лри которых замкнутая система асимптотически устойчива. б) Для каждого значения коэффициента А определите такой ко- коэффициент р, при котором следящая система обеспечивает нуле- нулевую установившуюся ошибку при ступенчатом изменении эталон- эталонной переменной. Ниже коэффициент р всегда выбирается так, чтобы зто условие удовлетворялось. в) Предположим, что эталонная переменная представляет собой экспоненциально коррелированный шум со среднеквадратическим -значением 30 рад/с и частотой срыва 1 рад/с. Определите такой коэффициент в обратной связи, при котором среднеквадратическое значение входного напряжения, поступающего на двигатель пос- постоянного тока, равно 2 В. Какое среднеквадратическое значение ошибки слежения соответствует этому коэффициенту? Начертите логарифмические частотные характеристики системы управления при этом значении коэффициента. Каково значение 10%-ной частоты среза? Сравните его с 10%-ной частотой среза эталонной переменной и прокомментируйте сравнение величины среднеквадр этического значения ошибки слежения и среднеквадра- тического значения эталонной переменной. Каково 10%-ное время установления реакции системы на ступенчатое изменение эталон- эталонной переменной? г) Предположим, что к системе приложено возмущение в виде стохастически изменяющегося момента на валу двигателя постоян- постоянного тока, который может быть представлен как экспоненциально коррелированный шум со среднеквадратическим значением 0,1732 Н-м и частотой срыва 1 рад/с. Вычислите приросты установив- установившихся среднего значения квадрата ошибки слежения и среднего
222 Глава 2 значения входной переменной, обусловленные возмущением, для значений К ир, выбранных в п. (в). Влияет ли в значительной сте- степени возмущение на качество системы? д) Предположим, что измерение угловой скорости искажается аддитивным шумом измерений, который может быть представлен экспоненциально коррелированным шумом со среднеквадратичес- ким значением 0,1 рад/с и частотой срыва 100 рад/с. В какой мере влияет шум измерения на качество системы? е) Предположим, что двигатель постоянного тока обнаружива- обнаруживает изменение момента инерции / из-за вариации нагрузки. Рас- Рассмотрите отклонения от номинального значения момента инерции, равные 0,005 и 0,02 кГ-м2. Как эти крайние значения влияют на ре- реакцию системы при ступенчатом отклонении эталонной переменной, если коэффициенты К и р имеют значения, выбранные в п. (в)? 2.12.2. СХЕМА РАЗВЯЗАННОЙ СИСТЕМЫ УПРАВЛЕНИЯ СМЕСИТЕЛЬНЫМ БАКОМ Рассмотрим задачу управления смесительным баком, описан- описанную в примерах 2.2 (разд. 2.2.2) и 2.8 (разд. 2.5.3). Дифференци- Дифференциальное уравнение состояния объекта представляется в виде °'Oi ° )x(t) + ( 1 * )u(t), B.215) 0 — 0,02 j w \— 0,25 0,75/ К" \ ' а управляемая переменная равна °)(t)' B-216) а) Покажите, что объект может быть полностью развязан при выборе u(t) = Qu'(t), B.217) где Q — соответствующая^ матрица 2 X 2, a u'(t) — Цг'(О] — новая входная переменная объекта. б) Используя (а), постройте замкнутую систему управления, аналогичную построенной в примере 2.8, которая является пол- полностью развязанной, где Г@) = /, и каждое звено имеет 10%-ную частоту среза, равную 0,01 рад/с. 2.12.3. ИНТЕГРИРУЮЩЕЕ ДЕЙСТВИЕ РЕГУЛЯТОРА Рассмотрим объект с постоянными параметрами и скаляр- скалярными входной и выходной переменными, где управляемая пере- переменная является также наблюдаемой переменной, т. е. С —D,
Анализ линейных систем управления <# 223 а матрица А. неособая. Для подавления постоянных возмущений функция чувствительности 5(/со) должна быть сделана малой (предпочтительно нулевой) при со = 0. Функция S(s) определя- определяется выражением 5 (*) = 7X7777777' <2-218) 1 + Н (s) G (i) где H(s) — передаточная функция объекта, a G(s) — передаточ- передаточная функция регулятора (рис. 2.25). Предположим, что можно найти такую рациональную функцию Q(s), при которой регулятор с передаточной функцией G(s) = —Q(s) B.219) S делает замкнутую систему асимптотически устойчивой. Говорят, что такой регулятор обладает свойством интегрирования. Покажи- Покажите, что для этой системы управления 5@) = 0, при ненулевом значении H@)Q@). Следовательно, регуляторы с интегрирующим действием могут полностью подавить постоянные возмущения. 2.12.4*. ПОСТОЯННЫЕ ВОЗМУЩЕНИЯ В ОБЪЕКТЕ ПРИ ОСОБОЙ МАТРИЦЕ А Рассмотрим влияние постоянных возмущений в системе управ- управления при допущениях 1—5 из разд. 2.7, но в случае, если матрица А объекта особая, т. е. объект содержит интегратор. а) Покажите, что составляющая установившегося среднего зна- значения квадрата ошибки слежения от постоянной части возмущения может быть выражена в виде lim E {vTp0 (— si — АТУ1 DTS(—s)S (s) D (si — A)~l v^}. ¦ B.220) Будем различать два случая: (б) и (в). б) Допустим, что возмущения приложены к системе таким об- образом, что предел lim D (si — A)~lvp0 B.221) S-9-0 всегда конечен. Это означает, что постоянные возмущения всегда приводят к конечным постоянным эквивалентным ошибкам в уп- управляемой переменной, несмотря на интегрирующий характер объ- объекта. Покажите, что в этом случае 1) принцип проектирования 2.5 применяется без модификации; 2) S@) = 0 при условии, что предел lim sH(s)G(s) B.222)
224 Глава 2 является нулевым. Здесь H(s) — передаточная функция объекта, a G(s) — передаточная функция в цепи обратной связи (рис. 2.25). Эти результаты показывают, что в объекте с интегрированием, где пост.оянные возмущения всегда приводят к конечным постоян- постоянным эквивалентным ошибкам в управляемой переменной, постоян- постоянные возмущения подавляются полностью [при условии, что B.222) удовлетворяется; это приводит к тому, что ни передаточная функция объекта, ни передаточная функция регулятора не имеют нуля в начале координат.] в) Рассмотрим теперь случай, когда предел B.221) не является конечным. Предположим, что предел lira sk D (si—A) vp0 . B.223) s->0 конечен, где к — наименьшее положительное целое число, для которого это предположение справедливо. Покажите, что в этом случае для получения малой постоянной ошибки управляемой переменной предел lim -^L B.224) должен быть малым (предпочтительно нулевым). Покажите, что предел B.224) монщо привести к нулю, положив где Q{s) — такая рациональная функция от s, что Q@) ф- О, Q@) ф. оо, и где т0 — такое наименьшее целое среди т, что UmsmH(s) B.226) s-»0 является конечным.
ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ С ОБРАТНОЙ СВЯЗЬЮ 3.1. Введение В гл. 2 было проведено общее рассмотрение задач линейной тео- теории управления. В настоящей главе будут изложены основы тео- теории, которую можно использовать для решения этих задач. Ос- Основным ограничением в данной главе является предположение, что полное состояние x(t) объекта управления может быть точно измерено в любой момент времени и использовано для обратной связи. Хотя такое предположение для многих систем управления на практике является нереальным, оказывается, что теория, рас- рассматриваемая в настоящей главе, может служить основой для бо- более общего случая, когда состояние x(t) точно не известно. Основное внимание в этой главе уделяется задачам регулирова- регулирования, т. е. задачам, в которых основной целью является приведение системы в заданное состояние. Будет показано, что линейная тео- теория управления обеспечивает эффективное решение таких задач. Детально рассматриваются детерминированный и стохастичес- стохастический варианты задачи оптимального линейного управления. Зна- Значительное внимание уделяется дальнейшему развитию задачи ре- регулирования — регулятору при ненулевой заданной точке и задаче оптимального линейного слежения. Другие разделы главы посвящены численному решению урав- уравнения Риккати, асимптотическим свойствам оптимальных законов управления и чувствительности линейных оптимальных систем управления с обратной связью. 3.2. Улучшение динамических свойств линейных систем с помощью обратной связи 3,2,1. ЛИНЕЙНОЕ УПРАВЛЕНИЕ С ОБРАТНОЙ СВЯЗЬЮ В гл. 2 было показано, что важным аспектом в разработке сис- систем управления с обратной связью является устойчивость системы. Устойчивость системы должна быть обеспечена во всех случаях ее использования.Иногда основная задача обратной связи состоит в стабилизации неустойчивой системы или, если переходный про- процесс не затухает достаточно быстро, в улучшении ее динамических свойств. В данном разделе рассматриваются вопросы улучшения дина- динамических свойств линейных систем с помощью обратной связи.
226 . Глава 3 Рассмотрим линейную нестационарную систему, описываемую дифференциальным уравнением состояния .x(t) = A(t)x(t) + B(t)u(t). C.1) Если предположить, что полное состояние системы можно точ- точно измерить в любой момент времени, то можно реализовать ли- лилейный закон управления вида u(t) = —F{t)x(t) + u'(t), C.2) где F(t)— переменная матрица коэффициентов усиления обратной связи, a u'(t)—новая входная переменная. Если этот закон управле- управления используется в системе C.1), то замкнутая система управления описывается следующим дифференциальным уравнением состояния: х (t) = [A (t) — B(t)F (t)} z(t) + B (t) и' (t). C.3) Устойчивость этой системы зависит, конечно, от поведения матриц A(t) и B(t), а также от матрицы коэффициентов F(t). Здесь удобно ввести следующую терминологию. Определение 3.1. Линейный закон управления u(t) = —F(t) x(t) + u' (t) C.4) называется асимптотически устойчивым законом управления для системы x(t) = A(t)x(t) + B(t)u{t), C.5) если замкнутая система х (t) = [A (t) —B(t)F (t)] x(t)+B (t) и' (t) C.6) является асимптотически устойчивой. Если система C.5.) имеет постоянные параметры и матрица F вы- выбрана постоянной, то устойчивость закона управления C.4) опреде- определяется характеристическими числами матрицы А—BF. В следую- следующем разделе будет показано, что при нежестком ограничении (система должна быть полностью управляемой) все характеристи- характеристические числа для замкнутого контура могут быть произвольно размещены на комплексной плоскости путем соответствующего выбора матрицы F (конечно, при ограничении, что комплексные полюса образуют комплексно сопряженные пары). Если все по- полюса замкнутого контура находятся в левой полуплоскости, то система, очевидно, асимптотически устойчива. В следующем разделе будет-также показано, что в случае сис- систем с одним входом, т. е. систем со скалярной переменной и, обычно
Оптимальные линейные СУ с обратной связью 227 существует единственная матрица усиления F для заданной груп- группы полюсов замкнутого контура. В книге Мелса [127] приведена программа определения этой матрицы с помощью ЦВМ, записанная на языке ФОРТРАН. В слу- случае систем со многими входными переменными заданное распре- распределение полюсов обычно может достигаться при различных вы- выборах матрицы F. Пример 3.1. Стабилизация перевернутого маятника Дифференциальное уравнение состояния для системы управ- управления положением перевернутого маятника из примера 1.1 (разд. 1.2.3.) имеет вид *(*)¦ = 0 0 0 g L' 1 F ~ М ¦ 0 0 0 0 0 g и 0 0 1 0 x(t) + 0 1 М 0 0 C-7) Рассмотрим закон управления с постоянной настройкой V- (*) = ~ (<Pi. <Pi, Фз. Ф*) * (*)• " C.8) Из этого следует, что для системы C.7) и закона управления C.8) имеем A—BF- О «Pi м, О 1 М О _? J- О м О j_ и О м 1 о C.9) Характеристический полином этой матрицы равен Р + «Ра + <Р4 g М M U — s- M g C.10) Предположим, что все полюса замкнутой системы необходимо расположить в точке —а. Тогда характеристический полином зам- замкнутого контура записывается в виде (s.+ a)* = s* + 4as3 + 6a2s2 + 4a3s + а4. C.11)
228 Глава 3 - Приравнивая коэффициенты в выражениях C.10) и C.11), по- получим следующие уравнения относительно q>i, ф2, фз, ф^ м Л *- = 6а2, м и C.12) м и м и Используя численные значения из примера 1.1 и полагая чх = 3 с, находим из этих линейных уравнений следующий закон управления: 1ь(г) = —F5,65, 11,00,-72,60, —21,27)х(t). ' C.13) Пример 3.2. Смесительный бак Смесительный бак из примера 1.2 (разд. 1.2.3) является при- примером системы с многими входными переменными. При численных значениях, взятых из примера 1.2, линеаризованное уравнение состояния системы имеет вид x(t)+( l l )u(t). C.14) 0 -0,02 J w^V_0,25 0,75/ w v Рассмотрим закон управления с постоянной настройкой 1). C.15) Ф21 Ф28 Из C.14) и C.15) следует, что характеристический полином замкнутого контура определяется выражением det (si — А + BF) = s2 + s @,03 + Фи — 0,25 <р12 + Ф21 + 0.75 <р22) + + @,0002 + 0,02 фи — 0,0025 Ф12 + 0,02ф21 + 0,0075 сра2 + + ?ц Ф22 — Ф12 Ф21)• ' C-16) Легко установить, что этот характеристический полином зам- замкнутой системы можно получить при различных значениях коэф- коэффициентов усиления уц. Например, три следующие матрицы ко- коэффициентов усиления обратной связи: U 3,74 /0 0 Ч в/0,1 0 \ 0 0 Г \1,1 -1,2333/ с \0 0,1/ V '
Оптимальные линейные СУ с обратной связью 229 дают характеристический полином s2 + 0,2050s + 0,01295, так что характеристические числа замкнутой системы равны —0,1025± ± /0,04944. Отметим, что в законе управления, соответствующем первой матрице усиления, не используется вторая входная пере- переменная, во второй матрице не используется первая переменная, тогда как в третьем законе управления обе входные переменные управляют системой. На рис. 3.1 показаны реакции трех соответствующих замкнутых «истем на начальные условия Ь@) = 0м», .C.18) ?2@) = 0,1 кмоль/м3. Отметим, что, несмотря на одинаковые полюса этих замкнутых систем, наблюдаются значительные различия в их реакциях. 3.2.2*. УСЛОВИЯ РАЗМЕЩЕНИЯ ПОЛЮСОВ И СТАБИЛИЗАЦИЯ В данном разделе будет точно установлено: 1) при каких усло- условиях полюса замкнутой системы с постоянными параметрами могут быть произвольно размещены в некоторой области на комплекс- комплексной плоскости с помощью линейной обратной связи и 2) при каких условиях систему можно стабилизировать. Сначала получим сле- следующий результат. Теорема 3.1. Рассмотрим линейную систему с постоянными параметрами x(t) = Ax{t) + Bu (t) C.19) и законом управления с постоянной настройкой u(t) = —Fz(t)+u'(t). C.20) Для такой системы характеристические числа замкнутой сис- системы, т. ё. характеристические числа матрицы А — BF, могут быть произвольно размещены на комплексной плоскости (с тем ограничением, что комплексные характеристические числа образуют комплексно сопряженные пары) путем соответствующего вы- выбора матрицы F тогда и только тогда, когда система C.19) явля- является полностью управляемой. Полное доказательство этой теоремы дано в работах [37, 45, 72, 183]. В работе [180] рассмотрен нестационарный случай. Ограничимся доказательством для систем со скалярной входной переменной. Предположим, что система, описываемая дифференциальным уравнением состояния ' C.21)
0,5 _- 0.Z t,c 50 .0,5 0 -0,5 0 V- i t,c SO ? °>z Ы | 0 t,c SO Рис. 3.1. Реакция замкнутых систем регулирования смесительного бака на начальные условия ^@) = 0 м3, 5г@) = 0,1 кмоль/м8 для матриц усиления обратной связи. ~*а- 6~Fb' °~
Оптимальные линейные СУ с обратной связью 231 где \i(t) — скалярная входная переменная, является' полностью управляемой. Из разд. 1.9 известно, что существует преобразова- преобразование состояния x'(t) = T'lx(t) (где Т — неособая матрица преобразования), которое преобразует систему C.19) в канони- каноническую форму фазовой переменной x'(t)= О О 1 О о 1 о о — а 'п-1 ) х' (*) + О О О 1 C.22) Здесь лисла dt, i = 0, 1, ..., п — 1, —коэффициенты характе- характеристического полинома системы C.21), т. е. det (si — А) — sn + an_j s" -f ... + a4s -f a0. Запишем C.22) более компактно: x'(t) = A' х'ф + Ь'ру). Рассмотрим теперь линейный закон управления где /' — вектор-строка, /' = (Ф1. Ф2 ф„). C.23) C.24) C.25) Замкнутая система с этим законом управления описывается диф- дифференциальным уравнением состояния х' (t) = {А' — V /') х (t) + V |i/ (*). C.26) Легко показать, что матрица А' — b'f определяется выражением 0 1 0 0 0 0 1 0 . . .0 A'—b'f' = 0 — «о — <Pi 0 . C.27)
232 Глава 3 Из этого выражения следует, что характеристический полином матрицы А'—b'f имеет коэффициенты а( — фг+1, i = О, 1, ... ..., п—1. Так как срг-, ?=1, 2, ..., п, являются произвольно выб- выбранными вещественными числами, коэффициенты характерис- характеристического полинома замкнутого контура могут быть заданы в виде любых желаемых чисел. Это означает, что полюса замкнутого кон- контура можно произвольно размещать на комплексной плоскости (при условии, что комплексные полюса образуют комплексно со- сопряженные пары). Так как закон управления с обратной связью выбран в виде за- зависимости от преобразованных переменных состояния, его можно представить непосредственно через исходные переменные состоя- состояния x(t) в следующем виде: !х@ = -/'*'(*) + !*'(*) = -f'T-4{t) + р'у) = -/*(*) +1*'(*)< C-28) Тем самым доказывается, что если система C.19) полностью управляема, то характеристические числа замкнутого контура можно выбирать произвольно. Обратное доказательство следует из последней части доказательства теоремы 3.2. Доказательство для систем с многомерной входной переменной более сложно, по- поэтому опустим его. Как видно из примера 3.2, в этом случае обычно имеется много решений для матрицы коэффициентов усиления обратной связи F при заданных характеристических числах замкнутого контура. На основе теоремы 3.1 всегда можно полностью стабилизи- стабилизировать управляемую систему с помощью обратной связи или повы- повысить ее устойчивость, размещая полюса замкнутой системы в ле- левой половине комплексной плоскости. Эта теорема, однако, не дает указаний, каким образом следует распределять полюса зам- замкнутой системы в левой половине комплексной плоскости. Кроме того, имеется неопределенность в случае системы ео многомерной входной переменной, когда одна и та же схема распределения полюсов замкнутой системы может быть реализована с помощью различных законов управления. Эта неопределенность устраняет- устраняется методами линейной оптимальной теории регулирования, кото- рые*обсуждаются ниже в гл. 3. Из теоремы 3.1 следует, что всегда можно стабилизировать пол- полностью управляемую линейную систему. Предположим, однако, что имеем случай системы с постоянными параметрами, которая не является полностью управляемой. Из рассмотрения понятия ста- билизируемости в разд. 1.6.4 можно установить, что стабилизируе- мость, как следует из названия, точно характеризует условия, ко- которые позволяют стабилизировать неполностью управляемую сис- систему с постоянными параметрами при помощи линейного закона управления с постоянной настройкой [183].
Оптимальные линейные СУ с обратной связью 233 Теорема 3.2. Рассмотрим линейную систему с постоянными пара- параметрами х (t) = Ax (t) + Bu (t) C.29) и законом управления с постоянной настройкой и (t) = —Fx(t) + u' (t). C.30) Докажем, что можно найти такую постоянную матрицу F, при которой замкнутая система будет асимптотически устойчи- устойчивой тогда и только тогда, когда система C.29) стабилизируема. Доказательство этой теоремы очень простое. Из теоремы 1.26 (разд. 1.6.3) известно, что система может быть представлена в ка- канонической форме управляемости ГВ'Л u(t), C.31) где пара {А'и,В\}— полностью управляемая. Рассмотрим ли- иейный закон управления и (t) = - (F[ ,F'2)x' (t) + и' (t). C.32) Для замкнутой системы получим а' а'\ /в'. An-B\F\ A\2-B\F В' \u'(t). C.33) В этом выражении характеристические числа сложной матрицы являются характеристическими числами матриц А',, — В'j.F't и A'2Z. Тогда, если система C.29) стабилизируема, то матрица А'гг асимптотически устойчива, и так как пара {А'цВ\} полностью управляема, то всегда можно найти такую матрицу F'{, что матри- матрица А'ц— B'iF'i будет устойчивой. Тем самым доказывается, что если система C.29) стабилизируема, то всегда можно найти закон управления с обратной связью, который стабилизирует систему. И наоборот, если можно найти закон управления с обратной связью, который стабилизирует систему, то матрица А'гг должна быть асимптотически устойчивой, так как система стабилизируема. Это доказывает другое положение теоремы.
234 Глава 3 Из доказательства рассмотренной теоремы следует, что если система стабилизируема, но не полностью управляема, то только некоторые из полюсов замкнутой системы могут быть размещены произвольно, так как закон управления не изменяет характеристи- характеристических чисел матрицы А '22. Тем самым доказывается еще одно по- положение теоремы 3.1. 3.3. Задача детерминированного линейного оптимального управления 3.3.1. ВВЕДЕНИЕ f.. В разд. 3.2 было показано, что при определенном условии (пол- (полной управляемости) линейная система с постоянными параметра- параметрами всегда может быть стабилизирована с помощью закона управ- управления с обратной связью. Систему можно стабилизировать, поскольку полюса замкнутой системы могут быть произвольно рас- расположены на комплексной плоскости; кроме того, путем соответст- соответствующего выбора полюсов в левой половине комплексной плоскос- плоскости можно обеспечить как угодно .быструю сходимость к нулевому состоянию. Однако, чтобы повысить быстродействие системы, не- необходимо иметь входную переменную большой амплитуды. В любой . практической задаче амплитуда входной переменной должна быть ограничена, и это налагает ограничение на возможное перемеще- перемещение полюсов замкнутой системы в левой полуплоскости. Эти сооб- соображения приводят к постановке задачи оптимизации, в которой одновременно учитываются скорость перехода системы в нулевое состояние и величина амплитуды входной переменной. Чтобы поставить эту задачу оптимизации, отложим рассмотре- рассмотрение вопроса о размещении полюсов и обратимся к нему в разд. 3.8. Рассмотрим линейную систему с постоянными параметрами, описываемую дифференциальным уравнением состояния 'x(t) - A (t) х (t) +[B\(t) и (t), C.34) и исследуем задачу перевода этой системы из произвольного на- начального состояния в нулевое состояние с максимальной скоростью (в'разд. 3.7 будет рассмотрен случай, когда заданное состояние не является нулевым). Существует много критериев скорости пере- перехода системы из начального состояния в нулевое; весьма эффек- эффективным является квадратический интегральный критерий U ' ' xT(t)Ri(t)x(t)dt. ¦ C.35) I
Оптимальные линейные СУ с обратной связью . 235 Здесь R^t) — неотрицательно определенная симметрическая мат-, рица. Величина хт (?)Дх(?)а:(?) является мерой отклонения сос- состояния системы в момент t от нулевого состояния; весовая матрица Ri(t) определяет вес каждой из компонент состояния. Интеграл C.35) является критерием суммарного отклонения x(t) от нулевого состояния на интервале времени [t0, tj]. Как было показано в гл. 2, во многих задачах управления можно идентифицировать управляемую переменную z(t). В исполь- используемых линейных моделях обычно имеем z(t) = D{t)x(t). . C.36) Если в реальной задаче управляемая переменная z{t) обраща- обращается в нуль с максимально возможной скоростью, то критерий C.35) можно привести к виду и zT(t)Rs(t)z(t)dt, : C.37) где R3{t) — положительно определенная симметрическая весовая матрица. Легко показать, что C.37) эквивалентно C.35), так как с учетом C.36) можно написать zT{t)Rs(t)z(t)dt=^ xT{t)Rl(t)x(t)dt, C.38) и -и где Ri(t) = DT(t)Rs(t)D(t). C.39) При попытке найти оптимальное значение переменной на вхо- входе системы путем минимизации величины C.35) или C.37) обычно сталкиваются с трудностью, заключающейся в бесконечно боль- больших амплитудах входной переменной. Чтобы преодолеть эту труд- трудность, .учтем входную переменную в критерии и рассмотрим выра- выражение U zT (t) R3 (t) z (t) + uT (t) R2 (t) и (*)] dt, C.40) где R2(t) — положительно определенная симметрическая весовая матрица. Учет второго члена в критерии приводит к снижению амплитуды входной переменной, если попытаться, насколько это возможно, уменьшить общую величину выражения C.40). Вклад каждого из двух членов в критерии определяется матрицами R3 и Если необходимо обеспечить максимальную близость терминаль- терминального состояния x(tL) к .нулевому состоянию, то в отдельных слу-
236 Глава 3 чаях целесообразно дополнить критерий C.40) третьим членом J [ zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt + xT (*,) Ptx (fj, C.41) n где Рг — неотрицательно определенная симметрическая матрица. Теперь можно сформулировать задачу детерминированного линейного оптимального регулятора. Определение 3.2. Рассмотрим линейную систему с постоянными, параметрами x(t) = A(t)z(t)+B(t)u(t), C.42) где x(t0) = x0 C.43) с управляемой переменной z(t) = D{t)x(t). C.44) Рассмотрим также критерий zT (t) R3 (t) z (t) + uT (t) Rz (t) и (*)] dt + / (t,) PMh), C.45) где Рх — неотрицательно определенная симметрическая матрица^ a R3(t) и R2{t) — положительно определенные симметрические матрицы при t0 < t <g tv Тогда задача определения входной переменной и0 (t), 10 < t < tl7 при которой критерий минимален, называется задачей детерминированного линейного оп- оптимального регулятора. В этой главе, как и во всей книге, предполагается, что A(t) есть непрерывная функция t, a B(t), D(t), R3(t), R2{t) — кусочно-не- кусочно-непрерывные функции t, и все эти матричные функции ограничены. Задача синтеза регулятора с постоянной настройкой является специальным случаем. Определение 3.3. Если все матрицы в постановке задачи детер- детерминированного линейного оптимального регулятора постоянны^ то эту задачу будем называть детерминированной задачей линейного оптимального регулятора с постоян- постоянными параметрами. Продолжим в этом разделе дальнейшее обсуждение постановки задачи регулирования. Во-первых, учтем, что в этой задаче, как указывалось в определении 3.2, рассматривается только переход- переходный процесс, произвольное начальное состояние которого должно быть переведено в нулевое состояние. Постановка задачи не вклю- включает возмущений или эталонной переменной, которую необходимо
Оптимальные линейные СУ с обратной связью 237" отслеживать; эти более сложные случаи обсуждаются в разд. 3.6. Значительные трудности создает выбор весовых матриц R3r R2 и Рх в критерии C.45) ; их необходимо выбирать следующим, образом. Обычно можно определить интегральную квадратичес- квадратическую ошибку регулирования, интегральную квадратическую вход- входную переменную и взвешенную квадратическую терминальную- ошибку. Интегральная квадратическая ошибка регулирования описывается выражением jzr '{t)We{t)z{t)dt, C.46> to где We(t), *0 < t < tx,— весовая матрица, обеспечивающая соот- соответствующую размерность и физический смысл zT (t)We(t)z(t). Выбор таких весовых матриц рассматривался в гл. 2. Интеграль- Интегральная квадратическая входная переменная выражается в виде ^uT(t)Wu(t)u(t)dt, C.47> где вееовая матрица Wu(t), t0 < t < tu определяется аналогич- аналогичным образом. И наконец, взвешенная квадратическая терминаль- терминальная ошибка равна zT{QWtx{td, ' C.48) где Wt — соответствующая весовая матрица. Теперь будут рас- рассмотрены следующие задачи. 1. Минимизация интегральной квадратической ошибки регули- регулирования при ограничении максимальной величины интегральной квадратичеекой входной переменной и взвешенной квадратичес- квадратической терминальной ошибки. 2. Минимизация взвешенной квадратической терминальной ошибки при ограничении максимальной величины интегральной квадратической входной переменной и интегральной квадрати- квадратической ошибки регулирования. 3. Минимизация интегральной квадратической входной пере- переменной при ограничении максимальной величины интегральной квадратической ошибки регулирования и взвешенной квадрати- квадратической терминальной ошибки. Все эти задачи можно исследовать, минимизируя критерий Pl j zT (t) We (t) z (t) dt + p2 j uT (t) Wu (t) и (t) dt + <o to + p3xT(ti)Wtx(ti), C.49) где константы p lt p 2 и р 3 выбираются соответствующим образом*
238 Глава 3 II tl If I Интегральная квадратическая величина входного воздействия Рис. 3.2. Изменение интегральной квадратическоц ошибки регулирования в зависимости от интегральной квадратической величины входного воздействия При Q1 = 1 И Q2 = G. Выражение C.45) имеет точно такой же вид. Рассмотрим,например, весьма важный случай, когда терминальная ошибка несуществен- несущественна и необходимо минимизировать интегральную ошибку регули- регулирования при интегральной квадратической входной переменной, которая не превышает определенной величины. Поскольку терми- терминальная ошибка не учитывается, примем р3 = 0. Так как миними- минимизируется интегральная квадратическая ошибка регулирования,- примем р1 =1. Рассмотрим, таким образом, минимизацию вели- величины J* [ zT (t) We (t) z (t) + p2 uT (t) Wu (t) и («)] dt, C.50) Скаляр р2 теперь играет роль множителя Лагранжа. Чтобы -определить соответствующую величину р2, решим задачу при раз- различных значениях р2. В результате получим график, приведенный на рис. 3.2, где результирующая интегральная квадратическая ошибка представлена в виде зависимости от интегральной квадра- квадратической входной переменной с р2 в качестве параметра. При умень- уменьшении р3 результирующая интегральная квадратическая ошибка убывает, а интегральная квадратическая входная переменная воз- возрастает. Из этого графика можно определить величину р 2, при ко- которой ошибка регулирования достаточно мала, а значения входной переменной не очень велики. С помощью этого же графика можно решить задачу минимиза- минимизации интегральной квадратической входной переменной при ограни- ограниченной величине интегральной квадратической ошибки регулиро-
Оптимальные линейные СУ с обратной связью 239 вания. Другие варианты задачи можно решить аналогичным об- образом. Видно, что задача регулирования, сформулированная в определении 3.2, является весьма многосторонней и может быть видоизменена для различных целей. В следующих разделах будет показано, что решение задачи регулирования может быть дано в форме линейного закона управ- управления, который имеет несколько полезных свойств. Это делает задачу исследования интересной и практически целесообразной. Пример 3.3. Задача стабилизации .угловой скорости В качестве первого примера рассмотрим задачу стабилизации; угловой скорости. Объект состоит из двигателя постоянного такаг управляемого входным напряжением |х(?), с угловой скоростью вала g (г). 'Система описывается скалярным дифференциальным уравнением состояния = —а?(«)+*!*('). C.51) где а и х — известные константы. Рассмотрим задачу стабилизации угловой скорости вращения ?(?) относительно заданной величины соо. При постановке общей задачи управления начало координат пространства состояний вы- выбиралось в равновесной точке. Так как в рассматриваемой за- задаче заданное равновесное положение равно \(t) = co0, сдвинем начало координат. Пусть ц0 является постоянным входным напря- напряжением, которому соответствует величина угловой скорости (о0 в установившемся состоянии. Тогда |х0 и <ю0 связаны соотношением 0=-скоо + х(х0. . C.52> Введем теперь новую переменную состояния 5'0 = 5(«)-«о- C-53> Тогда из C.51) с учетом C.52) следует, что ?'(?) удовлетворяет дифференциальному уравнению состояния Г(*) = -оГ(*)+х,*'(*), C-.54) где !*'(*) = !*(*)-ft,- C.55) Это показывает, что задача перевода системы C.51) из произ- произвольного начального состояния ? (t0) — % в состояние | = <в0 эквивалентно переводу системы C.51) из начального состояния g(?0) = ш1 — соо в равновесное состояние ? = 0. Таким обра- лом, без нарушения общности рассмотрим задачу управления сис- системой C.51) относительно нулевого состояния. Управляемой пере- переменной С в этой задаче, очевидно, является состояние | С (*) = !(«)• \ C.56)
240 Глава 3 Выберем в качестве критерия оптимальности выражение 'iS'Ci) C-57) при р > 0, jtx >¦ 0. Этот критерий гарантирует, что отклонения ;? (?) относительно нуля ограничены [т. е. | (t) близко к соо], что \i(t) не слишком велико l\a{t) не отклоняется сильно от значения ц0] и что терминальное состояние | (?х) близко к нулю [| (^) близко к w0]. Величины рил, должны быть определены методом проб и ошибок. Используем следующие значения а и *: а = 0,5 с, C.58) у. = 150 рад/(В-с2), Пример 3.4. Управление положением В примере 2.4 (разд. 2.3) была рассмотрена задача управления положением двигателя постоянного тока. Система описывается дифференциальным уравнением состояния x{t)=(°o -1)х{*) + [1)^-. ' C'59) где компонентами x(t) являются угловое положение | $) и угловая скорость ? 2{t), а входная переменная \i{t) представляет собой нап- напряжение на входе усилителя постоянного тока, который управля- управляет двигателем. Предположим, что необходимо обеспечить постоян- постоянное положение ?10. Как и в предыдущем примере, сдвинем начало координат пространства состояний, чтобы получить обычную за- задачу регулирования. Введем новую переменную состояния x'(t) с компонентами C.60) Простая подстановка показывает, что x'(t) удовлетворяет диф- дифференциальному уравнению состояния ^!) C-6l) Отметим, что в отличие от предыдущего примера не требуется определять новую входную переменную. Это следует из того фак- факта, что можно обеспечить любое постоянное угловое положение при нулевой входной переменной. Так как система C.61) идентична
Оптимальные линейные СУ с обратной свя&ью 2А1 C.59), опустим штрихи и рассмотрим задачу управления системой C.59) относительно нулевого состояния. Для управляемой переменной выберем угловое положепие C(*)=?i@ = .(l, O)x(t). C.62) Соответствующий критерий оптимальности имеет вид V(*) + pp2(OH*- C.63) Положительный скалярный коэффициент р определяет отно- относительный вес каждого члена в подынтегральном выражепии. При этом используются следующие значения а и ¦*.: а = 4,6 с, C.64) у. =0,787 рад/(В-с2). 3.3.2. РЕШЕНИЕ ЗАДАЧИ РЕГУЛИРОВАНИЯ Решим задачу построения детерминированного оптимального регуляторд с помощью обычных методов вариационного исчисле- исчисления. Для этого целесообразно переписать критерий C.45) в форме l' [хт (t) Rl (t) x (t) + uT (t) R2 (t) и (t)] dt + xT (tJPlX(td, C.65) где R^t) — неотрицательно определенная симметрическая матрица Rl(t) = Dr(t)R3(t)D(t). C.66) Предположим, что существует входная переменная, которая минимизирует критерий. Обозначим эту переменную через и0 (t), tn < t < tx. Рассмотрим теперь входную переменную u(t) = u°(t) + sZ(t), to<.t<tu C.67) где u(t) — произвольная функция времени, а е — произвольное число. Выясним, каким образом изменение входной переменной нлияет на критерий C.65). Вследствие изменения входной перемен- переменной будет изменяться состояние, например от х° (t) (оптимальное поведение) до x(t)=x°(t) + zlc(t), to<t<tt. C.68) Определим x(t). Решение уравнения C.68) относительно x(t) должно удовлетворять дифференциальному уравнению состояния Ч 394
242 Глава 3 C.42), в котором u(t) выбирается в соответствии с выражением C.67). В результате получим х° (t) + в x(t) = A (t) х° (t) + s A (t) x(t) + + В (t) u° (t) + tB (t) Z (t). C.69) Поскольку оптимальное решепие также должно удовлетворять дифференциальному уравнению состояния, имеем ifl(t) = A(t)x°{t)-\-B{t)u^(t). C.70) Подстановка C.69) и C.70) и исключение е дает x(t) = A(t)x(t) + B(t)u(t). C.71) Поскольку начальное состояние не изменяется, если входная переменная изменяется в диапазоне от u°(t) до u°(t) -|- eu(t), io< <:?<:?!, то имеем x(t0) = 0, и решение C.71) с использованием A.61) можно записать в виде x(t)= \ <b(t,x)B(x)u(-z)dx, C.72) и где Ф(?, t0) — переходная матрица системы C.71). Отметим, что x(t) не зависит от е. Теперь рассмотрим критерий C.65). С уче- учетом C.67) и C.68) можно записать и j [xT (t) Д, (t) x{t) + uT (t) R2 (t) и (t)] dt + xT (*,) P, x (*,) = и = j' [xOT(t) Д, (t) x» (t) + u0T (t) R2 (t) u° (t)] dt + x0T (t,) Pi x^ (t{) + и (f, ^ ^ \ + 2e J Г [~xT (t) Д, (t) x° (t) + ZT(t) R2 (t) u° (t)\ dt + хт Ц{)РХ x^tM + j' [ZT(t) Rt (t)Z(t) + ZT(t) R2 (t) u(t) ] dt -y .to + ~xT(ti)Plx(ti)}. C.73) Так как u°(t) — оптимальная входная переменная, вследствие изменения входной переменной в диапазоне от u°(t) до значения C.67) величина критерия может только возрасти. При этом пред-
Оптимальные линейные СУ с обратной связью 243 полагается, что выражение C.73) как функция е должно иметь минимум при е — 0. Поскольку C.73) является квадратическим выражением относительно е, минимум при 8=0 может сущест- новать только в том случае, если первая производная по е равна нулю при е = 0. Тогда получим +H:T(tl)P1xo(ti)=0 C.74) Подстановка C.72) в C.74) после изменения порядка интегри- интегрирования и переменных дает f" ZT (t) I Вт (t) ( Фт (г, t) Д, (т) х° (,) dz + R2 (t) u° (t) + 4- Вт (t) Фт (tt, t) P, x° (tj} dt = 0. C.75) Введем обозначение р (t) = ( Фт (-, t) Rl (х) хп (т) dz + Фт (tir t) P, x° (tt). C.76) t С учетом этого обозначения интеграл C.75) можно записать в более компактном виде ti f uT (t)[BT (t) p{t) + R2(t)u* (t)) dt~O. C.77) и Ото соотношение справедливо для всех u(t), ?0«: t <. tlt если r Ra(t)u°(t) = O, to<t<.ti. C.78) Предполагая, что R2(t) является несингулярной матрицей при Ai < t < tu можно написать u°(t)= ~R-l(t)BT(t)p(t), to<ct<tv C.79) Если функция p(t) известна, то это соотношение позволяет оп- определить оптимальную входную переменную в момент t. Преобразуем соотношение C.76) для p(t) в дифференциальное уравнение. При подстановке t = tL видно, что . C.80) Дифференцируя C.76) по t, получим p(t) = - Д, @ х° (t) - Ат (t) p (t), C.81)
244 Глава 3 где использовано соотношение из теоремы 1.2,г (разд. 1.3.1): -~ФТ{Ч, t) = -AT(t)<bT(t0, t). C.82) Теперь можно составить уравнения в вариациях. Подстановка C.79) в дифференциальное уравнение состояния дает x\f) = A (t) z° (t) - В (t) В-1 (t) BT (t) p (t). C.83) Совместно с C.81) это уравнение образует систему 2п линейных дифференциальных уравнений для п компонент x°(t) и п компонент p(t). Назовем p{t) сопряженной переменной. Тогда 2п граничны- граничными условиями для дифференциальных уравнений являются 3?(to) = xo C.84) PlX°(tJ. C.85) Видно, что граничные условия удовлетворяются на противо- противоположных концах интервала Uo, tt\. Это означает, что задача явля- является двухточечной краевой. Чтобы решить эту задачу, запишем совместно дифференциальные уравнения C.83) и C.81) в форме *®\(А® -вюн;ЧГм\/*у\ {ЗЩ p(t) ] \~RUt) -Af{t) j\p(t) ) Рассмотрим это дифференциальное уравнение состояния линей- линейной системы размерности 2п с переходной матрицей 8 (t. t0). Пред- Представим эту переходную матрицу, соответствующую выражению C.86), в виде / ц if f \ н (t t \ \ I . (о.Ы) При таком разбиении можно выразить состояние в промежуточ- промежуточный момент времени t через переменную состояния и сопряжен- сопряженную переменную в конечный момент времени t± следующим обра- образом: х° (t) = 6И (t, t{) Xй (td + 612 (t, tt) p (tj. C.88) С учетом конечного условия C.85) имеем Аналогично можно написать для сопряженной переменной = [б21 {t, td + 622 (*, h) P\] *° (*i)- Ф-Щ
Оптимальные линейные СУ с обратной связью 245 Исключая 2й (<j) из C.89) и C.90), получим (*, *0 + б!2 (*, *l) ЛГ* *° @- C-91) Выражение C.91) показывает, что существует следующее линейное соотношение между p(t) и z°(t): = P(t)a*(t), C.92) где р (t) = [вг1 (*, *о + е22 (^, g р,] [9И G, f,) + е12 (г, ^ р,г. C.93) Используя C.79), получим выражение для оптимальной вход- входной переменной u°(t) = —F(t)a»(t), C.94) где F(t) = R~x (t)BT(t)P(t). C.95) Последнее выражение являете»/ решением задачи синтеза ре- регулятора, которое получается в предположении, что оптимальное решение существует. Подытожим полученные результаты сле- следующим образом. Теорема 3.3. Рассмотрим задачу построения детерминирован- детерминированного линейного оптимального регулятора. Тогда оптимальную входную переменную можно задать с помощью линейного закона ¦°(t), C.96) где F(t) = R2l (t)BT (t) P (t). C.97) Матрица P(t) определяется выражением P{t) = [S21 (t, t±) + 622 (t, t{) P,\ [6И (t, t,) + Bl2 (t,t{) ЛГ1, C-98) где бп(г, t0), B12(t, t0), 6a](i. t0) и 6„,(г, ta) получаются путем разбие- разбиения переходной матрицы B(t, i0) дифференциального уравнения состояния <t)\ (A(t) —B(t)B~l (t)BT (t)\fj(t)\ \p(t)J \-RAt) ~AT{t) J\p(t)J где Rl(t) = DT(t)R3(t) D(t). C.100) Эта теорема дает решение задачи в форме линейного закона. Закон управления автоматически задает оптимальную входную переменную для любого начального состояния. Интерпретация с
246 Глава 3 Матрица усиления обратной связи F(t) Рис. 3.3. Блок-схема оптимального линейного регулятора с обратной связью. помощью блок-схемы дана на рис. 3.3, где наглядно показан зам- замкнутый характер решения. Постановка задачи регулирования, данная в определении 3.2, конечно, не обязательно предполагает замкнутую форму решения. Можно также, как и раньше, получить разомкнутое решение. Выражение C.89) в момент t0 сводится к виду Ч = [9ц Co. h) + 91а (*0, *0 РА *° (*,). C.101) и подставляя результат в Разрешая C.101) относительно х° (З.УО), получим. = [еа,(*, f,) + 922(f, *,) Р{] [Qn(t0, t,) + Qit(t0, На основе C.79) имеем x0. C.102) u° (t) = - R-1 (t) BT (t) [921 (t, *,) + 922 (t, t,) P41 [0И (t0, tt) + Qi2(to,tl)Pi]-1xo, to*ct<tv C.103) Это соотношение описывает программное изменение входной переменной для данного х0. Соответствующее изменение состояния определяется при подстановке х(гг), полученпого из C.101), в C.89): х° @ = [0и(*, tt) + Qi2(t, t,) Р,\ [dn(t0, t,) + Qlt(t0, tj Pt]-i x0, C.104)' С учетом преимуществ замкнутого управления, рассмотренных в гл. 2, для практической реализации, конечно, предпочтительнее замкнутая форма решения C.96) в отличие от разомкнутой формы C.103). В разд. 3.6, в котором рассматривается задача построе- построения стохастического регулятора, показано, что обратная связь по состоянию является не только предпочтительной, но и просто необходимой.
Оптимальные линейные СУ с обратной связью 247 Пример 3.5. Стабилизация угловой скорости Задача стабилизации угловой скорости из примера 3.3 (разд. 3.3.1) является наиболее простым нетривиальным применением теории, рассмотренной в этом разделе. Совместные уравнения C.99) для переменных состояния и сопряженных переменных теперь име- имеют вид ) = ( ~° "~\1Ш ]. C.105) %(t)J \-l а JU(t)J Для этой системы дифференциальных уравнений можно опреде- определить переходную матрицу / / \ где Л) = л_7 (*—<„) ч? 2PY ¦«_<„) 1 7 + а 1 27 + _ ~ ( C.106) т==]/а2+. —. C.107) Чтобы упростить обозначения, представим переходную матри- матрицу в виде C.108) Из C.103) и C.104) следует, что в разомкнутой форме оптималь- оптимальная входная переменная и состояние определяются соотношениями ^0 (А = 211 , 1 ^ 22 , у 1 |о) C Р 1 ('0> 'l) + 2 ('0> *l) л1 /A= Па рис. 3.4 показаны оптимальные траектории и изменение оптимальной входной переменной для различных значений весо- весомого коэффициента р. При этом использовались следующие зна- значения а, х, t0 и tr: 0 = 0,5 0-!, х= 150 рад/(В-с2), C.111) ?0 = 0 с, tt = 1 с.
248 Глава 3 Рис. 3.4. Поведение переменной состояния и входного воздействия в аадаче отслеживания угловой скорости при различных значениях q (ni = 0).' В данном случае весовой коэффициент я i полагался равным ну- нулю. Из рисунка наглядно видно, что при уменьшении р амплиту- амплитуда входной переменной возрастает, тогда как продолжительность переходного процесса уменьшается. .На рис. 3.5 показано влияние весового коэффициента ni при постоянном коэффициенте р. Видно, что с увеличением л i конечное состояние стремится приблизиться к нулевому состоянию за счет
Оптимальные линейные СУ с обратной связью 2А9 -0,2 А-о,з Рис. 3.5. Поведение переменной состояния и входного воздействия в задаче стабилизации угловой скорости при различных значениях лх(р = 1000). несколько большей амплитуды входной переменной в конце ин- интервала. Предположим теперь, что отклонения начального состояния не превышают ±100 рад/с, а амплитуда входной переменной огра- ограничена величиной ±3 В. Тогда на рис. 3.4 и 3.5 следует, что рацио- рациональная величина р составляет около 1000. Величина л l оказывает влияние практически лишь в конце иптервала времени [t0, tj]. Рассмотрим теперь решение в форме обратной связи. Из теоре- теоремы 3.3 следует, что оптимальные траектории рис. 3.4, 3.5- можно получить с помощью закона управления . v4t) = -F(t)t(t), C.112) где переменный скалярный коэффициент F(t) определяется выра- выражением . h) *i C.113) На рис. 3.6 показано изменение коэффициента F{t), соответст-
250 Глава 3 B(padlc) 0,05 - p = 100, X-,=0 - p no ooo, x^o pHOOO ___ г It, X -0,5/\ —-J 0 0,5 ^ c 1 Рис. З.6. Поведение оптимального коэффициента усиления обратной связи в задаче1 стабилизации угловой скорости при различных значениях р и щ. вующее различным численным значениям, используемым на рис. 3.4 и 'Л.Г). Из рис. 3.6 видно, что в большинстве случаев коэффициент усиления F(t) является постоянным почти на всем интервале [t0, tj]. Однако в конце интервала наблюдаются изменения. Видно также, что при величине „-ц = 0,19 коэффициент усиления постоянен почти на всем интервале. Такая величина коэффициента усиления весьма целесообразна с практической точки зрения, так как реа- реализация переменного коэффициента сложна. Сравнение графиков прид! = 0,19 на рис. 3.5 с другими кривыми показывает, что ко- коэффициент F можно считать практически постоянным, если не учи- учитывать конечного состояния. 3.3.3. ВЫВОД УРАВНЕНИЯ РИККАТИ Рассмотрим несколько дополнительных вопросов, связанных с матрицей P(t), определяемой выражением C.98). В дальнейшем анализе матрица P(t) играет важную роль. Для нее можно полу- получить дифференциальное уравнение. С этой целью продифференци- продифференцируем матрицу P(t) no t. Используя правило дифференцирования обратной .матрицы M(t), зависящей от времени: _2_ м-1 (t) = — М'1 (t) M (t) М-1 (t), dt C.114)
Оптимальные линейные СУ с обратной связью 251 которое может быть доказано путем дифференцирования единичной матрицы М(t) М'1^) — /, получим р @ •= [021 (t, h) + 022 (t, t,) p,i [ви (t, t,) + el2 (t, tj p±t1 — - [92i (*, *i) + e22 (t, tt) pt\ [0lt (t, *,) - г е12 (*, f j) pj-i [ 0H (t, t,) + + ё12(г, t^p^d^t, tt) + ol2(t, tjpj-1, (З.И5) где точка обозначает дифференцирование по t. Так как d(t, t0) яв- является переходной матрицей для C.99), имеем еи (t, t{) = a (t) еи (t, ti) — в (t) r~* (t) вт (t) o21 (^, tj, '•' C.116) i, tt)~B(t) R~[ (t) BT{t) 021 (*. «l) = - «i («) 011 (*, *.) - AT (t) 021 (*, *i). e22 (*, t,) = - д4 (*) e12 (*, *,) - лг (t) eJ2 (*, ^). Подставляя эти выражения в C.115), получим после перегруп- перегруппировки следующее дифференциальное уравнение: - P{t) = Bt (t) -P{t) В (t) R-* (t) BT (t)P(t) + + P(t)A(t) + AT(t)P(t). C.117) Граничное условие для этого дифференциального уравнения определяется путем подстановки t ~ tk в C.98). Отсюда следует P(ti) = Pi. C.118) Матричное дифференциальное уравнение, полученное таким образом, подобно хорошо известному уравнению -%- + a(z)y + $(x)y* = y(x), C.119) dx где х — независимая", у — зависимая переменные, a ol{x), f>(x) и у (х) — известные функции х. Это уравнение называется урав- уравнением Риккати [44]. По аналогии будем называть уравнение C.117) матричным уравнением Риккати [86]. Отметим, что, поскольку матрица Ри являющаяся конечным условием для P(t), симметрична и матричное дифференциальное уравнение для P(t) также симметрично, решение для P(t) должно быть симметричным для всех t0 < t < tv Эта симметрия будет часто использоваться, особенно при вычислении Р. Дадим интерпретацию матрицы P(t). Оптимальная замкнутая
252 Глава 3 система описывается дифференциальным уравнением состояния z(t) = \A(t)-B(t)F(t)\r(t). A.120) Рассмотрим в связи с этим критерий оптимальности C.65), вы- числяемый-на интервале [t, .?j. Напишем ( [хт (?) Я, (х) х (х) + ит (т) R2 {z) и (хI dx + / (^ Р, х (t{) = f = f x^^lfliW+F^^R^^F^lar^^ + x7"^,)^^!) C-121) так как u(v)=-F(x)x(d. C.122) На основе результатов разд. 1.11.5 (теорема 1.54) выражение C.121) можно записать в виде хт (t)P(t)x(t), C.123) где P(t) — решение матричного дифференциального уравнения - Р (t) = Я, @ + FT (t) R2 (t) F(t) + P (t) [A (t) -B(t)F (*)] + + [A(t)~B(t)F(t)]TP(t) . с C.124) P(h) = Pi. Подставляя F(t) = R-l(t)BT{t)P(t) в C.124), получим — ?(*) = Я, (*) + P (*) В (t) i?-1 («) ВГ (t) P («) + P (t) A (t) - -P(t)B(t)R-1 (t) BT (t) P (t) + AT(t)P (t) - ~P{f)B(t)R~l {t)BT(t)P(t). C.125) •Можно утверждать, что решение этого матричного дифферен- дифференциального уравнения в точности равно P(t): P(t) = P(t). C.126) Это легко показать, так как при подстановке P(t) в выражение для P(t) дифференциальное уравнение C.125) сводится к виду — />(*) = Я, (*) —P(t)B (t) R~' (t) BT (t) P (t) + + P(t)A(t) + AT(t)P(t). C.127)
Оптимальные линейные СУ с обратной связью ¦ 253 Это уравнение является матричным уравнением Риккати C.117), которое удовлетворяется подстановкой P(t); кроме того, конечпое условие корректно. Этот вывод также показывает, что матрица P{t) должна быть неотрицательно определенной, так как выраже- выражение C.121) является неотрицательным, поскольку матрицы Rx, R2 и Р{ — неотрицательно определенные. Сформулируем выводы в следующем виде. Теорема 3.4. Оптимальная входная переменная в детерминиро- детерминированном оптимальном линейном регуляторе задается линейным ¦законом управления uo{t) = —Fo{t)x°(t), C.128) где F*{t) = R~x {t)BT {t)P(t). C.129) Тогда существует симметрическая неотрицательно определен- определенная матрица P(t),> удовлетворяющая матричному уравнению Риккати -P{t) = Я, (*) -P(t)B (t) R-* (t) BT (t) P (t) + + P(t)A(t)+AT(t)P(t) C.130) с конечным условием ¦ Р(*,) = Л. C.131) и где Ri(t) = DT(t)Ra(t)D{t). Для оптимального решения имеем соотношение h j [х0Т (х) Я, (г) х° (х) + иОТ (z) Яа (т) и° (т)] ch + + хот {td Р^з* fr) = хот (t) P {t) з* (t), t^ty C.132) Видно, что матрица P(t) позволяет не только найти оптималь- оптимальный закон управления с обратной связью, но и оценить величину критерия для любых заданных начального состояния и начального момента времени. Из выводов этого раздела рассмотрим следующий результат 11851, который будет полезен при решении задачи, построения стохастического линейного оптимального регулятора и задачи оптимального наблюдения. Лемма 3.1. . Рассмотрим матричное дифференциальное уравнение
254 Глава 3 - Р (t) = Rt (t) + FT (t) R2 (t) F(t) + P (t) [A (t) -B(t)F @1 + + [A(t)~B(t)F(t)fP(t) C.133) с конечным условием P(td = Pu C.134) где Rift), R2(O, d(t), B(t) — заданные переменные во времени матрицы соответствующей размерности, причем Bt(t) — неот- неотрицательно определенная матрица, R^(t) — положительно опре- определенная матрица при t0 ¦<: t ¦<: tlt a Pi — неотрицательно определенная, матрица. Пусть F(t) — произвольная непрерывная матричная функция при t0 <: t < tL. Тогда для P(t)>P(t), C.135) где P(t) — решение матричного уравнения Риккати — Р @ = Л. (t) — P(t)B (t) R-1 (t) BT (t) P (t) + + P(t)A(t)-\-AT(t)P(t), C.136) имеем P(ti)=Pi. ' C.137) Неравенство C.135) преобразуется в равенство, если F (-) == R~l (-с) ВТ (г) Р (х) для t < z < t{. C.138) Лемма предполагает, что P(t) «минимизируется» в соответствии с C.135), если выбрать функцию F, как указано в C.138). Дока- Доказательство является песложным. Выражение хт (t) P (t) х (t) C.139) представляет собой критерий C.121), если система управляется с помощью линейного закона u(i) = —F(')x(-), *<*<*!. C.140) Оптимальный закон управления, который является линейным и, как следствие, наилучшим линейным законом управления, дает величину критерия, равную xT(t)P(t)x(t) (теорема 3.4), так что xT(t)P(t)x(t)^xT(t)P(t)x(t) для всех x(t). C.141) Это и требовалось доказать.
Оптимальные линейные СУ с обратной связью 255 0,5 О, к 0.2L 0,1 - - P.m.xt. -~^ 0 -0 J —^^ о = 1000 I Л, -- 0,5 0,5 t,c Рис. 3.7. Поводонио P(t) в задаче стабилизации угловой скорости при различ- различных значениях р и jii. Закончим этот раздел замечанием о существовании решения задачи синтеза регулятора. Можно показать, что при условиях, сформулированных в определении 3.2, задача построения детер- детерминированного линейного оптимального регулятора имеет един- ствонпое решение. Существование решения задачи также гаранти- гарантирует 1) существование обратной матрицы в выражении C.98) и 2) единственность решения C.98) матричного уравнения Рйккати C.130) с копечпым условием C.131). Вопросы существования решения задачи и решения уравнения Рйккати рассмотрены в работах Калмапа [86], Атанса и Фалба [8], Вонхэма [185], а также в работах [26, 29, 91, 129, 158]. Пример 3.6. Стабилизация угловой скорости Продолжим рассмотрение примера 3.5. Здесь P(t) является ска- лярпой функцией, удовлетворяющей скалярному уравнению Рпккати О C.142) с конечным условием P{ti) = *t. C.143) К этом скалярном случае уравнение Рйккати C.142) может быть решено непосредственно. Однако с учетом результатов, полученных is примере 3.5, целесообразнее использовать соотношение C.98). Поэтому напишем (Mi) (Mi) *i 8n(Mi)- (Mi) C.144) где 0tj определяется таким же образом, как в примере 3.5. На рис. 'АЛ показано изменение P(t) для некоторых рассмотренных ранее
256 Глава 3 случаев. Отметим, что матрица P(t), так же как и коэффициент F(t), является постоянной почти на всем интервале [t0, /J, за исключени- исключением участка на колце. (Это не удивительно, так как Р(t) и F(t) раз- различаются только постоянным коэффициентом.) 3.4. Установившееся решение задачи построения детерминированного линейного оптимального регулятора 3.4.1. ВВЕДЕНИЕ И АНАЛИЗ ОСНОВНЫХ РЕЗУЛЬТАТОВ В предыдущем разделе била рассмотрена задача минимизации критерия t, j [ zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt + xT (*,) Ptx (y C.145) для системы x{t) = A{t)x{t)+B(t)u(t), C.146) z(t) = D(t)x(t), в которой терминальное время t1 конечно. С практической точки зрения естественно рассматривать очень длинные интервалы [t0, tj]. Поэтому в данном разделе будет детально исследова- исследовано асимптотическое поведение решения задачи детерминированно- детерминированного регулирования при t1 —>- оо. Основные результаты этого раздела можно суммировать сле- следующим образом. 1. Когда терминальное время t1 возрастает до бесконечности, решение P(t) матричного уравнения Риккати -P(t) = DT (t) Rs (t) D(t)-P (t)B (t) Д-1 (t) BT (t) P (t) + + AT (t) P (t) + P (t) A (t) • # C.147) с конечным условием P{h) = Pi C.148) обычно стремится к установившемуся решению Рft), которое не зависит от Р1ш Условия, при которых это имеет место, точно определены в разд. 3.4.2. Далее будет также показано, что в случае неизменных во времени параметров, т. е. когда матрицы А, В, D, /?а и i?2 постоян-
Оптимальные линейные СУ с обратной связью 257 ны, установившееся решение Р также постоянно и является реше- решением алгебраического уравнения Риккати 0 = DTRsD — ~P~BR~l ВТ р+АтР +РА. C.149) Легко установить, что Р является неотрицательно определен- определенной, матрицей. Докажем, что в общем случае (точные условия заданы) установившееся решение Р является решением алгебраи- алгебраического уравнения Риккати, которое неотрицательно определено и может быть определено единственным образом. Для установившегося решения уравнения Риккати получаем соответственно установившийся закон управления u(t)=—'F(t)x(t), C.150) где . _ _ F{t)= R-* (t)BT(t)P(t). C.151) Ниже будет показано, что установившийся закон управления минимизирует критерий C.145), где ?г = оо. Весьма важен сле- следующий вывод. 2. Установившийся закон управления.в общем случае асимптоти- асимптотически устойчив. Снова будут определены точные условия. Этот факт интуитивно понять нетрудпо. Так как интеграл [ zT (t) R3 (t) z (t) + uT (t) #2 (t) и (*)] dt C.152) существует для установившегося закона управления, следователь- следовательно, в замкнутой системе u(t) —*- 0 и z(t} —*- 0 при / —*- оо. В об- общем случае это справедливо, если x{t) -*¦ 0, т. е. когда система асимптотически устойчива. Последний вывод очень важен, поскольку теперь мы распола- располагаем методами синтеза линейных систем с обратной связью, кото- которые асимптотически устойчивы и в то же время имеют оптималь- оптимальные характеристики переходного процесса в том смысле, что любое ненулевое начальное состояние переводится в нулевое состояние оптимальным образом. Для систем с постоянными параметрами этот вывод является хорошим дополнением к теории стабилизации, рассмотренной в разд. 3.2, где было показано, что любая система с постоянными параметрами в общем случае, может быть стабилизи- стабилизирована с помощью линейного закона с обратной связью, а полюса замкнутой системы можно разместить произвольно. Решение задачи синтеза регулятора дает метод рационального распределе- распределения полюсов. Вопрос об оптимальном распределении полюсов замкнутой системы будет снова рассмотрен в разд. 3.8.
258 Глава 3 Пример 3.7. Стабилизация угловой скорости Для задачи стабилизации угловой скорости, рассмотренной в примерах 3.3, 3.5 и 3.6, решение уравнения Риккати описывается выражением C.144). Легко определить с помощью C.106), что при tl —>• оо Ч-^-). C.153) Решение- Р можно также найти из алгебраического уравнения C.149),. которое в этом случае сводится к виду 0=1 —Р2—2аР. C.154) Р Это уравнение имеет решения -o± V^ + ^r ¦ C-155) Так как Р должно быть неотрицательным, получаем, что C.153) является точным решением. Соответствующий установившийся коэффициент усиления оп- определяется выражением (/) C.156) Подставляя V.(t)=-Ft(t) C.157) в дифференциальное уравнение состояния системы, получим сле- следующее дифференциальное уравнение состояния замкнутой сис- системы: Очевидно, что эта система асимптотически устойчива. Пример 3.8. Управление положением Как более сложный пример рассмотрим задачу управления положением из примера 3.4 (разд. 3.3.1). Установившееся решение Р уравнения Риккати C.147) должно теперь удовлетворять урав- уравнению C.159)
Оптимальные линейные СУ с 'обратной связью 2о9 Пусть Р ij, l-j — 1,2, обозначает элементы матрицы Р. Тог- Тогда, учитывая Р12 = Р-п- получим из C.159) следующие алгебраи- алгебраические уравнения: "Г 12> . р р 22 Эти уравнения имеют несколько решений, однако легко проверить, что только неотрицательно определенному решению удовлетворя- удовлетворяют соотношения Ри = f V«' Кр -a V? Соответствующая матрица коэффициентов обратной связи для установившегося состояния определяется выражением (ЗЛ62) Таким образом, входная переменная равна p(t)= —Fx(t). C.163) Легко показать, что оптимальная замкнутая система описыва- описывается дифференциальным уравнением состояния О 1 C.164) Характеристический полином замкнутой системы имеет вид Ур Ур а характеристические числа равны 1 —--— 9 C.165) C.166)
260 Глава 3 --10 --15 Рис. 3.8. Годограф корней замкнутой системы управления положением в функции р. На рис. 3.8 приведеп годограф характеристических чисел зам- замкнутого контура при изменении р. Интересно отметить, что при уменьшении р полюса замкнутого контура перемещаются в бес- бесконечность вдоль двух прямых линий, образующих угол тг/4 с от- отрицательной вещественной осью. Асимптотические значения по- полюсов замкнутой системы определяются выражением —— -— 1--2(— 1±;) при р-^0. C.167) р /4 ~. На рис. 3.9 показан переходный процесс в оптимальной зам- замкнутой системе, соответствующий следующим значениям парамет- параметров: у. =0,787 рад/(В-с2), а = 4,6 с, C.168) р = 0,00002 Рад2/В2.
Оптимальные линейные СУ с обратной связью 261 I t. с 0,5- Рис. 3.9. Реакция оптимальной системы управления положением па началь- начальные условия ?i@) = 0,1 рад, ?г@) = 0 рад/с. Соответствующая матрица коэффициентов усиления равна 7 = B23,6; 18,69), C.169) ¦а вычисленные полюса замкнутой системы составляют —9,658 + ± /9,094. Видно, что данная схема эквивалентна схеме с обратной ¦связью по положению и скорости, рассмотренной в примере 2.4 (разд. 2.3). Матрица усиления C.169) оптимальна с точки зрения характеристик переходного процесса. Интересно' отметить, что современные методы проектирования реализуются в виде системы второго порядка с относительным демпфированием ) 2/2, которое точно такое же, как и в примере 2.7 (разд. 2.5.2), где исследована наиболее рациональная схема. Заканчивая обсуждение, отметим, что, как следует из примера 3.4, если x(t) представляет собой отклонение от некоторого равно- равновесного состояния х0, не являющегося нулевым состоянием, то в законе управления C.163) необходимо заменить x(t) на x'{t), *'(*>= l io C.170) а1ю — заданное угловое положение. В итоге получим закон уп- управления -Л[?,(О-?1о]-^г(О. ' C-171)
262 Глава 3 где F = (Fx, Fcj,). Блок-схема системы, соответствующая этому закону управлеЕшя, приведена на рис. 3.10. Пример 3.9. Смесительный бак В качестве другого примера рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3). Предположим, что необходимо стабили- стабилизировать выходной расход F(t) и выходную концентрацию с(?). Поэтому в качестве управляемой переменной выберем Здесь используются численные значения из примера 1.2. При оп- определении весовой матрицы R3 будем придерживаться тех же сооб- соображений, что и в примере 2.8 (разд. 2.5.3). Номинальная величина выходного расхода составляет 0,02 м3/с, а номинальная величина выходной концентрации — 1,25 кмоль/м3. Предположим, что матрица R3 выбрана диагональной с диагональными элементами ах и а2. Тогда -J (t) R3 z (t) = a, 1* (t) + Oi i\ (t), C.173) где z(t) = col(Cj(?), C2@)- Если изменение выходного расхода на 10% @,002 м3/с) должно производить такое же изменение крите- критерия, как 10%-иое изменение выходной концентрации (~0,1 кмоль/м3), то должно существовать примерное равенство <7! • 0,0022»а2. ОД2, C.174) т. е. -^-«2500. C.175) Поэтому выберем а! = 50, а2=1/50, C.176) или п /50 0 \ .„ ,„ч R3= . 3.177) 3 \0 0,02/ V Чтобы выбрать матрицу i?2, используем такой же подход- Изменение расхода F1 на 10% составляет 0,0015 м3/с, в то время как 10%-ное изменение расхода F2 равно 0,0005 м3/с. Выберем R2 = diag (pi,p2)- Тогда изменение расходов Fx и F2 на 10% вызо- вызовет изменение величины критерия, равное р4 • 0.00152 + р2 • 0.00052. C.178)
Заданное полотенце г h • Входное -*\ напряжение filt) J Усилитель постоянного тока F. Гг Двигатель постоянного тока 0 Угловая скорость ?2(t) Угловое положение Тахо- Тахометр i,M Поте ме нцио- vp Рис. 3.10. Блок-схема оптимальной системы управления положением.
Концентрация ?2W, кмоль/м3 Объем t,(t), м3 Концентрация ?гA),кмоль/м3 Объем Zf(t),
50 t,c 100 50 t,c 100 I SO t,c Г 100 Рис. 3.11. Реакции замкнутой системы регулирования смесительного бака при различных значениях весового коэффициента р. Слева — реакции по приращению объема и концентрации в потоках MS 1 и 2 на начальное состояние х @) = col @.1, 0); справа — реакции по приращению объема и концентрации в потоках № 1 и 2 на начальное состояние х @) = col @, 0,1).
26G Глава 3 Обе составляющие вносят одинаковое изменение, если Поэтому выберем Pi н 9 v3 о О 3 C.179) C.180) где р — скалярная константа, которую необходимо определить. На рис. 3.11 приведены характеристики оптимальной замкну- замкнутой системы в установившемся режиме при р = оо, 10, 1 и 0,1. Случай р = оо соответствует разомкнутой системе (управление отсутствует). Видно, что с уменьшением р непрерывно возрастает быстродействие за счет все большего увеличения амплитуды вход- входной переменной. В табл. 3.1 приведены характеристики замкнутой Таблица 3.1 Распределение установившихся полюеов оптимальной замкнутой системы регулирования смесительного бака в функции р Оптимальные полюса замкнутой системы, с 10 1 0,1 0,01 0,02952 0,07517 0,2310 —0 02 —0,04523 —0,1379 —0/i345 системы в функции р. Видно, что во всех случаях полюса замкну- замкнутой системы находятся в левой области комплексной плоскости. Здесь не указаны матрицы усиления F, пайденпые для каждо- каждого значения р, однако оказывается, что они не диагональные i>, от- отличие от рассмотренных в примере 2.8. Системы с обратной связью, рассмотренные в настоящем примере, оптимальны в том смысле, что являются наилучшим компромиссом между требова- требованием максимального быстродействия и ограничениями по ампли- амплитуде входной переменной. И наконец, из графиков на рис. 3.11 видно, что в замкнутой системе относительно невелико взаимовлияние, т. е. реакция на начальное возмущение по концентрации слабо влияет на объем бака и наоборот.
Оптимальные линейные СУ с обратной связью 267 .{.4.2*. СВОЙСТВА УСТАНОВИВШЕГОСЯ РЕШЕНИЯ ЗАДАЧИ ОПТИМАЛЬНОГО РЕГУЛИРОВАНИЯ В этом и последующем разделах рассматриваются свойства установившегося решения задачи построения оптимальных регу- регуляторов. Данный раздел посвящен общему случаю системы с пе- переменными параметрами; в следующем разделе более детально рассматривается случай системы с постоянными параметрами. Большая часть результатов настоящего раздела получена Кал- маном [86]. Авторы книги в той или иной степени следуют его выводам. Сформулируем сначала следующий результат. Теорема 3.5. Рассмотрим матричное уравнение Риккати -P(t) = D7 (t) R3 (t) D(t)-P (t) В (t) /?2-' (t) BT (t) P (t) + ¦ + AT(t)P(t)+P(t)A(t). C.181) Предположим, что матрица Aft) является непрерывной и ог- ограниченной, матрицы B(t), D(t), R^ft) и R2(t) кусочно-непрерыв- кусочно-непрерывны, и ограничены на интервале [t0, оо] и, кроме того, R3(t)>-aJ, R2(t)>>$I для всех t, C.182) где а и р — положительные константы. 1. Тогда, если система x(t) = A(t)x(t)-\-B(t)u(t), C.183) z(t)=D(t)x(t) а) полностью управляема или б) экспоненциально устойчива, то решение P(t) уравнения Риккати C.181) с конечным условием l*(h) = 0 сходится к неотрицательно определенной матричной функции P(t)npu t1 —у оо. Матрица P(t) является решением уравнения Риккати C.181). 2. Кроме того, если система C.183) в) одновременно полностью управляема и полностью восстанав- восстанавливаема или ' г) экспоненциально устойчива, то решение P(t) уравнения Риккати C.181) с граничным условием ^(h) -- Р\ сходится к P(t) при tl -у оо для любого Рх > 0. Доказательство первой части этой теоремы не представляет особых затруднений. Из теоремы 3.4 (разд. 3.3.3) известно, что при конечном tx
268 Глава 3 ХТ (t) P (t) X (t) = min M I / (x) /?3 (х) z (х) + + "ГМ"й2М«(х)]йт1. C,184) Это выражение, очевидно, является функцией конечного мо- момента времени tx. Сначала установим, что эта функция tv имеет верхнюю границу. Если система является полностью управляемой [предположение (а)], то существует входное воздействие, которое переводит состояние x(f) в нулевое состояние в некоторый момент времени t\. Для этого воздействия можно вычислить величину критерия *\ \ [ zT (-с) R3 (x) z (т) + ит (х) Л2 (-) и (х)} dz, C.185) )' - которая является верхней границей для соотношения C.184), так как, очевидно, можно принять u(t) = 0 при t -^ t\. Если система экспоненциально устойчива (разд. 1.4.1), то x(t) сходится экспоненциально к нулю, если принять u{i) ss 0. Тогда интеграл "' [ гт (,) R3 (х) z (х) + ит (х) R2 (x) и (т)] dx ¦= сходится к конечному числу при ft -*¦ оо, поскольку предполага- предполагается, что матрицы D(t) и /?з@ ограничены. Это число является верхней границей для соотношения C.184). Таким образом, показано, что выражение C.184) как функция tx имеет верхнюю границу при предположениях (а) и (б). Более того, вполне ясно, что как функция tx это выражение является монотонно неубывающим. Предположим, "что это неверно. Тогда должны существовать такие t\ и t'\ с t'\ > t\, что при'^ = t'\ величина критерия будет меньше, чем при tx ~ t\. Введем затем входное воздействие, которое является оптимальным при t"\ на интервале [t0; t\\. Так как интеграл от критерия является не- неотрицательным, то критерий на этом меньшем интервале должен иметь величину, которая меньше или равна величине критерия на большем интервале [?0> Ь"^\. Однако здесь возникает противо- противоречие,' так как выражение C.184) должно быть монотонно неубы- неубывающей функцией ty.
Оптимальные линейные СУ с обратной связью 200 Поскольку выражение C.184) как функция tx ограничено свер- сверху и монотонне не убывает, то должен существовать предел при ty -*- оо. Так как x(t) выбирается произвольно, то каждый из элементов P(t) имеет предел, поэтому матрица P{t) также имеет предел, который обозначим через P(t). Очевидно, что P(t) являет- является неотрицательно определенной и симметрической матрицей. Тот факт, что P(t) является решением матричного уравнения Рик- кати, следует из непрерывности решений уравнения Риккати от- относительно начальных условий. Следуя Калману [86], обозначим через П(?; Рг, t'j) решение матричного уравнения Риккати с конеч- конечным условием P^ty) = Рг. Тогда имеет место соотношение ~Р {t) = lim П (t; 0, t2) = lira П [t; П {tt; 0, t2) t{] = = Hit; lim n(tx\ 0, t2), *,] = U[t, P(tt), tt] , C.187) которое показывает, что P^ti) действительно является решением уравнения Риккати. Доказательство остальной части теоремы 3:5 будет получено позднее.- Назовем P(t) установившимся решением уравнения Риккати. Этому установившемуся решению соответствует установившийся оптимальный закон управления u(t) = ~F(t)x(f), C.188) где _ __ F{t) = R~l (t)BT {t)P{t). C.189) Рассматривая устойчивость установившегося закона управле- управления, получим следующий результат. Теорема 3.6. Рассмотрим задачу построения детерминирован- детерминированного линейного оптимального регулятора и предположим, что выполняются допущения теоремы 3.5 относительно матриц А, В, D, R3 и R.,. Тогда, если система x{t) = A{t) x(f)-\-B{t) u(t), C.190) z{t)=D{t)x{t) а) одновременно полностью управляема и полностью восстанав- восстанавливаема или б) экспоненциально устойчива, то:
270 Глава 3 1) оптимальный закон управления в установившемся режиме и (*) = — R~] (t) BT (t) P(t) x (t) . C.191) экспоненциально устойчив; 2) закон управления C.191) минимизирует критерий ( h f ( h lim f [ гТ (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt + T C.192) ¦для всех Pl > 0. Минимальная величина критерия C.192), кото- которая достигается при установившемся законе управления, опреде- определяется выражением xT(to)T(to)x(to). C.193) Точное доказательство этих результатов дано Калмапом [86]. Здесь приводятся только основные соображения. Если вы- полпяется условие (а) или (б) теоремы 3.6, то также выполняется условие (а) или (б) теоремы 3.5. Из этого следует, что решение уравнения Риккати C:181) с условием Р^г) = 0 сходится к РA) при t^ —>oo. Для соответствующего установившегося закона уп- управления имеем f [zT(t)R3(t)z(t)+ur(t)R2(t)u(t)]dt = xr(t0)P(t0)x(t0). C.194) to Так как интеграл сходится, а матрицы Д3(?) и R.^t) удовлетворя- удовлетворяют условиям C.182), z{t) и u(t) должны сходиться к нулю при t ->• ->• оо. Предположим теперь, что замкнутая система не является асимптотически устойчивой. Тогда существует такое начальное состояние, для которого x(t) не достигает нуля при z(t) -+0 н u{t) —*¦ 0. Ясно, что это находится в противоречии с полной вос- восстанавливаемостью системы, если выполняется условие (а), а также с предположением об экспоненциальной устойчивости системы, если выполняется условие (б). Поэтому замкнутая система должна быть асимптотически устойчивой. Экспоненциальная устойчивость системы следует из свойств ее однородности. Том самым доказывается первая часть теоремы; вторую часть можно доказать следующим образом. Предположим, что существу- существует другой закон управления, который дает меньшую величину кри- критерия C.192). Поскольку величина критерия C.192) конечна при использовании установившегося оптимального закона управления, этот другой закон должен также давать конечную величину. Тогда по таким же соображениям, как и для установившегося закона уп-
Оптимальные линейные СУ с обратной связью 211 Угловая скорость и Ц) L Ban v приводимый So Вращение двигатепем постоянного тона Катушка Скорость намотки проволоки Kit) Рис. 3.12. Схематическое представление механизма для намотки проволоки. равлепия, этот закон управления должен быть асимптотически ус- устойчив, и для такого закона управления имеем г и lim Г [zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt + '•-*" Ы -f xT (fj) PlX(tt) 1 = j [ zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)} dt. C.195) J и Одиако, поскольку правая часть этого выражения минимизиру- минимизируется с помощью установившегося закона управления, не сущест- существует другого закона управления, который давал бы меньшую вели- величину левой части выражения. Тем самым доказывается вторая часть теоремы 3.6. Кроме того, это доказывает вторую часть теоремы 3.5, так как при допущениях (в) и (г) этой теоремы закон управления с обратной связью в установившемся режиме миними- •чирует критерий C.192) при всех Pt > 0. Из этого следует, что уравнение Риккати сходится к P(t) при всех Рг >. 0. Проиллюстрируем результаты, полученные ' в этом разделе. Пример 3.10. Механизм для намотки проволоки В качестве примера простой системы с переменными параметра- параметрами рассмотрим механизм для намотки проволоки, представленный па рис 3.12. Двигатель постоянного тока вращает катушку, на которую наматывается проволока. Скорость намотки проволоки на катушку поддерживается постоянной. Из-за увеличения диаметра катушки возрастает момент инерции; кроме того, для поддержания постоянства скорости намотки необходимо уменьшать угловую скорость вращения. Обозначим через a>(t) угловую скорость ка- катушки, через J(t) — момент инерции катушки якоря двигателя, и через \i(t) — напряжение на входе усилителя мощности, кото-
272 Глава 3 рый управляет двигателем постоянного тока. Тогда получаем [()<d(t)] \(t) 4Xu(t), C.196) dt где х — коэффициент пропорциональности между моментом дви- двигателя и входным напряжением, ty — коэффициент трения. Кроме того, обозначим через R(t) радиус катушки; при этом скорость на- намотки проволоки будет определяться выражением С (*) = Д (*)©(*). ~ C.197) Введем переменную состояния ?(*) = /(*)©(«). * " C.198) Тогда система будет описываться уравнениями C.199) Предположим, что скорость вращения катушки регулируется таким образом, что скорость движения проволоки поддерживается постоянной и равной ?0. Зависимости / и R от времени тогда можно установить следующим образом. Предположим, что на коротком интервале времени dt радиус катушки возрастает от R до R + dR. Увеличение объема проволоки, намотанной на катушку, пропор- пропорционально RdR. Объем также пропорционален dt, так как по пред- предположению проволока наматывается с посюянной скоростью. Тогда имеем RdR = cdt, C.200) где с — константа. После интегрирования получим R (t) = V R* @)-\-ht, . C.201) где h — другая константа. Однако если радиус возрастает от R до R + d,R, то момент инерции возрастает на величину, пропор- пропорциональную RdRR2 = R3dR. Таким образом, имеем dJ=c'R3dR, C.202) где с' —¦ константа. После интегрирования получим Rl@)],. C.203) где h' — тоже константа. Рассмотрим теперь задачу такого регулирования системы, при
Оптимальные линейные СУ с обратной связью 273 котором скорость намотки поддерживается постоянной и равной величине Со. Номинальное решение Со@» М^)> которое соответст- соответствует этому случаю, можно найти следующим образом. Если ?0@= т^ Со, то имеем U0 = -^4, C.204) Номинальная входная переменная находится из дифференци- дифференциального уравнения состояния = J.M_ <_ГЩ + -I-V. C.205) * [at 1 Л@) R(t)\*° v ; Введем смещенные переменную состояния, входную и управ- управляемую переменные соответственно » E-206) Эти переменные удовлетворяют уравнениям Г@ = —j^g'W + VW, C.207) С С) = -7^-Г (О- Выберем критерий в виде | . C.208) Тогда уравнение Риккати примет вид -^^'¦^(о-7"^-^—27*uP{t) Cl209) с конечным условием Р (tt) = 0. C.210) В этом случае P(t) является скалярной функцией. Скалярный коэффициент усиления обратной связи определяется выражением C.211) P 10—394
274 Глава 3 15 * 10 1 0-5 5 Установившийся / участок 10 t,c 15 20 Рис. 3.13. Поведение оптимального коэффициента усиления в задаче намотки проволоки при различных значениях конечного момента времени ti. Выберем следующие численные значения: /(*) = 0,02 + 66,67 [Д* (*) — Д* @)] кг-м2, C.212) = /0,01+0,0005* м, ф = 0,01 кг-м2/с, х = 0,1 кг-м2-рад/(В-с2), р = 0,06 м2/(В2-с2). На рис. 3.13 показано изменение оптимального коэффициента усиления F(t) для конечных моментов времени tt = 10, 15 и 20 с. Отметим, что для всех величин tx поведение коэффициента усиления в установившемся режиме одинаковое, только вблизи конечного момента времени наблюдаются некоторые изменения. Видно, что коэффициент усиления в установившемся состоянии изменяется во времени. Реализовать переменный коэффициент усиления весьма неудобно. В рассматриваемом случае с использованием постоян- постоянного коэффициента усиления обратной связи могут быть получены практически адекватные характеристики. 3.4.3*. СВОЙСТВА УСТАНОВИВШЕГОСЯ РЕШЕНИЯ ЗАДАЧИ ПОСТРОЕНИЯ ОПТИМАЛЬНОГО РЕГУЛЯТОРА С ПОСТОЯННЫМИ ПАРАМЕТРАМИ В этом разделе будут исследованы свойства оптимального ли- линейного регулятора с постоянными параметрами в установившемся состоянии. Кроме того, будут получены необходимые и достаточ- . ные условия, при которых уравнение Риккати имеет установившее-
Оптимальные линейные СУ с обратной связью 275 ся решение и при которых оптимальная замкнутая система устой- устойчива в установившемся режиме. Большая часть этих результатов получена в работах [119, 123, 186]. Основные результаты можно сформулировать следуюпщм об- образом. Теорема 3.7. Рассмотрим задачу синтеза регулятора с постоян- постоянными параметрами для системы x(t) = Ax(t)+Bu(t), C.213) z (t) = Dx (t) с критерием j'/ 7>('i) C-214) при R3 > О, R2 > 0, Рг >• 0. Соответствующее уравнение Рик- кати имеет вид — >(*) = DT R3D — P[t) BR~^ BT P (t) +ATP(t) + P (t) A % C.215) с конечным условием P.(td = Pf C.216) к а) Предположим, что Pt — 0. Тогда при tx -> oo решение урав- уравнения Риккати стремится к постоянной величине Р в установив-. шемся состоянии в том и только гпом случае, если система не имеет полюсов, которые одновременно были бы неустойчивыми, неуправ- неуправляемыми и восстанавливаемыми. б) Если система C.213) является стабилизируемой и обнаружи- обнаруживаемой, то решение уравнения Риккати C.215) стремится к един- единственной величине Р при tx -*¦ оо для всех Рг 3s» 0. в) Если Р существует, то зта матрица является неотрица- неотрицательно определенным симметрическим решением алгебраического уравнения Риккати 0= DTR3D—PBR~1 BTP + ATP + PA. C.217) Если система C.213) является стабилизируемой и обнаруживае- обнаруживаемой, то Р — единственное неотрицательно определенное симмет- симметрическое решение алгебраического уравнения Риккати C.217). г) Если решение Р существует, то оно является положительно определенным тогда и только тогда, когда система C.213) пол- полностью восстанавливаема. 10*
276 Глава 3 д) Если Р существует, то установившийся закон управления^ u(t)= —Jx{t), C.218) где Fr=R~iB7"P, C.219) асимптотически устойчив тогда и только тогда, когда система является C.213) стабилизируемой и обнаруживаемой. е) Если система C.213), стабилизируемая и обнаруживаемая, то установившийся закон управления минимизирует критерий { h } lim Г [ zT (t) R3z (t) + uT (t) R2u (t)] dt + xT {tt)PiX (t,) C.220) h-*°>\l ¦ J при всех Pi > 0. При установившемся законе управления критерий C.220) равен xT(t0)Px(t0). C.221) Докажем сначала часть (а) этой теоремы. Предположим, что система не является полностью восстанавливаемой. Тогда ее мож- можно представить в канонической форме восстанавливаемости сле- следующим образом: \ A2i A2u C.222) z(t)=(DltO)x(t), где пара {Ап, D^—полностью восстанавливаемая. Разделяя реше- решение P(t) уравнения Риккати C.215) в соответствии с разделением C.222): / Ри (t) Pi2 (t) \ P(t) = l r , C-223) \PT12(t) P22(t)J легко показать, что уравнение Риккати C.215) упрощается до следующих трех матричных уравнений: - Ри (t) = D\ R3 D, - \Pn (t) Bi + Pi2 (t) B2] R-1 [B[ Pu (t) + + B\ P*2(t)] + ATU Pu(t) + A\x P\2{t) + Pu(t) Au + Pa(t) A2i, C.224) - Pi2 (t) = - [Pa (t) B, + Pa (t)-B2] R~l [B\ Pi2 (t) + BT2 P22 (t)] + + ATn Pi2 (t) + AT2l P22 (t)+Pi2 (t) AM, C.225)
Оптимальные линейные СУ с обратной связью 277 - К (О = - [Р\2 (О В, + Ръ (t) В2] Я [В[ Pi2 (t) + В\ Р2г (t)} + T . .C.226) Видно, что при конечных значениях Рп(г]) = 0, Рп(^) = О, () = 0 уравнения C.225) и C.226) удовлетворяются условия- условиями Л. @ = 0, />м@-=0, *<*,. C.227) Тогда уравнение C.224) сводится к виду - К @ = ^ Д, 2), - />„ (о в, в.-1 в[ ри (о + < />и (о + + Ри @ ^н. Л, (<J = 0. C.228) Из этого следует, что полюса невосстанавливаемости системы, т. е. характеристические значения матрицы Аг%, не влияют на сходимость Pu(t) при tt ->- оо, и поэтому они не влияют также на сходимость P(t). Поэтому для исследования сходимости можно предположить на время, что система C.213) является полностью восстанавливаемой. Преобразуем теперь систему C.213) в каноническую форму уп- управляемости, и представим ее следующим образом: C.229) z(t) = {Dt, D2)x(t), где пара {A^, Bt}—полностью управляемая. Предположим теперь, что система нестабилизируема, поэтому Л22 не является асимптоти- асимптотически устойчивой. Тогда, очевидно, существуют такие начальные состояния в форме со!@, х.2О), при которых x(t) -*- оо независимо от выбора и (t). В предположении о полной восстанавливае- восстанавливаемости системы при таких начальных состояниях интеграл и j I zT (t) B3z](t) + uT (t) B2n (t)] dt' C.230) и никогда не будет сходиться к конечному числу при t1 —*¦ оо. Это означает, что P{tf также никогда не будет сходиться к конечному числу при tx -*- оо, если система C.213) нестабилизируема. Од- Однако если система C.213) является стабилизируемой, то всегда можно найти закон управления с обратной связью, который делает замкнутую систему устойчивой. В случае такого закона выраже-
278 Глава 3 ние C.230) сходится к конечному числу при tx -> оо; это число представляет собой верхнюю границу для минимальной величины критерия. Как и в разд. 3.4.2, можно полагать, что минимальная величина C.230) является.монотонно неубывающей функцией t1. Это доказывает, что мипимальная величина C.230) имеет предел при t1 -*¦ оо и, как следствие, что матрица P{t), определяемая из C.215) при\Р(^) = 0, имеет пределом Р при tL —>¦ оо. Тем самым завершается доказательство части (а) теоремы. Теперь рассмотрим весьма важное доказательство части (г) теоремы. Предположим, что система не является полностью вос- восстанавливаемой. Тогда, как было показано в начале доказательст- доказательства части (а), если система представлена в канонической форме вос- восстанавливаемости ni3! =0, то P(t) можно представить в форме «W 0 n 3.231) 0 0/ Из этого следует, что матрица Р, если она существует, является сингулярной. Тем самым доказывается, что если Р строго положи- положительно определена, то система должна быть полностью восстанав- восстанавливаемой. Чтобы доказать обратное, предположим, что система яв- является полностью восстанавливаемой, а Р — сингулярной мат- матрицей. Тогда существует такое ненулевое начальное состояние, при котором со J [ и 2Г (t) Rsz (t) + uT (t) R2 и (t)] dt = 0. C.232) Поскольку i?3 > 0 и й2 > 0, из этого следует м(*) = 0 и z(t) = O при t>t0. C.233) Однако это означало бы. что существует ненулевое начальное состояние, которое вызывает нулевую реакцию z(t), равную нулю при всех t. Это находится в противоречии с предположением о полной восстанавливаемости системы; следовательно, предполо- предположение о том, что матрица Р сингулярна, неверно. Тем самым дока- доказывается часть (г) теоремы. Рассмотрим теперь доказательство части (д). Предположим, что матрица Р существует. Это означает, что система не имеет неус- неустойчивых полюсов неуправляемости, которые являлись бы полю- полюсами восстанавливаемости. При доказательстве части (а) теоремы было показано, что при представлении системы в канонической формз восстанавливаемости матрица Р записывается в форме Ро" о)- C-234)
Оптимальные линейные СУ с обратной связью 279 Это значит, что матрица усиления обратной связи в установив- установившемся состоянии имеет вид F= R~l {В\ , Вт2) (Pqh 0) = (R-1 B\PiU 0). C.235) В свою очередь зто означает, что матрица усиления обратной связи в установившемся состоянии совсем не затрагивает невос- станавливаемую часть системы. Из этого следует, что если за- закон управления в установившемся состоянии делает замкнутую систему. асимптотически устойчивой, то невосстанавливаемая часть системы должна быть асимптотически, устойчивой, т. е. разомкнутая система должна быть обнаруживаемой. Далее, если замкнутая система должна быть асимптотически устойчивой, то разомкнутая система должна быть стабилизируемой, в противном случае никакой закон управления н, следовательно, даже устано- установившийся закон управления не сможет сделать замкнутую систе- систему устойчивой. Таким образом, видно, что стабилизируемость и обнаруживаемость являются необходимыми условиями асимптоти- асимптотической устойчивости установившегося закона управления. Стабилизируемость и обнаруживаемость гарантируют асимп- асимптотическую устойчивость. Было показано, что установившийся закон управления влияет на невосстанавливаемую часть системы. Поэтому если система обнаруживаема, то можно также исключить невосстанавливаемую часть и предположить, что система пол- полностью восстанавливаема. Представим систему в канонической форме управляемости аналогично C.229). Разделяя матрицу P(t) в соответствии с разделением в C.229), напишем Рт., (t) Pi2 (t) U 1 C-236) Нетрудно определить из уравнения Риккати C.215), что Ptl(t) является решением уравнения -г- Ри (t) = D\ Rs D, - Pu (t) Bt i?-1 B\ Pn (t) + + ATnPll(t) + Pli(t)Aii, C.237) = 0. a Видно, что это обычное уравнение Риккати. Пари {А1Х, 5Х} является полностью управляемой, а"из теоремы 3.5 известно, что Pn(t) имеет такое асимптотическое решение Рп прн tx -*¦ оо, что матрица Ап — В^, где Fx = R \в\Руъ асимптотически ус-
280 Глава 3 тойчива. Закон управления для всей системы C.229) определяется в виде =\R~xB[Pn RJX В\Ра). C.238) При таком законе управления замкнутая система описывается уравнением X\tj= I ^ \x (t). (o.Zov) V О А22 ' 1 Очевидно, что если разомкнутая система стабилизируема, то замкнутая система асимптотически устойчива, поскольку асимпто- асимптотически устойчивы матрицы Ап — B1F1 и Агг. Тем самым дока- доказывается, что обнаруживаемость и стабилизируемость являются достаточными условиями для гарантии асимптотической устойчи- устойчивости установившегося закона управления разомкнутой системой. Тем самым доказывается часть (д) теоремы. Рассмотрим теперь часть (е) теоремы. Установившийся закон управления, очевидно, минимизирует критерий ; %т (*) Raz (t) + uT (t) R2u (t)] dt, C.240) а минимальная величина этого критерия равна Хт (tu)PX(t0). Рас- Рассмотрим теперь критерий f [ zT (t) Raz (t) + uT (t) i?2u (t)] dt + xT (fj PiXitM C.241) t to ) при P1 > 0. Если система является стабилизируемой и обнаружи- обнаруживаемой, то при установившемся законе управления критерий C.241) равен ~zT(t)R3I(t)+ur(t)R2u(t)]dt = zT(t0)P~x(t0), C.242) где z и u° — управляемая и входная переменные соответственно, определяемые установившимся законом управления. Докажем, что установившийся закон управления минимизирует не только критерий C.240), но и C.241). Предположим, что существует дру- другой закон управления, который дает меньшее значение критерию
Оптимальные линейные СУ с обратной связью 281 C^241), так что при этом законе управления имеет место неравен- неравенство со [zT(t)Rsz(t)+uT(t)Riu(t)]dt + lim xT (*,) /»!*(*,) < xT (t0) P~x (ta). C.243) j to Из неравенства Рг >¦ 0 следует, что при этом законе управле- управления с обратной связью имеем zT(t) R3z(t) + uT(t) R2u(t)] dt<4(gPx(t0). C.244) Поскольку известно, что левая часть этого выражения миними- минимизируется с помощью установившегося закона управления и может быть достигнута величина критерия, не меньшая Хт (to)PX(to), то приходим к противоречию, так как критерий C.241) тоже дол- должен минимизироваться с помощью этого установившегося закона управления. Тем самым доказывается часть (е) теоремы. Обратимся снова к части (б) теоремы. Утверждение части (б) непосредственно следует из части (е). Рассмотрим теперь часть (в). В общем случае алгебраическое уравнение Риккати имеет много решений (см. задачу 3.8). Если Р существует, то оно явля- является неотрицательно определенным решением алгебраического уравнения Риккати, так как Р должно быть решением дифферен- дифференциального уравнения Риккати C.215). Предположим, что система C.213) является стабилизируемой и обнаруживаемой, и пусть Р'— некоторое неотрицательно определенное решение алгебраического уравнения Риккати. Рассмотрим дефференциальное уравнение Риккати C.215) с конечным условием P(t) = P', t <. t. Тогда решение в установившемся состоянии Р должно также определять- определяться решением Р'. Этим доказывается, что любое неотрицательно определенное решение Р' алгебраического уравнения Риккати является установившимся решением Р, поэтому установившаяся величина Р является единственным неотрицательно определенным решением алгебраического уравнения Риккати. Тем самым закан- заканчивается доказательство части (в) и всей теоремы в целом. Примечание. Завершим этот раздел следующими комментария- комментариями. Части (б) и (в) теоремы устанавливают, что стабилизируемость и обнаруживаемость являются достаточными условиями сходи- сходимости уравнения Риккати к одной матрице Р при всех Рг > О, а также того, чтобы алгебраическое уравнение Риккати имело единственное неотрицательно определенное решение. То, что
282 Глава 3 эти условия не являются необходимыми, можно увидеть из простых примеров. Кроме того, вполне возможен случай, что в отсутствие Р су- существует F = UmRTlBTP(t). C.245) Нетрудно сделать вывод, что установившийся закон управле- управления u(t) = —Fx(t): если он существует, изменяет расположение только таких полюсов разомкнутой системы, которые являются одновременно управляемыми и восстанавливаемыми. Поэтому может возникнуть нежелательная ситуация, когда система имеет -неуправляемые и невосстанавливаемые полюса, в особенности, когда эти полюса неустойчивы. К сожалению, обычно невозможно изменить структуру системы так, чтобы сделать неуправляемые полюса управляемыми. Если система имеет полюса невосстанав- ливаемостцх нежелательным расположением, то во многих случаях можно выбрать новые управляемые переменные таким образом, чтобы система уже не имела таких полюсов. 3.4.4*. РЕШЕНИЕ ЗАДАЧ СИНТЕЗА РЕГУЛЯТОРА С ПОСТОЯННЫМИ ПАРАМЕТРАМИ МЕТОДОМ ДИАГОНАЛИЗАЦИИ В этом разделе будет предпринято дальнейшее исследование устойчивого решения задачи^ синтеза регулятора с постоянными параметрами. Это позволяет разработать метод определения ус- устойчивого решения уравнения Риккати и, кроме того, подойти к вопросу получения информации о полюсах замкнутой системы и поведении регулятора в замкнутом контуре. В этом разделе будем полагать, что разомкнутая система является стабилизируемой и обнаруживаемой. В разд. 3.3.2 было показано, что задачу синтеза регулятора можно решить, анализируя линейное дифференциальное уравне- уравнение \) C.246) P{t)j где Z — постоянная матрица Zb^bT) C-247> Здесь Rt = DTR3D. Соответственно имеем граничные условия x(to) = xo, C.248а) C.2486)
Оптимальные линейные СУ с обратной связью 283 Из разд. 3.3.2 и 3.3.3 [уравнение C.92)] известно, что p(t) и x(t) связаны соотношением p(t) = P(t)x(t), C.249) где P(t) — решение матричного уравнения Риккати с конечным условием P(ti) = jPj. Выберем теперь Л = ~Р, C.250) где Р — установившееся решение уравнения Риккати. Тогда, очевидно, уравнение Риккати имеет, решение Р(*У=Р, «0<«<«1. C.251) Из этого следует, что установившееся решение можно полу- получить путем замены конечного условия C.2486) начальным условием Р (*„)=?* (д. ' C.252) Решение дифференциального уравнения C.246) с начальными условиями C.248а) и C.252) дает установившееся поведение пере- переменной состояния и сопряженной переменной. Исследуем решение этой задачи методом диагонализации мат- матрицы Z. Можно показать с помощью элементарных преобразований определителя, что det(— si — Z) = det(s/ — Z). C.253) Следовательно, det(s/ — Z) является полиномом относительно s2, откуда следует, что если % — характеристическое число матри- матрицы Z, то —% тоже характеристическое число. Для простоты пред- предположим,, что все характеристические числа являются различными (более общий случай представлен в задаче 3,9). Это позволяет провести диагонализацию матрицы Z следующим образом: Здесь А— диагональная матрица, которая образуется следу- следующим образом. Если характеристическое число % матрицы Z имеет строго положительную часть, то оно является диагональным элементом матрицы А. Характеристическое число —% автоматически располагается в матрице—А. Если % имеет нулевую вещественную часть, то одно характеристическое число из пары %, —% произволь- произвольно назначается матрице А, а другое— матрице—А. Матрица W образована собственными векторами Z; г-й вектор-столбец W явля- является собственным вектором Z, соответствующим характеристи- характеристическому числу в г-м диагональном положении diag (A, —А). Рассмотрим теперь дифференциальное уравнение
284 Глава 3 C.255) \z2(t)J \0 ~AJ\z2(t)J где NjgU^-i^W). C.256) \z2{t)J \p(t)) v Разделим матрицу W~x следующим образом: \^21 "ti Тогда можно написать Zl @ = Vux(t) + Vi2p(t) = (Ун + Vi2P)x(t). C.258) Известно, что установившееся решение устойчиво, т. е. x(t) -> -> Опри? -> сю. Это также предполагает, что z^t) -> Опри< -> ->- оо. Из уравнения C.255), однако, следует, что МО^^М*»). C.259) Так как все характеристические числа матрицы X имеют нуле- нулевые или положительные вещественные части, то z^t) может схо- сходиться к нулю, если только z^it^) = 0. Согласно выражению C.258) это соответствует всем х0 тогда и только тогда, когда Р удовлетворяет соотношению VH + Vi2P = 0. C.260) Если матрица F12 несингулярна, то уравнение можно разре- разрешить относительно Р следующим образом: ( '~P=-VTi Vn. C.261) В любом случае Р должно удовлетворять уравнению C.260), Предположим, что C.260) не имеет единственного неотрицатель- неотрицательно определенного решения Р, и пусть Р' является одним из неот- неотрицательно определенных решений. Рассмотрим теперь дифферен- дифференциальное уравнение C.246) с конечным условием P'xit,). C.262) Можно записать решение в форме P(t)J \W2l C.263)
Оптимальные линейные СУ с обратной связью 285 где матрица W также разделена. Подстановка C.262) дает х (t) \ (W W \ ( еА ('~''' О P(t)) = [w2i wJ\0 e~ C.264) Учитывая, что Р' является решением уравнения C.260), по- получим х (t) =Wize~x {t~tl) (F21 -г F22P') x (*,), C.265a) p (t) = W22e~A {t~U) (F21 + F22p') x (tj). C.2656) При t = t0 первое из этих уравнений сводится к виду г XV р~к Со—'0 /у \у р/\ T(f\ /Q Ойй\ Поскольку двухточечная краевая задача должна иметь реше- решение для всех х0, матрица, связывающая х0 с лг(^), должна быть несингулярной (в противном случае это уравнение не будет иметь решения, если х0 не находится в диапазоне, допустимом для этой матрицы). Действительно, так как любое t < tt можно рассматри- рассматривать как начальный момент времени на интервале [t, tj, матрица W^e~K {t~h) (F21 + F22P') C.267) должна быть несингулярной для всех t <: ti. Решая уравнение C.265а) относительно x(ti) и подставляя решение в C.2656), по- получим р (t) = W22e~A <'-''> (F21 + F22P') (F21 + V^P'T1 eHf-h) WT2l x (t) C.268) или в соответствии с работой [134] п/Л W Ш~1 -г lt\ /Q 9fiQ\ y \У) — г г 22 12 ™ \") • (O.j?U?71 Решая двухточечную краевую задачу с конечным условием Р(^) = Р', получим решение в виде C.270) л где Р — константа. Так как это решение не зависит от конечного л _ времени tu Р также является установившимся решением Р уравне- уравнения Риккати при ti -> сю. Поскольку , как известно из теоремы 3.7, это установившееся решение является единственным, нельзя не сделать вывод, что ^ C.271)
286 Глава 3 Из этого следует, что матрица PF12 не является сингулярной, а Р можно представить в форме C.271). Поскольку разделенные блоки матриц V и W взаимосвязаны, можно также показать, что Vt2 является несингулярной матрицей, и, как следствие, вы- выражение C.261) является точным (задача 3.11.12). В дополнение к этим результатам можно получить следующий интересный результат. Решая уравнение C.266) относительно x(ti) и подставляя решение в C.265а),получим. х @ = Wi2e~L {t-U)W7? х0. C.272) Это показывает, что характеристические числа замкнутой сис- системы в установившемся состоянии являются диагональными эле- элементами матрицы — Л [134]. Поскольку известно, что замкнутая система асимптотически устойчива, диагональные элементы мат- матрицы —Л имеют строго отрицательные вещественные части. Так как эти характеристические числа получаются из характерис- характеристических чисел матрицы Z, это означает, что Z не может иметь ха- характеристических чисел с нулевой вещественной частью, а харак- характеристическими числами замкнутой системы в установившемся состоянии являются характеристические числа Z с отрицатель- отрицательными вещественными частями [108]. Подытожим эти выводы сле- следующим образом. Теорема 3.8. Рассмотрим задачу построения детерминирован- детерминированного линейного оптимального регулятора с постоянными парамет- параметрами и предположим, что пара {А, В} является стабилизируемой и восстанавливаемой, а пара {А , D} обнаруживаемой. Определим матрицу размером 2п X 2п 2lBT\ C273) и предположим, что Z имеет 2п различных характеристических чисел. Тогда а) Если % — характеристическое число матрицы Z, то —X также является характеристическим числом. Матрица Z не имеет характеристических чисел с нулевыми вещественными частями. б) Характеристические числа оптимального замкнутого регу- регулятора в установившемся состоянии являются' характеристичес- характеристическими числами Z с отрицательными вещественными частями. в) Если матрица Z диагонализирована в форме где диагональная матрица Л имеет в качестве диагональных эле-
Оптимальные линейные СУ с обратной связью 287 ментов характеристические числа Z с положительными вещест- вещественными частями, то установившееся решение уравнения Риккати C.215) можно записать в виде Р = W22WT2l = -V^VU, C.275) где Wи и V't,, i, j = 1, 2, получаются путем разделения.матриц W и V = W~l соответственно. В обоих выражениях существует обратная матрица. г) Реакцию замкнутого регулятора в установившемся состоянии можно записать в виде x{t) = Wi2e^{t-U)WT2X0. . C.276) Метод диагонализации, рассмотренный в настоящем разделе, далее развивается в задачах 3.11.8—3.11.12. 3.5. Численное решение уравнения Риккати 3.5.1. ПРЯМОЙ МЕТОД ИНТЕГРИРОВАНИЯ В этом разделе будут рассмотрены различные методы числен- численного решения уравнения Риккати, которые имеют исключительно важное значение для задачи синтеза регулятора, а также, как будет видно из гл. 4, для задачи оценки состояния. Матричное уравнение Риккати определяется выражением -P(t) = Rt (t) ~P(t)B @ /?"' (t) BT(t) P (t) + + AT(t)P(t) + P(t)A(t) ' ' C.277) с конечным условием Прямой метод решения основан на представлении уравнения C.277) в виде системы п2 нелинейных дифференциальных уравне- уравнений первого порядка [в предположении, что P(t) — матрица п. X п) и использовании любого стандартного численного метода интегрирования уравнений в обратном времени, начиная с момен- момента tt. Наиболее простым методом численного интегрирования яв- является метод Эйлера P(t — At)~P(t)-^P(t)At, C.278) по которому вычисляется матрица P(f) в моменты t = tt — At, ti — 2Д? .... Если решение сходится к постоянной величине,
288 Глава 3 как это обычно бывает в случае системы с постоянными парамет- параметрами, то необходимо ввести условие остановки. Недостатком этого метода является то, что для обеспечения достаточной точности обычно требуется весьма малая величина At, приводящая к боль- большому числу шагов. Кроме того, из-за ошибок вычислений наруша- нарушается симметрия матрицы P(t), что можно устранить путем симмет- симметрирования после каждого шага, т. е. путем замены P(t) на (V2) \P{t) + Рт (t)]. Симметрию матрицы P(t) можно использовать, заменяя уравнение C.277) системой (V2)n (п + 1) дифференциаль- дифференциальных уравнений первого порядка и получая в результате существен- существенную экономию машинного времени. Более детальный анализ ме- метода прямого интегрирования можно найти в работе [29]. Метод прямого интегрирования применим к системам с пере- переменными и постоянными параметрами. Если требуется найти лишь установившееся решение для задач е переменными параметрами, то более эффективными оказываются методы, рассмотренные в разд. 3.5.3 » 3.5.4. Наконец, отметим следующее обстоятельство. Чтобы реализо- реализовать закон управления с переменной настройкой, необходимо за- запоминать все значения F(t) при t0 < t <: tt. По-видимому, целе- целесообразно поступать следующим образом. Матрицу P(t0) можно вычислить путем интегрирования в ускоренном масштабе времени. Затем уравнение Риккати C.277) интегрируется в реальном масш- масштабе времени с начальным условием P(tQ) и определяется матрица усиления обратной связи в реальном времени из соотношения F(t) = R2~1(t)BT (t)P(t). Этот метод обычно приводит к неудовлет- неудовлетворительным результатам, однако интегрирование уравнения Риккати C.277) в прямом направлении неустойчиво, что вызывает возрастающие со временем ошибки вычислений [8бГ. 3.5.2. МЕТОД КАЛМАНА — ЭНГЛАРА Если необходимо получить полное решение уравнения Риккати с постоянными параметрами, то используется обычный метод [91], основанный на следующем выражении, получаемом из C.98): Р Ум) = [©и Ум> *i) + %г Ум, td P(t,)] [Qu Цм, ti) + + Bit(t-M,tt)Pyt)r1, C.279) где ti+i = tt—At. C.280) Матрицы Qtj (t, t0). получаются путем разделения переходной матрицы 0(?, t0) системы
Оптимальные линейные СУ с обратной связью 289 C.281) \p(t)J \p(t)J где *-( ? -ВЩТ). C.282) \~DTS,D -Ат ) Матрицу Q(ti+i, tt) можно вычислить однажды, так как C.283) Это выражение можно оценить по методу разложения в ряд (разд. 1.3.2). Решение уравнения Риккати тогда находится путем многократного использования выражения C.279). При этом после каждого шага целесообразно проводить симметрирование. Если интервал At выбран слишком большим, то возникает труд- трудности вычислений, обусловленные несингулярностью матрицы, обращаемой в выражении C.279). В работе [171] эти трудности рассматриваются более детально. В этой работе показано, что если вещественные части характеристических чисел Z сильно различа- различаются по величине, то необходимо использовать очень малый ин- интервал At. В большей части задач этот интервал выбирается доста- достаточно малым, чтобы получать точные результаты. Однако время вычислений при этом может быть большим, особенно если иссле- исследуется установившееся решение. 3.5.3*. РЕШЕНИЕ МЕТОДОМ ДИАГОНАЛИЗАЦИИ Чтобы найти установившееся решение уравнения Риккати с постоянными параметрами, целесообразно использовать резуль- результаты, полученные в разд. 3.4.4 методом диагонализации матрицы Z размером In X In. Асимптотическое решение тогда определя- определяется выражением Р = W2iWT2l, C.284) где W22 и Wi2 получаются в результате разделения матрицы W: n wi2)- <3-285> 21 VY 22/ Матрица W состоит из собственных векторов матрицы Z, об- образованных таким образом: первые п столбцов матрицы W соот- соответствуют характеристическим числам Z с положительными ве- вещественными частями, а последние п столбцов матрицы W — ха- характеристическим числам матрицы Z с отрицательными веществен- вещественными частями.
290 Глава 3 Обычно некоторые или все собственные векторы матрицы Ъ могут быть комплексными. Тогда W2i и WiZ также могут быть ком- комплексными матрицами. Операции с комплексными числами можно избежать следующим образом. Так, если е — собственный вектор Z, соответствующий характеристическому числу % с отрицательной ве- вещественной частью, то комплексно-сопряженный вектор е также является собственным вектором, соответствующим характеристи- характеристическому числу % с отрицательной вещественной частью, а послед- последние п столбцов матрицы W будут содержать кроме вещественных вектор-столбцов только комплексно-сопряженные пары вектор- столбцов. В этом случае всегда можно выполнить такое несингу- несингулярное линейное преобразование W \ I W 12 1 / 12 C-286) при котором каждая пара комплексно-сопряженных вектор-столб- дов е и е в col(WiZ, PF22) заменяется на два вещественных вектора Re(e) и Im(e) в-col (W12, W'^)- Тогда справедливо соотношение W'aW\fl = (WnU) (Wi2U)-i = WnW?, C.287) из которого следует, что для вычисления Р можно использовать W' %г и W & вместо W22 и Wi2. Систематизируем метод определения Р: а) Образуется матрица Z и используется любой стандартный численный метод вычисления собственных векторов, соответству- соответствующих характеристическим числам с отрицательными веществен- вещественными частями, б) Из этих п собственных векторов образуется In X п-матрица U). C.288) где W'2i и W22 есть п X n-блоки матрицы. Если е — вещест- вещественный собственный вектор, то пусть е будет одним из столбцов матрицы C.288). Если е и е образуют комплексно-сопряженную па- пару, то пустьRe(e) будет одним из столбцов матрицы C.288), a Im(e) — другим ее столбцом. в) Вычисляется р = W'^W'if1. C.289) Эффективность этого метода зависит от эффективности подпро- подпрограммы вычисления собственных векторов матрицы Z. В работе [170] предложен алгоритм вычисления собственного вектора, кото-
Оптимальные линейные СУ с обратной связью ' 291 рый особенно эффективен для задач такого типа. Этот алгоритм, как подчеркивалось выше, успешно использовался для решения уравнений Риккати высокого порядка [19, 65, 71]. 13 работе [59] представлена рациональная модификация этого метода. Метод диагонализации можно также исдользовать не только для нахождения асимптотического решения уравнения Риккати, но и для исследования всего поведения матрицы P{f), используя соотношения из задачи 3.11.11. Другой метод вычисления асимптотического решения Р сос- состоит в использовании тождества (ем. задачу 3.11.10) ' C.290) где i|) (s) определяется путем факторизации det(s/ — Z) = 9(s)9(— s) C.291) таким образом, что корни <p(s) точно являются характеристичес- характеристическими числами Z с отрицательными вещественными частями. Оче- Очевидно, что cp(s) является характеристическим полиномом замкну- замкнутой оптимальной системы в установившемся состоянии. Здесь det(s/—Z) можно получить с помощью алгоритма Леверье (разд. 1.5.1) или стандартным методом определения характеристических чисел матриц. В работе [65] приведены результаты успешного ис- использования этого метода, а в работах [19, 71] получены отрица- отрицательные результаты. 3.5.4*. РЕШЕНИЕ МЕТОДОМ НЬЮТОНА—РАФСОНА В этом разделе рассматривается метод определения установив- установившегося решения уравнения Риккати с постоянными параметрами, который существенно отличается от предыдущих методов. Метод основан на многократном решении линейного матричного уравне- уравнения вида 0 = АТР + РА + R, ' C.292) которое рассматривалось в разд.' 1.11.3. Установившееся решение Р уравнения Риккати должно удов- удовлетворять алгебраическому уравнению Риккати О = /?± — PSP + АТР + РА, C.293) где S = BR^BT. C.294)
292 Глава 3 Рассмотрим матричную функцию F(P) = Ri~ PSP+ATP +PA. C.295) Задача заключается в определении неотрицательно определен- определенной симметрической матрицы Р, удовлетворяющей условию F[P~) = 0. C.296) Построим итерационную процедуру. Предположим, что на к-м шаге получено решение -Pk, которое мало отличается от искомо- искомого решения Р. Тогда напишем P = Ph + P. C.297) Если Р является малой величиной, то можно аппроксимировать F(P), опуская квадратические члены в Р. Тогда получим F (Р) ~ R, - PhSPh ~ PkSP - PSPh + AT (Ph + P) + + {Ph + p)A. C.298) Суть метода Ньютона — Рафсона заключается в оценке Р, когда правая часть выражения C.298) приравнивается к нулю. Если полученную таким образом оценку Р обозначить через Ph и приравнять PM = Pk + Pk, C.299) то найдем, полагая правую часть C.298) равной нулю, О = R, + PkSPh + Pk+iAk + AlPh+i, C.300) где Ak = A — SPk. C.301) Уравнение C.300) имеет такой же вид, как и уравнение C.292), для решения которого существуют эффективные методы (см. разд. 1.11.3.). Таким образом, получаем следующий алгоритм: а) выбираем соответствующую матрицу Ро и полагаем номер итерации А: равным 0; б) определяем Pk+1 из уравнения C.300); в) если достигается сходимость, то производим остановку; в противном случае увеличиваем к на единицу и возвращаемся к п. «б>>. В работах [94, 120] показано, что если алгебраическое уравне- уравнение Риккати имеет единственное неотрицательно определенное ре- решение, то Pk и Pft+i удовлетворяют неравенству Ph,i<Pk> k = 0, U 2, C.302)
Оптимальные линейные СУ с обратной связью 293 lim Ph = Р C.303) А-*оо при условии, что матрица Ро выбрана таким образом, что выраже- выражение Ао = А — 5Р0 C.304) асимптотически устойчиво. Это означает, что сходимость решения обеспечивается, если начальная схема выбрана правильно. Если начальная оценка выбрана некорректно, то может наб- наблюдаться сходимость к произвольному решению алгебраического уравнения Риккати'или вообще она может не достигаться. Если матрица Л асимптотически устойчива, то целесообразным выбором является Ро =0. Если А не является асимптотически устойчи- устойчивой, то выбор начального приближения может представить опре- определенные трудности. В работах [96, 122, 189] даны методы выбора Ро для случая, когда выражение для А не является асимптотичес- асимптотически устойчивым. Основные трудности в этом методе связаны с уравнением C.292), которое должно решаться многократно. Хотя это урав- уравнение является линейным, его численное решение может оказаться трудоемким, так как число линейных уравнений, которые должны решаться на каждой итерации, быстро возрастает с увеличением размерности задачи (для п = 15 это число равно 120). В разд. 1.11.3 обсуждались различные численные методы решения урав- уравнения C.292). В работах [18, 94, 95] освещается опыт успешного использования метода Ньютона — Рафсона для решения уравне- уравнений Риккати в задачах с размерностью до 15. ii.fi. Задачи стохастического линейного оптимального регулирования и слежения 3.6.1. ЗАДАЧИ РЕГУЛИРОВАНИЯ ПРИ ВОЗМУЩЕНИЯХ — СТОХАСТИЧЕСКИЕ ЗАДАЧИ РЕГУЛИРОВАНИЯ В предыдущих разделах была рассмотрена детерминированная задача линейного оптимального регулирования. Решение этой задачи позволяет точно рассчитать переходные процессы в том случае, когда линейная система имеет возмущенное начальное состояние и необходимо вернуть систему в нулевое состояние с максимальной быстротой при ограничении на амплитуду входного воздействия. Существуют практические задачи, которые могут быть сформулированы в такой постановке, однако большинство составляют задачи, в которых возмущения действуют на систему
294 Глава 3 непрерывно и стремятся вывести систему из нулевого состояния. В таких случаях задача состоит в разработке структуры обратной связи, с помощью которой с максимальным быстродействием сни- снижаются начальные отклонения, а также, насколько это возможно, компенсируется воздействие возмущений в установившемся сос- состоянии. Решение этой задачи позволит синтезировать регуляторы, которые были необходимы в гл. 2. Введем на некоторое^ время предположение, что полное состоя- состояние системы можно точно наблюдать в любой момент времени. Влияние возмущений можно учесть путем соответствующего рас- расширения вектора состояния системы. Рассмотрим систему, описы- описываемую уравнениями z(t) = A(t)x(t)+B(t)u(t)+v(t), - C.305) z(t) = D(t)x(t), где u(t) — входная переменная, z(t) — управляемая перемен- переменная, a v(t) — возмущения, действующие на систему. Представим математически возмущения в виде стохастических процессов, ко- которые будем моделировать как выход линейной системы, возму- возмущаемой, белым шумом. Тогда предположим, что v(t) определяет- определяется выражением v(t) = Dd(t)xd(t). C.306) Здесь xd(t) — решение уравнения x.d (t) = Ad (t) xd (t) +w(t), C.307) где w(t) — белый шум. Кроме того, предположим, что x(t0) и xd(t0) — стохастические переменные. Объединим описание системы и возмущений, вводя расширен- расширенный вектор состояния x(t) — co\[x{t), xd(t)], который, как можно увидеть из C.305) — C.307), удовлетворяет уравнению ~ (A (t) Dd (t) \~ (B(t)\ / 0 При расширенном описании системы управляемая переменная определяется выражением • z(Q = (D(t),O)x(t). C.309) Отметим, что уравнение C.308) описывает систему, которая не является полностью управляемой по и. Обратимся вновь к критерию оптимизации. В детерминирован- детерминированной задаче регулирования рассматривался интегральный квадра-
Оптимальные линейные СУ с обратной связью 295 тический критерий и J [ zT (t) R3 (t) z (t) + uT (t) Rt (t) и (t)] dt + xT (ti) Ptx (h). C.310) и Для заданного воздействия u(t), tQ <: t <: ti, и заданной реа- реализации возмущений v(t), t0 <: t < <if этот критерий является мерой отклонений z(t) и u(t) от нуля. Однако априорно этот крите- критерий нельзя оценить из-за стохастической природы возмущений. Поэтому проводится осреднение по всем возможным реализациям и рассматривается критерий Е IJ [ zT (t) Ra (t) z (t) + uT (t) R2 (t) и (*)] dt + xT (*,) PlX (*i)J . C.311) Используя расширенный вектор состояния x(t) == xd(t)], этот критерий можно представить в виде E f f [ zT (t) R3 (t) z (t) + uT (t) R2 (t) u(t)]dt+x* C.312) где * = [% 2). C-313) Очевидно, что задача минимизации критерия C.3t2) для систе- системы C.308) является лишь частным случаем общей задачи миними- минимизации Е \ f [zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt + xT (<j) Ptx fa) 1 C.314) I v I для системы 'x(t) = A (t) x(t)+B (t) u(t) + w (t), C.315) где w(t) — белый шум, a x(t0) — стохастическая переменная. Назовем эту задачу задачей построения стохастического линейного оптимального регулятора. Определение 3.4. Рассмотрим систему, описываемую дифферен- дифференциальным уравнением состояния x(t) = A (t) x(t)+B (t) u(t) + w (t) C.316)
296 Глава 3 с начальным состоянием и управляемой переменной z(t)=D(t)x(t). C.317) C.318) В уравнении C.316) w(t) — белый шум с интенсивностью V(t). Начальное состояние х0 является стохастической величиной, не зависящей от белого шума w, с Qo. . C.319) Рассмотрим критерий Elf[zT (<) Ra (t) z (t) + uT (t) R2 (t) и (*)] dt + xT где R3(t), R%(t) — положительно определенные симметрические матрицы для t0 < t <: tu a Pi— неотрицательно определен- определенная симметрическая матрица. Тогда задача определения для любо- любого момента t, t0 <: t <: tt, такого входного воздействия u(t) в виде функций всей прошлой информации, при котором критерий достигает минимума, называется задачей построения стохастиче- стохастического линейного оптимального регулятора. Если в такой поста- постановке задачи все матрицы являются постоянными, то эту задачу назовем задачей построения стохастического линейного оптималь- оптимального регулятора с постоянной настройкой. Решение этой задачи рассматривается в разд. 3.6.3. Пример 3.11. Смесительный бак В примере 1.37 (разд. 1.11.4) была расширена модель смеси- смесительного бака, в которой учтены возмущения в форме флуктуации концентрации потоков. Расширенная модель системы описывается уравнением s(t) = -— О 26 0 0 О О —4- О 0 i- x(t)
Оптимальные линейные СУ с обратной связью 297 1 Сю — Со va 0 0 1 С20 — с0 va 0 ' 0 u(t) + 0 1 _0 0 0 0 1 w(t), C.321) где w(t) — белый шум с интенсивностью Ь_ о о fi C.322) Здесь компонентами вектора состояния являются соответст- соответственно приращение объема жидкости, изменение концентрации смеси в баке, концентрации потока Ft и концентрации потока Ft. Рассмотрим сначала в качестве компонент управляемой перемен- переменной приращение выходного потока и выходной концентрации. Тогда получим /— о о о = ( 29 И')- 10 0, C.323) Задача синтеза стохастического оптимального регулятора за- заключается в определении такой входной переменной u(t), при кото- которой критерий вида Е К [ zT (t) Raz (t) + uT (t) R2u (t)} dt + xT (tt) Pix (tM C.324) достигает минимума. Весовые матрицы R3 и i?2 выбираются точно так же, как и в примере 3.9 (разд. 3.4.1), а матрица Pj выбирается нулевой. .3.6.2. СТОХАСТИЧЕСКИЕ ЗАДАЧИ СЛЕЖЕНИЯ Задача построения стохастического оптимального регулятора была сформулирована при рассмотрении задачи регулирования с возмущениями. Стохастические задачи регулирования возника-
298 Глава 3 ют также при постановке стохастических оптимальных задач сле- слежения. Рассмотрим линейную систему x(t) = A(t)x(t)+B(t)u(t) ¦ C.325) с управляемой переменной z(t) = D (t) x (t). C.326) Предположим, что управляемая переменная должна быть мак- максимально близка к эталонной переменной zr(t), которая рассмат- рассматривается как выходная" переменная линейной дифференциальной системы, возбуждаемой белым шумом, zr(t) = Dr(t)x,(t) C.327) с xr(t) = Ar(t)xr(t)+w{t). C.328) Здесь w(t) — белый шум с заданной интенсивностью V(t). Уравнения системы и эталонной модели можно объединить, вводя расширенный вектор состояния x(t) = col[x(t), xr(t)], удовлетво- удовлетворяющий уравнению ' ~ (AU) 0 \ ~ [B(t)\ ( 0 \ V 0 AT{t)J V 0 ) \w(t)J Заметим, что эта система [так же, как и C.308)] не является полностью управляемой по и. Чтобы синтезировать оптимальную следящую систему, рас- рассмотрим критерий Е ttl{[z(t)-zr(t)]TR3(t)[z{t)~zr(t)} + (и + uT(t)R2(t)u(t)}dt\, C.330) где Rs{t), Rz(t) — соответствующие весовые матрицы. Этот кри- критерий характеризует меру отклонения от эталонной переменной при ограничении амплитуды входной 'переменной. При R3{t) = = We(t) и R2(t) = p Wu(t) критерий упрощается: fC.(t)±tCu(Wdt, C.331) где Ce(t) и Cu(t) — среднее значение квадрата ошибки слежения и
Оптимальные линейные СУ с обратной связью ' 299 среднее значение квадрата входной переменной соответственно, как и в гл. 2 (разд. 2.3): Ce(t) = E[eT(t)We(t)e(t)}, C.332) Cu(t) = E{uT(t)Wu(t)u(t)}. Здесь e(t) — ошибка слежения, e(t) = z(t) — zr(t). C.333) Весовой коэффициент р должен выбираться таким образом, чтобы получить наименьшее возможное среднее значение квадрата ошибки слежения при заданной величине среднего значения квадрата входной переменной. Критерий C.330) можно выразить через компоненты расширен- расширенного вектора состояния x(t) в следующем виде: Е |' [ 7Т (t) Я3 (t)~z (t) + ит (t) R2 (t) и (*)J dt\, C.334) где 7(t) = {D(t), -Dr(t))Z(t). C.335) Задача минимизации критерия C.334) для системы C.329), очевидно, является специальным случаем стохастической задачи синтеза оптимального линейного регулятора в соответствии с оп- определением 3.4. Не входя в детали, укажем, что задачи слежения с возмуще- возмущениями могут быть сведены к стохастическим задачам регулирова- регулирования методом обновления состояния. В заключение отметим, что подход, использованный в этом раз- разделе, полностью согласуется чс гл. 2, в которой рассматривались эталонные переменные с переменной и постоянной частями. В сле- следующем разделе примем постоянную часть равной нулю; в разд. 3.7.1 будем рассматривать ненулевые постоянные эталонные пе- переменные. Пример 3.12. Система управления угловой скоростью Рассмотрим систему управления угловой скоростью из приме- примера 3.3 (разд. 3.3.1). Предположим, что угловая скорость, которая является управляемой переменной С(От Должна отслеживать по возможности точно эталонную переменную (,r(t), которую можно представить в виде экспоненциально коррелированного шума с постоянной времени Э и среднеквадратическим значением с*. Тогда эталонный процесс можно описать выражением (см. пример 1.36, разд. 1.11.4)
300 Глава 3 где %r(t)— решение уравнения ,C-337> Белый шум w(t) имеет интенсивность 2ст,2/Э. Так-как дифферен- дифференциальное уравнение состояния системы имеет вид E(*)==-ag(*) + 4*(*), C.338) то дифференциальное уравнение расширенного состояния можно записать следующим образом: *(*)=! 0 L ИН h(t)+[ k@. C.339) где x(t) — col[?(?),. %r(t)]. В качестве критерия оптимальности примем Е J j [[С (О -<:Г (f)]2 + Ptt2 (*I ^^ 1. C.340) где р — соответствующий весовой коэффициент. Этот критерий можно представить в виде f [ ] C-341) где Г(*) = A, —1) а:(*). C.342) Задача минимизации критерия C.341) для системы, описываемой уравнениями C.339) и C.342), является задачей стохастического оптимального регулирования. 3.6.3. РЕШЕНИЕ ЗАДАЧИ СИНТЕЗА СТОХАСТИЧЕСКОГО ЛИНЕЙНОГО ОПТИМАЛЬНОГО РЕГУЛЯТОРА В разд. 3.6.1 была поставлена задача синтеза стохастического линейного оптимального регулятора. Эта задача (определение 3.4) существенно отличается от детерминированной задачи регули- регулирования, поскольку из-за белого шума невозможно точно предска- предсказать поведение системы. Поэтому, очевидно, лучше не определять априорно входное воздействие u{t) для всего периода управления [t0, tj, а последовательно анализировать ситуацию в каждый про- промежуточный момент времени t на основе всей располагаемой ин- информации.
Оптимальные линейные СУ с обратной связью 301 В момент времени t дальнейшее поведение' системы полностью определяется текущим состоянием x(t), входным воздействием и(т) при т > t и белым шумом w(i) при % :> t. Вся информация из прошлого, которая относится к будущему, содержится в сос- состоянии x(t). В связи с этим рассмотрим закон управления вида u(t) = g[x(t),t], C.343) который определяет входное воздействие для всех возможных состояний в моменты t. Использование таких законов управления предполагает, что все компоненты вектора состояния можно точно измерить в любой момент времени. Как указывалось выше, такое предположение является нереальным, тем более в стохастическом случае, когда вектор состояния может включать компоненты, описывающие воз- возмущения или эталонную переменную. Маловероятно, что эти ком- компоненты можно легко измерить. Преодоление этой трудности будет рассмотрено позднее, после гл. 4, в которой исследуются вопросы восстановления состояния по неполным и неточным измерениям. В предыдущих разделах было получено решение детерминиро- детерминированной задачи регулирования в форме обратной связи C.343). Для стохастического варианта задачи получен неожиданный ре- результат, состоящий в том, что присутствие белого шума w(t) в уравнении C.316) не изменяет решения, за исключением увеличе- увеличения минимальной величины критерия. Сформулируем сначала этот результат, 'а затем рассмотрим доказательство. Теорема 3.9. Оптимальное линейное решение задачи построе- построения стохастического линейного оптимального регулятора состоит в выборе входного воздействия в соответствии с линейным законом управления u(t) = — F°(t)x{f), C.344) где F° (t) = ВТ1 (t) ВТ (t) Р (*)." - C.345) Здесь P(t) — решение матричного уравнения Риккати -P(t) = Ri(t) + Al с конечным условием -P(t)B (t) ВТ1 n(t)P(t) + Р (*,) = P(t) Л- Как и обычно; использовано обозначение ВМ ) = DT(t)j F? (t). (t)B A(t) D(t). T (*) P(t) + C.346) C.347) C.348)
302 Глава 3 Минимальная величина критерия определяется выражением tr Гр (*0) Qo + \ Р (t) V(t)dt\. C.349) Отметим, что эта теорема дает только наилучшее линейное решение стохастической задачи регулирования. Поскольку мы .ограничиваемся рассмотрением линейных систем, это вполне удовлетворительно._]Однако можно доказать, что линейный закон / с обратной связью является оптимальным, если белый шум w(t) ' является гауссовским [6, 102, 103]. —- Для доказательства теоремы предположим, что система управ- управляется с помощью линейного закона u(t) = — F(t)x(t). C.350) Тогда замкнутая система описывается дифференциальным урав- уравнением (t) + w(t), C.351) и для критерия C.320) можно написать Е I j1 xT (t) [ Я, (t) + FT (t) R2 (t) F (*)] x (t) dt + xT (tt) iV (tt)\ . C.352) Из теоремы 1.54 (разд. 1.11.5) следует, что критерий можно выразить в виде tr \р (t0) Qo + f1 P (t) V (t) dt\ , C.353) где P(t) — решение матричного дифференциального уравнения ~P(t) = [A (t) ~B(t)F (OF P(t) + P (t) [A @ - В (t) F @1 + + Rl(t)+FT(t)Ri(t)F(t) , C.354) с конечным условием P (О = Pt. C.355) Лемма 3.1 (разд. 3.3.3) устанавливает, что P(t) удовлетворяет условию P(t)>P(t) C.356)
Оптимальные линейные СУ с обратной связью 303 для всех t0 < t < tu где P(t) — решение уравнения Риккати C.346) с конечным условием C.347). Неравенство C.356) преобра- преобразуется в равенство, если F выбирается в виде F° (х) = ЯГ' @ Вт (т) Р (х), t < т < *,. C.357) Из неравенства C.356) следует tr [Р (О Г ] > tr [Р @ Г] C.358) для любой неотрицательно определенной Матрицы Г. Видно, что критерий C.353) минимизируется путем выбора F в соответствии с C.357). Для такого выбора F критерий C.353) задается в форме C.349). Тем самым завершается доказательство того, что закон управления C.345) является оптимальным линейным законом уп- управления. Теорема 3.9 позволяет решать различные типы задач. В разд. 3.6.1 и 3.6.2 было показано, что стохастическая задача линейного оптимального регулирования может возникать в регулируемых системах с возмущениями и в задачах оптимального слежения. В обоих случаях эта задача имеет специальную структуру. Рас- Рассмотрим теперь кратко свойства решений, которые следуют из этих специальных структур. Для случая регулирования при воздействии возмущений диф- дифференциальное уравнение состояния и уравнение для выходной переменной записываются в форме C.308), C.309). Предположим, что решение P(t) уравнения Риккати C.346) разделено в соответ^ ствии с разделением вектора x(t) = col[a:(?), xd(t)]: /Pit (t) Pi2 (t)\ P{t)^( ;iW 12U . C.359) \Pl(t) Pn(t)j Если соответственно матрица оптимальных коэффициентов усиления обратной связи разбита в виде = №@. *">(*)), C.360) то нетрудно показать, что F, @ = ^@^@^11@. C.361) Кроме того, путем разделения уравнения Риккати можно найти, что PiU Pi2 и Р22 являются решениями матричных дифференци- дифференциальных уравнений
304 Глава 3 Белый шум W Звено прямой связи Динамика возмущений \ и ) возмущение V Объект X В Здено обратной связи Ряс. 3.14. Структура оптимального регулятора с обратной связью при воз- возмущениях. - Pu (t) = DT (t) R3 (t) D (t) - Pu (t) В (t) R? (t) BT (t) Pu {t) + AT(t)Pli(t)^Pil(t)A(t), - Pia (t) = Pu (t) Dd (t) + [A (t) - В (t) Fi (t)f Pi2 (t) + Plt(t)Aa(t), C.362) Pi»(*i) = 0, C.363) -Pn(t) = - Pi(t) В (t) ЯГ1 (t) BT(t) Pn (t) + Dl (t) Pa (t) + + PTt (t) pd (t) +_ Al (t) P22 (t) + P22 @ Ad (t), C.364) Видно, что Рц, а следовательно, и Ft полностью не зависят от
Оптимальные линейные СУ с обратной связью 305 свойств возмущений и определяются путем решения детермини- детерминированной задачи регулирования при отсутствии возмущений. Пос- После того как определены Рц и Ft, можно решить уравнение C.363) с целью определения Pi2, а затем и F2. Структура системы управ- управления приведена на рис. 3.14. Очевидно, что обратная связь, т. е. связь от состояния х к входному воздействию и, полностью не зависит от свойств возмущений. Прямая связь, т. е. связь от сос- состояния возмущений^ к управлению и, конечно, зависит от свойств возмущений. Аналогичный вывод можно сделать для задач оптимального слежения. В этих случаях оказывается, что для дифференциаль- дифференциальных уравнений состояния и для входной переменной со структурой C.329) и C.335) матрицу усиления обратной связи можно разбить на блоки F0(t) = (Fi(t), —Ft(f)) , C.365) (заметим, что введен знак минус), где Fi(t) = RT1(t)BT(t)Pii(t), F2(t)=-RTl(t)BT(t)Pl2(t). C.366) Здесь матрицы Рц, Pi2 и Р22 получены путем разбиения матри- матрицы Р соответственно разбиению x(t) = col[x(t), xr(t)\. Эти матрицы удовлетворяют матричным дифференциальным уравнениям - Ри (*) = DT (t) R3 (t) D (t) - Pu (t) В (t) ДГ1 (t) BT (t) PH (t) + + AT(t)Pti(t) + Plt(t)A(t), P (t.) = 0, C.367) - Plt (t) = - DT (t) R3 (t) Dr (t) + [A (t) - В (t) Fi (t)f PiZ (t) + + Pit(t)Ar(t), Ра(*д = О, C.368) - PM (t) = DTT (t) R3 (t) Dr (t) - Pi (t) В (t) RTl (t) BT (t) Pi2 (t) + + AUt)Pn(t) + Ptt(t)A,(t)t Pn(td = Q. C.369) Можно сделать вывод, что для оптимальной системы слежения обратная связь также не зависит от свойств эталонной перемен- переменной, тогда как на прямую связь, конечно, оказывают влияние свой- свойства эталонной переменной. Схема оптимальной системы слежения представлена на рис. 3.15. 11—394
306 Глава 3 белый шум w ¦ Звено прямой связи Звено обратной связи Рис. 3.15. Структура оптимальной системы слежения с обратной связью Вернемся вновь к общей стохастической задаче оптимального регулирования. На практике обычно встречаются случаи, когда интервалы управления очень велики. Это означает, что представ- представляет интерес случай, когда tt -*- оо. В детерминированной зада- задаче регулирования было показано, что обычно уравнение Риккати C.346) имеет установившееся решениеP(t)при ti= -*- оо и что ус- установившийся закон управления F(t) является оптимальным для полубесконечных интервалов управления. Можно предположить [1031, что установившийся закон управления является оптималь- оптимальным для стохастического регулятора в том смысле, что миними- минимизирует критерий lim _i_ E\([zT (t)R3 (t) z (t) -f uT (t) i?2 (t) и (*)] dt] C.370) <l-»oo h—t0 J Ко / (если это выражение существует для установившегося закона уп- управления) в сравнении с другими управлениями, для которых су- существует выражение C.370). Для установившегося закона управ- управления критерий C.370) определяется в виде 1 '• г- 1 Нт —i_ I" tr [P (t) V (t)\ dt, tt-*-oa t\ — to J C.371) если это выражение существует [ср. с C.349I. Кроме того, уста- установлено, что для стохастической задачи регулирбвания с посто- постоянными параметрами и асимптотически устойчивого закона уп- управления с постоянной настройкой выражение C.370) равно lim Е (z (t) Raz(t) + и (t) Rzu(t) ' 1 C.372)
Оптимальные линейные СУ с обратной связью 307 Из этого непосредственно следует, что установившийся закон управления минимизирует критерий C.372) по сравнению со всеми другими законами управления с постоянной настройкой. Из C.371) видно, что минимальная величина критерия C.372) определяется выражением tr(PF). C.373) Видно, что если Rs = We и R2 = р Wu, где We и Wu — весовые матрицы в средних значениях квадратов ошибки слежения и вход- входного воздействия (как определено в разд. 2.5.1), то выражение C.372) точно равно С»„ + рС»«- C.374) Здесь Свсо— установившееся среднее значение квадрата ошибки слежения, а Си<х> — установившееся среднее значение квадрата входного воздействия. Чтобы. вычислить Се™ и Cum отдельно, как это обычно требуется, необходимо вывести полные уравнения замкнутой системы и получить из них дифференциальное уравне- уравнение для матрицы дисперсий состояния. Из этой матрицы дисперсий можно определить все необходимые среднеквадратические величи- величины. Пример 3.13, Регулятор смесительного бака В примере 3.11 была описана стохастическая задача регулиро- регулирования, возникшая при рассмотрении смесительного бака. В до- дополнение к численным значениям примера 1.2 (разд. 1.2.3) примем следующие значения величин: 94 = 40 с, 92=50 с, C.375) О( = 0,1 кмоль/м3, • а2 = 0,2 кмоль/м3. Так же как и в примере 3.9 (разд. 3.4.1), запишем весовые мат- матрицы й3 и й2 в следующем виде: 50 0 \ /JL 0\ . Я2 = р 3 . C.376) 0 0,02/ \ 0 3 / гдер необходимо выбрать; Как и в примере 3.9, оптимальный за- закон управления был определен для р = 10, 1 и 0,1, однако ре- результаты здесь не приведены. Конечно, оказалось, что коэффици- 11*
308 Глава 3 енты усиления обратной связи по переменным состояния объекта не изменяются при учете возмущений в модели системы. Это оз- означает, что полюса замкнутой системы являются точно такими же, как и в табл. 3.1. Чтобы более детально оценить характеристики системы, вы- вычислим матрицу ковариаций для установившегося состояния = limE{x(t)xT(t)} C.377) из матричного уравнения '0= [A — BF)Q + Q(A— Bl)T C.378) Матрицу ковариаций входного воздействия в установившемся состоянии можно определить следующим образом: limE {u(t)uT(t)} = И Тт\ FQFT = FQFT. C.379) Из этих матриц ковариаций можно легко вычислить средне- квадратические значения компонент управляемой переменной и входного воздействия. В табл. 3.2 приведены результаты вычисле- Таблица 3.2 Среднеквадратические значения в задаче регулирования смесительного бака р оо 10 1 0,1 Установившиеся среднеквадратпческие значения Приращение выходного рас- расхода. М3/С 0 0,0001038 0,00003303 0,000004967 Приращение концентрации, кмоль/м3 0,06124 0,03347 0,008238 0,001127 Приращение входного расхода, м'/с №. 1 0 0,0008957 0,001567 0,001769 № 2 0 0,0006980 0,001487 0,001754 ний. Из таблицы наглядно видно, что с уменьшением р флуктуа- флуктуации выходной концентрации становятся все меньше и меньше. Флуктуации выходного потока, обусловленные управлением, в итоге также уменьшаются вместе с р. Все это происходит, конечно, за счет увеличения флуктуации входных потоков. Из практичес-' ких соображений необходимо решить, какая величина р является наиболее рациональной.
Оптимальные линейные СУ с обратной связью 309 Пример 3.14. Система отслеживания угловой скорости Рассмотрим задачу отслеживания угловой скорости, постав- поставленную в примере 3.12. Чтобы решить эту задачу, разработаем специальную структуру задачи отслеживания. Из C.365) находим, что оптимальный закон слежения определяется соотношением V- (t) = - Fi (t) | (*) + Fz{t\lr (t).i C.380) Коэффициент обратной связи Fi(t) не зависит от свойств эта- эталонной переменной и фактически уже был определен в предыдущих примерах, где рассматривалась задача регулирования угловой скорости. Из примера 3.7 (разд. 3.4.1) следует, что установившая- установившаяся величина коэффициента обратной связи определяется выраже- выражением Г 2+ — V C.381) а установившееся значение Ри равно C.382) Из (S.368) следует, что установившееся значение Р12 можно вы- вычислить с помощью уравнения ^i2--j-Pn. C.383) В результате получаем * C-384) f Тогда •х. f C-385) Наконец, решение уравнения C.369) для Р22 Дает Р . C.386)
310 Глава 3 Выберем следующие численные значения: а = 0,5 с, х = 150 рад/(В • с2), .6 = 1 с, C.387) о = 30 рад/с, р = 1000 рада/(В2 • с2). Тогда получим следующие численные результаты: F{ = 0,02846, F (- 0,1897 P = V—0,1733 Из C.373) получаем lim [?{C2(O}+pS{[* t-*oa где C@ = ?@ — ?/¦(*)• Так как в /0 0 \ F = (^o ^ij^ то находим , = 0,02600, — 0,1733\ 0,16217 ' 2@f] = tr(PF), данной задаче /0 0 \ : 1 0 1800 Г \ / C.388) C.389) C.390) C.391) - lim [е {Г2 (*)} + рЯ ((J.2 (*)}¦] = 291,8 рад2/с2. C.392) Можно использовать соотношение C.392), чтобы получить приближенные оценки среднеквадратическои ошибки слежения и средНеквадратической величины выходного напряжения в следую- следующем виде. Сначала из C.392) имеем lim Е {Т2 It) ) < 291,8 рад2/с2. • C.393) И-з этого следует, что установившаяся среднеквадратическая ошибка слежения < 17,08 рад/с. " C.394) Аналогично из C.392) следует lim Я {(л,2 @) <-^^- = 0,2918 В2. C.395) t-+oo Р
Оптимальные линейные СУ с обратной связью 311 Делаем вывод, что установившаяся среднеквадратическая величина входного на- напряжения < 0,5402 В. C.396) Точные значения среднеквадратическои ошибки слежения и среднеквадратическои величины входного напряжения можно най- найти путем вычисления матрицы ковариации состояния x(t) замкну- замкнутой расширенной системы в установившемся состоянии. Эта сис- система описывается уравнением 0 ~т) \°J Vv C.397) или a *Fi^yx{t) + Qw{t), C398) Матрица Q ковариации x(t) в установившемся состоянии яв- является решением матричного уравнения /—а — xF, *Fa\ / —a — *F, 0 0 = Численное решение дает /497,5 608,4 \ О = . C.400) - V608'4 900,0/ Установившееся среднее значение квадрата ошибки слежения определяется следующим образом: НтЯ{[|(*)-|,(')]2} = 9н-2^12 +~&2 =180,7 рад2/с2, C.401) гДе Qtj — входы матрицы Q. Аналогично среднее значение квад- квадрата входного воздействия описывается выражением ^^ . = 0,1110 В2. - C.402)
312 'Глава 3 В табл. 3.3 сравниваются оцениваемые и фактические средне- квадратические значения. Кроме того, указаны среднеквадрати- ческие значения для разомкнутой системы, т. е. среднеквадрати- ческие значения для случая, когда вообще нет управления. Видно, что оцениваемые среднеквадратические ошибка слежения и вход- входное напряжение весьма приближенные, но .они дают наглядное представление о порядке величин. Более того, видно, что управ- Таблица 3.3 Численные результаты для системы отслеживания угловой скорости Система Разомкнутый контур Оцениваемый замкнутый контур Фактический замкнутый контур Установившееся среднеквадратическое значение ошибки слежения, рад/с 30 <17,08 13,44 Установившаяся среднеквадратическая величина входного напряжения, В 0 <0,5402 0,3333 ление малоэффективно, так как среднеквадратическая ошибка слежения 13,44 рад/с не является малой в сравнении со средне- квадратической величиной эталонной переменной 30 рад/с Сред- Среднеквадратическая величина входного воздействия весьма мала, однако она, по-видимому, еще может быть уменьшена. Этого мож- можно достичь, выбирая гораздо меньшую величину р (см. задачу 3.5). Проверим теперь эталонную переменную и полосу пропускания замкнутой системы в настоящем примере. Частота срыва для эта- эталонной переменной равна 1/0 = 1 рад/с. Подставляя закон управ- управления в уравнение системы, найдем для замкнутой системы Это система первого порядка с частотой срыва а2 + — = 4,769 рад/с. C.403) C.404) Так как спектральная плотность эталонной переменной, явля- являющейся экспоненциально коррелированным шумом, относительно медленно уменьшается с ростом частоты, разность частот срыва эталонной переменной и замкнутой системы недостаточно велика для получения малой ошибки слежения.
Оптимальные линейные СУ с обратной связью 313 3.7. Системы регулирования и следящие системы с пену левыми заданными точками и- постоянными возмущениями 3.7.1. НЕНУЛЕВЫЕ ЗАДАННЫЕ ТОЧКИ При рассмотрении задач регулирования и слежения до сих пор предполагалось, что нулевое состояние всегда является желае- желаемым равновесным состоянием системы. На практике, однако, почти во всех случаях желаемою равновесное состояние, которое будем называть заданной точкой пространства состояний, характеризу- характеризуется постоянной точкой, не совпадающей с началом координат. Такое отличие можно исключить, если сместить начало координат пространства состояний в зту точку. Так, обычно и поступали в рассмотренных примерах. В настоящем разделе, однако, будет рассмотрен случай, когда заданная точка не является фиксиро- фиксированной, т. е. предполагается, что заданная точка постоянна на длительных интервалах времени, но время от времени она смеща- смещается. Такая ситуация на практике является типовой. Ограничимся анализом системы с постоянными параметрами. Рассмотрим линейную систему с постоянными параметрами, опи- описываемую дифференциальным уравнением состояния х (t) = Ax (t) -+- Би @, C.405) где управляемая переменная определяется выражением z (i) = Dx (i). C.406) Предположим, что заданная точка управляемой переменной есть z0. Тогда для того, чтобы привести систему в зту точку, необ- необходимо определить постоянное входное воздействие ы0, которое удерживает состояние в точке лг0, так что [52] z0 = Dx0. C.407) Из дифференциального уравнения состояния следует, что х0 и и0 должны быть связаны соотношением 0 = Ах0 + Ви0. C.408) Может ли быть система переведена в заданную точку, зто зави- зависит от того, можно ли решить соотношения C.407) и C.408) отно- относительно щ для заданного z0. К этому вопросу мы еще вернемся, а сейчас предположим, что решение существует. Определим смещен- смещенное входное воздействие, смещенное состояние и смещенную управ- управляемую переменную соответственно:
314 Глава 3 x'{t) = x(t) — x0, C.409) z'(t) = z(t)-z0. Решая эти уравнения относительно u, х и z, подставляя получен- полученный результат в дифференциальное уравнение состояния C.405) и уравнение для выходной переменной C.406) и используя C.407) и C.408), нетрудно установить, что смещенные переменные удов- удовлетворяют уравнениям x'(t)=Ax'(t) + Bu'(t), C.410) z' (t) = Dx' (t). Предположим теперь, что в определенный момент времени за- заданная точка скачком смещается. Тогда в параметрах смещенных уравнений C.410) система приобретает ненулевое начзльное сос- состояние. Для того чтобы система достигла новой заданной точки регулярным образом, предлагается оказывать такое воздействие на переходный процесс, чтобы достигал минимума критерий оп- оптимальности ( [z'T(t) Raz' (t) + и'Т (t) R2u' (t)] dt + x'T (h) P±x' (*,). C.411) Предположим, что смещенная задача регулирования имеет установившееся решение в форме асимптотически устойчивого установившегося закона управления с постоянной настройкой u'(t) = — Fx'{t). ¦ C.412) Использование этого закона управления, гарантирует, что (в параметрах исходной системы) система переходит в новую заданную точку с максимальной скоростью и без чрезмерно больших амп- амплитуд входного воздействия. Посмотрим теперь, какую форму принимает закон управления в параметрах исходной системы. Из уравнений C.412) и C.409) получаем и (t) = —~Fx (t) + щ+ Far,,. C.413) Отсюда следует,, что закон управления имеет вид u (t) =—Fx (t) -t- и'д, C.414) где необходимо опрзчелить постоянный вектор и'о таким образом, чтобы в установившемся состоянии управляемая переменная z{t)
Оптимальные линейные СУ с обратной связью 315 достигала заданной величины z0. Рассмотрим вопрос о том, при каких условиях можно найти и'о. Подстановка выражения C.414) в дифференциальное уравне- уравнение системы дает х (t) = (A —BF) х (*) + Ви'о . C.415) Так как замкнутая система асимптотически устойчива, то при t -*¦ оо состояние достигает установившихся значений х0, которые удовлетворяют уравнению о + Ви'0. C.416) Введем обозначения 2= A—BF. C.417) Поскольку замкнутая система асимптотически устойчива, все характеристические числа матрицы А находятся в левой области комплексной плоскости, и поэтому А несингулярна. Тогда урав- уравнение C.416) можно решить относительно х0: х0 = (— А)'1 Ви'о. _ C.418) Для достижения заданной точки управляемой переменной z0 необходимо, чтобы выполнялось условие C.419) При решении уравнения относительно и'о с заданной величиной г0 необходимо выделить три случая. а) Размерность г больше, чем и. Тогда C.419) решается только для отдельных значений z0, а общее решение не существует. В этом случае следует пытаться управлять переменной z(t) при мень- меньшей размерности входного воздействия u(t). Поскольку имеется слишком мало степеней свободы, неудивительно, что для .об- .общего случая решение найти нельзя.' б) Размерности uuz одинаковы, т. е. имеется достаточное число степеней свободы для управления системой. В этом случае C.419) можно решить относ тельно м'опри условии, что матрицаD(—А)~1В несин гулярна. Находим выражение щ=\0{-1)-хВ\-хг„ C.420) которое определяет оптимальное входное воздействие дош системы слежения ( [Л(— 1)"*В]~Ч. C.421) в) Размерность z меньше, чем и. В этом случае существует слиш-
316 Глава 3 ком много степеней свободы и C.419) имеет много решений. Мо- Можно-выбрать одно из этих решений, однако более рационально заново сформулировать задачу слежения, добавляя компоненты в управляемую переменную. На основе этих соображений будем впредь предполагать, что dim (z) = dim (и), C.422) т. е. имеет место случай (б). Получаем д(_1)-1Б = Яс@), . C.423) где _ Hc{s) = D{sI — А)'1 В, C.424) Назовем Hc(s) матричной передаточной функцией [переда- [передаточной матрицей) замкнутой системы, поскольку она является матрицей перехода от u'(t) к z(t) для системы х (t) = Ах @ + Ви (t), z(t) = Dx(t), C.425) Оптимальный закон управления C.421) можно записать через Нс @) в следующем виде: u(t) = —Fx(t) + H71 @) z0. C.426) Как было показано, этот закон управления обладает тем свойст- свойством, что после ступенчатого изменения заданной точки г0 система переводится в новую заданную точку с максимально возможной быстротой без чрезмерно больших амплитуд входного воздействия. Кроме того, этот закон управления, конечно, возвращает систему в заданную точку из любого начального состояния оптимальным образом. Назовем C.426) оптимальным законом управления при ненулевой заданной точке. Этот закон обладает тем свойством, что статически разделяет систему управления, т. е. передаточная матрица T(s) от заданной точки z0 к управляемой переменной z удовлетворяет условию Т@) = /. Рассмотрим теперь вопрос, при каких условиях Нс@) имеет обратную матрицу. Покажем, что это свойство можно выяснить непосредственно из уравнений разомкнутой системы х (t) = Ax (t) + Ви (t), C.427) z(t) = Dr(t). Рассмотрим следующую цепь равенств: det [Яс (s)] = det [D {si — A +BF)'1 В] =
Оптимальные линейные СУ с обратной связью 317 = det [D (si — А)'1 {/+ BJ(sI — А)'1}'1 В] = = det [D (si — Ay* {I—BF~[l + + (si — A)-* BF]'1 (si — Ay*} B] = = det[D(sI — A)-iB]det[l— F {si — Л+5^)~гв] = = det [D (si — A)-1 B] det [i — (si — A + Bl)'1 BF\ = = det [D(sI—A^B]det [{si—A + BF)'1 ]det(s/— 4)= det (si — A + BF) 4c Здесь дважды используем лемму 1.1 (разд. 1.5.3). Полином t|»(s) определяется выражением det [#(«)]= i^-, C.429) 9 (s) где H(s) — передаточная матрица разомкнутой системы H(s) = D (si — Ay* В, C.430) a cp(s) "~" характеристический полином разомкнутой системы Ф (s) = det (si — А). C.431) Наконец, срс (s) — характеристический полином замкнутой сис- системы Фс (s) = det (si — А + Bl)." C.432) Из. C.428) видно, что нули передаточной матрицы замкнутой системы такие же, как и у передаточной матрицы разомкнутой системы. Видно также, что определитель ' det [D {-А)'1 В] = det[Яс@)] = ±?L C.433) равен нулю тогда и только тогда, когда ф@) = 0. Таким обра- образом, условие ф@) Ф 0 гарантирует, что матрица D(—А)~1В несин- несингулярна; следовательно, закон управления при ненулевой задан- заданной точке существует. Эти результаты можно суммировать в сле- следующем виде. Теорема 3.10. Рассмотрим систему с постоянными параметрами x(t) = Ax(t)+Bu(t), C.434) z {t) = Dx (t),
318 Глава 3 где z и и имеют одинаковую размерность. Рассмотрим некоторый асимптотически устойчивый закон управления с постоянной настройкой u(t) = -~ Fx {?) + и' (t). C.435) Обозначим через H(s) передаточную матрицу разомкнутой системы H(s) = D (si — А)-1 В, C.436) а через Нс (s) — передаточную матрицу замкнутой системы Нс (s) => D (si — А + BF)'1 В. C.437) Матрица Нс @) является несингулярной, а величина управляе- управляемой переменной z(t) при установившихся условиях может поддер- поддерживаться равной z0 с помощью и' (t) = Я71 @) z0 C.438) тогда и только тогда, когда H(s) является полиномом с ненулевым числителем, который не имеет нулей в начале координат. Отметим, что эта теорема формулируется для любого асимпто- асимптотически устойчивого закона управления, а не только для-устано- для-установившегося оптимального закона управления. 1 В этом разделе были рассмотрены только детерминированные задачи регулирования. В стохастических задачах регулирования (включая задачи слежения), конечно, также могут быть ненулевые заданные точки. Теория, рассмотренная в этом разделе, исполь- используется для стохастических задач регулирования без модификации. Оптимальный закон управления для стохастического регулятора при ненулевой заданной точке также определяется выражением и' (t) = Fx (t) + #7' @) z0. C.439) Пример 3.15. Система управления положением Рассмотрим систему управления положением из примера 3.4 (разд. 3.3.1). В примере 3.8 (разд. 3.4.1) был получен оптимальный установившийся закон управления. Нетрудно определить на осно- основе результатов примера 3.8, что передаточная функция замкнутой системы имеет вид He(s) .!__' ^ . C.440) V р р Из C.435) и C.438) следует, что оптимальный закон управле-
Оптимальные линейные СУ с обратной связью 319 ния при ненулевой заданной точке определяется выражением г= /0,1 F= 1,0, = -^rb(*)-f -a У? x \ где Со — заданная точка для углового положения. Это выражение точно совпадает с законом управления C.171), который был полу- получен в примере 3.8 из элементарных соображений. Пример 3.16. Смесительный бак В качестве примера многомерной системы регулирования рас- рассмотрим задачу регулирования смесительного бака из примера 3.9 (разд. 3.4.1). При р = 1, где р определяется так же, как в примере 3.9, задача регулирования приводит к определению матрицы установившихся коэффициентов усиления обратной связи: ,1009 -6,09708^ C 442) ,01681 0.05475J* @Л^> Нетрудно установить, что соответствующая передаточная мат- матрица замкнутой системы определяется выражением Нс (s) = D (si — А + BF)~l В а. = 1 / 0,01s + 0,0007475 0,01s + 0,001171 \ *а + 0,2131s + 0,01037 \— 0,25s — 0,01931 0,75s + 0,1084 )• C.443)' Из оптимального закона управления при ненулевой заданной точке можно найти —0,1171 \„ гз 444^ 0.07475J °" ( ; На рис. 3.16 показана реакция замкнутой системы на ступен- ступенчатые изменения элементов заданной точки г0. Здесь заданная точ- точка для выходного потока изменяется на 0,002 ms/c, что составляет 10% номинальной величины, тогда как для выходной концентра- концентрации заданная точка изменяется на 0,1 кмоль/м3, что соответствует 8% номинальной величины. Заметим, что в системе управления проявляется в некоторой степени динамическое взаимовлияние, или взаимосвязь, т. е. изменение заданной точки по одной из ком- компонент управляемой переменной непосредственно влияет на дру-, гую компоненту. Однако это влияние невелико.
320 Глава 3 о,оогг 0,002 0.1 г- I 0 Ьл 50 Рис. 3.16. Реакции смесительного бака'как системы регулирования с ненуле- ненулевой заданной 4 точкой. Слева — реакции по приращению расхода и концентрации выходного потока на ступенча- ступенчатое изменение расхода 0,002 м3/с; справа — реакции по приращению расхода и концентра- концентрации на ступенчатое изменение концентрации 0,1 кмоль/м'. 3.7.2*. ПОСТОЯННЫЕ ВОЗМУЩЕНИЯ В этом- разделе рассмотрим метод компенсации влияния посто- постоянных возмущений в системах регулирования с постоянными па- параметрами. Как было показано в гл. 2, в системах регулирования и слежения, где требуется высокая точность, важно полностью исключить постоянные возмущения. Этого можно добиться, ис- используя свойства интеграла. Введем интегрирование в управле- управление с обратной связью путем первоначального расширения обыч- обычной задачи регулирования, а затем рассмотрим влияние постоян- постоянных возмущений в соответствующей модифицированной схеме зам- замкнутой системы управления. Рассмотрим систему с постоянными параметрами, описываемую дифференциальным уравнением состояния x(t)^Ax(t)+Bu(t) C.445)
Оптимальные линейные СУ с обратной связью 321 при заданном x(t0) и управляемой переменной C.446) Добавим к параметрам системы «интегральное состояние» [131, 140, 161], определяемое соотношением q(t) = z(t) C.447) при заданном q{t0). Тогда можно рассмотреть задачу минимизации критерия вида оо [ zT (t) R3z (t) + qT @ R'3 q (t) + uT (t) R2u (t)] dt, C.448) где /?з, R3', R2 — соответствующим образом выбранные весовые матрицы. Первый подынтегральный член сводит управляемую пе- переменную к нулю, тогда как второй член минимизирует величину интеграла, т. е. общая площадь под кривой реакции управляе- управляемой переменной стремится к нулю. Третий член, как обычно, используется для ограничения амплитуды входного воздействия. Предположим, что путем минимизации выражения C.448) или с помощью другого метода определен закон управления с по- постоянными параметрами !»(*) = - Ftx (t) -[F2q (t), C.449) который стабилизирует расширенную систему, описываемую урав- уравнениями C.445) — C.447). Отложим в данное время рассмотрение вопроса о том, при каких условиях существует такой асимптоти- асимптотически устойчивый закон управления. Предположим, что в системе присутствует постоянное возмущение. Тогда дифференциальное уравнение состояния C.445) необходимо заменить на уравнение x(t) = Ax(t) + Bu(t) + v0, C.450) где v0 — постоянный вектор. Так как присутствие постоянного возмущения не влияет на асимптотическую устойчивость системы, то lim q (t) = 0 C.451) t-*co или из C.447) lim z (t) = 0. C.452) Это означает, что система управления с асимптотически устой- устойчивым законом управления C.449) обладаетп^таким свойством, что влияние постоянных возмущений на управляемую переменную в
322 Глава 3 x=Ax+Bu : h X J 4 , Рис. 3.17. Схема системы интегрального управления с обратной связью. конце концов исчезает. Так как это достигается за счет введения ин- интеграла состояния q, такая схема системы управления имеет форму интегрального управления. На рис. 3.17 представлена схема ин- интегрального управления. Рассмотрим процесс подавления постоянного возмущения. Целью интегрирования по многим переменным C.447) является формирование постоянной составляющей и0 во входном воздейст- воздействии, которая компенсирует влияние постоянного возмущения на управляемую переменную. Рассмотрим реакцию системы C.450) на входное воздействие и (*)*= — Ftx (t) + и0. C.453) Подстановка этого выражения в дифференциальное уравнение состояния C.450) дает C.454) х (t) = (А — BFt) х (t) + Ви0 + v0. Предполагается, то в равновесных условиях^ имеется постоянная составляющая состояния х0, которая должна удовлетворять соот- соотношению где 0 = Ах0 + Ви0 + v0, — BFt. C.455) C.456) Решение для х0 дает х0 = (— ly^-Buo + (—~A)~lvQ C.457) при условии, что матрица А несингулярная. Соответствующая рав- равновесная величина управляемой переменной z0 определяется вы- выражением z0 = Dxo = D (—I) Ви0 + D{— J)'1 v0. C.458)
Оптимальные линейные СУ с обратной связью 323 Если теперь рассмотреть вопрос о том, существует ли величина щ, которая обеспечивает равенство z0 = 0, то, очевидно, получим такие же'условия, как и в разд. 3.7.1, соответствующие следую- следующим трем случаям. а) Размерность z больше, чем и. В этом случае уравнению Q = D{—l)~1Bu0 + D(—A)~1v0 C.459) соответствует число уравнений, которое больше числа переменных. Это означает, что решение для общего случая не существует. Число степеней свободы слишком мало, и установившуюся ошибку по z нельзя исключить. б) Размерность z равна размерности и. В этом случае решение существует тогда и только тогда, когда матрица D [— А)'1 В = Не @) C.460) несингулярна, где Hc(s) = D{sI — 1)~1В C.461) есть передаточная матрица замкнутей системы. Как следует из теоремы 3.10, матрица Нс @) является несингулярной тогда и толь- только тогда, когда передаточная матрица разомкнутой системы H(s) = = D(sl — А^В не имеет нулей в начале координат. в) Размерность z меньше размерности и. В этом случае имеется слишком много степеней свободы, и размерность z можно увели- увеличить путем добавления компонент в управляемую переменную. На основе этих соображений ограничимся случаем dim(z) = = dim(w). Проведенный анализ показывает, что необходимое усло- условие для успешной работы рассматриваемой схемы интегрального уп- управления состоит в том, что передаточная матрица разомкнутой системы H(s) = D(sl — А)'1 В не должна иметь нулей в начале координат. Действительно, путем некоторого развития результатов работы [144], включающих каноническое представление системы C.445) в форме управляемости, можно показать, что необходимые и достаточные условия для существования асимптотически устойчи- устойчивого закона управления в форме C.449) состоят в том, что: 1) система C.445) должна быть стабилизируема и 2) передаточная матрица разомкнутой системы H(s) = D(sl — А)~1В не должна иметь нулей в начале координат. В работах [45, 144] показано, что. необходимые и достаточные условия для произвольного размещения полюсов замкнутой систе- системы состоят в том, что система C.445) должна быть полностью уп- управляемой, а передаточная матрица разомкнутой системы не долж- должна иметь нулей в начале координат. В работе [45] последнее усло- условие сформулировано в альтернативной форме. В литературе можно найти различные подходы .к определению
324 Глава 3 схем интегрального управления (см., например, работы [1, гл. 10; 81]). Пример 3.17. Управление положением с использованием интеграла Рассмотрим систему управления положением из предыдущих примеров и предположим, что на вход системы поступает постоян- постоянное возмущение в форме постоянного момента тона валу двигателя. Преобразуем Дифференциальное уравнение состояния C.59) к форме (! i) () (?)- СЗ-462) где у — 1U, а / — момент инерции всех вращающихся частей. Как и раньше, управляемая переменная определяется выражением С(*) = A, O)x(t), C.463) Дополним систему скалярной интегральной переменной состоя- состояния q(t), определяемой в виде д(*)-Ч(*). C.464) Из примера 3.15 известно, что передаточная функция разом- разомкнутой системы не имеет нулей в начале координат. Кроме того, система является полностью управляемой, так что не следует ожи- ожидать трудностей в определении системы интегрального управле- управления. Рассмотрим критерий оптимальности и Как и в предыдущем примере, выберем? р = 0,00002 рад2/В2. • C.466) Анализ рис. 3.9 показывает, что при отсутствии интегрального управления q(t) достигает установившийся величины около 0,01 рад-с при заданных начальных условиях. Выбирая X = 10 с, ' C.467) можно существенно влиять на схему управления. Численное решение соответствующей задачи регулирования при численных значениях примера 3.4 (разд. 3.3.1) и у~0,1кг -м позволяет определить установившийся закон управления (I (t) = - Ftx (t) - F2q (t) C.468)
Оптимальные линейные СУ с обратной связью 325 Рис. 3.18. Реакция системы интегрального управления положением на пос- постоянный момент ЮН-м на валу двигателя. Ft = B99,8, 22,37), C.469) F2 = 707,1. Соответствующие характеристические числа замкнутой системы равны —9,519 ± 7 9,222 с и —3,168 с. При сравнении с чисто пропорциональной схемой из примера 3.8 (разд. 3.4.1) отметим, что пропорциональная часть обратной связи, которую представля- представляет Fx, изменяется незначительно [ср. с C.169)], а соответствующие полюса замкнутой системы, равные —9,658 + /9,094 с в примере 3.8, перемещаются также незначительно.-На рис. 3.18 показана реакция интегральной системы управления при нулевых началь- начальных условиях на постоянный момент х0 на валу двигателя, равный ЮН -м. Максимальное отклонение углового перемещения, вызван- вызванного постоянным моментом, составляет ~0,004 рад. 3.8*. Асимптотические свойства оптимальных законов управления с постоянными параметрами 3.8.1*. АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ ПОЛЮСОВ ОПТИМАЛЬНОЙ ЗАМКНУТОЙ СИСТЕМЫ В разд. 3.2 было показано, что устойчивость линейных систем управления с обратной связью и постоянными параметрами можно обеспечить или повысить путем соответствующего размещения
326 Глава 3 полюсов замкнутой системы в левой половине комплексной плос- плоскости. Однако при этом не определялись наиболее рациональные типы размещения полюсов. В разд. 3.3 и 3.4 была изложена теория линейных оптимальных систем управления с обратной связью. Для оптимальных систем с постоянными параметрами, очевидно, интересным вопросом являются типы размещения полюсов замкнутой системы. Данный раздел посвящен изучению типов размещений полюсов. В результате будет получена по- полезная информация об ожидаемой реакции оптимальных регуля- регуляторов. Выберем в задаче регулирования с постоянными параметрами' выражение для /?2 в виде R2 = pN, C.470) где N — положительно определенная симметрическая матрица, ар — положительный скаляр. При таком выборе R2 критерий оптимальности определяется выражением со I [ zT (t) R8z (t) + pi/ (t) Nu (t)] dt. C.471) Параметр р показывает, какой вес приписывается входному воздействию; при большой величине р амплитуда входного воз- воздействия мала, а при малой величине р допускаются большие амп- амплитуды входного воздействия. Ниже рассмотрим вопрос, каким об- образом изменяется распределение полюсов оптимального замкну- замкнутого регулятора в функции р . Для этого используем методы корне- корневого годографа. В разд. 3.4.4 было показано, что полюса оптимальной замкну- замкнутой системы являются характеристическими числами матрицы Z в левой половине комплексной плоскости, где C.472) ¦DTRSD -Ar Используя лемму 1.2 (разд. 1.5.4) и лемму 1.1 (разд. 1.5.3), представим det (si—Z) в следующем виде: det (si — Z) = det I P \DTR3D si + AT = det (si — A) det \{sl + AT) — DTR3D (si — A)^ — I P = det (si — A) det {si + AT) det [/ — DTR3D (si —
Оптимальные линейные СУ с обратной связью ч 327 _ A)i~ J_ BN-iBT {si + А7)'11 = Р J = det (si —A) (— 1)" det(— si — A) det \l + + ± N-iBT {-SI-AT Y1 DTRaD (si - A)~i B] = P J = — 1)" ф (s) Ф (— s) det \l + — N~4IT (— s) RsH (s)l, C.473) где n — размерность вектора состояния х, Ф (s) = det (si — A), C.474) = D(sI— A)~lB. Для простоты сначала исследуем случай, когда входное воз- воздействие и и управляемая переменная z являются скалярами, а также Д3=1, # = 1. C.475) В конце этого раздела возвратимся к случаю многомерной системы. Из выражения C.473) следует, что в случае системы с одним входом и одним выходом (со скалярными входной и вы- выходной переменными) полюса замкнутой системы находятся в левой половине комплексной плоскости: (- 1)" Ф (•) Ф<_ ,)[i + -Lh (-}s) И (,)], C.476) где H(s) — скалярная функция. Представим H(s) в форме H(s) = ±<fL, C.477) <p(s) где ty(s) — полином. Из этого выражения следует, что полюса зам- замкнутой системы являются корнями следующего уравнения, распо- расположенными в левой половине комплексной плоскостиЗ Ф (s) ф (— s)i + — ф (*) <К— *) - 0. C.478) Р Для определения годографа полюсов замкнутой системы можно использовать два метода. Согласно первому методу, уравнение C.478) представляется в виде функции s2, s2 заменяется на s' и определяется корневой годограф в s'-плоскости. Полюса замкнутой системы затем определяются как квадратные корни в левой полу- полуплоскости из корней в s'-плоскости. Этот метод называется методом квадратичного корневого годографа [35].
328 Глава 3 Для наших целей более удобно строить годограф корней в -плоскости. Напишем C.479) ф(*)= П (*—*«)• где v,, i = 1,2, ...,р, — нули H(s), a пи i = li 2, ...,», — полюса H(s). Чтобы привести уравнение C.478) к стандартному виду, перепишем его с учетом C.479): П (* - *i) (* + *,) + (- I)""" — П (• - v,) (s + ь) = 0. C.480) ' Используя правила разд. 1.5.5, сделаем следующие выводы. а) При р -> 0 2га корней уравнения C.480) из общего числа 2 р асимптотически приближаются к р нулям Vj, i — 1, 2, ..., р, и их отрицательным значениям —vb i = 1, 2, ..., p. б) При р -> 0 другие 2(га — р) корней уравнения C.480) асимп- асимптотически приближаются к прямым линиям, которые пересекаются в начале координат и образуют с положительной вещественной осью углы, равные ——, к = 0,1,2,..., 2га — 2р — 1, га — р—нечетное число, п—р C.481) •, ft = 0,1, 2,..., 2га — 1р—1, га — р — четное число. п — р в) При р -*• 0 2(п — р) удаленных корней уравнения C.480) асимптотически удалены от начала координат на расстояние C.482) т) г) При р ->- оо 2га корней уравнения C.480) приближаются к геполюсамл i,i —1, 2, ..., re, и их отрицательным значениям —я г, i = 1,2 п. Поскольку полюса оптимальной замкнутой системы являются корнями уравнения C.480) в левой полуплоскости, можно сделать следующий вывод [87].
Оптимальные линейные СУ с обратной связью 329 Теорема 3.11. Рассмотрим установившееся решение задачи регу- регулирования для системы с одним входом и одним выходом при R3 = 1 и R2 = р . Предположим, что разомкнутая системна является ста- стабилизируемой и обнаруживаемой, а передаточная функция опреде- определяется выражением р П (» — П (* —п{) C.483) где.щ, i =1,2,..., п, — характеристические числа системы. Тог- Тогда имеем следующее. а) При р | 0 р из п характеристических чисел оптимальной замкнутой системы асимптотически приближаются к чис- числам v;, i = 1,2,..., р, где /Л ( \1 pi* я Tt \\ Л /у | **** M - I I» "ЬЛ1Ь J.IU 1 V;f -JSs- Vj o /о/\ v^ = { v C.484) I — v4, если Re(v,)>0. б) Я/7И p | 0 оставшиеся п — p характеристических чисел оптимальной замкнутой системы асимптотически приближают- приближаются к прямым линиям, которые пересекаются в начале координат и образуют с отрицательной вещественной осью уг-лы, равные ± I —-— , I = 0,1,..., п~р f и — р— нечетное число, п — р 2 C.485) (г+тЬ ' ±— —, Z = 0,1, ..., -— 1, п — р — четное число. п — р 2 Эти удаленные характеристические числа замкнутой системы асимптотически удалены от начала координат на расстояние C.486) в) Прир -*¦ оо га характеристических чисел замкнутой системы л приближаются к числам л i, i = 1, 2, ..., га, где л = f it,, если Re (it,) <s 0, 4g |—rt;, если Re(^j)>Q. Распределение полюсов, указанное в п.(б), известно как рас- распределение (размещение) Баттерворса порядка га — р с радиусом оH [175]. На рис. 3.19 указаны некоторые типы распределения
330 Глава 3 -J Рис. 3.19. Распределения полюсов по Баттерворсу первого — пятого поряд- порядков с единичным радиусом (соответственно графики 1—5). Баттерворса невысокого порядка. В следующем разделе будет рассмотрено, каким характеристикам системы соответствуют такие распределения. На рис. 3.20 приведен пример поведения полюсов замкнутой системы при гипотетическом распределении полюсов и нулей. Крестики обозначают полюса, а кружки — нули разомкнутой системы. Так как полюсов на два больше нулей, то при р \ 0 име- имеет место распределение Баттерворса второго порядка. Оставшийся полюс замкнутой системы приближается к нулю разомкнутой сис- системы при р ]• 0. При р -*¦ оо полюса замкнутой системы прибли- приближаются к единственному полюсу разомкнутой системы в левой полуплоскости и к зеркальным отражениям двух полюсов разом- разомкнутой системы в правой полуплоскости. Вернемся вновь к случаю многомерной системы. Исследуем корни уравнения
Оптимальные линейные СУ с обратной связью 331 р= р= р-0 lm Re \ \ \ Рис. 3.20. Корневой годограф характеристических чисел матрицы Z (пунктир- (пунктирные и сплошные линии) и полюсов замкнутой системы (только сплошные ли- линии) для системы с одним входом и одним выходом при фиктивном распреде- распределении полюсов (х) и нулей (О) разомкнутой системы. s) RSH (s) = 0. C.488) Ф (s) ф (— s) det Г/ -f — N-xHr L P Задача определения корневого годографа для этого выражения является не такой простой, как в случае системы со скалярной входной переменной. Анализ определителя приводит к выражению C.489) 1=0 где функции аД1/р), i = 0, 1, 2, ..., п, — полиномы 1/р. В работе 1151] указаны правила, которым необходимо следовать при опре- определении корневого годографа для такого выражения. Интерес представляет только асимптотическое поведение корней при р -*¦ ->• 0 ир -> оо. Корни уравнения C.488) являются также корнями уравнения Ф (в) Ф (— s) det ]p/ + N~WT (— s) R3H (s)] = 0. C.490)
332 Глава 3 Прир -v 0 некоторые корни стремятся к бесконечности; корни, принимающие конечную величину, достигают нулей выражения ф (») ф (_ s) det [N-iHT (— s) R3H (s)] C.491) при условии, что это выражение но равно тождественно нулю. Предположим, что H(s) является квадратной матричной переда- передаточной функцией (в разд. 3.7 было показано, что такое допущение естественно). Из разд. 1.5.3 известно, что det[tf(s)]= ^-. C.492) <?(s) .Здесь cp(s) — полином степени не больше п — к, где п — раз- размерность системы, а к — размерность и и z. Таким образом, можно записать вместо выражения C.491) det(i?3) , det(JV) YV Из этого следует, что при р | 0 корни уравнения C.490), имеющие конечные значения, приближаются к нулям передаточной функции H(s) и их отрицательным значениям. Это означает, что полюса оптимального замкнутого регулятора, которые принимают конечное значение, приближаются к нулям H(s), которые имеют отрицательные вещественные части; и к отрицательным значениям нулей, имеющим неотрицательные вещественные части. Оказывается [151], что прир \ 0 отдаленные полюса замкну- замкнутого регулятора, т. е. полюса, которые стремятся в бесконечность, обычно образуют не одно распределение Баттерворса, как в случае системы с одним входом, а несколько распределений Баттерворса различного порядка и различного радиуса (см. примеры 3.19 и 3.21). Грубую оценку расстояния от удаленных полюсов до начала координат можно получить следующим образом. Обозначим через Фс (s) характеристический полином замкнутой системы. Тогда имеем Ф (*) Фс (- *) = Ф (*) Ф (- «) det [/ + -j N-*HT (- *) ЯдЯ (*) ] . C.494) При малых значениях р правую часть этого выражения можно аппроксимировать выражением Ф («) Ф (- s) det ГJ- N-4?' (- ,) R3H ] ? C.495) где к — размерность входной переменной. Напишем
Оптимальные линейные СУ с обратной связью 333 <!>(*) = аП(*-*!)- C-496) Тогда член со старшей степенью в выражении C.491) определя- определяется выражением a2 ?et(i?3) (— 1)ps2p. C.497) pft det (iV) . Из этого следует, что полином <рс (s)cpc (—s) содержит следую- следующие члены: Фс (*) Фс (- *) = (- 1)П^Л + • • • + О? -^^ Р б C.498) Данные члены представляют собой член с наивысшей степенью s и член с наивысшей степенью 1/р. Аппроксимация удаленных корней этого полинома (при малых значениях р) определяется из выражения (_ 1)я 52Л + а2 det (дз) / Из этого следует, что полюса замкнутой системы аппроксими- аппроксимируются следующими решениями в левой полуплоскости: (Л-^,Л2(П-Р)]/2 det№)y/te^ C500) Эта аппроксимация описывает распределение Баттерворса по- порядка п — р и используется для оценки расстояния от удаленных полюсов до начала координат. Такая оценка (грубая) определяется выражением ^^HM.f2{n-p)\ C.501) p*det(.N)/ Наконец, рассмотрим поведение полюсов замкнутой системы при р -*¦ оо. В этом случае из выражения C.494) следует, что характе- характеристические числа матрицы Z приближаются к корням cp(s) <p(—s). Л Это означает, что полюса замкнутой системы достигают чисел яг, i = 1, 2, ..., п, определяемых выражением C.487). Подытожим полученные результаты для случая системы с мно- многими входами в следующем виде. Теорема 3.12. Рассмотрим установившееся решение задачи регулирования для многомерной системы с постоянными па- параметрами. Предположим, что разомкнутая система является
334 Глава 3 стабилизируемой и обнаруживаемой и что входная переменная и и управляемая переменная z имеют одинаковую размерность к, а век- вектор состояния х имеет размерность п. Пусть H(s) — (к X к)- матричная передаточная функция разомкнутой системы И'(*) = D (si ~ А)-1 В. C.502) Предположим, что <p(s) является характеристическим поли- полиномом разомкнутой системы, и напишем а П («-»|) det [Я (,)] = Ш = —i=i . C.503) Предположим, что а Ф 0, и примем R2 = pN при iV > 0, Р > 0." а) Тогда при р —*¦ 0 р полюсов оптимального разомкнутого ре- регулятора достигают значений v^, i = 1, 2, ..., р, где eW<0' C,504) —Vj, если Re(Vj)>0. Остальные полюса замкнутой системы стремятся к бесконеч- бесконечности и образуют несколько распределений Баттерворса различ- различного порядка и с различным радиусом. Грубая оценка расстояния от удаленных полюсов до начала координат определяется выражением 2{П-Р)]. C,505) б) При р —v oo n полюсов замкнутого регулятора достигают чисел л I, i = 1, 2, ..., п, где •а | к„ если 11е(иг)<0, } [—тч, если Re (тс?) >0. Закончим этот раздел следующими замечаниями. Когда р очень мало, допустимы большие амплитуды входного воздействия. В ре- результате этого движение системы может быть быстрым, что прояв- проявляется в виде большого расстояния от удаленных полюсов до на- начала координат. Очевидно, распределение полюсов по Баттерворсу дает хорошие результаты. Некоторые из полюсов замкнутой сис- системы, однако, не могут сильно удаляться и смещаются только до расположения нулей разомкнутой системы. Как будет показано ниже в этом разделе, в системах с нулями в левой полуплоскости только эти близко расположенные полюса «компенсируются»
Оптимальные линейные СУ с обратной связью 335 нулями разомкнутой системы. Это означает, что их влияние на поведение управляемой переменной не является заметным. Случай р = оо соответствует весьма сильному ограничению на амплитуду входного воздействия. Интересно отметить, что «наи- «наиболее экономичным» законом стабилизации («экономичным» с точки зрения величины амплитуды входного воздействия) является закон управления, который перемещает полюса неустойчивой системы в их зеркальное отражение в левой полуплоскости. Задача 3.11.14 даетнекоторые сведения относительно асимптоти- асимптотического поведения полюсов замкнутых систем, у которых dim{u)^ Ф dim(z). Пример 3.18. Система управления положением, В примере 3.8 (разд. 3.4.1) была исследована зависимость рас- распределения полюсов оптимальной системы управления положением от параметра р. Как было показано, полюса замкнутой системы образуют распределение Баттерворса второго порядка. Это соот- соответствует результатам данного раздела. Так как передаточная функция разомкнутой системы Н(8) = —±— C.507) *(« + «) не имеет нулей, то полюса замкнутой системы устремляются в бес- бесконечность при р | 0. Пример 3.19. Смесительный бак В качестве примера многомерной системы рассмотрим задачу регулирования смесительного бака из примера 3.9 (разд. 3.4.1). Из примера 1.15 (разд. 1.5.3) известно, что матричная передаточная функция разомкнутой системы бака определяется выражением + + , H(s) = \ I. C.508) v ' ' 025 075 ' v Для этой матричной передаточной функции имеем det [#(«)] = ^ ..' C.509) v ' (s+0,01) (s + 0,02) v Очевидно, что матричная передаточная функция не имеет ну- нулей; поэтому можно ожидать, что все полюса замкнутой системы будут смещаться в бесконечность при р \ 0. Найдем характерис- характеристический полином матрицы 2, с численными значениями Rs и N из примера 3.9: >
.436 Глава 3 + S2 / 0,5 . Ю-3 - °'02416 ) + @,4 • Ю-7 \ p / V °'7416-10'5 -0,4 -0,2 C.510) Годограф первого полюса Годограф второго полюса Рис. 3.21. Годограф корней замкнутой системы для регулятора смесительного бака. о — годограф начинается в точке —0,02; б — годограф начинается в точке —0,01. На рис. 3.21 показано поведение двух полюсов замкнутой сис- системы при изменении р. Очевидно, каждый полюс образует распре- распределение Баттерворса первого порядка. Асимптотическое поведение корней для р \ 0 можно найти, решая уравнение si 0,02416 g2 + i02 = 0) C.5H) Р Р2 которое определяет асимптотические распределения полюсов зам- замкнутой системы: 0,1373 0,07280 и — Выражение C.505) дает оценку расстояния от удаленных по- полюсов до начала координат: 0,1 VV C.513) Видно, что эта величина является геометрическим средним зна- значений C.512). Пример 3.20. Управление углом тангажа самолета В качестве более сложной системы управления рассмотрим сис- систему управления продольным движением самолета (рис. 3.22.). Это движение характеризуется скоростью и по оси х самолета, скоростью w по оси z, углом тангажа 9 и скоростью изменения
Оптимальные линейные СУ с обратной связью 337 Ось х 'Ось г ' Вертикаль Рис. 3.22. Продольное движение самолета. тангажа q —9. Оси х и z жестко связаны с самолетом. Ось х совпадает с горизонтальной осью, когда самолет совершает гори- горизонтальный установившийся полет. Управляемыми переменными в этих движениях являются тяга двигателя Т и угол отклонения руля высоты б. Уравнения дви- движения можно линеаризовать относительно номинального решения, которое представляет еобой горизонтальный полет с постоянной скоростью. Можно показать [20], что линеаризованные уравнения продольного движения не зависят от уравнений бокового движе- движения. Выберем следующие переменные состояния: ?>l(t) = u(f) — приращение скорости по оси х, I2(t) = w(t) — скорость по оси z, ?3 (t) = 9 (*) - тангаж, C.514) ?4 @ = Ч (t) — угловая скорость по тангажу. Входную переменную, обозначаемую через с, определим следу- следующим образом: C.515) Здесь T(t) — приращение тяги двигателя, a b(t) — отклонение руля высоты. 12—394
338 Глава 3 Используя эти обозначения, можно получить дифференциаль- дифференциальные уравнения на основе законов инерции и аэродинамики, опи- описывающих движение самолета [20]. Для частного случая крейсерс- крейсерского полета транспортного самолета среднего веса получим следую- следующее линеаризованное дифференциальное уравнение состояния: 0 -о, — о; 0 ,01580 ,1571 0,0005274 /с J + 1 \ 0,02633 — 1,030 0 — 0,01652 1,0006056 0 0 0 — 9,8: 0 0 0 0 -9,496 0 - 5,565 — 1,416 \c(t). C.516) Здесь используются следующие единицы измерения физических величин: ижю — м/с, 8 — рад, q— рад/с, Т — Н, б — рад. В этом примере тяга полагается постоянной, поэтому отклоне- отклонение руля высоты 6(?) является единственной управляющей пере- переменной. Тогда система описывается дифференциальным уравнением состояния '—0,01580 0,02633 х —9,810 0 — 0,1571 —1,030 0 120,5 * (*) = | 0 0 0 1 ч0,0005274 —0,01652 0 —1,466, ¦ / 0 / - 9,496 , + о |8О- <3-517> \—5,565 В качестве управляемой переменной выберем угол тангажа 9(?) 8(г) = @, 0, 1, O)x(t). C.518) Можно показать, что передаточная функция угла тангажа по отклонению руля высоты б(/) определяется выражением — 5,565s2 —5,663s —0,1112 si + 2,512s3 + 3,544s2 + 0,06487s + 0,03079 Полюса передаточной функции составляют — 0,006123 ±70,09353, C.520) — 1,250 ±/1,394,
Оптимальные линейные СУ с обратной связью 339 Im. 101 -1-10J р=0,01 -о -1 Re, с' р=100 Рис. 3.23. Годограф иолюсов замкнутой системы стабилизации по тангажу а — удаленные полюса; б — близко расположенные полюса. а ее нули равны — 0,02004 и —0,9976., C.521) . Годограф полюсов замкнутой системы можно вычислить на ЦВМ. Полюса указаны на рис. 3.23. Как и следовало оашдать, удаленные полюса образуют размещение Баттерворса второго порядка, а близко расположенные полюса замкнутой системы при- приближаются к нулям разомкнутой системы. Эта система рассматри- рассматривается в примере 3.22. Пример 3.21. Управление продольным движением самолета 12*
340 Глава 3 В примере 3.20 было рассмотрено управление тангажом само- самолета с помощью отклонения руля высоты. В данном примере рас- расширим систему за счет управления скоростью по оси х в дополне- дополнение к тангажу. Как дополнительный параметр управления исполь- используем приращение тяги двигателя T(t). Таким образом, в качестве входной переменной выберем с (t) = /^О'—приращение тяги двигателя, р 522> { b(t) — отклонение руля высоты, ^°' а в качестве управляемой переменной г /л _ fu(t)—приращение скорости по оси х, /ч 523> ( ' \ 8 (t) — тангаж. ^ " Из дифференциального уравнения состояния системы C.516) можно вычислить, что матричная передаточная функция системы имеет полиномиальный числитель ф (s) = —0,003370 (s + 1,002), C.524) которому соответствует один нуль разомкнутой системы — 1,002: Полюса разомкнутой системы равны —0,006123 ± /0,09353 и -1,250 ± /1,394. При дальнейшем анализе задачи необходимо выбрать весовые матрицы R3 и N. Предположим, что эти матрицы имеют диагональ- диагональную форму, а для определения их величин поступим таким же об- образом, как и в примере 3.9 (разд. 3.4.1) для смесительного бака. Предположим, что R3 — diag^, ctJ. Тогда zT (t) Rsz (t) = viU2 (t) + a202 (t). C.525) Примем, что отклонение величины скорости по оси х на 10 м/с оказывает такое же воздействие, как и отклонение по углу тангажа на 0,2 рад A2°). Поэтому выберем следующее соотношение между о"! и 'Ст2: о4 • 102 = а2 • 0,22, . C.526) или •^- = 0,0004. ¦ C.527) Таким образом, выбираем и /о,о2 а \ В* = [ 0 50)' • где для удобства положим det(R3) = 1. Аналогично предположим, что N = diag(pi, p2) и t) + p2b2(t). C.529)
Оптимальные линейные СУ с обратной связью 341 Чтобы определить р1 ир2, будем полагать, что изменение тяги двигателя на 500 Н допустимо так же, как и разброс отклонения руля высоты на 0,2. рад A2е). Это приводит к выбору из которого следует Pl - 5002 = р2 • 0,22, _ /0,0004 0 \ ' 0 2500/ C.530) C.531) При таких значениях R3 и N соотношение C.505) дает следую- следующую оценку расстояния до удаленных полюсов: = сг det (fl3) p&det (Л) C.532) Размещение полюсов замкнутой системы находится путем вычислений на ЦВМ. В табл. 3.4 указаны полюса замкнутой сис- Таблица 3.4 Полюса замкнутой системы обеспечения продольной •устойчивости самолета p -o 1 10 10"s 10-3 10"" 10 10~6 m-« —0,006123 —0,1734 —0,5252 —0,8877 —0,9745 —0,9814 —1,020 — 1,003 —1,002 Полюса замкнутой + /0,09353 + /0,1184 —0,2166 —0,2062 —0,2431 —0,4806 —1,344 —4,283 —42,82 СИС. ОМЫ, С —1,250 —1,203 — 1,370 —1,980 —3,484 —6,241 —11,14 — 19,83 -62,73 + /1,394 ±/1,415 +/1,564 + /2,179 + /3,609 ±/6,312 ±/11,18 ±/19,83 + /62,73 о.,, С 0 0,15 0,32 0,70 1,5 3,2 7,0 15 70 темы при различных значениях р и приведены значения оценивае- оцениваемого радиуса ю0. Отметим, во-первых, что один из полюсов зам- замкнутой системы приближается к нулю разомкнутой системы при —1,002. Кроме того, видно, что соо является всего лишь очень гру- грубой оценкой расстояния от удаленных полюсов до начала коорди- координат. На рис. 3.24 приведены годографы для замкнутой системы. Отметим, что по виду эти годографы сильно отличаются от годогра- годографов для систем со скалярной входной переменной. Два из общего числа удаленных полюсов образуют размещение Баттерворса
-5 Re, c"? Im, с 5j ,-1 -r n-5 /0 = 10 ,-z Re, c'1 p-1 \fa и p 10'3 Im,c' 0,1 0 . -0,1 p.1 Рис. 3.24. Годограф полюсов замкнутой системы управления продольным движением. а -г удаленные полюса; б — близко расположенный и удаленный полюса. Для ясности совпадающие участки годографа на вещественной оси обозначены отдельными линиями; в действительности они совпадают с вещественной осью.
Оптимальные линейные СУ с обратной связью 343 второго порядка, а третий полюс -- размещение Баттерворса первого порядка. Система, соответствующая такому размеще- размещению, обсуждается далее в примере 3.24. 3.8.2*. АСИМПТОТИЧЕСКИЕ СВОЙСТВА РЕГУЛЯТОРА СО СКАЛЯР- СКАЛЯРНЫМИ ВХОДНОЙ И ВЫХОДНОЙ НЕРЕМЕННЫМИ ПРИ НЕНУЛЕВОЙ ЗАДАННОЙ ТОЧКЕ В этом разделе будет рассмотрен оптимальный регулятор с одним входом и одним выходом в свете результатов разд. 3.8.1. Рассмотрим систему со скалярной входной переменной х (t) = Ах (t) -I- b\x (t) C.533) и скалярной управляемой переменной l(t) = dz(t). C.534) Здесь Ъ — вектор-столбец, d— вектор-строка. Из разд. 3.7 известно, что оптимальный закоп управления при ненулевой за- заданной точке определяется выражением рУ) = -ТхУ) +-±— Со, C.535) где"/ — вектор-строка Т= — ЬТР, C.536) _ р а Р — решение соответствующего уравнения Риккати. Кроме то- того, Hc(s) — передаточная функция замкнутой системы, Нс (s) = d {si — А + bf)'1 b, C.537) а Со — заданная точка для управляемой переменной. Для исследования реакции регулятора на ступенчатое измене- изменение заданной точки заменим ч0.па переменную C0(i), зависящую от времени. Тогда взаимосвязь разомкнутой системы и оптимального закона управления при ненулевой заданной точке описывается уравнениями x(t)={A-bJ)x(t) + b \ Со@. C.538) t(t) = dx(t). Преобразование Лапласа для передаточной функции T(s) от заданной точки Со(?) к управляемой переменной ^(t) дает Т (s) = d(sI — A + bj)'1 b —i— . C.539) W V ^ " Hc @) ^ ;
344 Глава 3 Рассмотрим передаточную функцию замкнутой системы d(sl — Л -\- bf)~lb. Очевидно, что d(sI—A+ bj)~lb=^ M&. , C.540) «раю где <pc(s) = det(s/ — А -\- bf) — характеристический полином замкнутой системы, а фс (s) — другой полином. В разд. 3.7 было показано [уравнение C.428)], что числитель определителя квадра- квадратичной матричной передаточной функции D(sl — А -\- BF)~lB не зависит от матрицы усиления обратной связи /^иравенполино- му числителя матричной передаточной функции ра