/
Author: Квакернаак Х. Сиван Р.
Tags: регулирование и управление машинами, процессами теория автоматического управления
Year: 1977
Text
Йу.;-'<ч .'
>,:,, ,
Щ
Щ
w
ШШП
шштш
ы
¦ 'л 'Р
¦V Ч
•lit
I
.W
Ш'№
«и
жлгс.
жШ
ДМ !» ti»,l
»i: i" "hi
к t i Л: !:'>i':
i'>: ii1
W!
.t^'M.
Ш
LINEAR OPTIMAL
CONTROL SYSTEMS
HUIBERT KWAKERNAAK
RAPHAEL SIVAN
WILEV-INTERSCIENCE, A DIVISION OF JOHN WILEY & SONS, INC.
NEW YORK • LONDON • SYDNEY • TORONTO
1972
X. КВАКЕРНААК,
ж- Р. СИВАН
ЛИНЕЙНЫЕ
ОПТИМАЛЬНЫЕ
СИСТЕМЫ
УПРАВЛЕНИЯ
Перевод с английского
канд. техн. наук В. А. ВАСИЛЬЕВА,
каид. техн. наук Ю. А. НИКОЛАЕВА
Предисловие
академика Б. Н. ПЕТРОВА
Издательство «Мир»
Москва 1977
УДК 62-501.12
В книге на основании современной теории фильтрации и
управления рассмотрены аспекты анализа и синтеза линейных
оптимальных систем управления: проектирование детерминиро-
детерминированных и стохастических регуляторов, оптимальная оценка со-
состояния, чувствительности и оптимальности систем, управление
дискретными системами. Книга отличается логичностью постро-
построения, детальным обсуждением поставленных вопросов, ясным и
и четким изложением материала на высоком научном уровне.
Книга имеет прикладной характер и представляет большой
интерес для широкого круга инженеров и научных работников,
специализирующихся в области автоматического управления.
Она может служить также учебным пособием для аспирантов и
студентов старших курсов соответствующих специальностей.
Редакция литературы по вопросам новой техники
^30501—169 1в9_7б © Перевод на русский язык, «Мир», 1977
Предиеловив к русскому, изданию
Для современного этапа развития науки и техники характерны
быстрый прогресс технической кибернетики и значительное рас-
расширение сферы ее практического применения.Если ранее, в конце
40-х годов, когда заканчивался начальный период формирования
теории автоматического регулирования, выдвигаемые практикой
задачи заключались в автоматизации отдельных производствен-
производственных процессов и управлении стационарными установками или
движущимися объектами, то в настоящее время основными черта-
чертами задач управления являются большая сложность объектов, не-
необходимость управления совокупностью объектов, а также высо-
высокие требования к точности и динамике управления. Так, например,
развитие авиации и ракетно-космической техники обусловило по-
постановку и необходимость решения принципиально новых проб-
проблем: управление многосвязными объектами, построение оптималь-
оптимальных систем стабилизации и терминального управления, управле-
управление системами при неполной информации, построение цифровых
систем управления и т. д.
Это привело к интенсивной разработке и широкому практиче-
практическому применению таких разделов теории, как оптимальное уп-
управление (детерминированный и стохастический варианты задач)
и адаптивное управление (в том числе теория экстремальных и
самонастраивающихся систем).
Наряду с разработкой новых разделов теории и принципов по-
построения систем дальнейшее развитие получила теория линейных
систем автоматического управления, в которой достигнуты весьма
важные результаты. В значительной мере достижения в этой об-
области связаны с работами Р. Калмана и Р. Бьюси по оптимальной
линейной фильтрации, а также с работами А. М. Летова и Р. Кал-
Калмана по синтезу линейных систем, оптимальных по квадратичному
критерию качества; последняя задача известна также как задача
аналитического конструирования оптимальных регуляторов.
Следует отметить, что в линейной теории систем за последнее,
время произошли существенные качественные изменения, связан-
связанные с применением новых математических методов, которые широ-
широко проникают в теорию управления и обогащают ее новыми идея-
идеями. Полное признание получил подход с использованием понятия
пространства состояний, применяющий методы линейной алгебры
и теории дифференциальных и разностных уравнений. С уверен-
уверенностью можно считать, что при построении оптимальных систем
дальнейшее развитие получат подходы, основанные на методах
6 Предисловие к русскому изданию
функционального анализа, теории случайных процессов и матема-
математической статистики, математическом программировании.
Широкий диапазон проблем управления сложными техниче-
техническими системами, оснащенными информационными приборами и
средствами вычислительной техники, а также возможность по-
построения адекватных моделей на основе методов современной тео-
теории управления привлекают к работе в данной области наряду с ин-
инженерами широкий круг математиков, что способствует получе-
получению новых важных результатов.
Теория линейных систем автоматического управления является
наиболее разработанным разделом технической кибернетики. Тра-
Традиционными аспектами исследования линейных систем являются
анализ устойчивости, исследование качества управления при нали-
наличии управляющих и возмущающих воздействий, анализ динами-
динамической точности при наличии случайных воздействий и синтез
регуляторов, обеспечивающих выполнение заданных требований.
За последние годы эти разделы обогатились новым содержанием,
в результате чего в инженерной практике все шире находят при-
применение анализ и синтез многосвязных систем, методы оптималь-
оптимального оценивания состояния систем, методы детерминированной и
стохастической теории оптимального управления.
Основная тенденция развития теории линейных систем, несом-
несомненно, определяется идеей оптимизации, разработке которой посвя-
посвящено большое количество публикаций. В связи с этим представ-
представляет большой интерес изложение в рамках одной книги теорети-
теоретических и прикладных аспектов оптимального управления линей-
линейными системами с учетом последних достижений в этой области.
Эту задачу в достаточно полной мере удалось решить X. Квакер-
нааку и Р. Сивану — авторам предлагаемой советскому читателю
монографии «Линейные оптимальные системы управления». В кни-
книге, посвященной в основном теории оптимальных систем с обратной
связью, на высоком научном уровне ив доступной форме с единых
позиций рассмотрен широкий круг вопросов анализа и синтеза
таких систем.
Самостоятельный интерес представляет гл. 1, в которой кроме
вводных разделов и изложения традиционных аспектов анализа
систем с использованием концепции пространства состояний дает-
дается систематическое изложение теории устойчивости, управляемос-
управляемости и восстанавливаемости. Приведенные в этой главе результаты
можно рассматривать как обобщение и развитие идей, содержа-
щихся в ранее опубликованных работах Р. Калмана, Л. Заде и
Ч. Дезоера. „
Рассмотренные в гл. 2 вопросы анализа и проектирования ли-
линейных систем с учетом влияния возмущений, шума наблюдений
и неопределенности в знании параметров объекта базируются на
концепции частотных характеристик. Полученные здесь резуль-
Предисловие к русскому изданию
таты и рекомендации очень наглядны и имеют ясный физический
смысл.
В последующих трех главах излагается теория линейных не-
непрерывных оптимальных систем с обратной связью.
Гл. 3 посвящена построению оптимальных линейных систем
при наличии полной информации о состоянии системы. При этом
достаточное внимание уделяется всем основным задачам, таким, как
синтез детерминированного регулятора с исследованием его свойств,
синтез стохастического регулятора, построение следящих сис-
систем и систем стабилизации.
В гл. 4 рассматривается самостоятельная проблема оценива-
оценивания фазового состояния линейной системы управления, решение
которой осуществляется при наличии как шума, возбуждающего
состояние системы, так и шума наблюдений. Оптимальное вос-
восстановление состояния системы обеспечивается посредством най-
найденных алгоритмов наблюдения (оптимальных наблюдателей). Здесь
же плодотворно используется идея о том, что задача восстановле-
восстановления состояния является двойственной (дуальной) задаче оптималь-
оптимального управления.
И наконец, с использованием результатов, полученных в пре-
предыдущих двух главах, в гл. 5 излагаются методы построения
оптимальных линейных систем при условии неполной и искажен-
искаженной шумами информации о состоянии системы. Рассмотрением
всего комплекса задач (таких, как задачи слежения и стабилиза-
стабилизации с учетом наличия шумов) завершается теория непрерывных
оптимальных систем.
Заключительная глава посвящена теории линейного оптималь-
оптимального управления для дискретных систем, в которой, по существу,
рассматривается дискретный вариант всех аспектов теории, из-
изложенных в гл. 1—5. При этом получены как результаты, анало-
аналогичные непрерывному случаю, так и результаты, характерные
только для дискретных систем и подчеркивающие их специфику.
Следует отметить, что вопросы теории дискретных систем име-
имеют особо важное значение. Это связано, в первую очередь, с широ-
широким применением цифровых вычислительных машин (ЦВМ) в
управлении различными процессами, что позволяет обеспечить
решение широкого круга задач и реализацию сложных алгоритмов
в реальном масштабе времени. Далее, необходимо иметь в виду,
что универсальные ЦВМ в настоящее время являются основным
и наиболее мощным инструментом для исследования проектируе-
проектируемых систем на этапе математического моделирования; при этом
исследуемые системы описываются..дискретными моделями. И на-
наконец, особую актуальность приобретают вопросы'эффективности
инженерных исследований при проектировании систем управления,
что связано с разработкой для дискретных моделей вычислитель-
вычислительных методов и алгоритмов, ориентированных на применение средств
8 Предисловие к русскому изданию
современной вычислительной техники,' с целью автоматизации
проектирования.
Систематическое изложение методов линейной теории систем
и оптимального управления в настоящей книге привлечет к ней
внимание широкого круга специалистов.
Инженеры и научные работники, специализирующиеся в об-
области автоматического управления, найдут в ней разработку идеи
оптимального управления, доведенную до алгоритмов, и могут
использовать приведенные результаты для исследования и проекти-
проектирования линейных моделей многих реальных систем. Кроме того,
несомненный интерес вызовет изложение основных положений
современной теории линейных динамических систем.
Преподаватели вузов также найдут, в книге много полезного.
Книга поможет им составить курс по теории автоматических сис-
систем в свете современных представлений, а при работе с ней они от-
отдадут должное стройности и методической направленности изло-
изложения. Книга также может быть использована аспирантами и сту-
студентами старших курсов с целью углубленного изучения разделов
современной теории управления.
В русское издание авторы книги внесли ряд уточнений и
исправлений, которые приняты с благодарностью.
Б. Н. Петров
Предисловие авторов
За последние годы современная линейная теория управления.
получила быстрое развитие и теперь она по общему признанию
является мощным практическим инструментом для решения за-
задач построения линейных замкнутых систем управления. Основ-
Основными аспектами современной линейной теории управления явля-
являются: описание систем посредством пространства состояний, опти-
оптимизация в терминах квадратичного критерия качества и теория
оптимального восстановления состояний Калмана — Бьюси. Зна-
Значительное преимущество современной линейной теории управления
над классической теорией состоит в ее применимости к задачам уп-
управления различными системами, включая многомерные системы
и системы с переменными параметрами; классическая теория огра-
ограничена рассмотрением систем с одномерными входной и выходной
переменными и постоянными параметрами.
Использование термина «современная» теория управления мо-
может внушить пренебрежение к «классической», или «обычной»
теории управления, а именно теории, состоящей из.методов проек-
проектирования, основанных на удобном аппарате передаточных функ-
функций и изучении полюсов и нулей. Однако мы не разделяем таких
убеждений; напротив, мы считаем, что классический подход, хо-
хорошо разработанный и проверенный практикой, характеризуется
комплексом разумно поставленных и полезных целей и задач.
В данной книге предпринимается попытка примирить совре-
современную линейную теорию с классической теорией управления.
Одна из главных задач, поставленных в книге, заключалась в том,
чтобы представить методы проектирования, которые при исполь-
использовании современных методов приводят к созданию систем, удов-
удовлетворяющих требованиям, разработанным в классической теории
управления. Поэтому одна глава полностью посвящается ана-
анализу управления на основе классических концепций. В последую-
последующих главах книги, в которых разрабатываются современные ме-
методы синтеза, имеются .также разделы по анализу. Более того,
особое внимание уделяется вопросам, которые являются обычными
в классической теории управления, но часто опускаются при сов-
современном рассмотрении; это, например, системы управления с не-
ненулевой заданной точкой, следящие системы и системы регулиро-
регулирования при постоянных возмущениях. При этом подчеркивается
стохастическая природа задач управления; для такого подхода
стохастические аспекты являются весьма существенными.
Мы считаем, что современную и классическую теории управле-
10 Предисловие авторов
ния можно успешно изучать одновременно, так как они рассмат-
рассматривают различные аспекты одних и тех же проблем. Этот подход
нашел отражение в настоящей книге.
Книга построена следующим образом. Около половины мате-
материала, содержащего большинство методов анализа и синтеза, а
также большое количество примеров представлено в разделах,
не отмеченных звездочкой. Более детальные аспекты, такие как
условия существования и результаты, касающиеся сходимости
установившихся решений, рассматриваются в разделах, заглавия
которых отмечены звездочкой. Не отмеченные разделы написаны
таким образом, "чтобы они могли составить учебник для двухсе-
местрового курса но теории управления. Отмеченные разделы
составляют метериал для углубленного изучения. Инженер по
управлению, интересующийся прикладными вопросами, найдет
большинство методов в неотмеченных разделах, но также может
обращаться к остальным разделам с целью получения сведений
по более сложным вопросам.
Предполагается следующая подготовка. Читатель должен пред-
предварительно прослушать курс по линейным системам или линейным
цепям, а также знать основы теории стохастических процессов.
Рекомендуется также, чтобы читатель имел некоторый опыт по
программированию и пользованию ЦВМ. Мы не считаем, что чи-
читателю необходимо быть знакомым с классической теорией управ-
управления перед изучением этой книги.
Содержание книги разделяется по главам следующим образом.
В гл. 1 «Элементы теории линейных систем» исходным пунктом
является описание линейных систем в терминах их состояний,
а концепции матричной передаточной функции и частотной харак-
характеристики вытекают из описания состояния..Детально обсуждаются
свойства, важные для анализа линейных оптимальных систем в
установившемся состоянии: управляемость, стабилизируемость,
обнаруживаемость и дуальность. Два последних раздела этой гла-
главы посвящены описанию векторных стохастических процессов,
при этом особое внимание уделяется представлению стохастиче-
стохастических процессов как выходных переменных линейных дифференци-
дифференциальных систем, возбуждаемых белым шумом. В последующих гла-
главах этот материал часто используется.
В гл. 2 «Анализ линейных систем управления» дается общее
описание задач управления. Далее, она включает последователь-
последовательный анализ различных аспектов анализа качества систем управле-
управления. Системы управления, одномерные и многомерные, исследу-
исследуются на основе единого подхода с использованием понятий Сред-
Средних значений квадрата ошибки слежения и квадрата входной
переменной.
В гл. 3 «Оптимальные линейные системы управления с обрат-
обратной связью» рассматривается обычное развитие задачи построе-
Предисловие авторов И
ния линейного оптимального регулятора, а также дается доста-
достаточно полный обзор установившихся свойств уравнения Риккати
и оптимального регулятора. Днализируется численное решение
уравнений Риккати и исследуются оптимальные стохастические
регуляторы, оптимальные системы слежения, регуляторы при
постоянных возмущениях и с ненулевыми заданными точками.
В качестве специального вопроса обсуждаются асимптотические
свойства установившихся законов управления и максимально
достижимая точность систем регулирования и слежения.
В гл. 4 «Оптимальное линейное восстановление состояния» дан
вывод фильтра Калмана — Бьюси с позиций теории наблюдения.
Изучаются также различные специальные случаи1, такие, как
сингулярные задачи наблюдений, и исследуются задачи со сме-
смешанным шумом наблюдений. Анализируются различные установив-
установившиеся и асимптотические свойства оптимальных наблюдателей.
В гл. 5 «Оптимальные линейные системы управления с обрат-
обратной связью по выходной переменной» регуляторы с обратной
связью по состоянию из гл. 3 объединяются с наблюдателями из
гл. 4. Представлено эвристическое и относительно простое дока-
доказательство принципа разделения, основанное на концепции об-
обновления, которая обсуждается в гл. 4. Дана последовательность
синтеза различных типов систем управления с обратной связью
по выходной переменной и приведен обзор методов синтеза регуля-
регуляторов пониженной размерности.
' В гл. 6 «Линейная теория оптимального управления для дис-
дискретных систем» дается сжатое изложение теоретических резуль-
результатов гл. 1—5 применительно к линейным дискретным системам
управления. Особое внимание уделяется апериодическим по сос-
состоянию и выходной переменной системам управления и вопросам
синхронизации измерений и управления.
На протяжении всей книги наиболее важные концепции вклю-
включены в определения, а основные результаты представлены в форме
теорем. Почти каждый раздел заключается одним или нескольки-
несколькими примерами, многие из которых являются численными. Эти
примеры предназначены для закрепления теоретического материа-
материала и чтобы подчеркнуть практическую применимость результатов
.теории. Большинство примеров является продолжением примеров,
введенных в начале книги, поэтому каждая задача рассматрива-
рассматривается в нескольких разделах и даже главах. При использовании
численных значений уделяется внимание соответствующим раз-
размерностям. В примерах используется система единиц СИ, которая
сейчас принята в международном масштабе. Полный обзор систе-
системы СИ можно найти.в Рекомендациях Международного совета по
стандартизации.
Книга включает около 50 задач, которые разделяются на две
категории: элементарные упражнения, непосредственно иллюстри-
12 Предисловие авторов
рующие материал текста, и дополнительные задачи, расширяю-,
щие материал текста. В некоторых задачах необходимо использо-
использовать цифровую вычислительную машину. Предполагается, что за-
задачи, отмеченные звездочкой, не относятся к основному материалу
книги. Соответствующие курсовые работы могут состоять из на-
написания и испытания подпрограмм для ЦВМ, перечисленных в
разд. 5.8.
На протяжении всей книги даются многие ссылки на литера-
литературу, однако при этом не делается попытки достичь определен-
определенной степени полноты отражения имеющихся работ или осветить
историю вопроса. Тот факт, что упоминается та или иная публи-
публикация, просто означает, что она используется как источник и что
в этой работе можно найти соответствующий материал.
X. Квакершгак,
Р. Сивсш
ЭЛЕМЕНТЫ ТЕОРИИ ЛИНЕЙНЫХ СИСТЕМ
1.1. Введение
Настоящая книга посвящена анализу и синтезу линейных сис-
систем управления. Необходимым условием для исследования линей-
линейных систем управления является знание теории линейных систем.
В связи с этим в настоящей главе дается обзор важнейших поло-
положений теории линейных систем, а рассмотрение задач управления
откладывается до гл. 2.
Основная цель данной главы состоит в том, чтобы установить
основные понятия, ввести обозначения и представить основные
положения теории линейных систем. Отправной точкой является
описание линейных систем методом пространства состояний. За-
Затем рассматриваются решения линейных дифференциальных урав-
уравнений состояния, устойчивость линейных систем и анализ таких
системе помощью преобразования Лапласа. Последующие разделы
затрагивают более сложные темы; в них рассмотрены вопросы уп-
управляемости, восстанавливаемости и дуальности, а также кано-
канонические формы фазовых переменных линейных систем. Глава
заканчивается обсуждением векторных стохастических процессов
и анализом реакции линейных систем на белый шум. Указанные
темы играют важную роль в разработке теории.
Поскольку предполагается, что читатель этой главы знаком
с основами теории линейных систем, доказательства некоторых
хорошо известных теорем опущены; при этом даются ссылки на
соответствующие учебники. Некоторые разделы, касающиеся, в
частности, управляемости, восстанавливаемости, дуальности и
канонических форм фазовых переменных, обозначены звездоч-
звездочками. Звездочка означает, что соответствующие темы являются
более сложными; при этом полученные результаты используются
только в разделах, отмеченных аналогичным образом.
1.2. Описание состояния
линейных систем
1.2.1. ОПИСАНИЕ СОСТОЯНИЯ НЕЛИНЕЙНЫХ
И ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ СИСТЕМ
Многие системы^могут быть описаны системой дифференциаль-
дифференциальных уравнений вида
.x(t) = f[x(t),u(t),t]. A.1)
14 Глава 1
Здесь t — переменное время, x(t) — действительный п-мерный
переменный во времени вектор-столбец, который обозначает состоя-
состояние системы, a u(t) — действительный /с-мерный вектор-столбец,
который обозначает входную переменную, или переменную управле-
управления. Функция / является действительной и векторной. Для многих
систем выбор состояния естественно следует из физического уст-
устройства системы, а уравнение A.1), называемое дифференциаль-
дифференциальным уравнением состояния, обычно непосредственно следует из
элементарных физических законов, которым подчиняется сис-
система.
Пусть y(t) — действительная Z-мерная переменная системы,
которая может быть наблюдаема или с помощью которой система
воздействует на окружающую обстановку. Такая переменная
называется выходной переменной системы, которая часто может
быть представлена следующим образом:
• y(t) = g[x(t), u(t), t]. A.2)
Это уравнение называется уравнением выходной переменной сис-
системы.
Система, описываемая уравнениями A.1) и A.2), называется
конечномерной дифференциальной системой или, короче, дифферен-
дифференциальной системой. Вместе уравнения A.1) и A.2) называются
уравнениями системы. Если векторная функция g определенно
содержит и, говорят, что система имеет прямую связь.
В данной книге рассматривается главным образом случай,
когда / и g являются линейными функциями. В этом случае гово-
говорят о (конечномерной) линейной дифференциальной системе, урав-
уравнение состояния которой имеет вид
x(t) = A(t)x(t) + B(t)u(t), . A.3)
где A(t) и B(t) — переменные матрицы соответствующих размер-
размерностей. Размерность п вектора х есть размерность системы. Урав-
Уравнение выходной переменной такой системы имеет вид
y{t) = C{t)x{t)+D{t)u{t). A.4)
Если матрицы А, В, С и D постоянны, то система называется сис-
системой с постоянными параметрами.
1.2.2. ЛИНЕАРИЗАЦИЯ
В настоящем разделе будет показано, что если uo(t) — задан-
заданная входная переменная системы, описываемой дифференциальным
уравнением состояния A.1), a xo(t) — известное решение диффе-
дифференциального уравнения, то можно найти приближенные решения
для небольших отклонений от начального состояния и входной пе-
Элементы теории линейных систем 15
ременной из нелинейного дифференциального уравнения состояния.
Предположим, что xo{t) удовлетворяет уравнению
«о@ =/[*<»(*). «o(Oi *L to<t<tv A.5)
Пусть и0 — номинальное значение входной переменной, а х0 —
номинальная траектория. Часто можно предположить, что систе-
система функционирует в условиях, близких к номинальным, т. е. и и х
мало отличаются от и0 и х0 соответственно. Поэтому справедливо
представление
x(tj = xo(t9) + x(to), A.6)
где и(?) и x(t0) — малые возмущения. Соответственно введем
x{t) = xoft)+'x(t), *0 <«<*!. A.7)
Подставим теперь х и ы. в дифференциальное уравнение состоя-
состояния и применим разложение в ряд Тейлора. Тогда получим
xo(t)+~x(t) = f[xo{t), uo(t), t]+Jx[x0(t), uo{t), t)Z(t) +
+ Ju [x0 (t), u0 (t), t] Z{t) + h (t), to<t< ti. A.8)
Здесь J хш Ju — матрицы Якоби функция / относительно х и и
соответственно, т. е. Jх — матрица, (г, /)-й элемент которой имеет
вид
где fi — i-компонента вектора /, а |у — j-я компонента вектора х.
Матрица Ja определяется аналогичным образом. Пусть величина
h(t) по предположению «мала» по сравнению с х ши. Пренебрегая
этой величиной, видим, что х и и приближенно удовлетворяют
линейному уравнению
x(t) = A(t)'x(t)+B(t)Z(t), to*?t<tv A.10)
где A(t)—Jx [xo(t), uo(t), 1], a B(t)=Ju[z0(t), uo(t), t]. Уравнение
A.10) называется линеаризованным дифференциальным уравнением
состояния. Начальным условием уравнения A.10) является x(t0).-
Указанная процедура линеаризации представляет собой самый
обычный метод, применяемый при решении задач управления. Часто
удобно линеаризовать дифференциальные уравнения системы перед
16 Глава 1
представлением их в форме уравнений состояния. Это, естественно,
приводит к тем же самым результатам (см. примеры разд. 1.2.3).
Из учебников по дифференциальным уравнениям (см., например,
[150]) следует, что аппроксимация x{t), полученная таким спосо-
способом, может быть сделана с произвольной точностью, при условии
что функция / обладает частным^производными по компонентам
векторов х и и относительно номинальных значений х0, и0, интер-
интервал [t0, ij] конечный, а начальное отклонение x(tQ) и отклонения
входной переменной и выбираются достаточно малыми.
В разд. 1.4.4 представлено дальнейшее обоснование широкого
использования линеаризации при исследовании процессов уп-
управления.
1.2.3. ПРИМЕРЫ
В данном разделе приводится несколько примеров, иллюстри-
иллюстрирующих, как уравнения физических явлений превращаются в
дифференциальные уравнения состояния и как выполняется про-
процедура линеаризации. Эти примеры обсуждаются довольно под-
подробно, так как в дальнейшем они широко используются для ил-
иллюстрации многих положений теории.
Пример 1.1. Система управления положением перевернутого маят-
маятника.
Рассмотрим перевернутый маятник, показанный на рис. 1.1
(см. также в связи с этим примером работы [34, 55]). Ось маятника
Маятник
Телетка
Рис. 1.1. Система управления положе-
\—у нием перевернутого маятника.
Элементы теории линейных систем.
17
монтируется на тележке, которая может перемещаться в горизон-
горизонтальном направлении. Тележка приводится в движение неболь-,
шим мотором, который в момент времени t прикладывает к те-
тележке силу [i(t), являющуюся входной переменной системы.
На рис. 1.2 представлены силы и перемещения. В момент вре-
времени t перемещение оси характеризуется функцией s(t), а угловое
Рис. 1.2. Перевернутый маятник: силы и перемещения.
отклонение маятника — функцией <р(?). Масса маятника' обозна-
обозначена буквой тп, L — расстояние между осью и центром тяжести,
/ — момент инерции относительно центра тяжести и М — масса
тележки. К. маятнику приложена сила mg в центре тяжести, а так-
также горизонтальная H(t) и вертикальная V(t) силы реакции у оси
маятника. Здесь g — ускорение силы тяжести.
Для системы справедливы следующие уравнения:
m -5— [s (t) + L sin ф (t)] = H (t),
dt*
m ¦
d«a
dt
A.11)
A.12)
A.13)
A.14)
.Трение учитывается только при движении тележки; в уравне-
уравнении A.14) F — коэффициент трения. Трение оси маятника не учи-
учитывается. После преобразования дифференциальных уравнений
A.11) и A.12) имеем
18 Глава 1
m's(t) -\-mL<p(t) cosy (t) — mLy2 (t) sin у (t) = #(?). A.15)
— mLy (t) sin ф (t) — mLy2 (t) cos ф (t) == V (t) — mg, A.16)
/ Ф (t) = LV (t) sin ф (t) —LH (t) cos ф (t), A.17)
M's(t) = \i(t)—H(t)—Fs{t). . A.18)
С целью упрощения уравнений предположим, что масса т
мала по сравнению с М, и поэтому пренебрежем горизонтальной
реакцией H(t) на движение тележки. Это позволяет заменить A.18)
уравнением
A.19)
Исключая H(t) и V(t) из уравнений A.15)—A.17), получим
(/ + mL2) ф (t) — mgL sin ф (t) + mLs (t) cos ф (t) = 0. A.20)
Производя почленное деление яа,1-\~тЬ2, найдем
Ф @ ГГ sin Ф @ + "тг s @-CO8 Ф @ = 0, A.21)
где
L'= / + mL2 . ¦ A.22)
Эта величина называется эффективной длиной маятника, так как
движение математического маятника длиной L' также описывает-
описывается уравнением A.21).
Выберем в качестве номинального решение |j,(?)=0, s(?)=0,
<р(?)=0. Линеаризацию легко выполнить, разлагая sin ф(?) исоэф(?)
в ряды Тейлора и подставляя в уравнение A.21) только первые чле-
члены рядов. Линеаризация A.21) приводит к уравнению
Ф @ - -jr Ф @ + -jr s @ = °- С1-23)
В качестве компонент вектора состояния z(t) выбираем
A.24)
Третья компонента состояния представляет собой линеаризо-
Элементы теории линейных систем
19
ванную аппроксимацию перемещения точки маятника, находя-
находящейся на расстоянии L' от оси. Функцию | 3@ рассматривают как
перемещение маятника. При выбранных обозначениях из A.19)
и A.23) определим линеаризованное уравнение состояния
A.25)
которое в векторно-матричных обозначениях имеет вид
*@= ¦ Z n л x{t)+ " MO- A.26)
0
0
0
g
V
F
M
0
0
0
0
0
g
L'
0
0
1
0
x(t) +
0
1
M
0
0
где i@ = col[g1@, 12@, E8@. |4@b
Ниже параметрам системы присваиваются следующие числен-
численные значения:
F _
M ~
1 _
V ~
L' =
1 c-1
1 КГ
11,65
0,842
с,
M.
A.27)
Пример 1.2. Смесительный бак.
В данном примере исследуется типичная система управления
процессом. Рассмотрим смесительный бак, схема которого пред-
представлена на рис. 1.З.' Бак наполняется с помощью двух потоков,
имеющих переменные мгновенные расходы F{(t) и F2(t). Оба вход-
входных потока содержат растворимое вещество с постоянными вели-
величинами концентрации ct и с2. Выходной поток имеет массовую
20
Глава 1
скорость истечения F{t). Предполагается, что содержимое бака
перемешивается так, что концентрация выходного потока равна
концентрации c(t) в баке.
Клапаны
Расход Ft
Концентрация с,
Высота
h
Расход Fz
Концентрация сг
Мешалка
^ Объем V
Концентрация с'
J Выходной расход F
Концентрация с
Рис. 1.3. Смесительный бак.
Уравнения баланса масс для бака имеют вид
—-— = ^i @ + F2 (t) —F (t),
at
— [с (t) V {t)] = CjFj (t) + c2F2 (t) —c(t)F (t),
At
A.28)
A.29)
где V(t) — объем жидкости в баке. Мгновенный расход выходного
потока F(t). зависит от высоты h(t) следующим образом:
F(t) = kVW), A-30)
где к — экспериментальная константа. Если бак имеет постоян-
постоянную площадь поперечного сечения S, то можно написать
F(t) =
тогда уравнения баланса масс примут вид
A.31)
A.32)
Элементы теории линейных систем 21
= ciFi(t) + c2F2(t) ~c (t) к Y^~. A-33)
Рассмотрим сначала случай установившегося состояния, когда
все величины являются постоянными: Fi0, F20 и Fo — расходы,
Vo — объем и с0 — концентрация в баке. Тогда имеют место сле-
следующие соотношения:
0 = ^0 + ^0-^, A.34)
^0 =
При заданных Fi0 и F2o эти уравнения могут быть решены от-
относительно Fo, V 0 и с0. Предположим теперь, что возникли не-
небольшие отклонения от установившегося состояния. Напишем
A.37)
где ц\ шц2 рассматриваются как входные переменные, а ?4 и^2 —
переменные состояния. В предположении, что указанные четыре
параметра являются малыми, линеаризация A.32) и A.33) приво-
приводит к уравнениям
Ut) = ъ @ + ^ @ - -ж^ /-§-,6. @. A-38)
A.39)
Подставляя A.36) в эти уравнения, получим
L @ = Vi @ +1»2 @ — \ -у- li (t),
iz (t) Vo + c0 Ei @ = e^ (t) + с2[л2 (f) :_ i- c0 A- Uty
Введем параметр
-?- = et A.42)
22 Глава 1
называемый временем заполнения бака. Исключение |j из A.41)
приводит к линеаризованному дифференциальному уравнению
состояния
i
29
0
0
1
где *(t) = col[ |,(*), gг(«) 1 и | ц(
Если определить выходные переменные в виде
то можно дополнить уравнение A.43) линеаризованным уравне-
уравнением выходной переменной
= 26 \x{t)>
0
гДе y(t) = col \fli(t), т]г(^M- Примем следующие численные зна-
значения параметров:
^ю = 0,015 м3/с,
F20 = 0,005 м3/с,
Fo = 0,02 м3/с,
ci — 1 кмоль/м3, ,A.46)
с2 = 2 кмоль/м3,
с0 = 1,25 кмоль/м3,
Vo = 1 м3,
е = 50 с.
В результате линеаризованная система уравнений примет вид
)*& + (
0 —0,02; W 1,-0,25 0,75)
A.47)
Элементы теории 'линейных систем 23
1.2.4. ПРЕОБРАЗОВАНИЯ УРАВНЕНИИ СОСТОЯНИЯ
Иногда оказывается полезным использовать преобразованное
представление уравнений состояния. В данном разделе кратко
рассматриваются линейные преобразования линейных дифферен-
дифференциальных систем с постоянными параметрами. Уравнения систе-
системы имеют вид
x(t) = Ax(t)+Bu(t), A48)
Определим новую переменную состояния
x'{t)=Tx(t), A-49)
где Т — постоянная неособая (невырожденная) матрица преобразо-
преобразования. Подставляя x(t)=T~lx'(t) в {1-48), получим
A.50)
или
x'(t) = TAT-1x'(t)+TBu{t), A>51)
г/@ = СТ-1 ж' (*).
Таким образом, получены дифференциальное уравнение сос-
состояния и уравнение выходной переменной системы для состояния
x\t). Очевидно, что новое представление полностью эквивалентно
первоначальной системе, так как всегда можно восстановить по-
поведение системы в терминах первоначального состояния с помощью
соотношения x(t)=T~lx'{t). Выбор состояния до некоторой степени
является произвольным, и поэтому может быть произведен с уче-
учетом той или иной цели. Многие свойства линейных систем с посто-
постоянными параметрами остаются неизменными после преобразова-
преобразования состояния (задачи 1.12.3, 1.12.6, 1.12.7).
1.3. Решение дифференциальных
уравнений состояния
линейных систем
1.3.1. ПЕРЕХОДНАЯ МАТРИЦА И МАТРИЧНАЯ ИМПУЛЬСНАЯ
ПЕРЕХОДНАЯ ФУНКЦИЯ
__^ Ниже рассматривается решение линейного дифференциального
уравнения состояния
24 Глава 1
Для этого необходимо изложить несколько теорем [50, 190].
Теорема 1.1. Рассмотрим однородное уравнение
x(t) = A(t)x(t). ' A.53)
Если A{t) в этом уравнении является постоянной величиной для
всех t, то оно всегда имеет решение
х (t) = Ф (t, t0) х (t0) для всех t. A.54>
Переходная матрица ф(?, t0) является решением матрич-
матричного дифференциального уравнения
—- Ф (t, t0) = A (t) Ф (t, t0) для всех t,
dt
A.55)
где I — единичная матрица.
Для системы с переменивши параметрами общего вида эта матри-
матрица редко может быть выражена элементарными функциями, в^связи
с чем приходится использовать методы численного интегрирова-
интегрирования. Для систем с постоянными параметрами низкой размерности
или простой структуры переходная матрица может быть вычисле-
вычислена одним из методов, рассматриваемых в разд. 1.3.2, 1.3.3 и 1.5.1.
Для более сложных систем с постоянными параметрами следует
применять численные методы, описанные, например, в разд. 1.3.2.
Можно показать, что переходная матрица обладает следующи-
следующими свойствами [190].
Теорема 1.2. Переходная матрица ф(/, t0) линейной дифференци-
дифференциальной системы уравнений имеет следующие свойства:
а) Ф (t2, tt) Ф (tit t0) = Ф (t2, t0) для всех t0, tu t2; A.56)
б) Ф(?, if0) является неособой для всех t, to\ A-57)
в) Ф-Х(г, tQ) — ФA0, t) для всех t, t0; A.58)
г) — ФТ (t0, t) = —АтA)ФтЦ0,г) для всех t, t0, A.59).
dt
где верхний индекс Т обозначает транспонирование.
Свойство «г» означает, что система x{t)*= —AT (t)x(t) имеёт-
переходную матрицу фт'(?0; t). Доказательство следует из диф-
дифференцирования тождества <b(t,to)<b(to, t) = I.
Элементы теории линейных систем 25
Если переходная матрица найдена, то решения дифференци-
дифференциального уравнения состояния A.52) могут быть легко получены.
Теорема 1.3. Рассмотрим линейное дифференциальное уравнение
состояния
x(t) = A (t) x(t) + B(t)u (t). A,60)
Тогда, если A{t) — непрерывная функция, a B(t) и u(t) — ку-
кусочно-непрерывные функции для,всех t, решение уравнения A.60)
имеет вид
t
хA)=Ф (t, t0) x (t0) + Г Ф (t, ч) В (т) и {z) dz для всех t. A.61)
Этот результат легко проверить непосредственной подстанов-
подстановкой в дифференциальное уравнение состояния [190].
Рассмотрим теперь систему с дифференциальным уравнением
состояния A.60) и уравнением выходной переменной
y(t) = C(t)x(t). A.62)
Ддя выходной переменной имеем
t
у (t) = С (t) Ф (*, g;r(*0) + С @ j Ф (*, х) В (х) и (z) dz. A.63)
и
Если система имеет нулевое начальное состояние, т. е. x(to)=0,
то реакция выходной переменной записывается в форме
t
¦ y(t)= j K(t,*)u(x)di, *>*o. A-64)
to
где
K(t,z) = C(t)O{t,z)B(z), *»т. A.65)
Матрица K(t, %) называется матричной импульсной переходной
функцией, потому что (i, ;)-й элемент матрицы является реакцией
в момент времени t г-й компоненты выходной переменной на им-
импульс, приложенный к /-й компоненте входной переменной в мо-
момент времени % > t0, тогда как другие компоненты вектора входной
переменной нулевые и начальное состояние также нулевое. Мат-
Матричная переходная функция S{t, т) определяется следующим об-
образом:
')йт', *>т. A.66)
Здесь (г, /)-й элемент матричной переходной функции является
реакцией в момент времени t i-ш компоненты выходной переменной,
26 Глава 1
когда 7-я компонента входной переменной является ступенчатой
функцией, приложенной в момент времени % >tB, а все другие-
компоненты вектора входной переменной равны нулю и началь-
начальное состояние также нулевое.
1.3.2. ПЕРЕХОДНАЯ МАТРИЦА СИСТЕМЫ
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
Переходная матрица системы с постоянными параметрами
может быть вычислена точно [50, 139, 190].
Теорема 1.4. Система с постоянными параметрами
x(t)=Ax(t) A.67)
имеет переходную матрицу
Ф(Мв) = «А('~''\ A.68)
где экспоненциал квадратной матрицы М определяется как ряд
ем= I + M + — М2+ — М3 + ..., (
который сходится для всех М.
При малых размерах или простой структуре матрицы А этот
результат может быть использован для точного представления
переходной матрицы с помощью элементарных функций (см. при-
пример 1.3). При большой размерности матрицы А теорему 1.4 впол-
вполне можно использовать для вычисления переходной матрицы на
ЦВМ, так как все требуемые алгебраические действия весьма прос-
просто запрограммировать и выполнить. Такие программы должны
включать в себя алгоритм остановки с целью ограничения беско-
бесконечного ряда конечным числом членов. Обычный алгоритм оста-
остановки заключается в ограничении ряда, когда добавление но-
нового члена изменяет каждый из элементов частичной суммы
меньше, чем на заданную величину. При слишком больших
М могут возникнуть вычислительные трудности; это связано
с тем, что приращение t — ta в уравнении A.68) не мо-
может быть выбрано слишком большим [88, 91 ]. Наличие
программы для вычисления матричного экспоненциала необхо-
необходимо каждому исследователю, моделирующему линейные системы
с постоянными параметрами. Существуют многочисленные работы
по вычислению матричного экспоненциала и моделированию
линейных систем, в частности можно рекомендовать работы [17,
56, 58, 100, 109, 111-114, 124, 136, 148, 173, 177-7179]. Мелса
[127 1 приводит программу вычислений на ФОРТРАНе.
Элементы теории линейных систем
27
С учетом уравнения A.68) выражение A.63) в случае постоян-
постоянных параметров принимает вид
y{t) = CeMi-M x (t0) + С J eA(t~z) Bu (т) dz. A.70)
to
Сравнивая A.64) и A.70), можно видеть, что матричная им-
импульсная переходная функция линейной- дифференциальной сис-
системы с постоянными параметрами зависит только от it — т и может
быть представлена как
K(t—x) = CeMt-') В, *>т. A.71)
Пример 1.3. Смесительный бак
Однородное уравнение, соответствующее линеаризованному
дифференциальному уравнению состояния бака из примера 1.2,
имеет вид
" С
0 -f
Нетрудно найти, что его переходная матрица есть
Ф {t, t0) = eMt~U) ,
A.72)
A.73)
где
№1
Ступенчатое изменение
расхода F, на 0,002 м3/с
0,002
100
200
t.c
Ступенчатое Изменение
расхода Fz на 0,001м3 1с
100
200 t, с
^ о
200 t, с
S 0,1
100
200 t, с
Рис. 1.4. Реакция смесительного бака на, ступенчатое изменение расхода.
28 Глава 1
e ' 2! V e,
A.74)
Матричная импульсная переходная функция системы равна
—СО „-(/—О/в С2—?о -(/-¦О/в
A.75)
Теперь найдем матричную переходную функцию бака
(а — (i — т:)/29 . , _((_-)/2Э s
ct-c0 A g-(^)/B) С2~1 A с_(^)/8) ]• A-76)
^о Л> . /
На рис. 1.4 представлены переходные функции для численных
значений параметров из примера 1.2.
1.3.3. ДИАГОНАЛИЗАЦИЯ
Точная форма переходной матрицы системы с постоянными
параметрами может быть получена с помощью диагонализации
матрицы А. Известен следующий результат [1331.
Теорема 1.5. Предположим, что постоянная п ХпХматрица А
имеет различные характеристические числа Хи %2, ..., Кп. Пусть
еъ е2,..., еп — соответствующие собственные векторы. Определим
п х п-матрицы
Т = {еи е2, ... , еп), A.77а)
i\. = diag(A.j, Х2, ... , А,„). A.776)
Тогда Т является неособой и А может быть представлена как
А^ТАТ-\ A.78)
Здесь в уравнении A.77а) векторы е4, е2,..., еп являются столб-
столбцами матрицы Г, а в уравнении A.776) Л — диагональная мат-
матрица, где A,j, ^2>--ч ^п. — диагональные элементы. В этом случав
говорят, что Т диагонализирует А.
Кроме того, нетрудно убедиться в следующем факте.
Элементы теории линейных систем. 29
Теорема 1.6. Рассмотрим матрицу А, которая удовлетворяет
допущениям теоремы 1.5. Тогда
а)' ем = Тем Т1; A.79)
б) ем = diag ( eXlt, ev, ... ехп'). A.80)
Этот результат упрощает вычисления exp {At), если матрица А.
диагонализирована. Поучительно представить тот же результат
в иной форме.
Теорема 1.7. Рассмотрим систему с постоянными параметрами
x{t)=Ax{t), A.81),
где А удовлетворяет допущениям теоремы 1.5. Запишем матрицу
T~i в форме
A.82)
т. е. векторы-строки /ь /2,-.., fn являются строками матрицы
Т~г. Тогда решение A.81) при ^„=0 может быть записано в виде
*Ч/,*@). A-83)
Это можно показать, выражая- аг(^)=7'ехр (Л^)Г ^@) через
еь fi и exp(X;i), i = l,2,..., п. Запишем A.83) в виде
где [it — скаляры /гаг(О), г —1,2,...,п. Отсюда видно, что реакция
системы A.81) является комбинацией движений по собственным
векторам матрицы А. Назовем такое движение модой системы:
Каждая мода, имеющая компоненты по соответствующим собствен-
собственным векторам, возбуждается соответствующим выбором началь-
начального состояния.
Очевидно, что характеристические числа Xt, i = i,2,...,n, в зна-
значительной степени определяют поведение системы. Часто эти
числа называют полюсами системы.
30 Глава 1
Даже в случае кратных характеристических чисел матрица А
может быть диагонализирована при условии, что число линейно
независимых собственных векторов для каждого характеристиче-
характеристического числа равно кратности характеристического числа'. Более
сложный случай, когда матрица А не может быть диагонализи-
диагонализирована, обсуждается в разд. ,1.3.4.
Пример 1.4. Перевернутый маятник.
Однородное уравнение, соответствующее дифференциальному
уравнению состояния маятниковой системы из примера 1.1, имеет
вид
x(t)=.
О
О
О
1
?_
М
О
О
.0
-¦ь ° -
g
V
о
о
1
о
x(t).
A.85)
Характеристические числа и собственные векторы матрицы А
выражаются следующим образом:
I, - П У - —
1 _ l/ e
1
0
1
0
1
1
F .
~~ М
а
F
0
0
1
' У 17
0
0
1
-Vi-
A.86)
где
g
V
A.87)
g F*
L' ~ M*
и по предположению знаменатель а отличен от нуля. Матрица Т
и обратная ей имеют вид
Т =
x
1
0
1
0
1
F
~ м.
а
F
— а
М
0
0
1
0
0
1
— 1/
Племс.пты теории линейных систем
31
1
0
1
2
1
2
F
M
F
M ¦
F
M
F
1
2
+ V V
1
2
0
0
1
2
1
?,
о
о
Модами системы являются
A.88)
1
О
1
О
J
1
F
~ М
а
F
— а
М
0
0
1
1
и
о
о
1
A.89)
Первая мода показывает безразличие системы по отношению
к горизонтальным перемещениям, тогда как третья мода иллюст-
иллюстрирует неустойчивый характер перевернутого маятника.
1.З.4.* ЖОРДАНОВА ФОРМА
В предыдущем разделе показано, что нахождение переходной
матрицы может быть упрощено использованием диагонализа-
ции матрицы А. Эта диагонализация невозможна, если га х га-мат-
га-матрица А не имеет п линейно независимых собственных векторов.
И этом случае, однако, можно привести матрицу А к так называе-
называемой канонической форме Жордана, которая является квазидиаго-
нпльной и из которой можно легко получить переходную матрицу.
Сначала вспомним некоторые положения линейной алгебры.
Кепи М — матрица, то нулъ-прострапство М определяется как
множество
ЛГ(М) = {х:х?Сп, Мх = 0}, A.90)
Где Сп — га-мерное комплексное векторное пространство. Далее,
* Смысл звездочки при обозначении раздела объясняется во введении.
32 Глава 1 ¦ . ,
если o/fli и з#2 — Два линейных подпространства n-мерного прост-
пространства, то говорят, что линейное пространство
М* = М&Мъ _ A.91)
является прямой суммой о/К,г тз-qMz, если любой вектор x3^.aS Зжотет
быть записан только единственным образом, как x3=xt-\-x2, где
X^aSi И Х2€а#2-
В связи с этим имеем следующий результат [190].
Теорема 1.8. Положим, что п х п-матрица А имеет к различных
характеристических чисел kt, i = l,2,...,k. Пусть mt — кратность
каждого характеристического числа Kt в характеристическом поли-
полиноме матрицы А. Определим
Mt = (A — XtI)mi A.92)
и положим
jrt = ЛГ {Mt). A.93)
Тогда
а) размерность линейного подпространства Jf'\ равна mt, i= I,
2,..,,к;
б) полное п-мерное комплексное пространство Сп является
прямой суммой нуль-пространств jft, i = l, 2,...,к, т. е.
С^^ФЛ©...©^. A.94)
Если матрица А имеет п различных характеристических чисел, то
нуль-пространства jft трансформируются в одномерные под-
подпространства, каждое из которых порождается собственным век-
вектором матрицы А.
Имеем следующий результат [133].
Теорема 1.9. Рассмотрим матрицу со свойствами, указанными в
теореме 1.8. Тогда всегда можно найти неособую матрицу пре-
преобразования Т
Т = (ТиТг,...,Тк), A.95)
для которой
A = TJT~l, A.96)
•где
/ = diag(/1,/2, ...,/,). A.97)
Блок Ji имеет размерность mi x Щ, i== 1, 2,...,k, и каждому
блоку Т\ соответствует своя матрица Jt. Столбцы матрицы Tt
образуют специально выбранный базис для нуль-пространств «#*;,
г = 1, 2,..., к. Блоки Jt могут быть представлены следующим обра-
образом:
Jt = diag (Jti, Ji2, ..., Jtli), A.98)
Элементы теории линейных систем
33
•¦<>е каждый подблок имеет форму
г-
0
о .
0 .
1
Xi
0
1
.0
0
Xi
0
1
Xi
A.99)
Матрица / называется жордановой нормальной формой
матрицы А.
Выражение A.96) дает практический метод вычисления матри-
матрицы преобразования [133]. Из этого выражения следует
AT = TJ.
A.100)
Обозпачим столбцы матрицы Т как qlt q2, ..., qn. Тогда из формы
матрицы / с учетом A.100) получим
Aqt = Xqt + Ys^i-i i A.101)
где Yz принимает значение 0 или 1 в зависимости от /, а К — ха-
характеристическое число матрицы А. Пусть разбиение блока Tt
матрицы Т, соответствующее разбиению A.98) блока Jt, имеет
|шд Тii, Ti2, ..., Тцг. Тогда число Yj равно нулю, когда соответ-
соответствующий столбец qt матрицы Т является первым столбцом под-
подблока. Так как при Yz= 0 вектор q-b является собственным векто-
вектором матрицы А, очевидно, что можно найти первые столбцы каж-
каждого подблока как собственные векторы матрицы А. Оставшиеся
столбцы каждого подблока тогда получаются из A.101) при yt =
1. Такие оставшиеся столбцы известны как обобщенные соб-
собственные векторы. Этот процесс останавливается, когда A.101)
не обеспечивает получения решения. Пример 1.5 в конце данного
раздела иллюстрирует эту процедуру.
Если матрица А представлена в жордановой нормальной форме,
т<> нетрудно найти экспоненциал матрицы А.
Теорема 1.10. Рассмотрим матрицу А со свойствами, указанными
<¦ теоремах 1.8 и 1.9. Тогда
а) И' =
б) *" =
и) e i = diag^e fi , e
A'
.V
A.102)
A.103)
A.104)
34
Глава 1
1 t
2t
0 1*.
, A.105)
где и^ — размерность матрицы /г;..
Из этой теоремы следует, что реакция системы
x(t) = Ax(t)
A.106)
может содержать кроме чисто экспоненциальных членов вида
ехр (К^) также члены вида t exp(X^), t% ехр(^г?) и т. д.
По аналогии с результатом из разд. 1.3.3 справедливо следую-
следующее утверждение [190].
Теорема 1.11. Рассмотрим линейную систему с постоянными пара-
параметрами
x(t) == Ax(t).
Выразим начальное состояние х@) ]шк
Напишем
к.
2
.1=1
A.107)
A.108)
A.109)
где разбиение соответствует разбиению матрицы Т в теореме 1.9.
Тогда реакция системы может быть выражена как
x(t)= У
A.110)
Из этой теоремы следует, что, если начальное состояние принад-
принадлежит одному из нуль-пространств J/'t, характер движения систе-
системы из этого начального состояния полностью определяется^соот-
определяется^соответствующим характеристическим числом. По аналогии с простым
случаем из разд. 1.3.3 назовем движение системы из любого на-
начального состояния, принадлежащего одному из нуль-пространств,
модой системы.
Элементы теории линейных систем
35
Пример 1.5. Перевернутый маятник
Рассмотрим пер'евернутый маятник из примера 1.1 в предполо-
предположении, что трением тележки можно пренебречь, так что F = 0.
Однородное уравнение, соответствующее линеаризованному диф-
дифференциальному уравнению состояния, теперь имеет вид x(t) =
=Ax(t), где1
, A.111)
0
0
0
g
V
1
0
0
0
0
0
и
g
V
о.
0
1
0
Характеристические числа матрицы А равны
л a j a j 1/ « j \/ s (\ 112^
Нетрудно найти, что существует только один собственный вектор
1
51, ¦ A.ИЗ)
соответствующий двукратному характеристическому числу 0.
Числам К3 и Х4 соответствуют собственные векторы
0
0
1
У v
о
о
1
A.114)
Так как характеристические числа К3 и ^ являются единствен-
единственными, то соответствующие нуль-пространства имеют размерность,
равную единице, и порождаются собственными векторами. Пос-
Поскольку нуль представляет собой двукратное характеристическое
число, соответствующее" нуль-пространство является двумерным.
Имеет место лишь один подблок в жордановой форме размерами
2x2, поскольку не существует двух линейно независимых соб-
собственных векторов. Пусть характеристический вектор A.113)
является первым столбцом q{ матрицы преобразования Т. Тогда
второй столбец д2 должен определяться из уравнения
= 0 • q2 + qt.
A.115)
36
Глава 1
Нетрудно найти, что общее решение этого уравнения имеет вид
1/ До
A.116)
где Р — произвольная константа. Примем {3 = 0. Поскольку q3
и qt должны быть собственными векторами A.114), найдем матри-
матрицу преобразования Т
Т =
1
о
1
о
1
о
0 1
о
о
1
о
о
1
V-t
A.117)
Соответствующая жордавова нормальная форма матрицы А
имеет вид
/==
О
О
1
О
о
о
о
о
V
о
о
о
\
-VJ
A,118)
Экспоненциал матрицы А нетрудно найти из уравнений A.102),
A.117) и A.118).
1.4. Устойчивость
1.4.1. ОПРЕДЕЛЕНИЕ УСТОЙЧИВОСТИ
В настоящем разделе рассматривается поведение дифференци-
дифференциальных систем на длительном интервале времени. Пусть нелиней-
нелинейное дифференциальное уравнение состояния имеет вид
x(t)=*f\x(t), u(t), t]. • A.119)
Важно установить, обладают ли решения дифференциального
уравнения состояния свойством неограниченно возрастать при
t->-oo. Для упрощения вопроса предположим, что имеем дело с ав-
автономной системой, т. е. в системе отсутствует входной сигнал и
или, что эквивалентно, входной сигнал является фиксированной
Элементы теории линейных систем 37
величиной. Таким образом, перейдем к системе
x{t) = f[x(t),t]. ¦ A.120)
Так же как в разд. 1.2.2 при выполнении линеаризации, вве-
введем понятие номинального решения xo(t), которое удовлетворяет
дифференциальному уравнению состояния:
х (Л = f[x (t) t). A 121)
Особый интерес представляет случай, когда xo(t) является пос-
постоянным вектором хе; в этом случае говорят, что хе характеризует
состояние равновесия системы.
Исследуем вопросы устойчивости решений дифференциальных
уравнений состояний. Сначала дадим следующее определение
(в связи со всей последовательностью приводимых ниже определе-
определений см. также [24, 89, 190])..
Определение 1.1. Рассмотрим дифференциальное уравнение сос-
состояния
x(t) = f[x(t),t] A.122)
с. номинальным решением xo(t). Номинальное решение этого
уравнения является устойчивым в смысле Ляпунова, если для
любого t0 и для любого е > 0 существует б(е, t0) >> 0 (зависящее
от & и, возможно, от t0), такое, что при\\ x(t0) — 2о(^о)|| ^ б удов-
удовлетворяется неравенство^ x(t) — ^о@|| < е &ля всех t >- t0. ¦
Здесь \\x\\ обозначает норму вектора х, которой может быть эв-
эвклидова норма
H*li=l/ У.1*, A-123)
где lt, i =1,2, ..., п, — компоненты х.
Можно использовать также и другие нормы.
Устойчивость в смысле Ляпунова гарантирует, что состояние
не отклоняется слишком далеко от номинального решения при
начальном состоянии, достаточно близком к номинрльному реше-
решению. Устойчивость в смысле Ляпунова является довольно слабой
формой устойчивости. Поэтому расширим понятие устойчивости.
Определение 1.2. Номинальное решение xo(t) дифференциального
уравнения состояния
x(x)=f[.r(t),t] A.124)
является асимптотически устойчивым, если
38 Глава 1
а) оно устойчиво в смысле Ляпунова;
б) для всех t0 существует такое p(t0) > 0 (возможно, завися-
зависящее от t0), что в случае \\x(t0) — ?o(^o)l|<f>4 имеем
|| х (t) —x0 (t) || -> О при
Таким образом, асимптотическая устойчивость в дополнение
к устойчивости в смысле Ляпунова приводит к тому, что решение
всегда приближается к номинальному решению при начальном
отклонении, удовлетворяющем неравенству
.11 *(*„) — x0(t0) |[<.р.
Асимптотическая устойчивость не всегда дает информацию при
больших начальных отклонениях от номинального решения. Сле-
Следующее определение соответствует случаю произвольных пачаль-
ных отклонений.
Определение 1.3. Номинальное решение xo(t) дифференциального
уравнения состояния
x(t) = f[x{t),t\ A.125)
является асимптотически устойчивым « целом
{большом), если
а) оно устойчиво в смысле Ляпунова;
б) для любого x(t0) и любого t0
\\x(t) — xo(t)\\-+O A.126)
при t—*-oo.
К решению, асимптотически устойчивому в целом,, в итоге
приближаются все другие решения.
Пока что обсуждалась только устойчивость решений. Для нели-
нелинейных систем это необходимо вследствие сложности явлений,
характерной для этих систем. В случае линейных систем, однако,
ситуация проще, и целесообразнее говорить об устойчивости сис-
систем, а не об устойчивости решений. Поясним это утверждение.
Положим, что xo(t) — любое номинальное решение линейного
дифференциального уравнения
x(t) = A(t)x(t), A.127)
a x(t) — любое другое решение уравнения A.127). Поскольку и
;ro(t), и x(t) являются решениями дифференциального уравнения
^1.127), x(t) — xo(t) также является решением, т. е.
4- [x(t)~-x0 @1 = A(t)[x (t)-x0 (*)]• A.128)
at
Элементы теории линейных систем, 39
Очевидно, что для анализа устойчивости номинального решения
xo(t) можно исследовать устойчивость тривиального решения, т. е.
решения x(t) = 0. Если нулевое решение устойчиво в любом смыс-
смысле (по Ляпунову, асимптотически или асимптотически в целом),
любое другое решение будет также устойчивым в том же смысле.
Поэтому введем следующую терминологию.
Определение 1.4. Линейная дифференциальная система
x{t) = A(t)x(t) A.129)
устойчива в определенном смысле (по Ляпунову, асимптотически
или асимптотически в целом), если тривиальное решение oro(t) =
-~ 0 устойчиво в этом смысле.
В дополнение к тому, что все номинальные решения линейной
дифференциальной системы обнаруживают одинаковые свойства
устойчивости, для линейных систем пет необходимости делать раз-
различие между асимптотической устойчивостью и асимптотической
устойчивостью в целом, что утверждается в следующей теореме.
Теорема 1.12. Линейная дифференциальная система
x(t) = A(t)x(t) A.130)
асимптотически устойчива тогда и только тогда, когда она асим-
асимптотически устойчива в целом.
Эта теорема следует из того, что для линейных систем решения
могут быть продолжены без изменения их поведения.
Завершим этот раздел введением другой формы устойчивости,
которую определим только для линейных систем [24].
Определение 1.5. Линейная дифференциальная система с перемен-
переменными параметрами
является экспоненциально устойчивой, если существуют положи-
положительные константы а и §, такие, что
x(t) = A(t) x(t) ' A.131)
'•о устойчивой, если существуют положи-
Р, такие, что
:¦ || x(t) || < ае~г<*~^ il x(t0) \\, t>t0, _ A.132)
г'ля каждого начального состояния x(t0).
Экспоненциально устойчивая система обладает тем свойствам,
что текущее состояние экспоненциально сходится к нулевому сос-
состоянию независимо от начального состояния.
Поясним понятия, введенные в этом разделе, несколькими
примерами.
40 Глава 1
Пример 1.6. Перевернутый маятник
Положение равновесия s{t) = 0, ф@ = 0, \i(t) = 0 переверну-
того маятника из примера 1.1 (разд. 1.2.3), очевидно, не является
устойчивым в любом смысле.
Пример 1.7. Обычный маятник
"Рассмотрим маятник, описанный в примере 1.1 (разд. 1.2.3).
Положим [i(t) = 0. Из физических соображений ясно, что решение
s(t) = 0, ср(О = я (соответствующее обычному подвешенному маят-
маятнику) является устойчивым в смысле Ляпунова; выбором достаточ-
достаточно малых начальных отклонений и скоростей можно добиться, что-
чтобы движения системы оставались произвольно малыми. Система,
однако, не является асимптотически устойчивой, так как не пред-
предполагается наличие трения в маятнике; однажды возникая, дви-
движение маятника не прекращается. Более того, если придать тележ-
тележке начальное перемещение; она не вернется в нулевое положение
без помощи внешней силы. •
Пример 1.8. Смесительный бак
Рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3).
При u(t) = 0 линеаризованная система описывается уравнением
¦ JL о
о —-
которое имеет решения
i,@ = e-</23|1@), *>o,
A.134)
52@ = e-"9g2@), *>о.
Очевидно, ?t@ и ?2@ всегда приближаются к нулевому зна-
значению при возрастании t, так как 6> 0. В результате линеаризо-
линеаризованная система асимптотически устойчива. Более того, поскольку
сходимость к положению равновесия является экспоненциальной,
система экспоненциально устойчива.
Из разд. 1.4.4 видно, что если линеаризованная система асим-
асимптотически устойчива, то положение равновесия, относительно
которого была произведена линеаризация, является асимптоти-
асимптотически устойчивым, но не обязательно асимптотически устойчи-
устойчивым в целом.
Из физических соображений, однако, следует ожидать, что в
данном случае система является асимптотически устойчивой в
целом.
Элементы теории линейных систем
1.4.2. УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
В этом разделе определяются условия, при которых линейные
системы с постоянными параметрами обладают той или иной из
рассмотренных выше форм устойчивости. Рассмотрим систему
x(t) = Ax(t), A.135)
где А — постоянная матрица п X п. В разд. 1.3.3 мы видели, что,
если А имеет различные характеристические числа Xv K2, •¦•, Я„
и соответствующие собственные векторы еи е2, • •-, еп, реакция
системы на произвольное начальное отклонение может быть пред-
представлена как
V
где скаляры цг, i = 1, 2, ..., п, определяются из начального сос-
состояния х@). Для систем с педиагонализируемой матрицей А это
выражение содержит добавочные члены вида ?*ехр (Х,?) (разд.1.3.4).
Ясно, что устойчивость системы в обоих случаях определяется
характеристическими числами Х;. При этом имеем следующий
результат.
Теорема 1.13. Линейная система с постоянными параметрами
x{t)=Ax{t) .A.137)
является устойчивой в смысле Ляпунова тогда и только тогда,
а) все характеристические числа А имеют неположительные
действительные части и
б) любому характеристическому числу' на мнимой оси кратнос-
кратности т точно соответствует т собственных векторов матрицы А.
Условие (б) необходимо для ограничения членов, которые воз-
возрастают как tk (разд. 1.3.4). Это условие всегда удовлетворяется,
вели А не имеет кратных характеристических чисел на мнимой оси.
Для асимптотической устойчивости необходимы несколько бо-
более жесткие условия.
Теорема 1.14. Система с постоянными параметрами
x(t) = Ax(t). A.138)
является асимптотически устойчивой тогда и только тогдаг когда
все характеристические числа матрицы А имеют строго отрица-
отрицательные действительные части.
42 Глава 1 '
Этот результат нетрудно доказать. Более того, видно, что, если
линейная система с постоянными параметрами является асимпто-
асимптотически устойчивой, сходимость текущего состояния к нулевому
состоянию экспоненциальная. Этот результат формулируется в
следующей теореме.'
Теорема 1.15. Система с постоянными параметрами
x(t)=Ax(t) ¦ A.139)
является экспоненциально устойчивой тогда и только тогда, когда
она асимптотически устойчива.
Поскольку асимптотическая устойчивость системы определяет-
определяется матрицей А, удобно использовать следующую терминологию.
Определение 1.6. Постоянная матрица А размерности п X п
является асимптотически устойчивой, если все ее характеристи-
характеристические числа имеют отрицательные действительные части.
Характеристические числа матрицы А являются корнями ха-
характеристического полинома XI — А. С помощью хорошо извест-
известного критерия Рауса—Гурвица (см., например, [159]) устойчи-
устойчивость матрицы А может быть непосредственно исследована по ко-
коэффициентам характеристического полинома, без вычисления
корней.
При рассмотрении систем, не являющихся асимптотически
устойчивыми, удобно <выделять те' характеристические числа мат-
матрицы А, которые имеют строго отрицательные действительные час-
части, как устойчивые полюсы системы, а оставшиеся характеристи-
характеристические числа — как неустойчивые полюсы.
Завершим этот раздел простым примером. Дополнительный
пример приводится в разд. 1.5.1.
Пример 1.9. Смесительный бак
Матрица А линеаризованного дифференциального уравнения,
состояния из примера 1.2 имеет характеристические числа
— A/29) и —A/9). Как показано выше (пример 1.8), линеари-
линеаризованная система асимптотически устойчива, так как 8>0.
1.4.З.* ПОДПРОСТРАНСТВА УСТОЙЧИВЫХ И НЕУСТОЙЧИВЫХ
СОСТОЯНИЙ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ
ПАРАМЕТРАМИ
В этом разделе показывается, как пространство состояний линей-
линейной дифференциальной системы с постоянными параметрами мо-
может быть разбито на такие два подпространства, что движение
системы из начального состояния, принадлежащего первому под-
подпространству, всегда сходится к нулевому состоянию, тогда как
Элементы теории линейных систем ¦ 43
движение из ненулевого начального состояния, принадлежащего
другому подпространству, никогда не сходится.
Рассмотрим систему с постоянными параметрами
• x(t)=,Ax(t) A.140)
и предположим, что матрица А имеет различные характеристи-
характеристические числа (более общий случай обсуждается в данном разделе
ниже). Тогда, как было показано в разд. 1.3.3, реакция этой сис-
системы может быть представлена в виде
где At, лг, .,., А„ — характеристические числа, а еи ..., еп — со-
соответствующие собственные векторы. Коэффициенты \it, \i2, ¦¦.
..., H,t показывают, как осуществляется декомпозиция начального
состояния по векторам еъ е2, •••, еп.
Предположим теперь, что система не является асимптотически
устойчивой, что соответствует случаю, когда некоторые характе-
характеристические числа имеют неотрицательные действительные час-
части. Ясно, что текущее состояние будет сходиться к нулевому'сос-
тоянию только в том случае, когда начальное состояние имеет
компоненты только цо таким собственным векторам, которые
соответствуют устойчивым полюсам.
Если начальное состояние имеет компоненты только по соб-
собственным векторам, соответствующим неустойчивым полюсам,
реакция системы будет состоять из неубывающих экспонент. Это
приводит к следующей декомпозиции пространства состояний.
Определение 1.7. Рассмотрим п-мерную систему x(t) = Ax(t)
где А — постоянная матрица. Положим, что А имеет п различ-
различных характеристических чисел. Определим подпространство ус-
устойчивых состояний этой системы как действительное линейное
подпространство, порожденное теми собственными векторами ма-
матрицы А, которые соответствуют характеристическим числам
со строго отрицательными действительными частями. Для такой
системы подпространством неустойчивых состояний
является действительное подпространство, порожденное теми соб-
собственными векторами, которые соответствуют характеристиче-
характеристическим числам с неотрицательными действительными частями.
Распространим это понятие на линейные системы g постоян-
постоянными параметрами более общего вида.
В разд. 1.3.4 было показано, что реакция системы может быть
представлена в виде
*
it)Uivit A.142)
44 Глава 1
где vt находятся в нуль-пространствах Л\, i = 1, 2, ..., к. По-
Поведение выражения exp (/;i) определяется характеристическим
числом Лг; только в том случае, если Kt имеет строго отрицательную
действительную часть, соответствующая компонента состояния
стремится к нулевому состоянию. По аналогии с простым случаем,
данным в определении 1.7, получаем следующую декомпози-
декомпозицию.
Определение 1.8. Рассмотрим п-мерную линейную систему с пос-
постоянными параметрами. Определим подпространство устойчи-
устойчивых состо яний этой системы как действительное подпространство
прямой суммы тех нуль-пространств jft, которые соответству-
-ют характеристическим числам матрицы А со строго отри-
отрицательными действительными частями. Аналогичным образом
определим подпространство неустойчивых состояний матрицы
А как действительное подпространство прямой суммы тех нуль-
пространств JPi, которые соответствуют характеристическим
числам матрицы А с неотрицательными действительными час-
частями.
' В соответствии с этим определением все действительное и-мер-
ное пространство Мп есть прямая сумма подпространств устой-
устойчивых и неустойчивых состояний.
Пример 1.10. Перевернутый маятник
В примере 1.4 (разд. 1.3.3) показано, что матрица А линеари-
линеаризованного дифференциального уравнения состояния переверну-
перевернутого маятника имеет следующие характеристические числа и
векторы:
? Y Yjr. A.143)
ei =r
1
0
1
n
1
F
~ М
а
F
м
, ея =
0
0
1
¦t/~f
{ V V
о
1
V
A.144)
Элементы теории линейных систем
45
Очевидно, что подпространство устойчивых состояний этой сис-
системы порождается векторами е2 и е4, тогда как подпространство
неустойчивых состояний порождается векторами е{ и е3.
Пример 1.11. Перевернутый маятник без трения
В примере 1.5 (разд. 1.3.4) была рассмотрена жорданова нор-
нормальная форма матрицы А для перевернутого маятника без тре-
трепня и найдены двукратное характеристическое число 0 и простые
характеристические числа ]/g/L' и —|/g/L/. Нуль-пространство,
соответствующее характеристическому числу 0, порождается пер-
ш.ши двумя столбцами матрицы Т, т. е.
A.145)
Эти два вектора вместе с собственным вектором, соответствую-
соответствующим числу Vg!U, т.е.
О
О
1
и
A.146)
порождает подпространство неустойчивых состояний системы. Под-
Подпространство устойчивых состояний порождается оставшимся
собственным вектором
(
О
О
1
A.147)
L' )
1.4.4.* ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ НЕЛИНЕЙНЫХ СИСТЕМ
НО ЛИНЕАРИЗОВАННОЙ МОДЕЛИ
Настоящая книга посвящена в основном синтезу линейных сис-
систем управления. Первоочередной задачей при этом является обес-
обеспечение устойчивости. В последующих главах разрабатываются
эффективные методы построения устойчивых лннейных замкдутых
систем управления.
46 "Глава 1
Однако, как ранее было показано, реальные системы никогда
не бывают линейными, а используемые линейные модели получают-
получаются после линеаризации.
Таким образом, целесообразно - разрабатывать лишь те еис-
темы, линеаризованные модели которых обладают хорошими
свойствами. При этом возникает вопрос: какие из этих свойств
сохраняются у функционирующей реальной нелинейной системы?
Здесь оказывается полезным следующий результат.
Теорема 1.16. Рассмотрим систему с постоянными параметрами,
состояние которой описывается дифференциальным уравнением
i@ = /[*(*)]¦ A-148)
Предположим, что система имеет положение равновесия хе,
а функция f имеет, частные производные по компонентам х прихе.
Предположим, что линеаризованное относительно хе диффе-
дифференциальное' уравнение состояния имеет вид
x(t)=Ax(t), .A.149)
где постоянная матрица А является якобианом функции / по отно-
отношению к хе. Тогда, если матрица А асимптотически устойчива,
x{t) = хе является асимптотически устойчивом решением урав-
уравнения A.148).
Доказательство читатель мо5кет найти в работе [150]. Заметим,
что по линеаризованному дифференциальному уравнению состоя-
состояния нельзя, Конечно, сделать заключения об устойчивости.
Приведенная теорема подтверждает сделанный вывод. Поло-
Положим, что первоначально система является неустойчивой, и линеа-
линеаризованные уравнения используются для синтеза регулятора,
обеспечивающего устойчивость линеаризованной системы. Тогда
на основании теоремы следует, что реальная нелинейная система
с этим регулятором будет, по крайней мере, асимптотически ус-
устойчивой для небольших отклонений от положения равновесия.
Заметим, однако, что теорема справедлива- только тогда, когда
в системе имеются «гладкие» пелинейности. Если имеются эле-
элементы с разрывными характеристиками (зоны нечувствительнос-
нечувствительности, сухое трение), теорему применять нельзя.
В заключение заметим, что, если некоторые из характеристи-
характеристических чисел матрицы А имеют нулевые действительные части,
а все другие характеристические числа имеют строго-отрицатель-
строго-отрицательные части, никаких выводов об устойчивости относительно хе
не может быть сделано в результате анализа линеаризованной
"системы. Если А имеет несколько характеристических чисел с
Элементы теории линейных систем 47
положительными действительными частями, то хе не является
устойчивым в любом смысле [150].
В гл. 2 (разд. 2.4, пример 2.6) приводится пример применения
этой теоремы.
L.5. Анализ систем с постоянными
параметрами на основе
преобразования Лапласа
1.5.1. РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНОГО УРАВНЕНИЯ СОСТОЯНИЯ
С ПОМОЩЬЮ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА
Часто весьма удобно исследовать линейные системы с постоян-
постоянными параметрами с помощью преобразования Лапласа. Опреде-
Определим преобразование Лапласа вектор-функции z( t) следующим об-
ра.чом:
со
Z{s) = X[z(t)]= f e~slz{t)dt, A.150)
где s — комплексная переменная. Символ Jjf обозначает операцию
преобразования Лапласа функции, стоящей в квадратных скоб-
скобках. Преобразование Лапласа определяется для тех значений s,
при которых интеграл A.150) сходится. Очевидно, что преобразова-
преобразование Лапласа вектор-функции z{t) является вектором, компоненты
которого являются преобразованиями Лапласа компонент вектора
z(t).
Рассмотрим сначала однородное дифференциальное уравнение
состояния
x{t) = Ax{t), A.151)
где А — постоянная матрица. Выполняя преобразование Лапласа ,
получим
ос-ссы?и.+^ -> •?, X(s)— x@) = AX(s), A.152)
так как все обычные теоремы преобразования Лапласа для ска-
скалярных выражений справедливы и в" векторном случае [139].
Решение относительно X(s) имеет вид
X (s) = {si — Л) х @). ¦ A.153)
Во временной области этому соответствует выражение
x{t) = eAt х{0). ' , A.154)
Таким образом, имеем следующий результат.
48 Глава 1
Теорема 1.17. Пусть А является постоянной матрицей п X п.,
Тогда (si — А)'1 — X[eAi] или, что эквивалентно, eAt = X~l [(si —
—А)гЦ.
Преобразование Лапласа матричной функции выполняется по-
посредством преобразования каждого ее элемента. Теорема 1.17
особенно удобна для получения точного выражения переходной
матрицы, если величина п не является слишком большой, незави-
независимо от того, является ли матрица А диагонализируемой.
Матричная функция (si — ^d) называется резольвентой ма-
матрицы А. В связи с этим имеет место следующий результат [13,
190].
Теорема 1.18. Рассмотрим постоянную матрицу А размерности
п X п с характеристическим полиномом
det (si — А) = sn + a^is"'1 + ... -f сця + a0. A.155)
Тогда резольвента матрицы А может быть записана в виде
п
(si—А)'1 = - V s'-i Rit A.156)
*=i
. где матрицы Rt определ яются как
п
Rt= У a>jA>-1, i = 1, 2, ... , п, A.157)
а ап = 1. Коэффициенты at и матрицы Rt, i = 1, 2, ..., п, мо-
могут быть определены с помощью следующего алгоритма.
Пусть
' а„=1, Д„ = 7. A.158)
Тогда
A.159)
A.160)
для к = 1,2, ..., п. При к = п имеем
Д0 = 0. A.161)
Здесь используется обозначение
П
tr (M) =
Элементы теории линейных систем 49"
если М — матрица размерности п X п с диагональными элемен-
элементами Мп, i =1,2, ..., п. Алгоритм теоремы следует из алгоритма
Леверъе [13]. Он также известен как метод Сурьё, или метод Фад-
деевой [190]. Условие Яо = 0 можно использовать для проверки.
Алгоритм очень удобно реализовать на ЦВМ. Однако следует
отметить, что алгоритм довольно чувствителен к ошибкам округ-
лепия [61], поэтому обычно при вычислениях требуется двукрат-
двукратная точность. Мелса [127] приводит вычислительную программу
по этому алгоритму на ФОРТРАНе.
Рассмотрим теперь неоднородное уравнение
x(t) = Ax(t) + Bu(t), A.163)
где А ж В — постоянные матрицы. Выполняя преобразование Лап-
Лапласа, получим
sX (s) — х @) = АХ (s) + BU (s)\ A.164),
откуда найдем
X (s) = (si — A)~l x @) + (si — A)-15U (s). A.165)
Пусть уравнение относительно выходной координаты системы
имеет- вид
. y(t) = Cx(t), A.166).
где С — постоянная матрица. Выполняя преобразование Лапласа
и подставляя A.165), получим
Y(«) = CX(s) = C(sI—A)-1x@) + С (si —A)~l EM (s), A.167)
что эквивалентно преобразованию Лапласа выражения A.70) при
1о=0,
t
y(t) = CeAt x@) + C j eA{t~z) Bu (x) dx. A.168)
о
При х@) = 0 выражение A.167) принимает вид
Y(s) = ff(s)U(s), A.169).
где
•H(s) = C(8l—A)-iB. • A.170)
Матрица H(s) называется матричной передаточной функцией
системы. Если H(s) и U(s). известны, реакция системы при нулевом
начальном состоянии может быть найдена посредством обратного
преобразования Лапласа выражения- A.169).
На основании теоремы 1.17 из уравнения A.170) следует, что
матричная передаточная функция H(s) является преобразованием
Лапласа матричной функции K(t) = Cexy(At)B, t>- 0. Из A.168)
очевидно, что K(t — т.), t>-x, является матричной импульсной:
переходной функцией системы.
50 Глава 1
Принимая во внимание теорему 1.18, матричную передаточную
функцию 'можно представить в форме
Я(в)= P{s), A.171)
W det(s/ — A) W y '
где P(s) — матрица, элементы которой являются полиномами от s.
Следовательно, элементы матричной передаточной функции H(s)
является рациональными функциями s. Общим знаменателем
алементов H(s) является выражение det (si — А), если не про-
происходит сокращения множителей видав — Kt, где Kt— характери-
характеристическое число матрицы А во всех элементах матрицы H(s).
Корни общего знаменателя H(s) называются полюсами матрич-
матричной передаточной функции H(s). Если сокращения не происходит,
полюса матричной передаточной функции являются полюсами
системы, т. е. характеристическими числами матрицы А.
Если как входная u(t), так и выходная y(t) переменные явля-
являются скалярными, то матричная передаточная функция переходит
в скалярную передаточную функцию. Для многомерных систем
каждый элемент Н^(в) матричной передаточной функции H(s)
является передаточной функцией от /-Й компоненты входа к ?-й
компоненте выхода.
Пример 1.12. Недиагоналйзируемая система
Рассмотрим систему
= (о
AЛ72)
Нетрудно проверить, что эта система имеет двукратное харак-
характеристическое число 0, но единственный собственный вектор; поэ-
поэтому она не является диагонализируемои.
С помощью преобразования Лапласа вычислим матричную пере-
передаточную функцию. Резольвента системы может быть найдена
следующим образом:
t
Обратное преобразование Лапласа дает
ел = D' M. A.174)
Vo о/ у
, Заметим, что эта система не является устойчивой в смысле
Ляпунова.
Элементы теории линейных систем
51
Пример 1.13. Смесительный бак
Смесительный бак из примера 1.2 описывается линеаризован-
линеаризованным уравнением состояния
x(t) =
¦--L о
29
о —L
9
\x(t) +
1
— с0
\u(t). A.175)
а уравнение выходной переменной имеет вид
x(t).
A.176)
0
Резольвента матрицы А определяется выражением
I 1
!+ 29
¦1
A.177)
Система имеет матричную передаточную функцию
26
1
I — с0 1
s+ Г
A.178)
Матричная импульсная переходная функция A.75) системы
определяется посредством, обратного преобразования Лапласа
A.178).
1.5.2. ЧАСТОТНАЯ ХАРАКТЕРИСТИКА
В данном разделе рассматривается частотная характеристика
системы с постоянными параметрами и определяется реакция
системы на входной сигнал вида
A.179)
¦32 Глава ]
где ит— постоянный вектор. Представим решение дифференци-
дифференциального . уравнения состояния
' x(t) = Ах (t) + Bu (t) A.180)
как сумму решения однородного уравнения и частного решения.
Сначала найдем частное решение в форме
xp{t)=xme«\ A.181)
где хт— постоянный вектор, который следует определить. Нетруд-
Нетрудно найти, что частное решение описывается выражением
хру) = 0<й1—А)-1Витем <>0. A.182)
Общее решение однородного уравнения x(t) = Ax(t) может
быть представлено в виде
xh(t) = eMa, A.183)
где а — произвольный постоянный вектор. Таким образом, общее
решение неоднородного уравнения A.180) имеет вид
х (t) = eAt a + (j&I ~ А)~1Витеы, t^O. A.184)
Постоянный вектор а может быть определен из начальных ус-
условий. Если система., описываемая уравнением A.180), явля-
является асимптотически устойчивой, то первый член решения при
возрастании t затухает, а второй член характеризует
установившееся состояние при входном воздействии A.179). Соот-
Соответствующее установившееся значение выходной переменной
A.185)
определяется выражением
= Н{^)итеы. A.186)
Заметим, что в это выражение входит матричная передаточная
функция H(s), где s заменяет /со. HQa) называется матричной
частотной характеристикой системы.
Получив реакцию системы на комплексный периодический сиг-
сигнал вида A.179), нетрудно определить установившуюся реакцию
при действительном синусоидальном входном сигнале.
Предположим, что k-я компонента fifi(?) вектора входной пере-
переменной u(t) имеет вид
?й*+фА), *>0. A.187)
.'>.пмснты теории линейных систем
53
iдо II:h(jw) является (г, /г)-м элементом матрицы Hjw, a
Предположим, что все другие компоненты вектора u(t) равны
пулю. Тогда установивгаееся значение'/-й компоненты ij t(t) век-
•iiipa выходной переменной y(t) описывается выражением
A.188)
A.189)
Скалярные частотные характеристики удобно представлять
методом асимптотических логарифмических характеристик [49].
Г> работе [1271 приводится ФОРТРАН-программа для построения
лмплитуды и фазы скалярной частотной характеристики.
В заключение отметим, что установившееся значение выходной
переменной асимптотически, устойчивой системы с матричной час-
частотной характеристикой ff(ja>) при постоянном входном сигнале
u(t) = um A-190)
определяется как
= H@)u
A.191)
Пример 1.14. Смесительный бак
Смесительный бак из примера 1.2 имеет матричную передаточ-
передаточную функцию (пример 1.13)
H(s) =
1
29
'¦+т
A.192)
Эта система асимптотически устойчива, в связи с чем имеет
«•мыел матричная частотная характеристика. При числовых зна-
челшях из примера 1.2 получим
0,01
0,01
II (/">) =
/<о + 0,01
— 0,25
/со+ 0,02 /ш+0,02
A.193)
54 Глава 1 - >
1.5.3. НУЛИ МАТРИЧНЫХ ПЕРЕДАТОЧНЫХ ФУНКЦИЙ
Рассмотрим систему со скалярными входной и выходной пере-
переменными
х (t) = Ах (t) + iy it), ^ 194^
ч@ = с* (о,
где ц(?) и ц{1) — скалярные соответственно входная и выходная
переменные, Ъ — вектор-столбец, с — вектор-строка. Матричная
передаточная функция этой системы трансформируется в переда-
передаточную функцию, которая определяется следующим образом:
H(s) = c(sI—A)-1b. ' A.195)
Характеристический полином матрицы А имеет вид
det(s/— Л) = (jp(s). A.196)
Тогда H(s) можно записать как
#(s) = -iifL A.197)
<р (s)
где cp(s) — полином степени п, a '-j>(s) — полиномЧтепепи, но боль-
большей чем п — 1, если матрица А имеет размерность п X п. Корни
полинома ф(я) называются нулями системы A.194). Заметим, что
нули определяются до возможного сокращения общих множителей
в полипомах i]j(s) и <f(s). Нули выражения H(s), которые остаются
после сокращения, называются нулями передаточной функции.
В случае многомерной системы H(s) является матрицей, при
этом каждый элемент матрицы H(s) представляет собой передаточ-
пую функцию, которая имеет собственные нули. В данном случае
не очевидно, как определяются нули. fr(s). В конце этого раздела
дается определение, которое обосновывается результатами разд.
3.8; при этом рассматриваются только квадратичные матричные
передаточные функции. (
Сначала изложим следующий результат.
Теорема 1.19. Рассмотрим систему
x(t) = Ax(t) + Bu(t), A.198)
где состояние х имеет размерность п, а входная и и выходная
у переменные имеют размерность т. Пусть H(s) = C(sl — A)'lB
является матричной передаточной функцией системы. Тогда
'Кименты теории линейных систем 55
A.199)
где
(jp(s) = det(s/—Л), A.200)
« J'f'sj является, полиномом от s степени, не большей чем п.— т.
Докажем это утверждение, так как оно не является общеизвест-
общеизвестным.
Сначала установим следующий факт из теории матриц.
. 1емма 1.1. Пусть М и N являются матрицами соответственно
размерности т X п и п X т, а 1т и 1п обозначают соответственно
античные матрицы размерности т X т и п X п. Тогда
а) ЫAт + MN) = det(In + NM). A.201)
- б) Предположим, что det (Im X MN) 4= 0. Тогда
(Im + MNP = Im-M (In + NM)-i N. A.202)
Доказательство положения (а) следует из рассмотрения ха-
характеристических чисел матрицы /m + MN [138, 154].
Справедливость положения(б) нетрудно проверить.
Для доказательства теоремы 1.19 рассмотрим выражение
det[XIn + C(sIn-A)^B). A.203)
гЛе % — ненулевой произвольный скаляр, который позднее будет
устремлен к нулю. Используя часть (а) леммы, получаем
det [Um+ С (sln - A)-4B] = Aet (KIJ det|^m + j-C (sln - A)'^ #] =
= Kmdet [/„ + ± (sln ~ A)-* 5CJ =
lm det Г sln — A + — Bc\
= != =L '. A.204)
det (sln -A) V
Полиномы от Х, находящиеся в правой и левой частях выраже-
выражения A.204), равны при всех ненулевых %; откуда, положив %-*¦ 0,
получим
det [С (si — А)-1 В\ = -A^L , /1.205)
ср (s)
56 Глава 1
где
(s) = lim Ят det (sln — A + — BC), A.20R)
x->o \ X )
и, следовательно, 'i(s) является полиномом от s. Определим сте-
степень этого полинома. При )ф->-оо из теоремы 1,18 следует
lim s{sl
|S|-»OO
Таким образом
m
lim
i j sd
|s|-»co <f (s) |s|-*oo
= lim det[Cs(s/—^)-1JB] = det(C5/. A.208)
Отсюда видно, что степень cp(s) больше,1 чем степень ф(я), по
крайней мере на т; поэтому ty(s) имеет степень, не превышающую
п — т. Если det(C5) Ф 0, то степень fy(s) точно равна п — т.
Этим доказательство теоремы 1.19 заканчивается.
Введем следующее определение.
Определение 1.9. Нулями системы ,
Bu(t), A.209)
y(t) = Cx(t),
где состояние х имеет размерность п, а входная и и выходная у
координаты имеют размерность т., являются нули полинома-
ty(s); где
det [H (s)] = -i-^-. A.210)
Cf (S)
Здесь H(s) — C(sl — A)~XB — матричная передаточная функ-
функция, a (p(s) = det(sl — A) —характеристический полином сис-
системы.
Таким образом, /г-мерная система с m-мерными входной и вы-
выходной переменными имеет самое большее п — т нулей. Заметим^
что для систем со скалярными входной и выходной переменными
определение нулей системы трансформируется в определение,
данное в начале этого раздела. В этом случае система имеет нв'
больше чем п — 1 нулей.
Вычисление полинома ф(х) для системы средней сложности вы-
вызывает трудности. Одним из возможных путей преодоления их
является запись числителя в виде
ф(*) = Ф(*) det [#(*)], A.211)
•Элементы теории линейных систем
i де ф(г>) является характеристическим полиномом системы. Коэф-
Коэффициенты ф($) могут быть найдены подстановкой п — т -\- 1
соответствующих значений для s в правую часть'A.211) и решением
полученных линейных уравнений. Другой, возможно, более прак-
практичный подход заключается в использовании полученного из
A.206) соотношения
где
A.212)
A.213)
Анализ выражения A.213) показывает, что можно написать
где «;(«), i —0, 1, ..., т, являются полиномами от s. Эти полино-
полиномы могут быть вычислены расчетом ty(s, X) для т различных зна-
значений X. Искомый полином (f(s) в точности соответствует oco(s).
Проиллюстрируем результаты этого раздела следующим при-
примером. •
Пример 1.15. Смесительный бак
Смесительный бак из примера 1.2 (разд. 1.2.3) имеет матрич-
матричную передаточную функцию
( J_ J_
29 29
#(*) =
2в
1
\
s + ~7Г
у и vj
Характеристический полином системы равен
1
A.215)
Ф (s) = s +
29
в
A.216)
Определитель матричной передаточной функции записывается
виде
20
1
2в
A.217)
.58
Глава 1
Очевидно, что матричная передаточная функция не имеет пу-
пулей. Этого следовало ожидать, так как в данном случае п — т =
= 0; следовательно, степень полинома ф(х) нулевая.
1.5.4. СОЕДИНЕНИЯ ЛИНЕЙНЫХ СИСТЕМ
Ниже рассматриваются соединения линейных систем. Наибо-
Наиболее важными и часто встречающимися примерами соединения сис-
систем являются последовательное соединение (рис. 1.5) и соединение
и, (t)
Система
1
y1(t)=uz(t)
Рис. 1.5. Последовательное соединение.
r(t)
"N и, It)
Система
1
Система
2
yf(t)-u2(t)
Рис. 1.0. Соединение ¦ посредством обратной связи.
посредством обратной связи, или замкнутая система (рис. 1.6).
Соединения систем обычно описываются с помощью метода
расширения фазового Пространства. Пусть отдельные системы в
последовательном соединении (рис. 1.5) описываются следующими
дифференциальными уравнениями состояния и уравнениями вы-
выходных переменных:
t (t) x, (t) + Bt (t) щ (t) 1 (система 4)>
j
= C2(t)x2(t)
-B2(t)u2{t)
D2(t)u2(t)
. A-218)
(система 2).
Элементы теории линейных систем ' 59
Вводя расширенный вектор состояния
объединенную систему можно описать следующим дифферен-
дифференциальным уравнением состояния:
где используется равенство u2(t) — ух@. Принимая y2(t) за выход-
выходную переменную объединенной системы, получим уравнение
Уг @ = Юг (t) С, @, С2 (*)] а; (*) + Я2 (*) ^ @ ^ (*). A.221)
В случае систем с постоянными параметрами соединение сис-
систем удобно .описать при помощи матричных передаточных функций.
Предположим, что H^s) и H2(s) являются матричными передаточ-
передаточными функциями соответственно систем 1 и 2.
Тогда общая передаточная матрица равна 'H2(s)H1(s), что сле-
следует из соотношения:
Y2 (s) = tf2 (s) ВД = Я2 (s) Я, (s) U, (s). ' A -222)
Заметим, что порядок Н2 и Н± в общем случае не может быть
изменен.
В системе с обратной связью (рис. 1.6) r(t) является входным
сигналом. Предположим, что отдельные системы описываются
следующими дифференциальными уравнениями состояния и урав-
уравнениями выходных переменных: -~
xt (t) = A, (t) Xt (t) + В, (t) щ (t) 1 (система 1)t
. J/1(«) = C1(*)a:i(*). J
A.223)
x2(t) = A2(t)x2(t) + B2(t) u2(t) \ (система 2).
1
Заметим, что система 1 не имеет прямой связи. Это позволяет
избежать неявных алгебраических уравнений. С помощью расши-
расширенного вектора состояния x(t) =:po\[xi(t), oc2(t)] система с обрат-
обратной связью может быть описана дифференциальным уравнением
состояния
B2(t)Ct(() A2(t) )
A.224)
60
Глава 1
где используются равенства u.2(t) = y^t) и щ{1) = r(t) — y2{t)-
Если yL(t) — выходная переменная объединенной системы, то ее-
уравнение имеет вид
yi(t) = lCdt),O\x{t). . A.225)
Рассматривая систему с постоянными параметрами, имеем
Yl(s)^Hi(s)[R(s)~H2(s)Yl(s)}, A.226)
где #x(s) и H2(s) — матричные передаточные функции отдельных
систем.
Разрешая A.226) относительно Y1(s), найдем
Y, (s) = [/ + Я4 (з) Н2 (s)] Я4 (s) R (s). A.227)
Выражению / ^|- H^sjH.^s) удобно дать специальное опре-
определение.
Определение 1.10. Рассмотрим объединенную систему с обратной
связью (рис. i.G), в которой системы \и1с постоянными парамет-
параметрами имеют матричные передаточные функции H^s) и И\.(s)
соответственно. Матричная функция для такой системы
J(s) = I + Hl{s)H2(s) A.228)
называется матрицей возвратной разности, а мат,ричная
Ь(а) = Нх(8) H2{s) A.229)
функция называется матрицей усиления понт ура.
Термин «возвратная разность» может быть пояснен с помощью
рис. 1.7, на котором показана система при наличии разрыва сое-
соединительной цепи.
В случае r(t) = 0 имеем
Yj (в) = — #4 (в) Я2 (s) U2 (s). ' A.230)
-i h
Рис. 1.7. Иллюстрации термина «возвратная разность».
Элементы теории линейных систем 61
Разность выражений «возвратной переменной» y^t) и «введен-
«введенной переменной)) u2(t) равна
U2 (*) - Y4 (,) =[1 + Щ (s) Нг (*)] U2 is) = J (g) U2 (s). A.231)
Заметим, что при наличии разрыва контура в каком-либо дру-
другом месте матрица возвратной разности будет иметь другой вид.
Тем не менее будем строго придерживаться определения, данного
выше. Термин «матрица усиления контура» достаточно ясен.
Определяющее значение для автоматического управления име-
имеет вопрос об устойчивости соединений систем. Для последова-
последовательного соединения получаем следующий результат, который не-
немедленно вытекает из рассмотрения характеристического поли-
полинома 'дифференциального уравнения расширенного состояния
A.220).
Теорема 1.20. Рассмотрим последовательное соединение
(рис. i.b), где системы {и 2 являются системами с постоянными
параметрами'и характеристическими полиномами q>i(s) и (f.z(s)
соответственно. Соединение имеет характеристический поли-
полином fxfs) ty.ifs). Поэтому объединенная система является асимп-
асимптотически устойчивой в том и только том случае., когда системы
i и 2 асимптотически устойчивы.
В терминах матричных передаточных функций устойчивость
систем с обратной связью (рис. 1.6) может быть исследована с
помощью следующего результата [36,- 75].
Теорема 1.21. Рассмотрим систему с обратной связью (рис. 1.0J,
в которой системы 1 и 2 являются системами с постоянными па-
параметрами и имеют матричные' передаточные функции H^s)
и H,z(s) соответственно; при этом в системе 1 нет прямой связи.
Тогда характеристический полином замкнутой системы равен.
щ (*) ср2 (s) det [7 + Щ (s) H2 (,)]. A.232)
Поэтому замкнутая система является устойчивой тогда и только
тогда, когда полином (\.2Ъ2) имеет нули со строго отрицатель-
отрицательными действительными частями.
Перед доказательством результата нужно отметить следую-
следующее. Выражение det[7 + H^H^s)] является рациональной
функцией от s. Если не происходит сокращения, знаменатель этой
функции равен <Pi(s)(p2(s)> так что числитель выражения
det [/ — ff1(s)//2(s)] является характеристическим полиномом объе-
объединенной системы. Выражение A.232) часто называют характе-
характеристическим полиномом замкнутого контура:
Теорему 1.21 можно доказать следующим образом. Для слу-
случая постоянных параметров из выражения A.224) следует диффе-
62 Глава 1
ренциальное уравнение состояния замкнутой системы
Покажем, что характеристический полином этой системы в точ-
точности соответствует A.232). Для этого необходим следующий ре-
результат из теории матриц.
¦Лемма 1.2, Пусть М — квадратная блочная матрица вида
M= '"* . A.234)
\М3 Mj
Тогда^при de\(M1) =? 0 имеем
det (M) — det (М4) det (М4 — М3 М М2), A.235)
а при detfM4j ^= 0 получаем
det (М) = det (M4) det (М4 — Мг М^ Мя). A.236)
Лемма просто доказывается посредством элементарных действий
со строками и столбцами матрицы М. С помощью лемм 1.2 и 1.1
(разд. 1.5.3) характеристический полином A.233) может быть
записан следующим образом:
I А± -\- Г>1 и% Ui JD{ls2
= det (si — Л2) det {si — Л4 + i51ZJC1 + 5tC2 (s/ — A2)~l BZCV\ =
== det (s/ — As) det (s/ — Az) X
X det {/-f Ct (s/— Л054 [C2 (s/— Azyi Bz+D2\) . A.237)
Так как
det (si—Ad — <?i{s),
det (s/ — A2) — Фг(?).
с1(»/-л1)в1 = я1(«), A238)
C2 (s/ — Л2)-г В2 + D2 '= Я2 (s),
выражение A.237) может быть переписано в виде
¦q>1(s)q>2(s)det[/ + tf1(s)tf2(s)l. • ' A.239)
Отсюда следует, что A.232) является характеристическим поли-
•Элементы теории линейных систем 63-
помом замкнутой системы; таким образом, устойчивость непосред-
непосредственно определяется корнями выражения A.232).
, Этот метод проверки устойчивости замкнутых систем обычно-
более удобен для систем со скалярными входной и выходной пере-
переменными, чем для многомерных систем. Для случая одномерных
систем имеем
Я1(*)=А^-, tfa(S)=i*M-, A.240)
где фДя) и <]>2(s) — полиномы числителей. На основании теоремы
1.21 устойчивость определяется корнями полинома
Ф1 (*) Фа (?) f 1 + Ь®^ ] = ф1 (s) ф2 (s) + ф4 (s) ф2 (s). A.241)
L <Pl (s) ?2 (s) J
При проектировании линейных автоматических систем часто-
имеет место ситуация, когда коэффициент усиления в обратной
связи или в прямой цепи остается неопределенным до последнего
этапа синтеза. Возьмем в качестве примера
Я1E) = р-^, A.242)
1 v 1,0 р — неопределенный коэффициент усиления. Характеристи-
Характеристические числа замкнутой системы являются в этом случае корнями
пыражепия
<Pi (*) Фг (*) + Р Ь (*) <Ь (*)• A-243)
Возникает интересная задача, состоящая в построении годо-
1 рафа корней этого полинома как функции скалярного параметра р.
¦ Ь'о частньш случай более общей задачи нахождения на комплек-
комплексной плоскости годографа корней выражения
- Ф(*) + Р<!>(*) ¦ A-244)
при изменении параметра р, где <p(s) и t]»(s) — произвольно задан-
заданные полиномы. Правила построения такого годографа приводятся
н следующем разделе.
Пример 1.16. Перевернутый маятник
Рассмотрим задачу стабилизации маятника из примера 1.1
(разд. 1.2.3). Ясно, что, если маятник начинает падать вправо,
толежка также должна двигаться вправо. Поэтому попытаемся
использовать для управления приложенную к тележке силу
|i(/), которая пропорциональна углу ф(?). Этот угол можно изме-
измерить потенциометром, установленным на оси; сила \i(t) приклады-
прикладывается с помощью небольшого сервомотора. Таким образом, имеем
ky(t), - ' A.245),
64 Глава 1
где к — константа. Нетрудно найти, что передаточная функция от
\i(t) к ц>A) равна
A.246)
Передаточная функция звена в обратной связи определяется
из A.245) как
H2(s) = —k. A.247)
Характеристический полином системы управления положением
имеет вид
ф1 (s) =s(s + -Lj (s* - -pj , A.248)
тогда как характеристический полином звена в обратной связи
равеп
ф2(*) = 1. A-249)
Из A.24С) и A.247) имеем
з i « F , i k 8 \ F g
S3 Ц_ S2 —— 4. s
,,„,,„,, М ' V L'M U ML' .. огп.
1 + Я, (s) 7/2 (s) = : —— '— ,• A.250)
((f
тог^да как из A.248) и A.249) получаем
ф1 (s) ф2(*) = s(s + ^-)^2 —?-) . A.251)
Заметим, что в данном случае знаменатель выражения
1 [- Jff1(s)JH(s) не является произведением характеристических
полиномов A.251) и что множитель s был сокращен. Поэтому числи-
числитель A.250) не является характеристическим полиномом замкнутой
системы. Вычисляя произведение выражений A.250) и A.251),
найдем, что характеристический полином замкнутой системы
имеет вид
М \ L' M L' ) ML')
Очевидно, что одно из характеристических чисел замкнутого
контура равно нулю. Более того, поскольку другой множитель
содержит член с отрицательным коэффициентом, согласно хорошо
Элементы теории линейных систем 65
известному критерию Рауса—Гурвица [159] существует по край-
крайней мере один корень с положительной действительной частью.
Это означает, что система не может быть стабилизирована данным
способом. В примере 2.6 (разд. 2.4) рассматривается более сложная
схема управления, с помощью которой удается добиться стабили-
лации системы.
Пример 1.17. Смесительный бак
Рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3).
Положим, что требуется установить такой режим работы системы,
при котором поддерживаются постоянный расход F(t) и постоян-
постоянная концентрация c(t). Один из методов достижения этой цели
состоит в регулировании расхода F путем изменения расхода
основного потока F1 и регулировании концентрации с посредством
изменения расхода другого потока F2.
Пусть выбраны следующие законы изменения входных пере-
переменных:
M*) M(*) A253)
Это означает, что система имеет в цепи обратной связи матрич-
матричную передаточную функцию
При численных значениях параметров из примера 1.2 матрич-
матричная передаточная функция системы в прямой цепи равна
0,01 0,01
0,25 0,75
s+0,02 s+0,02
Тогда матрица возвратной разности имеет вид
s + 0,01^ + 0,01 ' 0,01 к2 \ г
S + 0'01 ' s + 0-01 \ A.256)
— 0,25^ s + 0,75 А:2 +0,02 I
s + 0,02 s + 0,02. /
Найдем характеристические полиномы двух систем:
ф1 («) = (s + 0,01) (s + 0,02),
3-394
66 Глава 1
Из A.256) следует
L J
det \j (s)] = (* + °'olfei + °'01) (* + 0.75fc2 +.0,02) + 0,0025 frfr (
L J (s + 0,01) (s +0,02) , • I
Так как знаменатель этого выражения представляет собой
произведение <Pi(s)cp2(s), его числитель является характеристичес-
характеристический полиномом замкнутой системы. Выполняя дальнейшее пре-
преобразование выражения для характеристического полинома, по-
получим
s2 + s @,01fct + 0,75/с2 + 0,03) + @,0002*! + 0,0075*2 +
+ 0,01 kjet + 0,0002). A.259)
Это выражение показывает, что для положительных значений
кг и к2 замкнутая система является устойчивой. Выберем следую-
следующие значения для коэффициентов усиления: кх — 10 и к2 = 0,1.
Тогда характеристический полином имеет вид
s2 + 0,205s + 0,01295. A.260)
Характеристические числа равны
— 0,1025 ±/0,04944. A.261)
• Эффективность схемы управления A.253) исследуется в при-
примере 2.8 (разд. 2.5.3).
1.5.5.* КОРНЕВОЙ ГОДОГРАФ
Из предыдущего раздела следует, что иногда представляет
интерес построение на комплексной плоскости годографа корней
выражения вида
ФE) + РФ(*), -A-262)
где ep(s) и i])(s) — полиномы от s при изменении скалярного пара-
параметра р.
В настоящем разделе приводятся некоторые правила, относя-
относящиеся к построению годог.рафа, которые позволяют определять
некоторые специальные точки годографа и, в частности, асимпто-
асимптотическое поведение. Эти правила позволяют довольно легко вы-
вычертить годограф для простых задач; в более сложных задачах для
вычисления корневого годографа совершенно необходимо исполь-
использование ЦВМ. Мелса [127] приводит ФОРТРАН-программу для
вычисления корневого годографа.
Примем, что полиномы cp(s) и Ц$) имеют следующий вид:
Элементы теории линейных систем 67
/ \ I—[ / \
Ф IS) = I I (S —TCj),
i=1 - A.263)
m
. , \ i—r / \
TV/ 1 1 *¦ "' ч
где л4, i = 1, 2, ..., n, — полюса разомкнутого контура, a v4,
i = 1, 2, ..., т, — его кули. Корни A.262) назовем полюсами
замкнутого контура. Объяснение этим терминам можно найти в
разд. 1.5.4. Предположим, что т -^ п. Это не является ограниче-
ограничением, так как при яг >¦ п функции q>(s) и <b(s) можно поменять ро-
ролями, выбрав в качестве параметра 1/р.
Приведем следующие основные свойства корневого годог-
годографа.
а) Число корней. Число корней выражения A.262) равно п.
Каждый из. корней имеет свой непрерывный годограф при изме~
нении р от —• оо до оо.
б) Начало годографа. Годограф берет начало для р = О
в полюсах itj, i = 1, 2,..., п. Это вытекает из того факта, что
при р = 0 корни A.262) являются корнями cp(s).
в) Поведение годографа при р—»- ± оо. При р-> rfc.oo.
т годографов приближается к нулям Vj, г =1, 2, ..., т. Ос»
тальные п — т годографов стремятся к бесконечности.
Это следует из того, что корни A.262) также являются кррнями
выражения
—<Р(») + «К»)- ' A.264)
. Р
г) Асимптоты годографов. Указанные п — т годографов,
стремящихся к бесконечности, асимптотически приближаются
к п — т прямым, которые составляют углы
к = 0,1 п —те —1, A.265)
п — т
с положительной действительной осью при р -> + °° и углы
к 2п
— , fc = 0,l,..., п —те —1, A.266)
п — т
при р ->— оо. Эти п— т асимптот пересекаются в
одной точке на действительной оси, определяемой выражением
п т
^^ i ^ ^^ i
-^ — . A.267)
п — т
68 Глава 1
Отмеченные свойства объясняются следующим образом. Для
больших s выражение A.262) можно приближенно заменить
выражением
sn + psm.. A.268)
Корни этого полинома
(—p)I/("-m) A.269)
дают первое приближение в определении истинных корней. Более
точный анализ показывает, что лучшее приближение дает выра-
выражение
п т у
- Д>,
A.270)
Это подтверждает перечисленные выше свойства асимптотичес-
асимптотического поведения.
д) Части корневого годографа на действительной
оси.
Если предположить, что р принимает только положительные
значения, любая часть действительной оси, справа от которой
располагается нечетное количество полюсов и нулей на дейст-
действительной оси, является частью корневого годографа. Если р при-
принимает только отрицательные значения, то любая часть дей-
действительной оси, справа от которой на действительной оси ле-
лежит четное число полюсов и нулей, является частью корневого
годографа. Это можно показать следующим образом. Корни
выражения A.262) могут быть найдены из решения уравнения
' -f?J- = -p. A.271)
Если предположить, что р положительное, то|уравнение A,271)
эквивалентно действительным уравнениям
——— = % + 2nk, A.273)
+ («)
где k — произвольное целое число. Если s — действительное
число, то всегда существует р, для которого A.272) удовлетворяет-
удовлетворяется. Чтобы удовлетворялось также уравнение A.273), должно быть
нечетное число нулей и полюсов справа от s. Подобные рассужде-
рассуждения справедливы и для случая отрицательного р.
Могут быть установлены также некоторые другие свойства кор-
корневых годографов, облегчающие их построение [49], однако мы
Элементы теории линейных систем
69
-*-»»
-114.
-«-*-
-1
Im, С
-J
О
—j
3,14 Re, с
.-г
Рис. 1.8. Корневые годографы перевернутого маятника.
X полюса разомкнутого контура; О нуль разомкнутого контура.
ограничимся перечисленными выше правилами, поскольку этих
правил достаточно для достижения целей данной книги.
Пример 1.18. Перевернутый маятник
Рассмотрим предложенную схему с пропорциональной обрат-
обратной связью из примера 1.16, для которой характеристический
полином замкнутой системы записывается в виде
s\ s
F
М
c« .
L'M
A.274)
Здесь &_изменяется от 0 до оо. Полюса равны О, —F/M, Vg
и —VgIL'; в точке 0 имеется двукратный нуль. Асимптоты состав-
составляют углы я/2 и —л/2 с действительной осью при к -> оо, так как
п. — т = 2. Асимптоты пересекаются в точке —1/2 (F/M). Части
действительной оси между У gIL' и 0 и между — FIM и —УцШ
принадлежат годографу. Полюс в 0 совпадает с нулем; это означает,
что 0 всегда является одним из полюсов замкнутого контура. Го-
Годографы остальных корней для численных значений, заданных в
примере 1.1, показаны на рис. 1.8. Очевидно, что замкнутая систе-
система не является устойчивой при любых к, что уже было показано
и примере 1.16. '
70 Глава 1
1.6*. Управляемость
1.6.1.* ОПРЕДЕЛЕНИЕ УПРАВЛЯЕМОСТИ
Для решения задач управления важно знать, обладает ли дан-
данная система свойством быть управляемой в смысле перевода из
любого заданного состояния в любое другое заданное состояние.
Это приводит к введенному Калманом [86] понятию управляемос-
управляемости, которое обсуждается в данной главе. Дадим следующее опре-
определение.
Определение 1.11. Линейная система с дифференциальным урав-
уравнением состояния
x{t) = A (t) x(t) + B (t) и (t) A.275)
считается полностью управляемой, если она может быть переве-
переведена из нулевого состояния в момент t0 в любое конечное состояние
x(tx) = х1 за конечное время tx — t0. Здесь имеется в виду, что су-
существует кусочно-непрерывная входная переменная u(t), to<^.
< t <: tx, которая переводит систему из одного состояния в другое.
Определение 1.11 кажется отчасти ограниченным; так, един-
единственное требование заключается в том, что система может быть
переведена из нулевого состояния в другое состояние. Однако
дальше будет видно, что определение предполагает большее. Дви-
Движение системы из произвольного начального состояния, как сле-
следует из уравнения A.61), описывается выражением
х (tt) = Ф (tlf *0) х (t0) + ( Ф (*„ т> В (т) и (т) А, A.276)
I
так что"
х (tt) - Ф (tit g x (t0) = j' Ф (h, x) В (х) и (х) й-.. A.277)
Это показывает, что перевод системы из состояния x(tQ) = х0
в состояние x(tx) = хг достигается при той же самой входной пере-
переменной, которая переводит систему из состояния x(t0) = 0 в
состояние x(tx) = хх — Ф^., to)xo. Отсюда имеем следующий ре-
результат.
Теорема 1.22. Линейная дифференциальная система
x(t) = A (t) z(t)+B (t) u (t) A.278)
является полностью управляемой тогда и только тогда, когда она
может быть переведена из любого начального состояния х0 в про-
Элементы теории Линейных систем 71
изволъный начальный момент t0 в любое конечное состояние x(tx) —
= хх за конечное время tx— t0.
Пример 1.19. Смесительный бак
Предположим, что оба потока, поступающие в смесительный
бак (пример 1.2, разд. 1.2.3), имеют равные концентрации сх =
= с% = с. Тогда установившаяся концентрация в баке с0 также
равна с, а линеаризованное дифференциальное уравнение состоя-
состояния имеет вид
Из этого уравнения видно, что-приращение концентрации, яв-
являющееся второй компонентой состояния, не может управляться
посредством вектора входной переменной, компонентами которого
являются приращения втекающих потоков. Физически это также
ясно, так как по предположению втекающие потоки имеют равные
концентрации.
Поэтому очевидно, что система не является полностью управ-
управляемой, если ct = c2. При с4 ^= с2 система полностью управляема,
что будет показано в примере 1.21.
1.6.2.*. УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
В этом разделе рассматривается управляемость линейных сис-
систем с постоянными параметрами. Сначала получим следующий
важный результат.
Теорема 1.23. п-мерная линейная система с постоянными парамет-
параметрами
х (t) = Ах (t) + Bu (t) A.280)
является полностью управляемой тогда и только, тогда, когда
вектор-столбец матрицы управляемости
Р = (В, АВ, А2В А"'1 В) A.281)
порождает п-мерное пространство.
Этот вывод может быть доказан формально следующим обра-
образом. Если в момент времени t0 система находилась в нулевом сос-
состоянии, то состояние в момент ^определяется следующим образом:
h
j eMu^Bu(x) Л., A.282)
x(tt)= j
72 Глава 1
Представляя экспоненциал в виде ряда Тейлора, найдем
П h
х (tt) = В Г u(x)dx + AB j (ti — x)u (x) dx +
f
n
A.283)
Видно, что конечное состояние принадлежит линейному под-
подпространству, порожденному вектор-столбцами бесконечной по-
последовательности матриц В, АВ, А2В, ... . В этой последователь-
последовательности должна появиться матрица, скажем А1В, все вектор-стол-
вектор-столбцы которой линейно зависят от комбинации вектор-столбцов
предыдущих матриц В, АВ,..., А1~1В. Такая матрица должна иметь
место, так как в /г-мерном пространстве не может быть более чем п
линейно независимых векторов. Это также предполагает, что I < п.
Рассмотрим теперь А1+1В = А{А1В). Поскольку вектор-столб-
вектор-столбцы матрицы А1В линейно зависят от комбинации вектор-столб-
вектор-столбцов матриц В, АВ, ..., А1'1 В, можно написать
А'В = ВА0 + ABAt + ... + Л'15Л;_4, A.284)
где Лг, I = 0, 1, ..., Z — 1, являются матрицами, которые содержат
коэффициенты, позволяющие выразить каждый вектор-столбец
матрицы А1В через вектор-столбцы матриц В, АВ, ..., А1'1 В.
Следовательно, имеем
А1+1В = АВА0 + A2BAi + ... + А1ВЛМ , A.285)
откуда видно, что столбцы матрицы А1+1В также линейно зависят
от вектор-столбцов В, АВ, ..., А1~1В. Подобным же образом можно
показать, что вектор-столбцы всех матриц AkB для к > I линейно
зависят от вектор-столбцов матриц В, АВ, ..., А1~ХВ.
Возвращаясь к выражению A.283), можно видеть, что конечное
состояние x(ti) принадлежит линейному подпространству, порож-
порожденному вектор-столбцами матриц В, АВ, ..., А1'ХВ. Поскольку
I <J n, можно также сказать, что ж(^) принадлежит подпростран-
подпространству, порожденному вектор-столбцами матриц В, АВ, ..., Ап~^В.
Теперь ясно, что, если эти вектор-столбцы не порождают /г-мерное
пространство, можно достичь только тех состояний, которые при-
принадлежат линейному подпространству меньшей размерности,
поэтому система не является полностью управляемой. Это дока-
доказывает, что, если система полностью управляема, вектор-столбцы
управляемости Р порождают /г-мерное пространство.
Чтобы доказать другое утверждение теоремы, положим, что
вектор-столбцы матрицы Р порождают «-мерное пространство.
Тогда соответствующим выбором входной переменной и(т), t0 -<C
¦^С т -С h (включая, например, ортогональные полиномы), всегда
Элементы теории линейных систем
73
можно выбрать такие векторы коэффициентов
ч
1
и(-)
A.286)
в уравнении A.283), что правая часть A.283) будет равна любому
заданному вектору в пространстве, порожденном столбцами мат-
матрицы Р. По предположению столбцы матрицы Р порождают все п-
мерное пространство, а это означает, что любое конечное состояние
может быть достигнуто, и, следовательно, система является пол-/*
ностью управляемой. На этом заканчивается доказательство тео-
теоремы 1.23.
Управляемость системы A.280), конечно, полностью опреде-
определяется матрицами А и В. Поэтому удобно ввести следующую тер-
терминологию.
Определение 1.12. Пусть А и В — соответственно матрицы
размерности п X п и п X к. Тогда говорят, что пара {А, В}
полностью управляемая, если система
x(t) = Ax(t)-\-Bu(t) . A.287)
является полностью управляемой.
Пример 1.20. Перевернутый маятник
Перевернутый маятник из примера 1.1 (разд. 1.2.3) является
системой с единственной входной переменной, которая описывает-
описывается дифференциальным уравнением состояния
*(*) =
0
0
_?_
V
1
F_
О
О
о
о
J_
V
0
о
1
о
*(*)
< о
j_
О
0
!*(*). A.288)
Матрица управляемости системы имеет вид
0
J_
м
1
м
F
М
м м
F_
М
1
м
, м ) м \ м )
g
V
1
М
М } М
g 1
L' ЛГ
j_ _? i_
VMM
A,289)
74 Глава 1
Нетрудно видеть, что ранг матрицы Р равен четырем для всех
значений параметров, поэтому система является полностью управ-
управляемой.
1.6.З.* ПОДПРОСТРАНСТВО УПРАВЛЯЕМЫХ СОСТОЯНИЙ
В этом разделе анализируется структура линейных систем с
постоянными параметрами, которые не являются полностью уп-
управляемыми. Если система не является полностью управляемой,
то, очевидно, представляет интерес определение части пространст-
пространства состояний, которая может быть достигнута. В связи с
этим вводится следующее определение.
Определение 1.13. Подпространство управляемых
состояний линейной системы, с постоянными параметрами
x(t) = Ax{t)+Bu(t) A.290)
является линейным подпространством, состоящим из состояний,
которые могут быть достигнуты из нулевого состояния за конечное
время.
В связи с ролью, которую играет матрица управляемости Р,
является закономерным следующий результат.
Теорема 1.24. Подпространство управляемый: состояний п-мерной
линейной системы с постоянными параметрами
x(t) = Ax(t)+Bu(t) A.291)
является линейным подпространством, порожденным столбцами
матрицы управляемости
Р = (В, АВ, ..., А"-1 В). A.292)
Эта теорема непосредственно следует из доказательства теоре-
теоремы 1.23, где показано, что любое состояние, которое может быть
достигнуто из нулевого состояния, принадлежит подпространству,
порожденному вектор-столбцами В, АВ, ..., Ап~1В, а любое сос-
состояние, не принадлежащее указанному подпространству, не может
быть достигнуто. Подпространство управляемых состояний обла-
обладает следующим свойством.
Лемма 1.3. Подпространство управляемых состояний системы
x(t) = Ax(t) + Bu(t) инвариантно по отношению к матрице
А, т. е. если вектор х принадлежит подпространству управляе-
управляемых состояний, то вектор Ах также принадлежит этому подпро-
подпространству.
Доказательство этой леммы проведем по схеме доказательства
Элементы теории линейных систем ' 75
теоремы 1.23. Подпространство управляемых состояний порождает-
порождается вектор-столбцами матриц В, АВ, ..., Ап~хВ. Таким образом,
вектор Ах, где х — вектор, принадлежащий подпространству
управляемых состояний, принадлежит линейному подпростран-
подпространству, порожденному вектор-столбцами матриц АВ, АгВ, ..., Ап В.
Вектор-столбцы матрицы Ап В, однако, линейно зависят от вектор-
столбцов матриц В, АВ, ..., Ап~хВ; поэтому Ах принадлежит под-
подпространству, порожденному вектор-столбцами матриц В, АВ, ...
..., А"-1В,что означает принадлежность вектора Ах подпростран-
подпространству управляемых состояний. Следовательно, подпространство
управляемых состояний инвариантно по отношению к матрице А.
Понятие подпространства управляемых состояний можно пояс-
пояснить следующим фактом.
Теорема 1.25. Рассмотрим линейную систему с постоянными пара-
параметрами x(t) = Ax(t) + Buft). Тогда система из любого началь-
начального состояния, принадлежащего подпространству управляемых
состояний, может быть переведена в любое конечное состояние,
принадлежащее подпространству управляемых состояний, за ко-
конечное время.
Докажем этот результат, для чего запишем выражение для
состояния системы в момент t^.
А{h~U) x + f eA itl~T)
= еА{hU) x
+ f eA itl~T) Bu (x) fc. A.293)
п
Теперь заметим, что если х0 принадлежит подпространству уп-
управляемых состояний, то вектор exp [Afti- to)]xo также принад-
принадлежит ему, так как подпространство управляемых состояний ин-
инвариантно по отношению к матрице A, a exp lA(tt — t0)] =
= / + A(ti — t0) + 1/2A2(ti — t0) + ... . Поэтому если х^ при-
принадлежит 'пространству управляемых состояний, то х^ — ехр
\A(tt — ^0)^0 также принадлежит ему. Выражение A.293) пока-
покапывает, что любой вектор входной переменной, который переводит
нулевое состояние в состояние Zj^expfA (tt—to)]xo, также пе-
переводит х0 в Zj. Поскольку xt — exp [A (ti — t0)] x0 принадлежит
подпространству управляемых состояний, такой входной вектор
существует; таким образом, теорема 1.25 доказана.
Найдем теперь матрицу преобразования состояния с целью
представления системы в'канонической форме, которая облегча-
облегчает исследование свойетв "управляемости системы.
Предположим, что Р имеет ранг т -^Г. п, т. е. матрица Р имеет
т линейно независимых вектор-столбцов. Это означает, что под-
подпространство управляемых состояний системы A.290) имеет раз-
размерность т. Примем векторы е1; е2, ..., ет в качестве базиса под-
подпространства управляемых состояний. Далее, выберем п — т
76 Глава 1
линейно независимых векторов em+1, em+2, ..., еп, которые вмес-
вместе с векторами е1( е2, ..., ет порождают все re-мерное пространство.
Сформируем теперь неособую матрицу преобразования
. Т={Т,,Т2), A.294)
где
Г, = (е„ е2, ..., ет), . A.295)
212 = (em+1)em+2, ...,е„)- A-296)
Наконец, введем преобразованную переменную состояния
x'{t), определяемую соотношением
ZV @ =•*(<)• A.297)
Подставляя A.297) в дифференциальное уравнение состояния
A.290), получим
Tx'{t) = ATx' (t) + Bu{t), A.298)
или
х' (t) = Г ATx' (t) + Г1 Ви (t). A.299)
Разобьем Т~г на подматрицы следующим образом:
A.300)
при этом разбиение Т'1 соответствует разбиению Т в том смысле,
что Ui имеет тп строк, а'?/2 содержит п — m строк. В результате
имеем
откуда
UzTl = 0. A.302)
Матрица Ti состоит из векторов еи ег, ..., ет, которые порож-
порождают подпространство управляемых состояний. Это означает, что
из A.302) следует.
U 0 A.303)
для любого вектора х, принадлежащего подпространству управляе-
управляемых состояний.
С учетом разбиений A.294) и A.300) напишем
Г AT = ( Ul )а (Г„ Т2) = ( UiATi UiATz) A304)
1 U2 ) К { U2AT, U2AT2 )
<5>
Элементы теории линейных систем 77
Все столбцы матрицы Tt принадлежат подпространству управ-
управляемых состояний. Это означает, что все столбцы матрицы ATi
также принадлежат указанному подпространству, так как под-
подпространство управляемых состояний инвариантно по отношению
к матрице А (лемма 1.3). Однако тогда из A.303) вытекает
U2ATi = 0. A.306)
Очевидно, что все столбцы матрицы В принадлежат подпро-
подпространству управляемых состояний, так как В является частью
матрицы управляемости. Поэтому также получаем
U2B = 0. A.307)
Подведем итоги обсуждения следующим результатом.
'Георема 1.26. Рассмотрим п-мерную систему с постоянными
параметрами.
x{t) = Ax{t) + Bu(t). A.308)
Сформируем неособую матрицу преобразования Т = (Ти Т%),
где вектор-столбцы матрицы Т\ образуют базис т-мерного (т <^л)
подпространства управляемых состояний системы A.308), а век-
вектор-столбцы матрицы Т2 вместе, с вектор-столбцами матри-
матрицы Гг образуют базис всего п-мерного пространства. Определим
преобразованное состояние в виде
х' (t) = Г1 х (t). A.309)
Тогда дифференциальное уравнение состояния A.308) преобра-
преобразуется в каноническую форму управляемости
Ап А\
*'(*)=
Здесь Ап'— матрица т Хт, а пара [А1ХГ, Bt'} является пол-
полностью управляемой.
Разбивая вектор
A.311)
где .г/ имеет размерность т, а х2 — размерность п — т, и прини-
принимая во внимание теорему 1.26, легко установить, что преобразован-
преобразованную систему можно представить в виде, показанном на рис. 1.9.
Отметим, что поведение х2' полностью независимо, тогда как на
78 Глава 1
х-l оказывают влияние как х{, так и входная переменная и. Тот
факт, что пара {Ац' ,В^} полностью управляема, следует из того,
что любое состояние вида col (x0', 0) принадлежит подпростран-
подпространству управляемых состояний системы A.310). Доказательство
оставляем читателю в качестве упражнения.
Следует отметить, что каноническая форма управляемости не
является единственной, так как матрицы Ti и Т2 могут быть выбра-
ult)
*г
т.*
а)=А'ггх'га)
Рис. 1.9. Каноническая форма управляемости линейной дифференциальной
системы с постоянными параметрами.
ны до некоторой степени произвольно. Однако нетрудно убедить-
убедиться, что, какой бы ни была матрица преобразования Т, характерис-
характеристические числа обеих матриц А^' и А22 всегда являются такими
же, как в исходной системе (задача 1.12.5).
Вполне естественно назвать характеристические числа мат-
матрицы Ац' полюсами управляемости системы, а характеристические
числа матрицы А ц' полюсами неуправляемости. Предположим
теперь, что все характеристические числа системы A.310) являются
различными (это ограничение несущественно). Тогда нетрудно по-
показать (задача 1.12.5), что подпространство управляемых состояний
системы A.310) порождается собственными векторами, соответ-
соответствующими полюсам управляемости системы. Это утверждение
также справедливо и для исходного представления A.308) системы.
Тогда естественно определить подпространство неуправляемых
состояний (что пока еще не сделано) как подпространство, порож-
порожденное векторами, соответствующими полюсам неуправляемости
системы.
Пример 1.21. Смесительный бак
Смесительный бак из примера 1.2 (разд. 1.2.3) описывается диф*-
ференциальным уравнением состояния
Элементы теории линейных систем 79
-@=1 |*@+l ^ с2_с„ ]»(*). A-312)
и его матрица управляемости имеет вид
I I !_
Р = | _с ^^ ™ с_с ~ с_с ]• A-313)
Ранг матрицы Р равен двум при условии ct ^ сг- Следовательно,
система является полностью управляемой, если с4 -ф с2.
Если с4 = с2 = с, то с0 = с, и матрица управляемости прини-
принимает вид-
л _± L\
26 28 |. A.314)
0 0 0 /
Следовательно, подпространство управляемых состояний по-
порождается вектором col(l, 0). Это означает, как было видно из при-
примера 1.19, что можно управлять только объемом жидкости в баке,
по не концентрацией.
В заключение отметим, что при ct=c2 — с0 = с дифференциаль-
дифференциальное уравнение состояния A.312) принимает вид A.279), что яв-
является уже канонической формой управляемости. Значение
— 1/2е соответствует полюсу управляемости, а —Ve — полюсу
j юуправляемости.
1.Й.4.» СТАБИЛИЗИРУЕМОСТЬ
В данном разделе рассмотрим понятие стабилизируемости
|(»(), 185]. Соответствующая терминология будет объяснена в разд.
•4.2. В разд. 1.4.3 были определены подпространства устойчивых
и неустойчивых состояний для систем с постоянными параметрами.
•II юбое начальное состояние а;@) может быть единственным образом
представлено в следующем виде:
х @) = xs @) + хи @), A.315)
гдо xs @) принадлежит подпространству устойчивых состояний, а
;г„@) — подпространству неустойчивых состояний. Очевидно, что
для правильного управления системой требуется, чтобы неустой-
Ми иая компонента была полностью управляемой.
80 Глава 1
Определение 1.14. Линейная система с постоянными параметрами
x(t) = Ax(t)+Bu{t) A.316)
является стабилизируемой, если подпространство неустойчи-
неустойчивых состояний содержится в подпространстве управляемых состоя-
состояний, т. е. любой вектор х; принадлежащий подпространству не-
неустойчивых состояний, принадлежит также подпространству
управляемых состояний.
Иногда удобно использовать следующую упрощенную терми-
терминологию.
Определение 1.15. Пара {А, В} называется стабилизируемой, если
система
x(t) = Ax(t)+Bu(t) A.317)
является стабилизируемой.
Имеем следующий очевидный результат.-^
Теорема 1.27. Любая асимптотически устойчивая система с
постоянными параметрами является стабилизируемой. Любая
полностью управляемая система является стабилизируемой
Стабилизируемость системы удобно исследовать, если диффе-
дифференциальное уравнение состояния представлено в канонической
форме управляемости. Это вытекает из следующего результата. .
Теорема 1.28. Рассмотрим линейную систему с постоянными пара-
параметрами
x(t) = Ax(t)+Bu(t). A.318)
Предположим, что уравнение A.318) преобразовано согласно
теореме 1.26 в каноническую форму управляемости
x'(t)=[U'(t) + [ \u(t), A.319)
V?4 V )
где пара {Ап',Bt'} полностью управляемая. Система A.318) явля-
является полностью стабилизируемой в том и только том случае,
когда матрица А22 асимптотически устойчива.
Другими словами, система' является стабилизируемой тогда
и только тогда, когда ее полюса неуправляемости являются ус-
устойчивыми. Докажем теорему следующим образом.
а) Из стабилизируемости следует асимптотическая устойчи-
устойчивость матрицы Аг{. Предположим, что система A.318)
стабилизируемая. Тогда преобразованная система A.319) также
Элементы теории линейных систем 81
является стабилизируемой (задача 1.12.6). Пусть имеет место раз-
разбиение
x'(t) = [ , • A.320)
где размерность пг вектора Xi'{t) является размерностью подпро-
подпространства управляемых состояний исходной системы A.318).
Предположим, что матрица А22 является неустойчивой. Вы-
Выберем (п — т)-мерный вектор х2 в подпространстве неустойчивых
состояний, соответствующем матрице А22 . Тогда очевидно, что
//-.мерный вектор-столбец col@, х2) принадлежит подпространству
неустойчивых состояний системы A.319). Ясно, однако, что этот
пектор не принадлежит подпространству управляемых состояний
системы A.319). Это означает, что существует вектор, который
принадлежит подпространству неустойчивых состояний, но не
принадлежит подпространству управляемых состояний, что про-
противоречит предположению о стабилизируемости. Это доказывает,
что если система A.318) является стабилизируемой, то матрица
Л-,-1 должна быть устойчивой.
б) Из устойчивости матрицы А22' следует стабилизируемостъ.
Допустим, что матрица А22 устойчивая. Тогда любой вектор, кото-
который принадлежит подпространству управляемых состояний сис-
системы A.319), должен иметь форму соЦх^, 0). Однако, поскольку
пара {414'", Bi'} является полностью управляемой, этот вектор
иноке принадлежит подпространству управляемых состояний
системы A.319). Это показывает, что любой вектор из подпростран-
сгна неустойчивых состояний системы A.319) также принадлежит
подпространству управляемых состояний, поэтому система A.319)
ииляется стабилизируемой. Следовательно (задача 1.12.6), исход-
пая система A.318) является также стабилизируемой.
Пример 1.22. Смесительный бак
Смесительный бак из примера 1.2 (разд. 1.2.3) при условии
г, . с2 = с0 = с описывается дифференциальным уравнением сос-
¦юяния
Как было показано выше, эта система не является полностью
управляемой. Дифференциальное уравнение состояния уже имеет
каноническую форму управляемости. Матрица А22' имеет харак-
1 394
82 Глава 1
теристическое число —1/9, откуда следует, что система является
стабилизируемой. Это означает, что. даже если приращение кон-
концентрации ?2@ первоначально имеет неправильное значение, оно
в итоге будет стремиться к нулю.
1.6.5. УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ
С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ
Исследование управляемости на основе теоремы 1.24 для ли-
линейных систем с переменными параметрами является невозможным.
Для таких систем имеем следующий результат, который не будем
доказывать.
Теорема 1.29. Рассмотрим линейную систему с переменными па-
параметрами, дифференциальное уравнение состояния которой имеет,
вид
x(t) = A(t)x(t) + B(t)u(t). A322)
Запишем неотрицательно определенную симметрическую мат-
матричную функцию в виде
W (t0, t)= f Ф (t, ~) В (т) Вт (т) Фт (*, х) d-г,. A..323)
h
где Ф(г, t0) — переходная матрица системы. Система является
¦ полностью управляемой тогда и только тогда, когда для всех t^
существует такой момент времени tx (t0 < ^i < °°)i что матрица
W(t0, ti) является неособой.
Доказательство этой теоремы читатель может найти в книге
Калмана, Фалба и Арбиба [92}.
Матрица VF^,,, t^} связана g минимальной «энергией управ-
управления», необходимой для перевода системы из одного состояния
в другое. «Энергия управления» измеряется в соответствии с вы-
выражением
f uT(t)u(t) dt, A.324)
to
При определенных дополнительных ограничениях, наложенных
на матрицу W(t0, t), может быть введена более сильная форма уп-
управляемости [86].
Определение 1.16. Линейная система с переменными параметрами
A.322) является равномерно полностью управляемой,
• >.¦!( менты теории линейных систем 83
если, существуют положительные константы or, а0, оц, ро и р",,
такие, что
а) а0/ <: W (t0, t0 + о) < сц/ для всея iQ; A.325)
G) ft,/ « Ф (t0, to + a)W (t0, t0 + а) Фт (t0, t0 +
I a) « $J для всех t0, A.326)
,'de W(t0, t) — матрица A.323), a<$)(t, t0) — переходная матрица
системы.
Равномерная управляемость предполагает не только то, что
гистема может быть переведена из любого состояния в любое дру-
другое состояние, но также и то, чтв энергия управления, связанная
с :>тим переходом,,и время перехода практически не зависят от
лачального момента. В-связи с этим замечанием не является нео-
неожиданным следующий результат.
'Георема 1.30. Линейная система с постоянными параметрами
x(t) = Ax{t)+Bu(t) A.327)
мнляется равномерно полностью управляемой тогда и только тог-
(iii, когда она полностью управляема.
1.7. Восстанавливаемость
1.7.1*. ОПРЕДЕЛЕНИЕ ВОССТАНАВЛИВАЕМОСТИ
В гл. 4 рассматривается задача восстановления поведения сис-
системы цо неполным и, возможно, неточным наблюдениям. Перед
изучением такой проблемы важно знать, обладает ли данная сис-
система свойством, позволяющим определить ее состояние по пове-
поведению выходной переменной. Это приводит к понятию восстанав-
.шваемости [921, которое обсуждается в данном разделе.
Ппедем сначала следующее определение.
Определение 1.17. Пусть y(t; t0, x0, и) описывает изменение вы-
.ю()ной переменной y(t) линейной дифференциальной системы
. A.328)-
y(t) = C(t)x(t)
и.i начального состояния x(t0) = хп. Тогда система называется
полностью восстанавливаемой, если для всех tt существует такой
-г
84 Глава 1
момент t0, — оо < tn < tu что из равенства
У (t; t0, х0, и) = у (t; t0, xQ , и) to^t<.tit A.329)
для всех u(t), t0 ¦*<
<-'. t <^ tlt следует x0 — x0'.
Определение показывает, что, если система является полностью
восстанавливаемой и выходная переменная наблюдается до про-
произвольного момента tit всегда существует момент t0 <; t{, при ко-
котором состояние системы может быть определено единственным
образом. Если x(t0) известно, значение x(t^) также может быть оп-
'ределено.
Следующий результат показывает, что для исследования вос-
восстанавливаемости системы A.328) можно ограничиться рассмотре-
рассмотрением упрощенной ситуации.
Теорема 1.31. Система A.328) является полностью восстанавли-
восстанавливаемой в том и только том случае, если для всех ti существует
такой момент t0> — оо< t0 < tu что из равенства
y(t;to,xo,O) = O, to<.t<tlt A.330)
следует хп = 0.
Этот результат нетрудно доказать. Конечно, для полностью
восстанавливаемой системы A.328) из определения следует, что
если A.330) справедливо, то хп = 0. Это доказывает одно утверж-
утверждение теоремы. Однако, поскольку
It
ф (*, g х0 + f ф (t, -) в (т) и (х) dx , A.331)
и . ¦
равенство
имеет место при .
C(tL>(t,to)xo=C(t)<I>(t,tJxo, *„<*<*!. C.333)
Это в свою очередь эквивалентно соотношению
C(t)<b{t,to)(xo—xo) = O, to<t<Ztt. A.334)
Очевидно, если из A.334) следует, что х0 — х^' ¦— 0, т.е.
х0 = х0', то система является полностью восстанавливаемой. На
этом завершается доказательство другого утверждения теоремы
1.31.
Определение восстанавливаемости введено Калманом [92].
Следует отметить, что восстанавливаемость дополняет понятие на-
наблюдаемости. Говорят, что система вида A.328) полностью наблю-
Элементы теории линейных систем 85
даема, если для всех t0 существует такое время tt < оо, что из
равенства
y(t; tQ, xQ, и) = у (t; t0, x'o, и), to<t <. tt A.335)
для всех u(t), tQ <^ t -< tu следует xn = x0'. Наблюдаемость озна-
означает, что имеется возможность определить состояние в момент
t0 по будущим значениям выходной переменной. В задачах управ-
управления и фильтрации, однако, имеются обычно только прошлые зна-
значения выходной переменной. Поэтому более естественно рассмат-
рассматривать восстанавливаемость, которая ставит задачу определения
настоящего состояния по прошлым наблюдениям. Нетрудно обна-
обнаружить, что для систем с постоянными параметрами из полной
посстанавливаемости следует полная наблюдаемость и наоборот.
Пример 1Л23. Перевернутый маятник
Рассмотрим перевернутый маятник из примера 1.1 (разд. 1.2.3)
и примем в качестве выходной переменной угол q>(t). Сравним сос-
состояния
A.336)
Второе состояние отличается от первого (нулевого) тем, что и
тележка, и маятник перемещаются на расстояние d0; иначе говоря,
система находится в покое. Если приложенное входное воздейст-
воздействие равно нулю, система остается в прежнем положении и ср(?) = О
в обоих случаях. Ясно, что, если наблюдается только угол q(t),
невозможно решить, в каком из этих двух состояний находится
система в настоящее время; таким образом, система не является
полностью восстанавливаемой.
1.7.2*. ВОССТАНАВЛИВАЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
В этом разделе обсуждается задача о восстанавливаемости ли-
линейных систем с постоянными параметрами. Основной результат
заключается в следующем.
Теорема 1.32. п-мерная линейная система с постоянными па-
параметрами
0 \
1
0
о/
и
/do
/ 0
1
do
\0
= Cx(t)
86
Глава 1
является полностью восстанавливаемой в том и только том
случае, если вектор-строки матрицы восстанавливаемости
порождают п-мерное пространство
С-
СА
СА2 A.338)
Это может быть доказано следующим образом. Сначала пред-
предположим, что система A.337) является полностью восстанавливае-
восстанавливаемой. Тогда из теоремы 1.31 следует, что для всех f4 существует та-
такой момент tu, для которого из равенства
CeMt~*°)x0 = Q, to<.t<.tit A.339)
получаем х0 = 0. Представляя ехрЫ(? — ?<j)] B виДе Ряда Тейлора,
находим, что выражение A.339) эквивалентно равенству
2!
t0 ¦< t
С А2
3!
+ ...]*„ = 0.
A.340)
Если .матрица восстанавливаемости Q не имеет полного ранга, су-
существует такое ненулевое х0, что
Сх = 0 С Ах = 0 С Ап~^ х =¦ 0 A 3411}
Используя теорему Кэли—Гамильтона, нетрудно видеть, что
СА'х0 = 0 для I >- п. Таким образом, если Q не имеет полного
ранга, существует такое ненулевое х0, для которого справедливо
A.340). Ясно, что в этом случае из A.339) не следует х0 — 0, и
система не является полностью восстанавливаемой. Это противоре-
противоречит нашему допущению, откуда следует, что матрица Q должна
иметь полный ранг.
Докажем теперь другое утверждение теоремы 1.32. Допустим,
что Q имеет полный ранг. Предположим, что
y(t)=CeMt~t>)x0 = 0, *„<*<*!. . A.342)
Многократно дифференцируя y(t), получаем
y(to) = Cxo = O,
у' (д = С Ах, = 0,
A.343)
Элементы теории линейных систем
87
или Qxo = O. A.344)
Поскольку Q имеет полный ранг, из A.344) следует, что х0 = 0.
Отсюда на основании теоремы 1.31 имеем, что система является
полностью восстанавливаемой. На этом заканчивается доказатель-
доказательство теоремы 1.32.
Поскольку восстанавливаемость системы (.1.337) зависит толь-
только от матриц А и С, удобно использовать следующую термино-
терминологию.
Определение 1.18. Пусть А и С — матрицы размерами пХп,
и I X п соответственно. Тогда пара {А, С} называется полно-
полностью восстанавливаемой, если система
x(t) = Ax(t),
y(t) = Cx{t)
A.345)
A.346)
является полностью восстанавливаемой.
Пример 1.24. Перевернутый маятник
Перевернутый маятник из примера 1.1 (разд. 1.2.3) описывает-
описывается дифференциальным уравнением состояния
0
0
0
g_
V
1
F
M
0
0
0
0
0
g
и
0
0
1
0
x(t) =
Если в качестве выходной переменной ti (t) принять угол
получим
(b){t)- (L348)
*(*) +
¦
0
1
M
0
0
A-347)
Матрица
- 1
L'
0
g
V
0
восстанавливаемости имеет
1
L'
—
F
M
— ¦
0
1
V
g
T'
l
l
17"
i
V
0
g
I f \2 i
~[~m) U
вид
1
V
0
1
L'
0
¦g
V
1
. A.349)
Глава 1
Эта матрица имеет ранг, равный трем; следовательно, система
. не является полностью восстанавливаемой. Это подтверждает
вывод примера 1.23. Если добавить в качестве второй компоненты
выходной переменной перемещение тележки s{t), получим
—L о J-
v
1
о
и
о
о
о
\x(t).
A.350)
Это приводит к матрице восстанавливаемости
J_
V
О
Q =
1
и
1
0
0
g
V
0
0
0
0
0
1
~~ V
1
F 1
~М~ ~~L'
F
~^~ L' 1
Л/
1
V
О
_?_
L'
О
О
о
о
о
7
о
о
о
g
о
A.351)
При данной выходной переменной система является полностью
восстанавливаемой, так как матрица Q имеет ранг, равный четырем.
1.7.3*. ПОДПРОСТРАНСТВО НЕВОССТАНАВЛИВАЕМЫХ СОСТОЯНИЙ
В этом разделе анализируется структура систем, которые не
являются полностью восстанавливаемыми. Если система не яв-
является полностью восстанавливаемой, то по выходной переменной .
невозможно однозначно установить, в каком состоянии система
находится. Ясно, что представляет интерес вопрос, какая мера
неопределенности остается. Это приводит к следующему опре-
определению.
Определение 1.19. Подпространство невосстанавливае-
мыж состояний линейной системы с постоянными параметрами
A.352)
Элементы теории, линейных систем 89
является линейным подпространством состояний х0, для которых
y(t;to,xo,i)) = O, t>t0. A.353)
Следующая теорема характеризует подпространство-невосста-
павливаемых состояний.
Теорема 1.33. Подпространство невосстанавливаемых состояний
п-мерной линейной системы с постоянными параметрами
(
= Cx(t)
является нуль-пространством матрицы восстанавливаемости
Q = \ CA* \ A.355)
Доказательство этой теоремы непосредственно следует из до-
доказательства теоремы 1.32, где показано, что любое начальное
состояние, принадлежащее нуль-пространству матрицы Q, по-
порождает выходную переменную, которая идентична нулевой ре-
реакции при нулевом входном сигнале. Любое начальное состояние,
пе принадлежащее нуль-пространству матрицы Q, вырабатывает
ненулевую реакцию, показывающую, что нуль-пространство ма-
матрицы Q является подпространством невосстанавливаемых сос-
состояний. Подпространство невосстанавливаемых состояний обла-
обладает следующим Свойством.
Лемма 1.4. Подпространство невосстанавливаемых состояний
системы x(t) = Ax(t), y(t) = Cx(t) инвариантно по отношению
к матрице А.
Доказательство этой леммы предоставляем в виде упражнения
читателю.
Понятие подпространства невосстанавливаемых состояний
можно пояснить следующим результатом.
Теорема 1.34. Рассмотрим систему с постоянными параметрами
x(t) = Ax(t)+Bu(t), (
y(f) = Cx(t).
Предположим, что выходная y(t) и входная u(t) переменные
известны на интервале t0 ^ t -^ tt. Тогда начальное состояние
¦Q0 Глава 1
системы в момент t0 определяется с точностью до произвольного
вектора, принадлежащего подпространству невосстанавливаемых
состояний. В результате конечное состояние в момент tt также
определяется с точностью до произвольного вектора, принадле-
принадлежащего подпространству невосстанавливаемых состояний.
Чтобы доказать первую часть теоремы, надо показать, что если
два начальных состояния x(t0) = х0 и x(t0) — х0' производят одну
и ту же самую выходную переменную y(t), t0 ^ t <^ tlt при любой
входной переменной u(t), t0 <! t ^ tv то х0 — ха' принадлежит под-
подпространству невосстанавливаемых состояний. Это, очевидно,
справедливо, так как вследствие линейности системы условие
у (t' t х и) = у (t~ t x u\ t < t <: t A 357)
эквивалентно условию
y(t; t0, хй — x'0,Q) = 0, to<t<tit A.358)
откуда следует, что х0 — х0' принадлежит подпространству невос-
невосстанавливаемых состояний.
Вторая часть теоремы доказывается следующим образом. Ре-
Результатом добавления произвольного вектора х0", принадлежа-
принадлежащего подпространству невосстанавливаемых состояний, к векто-
вектору х0 является добавление выражения ехр[Л(^ — ^0)]ж0" к конеч-
конечному состоянию. Поскольку выражение ехр[4(^ — t0)] может
быть разложено в степенной ряд матрицы А и подпространство
невосстанавливаемых состояний инвариантно по отношению к
матрице А, то exp [A(tl — to)]xo" также принадлежит подпростран-
подпространству невосстанавливаемых состояний. Более того, поскольку мат-
матрица exp [4(it — ?0I неособая, это означает, что конечное состо-
состояние определяется с точностью до произвольного вектора, принад-
принадлежащего подпространству невосстанавливаемых состояний.
Рассмотрим теперь преобразование состояния, которое пред-
представляет систему в канонической форме с целью простого выяв-
выявления свойств- восстанавливаемости системы. Предположим, что
Q имеет ранг т <^ п, т. е. Q имеет т линейно независимых вектор-
строк. Это означает, что нуль-пространство Q и, следовательно,
подпространство невосстанавливаемых состояний имеют размер-
размерность га — т. Вектор-строки матрицы Q порождают иг-мерное ли-
линейное подпроетранство; положим, что вектор-строки /lt /2, :..,/m
образуют базис этого подпространства. Очевидно, за базис следу-
следует принять т независимых вектор-строк матрицы Q. Далее пусть
fm+u fm+z, ¦•-, in являются п — т линейно „независимыми вектор-
стррками, которые вместе с /1? ..., fm порождают все га-мерное
пространство. Составим неособую матрицу преобразования
' и = [и„Л, A.359)
Элементы теории линейных систем 91
где
•' /тп+1 \
/т+2 1 . A.360)
fm/ \ln )
Наконец, введем преобразованную переменную состояния
х' (t) = Ux(t). A.361)
Подставляя A.361) в A.356), получим
V1 х' (t) = AU-i х' (t) + Ви (t), A 362)
у (t) = CU-1 x' (t), ¦
или
, A363)
= CU-1x'(t). ¦
Представим матрицу U в виде
U-1 = G\, Т.г), A.364)
что соответствует Такому разбиению U, при котором Tj имеет гп,
а Т2 — п — m столбцов. Имеем
откуда следует
UiT2 = Q. A.366)
Строки "матрицы [74 дополняются линейными комбинациями
линейно независимых строк матрицы восстанавливаемости Q.
Ото означает, что любой вектор х, который удовлетворяет усло-
условию UiX = 0, также удовлетворяет условию Qx — 0 и поэтому,
принадлежит подпространству невосстанавливаемых состояний.
Поскольку
UiT2 = 0,' A.367)
«се вектор-столбцы матрицы Tz должны принадлежать подпро-
странству невосстанавливаемых состояний. Тгш как Т2 имеет
п — тп линейно независимых вектор-столбцов и подпространство
невосстанавливаемых состояний имеет размерность п — тп, век-
вектор-столбцы матрицы Т2 образуют базис подпространства. Поэто-
Поэтому из A.367) следует U^x = 0 для любого х, принадлежащего под-
подпространству.
92 Глава 1
При разбиении A.359) и A.364) имеем
в
CU-1 = (CTlt СТ2). A.369)
Все вектор-столбцы матрицы Т2 принадлежат подпространству
невоестанавливаемых состояний; поскольку подпространство ин-
инвариантно по отношению к матрице А (лемма 1.4), столбцы матри-
матрицы А Т2 также принадлежат подпространству, и из A.367) имеем
UtAT2 = 0. A.370)
Поскольку строки матрицы С являются строками матрицы
восстанавливаемости Q, а столбцы матрицы Тг принадлежат под-
подпространству невосстанавливаемых состояний и, следовательно,
нуль-пространству матрицы Q, получаем
СТг = 0. A.371)
Подведем итоги следующим образом.
Теорема 1.35. Рассмотрим п-мерную линейную систему с постоян-
постоянными параметрами
x(t) = Ax(t) + Bu(t), A.372)
y(t)=Cx(t).
Сформируем неособую матрицу преобразования
A.373)
где т строк матрицы [74 образуют базис т-мерного (т ^ п) под-
подпространства, порожденного строками матрицы восстанавливае-
восстанавливаемости системы, п—т строк матрицы \]г вместе с т строками
матрицы U1 образуют базис всего п-мерного пространства.
Определим преобразованную переменную состояния как
„I /f\ TJr lf\ (А Он/Л
С использованием преобразованной переменной состояния сис-
система представляется в канонической форме восстанав-
восстанавливаемости
Ап 0 \ ( В\
4.
x'(t) =
A.375)
y(t) = (C[, 0)x'(t).
Элементы теории линейных систем
93
Здесь Ап' — матрица размерами m X m, а пара
.является полностью восстанавливаемой.
При разбиении
х (t) =
A.376)
где xt' имеет размерность т, а х2' — размерность п — т, из тео-
теоремы 1.35 следует, что система может быть представлена в виде,
показанном на рис. 1.10. Заметим, что никакого суждения о пере-
u(t)
Xjftj = A'21 x{ [t) + A\
zx'z[t)+B'zu(t)
1 'ii<-,
1.10. Каноническая форма восстанавливаемости линейной дифференци-
дифференциальной системы с постоянными параметрами.
менной х{ не может .быть сделано по наблюдению выходной пере-
переменной у. То, что пара {AXir, С4} является полностью восстанав-
восстанавливаемой, вытекает из следующего: если начальное состояние
¦'¦'('о) ПРИ нулевом входном сигнале производит нулевую реакцию,
оно должно иметь вид x'(t0) = col@, х2о'). Полное доказательство
читатель может провести сам в качестве упражнения.
В заключение отметим, что каноническая форма восстанавли-
шюмости не является единственной, так как матрицы Ui и Ui
могут быть выбраны до некоторой степени произвольно. Однако,
|,;\кое бы преобразование ни выполнялось, можно показать, что
характеристические числа матриц Atl' и А22.' всегда являются те-
теми же самыми, что и в исходной системе. Это приводит к определе-
определению характеристических чисел матрицы Аи' как полюсов восста-
восстанавливаемости, а характеристических чисел матрицы AZ2 как
полюсов невосстанавливаемости системы A.372). Для простоты по-
положим, что все характеристические числа системы являются раз-
различными. Тогда можно доказать, что подпространство невосста-
навливаемых состояний системы порождается теми собственны-
собственными векторами системы, которые соответствуют полюсам невос-
94 Глава 1
станавливаемости. Это справедливо как для преобразованного
A.375), так и для исходного A.372) представления системы. Впол-
¦не естественно теперь определить подпространство восстанавли-
восстанавливаемых состояний системы A.372) как подпространство, порож-
порожденное собственными векторами системы, соответствующими
полюсам восстанавливаемости.
Пример 1.25. Перевернутый маятник
В примере 1.24 было показано, что перевернутый маятник не
является полностью восстанавливаемым, если в качестве наблю-
наблюдаемой переменной выбран угол ц>(?). Определим теперь подпро-
подпространство невосстанавливаемых состояний и каноническую форму
восстанавливаемости. Нетрудно видеть, что строки матрицы вос-
восстанавливаемости Q, определяемой выражением A.349), порож-
порождаются^ вектор-строками
(-1,0,1,0), @,-1,0,1), @,1,0,0). A.377)
Любой вектор х = соЦ?!, %%, %3, ?4), принадлежащий нуль-
пространству Q, должен удовлетворять условиям
= 0, A.378)
Это означает, что подпространство" невосстанавливаемых сос-
состояний порождается вектором
col A, 0, 1, 0). A.379)
Любое начальное состояние, пропорциональное этому вектору,
является неотличимым от нулевого состояния, как показано
в примере 1.23.
Чтобы привести уравнение системы к канонической форме
восстанавливаемости, выберем вектор-строки A.377) в качестве
первых трех строк матрицы преобразования U. Четвертую строку
выберем до некоторой степени произвольно:
A, 0, 0, 0). A.380)
Найдем матрицу преобразования U и соответствующую ей
обратную матрицу
/ — 1 0 1 0\ /0 0 6
0 _1 0 l\ [/-i/oO
0 1 0 0 Г I 1 0 0
1 0 0 0/ \ 0 1 1
Элементы теории линейных систем
95
Преобразованная
< (t) =
0
g
V
0
0
,1
0
0
0
система
0
F
M
F
M
1
уравнений имеет
. 01
* 0
• 0
. 0
*'(*) +
вид
0
1
М
1
М
о
V-it), A.382)
= (-L 0, 0, O)ar'(t).
Как следует из A.24), компонентами преобразованного состоя-
состояния являются
A.383)
В этом представлении положение и скорость маятника отно-
относительно тележки, так же как скорость тележки, могут быть вос-
восстановлены по наблюдаемой переменной, но нельзя восстановить'
положение тележки.
Нетрудно видеть, что полюсами восстанавливаемости являются
—FIM и ±V gIL'. Полюс невосстанавливаемости равен 0.
1.7.4*. ОБНАРУЖИВАЕМОСТЬ
В предыдущем разделе было показано, что при наблюдении
Л1.1ходной переменной не полностью восстанавливаемой системы
ж-игда существует неопределенность в определении действитель-
действительного состояния системы, так как к любому возможному состоянию
можно добавить произвольный вектор, принадлежащий подпро-
подпространству невосстанавливаемых состояний (теорема 1.34). Самое
лучшее, на что можно рассчитывать в данной ситуации, состоит
к следующем.
Любое состояние, принадлежащее подпространству невосста-
невосстанавливаемых состояний, обладает тем свойством, что дйижение
системы из этого состояния при нулевом входном сигнале сходится
и нулю. Это соответствует случаю, когда любое состояние, принад-
принадлежащее подпространству невосстанавливаемых состояний, при-
принадлежит также подпространству устойчивых состояний системы.
Тогда, что бы ни было принято в качестве невосстанавливаемой
96 Глава,1 х ....
компоненты состояния, ошибка никогда не будет неограниченно
возрастать. Систему, обладающую таким свойством, будем назы-
называть обнаруживаемой [185]. Определим это свойство следующим
образом.
Определение 1.20. Линейная система с постоянными параметрами
x(t) = Ax(t) + Bu(t), A.384)
y(t)=Cx(t)
является обнаруживаемой, если ее подпространство невосстанав-
ливаемых состояний содержится в подпространстве устойчивых
состояний.
Удобно использовать следующую упрощенную терминологию.
Определение 1.21. Пара {А, С} является обнаруживаемой, если
система
x(t) = Ax(t), A385)
у (t) = Cx (t)
является обнаруживаемой.
Следующий результат непосредственно вытекает из опреде-
определения.
Теорема 1.36. Любая асимптотически устойчивая система вида
A.384) является обнаруживаемой. Любая полностью восстанавли-
восстанавливаемая система вида A.384) является обнаруживаемой.
Обнаруживаемые системы обладают следующим свойством.
Теорема 1.37. Рассмотрим линейную систему с постоянными
параметрами
x(t) = Ax(t), (
y(t)=Cx(t).
Предположим, что, согласно теореме 1.35, система преобра-
преобразована к виду
A.387)
y(t) = (C\,O)x'(t),
где пара {Ацг С/} является полностью восстанавливаемой. Тогда
Элементы теории линейных систем • ' 97
система является обнаруживаемой в том и только том случаег
если матрица А^г асимптотически устойчивая.
Теорему можно подытожить следующим утверждением: сис-
система является обнаруживаемой тогда и только тогда, когда ее
полюса невосстанавливаемости являются устойчивыми. Докажем
теорему следующим образом.
а) Из обнаруживаемости следует асимптотическая устойчи-
устойчивость А22 ¦ Пусть вектор преобразованной переменной состояния
разбит следующим образом:
/ х\ (t)
где размерность т вектора xt'(t) равна рангу матрицы восстанав-
восстанавливаемости. То, что система является обнаруживаемой, обусловли-
обусловливает следующий факт: любое начальное состояние, принадлежащее
подпространству невосстанавливаемых состояний, дает реакцию,
сходящуюся к нулю. Любое начальное состояние, принадлежащее
подпространству невосстанавливаемых состояний, имеет в преоб-
преобразованном представлении вид
°) A389)
Изменение преобразованного состояния из этого начального
состояния определяется выражением
x'(t) = l . ). A.390)
V*22*2(°)/
Поскольку эта реакция должна сходиться к нулю, матрица
/122' должна быть устойчивой.
б) Из асимптотической устойчивости А22 следует обнаружи-
ваемостъ. Любое начальное состояние х@), принадлежащее под-
подпространству невосстанавливаемых состояний, должно в преоб-
преобразованном представлении иметь вид
A-391)
Движение из этого состояния описывается выражением
22 х2@)
«8 Глава 1
Поскольку матрица А22 является устойчивой, такая реакция
сходится к нулю. Это показывает, что состояние х@), которое по
предположению принадлежит подпространству невоестанавли-
ваемых состояний, также принадлежит и подпространству устой-
устойчивых состояний. Из этого следует, что система является обнару-
обнаруживаемой.
Пример 1.26. Перевернутый маятник.
Рассмотрим перевернутый маятник в преобразованном представ-
представлении из примера 1.25. Матрица А^' имеет характеристическое
число 0, откуда следует, что система не является обнаруживаемой.
Это означает, что, если первоначально существует неопределен-
неопределенность в определении положения тележки, такая ошибка будет ос-
оставаться постоянной.
1.7.5*. ВОССТАНАВЛИВАЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ
С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ
Восстанавливаемость линейных систем с переменными napaJ
метрами можно исследовать следующим образом.
Теорема 1.38. Рассмотрим линейную систему с переменными па-
параметрами
x(t) = A(t)x(t)+B(t)u(t), A393)
y(t) =C(t)x(t).
Запишем для нее неотрицательно определенную матричную
функцию
ts
Рг(~, t) CT (i) С (i) Ф (т, t)dk, A.394)
где Ф(% t0) — переходная матрица системы. Система является
полностью, восстанавливаемой в том и только том случае, если
для всех ti существует такой момент времени t0, —со < t0 < ti7
для которого матрица M(t0, tj является неособой.
Доказательство читатель может найти в работах [29, 92]. Более
сильная форма восстанавливаемости приводит в результате к на-
наложению дополнительных условий на матрицу М [86].
Определение 1.22. Система с переменными параметрами A.393)
является равномерна полностью восстанавливаемой,
если существуют такие положительные константы <у, осо, ai7 po
и р4, что
Элементы теории линейных систем 99
а) а0/ < М (ti —0, i4) < aj для всех tu A.395)
б) р0/ < Фг(^ —а, tj M (ti — о, tt) Ф (tt — a, t^ < а,/ для всех- tit
A.396)
где M(t, tj — матричная функция A.394).
Равномерная восстанавливаемость гарантирует, что идентифи-
идентификация состояния всегда возможна приблизительно в пределах оди-
одинакового интервала времени. Для систем с постоянными парамет-
параметрами справедливо следующее.
Теорема 1.39.' Линейная система с постоянными параметрами
(
y(t)=Cx(t)
является равномерно полностью восстанавливаемой в том и только
в том случае, если она является полностью восстанавливаемой.
1.8*. Дуальность линейных систем
При изучении свойств управляемости и восстанавливаемости
нетрудно было заметить симметрию свойств, которую можно ис-
исследовать более полно, использовав принцип дуальности (двой-
(двойственности) [86, 92].
Определение 1.23. Рассмотрим линейную систему с переменными
параметр ами
(
y(t)=C(t)x(t),
а также систему
>(*)= AT(t* — t)x*(t) + CT(t* — t)u*(t), ¦
A.399)
y*(t)=BT(t*—t)x*(t),
где t* — произвольный фиксированный момент. Система A.399)
называется дуальной системе A.398) относительно момента t*.
Цель введения дуальных систем становится очевидной в гл. 4,
где обсуждается дуальность задач линейного оптимального уп-
управления и задач линейного оптимального наблюдения. В связи
с этим имеем следующий результат.
Теорема 1.40. Система, дуальная системе A.399) относительно
момента t*, является исходной системой A.398).
100 ¦ Глава 1
Существует тесная связь между восстанавливаемостью и уп-
управляемостью исходной и дуальной систем.
Теорема 1.41. Рассмотрим систему A.398) и дуальную ей систему
A.399), где время t*, произвольное.
а) Система A.398) является (равномерно) полностью управ-
управляемой в том и только том случае, если дуальная система (равно-
(равномерно) полностью восстанавливаемая.
б) Система A.398) является (равномерно) полностью восста-
восстанавливаемой в том и только том случае, если дуальная система
(равномерно) полностью управляемая.
в) Предположим, что система A.398) имеет постоянные пара-
параметры. Тогда система A.398) является стабилизируемой в том
и только том случае, если дуальная система обнаруживаемая.
г) Предположим, что система A.398) имеет постоянные пара-
параметры. Тогда она является обнаруживаемой, если дуальная сис-
система стабилизируемая.
Приведем доказательство только для систем с постоянными
параметрами. Матрица восстанавливаемости дуальной системы
имеет вид
?* =
В1
ВТ(АТ)
уВТ(Ат)
Г \л-1
= РТ
A.400)
где Р — матрица управляемости исходной системы. Это сразу до-
доказывает утверждение (а).
Утверждение (б) теоремы доказывается подобным же образом.
Матрица управляемости, дуальной системы определяется выраже-
выражением
Р* = (СГ , АТСГ, ..., (A7)'1-1 CT) = QT, A.401)
где Q'— матрица восстанавливаемости исходной системы. Отсюда
следует справедливость утверждения (б).
Утверждение (в) может быть доказано следующим образом.
Исходная система с помощью преобразования х = Т~1х, согласно
теореме 1.26 (разд. 1.6.3), может быть приведена к канонической
форме управляемости
х' (t) =
\x'{t)
В,
\u(t),
X22 ,
= (C[, C2)x'(t).
A.402)
Элементы теории линейных систем 101
Если система A.398) стабилизируема, то пара {Аи', Z?/} яв-
является полностью управляемой, а А 1г^~устойчивой. Система,
. дуальная преобразованной системе, имеет вид
A.403)
Поскольку пара {Ац1, Вн'} является полностью управляемой,
пара {Ац'т, 5ц'7*} полностью восстанавливаемая [утверждение
(а)\. Поскольку матрица А22 является устойчивой, А%2'т также ус-
устойчивая. Отсюда следует, что система A.403) обнаруживаемая.
С. помощью преобразования Ттх* = х'* (см. задачу 1.12.8) система
A.403) преобразуется в дуальную систему по отношению к исход-
исходной. Следовательно, поскольку система A.403) обнаруживаемая,
inстема, дуальная исходной, также является обнаруживаемой.
Повторяя основные шаги доказательства, нетрудно доказать тео-
теорему, обратную теореме 1.41 (в). Утверждение (д) может быть до-
i;n:mno аналогичным способом. Доказательство утверждений (а)
и (б) для случая систем с переменными параметрами оставляем
читателю в качестве упражнения.
Завершим этот раздел установлением следующего результата,
относящегося к устойчивости исходной и дуальной систем.
Теорема 1.42. Система A.398) является экспоненциально устойчи-
iioi'i в том и только том случае, если дуальная система A.399)
.тспоненциалъно устойчивая.
Этот результат нетрудно доказать, сначала удостоверившись,
что дуальная система имеет переходную матрицу Фг (t*—10, t*— t),,
сени система A.398) имеет переходную матрицу Ф(?, t9), а затем
используя определение 1.5 (разд. 1.4.1).
1.9*. Канонические формы фазовой
переменной
При рассмотрении линейных систем с постоянными парамет-
параметрами и скалярной входной переменной иногда бывает удобно ис-
использовать так называемую каноническую форму фазовой перемен-
переменной.
Определение 1.24. Линейная система с постоянными параметра-
параметрами и скалярной входной переменной представлена в канони-
чесмои форме фазовой, переменной, если уравнения системы
имеют вид
102 Глава 1
x(t) =
О 1 О
О 0 1
.0
. о
о
.0 1
— а,
i
x(t) +
)
0
0
0
1
11@. A-404)
y{t) = Cx(t).
Заметим, что никаких особых ограничений на матрицу С это
определение не накладывает. Нетрудно видеть, что числа at ,
i=0,...,n — 1, являются коэффициентами характеристичес-
характеристического полинома . '
п
2°
1=0
A.405)
системы, где а„= 1.
Нетрудно показать, что система A.404) всегда полностью управ-
управляема. Действительно, любая полностью управляемая система
со скалярной входной переменной может быть преобразована к
канонической форме фазовой переменной.
Теорема 1.43. Рассмотрим полностью управляемую систему с
постоянными параметрами и скалярной входной переменной
х @ = Ах (t) + bp (t), A,406)
y(t) = Cx(t),
где Ъ — вектор-столбец. Пусть Р — матрица управляемости
системы •
Р = (Ь, АЬ, А% ... , Ап-Щ, A.407)
и пусть
det (si — A) =
A.408)
где ап = 1 является характеристическим "полиномом матрицы А.
Тогда система преобразуется к канонической форме фазовой пере-
переменной преобразованием x(t) = Tx'(t). Здесь Т — неособая мат-
матрица преобразования
Т = РМ,
где
o-i (h а„
-а„
0
x. 0
A.409)
• ).п'менты теории линейных систем •* 103
Если система A.406) не является полностью управляемой, та-
ного преобразования не существует.
Этот результат может быть доказан следующим образом [3].
Нетрудно установить, что матрица преобразования Т неособая:
/' является неособой матрицей из-за допущения о полной управ-
управляемости, a det(M) = 1, потому что а„ = 1. Теперь докажем, что
Т преобразует систему к канонической форме фазовой перемен-
переменной. После умножения Р на М нетрудно видеть, что Т можно
записать в виде
Т = fo, h U. A-410)
где вектор-столбцы tt матрицы Т определяются выражениями
ti = afi + azAb + as42b + ... + а„ А"-1 Ъ,
... + аПА»-2Ъ, ¦
A.411)
Ил A.411) получаем
Ati = tt_l—al-1ta, J = 2,3,...,n, A.412)
так как Ъ = tn.
Теперь дифференциальное уравнение состояния системы запи-
запишем с помощью новой переменной:
х'(t) =.T-1 AT x'(t)+ 1-^4.A). A.413)
j
1'ассмотрим матрицу Т'гАТ. Обозначим "строки матрицы Т'1
через rt, i =1,2, ..., п. Тогда при i = 1, 2, ..., пи/ = 2, 3, ..., п
(i, /)-й элемент матрицы Т'^АТ определяется выражением
(Г AT)tj = rt (At,) = г, (tM -aM tn) =
1 при i — j ¦— 1,
-а;_, при i = п, A.414)
0 в остальных случаях.
Это доказывает, что последние п — 1 столбцов матрицы Тг~А Т
имеют вид, соответствующий канонической форме фазовой пере-
моиной. Чтобы определить первый столбец, из A.411) найдем
aAi =—аф = —а„*в, A.415)
так как, согласно теореме Кэли—Гамильтона, справедливо соот-
соотношение
...+anAn = 0. A.416)
104 Глава 1
Следовательно, для i = 1, 2, ..., п имеем
— а0 при i = п,
О в остальных
A.417)
случаях.
Подобным же образом можно показать, что Т~гЪ имеет требуе-
требуемую форму; на этом заканчивается доказательство первой части
теоремы 1.43. В справедливости последнего утверждения теоре-
теоремы 1.43 нетрудно убедиться: если система A.406) не является пол-
полностью управляемой, никакое неособое преобразование не может
привести систему к канонической форме фазовой переменной,
так как неособые преобразования сохраняют свойства управляе-
управляемости (см. задачу 1.6). Другой метод нахождения канонической
формы фазовой переменной рассматривается в работе [145]. Вы-
Вычислительные аспекты задачи описываются в работах [82, 146,
169]. Для систем со скалярной входной переменной, представлен-
представленных в канонической форме фазовой переменной, некоторые за-
задачи линейного оптимального управления решаются намного про-
проще, чем в случае, когда система представлена в общей форме (см.,
например, разд. 3.2). Аналогично некоторые задачи фильтрации,
включая восстановление состояния по наблюдениям выходной
переменной, более просто решаются, когда система представляется
в канонической форме дуальной фазовой переменной.
Определение 1.25. Линейная система с постоянными парамет-
параметрами и скалярной выходной переменной представляется в кано-
канонической форме дуальной фазовой переменной, если,
уравнения системы имеют вид '
*(*) =
0
1
0
о
0
0
1
0
0
0
0
= @00
0 -а0
0 — сц
0 —-сц.
0
Bu(t)f
A.418)
Заметим, что определение не накладывает никаких особых ог-
ограничений на матрицу В. Рассматривая теорему 1.43 с позиций
дуальности, нетрудно найти преобразование, позволяющее пред-
представить полностью восстанавливаемые системы в дуальной ка-
канонической форме. Соответствующие канонические формы могут
быть получены и для многомерных систем [3, 80, 118, 181].
¦ i.irменты теории линейных систем 105
НО. Векторные стохастические
процессы
1.10.1. ОПРЕДЕЛЕНИЯ
В следующих главах в качестве математических моделей воз-
возмущающих и шумовых воздействий используются стохастические
процессы. На исследуемые системы весьма часто оказывают одно-
лрсменное действие как возмущения, так и шумы. В связи с этим
ткшикает необходимость рассмотреть векторные стохастические
процессы, что и составляет предмет изучения данного раздела.
Стохастический процесс может быть представлен как семейство
Функций времени. Каждую функцию времени будем называть
реализацией процесса. Предположим, что vt(?), v2(?), ..., vn(?)
лиляются п скалярными стохастическими процессами, которые,
ионможно, взаимно зависимы. Тогда назовем
р(г) = со1К(г), v2(f), ...; vn(*)] A.419)
«гкторным стохастическим процессом. Всегда будем предполагать,
что каждая компонента вектора v{t) принимает действительные
s .чмачения и что t >- t0, где t0 задано.
Стохастический процесс может быть охарактеризован посред-
¦спмш совместного распределения вероятностей
Р {v (t{) < vlt v (t2) «? v2, ..., v (О < vm) A.420)
'i.i»r всех действительных v\, v2, ..., vm, для всех tl4 t2, ..., tm ^: t0
и для каждого натурального числа т. Здесь векторное неравенст-
IIO v(tj) -^ vi по определению удовлетворяется, если неравенства
M*f)<v«. 7-1, 2, .... п, A.421)
удовлетворяются одновременно. Значения v| являются компо-
игитами вектора Vi т. е.
vt = col (vfl, vf2, ..., vln).
Особый класс стохастических процессов составляют те процес-
11.1, стохастические свойства которых не изменяются .с течением
прсмени. Определим их более точно.
Определение 1.26. Стохастический процесс v(t) является стацио-
нарны.ч, если
= P{v(ty + 9) < vit ... ,v(tm + Q)< vm) A.422)
<).ih всех tl7 t2, .,., tm, для всех vt, ..., vm, для каждого целого поло-
положительного числа т и для всех В. Совместное распределение ве-
106 Глава 1
роятностей, которое характеризует стационарный стохастический
процесс, является, таким образом, инвариантным относительно
изменения начала отсчета времени.
Во многих случаях представляют интерес только свойства пер-
первого и второго порядков стохастического процесса, а именно
среднее значение и ковариационная матрица или, что эквивалент-
эквивалентно,, матрица смешанных моментов второго порядка. Определим эти
термины следующим образом.
Определение 1.27. Рассмотрим векторный стохастический про-
процесс v(t). Тогда
m{t) = E{v{t)} ' A.423)
назовем вектором средних значений (средним значе-
значением) процесса,
Rv {tlt tz) = Е {[v (tt) - т (*,)] lv (t2) -m (t2)f } A.424)
ковариационной матрицей, а
Г A-425)
матрицей смешанных моментов второго порядка. Мат-
Матрица Rv(t,t)=Q(t) называется матрицей дисперсий, a Cv(t,t) —
=¦=(?'(?)— матрицей моментов второго порядка.
Здесь Е — оператор математического ожидания. В дальней-
дальнейшем часто будем предполагать, что рассматриваемый стохастичес-
стохастический процесс имеет нулевое среднее, т. е. m(t) = 0 для всех t;
в этом случае ковариационная матрица и матрица смешанных
моментов второго порядка совпадают. Матрица смешанных момен--
тов второго порядка в рассмотренном виде записывается следую-
следующим образом:
A.426)
Каждый элемент матрицы С„{1и t2) является скалярным смешан-
смешанным моментом. Подобным же образом каждый элемент матрицы
Rv(ti' ^2) является скалярной ковариационной функцией. Нетруд-
Нетрудно доказать следующее.
Теорема 1.44. Ковариационная матрица Rv(ti, tz) и матрица,
смешанных моментов второго порядка Cv(tit t%) векторного сто-
стохастического процесса v(t) имеют следующие свойства:
Пименты теории линейных систем ' ' 107
а) Rv{t%, tl) = Rl{t1, tz) для всех tlt t2 и A.427)
Cv{h, h) = CTv{tu Q для всех tlt t2; A.428)
б) Q (t) = Rc (t, t) > 0 для всех t и A.429)
Q' (t) = Cv (t, *) :» 0 для всех t; A.430)
в) Ce(tlttz) = RB{ti, tj+mitjm7^) для всех tu t4y A.431)
.i)e m(t) — среднее значение процесса.
Здесь М > 0 — квадратная симметрическая неотрицательно
«предеденная действительная матрица, т. е.
хтМх>-0 для всех действительных х. A.432)
Теорему нетрудно доказать на основании определений Rv(t^, t2)
ii СоA{, t2). Поскольку свойства второго порядка стохастических
процессов в равной мере хорошо характеризуются как ковариаци-
ковариационной матрицей, так и матрицей смешанных моментов, обычно
Г>удем рассматривать только ковариационную матрицу. Для ста-
стационарных процессов имеем следующий результат.
Теорема 1.45. Предположим, что v(t) — стационарный, стоха-
ппический процесс. Тогда его среднее значение m(t) является пос-
постоянным, а его ковариационная матрица Rv(tl,t*) зависит только
cm tx— t3.
Это нетрудно показать, используя определение стационарности.
Иногда имеют место стохастические процессы с постоянным
средним и ковариационной матрицей, зависящей только от t-y —
/,. тогда как другие статистические свойства не являются свойст-
пами стационарных процессов. Поскольку часто представляют ин-
интерес только свойства первого и второго порядков стохастичес-
стохастического процесса, введем следующее определение.
Определение 1.28. Стохастический процесс vft) называется ста-
стационарным вгиироком смысле если матрица моментов второ-
<•() порядка Cvft, t) является конечной для всех t, среднее значение
m(t) постоянно, а ковариационная матрица R^t^, t2) зависит
только от tx— t.A.
Очевидно, что любой стационарный процесс с конечной 'мат-
'матрицей моментов второго порядка является также стационарным
и широком смысле.
Пусть v±(t) и v2(t) — два векторных стохастических процесса.
Тогда vx и v2 называются независимыми процессами, если {v^t^,
rjtj, ..^ViftJ} и {vz(tk'), vz(t2'), ,.., v2(tm)} являются незави-
сииыии множествами стохастических переменных для всех tu t2,
..., tt, 1г', t2', ..., tm' ^> tо и для всех натуральных чисел т и I.
Далее, v1 и и2 называются некоррелированными стохастическими
108 Глава 1
процессами, если у1(/1) и v2(tiZ) являются .некоррелированными
векторными стохастическими переменными для всех tt, t2 > t0, т. е.
Е \{Vi (t{) — m, (tt)] [v2 (t2) — т2 (t2)f } = О
для всех ti и t2, Tjnejrii является средним процесса vt, а тг — сред-
средним процесса v2.
Пример 1.27. Гауссовские стохастические процессы
Гауссовский стохастический процесс v является стохастичес-
стохастическим процессом, где для каждого множества моментов времени
t-y, t2, ..., tm ^> ^0 я-мерный вектор стохастических переменных
v(tt), v(t2), ..., v(tm) имеет гауссовское совместное распределение
вероятностей. Если составная ковариационная матрица
,t2) . . . RAh,tm) I _ A.433)
является неособой, то соответствующая функция плотности ве-
вероятностей может быть записана в виде
т п\
, vт \— гг- ех р
) [Bл)тп det (R)] '2 (_ 2
1=1 у = 1
. — иг(*г)]г Лг/[уу— т(^)]} • A.434)
Матрица Л^ размерности п X п получается разбиением Л =
= R~l, соответствующим разбиению матрицы R, а именно
-Ml -42 ¦ • ¦ -Мш
¦ л = | л« -^ • ¦ ¦ л2т |_ A435>
\ Л Л
'mi -1т2 " ¦ " iVmn
Заметим, что этот процесс полностью характеризуется его
средним и ковариационной матрицей; таким образом, гауссовскийг
процесс является стационарным в том и только том случае, если
он стационарный в широком смысле.
Пример 1.28. Экспоненциа,гъно коррелированный шум.
Широко известным видом стохастического процесса, стацио-
стационарного в широком смысле, является так называемый окспопен-
циалыю коррелированный шум. Это скалярный стохастический
.'Кимгпты теории линейных систем 109
процесс v(?) с ковариационной функцией
i?v (т) = ст2 ехр /— ill \ , ' A.436)
где о2 — дисперсия процесса, а 9 ¦— «постоянная времени». Та-
Такую ковариационную функцию имеют многие известные в прак-
практике процессы.
Пример 1.29. Процессы с некоррелированными ¦ приращениями
Процесс v(t)H t ~>- t0, с некоррелированными приращениями
может быть определен следующим образом.
1. Начальное значение
v(to) = O. A.437>
2. Для любой последовательности моментов t1, .t2, ts, t±, гд&
/» : t1 >• t2 ^. t3 -^ t4, приращения v{t^ — ufa) и и((^ —v(t:i) име-
имеют нулевые средние и являются некоррелированными, т. е.
E{v(h)~v(t3)} = 0,
A.438).
. . E{lv(t? — v{ti))lv(ti) — v{t3)]T\ =0.
Нетрудно найти сроднее такого процесса:
m{t) = E{v{t)} = E{v{t)—v{tJ} = 0, t>to. A.439).
Предположим, что L ^> ^. Тогда ковариационная матрица
имеет вид
Л„ (tiy t2) = E{v (*,) vT (t2)} = E {[v (*t) —i> (*0)l [v (t2) —v(tt) -t-
+ и («,) - v (to)f \ = E{[v (tt) - v (to)\ [v (tj—v (to)f } = • •
= ^{w(«,)/(Ol=9('i). <2>*i>'o. A.440).
где
является матрицей дисперсий процесса. Аналогичным образом
для t^tz^t0. A.442).
Ясно, что процесс с некоррелированными приращениями не
является стационарным или стационарным в широком смысле,
:ta исключением тривиального случая, при котором Q{t) == О,
Рассмотрим теперь матрицу дисперсий процесса. Для t^ ^
> t1 ^ t0 можно написать :
110 Глава 1
(t2)} =
+ Q{h). A.443)
Очевидно, Q(t) является монотонно неубывающей матричной
функцией от t в том смысле, что
Q (h) > Q (h) Для всех t2 ><j > t0. A.444)
Здесь, если А ж В — две симметрические действительные мат-
матрицы, запись
А>.В A.445)
предполагает, что матрица А — В неотрицательно определен-
определенная. Предположим теперь, что матричная функция Q(t) абсолют-
абсолютно непрерывная, т. е. можно написать
Q(t)= ('F(x)dx, A.446)
где V(t) — неотрицательно определенная симметрическая матрич-
матричная функция. Тогда из A.443) следует, что матрица дисперсий
приращения v(t2) — у(^) определяется выражением
t,
E{[v{t2)~v{ti)\\v{t2)--v{ti)\r\=Q{t2)—Q{ti)= fV»ch. A.447)
и
С учетом A.440) и A.442) видно, что если справедливо выра-
выражение A.446), то ковариационная матрица процесса может быть
выражена следующим образом:
min {tit tt) '
Д„(<1. *S)= f V(x)fc. A.448)
h
Одним из широко известных процессов с некоррелированными
приращениями является процесс броуновского движения, также из-
известный как процесс Винера^ или процесс Винера — Леей. Это
процесс с некоррелированными приращениями, где каждое из
приращений v(t2) — у(<г) является гауссовским стохастическим
вектором с нулевым средним и матрицей дисперсий (t2) — tx) I, a
/ — единичная матрица. Обобщением данного процесса Является
процесс, для которого каждое приращение v(t^) — у(^) является
гауссовским стохастическим вектором с нулевым средним и мат-
матрицей дисперсий вида A.447). Так как приращения в процессе
броуновского движения некоррелированные и гауссовские, они
Элементы теории линейных систем ¦ 111
являются независимыми. Очевидно, что броуновское движелие
является гауссовским процессом. В теории стохастических про-
процессов рассмотренные процессы занимают важное место.
1.10.2. МАТРИЦЫ СПЕКТРАЛЬНЫХ ПЛОТНОСТЕЙ ЭНЕРГИИ
Для скалярных стохастических процессов, стационарных в
широком смысле,-функция спектральной плотности энергии опре-
определяется как преобразование Фурье ковариационной функции.
Подобным же образом введем определение для векторных стохас-
стохастических процессов.
Определение 1.29. Матрица спектральных плотностей
энергии 1:v(w) векторного стохастического процесса, стационар-
стационарного в широком смысле; определяется как преобразование Фуры (если
оно существует) ковариационной матрицы RD(tt—12) процесса, т. е.
V/<KBBCO<fr. A.449)
Отметим, что в записи ^ковариационной матрацы переменные
11 и'?2 заменены одной переменной tx — tt.
Матрица спектральных плотностей энергии имеет следующие
свойства.
Теорема 1.46. Предположим, что %v(u>) является матрицей
спектральных плотностей стационарного процесса v(t), стацио-
стационарного в широком смысле. Тогда 2„(ы) — комплексная матрица,
которая имеет следующие свойства:
а) 2» (—<°) = И.» И для всех <о; A.450)
б) % И = 2о И для всех <°; A.451)
в) 2« («') > ° для всех м- " A.452)
Здесь звездочка обозначает' комплексно-сопряженное транспо-
транспонирование, тогда как М > 0, где М — комплексная матрица, оз-
означает, что М является неотрицательно определенной матрицей,
т. е. х*Мх > 0 для всех комплексных х.
Доказательство утверждений (а) и (б) следует непосредственно
из определений 2в (со) и теоремы 1.44. Чтобы доказать утверждение-
(в), надо распространить на векторный случай доказательство Да-
венпорта и Рута [43, гл. 6]. Смысл термина «матричная спектраль-
спектральная плотность энергии» станет ясным в разд. 1.10.4.
Пример 1.30. Экспоненциально коррелированный шум
112 Глава 1
В примере 1.28 рассматривался экспоненциально коррелиро-
коррелированный шум — скалярный стационарный процесс v(?), стационар-
стационарный в широком смысле, с ковариационной функцией
A.453)
Используя преобразование Фурье, найдем, что функция спек-
спектральной плотности энергии имеет вид
у (о,) = 2g2e A.454)
при условии 6>0.
1.10.3. РЕАКЦИЯ ЛИНЕЙНЫХ СИСТЕМ НА СТОХАСТИЧЕСКИЕ
ВХОДНЫЕ ВОЗДЕЙСТВИЯ
В данном разделе рассматриваются статистические свойства
реакции линейной системы при входном воздействии, представляю-
представляющем собой реализацию стохастического процесса. В связи с этим
имеем следующий результат.
Теорема 1.47. Рассмотрим линейную систему с матричной импуль-
импульсной переходной функцией K(t, %), находящуюся в момент t0 в нуле-
нулевом состоянии. Предположим, что входное воздействие на систему
является реализацией стохастического процесса u(t) с нулевым сред-
средним mu(t) и ковариационной матрицей Ru(t1, tz). Тогда выходная
переменная является реализацией стохастического процесса y(t)
со средним
my@ = j" K(t,z)mu(v)d*^ A.455).
to
и ковариационной матрицей
Ry (ti7 t2) = f' d4 j2 К (tu x4) Ru (xlf x2) KT (t2, 4) dx2 A.456)
и <»
при условии, что интегралы существуют.
Рассмотрим формальное доказательство этих результатов. Вы-
Выгодная переменная у, соответствующая стохастическому процес-
процессу, описывается выражением
y{t)= j K(t, x)u(x)dx. A.457)
Элементы теории линейных систем 113
Определяя математическое ожидание обеих частей уравнения
A.457) и меняя местами порядок выполнения операций интегри-
интегрирования и математического ожидания, нетрудно получить выраже-
выражение A.455).
Подобным же образом можно написать (предполагая для прос-
простоты mu(t) — 0)
= E \ f dzt ( d^ К (tu т.) и (x,) мг (x2) KT (t2, x2) 1 =
= j dx, f dx2 Z («lf Ч) Е {и(т,)ит (x2)) Z7" (t2, т2) =
f dx2 я: («lf xt) i?u (,lf x2) Zr(i2, ij.
A.458)
Для системы с постоянными параметрами и стационарным в
широком смысле процессом имеем следующий результат.
'Георема 1.48. Предположим, что линейная система, рассмотрен-
рассмотренная в пъеореме 1.47, является асимптотически устойчивой системой
с постоянными параметрами и матричной импульсной переходной
функцией K(t — х) и что входной стохастический процесс u(t)
чиляется стационарным в широком смысле с ковариационной мат-
матрицей Rufh — t-i)- Тогда, если входное воздействие на систему
является реализацией процесса u(t), который приложен с момента
-оо, выходная переменная является реализацией стационарного
i широком смысле стохастического процесса y(t) с ковариационной
матрицей
6
Заметим, что в обозначении матричной импульсной переходной
функции К и ковариационной матрицы Яц допущена некоторая не-
тчпость. Как было видно из разд. 1.3.2, матричная импульсная
пгреходная функция системы с постоянными параметрами зависит
¦т.чько от t — т. Результат A.459) может быть найден из A.456)
при устремлении to->- — ср и некоторых простых подстановках.
:. 394
114 Глава 1
Для стационарных в широком смысле процессов представляет
интерес определение матрицы спектральных плотностей.
Теорема 1.49. Рассмотрим асимптотически устойчивую линейную
систему с постоянными параметрами и матричной передаточной
функцией Н($). Предположим, что входная переменная является
реализацией стационарного в широком смысле стохастического'
процесса u(t) с матрицей спектральных плотностей Ъа(ы), кото-
который приложен с момента времени —оо. Тогда выходная переменная
является реализацией стационарного в широком смысле стохасти-
стохастического процесса у ft) с матрицей спектральных плотностей
Этот результат нетрудно получить, если осуществить преобра-
преобразование Фурье A.459) после замены 'tt — t2 на переменную %
и использования того факта, что H(s) является преобразованием
Лапласа К(х).
Пример 1.31. Смесительный бак
Рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3.)
и предположим, что имеют место флуктуации концентраций с1
и с2. Поэтому напишем
где с10 и с20 являются средними концентрациями, a vx(?) и v2(?) —
флуктуациями относительно средних. Нетрудно показать, что
уравнения линеаризованной системы могут быть приведены к виду
x(t) = \ " |z(*) +I ' |«@
A.462)
y(t) = \
Если положить входную переменную равной нулю, u(t) = 0,
то матричная передаточная функция от возмущений v{t) =
Элементы теории линейных систем 115
- col[v1(<), ч2(?I к выходной переменной y(t) может быть найдена
следующим образом:
О 0
F10/v0 F20/v0
s + 1/9 s + 1/9
Очевидно, что возмущения действуют только на вторую компо-
11 опту выходной переменной тJ@ =ё а(^)- Предположим, что Vj(<)
и v2(?) являются двумя независимыми экспоненциально коррели-
коррелированными шумовыми процессами, при этом ковариационная мат-
матрица процесса v(t) имеет следующий вид:
Найдем, что матрица спектральных плотностей процесса v(t)
равна
Из A.460) следует, что матрица спектральных плотностей энер-
энергии выходной переменной, обусловленная возмущением v(t), име-
имеет вид
0 0
1.10.4. КВАДРАТИЧНЫЕ ФОРМЫ
Часто целесообразно использовать среднее значение квадрата
стохастического процесса. Для векторных стохастических процес-
процессов введем квадратичную форму
E{vT(t)W(t)v(t)}, A.467)
где W(t) — симметрическая весовая матрица. Если v(t) =
col[v1(f), ..., vn(t)], a W имеет элементы Wtj, i, j — 1. 2, ..., n,
•u> выражение A.467) может быть записано в виде,
(t)\, A.468)
J
116 Глава 1
что является математическим ожиданием квадратичной формы от-
относительно компонент v;(?) вектора v(t). Матрица W(t) выбирает-
выбирается неотрицательно определенной, так что выражение принимает
только неотрицательные значения.
Квадратичные формы данного типа используются при записи
выражений, содержащих ковариационную матрицу и матрицу спек-
спектральных плотностей процесса v(t). В связи с этим имеем следую-
следующий результат. w
Теорема 1.50, Пусть v(t) — векторный стохастический процесс.
Тогда, если W(t) — симметрическая матрица, то
Е {vT(t)W(t)v(t)} = tr[W(t)Cv(t, t)\, A.469)
где Cv(ty, t.2) — матрица смешанных моментов второго порядка
процесса v(t). Если v(t) — стационарный в широком смысле про-
процесс с нулевым средним и ковариационной матрицей Rv(t^ t.J,
a W — постоянная матрица, то
E{vT(t)Wv(t)}=lr[WRv(O)}. A.470)
Если v(t) имеет нулевое среднее и матрицу спектральных
плотностей 2,/со), то-
где
Кроме
- Запись
Е
того,
ЩА)
1 °°
vT(t) Wv {t)\ = tr [ W V,o (со) df
¦ L-- ~
R» @) = \ 2» И df.
— CO
означает след матрицы Л, т. е.
A.471)
A.472)
A.473)
(Л) = 2 а». С1-474)
tr (A) =
где аГп i -- 1; ..., п, являются диагональпыми элементами мат-
матрицы. Проверим справедливость первого утверждения теоремы:
vT I
Е ! vT (t)W(t) v {t)\ = Е I 2 ^ (*) Wu (t) v; (t)\ =
«,/=?! - './=1
= tv[W(t)CB(t,t)], ., A-475)
Элементы теории линейных систем • 117
где CPijj (t, t) является (j, /)-м элементом матрицы Cv(t, t). Второй
результат A.470) следует при допущениях, устанавливающих
(-\(t, t) = Bv@). Третий результат может быть доказан с учетом
того факта, что матрица спектральных плотностей 2„(со) является
преобразованием Фурье функции Rv{t), и, следовательно, Вь{т:)
является обратным преобразованием 2„(со):
= f 20
При т = 0 получаем A.471) и A.473).
Равенство A.471) позволяет интерпретировать термин «матри-
«матрица спектральных плотностей энергии». Очевидно, «общая энергия»
E{vT (t)Wv(t)} стационарного в широком смысле процесса v(t) с
нулевым средним получается при интегрировании trlJPSj, (со)]
по всем частотам. Таким образом, выражение tr[VFS,,(co)] может
быть1 рассмотрено как мера «плотности» энергии на частоте со.
Весовая матрица W определяет долю участия каждой компоненты
процесса v(t).
Пример 1.32. Смесительный бак
Продолжим пример 1.31, где была вычислепа матрица спек-
спектральных плотностей выходной переменной y(t), обусловленной
возмущениями v(t) концентраций потоков, поступающих в бак.
Предположим, что требуется вычислить среднее значение квадрата
флуктуации г] z(t) концентрации вытекающего потока. Это выраже-
выражение может быть записано в следующем виде:
A.477)
где весовая матрица имеет простую форму
Найдем, таким образом, среднее значение квадрата ошибки
Е {/ (t) Wy (t)} = j tr [W vy N1 df =
J
A479)
oo
_К»+1/в.
(Fio/УоI
1 + ш!
9 - fl
ГоJ ^
2 2
o2o2 ^
118 Глава 1
При вычислениях квадратичных форм, рассмотренных в данном
разделе, часто встречаются интегралы от рациональных функций,
например вида A.479). Таблицы таких интегралов могут быть най-
найдены в приложениях книг [132, 160].
1.11. Реакция линейных
дифференциальных систем
на белый шум
1.11.1. БЕЛЫЙ ШУМ
Довольно часто в практике встречаются скалярные стохасти-
стохастические процессы с нулевым средним, обладающие таким свойством,
что величины w^j) и w(t.2) являются некоррелированными даже
при малых значениях |Z2 — tt |, т. е.
Дж (*„ *i) =* 0 при |*2 —*2|>ё, A.480)
где е — «малое» число. Ковариационная матрица таких стохасти-
стохастических процессов в идеализированной форме записывается сле-
следующим образом:
Здесь 8(^2 — tj) — дельта-функция, a V(t) рассматривается как
интенсивность процесса в момент t. Такие процессы называются
¦ процессами белого шума; ' смысл термина объясняется позднее.
Распространим это понятие на векторные процессы.
Определение 1.30. Пусть w(t) — векторный стохастический про-
процесс с нулевым средним и ковариационной матрицей
Rw(h,ti) = V(ti)^(t2-tl), A.482)
где V(t) :> 0. Тогда говорят, что iv(t) является стохастическим
процессом типа белого шума интенсивности V(t).
В том случае, когда интенсивность белого шума постоянна,
процесс является стационарным в широком смысле и может быть
определена матрица спектральных плотностей. Осуществляя фор-
формально преобразование Фурье функции У6(т), можно видеть, что
стационарный в широком смысле процесс типа белого шума имеет
матрицу спектральных плотностей
Элементы теории линейных систем
119
Отсюда следует, что стационарный в широком смысле процесс
типа белого шума имеет равную плотность энергии на всех часто-
частотах. Вот почему по аналогии со светом такие процессы называют-
называются процессами типа белого шума. Этот результат также согласует-
согласуется с физической интуицией. Процесс с малой корреляцией между
двумя близкими значениями w(^) и w(t.,) является весьма нерегу-
нерегулярным и, таким образом, содержит энергию на довольно высоких
частотах.
К сожалению, при вычислениях общей энергии процесса типа
белого шума на основании равенств A.470) и A.471) получается
бесконечная величина. Это показывает, что, хотя с процессами
типа белого шума удобно иметь дело, в природе они не существу-
существуют. С математической точки зрения процессы типа белого шума
действительно не являются строго определенными. Как будет по-
показано в примере 1.33, белый шум является «производной» процес-
процесса с некоррелированными приращениями; однако можно пока-
покапать, что такой процесс не имеет производной. Тем не менее, если
белый шум по крайней мере один раз проинтегрирован, снова име-
имеется строгое математическое обоснование и могут быть доказаны
следующие правила интегрирования.
Теорема 1.51. Пусть w(t) — векторный процесс типа белого
шума интенсивности V(t), a A1(t), A.,(t) и A(t) — заданные пе-
переменные матрицы. Тогда
а) Е\[ A(t)w(t)dt\ = O,
1 *) I
A.484)
lj (t) w (t) dt W
Az(t')w(t')dt'
I
= f tr [V (t) A\{t) WA2 (t)\ dt, A.485)
где I — пересечение [tx, t2] и U3, i4], a W — любая весовая матрица;
t,
и ~т
A2(t')w(t')dt'
в) Е
где I определено выше.
Формально положение (а) можно доказать на основании того,
что w(t) является процессом с нулевым средним, тогда как (б)
120 Глава 1
можно подтвердить следующим образом:
j' Y f \
Е J Г j' A, (t) w (t) dtY W f \ A2 (?) w (?) **']} =
= E f dt j d?wT(t)ATl(t)WA.i(t')w(?)\= A.487a)
[ tt[w(?)wT(?)ATl(t)WAi(?)]d?\= A.487 6)
J
U[V(t)ATl{t)WAt(?)]&(t — ?)df= A.487r)
и и
= j dt \ tt.[E{w(?)wT(t)}ATl(t)WAt(?)]d? = A.487b)
= \ dt\ U[V(t)AT
= J tr [F (О Л[ (f) ^42 @1 di. A.487 д)
Переход от A.487в) к A.487г) осуществляется с помощью
A.482), а переход от A.487г) к A.487д) следует из свойств дельта-
функции. Использовалось также соотношение tr(AB) -= ir(BA),
где А и В — матрицы совместимых размеров.
Положение (в) доказывается аналогично положению (б).
Пример 1.33. Белый шум как производная процесса с некоррелиро-
некоррелированными приращениями. >
В примере 1.29 (разд. 1.10.1) рассматривались процессы v(t),
t >- t0. с некоррелированными приращениями, которые, как по-
показано, являются процессами с нулевыми средними и ковариацион-
ковариационными матрицами вида
для fj > i2 > i0.
Поступая формально, покажем, что ковариационная матрица
производной
v{t) = ±l?L7 ¦ t>tot A.489)
at
состоит из дельта-функции. Для среднего значения процесса
A.489) имеем
E{v(t)} = -l-E{v(t)} = 0, t>to. . "A.490)
at
Элементы теории линейных систем . 121
Запишем формальное выражение для ковариационной матрицы
процесса A.489): ;
= ^-^Rv(tuh), tut2>t0. A.491)
Определив частные производные, получим
#p('i' ^) = <? (*i) 8 (<i — h), tittz>.t0, A.492)
где
Это показывает, что производная процесса с некоррелирован-
некоррелированными приращениями является процессом типа белого шума. Если
каждое приращение v(t,) — у(?,) процесса имеет матрицу диспер-
дисперсий вида
U
f V (t) dt, A.494)
h
то интенсивность белого шума, который является производной
процесса с некоррелированными приращениями, равна V(t), так
как (см. пример 1.29)
<?(*)= \.V(i)dz. A.495)
to
Значительный интерес представляет 'случай, когда процесс
v(t), производная которого — белый шум, является броуновским
движением (см. пример 1.29). Процесс типа белого шума, получае-
получаемый в данном случае, называется часто гауссовским белым шумом.
В строгой теории процесс типа белого шума никогда не опре-
определяется. Вместо этого развивается теория, основанная на про-
процессах с некоррелированными приращениями. В частности, интег-
интегралы, рассматриваемые в теореме 1.51, определяются в терминах
этих процессов. Рассмотрим интеграл
и
\ A(t)w(t)dt. A.496)
Он заменяется выражением
f А @ dv (t) = lim У А (т,) [v (тж) -v Ы], A.497)
122 ]\гава I
где v(t) — процесс с некоррелированными приращениями, произ-
производная которого — белый шум w(t). и где 11 =то<т1< ... <т„ =
= U, а
з = тах | TM—xt | A.498)
есть разбиение интервала Ux, tz}. Предел в выражении A.497)
может быть определен таким образом, что существует соответствую-
соответствующая стохастическая переменная, удовлетворяющая свойствам
теоремы 1.51. Детальное изложение вопроса читатель может
найти в работах [6, 53, 67, 103]. Глубокое и строгое изложение
понятия белого шума сделано в работе 1731.
Материал этого примера в дальнейшем не используется. Для
целей, преследуемых данной книгой, достаточно знать теорему
1.51.
1.11.2. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ СИСТЕМЫ;
ВОЗБУЖДАЕМЫЕ БЕЛЫМ ШУМОМ
В дальнейшем будет показано, что линейные дифференциальные
системы, возбуждаемые белым шумом, являются очень удобными
моделями для формулирования и решения задач линейного управ-
управления с учетом возмущений и шумов. В данном разделе рассмат-
рассматриваются некоторые статистические свойства состояния линейной
дифференциальной системы при наличии процесса типа белого
шума в качестве входной переменной. В частности, вычисляются
среднее значение, ковариационная матрица, матрица смешанных
моментов, матрицы дисперсий и моментов состояния х.
Теорема 1.52. Предположим, что x(t) — решение уравнения
x(t) = A(t)x(t) + B(t)w(t), A499)
я (*о) = ^о»
где w(t) — белый шум интенсивности V(t), а х0 — стохастичес-
стохастическая величина, независимая от w(t) со средним значением т0 и мат-
матрицей дисперсий Qo = Е{(х0— то)(хо — то)Т}- Тогда x(t) имеет
среднее значение
{t) Q(tt0)m0, A.500)
где Ф (t, t0) — переходная матрица системы A.499). Ковариаци-
Ковариационная матрица процесса x(t) имеет вид
¦+ Y " .' Ф (*„ ¦:) В (х) V W ВТ (?) Фт (*2, х) dx. A.501)
Элементы теории линейных систем 123
Ковариационная матрица Q(t) = Rx(t, t) удовлетворяет мат-
матричному дифференциальному уравнению
Q(t) = A (О Q (О + Q (О АТ (О + B(t)V (t) Вт (*);
A.502)
Q
Кроме того,
[Q{t)*T{ttd *1>'1> A.503)
Матрица смешанных моментов второго порядка процесса
x(t) имеет вид
сх (tlt t2) = е[х (tо хГ (*2)} = ф (<„ <0) сж (*0> g фт (t2, t0) +
min(f,, tt)
+ J ФA{>г)В(-:)У(х)ВТ^)ФТA.2,,)^. A.504)
(в
Mатрица моментов Cx(t, t) — Q'(t) удовлетворяет матрич-
матричному дифференциальному уравнению
t) + Q'(t)AT(t)+B(t)V(t)BT(t), A.505)
}. A.506)
JS заключение имеем
lQ'{t^T^^ h>h> A-507)
*2)^'(*2) *i>'«-
Эти результаты нетрудно доказать, используя правила интег-
интегрирования, приведенные в теореме 1.51. Поскольку
x(t) = Q> (t, t0) x0 + j Ф (*, .) В (т) w (х) с?х, A.508)
из A.484) следует, что mx(t) определяется формулой A.500).
Чтобы найти ковариационную матрицу и матрицу смешанных мо-
моментов, рассмотрим уравнение
Е [х (*,) xT(t2)) = Ф (tlf g ? {^0 а:ог} ФТ (t2, t0) +
124 Глава 1
Е\ Г Ф (*„х) В(х) и> (х) dx [Ф(t2, g *0
4-
X
A.509)
Вследствие независимости хи и w(t) итого факта, что w(t) имеет
нулевое средпео, второй и третий члены в правой части выраже-
выражения A.509) равны нулю. Принимая во внимание A.486), четвертый
член можно упростить так, что из A.509) следует A.504). Подобным
же образом устанавливается справедливость выражения A.501).
Дисперсия Q(t) получается, если положить tl = tz = t в A.501):
+ Г Ф (*, х) В (х) V (х) Вт (х) Фт (t, x) dx. A.510)
Дифференциальное уравнение A.502) находится дифференци-
дифференцированием Q(t) в A.510) относительно ^.Начальное условие A.502)
определяется при t — t0. Дифференциальное уравнение для
CJf, t) —Q'{t) находится аналогичным образом. Наконец, A.503)
и A.507) cлeдyюf непосредственно.из выражений A.501) и A.504).
Кстати заметим, что если х0 — гауссовская стохастическая
величина и белый шум w(t) — гауссовский (см. пример 1.33),
то x{t) является гауссовским стохастическим процессом. В заключе-
заключение отметим, что для анализа линейных систем полезно иметь вычис-
вычислительную программу с целью моделирования линейной дифферен-
дифференциальной системы, возбуждаемой белым шумом (см., например,
[126]).
Пример 1.34. Дифференциальная система первого порядка, воз-
возбуждаемая белым шумом
Рассмотрим стохастическое дифференциальное уравнение пер-
первого порядка
?(<)=--l|(t)+ffl(t), A.511)
где <о(г) — скалярный белый шум интенсивности it. Предположим,
что |@) =Ejo- гДе ?о " скалярная стохастическая величина с ну-
нулевым средним и дисперсией /?(?о2) = О2- Нетрудно установить,
что | (t) имеет ковариационную функцию
Элементы теории линейных систем 125
¦ tu t2>0. A.512)
Дисперсия процесса равна
e-*>9+*l, t>0. A.513)
1.11.3. УСТАНОВИВШЕЕСЯ ЗНАЧЕНИЕ МАТРИЦЫ ДИСПЕРСИЙ
ДЛЯ СЛУЧАЯ ПОСТОЯННЫХ ПАРАМЕТРОВ
В предыдущем разделе найдено выражение [уравнение A.510)]
для матрицы дисперсий состояния линейной дифференциальной
системы, возбуждаемой белым глумом. В настоящем разделе рас-
рассматривается асимптотическое поведение матрицы дисперсий в
случае постоянных параметров, т. е. когда А, В и V являются
постоянными матрицами. В этом случае A.510) может быть запи-
записано в виде
Q @ = eA(t~U) Qo /"('-'j) + j eMt~'] BVBT /«-^ di. A.514)
Нетрудно видеть, что Q(t) при произвольном Qo имеет предел
Hm Q (t) = lim Q (t) = Q = f eM BVBT e^x dz A.515)
t-+CX> t»-^ CO *J
тогда и только тогда, когда матрица А асимптотически устойчива.
Поскольку матрица Q(t) является решением дифференциального
уравнения A.502), ее предел Q также должен удовлетворять этому
уравнению, так что
AQ + QAT +BVBT =0. A.516)
Нетрудно установить, что это матричное алгебраическое урав-
уравнение имеет единственное решение, которое должно определяться
выражением A.515). Это вытекает из следующего результата тео-
теории матриц [63].
Лемма 1.5. Пусть Мг, Мг и Мъ — действительные матрицы раз-
размерами п X п, т X т и п X т соответственно. Пусть %h i =
= 1, 2, ..., п,и \ij, / — 1, 2. ..., т, обозначают характеристичес-
характеристические числа матриц Mv и Mt соответственно. Тогда матричное
уравнение
MtX + XMl = M3 A.517)
126 Глава 1
имеет единственное решение X в том и только том случае, если
для всех i, )
A.518)
Црименяя эту лемму к уравнению A.516), положим Мх —А,
Мt = Аг. Отсюда следует, что т — п и цу = %j, j = 1, 2, ..., т.
Поскольку по допущению А является асимптотически устойчивой,
все характеристические числа имеют строго отрицательные дей-
действительные части и неизбежно
%. + %;фО A.519)
для всех i, j. Таким образом, A.516) имеет единственное решение.
Обобщим изложенное.
Теорема 1.53. Рассмотрим стохастическое дифференциальное
уравнение
x(t) = Ax(t)+Bw(t), A520)
z (*о) = жо.
где А и В — постоянные матрицы, a w(t) — белый шум постоян-
постоянной интенсивности V. Тогда, если матрица А ^асимптотически
устойчивая и tu—*- —оо или t-^-oo. матрица дисперсии процесса
x(t) стремится к постоянной неотрицательно определенной
матрице
Q = j* eAt BVBT елТ< dt, A.521)
которая является единственным решением, матричного урав-
уравнения
0 = AQ + QAT+BVBT. A.522)
Матрица Q, таким образом, может быть найдена как предел
решения дифференциального уравнения A.502) при начальном
условии @0 из интеграла A.521) или из алгебраического уравнения
A.52^); здесь (H — произвольная положительно полуопределен-
полуопределенная матрица.
Матричные уравнения вида A.522) также имеют место в теории
устойчивости и известны как уравнения Ляпунова. Хотя матричное
уравнение A.522) линейно относительно Q, его решение не может
непосредственно быть получено с помощью простого обращения
матриц. В работах [38, 121] даются полезные предложения по сос-
составлению линейных уравнений, из которых может быть найдена
матрица Q. Другие возможные подходы рассматриваются в рабо-
теории линейных систем 127
тах [9, 47, 78, 95, 115, 130, 149, 164, 165]. В работе [691 сделано
сравнение различных методов решения, но рекомендации к при-
применению какого-либо одного метода не дается. Обзор некоторых
методов решения выполняется также в работах [10,152].
Заметим, что, если матрица А асимптотически устойчивая и
/0 -.= —оо, выходная переменная дифференциальной системы
A.499) является стационарным в широком смысле процессом.
Спектральная плотность состояния х равна
2, (со) = (/со/ — A)'1 BVBT (— /со/ — А7)'1. A.523)
Тогда,* используя A.473), можно получить другое выражение
для Q, а именно
Q= |" (joiI~-A)-1BVBT(~jbiI~AT)'1df. A.524)
Как было показано в настоящем разделе, установившееся зна-
значение матрицы дисперсий Q является асимптотическим решением
дифференциального уравнения дисперсий при t0 -> —оо или t ->oo.
Предположим теперь, что в качестве начальной дисперсии в момент
/0 выбрано установившееся значение матрицы дисперсий, т. е.
положим
Q0 = Q. A.525)
Согласно A.502), это ведет к равенству
Q, »>*,.. . ' A.526)
Полученный таким образом процесс x(f) имеет все свойства
стационарного в широком смысле процесса.
Пример 1.35. Установившиеся значения дисперсии и ковариацион-
ковариационной функции системы первого порядка.
Рассмотрим (см. пример 1.34) скалярное дифференциальное
уравнение
SW = -k (*)+«>(*). A-527)
о
где скалярный белый шум со(?) имеет интенсивность ц,, а 6 >0,
Обозначая через Q предел Q(t) при ?-»-оо, из A.513) получаем
Ъ=Ц-. A,528)
Уравнение Ляпунова A.522) сводится к следующему:
--fe + t* = O, A.529)
128 Глава 1
.что согласуется с A.528). Из A.521) следует тот же самый резуль-
результат
ё = |1 ^e-*l*dt = J!±. A.530)
6
„ Наконец, можно проверить, что из A.524) следует
Q = +Г & df = Л!'. A.531)
V J, (Ш2 I 1/92) 2 V '
— оо
" Заметим, что ковариационная функция Щ (?4, ?2)> определяемая
выражением A.512), сходится к
|^|) " A.532)
при ti + <2~*"°° и конечном отрезке времени <4 — ?2- Матрица
¦^5 (*i> h) равна этому пределу при конечных tt и t2, если дисперсия
начального состояния равна '
Таким образом, выражение A.527) представляет собой экспо-
экспоненциально коррелированный шум при условии, что ?,(t0) является
стохастической величиной с нулевым средним и дисперсией A-533).
1.11.4. МОДЕЛИРОВАНИЕ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ
В последних главах настоящей книги стохастические процес-
процессы почти всегда представляются с использованием линейных диф-
дифференциальных систем, возбуждаемых белым шумом. Это пред-
представление стохастического процесса v(t) обычно имеет следующую
-форму. Предположим, что
v{t) = C{t)x(t), ' A:534)
гДе .
x(t) = A{t)x{t)+B(t)w(t), A.535)
a w(t) — белый шум. Выбирая такое представление стохасти-
стохастического процесса V, его можно моделировать. Использование та-
таких моделей может быть обосновано следующим образом.
а) В природе часто встречаются стохастические явления, свя-
связанные с воздействием быстро меняющихся флуктуации на инер-
инерционную дифференциальную систему. Типичным примером бе-
белого шума, действующего на дифференциальную систему, являет-
является тепловой шум в электронной цепи.
Элементы теории линейных систем ' '••.¦. 129
б) Как будет видно из дальнейшего, в линейной теории управ-
управления почти всегда рассматриваются только среднее значение и.
ковариация Стохастического процесса. Для линейной модели
ксегда можно аппроксимировать любые полученные эксперимен-
экспериментально характеристики среднего значения и ковариационной
матрицы с произвольной точностью.
в) Иногда возникает задача моделирования стационарного
стохастического процесса с известной спектральной плотностью
энергии. В этом случае всегда имеется возможность генерировать
стохастический процесс как процесс на выходе линейной диффе-
дифференциальной системы; при этом матрица спектральных плотностей
анергии аппроксимирует с произвольной точностью матрицу спек-
спектральных плотностей энергии исходного стохастического процесса.
Примеры 1.36 и 1.37, так же как и задача 1.11, иллюстрируют
метод моделирования.
Пример 1.36. Дифференциальная система первого порядка .
Предположим, что измеренная ковариационная функция сто-
хастического скалярного процесса ч, о котором известно, что он
является стационарным, описывается экспоненциальной функцией
' Д, ('!.',) = °2 е-"'11/в'- ' ' A-536)
Этот процесс можно моделировать при t > t0, как состояние
дифференциальной системы первого порядка (см. пример 1.35)
С(*)= JU (*) + ©(*), - A.537)
где (o(t) —г белый шум интенсивности 2<т2/9, a v(i0)¦¦— стохастичес-
стохастическая величина с нулевым средним и дисперсией аг.
Пример 1.37. Смесительный бак
Рассмотрим смесительный бак из примера 1.31 (разд. 1.10.3)
и вычислим для него матрицу дисперсий выходной переменной y.(f).
15 примере 1.31 предполагалось, что флуктуации концентраций в
потоках описываются экспоненциально коррелированными шума-
шумами и, таким образом, могут быть смоделированы как решение сис-
системы первого порядка, возбуждаемой белым шумом. Добавим
теперь к дифференциальному уравнению смесительного бака
уравнения моделей стохастических процессов vt(?) и v2(f). Получим
где
?.(*)=-т" *»(')+«МО- A-539)
• !десь a>i(t) — скалярный белый шум интенсивности щ; чтобы
130 Глава 1
получить дисперсию процесса v4(<) равной (Т42, примем ц4 =
= 2<т12/61. Для процесса v2(f) = ?4(?) используем аналогичную
модель. Таким образом, получим систему уравнений
i- 0
•о
0
*! —
1
v,
0
0
0
0
0
с
—
1
0
0
1
6
0
0
-i- 0
о L
-f
A.540)
где w(t) — col[o)j(i), ш2(<)]. Двумерный белый шум w(t) имеет интен-
интенсивность
V =
0
0
2а*
A.541)
Предположим, что в A.540) u(f) = 0; тогда решение урав-
уравнения A.522) относительно матрицы дисперсии Q имеет вид
0 0 0 0 >
0 =
0 о?
где
A.542)
A.543)
A.544)
A.545)
Элементы теории линейных систем 131
Дисперсия процесса т]г@ = 1г@ равна q22, что согласуется с
результатом примера 1.32 (разд. 1.10.4).
1.11.5. КВАДРАТИЧНЫЕ ИНТЕГРАЛЬНЫЕ ФОРМЫ
Рассмотрим линейную дифференциальную систему
x(t) = A(t)x{t) + B(t)w(t), A.546)
где w(t) -¦- белый шум интенсивности V(t) и предполагается, что
начальное состояние x(t0) является стохастической величиной с
матрицей моментов второго порядка
E{x(t0)xT(t0)) = Q0. . A.547)
В последующих главах часто используются квадратичные интег-
интегральные формы вида
Е J хт@ ft @ х(t) at -V * (*,)PiS(ti)|, A-548)
где R(t) — симметрическая неотрицательно определенная весовая
матрица для всех t0 < t <: tu a Pi — симметрическая неотрица-
неотрицательно определенная матрица. Эти формулы, конечно, применимы
также и в детерминированном случае, где w(t) = 0.' t > ^0, x(t0) —
детерминированная величина, а символ математического ожидания
не используется.
Для решения линейного дифференциального уравнения A.546)
напишем
х (t) = Ф (t, t0) x (t0) + j Ф (t, т) В (т) w (т). dT, A.549)
to
так что
h U Г
*г @ ft (о х (t) dt + *r (t,) p,^,) = j xr (g Фг
и V
(т) ВГ (т) ФГ (t, t) d J • ft @ I Ф (*, *0) X (t0)
J
Ф (t, т) В (т) u; (t) dt d* + Г а-т.(/0) ФГ (tu t0) +
' WT (T) 5Г (Т) ФГ (tlt T) dx I />4 [ Ф (tu t0) X (t0) +
ic
A.550)
132 Глава 1
Определяя математическое ожидание этого выражения и ис-
используя правила интегрирования из теоремы 1.51, получим
Е I ('' хт (t) R (t) x (t) dt + / (tt) Pvx Ц =
= tr f фг (t, g r (t) ф (t, у dt + фт (tu t0) p± a>(tlf gj <?0 +
J
V (x) Вт (х) Фг (t, x) R (t) Ф (t, t) В (x) ch
i, lit
+ f' F (x) BT (z) Фт (tu x) Pi Ф (tu x) В (х) Ц ¦ A.551)
to j
Тогда, если М и N — произвольные матрицы соответствующих
размеров, нетрудно показать, что tr(MN) = tr(NM). Примене-
Применение этого результата к двум последним членам выражения A.551)
и изменение порядка интегрирования в третьем члене дает
tr j J [ f V (x) BT (x) Фг (t, x) R (t) Ф (t, x) В (х) d^dt +
U. Li. J
+ j' F (x) S7" (x) ФГ (tu x) P, Ф («„ x) В (x) dx | =
= tr j f | j В (x) 7 (x) Sr (x) Фг (t, x), Д (*) Ф (*, x) rfx 1 dt +
+ (' В (x) F (x) S7" (x) ФГ (*]f x) P4 Ф («lf x) dx 1 =
= tr J (' 5 (x) F (x) Sr (x) Г f' Фг («, x) R (*) Ф (t, x) rf* +
A.552)
Подстановка этого выражения в A.551) показывает, что можно
написать
Е П хт (t) R(t) x (t) dt + хт (*,) Pt x (*,) 1 =
Ли . J
= tv\p(t0)Q0 + ^B(t)V(t)BT(t)P(t)dt\, A553)"
¦ Ки'менты теории линейных систем 133
i до симметрическая матрица P(t) определяется выражением
Р (t) = f Фг (t, t) R (*) Ф (*, *) dx + Фг (tu t) P, Ф (tlf t). A.554)
Используя теорему 1.2 (разд. 1.3.1),- дифференцированием не-
i рудно показать, что P(t) удовлетворяет матричному дифферен-
дифференциальному уравнению
- Р (t) = Ат (t) P(t) + P (t) A(t) + R (*)¦ A-555)
Полагая в A.554) t — tu получим конечпое условие
P{U) = P,. A.55G)
Подведем итоги следующим образом.
'Георема ,1.54. Рассмотрим линейную дифференциальную систему
x{t) = A{t)x(t) + B(t)w{t), A.557)
,-<>(' w(t) — белый шум интенсивности Vft}, a x(t0) = х0 — сто-
.китическая величина с матрицей моментов второго порядка
J'{'ioxo} =Qo- Пусть матрицы R(t)—симметрическая неотрица-
неотрицательно определенная при t0 <^? <: ti: a Pt — постоянная симмет-
симметрическая неотрицательно определенная, Тогда имеем
И I j'1 xT (t) R (t) x (t) dt + xT (td PiX (tt) 1 =
= tv\p(to)Qo+ ^B(t)V(t)BT(t)P(t)dt\, A.558)
.¦tit- P(t) — симметрическая неотрицательно определенная мат-
матрица
Р (t).= \ ФТ (., t) R (z) Ф (,, t) fc + Фт (h, t) P, Ф (*lf *). A-559)
t
• 1<*есъ Ф(г, t0) — переходная матрица системы A.557). P(t) удов-
удовлетворяет матричному дифференциальному уравнению
— Р @ = АТ (*) P{t) + P (t) A(t)+R (t) A.560)
с конечным условием
P(ti) = Pi. A.561)
134 Глава 1
В частности, если дифференциальная система A.557) имеет
вид
x(t) = A(t)x\t), A.562) ¦
соответствующий однородной системе, т. е. V(t) = 0, a x(t0) —'.
детерминированная функция, то
[ / (О R (t) х (Q dt + хТ (f,) PiX (tt) = / (g P (g x (t0). [A.563)
и
Закончим этот раздел обсуждением асимптотического пове-
поведения матрицы P(t) при стремлении момента времени ^ к бес-
бесконечности. Ограничимся рассмотрением случая; когда матрицы
А, В, V и R являются постоянными, так что выражение A.559)
принимает вид
Р it) = J* ИГ(^° ДеЛ('-° d, + /<''-" Р\ еми~{). A.564)
t
Если матрица А асимптотически устойчивая, при tt—voo най-
найдем предел
P(Q-*P= [ eA {'~f) ЯеА^п d^. A.565) •
Заменяя переменную интегрирования, Р можно записать
в виде ;
Р= Г елГ'' ReAt'dt', A.566)
6
откуда следует, что Р- является постоянной матрицей. Поскольку
Р удовлетворяет матричному уравнению A.560), имеем
0 = 4гР + Р4 + 7?. A.567)
Поскольку по допущению А асимптотически устойчивая, лемма
1.5 (разд. 1.11.3) гарантирует, что это алгебраическое уравнение
имеет единственное решение.
В случае постоянных параметров из A.558) нетрудно пока-
показать, что при ?4 »?0 можно аппроксимировать
Е | f xT (t) Rx {t)dt + хт (t4) Pj .r(
~ tr { P~QQ + (tt — g BVBT P } . A.568)
Элементы теории линейных систем
135
Это показывает, что при tx -> оо критерий A.558) асимптоти-
асимптотически увеличивается со скоростью br(BVB Р).
Пример 1.38. Смесительный бак
Рассмотрим модель смесительного бака, учитывающую возму-
возмущения (см. пример 1.37). Положим, что u(t) = 0 и представляет
интерес определение интегрального выражения
A.569)
Этот интеграл характеризует среднее отклонение концентра-
концентрации |2@ от нулевого значения, где среднее берется как статисти-
статистически, так и по времени. Его формула следует из общего вида вы-
выражения A.548), если положить
г>
Решение алгебраического уравнения
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
даст установившееся решение
0 0 0 0
р = | ° Р22 Р23 Р24
0 Ргз Рзз Рз4
О Р24 Р34 Р44
i-Де
Р22 — — »
Ри =
6 17
г 20
_2 Vo_
1 1
Рзз =
8
2
1
в
Fw
) 2
A.570)
A.571)
A.572)
1 1
Ри =
V,,
вх в2
, A.573)
136 Глава 1
1 1
Если выразить V в виде A.541), как это делалось в примере
1.37, то можно найти, что скорость, с которой интегральный кри-
критерий A.569) асимптотически увеличивается при возрастании
t{ [см. A.568)], равна
tr (BVBTP) =
о ' а
8 + 82
A.574)
Неудивительно, что это в точности соответствует вычисленному
в примере 1.37 установившемуся значению величины ?{|22@}-
1.12. Задачи
1.12.1. ВРАЩАЮЩИЙСЯ СПУТНИК
Рассмотрим спутник, который вращается относительно своей
оси симметрии (рис. 1.11). Угловое положение спутника в момент
^=ва±=аЫ?
Ось
Рис. 1.11: Вращающийся
спутник.
t обозначим через ф(?), а постоянный момент инерции спутника:—
через /. С помощью газовых струй к спутнику может быть при-
приложен вращающий момент .\n{t), который рассматривается как
входная переменная системы. Трение отсутствует.
а) Возьмите в качестве компонент состояния угловое поло-
положение ф(?) и угловую скорость ср(?). Пусть г] @ = ф(?) — выход-
выходная переменная. Покажите, что дифференциальное уравнение
состояния и уравнение выходной переменной могут быть представ-
представлены в виде
A.575>
где р= Ш.
Элементы теории линейных систем
137
0) Вычислите переходную матрицу, импульсную переходную
функцию и переходную функцию системы. Начертите график им-
ттульсной переходной и переходной функций.
в) Является ли система устойчивой в смысле Ляпунова? Яв-
Является ли она асимптотически устойчивой?
г) Определите передаточную функцию системы.
д) Рассмотрите задачу поворота спутника из одного положе-
положения в другое. В терминах состояния это означает, что система
должна быть переведена из состояния x(t0) = col(cp0, 0) в состоя-
I
5
-а
i'nc. 1.12. Входной момент для пере-
перемещения спутника.
ние x(t{) = col((pi, 0) где ср0 и ф4 — заданные углы. Предположим,
что имеются две газовые струи; они прикладывают моменты в
противоположных направлениях, так что входная переменная при-
принимает только значения —а, 0 и +а, где а — фиксированное за-
шнное число. Покажите, что спутник может быть повернут с
помощью входной переменной, график которой показан на
рис. 1.12. Вычислите время переключения ts.vi конечное время tt.
Начертите траекторию состояния на фазовой плоскости.
1.12.2. АМПЛИДИН
Я, ?,
Статор Якорь
Рис. 1.13. Схема амплидина.
Статор Якорь
138 Глава 1
Амплидин является электрической машиной, предназначае-
предназначаемой для управления постоянным током большой мощности пос-
посредством маломощного напряжения постоянного тока. На
рис. 1.13 показана упрощенная схема амплидина [49]. Два яко-
якоря вращаются с постоянной скоростью (в действительности они
располагаются на одном валу). Выходное напряжепие каждого
якоря пропорционально соответствующему току. Пусть Lt и Rt
обозначают соответственно ипдуктивность и сопротивление об-
мотки якоря, a L2 и Л2 — те же параметры обмоток первого и вто-
второго якорей вместе.
Индуктированные напряжения определяются соотношениями
ei==iVi, A57Г))
&2 ~~ <^2 ^2*
Используются следующие численные значения:
RjLi = 10 с, R2/L2 = 1 с,
й, = 5Ом, * . Д2=10Ом, A.577)
к, = 20 В/А. А-2 = 50 В'А.
а) Примите в качестве компонент состояния \x{f) — i^t) и
|2(i) == 1г@ и покажите, что система уравнений имеет вид
\ L A.578)
где \i(i) =eo(i) и ц (t) =e2(t).
б) Вычислите переходную матрицу, импульсную переходную
функцию и переходную функцию системы. Начертите графики им-
импульсной и переходной функций для заданных численных зна-
.чений.
в) Является ли система устойчивой в смысле Ляпунова? Яв-
Является ли она асимптотически устойчивой?
г) Определите передаточную функцию системы. Для заданных
значений параметров начертите логарифмические частотные ха-
характеристики системы.
д) Вычислите моды системы.
Элементы теории линейных систем 139
1.12.3. СВОЙСТВА СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
ПРИ ПРЕОБРАЗОВАНИЯХ СОСТОЯНИЯ
Имеем линейную систему с постоянными параметрами
Bu(t), A.579)
y(t)=Cx(t).
Рассмотрим эффект преобразования состояния х = Тх.
а) Покажите, что переходная матрица Ф(?, t0) системы A.579)
и переходная матрица Ф'(^> *о) преобразованной системы связаны
соотношением
Ф'(и^ = ГФ(и»)П A-580)
б) Покажите, что матричная импульсная переходная функция
II матричная переходная функция системы не изменяются при
преобразовании состояния.
в) Покажите, что характеристические числа системы не изме-
изменяются при преобразовании состояния.
г) Покажите, что преобразованная система является устойчи-
устойчивой в смысле Ляпунова тогда и только тогда, когда исходная сис-
система A.579) устойчива в смысле Ляпунова. Докажите также, что
преобразованная система является асимптотически устойчивой
тогда и только тогда, когда исходная система A.579) асимптоти-
асимптотически устойчива.
д) Покажите, что матричная передаточная функция не изме-
изменяется при преобразовании состояния.
1.12.4. УСТОЙЧИВОСТЬ АМПЛИДИНА, ОХВАЧЕННОГО
ОБРАТНОЙ СВЯЗЬЮ
Рассматривается схема с пропорциональной обратной связью,
которую можно представить как результат попытки улучшить
характеристики амплидина (задача 1.12.2). Имеем
Здесь п ДО — внешнее эталонное напряжение, а А. — постоян-
постоянный коэффициент, подлежащий определению.
а) Найдите матричную передаточную функцию от эталонного
напряжения r\.r{t) до выходного напряжения г|@ в замкнутой схе-
схеме управления амплидином.
б) Определите значения постоянного коэффициента X, для
которых замкнутая система асимптотически устойчива. ¦
140 Глава 1
1.12.5*. СТРУКТУРА ПОДПРОСТРАНСТВА
УПРАВЛЯЕМЫХ СОСТОЯНИЙ
Рассматривается каноническая форта управляемости из тео-
теоремы 1.26 (разд. 1.6.3).
а) Докажите, что, каким бы способом ни была выбрана матрица
преобразования Т, характеристические числа обеих матрицС4 и'
и А22 всегда такие же, как в исходной системе.
б) Определите характеристические числа матрицы А и' как-
полюса управляемости и характеристические числа матрицы А22'
как полюса неуправляемости системы. Докажите, что подпростран-
подпространство управляемых состояний систе.мы A.310) порождается соб-
собственными векторами и обобщенными собственными векторами
системы, которые соответствуют полюсам управляемости.
в) Подтвердите, что при исходном представлении системы;.
A.308) подпространство управляемых состояний порождается
собственными векторами и обобщенными собственными векторами,
соответствующими полюсам управляемости.
1.12.6*. УПРАВЛЯЕМОСТЬ И СТАБИЛИЗИРУЕМОСТЬ СИСТЕМЫ
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
ПРИ ПРЕОБРАЗОВАНИИ СОСТОЯНИЯ
Рассматривается преобразование состояния х = Тх в линей-
линейной системе с постоянными параметрами
x(t) = Ax(t) + Bu(t). A.582)
а) Докажите, что преобразованная система является полно-
полностью управляемой в том и только том случае, если исходпая сис-
система A.582) полностью управляемая.
б) Докажите непосредственно (не используя теорему 1.26)v
что преобразованная система является стабилизируемой в том и
только том случае, если исходная система A.582) стабилизируем
мая. х
1.12.7*. ВОССТАНАВЛИВАЕМОСТЬ И ОБНАРУЖИВАЕМОСТЬ СИСТЕМЫ,
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ ПРИ ПРЕОБРАЗОВАНИИ,
СОСТОЯНИЯ
. Рассматривается преобразование состояния¦ х' = Тх в систе-
системе с постоянными параметрами
x(t) = Ax(t), y(iy=Cx(t). A.583)-
а) Докажите, что преобразованная система является полно-
Элементы теории линейных систем, ,141
стыо восстанавливаемой в том и только том случае, если исход-
исходная система A.583) полностью восстанавливаемая.
б) Докажите непосредственно (не используя теорему 1.35),
что преобразованная система является обнаруживаемой в том и
только том случае, если исходная система A.583) обнаруживае-
обнаруживаемая.
1.12.8*. СИСТЕМА, ДУАЛЬНАЯ ПРЕОБРАЗОВАННОЙ СИСТЕМЕ
Рассматривается система с постоянными параметрами
x(t) = Ax{t)-\-Bu(t), A.584)
Преобразуйте эту систему, используя соотношение x'(t) =
— Tx(t), где Т — неособая матрица преобразования. Покажите,
что система, дуальная A.584), переходит в систему, дуальную пре-
преобразованной системе, с помощью преобразования x*(t) = TTx'*(f).
1.12.9. «ДЕМПФИРОВАНИЕ» СМЕСИТЕЛЬНОГО БАКА
Рассматривается бак для перемешивания с флуктуациями
концентраций с{ и с2, как описано в примерах 1.31 и 1.32
(разд. 1.10.3 и 1.10.4). Полагается u(t) ~ 0. Наличие объема жид-
жидкости в баке ведет к тому, что флуктуации в концентрациях
ci и С2 уменьшаются. Определите «показатель демпфирования»
бака как квадратный корень из отношения среднего значения квад-
квадрата флуктуации в концентрациях c(t) вытекающего потока и
среднего значения квадрата флуктуации, когда входящие потоки
смешиваются непосредственно вне бака (Fo = 0). Вычислите по-
показатель демпфирования как функцию Vo. Положите <л = а2,
Oj = 62 — 10 с и используйте численные значения из примера 1.2
(разд. 1.2.3).-Начертите график зависимости показателя демпфиро-
демпфирования от Vo.
1.12.10. СОСТОЯНИЕ СИСТЕМЫ, ВОЗБУЖДАЕМОЙ ГАУССОВСКИМ
БЕЛЫМ ШУМОМ, КАК МАРКОВСКИЙ ПРОЦЕСС •
Стохастический процесс v{t) является марковским процессом,,
ос л и
Р {о (О < v.n | v (tt), v (t2), ...,v (*„_,)} = P {v (tn) < vn I vit^)} A.585)
для всех п, всех tu t2, ..., tn, {tn > tn_i > tn_2, ..., > t{) и
всех vn. Покажите, что состояние x(t) системы
142 ¦ Глава 1
{t), A586)
х (Ч) == хо->
где w(t) — гауссовский белый шум, & х0 — заданная стохастичес-
стохастическая переменная, является марковским процессом при условии,
что х0 не зависит от w(t), t > t0.
1.12.11. МОДЕЛИРОВАНИЕ СТОХАСТИЧЕСКИХ ПРОЦЕССОВ ВТОРОГО
ПОРЯДКА
Рассматривается система
° 1 W) + (°W). A.587)
Для удобства выбрана система, представленная в каноничес-
канонической форме. Пусть соB) — белый шум интенсивности 1. Выходная
переменная системы записывается в виде
v(*) = (Yi, ¦?*)*(<)¦ (!-588)
а) Покажите, что если система A.587) асимптотически устой-
устойчивая, то функция спектральной плотности энергии процесса
y(t) определяется выражением
X И =
A.589)
)* +ai (И+
б) Скалярный стационарный стохастический процесс задает-
задается одним из следующих двух типов ковариационных функций:
Д, ft = Pi «Г*'" +M-"tM A-590)
или
/?v (т) = 84 е"'0' '¦' cos (со0т) ¦+¦ ^ге~'т' cos (<oo -), A.591)
где х =-<1 — ^2- Покажите, что система, описываемая уравнения-
уравнениями A.587) и A.588), может быть использована для моделирования
таких процессов. Найдите выражения, связывающие константы
в уравнениях A.587) и A.588) с константами выражений A.590)
или A.591).
в) Атмосферная турбулентность проявляется-в виде стохасти-
стохастически изменяющихся скоростей воздушного потока. Скоростные
флуктуации в направлении, перпендикулярном главному потоку,
могут быть представлены как скалярный стохастический процесс
« ковариационной функцией
Д(т) = о2е-м/9('1--1--Ь-1), . A.592)
где т = ^i — h- Смоделируйте этот процесс.
9
АНАЛИЗ ЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ
<?./. Введение
Во введении дается краткое описание задач управления и со-
содержание данной главы.
Система управления является динамической системой, которая
ведет себя желаемым образом, как правило, без вмешательства
человека. Теория управления рассматривает вопросы анализа и
синтеза систем управления.
Основными компонентами системы управления (рис. 2.1) яв--
ляются: 1) объект, которым система должна управлять, 2) датчик
Желаемая
величина
Рис. 2.1. Схема системы упраиления.
(или несколько датчиков), который обеспечивает получение ин-
информации об объекте, и 3) регулятор — важнейший компонент
системы управления, который сравнивает измеренные и желае-
желаемые значения и регулирует входные переменны* объекта.
Примером системы управления является саморегулируемая
система отопления дома, которая поддерживает внутри дома прак-
практически постоянную температуру при существенных изменениях
температуры окружения. Система работает без вмешательства
человека, за исключением тех случаев, когда надо установить же-
желаемую температуру. В этой системе управления объектом
являются дом и тепловая установка. Роль датчиков обычно
выполняют термодатчик, находящийся внутри дома, и (иногда)
датчик наружной температуры. Регулятор обычно объединяется с
144 Глава 2
внутренним термодатчиком в термостат, который включает либо
выключает по мере необходимости тепловую установку.
Другим примером системы управления является следящая ан-
антенна, которая без помощи человека все время направлена на дви-
движущийся объект, например на спутник. Здесь объектом являют-
являются антенна и исполнительный двигатель. Датчик состоит из по-
потенциометра или другого чувствительного элемента, который изме-
измеряет перемещение антенны и, возможно, включает в себя тахоге-
нератор для измерения угловой скорости антенны. Регулятор
состоит из электронной аппаратуры, которая обеспечивает подачу
соответствующего входного напряжения на исполнительный дви-
двигатель. '
Хотя на первый взгляд эти системы управления кажутся раз-
различными, более глубокое изучение показывает, что они имеют
много общего, Во-первых, объект и регулятор описываются диффе-
дифференциальными уравнениями. Поэтому математический аппарат,
необходимый для анализа поведения системы управления в обо-
обоих случаях, состоит из совокупности методов, обычно называемых
теорией систем. Во-вторых, обе системы управления имеют ха-
характерную особенность, состоящую в наличии обратной связи,
суть которой заключается в том, что действительное состояние
системы управления сравнивается с желаемым состоянием и на
основании этого сравнения вырабатывается входной сигнад на
объект управления.
Обратная связь имеет несколько важных свойств. Поскольку
действительное состояние непрерывно сравнивается с желаемым
состоянием, системы управления с обратной связью способны удов-
удовлетворительно функционировать и в неблагоприятных условиях,
таких, как возмущения, которые действуют на систему, или изме-
изменения свойств объекта. В системе отопления дома возмущения вы-
вызываются изменениями окружающей температуры и скорости вет-
ветра, а изменения в свойствах объекта могут иметь место вследствие
соединения либо разъединения частей отопительной системы
дома. В системе управления антенной на объект действуют воз-
возмущения в виде порывов ветра, а изменение свойств объекта про-
происходит вследствие зависимости коэффициента трения от темпе-
температуры.
В настоящей главе рассматриваются задачи управления и опи-
описываются возможные решения этих задач, анализируются эти/
решения и формулируются основные принципы проектирования.
В последующих главах задачи управления рассматриваются как
задачи математической оптимизации и полученные результаты
используются для синтеза систем управления. Указанные основ-
основные принципы проектирования в основном устанавливаются для
линейных систем управления с постоянными параметрами.
Обычно они разрабатываются с использованием частотных харак-
Анализ линейных систем управления 145
теристик, так как в этом случае может быть достигнуто наиболее
ясное и наглядное изложение. Описание систем управления во
временной области посредством уравнений состояния также ши-
широко используется, поскольку во временной области часто более
удобно выполнять численные расчеты.
Настоящая глава построена следующим образом. В разд. 2.2
дается общее описание задач слежения, регулирования и терми-
терминального управления. В разд. 2.3 рассматриваются замкнутые
регуляторы. В последующих разделах обсуждаются различные
свойства систем управления, такие, как устойчивость, точность
слежения в установившемся режиме, свойства переходного про-
процесса, влияние возмущений и шума наблюдений, влияние изме-
изменений свойств объекта. Рассматриваются как одномерные, так и
многомерные системы.
?.?. Формулирование задач управления
2.2.1. ВВЕДЕНИЕ
В настоящем разделе рассматриваются два вида задач управ-
управления: 1) задачи слежения и как частный случай задачи регулиро-
регулирования; 2) задачи терминального управления.
В последующих разделах приводится детальное описание воз-
возможных схем управления и обстоятельно анализируются эти схе-
схемы. В частности, значительное внимание уделяется следующим
нопросам: вычислению среднеквадратической ошибки слежения и
среднеквадратического значения входной переменной, анализу
устойчивости, передаточных свойств и поведения в переходном
процессе, подавлению возмущений и шума наблюдений, а также
компенсации изменения параметров объекта.
2.2.2. ФОРМУЛИРОВАНИЕ ЗАДАЧ СЛЕЖЕНИЯ
И РЕГУЛИРОВАНИЯ
Рассмотрим с общих позиций один из важнейших классов задач
управления — задачи слежения. Пусть имеется система, обычно
называемая объектом, изменять которую не допускается. С объек-
объектом связаны следующие переменные (рис. 2.2):
1. Входная переменная u(t), которая воздействует на объект
и может быть регулируемой.
2. Возмущающая переменная vp (t), которая воздействует на
объект и не может быть регулируемой.
3. Наблюдаемая переменная у(t), которая измеряется датчи-
датчиками и используется для получения информации о состоянии
объекта; наблюдаемая переменная обычно искажается шумом
наблюдений vm(t).
(,—394,
146 Глава 2
4. Управляемая переменная z(t), которой требуется управлять.
5. Эталонная переменная r(t), которая представляет собой
требуемое значение управляемой переменной.
Задача слежения, говоря кратко, заключается в следующем.
Для заданной эталонной переменной нужно найти такую подхо-
Возмущающая
переменная vp
Входная
переменная и
Эталонная
переменная г
Датчики
Управляемая
переменная z
Наблюдаемая
переменная у
Шум
наблюдений vm
Рис. 2.2. Объект.
дящую входную переменную, чтобы управляемая переменная сле-
следила за эталонной, т. е.
t>t0,
B.1)
где t0 — момент времени, начиная с которого осуществляется
управление. Как правило, зараннее эталонная переменная не
известна. Кроме того, диапазон изменения входной переменной
u(t) практически ограничен. Расширение этого диапазона ведет к
замене объекта на более мощный, что является неэкономичным.
Как будет видно из дальнейшего, это ограничение имеет очень
большое значение и не позволяет получать идеальные системы
слежения.
При проектировании следящих систем, удовлетворяющих ос-
основному требованию B.1), должны быть приняты во внимание
следующие аспекты:
1. На объект действуют неконтролируемые возмущения.
2. Параметры объекта могут быть в точности не известными и
изменяться.
3. Начальное состояние объекта может быть неизвестным.
4. Наблюдаемая переменная, может не давать непосредственной
формации о состоянии объекта и, более того, может быть иска-
искажена шумом наблюдений.
Входной сигнал для объекта вырабатывается устройством, кото-
Анализ-линейных систем управления
147
рое назовем регулятором. Различаются два вида регуляторов:
разомкнутые и замкнутые. Разомкнутые регуляторы вырабаты-
вырабатывают сигнал u(i) на основе только прошлых и текущего значений
эталонной переменной (рис. 2.3), т. е.
Эталонная
переменная
г
Регулятор
Входная
переменная
и
Возмущающая
переменная vp
Объект
Управляемая
переменная
z
Рис. 2.3. Разомкнутая система управления.
Замкнутые регуляторы имеют дополнительную информацию об
объекте, которая содержится в наблюдаемой переменной; указан-
указанный принцип может быть представлен (рис. 2.4) в виде
Эталонная
переменная
г
регулятор
Входная
переменная
и
Возмущающая
переменная vp
ЧпрпЯпярмап
Объект
переменная ъ
Датчики нпПпюЯлрипг
—Г
Шум
набпюдений
переменная у
vm
Рис. 2.4. Замкнутая система управления.
и It) =
у
t\,
t0.
B.3)
Заметим, что ни в B.2), ни в B.3) для получения входной
переменной не используются будущие значения эталонной и на-
наблюдаемой переменных, поскольку они не известны. Объект и
регулятор составляют систему управления.
Уже на данной стадии заметим, что замкнутые регуляторы об-
6*
148 Глава 2
ладают намного большими возможностями, чем разомкнутые.
Замкнутые регуляторы могут накапливать информацию об объек-
объекте в процессе его функционирования и таким образом могут соби-
собирать информацию о начальном состоянии объекта, могут умень-
уменьшать влияние возмущений и компенсировать неопределенность
и изменение параметров объекта. Разомкнутым регуляторам, оче-
очевидно, не доступна какая-либо информация об объекте, за исклю-
исключением того, что известно до начала управления. То, что разомкну-
разомкнутые регуляторы не испытывают влияния шума наблюдения, пос-
поскольку они не используют наблюдаемую переменную, не возме-
возмещает указанного пробела.
Важный класс задач слежения составляют задачи, в которых
эталонная переменная является постоянной в течение продолжи-
продолжительного периода времени. В таких случаях обычно принято на-
называть эталонную переменную заданной точкой системы и гово-
говорить о задачах регулирования. Главная задача обычна здесь сос-
состоит в том, чтобы поддерживать управляемую переменную в задан-
заданной точке при наличии возмущений. В настоящей главе задачи
слежения и регулирования рассматриваются параллельно.
Данный раздел завершаетея двумя примерами.
Пример 2.1. Система управления положением
В данном примере описывается задача управления, которая
детально разбирается позже. Представим объект, движущийся, в
плоскости. В центре плоскости располагается вращающаяся ан-
антенна, которая, как предполагается, отмечает направление объекта
во все моменты времени. Антенна приводится в движение электро-
электродвигателем. Задача управления заключается в таком воздействии
на двигатель, при котором
в(*)~е,(*), г>г0, B.4)
где 6@ обозначает угловое положение антенны, а 6Дг) — угловое
положение объекта. Предположим, что угол Qr(t) доступен для из-
измерения с помощью визирного устройства.
Объект состоит из антенны и двигателя. Возмущением являет-
является момент ветровой нагрузки, приложенный к антенне. Наблюдае-
Наблюдаемой переменной является выходной сигнал потенциометра или
другого преобразователя на валу антенны, определяемый выра-
- жением
*i(O = e(*) + v(*), B.5)
где v(i) — шум измерений. В данном примере углом Q(t) необ-
необходимо управлять, и, следовательно, он является управляемой
переменной. Эталонной переменной является направление на
объект Qr(t). Входным сигналом на объект является входное на-
напряжение ц, поступающее на двигатель.
Угловое положение
визира и объекта
Потенциометр
Электрический сигнал
Регулятор
Дифференциальный
усилитель и
усилитель
мощности
входное
напряжение
на двигатель
Ветробое
дозмушше
Объект
Электрический
сигнал
Двигатель
и
антенна
, Датчик
Потенциометр
Угловое полотенце
двигателя
Шум
наблюдений
Рис. 2.5. Система управления положением.
150 Глава 2
Возможный метод разворота антенны в точку, соответствующую
положению объекта, заключается в следующем. Оба угла, как ан-
антенны Q(t), так и объекта Qr(t), преобразуются в электрические
переменные с помощью потенциометров или других преобразова-
преобразователей, установленных на валах антенны и визира. Затем Q(t)
вычитается из Qr(t); разность усиливается и служит в качестве
входного сигнала для двигателя. В результате, когда разность
Qr(t) — Q(t) положительна, вырабатывается положительный
входной сигнал, который вызывает вращение антенны в положи-
положительном направлении таким образом, чтобы разность между dr(t)
и 6@ уменьшалась. На рис. 2.5 представлена такая схема управ-
управления.
Очевидно, что такая схема предполагает замкнутый регулятор.
Разомкнутый регулятор вырабатывал бы управляющее напря-
напряжение A,B) только на основе эталонного угла Qr(t). Такой регулятор
не имеет возможностей компенсировать влияние возмущений, та-
таких, как ветровой момент, изменения параметров объекта или
различные коэффициенты трения при разных температурах. Как
будет показано, в случае замкнутого регулятора представляется
возможность защиты от таких явлений.
Данная задача является типичной задачей слежения.
Пример 2.2. Система регулирования смесительного бака
Предыдущий пример — относительно простой, так как
объект имеет скалярные входную и управляемую пере-
переменные. Многомерные задачи управления, в которых объект име-
имеет несколько входных и несколько управляемых переменных,
намного сложнее. В качестве примера многомерной системы рас-
рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3). Бак имеет
два подвода питания; соответствующие потоки могут регулиро-
регулироваться клапанами. Концентрация растворимого вещества в каж-
каждом из потоков постоянна и не может быть изменена. Бак имеет
одно выходное отверстие, и задача управления состоит в проек-
проектировании установки, которая бы автоматически регулировала
расходы через клапаны питания с тем, чтобы поддерживать рас-
расход п концентрацию выходного потока постоянной в соответствии
с заданными эталонными значениями (рис. 2,6).
Это типичная задача регулирования. Компонентами входной
переменной являются расходы входящих потоков. Компонента-
Компонентами управляемой переменной являютея выходной расход и концен-
концентрация выходного потока. Заданная рабочая точка также имеет
две компоненты: желаемый выходной расход и желаемую выход-
выходную концентрацию. Могут иметь место следующие возмущения:
флуктуации входных концентраций, флуктуации входных расхо-
расходов вследствие флуктуации давлений перед клапанами, потерь
жидкости из-за утечек и испарения и т. д. Для хорошего управле-
Эталонный
расход
Эталонная
концентрация
Управляющий сигнал
Управляющий сигнал
на клапан 1
Входной
потоп 1
Регулятор
на клапан 2
Управляющее
устройство
клапана 1
Управляющее
устройство
клапана 2
Клапан 1
Клапан 2
Входной
потоп 2
Датчик
расхода
Датчик ¦
концентрации
Выходной
поток
Рис. 2.6. Система управления смесительным баком.
152 Глава 2
пия системой должны измеряться и выходной расход, и концен-
концентрация; тогда они явятся компонентами наблюдаемой переменной.
Замкнутый регулятор использует как эти изменения, так и значе-
значения заданных уровней расхода и концентрации для вырабатыва-
вырабатывания пневматического или электрического сигнала, который ре-
регулирует клапаны.
2.2.3. ФОРМУЛИРОВАНИЕ ЗАДАЧ ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ
Хотя задачи терминального управления в основном подобны
задачам слежения и регулирования,тем не менее здесь преследуется
несколько иная цель. Как и в предыдущем случае, задан объект с
входной переменной и, возмущением vp, наблюдаемой переменной
у и управляемой переменной z. При этом типичная задача терми-
терминального управления, коротко говоря, заключается в следующем.
Найти такое u{t), t0 < t < tu чтобы выполнялось условие z(tj) =*
^ г, где г — данный вектор, а конечное время t1 может быть как
задано, так и не задано. Практическое ограничение состоит в том,
что диапазон входных амплитуд ограничен. Входной сигнал дол-
должен вырабатываться регулятором, который также может быть
замкнутого или разомкнутого типа.
В настоящей книге подробно эти задачи не разрабатываются и
их рассмотрение ограничивается следующим примером.
Пример 2.3. Управление положением как задача терминального
управления
Рассмотрим задачу унравления положением антенны из приме-
примера 2.1. Предположим, что в определенное время t0 антенна непод-
неподвижна и занимает угловое положение 80. Тогда задача перемещения
антенны в угловое положение Qlf в котором она должна остановить-
остановиться, за минимально возможное время без перегрузки двцгателя яв-
является примером задачи терминального управления.
2.3. Замкнутые регуляторы: основной
принцип проектирования
В данном разделе даются детальные описания объекта и зам-
замкнутых регуляторов. Эти описания составляют основу для после-
последующего материала, излагаемого в настоящей главе. Далее опре-
определяются среднее значение квадрата ошибки слежения и среднее
значение квадрата входной переменной и показывается, как эти
величины могут быть вычислены.
В данной главе и почти во всей книге предполагается, что объект
можэт быть представлен линейной дифференциальной системой;
при этом некоторые компоненты входной переменной являются
Анализ линейных систем управления 153
стохастическими процессами. Дифференциальное уравнение сос-
состояния системы имеет вид
x(t) = A(t)x(t) + B(t)u(t) + vp(t), B6)
x(t0) = x0.
Здесь x(t) — состояние объекта, a u(t) — входная пе-
переменная. Начальное состояние х0 — стохастическая величина, а
возмущающая переменная vp(t) — но предположению стохасти-
стохастический процесс. Наблюдаемая переменная y(t) определяется вы-
выражением
y(t) = C(t)x(t) + vm(t), B.7)
где предполагается, что шум наблюдений vm(t) является стохасти-
стохастическим процессом. Управляемая переменная определяется в виде
z(t) = D(t)x(t). B.8)
Наконец, предполагается, что эталонная переменная r(t)
является стохастическим процессом той же размерности, что и
управляемая переменная z(t).
В общем виде замкнутый регулятор также будет представлен
как линейная дифференциальная система с эталонной переменной
r(t) и наблюдаемой переменной y(t) в качестве входных воздействий
и входной переменной объекта u(t) в качестве выходной величины.
Дифференциальное уравнение состояния замкнутого регулятора
будет иметь вид
q(t) = L (t) q (t)+ Kr (t) r (t) - К, (t) у (t), B 9)
q (h) = ?o.
тогда как уравнение выходной переменной регулятора представ-
представляется следующим образом:
u(t) = F(t)q (t) + Hr (t) r (t) - Hf (t) у (t). B.10)
Здесь индекс г относится к эталонной переменной, а индекс
/ — к обратной связи. Переменная q(t) характеризует состояние
регулятора. Начальное состояние q0 является либо заданным век-
вектором, либо стохастической величиной. На рис. 2.7 показаны
связи объекта и регулятора, которые составляют систему управ-
управления. При Kj{t) = 0и Hj{t) = 0 замкнутый регулятор преобра-
преобразуется в разомкнутый регулятор (рис. 2.8). Система управления
с замкнутым регулятором представляет собой замкнутую систему
управления, а система управления с разомкнутым регулятором —
разомкнутую систему управления.
Определим два критерия качества системы управления,'кото-
j [_^1BH!IL.
Замкнутый регулятор
|
Рис. 2.7. Замкнутая система управления.
/л.
г
1
I
L
t
F
! i
Or"
m^
)
I
A
X
n
Разомкнутый регулятор
j ^Объект
.. |
Рис. 2.8. Разомкнутая система управления.
156 Глава 2
рые будут характеризовать, насколько успешно работает система
управления.
Определение 2.1. Среднее значение квадрата ошибки
слежения Сe(t) и среднее значение входной переменной
Cu(t) определяются выражениями
Ce(t) = E{eT(t)We(t)e(t)), t>t0,
B.11)
Ca{t) = E\uT{t)Wu(t)u(t)), t>t0.
Здесь ошибка слежения равна
e(t) = z(t) — r(t), t>t0, B.12)
a We(t) и Wu(t), t :> t0,— заданные неотрицательно определенные
симметрические весовые матрицы.
Если матрица We(t) является диагональной, что обычно и бы-
бывает, то Ce{t) представляет собой взвешенную сумму средних зна-
значений квадратов ошибок слежения каждой из компонент управ-
управляемой переменной. Если ошибка e(t) — скалярная переменная
и We— 1, то 'У Ce(t) — среднеквадратическая ошибка слежения.
Аналогичным образом, если входная переменная u(t) — скаляр и
\Уи — 1, то Y Cu(t) — среднеквадратическое значение входной пере-
переменной.
Основной целью при проектировании системы управления яв-
является уменьшение до возможно меньшего уровня среднего зна-
значения квадрата ошибки слежения. Уменьшение Ce(t) обычно пред-
предполагает увеличение среднего значения квадрата входной пере-
переменной Cu(t). Поскольку максимально возможное значение Cu(t)
определяется мощностью объекта, должен быть найден компромисс
между требованием к малому среднему значению квадрата ошиб-
ошибки слежения, и необходимостью ограничения среднего значения
квадрата входной переменной до приемлемого уровня.
Основной принцип проектирования. При проектировании систем
управления следует добиваться.Самого низкого из вбзможных сред-
среднего значения квадрата ошибки слежения, не допуская превышения
среднего значения квадрата входной переменной выше заданной
величины.
В последующих разделах приводятся более конкретные пра-
правила проектирования, вытекающие из основного принципа, в
частности для случая систем управления с постоянными парамет-
параметрами.
Рассмотрим способ вычисления среднего значения квадрата
ошибки Ce{t) и среднего значения квадрата входной переменной
Cu(t). Сначала для получения дифференциального уравнения сос-
состояния системы управления используем метод расширения про-
Анализ линейных систем управления ' 157
странства из разд. 1.5.4. Из уравнений состояния и выходной
переменной найдем
* (*) \ U (*) ~B{t) Hf (t) C(t). В (t) F (t)\ (x (t)
q(t)J \ -Kf(t)C(t) L(t) )\q.(t)
-Kf(t) J\vm(t)
Для ошибки слежения и входной переменной имеем
e(t)~[D(t), O]lx®\-r{t),
V q (*) /
B.14)
и (t) = [-Hf (t) С (t), F (*)] ( X B ) + Я, (*) r @ - Hf (t) vm (t).
Вычисление Ce(t) и Cu(t) выполняется в два этапа. Сначала оп-
определяется, среднее, или детерминированная часть процессов e(t)
и u(t), которые описываются выражениями
7= Я {«(*)}, u(t) = E{u(t)}, t>t0. B.15)
Средние значения вычисляются с использованием расширен-
расширенного уравнения состояния B.13) и соотношения B.14), где стохас-
стохастические процессы r(t), vp(t) и vm(t) заменяются своими средними
значениями, а в качестве начального состояния принимается
Среднее значение вектора со1[х(?0), q(ta)].
Обозначим через x(t), q(t) и т. д. переменные, которые получают-
получаются вычитанием из x(t), q(t) и т.д. их средних значений z(t),'q(t)
и т. д., т. е.
Z(t) = x(t)—x(t), g(*) = g(*)—?_(*)" т.д. *>*0. B.16)
Используя эти обозначения, запишем выражения для среднего
значения квадрата ошибки слежения и среднего значение квад-
квадрата входной переменной. Имеем
Ce(t)=E{eT(t)We(t)e(t)}=-eT(tjWe(tO(t) +
+ E{~eT(t)We(t)~e(t)},
B.17)
Си (t) =E{uT(t) Wu (t) и (t)) = uT (t) Wu (Л и Ц) +
*-E{ZT(t)Wu(t) Z(t)}
158 Глава 2
Члены Е {ет (t)We(t)e~(t)} и Е{йт (t)Wu(t)u{t)) могут быть легко
найдены, если известны матрица дисперсий процесса col[x(i),
q(t)}. Чтобы определить эту матрицу дисперсий, необходимо смоде-
смоделировать составляющие процессов r(t), vp(t) и vm(t), соответствую-
соответствующие нулевому среднему значению, как выходные переменные ли-
линейных дифференциальных систем, возбуждаемых белым шумом
(разд. 1.11.4). Тогда вектор col[x(t), q(t)] расширяется за счет сос-
состояний моделей, генерирующих различные стохастические про-
процессы, а матрица дисперсий результирующего расширенного сос-
состояния может быть вычислена с использованием дифференциаль-
дифференциального уравнения для матрицы дисперсий из разд. 1.11.2. Полная
процедура иллюстрируется примерами.
Пример 2.4. Система управления положением
Продолжим рассмотрение примера 2.1 (разд. 2.2.2). Движение
антенны может быть описано дифференциальным уравнением J
/в(«)+Вв(*) = т(*)+тЛ(*). B.18)
Здесь / — момент инерции всех вращающихся элементов кон-
конструкции, включая антенну; В — коэффициент вязкого трения,
t(i) — момент, развиваемый двигателем, a ra(t) — возмущающий
момент, вызываемый ветром. Предполагается, что момент, разви-
развиваемый двигателем, пропорционален входному напряжению
\x(t), т. е.
т (t) = /qx (*).
Определяя переменные состояния |х(?) = 0(?) и|а(?) = 0(?), за-
запишем дифференциальное уравнение состояния в виде
где
*(*) = col &(*),&(*)], о=-|-, * = -j., Y = -y- B.20)
Управляемой переменной ?(?) является угловое положение ан-
антенны
С (*) = A,0) *(«).• B.21)
Параметрам присваиваются следующие численные значения:
<х=4,6с-1, х = 0,787 рад/(В-с2), /=10кг.м2. B.22)
Анализ линейных систем управления
159
Вариант 1. Обратная связь по положению посредством регулятора
нулевого порядка.
В качестве первой попытки спроектировать систему управле-
управления рассмотрим схему, намеченную в примере 2.1. Единственной
измеряемой переменной является угловое положение Q(t), поэто-
поэтому уравнение наблюдаемой переменной имеет вид
Ч(*) = A, 0) *(*)+'v(*), B.23)
где v(<) — шум измерений. Предполагаемый регулятор может быть
описан соотношением
Р(О = М8Г(*)—Ч(*I. B.24)
где Qr(t) — эталонный угол, а X — постоянный коэффициент уси-
усиления. На рис. 2.9 показана упрощенная блок-схема системы уп-
Возмущающий
момент t^
Эталонный +,
угол вг
О
Входное
напряжение
Коэффициент
усиления
Двигатель
Угловое
положение
Шум
+ наблюдений
Наблюдаемая
переменная п
Гис. 2.9. Упрощенная блок-схема замкнутой системы унравления ноложением
с регулятором нулевого порядка.
равления, откуда видно, что напряжение, подаваемое на двигатель,
пропорционально разности между эталонным углом Qr(t) и наблю-
наблюдаемым угловым положением^ (<). Знаки выбираются таким обра-
образом, чтобы положительное значение разности <br(t) — y\(t) приводи-
приводило в результате к положительному моменту, прикладываемому к
валу антенны. Вопрос о том, каким выбрать %, пока остается от-
открытым; он будет рассмотрен в.примерах последующих разделов.
Из B.19), B.23) и B.24) следует дифференциальное уравнение
состояния замкнутой системы
B.25)
160 Глава 2
Заметим, что регулятор B.24) не увеличивает размерности зам-
замкнутой системы по сравнению с размерностью объекта, поскольку
он не имеет динамики. Регуляторы этого типа относятся к регуля-
регуляторам нулевого порядка.
В последующих примерах будет показано, как могут быть вы-
вычислены среднее значение квадрата ошибки слежения и среднее
значение квадрата входной переменной при наличии стохастичес-
стохастических процессов 0ДО, Td@ и Ч') в системе уравнений замкнутой
системы.
Вариант 11. Обратные связи по положению и скорости посред-
посредством регулятора нулевого порядка.
В последующих главах-будет показано, что чем больше инфор-
информации о состоянии системы имеется в системе управления, тем
лучше. Поэтому введем в систему, кроме потенциометра, измеряю-
измеряющего угловое положение, тахогенератор, устанавливаемый на
валу антенны, который измеряет угловую скорость. Таким обра-
образом, имеется полная информация о состоянии, хотя, конечно, ис-
искаженная шумом. Тогда наблюдаемая переменная приобретает вид
y(t)=(i \x(t)+v{t), B.26)
\0 1/
где y(t) — col [r|iB), г)а@1, а КО — с°1 lvi(i)(' va@1 является шумом
наблюдений.
Предложим теперь, следующую простую схему управления
(рис. 2.10):
возмущающий
Рис. 2.10. Упрощенная блок-схема замкнутой системы управления положены
ем и скоростью с регулятором нулевого порядка.
Анализ линейных систем управления
161
р (*) = X [Эг @ - га (*I - %рЪ (t). ' B.27)
При таком способе управления входное напряжение двигателя
содержит не только составляющую, пропорциональную ошибке
слежения Qr(t) — Q(t), но также и добавочную составляющую, про-
пропорциональную угловой скорости Q(t). Эта составляющая играет
следующую роль. Допустим, что в данный момент разность Qr(t) —
Q(t) положительна v а также имеет место положительная и значи-
значительная по величине угловая скорость Q(t). Это означает, что ан-
антенна с большой скоростью движется в требуемом направлении.
Поэтому может оказаться желательным не продолжать переме-
перемещение антенны, а начать торможение и таким образом избежать
перерегулирования (перехода через желаемое положение). Если
р выбрано правильно, то управлением B.27) можно эго осущест-
осуществить в противоположность управлению B.24). Позже будет пока-
показано, что данная схема может обеспечить более высокие показа-
показатели регулирования, чем схема, рассмотренная в варианте I.
Вариант 111. Обратная связь по положению посредством регуля-
регулятора первого порядка.
При данном подходе так же, как и в варианте I, предполагает-
предполагается, что измеряемым является только угловое положение Q(t).
Если наблюдения не содержат какого-либо шума, можно для полу-
получения производной Q(t) из.координаты 0(?) использовать дифферен-
дифференцирующее звено и продолжить построение системы в соответствии
с вариантом II. Однако, поскольку всегда присутствует шум изме-
измерений, использовать дифференцирование нельзя, так как это ве-
ведет к значительному увеличению уровня шума. Поэтому попытаем-
попытаемся использовать приближенное дифференцирующее звено
(рис. 2.11), которое в определенной степени может «фильтровать»
шум. Такое приближенное дифференцирующее звено можно реа-
Возмущаюишй
момент
Эталонный
Входное
напряжение
коэффициент
усиления
Двигатель
УглоЙде почтете
в
Приближенное значение
угловой скорости
4>-дийм
Ноярашццент
усиления
п-
Приближенный
Набнядимая
переменная
9(V
Рис. 2.11. Упрощенная блок-схема замкнутой системы управления положени-
положением с регулятором первого порядка.
162 Глава 2
лизовать с помощью устройства, имеющего передаточную функцию
, B.28)
где Td— (малая) положительная постоянная времени. Чем больше
величина Td, тем в меньшей степени это звено является дифферен-
дифференцирующим, но тем меньше усиливается шум.
Входная переменная объекта может быть представлена в виде
Н0 = ме,(*)-1(*I—W). B-29)
где r\(t) — наблюдаемое угловое положение, как и в B.23), а
b(t) — «приближенная производная», т. е. b(t) удовлетворяет диф-
дифференциальному уравнению
ТйЩ +§@ = ^@- B-30)
В данном случае регулятор является динамической системой
первого порядка. Детальный анализ качества рассматриваемой
системы управления также откладывается до последующих раз-
разделов, где будут выбраны соответствующие значения постоянной
времени Td и коэффициентов X и р. Как будет видно, показатели
качества этой системы занимают промежуточное значение между
показателями качества систем вариантов I и II; данная система
может достичь лучших показателей, чем в варианте I, хотя и не
таких хороших, как в варианте II.
2.4. Устойчивость систем управления
В предыдущем разделе были введены функции Ce(t) и Cu{t)
как меры качества системы управления. Поскольку, вообще
говоря, ожидается, что система управления будет функциониро-
функционировать в течение продолжительного времени, по крайней мере сле-
следует потребовать, чтобы функции Ce(t) и Ctt{t) оставались ограни-
ограниченными при увеличении t. Это непосредственно приводит к не-
необходимости исследования устойчивости системы управления.
Если система управления является неустойчивой, то рано или
поздно некоторые переменные начнут неограниченно возрастать,
что, конечно, являэтся неприемлемым в любой системе управления,
которая функционирует на некотором интервале времени (т. е.
в течение периода, большего, чем постоянная времени возрастаю-
возрастающего экспоненциала). Если система управления неустойчива, то
Ce(t) или Ca{t) либо обе функции неограниченно возрастают. Та-
Таким образом, приходим к следующему принципу проектирования.
Принцип проектирования 2.1. Система управления должна быть
асимптотически устойчивой.
Анализ линейных систем управления 163
В предположении о постоянстве параметров системы управле-
управления принцип проектиро'вания 2.1 эквивалентен требованию, что-
чтобы все характеристические числа расширенной системы B.13),
т. е. характеристические числа матрицы
-Kfi L j
имели строго отрицательные действительные части. В соответст-
соответствии с теоремой 1.21 (разд. 1.5.4) характеристический полином
матрицы B.31) можно записать в виде
det (si — A) det (si — L) det [1 + H (s) G (s)], B.32)
где матричная передаточная функция от входной переменной и до
наблюдаемой переменной у обозначается через
Н (s) = С (si — А)-1 В, . B.33)
L)-1Kf + H/ B.34)
есть матричная передаточная функция регулятора от у до ~и.
Одной из функций регулятора является перемещение полюсов
объекта на лучшие местоположения в левой комплексной полу-
полуплоскости, чтобы таким образом достичь улучшения качества
системы.
Если сам объект неустойчив, то главной задачей регулятора
является стабилизация системы посредством передвижения полю-
полюсов замкнутой системы в соответствующие места левой комплек-
комплексной полуплоскости (пример 2.6).
Пример 2.5. Система управления положением
Исследуем устойчивость системы управления с позиционной
обратной связью нулевого порядка, предложенной для переме-
перемещения антенны из примера 2.4 (вариант I). Передаточная функция
объекта (передаточная функция от управляющего напряжения
до положения антенны) задана в виде
H(s) = . B.35)
Передаточная функция регулятора равна
G(s) = K. B.36)
В соответствии с B.32) полюса замкнутой системы являются
корнями выражения
s (s + а) |~1 -| —1 = s2 + as + /Я- B.37>
L ( + ) J
164 Глава 2
-10 .
-5
Я«Я/7)
5/
-5/
Рис. 2.12; Корневой годограф системы управления положением.
- годограф системы второго порядка; модификация годографа из-за наличия
полюса в точке —10 с.
На рис. 2.12 показан корневой годограф полюсов замкнутой
системы, где % — параметр, а численные значения остальных пара-
параметров взяты из B.22).
Видно, что в идеальном случае система управления устойчива
при всех положительных значениях %. На практике, однако, при
больших X система становится неустойчивой. Причина этого,
кроме всего прочего, заключается в том, что не была учтена элек-
электрическая постоянная времени Те двигателя. G учетом ее переда-
передаточная функция системы двигатель — антенна записывается сле-
следующим образом:
Я (s) = - .. B.38)
В результате характеристический полином замкнутой сисгемк
приобретает вид
На рис. 2.12 показана модификация корневого годографа при
значении
Те = 0,1 с. B.40
Для X Ж*,П(, где
B.41
Анализ линейных систем управления 165
замкнутая система является неустойчивой. В данном случае
Хт = 85,3 В/рад.
Пример 2.6. Стабилизация перевернутого маятника
В качестве примера неустойчивого объекта рассмотрим пере-
перевернутый маятник из примера 1.1 (разд. 1.2.3). Из примера 1.16
(разд. 1.5.4) было видно, что с помощью обратной связи по углу
<$(?) посредством регулятора нулевого порядка вида
I* (*) = Л.Ф @ • ' ' B.42)
невозможно стабилизировать систему при любых значениях ко-
коэффициента X. Однако можно стабилизировать систему с помощью
обратной связи по полному состоянию x(t), а именно
{«,(*) = —fcc(*). B.43)
Здесь к — постоянная вектор-строка, которую требуется найти.
Заметим, что построение этого регулятора требует измерения всех
четырех переменных состояний.
В примере 1.1 было получено линеаризованное дифференциаль-
дифференциальное уравнение состояния системы, которое имеет вид
B.44)
где Ъ — вектор-столбец. Подставляя B.43), имеем
x(t) = Ax(f) — bkx(t), B.45)
или
x(t) = (A—bk)x(t). B.46)
Устойчивость этой системы определяется характеристическими
числами, матрицы А — Ьк. В гл. 3 обсуждаются методы определе-
определения, оптимальных регуляторов вида B.43), которые стабилизиру-
стабилизируют систему. Используя эти методы, при численных значениях па-
параметров из примера 1.1 можно найти, например, что
к = (86,81; 12,21; —118,4; —33,44) B.47)
стабилизирует линеаризованную систему. При таком к характе-
характеристические числа замкнутой системы равны —4,706 ±/1,382
и -1,902 +/3,420.
Для исследования устойчивости реальной (нелинейной) зам-
замкнутой системы рассмотрим нелинейные уравнения состояния
B.48)
166 Глава 2
,
M
co,
-МОП
> У
где компоненты |x, |2, |3 и ?4 определяются так же, как и в линеа-
линеаризованных уравнениях. Подстановка выражения B.43) для
[л(?) в B.48) приводит к дифференциальному уравнению состояния
замкнутой системы. На рис. 2.13 показаны реакции замкнутой
системы по углу ф(?) при различных начальных значениях <р@)
и нулевых начальных условиях по другим координатам. При
ф@) = 10° движение не отличается от движения, которое было най-
найдено для линеаризованной системы. При ф@) = 20° имеет место
некоторое отклонение, тогда как при ф@) = 30° значения B.47)
не обеспечивают стабилизацию системы.
Рис. 2.13. Поведение угла <f{t) в стабилизированном перевернутом маятнике.
о) 9 @) =0°; б) <р„ = 20°; " в) <р,@) = 30°.
Этот пример также иллюстрирует теорему 1.16 (разд. 1.4.4),
которая устанавливает, что если линеаризованная система явля-
является асимптотически устойчивой, то нелинейная система, из ко-
которой она получена, также асимптотически устойчивая. Очевидно,
что в настоящем случае диапазон, в котором линеаризация дает
положительные результаты, достаточно велик.
Анализ линейных систем управления- 167
2.5. Анализ точности слежения
в установившемся режиме
2.5.1. УСТАНОВИВШИЕСЯ СРЕДНИЕ ЗНАЧЕНИЯ КВАДРАТОВ
ОШИБКИ СЛЕЖЕНИЯ И ВХОДНОЙ ПЕРЕМЕННОЙ
В разд. 2.3 были введены среднее значение .квадрата ошибки
слежения се и среднее значение квадрата входной переменной са.
Из уравнений системы управления B.13) и B.14) можно видеть,
что все три процесса r(t), vp(t) и vm(t), т. е. эталонная переменная,
возмущающая переменная и шум наблюдений, оказывают влия-
влияние на Се и Си. С этого момента до конца главы предположим, что
r(t), vp{t)- и vm(t) — статистически некоррелированные стохасти-
стохастические процессы, так что их влияние на Се и Си может быть изу-
изучено по отдельности. В настоящем и последующем разделах рас-
рассматривается влияние эталонной переменной r(t) отдельно на Ce(t)
и Cu(t), Влияние возмущений и шума наблюдений исследуется в
последующих разделах.
Разделим продолжительность процесса управления на два
периода: переходный и установившийся. Эти два периода могут
быть охарактеризованы следующим образом. Переходный период
начинается с началом процесса и оканчивается, когда интересую-
интересующие нас величины (обычно средние значения квадрата ошибки сле-
слежения и входной переменной) Приблизительно достигают своих
установившихся значений. С этого времени обычно говорят, что
процесс находится в установившемся состояний. Предполагается,
конечно, что интересующие величины стремятся с течением вре-
времени к определенному пределу. Продолжительность переходного
периода называется временем установления.
При проектировании систем управления должны приниматься
во внимание характеристики системы как в переходном, так и в
установившемся периодах. Настоящий раздел посвящается ана-
анализу свойств следящих систем в установившемся режиме. В сле-
следующем разделе рассматривается анализ переходных процессов.
Для данного и следующего разделов делаются следующие допу-
допущения:
1. Принцип проектирования 2.1 удовлетворяется, т. е.
система управления асимптотически устойчивая.
2. Система управления имеет постоянные параметры, а ве-
весовые матрицы We и Wa постоянные.
3. Возмущение Vp(t) и шум наблюдений vm(t) равны нулю.
4. Эталонная переменная r(t) может быть представлена в
виде
r(t)=ro + rn(t), BЛ9)
168 Глава 2
где rQ — стохастический вектор, a rv(t) — стационарный в ши-
широком смысле и при этом некоррелированный с г0 векторный сто-
стохастический процесс с нулевым средним.
Здесь стохастический вектор г0 является постоянной частью
эталонной переменной и фактически представляет собой заданную
точку управляемой переменной. Процесс rv(t) с нулевым средним
является переменной частью эталонной переменной. Предполо-
Предположим, что матрица моментов второго порядка вектора г0 задана
в виде
E{r0/0} = R0, B.50)
а переменная часть rv(t) имеет матрицу спектральной плотности
энергии 2Дю).
При установленных допущениях среднее значение квадрата
ошибки слежения и среднее значение квадрата входной переменной-
при увеличении t сходятся к постоянным величинам. Тогда опре-
определим
e(t) B.51)
как установившееся среднее значение квадрата ошибки слежения,
а
Cae,= HmC1u@ B-52)
как установившееся среднее значение квадрата входной переменной.
Для вычисления Сесо и Сиоо обозначим через T(s) передаточную
функцию замкнутой системы управления, т. е\ матричную переда-
передаточную функцию от эталонной переменной г до управляемой
переменной г. Далее обозначим через N(s) матричную передаточ-
передаточную функцию замкнутой системы от эталонной переменной г до
входной переменной и.
Чтобы найти выражения для установившихся средних значе-
значений квадратов ошибки слежения и входной переменной, рассмот-
рассмотрим отдельно составляющие, обусловленные постоянной частью
г0 и переменной частью rv(t) эталонной переменной.
Постоянная часть эталонной переменной приводит к устано-
установившимся значениям управляемой и входной переменной, опре-
определяемым соответственно выражениями - •
lim z (t) = Т @) r0 B.53)
и
lim и («) = N @) г0. B.54)
Анализ линейных систем управления 169
Соответствующие части средних значений квадратов ошибки
слежения ж входной переменной равны
[Т @) г0 - ro]T We [Т @) г0 - г0] = tr {r0 rT0 [T @) -
— I]TWe[T@)-l]} B.55)
B.56)
Отсюда следует, что составляющие от постоянной части эта-
эталонной переменной в общей величине установившихся средних
значений квадратов ошибки слежения и входной переменной соот-
соответственно равны
tt {Ro\f@)-if We[T@)-I]), tv{R0NT@)WuN@)]. B.57)
Составляющие от переменной части эталонной переменной в
общей величине установившихся средних значений квадратов
ошибки слежения и входной переменной могут быть легко опре-
определены при использовании результатов разд. 1.10.3 и 1.10.4.
Установившееся среднее значение квадрата ошибки слежения
оказывается равным
Се а = tr {й0 [Т @) - if We[T @) - /] +
+ f 2, И IT (~ /<») - I\T We [T W -1] df\ , B.58)
а установившееся среднее значение квадрата входной переменной
принимает вид
Са „ = tr (i?0 NT @) Wu N @) + J2r (<в) Л'г (-/со) Wu N (/«) df\ .B.59)
Эти формулы служат отправной точкой для формулирования
принципов проектирования. Следующий раздел ограничивается
рассмотрением случая единственной входпой и и единственной
выходной z переменных, т. е. случая, когда и входная, и управ-
управляемая переменные являются скалярными, а интерпретация фор-
формул B.58) и B.59) становится очевидной. В разд. 2.5.3 рассмат-
рассматривается более общий многомерный случай.
В заключение получим выражения для T(s) и N(s) в терминах
различных матричных передаточных функций объекта и регуля-
регулятора. Обозначим через K(s) матричную передаточную функцию
объекта B.6) — B.8) (в предположении постоянства парамет-
параметров) от входной переменной и до управляемой переменной z, a
передаточную функцию от входной переменной и до наблюдаемой
170 Глава 2
Г "
г
1
Р IS)
1
г
1
Объект
К is)
His)
Gisy
z
—
—i
¦ Замкнутый .регулятор ¦
Рйс. 2.14. Блок-схема линейной замкнутой системы управления с постоянны-
постоянными параметрами.
переменной у — через H(s): Обозначим, кроме того, матричную
передаточную функцию регулятора B.9), B.10) (также с постоян-
постоянными параметрами) от эталонной переменной г до и через P(s),
а матричную передаточную функцию от наблюдаемой переменной
у до — и через G(s). Таким образом, имеем
K(s) = D (si — А)'1 В\ Н (8) = С (si — А)-1 В,
B.60)
P{s) =F(sI — L)-1Kr + Hr, G(s) =F{sI — L)-xKf + Hf.
Из блок-схемы, представленной на рис. 2.14, можно опреде-
определить соотношения между некоторыми переменными системы в тер-
терминах матричных передаточных функций. Отсюда видно, что, если
R(s) является преобразованием Лапласа функции r(t), справедли-
справедливы следующие соотношения в терминах преобразованнй Лапласа:
l)(8) = P(8)R(8)-G{8)Y(8),
y(s) = H(s)U(s), B.61)
Z(s)=K(s)U(s).
Исключая некоторые переменные, имеем
Z (*) = Т (8) R (*),
B.62)
U(s)^N(s)R(s),
где
B.63)
Анализ линейных систем управления . . 171
Выражения T(s) и N(s) связаны соотношением
T(s) = K(s)N(s). B.64)
2.5.2. СЛУЧАЙ СКАЛЯРНЫХ ВХОДНОЙ
И ВЫХОДНОЙ ПЕРЕМЕННЫХ
В данном разделе предполагается, что входная и и управляе-
управляемая z переменные, а следовательно, и эталонная переменная г
являются скалярными. Без потери общности можно принять
We — 1 и Wa = 1. В результате установившееся среднее значение
квадрата ошибки слежения и установившееся среднее значение
квадрата входной переменной логут быть выражены в виде
Се„ = #оI Г @) -112 + f 2, (со) | Т (/со) - 1 fdf, B.65а)
Си « = #0\N @)|2 + j 2, NIN (/со) |2 df. B.656)
Из анализа выражения B.65а) вытекает, что, поскольку при
проектировании следящих систем стремятся к малому установив-
установившемуся среднему значению квадрата ошибки слежепия, нужно
придерживаться следующего принципа.
Принцип проектирования 2.2. Чтобы обеспечить малое устано-
установившееся среднее значение квадрата ошибки слежения, передаточ-
передаточную функцию T(s) линейной системы управления с постоянными
параметрами следует выбирать таким образом, чтобы выражение
2г(со)|Г(/со)-1J B.66)
принимало малые значения для'всех действительных со. В частнос-
частности, если заданные точки нулевые, то Т@) должно быть близким
к 1.
Замечание, касающееся Г@), можно пояснить следующим об-
образом. В некоторых прикладных задачах весьма важным яв-
является точное выдерживание заданной рабочей точки системой
управления. В частности, это имеет место в задачах регулирова-
регулирования, где переменная часть эталонной переменной полностью от-
отсутствует. В этом случае может возникнуть необходимость, чтобы
Г@) в точности равнялось 1.
Рассмотрим теперь составляющие интеграла B.65а) по различ-
различным частотным диапазонам. Обычно при возрастании со величина
2г(со) уменьшается и стремится к нулю. Таким образом, из B.65а)
следует, что достаточно сделать малым значение |Г(/(со) — 1|
172 Глава 2
в том диапазоне частот, где 2f(co) принимает . большие значения.
Поскольку эти замечания весьма важны, введем понятия по-
полосы частот системы управления и полосы частот эталонной пе-
переменной. Полосой частот системы управления, грубо говоря,
является диапазон частот, в котором величина T(ja>) близка к 1.
Определение 2.2. Пусть T(s) — скалярная передаточная функ-
функция асимптотически устойчивой линейной системы управления
\T(Ju)-1\
О
Полоса частот
Полоса пропускания
системы управления
Частота среза
Рис. 2.15. Иллюстрации определения полосы частот, полосы пропускания и
частоты среза одномерной системы управления с постоянными параметрами.
Предполагается, что Т (/ш) -»0 при ш -» оо.
с постоянными параметрами и скалярными входной и управляе-
управляемой переменными. Тогда полоса частот системы управления
определяется как множество частот со, со >- 0, для которых
|Г(/т)-1|<е, B.67)
где г — заданное число, малое по сравнению с 1. Если полоса частот
представляет собой интервал [(оь а>2], то разность а>2 — a>i
является полосой пропускания системы управления. Если
полоса частот представляет собой интервал [О, шс], то <йс назы-
называется частотой среза системы.
Рис. 2.15 иллюстрирует понятия полосы частот, полосы про-
пропускания и частоты среза.
В данной книге обычно рассматриваются низкочастотные сис-
системы, полоса пропускания которых представляет собой диапазон
частот от нуля до частоты среза шс. Точное значение частоты среза,
конечно, в значительной степени зависит от числа е. При е = 0,01
определим сос как 1%-ную частоту среза. Подобную терминоло-
Анализ линейных систем управления
173
гию будем использовать для различных значений е-'Часто, однако,
удобно говорить о частоте срыва системы управления, которую
определяют как угловую частоту, при которой асимптотическая
логарифмическая частотная характеристика |J(/o>)| начинает рез-
резко отходить от единицы. Так, частота срыва передаточной функ-
функции первого порядка
гр _ ^
s -\- a
B.68)
равна а, а частота срыва передаточной функции второго порядка
гх, ш0 з +
B.69)
равна ©0. Заметим, однако, что в обоих случаях частота среза
значительно меньше, чем частота срыва, которая зависит от е
(а в случае системы второго порядка — от параметра демпфиро-
демпфирования С). В табл. 2.1 приведены частоты среза 1 и 10% для раз-
различных случаев.
Таблица 2.1
Соотношение между частотой срыва и частотой среза
для скалярных передаточных функций первого и второго порядков
Частота среза
1%
ю%
Система первого
порядка с час-
частотой срыва а
0,01а
0,1а
Система второго порядка с частотой срыва га0
С = 0,4
0,012<о0
0,12о>0
С = 0,707
0,0071иH
0,071ш0
С = 1,5
0,0033«>о
0,033м0
Определим полосу частот эталонной переменной как диапазон
частот, в котором 2,@)) значительно отличается от нуля.
Определение 2.3. Пусть г — скалярный стационарный в широком
смысле стохастический процесс со спектральной плотностью
энергии 2г(ш). Полоса частот Q процесса r(t) определяется как
множество частот ш, со > 0, для которых
2,
о.
B.70)
- Здесь а выбирается таким образом, чтобы полоса содержала
заданную часть 1 — е (е <С 1) половины энергии процесса, т.е.
=(! -8)
B.71)
174 Глава 2
Если полоса частот представляет собой интервал [©4, ©2],
то разность ©2 — Wj определим как полосу пропускания
процесса. Если полоса частот представляет собой интервал [О,
<ос], то сдс представляет собой частоту среза процесса.
Рис. 2.16 иллюстрирует понятия полосы частот, полосы пропус-
пропускания и частоты среза стохастического процесса.
Обычно будут рассматриваться низкочастотные типы стохас-
стохастических процессов, у которых полосой частот является интервал
Полоса частот
Частота среза
Полоса пропускания
стохастического процесса
Рис. 2.16. Иллюстрация определения полосы частот, полосы пропускания и
частоты среза скалярного стохастического процесса г.
вида [0, сос]. Точная величина частоты среза, конечно, во многом
зависит от величины g • Если е = 0,01, то говорят об 1%-ной час-
частоте среза; это означает, что в интервале [0, сос] содержится 99%
от половины энергии процесса. Подобная терминология исполь-
используется и для других значений е- Во многих случаях, однако,
удобно говорить о частоте срыва процесса, которую определим
как угловую частоту, при которой асимптотическая логарифми-
логарифмическая частотная характеристика, соответствующая 2Г(©), начи-
начинает резко отходить от низкочастотной асимптоты, т. е. от 2г@).
Возьмем в качестве примера экспоненциально коррелированный
шум со среднеквадратическим значением ст и постоянной времени
G. Этот процесс имеет функцию спектральной плотности энергии
Анализ линейных систем управления
175
I Полоса" частот
i системы управления
I I
X
ч
Полоса частот
эталонного сигнала
Диапазон частот, который -обусловливает
I появление большей части среднего значения квадрата
1 ошибки слежения
Рис. 2.17. Иллюстрация принципа проектирования 2.2А.
так что его частота срыва равна 1/9. Поскольку эта функция спек-
спектральной плотности очень медленно уменьшается с увеличением
01, 1%- и 10%-ная частоты среза намного больше, чем 1/8: эти ве-
величины равны 63,66/0 и 6,314/0 соответственно.
Рассмотрим вновь интеграл B.65а). Используя введенные по-
понятия, заметим,, что основная часть этого выражения определяет-
определяется теми частотами, которые образуют полосу частот эталонной пе-
переменной, а не полосу частот системы (рис. 2.17). Переформули-
Переформулируем принцип проектирования 2.2 следующим образом.
Принцип проектирования 2.2А. Для получения малого устано-
установившегося среднего значения квадрата ошибки слежения необхо-
необходимо, чтобы полоса частот системы управления содержала как
можно большую часть полосы пропускания переменной части эта-
эталонной переменной^ Если заданные точки не являются нулевыми,
то следует стремиться, чтобы Т@) было близким к 1.
Важный аспект этого правила проектирования состоит в том,
что оно является также полезным в случае, когда об эталонной
переменной ничего не известно, за исключением грубых оценок
ее полосы частот.
Рассмотрим теперь второй аспект проектирования — устано-
установившееся среднее значение квадрата входной переменной. Рас-
Рассмотрение выражения B.656) позволяет сформулировать следую-
следующий принцип управления.
176 Глава 2
Принцип проектирования 2.3. Для получения малого установивше-
установившегося среднего значения квадрата входной переменной в асимптоти-
асимптотически устойчивой линейной системе управления со скалярными
входной и выходной переменными и постоянными параметрами
необходимо, чтобы выражение
ХИ1^(/о))Г B.73)
принимало малые значения для всех действительных ю. Этого
можно достичь, делая \N(ja>)\ малым в полосе частот эталонной
переменной.
Следует заметить, что этот принцип не рекомендует оставлять
N@) малым, как это могло бы следовать из рассмотрения первого
члена выражения B.656). Указанный член представляет собой сос-
составляющую от постоянной части эталонной переменной, т. е. от
заданной рабочей точки, во входной.переменной. Заданная точка
определяет желаемый уровень управляемой переменной и, следо-
следовательно, входной переменной. Можно предположить, что объект
спроектирован таким образом, что он способен выдерживать этот
уровень. Второй член в выражении B.656) важен для динамичес-
динамического диапазона входной переменной, т. е. для допускаемых изме-
изменений входной переменной относительно заданной точки. Пос-
Поскольку этот динамический диапазон ограничен, амплитуда второго
члена в B.65 б) должна быть ограничена.
Не представляет особого труда спроектировать систему управ-
управления так, чтобы один из принципов проектирования — 2.2А
или 2.3 — полностью удовлетворялся. Однако, поскольку T(s) и
N(s) связаны соотношением
Т (s) = K(s) N (*), B.74)
звено T(s) влияет на N(s) и наоборот. Рассмотрим это несколько
подробнее и покажем, что принципы 2.2 и 2.3 могут противоречить
друг другу. Амплитудно-частотная характеристика объекта \K(je>)\
обычно уменьшается при частотах, превышающих определенную
частоту, скажем <ар. Если характеристика \T(j<a)\ остается близ-
близкой к 1 за частотой © из B.74) следует, что 1-/V(;co)| должно уве-
увеличиваться за частотой ар. То что \T(j<a)\ не должно уменьшаться
за частотой ©р, означает, что полоса частот эталонной переменной
распространяется за частоту сор. В результате |./V(/co)| будет боль-
большим в том частотном диапазоне, в котором 2г(со) не является ма-
малым, что может означать большой вклад в среднее значение сиг-
сигнала входной переменной. Если это приводит в результате к пере-
перегрузке объекта, то либо должна быть уменьшена полоса пропус-
пропускания системы за счет возрастания ошибки слежения, либо объект
должен быть заменен на более мощный.
Конструктор должен найти технически разумный компро-
Анализ линейных систем управления , 177
мисс между требованиями малого среднего значения квадрата
ошибки слежения и среднего значения квадрата входной перемен-
переменной, что характеризует динамический диапазон объекта. Этот
компромисс должен быть основан на таких показателях системы,
как максимально допустимая среднеквадратическая ошибка сле-
слежения или максимальная мощность объекта. В последующих гла-
главах, рассматривающих задачу синтеза, находится оптимальный
компромисс этой дилеммы.
Здесь уместно дать краткое пояснение вычислительных аспек-
аспектов. В разд. 2.3 обсуждались методы, основанные на временных
характеристиках, пригодные для вычисления среднего значения
квадрата ошибки слежения и среднего значения квадрата входной
переменной. В случае постоянных параметров интегральные вы-
выражения B.65а) и B.65 б) предлагают другой вычислительный под-
подход. Точные решения интегралов были табулированы для систем
низких порядков (см., например, [132, 160]). При вычислениях,
однако, обычно предпочитают подход, основанный на операциях
во временной области, так как это удобно для расчетов на ЦВМ.
Тем не менее выражения в частотной области чрезвычайно важны,
поскольку они позволяют формулировать принципы проектиро-
проектирования, которые не могут быть так просто установлены во времен-
временной области.
Пример 2.7. Точность системы управления положением
Рассмотрим задачу управления положением из примеров 2.1
(разд. 2.2.2) и 2.4 (разд. 2.3) и предположим, что эталонная пере-
переменная представляется в виде экспоненциально коррелированного
шума с нулевым средним, среднеквадратическим значением а и
постоянной времени Тг. Используем численные значения
о- = 1 рад, Тг = 10 с. B.75)
Из B.72) и численного значения постоянной времени следует,
что частота срыва эталонной переменной равна 0,1 рад/с, 10%-ная
частота среза соответствует 0,63 рад/с, а 1%-ная частота —
6,4 рад/с.
Вариант I. Рассмотрим сначала вариант I из примера 2.4, где
предложена обратная связь нулевого порядка по положению. Не-
Нетрудно найти, что передаточные функции T(s) и N(s) имеют вид
Т (s) = - ,
s* -J- as -J- %К
B.76)
N(s)= ls{s + a)
s2 + as + хХ
7—394
17 8 Глава 2
— ш>
100 рад/с
0,0001
Рис. 2.18. Логарифмические частотные характеристики системы управления
положением.
Вариант I при различных значениях коэффициента X.
откуда имеем
где
T(s) = °- -, • B.77),
s2 -j- Ж «оs + шо
coo = yHx B.78)
есть частота собственных колебаний в отсутствие демпфирования,
а
Г =
2V4I
B.79)
— параметр демпфирования. На рис. 2.18 показан, график
[Г(/со)| в функции частоты для различных значений коэффициен-
коэффициента X. В соответствии с принципом проектирования 2.2А коэффи-
коэффициент А должен быть не меньше 15 В/рад, поскольку в противном
случае частота среза системы управления будет слишком малой
по сравнению с 1%-ной частотой среза эталонной переменной,
равной 6,4 рад/с. Однако частота среза, видимо, не увеличивается
далее с ростом коэффициента из-за наличия пика, который ста-
становится все более и более резко выраженным. Значение коэффи-
коэффициента 15 В/рад соответствует случаю, когда параметр демпфиро-
демпфирования с, приблизительно равен 0,7.
Остается удостовериться, приводит ли это значение к прием-
приемлемым значениям среднеквадратической ошибки слежения и сред-
неквадратического входного напряжения. Вычислим обе величи-
Анализ линейных систем управления
179
ны. Эталонная переменная может быть смоделирована следую-
следующим образом:
6,(*) = ±-Q,(t) + u>tt), B.80)
где w{t) — белый шум интенсивности 2аУТг. Из B.19), B.24) и
B.80) следует объединенное уравнение состояния системы управ-
управления и эталонной переменной
L oi о \/Ei()\ /\
И 1 \w(t). B.81)
Используя это уравнение, нетрудно составить и решить урав-
уравнение Ляпунова относительно матрицы установившихся диспер-
дисперсий Q расширенного состояния col [?i@> Ег(*)» 9^@1 (теорема 1.53,
разд. 1.11.3). В результате имеем
у.ХТг
B.82)
^ -+Г,
.. (хХ)«
Gt
1
а2
1
+ —-
1 г
Выражение для установившегося значения среднего. квадрата
ошибки слежения получим в виде
С =limE{[0(t)— 0Г|
1 хХ
- 2qa +~q33 =
B.83)
где q(J — элементы матрицы Q. График установившейся ореднеквад-
ратической ошибки слежения приведен на рис. 2.19. Заметим, что
возрастание К выше значений 15—25 В/рад уменьшает среднеквад-
7*
180 Глава 2
i
i
Z5 50 15
Коэффициент X, ВI pad
100
20
ii
fi
I
I
25 . 50 75
Коэффициент 1, В/рад
100
Рис. 2.19. Среднеквадратическая ошибка слежения и среднеквадратнческое
входное напряжение как функции коэффициента А, в системе управления по-
положением (вариант I).
ратическую ошибку очень незначительно. То, что Сеоо не умень-
уменьшается до нуля при X—>- сю, обусловлено пиком в частотной харак-
характеристике системы, который при больших Л становится все более
резко выраженным.
Установившееся среднее значение квадрата входного напряже-
напряжения определяется выражением
[9 (t) - Qr
= V Се
B.84)
Рис. 2.19 показывает то, что чувствуется интуитивно, а именно
среднеквадратическое значение входной переменной возрастает с
увеличением коэффициента Л. Сравнивая поведение среднеквадра-
тической ошибки слежения и среднеквадратического входного
напряжения, убеждаемся в том, что не имеет большого смысла
увеличивать коэффициент сверх 15—25 В/рад, так^как увеличение
среднеквадратического входного напряжения не приводит к ка-
какому-либо ощутимому уменьшению среднеквадрагической ошиб-
ошибки слежения. Однако рассматриваемый вариант системы не яв-
является достаточно хорошим, поскольку среднеквадратическая
ошибка слежения достигает значения 0,2 рад, что сравнимо со
среднеквадратичесКим значением эталонной переменной 1 рад.
Анализ линейных систем управления 181
Вариант II. Второй вариант, предложенный в примере 2.4, дает
лучшие результаты, поскольку в этом случае коэффициент тахомет-
рической обратной связи р может быть выбран таким, чтобы зам-
замкнутая система была демпфированной в желаемой полосе пропус-
пропускания, что устраняет влияние резонансного пика. Для данного
варианта передаточная функция
Т (в) = B.85)
сходна с выражением B.76), за исключением того, что а заменяет-
заменяется на а + хЛр. В результате собственная частота системы равна
B.86)
а параметр демпфирования имеет вид
B-87)
Частота срыва системы равна ш0, которая посредством выбора
достаточно большого X может быть сделана большой. Выбором
р, обеспечивающего значение параметра демпфирования ~0,7,
частота среза системы- управления может быть сделана соответ-
соответственно большой. Установившееся среднее значение квадрата
ошибки слежения записывается в виде
Се m = = ^ о\ B.88)
(а + *Хр) [а + хХр + — -Ji xlTr
а установившееся среднее значение квадрата входного напряже-
напряжения равно
а хлр
iia\ B.89)
~
Величина Се<а может быть сделана произвольно малой посред-
посредством выбора больших значений X и р. Для заданного среднеквад-
ратического входного напряжения можно получить меньшую,
чем в варианте I, среднеквадратическую ошибку слежения. Зада-
Задача выбора коэффициентов X и р такими, чтобы получались заданные
среднеквадратическое значение входной переменной и минималь-
минимальная среднеквадратическая ошибка слежения, является задачей
математической оптимизации.
В гл. 3 показывается, как может быть решена эта задача. Сей-
Сейчас ограничимся следующим общим рассуждением. Предположим,
182 Глава 2
что для каждого значения X коэффициент тахометрической связи
р выбирается таким, чтобы параметр демпфирования С равнялся
0,7. Далее предположим заданным условие, что установившееся
среднеквадратическое входное напряжение не должно превышать
30 В. Тогда методом проб и ошибок, используя формулы B.88)
и B.89), можно найти, что при
X = 500 В/рад, р = 0,06 с B.90)
установившаяся среднеквадратическая ошибка слежения равна
0,1031 рад, а установившееся среднеквадратическое входное на-
напряжение равно 30,64 В. Эти значения коэффициентов обеспечи-
обеспечивают близкую к минимальной среднеквадратическую ошибку сле-
слежения для заданной среднеквадратической входной перемен-
переменной. Отметим, что этот вариант лучше, чем вариант I, где была
получена среднеквадратическая ошибка слежения ~0,2 рад. Одна-
Однако вариант II не является еще достаточно хорошим, так как сред-
среднеквадратическая ошибка слежения 0,1 рад не очень мала по
сравнению со среднеквадратическим значением эталонной пере-
переменной 1 рад. Положение можно исправить либо использованием
более мощного двигателя, либо снижением полосы пропускания
эталонной переменной. 10%-ная частота среза рассматриваемой
замкнутой системы равна 0,071 соо =0,071 j/x\ ~ 1,41 рад/с,
где соо — частота срыва системы (табл. 2.1). Эта частота среза зна-
значительно меньше 1%-ной частоты среза эталонной переменной,
равной 6,4 рад/с.
Вариант 111. Третий вариант, . предложенный в примере 2.4,
занимает промежуточное положение: при Тd = 0 он переходит в
вариант II, а при jfd= оо — в вариант I. Для заданного значения
Тй можно ожидать, что его показатели качества также находятся
между показателями указанных двух вариантов, т. е. при задан-
заданном среднеквадратическом входном напряжении среднеквад-
среднеквадратическая ошибка слежения может быть получена меньше, чем
в варианте I, и больше, чем в варианте II.
G точки зрения качества слежения величина Td, конечно,' дол-
должна быть выбрана как можно меньшей. Однако слишком малое
значение Та будет способствовать неблагоприятному влиянию
шума наблюдений. В примере 2.11 (разд. 2.8), который завершает
раздел о влиянии шума наблюдений в системе управления, опре-
определяется наиболее подходящая величина Td.
2.5.3. СЛУЧАИ МНОГОМЕРНОЙ СИСТЕМЫ
В данном разделе вернемся к случаю, когда входная, управ-
управляемая и эталонная переменные являются многомерными, и об-
обобщим принципы проектирования, сформулированные в разд.2.5.2.
Анализ линейных систем управления 183
Из рассмотрения среднего значения квадрата ошибки слежения
в виде B.58) становится очевидным, что принцип проектирования
2.2 следует модифицировать в том смысле, что выражение
tr { 2г(о) 1Т-(~Щ—1)Т We\T(/©) -/]} B.91)
должно быть малым для всех действительных со >¦ 0 и что при
ненулевых заданных рабочих точках должно быть малым выра-
выражение
tr {Ro [T@)~lf We[T@)-~I]\ . B.92)
Очевидно, что это условие выполняется, если T(ja>) равно
единичной матрице для всех частот. Достаточно, однако, чтобы
ТЦ(о) было близким к единичной матрице на всех частотах, для
которых 2Дсо) значительно отличается от нуля. Чтобы более
строго обосновать это утверждение, нужно принять следующие
допущения.
1. Переменная часть эталонной переменной является стохас-
стохастическим процессом с некоррелированными компонентами, для
которого матрица спектральной плотности энергии может
быть выражена в виде-
1(<o), x,2 И 2,. «И1- B-93)
2. Постоянная часть эталонной переменной является стохас-
стохастической величиной с некоррелированными компонентами, так
что ее матрица моментов вторрго порядка может быть выражена
в виде
i?0 = diag(tf0>1, #0,2>-.#o,m)- B-94)
С практической точки зрения эти допущения не накладывают
существенных ограничений. Используя B.93) и B.94), нетрудно
найти, что установившееся среднее значение квадрата ошибки
слежения может быть выражено в виде
т
ЦТ {Щ-If We[T@)-!))„ +
^T(-M-lfWe[TO^)~I])udf. B-95)
1
2 f
/1
где
КГ (-/со) -I\TWe\T№)-~I\\u B.96)
обозначает i-й диагональный элемент матрицы [Т(—/со) — IV
We[T(ja) - Л-
184 Глава 2
Рассмотрим теперь один из членов правой части выражения
B.95):
f 2г. i(Сй) [{Т {~1(Л) -I]T We {Т (/Сй) ~/1}"df- B-97)
00
Выражение B.97) описывает составляющую ошибки слежения
от i-й компоненты эталонной переменной при прохождении ее
через систему. В связи с этим удобно ввести следующее понятие.
Определение 2.4. Пусть T(s) есть т X т-матричная переда-
передаточная функция асимптотически устойчивой линейной системы
управления с постоянными параметрами. Определим полосу час-
частот i-го звена системы управления как множество частот со,
со > О, для которых
Здесь е — заданное число, малое по сравнению с 1, We— весовая
матрица для среднего значения квадрата ошибки слежения, а
Wetii обозначает i-й диагональный элемент матрицы We.
Установив полосу частот i-ro звена, можно, конечно, опреде-
определить полосу пропускания и частоту среза i-ro звена, если они су-
существуют, как это было сделано в определении 2.2. Заметим, что
определение 2.4 также справедливо для недиагональной весовой
матрицы We. Причиной, по которой величина
{[Г(—/со)—/JrWe|r0Jo»)—/И»
сравнивается с Wetli, заключается в том, что имеет смысл сравни-
сравнивать составляющую B.97) от ?-й компоненты эталонной переменной
в среднем значении квадрата ошибки слежения с составляющей
в отсутствие управления, т. е. при T(s) = 0. Эта последняя сос-
составляющая определяется выражением
И We, U V- ~B-")
Нормированную функцию {[Т(—/со)—7]г We[T(ja) — Л}гг/
eiii будем рассматривать как разностную функцию i-ro звена.
В случае скалярных входной и выходной переменных эта функ-
функция равна \T(j(o)— 1|2.
Расширим теперь принцип проектирования 2.2А следующим
образэи.
Припцип проектирования 2.2Б. Пусть T(s) есть т X т-матрич-
т-матричная передаточная функция асимптотически устойчивой линейной
Анализ линейных Систем управления 185
системы управления с постоянными параметрами, для которой
как постоянная, так и переменная части эталонной переменной
имеют некоррелированные компоненты. Тогда для обеспечения
малого установившегося значения среднего квадрата ошибки сле-
слежения полоса частот каждого из т звеньев должна содержать по
возможности большую часть полосы частот соответствующей ком-
компоненты эталонного сигнала. Если i-я компонента, i =1,2,
..., т, эталонной переменной имеет ненулевую заданную рабочую
точку, значение {[T(Q) — I]T We[T(O) — 1]}ц должно быть сде-
сделано малым по сравнению с Weia.
Уточняя это правило, можно' показать, чтб если составляющая
выражения Се т, от какого-либо одного члена в выражении B.95)
много больше, чем составляющая от остальных членов, то ука-
указанный принцип проектирования должен быть применен в большей
степени к соответствующему звену, чем к другим звеньям.
Имея в виду допущения 1 и 2, имеет смысл предположить, что
весовая матрица We диагональная, т. е.~~
We = uiag(Wen,We<22,..,,We_mm). B.100)
Тогда можно написать
[Г(/со)-/]}„ =
e i
m
= ^\{T(M~I}n\2Wei[n « = 1.2 то. B.101)
/=i
где {T(j(u)— 1}п обозначает (I, i)-& элемент матрицы ТЦа) — /.
Отсюда видно, что полоса частот i-го звена определяется i-ьтм
столбцом передаточной функции T(s).
Легко заметить, особенно в случае, когда матрица We диаго-
диагональная, что принцип проектирования требует от элементов
частотной характеристики Г(/со), чтобы они были близки к 1 в со-
соответствующей полосе частот, тогда как недиагональные элементы
должны быть достаточно малыми. Если все недиагональные эле-
элементы матрицы Т(](й) равны нулю, т. е. матрица T(j(o) диагональ-
диагональная, говорят, что система управления является полностью раз-
развязанной. О системе, не полностью развязанной, говорят, что она
испытывает взаимовлияние. Хорошо спроектированная система
характеризуется малым взаимовлиянием. Систему управления,
у которой матрица 7"@) диагональная, будем называть статичес-
статически развязанной.
В заключение рассмотрим установившееся среднее значение
квадрата входной переменной. Если компоненты эталонной пе-
переменной не коррелированы (допущения 1 и 2), то можно напи-
написать
186 Глава 2
2 f
2 f Si(co){лгГ(~^)w«N^]"df' B-102)
l—\ — 00
где {Лгг(—/a>)FFuiV(;cu)}H — i-й диагональный. элемент матрицы
NT (—7u))WuiVGCu). Отсюда непосредственно вытекает следующий
принцип проектирования.
Принцип проектирования 2.3А. Для получения малого установив-
установившегося среднего значения квадрата входной переменной в асимпто-
асимптотически устойчивой линейной системе управления с постоянными
параметрами и т-мерной эталонной переменной с некоррелирован-
некоррелированными компонентами необходимо, чтобы выражение
{NT(-jd)WuN{^))ti B.103)
принимало малые значения в полосе частот i-u компоненты эта-
эталонной переменной при i =1,2, ..., т.
Снова, как и в принципе 2.3, не накладывается специальных
ограничений на выражение {NT @)WuN@)}u, даже если у i-й ком-
компоненты эталонной переменной может быть ненулевая заданная
точка, поскольку необходимо ограничивать флуктуации только
относительно заданной точки.
Пример 2.8. Управление смесительным бакам
Поставим задачу управления смесительным баком, описанным
в примере 2.2 (разд. 2.2.2). Линеаризованное уравнение состоя-
состояния, полученное в примере 1.2 (разд. 1.2.3), имеет вид
W) + ( W). B.Ю4)
0 —0,02,/ W 4-0,25 0,75/ W V '
В качестве компонент управляемой переменной z(t) выберем
расход и концентрацию выходного потока, поэтому напишем
Таким образом, компонентами эталонной переменной r(t) яв-
являются pi@ ира(О — желаемые выходной расход и выходная кон-
концентрация соответственно.
Рассмотрим следующий простой регулятор. Если выходной
расход слишком мал, будем регулировать расход потока 1 пропор-
пропорционально разности между действительным и желаемым расхо-
Анализ линейных систем управления 187
дами; таким образом, положим
МО = *,№,(*)-<:. (*н, B-106)
Однако, если выходная концентрация отличается от желаемо-
желаемого значения, расход потока 2 регулируется следующим образом:
МО = *2[Р2(<)-С2(*)]- B.Ю7)
На рис. 2.20 показана блок-схема системы управления. Ожи-
Ожидается, что эта схема окажется работоспособной, так как поток
2 имеет более высокую концентрацию, чем поток 1; таким образом,
концентрация более чувствительна к регулированию второго
потока. В результате, расходом первого потока более удобно ре-
регулировать выходной расход. Однако, поскольку расход второго
потока также воздействует на выходной расход, а расход первого
потока — на его концентрацию, в этой схеме неизбежным оказы-
оказывается определенное взаимовлияние.
В рассматриваемой схеме управления матричные передаточные
функции, указанные на рис. 2.14, могут быть представлены в
виде
О,Of 0,01
, s + 0,01 s-j-0,01 ,
K(s) = H(s) = \ ^ ^ , B.108)
— 0,25 0,75
s+0,02 s + 0,02
\д к2
В примере 1.17 (разд. 1.5.4) было найдено, что характеристи-
характеристический полином замкнутой системы имеет вид
Фс (S) = s2 + s @,01 к{ + 0,75 к2 + 0,03) + @,0002 кх +
+ 0,0075 к2 + 0,01 ki К + 0,0002), B.109)
откуда следует, что замкнутая система асимптотически устойчива
для всех положительных значений коэффициентов./ct и /с2.
Передаточная функция системы может быть представлена с
помощью выражения
Т (s) = К (s) [/ + G (s) H (s)] P (s) =
W.01 Ms + *2 + 0,02) 0,01/c2(s +0,02) \
,(*)(— 0,25 ^ (s + 0,01) к2 @,75s + 0,01 fc, + I
+ 0,0075)/
Г"
Эталонное значение расхода
Р, Ш
Эталонное значение концентрации
Коэффициент |
усиления
ОН
юн
Входной расход 1
Коэффициент
усиления
| Регулятор
Л
Входной расход Z
ИгШ
Объект
Выходной расход
Выходная концентрация
Рис. 2.20. Схема замкнутой системы управления смесительным баком.
Анализ линейных систем управления • 189
В результате получим
T(s) -I =
/—[s2+s@,75fc2+0,03) + 0,01 к2 (s + 0,02)
1 j +0,0075Л2+0,0002]
~" Фс (s) I — 0,25 Art (s + 0,01) —[s2+«@,01^+0,03)+
\ + 0,0002 ft, + 0,0002]
B.111)"
Нетрудно видеть, что, если /ct и к2 одновременно устремляются
к бесконечности, выражение T(s) — / стремится к нулю и обеспе-
обеспечивается слежение, близкое к идеальному.
Матричная передаточная функция N(s) может быть найдена
в виде
/Ar1[s2+s@,75/c2+0,03)+ — 0,01 к,. k2 (s + 0,02)
= 1 j + O,O075fc2 + 0,0002]
~~ 4c W I 0,25 lah (s + 0,01) /c2[s2+s@,01/c1+0,03) +
\ + 0.0Q02/CJ+0,0002]
B.112)
Если ki и к2 одновременно приближаются к бесконечности,
то
75 (. + 0,01) -.(. + 0,02)N
25 (s +0,01) 5 + 0,02 ) У '
откуда следует, что установившееся среднее значение квадрата
входной переменной Сиаа будет бесконечно большим, если элемен-
элементы матрицы 2Дсо) уменьшаются не достаточно быстро с уве-
увеличением со.
Чтобы найти приемлемые значения коэффициентов /ct и к2,
применим принцип проектирования 2.2Б и попытаемся определить
Такие значения -fet и к2, при которых полосы частот двух звеньев
системы содержат полосы частот эталонной переменной. Однако
это является сложной задачей, и для решения ее используем
метод проб и ошибок, который является типичным методом ре-
решения задач управления в многомерных системах. Этот подход
заключается в следующем. При определении к{ допускаем, что
вторая обратная связь еще не подключена. Аналогично при опре-
определении к2 допускаем, что первая обратная связь разомкнута. Та-
Таким образом, получены две системы с одномерными входной и вы-
выходной переменными, для которых решение задачи синтеза упро-
упрощается. Затем анализируется система управления с обеими об-
190 Глава 2
ратными связями, и, если необходимо, процесс проектирования
повторяется.
Если размыкается вторая обратная связь, то передаточная функ-
функция от первой входной переменной до первой управляемой пе-
переменной равна
HH(s)= °'01 . B.114)
11 w s + 0,01
Пропорциональная обратная связь, согласно B.106), дает
передаточную функцию от р i(t) до Ci(?) в виде
Очевидно, что частотная характеристика в нуле отличается от
1; это можно исправить включением коэффициента /i в цепи пер-
первой компоненты эталонной переменной следующим образом:
Jh(«) = A1l/lPl(O-C1(t)]. B.116)
Тогда передаточная функция B.115) приводится к виду
0,01 А^Д
+0,01
B.117)
Для каждого значения ki можно выбрать такое /4, что частот-
частотная характеристика в нуле будет равна 1. Теперь значение &J за-
зависит только от желаемой частоты среза. При &j = 10 10%-ная
частота среза равна 0,011 рад/с (табл. 2.1). Допустим, что этого
достаточно для удовлетворения требований, предъявляемых к_
системе управления. Тогда для fi должно быть выбрано значение
1.1.
Изучая аналогичным образом второе звено, можно найти, что
при управлении
M') = M/2P2(*)-C2(')] B-118)
передаточная функция замкнутой системы от р 2(t) до Сг(О (в пред-
предположении, что первая обратная связь разомкнута) равна
s + 0,75 /c2 + 0,02
При к2 = 0,1 и /2 = 1,267 частотная характеристика в нуле
равна 1, а 10%-ная частота среза составляет 0,0095 рад/с.
Исследуем теперь работу многомерной системы управления,
где
• °W10 ° ) B.120)
,0 v lo од/
Анализ линейных систем управления 191
П -kt 1 10 0 1967'- BЛ21)
Можно показать, что передаточная функция системы управ-
управления равна
ТО- 1 / 0,11s 4- 0,0132 0,001267s+0,00002534 \
(s> ~ S2+O,2O5S+O,O1295( —2,75s—0,0275 0,09502s + 0,01362 J '
B.122)
тогда
T (s) — / = X
v ' s» + 0,205s+ 0,01295
s2 — 0,095s 4- 0,00025 0,001267s 4- 0,00002534 \ .
¦2,75s—0,0275 — s2 — O.HOOs+0,00067/
Теперь, чтобы определить полосы частот двух звеньев системы
управления, сначала необходимо выбрать весовую матрицу We.
Двумя управляемыми переменными являются выходной расход и
выходная концентрация. Расход имеет постоянное номинальное
значение 0,02 м*/с, тогда как постоянное номинальное значение
концентрации равно 1,25 кмоль/м8. Поэтому 10%-ное изменение
расхода соответствует 0,002 м*/с, а 10%-ное изменение концентра-
концентрации ~0,1 кмоль/м3. Предположим теперь, что весовая матрица
We диагональная с элементами We>i и И^2, а 10%-ные изменения
в расходе либо в концентрации дают одинаковые составляющие
среднего значения квадрата ошибки слежения. Тогда получаем
Wel = 0,l2We2, B.124)
или
W
-i-i- = 2500. B.125)
Поэтому выберем
FPe=diagE0, 0,02). B.126)
Поскольку матрица We диагональная, можно использовать вы-
выражение B.101) для определения полосы частот ?-го эвена. По-
Полоса частот первого звена (цепи расхода), таким образом, опреде-
определяется из рассмотрения неравенства
50
О»J + 0,095(/ш) — 0,00025 я
(;о)J-|-0,205 (;<о) + 0,01295
4- 0 02 I 2,75 (/<¦>)+0.0275
О»J +.0,205 (/ш) + 0,01295
50е2. B.127)
192 Глава 2
После преобразований получим
|0'<о)а + 0,095 (/о) - 0,00025 1' + 0,00041 2,75 (fo) + 0,02751»
+0,205
,01295 | 2
„
На рис. 2.21 показан график логарифмической частотной ха-
характеристики для левой части неравенства B.128), что точно со-
соответствует разностной функции первого звена. Очевидно, что ве-
Рис. 2.21. Разностные функции первого и второго звеньев системы управле-
управления смесительным баком.
личина е не может быть выбрана произвольно малой, поскольку
левая часть неравенства B.128) ограничена снизу. Горизон-
Горизонтальная часть кривой в области низких частот главным образом
обусловлена вторым членом числителя левой части неравенства
B.128), который образуется из недиагонального элемента в пер-
первом столбце матрицы T(ja) — /. Этот элемент характеризует
часть взаимовлияния, существующего в системе.
Рассмотрим теперь второе звено (цепь концентрации). Его
полоса частот определяется из неравенства
50
0,001267 (/с*) + 0,00002534
+ 0,02
J + 0,205 (;о>) + 0,01295
(j<oJ _{_ 0,1100 (}а>) — 0,00067
¦<0,02ва. B.129)
(/«>)* + 0,205 (Н + 0,01295
После преобразований получим
| (;и>J + о,цоо (/<¦>)"— 0,00067 I2 + 2500 | 0,001267 (/<о) +0,0000253412
205 (/о
0,01295 |
B.130)
Анализ линейных систем управления
193
0,002
5
t, с
50
0,1
«Si
tew
Р
I
Г
t,c
50
Рис. 2.22. Матрица реакций на ступенчатое воздействие системы управления
смесительным баком.
Слева — реакции выходного расхода и концентрации на ступенчатое изменение расхода
0,002 ы?[с; справа — реакции выходного расхода и концентрации на ступенчатое измене-
изменение концентрации 0,1 нмоль/м1.
Логарифмическая частотная характеристика, соответствующая
левой части неравенства B.130), которая является разностной
функцией второго звена, также показана на рис. 2.21. В этом слу-
случае горизонтальная часть кривой в области низких частот также
обусловлена взаимовлиянием в системе. Если требования к е
не слишком жесткие, то значение частоты среза второго звена сос-
составляет ~0,01 рад/с.
Полученные частоты среза с приемлемой точностью близки к
10%-ным частотам среза отдельных контуров @,011 и 0,0095 рад/с).
Более того, оказывается, что взаимовлияние в системе невелико.
В заключение на рис. 2.22 представлены графики элементов мат-
матрицы переходных функций. Графики подтверждают, что система
обнаруживает умеренное взаимовлияние (и динамическое, и ста-
статическое). Каждое звено имеет переходную функцию системы пер-
первого порядка с постоянной времени, приблизительно равной 10 с.
Грубое представление об амплитуде входной переменной может
быть получено следующим образом. Из выражения B.116) на-
находим, что ступенчатое изменение расхода на 0,002 м3/с (типовая
194 Глава 2
величина) приводит в результате к изменению начального расхода
потока 1 на kjl-0,002 =0,022 м^с. Аналогично ступенчатое
изменение концентрации на 0,1 кмоль/м3 приводит в результате
к изменению начального расхода потока 2 на к^-О,! =0,01267
м3/с. В сравнении с номинальными величинами расходов входящих
потоков (соответственно 0,015 и 0,005 м3/с) эти величины слишком
большие, откуда следует, что либо должна быть выбрана меньшая
амплитуда скачка входной переменной, либо должна быть более
плавной желаемая переходная характеристика. Последнее можно
обеспечить, проектируя систему с меньшей полосой пропускания.
В задаче 2.2 рассматривается более сложный вариант регуля-
регулятора смесительного бака.
2.6. Анализ переходных процессов
в следящих системах
В предыдущем разделе подробно обсуждались свойства сле-
следящих систем в установившемся состоянии. Данный раздел содер-
содержит исследование поведения следящих систем в переходном про-
процессе, в частности исследование поведения среднего значения
квадрата ошибки слежения и среднего значения квадрата
входной переменной. Определим время установления опреде-
определенного процесса (среднего значения квадрата ошибки слежения,
среднего значения квадрата входной переменной или какой-
либо другой переменной) как время, в течение которого пере-
переменная достигает установившегося значения в пределах заданной
точности. Если эта точность равна, скажем, 1 % максимального
отклонения от установившегося значения, то говорят об 1%-ном
времени установления. Для других значений используется ана-
аналогичная терминология.
Обычно в момент начала работы системы управления началь-
начальная ошибка слежения и соответственно начальное значение вход-
входного сигнала бывают большими. Очевидно, желательно, чтобы
среднее значение квадрата ошибки слежения достигало своего
установившегося значения как можно быстрее после включения
системы. Таким образом, сформулируем следующую рекоменда-
рекомендацию.
Принцип проектирования 2.4. Система управления должна быть
спроектирована так, чтобы время установления среднего значе?
ния квадрата ошибки слежения было по возможности малым.
Как было показано в разд. 2.5.1, среднее значение квадрата
ошибки слежения, соответствующее эталонной переменной, сос-
состоит из двух составляющих, одна из которых обусловлена пос-
постоянной частью эталонной переменной, а другая — ее переменной
Анализ линейных систем управления 195
частью. Поведение составляющей от переменной части в переход-
переходном режиме должно быть найдено из решения (довольно трудоем-
трудоемкого) матричного дифференциального уравнения относительно
матрицы дисперсий состояния системы управления. Поведение
в переходном режиме составляющей от постоянной части найти
намного проще; это можно сделать, вычислив реакцию системы
управления иэ ненулевых начальных условий и на ступенчатое
изменение эталонной переменной. Как правило, вычисление этих
реакций дает очень хорошее представление о поведении системы
управления в переходном режиме.
Для асимптотически устойчивых линейных систем управления
с постоянными параметрами некоторая информация относительно
времени установления часто может быть получена из расположе-
расположения полюсов замкнутой системы. Это следует из того факта, что
все реакции представляют собой экспоненциально демпфированные
движения с постоянными времени, которые являются отрицатель-
отрицательными обратными величинами действительных частей характерис-
характеристических чисел замкнутой системы. Поскольку 1 %-ное время уста-
установления процесса
<Гг/\ г>0, B.131)
равно 4,69', граница для 1%-ного времени установления ts какой-
либо переменной определяется неравенством
ts< 4,6max( i—) , , B.132)
t 11 Re (A;) | J ' У '
где %г, i = 1, 2, ..., n,— характеристические числа замкнутой
системы. Заметим, что для квадратпических переменных, таких, как
среднее значение квадрата ошибки слежения и среднее значение
квадрата входной переменной, время установления равно поло-
половине времени установления самой переменной.
Определение границы с помощью выражения B.132) иногда
может ввести в заблуждение, поскольку всегда может случиться,
что реакция данной переменной не зависит от некоторых харак-
характеристических чисел. Позднее (разд. 3.8) рассматривается случай,
где время установления среднеквадратической ошибки слежения
определяется самыми отдаленными от начала координат полюсами
замкнутой системы, а не близкими полюсами, тогда как время уста-
установления среднеквадратического значения входной переменной
зависит лишь от близких Полюсов замкнутой системы.
Пример 2.9. Время установления ошибки слежения в системе
управления положением
Рассмотрим систему управления положением с вариантом I
регулятора из примера 2.4-(разд. 2.3). Из анализа установивше-
установившегося состояния в примере 2.7 (разд. 2.5.2) найдено, что с увели-
196 Глава 2
чением коэффициента А установившаяся среднеквадратическая
ошибка слежения продолжает уменьшаться, хотя увеличение
этого коэффициента выше 15—25 В/рад приводит лишь к очень
небольшому улучшению среднеквадратической ошибки слежения,
тогда как среднеквадратическое значение входного напряжения
непрерывно возрастает. Рассмотрим теперь время установления
ошибки слежения. На рис. 2.23 представлена реакция управляе-
100
Рис. 2.23. Реакции системы управле-
управления положением (вариант I) на сту-
ступенчатое изменение 0,1 рад эталон-
эталонной переменной для различных зна-
значений коэффициента Я,.
мой переменной из нулевых начальных условий для различных
значений % на ступенчатое изменение эталонной переменной. Оче-
Очевидно, что время установления реакции на ступенчатое воздей-
воздействие (в данном случае ошибки слежения) сначала быстро умень-
уменьшается с ростом А, но затем после значения К ~15 В/рад почти не
уменьшается из-за усиливающихся колебаний реакции. В этом
случае оказывается, что самое подходящее значение X находится
около 15 В/рад, что соответствует параметру демпфирования
С «0,7 (пример 2.7). Из графика |Г(/©)| на рис. 2.18 Ьидим, что
при этом значении коэффициента получается самая, большая
полоса пропускания, а нежелательный пик частотной характерис-
характеристики отсутствует.
2.7. Влияние возмущений
в скалярном случае
В разд. 2.3 указывалось, что система управления часто подвер-
подвергается воздействию возмущений, в результате чего ухудшаются
показатели качества слежения. В данном разделе устанавливают-
устанавливаются выражения, определяющие возрастание установившихся сред-
средних значений квадрата, ошибки слежения и квадрата входной пе-
переменной за счет действия возмущений, и формулируются прин-
Анализ линейных систем управления 197
ципы проектирования, которыми можно руководствоваться при
проектировании систем управления, способных противодейство-
противодействовать возмущениям.
Для данного раздела принимаются следующие допущения.
1. Возмущающая переменная vp(t) является стохастическим
процессом, который не коррелирован с эталонной переменной
r(t) и шумом наблюдений vm(t).
Это позволяет определить возрастание значения среднего квад-
квадрата ошибки слежения ^ среднего значения квадрата входной
перемепиой, положив r(t) и vm(t) равными нулю.
2. Управляемая переменная является также наблюдаемой пе-
переменной, т.е. С =D.
Это означает, что можно написать
y{t) = z(t) + vm(t), B.133)
и что в случае постоянных параметров
= K(s). B.134)
Допущение о том, что управляемая переменная является также
наблюдаемой переменной, вполне правомерно, так как интуитив-
интуитивно ясно, что обратная связь является наиболее эффективной, если
она осуществляется по самой управляемой переменной.
3. Система управления является асимптотически устойчивой
и имеет постоянные параметры.
4. Входная и управляемая переменные и, следовательно, эта-
эталонная переменная являются скалярными, а весовые матрицы We
и Wu равны 1.
Выводы данного раздела могут быть распространены на слу-
случай многомерных систем; такие обобщения приводятся в конце
настоящего и последующего разделов.
5. Возмущающая переменная v (t) может быть записана в
виде
МО^о + ^рЛО. BЛ35>
где постоянная часть v^ возмущающей переменной является сто-
стохастическим вектором с заданной матрицей вторых моментов, а
переменная часть vpv (t) возмущающей переменной является стацио-
стационарным в широком смысле некоррелированным с VpQ стохастичес-
стохастическим процессом с нулевым средним и матрицей спектральных плот-
плотностей энергии Hvp(a>).
Матричная передаточная функция от возмущающей переменной
v-p(t) до управляемой переменной z(t) может быть найдена из сле-
следующего соотношения (рис. 2.24):
Z(s) = -H(S)G(s)Z(s) + D(sr-A)-*Vp(s), B.136)
198 Глава 2
где Z(s) и Vp (s) обозначают преобразования Лапласа переменных
z(t) и vp(t) соответственно; отсюда
"Z(*) = D (si — А)-*\ D(s). B.137)
w 1 + Я (s) G (s) . v ' "w v 7
Здесь использован тот факт, что управляемая переменная яв-
является скалярной, поэтому величина 1 + H(s)G(s) также является
скалярной функцией. Введем функцию
g /s\ \ B 138)
Рис. 2.24. Блок-схема матричной передаточной функции замкнутой системы
управления при наличии приложенного к объекту возмущения Ур.
которую назовем функцией чувствительности системы управле-
управления; смысл ее объясняется позднее.
Вычислим составляющую от возмущающей переменной в уста-
установившемся среднем значении квадрата ошибки слежения как
сумму двух членов, первый из которых обусловлен постоянной
частью, а второй — переменной частью возмущений. Поскольку
Z(s) = S (s) D {sI — A^Vpls), B.139)
установившаяся реакция управляемой переменной от постоянной
части возмущений определяется следующим образом:
lim z(t) = S @) D (— A)-1 Vpo = S @) v,
oo-
B.140)
Здесь предполагается, что Матрица А неособая (случай, когда
А — особая матрица, рассматривается в задаче 2.12.4), а также
использовано обозначение
vw = D{-A)-iV[A. B.141)
В результате из B.140) следует, что составляющая от постоян-
Анализ линейных систем управления
199
ной части возмущении в установившемся среднем значении квад-
квадрата ошибки слежения равна
Я{ | S @) »оо|«> = | S @)l*Vo , B.142)
где Fo — момент второго порядка величины у00, т. е. Fo = #{i>ooa}.
На основании методов разд. 1.10.3 и 1.10.4 из B.139) следует, что
составляющая от переменной части возмущений в установившемся
среднем значении квадрата ошибки слежения может быть выраже-
выражена в виде
S (/ш)
D (/to/ — A)~l V (<o) (— /со/ — Ат У1 DT df =
B.143)
Здесь принято обозначение
Следовательно, увеличение установившегося среднего значе-
значения квадрата ошибки слежения от действия возмущений опреде-
определяется выражением
С т (с возмущением) — С (без возмущения) =
B.145)
Перед обсуждением задачи о том, как сделать это выражение
малым, рассмотрим его более подробно. Пусть имеет место ситуа-
ситуация, показанная на рис. 2.25, где переменная vo(t) действует на
Объект
G(s)
Рис. 2.25. Блок-схема матричной передаточной функции замкнутой системы-
управления при наличии эквивалентного возмущения vo управляемой пере-
переменной.
200 Глава 2
замкнутую систему. Эта переменная добавляется к управляемой
переменной. Нетрудно установить, что при нулевых начальных
условиях и нулевой эталонной переменной преобразование Лап-
Лапласа управляемой переменной определяется в виде '
Z(*) = S(*)Ve», B.146)
где V0(s) обозначает преобразование Лапласа переменной vo(t).
Отсюда непосредственно следует, что, если vo(t) — стохастический
процесс, постоянная часть которого является стохастической ве-
величиной с моментом второго порядка Fo, а переменная часть —
стационарным в широком смысле стохастическим процессом с ну-
нулевым средним и спектральной плотностью энергии 2„о(со), уве-
увеличение установившегося среднего значения квадрата ошибки сле-
слежения точно определяется выражением B.145). Поэтому назовем
процесс vo(t) с такими свойствами эквивалентным возмущением-
управляемой переменной.
Исследование B.145) приводит к следующему правилу проек-
проектирования.
Принцип проектирования 2.5. Чтобы уменьшить прирост ус-
установившегося среднего значения квадрата ошибки слежения, обус-
обусловленный возмущениями, в асимптотически устойчивой линейной
системе управления с постоянными параметрами и скалярной
управляемой переменной, которая является также наблюдае-
наблюдаемой переменной, абсолютное значение функции чувствительнос-
чувствительности S (]<?>) нужно сделать малым в полосе частот эквивалентного
возмущения управляемой переменной. Если особое внимание уде-
уделяется устранению постоянных ошибок, то S@) должно быть сде-
сделано малым, предпочтительно нулевым.
Последнее утверждение данного правила проектирования не
является справедливым без допущения о том, что матрица А
объекта является леособой; этот случай обсуждается в задаче
2.12.4. Заметим, что, поскольку S(/c°) определяется выражением
S (/со) = , B.147)
малое значение SQw) обычно достигается при большом коэффи-
коэффициенте усиления1 цепи H(ja>)G(J<a) системы управления в соответ-
соответствующем диапазоне частот. Это противоречит принципу проек-
проектирования 2.1, относящемуся к устойчивости системы управления
(пример 2.5, разд. 2.4). Следовательно, должен быть найден
компромисс.
Уменьшение, постоянных ошибок представляет' собой задачу
особой важности в системах регулирования и слежения, где за-
заданная точка управляемой переменной должна выдерживаться с
1 Имеется в виду динамический коэффициент усиления.— Прим. перев.
Анализ линейных систем управления 201
большой точностью. Постоянные возмущения часто возникают^
системах управления, особенно из-за ошибок, сделанных при уста-
установлении номинального входного сигнала. Постоянные ошибки
могут быть полностью ликвидированы при S@) = 0, что обычно
достигается введением интегрирующего действия регулятора,
т. е. установлением в передаточной функции регулятора G(s) по-
полюса в начале координат (см. задачу 2.3).
Займемся рассмотрением установившегося среднего значения
квадрата входной переменной. Нетрудно найти, что в терминах
преобразования Лапласа можно написать (рис. 2.24)
U(s) = =^ DisI—A^V.is), B.148)
i + H(s)G(s) V ; pK V '
где U(s) преобразование Лапласа переменной u(t). Отсюда следует,
что увеличение установившегося среднего значения квадрата
входной переменной, используя введенные в данном разделе
обозначения, можно представить в следующем виде:
Сиса (с возмущениями) — Сисо (без возмущений) =
6@)
1 + Н @) G @)
fl ^ 2S (»)d/. B.149)
J I 1 + Д (/<o) G (/«.) AiOv ^
Это выражение позволяет сформулировать следующую реко-
рекомендацию.
Принцип проектирования 2.6. Чтобы получить малый прирост
установившегося среднего значения квадрата входной переменной,
обусловленного возмущениями, в асимптотически устойчивой линей-
линейной системе управления с постоянными параметрами и скалярной
управляемой переменной, которая является и наблюдаемой пере-
переменной, и скалярной входной переменной, необходимо, чтобы вы-
выражение
G (/<-)
1 + Н (/<¦>) G (/а.)
B.150)
принимало малые значения в полосе частот эквивалентного возму-
возмущения управляемой переменной.
В этой рекомендации не уделяется внимания постоянной части
входной переменной, поскольку, как предполагалось при обсуж-
обсуждении принципа 2.3, объект должен обладать способностью вы-
выдерживать эти постоянные отклонения.
Принцип проектирования 2.6 противоречит принципу 2.5.
Увеличение коэффициента усиления цепи H(j(a)G(ja>), как требует
принцип проектирования 2.5, обычно приводит к малым значе-
значениям выражения B.150). Здесь снова должен быть найден компро-
компромисс.
202 Глава 2
Пример 2.10. Влияние возмущений на систему управления поло-
положением
В этом примере исследуется влияние возмущений на вариант I
системы управления положением из примера 2.4 (разд. 2.3). Не-
Нетрудно найти, что функция чувствительности системы управления
определяется выражением
S(s) =
S2
B.151)
На рис. 2.26 представлены логарифмические характеристики
I)! при некоторых значениях коэффициента X. Очевидно,
что при больших значениях % полоса частот, в которой подавляют-
IU
,. 1
0,1
0,01
nnm
0,1 %^^^^
fc~^-— ы.радк
Рис. 2.26. Логарифмические частотные характеристики функции чувствитель-
чувствительности системы управления положением (вариант I) при различных значениях
коэффициента X.
ся возмущения, также становится шире. Если, однако, эквивалент-
эквивалентное возмущение управляемой переменной имеет большую энергию
вблизи частоты, соответствующей пику характеристики ^(/са)],
то можно рекомендовать меньшее значение коэффициента.
В примере 2.4 предполагалось, что возмущение представляет
собой возмущающий момент %d(t), приложенный к валу двига-
двигателя. Если переменная часть этого возмущающего момента имеет
функцию спектральной плотности 2rd (со), то переменная часть
эквивалентного возмущения управляемой переменной имеет
функцию спектральной плотности
a)
B.152)
Спектральная плотность составляющей от возмущающего мо-
момента в управляемой переменной находится умножением B.152)
на |5(/оо)|2 и, таким образом, равна
Анализ линейных систем управления 203
V
(ш). B.153)
Предположим, что переменная часть возмущающего момента
может быть представлена как экспоненциально коррелированный
шум со среднеквадратическим значением ard и постоянной време-
времени Trd, так что
V (со) = ЧлТ'й , B.154)
Прирост установившегося среднего значения квадрата ошибки
слежения, обусловленный возмущающим моментом, может быть
вычислен интегрированием B.153) или путем моделирования воз-
возмущения, т. е. расширением состояния дифференциальной системы
и решением уравнения относительно матрицы установившихся дис-
дисперсий расширенного состояния. Тем или другим способом на-
находим
Сесо (с возмущающим моментом)—Се да (без возмущающего
Отсюда видим, что слагаемое в Сею, обусловленное возмуще-
возмущением, монотонно убывает до нуля при увеличении "К. Таким обра-
образом, чем больше %, тем в меньшей степени возмущающий момент
оказывает влияние на точностные свойства.
В отсутствие эталонной переменной имеем \i(f) =—\i\(t),
так что прирост среднего значения квадрата входного напряже-
напряжения, обусловленный возмущающим моментом, в X2 раз больше
прироста среднего значения квадрата ошибки слежения
Си ot (с возмущающим моментом) — Са т (без возмущающего
момента) = -—5— ' °1* • B.156)
l + aTrd-\- %XT2rd <rx. rd \
При X -*¦ со величина Саоа монотонно возрастает до значения
д + ^Н2 дЗ B.157)
Из B.25) нетрудно найти, что постоянный возмущающий момент
То приводит к установившемуся отклонению управляемой пере-
переменной на. величину
-12L. B.158)
204 Глава 2
Очевидно, что при достаточно большом коэффициенте X это
отклонение может быть сделано как-угодно малым.
2.8. Влияние шума наблюдений
в скалярном случае
В любой замкнутой системе в некоторой степени ощущается
влияние шума наблюдений. В настоящем разделе анализируется
составляющая от шума наблюдений в среднем значении квадрата
ошибки слежения и среднем значении квадрата входной перемен-
переменной. В данном разделе принимаются следующие допущения.
1. Шум наблюдений vm(t) является стохастическим процессом,
некоррелированным с эталонной переменней r(t) и приложенным
к объекту возмущением vp(t).
Таким образом, приращения среднего значения квадрата ошиб-
ошибки слежения и среднего значения квадрата входной переменной,
обусловленные.шумом наблюдений, могут быть вычислены,-.если
положить r(t) и vp(t) равными нулю.
2. Управляемая переменная является также наблюдаемой пере-
переменной, т. е. С =2), так что
= z(t)+vm(t),
а в случае постоянных параметров
Я («) = *
B.159)
B.160)
3. Система управления является асимптотически устойчивой
и имеет постоянные параметры.
4. Входная и управляемая переменные и, следовательно, эталон-
эталонная переменная являются скалярными, а весовые матрицы We
и Wu равны 1.
Здесь также анализ может быть распространен на случай мно-
многомерных систем, однако это почти не дает дополнительной инфор-
информации.
Рис. 2.27. Блок-схема матричной передаточной функции замкнутой системы
управления при наличии шума наблюдений.
Анализ линейных систем управления ' 205
5. Шум наблюдений является стационарным в широком смысле
стохастическим процессом с нулевым средним и функцией спек-
спектральной плотности 2,ит(&).
На рис. 2.27 показана блок-схема системы, которая полу-
получается после принятия указанных допущений. В терминах пре-
преобразований Лапласа имеем
Z (s) = - Я (s) G (s) [Vm (s) + Z («)], B,161)
так что
Z(s) = g(s)G(s) -Vm(»). B.162)
w i + я (s) G (s) m W V '
Следовательно, прирост установившегося среднего значения
квадрата ошибки слежения, обусловленный шумом наблюдений,
может быть записан в виде
Се т (с шумом наблюдений) — Се т (без шума наблюдений) =
=, f _^M?i^I_2y {<a)dfm B.163)
J 1 + Я(,Ъ) G(/<o) ^JomV ' V ;
В связи с этим может быть сформулирован следующий принцип
проектирования.
Принцип проектирования 2.7. Чтобы уменьшить прирост устано-
установившегося среднего значения квадрата ошибки слежения, обуслов-
обусловленный шумом наблюдений в асимптотически устойчивой линей-
линейной системе управления, с постоянными параметрами, со скалярной
управляемой переменной, которая является также наблюдаемой
переменной, систему следует спроектировать так, чтобы значение
Н (Н G (/<¦>)
B.164)
1 + Я (/со) G (/со)
было малым в полосе частот шума наблюдений.
Очевидно, что этот принцип противоречит принципу 2.5, по-
поскольку- увеличение коэффициента усиления цепи H(i&)G(i(si),
как этого требует принцип 2.5, приводит к значению B.164),
близкому к 1, что означает появление в ошибке слежения неподав-
неподавленного шума наблюдений. Это происходит в результате того,
что в случае большого коэффициента усиления цепи H(Ja>)G(j а>)
вместо переменной z(t) за эталонной переменной следит сумма
переменных z(t) + vm(t).
Очевидно, что передаточная функция от шума наблюдений де
входной переменной объекта имеет вид
?i>Vm (s), B.165)
+ G(s)H(s)
206 Глава 2
откуда следует, что прирост установившегося среднего значения
квадрата входной переменной, обусловленный шумом наблюде-
наблюдений, равен
Сисо (с шумом наблюдений)—Са да (без шума наблюдений) —
B.166)
1 + G (/со) Я (jco)
СО
Это приводит к следующему правилу проектирования: чтобы
прирост установившегося среднего значения квадрата входной
переменной, обусловленный шумом наблюдений, был малым,
выражение
B.167)
должно принимать малые значения в полосе частот шума наблю-
наблюдений. Ясно, что это правило также противоречит принципу 2.5.
Пример 2.11. Система управления положением с единственной об-
обратной связью по положению
Рассмотрим снова систему управления положением из приме-
примера 2.4 (разд. 2.3) с предложенными иремя различными схемами
управления (варианты I — III). В примерах 2.7 (разд. 2.5.2.)
и 2.9 (разд. 2.6) был проанализирован вариант I и выбрано % —
= 15 В/рад как наилучшее значение этого коэффициента. В при-
примере 2.7 было найдено, что вариант II обеспечивает лучшие
показатели качества благодаря добавочной обратной связи по уг-
угловой скорости. Теперь, однако, предположим, что по некоторой
причине (финансовой или технической) тахогенератор не может
быть установлен. Тогда мы обращаемся к варианту III, в котором
предпринимается попытка приблизиться к варианту II, исполь-
используя приближенное дифференцирующее звено с постоянной време-
времени Td. Если шум наблюдений отсутствует, можно выбрать Тd =
= 0, и вариант III будет сведен к варианту II. Предположим, од-
однако, что имеется шум наблюдений и он может быть представлен
как экспоненциально коррелированный шум с постоянной време-
времени
Гт=0,02с B.168)
и среднеквадратическим значением
ст = 0,001 рад. B.169)
Наличие шума наблюдений вынуждает выбрать Td>0. Что-
Чтобы определить приемлемое значение Td, предположим сначала,
Анализ линейных систем управления
207
о), рад/с
1000
Рис. 2.28. Влияние величины Td на частотную характеристику системы управ-
управления положением (вариант III).
что Td оказывается достаточно малым, и поэтому коэффициенты
р и X могут быть выбраны в соответствии с вариантом II. Тогда
легко установить, насколько большим может быть выбрано Т(„
обеспечивающее достаточное подавление шума наблюдений без
ухудшения качества варианта II.
Нетрудно найти, что передаточная функция системы управле-
управления варианта III имеет вид
(?> + 1)
Td *3 + (*Td + 1) s2 + (a + xXTd +
-f Ь.
B.170)
Чтобы определить приемлемо малое значение Td, поступим
следующим образом. Замкнутая система варианта II причислен-
причисленных значениях параметров X и р, полученных в примере 2.7,
имеет собственную частоту со0, близкую к значению 20 рад/с, а
параметр демпфирования составляет ~0,707. Теперь, чтобы не
замедлять движение системы, постоянная времени Тd устройства
дифференцирования должна быть выбрана малой по отношению к
обратной величине собственной частоты, т. е. малой по сравнению
с 0,05 с. На рис. 2.28 представлены графики частотной характерис-
характеристики, соответствующие выражению B.170), для различных зна-
значений Тd. Видно, что при 7^=0,01 с частотная характеристика
почти не изменяется от приближенной операции дифференциро-
дифференцирования, а при 7^=0,1.0 наблюдается значительное отличие.
Рассмотрим влияние шума наблюдений. Моделируя vm(t)
обычным образом* из матрицы дисперсий расширенного состояния
208 Глава 2
можно вычислить добавочные части установившихся средних зна-
значений квадратов ошибки слежения и входной переменной. Числен-
Численные результаты графически изображены на риС. 2.29. Эти графики
показывают, что для малых Тd установившееся среднее значение
квадрата входной переменной в значительной степени увеличивает-
0.001Z
Рис. 2.29. Графики функций от Тd, равных квадратным корням из составляю-
составляющих в установившихся средних значениях квадратов ошибки слежения и
входного напряжения, обусловленных шумом наблюдений (вариант III сис-
системы управления положением).
ся. Приемлемое значение Td, видимо, находится около 0,01 с.
Для этого значения величина квадратного корня из прироста уста-
установившегося среднего значения квадрата входной переменной сос-
составляет только 2<В, величина квадратного корня из прироста уста-
установившегося среднего значения квадрата ошибки слежения 0,0008
рад является очень малой и частотная характеристика меняется
незначительно.
2.9. Влияние неопределенности
параметров объекта
в скалярном случае
Довольно часто при проектировании системы управления воз-
возникает ситуация, в которой разработчику точно не известны пара-
параметры объекта. На практике может также оказаться, что непрерыв-
непрерывное изменение параметров объекта и соответствующая настройка
регулятора представляются весьма трудоемкими.
Замкнутые регуляторы, как будет показано, могут быть спроек-
спроектированы так, что, несмотря на существенное различие между дей-
действительными параметрами объекта и номинальными значениями
Анализ линейных систем управления 209
{т. е. значениями параметров, принятыми при проектировании
регулятора), качество системы ухудшается весьма незначительно.
Далее исследуется прирост установившегося среднего значения
квадрата ошибки слежения, обусловленной отклонениями пара-
параметров.
В данном разделе приняты следующие допущения.
1. Система управления является асимптотически устойчивой
и имеет постоянные параметры.
2. Управляемая переменная является также наблюдаемой пе-
переменной, т.е. С — D, поэтому K(s) =H(s).
3. Входная и управляемая переменные, а следовательно, и
эталонная переменная являются скалярными, а весовые матрицы
We и Wu равны 1.
Обобщение на многомерный случай возможно, однако это прак-
практически не дает дополнительной информации.
4. Исследуется влияние изменений параметров только на ка-
качество слежения; характеристики подавления возмущений и шумов
не рассматриваются.
5. Эталонная переменная имеет как постоянную часть г0,
которая является стохастическим вектором с моментом второго
порядка Ro, так и переменную часть, которая является стацио-
стационарным в широком смысле стохастическим векторным процессом
с нулевым средним и спектральной плотностью И,г(<л).
Обозначим через H0(s) номинальную передаточную функцию
объекта, а через H^s) действительную передаточную функцию.
Аналогично обозначим через T0(s) — передаточную функцию сис-
системы управления с номинальной передаточной функцией объекта,
а через T^s) передаточную функцию с действительной передаточной
функцией объекта. Предположим, что. передаточная функция
G(s) в цепи обратной связи и передаточная функция P(s) в цепи эта-
эталонной переменной (см. блок-схему рис. 2.14, разд. 2.5.1) точно
известны и не подвергаются изменению.
Используя B.63), получим выражения для номинальной пере-
передаточной функции
TO(S)= д°(*>р(*> B.171)
oW 1 + G(S)#O(S) v '
и действительной передаточной функции
= H1(s)P(s) B 172)
1W l + G^ff^s)
Для действительной системы управления установившееся
среднее значение квадрата ошибки слежения равно
—аз
8—394
210 Глава 2
Найдем оценку прироста установившегося среднего значения
квадрата ошибки слежения, обусловленного изменением переда-
передаточной функции. Примем обозначение
B.174)
Подставляя 7\(s) =,T0(s) + AT(s) в B.173), получим
+ 2 [То @) -1] AT @) i?0 + 2 Re { j [Го (/ш) -
-1] AT (- уев) Sr И df) + | АГ @) |» Ro +
B-175)
Теперь предположим, что номинальная система управления
спроектирована хорошо, так что частотная характеристика T0(ja>)
очень близка к 1 в полосе частот эталонной переменной. В данном
случае можно пренебречь первыми четырьмя членами выражения
B.175), поэтому приближенно имеем
Се в ~ | АГ @) |2 Ra + f | AT (/'со) |2 2, И df. B.176)
—со
Эта аппроксимация предполагает, что
для всех © в полосе частот эталонной переменной.
Далее выразим AT(s) с помощью AH(s), где
В результате получим
B-177)
= Я1(в)— #0(s). B.178)
= fl" w *(s) = Si(s)AH(s)N0(s), B.179)
где
5i(S)=——^7Г 'B.180)
Анализ линейных систем управления 211
есть функция чувствительности действительной системы управ-
управления, а
?Ф B.181)
— передаточная функция номинальной системы от эталонной пе-
переменной г до входной переменной и. Теперь, используя аппрок-
аппроксимацию
в,(/в))~50(/а). B-182)
где
50(s) = -—-4-777 B-183)
1 + Я о (s) G (s)
есть функция чувствительности номинальной системы управления
(которая известна), запишем выражение для установившегося
среднего значения квадрата ошибки слежения
Cem~(Sa@)\*\AH@)N0@)\*R0-M
| So (/со) |2 | АЯ (/со) No (/со) |2 2, И d/. B.184)
Сформулируем следующий принцип проектирования.
Принцип проектирования 2.8. Рассмотрим асимптотически ус-
устойчивую линейную замкнутую систему управления с постоянными
параметрами и скалярной управляемой переменной, которая яв-
является также наблюдаемой переменной. Тогда для уменьшения
установившегося среднего значения квадрата ошибки слежения,
обусловленной вариацией AH(s) в передаточной функции объекта
H(s), необходимо, чтобы функция чувствительности системы уп-
управления S0(i&) была малой в полосе частот характеристики
\AH(j(u)N0(j<u)\2 2Г (<й). Если особую важность имеют постоянные
ошибки, значение S0@) должно быть, сделано малым (предпочти-
(предпочтительно нулевым) при значении AH(O)NO(O), отличном от нуля.
Этот принцип надо понимать следующим образом. Обычно пе-
передаточная функция объекта определяется из условия компромис-
компромисса между средним значением квадрата ошибки слежения и средним
значением квадрата входной переменной. Если выбрана T0(s),
то передаточная .функция N0(s) от эталонной переменной до вход-
входной переменной объекта является фиксированной. Заданные
T0(s) ж N0(s) могут быть реализованы различными путями, напри-
мер желаемую функцию T0(s) можно получить, если сначала выб-
выбрать передаточную функцию G(s) в цепи обратной связи, а затем
подстроить передаточную функцию P(s) в цепи эталонной пере-
8*
212 Глава 2
менной. Принцип проектирования 2.8 устанавливает, что эта реа-
реализация должна быть выбрана так, чтобы функция
50(/т)= - г- B.185)
1 + Я(/«)С(Н v
принимала малые значения в полосе частот функции \&H(ja>}
¦^o(/(B)l22r((o). Последняя функция известна, если имеются неко-
некоторые сведения о &H(j®), a T0(j(o) была найдена. Заметим, нто для
подавления влияния -возмущений в системе управления малые зна-
значения функции чувствительности 50(/со) также являются необхо-
необходимыми, что было установлено в разд. 2.7. Как было отмечено в
разд. 2.7, функция S0@) может быть приведена к нулю путем интег-
интегрирующего действия регулятора (задача 2.12.3).
Завершим данный раздел интерпретацией функции SJs).
Из B.171) и B.179) следует
^i?L = 5l(s)^?i?l B.186)
Г, («) W Яо (s)
Таким образом, функция 51(s) связывает относительное изме-
изменение передаточной функции объекта H(s) с получающимся вслед-
вследствие этого относительным изменением передаточной функции
системы управления T(s). Если амплитуда изменений передаточ-
передаточной функции объекта невелика, то можно считать S^ca) с^
~ iS0(/to). Эта интерпретация функции S0(s) является классичес-
классической и принадлежит Боде (см., например, [74]); S0(s) называется
функцией чувствительности замкнутой системы, поскольку она
дает информацию о чувствительности передаточной функции сис-
системы управления к изменениям передаточной функции объекта.
Пример 2.12. Влияние изменения параметров системы управления
положением
Проанализируем чувствительность к изменениям параметров
в варианте I системы управления положением (пример 2.4,
разд. 2.3). Функция чувствительности для этой системы опреде-
определяется выражением
Графики функции |?(/(о)| для различных значений коэффи-
коэффициента % были приведены на рис. 2.26. Очевидно, что при % =
= 15 В/рад (самое благоприятное значение коэффициента) подав-
подавление влияния изменений параметров обеспечивается при значе-
значениях до 3 рад/с. Для большей конкретности предположим, что
изменения параметров вызываются изменениями момента инер-
инерции /. Поскольку параметры объекта а и х определяются выра-
выражениями (пример 2.4)
Анализ линейных систем управления
213
в
~7
к
J
B.188)
нетрудно найти, что при малых изменениях Д/ параметра / мож-
можно написать
B.190)
есть передаточная функция объекта. -Отметим следующее.
1. При нулевой частоте независимо от значения Д/ имеем
Я@)
B.191)
Поскольку Г@) = 1, следовательно, ДГ@) = 0. Это означает, что
независимо от инерционной нагрузки реакция системы на изме-
изменение заданной точки всегда является правильной.
2. Из выражения B.189) видно, что функция со влияния изме-
изменения момента инерции на передаточную функцию объекта возрас-
0,1
1
Рис. 2.30. Влияние изменений парамет-
параметров на реакции системы управления
положением (вариант I) при ступенчатом
изменении эталонной переменной на
0,1 рад.
1 — номинальная инерционная нагрузка; 2 —
инерционная нагрузка, равная 1,3 номиналь-
номинальной; з — инерционная нагрузка, равная 0,7
номинальной.
t,c
тает до частоты срыва а = 4,6 рад/с и остается далее постоянной.
Из поведения функции чувствительности следует, что при низких
частотах (до 3 рад/с) влияние изменения момента инерции на пере-
передаточную функцию системы невелико, причем с уменьшением
частоты это влияние ослабляется.
Чтобы иллюстрировать чувствительность системы управления,
на рис. 2.30 показаны реакции замкнутой системы на ступенчатое
изменение эталонной переменной для случаев
-у- = 0; -0,3; +0,3.
B.192)
214 Глава 2
С учетом того, что ступенчатому сигналу соответствует довольно
большая полоса частот, система управления компенсирует изме-
изменение параметров вполне удовлетворительно.
2.10*. Разомкнутая установившаяся
эквивалентная схема управления
Потенциальные преимущества управления по замкнутой схеме
могут быть достаточно ясно освещены при сравнении замкнутых
Разомкнутый. .
регулятор Объе«т
Рис. 2.31. Разомкнутый уста-
установившийся эквивалент систе-
системы управления.
схем управления с их так называемыми разомкнутыми установив-
установившимися эквивалентами. Ниже мы рассмотрим такие эквивалент-
эквивалентные разомкнутые системы управления, при этом ограничимся слу-
случаем постоянных параметров.'
Рассмотрим замкнутую систему управления с постоянными па-
параметрами и обозначим матричную передаточную функцию от эта-
эталонной переменной г до входной переменной объекта и через
N(s). Для такой системы всегда можно построить разомкнутую
систему управления (рис. 2.31), которая имеет такую же матричную
передаточную функцию AT(s) от эталонной переменной г до входной
переменной объекта и. В результате передаточная функция как
замкнутой системы, так и вновь построенной разомкнутой системы
управления имеет вид
T(s) = K(s)N(s), B.193)
где K(s) — матричная передаточная функция объекта от входной
переменной объекта и до управляемой переменной z. По причинам,
которые будут объяснены ниже, назовем разомкнутую систему
установившимся эквивалентом данной замкнутой системы. В боль-
большинстве случаев оказывается, что разомкнутый установившийся
эквивалент является худшим, чем замкнутая система управления
Часто, однако, имеет смысл исследовать разомкнутый эквивалент
данной системы, поскольку он описывает некоторые свойства,
которые надо улучшить. Последовательно сравним замкнутые
системы управления и их разомкнутые эквиваленты по следующим
показателям качества систем управления: устойчивости, точ-
Анализ линейных систем управления 215
ностпи слежения в установившемся режиме, поведению в переходном
режиме, влиянию возмущений, приложенных к объекту, влиянию
шума наблюдений и чувствительности к изменениям объекта.
Рассмотрим сначала устойчивость. Мы сразу же обнаружим,
что характеристические числа эквивалентной разомкнутой систе-
системы управления состоят из характеристических чисел объекта, на-
наряду с характеристическими числами регулятора (ср. разд. 1.5.4).
Это означает, между прочим, что неустойчивый объект не может
быть стабилизирован разомкнутым регулятором. Поскольку
устойчивость является основным принципом проектирования, не
имеет смысла рассматривать разомкнутые эквиваленты, если объект
не является асимптотически устойчивым.
Предположим, что объект и разомкнутый эквивалент являются
асимптотически устойчивыми. Рассмотрим характеристики точно-
точности обеих систем управления в установившемся режиме. Поскольку
передаточные функции и матричные-передаточные функции от эта-
эталонной переменной до входной переменной объекта рассматривае-
рассматриваемых систем соответственно равны, их установившиеся средние зна-
значения квадратов ошибок слежения и установившиеся средние
значения квадратов входных переменных также равны. Это обстоя-
обстоятельство объясняет название «установившийся эквивалент». Оно
также означает, что с точки зрения качества слежениянетнеобхо-
слежениянетнеобходимости прибегать к управлению по замкнутому принципу.
Перейдем к рассмотрению свойств переходного процесса. По-
Поскольку среди характеристических чисел разомкнутой эквивалент-
эквивалентной системы управления находятся неизмененные характеристи-
характеристические числа объекта, очевидно, что улучшение свойств переходно-
переходного процесса не может быть достигнуто посредством разомкнуто-
разомкнутого управления, в противоположность управлению по замкнутому
принципу. Под переходным процессом понимается реакция систе-
системы управления на ненулевые начальные условия объекта.
Затем рассмотрим влияние возмущений. Как и в разд. 2.7, пред-
предположим, что возмущающая переменная может быть записана как
сумма постоянной и переменной частей. Поскольку в многомерном
случае составляющая управляющей переменной замкнутой сис-
системы, обусловленная возмущением, представдяется в виде
r1D(SI-A)^\p(s), B.194)
составляющую среднего значения квадрата ошибки слежения
замкнутой системы от возмущающей переменной можно записать
следующим образом:
Се ш (с возмущением) — Се ш (без возмущения) ==
= tr \sT @) Vo S @) W'e + J S (/со) 2„ о И ST(-ja) Wtdf. B.195)
216 Глава 2
где использованы результаты разд. 1.10.3. и 1.10:4, и
S(s) = [I + H(s)G(s)]-\
^)2орИ(-/©/-^Т)^Г. B-196)
По аналогии со скалярным случаем S(s) называется матрицей
чувствительности системы. Предполагается, что матрица А не-
неособая. Рассмотрим теперь эквивалентную разомкнутую систему.
Составляющая управляемой переменной от возмущения опреде-
определяется в виде
Z(s) = D(sI~Ar-\p(s). B.197)
Полагая, что разомкнутая эквивалентная система управления
асимптотически устойчива, можно найти, что прирост установив-
установившегося среднего значения квадрата ошибки слежения, обусловлен-
обусловленный возмущением, в разомкнутой системе может быть определен
выражением
Се га (с возмущением) —Се от (без возмущения) =
Из B.198) видно, что прирост установившегося среднего зна-
значения квадрата ошибки слежения не зависит от регулятора, и на
него не оказывает влияния схема разомкнутой системы управле-
управления. Ясно, что в разомкнутой системе подавление возмущений не-
невозможно.
Поскольку матрица спектральных плотностей 2„о(о)) может
быть известна с недостаточной точностью, представляет опре-
определенный интерес установить, существуют ли условия, кото-
которые гарантируют, что в замкнутой системе управления возмуще-
возмущения подавляются по сравнению с разомкнутым эквивалентом без-
безотносительно к 2„0. Перепишем выражение B.195) для прироста
среднего значения квадрата ошибки слежения замкнутой системы
следующим образом:
Се да (с возмущением) — Се от (без возмущения) =
= trlsr @) We S @) Vo + j° ST (-/со) WeS (.до) 2re H dfi B.199)
где S (s) — матрица чувствительности системы. Сравнение этого
выражения с B.198) приводит к следующему утверждению.
Анализ линейных систем управления 217
Теорема 2.1. Рассмотрим асимптотически устойчивую замкнутую
систему управления с постоянными параметрами, в которой управ-
управляемая переменная является также наблюдаемой переменной и объ-
объект является асимптотически устойчивым. Тогда прирост устано-
установившегося среднего значения квадрата ошибки слежения, обуслов-
обусловленный приложенным к объекту возмущением, по крайней мере
меньше аналогичного значения установившегося разомкнутого эк-
эквивалента безотносительно к свойствам возмущения в том и толь-
только е том случае, если
S (—j(i>)WeS(j(u)*?We для всех действительных со. B.200)
Доказательство этой теоремы основано на том, что если заданы
две неотрицательно определенные эрмитовы матрицы Mi и Мг,
то из Mi >¦ М2 следует tr(MiN) > ti{MzN) и наоборот для любой
неотрицательно определенной эрмитовой матрицы N.
Условие B.200) особенно удобно для систем со скалярными
входом и выходом, где S(s) — скалярная функция, так что B.200)
сводится к неравенству
| ?(/со)| ¦< 1 для всех действительных ©. B.201)
Обычно это условие проще проверить с помощью функции воз-
возвратной разности
J (*) = -щ = 1 + Я(*) G (*). B.202)
Учитывая это, выражение B.201) можно переписать в следую-
следующем виде:
[ /(/со) [ з> 1 для всех действительных со. B.203)
Для многомерных систем часто также более удобно проверить
справедливость выражения B.200) с помощью матрицы возвратной
разности
/ (s) = S-1 (s)*=I + H (s) G (s). B.204)
В связи с этим представляется полезным следующий рееультат.
Теорема 2.2. Пусть J(s) = S^). Тогда эквивалентны три сле-
следующих утверждения:
а) Sr\~)(o)WeS{j<a)<We;
б) JT(-jn)WeJVa)>Wt-t- B.205)
. в) J(f&)W-1 JT{-jw) > W~l.
Доказательство оставляем для упражнения.
218 Глава 2
Таким образом, видно, что разомкнутые системы хуже замкну-
замкнутых с точки зрения подавления возмущений. Справедливости ради
следует заметить, что в разомкнутых системах управления возму-
возмущения, приложенные к объекту, не увеличивают среднего значе-
значения квадрата входной переменной. >
Следующим предметом рассмотрения является влияние шума
наблюдений. Очевидно, в разомкнутых сиетемах управления шум
наблюдений не воздействует ни на среднее значение квадрата вход-
входной переменной, ни на среднее значение квадрата ошибки слеже-
слежения, поскольку не имеется обратной связи, которая вводит шум
наблюдений в систему. В этом отношении разомкнутый эквивалент
превосходит замкнутую систему.
В заключение рассмотрим чувствительность к изменениям
объекта. Рассмотрим сначала скалярный случай и выразим сред-
среднее значение квадрата ошибки слежения, обусловленной измене-
изменениями в объекте, для разомкнутой системы управления. Посколь-
Поскольку разомкнутая система имеет единичную функцию чувствитель-
чувствительности, из выражения B.184) следует, что при допущениях разд. 2.9
среднее значение квадрата ошибки слежения, обусловленной изме-
изменениями в объекте, определяется выражением
Се т (разомкнутой системы) ~ | АН @) No @) |2 Ro +
B.206)
Полагая, что N0(s) определяется путем рассмотрения номиналь-
номинальных средних значений квадратов ошибки слежения и входной пе-
переменной, из этого выражения можно заключить, что на чувстви-
чувствительность разомкнутой системы управления к изменениям пере-
передаточной функции объекта не влияет схема системы управления.
Очевидно, что защита от изменений в объекте не может быть обес-
обеспечена посредством управления по разомкнутой схеме.
Для замкнутых систем среднее значение квадрата ошибки сле-
слежения, обусловленной изменениями объекта, определяется выра-
выражением B.184)
Се т (замкнутой системы) ~ | So @) |2 \АН @) iV0 @) |2 Ro +
S0(ja>) р | АН (j<o) No (/©) р 2, И df. B.207)
Сравнение B.206) и B.207) показывает, что замкнутая система
всегда менее чувствительна к изменениям объекта, чем эквивалент-
эквивалентная разомкнутая система, независимо от того, каков характер из-
Анализ линейных систем управления
219
менений и каковы свойства эталонной переменной, если функция
чувствительности удовлетворяет неравенству
| S0(Ja) | < 1 для всех со. B.208)
Таким образом, видно, что условие, которое гарантирует, что
замкнутая система менее чувствительна к возмущениям, чем разом-
разомкнутая, также делает систему менее чувствительной к изменениям
объекта.
Для многомерного случая условие B.208) подавления возмуще-
возмущений обобщается следующим образом:
Sl(—j(o)We So (/со) < We для всех со; B.209)
Таблица 2.2
Сравнение замкнутых и разомкнутых схем
Характерное свойство,
параметр
Замкнутая система
Разомкнутый установив-
установившийся эквивалент
Усто-йчиеость
Установившиеся сред-
средние значения КЕадра-
та ошибки слежения
и квадрата входной
переменной, обуслов-
обусловленные эталонной
переменной
Поведение в переход-
переходном режиме
Влияние Еозмущений
Влияние
дений
шума наблю-
Влияние изменений
объекта управления
Неустойчивый объект
может быть стабили-
стабилизирован
Неустойчивый объект
не может быть стаби-
стабилизирован
Идентичные характеристики, если объект _
асимптотически устойчив
Возможно значительное
улучшение реакции
на начальное откло-
отклонение
Среднее значение квад-
квадрата ошибки слеже-
. вия может быть в зна-
значительной степени
уменьшено; среднее
значение квадрата
входной переменной
возрастает
Средние значения квад-
квадрата ошибки слеже-
слежения и входной пере-
переменной возрастают
Влияние на среднее зна-
значение квадрата ошиб-
ошибки слежения может
быть в значительной
степени уменьшено
Невозможно улучшить
реакцию системы на
начальное отклонение -
Полное влияние на сред-
среднее значение квадрата
ошибки слежения; на
среднее значение
квадрата входной пе-
переменной действие не
оказывается
Не оказывает влияния
на средние значения
квадратов ошибки
слежения и входной
переменной
Полное влияние на
среднее значение
квадрата ошибки сле-
слежения
220 Глава 2
Условие B.209) гарантирует [41, 97], что прирост установив-
установившегося среднего значения квадрата ошибки слежения* из-за (малых)
изменений объекта в замкнутой системе никогда не превышает
аналогичного значения для разомкнутого установившегося эквива-
эквивалента независимо от характера изменений объекта и свойств эта-
эталонной переменной.
Завершим зтот раздел табл. 2.2, которая подытоживает сход-
сходные и отличные показатели замкнутых схем управления и их ра-
разомкнутых установившихся эквивалентов.
2.11. Заключение
В данной главе описаны задачи управления и различные аспек-
аспекты качества систем управления. Показано, что замкнутые схемы
управления могут обладать очень хорошими свойствами. Разрабо-
Разработаны различные правила, которые могут быть использованы при
проектировании системы управления.
Однако были рассмотрены лишь некоторые варианты схем ре-
регуляторов. Эта задача более подробно рассматривается в следую-
следующих главах. Будет сформулирована задача нахождения приемле-
приемлемого компромисса между требованием малого среднего значения
квадрата ошибки слежения без значительного увеличения сред-
среднего значения квадрата входной переменной как задача математи-
математической оптимизации. Эта задача оптимизации будет поставлена и
решена по этапам в гл. 3—5. Ее решение позволяет точно опреде-
определить приемлемые схемы управления.
2.12. Задачи
2.12.1. УПРАВЛЕНИЕ УГЛОВОЙ СКОРОСТЬЮ ДВИГАТЕЛЯ
Рассмотрим двигатель постоянного тока, описываемый диффе-
дифференциальным уравнением
?LBc(t) = m(t), ^ '¦ B.210)
J+Bc(t) m(t),
dt
где c{t) — угловая скорость двигателя; m(t) — момент, прило-
приложенный к валу двигателя; / — момент инерции; В — коэффи-
коэффициент трения.
Выберем выражение для m(t) в виде
т (t) = ku (t), ¦ B.211)
где u(t) — электрическое напряжение, подаваемое на двигатель,
& к — коэффициент пропорциональности между моментом и нап-
Анализ линейных систем управления 221
ряжением. Подставляя B.211) в B.210), напишем дифференциаль-
дифференциальное уравнение системы
-^_ + ас (t) = ш (t). B.212)
dt
Используются следующие численные значения:
0=0,5 0-', х=150 рад/(В-еJ, / = 0,01 кг-м2. B.213)
Предполагается, что угловая скорость является как наблюдае-
наблюдаемой, так и управляемой переменной. Исследуем простую пропор-
пропорциональную схему управления, в которой входное напряжение
задается в виде
м (*) = —-Хс (f) + рг (*). B-214)
Здесь r(t) — эталонная переменная, а % ир — коэффициенты,
которые следует определить. Задача состоит в проектировании сле-
следящей системы.
а) Определите значения коэффициента в обратной связи %,
лри которых замкнутая система асимптотически устойчива.
б) Для каждого значения коэффициента А определите такой ко-
коэффициент р, при котором следящая система обеспечивает нуле-
нулевую установившуюся ошибку при ступенчатом изменении эталон-
эталонной переменной. Ниже коэффициент р всегда выбирается так, чтобы
зто условие удовлетворялось.
в) Предположим, что эталонная переменная представляет собой
экспоненциально коррелированный шум со среднеквадратическим
-значением 30 рад/с и частотой срыва 1 рад/с. Определите такой
коэффициент в обратной связи, при котором среднеквадратическое
значение входного напряжения, поступающего на двигатель пос-
постоянного тока, равно 2 В. Какое среднеквадратическое значение
ошибки слежения соответствует этому коэффициенту?
Начертите логарифмические частотные характеристики системы
управления при этом значении коэффициента. Каково значение
10%-ной частоты среза? Сравните его с 10%-ной частотой среза
эталонной переменной и прокомментируйте сравнение величины
среднеквадр этического значения ошибки слежения и среднеквадра-
тического значения эталонной переменной. Каково 10%-ное время
установления реакции системы на ступенчатое изменение эталон-
эталонной переменной?
г) Предположим, что к системе приложено возмущение в виде
стохастически изменяющегося момента на валу двигателя постоян-
постоянного тока, который может быть представлен как экспоненциально
коррелированный шум со среднеквадратическим значением 0,1732
Н-м и частотой срыва 1 рад/с. Вычислите приросты установив-
установившихся среднего значения квадрата ошибки слежения и среднего
222 Глава 2
значения входной переменной, обусловленные возмущением, для
значений К ир, выбранных в п. (в). Влияет ли в значительной сте-
степени возмущение на качество системы?
д) Предположим, что измерение угловой скорости искажается
аддитивным шумом измерений, который может быть представлен
экспоненциально коррелированным шумом со среднеквадратичес-
ким значением 0,1 рад/с и частотой срыва 100 рад/с. В какой мере
влияет шум измерения на качество системы?
е) Предположим, что двигатель постоянного тока обнаружива-
обнаруживает изменение момента инерции / из-за вариации нагрузки. Рас-
Рассмотрите отклонения от номинального значения момента инерции,
равные 0,005 и 0,02 кГ-м2. Как эти крайние значения влияют на ре-
реакцию системы при ступенчатом отклонении эталонной переменной,
если коэффициенты К и р имеют значения, выбранные в п. (в)?
2.12.2. СХЕМА РАЗВЯЗАННОЙ СИСТЕМЫ УПРАВЛЕНИЯ
СМЕСИТЕЛЬНЫМ БАКОМ
Рассмотрим задачу управления смесительным баком, описан-
описанную в примерах 2.2 (разд. 2.2.2) и 2.8 (разд. 2.5.3). Дифференци-
Дифференциальное уравнение состояния объекта представляется в виде
°'Oi ° )x(t) + ( 1 * )u(t), B.215)
0 — 0,02 j w \— 0,25 0,75/ К" \ '
а управляемая переменная равна
°)(t)' B-216)
а) Покажите, что объект может быть полностью развязан при
выборе
u(t) = Qu'(t), B.217)
где Q — соответствующая^ матрица 2 X 2, a u'(t) —
Цг'(О] — новая входная переменная объекта.
б) Используя (а), постройте замкнутую систему управления,
аналогичную построенной в примере 2.8, которая является пол-
полностью развязанной, где Г@) = /, и каждое звено имеет 10%-ную
частоту среза, равную 0,01 рад/с.
2.12.3. ИНТЕГРИРУЮЩЕЕ ДЕЙСТВИЕ РЕГУЛЯТОРА
Рассмотрим объект с постоянными параметрами и скаляр-
скалярными входной и выходной переменными, где управляемая пере-
переменная является также наблюдаемой переменной, т. е. С —D,
Анализ линейных систем управления <# 223
а матрица А. неособая. Для подавления постоянных возмущений
функция чувствительности 5(/со) должна быть сделана малой
(предпочтительно нулевой) при со = 0. Функция S(s) определя-
определяется выражением
5 (*) = 7X7777777' <2-218)
1 + Н (s) G (i)
где H(s) — передаточная функция объекта, a G(s) — передаточ-
передаточная функция регулятора (рис. 2.25). Предположим, что можно
найти такую рациональную функцию Q(s), при которой регулятор
с передаточной функцией
G(s) = —Q(s) B.219)
S
делает замкнутую систему асимптотически устойчивой. Говорят,
что такой регулятор обладает свойством интегрирования. Покажи-
Покажите, что для этой системы управления 5@) = 0, при ненулевом
значении H@)Q@). Следовательно, регуляторы с интегрирующим
действием могут полностью подавить постоянные возмущения.
2.12.4*. ПОСТОЯННЫЕ ВОЗМУЩЕНИЯ В ОБЪЕКТЕ
ПРИ ОСОБОЙ МАТРИЦЕ А
Рассмотрим влияние постоянных возмущений в системе управ-
управления при допущениях 1—5 из разд. 2.7, но в случае, если матрица
А объекта особая, т. е. объект содержит интегратор.
а) Покажите, что составляющая установившегося среднего зна-
значения квадрата ошибки слежения от постоянной части возмущения
может быть выражена в виде
lim E {vTp0 (— si — АТУ1 DTS(—s)S (s) D (si — A)~l v^}. ¦ B.220)
Будем различать два случая: (б) и (в).
б) Допустим, что возмущения приложены к системе таким об-
образом, что предел
lim D (si — A)~lvp0 B.221)
S-9-0
всегда конечен. Это означает, что постоянные возмущения всегда
приводят к конечным постоянным эквивалентным ошибкам в уп-
управляемой переменной, несмотря на интегрирующий характер объ-
объекта. Покажите, что в этом случае
1) принцип проектирования 2.5 применяется без модификации;
2) S@) = 0 при условии, что предел
lim sH(s)G(s) B.222)
224 Глава 2
является нулевым. Здесь H(s) — передаточная функция объекта,
a G(s) — передаточная функция в цепи обратной связи (рис. 2.25).
Эти результаты показывают, что в объекте с интегрированием,
где пост.оянные возмущения всегда приводят к конечным постоян-
постоянным эквивалентным ошибкам в управляемой переменной, постоян-
постоянные возмущения подавляются полностью [при условии, что B.222)
удовлетворяется; это приводит к тому, что ни передаточная функция
объекта, ни передаточная функция регулятора не имеют нуля в
начале координат.]
в) Рассмотрим теперь случай, когда предел B.221) не является
конечным. Предположим, что предел
lira sk D (si—A) vp0 . B.223)
s->0
конечен, где к — наименьшее положительное целое число, для
которого это предположение справедливо. Покажите, что в этом
случае для получения малой постоянной ошибки управляемой
переменной предел
lim -^L B.224)
должен быть малым (предпочтительно нулевым). Покажите, что
предел B.224) монщо привести к нулю, положив
где Q{s) — такая рациональная функция от s, что Q@) ф- О,
Q@) ф. оо, и где т0 — такое наименьшее целое среди т, что
UmsmH(s) B.226)
s-»0
является конечным.
ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ
УПРАВЛЕНИЯ С ОБРАТНОЙ СВЯЗЬЮ
3.1. Введение
В гл. 2 было проведено общее рассмотрение задач линейной тео-
теории управления. В настоящей главе будут изложены основы тео-
теории, которую можно использовать для решения этих задач. Ос-
Основным ограничением в данной главе является предположение,
что полное состояние x(t) объекта управления может быть точно
измерено в любой момент времени и использовано для обратной
связи. Хотя такое предположение для многих систем управления
на практике является нереальным, оказывается, что теория, рас-
рассматриваемая в настоящей главе, может служить основой для бо-
более общего случая, когда состояние x(t) точно не известно.
Основное внимание в этой главе уделяется задачам регулирова-
регулирования, т. е. задачам, в которых основной целью является приведение
системы в заданное состояние. Будет показано, что линейная тео-
теория управления обеспечивает эффективное решение таких задач.
Детально рассматриваются детерминированный и стохастичес-
стохастический варианты задачи оптимального линейного управления. Зна-
Значительное внимание уделяется дальнейшему развитию задачи ре-
регулирования — регулятору при ненулевой заданной точке и
задаче оптимального линейного слежения.
Другие разделы главы посвящены численному решению урав-
уравнения Риккати, асимптотическим свойствам оптимальных законов
управления и чувствительности линейных оптимальных систем
управления с обратной связью.
3.2. Улучшение динамических свойств
линейных систем с помощью обратной
связи
3,2,1. ЛИНЕЙНОЕ УПРАВЛЕНИЕ С ОБРАТНОЙ СВЯЗЬЮ
В гл. 2 было показано, что важным аспектом в разработке сис-
систем управления с обратной связью является устойчивость системы.
Устойчивость системы должна быть обеспечена во всех случаях
ее использования.Иногда основная задача обратной связи состоит
в стабилизации неустойчивой системы или, если переходный про-
процесс не затухает достаточно быстро, в улучшении ее динамических
свойств.
В данном разделе рассматриваются вопросы улучшения дина-
динамических свойств линейных систем с помощью обратной связи.
226 . Глава 3
Рассмотрим линейную нестационарную систему, описываемую
дифференциальным уравнением состояния
.x(t) = A(t)x(t) + B(t)u(t). C.1)
Если предположить, что полное состояние системы можно точ-
точно измерить в любой момент времени, то можно реализовать ли-
лилейный закон управления вида
u(t) = —F{t)x(t) + u'(t), C.2)
где F(t)— переменная матрица коэффициентов усиления обратной
связи, a u'(t)—новая входная переменная. Если этот закон управле-
управления используется в системе C.1), то замкнутая система управления
описывается следующим дифференциальным уравнением состояния:
х (t) = [A (t) — B(t)F (t)} z(t) + B (t) и' (t). C.3)
Устойчивость этой системы зависит, конечно, от поведения
матриц A(t) и B(t), а также от матрицы коэффициентов F(t). Здесь
удобно ввести следующую терминологию.
Определение 3.1. Линейный закон управления
u(t) = —F(t) x(t) + u' (t) C.4)
называется асимптотически устойчивым законом управления
для системы
x(t) = A(t)x(t) + B(t)u{t), C.5)
если замкнутая система
х (t) = [A (t) —B(t)F (t)] x(t)+B (t) и' (t) C.6)
является асимптотически устойчивой.
Если система C.5.) имеет постоянные параметры и матрица F вы-
выбрана постоянной, то устойчивость закона управления C.4) опреде-
определяется характеристическими числами матрицы А—BF. В следую-
следующем разделе будет показано, что при нежестком ограничении
(система должна быть полностью управляемой) все характеристи-
характеристические числа для замкнутого контура могут быть произвольно
размещены на комплексной плоскости путем соответствующего
выбора матрицы F (конечно, при ограничении, что комплексные
полюса образуют комплексно сопряженные пары). Если все по-
полюса замкнутого контура находятся в левой полуплоскости, то
система, очевидно, асимптотически устойчива.
В следующем разделе будет-также показано, что в случае сис-
систем с одним входом, т. е. систем со скалярной переменной и, обычно
Оптимальные линейные СУ с обратной связью
227
существует единственная матрица усиления F для заданной груп-
группы полюсов замкнутого контура.
В книге Мелса [127] приведена программа определения этой
матрицы с помощью ЦВМ, записанная на языке ФОРТРАН. В слу-
случае систем со многими входными переменными заданное распре-
распределение полюсов обычно может достигаться при различных вы-
выборах матрицы F.
Пример 3.1. Стабилизация перевернутого маятника
Дифференциальное уравнение состояния для системы управ-
управления положением перевернутого маятника из примера 1.1 (разд.
1.2.3.) имеет вид
*(*)¦ =
0
0
0
g
L'
1
F
~ М
¦ 0
0
0
0
0
g
и
0
0
1
0
x(t) +
0
1
М
0
0
C-7)
Рассмотрим закон управления с постоянной настройкой
V- (*) = ~ (<Pi. <Pi, Фз. Ф*) * (*)• " C.8)
Из этого следует, что для системы C.7) и закона управления
C.8) имеем
A—BF-
О
«Pi
м,
О
1
М
О
_?
J- О
м
О
j_
и
О
м
1
о
C.9)
Характеристический полином этой матрицы равен
Р + «Ра + <Р4 g
М
M
U
— s-
M
g
C.10)
Предположим, что все полюса замкнутой системы необходимо
расположить в точке —а. Тогда характеристический полином зам-
замкнутого контура записывается в виде
(s.+ a)* = s* + 4as3 + 6a2s2 + 4a3s + а4. C.11)
228 Глава 3
- Приравнивая коэффициенты в выражениях C.10) и C.11), по-
получим следующие уравнения относительно q>i, ф2, фз, ф^
м
Л *- = 6а2,
м и
C.12)
м и
м и
Используя численные значения из примера 1.1 и полагая
чх = 3 с, находим из этих линейных уравнений следующий закон
управления:
1ь(г) = —F5,65, 11,00,-72,60, —21,27)х(t). ' C.13)
Пример 3.2. Смесительный бак
Смесительный бак из примера 1.2 (разд. 1.2.3) является при-
примером системы с многими входными переменными. При численных
значениях, взятых из примера 1.2, линеаризованное уравнение
состояния системы имеет вид
x(t)+( l l )u(t). C.14)
0 -0,02 J w^V_0,25 0,75/ w v
Рассмотрим закон управления с постоянной настройкой
1). C.15)
Ф21 Ф28
Из C.14) и C.15) следует, что характеристический полином
замкнутого контура определяется выражением
det (si — А + BF) = s2 + s @,03 + Фи — 0,25 <р12 + Ф21 + 0.75 <р22) +
+ @,0002 + 0,02 фи — 0,0025 Ф12 + 0,02ф21 + 0,0075 сра2 +
+ ?ц Ф22 — Ф12 Ф21)• ' C-16)
Легко установить, что этот характеристический полином зам-
замкнутой системы можно получить при различных значениях коэф-
коэффициентов усиления уц. Например, три следующие матрицы ко-
коэффициентов усиления обратной связи:
U 3,74 /0 0 Ч в/0,1 0 \
0 0 Г \1,1 -1,2333/ с \0 0,1/ V '
Оптимальные линейные СУ с обратной связью 229
дают характеристический полином s2 + 0,2050s + 0,01295, так
что характеристические числа замкнутой системы равны —0,1025±
± /0,04944. Отметим, что в законе управления, соответствующем
первой матрице усиления, не используется вторая входная пере-
переменная, во второй матрице не используется первая переменная,
тогда как в третьем законе управления обе входные переменные
управляют системой.
На рис. 3.1 показаны реакции трех соответствующих замкнутых
«истем на начальные условия
Ь@) = 0м»,
.C.18)
?2@) = 0,1 кмоль/м3.
Отметим, что, несмотря на одинаковые полюса этих замкнутых
систем, наблюдаются значительные различия в их реакциях.
3.2.2*. УСЛОВИЯ РАЗМЕЩЕНИЯ ПОЛЮСОВ И СТАБИЛИЗАЦИЯ
В данном разделе будет точно установлено: 1) при каких усло-
условиях полюса замкнутой системы с постоянными параметрами могут
быть произвольно размещены в некоторой области на комплекс-
комплексной плоскости с помощью линейной обратной связи и 2) при каких
условиях систему можно стабилизировать. Сначала получим сле-
следующий результат.
Теорема 3.1. Рассмотрим линейную систему с постоянными
параметрами
x(t) = Ax{t) + Bu (t) C.19)
и законом управления с постоянной настройкой
u(t) = —Fz(t)+u'(t). C.20)
Для такой системы характеристические числа замкнутой сис-
системы, т. ё. характеристические числа матрицы А — BF, могут
быть произвольно размещены на комплексной плоскости (с тем
ограничением, что комплексные характеристические числа образуют
комплексно сопряженные пары) путем соответствующего вы-
выбора матрицы F тогда и только тогда, когда система C.19) явля-
является полностью управляемой.
Полное доказательство этой теоремы дано в работах [37, 45,
72, 183]. В работе [180] рассмотрен нестационарный случай.
Ограничимся доказательством для систем со скалярной входной
переменной.
Предположим, что система, описываемая дифференциальным
уравнением состояния
' C.21)
0,5
_- 0.Z
t,c
50
.0,5
0
-0,5
0
V-
i
t,c SO
? °>z
Ы |
0
t,c
SO
Рис. 3.1. Реакция замкнутых систем регулирования смесительного бака на начальные условия ^@) = 0 м3, 5г@)
= 0,1 кмоль/м8 для матриц усиления обратной связи.
~*а- 6~Fb' °~
Оптимальные линейные СУ с обратной связью
231
где \i(t) — скалярная входная переменная, является' полностью
управляемой. Из разд. 1.9 известно, что существует преобразова-
преобразование состояния x'(t) = T'lx(t) (где Т — неособая матрица
преобразования), которое преобразует систему C.19) в канони-
каноническую форму фазовой переменной
x'(t)=
О
О
1
О
о
1
о
о
— а
'п-1 )
х' (*) +
О
О
О
1
C.22)
Здесь лисла dt, i = 0, 1, ..., п — 1, —коэффициенты характе-
характеристического полинома системы C.21), т. е.
det (si — А) — sn + an_j s" -f ... + a4s -f a0.
Запишем C.22) более компактно:
x'(t) = A' х'ф + Ь'ру).
Рассмотрим теперь линейный закон управления
где /' — вектор-строка,
/' = (Ф1. Ф2 ф„).
C.23)
C.24)
C.25)
Замкнутая система с этим законом управления описывается диф-
дифференциальным уравнением состояния
х' (t) = {А' — V /') х (t) + V |i/ (*). C.26)
Легко показать, что матрица А' — b'f определяется выражением
0 1 0 0
0 0 1 0 . . .0
A'—b'f' =
0
— «о — <Pi
0
. C.27)
232 Глава 3
Из этого выражения следует, что характеристический полином
матрицы А'—b'f имеет коэффициенты а( — фг+1, i = О, 1, ...
..., п—1. Так как срг-, ?=1, 2, ..., п, являются произвольно выб-
выбранными вещественными числами, коэффициенты характерис-
характеристического полинома замкнутого контура могут быть заданы в виде
любых желаемых чисел. Это означает, что полюса замкнутого кон-
контура можно произвольно размещать на комплексной плоскости
(при условии, что комплексные полюса образуют комплексно со-
сопряженные пары).
Так как закон управления с обратной связью выбран в виде за-
зависимости от преобразованных переменных состояния, его можно
представить непосредственно через исходные переменные состоя-
состояния x(t) в следующем виде:
!х@ = -/'*'(*) + !*'(*) = -f'T-4{t) + р'у) = -/*(*) +1*'(*)< C-28)
Тем самым доказывается, что если система C.19) полностью
управляема, то характеристические числа замкнутого контура
можно выбирать произвольно. Обратное доказательство следует
из последней части доказательства теоремы 3.2. Доказательство
для систем с многомерной входной переменной более сложно, по-
поэтому опустим его. Как видно из примера 3.2, в этом случае
обычно имеется много решений для матрицы коэффициентов
усиления обратной связи F при заданных характеристических
числах замкнутого контура.
На основе теоремы 3.1 всегда можно полностью стабилизи-
стабилизировать управляемую систему с помощью обратной связи или повы-
повысить ее устойчивость, размещая полюса замкнутой системы в ле-
левой половине комплексной плоскости. Эта теорема, однако, не
дает указаний, каким образом следует распределять полюса зам-
замкнутой системы в левой половине комплексной плоскости. Кроме
того, имеется неопределенность в случае системы ео многомерной
входной переменной, когда одна и та же схема распределения
полюсов замкнутой системы может быть реализована с помощью
различных законов управления. Эта неопределенность устраняет-
устраняется методами линейной оптимальной теории регулирования, кото-
рые*обсуждаются ниже в гл. 3.
Из теоремы 3.1 следует, что всегда можно стабилизировать пол-
полностью управляемую линейную систему. Предположим, однако,
что имеем случай системы с постоянными параметрами, которая
не является полностью управляемой. Из рассмотрения понятия ста-
билизируемости в разд. 1.6.4 можно установить, что стабилизируе-
мость, как следует из названия, точно характеризует условия, ко-
которые позволяют стабилизировать неполностью управляемую сис-
систему с постоянными параметрами при помощи линейного закона
управления с постоянной настройкой [183].
Оптимальные линейные СУ с обратной связью 233
Теорема 3.2. Рассмотрим линейную систему с постоянными пара-
параметрами
х (t) = Ax (t) + Bu (t) C.29)
и законом управления с постоянной настройкой
и (t) = —Fx(t) + u' (t). C.30)
Докажем, что можно найти такую постоянную матрицу F,
при которой замкнутая система будет асимптотически устойчи-
устойчивой тогда и только тогда, когда система C.29) стабилизируема.
Доказательство этой теоремы очень простое. Из теоремы 1.26
(разд. 1.6.3) известно, что система может быть представлена в ка-
канонической форме управляемости
ГВ'Л
u(t), C.31)
где пара {А'и,В\}— полностью управляемая. Рассмотрим ли-
иейный закон управления
и (t) = - (F[ ,F'2)x' (t) + и' (t). C.32)
Для замкнутой системы получим
а' а'\ /в'.
An-B\F\ A\2-B\F
В'
\u'(t). C.33)
В этом выражении характеристические числа сложной матрицы
являются характеристическими числами матриц А',, — В'j.F't и
A'2Z. Тогда, если система C.29) стабилизируема, то матрица А'гг
асимптотически устойчива, и так как пара {А'цВ\} полностью
управляема, то всегда можно найти такую матрицу F'{, что матри-
матрица А'ц— B'iF'i будет устойчивой. Тем самым доказывается, что
если система C.29) стабилизируема, то всегда можно найти закон
управления с обратной связью, который стабилизирует систему.
И наоборот, если можно найти закон управления с обратной
связью, который стабилизирует систему, то матрица А'гг должна
быть асимптотически устойчивой, так как система стабилизируема.
Это доказывает другое положение теоремы.
234 Глава 3
Из доказательства рассмотренной теоремы следует, что если
система стабилизируема, но не полностью управляема, то только
некоторые из полюсов замкнутой системы могут быть размещены
произвольно, так как закон управления не изменяет характеристи-
характеристических чисел матрицы А '22. Тем самым доказывается еще одно по-
положение теоремы 3.1.
3.3. Задача детерминированного
линейного оптимального управления
3.3.1. ВВЕДЕНИЕ
f.. В разд. 3.2 было показано, что при определенном условии (пол-
(полной управляемости) линейная система с постоянными параметра-
параметрами всегда может быть стабилизирована с помощью закона управ-
управления с обратной связью. Систему можно стабилизировать,
поскольку полюса замкнутой системы могут быть произвольно рас-
расположены на комплексной плоскости; кроме того, путем соответст-
соответствующего выбора полюсов в левой половине комплексной плоскос-
плоскости можно обеспечить как угодно .быструю сходимость к нулевому
состоянию. Однако, чтобы повысить быстродействие системы, не-
необходимо иметь входную переменную большой амплитуды. В любой
. практической задаче амплитуда входной переменной должна быть
ограничена, и это налагает ограничение на возможное перемеще-
перемещение полюсов замкнутой системы в левой полуплоскости. Эти сооб-
соображения приводят к постановке задачи оптимизации, в которой
одновременно учитываются скорость перехода системы в нулевое
состояние и величина амплитуды входной переменной.
Чтобы поставить эту задачу оптимизации, отложим рассмотре-
рассмотрение вопроса о размещении полюсов и обратимся к нему в разд.
3.8.
Рассмотрим линейную систему с постоянными параметрами,
описываемую дифференциальным уравнением состояния
'x(t) - A (t) х (t) +[B\(t) и (t), C.34)
и исследуем задачу перевода этой системы из произвольного на-
начального состояния в нулевое состояние с максимальной скоростью
(в'разд. 3.7 будет рассмотрен случай, когда заданное состояние
не является нулевым). Существует много критериев скорости пере-
перехода системы из начального состояния в нулевое; весьма эффек-
эффективным является квадратический интегральный критерий
U ' '
xT(t)Ri(t)x(t)dt. ¦ C.35)
I
Оптимальные линейные СУ с обратной связью . 235
Здесь R^t) — неотрицательно определенная симметрическая мат-,
рица. Величина хт (?)Дх(?)а:(?) является мерой отклонения сос-
состояния системы в момент t от нулевого состояния; весовая матрица
Ri(t) определяет вес каждой из компонент состояния. Интеграл
C.35) является критерием суммарного отклонения x(t) от нулевого
состояния на интервале времени [t0, tj].
Как было показано в гл. 2, во многих задачах управления
можно идентифицировать управляемую переменную z(t). В исполь-
используемых линейных моделях обычно имеем
z(t) = D{t)x(t). . C.36)
Если в реальной задаче управляемая переменная z{t) обраща-
обращается в нуль с максимально возможной скоростью, то критерий
C.35) можно привести к виду
и
zT(t)Rs(t)z(t)dt, : C.37)
где R3{t) — положительно определенная симметрическая весовая
матрица. Легко показать, что C.37) эквивалентно C.35), так как
с учетом C.36) можно написать
zT{t)Rs(t)z(t)dt=^ xT{t)Rl(t)x(t)dt, C.38)
и -и
где
Ri(t) = DT(t)Rs(t)D(t). C.39)
При попытке найти оптимальное значение переменной на вхо-
входе системы путем минимизации величины C.35) или C.37) обычно
сталкиваются с трудностью, заключающейся в бесконечно боль-
больших амплитудах входной переменной. Чтобы преодолеть эту труд-
трудность, .учтем входную переменную в критерии и рассмотрим выра-
выражение
U
zT (t) R3 (t) z (t) + uT (t) R2 (t) и (*)] dt, C.40)
где R2(t) — положительно определенная симметрическая весовая
матрица. Учет второго члена в критерии приводит к снижению
амплитуды входной переменной, если попытаться, насколько это
возможно, уменьшить общую величину выражения C.40). Вклад
каждого из двух членов в критерии определяется матрицами R3 и
Если необходимо обеспечить максимальную близость терминаль-
терминального состояния x(tL) к .нулевому состоянию, то в отдельных слу-
236 Глава 3
чаях целесообразно дополнить критерий C.40) третьим членом
J [ zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt + xT (*,) Ptx (fj, C.41)
n
где Рг — неотрицательно определенная симметрическая матрица.
Теперь можно сформулировать задачу детерминированного
линейного оптимального регулятора.
Определение 3.2. Рассмотрим линейную систему с постоянными,
параметрами
x(t) = A(t)z(t)+B(t)u(t), C.42)
где
x(t0) = x0 C.43)
с управляемой переменной
z(t) = D{t)x(t). C.44)
Рассмотрим также критерий
zT (t) R3 (t) z (t) + uT (t) Rz (t) и (*)] dt + / (t,) PMh), C.45)
где Рх — неотрицательно определенная симметрическая матрица^
a R3(t) и R2{t) — положительно определенные симметрические
матрицы при t0 < t <g tv Тогда задача определения входной
переменной и0 (t), 10 < t < tl7 при которой критерий минимален,
называется задачей детерминированного линейного оп-
оптимального регулятора.
В этой главе, как и во всей книге, предполагается, что A(t) есть
непрерывная функция t, a B(t), D(t), R3(t), R2{t) — кусочно-не-
кусочно-непрерывные функции t, и все эти матричные функции ограничены.
Задача синтеза регулятора с постоянной настройкой является
специальным случаем.
Определение 3.3. Если все матрицы в постановке задачи детер-
детерминированного линейного оптимального регулятора постоянны^
то эту задачу будем называть детерминированной задачей
линейного оптимального регулятора с постоян-
постоянными параметрами.
Продолжим в этом разделе дальнейшее обсуждение постановки
задачи регулирования. Во-первых, учтем, что в этой задаче, как
указывалось в определении 3.2, рассматривается только переход-
переходный процесс, произвольное начальное состояние которого должно
быть переведено в нулевое состояние. Постановка задачи не вклю-
включает возмущений или эталонной переменной, которую необходимо
Оптимальные линейные СУ с обратной связью 237"
отслеживать; эти более сложные случаи обсуждаются в разд. 3.6.
Значительные трудности создает выбор весовых матриц R3r
R2 и Рх в критерии C.45) ; их необходимо выбирать следующим,
образом. Обычно можно определить интегральную квадратичес-
квадратическую ошибку регулирования, интегральную квадратическую вход-
входную переменную и взвешенную квадратическую терминальную-
ошибку. Интегральная квадратическая ошибка регулирования
описывается выражением
jzr '{t)We{t)z{t)dt, C.46>
to
где We(t), *0 < t < tx,— весовая матрица, обеспечивающая соот-
соответствующую размерность и физический смысл zT (t)We(t)z(t).
Выбор таких весовых матриц рассматривался в гл. 2. Интеграль-
Интегральная квадратическая входная переменная выражается в виде
^uT(t)Wu(t)u(t)dt, C.47>
где вееовая матрица Wu(t), t0 < t < tu определяется аналогич-
аналогичным образом. И наконец, взвешенная квадратическая терминаль-
терминальная ошибка равна
zT{QWtx{td, ' C.48)
где Wt — соответствующая весовая матрица. Теперь будут рас-
рассмотрены следующие задачи.
1. Минимизация интегральной квадратической ошибки регули-
регулирования при ограничении максимальной величины интегральной
квадратичеекой входной переменной и взвешенной квадратичес-
квадратической терминальной ошибки.
2. Минимизация взвешенной квадратической терминальной
ошибки при ограничении максимальной величины интегральной
квадратической входной переменной и интегральной квадрати-
квадратической ошибки регулирования.
3. Минимизация интегральной квадратической входной пере-
переменной при ограничении максимальной величины интегральной
квадратической ошибки регулирования и взвешенной квадрати-
квадратической терминальной ошибки.
Все эти задачи можно исследовать, минимизируя критерий
Pl j zT (t) We (t) z (t) dt + p2 j uT (t) Wu (t) и (t) dt +
<o to
+ p3xT(ti)Wtx(ti), C.49)
где константы p lt p 2 и р 3 выбираются соответствующим образом*
238 Глава 3
II
tl
If
I
Интегральная квадратическая
величина входного воздействия
Рис. 3.2. Изменение интегральной квадратическоц ошибки регулирования в
зависимости от интегральной квадратической величины входного воздействия
При Q1 = 1 И Q2 = G.
Выражение C.45) имеет точно такой же вид. Рассмотрим,например,
весьма важный случай, когда терминальная ошибка несуществен-
несущественна и необходимо минимизировать интегральную ошибку регули-
регулирования при интегральной квадратической входной переменной,
которая не превышает определенной величины. Поскольку терми-
терминальная ошибка не учитывается, примем р3 = 0. Так как миними-
минимизируется интегральная квадратическая ошибка регулирования,-
примем р1 =1. Рассмотрим, таким образом, минимизацию вели-
величины
J* [ zT (t) We (t) z (t) + p2 uT (t) Wu (t) и («)] dt, C.50)
Скаляр р2 теперь играет роль множителя Лагранжа. Чтобы
-определить соответствующую величину р2, решим задачу при раз-
различных значениях р2. В результате получим график, приведенный
на рис. 3.2, где результирующая интегральная квадратическая
ошибка представлена в виде зависимости от интегральной квадра-
квадратической входной переменной с р2 в качестве параметра. При умень-
уменьшении р3 результирующая интегральная квадратическая ошибка
убывает, а интегральная квадратическая входная переменная воз-
возрастает. Из этого графика можно определить величину р 2, при ко-
которой ошибка регулирования достаточно мала, а значения входной
переменной не очень велики.
С помощью этого же графика можно решить задачу минимиза-
минимизации интегральной квадратической входной переменной при ограни-
ограниченной величине интегральной квадратической ошибки регулиро-
Оптимальные линейные СУ с обратной связью 239
вания. Другие варианты задачи можно решить аналогичным об-
образом. Видно, что задача регулирования, сформулированная в
определении 3.2, является весьма многосторонней и может быть
видоизменена для различных целей.
В следующих разделах будет показано, что решение задачи
регулирования может быть дано в форме линейного закона управ-
управления, который имеет несколько полезных свойств. Это делает
задачу исследования интересной и практически целесообразной.
Пример 3.3. Задача стабилизации .угловой скорости
В качестве первого примера рассмотрим задачу стабилизации;
угловой скорости. Объект состоит из двигателя постоянного такаг
управляемого входным напряжением |х(?), с угловой скоростью
вала g (г). 'Система описывается скалярным дифференциальным
уравнением состояния
= —а?(«)+*!*('). C.51)
где а и х — известные константы.
Рассмотрим задачу стабилизации угловой скорости вращения
?(?) относительно заданной величины соо. При постановке общей
задачи управления начало координат пространства состояний вы-
выбиралось в равновесной точке. Так как в рассматриваемой за-
задаче заданное равновесное положение равно \(t) = co0, сдвинем
начало координат. Пусть ц0 является постоянным входным напря-
напряжением, которому соответствует величина угловой скорости (о0 в
установившемся состоянии. Тогда |х0 и <ю0 связаны соотношением
0=-скоо + х(х0. . C.52>
Введем теперь новую переменную состояния
5'0 = 5(«)-«о- C-53>
Тогда из C.51) с учетом C.52) следует, что ?'(?) удовлетворяет
дифференциальному уравнению состояния
Г(*) = -оГ(*)+х,*'(*), C-.54)
где
!*'(*) = !*(*)-ft,- C.55)
Это показывает, что задача перевода системы C.51) из произ-
произвольного начального состояния ? (t0) — % в состояние | = <в0
эквивалентно переводу системы C.51) из начального состояния
g(?0) = ш1 — соо в равновесное состояние ? = 0. Таким обра-
лом, без нарушения общности рассмотрим задачу управления сис-
системой C.51) относительно нулевого состояния. Управляемой пере-
переменной С в этой задаче, очевидно, является состояние |
С (*) = !(«)• \ C.56)
240 Глава 3
Выберем в качестве критерия оптимальности выражение
'iS'Ci) C-57)
при р > 0, jtx >¦ 0. Этот критерий гарантирует, что отклонения
;? (?) относительно нуля ограничены [т. е. | (t) близко к соо], что \i(t)
не слишком велико l\a{t) не отклоняется сильно от значения ц0] и
что терминальное состояние | (?х) близко к нулю [| (^) близко к
w0]. Величины рил, должны быть определены методом проб и
ошибок. Используем следующие значения а и *:
а = 0,5 с,
C.58)
у. = 150 рад/(В-с2),
Пример 3.4. Управление положением
В примере 2.4 (разд. 2.3) была рассмотрена задача управления
положением двигателя постоянного тока. Система описывается
дифференциальным уравнением состояния
x{t)=(°o -1)х{*) + [1)^-. ' C'59)
где компонентами x(t) являются угловое положение | $) и угловая
скорость ? 2{t), а входная переменная \i{t) представляет собой нап-
напряжение на входе усилителя постоянного тока, который управля-
управляет двигателем. Предположим, что необходимо обеспечить постоян-
постоянное положение ?10. Как и в предыдущем примере, сдвинем начало
координат пространства состояний, чтобы получить обычную за-
задачу регулирования. Введем новую переменную состояния x'(t) с
компонентами
C.60)
Простая подстановка показывает, что x'(t) удовлетворяет диф-
дифференциальному уравнению состояния
^!) C-6l)
Отметим, что в отличие от предыдущего примера не требуется
определять новую входную переменную. Это следует из того фак-
факта, что можно обеспечить любое постоянное угловое положение
при нулевой входной переменной. Так как система C.61) идентична
Оптимальные линейные СУ с обратной свя&ью 2А1
C.59), опустим штрихи и рассмотрим задачу управления системой
C.59) относительно нулевого состояния.
Для управляемой переменной выберем угловое положепие
C(*)=?i@ = .(l, O)x(t). C.62)
Соответствующий критерий оптимальности имеет вид
V(*) + pp2(OH*- C.63)
Положительный скалярный коэффициент р определяет отно-
относительный вес каждого члена в подынтегральном выражепии.
При этом используются следующие значения а и ¦*.:
а = 4,6 с,
C.64)
у. =0,787 рад/(В-с2).
3.3.2. РЕШЕНИЕ ЗАДАЧИ РЕГУЛИРОВАНИЯ
Решим задачу построения детерминированного оптимального
регуляторд с помощью обычных методов вариационного исчисле-
исчисления. Для этого целесообразно переписать критерий C.45) в форме
l' [хт (t) Rl (t) x (t) + uT (t) R2 (t) и (t)] dt + xT (tJPlX(td, C.65)
где R^t) — неотрицательно определенная симметрическая матрица
Rl(t) = Dr(t)R3(t)D(t). C.66)
Предположим, что существует входная переменная, которая
минимизирует критерий. Обозначим эту переменную через и0 (t),
tn < t < tx. Рассмотрим теперь входную переменную
u(t) = u°(t) + sZ(t), to<.t<tu C.67)
где u(t) — произвольная функция времени, а е — произвольное
число. Выясним, каким образом изменение входной переменной
нлияет на критерий C.65). Вследствие изменения входной перемен-
переменной будет изменяться состояние, например от х° (t) (оптимальное
поведение) до
x(t)=x°(t) + zlc(t), to<t<tt. C.68)
Определим x(t). Решение уравнения C.68) относительно x(t)
должно удовлетворять дифференциальному уравнению состояния
Ч 394
242 Глава 3
C.42), в котором u(t) выбирается в соответствии с выражением
C.67). В результате получим
х° (t) + в x(t) = A (t) х° (t) + s A (t) x(t) +
+ В (t) u° (t) + tB (t) Z (t). C.69)
Поскольку оптимальное решепие также должно удовлетворять
дифференциальному уравнению состояния, имеем
ifl(t) = A(t)x°{t)-\-B{t)u^(t). C.70)
Подстановка C.69) и C.70) и исключение е дает
x(t) = A(t)x(t) + B(t)u(t). C.71)
Поскольку начальное состояние не изменяется, если входная
переменная изменяется в диапазоне от u°(t) до u°(t) -|- eu(t), io<
<:?<:?!, то имеем x(t0) = 0, и решение C.71) с использованием
A.61) можно записать в виде
x(t)= \ <b(t,x)B(x)u(-z)dx, C.72)
и
где Ф(?, t0) — переходная матрица системы C.71). Отметим,
что x(t) не зависит от е. Теперь рассмотрим критерий C.65). С уче-
учетом C.67) и C.68) можно записать
и
j [xT (t) Д, (t) x{t) + uT (t) R2 (t) и (t)] dt + xT (*,) P, x (*,) =
и
= j' [xOT(t) Д, (t) x» (t) + u0T (t) R2 (t) u° (t)] dt + x0T (t,) Pi x^ (t{) +
и
(f, ^ ^ \
+ 2e J Г [~xT (t) Д, (t) x° (t) + ZT(t) R2 (t) u° (t)\ dt + хт Ц{)РХ x^tM +
j' [ZT(t) Rt (t)Z(t) + ZT(t) R2 (t) u(t) ] dt -y
.to
+ ~xT(ti)Plx(ti)}. C.73)
Так как u°(t) — оптимальная входная переменная, вследствие
изменения входной переменной в диапазоне от u°(t) до значения
C.67) величина критерия может только возрасти. При этом пред-
Оптимальные линейные СУ с обратной связью 243
полагается, что выражение C.73) как функция е должно иметь
минимум при е — 0. Поскольку C.73) является квадратическим
выражением относительно е, минимум при 8=0 может сущест-
новать только в том случае, если первая производная по е равна
нулю при е = 0. Тогда получим
+H:T(tl)P1xo(ti)=0 C.74)
Подстановка C.72) в C.74) после изменения порядка интегри-
интегрирования и переменных дает
f" ZT (t) I Вт (t) ( Фт (г, t) Д, (т) х° (,) dz + R2 (t) u° (t) +
4- Вт (t) Фт (tt, t) P, x° (tj} dt = 0. C.75)
Введем обозначение
р (t) = ( Фт (-, t) Rl (х) хп (т) dz + Фт (tir t) P, x° (tt). C.76)
t
С учетом этого обозначения интеграл C.75) можно записать в
более компактном виде
ti
f uT (t)[BT (t) p{t) + R2(t)u* (t)) dt~O. C.77)
и
Ото соотношение справедливо для всех u(t), ?0«: t <. tlt если
r Ra(t)u°(t) = O, to<t<.ti. C.78)
Предполагая, что R2(t) является несингулярной матрицей при
Ai < t < tu можно написать
u°(t)= ~R-l(t)BT(t)p(t), to<ct<tv C.79)
Если функция p(t) известна, то это соотношение позволяет оп-
определить оптимальную входную переменную в момент t.
Преобразуем соотношение C.76) для p(t) в дифференциальное
уравнение. При подстановке t = tL видно, что
. C.80)
Дифференцируя C.76) по t, получим
p(t) = - Д, @ х° (t) - Ат (t) p (t), C.81)
244 Глава 3
где использовано соотношение из теоремы 1.2,г (разд. 1.3.1):
-~ФТ{Ч, t) = -AT(t)<bT(t0, t). C.82)
Теперь можно составить уравнения в вариациях. Подстановка
C.79) в дифференциальное уравнение состояния дает
x\f) = A (t) z° (t) - В (t) В-1 (t) BT (t) p (t). C.83)
Совместно с C.81) это уравнение образует систему 2п линейных
дифференциальных уравнений для п компонент x°(t) и п компонент
p(t). Назовем p{t) сопряженной переменной. Тогда 2п граничны-
граничными условиями для дифференциальных уравнений являются
3?(to) = xo C.84)
PlX°(tJ. C.85)
Видно, что граничные условия удовлетворяются на противо-
противоположных концах интервала Uo, tt\. Это означает, что задача явля-
является двухточечной краевой. Чтобы решить эту задачу, запишем
совместно дифференциальные уравнения C.83) и C.81) в форме
*®\(А® -вюн;ЧГм\/*у\ {ЗЩ
p(t) ] \~RUt) -Af{t) j\p(t) )
Рассмотрим это дифференциальное уравнение состояния линей-
линейной системы размерности 2п с переходной матрицей 8 (t. t0). Пред-
Представим эту переходную матрицу, соответствующую выражению
C.86), в виде
/ ц if f \ н (t t \ \
I . (о.Ы)
При таком разбиении можно выразить состояние в промежуточ-
промежуточный момент времени t через переменную состояния и сопряжен-
сопряженную переменную в конечный момент времени t± следующим обра-
образом:
х° (t) = 6И (t, t{) Xй (td + 612 (t, tt) p (tj. C.88)
С учетом конечного условия C.85) имеем
Аналогично можно написать для сопряженной переменной
= [б21 {t, td + 622 (*, h) P\] *° (*i)- Ф-Щ
Оптимальные линейные СУ с обратной связью 245
Исключая 2й (<j) из C.89) и C.90), получим
(*, *0 + б!2 (*, *l) ЛГ* *° @- C-91)
Выражение C.91) показывает, что существует следующее
линейное соотношение между p(t) и z°(t):
= P(t)a*(t), C.92)
где
р (t) = [вг1 (*, *о + е22 (^, g р,] [9И G, f,) + е12 (г, ^ р,г. C.93)
Используя C.79), получим выражение для оптимальной вход-
входной переменной
u°(t) = —F(t)a»(t), C.94)
где
F(t) = R~x (t)BT(t)P(t). C.95)
Последнее выражение являете»/ решением задачи синтеза ре-
регулятора, которое получается в предположении, что оптимальное
решение существует. Подытожим полученные результаты сле-
следующим образом.
Теорема 3.3. Рассмотрим задачу построения детерминирован-
детерминированного линейного оптимального регулятора. Тогда оптимальную
входную переменную можно задать с помощью линейного закона
¦°(t), C.96)
где
F(t) = R2l (t)BT (t) P (t). C.97)
Матрица P(t) определяется выражением
P{t) = [S21 (t, t±) + 622 (t, t{) P,\ [6И (t, t,) + Bl2 (t,t{) ЛГ1, C-98)
где бп(г, t0), B12(t, t0), 6a](i. t0) и 6„,(г, ta) получаются путем разбие-
разбиения переходной матрицы B(t, i0) дифференциального уравнения
состояния
<t)\ (A(t) —B(t)B~l (t)BT (t)\fj(t)\
\p(t)J \-RAt) ~AT{t) J\p(t)J
где
Rl(t) = DT(t)R3(t) D(t). C.100)
Эта теорема дает решение задачи в форме линейного закона.
Закон управления автоматически задает оптимальную входную
переменную для любого начального состояния. Интерпретация с
246 Глава 3
Матрица
усиления
обратной
связи
F(t)
Рис. 3.3. Блок-схема оптимального линейного регулятора с обратной связью.
помощью блок-схемы дана на рис. 3.3, где наглядно показан зам-
замкнутый характер решения.
Постановка задачи регулирования, данная в определении 3.2,
конечно, не обязательно предполагает замкнутую форму решения.
Можно также, как и раньше, получить разомкнутое решение.
Выражение C.89) в момент t0 сводится к виду
Ч = [9ц Co. h) + 91а (*0, *0 РА *° (*,). C.101)
и подставляя результат в
Разрешая C.101) относительно х°
(З.УО), получим.
= [еа,(*, f,) + 922(f, *,) Р{] [Qn(t0, t,) + Qit(t0,
На основе C.79) имеем
x0.
C.102)
u° (t) = - R-1 (t) BT (t) [921 (t, *,) + 922 (t, t,) P41 [0И (t0, tt)
+ Qi2(to,tl)Pi]-1xo, to*ct<tv C.103)
Это соотношение описывает программное изменение входной
переменной для данного х0. Соответствующее изменение состояния
определяется при подстановке х(гг), полученпого из C.101), в
C.89):
х° @ = [0и(*, tt) + Qi2(t, t,) Р,\ [dn(t0, t,) + Qlt(t0, tj Pt]-i x0, C.104)'
С учетом преимуществ замкнутого управления, рассмотренных
в гл. 2, для практической реализации, конечно, предпочтительнее
замкнутая форма решения C.96) в отличие от разомкнутой формы
C.103). В разд. 3.6, в котором рассматривается задача построе-
построения стохастического регулятора, показано, что обратная связь
по состоянию является не только предпочтительной, но и просто
необходимой.
Оптимальные линейные СУ с обратной связью 247
Пример 3.5. Стабилизация угловой скорости
Задача стабилизации угловой скорости из примера 3.3 (разд.
3.3.1) является наиболее простым нетривиальным применением
теории, рассмотренной в этом разделе. Совместные уравнения C.99)
для переменных состояния и сопряженных переменных теперь име-
имеют вид
) = ( ~° "~\1Ш ]. C.105)
%(t)J \-l а JU(t)J
Для этой системы дифференциальных уравнений можно опреде-
определить переходную матрицу
/
/
\
где
Л) =
л_7 (*—<„) ч?
2PY
¦«_<„) 1 7 + а 1
27
+
_
~ (
C.106)
т==]/а2+. —. C.107)
Чтобы упростить обозначения, представим переходную матри-
матрицу в виде
C.108)
Из C.103) и C.104) следует, что в разомкнутой форме оптималь-
оптимальная входная переменная и состояние определяются соотношениями
^0 (А = 211 , 1 ^ 22 , у 1 |о) C
Р 1 ('0> 'l) + 2 ('0> *l) л1
/A=
Па рис. 3.4 показаны оптимальные траектории и изменение
оптимальной входной переменной для различных значений весо-
весомого коэффициента р. При этом использовались следующие зна-
значения а, х, t0 и tr:
0 = 0,5 0-!,
х= 150 рад/(В-с2), C.111)
?0 = 0 с, tt = 1 с.
248 Глава 3
Рис. 3.4. Поведение переменной состояния и входного воздействия в аадаче
отслеживания угловой скорости при различных значениях q (ni = 0).'
В данном случае весовой коэффициент я i полагался равным ну-
нулю. Из рисунка наглядно видно, что при уменьшении р амплиту-
амплитуда входной переменной возрастает, тогда как продолжительность
переходного процесса уменьшается.
.На рис. 3.5 показано влияние весового коэффициента ni при
постоянном коэффициенте р. Видно, что с увеличением л i конечное
состояние стремится приблизиться к нулевому состоянию за счет
Оптимальные линейные СУ с обратной связью
2А9
-0,2
А-о,з
Рис. 3.5. Поведение переменной состояния и входного воздействия в задаче
стабилизации угловой скорости при различных значениях лх(р = 1000).
несколько большей амплитуды входной переменной в конце ин-
интервала.
Предположим теперь, что отклонения начального состояния
не превышают ±100 рад/с, а амплитуда входной переменной огра-
ограничена величиной ±3 В. Тогда на рис. 3.4 и 3.5 следует, что рацио-
рациональная величина р составляет около 1000. Величина л l оказывает
влияние практически лишь в конце иптервала времени [t0, tj].
Рассмотрим теперь решение в форме обратной связи. Из теоре-
теоремы 3.3 следует, что оптимальные траектории рис. 3.4, 3.5- можно
получить с помощью закона управления
. v4t) = -F(t)t(t), C.112)
где переменный скалярный коэффициент F(t) определяется выра-
выражением
. h) *i
C.113)
На рис. 3.6 показано изменение коэффициента F{t), соответст-
250 Глава 3
B(padlc)
0,05 -
p = 100, X-,=0
-
p no ooo, x^o
pHOOO ___
г
It,
X
-0,5/\
—-J
0 0,5 ^ c 1
Рис. З.6. Поведение оптимального коэффициента усиления обратной связи в
задаче1 стабилизации угловой скорости при различных значениях р и щ.
вующее различным численным значениям, используемым на рис.
3.4 и 'Л.Г). Из рис. 3.6 видно, что в большинстве случаев коэффициент
усиления F(t) является постоянным почти на всем интервале [t0, tj].
Однако в конце интервала наблюдаются изменения. Видно также,
что при величине „-ц = 0,19 коэффициент усиления постоянен
почти на всем интервале. Такая величина коэффициента усиления
весьма целесообразна с практической точки зрения, так как реа-
реализация переменного коэффициента сложна. Сравнение графиков
прид! = 0,19 на рис. 3.5 с другими кривыми показывает, что ко-
коэффициент F можно считать практически постоянным, если не учи-
учитывать конечного состояния.
3.3.3. ВЫВОД УРАВНЕНИЯ РИККАТИ
Рассмотрим несколько дополнительных вопросов, связанных
с матрицей P(t), определяемой выражением C.98). В дальнейшем
анализе матрица P(t) играет важную роль. Для нее можно полу-
получить дифференциальное уравнение. С этой целью продифференци-
продифференцируем матрицу P(t) no t. Используя правило дифференцирования
обратной .матрицы M(t), зависящей от времени:
_2_ м-1 (t) = — М'1 (t) M (t) М-1 (t),
dt
C.114)
Оптимальные линейные СУ с обратной связью 251
которое может быть доказано путем дифференцирования единичной
матрицы М(t) М'1^) — /, получим
р @ •= [021 (t, h) + 022 (t, t,) p,i [ви (t, t,) + el2 (t, tj p±t1 —
- [92i (*, *i) + e22 (t, tt) pt\ [0lt (t, *,) - г е12 (*, f j) pj-i [ 0H (t, t,) +
+ ё12(г, t^p^d^t, tt) + ol2(t, tjpj-1, (З.И5)
где точка обозначает дифференцирование по t. Так как d(t, t0) яв-
является переходной матрицей для C.99), имеем
еи (t, t{) = a (t) еи (t, ti) — в (t) r~* (t) вт (t) o21 (^, tj,
'•' C.116)
i, tt)~B(t) R~[ (t) BT{t)
021 (*. «l) = - «i («) 011 (*, *.) - AT (t) 021 (*, *i).
e22 (*, t,) = - д4 (*) e12 (*, *,) - лг (t) eJ2 (*, ^).
Подставляя эти выражения в C.115), получим после перегруп-
перегруппировки следующее дифференциальное уравнение:
- P{t) = Bt (t) -P{t) В (t) R-* (t) BT (t)P(t) +
+ P(t)A(t) + AT(t)P(t). C.117)
Граничное условие для этого дифференциального уравнения
определяется путем подстановки t ~ tk в C.98). Отсюда следует
P(ti) = Pi. C.118)
Матричное дифференциальное уравнение, полученное таким
образом, подобно хорошо известному уравнению
-%- + a(z)y + $(x)y* = y(x), C.119)
dx
где х — независимая", у — зависимая переменные, a ol{x), f>(x) и
у (х) — известные функции х. Это уравнение называется урав-
уравнением Риккати [44]. По аналогии будем называть уравнение
C.117) матричным уравнением Риккати [86].
Отметим, что, поскольку матрица Ри являющаяся конечным
условием для P(t), симметрична и матричное дифференциальное
уравнение для P(t) также симметрично, решение для P(t) должно
быть симметричным для всех t0 < t < tv Эта симметрия будет
часто использоваться, особенно при вычислении Р.
Дадим интерпретацию матрицы P(t). Оптимальная замкнутая
252 Глава 3
система описывается дифференциальным уравнением состояния
z(t) = \A(t)-B(t)F(t)\r(t). A.120)
Рассмотрим в связи с этим критерий оптимальности C.65), вы-
числяемый-на интервале [t, .?j. Напишем
( [хт (?) Я, (х) х (х) + ит (т) R2 {z) и (хI dx + / (^ Р, х (t{) =
f
= f x^^lfliW+F^^R^^F^lar^^ + x7"^,)^^!) C-121)
так как
u(v)=-F(x)x(d. C.122)
На основе результатов разд. 1.11.5 (теорема 1.54) выражение
C.121) можно записать в виде
хт (t)P(t)x(t), C.123)
где P(t) — решение матричного дифференциального уравнения
- Р (t) = Я, @ + FT (t) R2 (t) F(t) + P (t) [A (t) -B(t)F (*)] +
+ [A(t)~B(t)F(t)]TP(t) .
с C.124)
P(h) = Pi.
Подставляя F(t) = R-l(t)BT{t)P(t) в C.124), получим
— ?(*) = Я, (*) + P (*) В (t) i?-1 («) ВГ (t) P («) + P (t) A (t) -
-P(t)B(t)R-1 (t) BT (t) P (t) + AT(t)P (t) -
~P{f)B(t)R~l {t)BT(t)P(t). C.125)
•Можно утверждать, что решение этого матричного дифферен-
дифференциального уравнения в точности равно P(t):
P(t) = P(t). C.126)
Это легко показать, так как при подстановке P(t) в выражение
для P(t) дифференциальное уравнение C.125) сводится к виду
— />(*) = Я, (*) —P(t)B (t) R~' (t) BT (t) P (t) +
+ P(t)A(t) + AT(t)P(t). C.127)
Оптимальные линейные СУ с обратной связью ¦ 253
Это уравнение является матричным уравнением Риккати C.117),
которое удовлетворяется подстановкой P(t); кроме того, конечпое
условие корректно. Этот вывод также показывает, что матрица
P{t) должна быть неотрицательно определенной, так как выраже-
выражение C.121) является неотрицательным, поскольку матрицы Rx,
R2 и Р{ — неотрицательно определенные.
Сформулируем выводы в следующем виде.
Теорема 3.4. Оптимальная входная переменная в детерминиро-
детерминированном оптимальном линейном регуляторе задается линейным
¦законом управления
uo{t) = —Fo{t)x°(t), C.128)
где
F*{t) = R~x {t)BT {t)P(t). C.129)
Тогда существует симметрическая неотрицательно определен-
определенная матрица P(t),> удовлетворяющая матричному уравнению
Риккати
-P{t) = Я, (*) -P(t)B (t) R-* (t) BT (t) P (t) +
+ P(t)A(t)+AT(t)P(t) C.130)
с конечным условием
¦ Р(*,) = Л. C.131)
и где
Ri(t) = DT(t)Ra(t)D{t).
Для оптимального решения имеем соотношение
h
j [х0Т (х) Я, (г) х° (х) + иОТ (z) Яа (т) и° (т)] ch +
+ хот {td Р^з* fr) = хот (t) P {t) з* (t), t^ty C.132)
Видно, что матрица P(t) позволяет не только найти оптималь-
оптимальный закон управления с обратной связью, но и оценить величину
критерия для любых заданных начального состояния и начального
момента времени.
Из выводов этого раздела рассмотрим следующий результат
11851, который будет полезен при решении задачи, построения
стохастического линейного оптимального регулятора и задачи
оптимального наблюдения.
Лемма 3.1. . Рассмотрим матричное дифференциальное уравнение
254 Глава 3
- Р (t) = Rt (t) + FT (t) R2 (t) F(t) + P (t) [A (t) -B(t)F @1 +
+ [A(t)~B(t)F(t)fP(t) C.133)
с конечным условием
P(td = Pu C.134)
где Rift), R2(O, d(t), B(t) — заданные переменные во времени
матрицы соответствующей размерности, причем Bt(t) — неот-
неотрицательно определенная матрица, R^(t) — положительно опре-
определенная матрица при t0 ¦<: t ¦<: tlt a Pi — неотрицательно
определенная, матрица. Пусть F(t) — произвольная непрерывная
матричная функция при t0 <: t < tL. Тогда для
P(t)>P(t), C.135)
где P(t) — решение матричного уравнения Риккати
— Р @ = Л. (t) — P(t)B (t) R-1 (t) BT (t) P (t) +
+ P(t)A(t)-\-AT(t)P(t), C.136)
имеем
P(ti)=Pi. ' C.137)
Неравенство C.135) преобразуется в равенство, если
F (-) == R~l (-с) ВТ (г) Р (х) для t < z < t{. C.138)
Лемма предполагает, что P(t) «минимизируется» в соответствии
с C.135), если выбрать функцию F, как указано в C.138). Дока-
Доказательство является песложным. Выражение
хт (t) P (t) х (t) C.139)
представляет собой критерий C.121), если система управляется
с помощью линейного закона
u(i) = —F(')x(-), *<*<*!. C.140)
Оптимальный закон управления, который является линейным
и, как следствие, наилучшим линейным законом управления,
дает величину критерия, равную xT(t)P(t)x(t) (теорема 3.4), так
что
xT(t)P(t)x(t)^xT(t)P(t)x(t) для всех x(t). C.141)
Это и требовалось доказать.
Оптимальные линейные СУ с обратной связью
255
0,5
О, к
0.2L
0,1 -
- P.m.xt.
-~^
0
-0
J
—^^
о = 1000
I
Л, -- 0,5
0,5
t,c
Рис. 3.7. Поводонио P(t) в задаче стабилизации угловой скорости при различ-
различных значениях р и jii.
Закончим этот раздел замечанием о существовании решения
задачи синтеза регулятора. Можно показать, что при условиях,
сформулированных в определении 3.2, задача построения детер-
детерминированного линейного оптимального регулятора имеет един-
ствонпое решение. Существование решения задачи также гаранти-
гарантирует 1) существование обратной матрицы в выражении C.98) и
2) единственность решения C.98) матричного уравнения Рйккати
C.130) с копечпым условием C.131). Вопросы существования
решения задачи и решения уравнения Рйккати рассмотрены в
работах Калмапа [86], Атанса и Фалба [8], Вонхэма [185], а также
в работах [26, 29, 91, 129, 158].
Пример 3.6. Стабилизация угловой скорости
Продолжим рассмотрение примера 3.5. Здесь P(t) является ска-
лярпой функцией, удовлетворяющей скалярному уравнению
Рпккати
О C.142)
с конечным условием
P{ti) = *t. C.143)
К этом скалярном случае уравнение Рйккати C.142) может быть
решено непосредственно. Однако с учетом результатов, полученных
is примере 3.5, целесообразнее использовать соотношение C.98).
Поэтому напишем
(Mi)
(Mi) *i
8n(Mi)-
(Mi)
C.144)
где 0tj определяется таким же образом, как в примере 3.5. На рис.
'АЛ показано изменение P(t) для некоторых рассмотренных ранее
256 Глава 3
случаев. Отметим, что матрица P(t), так же как и коэффициент F(t),
является постоянной почти на всем интервале [t0, /J, за исключени-
исключением участка на колце. (Это не удивительно, так как Р(t) и F(t) раз-
различаются только постоянным коэффициентом.)
3.4. Установившееся решение задачи
построения детерминированного
линейного оптимального регулятора
3.4.1. ВВЕДЕНИЕ И АНАЛИЗ ОСНОВНЫХ РЕЗУЛЬТАТОВ
В предыдущем разделе била рассмотрена задача минимизации
критерия
t,
j [ zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt + xT (*,) Ptx (y C.145)
для системы
x{t) = A{t)x{t)+B(t)u(t),
C.146)
z(t) = D(t)x(t),
в которой терминальное время t1 конечно. С практической точки
зрения естественно рассматривать очень длинные интервалы [t0,
tj]. Поэтому в данном разделе будет детально исследова-
исследовано асимптотическое поведение решения задачи детерминированно-
детерминированного регулирования при t1 —>- оо.
Основные результаты этого раздела можно суммировать сле-
следующим образом.
1. Когда терминальное время t1 возрастает до бесконечности,
решение P(t) матричного уравнения Риккати
-P(t) = DT (t) Rs (t) D(t)-P (t)B (t) Д-1 (t) BT (t) P (t) +
+ AT (t) P (t) + P (t) A (t) • # C.147)
с конечным условием
P{h) = Pi C.148)
обычно стремится к установившемуся решению Рft), которое не
зависит от Р1ш
Условия, при которых это имеет место, точно определены в разд.
3.4.2. Далее будет также показано, что в случае неизменных во
времени параметров, т. е. когда матрицы А, В, D, /?а и i?2 постоян-
Оптимальные линейные СУ с обратной связью 257
ны, установившееся решение Р также постоянно и является реше-
решением алгебраического уравнения Риккати
0 = DTRsD — ~P~BR~l ВТ р+АтР +РА. C.149)
Легко установить, что Р является неотрицательно определен-
определенной, матрицей. Докажем, что в общем случае (точные условия
заданы) установившееся решение Р является решением алгебраи-
алгебраического уравнения Риккати, которое неотрицательно определено и
может быть определено единственным образом.
Для установившегося решения уравнения Риккати получаем
соответственно установившийся закон управления
u(t)=—'F(t)x(t), C.150)
где . _ _
F{t)= R-* (t)BT(t)P(t). C.151)
Ниже будет показано, что установившийся закон управления
минимизирует критерий C.145), где ?г = оо. Весьма важен сле-
следующий вывод.
2. Установившийся закон управления.в общем случае асимптоти-
асимптотически устойчив. Снова будут определены точные условия. Этот
факт интуитивно понять нетрудпо. Так как интеграл
[ zT (t) R3 (t) z (t) + uT (t) #2 (t) и (*)] dt C.152)
существует для установившегося закона управления, следователь-
следовательно, в замкнутой системе u(t) —*- 0 и z(t} —*- 0 при / —*- оо. В об-
общем случае это справедливо, если x{t) -*¦ 0, т. е. когда система
асимптотически устойчива.
Последний вывод очень важен, поскольку теперь мы распола-
располагаем методами синтеза линейных систем с обратной связью, кото-
которые асимптотически устойчивы и в то же время имеют оптималь-
оптимальные характеристики переходного процесса в том смысле, что любое
ненулевое начальное состояние переводится в нулевое состояние
оптимальным образом. Для систем с постоянными параметрами этот
вывод является хорошим дополнением к теории стабилизации,
рассмотренной в разд. 3.2, где было показано, что любая система
с постоянными параметрами в общем случае, может быть стабилизи-
стабилизирована с помощью линейного закона с обратной связью, а полюса
замкнутой системы можно разместить произвольно. Решение
задачи синтеза регулятора дает метод рационального распределе-
распределения полюсов. Вопрос об оптимальном распределении полюсов
замкнутой системы будет снова рассмотрен в разд. 3.8.
258 Глава 3
Пример 3.7. Стабилизация угловой скорости
Для задачи стабилизации угловой скорости, рассмотренной в
примерах 3.3, 3.5 и 3.6, решение уравнения Риккати описывается
выражением C.144). Легко определить с помощью C.106), что при
tl —>• оо
Ч-^-). C.153)
Решение- Р можно также найти из алгебраического уравнения
C.149),. которое в этом случае сводится к виду
0=1 —Р2—2аР. C.154)
Р
Это уравнение имеет решения
-o± V^ + ^r ¦ C-155)
Так как Р должно быть неотрицательным, получаем, что C.153)
является точным решением.
Соответствующий установившийся коэффициент усиления оп-
определяется выражением
(/) C.156)
Подставляя
V.(t)=-Ft(t) C.157)
в дифференциальное уравнение состояния системы, получим сле-
следующее дифференциальное уравнение состояния замкнутой сис-
системы:
Очевидно, что эта система асимптотически устойчива.
Пример 3.8. Управление положением
Как более сложный пример рассмотрим задачу управления
положением из примера 3.4 (разд. 3.3.1). Установившееся решение
Р уравнения Риккати C.147) должно теперь удовлетворять урав-
уравнению
C.159)
Оптимальные линейные СУ с 'обратной связью 2о9
Пусть Р ij, l-j — 1,2, обозначает элементы матрицы Р. Тог-
Тогда, учитывая Р12 = Р-п- получим из C.159) следующие алгебраи-
алгебраические уравнения:
"Г 12> .
р
р 22
Эти уравнения имеют несколько решений, однако легко проверить,
что только неотрицательно определенному решению удовлетворя-
удовлетворяют соотношения
Ри =
f V«'
Кр
-a
V?
Соответствующая матрица коэффициентов обратной связи для
установившегося состояния определяется выражением
(ЗЛ62)
Таким образом, входная переменная равна
p(t)= —Fx(t). C.163)
Легко показать, что оптимальная замкнутая система описыва-
описывается дифференциальным уравнением состояния
О 1
C.164)
Характеристический полином замкнутой системы имеет вид
Ур Ур
а характеристические числа равны
1 —--—
9
C.165)
C.166)
260 Глава 3
--10
--15
Рис. 3.8. Годограф корней замкнутой системы управления положением в
функции р.
На рис. 3.8 приведеп годограф характеристических чисел зам-
замкнутого контура при изменении р. Интересно отметить, что при
уменьшении р полюса замкнутого контура перемещаются в бес-
бесконечность вдоль двух прямых линий, образующих угол тг/4 с от-
отрицательной вещественной осью. Асимптотические значения по-
полюсов замкнутой системы определяются выражением
—— -— 1--2(— 1±;) при р-^0. C.167)
р /4 ~.
На рис. 3.9 показан переходный процесс в оптимальной зам-
замкнутой системе, соответствующий следующим значениям парамет-
параметров:
у. =0,787 рад/(В-с2),
а = 4,6 с, C.168)
р = 0,00002 Рад2/В2.
Оптимальные линейные СУ с обратной связью
261
I
t. с
0,5-
Рис. 3.9. Реакция оптимальной системы управления положением па началь-
начальные условия ?i@) = 0,1 рад, ?г@) = 0 рад/с.
Соответствующая матрица коэффициентов усиления равна
7 = B23,6; 18,69), C.169)
¦а вычисленные полюса замкнутой системы составляют —9,658 +
± /9,094. Видно, что данная схема эквивалентна схеме с обратной
¦связью по положению и скорости, рассмотренной в примере 2.4
(разд. 2.3). Матрица усиления C.169) оптимальна с точки зрения
характеристик переходного процесса. Интересно' отметить, что
современные методы проектирования реализуются в виде системы
второго порядка с относительным демпфированием ) 2/2, которое
точно такое же, как и в примере 2.7 (разд. 2.5.2), где исследована
наиболее рациональная схема.
Заканчивая обсуждение, отметим, что, как следует из примера
3.4, если x(t) представляет собой отклонение от некоторого равно-
равновесного состояния х0, не являющегося нулевым состоянием, то
в законе управления C.163) необходимо заменить x(t) на x'{t),
*'(*>=
l
io
C.170)
а1ю — заданное угловое положение. В итоге получим закон уп-
управления
-Л[?,(О-?1о]-^г(О. ' C-171)
262 Глава 3
где F = (Fx, Fcj,). Блок-схема системы, соответствующая этому
закону управлеЕшя, приведена на рис. 3.10.
Пример 3.9. Смесительный бак
В качестве другого примера рассмотрим смесительный бак из
примера 1.2 (разд. 1.2.3). Предположим, что необходимо стабили-
стабилизировать выходной расход F(t) и выходную концентрацию с(?).
Поэтому в качестве управляемой переменной выберем
Здесь используются численные значения из примера 1.2. При оп-
определении весовой матрицы R3 будем придерживаться тех же сооб-
соображений, что и в примере 2.8 (разд. 2.5.3). Номинальная величина
выходного расхода составляет 0,02 м3/с, а номинальная величина
выходной концентрации — 1,25 кмоль/м3. Предположим, что
матрица R3 выбрана диагональной с диагональными элементами
ах и а2. Тогда
-J (t) R3 z (t) = a, 1* (t) + Oi i\ (t), C.173)
где z(t) = col(Cj(?), C2@)- Если изменение выходного расхода на
10% @,002 м3/с) должно производить такое же изменение крите-
критерия, как 10%-иое изменение выходной концентрации (~0,1
кмоль/м3), то должно существовать примерное равенство
<7! • 0,0022»а2. ОД2, C.174)
т. е.
-^-«2500. C.175)
Поэтому выберем
а! = 50, а2=1/50, C.176)
или
п /50 0 \ .„ ,„ч
R3= . 3.177)
3 \0 0,02/ V
Чтобы выбрать матрицу i?2, используем такой же подход-
Изменение расхода F1 на 10% составляет 0,0015 м3/с, в то время
как 10%-ное изменение расхода F2 равно 0,0005 м3/с. Выберем
R2 = diag (pi,p2)- Тогда изменение расходов Fx и F2 на 10% вызо-
вызовет изменение величины критерия, равное
р4 • 0.00152 + р2 • 0.00052. C.178)
Заданное
полотенце
г
h
•
Входное
-*\ напряжение filt)
J
Усилитель
постоянного
тока
F.
Гг
Двигатель
постоянного
тока
0
Угловая скорость ?2(t)
Угловое
положение
Тахо-
Тахометр
i,M
Поте
ме
нцио-
vp
Рис. 3.10. Блок-схема оптимальной системы управления положением.
Концентрация ?2W, кмоль/м3 Объем t,(t), м3
Концентрация ?гA),кмоль/м3
Объем Zf(t),
50
t,c
100
50
t,c
100
I
SO
t,c
Г
100
Рис. 3.11. Реакции замкнутой системы регулирования смесительного бака при различных значениях весового
коэффициента р.
Слева — реакции по приращению объема и концентрации в потоках MS 1 и 2 на начальное состояние х @) = col @.1, 0); справа — реакции
по приращению объема и концентрации в потоках № 1 и 2 на начальное состояние х @) = col @, 0,1).
26G Глава 3
Обе составляющие вносят одинаковое изменение, если
Поэтому выберем
Pi
н
9
v3 о
О 3
C.179)
C.180)
где р — скалярная константа, которую необходимо определить.
На рис. 3.11 приведены характеристики оптимальной замкну-
замкнутой системы в установившемся режиме при р = оо, 10, 1 и 0,1.
Случай р = оо соответствует разомкнутой системе (управление
отсутствует). Видно, что с уменьшением р непрерывно возрастает
быстродействие за счет все большего увеличения амплитуды вход-
входной переменной. В табл. 3.1 приведены характеристики замкнутой
Таблица 3.1
Распределение установившихся полюеов оптимальной
замкнутой системы регулирования смесительного бака
в функции р
Оптимальные полюса замкнутой системы, с
10
1
0,1
0,01
0,02952
0,07517
0,2310
—0 02
—0,04523
—0,1379
—0/i345
системы в функции р. Видно, что во всех случаях полюса замкну-
замкнутой системы находятся в левой области комплексной плоскости.
Здесь не указаны матрицы усиления F, пайденпые для каждо-
каждого значения р, однако оказывается, что они не диагональные i>, от-
отличие от рассмотренных в примере 2.8. Системы с обратной
связью, рассмотренные в настоящем примере, оптимальны в том
смысле, что являются наилучшим компромиссом между требова-
требованием максимального быстродействия и ограничениями по ампли-
амплитуде входной переменной.
И наконец, из графиков на рис. 3.11 видно, что в замкнутой
системе относительно невелико взаимовлияние, т. е. реакция на
начальное возмущение по концентрации слабо влияет на объем
бака и наоборот.
Оптимальные линейные СУ с обратной связью 267
.{.4.2*. СВОЙСТВА УСТАНОВИВШЕГОСЯ РЕШЕНИЯ ЗАДАЧИ
ОПТИМАЛЬНОГО РЕГУЛИРОВАНИЯ
В этом и последующем разделах рассматриваются свойства
установившегося решения задачи построения оптимальных регу-
регуляторов. Данный раздел посвящен общему случаю системы с пе-
переменными параметрами; в следующем разделе более детально
рассматривается случай системы с постоянными параметрами.
Большая часть результатов настоящего раздела получена Кал-
маном [86]. Авторы книги в той или иной степени следуют его
выводам.
Сформулируем сначала следующий результат.
Теорема 3.5. Рассмотрим матричное уравнение Риккати
-P(t) = D7 (t) R3 (t) D(t)-P (t) В (t) /?2-' (t) BT (t) P (t) + ¦
+ AT(t)P(t)+P(t)A(t). C.181)
Предположим, что матрица Aft) является непрерывной и ог-
ограниченной, матрицы B(t), D(t), R^ft) и R2(t) кусочно-непрерыв-
кусочно-непрерывны, и ограничены на интервале [t0, оо] и, кроме того,
R3(t)>-aJ, R2(t)>>$I для всех t, C.182)
где а и р — положительные константы.
1. Тогда, если система
x(t) = A(t)x(t)-\-B(t)u(t),
C.183)
z(t)=D(t)x(t)
а) полностью управляема или
б) экспоненциально устойчива,
то решение P(t) уравнения Риккати C.181) с конечным условием
l*(h) = 0 сходится к неотрицательно определенной матричной
функции P(t)npu t1 —у оо. Матрица P(t) является решением
уравнения Риккати C.181).
2. Кроме того, если система C.183)
в) одновременно полностью управляема и полностью восстанав-
восстанавливаема или
' г) экспоненциально устойчива,
то решение P(t) уравнения Риккати C.181) с граничным условием
^(h) -- Р\ сходится к P(t) при tl -у оо для любого Рх > 0.
Доказательство первой части этой теоремы не представляет
особых затруднений. Из теоремы 3.4 (разд. 3.3.3) известно, что
при конечном tx
268 Глава 3
ХТ (t) P (t) X (t) = min M I / (x) /?3 (х) z (х) +
+ "ГМ"й2М«(х)]йт1. C,184)
Это выражение, очевидно, является функцией конечного мо-
момента времени tx. Сначала установим, что эта функция tv имеет
верхнюю границу. Если система является полностью управляемой
[предположение (а)], то существует входное воздействие, которое
переводит состояние x(f) в нулевое состояние в некоторый момент
времени t\. Для этого воздействия можно вычислить величину
критерия
*\
\ [ zT (-с) R3 (x) z (т) + ит (х) Л2 (-) и (х)} dz, C.185)
)' -
которая является верхней границей для соотношения C.184), так
как, очевидно, можно принять u(t) = 0 при t -^ t\.
Если система экспоненциально устойчива (разд. 1.4.1), то x(t)
сходится экспоненциально к нулю, если принять u{i) ss 0. Тогда
интеграл
"' [ гт (,) R3 (х) z (х) + ит (х) R2 (x) и (т)] dx ¦=
сходится к конечному числу при ft -*¦ оо, поскольку предполага-
предполагается, что матрицы D(t) и /?з@ ограничены. Это число является
верхней границей для соотношения C.184).
Таким образом, показано, что выражение C.184) как функция
tx имеет верхнюю границу при предположениях (а) и (б). Более
того, вполне ясно, что как функция tx это выражение является
монотонно неубывающим. Предположим, "что это неверно. Тогда
должны существовать такие t\ и t'\ с t'\ > t\, что при'^ = t'\
величина критерия будет меньше, чем при tx ~ t\. Введем затем
входное воздействие, которое является оптимальным при t"\
на интервале [t0; t\\. Так как интеграл от критерия является не-
неотрицательным, то критерий на этом меньшем интервале должен
иметь величину, которая меньше или равна величине критерия
на большем интервале [?0> Ь"^\. Однако здесь возникает противо-
противоречие,' так как выражение C.184) должно быть монотонно неубы-
неубывающей функцией ty.
Оптимальные линейные СУ с обратной связью 200
Поскольку выражение C.184) как функция tx ограничено свер-
сверху и монотонне не убывает, то должен существовать предел при
ty -*- оо. Так как x(t) выбирается произвольно, то каждый из
элементов P(t) имеет предел, поэтому матрица P{t) также имеет
предел, который обозначим через P(t). Очевидно, что P(t) являет-
является неотрицательно определенной и симметрической матрицей.
Тот факт, что P(t) является решением матричного уравнения Рик-
кати, следует из непрерывности решений уравнения Риккати от-
относительно начальных условий. Следуя Калману [86], обозначим
через П(?; Рг, t'j) решение матричного уравнения Риккати с конеч-
конечным условием P^ty) = Рг. Тогда имеет место соотношение
~Р {t) = lim П (t; 0, t2) = lira П [t; П {tt; 0, t2) t{] =
= Hit; lim n(tx\ 0, t2), *,] = U[t, P(tt), tt] , C.187)
которое показывает, что P^ti) действительно является решением
уравнения Риккати. Доказательство остальной части теоремы
3:5 будет получено позднее.-
Назовем P(t) установившимся решением уравнения Риккати.
Этому установившемуся решению соответствует установившийся
оптимальный закон управления
u(t) = ~F(t)x(f), C.188)
где _ __
F{t) = R~l (t)BT {t)P{t). C.189)
Рассматривая устойчивость установившегося закона управле-
управления, получим следующий результат.
Теорема 3.6. Рассмотрим задачу построения детерминирован-
детерминированного линейного оптимального регулятора и предположим, что
выполняются допущения теоремы 3.5 относительно матриц А,
В, D, R3 и R.,. Тогда, если система
x{t) = A{t) x(f)-\-B{t) u(t),
C.190)
z{t)=D{t)x{t)
а) одновременно полностью управляема и полностью восстанав-
восстанавливаема или
б) экспоненциально устойчива,
то:
270 Глава 3
1) оптимальный закон управления в установившемся режиме
и (*) = — R~] (t) BT (t) P(t) x (t) . C.191)
экспоненциально устойчив;
2) закон управления C.191) минимизирует критерий
( h
f
( h
lim f [ гТ (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt +
T
C.192)
¦для всех Pl > 0. Минимальная величина критерия C.192), кото-
которая достигается при установившемся законе управления, опреде-
определяется выражением
xT(to)T(to)x(to). C.193)
Точное доказательство этих результатов дано Калмапом [86].
Здесь приводятся только основные соображения. Если вы-
полпяется условие (а) или (б) теоремы 3.6, то также выполняется
условие (а) или (б) теоремы 3.5. Из этого следует, что решение
уравнения Риккати C:181) с условием Р^г) = 0 сходится к РA)
при t^ —>oo. Для соответствующего установившегося закона уп-
управления имеем
f [zT(t)R3(t)z(t)+ur(t)R2(t)u(t)]dt = xr(t0)P(t0)x(t0). C.194)
to
Так как интеграл сходится, а матрицы Д3(?) и R.^t) удовлетворя-
удовлетворяют условиям C.182), z{t) и u(t) должны сходиться к нулю при t ->•
->• оо. Предположим теперь, что замкнутая система не является
асимптотически устойчивой. Тогда существует такое начальное
состояние, для которого x(t) не достигает нуля при z(t) -+0 н
u{t) —*¦ 0. Ясно, что это находится в противоречии с полной вос-
восстанавливаемостью системы, если выполняется условие (а), а также
с предположением об экспоненциальной устойчивости системы,
если выполняется условие (б). Поэтому замкнутая система должна
быть асимптотически устойчивой. Экспоненциальная устойчивость
системы следует из свойств ее однородности.
Том самым доказывается первая часть теоремы; вторую часть
можно доказать следующим образом. Предположим, что существу-
существует другой закон управления, который дает меньшую величину кри-
критерия C.192). Поскольку величина критерия C.192) конечна при
использовании установившегося оптимального закона управления,
этот другой закон должен также давать конечную величину. Тогда
по таким же соображениям, как и для установившегося закона уп-
Оптимальные линейные СУ с обратной связью
211
Угловая
скорость и Ц)
L
Ban v
приводимый So Вращение
двигатепем
постоянного тона
Катушка
Скорость
намотки проволоки
Kit)
Рис. 3.12. Схематическое представление механизма для намотки проволоки.
равлепия, этот закон управления должен быть асимптотически ус-
устойчив, и для такого закона управления имеем
г и
lim Г [zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt +
'•-*" Ы
-f xT (fj) PlX(tt) 1 = j [ zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)} dt. C.195)
J и
Одиако, поскольку правая часть этого выражения минимизиру-
минимизируется с помощью установившегося закона управления, не сущест-
существует другого закона управления, который давал бы меньшую вели-
величину левой части выражения. Тем самым доказывается вторая часть
теоремы 3.6. Кроме того, это доказывает вторую часть теоремы
3.5, так как при допущениях (в) и (г) этой теоремы закон
управления с обратной связью в установившемся режиме миними-
•чирует критерий C.192) при всех Pt > 0. Из этого следует, что
уравнение Риккати сходится к P(t) при всех Рг >. 0.
Проиллюстрируем результаты, полученные ' в этом разделе.
Пример 3.10. Механизм для намотки проволоки
В качестве примера простой системы с переменными параметра-
параметрами рассмотрим механизм для намотки проволоки, представленный
па рис 3.12. Двигатель постоянного тока вращает катушку, на
которую наматывается проволока. Скорость намотки проволоки на
катушку поддерживается постоянной. Из-за увеличения диаметра
катушки возрастает момент инерции; кроме того, для поддержания
постоянства скорости намотки необходимо уменьшать угловую
скорость вращения. Обозначим через a>(t) угловую скорость ка-
катушки, через J(t) — момент инерции катушки якоря двигателя,
и через \i(t) — напряжение на входе усилителя мощности, кото-
272 Глава 3
рый управляет двигателем постоянного тока. Тогда получаем
[()<d(t)] \(t) 4Xu(t), C.196)
dt
где х — коэффициент пропорциональности между моментом дви-
двигателя и входным напряжением, ty — коэффициент трения. Кроме
того, обозначим через R(t) радиус катушки; при этом скорость на-
намотки проволоки будет определяться выражением
С (*) = Д (*)©(*). ~ C.197)
Введем переменную состояния
?(*) = /(*)©(«). * " C.198)
Тогда система будет описываться уравнениями
C.199)
Предположим, что скорость вращения катушки регулируется
таким образом, что скорость движения проволоки поддерживается
постоянной и равной ?0. Зависимости / и R от времени тогда можно
установить следующим образом. Предположим, что на коротком
интервале времени dt радиус катушки возрастает от R до R + dR.
Увеличение объема проволоки, намотанной на катушку, пропор-
пропорционально RdR. Объем также пропорционален dt, так как по пред-
предположению проволока наматывается с посюянной скоростью.
Тогда имеем
RdR = cdt, C.200)
где с — константа. После интегрирования получим
R (t) = V R* @)-\-ht, . C.201)
где h — другая константа. Однако если радиус возрастает от R
до R + d,R, то момент инерции возрастает на величину, пропор-
пропорциональную RdRR2 = R3dR. Таким образом, имеем
dJ=c'R3dR, C.202)
где с' —¦ константа. После интегрирования получим
Rl@)],. C.203)
где h' — тоже константа.
Рассмотрим теперь задачу такого регулирования системы, при
Оптимальные линейные СУ с обратной связью 273
котором скорость намотки поддерживается постоянной и равной
величине Со. Номинальное решение Со@» М^)> которое соответст-
соответствует этому случаю, можно найти следующим образом. Если ?0@=
т^ Со, то имеем
U0 = -^4, C.204)
Номинальная входная переменная находится из дифференци-
дифференциального уравнения состояния
= J.M_ <_ГЩ + -I-V. C.205)
* [at 1 Л@) R(t)\*° v ;
Введем смещенные переменную состояния, входную и управ-
управляемую переменные соответственно »
E-206)
Эти переменные удовлетворяют уравнениям
Г@ = —j^g'W + VW,
C.207)
С С) = -7^-Г (О-
Выберем критерий в виде
| . C.208)
Тогда уравнение Риккати примет вид
-^^'¦^(о-7"^-^—27*uP{t) Cl209)
с конечным условием
Р (tt) = 0. C.210)
В этом случае P(t) является скалярной функцией. Скалярный
коэффициент усиления обратной связи определяется выражением
C.211)
P
10—394
274 Глава 3
15
* 10
1
0-5 5
Установившийся
/ участок
10
t,c
15
20
Рис. 3.13. Поведение оптимального коэффициента усиления в задаче намотки
проволоки при различных значениях конечного момента времени ti.
Выберем следующие численные значения:
/(*) = 0,02 + 66,67 [Д* (*) — Д* @)] кг-м2,
C.212)
= /0,01+0,0005* м,
ф = 0,01 кг-м2/с,
х = 0,1 кг-м2-рад/(В-с2),
р = 0,06 м2/(В2-с2).
На рис. 3.13 показано изменение оптимального коэффициента
усиления F(t) для конечных моментов времени tt = 10, 15 и 20 с.
Отметим, что для всех величин tx поведение коэффициента усиления
в установившемся режиме одинаковое, только вблизи конечного
момента времени наблюдаются некоторые изменения. Видно, что
коэффициент усиления в установившемся состоянии изменяется во
времени. Реализовать переменный коэффициент усиления весьма
неудобно. В рассматриваемом случае с использованием постоян-
постоянного коэффициента усиления обратной связи могут быть получены
практически адекватные характеристики.
3.4.3*. СВОЙСТВА УСТАНОВИВШЕГОСЯ РЕШЕНИЯ ЗАДАЧИ
ПОСТРОЕНИЯ ОПТИМАЛЬНОГО РЕГУЛЯТОРА С ПОСТОЯННЫМИ
ПАРАМЕТРАМИ
В этом разделе будут исследованы свойства оптимального ли-
линейного регулятора с постоянными параметрами в установившемся
состоянии. Кроме того, будут получены необходимые и достаточ- .
ные условия, при которых уравнение Риккати имеет установившее-
Оптимальные линейные СУ с обратной связью 275
ся решение и при которых оптимальная замкнутая система устой-
устойчива в установившемся режиме. Большая часть этих результатов
получена в работах [119, 123, 186].
Основные результаты можно сформулировать следуюпщм об-
образом.
Теорема 3.7. Рассмотрим задачу синтеза регулятора с постоян-
постоянными параметрами для системы
x(t) = Ax(t)+Bu(t),
C.213)
z (t) = Dx (t)
с критерием
j'/ 7>('i) C-214)
при R3 > О, R2 > 0, Рг >• 0. Соответствующее уравнение Рик-
кати имеет вид
— >(*) = DT R3D — P[t) BR~^ BT P (t) +ATP(t) + P (t) A % C.215)
с конечным условием
P.(td = Pf C.216) к
а) Предположим, что Pt — 0. Тогда при tx -> oo решение урав-
уравнения Риккати стремится к постоянной величине Р в установив-.
шемся состоянии в том и только гпом случае, если система не имеет
полюсов, которые одновременно были бы неустойчивыми, неуправ-
неуправляемыми и восстанавливаемыми.
б) Если система C.213) является стабилизируемой и обнаружи-
обнаруживаемой, то решение уравнения Риккати C.215) стремится к един-
единственной величине Р при tx -*¦ оо для всех Рг 3s» 0.
в) Если Р существует, то зта матрица является неотрица-
неотрицательно определенным симметрическим решением алгебраического
уравнения Риккати
0= DTR3D—PBR~1 BTP + ATP + PA. C.217)
Если система C.213) является стабилизируемой и обнаруживае-
обнаруживаемой, то Р — единственное неотрицательно определенное симмет-
симметрическое решение алгебраического уравнения Риккати C.217).
г) Если решение Р существует, то оно является положительно
определенным тогда и только тогда, когда система C.213) пол-
полностью восстанавливаема.
10*
276 Глава 3
д) Если Р существует, то установившийся закон управления^
u(t)= —Jx{t), C.218)
где
Fr=R~iB7"P, C.219)
асимптотически устойчив тогда и только тогда, когда система
является C.213) стабилизируемой и обнаруживаемой.
е) Если система C.213), стабилизируемая и обнаруживаемая,
то установившийся закон управления минимизирует критерий
{ h }
lim Г [ zT (t) R3z (t) + uT (t) R2u (t)] dt + xT {tt)PiX (t,) C.220)
h-*°>\l ¦ J
при всех Pi > 0. При установившемся законе управления критерий
C.220) равен
xT(t0)Px(t0). C.221)
Докажем сначала часть (а) этой теоремы. Предположим, что
система не является полностью восстанавливаемой. Тогда ее мож-
можно представить в канонической форме восстанавливаемости сле-
следующим образом:
\ A2i A2u
C.222)
z(t)=(DltO)x(t),
где пара {Ап, D^—полностью восстанавливаемая. Разделяя реше-
решение P(t) уравнения Риккати C.215) в соответствии с разделением
C.222):
/ Ри (t) Pi2 (t) \
P(t) = l r , C-223)
\PT12(t) P22(t)J
легко показать, что уравнение Риккати C.215) упрощается до
следующих трех матричных уравнений:
- Ри (t) = D\ R3 D, - \Pn (t) Bi + Pi2 (t) B2] R-1 [B[ Pu (t) +
+ B\ P*2(t)] + ATU Pu(t) + A\x P\2{t) + Pu(t) Au + Pa(t) A2i, C.224)
- Pi2 (t) = - [Pa (t) B, + Pa (t)-B2] R~l [B\ Pi2 (t) + BT2 P22 (t)] +
+ ATn Pi2 (t) + AT2l P22 (t)+Pi2 (t) AM, C.225)
Оптимальные линейные СУ с обратной связью 277
- К (О = - [Р\2 (О В, + Ръ (t) В2] Я [В[ Pi2 (t) + В\ Р2г (t)} +
T . .C.226)
Видно, что при конечных значениях Рп(г]) = 0, Рп(^) = О,
() = 0 уравнения C.225) и C.226) удовлетворяются условия-
условиями
Л. @ = 0, />м@-=0, *<*,. C.227)
Тогда уравнение C.224) сводится к виду
- К @ = ^ Д, 2), - />„ (о в, в.-1 в[ ри (о + < />и (о +
+ Ри @ ^н.
Л, (<J = 0. C.228)
Из этого следует, что полюса невосстанавливаемости системы,
т. е. характеристические значения матрицы Аг%, не влияют на
сходимость Pu(t) при tt ->- оо, и поэтому они не влияют также на
сходимость P(t). Поэтому для исследования сходимости можно
предположить на время, что система C.213) является полностью
восстанавливаемой.
Преобразуем теперь систему C.213) в каноническую форму уп-
управляемости, и представим ее следующим образом:
C.229)
z(t) = {Dt, D2)x(t),
где пара {A^, Bt}—полностью управляемая. Предположим теперь,
что система нестабилизируема, поэтому Л22 не является асимптоти-
асимптотически устойчивой. Тогда, очевидно, существуют такие начальные
состояния в форме со!@, х.2О), при которых x(t) -*- оо независимо от
выбора и (t). В предположении о полной восстанавливае-
восстанавливаемости системы при таких начальных состояниях интеграл
и
j I zT (t) B3z](t) + uT (t) B2n (t)] dt' C.230)
и
никогда не будет сходиться к конечному числу при t1 —*¦ оо. Это
означает, что P{tf также никогда не будет сходиться к конечному
числу при tx -*- оо, если система C.213) нестабилизируема. Од-
Однако если система C.213) является стабилизируемой, то всегда
можно найти закон управления с обратной связью, который делает
замкнутую систему устойчивой. В случае такого закона выраже-
278 Глава 3
ние C.230) сходится к конечному числу при tx -> оо; это число
представляет собой верхнюю границу для минимальной величины
критерия. Как и в разд. 3.4.2, можно полагать, что минимальная
величина C.230) является.монотонно неубывающей функцией t1.
Это доказывает, что мипимальная величина C.230) имеет предел
при t1 -*¦ оо и, как следствие, что матрица P{t), определяемая из
C.215) при\Р(^) = 0, имеет пределом Р при tL —>¦ оо. Тем самым
завершается доказательство части (а) теоремы.
Теперь рассмотрим весьма важное доказательство части (г)
теоремы. Предположим, что система не является полностью вос-
восстанавливаемой. Тогда, как было показано в начале доказательст-
доказательства части (а), если система представлена в канонической форме вос-
восстанавливаемости ni3! =0, то P(t) можно представить в форме
«W 0 n 3.231)
0 0/
Из этого следует, что матрица Р, если она существует, является
сингулярной. Тем самым доказывается, что если Р строго положи-
положительно определена, то система должна быть полностью восстанав-
восстанавливаемой. Чтобы доказать обратное, предположим, что система яв-
является полностью восстанавливаемой, а Р — сингулярной мат-
матрицей. Тогда существует такое ненулевое начальное состояние,
при котором
со
J [
и
2Г (t) Rsz (t) + uT (t) R2 и (t)] dt = 0. C.232)
Поскольку i?3 > 0 и й2 > 0, из этого следует
м(*) = 0 и z(t) = O при t>t0. C.233)
Однако это означало бы. что существует ненулевое начальное
состояние, которое вызывает нулевую реакцию z(t), равную
нулю при всех t. Это находится в противоречии с предположением
о полной восстанавливаемости системы; следовательно, предполо-
предположение о том, что матрица Р сингулярна, неверно. Тем самым дока-
доказывается часть (г) теоремы.
Рассмотрим теперь доказательство части (д). Предположим,
что матрица Р существует. Это означает, что система не имеет неус-
неустойчивых полюсов неуправляемости, которые являлись бы полю-
полюсами восстанавливаемости. При доказательстве части (а) теоремы
было показано, что при представлении системы в канонической
формз восстанавливаемости матрица Р записывается в форме
Ро" о)- C-234)
Оптимальные линейные СУ с обратной связью 279
Это значит, что матрица усиления обратной связи в установив-
установившемся состоянии имеет вид
F= R~l {В\ , Вт2) (Pqh 0) = (R-1 B\PiU 0). C.235)
В свою очередь зто означает, что матрица усиления обратной
связи в установившемся состоянии совсем не затрагивает невос-
станавливаемую часть системы. Из этого следует, что если за-
закон управления в установившемся состоянии делает замкнутую
систему. асимптотически устойчивой, то невосстанавливаемая
часть системы должна быть асимптотически, устойчивой, т. е.
разомкнутая система должна быть обнаруживаемой. Далее, если
замкнутая система должна быть асимптотически устойчивой, то
разомкнутая система должна быть стабилизируемой, в противном
случае никакой закон управления н, следовательно, даже устано-
установившийся закон управления не сможет сделать замкнутую систе-
систему устойчивой. Таким образом, видно, что стабилизируемость и
обнаруживаемость являются необходимыми условиями асимптоти-
асимптотической устойчивости установившегося закона управления.
Стабилизируемость и обнаруживаемость гарантируют асимп-
асимптотическую устойчивость. Было показано, что установившийся
закон управления влияет на невосстанавливаемую часть системы.
Поэтому если система обнаруживаема, то можно также исключить
невосстанавливаемую часть и предположить, что система пол-
полностью восстанавливаема. Представим систему в канонической
форме управляемости аналогично C.229). Разделяя матрицу P(t) в
соответствии с разделением в C.229), напишем
Рт., (t) Pi2 (t)
U 1 C-236)
Нетрудно определить из уравнения Риккати C.215), что Ptl(t)
является решением уравнения
-г- Ри (t) = D\ Rs D, - Pu (t) Bt i?-1 B\ Pn (t) +
+ ATnPll(t) + Pli(t)Aii, C.237)
= 0.
a
Видно, что это обычное уравнение Риккати. Пари {А1Х, 5Х}
является полностью управляемой, а"из теоремы 3.5 известно, что
Pn(t) имеет такое асимптотическое решение Рп прн tx -*¦ оо, что
матрица Ап — В^, где Fx = R \в\Руъ асимптотически ус-
280 Глава 3
тойчива. Закон управления для всей системы C.229) определяется
в виде
=\R~xB[Pn RJX В\Ра). C.238)
При таком законе управления замкнутая система описывается
уравнением
X\tj= I ^ \x (t). (o.Zov)
V О А22 ' 1
Очевидно, что если разомкнутая система стабилизируема, то
замкнутая система асимптотически устойчива, поскольку асимпто-
асимптотически устойчивы матрицы Ап — B1F1 и Агг. Тем самым дока-
доказывается, что обнаруживаемость и стабилизируемость являются
достаточными условиями для гарантии асимптотической устойчи-
устойчивости установившегося закона управления разомкнутой системой.
Тем самым доказывается часть (д) теоремы.
Рассмотрим теперь часть (е) теоремы. Установившийся закон
управления, очевидно, минимизирует критерий
; %т (*) Raz (t) + uT (t) R2u (t)] dt, C.240)
а минимальная величина этого критерия равна Хт (tu)PX(t0). Рас-
Рассмотрим теперь критерий
f [ zT (t) Raz (t) + uT (t) i?2u (t)] dt + xT (fj PiXitM C.241)
t
to )
при P1 > 0. Если система является стабилизируемой и обнаружи-
обнаруживаемой, то при установившемся законе управления критерий C.241)
равен
~zT(t)R3I(t)+ur(t)R2u(t)]dt = zT(t0)P~x(t0), C.242)
где z и u° — управляемая и входная переменные соответственно,
определяемые установившимся законом управления. Докажем,
что установившийся закон управления минимизирует не только
критерий C.240), но и C.241). Предположим, что существует дру-
другой закон управления, который дает меньшее значение критерию
Оптимальные линейные СУ с обратной связью 281
C^241), так что при этом законе управления имеет место неравен-
неравенство
со
[zT(t)Rsz(t)+uT(t)Riu(t)]dt +
lim xT (*,) /»!*(*,) < xT (t0) P~x (ta). C.243)
j
to
Из неравенства Рг >¦ 0 следует, что при этом законе управле-
управления с обратной связью имеем
zT(t) R3z(t) + uT(t) R2u(t)] dt<4(gPx(t0). C.244)
Поскольку известно, что левая часть этого выражения миними-
минимизируется с помощью установившегося закона управления и может
быть достигнута величина критерия, не меньшая Хт (to)PX(to),
то приходим к противоречию, так как критерий C.241) тоже дол-
должен минимизироваться с помощью этого установившегося закона
управления. Тем самым доказывается часть (е) теоремы.
Обратимся снова к части (б) теоремы. Утверждение части (б)
непосредственно следует из части (е). Рассмотрим теперь часть
(в). В общем случае алгебраическое уравнение Риккати имеет
много решений (см. задачу 3.8). Если Р существует, то оно явля-
является неотрицательно определенным решением алгебраического
уравнения Риккати, так как Р должно быть решением дифферен-
дифференциального уравнения Риккати C.215). Предположим, что система
C.213) является стабилизируемой и обнаруживаемой, и пусть Р'—
некоторое неотрицательно определенное решение алгебраического
уравнения Риккати. Рассмотрим дефференциальное уравнение
Риккати C.215) с конечным условием P(t) = P', t <. t. Тогда
решение в установившемся состоянии Р должно также определять-
определяться решением Р'. Этим доказывается, что любое неотрицательно
определенное решение Р' алгебраического уравнения Риккати
является установившимся решением Р, поэтому установившаяся
величина Р является единственным неотрицательно определенным
решением алгебраического уравнения Риккати. Тем самым закан-
заканчивается доказательство части (в) и всей теоремы в целом.
Примечание. Завершим этот раздел следующими комментария-
комментариями. Части (б) и (в) теоремы устанавливают, что стабилизируемость
и обнаруживаемость являются достаточными условиями сходи-
сходимости уравнения Риккати к одной матрице Р при всех Рг > О,
а также того, чтобы алгебраическое уравнение Риккати имело
единственное неотрицательно определенное решение. То, что
282 Глава 3
эти условия не являются необходимыми, можно увидеть из простых
примеров.
Кроме того, вполне возможен случай, что в отсутствие Р су-
существует
F = UmRTlBTP(t). C.245)
Нетрудно сделать вывод, что установившийся закон управле-
управления u(t) = —Fx(t): если он существует, изменяет расположение
только таких полюсов разомкнутой системы, которые являются
одновременно управляемыми и восстанавливаемыми. Поэтому
может возникнуть нежелательная ситуация, когда система имеет
-неуправляемые и невосстанавливаемые полюса, в особенности,
когда эти полюса неустойчивы. К сожалению, обычно невозможно
изменить структуру системы так, чтобы сделать неуправляемые
полюса управляемыми. Если система имеет полюса невосстанав-
ливаемостцх нежелательным расположением, то во многих случаях
можно выбрать новые управляемые переменные таким образом,
чтобы система уже не имела таких полюсов.
3.4.4*. РЕШЕНИЕ ЗАДАЧ СИНТЕЗА РЕГУЛЯТОРА
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ МЕТОДОМ ДИАГОНАЛИЗАЦИИ
В этом разделе будет предпринято дальнейшее исследование
устойчивого решения задачи^ синтеза регулятора с постоянными
параметрами. Это позволяет разработать метод определения ус-
устойчивого решения уравнения Риккати и, кроме того, подойти
к вопросу получения информации о полюсах замкнутой системы и
поведении регулятора в замкнутом контуре. В этом разделе будем
полагать, что разомкнутая система является стабилизируемой и
обнаруживаемой.
В разд. 3.3.2 было показано, что задачу синтеза регулятора
можно решить, анализируя линейное дифференциальное уравне-
уравнение
\) C.246)
P{t)j
где Z — постоянная матрица
Zb^bT) C-247>
Здесь Rt = DTR3D. Соответственно имеем граничные условия
x(to) = xo, C.248а)
C.2486)
Оптимальные линейные СУ с обратной связью 283
Из разд. 3.3.2 и 3.3.3 [уравнение C.92)] известно, что p(t)
и x(t) связаны соотношением
p(t) = P(t)x(t), C.249)
где P(t) — решение матричного уравнения Риккати с конечным
условием P(ti) = jPj. Выберем теперь
Л = ~Р, C.250)
где Р — установившееся решение уравнения Риккати. Тогда,
очевидно, уравнение Риккати имеет, решение
Р(*У=Р, «0<«<«1. C.251)
Из этого следует, что установившееся решение можно полу-
получить путем замены конечного условия C.2486) начальным условием
Р (*„)=?* (д. ' C.252)
Решение дифференциального уравнения C.246) с начальными
условиями C.248а) и C.252) дает установившееся поведение пере-
переменной состояния и сопряженной переменной.
Исследуем решение этой задачи методом диагонализации мат-
матрицы Z. Можно показать с помощью элементарных преобразований
определителя, что
det(— si — Z) = det(s/ — Z). C.253)
Следовательно, det(s/ — Z) является полиномом относительно
s2, откуда следует, что если % — характеристическое число матри-
матрицы Z, то —% тоже характеристическое число. Для простоты пред-
предположим,, что все характеристические числа являются различными
(более общий случай представлен в задаче 3,9). Это позволяет
провести диагонализацию матрицы Z следующим образом:
Здесь А— диагональная матрица, которая образуется следу-
следующим образом. Если характеристическое число % матрицы Z
имеет строго положительную часть, то оно является диагональным
элементом матрицы А. Характеристическое число —% автоматически
располагается в матрице—А. Если % имеет нулевую вещественную
часть, то одно характеристическое число из пары %, —% произволь-
произвольно назначается матрице А, а другое— матрице—А. Матрица W
образована собственными векторами Z; г-й вектор-столбец W явля-
является собственным вектором Z, соответствующим характеристи-
характеристическому числу в г-м диагональном положении diag (A, —А).
Рассмотрим теперь дифференциальное уравнение
284 Глава 3
C.255)
\z2(t)J \0 ~AJ\z2(t)J
где
NjgU^-i^W). C.256)
\z2{t)J \p(t)) v
Разделим матрицу W~x следующим образом:
\^21 "ti
Тогда можно написать
Zl @ = Vux(t) + Vi2p(t) = (Ун + Vi2P)x(t). C.258)
Известно, что установившееся решение устойчиво, т. е. x(t) ->
-> Опри? -> сю. Это также предполагает, что z^t) -> Опри< ->
->- оо. Из уравнения C.255), однако, следует, что
МО^^М*»). C.259)
Так как все характеристические числа матрицы X имеют нуле-
нулевые или положительные вещественные части, то z^t) может схо-
сходиться к нулю, если только z^it^) = 0. Согласно выражению
C.258) это соответствует всем х0 тогда и только тогда, когда Р
удовлетворяет соотношению
VH + Vi2P = 0. C.260)
Если матрица F12 несингулярна, то уравнение можно разре-
разрешить относительно Р следующим образом: (
'~P=-VTi Vn. C.261)
В любом случае Р должно удовлетворять уравнению C.260),
Предположим, что C.260) не имеет единственного неотрицатель-
неотрицательно определенного решения Р, и пусть Р' является одним из неот-
неотрицательно определенных решений. Рассмотрим теперь дифферен-
дифференциальное уравнение C.246) с конечным условием
P'xit,). C.262)
Можно записать решение в форме
P(t)J \W2l
C.263)
Оптимальные линейные СУ с обратной связью 285
где матрица W также разделена. Подстановка C.262) дает
х (t) \ (W W \ ( еА ('~''' О
P(t)) = [w2i wJ\0 e~
C.264)
Учитывая, что Р' является решением уравнения C.260), по-
получим
х (t) =Wize~x {t~tl) (F21 -г F22P') x (*,), C.265a)
p (t) = W22e~A {t~U) (F21 + F22p') x (tj). C.2656)
При t = t0 первое из этих уравнений сводится к виду
г XV р~к Со—'0 /у \у р/\ T(f\ /Q Ойй\
Поскольку двухточечная краевая задача должна иметь реше-
решение для всех х0, матрица, связывающая х0 с лг(^), должна быть
несингулярной (в противном случае это уравнение не будет иметь
решения, если х0 не находится в диапазоне, допустимом для этой
матрицы). Действительно, так как любое t < tt можно рассматри-
рассматривать как начальный момент времени на интервале [t, tj, матрица
W^e~K {t~h) (F21 + F22P') C.267)
должна быть несингулярной для всех t <: ti. Решая уравнение
C.265а) относительно x(ti) и подставляя решение в C.2656), по-
получим
р (t) = W22e~A <'-''> (F21 + F22P') (F21 + V^P'T1 eHf-h) WT2l x (t)
C.268)
или в соответствии с работой [134]
п/Л W Ш~1 -г lt\ /Q 9fiQ\
y \У) — г г 22 12 ™ \") • (O.j?U?71
Решая двухточечную краевую задачу с конечным условием
Р(^) = Р', получим решение в виде
C.270)
л
где Р — константа. Так как это решение не зависит от конечного
л _
времени tu Р также является установившимся решением Р уравне-
уравнения Риккати при ti -> сю. Поскольку , как известно из теоремы
3.7, это установившееся решение является единственным, нельзя
не сделать вывод, что
^ C.271)
286 Глава 3
Из этого следует, что матрица PF12 не является сингулярной,
а Р можно представить в форме C.271). Поскольку разделенные
блоки матриц V и W взаимосвязаны, можно также показать,
что Vt2 является несингулярной матрицей, и, как следствие, вы-
выражение C.261) является точным (задача 3.11.12).
В дополнение к этим результатам можно получить следующий
интересный результат. Решая уравнение C.266) относительно
x(ti) и подставляя решение в C.265а),получим.
х @ = Wi2e~L {t-U)W7? х0. C.272)
Это показывает, что характеристические числа замкнутой сис-
системы в установившемся состоянии являются диагональными эле-
элементами матрицы — Л [134]. Поскольку известно, что замкнутая
система асимптотически устойчива, диагональные элементы мат-
матрицы —Л имеют строго отрицательные вещественные части.
Так как эти характеристические числа получаются из характерис-
характеристических чисел матрицы Z, это означает, что Z не может иметь ха-
характеристических чисел с нулевой вещественной частью, а харак-
характеристическими числами замкнутой системы в установившемся
состоянии являются характеристические числа Z с отрицатель-
отрицательными вещественными частями [108]. Подытожим эти выводы сле-
следующим образом.
Теорема 3.8. Рассмотрим задачу построения детерминирован-
детерминированного линейного оптимального регулятора с постоянными парамет-
параметрами и предположим, что пара {А, В} является стабилизируемой
и восстанавливаемой, а пара {А , D} обнаруживаемой.
Определим матрицу размером 2п X 2п
2lBT\ C273)
и предположим, что Z имеет 2п различных характеристических
чисел. Тогда
а) Если % — характеристическое число матрицы Z, то —X
также является характеристическим числом. Матрица Z не имеет
характеристических чисел с нулевыми вещественными частями.
б) Характеристические числа оптимального замкнутого регу-
регулятора в установившемся состоянии являются' характеристичес-
характеристическими числами Z с отрицательными вещественными частями.
в) Если матрица Z диагонализирована в форме
где диагональная матрица Л имеет в качестве диагональных эле-
Оптимальные линейные СУ с обратной связью 287
ментов характеристические числа Z с положительными вещест-
вещественными частями, то установившееся решение уравнения Риккати
C.215) можно записать в виде
Р = W22WT2l = -V^VU, C.275)
где Wи и V't,, i, j = 1, 2, получаются путем разделения.матриц
W и V = W~l соответственно. В обоих выражениях существует
обратная матрица.
г) Реакцию замкнутого регулятора в установившемся состоянии
можно записать в виде
x{t) = Wi2e^{t-U)WT2X0. . C.276)
Метод диагонализации, рассмотренный в настоящем разделе,
далее развивается в задачах 3.11.8—3.11.12.
3.5. Численное решение уравнения
Риккати
3.5.1. ПРЯМОЙ МЕТОД ИНТЕГРИРОВАНИЯ
В этом разделе будут рассмотрены различные методы числен-
численного решения уравнения Риккати, которые имеют исключительно
важное значение для задачи синтеза регулятора, а также, как будет
видно из гл. 4, для задачи оценки состояния.
Матричное уравнение Риккати определяется выражением
-P(t) = Rt (t) ~P(t)B @ /?"' (t) BT(t) P (t) +
+ AT(t)P(t) + P(t)A(t) ' ' C.277)
с конечным условием
Прямой метод решения основан на представлении уравнения
C.277) в виде системы п2 нелинейных дифференциальных уравне-
уравнений первого порядка [в предположении, что P(t) — матрица
п. X п) и использовании любого стандартного численного метода
интегрирования уравнений в обратном времени, начиная с момен-
момента tt. Наиболее простым методом численного интегрирования яв-
является метод Эйлера
P(t — At)~P(t)-^P(t)At, C.278)
по которому вычисляется матрица P(f) в моменты t = tt — At,
ti — 2Д? .... Если решение сходится к постоянной величине,
288 Глава 3
как это обычно бывает в случае системы с постоянными парамет-
параметрами, то необходимо ввести условие остановки. Недостатком этого
метода является то, что для обеспечения достаточной точности
обычно требуется весьма малая величина At, приводящая к боль-
большому числу шагов. Кроме того, из-за ошибок вычислений наруша-
нарушается симметрия матрицы P(t), что можно устранить путем симмет-
симметрирования после каждого шага, т. е. путем замены P(t) на (V2)
\P{t) + Рт (t)]. Симметрию матрицы P(t) можно использовать,
заменяя уравнение C.277) системой (V2)n (п + 1) дифференциаль-
дифференциальных уравнений первого порядка и получая в результате существен-
существенную экономию машинного времени. Более детальный анализ ме-
метода прямого интегрирования можно найти в работе [29].
Метод прямого интегрирования применим к системам с пере-
переменными и постоянными параметрами. Если требуется найти лишь
установившееся решение для задач е переменными параметрами,
то более эффективными оказываются методы, рассмотренные в
разд. 3.5.3 » 3.5.4.
Наконец, отметим следующее обстоятельство. Чтобы реализо-
реализовать закон управления с переменной настройкой, необходимо за-
запоминать все значения F(t) при t0 < t <: tt. По-видимому, целе-
целесообразно поступать следующим образом. Матрицу P(t0) можно
вычислить путем интегрирования в ускоренном масштабе времени.
Затем уравнение Риккати C.277) интегрируется в реальном масш-
масштабе времени с начальным условием P(tQ) и определяется матрица
усиления обратной связи в реальном времени из соотношения
F(t) = R2~1(t)BT (t)P(t). Этот метод обычно приводит к неудовлет-
неудовлетворительным результатам, однако интегрирование уравнения
Риккати C.277) в прямом направлении неустойчиво, что вызывает
возрастающие со временем ошибки вычислений [8бГ.
3.5.2. МЕТОД КАЛМАНА — ЭНГЛАРА
Если необходимо получить полное решение уравнения Риккати
с постоянными параметрами, то используется обычный метод
[91], основанный на следующем выражении, получаемом из C.98):
Р Ум) = [©и Ум> *i) + %г Ум, td P(t,)] [Qu Цм, ti) +
+ Bit(t-M,tt)Pyt)r1, C.279)
где
ti+i = tt—At. C.280)
Матрицы Qtj (t, t0). получаются путем разделения переходной
матрицы 0(?, t0) системы
Оптимальные линейные СУ с обратной связью 289
C.281)
\p(t)J \p(t)J
где
*-( ? -ВЩТ). C.282)
\~DTS,D -Ат )
Матрицу Q(ti+i, tt) можно вычислить однажды, так как
C.283)
Это выражение можно оценить по методу разложения в ряд
(разд. 1.3.2). Решение уравнения Риккати тогда находится путем
многократного использования выражения C.279). При этом после
каждого шага целесообразно проводить симметрирование.
Если интервал At выбран слишком большим, то возникает труд-
трудности вычислений, обусловленные несингулярностью матрицы,
обращаемой в выражении C.279). В работе [171] эти трудности
рассматриваются более детально. В этой работе показано, что если
вещественные части характеристических чисел Z сильно различа-
различаются по величине, то необходимо использовать очень малый ин-
интервал At. В большей части задач этот интервал выбирается доста-
достаточно малым, чтобы получать точные результаты. Однако время
вычислений при этом может быть большим, особенно если иссле-
исследуется установившееся решение.
3.5.3*. РЕШЕНИЕ МЕТОДОМ ДИАГОНАЛИЗАЦИИ
Чтобы найти установившееся решение уравнения Риккати с
постоянными параметрами, целесообразно использовать резуль-
результаты, полученные в разд. 3.4.4 методом диагонализации матрицы
Z размером In X In. Асимптотическое решение тогда определя-
определяется выражением
Р = W2iWT2l, C.284)
где W22 и Wi2 получаются в результате разделения матрицы W:
n wi2)- <3-285>
21 VY 22/
Матрица W состоит из собственных векторов матрицы Z, об-
образованных таким образом: первые п столбцов матрицы W соот-
соответствуют характеристическим числам Z с положительными ве-
вещественными частями, а последние п столбцов матрицы W — ха-
характеристическим числам матрицы Z с отрицательными веществен-
вещественными частями.
290 Глава 3
Обычно некоторые или все собственные векторы матрицы Ъ
могут быть комплексными. Тогда W2i и WiZ также могут быть ком-
комплексными матрицами. Операции с комплексными числами можно
избежать следующим образом. Так, если е — собственный вектор Z,
соответствующий характеристическому числу % с отрицательной ве-
вещественной частью, то комплексно-сопряженный вектор е также
является собственным вектором, соответствующим характеристи-
характеристическому числу % с отрицательной вещественной частью, а послед-
последние п столбцов матрицы W будут содержать кроме вещественных
вектор-столбцов только комплексно-сопряженные пары вектор-
столбцов. В этом случае всегда можно выполнить такое несингу-
несингулярное линейное преобразование
W \ I W
12 1 / 12
C-286)
при котором каждая пара комплексно-сопряженных вектор-столб-
дов е и е в col(WiZ, PF22) заменяется на два вещественных вектора
Re(e) и Im(e) в-col (W12, W'^)- Тогда справедливо соотношение
W'aW\fl = (WnU) (Wi2U)-i = WnW?, C.287)
из которого следует, что для вычисления Р можно использовать
W' %г и W & вместо W22 и Wi2.
Систематизируем метод определения Р:
а) Образуется матрица Z и используется любой стандартный
численный метод вычисления собственных векторов, соответству-
соответствующих характеристическим числам с отрицательными веществен-
вещественными частями,
б) Из этих п собственных векторов образуется In X п-матрица
U). C.288)
где W'2i и W22 есть п X n-блоки матрицы. Если е — вещест-
вещественный собственный вектор, то пусть е будет одним из столбцов
матрицы C.288). Если е и е образуют комплексно-сопряженную па-
пару, то пустьRe(e) будет одним из столбцов матрицы C.288), a Im(e)
— другим ее столбцом.
в) Вычисляется
р = W'^W'if1. C.289)
Эффективность этого метода зависит от эффективности подпро-
подпрограммы вычисления собственных векторов матрицы Z. В работе
[170] предложен алгоритм вычисления собственного вектора, кото-
Оптимальные линейные СУ с обратной связью ' 291
рый особенно эффективен для задач такого типа. Этот алгоритм,
как подчеркивалось выше, успешно использовался для решения
уравнений Риккати высокого порядка [19, 65, 71]. 13 работе [59]
представлена рациональная модификация этого метода.
Метод диагонализации можно также исдользовать не только
для нахождения асимптотического решения уравнения Риккати,
но и для исследования всего поведения матрицы P{f), используя
соотношения из задачи 3.11.11.
Другой метод вычисления асимптотического решения Р сос-
состоит в использовании тождества (ем. задачу 3.11.10)
' C.290)
где i|) (s) определяется путем факторизации
det(s/ — Z) = 9(s)9(— s) C.291)
таким образом, что корни <p(s) точно являются характеристичес-
характеристическими числами Z с отрицательными вещественными частями. Оче-
Очевидно, что cp(s) является характеристическим полиномом замкну-
замкнутой оптимальной системы в установившемся состоянии. Здесь
det(s/—Z) можно получить с помощью алгоритма Леверье (разд.
1.5.1) или стандартным методом определения характеристических
чисел матриц. В работе [65] приведены результаты успешного ис-
использования этого метода, а в работах [19, 71] получены отрица-
отрицательные результаты.
3.5.4*. РЕШЕНИЕ МЕТОДОМ НЬЮТОНА—РАФСОНА
В этом разделе рассматривается метод определения установив-
установившегося решения уравнения Риккати с постоянными параметрами,
который существенно отличается от предыдущих методов. Метод
основан на многократном решении линейного матричного уравне-
уравнения вида
0 = АТР + РА + R, ' C.292)
которое рассматривалось в разд.' 1.11.3.
Установившееся решение Р уравнения Риккати должно удов-
удовлетворять алгебраическому уравнению Риккати
О = /?± — PSP + АТР + РА, C.293)
где
S = BR^BT. C.294)
292 Глава 3
Рассмотрим матричную функцию
F(P) = Ri~ PSP+ATP +PA. C.295)
Задача заключается в определении неотрицательно определен-
определенной симметрической матрицы Р, удовлетворяющей условию
F[P~) = 0. C.296)
Построим итерационную процедуру. Предположим, что на
к-м шаге получено решение -Pk, которое мало отличается от искомо-
искомого решения Р. Тогда напишем
P = Ph + P. C.297)
Если Р является малой величиной, то можно аппроксимировать
F(P), опуская квадратические члены в Р. Тогда получим
F (Р) ~ R, - PhSPh ~ PkSP - PSPh + AT (Ph + P) +
+ {Ph + p)A. C.298)
Суть метода Ньютона — Рафсона заключается в оценке Р,
когда правая часть выражения C.298) приравнивается к нулю.
Если полученную таким образом оценку Р обозначить через Ph и
приравнять
PM = Pk + Pk, C.299)
то найдем, полагая правую часть C.298) равной нулю,
О = R, + PkSPh + Pk+iAk + AlPh+i, C.300)
где
Ak = A — SPk. C.301)
Уравнение C.300) имеет такой же вид, как и уравнение C.292),
для решения которого существуют эффективные методы (см. разд.
1.11.3.). Таким образом, получаем следующий алгоритм:
а) выбираем соответствующую матрицу Ро и полагаем номер
итерации А: равным 0;
б) определяем Pk+1 из уравнения C.300);
в) если достигается сходимость, то производим остановку; в
противном случае увеличиваем к на единицу и возвращаемся к
п. «б>>.
В работах [94, 120] показано, что если алгебраическое уравне-
уравнение Риккати имеет единственное неотрицательно определенное ре-
решение, то Pk и Pft+i удовлетворяют неравенству
Ph,i<Pk> k = 0, U 2, C.302)
Оптимальные линейные СУ с обратной связью 293
lim Ph = Р C.303)
А-*оо
при условии, что матрица Ро выбрана таким образом, что выраже-
выражение
Ао = А — 5Р0 C.304)
асимптотически устойчиво. Это означает, что сходимость решения
обеспечивается, если начальная схема выбрана правильно.
Если начальная оценка выбрана некорректно, то может наб-
наблюдаться сходимость к произвольному решению алгебраического
уравнения Риккати'или вообще она может не достигаться. Если
матрица Л асимптотически устойчива, то целесообразным выбором
является Ро =0. Если А не является асимптотически устойчи-
устойчивой, то выбор начального приближения может представить опре-
определенные трудности. В работах [96, 122, 189] даны методы выбора
Ро для случая, когда выражение для А не является асимптотичес-
асимптотически устойчивым.
Основные трудности в этом методе связаны с уравнением
C.292), которое должно решаться многократно. Хотя это урав-
уравнение является линейным, его численное решение может оказаться
трудоемким, так как число линейных уравнений, которые должны
решаться на каждой итерации, быстро возрастает с увеличением
размерности задачи (для п = 15 это число равно 120). В разд.
1.11.3 обсуждались различные численные методы решения урав-
уравнения C.292). В работах [18, 94, 95] освещается опыт успешного
использования метода Ньютона — Рафсона для решения уравне-
уравнений Риккати в задачах с размерностью до 15.
ii.fi. Задачи стохастического линейного
оптимального регулирования и слежения
3.6.1. ЗАДАЧИ РЕГУЛИРОВАНИЯ ПРИ ВОЗМУЩЕНИЯХ —
СТОХАСТИЧЕСКИЕ ЗАДАЧИ РЕГУЛИРОВАНИЯ
В предыдущих разделах была рассмотрена детерминированная
задача линейного оптимального регулирования. Решение этой
задачи позволяет точно рассчитать переходные процессы в том
случае, когда линейная система имеет возмущенное начальное
состояние и необходимо вернуть систему в нулевое состояние с
максимальной быстротой при ограничении на амплитуду входного
воздействия. Существуют практические задачи, которые могут
быть сформулированы в такой постановке, однако большинство
составляют задачи, в которых возмущения действуют на систему
294 Глава 3
непрерывно и стремятся вывести систему из нулевого состояния.
В таких случаях задача состоит в разработке структуры обратной
связи, с помощью которой с максимальным быстродействием сни-
снижаются начальные отклонения, а также, насколько это возможно,
компенсируется воздействие возмущений в установившемся сос-
состоянии. Решение этой задачи позволит синтезировать регуляторы,
которые были необходимы в гл. 2.
Введем на некоторое^ время предположение, что полное состоя-
состояние системы можно точно наблюдать в любой момент времени.
Влияние возмущений можно учесть путем соответствующего рас-
расширения вектора состояния системы. Рассмотрим систему, описы-
описываемую уравнениями
z(t) = A(t)x(t)+B(t)u(t)+v(t),
- C.305)
z(t) = D(t)x(t),
где u(t) — входная переменная, z(t) — управляемая перемен-
переменная, a v(t) — возмущения, действующие на систему. Представим
математически возмущения в виде стохастических процессов, ко-
которые будем моделировать как выход линейной системы, возму-
возмущаемой, белым шумом. Тогда предположим, что v(t) определяет-
определяется выражением
v(t) = Dd(t)xd(t). C.306)
Здесь xd(t) — решение уравнения
x.d (t) = Ad (t) xd (t) +w(t), C.307)
где w(t) — белый шум. Кроме того, предположим, что x(t0) и
xd(t0) — стохастические переменные.
Объединим описание системы и возмущений, вводя расширен-
расширенный вектор состояния x(t) — co\[x{t), xd(t)], который, как можно
увидеть из C.305) — C.307), удовлетворяет уравнению
~ (A (t) Dd (t) \~ (B(t)\ / 0
При расширенном описании системы управляемая переменная
определяется выражением •
z(Q = (D(t),O)x(t). C.309)
Отметим, что уравнение C.308) описывает систему, которая не
является полностью управляемой по и.
Обратимся вновь к критерию оптимизации. В детерминирован-
детерминированной задаче регулирования рассматривался интегральный квадра-
Оптимальные линейные СУ с обратной связью 295
тический критерий
и
J [ zT (t) R3 (t) z (t) + uT (t) Rt (t) и (t)] dt + xT (ti) Ptx (h). C.310)
и
Для заданного воздействия u(t), tQ <: t <: ti, и заданной реа-
реализации возмущений v(t), t0 <: t < <if этот критерий является
мерой отклонений z(t) и u(t) от нуля. Однако априорно этот крите-
критерий нельзя оценить из-за стохастической природы возмущений.
Поэтому проводится осреднение по всем возможным реализациям
и рассматривается критерий
Е IJ [ zT (t) Ra (t) z (t) + uT (t) R2 (t) и (*)] dt + xT (*,) PlX (*i)J .
C.311)
Используя расширенный вектор состояния x(t) ==
xd(t)], этот критерий можно представить в виде
E f f [ zT (t) R3 (t) z (t) + uT (t) R2 (t) u(t)]dt+x*
C.312)
где
* = [% 2). C-313)
Очевидно, что задача минимизации критерия C.3t2) для систе-
системы C.308) является лишь частным случаем общей задачи миними-
минимизации
Е \ f [zT (t) R3 (t) z (t) + uT (t) R2 (t) и (t)] dt + xT (<j) Ptx fa) 1 C.314)
I v I
для системы
'x(t) = A (t) x(t)+B (t) u(t) + w (t), C.315)
где w(t) — белый шум, a x(t0) — стохастическая переменная.
Назовем эту задачу задачей построения стохастического линейного
оптимального регулятора.
Определение 3.4. Рассмотрим систему, описываемую дифферен-
дифференциальным уравнением состояния
x(t) = A (t) x(t)+B (t) u(t) + w (t) C.316)
296 Глава 3
с начальным состоянием
и управляемой переменной
z(t)=D(t)x(t).
C.317)
C.318)
В уравнении C.316) w(t) — белый шум с интенсивностью V(t).
Начальное состояние х0 является стохастической величиной, не
зависящей от белого шума w, с
Qo. . C.319)
Рассмотрим критерий
Elf[zT (<) Ra (t) z (t) + uT (t) R2 (t) и (*)] dt + xT
где R3(t), R%(t) — положительно определенные симметрические
матрицы для t0 < t <: tu a Pi— неотрицательно определен-
определенная симметрическая матрица. Тогда задача определения для любо-
любого момента t, t0 <: t <: tt, такого входного воздействия u(t) в виде
функций всей прошлой информации, при котором критерий
достигает минимума, называется задачей построения стохастиче-
стохастического линейного оптимального регулятора. Если в такой поста-
постановке задачи все матрицы являются постоянными, то эту задачу
назовем задачей построения стохастического линейного оптималь-
оптимального регулятора с постоянной настройкой.
Решение этой задачи рассматривается в разд. 3.6.3.
Пример 3.11. Смесительный бак
В примере 1.37 (разд. 1.11.4) была расширена модель смеси-
смесительного бака, в которой учтены возмущения в форме флуктуации
концентрации потоков. Расширенная модель системы описывается
уравнением
s(t) =
-— О
26
0
0
О О —4- О
0 i-
x(t)
Оптимальные линейные СУ с обратной связью
297
1
Сю — Со
va
0
0
1
С20 — с0
va
0 '
0
u(t) +
0
1
_0
0
0
0
1
w(t), C.321)
где w(t) — белый шум с интенсивностью
Ь_ о
о fi
C.322)
Здесь компонентами вектора состояния являются соответст-
соответственно приращение объема жидкости, изменение концентрации смеси
в баке, концентрации потока Ft и концентрации потока Ft.
Рассмотрим сначала в качестве компонент управляемой перемен-
переменной приращение выходного потока и выходной концентрации.
Тогда получим
/— о о о
= ( 29 И')-
10 0,
C.323)
Задача синтеза стохастического оптимального регулятора за-
заключается в определении такой входной переменной u(t), при кото-
которой критерий вида
Е К [ zT (t) Raz (t) + uT (t) R2u (t)} dt + xT (tt) Pix (tM C.324)
достигает минимума. Весовые матрицы R3 и i?2 выбираются точно
так же, как и в примере 3.9 (разд. 3.4.1), а матрица Pj выбирается
нулевой.
.3.6.2. СТОХАСТИЧЕСКИЕ ЗАДАЧИ СЛЕЖЕНИЯ
Задача построения стохастического оптимального регулятора
была сформулирована при рассмотрении задачи регулирования
с возмущениями. Стохастические задачи регулирования возника-
298 Глава 3
ют также при постановке стохастических оптимальных задач сле-
слежения. Рассмотрим линейную систему
x(t) = A(t)x(t)+B(t)u(t) ¦ C.325)
с управляемой переменной
z(t) = D (t) x (t). C.326)
Предположим, что управляемая переменная должна быть мак-
максимально близка к эталонной переменной zr(t), которая рассмат-
рассматривается как выходная" переменная линейной дифференциальной
системы, возбуждаемой белым шумом,
zr(t) = Dr(t)x,(t) C.327)
с
xr(t) = Ar(t)xr(t)+w{t). C.328)
Здесь w(t) — белый шум с заданной интенсивностью V(t).
Уравнения системы и эталонной модели можно объединить, вводя
расширенный вектор состояния x(t) = col[x(t), xr(t)], удовлетво-
удовлетворяющий уравнению
' ~ (AU) 0 \ ~ [B(t)\ ( 0 \
V 0 AT{t)J V 0 ) \w(t)J
Заметим, что эта система [так же, как и C.308)] не является
полностью управляемой по и.
Чтобы синтезировать оптимальную следящую систему, рас-
рассмотрим критерий
Е ttl{[z(t)-zr(t)]TR3(t)[z{t)~zr(t)} +
(и
+ uT(t)R2(t)u(t)}dt\, C.330)
где Rs{t), Rz(t) — соответствующие весовые матрицы. Этот кри-
критерий характеризует меру отклонения от эталонной переменной
при ограничении амплитуды входной 'переменной. При R3{t) =
= We(t) и R2(t) = p Wu(t) критерий упрощается:
fC.(t)±tCu(Wdt, C.331)
где Ce(t) и Cu(t) — среднее значение квадрата ошибки слежения и
Оптимальные линейные СУ с обратной связью ' 299
среднее значение квадрата входной переменной соответственно,
как и в гл. 2 (разд. 2.3):
Ce(t) = E[eT(t)We(t)e(t)},
C.332)
Cu(t) = E{uT(t)Wu(t)u(t)}.
Здесь e(t) — ошибка слежения,
e(t) = z(t) — zr(t). C.333)
Весовой коэффициент р должен выбираться таким образом,
чтобы получить наименьшее возможное среднее значение квадрата
ошибки слежения при заданной величине среднего значения
квадрата входной переменной.
Критерий C.330) можно выразить через компоненты расширен-
расширенного вектора состояния x(t) в следующем виде:
Е |' [ 7Т (t) Я3 (t)~z (t) + ит (t) R2 (t) и (*)J dt\, C.334)
где
7(t) = {D(t), -Dr(t))Z(t). C.335)
Задача минимизации критерия C.334) для системы C.329),
очевидно, является специальным случаем стохастической задачи
синтеза оптимального линейного регулятора в соответствии с оп-
определением 3.4.
Не входя в детали, укажем, что задачи слежения с возмуще-
возмущениями могут быть сведены к стохастическим задачам регулирова-
регулирования методом обновления состояния.
В заключение отметим, что подход, использованный в этом раз-
разделе, полностью согласуется чс гл. 2, в которой рассматривались
эталонные переменные с переменной и постоянной частями. В сле-
следующем разделе примем постоянную часть равной нулю; в разд.
3.7.1 будем рассматривать ненулевые постоянные эталонные пе-
переменные.
Пример 3.12. Система управления угловой скоростью
Рассмотрим систему управления угловой скоростью из приме-
примера 3.3 (разд. 3.3.1). Предположим, что угловая скорость, которая
является управляемой переменной С(От Должна отслеживать по
возможности точно эталонную переменную (,r(t), которую можно
представить в виде экспоненциально коррелированного шума с
постоянной времени Э и среднеквадратическим значением с*. Тогда
эталонный процесс можно описать выражением (см. пример 1.36,
разд. 1.11.4)
300 Глава 3
где %r(t)— решение уравнения
,C-337>
Белый шум w(t) имеет интенсивность 2ст,2/Э. Так-как дифферен-
дифференциальное уравнение состояния системы имеет вид
E(*)==-ag(*) + 4*(*), C.338)
то дифференциальное уравнение расширенного состояния можно
записать следующим образом:
*(*)=! 0 L ИН h(t)+[ k@. C.339)
где x(t) — col[?(?),. %r(t)]. В качестве критерия оптимальности
примем
Е J j [[С (О -<:Г (f)]2 + Ptt2 (*I ^^ 1. C.340)
где р — соответствующий весовой коэффициент. Этот критерий
можно представить в виде
f [ ] C-341)
где
Г(*) = A, —1) а:(*). C.342)
Задача минимизации критерия C.341) для системы, описываемой
уравнениями C.339) и C.342), является задачей стохастического
оптимального регулирования.
3.6.3. РЕШЕНИЕ ЗАДАЧИ СИНТЕЗА СТОХАСТИЧЕСКОГО ЛИНЕЙНОГО
ОПТИМАЛЬНОГО РЕГУЛЯТОРА
В разд. 3.6.1 была поставлена задача синтеза стохастического
линейного оптимального регулятора. Эта задача (определение
3.4) существенно отличается от детерминированной задачи регули-
регулирования, поскольку из-за белого шума невозможно точно предска-
предсказать поведение системы. Поэтому, очевидно, лучше не определять
априорно входное воздействие u{t) для всего периода управления
[t0, tj, а последовательно анализировать ситуацию в каждый про-
промежуточный момент времени t на основе всей располагаемой ин-
информации.
Оптимальные линейные СУ с обратной связью 301
В момент времени t дальнейшее поведение' системы полностью
определяется текущим состоянием x(t), входным воздействием
и(т) при т > t и белым шумом w(i) при % :> t. Вся информация
из прошлого, которая относится к будущему, содержится в сос-
состоянии x(t). В связи с этим рассмотрим закон управления вида
u(t) = g[x(t),t], C.343)
который определяет входное воздействие для всех возможных
состояний в моменты t.
Использование таких законов управления предполагает, что
все компоненты вектора состояния можно точно измерить в любой
момент времени. Как указывалось выше, такое предположение
является нереальным, тем более в стохастическом случае, когда
вектор состояния может включать компоненты, описывающие воз-
возмущения или эталонную переменную. Маловероятно, что эти ком-
компоненты можно легко измерить. Преодоление этой трудности будет
рассмотрено позднее, после гл. 4, в которой исследуются вопросы
восстановления состояния по неполным и неточным измерениям.
В предыдущих разделах было получено решение детерминиро-
детерминированной задачи регулирования в форме обратной связи C.343).
Для стохастического варианта задачи получен неожиданный ре-
результат, состоящий в том, что присутствие белого шума w(t) в
уравнении C.316) не изменяет решения, за исключением увеличе-
увеличения минимальной величины критерия. Сформулируем сначала
этот результат, 'а затем рассмотрим доказательство.
Теорема 3.9. Оптимальное линейное решение задачи построе-
построения стохастического линейного оптимального регулятора состоит
в выборе входного воздействия в соответствии с линейным законом
управления
u(t) = — F°(t)x{f), C.344)
где
F° (t) = ВТ1 (t) ВТ (t) Р (*)." - C.345)
Здесь P(t) — решение матричного уравнения Риккати
-P(t) = Ri(t)
+ Al
с конечным условием
-P(t)B (t) ВТ1
n(t)P(t) +
Р (*,) =
P(t)
Л-
Как и обычно; использовано обозначение
ВМ
) = DT(t)j
F? (t).
(t)B
A(t)
D(t).
T
(*)
P(t)
+
C.346)
C.347)
C.348)
302 Глава 3
Минимальная величина критерия определяется выражением
tr Гр (*0) Qo + \ Р (t) V(t)dt\. C.349)
Отметим, что эта теорема дает только наилучшее линейное
решение стохастической задачи регулирования. Поскольку мы
.ограничиваемся рассмотрением линейных систем, это вполне
удовлетворительно._]Однако можно доказать, что линейный закон
/ с обратной связью является оптимальным, если белый шум w(t)
' является гауссовским [6, 102, 103].
—- Для доказательства теоремы предположим, что система управ-
управляется с помощью линейного закона
u(t) = — F(t)x(t). C.350)
Тогда замкнутая система описывается дифференциальным урав-
уравнением
(t) + w(t), C.351)
и для критерия C.320) можно написать
Е I j1 xT (t) [ Я, (t) + FT (t) R2 (t) F (*)] x (t) dt + xT (tt) iV (tt)\ .
C.352)
Из теоремы 1.54 (разд. 1.11.5) следует, что критерий можно
выразить в виде
tr \р (t0) Qo + f1 P (t) V (t) dt\ , C.353)
где P(t) — решение матричного дифференциального уравнения
~P(t) = [A (t) ~B(t)F (OF P(t) + P (t) [A @ - В (t) F @1 +
+ Rl(t)+FT(t)Ri(t)F(t) , C.354)
с конечным условием
P (О = Pt. C.355)
Лемма 3.1 (разд. 3.3.3) устанавливает, что P(t) удовлетворяет
условию
P(t)>P(t) C.356)
Оптимальные линейные СУ с обратной связью 303
для всех t0 < t < tu где P(t) — решение уравнения Риккати
C.346) с конечным условием C.347). Неравенство C.356) преобра-
преобразуется в равенство, если F выбирается в виде
F° (х) = ЯГ' @ Вт (т) Р (х), t < т < *,. C.357)
Из неравенства C.356) следует
tr [Р (О Г ] > tr [Р @ Г] C.358)
для любой неотрицательно определенной Матрицы Г. Видно, что
критерий C.353) минимизируется путем выбора F в соответствии
с C.357). Для такого выбора F критерий C.353) задается в форме
C.349). Тем самым завершается доказательство того, что закон
управления C.345) является оптимальным линейным законом уп-
управления.
Теорема 3.9 позволяет решать различные типы задач. В разд.
3.6.1 и 3.6.2 было показано, что стохастическая задача линейного
оптимального регулирования может возникать в регулируемых
системах с возмущениями и в задачах оптимального слежения.
В обоих случаях эта задача имеет специальную структуру. Рас-
Рассмотрим теперь кратко свойства решений, которые следуют из
этих специальных структур.
Для случая регулирования при воздействии возмущений диф-
дифференциальное уравнение состояния и уравнение для выходной
переменной записываются в форме C.308), C.309). Предположим,
что решение P(t) уравнения Риккати C.346) разделено в соответ^
ствии с разделением вектора x(t) = col[a:(?), xd(t)]:
/Pit (t) Pi2 (t)\
P{t)^( ;iW 12U . C.359)
\Pl(t) Pn(t)j
Если соответственно матрица оптимальных коэффициентов
усиления обратной связи разбита в виде
= №@. *">(*)), C.360)
то нетрудно показать, что
F, @ = ^@^@^11@.
C.361)
Кроме того, путем разделения уравнения Риккати можно найти,
что PiU Pi2 и Р22 являются решениями матричных дифференци-
дифференциальных уравнений
304 Глава 3
Белый шум
W
Звено
прямой связи
Динамика
возмущений
\ и )
возмущение
V
Объект
X
В
Здено
обратной связи
Ряс. 3.14. Структура оптимального регулятора с обратной связью при воз-
возмущениях.
- Pu (t) = DT (t) R3 (t) D (t) - Pu (t) В (t) R? (t) BT (t) Pu {t) +
AT(t)Pli(t)^Pil(t)A(t),
- Pia (t) = Pu (t) Dd (t) + [A (t) - В (t) Fi (t)f Pi2 (t)
+ Plt(t)Aa(t),
C.362)
Pi»(*i) = 0, C.363)
-Pn(t) = - Pi(t) В (t) ЯГ1 (t) BT(t) Pn (t) + Dl (t) Pa (t) +
+ PTt (t) pd (t) +_ Al (t) P22 (t) + P22 @ Ad (t),
C.364)
Видно, что Рц, а следовательно, и Ft полностью не зависят от
Оптимальные линейные СУ с обратной связью 305
свойств возмущений и определяются путем решения детермини-
детерминированной задачи регулирования при отсутствии возмущений. Пос-
После того как определены Рц и Ft, можно решить уравнение C.363)
с целью определения Pi2, а затем и F2. Структура системы управ-
управления приведена на рис. 3.14. Очевидно, что обратная связь, т. е.
связь от состояния х к входному воздействию и, полностью не
зависит от свойств возмущений. Прямая связь, т. е. связь от сос-
состояния возмущений^ к управлению и, конечно, зависит от свойств
возмущений.
Аналогичный вывод можно сделать для задач оптимального
слежения. В этих случаях оказывается, что для дифференциаль-
дифференциальных уравнений состояния и для входной переменной со структурой
C.329) и C.335) матрицу усиления обратной связи можно разбить
на блоки
F0(t) = (Fi(t), —Ft(f)) , C.365)
(заметим, что введен знак минус), где
Fi(t) = RT1(t)BT(t)Pii(t),
F2(t)=-RTl(t)BT(t)Pl2(t).
C.366)
Здесь матрицы Рц, Pi2 и Р22 получены путем разбиения матри-
матрицы Р соответственно разбиению x(t) = col[x(t), xr(t)\. Эти матрицы
удовлетворяют матричным дифференциальным уравнениям
- Ри (*) = DT (t) R3 (t) D (t) - Pu (t) В (t) ДГ1 (t) BT (t) PH (t) +
+ AT(t)Pti(t) + Plt(t)A(t),
P (t.) = 0, C.367)
- Plt (t) = - DT (t) R3 (t) Dr (t) + [A (t) - В (t) Fi (t)f PiZ (t) +
+ Pit(t)Ar(t),
Ра(*д = О, C.368)
- PM (t) = DTT (t) R3 (t) Dr (t) - Pi (t) В (t) RTl (t) BT (t) Pi2 (t) +
+ AUt)Pn(t) + Ptt(t)A,(t)t
Pn(td = Q. C.369)
Можно сделать вывод, что для оптимальной системы слежения
обратная связь также не зависит от свойств эталонной перемен-
переменной, тогда как на прямую связь, конечно, оказывают влияние свой-
свойства эталонной переменной. Схема оптимальной системы слежения
представлена на рис. 3.15.
11—394
306 Глава 3
белый
шум w
¦ Звено
прямой
связи
Звено
обратной связи
Рис. 3.15. Структура оптимальной системы слежения с обратной связью
Вернемся вновь к общей стохастической задаче оптимального
регулирования. На практике обычно встречаются случаи, когда
интервалы управления очень велики. Это означает, что представ-
представляет интерес случай, когда tt -*- оо. В детерминированной зада-
задаче регулирования было показано, что обычно уравнение Риккати
C.346) имеет установившееся решениеP(t)при ti= -*- оо и что ус-
установившийся закон управления F(t) является оптимальным для
полубесконечных интервалов управления. Можно предположить
[1031, что установившийся закон управления является оптималь-
оптимальным для стохастического регулятора в том смысле, что миними-
минимизирует критерий
lim _i_ E\([zT (t)R3 (t) z (t) -f uT (t) i?2 (t) и (*)] dt] C.370)
<l-»oo h—t0 J
Ко /
(если это выражение существует для установившегося закона уп-
управления) в сравнении с другими управлениями, для которых су-
существует выражение C.370). Для установившегося закона управ-
управления критерий C.370) определяется в виде
1 '• г- 1
Нт —i_ I" tr [P (t) V (t)\ dt,
tt-*-oa t\ — to J
C.371)
если это выражение существует [ср. с C.349I. Кроме того, уста-
установлено, что для стохастической задачи регулирбвания с посто-
постоянными параметрами и асимптотически устойчивого закона уп-
управления с постоянной настройкой выражение C.370) равно
lim Е (z (t) Raz(t) + и (t) Rzu(t)
' 1
C.372)
Оптимальные линейные СУ с обратной связью 307
Из этого непосредственно следует, что установившийся закон
управления минимизирует критерий C.372) по сравнению со всеми
другими законами управления с постоянной настройкой. Из C.371)
видно, что минимальная величина критерия C.372) определяется
выражением
tr(PF). C.373)
Видно, что если Rs = We и R2 = р Wu, где We и Wu — весовые
матрицы в средних значениях квадратов ошибки слежения и вход-
входного воздействия (как определено в разд. 2.5.1), то выражение
C.372) точно равно
С»„ + рС»«- C.374)
Здесь Свсо— установившееся среднее значение квадрата ошибки
слежения, а Си<х> — установившееся среднее значение квадрата
входного воздействия. Чтобы. вычислить Се™ и Cum отдельно,
как это обычно требуется, необходимо вывести полные уравнения
замкнутой системы и получить из них дифференциальное уравне-
уравнение для матрицы дисперсий состояния. Из этой матрицы дисперсий
можно определить все необходимые среднеквадратические величи-
величины.
Пример 3.13, Регулятор смесительного бака
В примере 3.11 была описана стохастическая задача регулиро-
регулирования, возникшая при рассмотрении смесительного бака. В до-
дополнение к численным значениям примера 1.2 (разд. 1.2.3) примем
следующие значения величин:
94 = 40 с,
92=50 с, C.375)
О( = 0,1 кмоль/м3,
• а2 = 0,2 кмоль/м3.
Так же как и в примере 3.9 (разд. 3.4.1), запишем весовые мат-
матрицы й3 и й2 в следующем виде:
50 0 \ /JL 0\
. Я2 = р 3 . C.376)
0 0,02/ \ 0 3 /
гдер необходимо выбрать; Как и в примере 3.9, оптимальный за-
закон управления был определен для р = 10, 1 и 0,1, однако ре-
результаты здесь не приведены. Конечно, оказалось, что коэффици-
11*
308 Глава 3
енты усиления обратной связи по переменным состояния объекта
не изменяются при учете возмущений в модели системы. Это оз-
означает, что полюса замкнутой системы являются точно такими же,
как и в табл. 3.1.
Чтобы более детально оценить характеристики системы, вы-
вычислим матрицу ковариаций для установившегося состояния
= limE{x(t)xT(t)}
C.377)
из матричного уравнения
'0= [A — BF)Q + Q(A— Bl)T
C.378)
Матрицу ковариаций входного воздействия в установившемся
состоянии можно определить следующим образом:
limE {u(t)uT(t)} = И
Тт\ FQFT
= FQFT. C.379)
Из этих матриц ковариаций можно легко вычислить средне-
квадратические значения компонент управляемой переменной и
входного воздействия. В табл. 3.2 приведены результаты вычисле-
Таблица 3.2
Среднеквадратические значения в задаче регулирования
смесительного бака
р
оо
10
1
0,1
Установившиеся среднеквадратпческие значения
Приращение
выходного рас-
расхода. М3/С
0
0,0001038
0,00003303
0,000004967
Приращение
концентрации,
кмоль/м3
0,06124
0,03347
0,008238
0,001127
Приращение входного расхода, м'/с
№. 1
0
0,0008957
0,001567
0,001769
№ 2
0
0,0006980
0,001487
0,001754
ний. Из таблицы наглядно видно, что с уменьшением р флуктуа-
флуктуации выходной концентрации становятся все меньше и меньше.
Флуктуации выходного потока, обусловленные управлением, в
итоге также уменьшаются вместе с р. Все это происходит, конечно,
за счет увеличения флуктуации входных потоков. Из практичес-'
ких соображений необходимо решить, какая величина р является
наиболее рациональной.
Оптимальные линейные СУ с обратной связью 309
Пример 3.14. Система отслеживания угловой скорости
Рассмотрим задачу отслеживания угловой скорости, постав-
поставленную в примере 3.12. Чтобы решить эту задачу, разработаем
специальную структуру задачи отслеживания. Из C.365) находим,
что оптимальный закон слежения определяется соотношением
V- (t) = - Fi (t) | (*) + Fz{t\lr (t).i C.380)
Коэффициент обратной связи Fi(t) не зависит от свойств эта-
эталонной переменной и фактически уже был определен в предыдущих
примерах, где рассматривалась задача регулирования угловой
скорости. Из примера 3.7 (разд. 3.4.1) следует, что установившая-
установившаяся величина коэффициента обратной связи определяется выраже-
выражением
Г 2+ — V C.381)
а установившееся значение Ри равно
C.382)
Из (S.368) следует, что установившееся значение Р12 можно вы-
вычислить с помощью уравнения
^i2--j-Pn. C.383)
В результате получаем
* C-384)
f
Тогда
•х.
f C-385)
Наконец, решение уравнения C.369) для Р22 Дает
Р . C.386)
310 Глава 3
Выберем следующие численные значения:
а = 0,5 с,
х = 150 рад/(В • с2),
.6 = 1 с, C.387)
о = 30 рад/с,
р = 1000 рада/(В2 • с2).
Тогда получим следующие численные результаты:
F{ = 0,02846, F
(- 0,1897
P =
V—0,1733
Из C.373) получаем
lim [?{C2(O}+pS{[*
t-*oa
где C@ = ?@ — ?/¦(*)• Так как в
/0 0 \
F = (^o ^ij^
то находим
, = 0,02600,
— 0,1733\
0,16217 '
2@f] = tr(PF),
данной задаче
/0 0 \
: 1 0 1800 Г
\ /
C.388)
C.389)
C.390)
C.391)
- lim [е {Г2 (*)} + рЯ ((J.2 (*)}¦] = 291,8 рад2/с2. C.392)
Можно использовать соотношение C.392), чтобы получить
приближенные оценки среднеквадратическои ошибки слежения и
средНеквадратической величины выходного напряжения в следую-
следующем виде. Сначала из C.392) имеем
lim Е {Т2 It) ) < 291,8 рад2/с2. • C.393)
И-з этого следует, что
установившаяся среднеквадратическая ошибка
слежения < 17,08 рад/с. " C.394)
Аналогично из C.392) следует
lim Я {(л,2 @) <-^^- = 0,2918 В2. C.395)
t-+oo Р
Оптимальные линейные СУ с обратной связью 311
Делаем вывод, что
установившаяся среднеквадратическая величина входного на-
напряжения < 0,5402 В. C.396)
Точные значения среднеквадратическои ошибки слежения и
среднеквадратическои величины входного напряжения можно най-
найти путем вычисления матрицы ковариации состояния x(t) замкну-
замкнутой расширенной системы в установившемся состоянии. Эта сис-
система описывается уравнением
0 ~т) \°J Vv
C.397)
или
a *Fi^yx{t) + Qw{t), C398)
Матрица Q ковариации x(t) в установившемся состоянии яв-
является решением матричного уравнения
/—а — xF, *Fa\ / —a — *F, 0
0 =
Численное решение дает
/497,5 608,4 \
О = . C.400)
- V608'4 900,0/
Установившееся среднее значение квадрата ошибки слежения
определяется следующим образом:
НтЯ{[|(*)-|,(')]2} = 9н-2^12 +~&2 =180,7 рад2/с2, C.401)
гДе Qtj — входы матрицы Q. Аналогично среднее значение квад-
квадрата входного воздействия описывается выражением
^^ . = 0,1110 В2. - C.402)
312 'Глава 3
В табл. 3.3 сравниваются оцениваемые и фактические средне-
квадратические значения. Кроме того, указаны среднеквадрати-
ческие значения для разомкнутой системы, т. е. среднеквадрати-
ческие значения для случая, когда вообще нет управления. Видно,
что оцениваемые среднеквадратические ошибка слежения и вход-
входное напряжение весьма приближенные, но .они дают наглядное
представление о порядке величин. Более того, видно, что управ-
Таблица 3.3
Численные результаты для системы отслеживания
угловой скорости
Система
Разомкнутый контур
Оцениваемый замкнутый контур
Фактический замкнутый контур
Установившееся
среднеквадратическое
значение ошибки
слежения, рад/с
30
<17,08
13,44
Установившаяся
среднеквадратическая
величина входного
напряжения, В
0
<0,5402
0,3333
ление малоэффективно, так как среднеквадратическая ошибка
слежения 13,44 рад/с не является малой в сравнении со средне-
квадратической величиной эталонной переменной 30 рад/с Сред-
Среднеквадратическая величина входного воздействия весьма мала,
однако она, по-видимому, еще может быть уменьшена. Этого мож-
можно достичь, выбирая гораздо меньшую величину р (см. задачу
3.5).
Проверим теперь эталонную переменную и полосу пропускания
замкнутой системы в настоящем примере. Частота срыва для эта-
эталонной переменной равна 1/0 = 1 рад/с. Подставляя закон управ-
управления в уравнение системы, найдем для замкнутой системы
Это система первого порядка с частотой срыва
а2 + — = 4,769 рад/с.
C.403)
C.404)
Так как спектральная плотность эталонной переменной, явля-
являющейся экспоненциально коррелированным шумом, относительно
медленно уменьшается с ростом частоты, разность частот срыва
эталонной переменной и замкнутой системы недостаточно велика
для получения малой ошибки слежения.
Оптимальные линейные СУ с обратной связью 313
3.7. Системы регулирования и следящие
системы с пену левыми заданными
точками и- постоянными возмущениями
3.7.1. НЕНУЛЕВЫЕ ЗАДАННЫЕ ТОЧКИ
При рассмотрении задач регулирования и слежения до сих
пор предполагалось, что нулевое состояние всегда является желае-
желаемым равновесным состоянием системы. На практике, однако, почти
во всех случаях желаемою равновесное состояние, которое будем
называть заданной точкой пространства состояний, характеризу-
характеризуется постоянной точкой, не совпадающей с началом координат.
Такое отличие можно исключить, если сместить начало координат
пространства состояний в зту точку. Так, обычно и поступали в
рассмотренных примерах. В настоящем разделе, однако, будет
рассмотрен случай, когда заданная точка не является фиксиро-
фиксированной, т. е. предполагается, что заданная точка постоянна на
длительных интервалах времени, но время от времени она смеща-
смещается. Такая ситуация на практике является типовой.
Ограничимся анализом системы с постоянными параметрами.
Рассмотрим линейную систему с постоянными параметрами, опи-
описываемую дифференциальным уравнением состояния
х (t) = Ax (t) -+- Би @, C.405)
где управляемая переменная определяется выражением
z (i) = Dx (i). C.406)
Предположим, что заданная точка управляемой переменной
есть z0. Тогда для того, чтобы привести систему в зту точку, необ-
необходимо определить постоянное входное воздействие ы0, которое
удерживает состояние в точке лг0, так что [52]
z0 = Dx0. C.407)
Из дифференциального уравнения состояния следует, что х0
и и0 должны быть связаны соотношением
0 = Ах0 + Ви0. C.408)
Может ли быть система переведена в заданную точку, зто зави-
зависит от того, можно ли решить соотношения C.407) и C.408) отно-
относительно щ для заданного z0. К этому вопросу мы еще вернемся, а
сейчас предположим, что решение существует. Определим смещен-
смещенное входное воздействие, смещенное состояние и смещенную управ-
управляемую переменную соответственно:
314 Глава 3
x'{t) = x(t) — x0, C.409)
z'(t) = z(t)-z0.
Решая эти уравнения относительно u, х и z, подставляя получен-
полученный результат в дифференциальное уравнение состояния C.405)
и уравнение для выходной переменной C.406) и используя C.407)
и C.408), нетрудно установить, что смещенные переменные удов-
удовлетворяют уравнениям
x'(t)=Ax'(t) + Bu'(t),
C.410)
z' (t) = Dx' (t).
Предположим теперь, что в определенный момент времени за-
заданная точка скачком смещается. Тогда в параметрах смещенных
уравнений C.410) система приобретает ненулевое начзльное сос-
состояние. Для того чтобы система достигла новой заданной точки
регулярным образом, предлагается оказывать такое воздействие
на переходный процесс, чтобы достигал минимума критерий оп-
оптимальности
( [z'T(t) Raz' (t) + и'Т (t) R2u' (t)] dt + x'T (h) P±x' (*,). C.411)
Предположим, что смещенная задача регулирования имеет
установившееся решение в форме асимптотически устойчивого
установившегося закона управления с постоянной настройкой
u'(t) = — Fx'{t). ¦ C.412)
Использование этого закона управления, гарантирует, что (в
параметрах исходной системы) система переходит в новую заданную
точку с максимальной скоростью и без чрезмерно больших амп-
амплитуд входного воздействия.
Посмотрим теперь, какую форму принимает закон управления
в параметрах исходной системы. Из уравнений C.412) и C.409)
получаем
и (t) = —~Fx (t) + щ+ Far,,. C.413)
Отсюда следует,, что закон управления имеет вид
u (t) =—Fx (t) -t- и'д, C.414)
где необходимо опрзчелить постоянный вектор и'о таким образом,
чтобы в установившемся состоянии управляемая переменная z{t)
Оптимальные линейные СУ с обратной связью 315
достигала заданной величины z0. Рассмотрим вопрос о том, при
каких условиях можно найти и'о.
Подстановка выражения C.414) в дифференциальное уравне-
уравнение системы дает
х (t) = (A —BF) х (*) + Ви'о . C.415)
Так как замкнутая система асимптотически устойчива, то при
t -*¦ оо состояние достигает установившихся значений х0, которые
удовлетворяют уравнению
о + Ви'0. C.416)
Введем обозначения
2= A—BF. C.417)
Поскольку замкнутая система асимптотически устойчива, все
характеристические числа матрицы А находятся в левой области
комплексной плоскости, и поэтому А несингулярна. Тогда урав-
уравнение C.416) можно решить относительно х0:
х0 = (— А)'1 Ви'о. _ C.418)
Для достижения заданной точки управляемой переменной z0
необходимо, чтобы выполнялось условие
C.419)
При решении уравнения относительно и'о с заданной величиной
г0 необходимо выделить три случая.
а) Размерность г больше, чем и. Тогда C.419) решается только
для отдельных значений z0, а общее решение не существует. В
этом случае следует пытаться управлять переменной z(t) при мень-
меньшей размерности входного воздействия u(t). Поскольку имеется
слишком мало степеней свободы, неудивительно, что для .об-
.общего случая решение найти нельзя.'
б) Размерности uuz одинаковы, т. е. имеется достаточное число
степеней свободы для управления системой. В этом случае C.419)
можно решить относ тельно м'опри условии, что матрицаD(—А)~1В
несин гулярна. Находим выражение
щ=\0{-1)-хВ\-хг„ C.420)
которое определяет оптимальное входное воздействие дош системы
слежения
( [Л(— 1)"*В]~Ч. C.421)
в) Размерность z меньше, чем и. В этом случае существует слиш-
316 Глава 3
ком много степеней свободы и C.419) имеет много решений. Мо-
Можно-выбрать одно из этих решений, однако более рационально
заново сформулировать задачу слежения, добавляя компоненты
в управляемую переменную.
На основе этих соображений будем впредь предполагать, что
dim (z) = dim (и), C.422)
т. е. имеет место случай (б). Получаем
д(_1)-1Б = Яс@), . C.423)
где _
Hc{s) = D{sI — А)'1 В, C.424)
Назовем Hc(s) матричной передаточной функцией [переда-
[передаточной матрицей) замкнутой системы, поскольку она является
матрицей перехода от u'(t) к z(t) для системы
х (t) = Ах @ + Ви (t),
z(t) = Dx(t), C.425)
Оптимальный закон управления C.421) можно записать через
Нс @) в следующем виде:
u(t) = —Fx(t) + H71 @) z0. C.426)
Как было показано, этот закон управления обладает тем свойст-
свойством, что после ступенчатого изменения заданной точки г0 система
переводится в новую заданную точку с максимально возможной
быстротой без чрезмерно больших амплитуд входного воздействия.
Кроме того, этот закон управления, конечно, возвращает систему
в заданную точку из любого начального состояния оптимальным
образом. Назовем C.426) оптимальным законом управления при
ненулевой заданной точке. Этот закон обладает тем свойством, что
статически разделяет систему управления, т. е. передаточная
матрица T(s) от заданной точки z0 к управляемой переменной z
удовлетворяет условию Т@) = /.
Рассмотрим теперь вопрос, при каких условиях Нс@) имеет
обратную матрицу. Покажем, что это свойство можно выяснить
непосредственно из уравнений разомкнутой системы
х (t) = Ax (t) + Ви (t),
C.427)
z(t) = Dr(t).
Рассмотрим следующую цепь равенств:
det [Яс (s)] = det [D {si — A +BF)'1 В] =
Оптимальные линейные СУ с обратной связью 317
= det [D (si — А)'1 {/+ BJ(sI — А)'1}'1 В] =
= det [D (si — Ay* {I—BF~[l +
+ (si — A)-* BF]'1 (si — Ay*} B] =
= det[D(sI — A)-iB]det[l— F {si — Л+5^)~гв] =
= det [D (si — A)-1 B] det [i — (si — A + Bl)'1 BF\ =
= det [D(sI—A^B]det [{si—A + BF)'1 ]det(s/— 4)=
det (si — A + BF) 4c
Здесь дважды используем лемму 1.1 (разд. 1.5.3). Полином
t|»(s) определяется выражением
det [#(«)]= i^-, C.429)
9 (s)
где H(s) — передаточная матрица разомкнутой системы
H(s) = D (si — Ay* В, C.430)
a cp(s) "~" характеристический полином разомкнутой системы
Ф (s) = det (si — А). C.431)
Наконец, срс (s) — характеристический полином замкнутой сис-
системы
Фс (s) = det (si — А + Bl)." C.432)
Из. C.428) видно, что нули передаточной матрицы замкнутой
системы такие же, как и у передаточной матрицы разомкнутой
системы. Видно также, что определитель
' det [D {-А)'1 В] = det[Яс@)] = ±?L C.433)
равен нулю тогда и только тогда, когда ф@) = 0. Таким обра-
образом, условие ф@) Ф 0 гарантирует, что матрица D(—А)~1В несин-
несингулярна; следовательно, закон управления при ненулевой задан-
заданной точке существует. Эти результаты можно суммировать в сле-
следующем виде.
Теорема 3.10. Рассмотрим систему с постоянными параметрами
x(t) = Ax(t)+Bu(t), C.434)
z {t) = Dx (t),
318 Глава 3
где z и и имеют одинаковую размерность. Рассмотрим некоторый
асимптотически устойчивый закон управления с постоянной
настройкой
u(t) = -~ Fx {?) + и' (t). C.435)
Обозначим через H(s) передаточную матрицу разомкнутой
системы
H(s) = D (si — А)-1 В, C.436)
а через Нс (s) — передаточную матрицу замкнутой системы
Нс (s) => D (si — А + BF)'1 В. C.437)
Матрица Нс @) является несингулярной, а величина управляе-
управляемой переменной z(t) при установившихся условиях может поддер-
поддерживаться равной z0 с помощью
и' (t) = Я71 @) z0 C.438)
тогда и только тогда, когда H(s) является полиномом с ненулевым
числителем, который не имеет нулей в начале координат.
Отметим, что эта теорема формулируется для любого асимпто-
асимптотически устойчивого закона управления, а не только для-устано-
для-установившегося оптимального закона управления.
1 В этом разделе были рассмотрены только детерминированные
задачи регулирования. В стохастических задачах регулирования
(включая задачи слежения), конечно, также могут быть ненулевые
заданные точки. Теория, рассмотренная в этом разделе, исполь-
используется для стохастических задач регулирования без модификации.
Оптимальный закон управления для стохастического регулятора
при ненулевой заданной точке также определяется выражением
и' (t) = Fx (t) + #7' @) z0. C.439)
Пример 3.15. Система управления положением
Рассмотрим систему управления положением из примера 3.4
(разд. 3.3.1). В примере 3.8 (разд. 3.4.1) был получен оптимальный
установившийся закон управления. Нетрудно определить на осно-
основе результатов примера 3.8, что передаточная функция замкнутой
системы имеет вид
He(s) .!__' ^ . C.440)
V р р
Из C.435) и C.438) следует, что оптимальный закон управле-
Оптимальные линейные СУ с обратной связью 319
ния при ненулевой заданной точке определяется выражением
г= /0,1
F= 1,0,
= -^rb(*)-f -a
У? x \
где Со — заданная точка для углового положения. Это выражение
точно совпадает с законом управления C.171), который был полу-
получен в примере 3.8 из элементарных соображений.
Пример 3.16. Смесительный бак
В качестве примера многомерной системы регулирования рас-
рассмотрим задачу регулирования смесительного бака из примера 3.9
(разд. 3.4.1). При р = 1, где р определяется так же, как в примере
3.9, задача регулирования приводит к определению матрицы
установившихся коэффициентов усиления обратной связи:
,1009 -6,09708^ C 442)
,01681 0.05475J* @Л^>
Нетрудно установить, что соответствующая передаточная мат-
матрица замкнутой системы определяется выражением
Нс (s) = D (si — А + BF)~l В а.
= 1 / 0,01s + 0,0007475 0,01s + 0,001171 \
*а + 0,2131s + 0,01037 \— 0,25s — 0,01931 0,75s + 0,1084 )•
C.443)'
Из оптимального закона управления при ненулевой заданной
точке можно найти
—0,1171 \„ гз 444^
0.07475J °" ( ;
На рис. 3.16 показана реакция замкнутой системы на ступен-
ступенчатые изменения элементов заданной точки г0. Здесь заданная точ-
точка для выходного потока изменяется на 0,002 ms/c, что составляет
10% номинальной величины, тогда как для выходной концентра-
концентрации заданная точка изменяется на 0,1 кмоль/м3, что соответствует
8% номинальной величины. Заметим, что в системе управления
проявляется в некоторой степени динамическое взаимовлияние,
или взаимосвязь, т. е. изменение заданной точки по одной из ком-
компонент управляемой переменной непосредственно влияет на дру-,
гую компоненту. Однако это влияние невелико.
320 Глава 3
о,оогг
0,002
0.1 г-
I
0 Ьл 50
Рис. 3.16. Реакции смесительного бака'как системы регулирования с ненуле-
ненулевой заданной 4 точкой.
Слева — реакции по приращению расхода и концентрации выходного потока на ступенча-
ступенчатое изменение расхода 0,002 м3/с; справа — реакции по приращению расхода и концентра-
концентрации на ступенчатое изменение концентрации 0,1 кмоль/м'.
3.7.2*. ПОСТОЯННЫЕ ВОЗМУЩЕНИЯ
В этом- разделе рассмотрим метод компенсации влияния посто-
постоянных возмущений в системах регулирования с постоянными па-
параметрами. Как было показано в гл. 2, в системах регулирования
и слежения, где требуется высокая точность, важно полностью
исключить постоянные возмущения. Этого можно добиться, ис-
используя свойства интеграла. Введем интегрирование в управле-
управление с обратной связью путем первоначального расширения обыч-
обычной задачи регулирования, а затем рассмотрим влияние постоян-
постоянных возмущений в соответствующей модифицированной схеме зам-
замкнутой системы управления.
Рассмотрим систему с постоянными параметрами, описываемую
дифференциальным уравнением состояния
x(t)^Ax(t)+Bu(t)
C.445)
Оптимальные линейные СУ с обратной связью 321
при заданном x(t0) и управляемой переменной
C.446)
Добавим к параметрам системы «интегральное состояние»
[131, 140, 161], определяемое соотношением
q(t) = z(t) C.447)
при заданном q{t0). Тогда можно рассмотреть задачу минимизации
критерия вида
оо
[ zT (t) R3z (t) + qT @ R'3 q (t) + uT (t) R2u (t)] dt, C.448)
где /?з, R3', R2 — соответствующим образом выбранные весовые
матрицы. Первый подынтегральный член сводит управляемую пе-
переменную к нулю, тогда как второй член минимизирует величину
интеграла, т. е. общая площадь под кривой реакции управляе-
управляемой переменной стремится к нулю. Третий член, как обычно,
используется для ограничения амплитуды входного воздействия.
Предположим, что путем минимизации выражения C.448) или
с помощью другого метода определен закон управления с по-
постоянными параметрами
!»(*) = - Ftx (t) -[F2q (t), C.449)
который стабилизирует расширенную систему, описываемую урав-
уравнениями C.445) — C.447). Отложим в данное время рассмотрение
вопроса о том, при каких условиях существует такой асимптоти-
асимптотически устойчивый закон управления. Предположим, что в системе
присутствует постоянное возмущение. Тогда дифференциальное
уравнение состояния C.445) необходимо заменить на уравнение
x(t) = Ax(t) + Bu(t) + v0, C.450)
где v0 — постоянный вектор. Так как присутствие постоянного
возмущения не влияет на асимптотическую устойчивость системы,
то
lim q (t) = 0 C.451)
t-*co
или из C.447)
lim z (t) = 0. C.452)
Это означает, что система управления с асимптотически устой-
устойчивым законом управления C.449) обладаетп^таким свойством, что
влияние постоянных возмущений на управляемую переменную в
322 Глава 3
x=Ax+Bu
: h
X
J
4 ,
Рис. 3.17. Схема системы интегрального управления с обратной связью.
конце концов исчезает. Так как это достигается за счет введения ин-
интеграла состояния q, такая схема системы управления имеет форму
интегрального управления. На рис. 3.17 представлена схема ин-
интегрального управления.
Рассмотрим процесс подавления постоянного возмущения.
Целью интегрирования по многим переменным C.447) является
формирование постоянной составляющей и0 во входном воздейст-
воздействии, которая компенсирует влияние постоянного возмущения на
управляемую переменную. Рассмотрим реакцию системы C.450)
на входное воздействие
и (*)*= — Ftx (t) + и0. C.453)
Подстановка этого выражения в дифференциальное уравнение
состояния C.450) дает
C.454)
х (t) = (А — BFt) х (t) + Ви0 + v0.
Предполагается, то в равновесных условиях^ имеется постоянная
составляющая состояния х0, которая должна удовлетворять соот-
соотношению
где
0 = Ах0 + Ви0 + v0,
— BFt.
C.455)
C.456)
Решение для х0 дает
х0 = (— ly^-Buo + (—~A)~lvQ C.457)
при условии, что матрица А несингулярная. Соответствующая рав-
равновесная величина управляемой переменной z0 определяется вы-
выражением
z0 = Dxo = D (—I) Ви0 + D{— J)'1 v0. C.458)
Оптимальные линейные СУ с обратной связью 323
Если теперь рассмотреть вопрос о том, существует ли величина
щ, которая обеспечивает равенство z0 = 0, то, очевидно, получим
такие же'условия, как и в разд. 3.7.1, соответствующие следую-
следующим трем случаям.
а) Размерность z больше, чем и. В этом случае уравнению
Q = D{—l)~1Bu0 + D(—A)~1v0 C.459)
соответствует число уравнений, которое больше числа переменных.
Это означает, что решение для общего случая не существует.
Число степеней свободы слишком мало, и установившуюся ошибку
по z нельзя исключить.
б) Размерность z равна размерности и. В этом случае решение
существует тогда и только тогда, когда матрица
D [— А)'1 В = Не @) C.460)
несингулярна, где
Hc(s) = D{sI — 1)~1В C.461)
есть передаточная матрица замкнутей системы. Как следует из
теоремы 3.10, матрица Нс @) является несингулярной тогда и толь-
только тогда, когда передаточная матрица разомкнутой системы H(s) =
= D(sl — А^В не имеет нулей в начале координат.
в) Размерность z меньше размерности и. В этом случае имеется
слишком много степеней свободы, и размерность z можно увели-
увеличить путем добавления компонент в управляемую переменную.
На основе этих соображений ограничимся случаем dim(z) =
= dim(w). Проведенный анализ показывает, что необходимое усло-
условие для успешной работы рассматриваемой схемы интегрального уп-
управления состоит в том, что передаточная матрица разомкнутой
системы H(s) = D(sl — А)'1 В не должна иметь нулей в начале
координат. Действительно, путем некоторого развития результатов
работы [144], включающих каноническое представление системы
C.445) в форме управляемости, можно показать, что необходимые и
достаточные условия для существования асимптотически устойчи-
устойчивого закона управления в форме C.449) состоят в том, что:
1) система C.445) должна быть стабилизируема и
2) передаточная матрица разомкнутой системы H(s) =
D(sl — А)~1В не должна иметь нулей в начале координат.
В работах [45, 144] показано, что. необходимые и достаточные
условия для произвольного размещения полюсов замкнутой систе-
системы состоят в том, что система C.445) должна быть полностью уп-
управляемой, а передаточная матрица разомкнутой системы не долж-
должна иметь нулей в начале координат. В работе [45] последнее усло-
условие сформулировано в альтернативной форме.
В литературе можно найти различные подходы .к определению
324 Глава 3
схем интегрального управления (см., например, работы
[1, гл. 10; 81]).
Пример 3.17. Управление положением с использованием интеграла
Рассмотрим систему управления положением из предыдущих
примеров и предположим, что на вход системы поступает постоян-
постоянное возмущение в форме постоянного момента тона валу двигателя.
Преобразуем Дифференциальное уравнение состояния C.59) к
форме
(! i) () (?)- СЗ-462)
где у — 1U, а / — момент инерции всех вращающихся частей.
Как и раньше, управляемая переменная определяется выражением
С(*) = A, O)x(t), C.463)
Дополним систему скалярной интегральной переменной состоя-
состояния q(t), определяемой в виде
д(*)-Ч(*). C.464)
Из примера 3.15 известно, что передаточная функция разом-
разомкнутой системы не имеет нулей в начале координат. Кроме того,
система является полностью управляемой, так что не следует ожи-
ожидать трудностей в определении системы интегрального управле-
управления. Рассмотрим критерий оптимальности
и
Как и в предыдущем примере, выберем?
р = 0,00002 рад2/В2. • C.466)
Анализ рис. 3.9 показывает, что при отсутствии интегрального
управления q(t) достигает установившийся величины около
0,01 рад-с при заданных начальных условиях.
Выбирая
X = 10 с, ' C.467)
можно существенно влиять на схему управления.
Численное решение соответствующей задачи регулирования при
численных значениях примера 3.4 (разд. 3.3.1) и у~0,1кг -м
позволяет определить установившийся закон управления
(I (t) = - Ftx (t) - F2q (t) C.468)
Оптимальные линейные СУ с обратной связью
325
Рис. 3.18. Реакция системы интегрального управления положением на пос-
постоянный момент ЮН-м на валу двигателя.
Ft = B99,8, 22,37),
C.469)
F2 = 707,1.
Соответствующие характеристические числа замкнутой системы
равны —9,519 ± 7 9,222 с и —3,168 с. При сравнении с чисто
пропорциональной схемой из примера 3.8 (разд. 3.4.1) отметим,
что пропорциональная часть обратной связи, которую представля-
представляет Fx, изменяется незначительно [ср. с C.169)], а соответствующие
полюса замкнутой системы, равные —9,658 + /9,094 с в примере
3.8, перемещаются также незначительно.-На рис. 3.18 показана
реакция интегральной системы управления при нулевых началь-
начальных условиях на постоянный момент х0 на валу двигателя, равный
ЮН -м. Максимальное отклонение углового перемещения, вызван-
вызванного постоянным моментом, составляет ~0,004 рад.
3.8*. Асимптотические свойства
оптимальных законов управления
с постоянными параметрами
3.8.1*. АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ ПОЛЮСОВ ОПТИМАЛЬНОЙ
ЗАМКНУТОЙ СИСТЕМЫ
В разд. 3.2 было показано, что устойчивость линейных систем
управления с обратной связью и постоянными параметрами можно
обеспечить или повысить путем соответствующего размещения
326 Глава 3
полюсов замкнутой системы в левой половине комплексной плос-
плоскости. Однако при этом не определялись наиболее рациональные
типы размещения полюсов. В разд. 3.3 и 3.4 была изложена
теория линейных оптимальных систем управления с обратной
связью. Для оптимальных систем с постоянными параметрами,
очевидно, интересным вопросом являются типы размещения
полюсов замкнутой системы. Данный раздел посвящен изучению
типов размещений полюсов. В результате будет получена по-
полезная информация об ожидаемой реакции оптимальных регуля-
регуляторов.
Выберем в задаче регулирования с постоянными параметрами'
выражение для /?2 в виде
R2 = pN, C.470)
где N — положительно определенная симметрическая матрица,
ар — положительный скаляр. При таком выборе R2 критерий
оптимальности определяется выражением
со
I
[ zT (t) R8z (t) + pi/ (t) Nu (t)] dt. C.471)
Параметр р показывает, какой вес приписывается входному
воздействию; при большой величине р амплитуда входного воз-
воздействия мала, а при малой величине р допускаются большие амп-
амплитуды входного воздействия. Ниже рассмотрим вопрос, каким об-
образом изменяется распределение полюсов оптимального замкну-
замкнутого регулятора в функции р . Для этого используем методы корне-
корневого годографа.
В разд. 3.4.4 было показано, что полюса оптимальной замкну-
замкнутой системы являются характеристическими числами матрицы Z
в левой половине комплексной плоскости, где
C.472)
¦DTRSD -Ar
Используя лемму 1.2 (разд. 1.5.4) и лемму 1.1 (разд. 1.5.3),
представим det (si—Z) в следующем виде:
det (si — Z) = det I P
\DTR3D si + AT
= det (si — A) det \{sl + AT) — DTR3D (si — A)^ —
I P
= det (si — A) det {si + AT) det [/ — DTR3D (si —
Оптимальные линейные СУ с обратной связью ч 327
_ A)i~ J_ BN-iBT {si + А7)'11 =
Р J
= det (si —A) (— 1)" det(— si — A) det \l +
+ ± N-iBT {-SI-AT Y1 DTRaD (si - A)~i B] =
P J
= — 1)" ф (s) Ф (— s) det \l + — N~4IT (— s) RsH (s)l, C.473)
где n — размерность вектора состояния х,
Ф (s) = det (si — A),
C.474)
= D(sI— A)~lB.
Для простоты сначала исследуем случай, когда входное воз-
воздействие и и управляемая переменная z являются скалярами, а
также
Д3=1, # = 1. C.475)
В конце этого раздела возвратимся к случаю многомерной
системы. Из выражения C.473) следует, что в случае системы
с одним входом и одним выходом (со скалярными входной и вы-
выходной переменными) полюса замкнутой системы находятся в
левой половине комплексной плоскости:
(- 1)" Ф (•) Ф<_ ,)[i + -Lh (-}s) И (,)], C.476)
где H(s) — скалярная функция.
Представим H(s) в форме
H(s) = ±<fL, C.477)
<p(s)
где ty(s) — полином. Из этого выражения следует, что полюса зам-
замкнутой системы являются корнями следующего уравнения, распо-
расположенными в левой половине комплексной плоскостиЗ
Ф (s) ф (— s)i + — ф (*) <К— *) - 0. C.478)
Р
Для определения годографа полюсов замкнутой системы можно
использовать два метода. Согласно первому методу, уравнение
C.478) представляется в виде функции s2, s2 заменяется на s' и
определяется корневой годограф в s'-плоскости. Полюса замкнутой
системы затем определяются как квадратные корни в левой полу-
полуплоскости из корней в s'-плоскости. Этот метод называется методом
квадратичного корневого годографа [35].
328 Глава 3
Для наших целей более удобно строить годограф корней в
-плоскости. Напишем
C.479)
ф(*)= П (*—*«)•
где v,, i = 1,2, ...,р, — нули H(s), a пи i = li 2, ...,», —
полюса H(s). Чтобы привести уравнение C.478) к стандартному
виду, перепишем его с учетом C.479):
П (* - *i) (* + *,) + (- I)""" — П (• - v,) (s + ь) = 0. C.480)
' Используя правила разд. 1.5.5, сделаем следующие выводы.
а) При р -> 0 2га корней уравнения C.480) из общего числа 2 р
асимптотически приближаются к р нулям Vj, i — 1, 2, ..., р, и
их отрицательным значениям —vb i = 1, 2, ..., p.
б) При р -> 0 другие 2(га — р) корней уравнения C.480) асимп-
асимптотически приближаются к прямым линиям, которые пересекаются
в начале координат и образуют с положительной вещественной
осью углы, равные
——, к = 0,1,2,..., 2га — 2р — 1, га — р—нечетное число,
п—р
C.481)
•, ft = 0,1, 2,..., 2га — 1р—1, га — р — четное число.
п — р
в) При р -*• 0 2(п — р) удаленных корней уравнения C.480)
асимптотически удалены от начала координат на расстояние
C.482)
т)
г) При р ->- оо 2га корней уравнения C.480) приближаются к
геполюсамл i,i —1, 2, ..., re, и их отрицательным значениям —я г,
i = 1,2 п.
Поскольку полюса оптимальной замкнутой системы являются
корнями уравнения C.480) в левой полуплоскости, можно сделать
следующий вывод [87].
Оптимальные линейные СУ с обратной связью 329
Теорема 3.11. Рассмотрим установившееся решение задачи регу-
регулирования для системы с одним входом и одним выходом при R3 = 1
и R2 = р . Предположим, что разомкнутая системна является ста-
стабилизируемой и обнаруживаемой, а передаточная функция опреде-
определяется выражением
р
П (» —
П (* —п{)
C.483)
где.щ, i =1,2,..., п, — характеристические числа системы. Тог-
Тогда имеем следующее.
а) При р | 0 р из п характеристических чисел оптимальной
замкнутой системы асимптотически приближаются к чис-
числам v;, i = 1,2,..., р, где
/Л ( \1 pi* я Tt \\ Л /у | **** M
- I I» "ЬЛ1Ь J.IU 1 V;f -JSs- Vj o /о/\
v^ = { v C.484)
I — v4, если Re(v,)>0.
б) Я/7И p | 0 оставшиеся п — p характеристических чисел
оптимальной замкнутой системы асимптотически приближают-
приближаются к прямым линиям, которые пересекаются в начале координат и
образуют с отрицательной вещественной осью уг-лы, равные
± I —-— , I = 0,1,..., п~р f и — р— нечетное число,
п — р 2
C.485)
(г+тЬ '
±— —, Z = 0,1, ..., -— 1, п — р — четное число.
п — р 2
Эти удаленные характеристические числа замкнутой системы
асимптотически удалены от начала координат на расстояние
C.486)
в) Прир -*¦ оо га характеристических чисел замкнутой системы
л
приближаются к числам л i, i = 1, 2, ..., га, где
л = f it,, если Re (it,) <s 0, 4g
|—rt;, если Re(^j)>Q.
Распределение полюсов, указанное в п.(б), известно как рас-
распределение (размещение) Баттерворса порядка га — р с радиусом
оH [175]. На рис. 3.19 указаны некоторые типы распределения
330 Глава 3
-J
Рис. 3.19. Распределения полюсов по Баттерворсу первого — пятого поряд-
порядков с единичным радиусом (соответственно графики 1—5).
Баттерворса невысокого порядка. В следующем разделе будет
рассмотрено, каким характеристикам системы соответствуют такие
распределения.
На рис. 3.20 приведен пример поведения полюсов замкнутой
системы при гипотетическом распределении полюсов и нулей.
Крестики обозначают полюса, а кружки — нули разомкнутой
системы. Так как полюсов на два больше нулей, то при р \ 0 име-
имеет место распределение Баттерворса второго порядка. Оставшийся
полюс замкнутой системы приближается к нулю разомкнутой сис-
системы при р ]• 0. При р -*¦ оо полюса замкнутой системы прибли-
приближаются к единственному полюсу разомкнутой системы в левой
полуплоскости и к зеркальным отражениям двух полюсов разом-
разомкнутой системы в правой полуплоскости.
Вернемся вновь к случаю многомерной системы. Исследуем
корни уравнения
Оптимальные линейные СУ с обратной связью
331
р=
р=
р-0
lm
Re
\
\
\
Рис. 3.20. Корневой годограф характеристических чисел матрицы Z (пунктир-
(пунктирные и сплошные линии) и полюсов замкнутой системы (только сплошные ли-
линии) для системы с одним входом и одним выходом при фиктивном распреде-
распределении полюсов (х) и нулей (О) разомкнутой системы.
s) RSH (s) = 0. C.488)
Ф (s) ф (— s) det Г/ -f — N-xHr
L P
Задача определения корневого годографа для этого выражения
является не такой простой, как в случае системы со скалярной
входной переменной. Анализ определителя приводит к выражению
C.489)
1=0
где функции аД1/р), i = 0, 1, 2, ..., п, — полиномы 1/р. В работе
1151] указаны правила, которым необходимо следовать при опре-
определении корневого годографа для такого выражения. Интерес
представляет только асимптотическое поведение корней при р -*¦
->• 0 ир -> оо. Корни уравнения C.488) являются также корнями
уравнения
Ф (в) Ф (— s) det ]p/ + N~WT (— s) R3H (s)] = 0. C.490)
332 Глава 3
Прир -v 0 некоторые корни стремятся к бесконечности; корни,
принимающие конечную величину, достигают нулей выражения
ф (») ф (_ s) det [N-iHT (— s) R3H (s)] C.491)
при условии, что это выражение но равно тождественно нулю.
Предположим, что H(s) является квадратной матричной переда-
передаточной функцией (в разд. 3.7 было показано, что такое допущение
естественно). Из разд. 1.5.3 известно, что
det[tf(s)]= ^-. C.492)
<?(s)
.Здесь cp(s) — полином степени не больше п — к, где п — раз-
размерность системы, а к — размерность и и z. Таким образом, можно
записать вместо выражения C.491)
det(i?3) ,
det(JV) YV
Из этого следует, что при р | 0 корни уравнения C.490),
имеющие конечные значения, приближаются к нулям передаточной
функции H(s) и их отрицательным значениям. Это означает, что
полюса оптимального замкнутого регулятора, которые принимают
конечное значение, приближаются к нулям H(s), которые имеют
отрицательные вещественные части; и к отрицательным значениям
нулей, имеющим неотрицательные вещественные части.
Оказывается [151], что прир \ 0 отдаленные полюса замкну-
замкнутого регулятора, т. е. полюса, которые стремятся в бесконечность,
обычно образуют не одно распределение Баттерворса, как в случае
системы с одним входом, а несколько распределений Баттерворса
различного порядка и различного радиуса (см. примеры 3.19 и
3.21). Грубую оценку расстояния от удаленных полюсов до начала
координат можно получить следующим образом. Обозначим через
Фс (s) характеристический полином замкнутой системы. Тогда имеем
Ф (*) Фс (- *) = Ф (*) Ф (- «) det [/ + -j N-*HT (- *) ЯдЯ (*) ] .
C.494)
При малых значениях р правую часть этого выражения можно
аппроксимировать выражением
Ф («) Ф (- s) det ГJ- N-4?' (- ,) R3H ] ?
C.495)
где к — размерность входной переменной. Напишем
Оптимальные линейные СУ с обратной связью 333
<!>(*) = аП(*-*!)- C-496)
Тогда член со старшей степенью в выражении C.491) определя-
определяется выражением
a2 ?et(i?3) (— 1)ps2p. C.497)
pft det (iV) .
Из этого следует, что полином <рс (s)cpc (—s) содержит следую-
следующие члены:
Фс (*) Фс (- *) = (- 1)П^Л + • • • + О? -^^
Р б C.498)
Данные члены представляют собой член с наивысшей степенью
s и член с наивысшей степенью 1/р. Аппроксимация удаленных
корней этого полинома (при малых значениях р) определяется из
выражения
(_ 1)я 52Л + а2 det (дз) /
Из этого следует, что полюса замкнутой системы аппроксими-
аппроксимируются следующими решениями в левой полуплоскости:
(Л-^,Л2(П-Р)]/2 det№)y/te^ C500)
Эта аппроксимация описывает распределение Баттерворса по-
порядка п — р и используется для оценки расстояния от удаленных
полюсов до начала координат. Такая оценка (грубая) определяется
выражением
^^HM.f2{n-p)\ C.501)
p*det(.N)/
Наконец, рассмотрим поведение полюсов замкнутой системы при
р -*¦ оо. В этом случае из выражения C.494) следует, что характе-
характеристические числа матрицы Z приближаются к корням cp(s) <p(—s).
Л
Это означает, что полюса замкнутой системы достигают чисел яг,
i = 1, 2, ..., п, определяемых выражением C.487).
Подытожим полученные результаты для случая системы с мно-
многими входами в следующем виде.
Теорема 3.12. Рассмотрим установившееся решение задачи
регулирования для многомерной системы с постоянными па-
параметрами. Предположим, что разомкнутая система является
334 Глава 3
стабилизируемой и обнаруживаемой и что входная переменная и и
управляемая переменная z имеют одинаковую размерность к, а век-
вектор состояния х имеет размерность п. Пусть H(s) — (к X к)-
матричная передаточная функция разомкнутой системы
И'(*) = D (si ~ А)-1 В. C.502)
Предположим, что <p(s) является характеристическим поли-
полиномом разомкнутой системы, и напишем
а П («-»|)
det [Я (,)] = Ш = —i=i . C.503)
Предположим, что а Ф 0, и примем R2 = pN при iV > 0,
Р > 0."
а) Тогда при р —*¦ 0 р полюсов оптимального разомкнутого ре-
регулятора достигают значений v^, i = 1, 2, ..., р, где
eW<0' C,504)
—Vj, если Re(Vj)>0.
Остальные полюса замкнутой системы стремятся к бесконеч-
бесконечности и образуют несколько распределений Баттерворса различ-
различного порядка и с различным радиусом. Грубая оценка расстояния от
удаленных полюсов до начала координат определяется выражением
2{П-Р)]. C,505)
б) При р —v oo n полюсов замкнутого регулятора достигают
чисел л I, i = 1, 2, ..., п, где
•а | к„ если 11е(иг)<0, }
[—тч, если Re (тс?) >0.
Закончим этот раздел следующими замечаниями. Когда р очень
мало, допустимы большие амплитуды входного воздействия. В ре-
результате этого движение системы может быть быстрым, что прояв-
проявляется в виде большого расстояния от удаленных полюсов до на-
начала координат. Очевидно, распределение полюсов по Баттерворсу
дает хорошие результаты. Некоторые из полюсов замкнутой сис-
системы, однако, не могут сильно удаляться и смещаются только до
расположения нулей разомкнутой системы. Как будет показано
ниже в этом разделе, в системах с нулями в левой полуплоскости
только эти близко расположенные полюса «компенсируются»
Оптимальные линейные СУ с обратной связью 335
нулями разомкнутой системы. Это означает, что их влияние на
поведение управляемой переменной не является заметным.
Случай р = оо соответствует весьма сильному ограничению
на амплитуду входного воздействия. Интересно отметить, что «наи-
«наиболее экономичным» законом стабилизации («экономичным» с точки
зрения величины амплитуды входного воздействия) является закон
управления, который перемещает полюса неустойчивой системы в
их зеркальное отражение в левой полуплоскости.
Задача 3.11.14 даетнекоторые сведения относительно асимптоти-
асимптотического поведения полюсов замкнутых систем, у которых dim{u)^
Ф dim(z).
Пример 3.18. Система управления положением,
В примере 3.8 (разд. 3.4.1) была исследована зависимость рас-
распределения полюсов оптимальной системы управления положением
от параметра р. Как было показано, полюса замкнутой системы
образуют распределение Баттерворса второго порядка. Это соот-
соответствует результатам данного раздела. Так как передаточная
функция разомкнутой системы
Н(8) = —±— C.507)
*(« + «)
не имеет нулей, то полюса замкнутой системы устремляются в бес-
бесконечность при р | 0.
Пример 3.19. Смесительный бак
В качестве примера многомерной системы рассмотрим задачу
регулирования смесительного бака из примера 3.9 (разд. 3.4.1).
Из примера 1.15 (разд. 1.5.3) известно, что матричная передаточная
функция разомкнутой системы бака определяется выражением
+ + ,
H(s) = \ I. C.508)
v ' ' 025 075 ' v
Для этой матричной передаточной функции имеем
det [#(«)] = ^ ..' C.509)
v ' (s+0,01) (s + 0,02) v
Очевидно, что матричная передаточная функция не имеет ну-
нулей; поэтому можно ожидать, что все полюса замкнутой системы
будут смещаться в бесконечность при р \ 0. Найдем характерис-
характеристический полином матрицы 2, с численными значениями Rs и N из
примера 3.9: >
.436 Глава 3
+ S2 / 0,5 . Ю-3 - °'02416 ) + @,4 • Ю-7
\ p / V
°'7416-10'5
-0,4 -0,2
C.510)
Годограф
первого полюса
Годограф
второго полюса
Рис. 3.21. Годограф корней замкнутой системы для регулятора смесительного
бака.
о — годограф начинается в точке —0,02; б — годограф начинается в точке —0,01.
На рис. 3.21 показано поведение двух полюсов замкнутой сис-
системы при изменении р. Очевидно, каждый полюс образует распре-
распределение Баттерворса первого порядка. Асимптотическое поведение
корней для р \ 0 можно найти, решая уравнение
si 0,02416 g2 + i02 = 0) C.5H)
Р
Р2
которое определяет асимптотические распределения полюсов зам-
замкнутой системы:
0,1373 0,07280
и —
Выражение C.505) дает оценку расстояния от удаленных по-
полюсов до начала координат:
0,1
VV
C.513)
Видно, что эта величина является геометрическим средним зна-
значений C.512).
Пример 3.20. Управление углом тангажа самолета
В качестве более сложной системы управления рассмотрим сис-
систему управления продольным движением самолета (рис. 3.22.).
Это движение характеризуется скоростью и по оси х самолета,
скоростью w по оси z, углом тангажа 9 и скоростью изменения
Оптимальные линейные СУ с обратной связью
337
Ось х
'Ось г ' Вертикаль
Рис. 3.22. Продольное движение самолета.
тангажа q —9. Оси х и z жестко связаны с самолетом. Ось х
совпадает с горизонтальной осью, когда самолет совершает гори-
горизонтальный установившийся полет.
Управляемыми переменными в этих движениях являются тяга
двигателя Т и угол отклонения руля высоты б. Уравнения дви-
движения можно линеаризовать относительно номинального решения,
которое представляет еобой горизонтальный полет с постоянной
скоростью. Можно показать [20], что линеаризованные уравнения
продольного движения не зависят от уравнений бокового движе-
движения.
Выберем следующие переменные состояния:
?>l(t) = u(f) — приращение скорости по оси х,
I2(t) = w(t) — скорость по оси z,
?3 (t) = 9 (*) - тангаж, C.514)
?4 @ = Ч (t) — угловая скорость по тангажу.
Входную переменную, обозначаемую через с, определим следу-
следующим образом:
C.515)
Здесь T(t) — приращение тяги двигателя, a b(t) — отклонение
руля высоты.
12—394
338 Глава 3
Используя эти обозначения, можно получить дифференциаль-
дифференциальные уравнения на основе законов инерции и аэродинамики, опи-
описывающих движение самолета [20]. Для частного случая крейсерс-
крейсерского полета транспортного самолета среднего веса получим следую-
следующее линеаризованное дифференциальное уравнение состояния:
0
-о,
— о;
0
,01580
,1571
0,0005274
/с
J
+ 1
\
0,02633
— 1,030
0
— 0,01652
1,0006056
0
0
0
— 9,8:
0
0
0
0
-9,496
0
- 5,565
— 1,416
\c(t). C.516)
Здесь используются следующие единицы измерения физических
величин: ижю — м/с, 8 — рад, q— рад/с, Т — Н, б — рад.
В этом примере тяга полагается постоянной, поэтому отклоне-
отклонение руля высоты 6(?) является единственной управляющей пере-
переменной. Тогда система описывается дифференциальным уравнением
состояния
'—0,01580 0,02633 х —9,810 0
— 0,1571 —1,030 0 120,5
* (*) = | 0 0 0 1
ч0,0005274 —0,01652 0 —1,466,
¦ / 0
/ - 9,496 ,
+ о |8О- <3-517>
\—5,565
В качестве управляемой переменной выберем угол тангажа 9(?)
8(г) = @, 0, 1, O)x(t). C.518)
Можно показать, что передаточная функция угла тангажа по
отклонению руля высоты б(/) определяется выражением
— 5,565s2 —5,663s —0,1112
si + 2,512s3 + 3,544s2 + 0,06487s + 0,03079
Полюса передаточной функции составляют
— 0,006123 ±70,09353,
C.520)
— 1,250 ±/1,394,
Оптимальные линейные СУ с обратной связью
339
Im.
101
-1-10J
р=0,01
-о
-1
Re, с'
р=100
Рис. 3.23. Годограф иолюсов замкнутой системы стабилизации по тангажу
а — удаленные полюса; б — близко расположенные полюса.
а ее нули равны
— 0,02004 и —0,9976.,
C.521)
. Годограф полюсов замкнутой системы можно вычислить на
ЦВМ. Полюса указаны на рис. 3.23. Как и следовало оашдать,
удаленные полюса образуют размещение Баттерворса второго
порядка, а близко расположенные полюса замкнутой системы при-
приближаются к нулям разомкнутой системы. Эта система рассматри-
рассматривается в примере 3.22.
Пример 3.21. Управление продольным движением самолета
12*
340 Глава 3
В примере 3.20 было рассмотрено управление тангажом само-
самолета с помощью отклонения руля высоты. В данном примере рас-
расширим систему за счет управления скоростью по оси х в дополне-
дополнение к тангажу. Как дополнительный параметр управления исполь-
используем приращение тяги двигателя T(t). Таким образом, в качестве
входной переменной выберем
с (t) = /^О'—приращение тяги двигателя, р 522>
{ b(t) — отклонение руля высоты, ^°'
а в качестве управляемой переменной
г /л _ fu(t)—приращение скорости по оси х, /ч 523>
( ' \ 8 (t) — тангаж. ^ "
Из дифференциального уравнения состояния системы C.516)
можно вычислить, что матричная передаточная функция системы
имеет полиномиальный числитель
ф (s) = —0,003370 (s + 1,002), C.524)
которому соответствует один нуль разомкнутой системы — 1,002:
Полюса разомкнутой системы равны —0,006123 ± /0,09353 и
-1,250 ± /1,394.
При дальнейшем анализе задачи необходимо выбрать весовые
матрицы R3 и N. Предположим, что эти матрицы имеют диагональ-
диагональную форму, а для определения их величин поступим таким же об-
образом, как и в примере 3.9 (разд. 3.4.1) для смесительного бака.
Предположим, что R3 — diag^, ctJ. Тогда
zT (t) Rsz (t) = viU2 (t) + a202 (t). C.525)
Примем, что отклонение величины скорости по оси х на 10 м/с
оказывает такое же воздействие, как и отклонение по углу тангажа
на 0,2 рад A2°). Поэтому выберем следующее соотношение между
о"! и 'Ст2:
о4 • 102 = а2 • 0,22, . C.526)
или
•^- = 0,0004. ¦ C.527)
Таким образом, выбираем
и /о,о2 а \
В* = [ 0 50)' •
где для удобства положим det(R3) = 1. Аналогично предположим,
что N = diag(pi, p2) и
t) + p2b2(t). C.529)
Оптимальные линейные СУ с обратной связью
341
Чтобы определить р1 ир2, будем полагать, что изменение тяги
двигателя на 500 Н допустимо так же, как и разброс отклонения
руля высоты на 0,2. рад A2е). Это приводит к выбору
из которого следует
Pl - 5002 = р2 • 0,22,
_ /0,0004 0 \
' 0 2500/
C.530)
C.531)
При таких значениях R3 и N соотношение C.505) дает следую-
следующую оценку расстояния до удаленных полюсов:
= сг
det (fl3)
p&det (Л)
C.532)
Размещение полюсов замкнутой системы находится путем
вычислений на ЦВМ. В табл. 3.4 указаны полюса замкнутой сис-
Таблица 3.4
Полюса замкнутой системы обеспечения продольной
•устойчивости самолета
p
-o
1
10
10"s
10-3
10""
10
10~6
m-«
—0,006123
—0,1734
—0,5252
—0,8877
—0,9745
—0,9814
—1,020
— 1,003
—1,002
Полюса замкнутой
+ /0,09353
+ /0,1184
—0,2166
—0,2062
—0,2431
—0,4806
—1,344
—4,283
—42,82
СИС. ОМЫ, С
—1,250
—1,203
— 1,370
—1,980
—3,484
—6,241
—11,14
— 19,83
-62,73
+ /1,394
±/1,415
+/1,564
+ /2,179
+ /3,609
±/6,312
±/11,18
±/19,83
+ /62,73
о.,, С
0
0,15
0,32
0,70
1,5
3,2
7,0
15
70
темы при различных значениях р и приведены значения оценивае-
оцениваемого радиуса ю0. Отметим, во-первых, что один из полюсов зам-
замкнутой системы приближается к нулю разомкнутой системы при
—1,002. Кроме того, видно, что соо является всего лишь очень гру-
грубой оценкой расстояния от удаленных полюсов до начала коорди-
координат.
На рис. 3.24 приведены годографы для замкнутой системы.
Отметим, что по виду эти годографы сильно отличаются от годогра-
годографов для систем со скалярной входной переменной. Два из общего
числа удаленных полюсов образуют размещение Баттерворса
-5
Re, c"?
Im, с
5j
,-1
-r
n-5
/0 = 10
,-z
Re, c'1
p-1
\fa
и p
10'3
Im,c'
0,1
0 .
-0,1
p.1
Рис. 3.24. Годограф полюсов замкнутой системы управления продольным
движением.
а -г удаленные полюса; б — близко расположенный и удаленный полюса. Для ясности
совпадающие участки годографа на вещественной оси обозначены отдельными линиями;
в действительности они совпадают с вещественной осью.
Оптимальные линейные СУ с обратной связью 343
второго порядка, а третий полюс -- размещение Баттерворса
первого порядка. Система, соответствующая такому размеще-
размещению, обсуждается далее в примере 3.24.
3.8.2*. АСИМПТОТИЧЕСКИЕ СВОЙСТВА РЕГУЛЯТОРА СО СКАЛЯР-
СКАЛЯРНЫМИ ВХОДНОЙ И ВЫХОДНОЙ НЕРЕМЕННЫМИ ПРИ НЕНУЛЕВОЙ
ЗАДАННОЙ ТОЧКЕ
В этом разделе будет рассмотрен оптимальный регулятор с
одним входом и одним выходом в свете результатов разд. 3.8.1.
Рассмотрим систему со скалярной входной переменной
х (t) = Ах (t) -I- b\x (t) C.533)
и скалярной управляемой переменной
l(t) = dz(t). C.534)
Здесь Ъ — вектор-столбец, d— вектор-строка. Из разд. 3.7
известно, что оптимальный закоп управления при ненулевой за-
заданной точке определяется выражением
рУ) = -ТхУ) +-±— Со, C.535)
где"/ — вектор-строка
Т= — ЬТР, C.536)
_ р
а Р — решение соответствующего уравнения Риккати. Кроме то-
того, Hc(s) — передаточная функция замкнутой системы,
Нс (s) = d {si — А + bf)'1 b, C.537)
а Со — заданная точка для управляемой переменной.
Для исследования реакции регулятора на ступенчатое измене-
изменение заданной точки заменим ч0.па переменную C0(i), зависящую от
времени. Тогда взаимосвязь разомкнутой системы и оптимального
закона управления при ненулевой заданной точке описывается
уравнениями
x(t)={A-bJ)x(t) + b
\ Со@.
C.538)
t(t) = dx(t).
Преобразование Лапласа для передаточной функции T(s) от
заданной точки Со(?) к управляемой переменной ^(t) дает
Т (s) = d(sI — A + bj)'1 b —i— . C.539)
W V ^ " Hc @) ^ ;
344 Глава 3
Рассмотрим передаточную функцию замкнутой системы d(sl
— Л -\- bf)~lb. Очевидно, что
d(sI—A+ bj)~lb=^ M&. , C.540)
«раю
где <pc(s) = det(s/ — А -\- bf) — характеристический полином
замкнутой системы, а фс (s) — другой полином. В разд. 3.7 было
показано [уравнение C.428)], что числитель определителя квадра-
квадратичной матричной передаточной функции D(sl — А -\- BF)~lB
не зависит от матрицы усиления обратной связи /^иравенполино-
му числителя матричной передаточной функции разомкнутой сис-
системы D(sl — А)~1В.
Поскольку в случае системы с одним входом и одним выходом
определитель передаточной функции сводится к самой передаточ-
передаточной функции, можно сразу сделать вывод, что полином <]>c(s) равен
полиному 4*(s), определяемому выражением
Н(8)=Ш-. г C.541)
<p(s)
Здесь H(s) — d(sl — A)~lb — передаточная функция разом-
разомкнутой системы, a cp(s) = det(si — А) — характеристический
полином разомкнутой еистемы.
В результате получаем
l(L_JP?B.. C.542)
4 (°)
()
Напишем
<]>(«) = a f\(s-»t), , C.543)
rflevj,i.=-- 1,2, ...,р, — нули ff(s). Тогда из теоремы 3.11 следует,
что при р \ 0 можно написать для характеристического полинома
замкнутой системы
tpc(s) ~ П Is - b) П (* - W>), C.544)
л
где v;, i — 1, 2, ..., /?, определяются выражением C.484), а т],-,
t = 1,2,..., п— р, образуют распределение Баттерворса порядка
п — р с радиусом 1 и где
\1/[2 (п-р)]
«« = ') — I • C.545)
Оптимальные линейные СУ с обратной связью 345
- Подстановка выражения C.544) в C.542) дает следующую аппро-
аппроксимацию для T(s):
s '
C.546)
П -
V ''и о
Перепишем это выражение в виде
C.547)
п
*„-,р(«Л"о) , - , ,
i=i I - — +1
где Хп-р (s) — полином Баттерворса порядка п — р, т. е. /n_p(s)
определяется выражением
Хл-„(*)=Г1 (- —+1). C-548)
В табл. 3.5 указаны некоторые полиномы Баттерворса невысо-
невысокого порядка Ц75].
Таблица 3.5
Полипомы Баттерворса
Xi(s) = s + 1
ХгОО = s2 + 1,414s +-1
X,(S). = S3 + 2s2 -f 2s + 1
X4(s) ^ s4 + 2,613s3 4- 3,414s2 + 2,613s 4- 1
-b(s) = ss + 3,236s4 4- 5,236s3 4- 3,236s 4- 1
Из выражения C.547) следует, что если передаточная функция
разомкнутой системы имеет нули только в левой полуплоскости, то
передаточная функция системы управления T(s) приближается к
виду
1 ¦ . C.549)
прир \ 0. Назовем это выражение передаточной функцией Бат-
Баттерворса порядка п — р с частотой срыва соо. На рис. 3.25, 3.26
представлены реакции на ступенчатое воздействие и диаграммы
Боде для систем с передаточными функциями Баттерворса различ-
различных порядков. Графики на рис. 3.25 являются примером реакций
системы на ступенчатое изменение заданной точки. Такая реакция
асимптотически не зависит от полюсов и нулей разомкнутой сис-
системы при условии, что последние находятся в левой половине ком-
546 ) Глава 3
10
*, С
Рис. 3.25. Реакции на ступенчатое воздействие систем с передаточной функ-
функцией Баттерворса первого — пятого порядков с частотой срыва 1 рад/с (со-
(соответственно кривые 1—5).
плексной плоскости. Видно также, что, выбирая р достаточно ма-
малым, можно сделать произвольно высокими частоту срыва соо и
соответственно время переходного процесса при ступенчатом воз-
воздействии. Очень высокая скорость перехода, конечно, достигается
за счет больших амплитуд входного воздействия.
Результаты этого анализа показывают, что реакция управляе-
управляемой переменной на изменения заданной точки в основном опреде-
определяется удаленными полюсами тца>0, i — 1, 2, ..., п — р. Близко
расположенные полюса, которые ггочти совпадают с полюсами ра-
разомкнутой системы, оказывают незначительное влияние на реак-
реакцию управляемой переменной, так как они почти компенсируются
нулями. Как будет показано в следующем разделе, удаленные по-
полюса практически определяют не только реакцию управляемой
переменной на изменение заданной точки, но также и реакцию на
произвольные начальные условия. Как можно легко показать (и
это будет проиллюстрировано на примерах), близко расположенные
полюса оказывают существенное влияние на входную переменную.
Поэтому длительность переходного процесса по ошибке слежения
определяется удаленными полюсами, а входная переменная —
близко расположенными полюсами.
Оптимальные линейные СУ с обратной связью
347
¦ 10
0,01
.-2
0,1
и, рад/с
то'
-
¦¦*
\
\\
0,01
0,1
j, pad/с
10
100
: ^^
^~
>
^
2
4
о
-во
'а " 18°
1-270
-360
Рис. 3.26. Амплитудная и фазовая характеристики для передаточной функции
Баттерворса первого — пятого порядков с частотой срыва 1 рад/с (соответст-
(соответственно кривые 1—5).
Для систем с нулями в правой полуплоскости ситуация оказыва-
оказывается менее благоприятной. В этом случае передаточная функция
T(s) содержит дополнительные множители вида
C.550)
а реакция по ошибке слежения определяется близко расположен-
расположенным полюсом в точке v;. Это налагает принципиальное ограничение
по быстродействию систем с нулями в правой полуплоскости. В сле-
следующем разделе снова обратимся к этому вопросу, но сначала
подытожим результаты данного раздела.
348 Глава 3
0,11
I
t,c
-1
Рис. 3.27. Реакция системы
управления тангажом на сту-
ступенчатое изменение 0,1 рад
заданной величины угла тан-
тангажа,
Теорема-3.13. Рассмотрим оптималь-
оптимальный закон управления C.535) при не-
ненулевой заданной точке для стабили-
стабилизируемой и обнаруживаемой системы
со скалярными входной и выходной
переменными, имеющей постоянные
параметры
x{t) = Ax(t)- ()
'Q(t)--=dx(t), C.551)
где R3 = 1, R2 =p. Тогда при р \ 0
передаточная функция системы
управления T(s), т. е. передаточная
функция замкнутого контура от пе-
переменной заданной точки C0(t) к
управляемой переменной (,(t), стре-
стремится к виду
— + 1
T(s)-
C.552)
г<?е Хп-р (s) — полином Баттерворса
порядка п — р с радиусом 1; п —
порядок системы; р — число нулей
передаточной функции разомкнутой
системы; соо — асимптотический ра-
радиус распределения Баттервдрса для
удаленных полюсов замкнутой систе-
системы, определяемых выражением C.486);
v;, i =1,2,..., р,— нули передаточ-
передаточной функции разомкнутой системы;
v;, i = 1, 2, ..., р, — нули переда-
передаточной функции разомкнутой систе-
системы, зеркально отраженные в левой
половине комплексной плоскости.
Пример 3.22. Управление углом тан-
тангажа
Рассмотрим задачу управления
углом тангажа из примера 3.20.
При р = 0,01 матрицу усиления
обратной связи для установившегося
состояния можно вычислить в виде
Оптимальные линейные СУ с обратной связью 349
7= (—0,0001174, 0,002813, —10,00, —1,619). C.553)
Соответствующий характеристический полином замкнутой сис-
системы определяется выражением
ц,с (S) = s4 -r 11,49s3 + 66,43s2 + 56,84s + 1,112. C.554)
Полюса замкнутой системы равны
— 0,02004, —0,9953 и 0,5239 ±/5,323. C.555)
Видно, что первые Два полюса очень близки к нулям разомкну-
разомкнутой системы —0,2004 и —0,9976. Передаточная функция замкну-
замкнутой системы определяется выражением
Л (,) = JtW_ = -5,565^-5,663,-0,1112
-9c(s) s* +11,49s3+ 66,43с2+56,84s+ 1,112 v
так что Нс@) = —0,1000. В результате закон управления при ну-
нулевой заданной точке имеет вид
b(t) = ^-Jx{t) — 10,00B0(t), C.557)
для которого Q0(t) — заданная точка по углу тангажа.
На рис. 3.27 представлена реакция системы на ступенчатое воз-
воздействие 0,1 рад в заданной точке Q0(t). Видно, что угол тангажа
0 быстро достигает заданной величины, а реакция системы пол-
полностью определяется размещением Баттерворса второго поряд-
порядка в точках —5,239 ± /5,323. .Полюс —0,9953, соответствующий
постоянной времени около 1 с, оказывает наибольшее воздействие
на реакцию по скорости w вдоль оси z и может быть также иденти-
идентифицирован по отклонению руля высоты 6. Очень медленное движе-
движение с постоянной времени 50 с, которая соответствует полюсу
—0,02004, представлено в реакции по скорости и вдоль оси х, ско-
скорости w вдоль оси z, а также в отклонении руля высоты б, хотя это и
не видно на графике. Требуется около 2 мин для того, чтобы ско-
скорости г* им; достигли установившихся значений — 49,16 z 7,754 м/с.
Отметим, что зтот закон управления дает начальное отклоне-
отклонение руля высоты около —1 рад (вообще говоря, очень большое).
Пример 3.23. Система с нулем в правой полуплоскости
В качестве второго примера рассмотрим систему со скалярной
входной переменной, описываемую дифференциальным уравне-
уравнением состояния
Выберем\для управляемой переменной
С@ = A, -!)*(*). C-559)
350 Глава 3
Im,c~
Полюса
разомкнутой
системы
-2
-1
•*-
Нуль
разомкнутой
системы
1 Re, с"
Рис. 3.28. Родограф полюсов замкнутой системы с нулем в правой полуплос-
полуплоскости.
Эта система имеет передаточную функцию в разомкнутом сос-
тояпии
#(S) =
C.560)
s (s + 2)
и, следовательно, нуль в правой полуплоскости. Рассмотрим для
этой системы критерий
+ pjx2 (t)\ dt.
C.561)
Соответствующее уравнение Риккати имеет установившееся
решение
Р
¦ V?
, C.562)
P -z-
V? I
а вектор коэффициентов усиления обратной связи в установив-
установившемся состоянии определяется выражением
=.(-^, -2+1/4+-L
C.563)
Полюса замкнутой системы можно найти из выражения
р
V
C.564)
На рис. 3.28 приведен вид годографа полюсов замкнутой систе-
системы. Как и ожидалось, один из полюсов замкнутой системы приб-
приближается к зеркальному отражению нуля в правой полуплоскости,
тогда как другие полюса уходят в —оо вдоль вещественной оси.
Оптимальные линейные СУ с обратной связью
351
Рис. 3.29. Реакция замкнутой системы с нулем в правой полуплоскости на
единичное ступенчатое изменение в заданной точке.
При р = 0,04 характеристический полином замкнутой системы
определяется выражением
s2 + 6,245 s + 5, C.565)
а полюса замкнутой системы равны —0,943 и —J5,302. Передаточ-
Передаточная функция замкнутой системы имеет вид
Нс и) = -lifL = =±±2 , C.566)
9с (s) s + 6,245s -f- 5
где //с@) = 0,2. Вектор коэффициентов усиления обратной свя-
связи в установившемся состоянии равен
7= E, 4,245). C.567)
352 Глава 3
Закон управления при ненулевой заданной точке описывается
выражением
[х (t) = — E, 4,245) х (t) + 5С0 (t). C.568)
На рис. 3.29 показана реакция замкнутой системы на ступенча-
ступенчатое изменение заданной точки zo(t). Видно, что в этом случае реак-
реакция определяется в основном полюсом замкнутой системы —0,943.
При этом нельзя получить реакцию с большим быстродействием и
одновременно меньшей интегральной квадратической ошибкой
слежения.
3.8.3*. МАКСИМАЛЬНО ДОСТИЖИМАЯ ТОЧНОСТЬ СИСТЕМ
РЕГУЛИРОВАНИЯ И СЛЕДЯЩИХ СИСТЕМ
В этом разделе исследовано установившееся решение уравнения
Риккати при р, стремящемся к нулю в выражении
R2 = рЛг. C.569)
Интерес к этому асимптотическому решению объясняется тем,
что оно позволяет оценить максимально достижимую точность
систем регулирования и слежения при отсутствии ограничений на
амплитуду входного воздействия. Данный раздел построен следу-
следующим образом. Сначала формулируются основные результаты в
форме теоремы. Доказательство этой теоремы [106], которое явля-
является весьма трудоемким, опущено. Остальная часть раздела посвя-
посвящена обсуждению результатов и примерам.
Сформулируем сначала основные результаты:.
Теорема 3.14. Рассмотрим стабилизируемую и обнаруживаемую
линейную систему с постоянными параметрами
()
C.570)
. z(t) = Dx(t),
в которой по предположению матрицы В и D имеют полный
ранг. Рассмотрим также критерий
GO
Г [ zT (t) Rsz (t) + и (t) R2u (t)] dt, C.571)
to
где R3 > 0, R2 > 0. Пусть
i?2 = p.V, C.572)
Оптимальные., линейные СУ с обратной связью 353
где N > 0, р — положительный скаляр, и пусть Рр *— устано-
установившееся решение уравнения Риккати:
- Р9 (О = DTRaD - Р? (t)В R~{ ВТ Рр (t) + Ат Рр (t) + Pp (t) A,
рр (*,) = 0. C.573)
Тогда имеет место следующее:
а) Существует предел
^'-- C.574)
б) Пусть zp ft), t > i0, обозначает реакцию по управляемой
переменной в регуляторе, который является оптимальным в уста-
установившемся состоянии при i?2 = pN- Тогда
lim f
= х (t) Poz (t0). C.575)
в) ?"слм dim(z) > dim(M), тео Ро 7^ 0.
г) Если clim(z) -_ dim(u) и полином числителя <]>(s) передаточ-
передаточной функции разомкнутой системы H(s) = D(sl— А)'1 равен
нулю, то Р0 = 0 тогда и только тогда, когда ty(s) имеет нули
только с неположительными вещественными частями.
д) Если имеет место неравенство dim(z) <; dim(M), то доста-
достаточное условие равенства нулю Ро состоит в том, что должна
существовать такая прямоугольная матрица М, при которой по-
полином числителя ty(s) квадратной передаточной матрицы D(sl—
— А)~1ВМ'не равен нулю и имеет нули только с неположительны-
неположительными вещественными частями.
Ниже обсуждаются различные части теоремы. Из п. (а) сле-
следует, что если уменьшать весовой коэффициент р для входного
воздействия, то критерий
j [ zT? (t) Rs zp (t) + pi/ (t) Nu? @] dt = aT (t0) Pp x (*„), C.576)
достигает предела xT (to)Pox (t0). Если отождествить Rs с We> a iV
с Wa, то выражение C.576) можно переписать в форме4
fc>p(O^ + P \Cu^(t)dt, C.577)
w
где Се<р (t) = zTp(t)Wezp(t) — взвешенная квадратическая ошибка
регулирования, a CUtP(t) = uTf(t)Wuup(t) — взвешенная квадра-
квадратическая величина входного воздействия. Из п. (б) теоремы следует,
354 Глава 3
что при р | 0 первый _из двух членов в выражении C.577) пол-
полностью определяет интегральную квадратическую ошибку регули-
регулирования, так что в пределе интегральная квадратическая ошибка
регулирования определяется выражением
lim f С? р (t) dt = хт (t0) Рйх (*0). C.578)
Если весовой коэффициент р равен нулю, то затраты не ограни-
ограничиваются в том смысле, что на амплитуду входного воздействия не
накладывается ограничений. Ясно, что при этом условии достига-
достигается наибольшая точность регулирования, т. е. интегральная квад-
квадратическая ошибка регулирования является наименьшей из всех
возможных.
В пп. (в), (г), (д) теоремы формулируются условия, при кото-
которых Ро = 0. Это означает, что достигается точное регулирование,
так как
lira f С. (t)dt = O. C.579)
Пункт (-в) теоремы устанавливает, что если размерность управ-
управляемой переменной больше, чем входной переменной, то точное
регулирование невозможно. Это вполне естественно, так как в та-
таком случае число степеней свободы для управления слишком мало.
Чтобы определить максимально достижимую точность, необходи-
необходимо вычислить Рд. Некоторые соображения по поводу того, как это
можно сделать, приведены в разд. 4.4.4.
В п. (г) теоремы рассматривается случай, когда число степеней
свободы достаточно, т. е. входная и управляемая переменные имеют
одинаковые размерности. Здесь максимально достижимая точность
зависит от свойств передаточной матрицы H(s) разомкнутой систе-
системы. Точное регулирование возможно лишь тогда, когда полином
числителя i}i(s) передаточной матрицы не имеет нулей в правой по-
полуплоскости [в предположении, что полином ф(«) не равен тождест-
тождественно нулю]. Это можно показать интуитивно следующим образом.
Предположим, что в момент времени 0 система находится в на-
начальном состоянии х0. Тогда, используя преобразование Лапласа,
можно описать реакцию по управляемой переменной выражением
Z(s) = H (s) U (s) + D (si — A)-1 x0, C.580)
где Z(s).h U(s) — преобразования Лапласа для г и и соответствен-
соответственно. Можно сделать Z(s) тождественно равным нулю, если выбрать
И {в) = — И-* {s) D (si — А)-1 х0. C.581)
Оптимальные линейные СУ с обратной .связью 355'
Входная переменная u(t) в общем случае содержит дельта-
функции и производные дельта-функций в момент времени 0.
Эти дельта-функции мгновенно переводят систему из состояния
х0 в момент 0 в состояние #@+), для которого z{0+) = Dx@+), при-
причем z(t) можно сделать равным 0 при t > 0 1163]. Заметим, что в
общем случае состояние x(t) претерпевает воздействие дельта-функ-
дельта-функции и их производных в момент времени 0, тогда как z(t) движется
от г@) = Dxg в 0 без отклонений, как это можно увидеть, если
подставить выражение C.581) в C.580).
Выражению C.581) соответствует устойчивое поведение вход
ной переменной, если устойчива обратная передаточная матрица
//"x(s), т. е. полипом числителя i|>(s) матрицы H(s) не имеет нулей в
правой полуплоскости. Причина, по которой входное воздействие
C.581) нельзя использовать в том случае, когда Н'Л (s) имеет неус-
неустойчивые "полюса, состоит в том, что, хотя входное воздействие
C.581) приводит управляемую переменную z(t) к нулю и поддер-
поддерживает ее равной нулю, само входное воздействие возрастает без-
безгранично [110]. В данной постановке задачи такие входные воз-
воздействия исключены, поэтому в рассматриваемом случае выраже-
выражение C.581) не является предельным входным воздействием при
р \ 0, и в действительности регулирование без затрат пе может быть
достигнуто.
Наконец, из п. (д) теоремы следует, что при cHrn(z) < dim(u)
имеем Ро = 0, если этот случай можно упростить до случая, со-
соответствующего п. (г) теоремы, заменяя входную переменную
и на и':
). ¦ C.582)
Однако существование такой матрицы М не является необхо-
необходимым условием для равенства нулю Ро.
В теореме 3.14 развиваются некоторые результаты разд. 3.8.2.
Установлено, что для систем с одним входом и одним выходом без
нулей в правой половине комплексной плоскости реакция управ-
управляемой переменной на ступенчатое воздействие в заданной точке
асимптотически полностью определяется удаленными полюсами
замкнутой системы, а не близко расположенными полюсами. При-
Причина состоит в том, что ближние полюса компенсируются нулями
системы. Теорема 3.14 приводит к более общим выводам.
Эта теорема устанавливает, что для многомерных систем без
нулей в правой половине комплексной плоскости интегральная
квадратическая Ошибка регулирования асимптотически стре-
стремится к нулю. Это означает, что при небольших значениях р
реакция управляемой переменной в замкнутой системе на любое
начальное условие в системе имеет высокую скорость, откуда
следует, что эта реакция определяется только удаленными полю-
полюсами замкнутой системы. Поэтому в таком случае влияние близко
356 Глава 3
расположенных полюсов компенсируется нулями. Медленное дви-
движение, соответствующее ближним полюсам, конечно, проявляется
в реакции входной переменной, и в общем случае можно ожи-
ожидать, что входная переменная имеет много большее время переход-
переходного процесса, чем управляемая переменная. Для иллюстрации
сошлемся на примеры.
Из теории следует, что в оптимальных системах регулирования
могут быть «скрытые режимы» (моды), которые отсутствуют в
управляемой переменной, но возникают в переменных состояния и
входной переменной. Эти режимы могут нарушить работу системы.
Из теории также следует, что системы с нулями в правой полу-
полуплоскости принципиально ограничены в возможностях регулиро-
регулирования, поскольку зеркальные отражения нулей в правой полуплос-
полуплоскости проявляются как ближние полюса замкнутой системы, кото-
которые не компенсируются нулями. Однако если эти нули в правой
полуплоскости удалить от начала координат, то их вредное влия-
влияние можно уменьшить.
Необходимо отметить, что идеальная точность никогда не может
быть достигнута, так как это предполагает бесконечно большие ко-
коэффициенты усиления обратной связи и амплитуды входного воз-
воздействия. Однако результаты этого раздела дают представление об
идеальных характеристиках системы. В действительности эти ха-
характеристики не могут быть аппроксимированы из-за ограничений
на амплитуды входного воздействия.
До этого были рассмотрены только задачи детерминирог
ванного регулирования. Рассмотрим теперь стохастическую зада-
задачу регулирования, которая включает задачу слежения. Из разд.
3.6 следует, что для стохастической задачи регулирования
С + рС = tr (Р V), C.583)
е оо , р ' * и оо, р ч ' ' ^ '
где Сеа> и Сит — установившееся среднее значение квадрата
ошибки регулирования и установившееся среднее значение квад-
квадрата входного воздействия соответственно. Из этого выражения
непосредственно следует
^00,P + pCuoo,0) = tr(^o^)- C-584)
Нетрудно доказать аналогично доказательству п, (б) теоремы
3.14, что первый член в выражении C.584) полностью определяет
величину левой части, так что
limCeM а=Ь(РоП C.585)
р;о
Это означает, что точное стохастическое регулирование (Ро =
= 0) достигается при таких же условиях, как и точное детермини-
детерминированное регулирование. Кроме того, легко проверить, что для
Оптимальные линейные СУ с обратной связью 357
регулятора с возмущепиями, не являющимися белым шумом (разд.
о.6.1), и стохастической задачи слежения (разд. 3.6.2) точное регу-
регулирование или слежение соответственно достигается тогда и толь-
только тогда, когда передаточная матрица объекта H(s) = D(sl —
— А)~1В удовлетворяет условиям, указанным в теореме 3.14. Из
этого следует, что максимально достижимую точность определяет
объект, а не характеристики возм'ущений или эталонной перемен-
переменной.
В заключение отметим, что теорема 3.14 не дает решения для
случая, в котором полином ф(«) числителя тождественно равен
нулю. Однако такой случай встречается редко.
Пример 3.24. Управление продольным движением самолета
В качестве примера многомерной системы рассмотрим управ-
лепие продольным движением самолета, описанного в при-
примере 3.21. Для р = 10~6 в примере 3.21 было найдено, что полюса
замкнутой системы равны —1,003, —4,283 и —19,83 ± /19,83.
Первый из этих полюсов практически совпадает с нулем разом-
разомкнутой системы —1,002. ¦ ~ - '
На рис. 3.30 показана реакция замкнутой системы на началь-
начальное отклонение по скорости и вдоль оси ж и на начальное отклоне-
отклонение по углу тангажа 0. Видно, что реакция по скорости вдоль оси
х определяется в основном постоянной времени ~0,24с, которая
соответствует полюсу —4,283. Реакция по углу тангажа определя-
определяется размещением Баттерворса —19,83 ± /19,83. Медленное
движение с постоянной времени ~1 с, которая соответствует
полюсу —1,003, оказывает некоторое влияние на реакцию по ско-
скорости z вдоль оси w.
Отметим, что в управляемой системе имеется весьма малое вза-
взаимовлияние в том смысле, что восстановление скорости по оси х
не проявляется в заметном отклонении по углу тангажа и наоборот.
. Наконец, необходимо отметить, что величина р= 10~6не яв-
является удобной с практической точки зрения, поскольку она
требует очень большого изменения тяги двигателя и угла откло-
отклонения руля высоты. Кроме того, двигатель не может отслеживать
быстрые изменения тяги, определяемые законом управления. При
дальнейшем исследовании необходимо учитывать динамику двига-
двигателя.
Пример подтверждает, однако, что, поскольку объект не имеет
нулей в правой полуплоскости, можно получить произвольно боль-
большое быстродействие, и близко расположенный полюс, соответстг
вующий нулю разомкнутой системы, не влияет на реакцию управ-
управляемой переменной.
Пример 3.25. Система с нулем в правой полуплоскости
В примере 3.23 было показано, что система, описываемая урав-
s
со
о
- о
i ST
¦a.
4?
5:
1~Г
г1
0,01
-1000, L
t, с
0,5
0,5
0,5
0,5
a
CtT
a:
к."
-1000 f-
1
0
-
г t,c
1
0,5
ч
if
II
Рис. 3.30. Реакции замкнутой системы обеспечения продольной устойчивости
самолета.
Слева — реакции на начальное состояние и @) = 1 м/с. когда все другие компонепты на-
начального состояния равны нулю; справа — реакции на начальнсе состояние в @) = 0.01 рад,
когда все другие компоненты начального состоянии равны нулю.
Оптимальные линейные СУ с обратной связью
359
Состояние
эталонной переменной
xr(t)
Заданная
точка
z° >
Fs
~\ ult) .
J
Объект
F
xlt)
D
Рис. 3.31. Структура линейной системы управления с обратной связью и иос-
тоянными параметрами.
нениями C.558) и C.559), с передаточной функцией разомкнутого
контура
H(s) =
-±-i- C.586)
s(s + 2)
имеет следующее установившееся решение уравнения Риккати:
Р =
|. C.587)
При р, стремящемся к нулю, Р приближается к Ро, где
2 О
,0 О,
C.588)
Как было показано в примере 3.23, в пределе р |0 реакция оп-
определяется полюсом замкнутой системы, равным —1.
3.9*. Чувствительность линейных
систем управления с обратной связью
по состоянию
В гл. 2 было показано, что весьма важным свойством замк-
замкнутых систем является способность противодействовать возму-
возмущениям и компенсировать изменения параметров. В настоящем раз-
360 Глава 3
деле будет исследован вопрос, в какой степени оптимальные систе-
системы регулирования и слежения обладают этими свойствами. Если
ограничиться только системами с постоянными параметрами и рас-
рассмотреть только установившийся случай, для которого конечный
момент времени находится в бесконечности, то оптимальные систе-
системы регулирования и слежения будут иметь структуру, представ-
представленную на рис. 3.31. Оптимальный закон управления для общего
случая можно представить в форме
u(t)=—Fx(l) + Frxr(t) + Fsz0, ' C.589)
где xr(t) — состояние эталонной переменной; z0 — заданная
точка; F, Fr, Fs — постоянные матрицы..Матрица F определяется
выражением
F = B-1BTP, C.590)
где Р — неотрицательно определенное решение алгебраического
уравнения Риккати
0= DT R9D-^TBR~X ВтР + АтР +~РА. C.591)
В разд. 2.10 было показано, что способность замкнутых систем
противодействовать возмущениям или компенсировать изменения
параметров в сравнении с аналогичной разомкнутой системой опре-
определяется поведением матрицы возвратной разности J(s). Получим,
матрицу J(s) для настоящего случая. Передаточная матрица объ-
объекта описывается выражением (si — А)~гВ, в то время как для
контура обратной связи она просто равна F. Тогда матрица воз-
возвратной разности имеет вид/
/(,) = / + (si — A)-1 BF. C.592)
Отметим, что полное состояние x(t) рассматривается как уп-
управляемая переменная (разд. 2.10).
Получим теперь выражение для матрицы J(s), исходя из алгеб-
алгебраического уравнения Риккати C.591). Суммирование и вычитание
дополнительного члена sP дает после перегруппировки
0= DTR3D— PBB~l ВТР — (—sI — AT)P~ — P(sl — A). C.593)
После предварительного умножения на Вт(—si — А7)'1 и
последующего умножения на (si — А)~1В получим
О = Вт (— si — Ат У1 (— РВВ~1 Вт Р + DT R3 DT ) (si — А)'1 В —
— BrP(sI — A)-1B—BT(—sI — AT)PB. C.594)
Оптимальные линейнце СУ с обратной связью 361
Это выражение можно преобразовать следующим образом:
[/ + Яг(-5/-ДгГ PBR-1 ] Я2 [1+ R-1 BTP(sI~A)-1B] =
= #2 + Вт (— si — Ат У1 DT RSD (si — А)-1 В. C.595)
После подстановки R.2~1BTP=F это выражение можно перепи-
переписать в виде
[/ + Вт (— s/ - Ат У1 7Т ] й2 [/ + F (я/ —^Г1 fi] =
=:R2 + HT(~~s)R3H(s), C.596)
где #(s) = D(sl — Л )"ХВ. Предварительное умножение обеих
частей выражения C.596) на Fт и последующее умножение на F-
дает поело преобразования
[/ + ~Fт Вт (— я/ — ЛгГ1]?7" /?2F'[/ + (si — A)-1 BF] =
= F" R2F +'FTHt(— я) «з#(в)?', ' C.597)
или
/" (— я) FT /?2 F / (я) = F Д./ |- 7Г Яг (— в) ДЯЯ (я) F. C.598)
После подстановки s = /со замечаем, что второй член в правой
части этого выражения является неотрицательно определенной
эрмитовой матрицей. Это означает, что можно написать
JT (—/со) WJQa) >• W для всех вещественных со, C.599)
где _ _
W = FT R2F . C.600)
Из разд. 2.1G известно, что условие в форме C.599) гарантирует
подавление возмущений и компенсацию изменения параметров
в сравнении с эквивалентной разомкнутой системой при всех час-
частотах. Этот результат весьма важен. В разд. 3.6 установлено, что
оптимальный регулятор оказывает оптимальное противодействие
возмущениям в виде белого шума на входе объекта. Настоящий
результат, однако, показывает, что противодействие возмущениям
не ограничивается только этим специальным случаем. Компенса-
Компенсация изменения параметров обеспечивается аналогичным образом.
Таким образом, получаем следующий результат [4, 97].
Теорема 3.15. Рассмотрим структуру системы (рис. 3.31), в
которой объект является обнаруживаемой и стабилизируемой сис-
системой с постоянными параметрами:
х (t) — Ах (t) + Bu (t). C.601)
3H2 Глава 3
XrW
~> и It)
J
Объект
с
x,lt)
'Z(t)
hW
Рис. 3.32. Пример системы, в которой управляемая переменная находится
внутри контура обратной связи.
Пусть матрица коэффициентов усиления обратной связи за-
задается выражением
J=R~1B7"F, C.G02)
где Р — неотрицательно определенное решение алгебраического-
уравнения Риккати
0= DT RSD —P~BR-lB7"P + AT~P+~PA. C.003)
Тогда возвратная разность
(З.ео4>
удовлетворяет неравенству
JT(—ja))WJ(Ja>)^W
где
для всех вещественных со, C.605)
W = F
Т RF
C.000)
Распространение этого результата на случай систем с перемен-
переменными параметрами читатель может найти в работе [98].
Очевидно, что в структуре, представленной на рис. 3.31, обес-
обеспечивается только улучшенное противодействие возмущениям и из-
изменению параметров внутри контура обратной связи. В частности,
изменения в матрице D полностью"отражаются на управляемой пе-
переменной z{t). Однако часто изменения в матрице D не имеют места.
Такой случай встречается, когда управляемая переменная обра-
образована из компонент вектора состояния, а это означает, что z(t)
фактически находится внутри контура (рис. 3.32).
У теоремы 3.15 имеется недостаток, состоящий в том, что весо-
весовая матрица FT R2F становится известной только после того, как
Оптимальные линейные СУ с обратной связью 363
вычислен закон управления. Поэтому трудно выбрать параметры
R3 и R2 таким образом, чтобы получить заданную весовую матрицу.
Видно, что при определенных условиях можно определить асимпто-
асимптотическое выражение для матрицы W. В разд. 3.8.3 было установ-
установлено, что если dim(z) = dim(u) и передаточная матрица разом-
разомкнутой системы //(s) = D(sl — А)~1В не имеет нулей в правой
полуплоскости, то решение Р алгебраического уравнения Риккати
приближается к нулевой матрице, когда весовая матрица R2 ста-
становится нулевой. Анализ алгебраического уравнения Риккати
C.591) показывает, что из этого следует
P~BR~l BTP~-»DT R3D, C.607)
при R2 -*- 0, или, так как Rz~lBT Р = F,
FT R27-+Dr R3D . C.608)
при /?2 ->- 0. Тем сам,ым доказывается, что весовая матрица W в
критерии чувствительности C.605) достигает величины DT R3D
при R2 -*- 0.
Рассмотрим полное состояние x(t) как переменную обратной
связи. Это озпачает, что взвешенная квадратическая ошибка сле-
слежения равна
J{t)Wx(t). C.609)
Из только что полученных результатов следует, что при R2 -*-
—v 0 это выражение можно заменить на
xT(t)DT RzDx{t)= zT (t) R3z(t). C.G10)
Это означает (разд. 2.10), что в пределе R2 -*¦ 0 управляемая
переменная защищена от возмущений и изменений параметров,
а компоненты управляемой переменной взвешиваются матрицей R3.
Этот результат весьма важен, так как данная управляемая
переменная представляет паибольший интерес.
Установленное свойство, однако, не реализуется для объектов
с нулями в правой полуплоскости или со слишком малым числом
входных переменных, так как при этом Р не приближается к
нулевой матрице.
Подытожим полученные результаты.
Теорема 3.16. Рассмотрим весовую матрицу
W^JTR21, C.611)
где
J=R~1BTT C.612)
364 Глава 3
и Р — неотрицательно определенное симметрическое решение
уравнения
0= DT RSD — PBR^1 ВТТ+ АТР~ + РА. C.613}_
Если удовлетворяются условия (теорема ЗЛА), при которых
Р -ъ 0 при R2 -*- 0, то
W^DTR3D C.614)
при R2 —*- 0.
Результаты этого раздела показывают, что в общем системы с
обратной связью оказывают противодействие возмущениям и из-
изменениям параметров. Так как матрицы чувствительности исполь-
использовать не удобно, то затруднительно определить, как поступать
при том или ином изменении параметров. Однако вполне обоснова-
обоснованы следующие общие выводы.
1. При уменьшении весовой матрицы i?2 улучшается противо-
противодействие возмущениям и изменениям параметров, так как возрас-
возрастают коэффициенты обратной связи. Для объектов с нулями только
в левой полговине комплексной плоскости частота срыва, до которой
обеспечивается противодействие возмущениям, определяется уда-
удаленными полюсами замкнутой системы, которые смещаются от
начала координат при уменьшении матрицы i?2.
2. Для объектов с нулями только в левой полуплоскости боль-
большинство защитных свойств распространяется на управляемую
переменную. Весовая доля различных компонент управляемой
переменной определяется весовой матрицей /?3. .
3. Для объектов с нулями в правой полуплоскости частота сры-
срыва, до которой обеспечивается противодействие, ограничивается
близко расположенными полюсами замкнутой системы, которые не
компенсируются нулями.
Пример 3.26. Система управления положением
Для иллюстрации теории данного раздела проведем краткий
анализ чувствительности системы управления положением,' рас-
рассмотренной в примере 3.8 (разд. 3.4.1). При заданных численных
•значениях параметров легко определить весовую матрицу в крите-
критерии чувствительности , ¦
( )• C.615)
10,08364 0,006994/
Это весьма близко к предельной величине
( ). C.616)
0 0/
Оптимальные линейные СУ с обратной связью
¦365
0,1 К
-МЛ
0}
1
t С
Рис. 3.33. Влияиис изменения параметров на реакцию системы управления!
положением.
1 — номинальная нагрузка; 2 — нагрузка в 2/я номинальной величины момента инерции;
з — нагрузка в 3/2 номинальной величины момента инерции.
На рис. 3.33 приведена реакция замкнутой системы для номи-
номинальных и нерасчетных условий, которая позволяет проанализиро-
проанализировать чувствительность замкнутой системы к изменению параметров.
Здесь нерасчетные условия вызваны изменением момента инерции
нагрузки, приводимой в движение системой управления положе-
положением. Кривая / соответствует номинальному случаю, а для кривых 2
и 3 суммарный момент нагрузки и якоря двигателя составляет 2/3
и 3/2 номинальной величины соответственно. Изменение суммарного
момента инерции на заданную величину соответствует делению
констант а и х на один и тот же коэффициент. Таким образом 2/3 но-
номинального момента инерции соответствуют значениям 6, 9 и 1, 18-
для а и х, а 3/2 номинального момента инерции приводят к величи-
величинам 3,07 и 0,525 для а и х соответственно. Рис. 3.33 наглядпо ил-
иллюстрирует ограниченное влияние относительно больших измене-
изменений параметров.
3fN' Глава 3
3.10. Заключение
В данной главе рассматривались системы управления с обрат-
обратной связью по состоянию, в которых все компоненты вектора
состояния можно точно измерить в любой момент времени. Изучен
вопрос о построении линейных систем управления с обратной
связью по состоянию, которые были бы оптимальными в смысле
квадратического интегрального критерия-. Такие системы имеют
много полезных свойств. Они могут иметь удовлетворительный
переходный процесс при ненулевых начальных условиях в ответ
на внешнее эталонное воздействие и на изменение заданной точки.
Кроме того, такие системы имеют хорошие характеристики устой-
устойчивости и нечувствительны к возмущениям и изменениям пара-
Все эти свойства можно обеспечить в желательной мере путем
соответствующего выбора управляемой переменной системы и соот-
соответствующего изменения весовых матриц RB и R2. Результаты
разд. 3.8 и 3.9, в которых рассматриваются асимптотические свойс-
свойства и свойства чувствительности установившихся законов управ-
управления, позволяют проанализировать влияние весовых матриц.
Однако основным недостатком теории, рассмотренной в этой
главе, является трудность или невозможность измерения всех
компонент вектора состояния во многих случаях. Для преодоления
этих ограничений в гл. 4 рассмотрим задачу восстановления сос-
состояния системы по неполным и неточным измерениям. После этого
в гл. 5 будет показано, как можно объединить теорию линейных
систем управления с теорией восстановления состояния с целью
разработки общей теории оптимального линейного управления с
обратной связью.
3.11. Задачи
3.11.1. СТАБИЛИЗАЦИЯ СИСТЕМЫ УПРАВЛЕНИЯ ПОЛОЖЕНИЕМ
Рассмотрите систему управления положением из примера 3.4
(разд. 3.3.1). Определите множество всех линейных законов управ-
управления, которые стабилизируют систему управления положением.
3.11.2. УПРАВЛЕНИЕ ПОЛОЖЕНИЕМ ДВИГАТЕЛЯ
ПОСТОЯННОГО ТОКА БЕЗ ТРЕНИЯ
Задачу регулирования из примера 3.4 (разд. 3.3.1) можно уп-
упростить, если пренебречь трением в двигателе. Тогда дифференци-
дифференциальное уравнение состояния принимает вид
Оптимальные линейные СУ с обратной связью 367
где x(t) = col[|1(f), ga@1. Примите в качестве управляемой пере-
переменной
С(9 = A,0K@ C.618)
и рассмотрите критерий
f 0 + PH2(*)]d*. C.619)
t
а) Определите установившееся решение Р уравнения Риккати.
б) Определите установившийся закон управления.
в) Вычислите полюса замкнутой системы; изобразите годограф
полюсов замкнутой системы при изменении р.
г) Используйте численные значения х= 150 рад/(В.с2) и
v = 2,25 рад2/В2 и определите путем вычисления или моделирова-
моделирования реакцию замкнутой системы на начальное условие ?i@) =
= 0,1 рад, ?а@) = 0 рад/с.
3.11.3. РЕГУЛИРОВАНИЕ АМПЛИДИНА
Рассмотрите амплидин из задачи 1.12.2.
а) Предположите, что выходное напряжение должно поддержи-
поддерживаться постоянным и равным величине е20. Обозначьте номиналь-
номинальную величину входного напряжения через ?00 и представьте систе-
систему при помощи смещенной переменной состояния с пулем в качест-
качестве номинальной величины.
б) Примите в качестве управляемой переменной
С @ = «*(*)-*2о C-620)
и рассмотрите критерий
(V(*)+Va (*)]<», C.621)
i
где
У@ = ео@-еоо. C.622)
Найдите установившееся решение задачи регулирования для
следующих численных значений:
i?4 = 5 Ом, R2 = 10 Ом, C.623)
Л, = 20 В/А, к2 = 50 В/А.
р = 0,025.
368 Глава 3
в) Вычислите полюса замкнутой системы.
г) Найдите путем вычислений или моделирования реакцию
замкнутой системы на начальные условия х{0) = col(l,0) и
0 l@l)
3.11.4. СТОХАСТИЧЕСКАЯ СИСТЕМА УПРАВЛЕНИЯ ПОЛОЖЕНИЕМ
Рассмотрите систему управления положением из примера 3.4
=(разд. 3.3.1), предполагая, что в дополпение к входному воздей-
воздействию на систему действует случайным образом изменяющийся^
момент. Тогда дифференциальное уравнение состояния C.59) мож-
можно представить следующим образом:
{ lo —a
Здесь v(?) отражает влияние возмущающего момента. Представь-
Представьте v(?) в виде экспоненциально коррелированного шума
v (t) = — — v It) + © (t), C.625)
8
где a>(t) — белый шум с интенсивностью 2о*2/0.
а) Рассмотрите управляемую переменную
Z(t) = (l,O)x' (t) C.626)
и критерий
id \
C.627)
Найдите установившееся решение соответствующей задачи
•стохастического регулирования.
б) Используйте численные значения
х = 0,787 рад/В-с2,
а = 4,6с-\ C.628)
а = 5 рад/с2,
6 = 1 с.
Вычислите установившиеся среднеквадратические значения
управляемой переменной С(?) и входного воздействия \i(t) для р =
= 0,2-10-* рад2/В2.
Оптимальные линейные СУ с обратной связью 369
3.11.5. СИСТЕМА ОТСЛЕЖИВАНИЯ УГЛОВОЙ СКОРОСТИ
Рассмотрите задачу отслеживания угловой скорости из приме-
примеров 3,12 (разд. 3.6.2) и 3.14 (разд. 3.6.3). В примере 3.14 было ус-
установлено, что величина р, которая была выбрана равной 1000,
может быть существенно улучшена.
а) Изменяя р, выберите такую величину р, которая бы соответст-
соответствовала установившейся среднеквадратической величине входного
напряжения ЗВ.
б) Вычислите соответствующую установившуюся среднеквадра-
тическую ошибку слежения.
в) Вычислите соответствующую частоту срыва для замкнутой
системы и сравните ее с частотой срыва для эталонной переменной.
3.11.6. РЕГУЛЯТОР ДЛЯ АМПЛИДИНА
ПРИ НЕНУЛЕВОЙ ЗАДАННОЙ ТОЧКЕ
Рассмотрите задачу 3.11.3, в которой синтезирован регулятор
для амплидина.
а) Используя результаты этой задачи, определите регулятор
при ненулевой заданной точке.
б) Промоделируйте или вычислите реакцию регулятора на сту-
ступенчатое изменение выходного напряжения в 10 В.
3.11.7. РАЗВИТИЕ ЗАДАЧИ РЕГУЛИРОВАНИЯ
Рассмотрите линейную систему с переменными параметрами
x(t) = A(t)x(t)+B{t)u{t) C.629)
и обобщенным квадратическим критерием
t,
j W (t) #, (t) x (t) + 2xT (t) i?12 (t) и (t) + uT (t) Д2 (t) и (*I dt ¦+¦
+ xT(ti)Pix(ti), C.630)
где Ri(t), i?12@> -Я2(?) — матрицы соответствующей размерности,
удовлетворяющие условиям R2(t)>0, i?j(?)—Ri2(t)R2^l(t)R.]2(t)^>0
при to-4^t^ti
а) Покажите, что задачу минимизации критерия C.630) для
системы C.629) можно сформулировать как минимизацию крите-
критерия
h
J
и
для системы
j[xT(t)R[ (t) x (t) + и T (t) R2 (t) и' (*)] dt + xT (t) Pttftd C.631)
x(f) = A' (t) x(t) + B (t) и (t), C.632)
13—394
370 Глава 3
где [1, 4, 87]
Д| (t) = Л, (t) - Д„ (t) R-1 (t) R\2 (t),
u' (t) = i*(t) + R-1 (t) RTl2 (t) x{t), C.633)
A'(t)=A(t)-B(t)R21{t)RT12(t).
б) Покажите, что критерий C.630) минимизируется для систе-
системы C.629) в предположений
u{t) = —F°(t)x(t), C.634)
где
с решением P(t) матричного уравнения Риккати
+ Л, @ - i?l2 (t) R-1 @ RTi2 (t) -P(t)B (t) R-1 (t) BT (t) P (t),t < tlt
Pi. C.636)
в) Пусть P(t) является решением матричного дифференциально-
дифференциального уравнения для произвольного F(t), t -^ t^:
-P(t) = [A (t) -B(t)F (t)\T P(t) + P (t) [A (t) -B(t)F(t)] +
+ R, (t) -Ri2 (t) F (t) ~FT (t) RT12 (t)+FT (t) R2 (t) F(t), t <g *„
P(*1) = P1. C.637)
Покажите, что путем выбора F(t), равного F°(t), P(t) минимизи-
минимизируется в том смысле, что P(t) > P(t), t <^ tlt где P(t) — решение
C.636). . -
Замечание: доказательство п. (в) следует из п. (б). Можно также
доказать путем преобразования уравнения C.637) и использова-
использования леммы 3.1 (разд. 3.3.3), что C.634) является наилучшим ли-
линейным законом управления.
3.11.8*. РЕШЕНИЯ АЛГЕБРАИЧЕСКОГО УРАВНЕНИЯ РИККАТИ [2,
134, Ш]
Рассмотрите алгебраическое уравнение Риккати
0 = Вг — P~BR-X BTP + TA + АТР. C.638)
Оптимальные линейные СУ с обратной связью 371
Пусть матрица Z
~BR^bT) C.639)
всегда может быть представлена в виде
Z = WJW~\ C.640)
где / — жорданова каноническая форма матрицы Z. Столбцы мат-
матрицы W всегда можно представить так, чтобы / можно было раз-
разбить на блоки;
(' ° ) C-641)
Здесь /41, /21, /22 — блоки размерности п X п. Матрица W раз-
разбивается соответственно:
/W W \
W= wu wa\t C.642)
а) Рассмотрите равенство
ZW = WJ C.643)
и покажите, анализируя блоки 12 и 22 этого равенства, что если
блок Wla является несингулярным, то Р = W^W^f1 — решение
алгебраического уравнения Риккати. Заметим, что, меняя порядок
характеристических чисел в /, таким способом можно получить
много решений.
б) Покажите, что характеристические числа матрицы А —
— BR,2~1BTW22W12~1 точно равны характеристическим числам
/22 и что (обобщенные) собственные векторы этой матрицы явля-
являются столбцами W12.
Указание: оцените блок 12 тождества C.643).
3.11.9*. УСТАНОВИВШЕЕСЯ РЕШЕНИЕ УРАВНЕНИЯ РИККАТИ
МЕТОДОМ ДИАГОНАЛИЗАЦИИ
Рассмотрите матрицу Z размера 2п X 2п, определяемую выра-
выражением C.247), и предположите, что эту матрицу нельзя диаго-
надизировать. Тогда Z можно представить в виде
Z=WJW~1, C.644)
где / — жорданова каноническая форма Z, а матрица W об-
образована собственными векторами и обобщенными собственными
векторами Z. Всегда можно так представить столбцы W, что /
13*
372 Глава 3
можно разбить следующим образом:
/=('"• ° ), C.645)
\ •! Ъ1 •'22 '
где диагональными элементами матрицы /п размера л X п явля-
являются такие характеристические числа матрицы Z, которые имеют
положительные вещественные части, а половина их имеет нулевые
вещественные части. Разбиение матриц W и V = W'1 соответст-
соответственно дает
C.646)
Предположите, что пара {А, В} является стабилизируемой, а
{A,D} — обнаруживаемой. Следуя положениям разд. 3.4.4 пока-
покажите, что для данного случая справедливы следующие выводы.
а) Установившееся решение Р уравнения Риккати
— P(t) = Rl — P (t) BR~] BT P (t) +ATP(t) + P (t) A C.647)
удовлетворяет уравнению
Vn + Vi2T = 0. C.648)
б) Матрица W12 является несингулярной и
Т = W22W~1 . C.649)
в) Оптимальное поведение состояния в установившемся режи-
режиме описывается выражением *
х (t) = Wi2eJ"{t~U) W^ x (t0). C.650)
Здесь матрица Z не имеет характеристических чисел с нулевы-
нулевыми вещественными частями, а полюса замкнутой системы состоят
из тех характеристических значений Z, которые имеют отрицатель-
отрицательные вещественные части.
Указание: покажите, что
ел = / е 0 \ C 651)
\X(t) е^ )
где точная форма X(t) неважна.
3.11.10*. СООТНОШЕНИЕ БАССА ДЛЯ Р [12]
Рассмотрите алгебраическое уравнение Риккати
0=7?!— P~BR~l ВТТ + А7"Р + Р~А ' C.652)
Оптимальные линейные СУ с обратной связью 373
и предположите, что удовлетворяются условия, при которых
оно имеет единственное неотрицательно определенное симметри-
симметрическое решение. Пусть матрица Z определяется выражением
z = ( A -^zfy
Из теоремы 3.8 (разд. 3.4.4) следует, что Z не имеет характерис-
характеристических чисел с нулевыми вещественными частями. Факторизуй-
те характеристический полином Z следующим образом:
det (si — Z) = ф (s) tp (— s), C.654)
так, чтобы корни cp(s) имели строго отрицательные вещественные
части. Покажите, что Р удовлетворяет соотношению
ср (Z) ( - ) = 0. C.655)
Указание: запишите cp(Z) = ^(WJW'1) = Wqi(J)W~r =
= Wq>(J)V, где V = PF и / = diag (Л,—Л) в обозначениях разд.
3.4.4.
3.11.11*. ОТРИЦАТЕЛЬНОЕ ЭКСПОНЕНЦИАЛЬНОЕ!РЕШЕНИЕ
УРАВНЕНИЯ РИККАТИ [171]
Используя обозначения разд. 3.4.4, покажите, что решение
уравнения Риккати с постоянными параметрами
Р (*,) = Р4 C.656)
можно представить в форме
Р (*) = \W22 + W2l G (t± -1)] [Wa + Wu G (*4 - г)], C.657)
где
G (t) = e~M Se~A C.658)
C.659)
ь через
S = - (W22 - Л WJ* (W2i - Р, Wti). C.660)
Покажите, используя задачу 3.12, что S можно записать через
W в виде
374 Глава 3
3.11.12*. СООТНОШЕНИЕ МЕЖДУ W и V
Рассматривается матрица Z, определяемая в разд. 3.4.4.
а) Покажите, что если е — col(e', е"), где е' и е" — м-мерные
векторы, является правым собственным вектором матрицы Z,
соответствующим характеристическому числу %, т. е. Ze = %e, то
(е"т , —е'т) является левым собственным вектором Z, соответст-
соответствующим характеристическому числу —%, т. е.
(ет, — e'T)Z= — l(eT, —e'T). C.661)
б) Предположите для простоты, что все характеристические
числа %i, i = 1, 2, ..., 2м, матрицы Z различны, и пусть заданы
соответствующие собственные векторы et, i = 1, 2, ..., 2п. Опре-
Определите масштаб для et так, что если собственный вектор е =
= col(e', е") соответствует характеристическому числу % и
/ =col(/', /") соответствует —%, то
fTe'—f'Te"=l. C.662)
Покажите, что если Появляется матрицей, которая имеет столб-
столбцы еи i = 1, 2, ..., 2ft, и разделяется на блоки
w= H 12\, C.663)
\ VY 21 VV 22 I
то [134, 174]
/ WT —WT
W~1 = V = П 12 ] . C.664)
\ VY 21 VY 1
Указание: учтите, что левый и правый собственные векторы
ортогональны.
3.11.13*. РЕШЕНИЕ ЗАДАЧ РЕГУЛИРОВАНИЯ
В ЧАСТОТНОЙ ОБЛАСТИ
Для систем с одним входом и постоянными параметрами в кано-
канонической форме фазовой переменной задачу регулирования удобно
решать в частотной области. Пусть система
х (t) = Ax (t) + bjx (t) C.665)
задана в канонической форме фазовой переменной. Рассмотрим
задачу минимизации
[С2 @ + PJJ-2 @1 ^^» C.666)
Оптимальные линейные СУ с обратной связью 375
где
^(t) = dx(t). C.667)
а) Покажите, что характеристический полином замкнутой сис-
системы можно найти путем факторизации полинома
1 + ±ЯE)Я(-$), C.668)
р
где H{s) = d(sl — А)'гЬ передаточная функция разомкнутого
контура.
б) Для заданного характеристического полинома замкнутой
системы покажите, каким образом можно найти соответствую-
соответствующий закон управления
(i(i) = -Jx(t). C.669)
Указание: сравните с данными разд. 3.2.
3.11.14*. МИНИМАЛЬНОЕ ЧИСЛО УДАЛЕННЫХ ПОЛЮСОВ
ЗАМКНУТОЙ СИСТЕМЫ
Рассмотрите задачу минимизации
(*)] dt, . C.670)
i
где i?! > 0, N > 0, р > 0, для системы
x(t) = Ax(t)+Bu(t). C.671)
а) Покажите, что при р \ 0 некоторые из полюсов замкнутой
системы уходят в бесконечность, тогда как остальные полюса
остаются конечными. Покажите, что те полюса, которые остаются
конечными, приближаются к нулям в левой полуплоскости опре-
определителя ,
. det[Br(— si — Ат)~г R^sl — А)'1 В]. C.672)
б) Докажите, что по крайней мере к полюсов замкнутой систе-
системы уходят в бесконечность, где к — размерность входной перемен-
переменной.
Указание: положите \s\ -> оо, чтобы определить максимальное
число нулей C.6.72). Сравните с доказательством теоремы 1.19
(разд. 1.5.3).
в) Докажите, что при р -> оо полюса замкнутой системы дости-
*% g^
гают чисел 1гг, ?=1, 2, ..., п, которые равны характеристическим
числам матрицы А, зеркально отраженным в левую часть комплек-
комплексной плоскости.
376 Глава 3
3.11.15*. ОЦЕНКА РАДИУСА УДАЛЕННЫХ ПОЛЮСОВ
ЗАМКНУТОЖ СИСТЕМЫ
ИЗ ЛОГАРИФМИЧЕСКОЙ ЧАСТОТНОЙ,! ХАРАКТЕРИСТИКИ (ДИА-
(ДИАГРАММЫ ВОДЕ) [107, 157]
Рассмотрите задачу минимизации
№(t) + PlS(t)]dt C.673)
п
для системы с одним входом и одним выходом
C.674)
Предположите, что имеется диаграмма Воде для частотной ха-
характеристики замкнутого контура H{ja) = d(js>I — A)~lb. По-
Покажите, что при малых значениях р радиус удаленных полюсов
оптимальной замкнутой системы в установившемся состоянии мож-
,но оценить как частоту шс, для которой |Я(/шс)| = j|/p7
ОПТИМАЛЬНОЕ ЛИНЕЙНОЕ
ВОССТАНОВЛЕНИЕ СОСТОЯНИЯ
4.1. Введение
Во всех вариантах задач регулирования и слежения, решенных
в гл. 3, использовалось следующее основное предположение:
полный вектор состояния можно измерить точно. Это предполо-
предположение обычно является нереальным. Наиболее часто встречается
случай, когда для данной системы
x(t) = A(t)x(t)+B(t)u(t), x(to) = xo D.1)
можно измерить только некоторую линейную комбинацию пере-
переменных состояния, обозначаемую через
y(t) = C(t)x(t). ¦ D.2)
Величину у, которая, как предполагается, является /-мерным
вектором, где I обычно меньше размерности вектора состояния п,
будем называть наблюдаемой переменной.
Задачей этой главы является анализ методов восстановления
вектора состояния или определения аппроксимаций вектора сос-
состояния по наблюдаемой переменной. В частности, необходимо оп-
определить такой функционал F:
x'(t) = F[y(t), to<x*$t], to^t, D.3)
для которого x'(t) ^ x{t), где х'(t) представляет собой восстанов-
восстановленное состояние. Здесь t0 — момент начала наблюдений. Отметим,
что F[y(%), t0 < т < t], т. е. восстановленное состояние x(t),
является функцией предыдущих наблюдений г/(т), t0 < т <^ t и
не зависит от будущих наблюдений г/(т), т > t. После того как
вектор состояния восстановлен, можно использовать законы уп-
управления, полученные в гл. 3 (в которых предполагается, что пол-
полный вектор состояния известен), заменяя действительное состояние
восстановленным состоянием.
В разд. 4.2 вводится понятие «наблюдатель». Это понятие ха-
характеризует динамическую систему, выходная переменная которой
со временем приближается к состоянию, которое необходимо вос-
восстановить. Хотя в таком подходе в явном виде не учитываются труд-
трудности, связанные с присутствием шума, данный подход использу-
использует методы восстановления состояния, в которых неявно в некоторой
степени применяется фильтрация шума.
378 Глава 4
В разд. 4.3 рассматриваются все стохастические аспекты, яв-
явно и количественно связанные с данной задачей, и получен опти-
оптимальный каблю<9а/пель,называемый также фильтром Калмана—Быо-
си. Синтез оптимального наблюдателя основан на том факте, что
задача разработки такого наблюдателя является «дуальной» по от-
отношению к задаче синтеза оптимального регулятора, рассмотрен-
рассмотренной в гл. 3.
Наконец, в разд. 4.4 исследуются установившиеся и асимптоти-
асимптотические свойства фильтра Калмана — Бьюси. Эти результаты легко
получаются на основе оптимальной теории регулирования с ис-
использованием свойства дуальности задач оптимального регулиро-
регулирования и наблюдения.
4.2. Наблюдатели
4.2.1. НАБЛЮДАТЕЛИ ПОЛНОГО ПОРЯДКА
Чтобы восстановить состояние х системы D.1) по наблюдаемой
переменной г/, определяемой соотношением D.2), рассмотрим
линейную дифференциальную систему, выход которой должен яв-
являться аппроксимацией состояния х в соответствующем смысле.
Далее будет исследовано, какими должны быть структура этой
системы и ее поведение. Сначала введем следующую терминоло-
терминологию [117].
Определение 4.1. Система
q (*) = F (*) q(t) + G (*) у (*)¦+ Я (Z) и (9,
D.4)
z(t) = K(t) q(t) + L(t) y{t) + M(t) u(t),
является наблюдателем для системы
x(t) = A(t)x(t)-{-B(t)u(f),
D.5)
y{t)=C(t)x(t),
если для каждого начального состояния x(t0) системы.D.5) существу-
существует начальное состояние д0 для системы D.4), такое, что равенство
(
приводит к
z(t) = x(t), t>t0 D.7)
при всех u(t), t > t0.
Заметим, что входами наблюдателя D.4) являются входная
переменная системы и и наблюдаемая переменная состояния сие-
Оптимальное линейное восстановление состояния 379
темы у, а выходом — переменная г.^аибольший интерес представ-
представляет специальный тип наблюдателей, в которых состояние q(t)
"наблюдателя" само по себе является аппроксимацией состояния
системы x(t).
Определение 4.2. Система п-го порядка
x(t) = F (t) x(t) + G (t) y(t) + H (t) и (t) D.8)
является наблюдателем полного порядка для системы п-го порядка
x(t) = A (t) x(t)-{-B {t) и (t), D.9a)
y(t)=C(t)z{t), D.96).
если
z(*o)=z(*o) - D-Ю)
дает
x(t) = z(t), i>«0, D.11)
при всех u(t), t > t0. —*.
Наблюдатель D.8) называется наблюдателем полного порядка,
л
так как его состояние х имеет такую же размерность, как у со-
состояния х системы D.9). В разд. 4.2.3 будут рассмотрены наблюда-
наблюдатели типа D.4), размерность которых меньше, чем у состояния х.
Такие наблюдатели назовем наблюдателями пониженного порядка
(пониженной размерности).''
Рассмотрим, теперь, каким условиям должны удовлетворять
матрицы F, G и Н для того, чтобы система D.8) была наблюдателем.
Сформулируем сначала следующий результат.
Теорема 4.1. Система D.8) является наблюдателем для системы
D.9) тогда и только тогда, когда
F(t) = A(t)-K(t)C(t),
G(t) = K(t) D.12)
где K(t) является произвольной переменной во времени матрицей.
В результате наблюдатели полного порядка имеют следующую
структуру:
x{t)=A (t) x(t) + B (t) u(t) + K (t) [y (t) — C{t)x (t)] . D.13)
380 Глава
У Ш
У It)
уШ-ytt)
Kit)
и It)
Bit)
С (t)
I
Alt)
x(t)
Рис. 4.1. Блок-схема наблюдателя полного порядка.
Эту теорему можно доказать следующим образом. Вычитая
уравнение D.8) из D.9а) и используя соотношение D.96), получим
следующее дифференциальное уравнение для разности x(t) —
л
- x(t):
x(t)-x(i) = lA(i)-G(t)C(t)]x(t)-F(i)x(t) +
+ [B(t)-H(t)]u(t). D.14)
Из этого уравнения непосредственно следует, что из равенства
x{t) = x(t) для t > t0 при всех u(t), t >¦ t0, следует D.12).
И наоборот, если выполняется D.12), то из этого следует
x(t)-x(t) = [A (t) -К {t) С(*)] \х(t) - х(«)] ; D.15)
это показывает, что если x(t0) = x(t0), то x(t) = x(t) для всех
t > t0 в. и (t), t > ^о- Тем самым завершается доказательство тео-
теоремы. .
Уравнение D.13) получается путем подстановки D.12) в D.8).
Поэтому наблюдатель полного порядка (рис. 4.1) включает модель
системы, а также дополнительную переменную, которая пропор-
Оптимальное линейное восстановление состояния . 381
циональна разности y(t) — y(t), где соотношение
y(t)=C(t)x(t) D.16)
является наблюдаемой переменной, восстанавливаемой наблюдате-
наблюдателем. Назовем матрицу K(t) матрицей коэффициентов усиления
наблюдателя. До сих пор выбор матрицы K(t) при t ~> ^являет-
^является произвольным.
Из уравнения D.13) видно, что наблюдатель можно также пред-
представить в виде
x(t) = [A(f)-K(t) C(t)]x(t) + B(t)u(t) + K(t)y(t). D.17)
Отсюда следует, что устойчивость наблюдателя определяется
поведением матрицы A(t) — K(t)C(t). Конечно, устойчивость на-
наблюдателя сама по себе является желательным свойством, однако
следующая теорема показывает, что устойчивость наблюдателя име-
имеет и другое важное значение.
Теорема 4.2. Рассмотрим наблюдатель
x{t)=A (t)x(t) + B(t) u(t) + K(t) [y (t) -C(t)x(t)} D.18)
для системы
D.19)
y(t)=C(t)x(t).
Тогда ошибка восстановления
e(t) = x(t)—x(t) D.20)
удовлетворяет дифференциальному уравнению
'е (t) = [A (t) — K(t)C (t)] e (t). D.21)
Ошибка восстановления обладает тем свойством, что
e{f)-+O при t-+ оо D.22)
для всех e(t0) тогда и только тогда, когда наблюдатель является
асимптотически устойчивым.
Тот факт, что ошибка восстановления, определяемая соотно-
соотношением D.20), удовлетворяет дифференциальному уравнению
D.21), непосредственно следует из уравнения D.15). Сравнение
уравнений D.21) z D.17) показывает, что устойчивость наблюда-
382 Глава 4 '
теля и асимптотическое поведение ошибки восстановления опре-
определяются поведением матрицы A(t) -— K(t)C(t). Отсюда видно,
что ошибка^осстановления e(t) достигает нуля независимо от ее
начального^ состояния тогда и только тогда, когда наблюдатель
асимптотически устойчив. Этот результат весьма важен.
Следовательно, синтез_наблюдателя__состоит в^определении^та-
в^определении^такой матрицы коэффициентов усиления K(t) при t > t0, для которой
дифференциальное уравнение ошибки восстановления D.21) асим-
асимптотически устойчиво. В случае системы с постоянными параметра-
параметрами, когда все матрицы в постановке задачи являются постоянными,
включая матрицу коэффициентов усиления К, устойчивость на-
наблюдателя следует из расположения характеристических чисел
матрицы А — КС. Назовем характеристические числа матрицы
А — КС полюсами наблюдателя. В следующем разделе будет по-
показано, что при нежестком ограничении (полной восстанавливае-
восстанавливаемости системы) все полюса наблюдателя могут быть расположены
произвольно на комплексной плоскости путем соответствующего
выбора матрицы К (при ограничениях, что комплексные полюса
образуют комплексно-сопряженные пары).
Здесь можно предложить только некоторые интуитивные реко-
рекомендации по выбору матрицы^ с целью получения удовлетворитель-
удовлетворительных характеристик наблюдателя. Чтобы обеспечить быструю схо-
сходимость ошибки восстановления к нулю, матрицу К необходимо
выбрать так, чтобы полюса наблюдателя были значительно удале-
удалены в левой половине комплексной плоскости. Однако это обычно
достигается лишь путем выбора большой матрицы коэффициентов
усиления К, что в свою очередь делает наблюдатель весьма чувст-
чувствительным к любому шуму в наблюдениях, который, возможно,
присутствует помимо наблюдаемой переменной y(t). Здесь необхо-
необходимо обеспечить компромисс. Разд. 4.3 посвящен задаче обеспече-
обеспечения оптимального компромисса с учетом всех статистических ас-
аспектов задачи.
Пример 4.1. Система управления положением
В примере 2.4 (разд. 2.3) была рассмотрена система управле-
управления положением, описываемая дифференциальным уравнением
состояния
x(t) = (° *)*(*)+ (°W). D.23)
\0 —0.1 \ V.J
Здесь x(t) — colll^i), |2@], rAeii@ обозначает угловое пере-
перемещение, а |2(?) — угловую скорость. Предположим", что наблю-
наблюдаемая переменная r\{t) является угловым перемещением, т. е.
tj (*)=(!, O)x(t).
Оптимальное линейное восстановление состояния
383
Рис. 4.2. Фактическая реакция си-
системы управления положением и
реакция, восстановленная наблюда-
наблюдателем полного порядка.
Восстановленная
реакция
Фактическая
реакция
Наблюдатель с постоянными параметрами для этой системы
описывается уравнением
А
где постоянные коэффициенты к± и к2 необходимо выбрать.Харак-
теристический полином наблюдателя определяется уравнением,
det
* О
О s
О
О —а) ' \к21
= $2 + (а + кг)в
— 1
s + а
D.25)
При численных значениях из примера 2.4 характеристические
числа системы D.23) находятся в точках 0 и —а = —4,6 с. Что-
Чтобы быстродействие наблюдателя было сравнимо с быстродействи-
быстродействием самой системы, выберем коэффициенты усиления кг и к2 таким
образом, чтобы полюса наблюдателя были равны —50 ± /50с.
Это дает следующие значения коэффициентов усиления:
ft1 = 95,40o-1, &2 = 4561c-a. D.26)
На рис. 4.2 сравнивается выходной сигнал наблюдателя с фак-
фактической реакцией системы. Начальными условиями в системе
управления положением являются
gt @) = ОД рад, ?2 @) = 0,5 рад/с, D.27)
тогда как входное напряжение равно
= —10 В, t>0. D.28)
384 Глава 4
Наблюдатель имеет нулевые начальные условия. Рис. 4.2 ил-
иллюстрирует высокую сходимость восстанавливаемого углового
положения к его фактическому положению.
4.2.2*. УСЛОВИЯ РАЗМЕЩЕНИЯ ПОЛЮСОВ
И СТАБИЛИЗАЦИИ НАБЛЮДАТЕЛЯ
В этом разделе выводятся необходимые и достаточные условия
для размещения полюсов и стабилизации наблюдателей полного
порядка с постоянными параметрами. Сначала получим следующий
результат, который является дуальным теореме 3.1 (разд. 3.2.2).
Теорема 4.3. Рассмотрим наблюдатель полного порядка с по-
постоянными параметрами
x(t) = A х (t) + К [у (t) — С х (t) ] + Ви (t) D.29)
для системы с постоянными параметрами
x(t) = Ax(t)+Bu(t),
D.30)
y(t)=Cx{t).
В этом случае полюса наблюдателя, т. е. характеристические
числа матрицы А — КС, можно произвольно размещать на ком-
комплексной плоскости (при ограничении, что комплексные характерис-
характеристические числа образуют комплексно-сопряженные пары) путем,
соответствующего выбора постоянной матрицы К тогда и только
тогда, когда система D.30) является полностью восстанавливае-
восстанавливаемой.
Для доказательства этой теоремы отметим, что
det [XI — (А — КС)] = det [II — (АТ — СТ Кт)] , D.31)
так что характеристические числа матрицы А — КС равны числам
матрицы Ат — Ст Кт . Однако на основе теоремы 3.1 характеристи-
характеристические числа матрицы Ат —СтКт можно произвольно размещать
путем соответствующего выбора матрицы К тогда и только тогда,
когда пара {Ат, Ст } является полностью управляемой. Из теоре-
теоремы 1.41 (разд. 1.8) известно, что пара {Ат , Ст } является полностью
управляемой тогда и только тогда, когда пара А, С полностью
восстанавливаема. Тем самым доказывается теорема.
Если пара {А, С) не является полностью восстанавливаемой,
то следующая теорема, дуальная теореме 3.2 (разд. 3.2.2), даег
условия устойчивости наблюдателя.
Оптимальное линейное восстановление состояния 385
Теорема 4.4. Рассмотрим наблюдатель с постоянными параметра-
параметрами
х(t) = Ax(t) + к[у (*) — Cx(t) ] +Bu(t) D.32)
для системы с постоянными параметрами
()
D.33)
y(t)=Cx(t).
В этом случае можно найти такую матрицу К, при ко-
которой наблюдатель асимптотически устойчив тогда и только
тогда, когда система D.55) является обнаруживаемой.
Определение обнаруживаемости было дано в разд. 1.7.4. Дока-
Доказательство этой теоремы следует из ее свойства дуальности теоре~
ме 3.2.
4.2.3*. НАБЛЮДАТЕЛИ ПОНИЖЕННОГО ПОРЯДКА
В этом разделе будет показано, что можно построить наблюда-
тели с размерностью, меньшей размерности наблюдаемой системы.
Назовем такие наблюдатели наблюдателями пониженного порядка.
Пусть система, .которую необходимо наблюдать, описывается урав-
уравнениями
D.34>
у (*) =Cx(t),
где размерность состояния x\t) равна п, а размерность наблюдае-
наблюдаемой переменной y(t) равна I. Поскольку уравнение наблюдений
y(t) = Cx(t) дает I- линейных уравнений для неизвестного состо-
состояния x(t), то необходимо восстановить только п — I линейных
комбинаций компонент состояния. Такой подход впервые был рас-
рассмотрен s работах [116, 117]. Здесь' используется метод, предло-
предложенный в работе [42].
Предполагая, что матрица С имеет полный ранг, введем такой
(п — /)-мерный вектор p(t)
p(t) = C'x(t), . D.35)
при котором матрица
386 Глава 4
является несингулярной. Из соотношений
y(t)=Cx(t),
D.37)
следует
х (t) = I \ | J. D-38)
Удобно записать
- • ^y = {LitLjt D39)
так что
D.40)
Если восстановить вектор p(t) и обозначить восстановленную
величину через p(t), то можно записать восстановленное состояние
в виде
x(t)=L1y(t) + LtP(t). D.41)
Наблюдатель для p(t) можно найти, учитывая, что вектор p(t)
удовлетворяет следующему дифференциальному уравнению:
или
p(t) = C'Ax{t) + C'Bu(t) . D.42)
р (*) = С AL, Р (t) + С АЬХ у (t) + С Ви (t). D.43)
Отметим, что в этом дифференциальном уравнении y(t) является
вынуждающей переменной. Если теперь попытаться определить
наблюдатель для р, заменяя рнарв уравнении D.43) и добавляя
член K{t)[y(t) — Cx(t)], где К— матрица коэффициентов усиле-
усиления, то эта попытка окажется безуспешной, так как из D.41) еле-
дует у — Сх = у — СЬгу — СЬ^р = у — у = 0. Очевидно,
что у не несет никакой информации о векторе р. Новую информа-
, цию можно получить, дифференцируя
у (t) = С Ах (*) + СВи (t) = CALs p (t) + CALt у (t) + СВи (t). D.44)
Уравнения D.43) и D.44) описывают наблюдатель
— САЦ-у (t) — СВи (t) — CAL2 p (*)] . D.45)
Оптимальное линейное восстановление состояния 387
В качестве упражнения предлагается показать, что если пара
{.4, С} является полностью восстанавливаемой, то пара {С'гАЬг,
CAL^f также является полностью восстанавливаемой, так что пу-
путем соответствующего выбора матрицы К все полюса уравнения
D.45) можно распределить произвольным образом [187].
Для реализации наблюдателя нет необходимости находить про-
производную y(t). Чтобы показать это, определим
q(t) = p(t)-Ky(t). D.46)
Легко показать, что
q (t) = [С AL2 — KCAL2] q (t) + [С, AL2K + С ALt — KCALt —
— KCAL2K\y(t) + [C'B — KCB]]u(t). D.47)
Это уравнение не содержит y(t). Восстановленное состояние
определяется соотношением
х (t) = L2q (t) + (L, + L2K) у (t). D.48)
Уравнения D.47) и D.48) описывают наблюдатель вида D.4).
Так как в наблюдателе пониженного порядка имеется непос-
непосредственная связь между наблюдаемой переменной y{t) и восстанав-
восстанавливаемым состоянием x{t), оценка x(t) будет более чувствительна
к ошибкам измерения y(t), чем оценка, вырабатываемая наблюда-
наблюдателем пониженного порядка. Вопрос о влиянии ошибок измерений
и возмущений в системе на наблюдатель рассматривается в
разд. 4.3.
Пример 4.2. Система управления положением
В этом примере получим наблюдатель первого порядка' для
системы управления положением, рассмотренной в примере 4.1. Для
этой системы наблюдаемая переменная определяется соотношением
¦»!(<) = A, 0)*(Л. D.49)
Выберем переменную p(t), которая является скаляром, в виде
p(t) = (O, l)x(t), D.50)
таким образом, чтобы p(t) точно являлась угловой скоростью.
Очевидно, что p(t) удовлетворяет дифференциальному уравнению
р(*) = — ар (t)+^(t). D.51)
Уравнение наблюдений получим путем дифференцирования
I D-52)
388 Глава 4
Тогда наблюдатель описывается уравнением
?(*)=- ар (t) + Kji (t) + К [ ^ (г) - р (t)] , D.53)
в котором необходимо выбрать скалярный коэффициент усиления
наблюдателя. Характеристическая величина наблюдателя равна
—(a -j- x). Чтобы сделать такой наблюдатель сравнимым с наблю-
наблюдателем полного порядка из примера 4.1, выберем полюс наблю-
наблюдателя на таком же расстоянии от начала координат, как и пара
полюсов в примере 4.1. Выберем a -f К = 501^ = 70,71 с.
При а = 4,6 с это дает для коэффициента усиления
Х= 66,11 с. D.54)
Восстановленное состояние исходной системы описывается вы-
выражением
Л / 7) (t\ \
0. D.55)
Чтобы получить наблюдатель пониженного порядка без опре-
определения производных, полошим
q{t)=p(t)—Krl{t). D.56)
Используя уравнение D.53), найдем, что q(t) удовлетворяет диф-
дифференциальному уравнению
q (t) =-(a+k)q(t) + xjx (t) -(a + X) M (t). D.57)
Восстановленное состояние исходной системы определяется
через член q(t) с помощью выражения
) D.58)
На рис. 4.3 сравниваются выходная переменная наблюдателя
пониженного порядка, описываемого' соотношениями D.57) и
D.58), с действительным поведением системы. Начальные условия
для системы, как и в примере 4.1, равны
& @) = 0,1 рад. 12 @) = 0,5 рад/с, D.59)
а вход системы определяется в виде
[х (К) = — 10 В, t > 0. D.60)
Начальным условием для наблюдателя является
q @) = 0 рад/с. D.61)
Оптимальное линейное восстановление состояния
389
Рис. 4.3. Фактическая реакция сис-
системы управления положением и ре-
реакция, восстановленная наблюдате-
наблюдателем пониженного порядка.
Фактическая
восстановленная
реакции
Фактическая'
реакция
На рис. 4.3 видно, что угловое положение воспроизводится
точно, а оцениваемая угловая скорость быстро сходится к точной
величине, хотя начальная оценка не является очень хорошей.
4.3. Оптимальные наблюдатели
4.3.1. СТОХАСТИЧЕСКИЙ ПОДХОД К ЗАДАЧЕ НАБЛЮДЕНИЯ
В разд. 4.2 было дано определение наблюдателя. . Однако,
как было показано, при выборе наблюдателя для заданной систе-
системы матрица коэффициентов усиления к определяется более или
менее произвольно. В данном_разделе представлены методы опре-
определения оптимцлъной матрицы коэффициентов усиления. С этой
целью необходимо ввести специальное предположение, касающееся
зозмущений и ошибок наблюдения, которые имеют место в наблю-
390 Глава 4
даемой системе, .Затем можно будет определить, в каком смысле
наблюдатель должен быть оптимальным.
Предполагается, что уравнения реальной системы имеют вид
x{t)=A (t) x(t)+B (t) и (t) + ц;, (*), D.62a)
y{t)=C(t)x(t)+wt(t). . D.626)
Здесь через w^t) обозначен шум, возбуждающий состояние, а
через u>2(t). — шум наблюдений или измерений. Предполагается
также, что совокупный процесс [wi (t), w2(t)] можно описать как бе-
белый шум с плотностью
/ V, (*) Vla (t) \
V(t)=l ' . 2W , - D.63)
{vTl2(t) v2(t) у K r
т. е.
Е\(щ
Если Fj2@ = 0 ', то шум, возбуждающий состояние, и шум наб-
наблюдений некоррелированы. Ниже (в разд. 4.3.5) будет рассмотрен
случай, когда Wi(t) и wz(t) могут и не представляться в виде белого
шума. Особый интерес представляет случай
V2(t)>0, t>to. D.65)
Это предположение по существу означает, что все компоненты
наблюдаемой переменной возмущаются белым шумом и невозможно
извлечь из y(t) информацию, которая не содержала бы белого шу-
шума. Если это условие удовлетворяется, то назовем задачу восста-
восстановления состояния системы D.62) несингулярной (невырожденной).
Наконец, примем обозначения
Е {х (*„)} = х0, Е{[х (*„) -*0] [х (*„) - ^О]Г }=Q0. D.6б>
Предположим теперь, что наблюдатель полного порядка вида
x(t)=A (t)x{t)+B(t)u{t) + K(t) [y (t) -C{t)x(t)] D.67)
соответствует системе D.62). Тогда ошибка восстановления опреде-
определяется выражением
e(t) = x(t)-x(t). D.68)
Среднее значение квадрата ошибки восстановления
E{eT(t)W(t)e(t)) . D.6.9)
Оптимальное линейное восстановление состояния 391
с заданной положительно определенной матрицей W(t) является
показателем того, насколько успешно наблюдатель восстанавлива-
восстанавливает состояние системы в момент времени t. Средняя квадратическая
ошибка восстановления определяется путем выбора x(t0) и матрицы
К(х), t0 ^ х < t. Задача оптимального выбора этих величин на-
называется задачей оптимального наблюдения (задачей построения
оптимального наблюдателя). ~
Определение 4.3. Рассмотрим систему
x(t) = A (t) x (t) + B[t) u (t) + wi (t),
t > t0. D.70)
y(t) = С («)*(*)+ »,(*),
, Здесь co1[m>i(?), wz(t)] — белый шум с интенсивностью
т > t>- t0. D-71)
Кроме того, начальное состояние x(t0) не коррелировано с
wi и w2,
E{x(to)} = xo, E{[x(to)-xo][x(to)-xo)T} = Qo, D.72)
а u(t), t > t0, — заданное входное воздействие в системе. Рассмот-
Рассмотрим наблюдатель
x(t) = A (t) x (t) + B(t) и (t) + К (t) [у (t) -C(t)x (*)] . D.73)
Тогда задача определения матричной функции К(%),
л
и начального условия x(t0) таким образом, чтобы минимизиро-
минимизировалось выражение
E{eT(t)W(t)e(t)}, ¦ D.74)
где
e(t) = z(t)—z(t) D.75)
и где W(t) — положительно определенная симметрическая весовая
матрица, называется задачей оптимального^ наблюдения. Если
V2(t)>0, t>to, D.76)
то задача оптимального наблюдения называется несингулярной.
В разд. _4;3:2 исследуется несингулярная задача оптимального
наблюденияГ1Г"которой предполагается, что шум, возбуждающий
состояние, и шум наблюдений являются некоррелированными.
В разд. 4JL3L условие некоррелированности снимается, а в
разд. 4.3.4 рассматривается сингулярная задача. __
392 Глава 4
4.3.2. НЕСИНГУЛЯРНАЯ; ЗАДАЧА ОПТИМАЛЬНОГО НАБЛЮДЕНИЯ
ПРИ НЕКОРРЕЛИРОВАННЫХ!ШУМЕ, ВОЗБУЖДАЮЩЕМ
СОСТОЯНИЕ, И ШУМЕ НАБЛЮДЕНИЙ
В этом разделе рассматривается несингулярная задача опти-
оптимального наблюдения, в которой предполагается, что шум, воз-
возбуждающий состояние, и шум наблюдений не коррелированы.
Эта очень важная задача впервые была решена Калманом и Бьюсег
[90]. Решение этой задачи оказало значительное влияние на разви-
развитие теории оптимальной фильтрации. Исторический очерк разра-
разработки так называемого фильтра Калмана — Въюси дан в работе^
[166].
До некоторой степени удивительно, что вывод оптимального»
фильтра может быть основан на лемме 3.1 (разд. 3.3.3). Однако,
прежде чем начать вывод, приведем следующую лемму, которая
показывает, каким образом в любом дифференциальном уравне-
уравнении можно изменить направление отсчета времени.
Лемма 4.1. Рассмотрим диффференциалъные уравнения
= f[t, X(t% t>t0, D.77>
at
D.78)
dt
где 10 < 11 и
Тогда, если
xo = yl, D.80>
то решения D.77) и D.78) связаны следующим образом:
x(t* — t), t<tit
Эту лемму легко доказать, заменив переменную t переменной
t* — t.
Приступим теперь к определению оптимального наблюдателя.
Вычитая уравнение D.67) из D.62а) и используя соотношение-
D.626), получим следующее дифференциальное уравнение-
для ошибки восстановления e{t) = x(t) — x(t):
е (t) = [A (t) -K(t)C (*)] e (t) + (I,-K (*))'( Щ ('J ), D.82>
Оптимальное линейное восстановление состояния 393
где ¦¦
eu = x(t0)-x(t0) D.83)
ж где K(t), f > t0, — пока еще произвольная матричная функция.
Обозначим через Q(t) матрицу дисперсий e(t), а через e(t) — мате-
математическое ожидание e(t):
E{e(t)}=e(t),
D.84)
Е {[е (*) -~e (t)] [e (t) -~e (t)]T } = Q (t).
Теперь напишем
Е [е (t) eT (t)\ = I(t) er(t) + Q (t). D.85)
Используя соотношение A.469), можно записать выражение
для среднего значения квадрата ошибки восстановления в следу-
следующем виде:
Е { ет (t) W (t) e{t)}= V (t) W (t) ~e (t) + tr [ Q (t) W (t)].' D.86)
Первый член этого выражения, очевидно, достигает минимума,
когда e(t) = 0. Это можно обеспечить, полагая e(t0) = 0, так
как на основании теоремы 1.52 (разд. 1.11.2) e(t) удовлетворяет
однородному дифференциальному уравнению
t(t) = [A(t)~K(t)C(i)]7(t), t>t0. D.87)
Можно обеспечить e(t0) — 0,_ выбирая начальное условие, для
наблюдателя в виде
' ?(*„) = 70.] - D.88)
Так как второй член выражения D.86) не зависит от e(t), то его
можно минимизировать независимо. Из теоремы 1.52 (разд. 1.11.2)
получаем следующее дифференциальное уравнение для Q(iJ:
Q (t) = [A (t) -r-K(t)C (t)] Q(t)+Q (t) \A (t) -K(t)C (t)f +
+ Vl(t)+K(l)V2(t)KT(t). D.89)
Соответствующим начальным условием является
Q(to) = Qo- D.90)
Введем теперь дифференциальное уравнение для матричной
394 Глава 4
функции P(t), которое получается из уравнения D.89) путем обра-
обращения времени (лемма 4.1):
— P(t) = [Ar(t* — t)—Cr(l* — t)Kr(t* — t)]TP(t)+ P{t)[AT{t* —
— t) ~ CT(t* —t) KT (t* — *)] + Vt(t* — t) + К (t* — t)Vt(t* - ¦
-.t)KT(t* — t), t<tt. D.91)
Здесь
**=**„ + *, D.92)
при i4 > ?0. В уравнении D.91) используем конечное условие
P(tl)=Q0. D.93)
Из леммы 4.1 непосредственно следует
Q(t) = P(t* — t), t<tx. D:94)
Теперь применим лемму 3.1 (разд. 3.3.3) к уравнению D.91).
Эта лемма утверждает, что матрица P(t) достигает минимума, если
матрица K(t* —-т), t ^ % ^ ti: выбирается как K°(t* — Ч),
t < т < h, где
K°T(t*—z) = V~1(t*—t)C{t* — x)P(x). D.95)
В этом выражении P(t) — решение уравнения D.91), где матри-
матрица К заменяется на К0, т.е.
— P(t)= V^—t) — P(t) CT (t* — t) V-1 (t* -t)C (t* — t)P (t) +
+ P(t)AT(t*—t)+A(t* — t)P(t), t<.tit D.96)
с конечным условием
P(td = Q0- D-97)
Минимальная величина P{t) равна P(t), если минимизация про-
проводится в смысле
P(t)<.P(t), *«:*!. D.98)
Обращая время в уравнении D.96), получаем, что матрица
Q(t) дисперсий e{t) минимизируется в смысле
Q(t)>Q(t), i>i0, "D.99)
если выбрать К(%) = К°(%), где t0 ^ % ^ t,
¦ К" (х) - Q (t) Сг(т) F (х), т > *0, D.100)
Оптимальное линейное восстановление состояния 395
и матрица Q(t) удовлетворяет матричному уравнению Риккати
CT (t) V? (t) С (t) Q(t)+Q (t) AT (t) +
A(t)Q (t), t > *„ D.101)
Q (t) = Vt (t) - Q (t) CT (t) V? (t) С (t) Q(t)+Q (t) AT (t) +
с начальным условием
Так как из D.99) следует ' ""
tv[Q(t)W(t)]<tr[Q(t)W(t)] D.103)
для любой положительно определенной симметрической матрицы
W(t), то приходим к заключению, что матрица коэффициентов
усиления D.100) оптимизирует наблюдатель. Кроме того, из выра-
выражения D.86) следует, что для оптимального наблюдателя среднее
значение квадрата ошибки восстановления определяется выра-
выражением
E{eTatyW?t)e(t)}=\tr[Q(t)W(t)], D.104)
rgpQ(t) — матрица дисперсий e(t).
В заключение отметим, что полученный результат не зависит от
конкретного момента t, который выбран для минимизации среднего
значения квадрата ошибки восстановления. Тогда, если коэффици-
коэффициент усиления определяется в соответствии с выражением D.100), то
среднее значение квадрата ошибки воестановления одновременно
минимизируется для всех t > t0.
Полученные результаты можно суммировать следующим обра-
образом.
Теорема 4.5. Рассмотрим задачу оптимального наблюдения,
сформулированную в определении 4.3'. Предположим, что задача
является несингулярной и что шум, возбуждающий состояние, и
шум наблюденийне коррелировани. Тогда решение задачи оптималь-
оптимального наблюдения получается путем выбора матрицы коэффициентов
усиления
Ka(t)^Q(t)CT(t)V^(t), f>*,. D.105)
аде Q(t) — решение матричного уравнения Риккати
Q(t)=.A (t) Q(t)+Q (t) AT (t) + Vt (t) - Q (t) CT(t) V7l\t) С (t) Q (t),
t>t0, ¦ D.106)
с начальным условием
= Q0- D.Ю7)
396 Глава 4
Начальное условие для наблюдателя должно быть выбрано в виде
x(to).= zo. D.108)
Если удовлетворяются соотношения D.105) и D.108), то выра-
выражение
E{[x(t)-z(t)]TW(t)[x(t)-z(t)]} DЛ09)
минимизируется при всех t > t0. Матрица дисперсий ошибки
восстановления определяется выражением
E{[x(t)-x(t)][x(t)~x(t)Y} = Q(t), D.110)'
а среднее значение квадрата ошибки восстановления равно
Е {[x(t)-x (t)]TW(t) [x(t) — x(t)]} = tr[Q(t)W(t)]. D.111)
Отметим, что, как это ни удивительно, решение задачи оптималь-
оптимального наблюдения не зависит от весовой матрицы W(t).
Оптимальный наблюдатель в теореме 4.5 известен как фильтр
Калмана — Въюси. В настоящем разделе будет дан вывод этого
фильтра в предположении, что фильтр имеет форму наблюдателя.
В первоначальном выводе Калмана и Бьюси [90], однако, доказы-
доказывается, что этот фильтр является линейным оцениеателем с мини-
минимальным средним значением квадрата ошибки, т. е. нельзя найти
другой линейный функционал наблюдений г/(т) и входного воздей-
Л
ствия и{х), го-<т<^ который дает оценку состояния x(t) с меньшей
средней квадратической ошибкой восстановления. Можно также
доказать (см., например, [79]), что если начальное состояние
x(t0) является гауссовым, а шум Wf, возбуждающий состояние, и
шум наблюдений w^ также являются гауссовыми процессами в виде
Л
белого шума, то фильтр Калмана — Бьюси дает оценку x(t) сос-
состояния x(t), которая имеет минимальную среднеквадратическую
ошибку восстановления для всех оценок, которые можно получить,
обрабатывая данные у (г) и и(%), tu ^ % <^ t.
Близкое соответствие задач оптимального регулирования и
оптимального наблюдения очевидно, поскольку матричное уравне-
уравнение Риккати для матрицы дисперсий наблюдателя является таким
же уравнением Риккати с обращенным временем, которое исполь-
используется в задаче регулирования. В следующих разделах будет ис-
использоваться это соответствие, которое будет называться свойством
дуальности, при выводе соотношений для наблюдателей на основе
результатов, полученных для регуляторов.
Матрицу коэффициентов усиления K°(t) можно получить, ре-
решая матричное уравнение Риккати D.106) в реальном масштабе
Оптимальное линейное восстановление состояния 397
времени и используя выражение D.105). С другой стороны, матри-
матрицу K°(t) можно вычислить заранее, запомнить и воспроизвести в
процессе восстановления состояния». Заметим, что в отличие от
оптимального регулятора, описанного в гл. 3, оптимальный наблю-
наблюдатель можно реализовать в реальном масштабе времени, так как
уравнение D.106) является дифференциальным уравнением с задан-
заданными начальными условиями, тогда как в задаче оптимального ре-
регулирования необходимо решать уравнение Риккати при заданных
конечных условиях в обратном времени.
Из теоремы 3.3 (разд. 3.3.2) следует, что уравнение Риккати для
регулятора можно получить, решая систему 2п X 2п дифферен-
дифференциальных уравнений (где п — размерность состояния). То же са-
самое нужно выполнить для уравнения Риккати в наблюдателе, как
указывалось в задаче 4.3.
Теперь рассмотрим кратко установившиеся свойства оптималь-
оптимального наблюдателя. То, что утверждается здесь, доказывается в
разд. 4.4.3. Можно показать, что при нежестких ограничениях
решение Q{t) уравнения Риккати D.106) для наблюдателя схо-
сходится к установившемуся решению Q(t), которое не зависит от Qo,
когда начальный момент времени t0 приближается к бесконечности.
Для сцстемы с постоянными параметрами, когда все матрицы в оп-
определении 4.3 являются постоянными, установившееся решение
Q также является постоянной матрицей и в общем случае представ-
представляет собой единственное неотрицательно определенное решение
алгебраического уравнения Риккати для наблюдателя
QAT + Vi — QCTVr1CQ. D.112)
Это уравнение получается из уравнения D.106), если принять
производную по времени равной нулю.
Соответственно установившемуся решению Q уравнения Рик-
Риккати для наблюдателя получаем установившуюся матрицу коэф-
коэффициентов усиления оптимального наблюдателя
K(t) = Q(t)CT(t)VT1(t). D.113)
В разд. 4.4.3 доказывается, что при нежестких ограничениях
лаблюдатель с матрицей коэффициентов усиления К является асим-
асимптотически устойчивым. Назовем этот наблюдатель установившим-
установившимся оптимальным наблюдателем. Поскольку в случае системы с по-
постоянными параметрами установившийся наблюдатель также яв-
является наблюдателем с постоянными параметрами, весьма привле-
привлекательно использовать установившийся оптимальный наблюдатель,
поскольку его легко реализовать. В случае системы с постоянными
параметрами установившийся наблюдатель является оптимальным
в том смысле, что предел
398 Глава 4
lira E (eT(t) We (t)\ = lim S ( eT (t) We (*)} D.114)
достигает минимума в сравнении со всеми другими наблюдателями
с постоянными параметрами.
Завершим" этот раздел следующим обсуждением, в котором ог-
ограничимся случаем наблюдателя с постоянными параметрами.
Оптимальный наблюдатель обеспечивает компромисс между ско-
скоростью восстановления состояния и устойчивостью к шуму наблю-
наблюдений. Баланс между этими двумя свойствами определяется вели-
величинами интенсивностей белого шума F4 и V%. Этот баланс можно
изменять, поддерживая интенсивность Vi постоянной и полагая
F2 = pM . D.115)
где М — постоянная положительно определенная симметрическая
матрица, ар — положительный скаляр, который варьируется.
Интуитивно ясно, что уменьшение р улучшает скорость восстанов-
восстановления состояния, так как при этом можно уделять меньше внима-
внимания фильтрации шума наблюдений. Увеличение скорос-ги восста-
восстановления сопровождается сдвигом полюсов наблюдателя в левую
половину комплексной плоскости. В тех случаях, когда точное
значение Fj или У2 неизвестно, целесообразно предположить, что
V2 имеет вид D.115), и изменять рдо тех пор, пока не получатся
удовлетворительные характеристики наблюдателя. Предельные
свойства оптимального наблюдателя при р. \ 0 или р ->- со об-
обсуждаются в разд. 4.4.4.
Пример 4.3. Оценка константы
Во многих случаях на практике параметры остаются постоян-
постоянными на относительно длительных интервалах времени и только
изредка изменяются. Для моделирования таких постоянных вели-
величин можно представить их в виде состояния невозмущенного
интегратора со случайным начальным условием. Тогда пусть ?(?)
представляет собой константу. Предположим
= 0/
D.116)
где |о — скалярная случайная переменная со средним значением
?„ и дисперсией Qo. Предположим, что эта константа измеряется с
шумом наблюдений v2(i), т. е. наблюдается
Ч (*) = ?(*)¦+*,(*). D.117)
где по предположению v2(?) — белый шум с постоянной скалярной
интенсивностью Fg.
Оптимальное линейное восстановление состояния 399
Оптимальный наблюдатель для |(?) описывается выражением
л _ v
?(O) = lo>
где скалярный коэффициент усиления k(t) из D.105) определяется
в виде
' к{Ь) = Ш-. D.119)
'2
Дисперсия ошибки Q{t) является решением уравнения Риккати
= (?0. D.120)
'2
Уравнение D.120) можно решить точно:
так что
' к (t) = --&—, *>°- D-122>
Отметим, что при t -> оо дисперсия ошибки (?{?) достигает
нуля. Это означает, что в итоге можно получить точную оценку ?(?).
В результате также имеем k(t) ->¦ 0. Это означает, что не
существует проблем, связанных с обработкой новых данных.
Характеристики этого наблюдателя не являются удовлетвори-
удовлетворительными, когда в действительности константа изредка изменя-
изменяется или изменяется медленно. В таком случае можно моделиро-
моделировать константу как выход интегратора, возмущаемого белым шу-
шумом. Основанием для моделирования процесса таким методом явля-
является то, что проинтегрированный белый шум имеет составляющую
с очень низкой частотой. Тогда напишем
t(*) *il*). D.123)
g<*) + M*).
где Vj — белый шум с постоянной интенсивностью Vit a v2 —
белый шум, независящий, как и раньше, otv4. Легко найти, что ус-
установившийся оптимальный наблюдатель описывается уравне-
уравнением
D.124)
где _
V . D.125)
400 Глава 4
Используя форму передаточной функции, поручаем
X (s) = VVllV* Y (s), D.126)
где X(s) и Y(s) — преобразования Лапласа для |(?) и Ц @ соответ-
соответственно. Видно, что наблюдатель является фильтром первого по-
порядка с коэффициентом усиления, равным единице при нулевой
частоте и частоте срыва VVJV2-
Пример 4.4. Система управления положением
В примере 2.4 (разд. 2.3) была рассмотрена система управления
положением, которая описывается дифференциальным уравнением
состояния »
^( i) (!) DЛ27>
Здесь x(t) = coKl^f), %,2(t)h где ^i(i) обозначает угловое пере-
перемещение 9(?), а |2@ — угловую скорость 0(f). Примем, как и в
примере 2.4, что возмущающий момент td(?) воздействует на вал
двигателя. Соответственно дифференциальное уравнение состояния
необходимо модифицировать следующим образом:
(f)' DЛ28)
где^1/у.— момент инерции всех вращающихся частей. Если слу-
случайные изменения возмущающего момента достаточно быстры ^в
сравнении с движением самой системы, то можно предположить,
чтот<г(?) является белым шумом с постоянной скалярной интенсив-
интенсивностью Vd. Предположим также, что наблюдаемая переменная оп-
определяется выражением
где vm(?) — белый шум с постоянной скалярной интенсивностью
Вычислим установившийся оптимальный наблюдатель для
этой системы. Уравнение Риккати для дисперсии принимает вид
p A,0) <?(*). - D.130)
Используя тот факт, что quit) = q<u{t), получим следующую систе-
систему дифференциальных уравнений, записанную через члены qtj(t),
i, i = 1, 2, матрицы Q(t):
Оптимальное линейное восстановление состояния . 401
D.131)
(t) = - 2a?2a @ + fVd - J- .<? (t).
v
vm
Можно найти, что установившееся решение этих уравнений при
t —»- оо определяется выражением
s
m\2 + p a/a2 + 2p a3
D.132)
где
Отсюда следует, что установившаяся оптимальная матрица
коэффициентов имеет вид
D.134)
Характеристический полином матрицы А—КС можно найти в
виде
¦ det (*/ — А + КС ) = s2 + s V аа + 2р + р. D.135);
Из этого следует, что полюса установившегося оптимального
наблюдателя равны
— (— V^TW ± К а2— 2р ) . D.136).
Примем следующие численные значения параметров:
х = 0,787 рад/(В-с2),
а =4,6 "с,
т = 0,1 кг-м-2, , D.137)
Fd= 10 Н2-ма-с,
Vm= Ю-7 рад2/с.
Предположим, что величина Vd определяется из условия
того, что среднеквадратическая величина возмущающего момен-
момента равна ^уЧООО ~ 31,6 Н-м, спектральная плотность постоянна
14—394
402 Глава 4
в диапазоне от —50 до 50 Гц и равна нулю вне этого диапазона
частот. Аналогично предположим, что для шума наблюдений, ко-
который имеет среднеквадратическую величину около 0,01 рад, функ-
функция спектральной плотности постоянна в диапазоне от— 500 до
500 Гц и равна нулю вне этого диапазона частот. Вычисления
производятся таким образом, как если бы шумы были белыми с
интенсивностью, указанной в D.137), а затем делается проверка,
выполняется ли это предположение.
При указанных численных значениях находим, что установив-
установившаяся матрица коэффициентов усиления равна
Полюса наблюдателя равны —22,48 ± /22,24. Расположение
этих полюсов, очевидно, обеспечивает оптимальный компромисс
между скоростью сходимости ошибки восстановления и устой-
устойчивостью к шуму наблюдений.
Частоту срыва оптимального наблюдателя можно определить
из расположения полюсов. Характеристический полином наблюда-
наблюдателя равен
s2 + s У а2 + 2р + р ~ s2 + 45s + Ю00 D.139)
и представляет собой систему второго порядка с недемпфированной
собственной частотой соо = 31,6 рад/с ~ 5 Гц и относительным
демпфированием около 0",71. Недемпфированная собственная час-
частота является также частотой срыва наблюдателя. Так как эта
частота весьма мала в сравнении с полосой пропускания шума
(~500 Гц) и полосой пропускания частот возмущений (~50 Гц), то
можно предположить, что вполне допустимо аппроксимировать оба
процесса белым шумом. Необходимо сравнить полосу пропускания
частот возмущений и полосу пропускания шума наблюдений с поло-
полосой пропускания наблюдателя,так как из дифференциального урав-
уравнения для ошибки D.82) следует, что оба процесса непосредственно
влияют на поведение ошибки восстановления. В примере 4.5 в
конце разд. 4.3.5 будет построен оптимальный фильтр без аппрок-
аппроксимации шума наблюдений белым шумом с проверкой справедли-
справедливости этой аппроксимации.
Установившаяся матрица дисперсии ошибок восстановления
определяется выражением
77 __ /0,000004036 0,00008143\ а \ш\
V ~~ 1,0,00008143 0,003661 J1 к " W)
Находя квадратные корни из диагональных элементов, полу-
получаем, что среднеквадратическая ошибка восстановления положе-
положения составляет ~0,002 рад, а соответствующая ошибка для угло-
угловой скорости — /~-0,06 рад/с.
Оптимальное линейное восстановление состояния 403
Завершим этот пример рассмотрением найденного оптимального
наблюдателя. Заметим, что фильтр полностью определяется отно-
отношением VJVm, которое можно рассматривать как отношение сиг-
сигнал — шум. Выражение D.136) показывает, что при увеличении
отношения р возрастает, а полюса наблюдателя смещаются все
дальше и дальше. В результате быстродействие наблюдателя воз-
возрастает, но. он также становится более чувствительным к шуму
наблюдений. При р = оо подучаем дифференцирующий фильтр,
который можно рассматривать следующим образом. В форме пере-
передаточной матрицы наблюдатель можно представить как
X (в) = [si — А + КС)'1 [К\ (в) + BU (s)] =
D.141)
Здесь X(s), Y(s),h U(s) — преобразования Лапласа для x(t),
y(t) и u{t) соответственно. По мере того как шум наблюдений
становится меньше и меньше, т. е. р ->- оо, выражение D.141)
сходится к.
X',(S) = -lY(S). D.142)
Это означает, что в качестве наблюдаемой переменной рассмат-
рассматривается восстановленное угловое положение и наблюдаемая
переменная дифференцируется для того, чтобы получить восста-
восстановленную угловую скорость.
4.3.3*. НЕВЫРОЖДЕННАЯ ЗАДАЧА ПОСТРОЕНИЯ ОПТИМАЛЬНОГО
НАБЛЮДАТЕЛЯ ПРИ КОРРЕЛИРОВАННЫХ ШУМЕ,
ВОЗБУЖДАЮЩЕМ СОСТОЯНИЕ, И ШУМЕ НАБЛЮДЕНИЙ
Ниже результаты, полученные в предыдущем разделе, распрост-
распространяются на случай, когда шум, возбуждающий состояние, и шум
измерений являются коррелированными, т. е. Vi2(t) Ф 0, t > t0.
Чтобы построить оптимальный наблюдатель, поступим так же,
как и в случае коррелированного шума. Пусть снова Q(t)'— мат-
матрица дисперсий ошибок восстановления, когда наблюдатель реа-
реализуется при произвольной матрице коэффициентов усиления
K{t), t з» t0. Используя теорему 1.52 (разд. 1.11.2), получим сле-
14*
404 Глава 4
дующее дифференциальное уравнение для матрицы Q(t), которое
является расширенным вариантом уравнения (^.вЭ):
Q(t) =. [А @ ~K{t)C (*)] Q{t) +Q (t) [A @ -K(t)C (t)f +
+ V, (t) - Vlt (t) KT (t) - К (t)Vj2 (t) + К (t) V2 (t) KT (t), t > t0,
D.143)
с начальным условием
= Qo. D.144)
Чтобы преобразовать задачу определения оптимальной матри-
матрицы коэффициентов усиления в известную задачу, введем в зто диф-
дифференциальное уравнение- обратное время. Тогда оказывается, что
данная задача является дуальной По отношению к расширенной
задаче регулирования 3.11.7, в которой интегральный критерий
содержит смешанный член состояния х с входной переменной и.
Используя результаты, полученные в задаче 3.11.7, можно легко
показать, что решение данной задачи получается следующим обра-
образом (см., например, [182]).
Теорема 4.6. Рассмотрим задачу оптимального наблюдения, сфор-
сформулированную в определении 4.3 {разд. 4.3.1). Предположим, что
эта, задача является несингулярной, т. е. F2(?) > 0, t :> t0. Тог-
Тогда решение задачи оптимального наблюдения достигается путем
выбора следующей матрицы коэффициентов усиления K(t) для наб-
наблюдателя D.73):
T\t), «>«„, D.145)
где Q(t) — решение матричного уравнения Риккати
<?(*) = [A\t) - Vi2 (*) Vt} (t) С @] Q(t)±Q (t) [A(t) -
- Vi2 @ VT1 (t) С (t)]T - Q (t) CT (t) VTl (t) С (t) Q (t) +
+ Vi(t)-Vi2(t)VT1(t)Vj2(t), t>t0, D.146)
с начальным условием
' Q{to) = Qo. D.147)
Начальное условие для наблюдателя имеет вид
x(to) = xo. D.148)
Выбором матриц D.145), D.148) минимизируется среднее
значение квадрата ошибки восстановления
Оптимальное линейное восстановление' состояния 405
E{[x(t)~x(t)]TW(t)[x(t)~x(t)]} D.149)
при всех t :> t0. Матрица дисперсий ошибок восстановления оп-
определяется выражением
Е {[х (t) -x(t)] [x (t) - х (t)Y) = Q (t). D.150)
Следовательно, /
E{[x(t)~x(t)]TW(t)[x(t) — x(t)]} = tT[W(t)Q(t)}, t>.t0.
D.151)
4.3.4*. СИНГУЛЯРНАЯ ЗАДАЧА ПОСТРОЕНИЯ
ОПТИМАЛЬНОГО НАБЛЮДАТЕЛЯ
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
Этот раздел посвящен построению оптимального наблюдателя
для сингулярного случая, т. е. для случая когда матрица F2(?) не
является положительно определенной. Чтобы избежать трудностей,
связанных с тем, что матрица F2(?) является положительно опре-
определенной в течение некоторых периодов времени и сингулярной
в течение других периодов, ограничимся в зтом разделе случаем
построения наблюдателя с постоянными параметрами, когда все
матрицы в определении 4.3 (разд. 4.3.1) постоянны. Сингулярные
задачи наблюдения возникают, когда некоторые из компонент наб-
наблюдаемой переменной свободны от шума наблюдений, а также когда
шум наблюдений не является белым шумом, как будет видно из
следующего раздела. Настоящий вывод наблюдателя приближен-
. но следует результатам работы [25].
Во-первых, отметим, что когда матрица F2 является сингуляр-
сингулярной, процедура построения из разд. 4.3.2 оказывается неприме-
неприменимой, так как анализ показывает, что необходима бесконечно
большая матрица коэффициентов усиления для наблюдателя пол-
полного порядка, как и предполагалось. Таким образом, постановка
задачи, данная в определении 4.3, является неадекватной для син-
сингулярного случая. В этом разделе сингулярная задача сводится к
несингулярной задаче (меньшего порядка), а затем используются
результаты разд. 4.3.2 или 4.3.3.
Поскольку матрица F2 сингулярна, всегда можно ввести другой
белый шум iv2(t) с несингулярной интенсивностью F?, такой, что
w2(t)]= Hw'2(t), ¦ D.152)
где dim(w2) <C dim(«72) и матрица Н имеет полный ранг. Это оз-
означает, что наблюдаемая переменная описывается выражением
y(t) = Cz(t)+Hw'2(t). - D.153)
406 Глава 4
При этом предположении интенсивность шума w2{t) определя-
определяется соотношением
V2 = HV2HT. , D.154)
Так как матрица V2 сингулярна, то можно разбить наблюдае-
наблюдаемую переменную на две части: «полностью зашумленную» часть
и часть, свободную от шума. Покажем, каким образом можно вы-
выполнить это разбиение.
\ Поскольку dim (од) < dim(u?2), всегда.можно найти несингу-
несингулярную матрицу Т размером I X I (здесь I — размерность наб-
наблюдаемой переменной у), разделяемую следующим образом:
У=^1). D.155)
\ 2/
так что
Матрица Hi является квадратной и несингулярной, и разбие-
разбиение матрицы Т осуществлялось соответственно правой части выра-
выражения D.156). Умножая уравнение для выходной переменной
= Cx(t)+Hw'2(t) D.157)
на Т, получим
Vi (*) = С,х (t) + Н±и>2 (t), D.158a)
yz(t) = C2x(t), D.1586)
где
Видно, что уравнения D.158) описывают разделение наблюдае-
наблюдаемой переменной y(t) на «полностью зашумленную» часть z/t(?) (так
как матрица Н^У^Щ несингулярна) и свободную от шума часть
УМ- % :
Предположим, теперь, что матрица С2 имеет полный ранг. Если
это не так, то можно определить yz(t), исключая все компоненты,
которые являются линейными комбинациями других компонент,
чтобы заново определенная матрица С2 имела полный ранг. Обоз-
Обозначим размерность yz(t) через к.
Уравнение D.1586) будет использоваться двояко. Во-первых,
приходим к заключению, что, поскольку y2(t) дает к линейных
уравнений x(t), необходимо восстановить только п — к (где п —
размерность х) дополнительных линейных комбинаций x(t). Во-
вторых, так как y2(t) не содержит белого шума, его можно диффе-
дифференцировать для того, чтобы извлечь дополнительную информацию.
Таким образом определим, как и в разд. 4.2.3, {п — &)-мерную век-
Оптимальное линейное восстановление состояния 407
торную переменную
.- p(t) = C'2x(t), D.160)
где С% выбирается таким образом^ что п X ге-матрица
0 (1)
является несингулярной. Из y2(t) и p(t) можно точно восстановить
x(t) по соотношениям
Удобно ввести обозначение
[ * ] =(Lit Lj) D.164)
таким образом, чтобы
ж (*) = Ltyt (t) + L2p {t). D.165)
Следующим шагом является построение наблюдателя для p(t).
Л.
Восстановленную переменную pit) обозначим через p(t). Из выра-
выражения D.165) следует, что восстановленное состояние x(t) опреде-
определяется в виде
х (t) = Ь^Уъ (t) -\- L2p (t). D.166)
Дифференциальное уравнение состояния для p(t) получается
путем дифференцирования соотношения D.160). Из D.165) следует
р (t) = С2х (t) = С2Ах (t) + С2Ви (t) + Ciwi (t) =
= С'2А [Ltj/t (t) + L%p (t)] + C2Bu (t) + C'2wi (t), D.167)
или
p (t) = A'p (t) + B'u (t) + B"y2 (t) + C'2wi(t), D.168)
где
A' = C'2AL2, B' = C'2B, B" = C'2ALi. D.169)
Заметим, что в этом уравнении u(t) и y2(t) являются вынуждаю-
408 Глава 4
щими переменными. Для располагаемых наблюдений yi(t) и г/2@
находим
у\ (t) = Cai (*) = С2Ах (t) + С2Ви (t) + C,Wi (t) =
= C2A[Lly2(t)+L2p{t)}+C2Bu(t) + C2wi(t). D.170)
Напишем для
D.171)
Объединяя yi(t) и i/2@> напишем для наблюдаемой перемен-
переменной системы D.168)
(у. it) \ [wAt) \
iK) C'p(t)+D'u(t) + D"y(t) + H>l ,D.172)
где
qi _ (CiL2 \ D, ( 0 \ г,// /CjLi \ jj, /0
\C2AL2J \^2OJ \^zALi) \С2
D.173)
Заметим,,что в дифференциальном уравнении состояния D.168)
и в уравнении для выходной переменной D.172) u(t) и y2(t) рассмат-
рассматриваются как заданные величины. Чтобы сделать постановку за-
задачи полной, необходимо вычислить априорные статистические
данные о вспомогательной переменной p(t0):
{'} D.174)
-Ap(t0)} [p(t0) ~P(to)Y
В задаче 4.6.4 показывается, каким образом можно найти эти
величины.
Задача наблюдения, которая теперь изучена и определена соот-
соотношениями D.168), D.172), D.174) и D.175), является задачей наб-
наблюдений с коррелированными шумом, возбуждающим состояние,
и шумом наблюдений. Эта задача может быть сингулярной или
несингулярной. Если задача является несингулярной, то ее можно
• л
решить в соответствии с разд. 4.3.3; так как p(t) имеется, можно ис-
использовать выражение D.166) для восстановления состояния. Если
задача наблюдений все еще остается сингулярной, то повторяем
всю процедуру путем выбора новой матрицы преобразования Т
для соотношения D.172). Этот процесс сводит задачу к одному из
двух вариантов:
Оптимальное линейное восстановление состояния 409
а) получается несингулярная задача наблюдения;
б) поскольку размерность величины, которую необходимо оце-
оценивать, снижается на каждом шаге, постепенно можно достичь
стадии, на которой матрица С2 в соотношениях D.162) становится
квадратной и несингулярной. Это означает, что соотношение можно
решить относительно x(t) непосредственно и динамический наблю-
наблюдатель не требуется.
Отметим в заключение этого раздела, что если выражения
D.168) и D.172) описывают несингулярную задачу наблюдения,
то при практической реализации оптимального наблюдателя не
требуется находить производную yz{t), так как затем эта производ-
производная интегрируется наблюдателем. Чтобы показать это, рассмотрим
следующий наблюдатель для переменной p(t): ¦<
i(t)= A'p{t)+B'u(t) + B"yi(t) +
+ К (t) [у' (t) -^D'u (t) - iryt{t)-C'i (*)] • D.176)
Разделяя матрицу
• Ку)=[КАЦ), Kt(t)], D.177)
получим из D.176)
p(t) = [A'-K(t)C']Ap(t)+B'u(t)+B"y2(t) +
+ К, (t) Vl (t) + K2 (t) y2 {t)-K{t\[D'u @ + D"y2 (*)]. D.178)
Определяя теперь
Q(t) = p(t)-K2(t)y2(t), ; D.179)
можно получить дифференциальное уравнение состояния для q(t)
с входными переменными yi(t), y%{t) и u(t) без 2/г@- Таким образом,
с помощью D.179) можно найти p(t), не используя y2(t).
4.3.5. ЗАДАЧА НАБЛЮДЕНИЯ ПРИ ЦВЕТНОМ ШУМЕ .
В этом разделе рассматривается случай, когда шум w^t),
возбуждающий состояние, и шум наблюдений w2(t) нельзя пред-
представить в виде белых шумов. Предположим, что эти процессы мож-
можно моделировать следующим образом:
v>dt) = Ci(t)*'(t)+">[&),
D.180)
{) C()'() (
410 Глава 4
при
w3(t). D.181)
Здесь w\(t), W2(t) и w3(t) — белые шумы, которые в общем слу-
случае могут и не быть некоррелированными. Объединяя выражения
D.180) и D.181) с дифференциальным уравнением состояния и
уравнением для выходной переменной
x{t) = A (t) x(t)+B (t) u (t) + w{ (t),
D.182)
= C(t)x(t)+w2(t),
получим следующее дифференциальное уравнение расширенного
состояния и уравнение для выходной переменной:
\x'(t)J \ 0 A'(t)!\x'(t)) \ 0 / \w,(t) I
)
D.183)
Чтобы завершить постановку задачи, необходимо задать сред-
среднее значение и матрицу дисперсий начального расширенного сос-
состояния col[#(?), x'(t)]. Во многих случаях белый шум и?г@ отсутст-
отсутствует, что делает задачу наблюдений несингулярной. Если в задаче
параметры являются постоянными, то можно использовать методы
разд. 4.3.4. Этот подход разработан в работе [25].
Проиллюстрируем изложенное примерами.
Пример 4.5. Система управления положением при цветном шуме
наблюдений
В примере 4.4 была рассмотрена система управления положе-
положением, описываемая дифференциальным уравнением состояния
QAt) DЛ84)
и уравнением для выходной переменной
m(O. ¦ D-185)
Шум измерений vm(?) аппроксимировался белым шумом с ин-
интенсивностью Vm. Предположим теперь, что лучшей аппроксима-
аппроксимацией будет представление шума vm(?) в виде экспоненциально кор-
коррелированного шума (см. пример 1.30, разд. 1.10.2) с функцией
спектральной плотности
V DЛ86)
Оптимальное линейное восстановление состояния 411
Это означает, что можно написать (пример 1.36, разд. 1.11.4)
*т @ = ?.(*). D.187)
ё« <*> —|- Ь @+'«>(*)• D-188)
Здесь <o(i) — скалярный белый шум с интенсивностью 2ст2/0.
В примере 4.4 предполагалось, что ta(t) также является белым шу-
шумом с интенсивностью Va. Чтобы не усложнять значительно зада-
задачу, остановимся на этом случае. Расширенная задача теперь' опи-
описывается дифференциальным уравнением состояния и уравнением
для выходной переменной
/6i@\ [о 1
( ?,(*)]= О -а
\о о —
\и%
где coH^i(f), l,2(t)] = x(t). Эта задача, очевидно, является сингу-
сингулярной задачей наблюдения, поскольку отсутствует шум наблюде-
наблюдений. Следуя выводам разд. 4.3.4, отметим, что уравнение для вы-
выходной переменной уже записано в форме D.158), где С± и Hi —
нулевые матрицы. Естественно выбрать
= *(*) D.190)
так, чтобы
" 1 о)-- D>191)
Записывая функцию p(t) в виде
Р @ = col К (*),«,(«)], D.192)
из обратной матрицы
f-q(t)
ir1(f)) = | 1 0 0 lUa(')l . D-193)
получим, что
412 Глава 4
2(t)\= О О 1 «,(*) .
D.194)
Так какр(^) = #(?), непосредственно получаем, что переменная
p{t) удовлетворяет дифференциальному уравнению состояния
Чтобы получить уравнение для выходной переменной, продиф-
продифференцируем Т) (t)
'ri(t) = (l,O)x(t) + i3(t). D.196)
Используя уравнения D.184), D.188) и D.194), можем написать
~ -1т)(^ 4-<»(/). D.197)
Уравнения D.195) и D.197) совместно описывают задачу наблю-
наблюдения для p(t), которая является несингулярной и в которой шум,
возбуждающий состояние, и шум наблюдений не коррелированы.
Оптимальный наблюдатель описывается выражением
0
-(-1, ljp(t)], D.198)
где оптимальную матрицу коэффициентов усиления K°(t) можно
вычислить- из соответствующего уравнения Риккати. Из выраже-
Л
ния D.194) видно, что оптимальные оценки состояния объекта x(t) и
Л
шума наблюдений ?3W определяются соотношениями
л л
x(t) = p(t),
D.199)
Примем следующие численные значения:
¦" х = 0,787 рад/(В-с2), Vd= 10 Я2.м2.с,
а = 4,6 с, 6 = 5- Ю-4 с, D.200)
¦ т = °Д кг^-м2, а = 0,01 рад.
На основании численных значений для а и 9 получаем, что
среднеквадратическая величина шума наблюдений составляет
Оптимальное линейное восстановление состояния 413
~0,01 рад, а частота срыва равна 1/9 = 2000 рад/с <^320 Гц.
Определим для этих значений установившуюся оптимальную мат-
матрицу коэффициентов усиления в уравнении D.198):
0,01998\
J- D-201)
Матрица дисперсий ошибки восстановления равна
/0,000003955 0,00007981\ ,, ,««,*
^0,00007981 0,003628 )' К >
Подстановка К0 вместо K°(t) в уравнение D.198) позволяет
построить оптимальный установившийся наблюдатель для x(t).
Реализация такого наблюдателя, для которой не требуется диффе-
дифференцировать т) (t), может быть легко выполнена.
Решенная здесь задача отличается от задачи из примера 4.4
предположением, что чт является цветным, а не белым шумом.
Настоящая задача сводится к задаче из примера 4.4, если аппрок-
аппроксимировать vm белым шумом с интенсивностью Vm, эквивалентной
спектральной плотности цветного шума на низких частотах, т. е.
если принять
Vm = 2а2Э. D.203)
Численные значения в настоящем примере и примере 4.4 были
выбраны одинаковыми. Теперь можно ответить на вопрос, возника-
возникающий в примере 4.4: правомерно ли представление vm в виде бе-
белого шума, имеющего широкую полосу пропускания, и соответст-
соответствующее построение оптимального наблюдателя? Для ответа на этот
вопрос вычислим матрицу, дисперсий ошибки восстановления для
настоящей задачи, используя наблюдатель, построенный в приме-
примере 4.4. В примере 4-4 ошибка восстановления описывалась диффе-
дифференциальным уравнением
где полагалось К — co\(ki, k2). С помощью выражений D.187),
D.188) получим следующее дифференциальное уравнение:
'-А, 1 -кЛ А,@\ / 0 \
-кш -аф ~к2 е2 @ + T,d@ . D:205)
о о" —^-у \ е. (о/ \а@ /
где е(?) = coHej(i), 8г@]-Из теоремы 1.52 (разд. 1.11.2) следует,
что матрица Q(t) дисперсий collect), e2(t), Ы*)\ удовлетворяет мат-
матричному дифференциальному уравнению
414 Глава 4
Численное решение при численных значениях D.200) и D.138)
дает следующую установившуюся матрицу дисперсий ошибки вос-
восстановления e(t):
/0,000003995 0,00008062\ ,. оП7ч
1,0,00008062 0,003645 )' [ '
Сравнение с матрицей D.202) показывает, что среднёквадрати-
ческие значения ошибок восстановления, которые имеют место при
аппроксимации шума в примере 4.4, только незначительно больше,
чем при более точном представлении шума'в данном примере. Это
подтверждает предположение, высказанное в примере 4.4, что
для оптимального наблюдателя хорошей аппроксимацией шума на-
наблюдений vm(?) является белый шум. В связи с этим более коррект-
корректный фильтр, построенный в предположении, что 4m(t) в действитель-
действительности является экспоненциально коррелированным шумом, дает
весьма небольшое улучшение.
4.3,6*. МЕТОД ОБНОВЛЕНИЯ
Рассмотрим оптимальную задачу наблюдения в соответствии
с определением 4.3 и ее решение, полученное в разд. 4.3.2 —
4.3.4. Здесь мы исследуем интересное свойство процесса
y(t)-C(t)u(t), *>*,, D.208)
л
где x(t) — оптимальное восстановление состояния в момент t на
основе данных, поступивших к моменту t. Фактически можно
доказать, что процесс D.208) является белым шумом с интенсив-
интенсивностью V2(t), точно равной интенсивности шума наблюдений
w2(t). Этот процесс называется процессом обновления [85], а ука-
указанный термин можно проследить вплоть до работ Винера. Можно
л
считать, что величина y(t) — C(t)x(t) несет новую информацию,
л
содержащуюся в y(t), так как y(t) — C(t)x(t) является вынуждаю-
вынуждающей переменной, которая совместно с моделью системы образует
Оптимальное линейное восстановление состояния 415
оптимальный наблюдатель. Концепция обновления оказывается
полезной при анализе теоремы разделения в линейной теории опти-
оптимального стохастического управления (гл. 5). Кроме того, эта
концепция также применяется в других задачах восстановления
состояния, не рассматриваемых в данной книге, в частности в так
называемой, задаче оптимального сглаживания [85].
Ограничимся рассмотрением случая, когда шум wlt возбуждаю-
возбуждающий состояние, и шум наблюдений w2 являются некоррелирован-
некоррелированными и имеют интенсивности Viif) и V2(t) соответственно, где
л
V2(t) > 0, t > t0. Чтобы доказать, что y(t) — C(t)x(t) является
белым шумом с интенсивностью V2(t), вычислим ковариационную
матрицу для ее интеграла и покажем, что зта матрица идентична
матрице ковариаций интеграла белого шума с интенсивностью
V2(t). ¦
л
Обозначим через s(t) интеграл разности y(t) — C(t)x(t) с усло-
условием, что
D.209)
«(*0) = 0.
Кроме того, разность
e(t) = x(t)—%(t) D.210)
будем считать ошибкой восстановления. Возвращаясь вновь к разд.
4.3.2, получим из уравнений D.209) и D.82) следующее дифферен-,
циальное уравнение состояния для s(i) и l(t):
)()(? I )(wdt)\
K°(t)C(t)l\e{t)l \l -K°(t)) \wt(t)J
D.211)
где K°(t) — коэффициент усиления оптимального наблюдателя.
Используя теорему 1.52 (разд. 1.11.2), получим следующее мат-
матричное дифференциальное уравнение для матрицы Q(t) дисперсий
co\[s(t), e(t)]:
~ /0 C(t) \~ ~ /0 - 0
<?(*)= <?(О+ <?(*) - т т
\0 A (t)~K°(t)C(t)J \CT(i) AT(t)~CT
/0 / \(Vl(t) 0 \/0 / \
+ 1 I I <4-212)
\T -K°(t))\ 0 \\{t)J\l -K°T(t)J
с'начальным условием
416 Глава 4
D213)
где QQ — матрица дисперсий x(tQ). Разобьем матрицу Q(t) следую-
следующим образом:
5( /q,,«> Qam\ D214)
Теперь можно переписать матричное дифференциальное урав-
уравнение D.212) в форме
, Qu(to) = O, D.215)
22 (t) + Qa (t) [A (t) - K° (t) С (t)]T -
-V2(t) K°T(t), Ql2(t0) = 0, D.216)
Q22(t) =[A(t)-K*(t)С(t)]Q22(t) + Qi2(t)[A (t)-?• (t)C (t)f +
+ Vi(t) + K°(t)V2(t)Kor(t), Q22(t0) = Q0. D.217)
Из уравнения D.217) можно видеть, что, как и следовало ожи-
ожидать, <?2г(г) = Q{t), где Q(t) — матрица дисперсий ошибки воссха-
. )аовления. Из выражения D.105) следует, что в уравнении D.216)
имеем
(t)-^Vt(t)Kw(t) = O. D.218)
Таким образом, уравнение D.216) упрощается:
Q*(t) = Qi2lWA{t)-K°(t)C(t)]Tt <?B(*o) = 0. D.219)
Это уравнение имеет решение
. 9i,@ = 0, t>t0. D.220)
Тогда уравнение D.215) также упрощается
<?« (t) = V2(t), Qn(t0) = 0, • D.221)
так что
<?п@= f Fa (-О Л. D.222)
Обращаясь снова к теореме 1.52, можно записать ковариаци-
ковариационную матрицу для col[s(t), e(t)\ следующим образом:
Оптимальное линейное восстановление состояния 417
*>*" D.223)
ДЛЯ *,>*2,
где Y(it, ?0) — переходная матрица системы
C(t) )(s(t)
. <4224>
Легко найти, что переходная матрица определяется выражени-
выражением
D.225)
0 V /
где Чг(^1, i0) — переходная матрица системы
e(t) = [A(t)-K°(t)C(t)]e(t). D.226)
Ковариационная матрица процесса s(t) является A,1)-блоком
матрицы R(ti,t2), которая, как можно установить, определяется
выражением
mln (/,, /,)
J V2(t)dt. D.227)
Это выражение является ковариационной матрицей процесса
с некоррелированными приращениями (см. пример 1.29, разд.
1.10.1). Так как процесс y(t) — C{t)x(t) является производной
процесса s(t), то он представляет собой белый Ьпум с интенсивностью
V2(t) (см. пример .1.33, разд. 1.11.1).
Подытожим полученные результаты в следующем виде.
Теорема 4.7. Рассмотрим решение несингулярной задачи опти-
оптимального наблюдения с некоррелированными шумом, возбуждаю-
возбуждающим состояние, и шумом наблюдений, заданным так же, как в тед-
реме 4.5. Тогда процесс обновления
y(t)-C(t)x(t), t>t0, D.228)
есть белый шум с интенсивностью V2(t).
Можно доказать, что эта теорема также справедлива для син-
сингулярной задачи оптимального наблюдения с коррелированными
шумом, возбуждающим состояние, и шумом наблюдений.
418 Глава 4
4.4*. Дуальность оптимального
наблюдателя и оптимального регулятора.
Установившиеся свойства оптимального
наблюдателя
4.4.1*. ВВЕДЕНИЕ
В этом разделе исследуются свойства оптимального наблюда-
наблюдателя в установившемся состояции и характеристики его устойчи-
устойчивости. Все эти результаты основаны на свойствах оптимального
регулятора, полученных в гл. 3, и вытекают из дуальности задач
оптимального. регулирования и оптимального наблюдения [90].
Разд. 4.4.2 посвящен рассмотрению свойства дуальности, а в разд.
4.4.3 обсуждаются установившиеся свойства оптимального наблю-
наблюдателя. Наконец, в разд. 4.4.4 исследуется асимптотическое пове-
поведение оптимального наблюдателя с постоянными параметрами в ус-
установившемся состоянии, когда интенсивность шума наблюдений
стремится к нулю. '
4.4.2*. ДУАЛЬНОСТЬ ЗАДАЧ ОПТИМАЛЬНОГО РЕГУЛИРОВАНИЯ
И ОПТИМАЛЬНОГО НАБЛЮДЕНИЯ
Результаты этого раздела основаны на следующей теореме.
Теорема 4.8. Рассмотрим задачу оптимального регулирования
(ЗОР) в соответствии с определением?).2 (разд. 3.3.1,) инесингуляр- .
ную задачу оптимального наблюдения (ЗОН) с коррелированными
шумом, возбуждающим состояние, и шумом наблюдений по опре-
определению 4.3 (разд. 4.3.1^. Пусть в задаче наблюдения матрица
Vi(t) определяется выражением
V1(t) = G(t)V3(t)GT(t), t>t0, D.229)
где
Va(t)>0, t>to, D.230)
а различные матрицы в определениях задач ЗОР и ЗОН связаны сле-
следующим образом:
A{t) в ЗОР равна AT(t*~t) в ЗОН,
R(t) в ЗОР равна CT(t* — t) в ЗОН,
D(t) в ЗОР равна GT(t* — t) в ЗОН,
R3(t) f ЗОР равна Va(t* — t) в ЗОН, D.231)
R2(t) в ЗОР равна Vz(t* — t) в ЗОН,
Pi в ЗОР равна Qo в ЗОН
Оптимальное линейное восстановление состояния . 419
при всех t <з tt. Здесь
t* = h + tt. D.232)
При этих условиях решения задачи оптимального регулирования
(теорема 3.4, разд. 3.3.3^ и несингулярной задачи оптимального
наблюдения с некоррелированными шумом, возбуждающим состоя-
состояние, и шумом наблюдений (теорема 4.5, разд. 4.3.2^ связаны следую-
следующим образом:
а) матрица P(t) в задаче ЗОР равна Q(t*—t) в задаче ЗОН
при t < ti,
б) матрица F°(t) e задаче ЗОР равна KuT(t*—t) в задаче ЗОН
герм t < tt;
в) замкнутый регулятор в задаче ЗОР
x(t) = [A(t)-B(t)F°(t))x(t) D.233)
и уравнение ошибки восстановления без вынужденной переменной
е задаче ЗОН
e(t) = [A(t)-K°(t)C(t)]e(t) D.234)
дуальны относительно f* в смысле определения 1.23 (разд. 1.8,).
Доказательство этой теоремы легко получается, если сравнить
уравнение Риккати C.130) для регулятора с уравнением Риккати
D.106) для наблюдателя и использовать обращение времени (лемма
4.1, разд. 4.3.2).
В разд. 4.4.3 используется дуальность задач построения опти-
оптимального регулятора и оптимального наблюдателя для того, чтобы
определить установившиеся свойства оптимального наблюдателя
из таких же свойств оптимального регулятора. Кроме того, это
свойство дуальности позволяет использовать для задач оптималь-
оптимального наблюдения вычислительные программы, разработанные для
задач оптимального регулирования, и наоборот, производя под-
подстановки в соответствии с выражением D.231).
4.4.3*. УСТАНОВИВШИЕСЯ СВОЙСТВА ОПТИМАЛЬНОГО НАБЛЮДАТЕЛЯ
Теорема 4.8 позволяет перенести из задачи регулирования в
задачу наблюдения свойства в установившемся состоянии (теорема
3.5, разд. 3.4.2), свойства устойчивости в установившемся состоя-
состоянии (теорема 3.6, разд. 3.4.2) и различные результаты для случая
системы!с постоянными параметрами (теорема 3.7, разд. 3.4.3, и
теорема 3.8, разд. 3.4.4).
Ниже определяются некоторые наиболее важные свойства в ус-
установившемся состоянии и свойства устойчивости. Теорема 3.5 об
установившемся поведении решения уравнения Риккати может
быть сформулирована следующим образом [90].
420 Глава 4
Теорема 4.9. Рассмотрим матричное уравнение Риккати
Q (*) = A{t)Q{t) + Q (t) AT (t) + G (t)Va (t) GT (t) -
-Q{t)CT{t)VTl(t)C(t)Q(t). D.235)
Предположим, что матрица A(t) является непрерывной и огра-
ограниченной, а C(t), G(t), Vs(t) и V2(t) — кусочно-непрерывные и
ограниченные матрицы; кроме того,
V3(t) > a/, V2(t) > $1 для всех t, D.236)
где а и р — положительные константы.
1) Тогда, если система
3(
D.237)
y(t) = C{t)x(t)
является
а) полностью восстанавливаемой или
б) экспоненциально устойчивой,
то решение Q(t) уравнения Риккати D.235) с начальным условием
Q(t0) = 0 сходится к неотрицательно определенной матрице Q(t)
при t0 ->-oo. Матрица Q(t) является решением уравнения Риккати
D.235).
2) Кроме того, если система ^4.237) является
в) одновременно равномерно полностью восстанавливаемой и
равномерно полностью управляемой или
г) экспоненциально устойчивой,
то решение Q(t) уравнения Риккати D.235) с начальным условием
Q(t0) = Qo сходится к Q(t) при t0 ->- — оо для любого Qo > 0.
Доказательство этой теоремы получается путем непосредст-
непосредственного использования свойств дуальности из теоремы 4.8 в тео-
теореме 3.5 с учетом того, что если система является полностью вос,-
стйнавливаемой, то дуальная система является полностью управ-
управляемой (теорема 1.41, разд. 1.8) и что если система является экспо-
экспоненциально устойчивой, то дуальная система также экспоненци-
' ально устойчива (теорема 1.42, разд. 1.8).
Сформулируем теорему, дуальную теореме 3.6 (разд. 3.4.2).
Теорема 4.10. Рассмотрим несингулярную систему оптимального
наблюдения с некоррелированными шумом, возбуждающим состоя-
состояние, и шумом наблюдений, и пусть
для всех t, D.238)
Оптимальное линейное восстановление состояния 421
где V3(t)>0 для всех t. Предположим, что условия непрерывности,
ограниченности и положительной определенности в теореме4.9, ка-
касающиеся матриц А, С, G, V3 и F2, удовлетворяются. Тогда, если
система D.237)
а) равномерно полностью восстанавливаема и равномерно пол-
полностью управляема или
б) экспоненциально устойчива, то имеет место следующее.
1) Установившийся оптимальный наблюдатель
(t) + K(t)[y(t)-C(t)x(t)], D.239)
где
~K{t)=Q{t)CT{t)V?{t), D.240)
экспоненциально устойчив. Здесь Q(t) определяется так же, как в
теореме 4.9.
2) Коэффициент усиления установившегося оптимального на-
наблюдателя K(t) минимизирует
lim Е{/(t)W{t) e (t)} D.241)
для всех Qo^> 0. Минимальная величина предела D.241), которая
достигается установившимся оптимальным наблюдателем, опре-
определяется выражением
tr[Q(t)W (t)}. D.242)
Сформулируем также теорему, дуальную теореме 3.7 (разд.
3.4.3), которая относится к системам с постоянными параметрами.
Теорема 4.11. Рассмотрим несингулярную задачу оптимального
наблюдения при постоянных параметрах в соответствии с опре-
определением 4.3 при некоррелированных шуме, возбуждающем состоя-
состояние, и шуме наблюдений для системы
D.243)
Здесь w3 — белый шум с интенсивностью V3, a w2 — шум с ин-
интенсивностью V2. Предполагается, что V3 > 0, V2 > 0 и (?,, > 0.
Соответствующее уравнение Риккати имеет вид
T + GVsGT -Q(t)C7 V^ CQ(t) D.:!44)
422 Глава 4
с начальным условием
Q{to) = Qo. D.245)
а) Примем, что Qo = 0. В этом случае при t0 -*~ —оо решение
уравнения Риккати достигает постоянной установившейся вели-
величины Q тогда и только тогда, когда система D.243) не имеет полю-
полюсов, которые одновременно были бы полюсами неустойчивости,
невосстанавливаемости и управляемости.
б) Если система D.243) является одновременно обнаруживаемой и
стабилизируемой, то решение уравнения Риккати достигает вели-
величины Q при t0 -»- —оо для всех Qo ^> 0.
в) Если Q существует, то эта величина является неотрицатель-
неотрицательно определенным симметрическим решением алгебраического урав-
уравнения Риккати
0 = AQ + QAT + GV3GT — QCTV^CQ. D.246)
Если система D.243) является обнаруживаемой и стабилизируе-
стабилизируемой, то Q представляет собой единственное неотрицательно опре-
определенное решение алгебраического уравнения Риккати.
г) Если Q существует, то эта величина является положительно
определенной тогда и только тогда, когда система является пол-
полностью управляемой.
д) Если Q существует, то установившийся оптимальный наб-
наблюдатель
x(t) = Ax{t)+K[y{t) — Cx(t)}, D.247)
где _
K = QCTVT\ D.248)
асимптотически устойчив тогда и только тогда, когда система
является обнаруживаемой и стабилизируемой.
е) Если система является обнаруживаемой и стабилизируемой,
то установившийся оптимальный наблюдатель D.247) минимизи-
минимизирует предел
lim E\eT{t)We{t)\ D.249)
*„-»--со I J
при всех Qo :> 0. Для установившегося оптимального наблюдателя
предел D.249) определяется выражением
tr [QW]. D.250)
Отметим, что условия (б), (в) являются необходимыми, но не
достаточными.
Оптимальное линейное восстановление состояния 423
4.4.4*. АСИМПТОТИЧЕСКИЕ СВОЙСТВА УСТАНОВИВШИХСЯ
ОПТИМАЛЬНЫХ НАБЛЮДАТЕЛЕЙ
С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
В этом разделе рассматриваются свойства оптимального фильт-
фильтра с постоянными параметрами в установившемся состоянии,
когда интенсивность шума наблюдений стремится к нулю. Данный
раздел является весьма коротким, поскольку все результаты можно
получить путем «дуализации» результатов из разд. 3.8.
Рассмотрим сначала случай, в котором шум w3(t), возбуждаю-
возбуждающий состояние [см. D.237)], и наблюдаемая переменная являются
скалярами. Из теоремы 3.11 (разд. 3.8.1) непосредственно сле-
следует теорема.
Теорема 4.12. Рассмотрим п-мерную систему с постоянными
параметрами
D.251)
¦q(t) = cx{t)($
где (о3 — скалярный белый шум с постоянной интенсивностью
V3; со2 — скалярный белый шум, некоррелированный с шумом со3 с
положительной постоянной интенсивностью Vz; g — вектор-стол-
вектор-столбец; с — вектор-строка. Предположим, что пара {A, g) стабили-
стабилизируемая, а {А, с) — обнаруживаемая. Пусть H(s) — скалярная
передаточная функция
D.252)
где q>(s) — характеристический полином системы, a nt, i =1,
2, ..., п, — его характеристические числа. Тогда характеристи-
характеристические числа устанобиешегдся оптимального наблюдателя являются
нулями в левой полуплоскости полинома
(- 1)» ф (в) ф (- *) Г1 + -?- Я (- s) Н (вI. D.253)
i5 результате имеет место следующее.
а) Дри V2/V3 -v 0 р из п полюсов установившегося оптимального
наблюдателя достигают чисел vt, i = 1, 2, ..., р, где
v4, ,«« RP(v,)<0. D2M)
— •»., если Ht'(v;)>0.
424 Глава 4
б) При V2/V3 -*¦ 0 оставшиеся п — р полюсов наблюдателя
асимптотически приближаются к прямым линиям, которые пере-
пересекаются в начале координат и образуют углы с отрицательной
вещественной осью, равные
I , ТС , П Л П Р 1
± I "., 1 = 0, 1,... , - , если п — р нечетное,
п — р 2
D.255)
± — , I = О, 1,... , п~ р — 1, если п — р четное.
п — р 2
Эти удаленные полюса наблюдателя асимптотически удалены
от начала координат на расстояние
<оо = (а2 -^-) • D.25fe)
в) При Vz/V3 -*¦ оо п полюсов наблюдателя достигают чисел
лг, I = 1, 2, ...,п, где
л Г *t,ecAuKB{«t)<0, D25?)
1—тсг, если Re(Tr?)>0.
Из пункта (б) следует, что удаленнне полюса образуют распре-
распределение Баттерворса.
Для общего случая имеем следующий результат, который вы-
вытекает из теоремы 3.12 (разд. 3.8.1).
Теорема 4.13. Рассмотрим п-мерную систему с постоянными па-
параметрами
D.258)
где wz — белый шум с постоянной интенсивностью F3, a w2 —
белый шум, некоррелированный с шумом wz с постоянной интенсив-
интенсивностью Vz >0. Предположим, что пара {A, G} является стабили-
стабилизируемой, а {А, С} — обнаруживаемой. Тогда полюса.установив-
полюса.установившегося оптимального наблюдателя являются нулями в левой полу-
полуплоскости полинома
(-l)»<p(s)<v(-s)iet[l + VT1H(SyV3HT(-s)], D.259)
где H(s) — передаточная мцтрица:
' A)-*Gt \ D.260)
Оптимальное линейное восстановление состояния 425
a q>(s) — характеристический полином системы D.258). Предпо-
Предположит, что dim(^3) = dim(i/) = к, так что H(s) является
к X к-передаточной матрицей. Пусть
а п (s—ii) ;
det [H(s)] =Ж = —^ , D.261)
гл примем, что a f 0. Предположим также, что
V2 = РЛ7 D.262)
N > 0 и положительном скаляре р.
а) Тогда при р ]. О р полюсов оптимального наблюдателя до-
достигают чисел vf, г =1,2, ..., р, где
°. D.263)
—vit если Re(vj)>0.
Остальные полюса наблюдателя удаляются в бесконечность и
образуют несколько распределений Баттерворса различного порядка
и различного радиуса. Грубая оценка расстояния от удаленных по-
полюсов до начала координат составляет
p)] D.264)
б) При р -v оо п полюсов оптимального наблюдателя достигают
чисел лг, i — 1, 2, ...,' п,
где
I R()>0
Некоторая информация относительно поведения полюсов наб-
наблюдателя при dina(u>3) ¦ф <\\т(у) может быть получена путем дуа-
лизации результатов задачи 3.14.
Окончательно запишем теорему 3.14 (разд. 3.8.4) следующим
образом.
Теорема 4.14. Рассмотрим систему с постоянными параметрами
Gw3(t),
D.266)
426 Глава 4
где матрицы G и С имеют полный ранг, w3 — белый шум с постоян-
постоянной интенсивностью V3, к>2 — белый шум, некоррелираванный с
шумом юъ, имеющим, постоянную несингулярную интенсивность
V2 — pN, p > О, N > 0. Предположим, что- пара {A, G} яв-
является стабилизируемой, а {А, С} — обнаруживаемой, и пусть
Q представляет собой установившееся решение уравнения Риккати
D.244) для дисперсий в задаче построения оптимального наблюда-
наблюдателя. Тогда имеет место следующее.
а) Существует предел
UmQ = Qi. D.267)
б) Пусть es(t) обозначает составляющую ошцбки восстановления
e(t) = x(t) — x(t), вызванную шумом, возбуждающим состояние,
a eo(t) — шумом наблюдений. Тогда для установившегося наблю-
наблюдателя существуют следующие пределы:
lim Е { el (t) Wes (t)} = tr (&W), D.268)
J0
рфО
в) Если dim(w3) > dim(i/), mo Q± Ф 0.
г) Если dim(u;3) = dim(y) и полином ф (s) числителя квадратной
передаточной матрицы
C(sI~A)-1G D.269)
не равен нулю, то Qi = 0 тогда и только тогда, когда ^(s) имеет
нули только с неположительными вещественными частями.
д) Если (Mva.(w3) <,dim(j/), то достаточное условие для того,
чтобы Qi была нулевой матрицей, состоит в том, что должна
существовать такая прямоугольная матрица, при которой поли-
полином числителя квадратной передаточной матрицыМС(si — A)~lG
не равен нулю и имеет нули только с неположительными вещест-
вещественными частями.
Эта теорема показывает, что если шум наблюдений отсутствует,
то точное восстановление состояния системы возможно, если число
компонент наблюдаемой переменной, по крайней мере, такое же,
как число компонент шума wi(f), возбуждающего состояние. Даже
если это условие и выполняется, то полностью успешное восста-
восстановление состояния возможно, только-в том случае, если переда-
передаточная матрица от шума w3, возбуждающего состояние, к наблюдае-
наблюдаемой переменной г/не имеет нулей в правой полуплоскости.
Оптимальное линейное восстановление состояния • 427
В связи с этим возникает следующий вопрос. При очень неболь-
небольших значениях интенсивности шума наблюдений V2 некоторые по-
полюса оптимального наблюдателя сильно удалены, тогда как неко-
некоторые другие полюса остаются в окрестности начала координат.
Из-за этих близко расположенных полюсов ошибка восстановления
относительно медленно отклоняется от заданных начальных усло-
условий. В то же время теорема 4.14 устанавливает, что матрица
дисперсий ошибки восстановления может быть весьма малой. Здесь,
по-видимому, имеется противоречие. Ответ на этот вопрос состоит
в следующем: структура наблюдаемой системы должна выбираться
таким образом, чтобы ошибка восстановления не находилась в под-
подпространстве, из которого ее можно вывести только медленно.
Завершим этот раздел замечанием, что предельную матрицу
дисперсий Qt при р \ 0 можно вычислить из решения сингулярной
задачи оптимального наблюдения, которая получается, если по-
положить w2(t)=0. Иногда в такой задаче построения наблюдателя
пониженного порядка система является необнаруживаемой, в ре-
результате чего у соответствующего алгебраического уравнения Рик-
кати будет более одного неотрицательно определенного решения.
В этом случае, конечно, необходимо выбрать такое решение, кото-
которое делает наблюдатель пониженного порядка устойчивым (асимп-
(асимптотически или в смысле Ляпунова), так как наблюдатель полного
порядка, который становится наблюдателем пониженного поряд-
порядка при V2 -*¦ 0, всегда асимптотически устойчив.
Задача, которая является дуальной для вычисления матрицы
Qi, т. е. задача вычисления
Ро = lim P D.270)
R,-*O
для детерминированной задачи оптимального регулирования
(раэд. 3.8.3), может быть решена путем постановки дуальной за-
задачи наблюдения и решения результирующей сингулярной задачи
оптимального наблюдения, как указывалось выше. В работе [30]
дано прямое ревдение задачи линейного регулирования без учета
затрат на управление.
Пример 4.6. Система управления положением
В примере 4.4 (разд. 4.3.2) было найдено, что применительно к
рассматриваемой системе управления положением установившее-
установившееся решение для матрицы дисперсии ошибки определяется выраже-
выражением
D.271)
428 Глава 4
где .
8 = т VVdIVm. D.272)
При Vm \ 0 матрица дисперсий имеет вид
Очевидно, матрица Q становится нулевой при Vт \ 0. В при-
примере 4.4 было установлено, что полюса оптимального наблюдателя
равны
— (— Va2 + 2р ± Ка2 — 2р). D.274)
Асимптотическое поведение этих полюсов описывается выра-
выражением
±^!\1I2 D.275)
которое представляет собой распределение Баттерворса второго
порядка. Все эти факты не противоречат интуитивным соображе-'
ниям, так как передаточная функция системы описывается урав-
уравнением
i D.276)
H(s) c{sIArg ,
s (s + a)
у которого нет нулей. Как было показано в примере 4.4, при
Vm \ 0 оптимальный фильтр становится дифференцирующим
фильтром пониженного порядка:
1@ = @. D.277)
Если шум наблюдений отсутствует, то этот дифференцирующий
фильтр восстанавливает состояние точно независимо от того, на-
насколько велик шум, возбуждающий состояние.
4.3. Заключение
В данной главе была решена задача восстановления состояния
линейной дифференциальной системы по неполным и неточным
измерениям. Обсуждаются различные варианты этой задачи. Рас-
Рассматриваются установившиеся и асимптотические свойства опти-
Оптимальное линейное восстановление состояния
429
мальных наблюдателей. Показано, что некоторые из результатов
этой главы и гл. 3 являются общими; действительно, некоторые
свойства оптимальных наблюдателей определены из соответствую-
соответствующих свойств оптимальных регуляторов, установленных в гл. 3.
Используя результаты этой главы, можно расширить резуль-
результаты гл. 3, в которой рассматриваются линейные системы управ-
управления с обратной связью. Теперь можно исключить обычно непри-
неприемлемое предположение, что все компоненты вектора состояния
всегда можно точно измерить. Это делается в гл. 5, в которой пока-
показано, каким образом можно построить системы управления с
обратной связью по выходной переменной, используя законы уп-
управления с обратной связью по состоянию, синтезированные
в гл. 3, совместно с наблюдателями, построенными в данной
главе.
4.6. Задачи
4.6.1. НАБЛЮДАТЕЛЬ ДЛЯ СИСТЕМЫ УПРАВЛЕНИЯ
ПОЛОЖЕНИЕМ ПЕРЕВЕРНУТОГО МАЯТНИКА
Рассмотрим систему управления положением перевернутого
маятника, описанную в примере 1.1 (разд. 1.2.3). Дифференци-
Дифференциальное уравнение состояния этой системы имеет вид
ГО 10
*(*) =
0
0
?_
и
л:
~М
0
0
0
0
g
и
(Г
0
1
0
x(t) +
- о~
Г
м
0
0
{*(*). D.278)
Предположим, что в качестве наблюдаемой переменной выбран
угол ср (г), который маятник образует с вертикалью, т. е. пусть
4i (<)={—р. 0, jj
D.279)
Рассмотрите задачу построения наблюдателя с постоянными
параметрами для этой системы:
а) Покажите, что нельзя найти асимптотически устойчивый
наблюдатель. Объясните это с физической точки зрения.
б) Покажите, что если в дополнение к углу ф(г) также измеряв
'430 Глава 4
ется перемещение тележки s(t), т. е. дополнительно вводится ком-
компонента
7)а(г) = A, 0, 0, O)x(t) D.280)
в наблюдаемой переменной, то можно построить асимптотически
устойчивый наблюдатель ' с постоянными параметрами.
4.6.2. ВОССТАНОВЛЕНИЕ УГЛОВОЙ СКОРОСТИ
Рассмотрим систему управления угловой скоростью из приме-
примера 3.3 (разд. 3.3.1), которая описывается дифференциальным урав-
уравнением состояния
5(*)=-a6(*) + *ji(*), D.281)
где |B) — угловая скорость, a \i(t) — входное напряжение.
Предположим, что система возмущается случайно изменяющимся
моментом, действующим на вал.. Тогда напишем
ffli@. D-282)
где <Hi(t) — экспоненциально коррелированный шум со средне-
квадратической величиной стх и постоянной времени 8Х. Наблюда-
Наблюдаемая переменная определяется выражением
@ = ?(') +МО. D.283)
где со2 — эксподенциально коррелированный шум со среднеквад-
ратической величиной ст2 и постоянной времени 83. Шумы (йх и
со2 не коррелированы.
Примем следующие численные значения:
а = 0,5 с, 01 = О,1 с,
х = 150 рад/(В-с2), сг2 = 5рад/с, . D.284)
at = 54,78 рад/с2, Э2 = 0,01 с.
а) Так как шум, возбуждающий состояние, и шум наблюдений
имеют очень широкую полосу пропускания в сравнении с полосой
пропускания системы, попытайтесь сначала найти оптимальный
наблюдатель для угловой скорости путем аппроксимации как шу-
шума, возбуждающего состояние, так и шума наблюдений белыми шу-
шумами с интенсивностью, равной спектральным плотностям шумов
(йх и (о2 ПРИ нулевой частоте. Вычислите установившийся опти-
оптимальный наблюдатель, который получается при таком подходе.
б) Чтобы проверить, можно ли представить, шумы (ох и со2
белым шумом, промоделируйте о^ и ооа в виде экспоненциально
коррелированных шумов и найдите дифференциальное, уравнение
Оптимальное линейное восстановление состояния 431
расширенного состояния, которое описывает систему управления
угловой скоростью. Используя дифференциальное уравнение наб-
наблюдателя, полученное для п. (а), получите дифференциальное урав-
уравнение пространственного расширенного состояния для ошибки вос-
восстановления e(t) = %(t) — |@и переменных состояния процес-
процессов сох и ш2. Затем вычислите установившееся значение дисперсии
ошибки восстановления и сравните это число с величиной, которая
вычислена в и. (а).
в) Попытайтесь обеспечить более хорошее соответствие между
расчетными и фактическими результатами, формулируя заново
задачу наблюдения в следующем виде. Шум, возбуждающий сос-
состояние, моделируется в виде экспоненциально коррелированного
шума, а шум .наблюдений аппроксимируется белым шумом, по-
поскольку полоса пропускания шума наблюдений очень широка.
Определите установившийся наблюдатель для этого случая и
сравните расчетное установившееся среднее значение квадрата
ошибки восстановления с фактическим значением, учитывая, что
шум наблюдений является экспоненциально коррелированным шу-
шумом. Прокомментируйте результаты.
г) Определите точное решение задачи оптимального наблюде-
наблюдения, представляя шум наблюдений в виде экспоненциально корре-
коррелированного' шума. Сравните характеристики результирующего
установившегося оптимального наблюдателя с характеристика-
характеристиками наблюдателя, полученного при условиях п. (в). Прокомменти-
Прокомментируйте результаты. %
4.6.3. РЕШЕНИЕ УРАВНЕНИЯ РИККАТИ
ДЛЯ НАБЛЮДАТЕЛЯ
Рассмотрите матричное уравнение Риккати
Q{t) = A(t)Q<t) + Q{t)AT(t) + Vi{t)-Q(t)CrWVTl{t)C{t
D.285)
с начальным условием
Q(to)=Qo. D.286)
Определите W(t, t0) как Bп X 2п)-мерное решение следующего
уравнения [где Q(t) — (п X п]-матрица]:
±V{t,to)= (- Ат (t) Ст (t) VT1 (t) С (t)\ у {t, t0),
\7i@ AV) )
D.287)
, to) = I.
432 Глава 4
Разделите матрицу W(t, t0) соответственно разделению в урав-
уравнении D.287) следующим образом:
t, ta)\
W(t, *0) = ' " , D.288)
\W2l(t, t0) W22(t, to)J
Покажите, что решение уравнения Рйккати можно записать в
виде
Q @ = [YM (t, *„) + ?22 {t, *0) <?01 [ЧГ„ {t, t0) + ?12(t, tQ) Qo]-K -
D.289)
4.6.4*. ОПРЕДЕЛЕНИЕ АПРИОРНЫХ ДАННЫХ
ДЛЯ СИНГУЛЯРНОЙ ЗАДАЧИ НАБЛЮДЕНИЯ
При построении оптимального наблюдателя в сингулярной
задаче наблюдения, описанной в разд. 4.3.4, необходимо опреде-
определить априорные данные
p(to) = E\C2x(to)\yi(to)) D.290)
и
<?(*„) = Е {[p(t0) - р (*„)] [p(t0) - p(to)Y\ y2(t0)}, D.291)
где
D.292)
Предположим, что заданы
E[x{to))=xQ D.293)
и
Е {[х (t0) - х0 ] ИМ— ** ]Г1 = <?¦>• D-2^)
Докажите, что если x{t^ является гауссовским процессом, то
Е №) 1 У.(*о)Н * (го) = ^о + QA (C2Q0Ct2 Г fea (g -C^l D.295)
и
я {[г(д -х(д] [*(д -х(д]г [& (д} =
= <?о -<?оС\{СгQoС[У C2Q0. D.296)
Определите по этим соотношениям выражения для D.290) и
D.291).
Указание: Используйте векторную формулу для многомерной
гауссовской функции плотности [ср. с выражением A.434)] и вы-
выражение для обращения блочной матрицы, приведенное в ра-
работе [133] (упражнение 1.59, стр. 25).
ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ
УПРАВЛЕНИЯ С ОБРАТНОЙ СВЯЗЬЮ
ПО ВЫХОДНОЙ ПЕРЕМЕННОЙ
Я.1. Введение
В гл. 3 было рассмотрено управление линейными системами,
которые описываются дифференциальным уравнением состояния
в форме
Теория, представленная в гл. 3, основывается на предположе-
предположении о том, что полный вектор состояния x(t) доступен для измере-
измерения и обратной связи.
В данной главе это предположение снимается и исследуется
более реальный случай, в котором для измерения и обратной связи
доступна наблюдаемая переменная, которая описывается урав-
уравнением вида
y(t) = C{t)x(t). E.2)
Системы управления, в которых в качестве входной переменной
регулятора используется наблюдаемая переменная у. а не состоя-
состояние х, будем называть системами управления с обратной связью
по выходной переменной.
С точки зрения результатов гл. 4 естественно, что оптимальный
регулятор с обратной связью по выходной переменной является
комбинацией наблюдателя, в котором восстанавливается состояние
системы, и закона управления, который представляет собой мгно-
мгновенную линейную фупкцию восстановленного состояния. Этот за-
закон управления является таким же законом, который получается,
если состояние непосредственно доступно для наблюдений.
В разд. 5.2 рассматривается детерминированный подход к зада-
задаче управления с обратной связью по выходной переменной и про-
проводится построение регуляторов путем комбинации асимптотичес-
асимптотически устойчивых наблюдателей и линейных законов управления.
В разд. 5.3 представлен стохастический подход и проводится по-
построение оптимальных линейных регуляторов с обратной связью
в виде соединения оптимальных наблюдателей и оптимальных
линейных законов управления с обратной связью по состоянию.
В разд. 5.4 исследуются задачи слежения'. В разд. 5.5 рассматрива-
рассматриваются системы регулирования и слежения с ненулевыми заданными
точками при постоянных возмущениях. В разд. 5.6 изучается чувст-
чувствительность линейных оптимальных систем управления с обратной
связью к возмущениям и изменению параметров систем. Завершает >
^ в котором рассматриваются регуляторы с обратной
связью пониженного порядка.
15—394
434 Глава 5
5.2. Регулирование линейной системы
при неполных измерениях
5.2.1. СТРУКТУРА СИСТЕМЫ УПРАВЛЕНИЯ
С ОБРАТНОЙ СВЯЗЬЮ ПО ВЫХОДНОЙ ПЕРЕМЕННОЙ
В этом разделе излагается детерминированный подход к зада-
задаче регулирования линейной системы при неполных измерениях.
Рассмотрим систему, описываемую дифференциальным уравнени-
уравнением состояния
x(t) = A(t)x(t)+B(l)u(t). E.3)
Наблюдаемая переменная определяется выражением
y(t) = C(t)x(t), E.4)
В гл. 3 рассматривались законы управления вида
u(t) = -F{t)x{t), E.5)
для которых предполагалось, что можно точно измерить полное
состояние x(t). Если состояние непосредственно не доступно для
измерения, то естественный подход заключается в том, чтобы по-
построить наблюдатель в форме
¦С л г л 1
x(t) = A(t)x(t)+B(t)u(t) + K(t)[y(t)-C(t)x(t)\, E.6)
а затем использовать закон управления применительно к восста-
л
новленному состоянию x(t),
u{t)=-F{t)x{t), E.7)
где F(t) имеет такой же вид, как и в выражении E.5). На рис. 5.1
показаны взаимосвязи объекта, наблюдателя и закона управле-
управления. Подставляя выражение E.7) для закона управления в урав-
уравнение наблюдателя E.6), получим уравнения регулятора в форме
л .
х (t) = [A (t) ~B(t)F (t) -K(t)C (l)] x (t) + K(t) у (t),
u(t) = —F{t)x(t). E.8)
Это приводит к упрощенной структуре, представленной-на
рис. 5.2.
Замкнутая система, получаемая в результате соединения объ-
объекта с регулятором, представляет собой линейную систему размер-
размерности 2га (где га — размерность состояниям), которую можно опи-
описать уравнением
Г"
S1Q.
u(t)
¦ Bit)
J
xlt)
Объект
Ait)
С it)
У it)
rr1 J
Г"
Ш
B[t)
J
+ ,,
—О
с It)
I Наблюдатель
Рис. 5.1. Структура системы управления с обратной связью по выходной переменной.
г
±к>
Ult)
I Объект
1 Оценибатель состояния I
1 Регулятор
Рис. 5.2. Структура системы управления с обратной связью по выходной переменной (рис. 5.1) в более
компактной форме.
СУ с обратной связью по выходной переменной 437
E9)
B(t) F(t) )\ )
Проанализируем теперь свойства устойчивости замкнутой сис-
системы. С этой целью рассмотрим состояние x(t) и ошибку восстанов-
восстановления
e(t) = x(t)—x(t). E.10)'
Вычитая E.6) из уравнения E.3), с помощью E.4) легко уста-
установить, что ошибка e(t) удовлетворяет уравнению
e{t) = [A{t) — K{t)C(t)\e(t). E.11)
Подстановка x(t) = x{t) — e(t) в E.3) и E.7) дает
E.12)
Анализ уравнения E.11) показывает, что ошибка e(t) сходится
к нулю независимо от начального состояния, если можно найти
матрицу коэффициентов усиления K(t), которая делает решение
E.11) асимптотически устойчивым. Однако определение такой мат-
матрицы эквивалентно определению матрицы K(t): при которой наб-
наблюдатель будет асимптотически устойчивым. Из гл. 4 известно, что
такую матрицу во многих случаях можно найти.
Рассмотрим далее уравнение E.12). Если матрицы B(t) и F{t) ог-
ограничены и e(t) -*¦ 0 при t -*- оо, то x(t) всегда сходится к пулю,
если сшстема
x{t) = {A(t)-B(t)F(t)]x(t) E.13)
асимптотически устойчива. Из гл. 3 известно, что матрицу Fit)
часто можно определить таким образом, чтобы уравнение E.13)
было асимптотически устойчиво. Следовательно,обычно существует
возможность определить матрицы F(t) и K(t) таким образом, чтобы
уравнения E.11) и E.12) образовывали асимптотически устойчивую
систему. Так как система E.9) получается из системы, описывае-
описываемой уравнениями E.11) и E.12) путем несингулярного линейного
преобразования, то из этого следует, что обычно можно найти та-
такие матрицы коэффициентов усиления F(t) и K(t), при которых
замкнутая система управления E.9) устойчива. В следующем раз-
разделе определяются точные условия, при которых этого можно
достичь.
Наконец, отметим следующее. Объединяя уравнения E.11)
и E.12), получим
438 Глава 5
x(t)\iA(ty~B(t)F(t) B(t)F(t)
e(t)J \ 0 A(t)-K(t)C(t)
Рассмотрим случай системы с постоянными параметрами, где
все матрицы, входящие в уравнение E.14), постоянны. Тогда ха-
характеристические числа системы E.14), которые также являются
характеристическими числами системы E.9), одновременно пред-
представляют собой нули выражения
, jsl— A + BF —BF
det
V 0 si—A + КС
= det(s/— A +BF)A&t(sI — A + КС). E.15)
Причина, по которой системы E.9) и E.14) имеют одинаковые
характеристические числа, сострит в том, что их соответствующие
векторы состояния связаны несингулярным линейным преобразо-
преобразованием (разд. 1.3). Следовательно, множество характеристических
чисел замкнутой системы образует характеристические числа мат-
матрицы А — BF (полюса регулятора) и характеристические числа
матрицы А — КС (полюса наблюдателя).
Теорема 5.1. Рассмотрим взаимосвязь системы с постоянными
параметрами
x(t) = Ax(t) + Bu(t),
E.16)
y(t)=Cx{t),
наблюдателя с постоянными параметрами
х (t) = Ax (t) -f- Bu (t) + К [у (t) — Cx(t)\ E.17)
и закона управления с постоянной настройкой
¦ U(t)= —Fx{t). . , E.18)
Тогда характеристические числа объединенной системы состоят
из полюсов регулятора (характеристические числа матрицы
А — BF) и полюсов наблюдателя (характеристические числа мат-
матрицы А — КС).
Эти результаты показывают, что можно раздельно рассматри-
рассматривать задачи определения асимптотически устойчивого наблюдателя
и асимптотически устойчивого закона с обратной связью по сос-
тояпию, так как их взаимосвязь приводит к асимптотически устой-
устойчивой системе управления.
СУ с обратной связью по выходной переменной 439
Однако возникает вопрос, можно ли, исходя из соображений,
устойчивости, раздельно производить построение наблюдателя и
закона управления. В разд. 5.3 дана постановка задачи стохасти-
стохастического оптимальнЪго регулирования. Решение этого стохастичес-
стохастического варианта звдачи приводит к утвердительному ответу на толь-
только что поставленный вопрос. . .
Выше рассматривался только наблюдатель полного порядка.
Можно показать, что наблюдатели пониженного порядка, объеди-
объединенные с законами управления с обратной связью по состоянию,
также приводят к полюсам замкнутой системы, которые состоят
из полюсов наблюдателя и полюсов регулятора.
Пример 5.1. Система управления положением
Рассмотрим систему управления положением, описываемую
дифференциальным уравнением состояпия (см. пример 2.1, разд.
2.2.2, и пример 2.4, разд. 2.3)
; О —О.) \ У.
С
у. = 0,787 рад'(В-с2),
E 20)
а = 4,0 с-
Закоп управления
дает характеристический полином регулятора
det (si — Л + BF) = s2 + (о. + */2) s + хД. E.22)
Выбирая значения
/)= 254,1 В/рад,
E.23)
/2= 19,57 (В-с)/рад,
разместим полюса в точках —10 + /10 с. Рассмотрим наблюда-
наблюдатель
i» = (» 1)х@ + (°)И0 +
\ 0 — а/ \ х/
+ ff1l[-']W-(l, 0)x@], E.24)
в котором
¦»](*) = A, 0)а:@ E.25)
440
1
11
->! -F
ПОЛ
Глава 5
Л Восстановленное
\ Фактическое
У ;
рад
||
0,5
t.c
20
.7/7
I
1
-fifl
20 r-
t,c
0,5
Рис. 5.З. Реакция и входная перемен-
переменная в системе управления положени-
положением с наблюдателем при г@)=со]@,1,
0), *@) = со!@,0).
Рис. 5.4. Реакция и входная перемен-
переменная в системе управления положение
ем с обратной связью по состоянию
(без наблюдателя) при x@)=col @,1,
0).
является наблюдаемой переменной. Характеристический полином
наблюдателя имеет вид
det (si — А — КС) = s2 + (а + kt) s + akt + к2.
E.26)
Чтобы повысить быстродействие наблюдателя в сравнении с ре-
регулятором, разместим полюса наблюдателя в точках —50 + /50
с. Это дает следующие коэффициенты усиления:
СУ с обратной связью по выходной переменной
.441
ft, = 95,40 с,
ft, = 43E1 с.
E.27)
На рис. 5.3 показана реакция системы управления с. обратной
связью по выходной переменной на начальное состояние х@) =
= col @,1, 0), х@) = 0. Для сравнения на рис. 5.4 представлена
реакция соответствующей системы с обратной связью по состоя-
состоянию, в которой закон управления E.21) непосредственно связан с
состоянием. Отметим, что в системе с наблюдателем наблюдатель
весьма быстро восстанавливает фактическое поведение состояния.
Однако из-за небольшого запаздывания по времени, вносимого наб-
наблюдателем, требуется большее входное воздействие, а реакция не-
несколько отличается от реакции системы без наблюдателя.
Пример 5.2. Система управления положение^ маятника
В этом примере рассматривается система управления положе-
положением из примера 1.1 (разд. 1.2.3). Дифференциальное уравнение
этой системы имеет вид
E.28)
x(t) =
,0
0
0
?_
V
1
F
М
0 .
0
Компонентами состояния
\
,!(*) = »
12 @ = 1
i,(t) = s
U(t)=>
0
0
0
g
L'
0
0
1
0
являются
@,
¦w.
@-4
@ 4
-Z/cp
^@ +
(')..
@.
0
t
Л/
0
0
.E.29)
Здесь s(t) — перемещение тележки, a ff(i) — угол, который
маятник образует с вертикалью. Предположим, что обе зти вели-
величины можно измерить. В таком случае для наблюдаемой перемен-
переменной получаем
10 0 0'
y(t) =
и
1
V
о
\x(t).
E.30)
442 Глава 5
Основной задачей в рассматриваемой системе управления
является стабилизация положения. Поэтому примем в качестве
управляемой переменной положение маятника
(,(t) = Z3(t) = s(t) + L'<f(t). E.31)
Сначала выберем полюса регулятора, решая задачу регули-
регулирования с использованием критерия
j [С2 (t) + PV-2 @1 At. , E.32)
и
Выберем величину р такой, чтобы оцениваемый радиус со0 для
удаленных полюсов, заданный, как в теореме 3.11 (разд. 3.8.1),
был бы равен 10 с. Тогда время успокоения будет ~10/со0, = 1 с.
Из численных значений примера 1.1 следует, что период колеба-
колебаний маятника составляет 2^У L'lg ca 1,84 с, поэтому выберем
время успокоения несколько меньшим периода колебапий.
Чтобы вычислить р из (о0; необходимо определить передаточную
функцию системы H{s) от входного воздействия \± к управляемой
переменной С. Эта передаточная функция определяется выраже-
выражением
H(s) = : — E.33)
Из C.486) следует
со0 == Ш1Ш>\ E.34)
L p J
При численных значениях из примера 1.1 можно найти, что
необходимо выбрать
р = Ю м2/Н2, E.35)
чтобы получить угловую скорость со0 приближенно равной 10 с.
Можно вычислить, что искомая установившаяся матрица коэффи-
коэффициентов усиления имеет вид
1= C89,0, 26,91, —1389, —282,4), E.36)
а полюса замкнутой системы равны —9,870 + /3,861 и —4,085 +
± /9,329 с. На рис. 5.5 показана реакция системы управления с
обратной связью на начальное состояние s@) = 0, s@) = 0,
<р@) = 0,1 рад (^б0), ф@) = 0. Видно, что входное воздействие
- 1
- I
V
0
V
\
4,
ч.
Рис. 5.5. Реакции систем управления положением маятника с обратной
связью по состоянию и выходной переменной на начальное состояние
х@) = col @, 0, 0,0842, 0) [начальное состояние наблюдателя х@) = 0].
1 — управление с обратной свявью по состоянию; 2 — управление с обратной связью bo
выходной переменной.
444 Глава 5
равно —100 Н, перемещение тележки составляет ~0,3 м, а мак-
максимальное смещение маятника достигает 0,08 м.
Предполагая, что эти характеристики приемлемы, перейдем
теперь к определению наблюдателя для системы. Поскольку име-
имеются две наблюдаемые переменные, для реализации заданного раз-
размещения полюсов наблюдателя матрицу коэффициентов усиле-
усиления наблюдателя можно выбирать более или менее произвольно.
Чтобы унростить задачу, введем ограничение, состоящее в том,
что первая компонента наблюдаемой переменной (перемещение)
используется только для восстановления состояния тележки
(т. е. Ei и |2), а вторая компонента наблюдаемой переменной —
для восстановления движения маятника (т. е. |3 и %,*)¦ Таким об-
образом, принимается следующая структура наблюдателя:
0
0
0
g
0
0
1
0
л
x (t) -f
0
1
M
0
0
y{t)-\
1 0 0 0\Л I
± о -1_ о И0
L' U ) J
Здесь необходимо определить коэффициенты усиления кг,
E3
E.37)
k3 и
р г v 3
ki. Легко найти, что при структуре E.37) характеристический поли-
полином наблюдателя определяется выражением
Видно, что одна пара полюсов определяет скорость восстанов-
восстановления движения тележки, а другая — маятника. Выберем теперь
коэффициенты ftx и к± таким образом, чтобы обе пары полюсов
находились от начала координат несколько дальше полюсов регу-
регулятора, полученных выше. Однако выбирать полюса наблюдателя
очень удаленными нецелесообразно, так как получающиеся при
этом большие коэффициенты усиления наблюдателя значительно
затрудняют их реализацию без существенного улучшения характе-
характеристик системы управления. Таким образом, выбираем обе пары
полюсов наблюдателя равными
Расстояние от этих полюсов до начала' координат составляет
СУ с обратной связью по выходной переменной 445
оО с. При численных значениях из примера 1.1 можно найти,
что для реализации этих полюсов наблюдателя необходимо вы-
выбрать
kt = 41,4, ks = 35,6,
E.39)
к2 = 859, kt = 767.
На рис. 5.5 также показаны характеристики объединенной
системы, включающей наблюдатель, закон управления и систему
управления положением маятника, в одних и тех же начальных
условиях, как и ранее, прих(О) =0. Оценка s(t) перемещения тележ-
тележки на рисунке не показана, так как совпадает с фактическим пере-
перемещением тележки с самого начала благодаря особому выбору на-
чальных условий. Видно, что оценка s + L'ty перемещения маят-
маятника s + L'cp весьма быстро совмещается с точной величиной.
Тем не менее из-за небольшого запаздывания во времени в процессе
восстановления движение системы балансирования маятника с
обратной связью по выходной переменной является более искажен-
искаженным, чем в случае обратной связи по состоянию. С точки зрения
практики эта система управления может оказаться неприемлемой,
так как рассматриваемое движение сильно искажено и система
ныходит из диапазона, в котором справедлива линеаризация;
весьма возможно, что маятник будет опрокидываться. Решение
можно искать в уменьшении р с целью демпфирования движения
системы. Альтернативное решение состоит в увеличении быстро-
быстродействия наблюдателя, однако это может вызвать трудности, свя-
связанные с шумом в системе.
5.2.2. УСЛОВИЯ РАЗМЕЩЕНИЯ ПОЛЮСОВ
И СТАБИЛИЗАЦИЯ СИСТЕМЫ УПРАВЛЕНИЯ
С ОБРАТНОЙ СВЯЗЬЮ ПО ВЫХОДНОЙ ПЕРЕМЕННОЙ
В этом разделе устанавливаются точные условия для системы,
описываемой уравнениями E.3) и E.4), при которых существует
наблюдатель E.6) и закон управления E.7), делающий замкнутую
систему управления E.9) асимптотически устойчивой [83, 142].
Теорема 5.2. Рассмотрим объединение системы
x{t) = A (t) x{t) + B (t) u (t),
E.40)
y(t) =C(t)x(t),
наблюдателя
A. л г ¦ л I
x (t) = A(t)x(t) + B(t)u(t) + K(t)\ij(t)-C(t)x(t)\ E.41)
446 Глава 5
и закона управления
¦ u{t)= -F(t)x(t). E.42)
Т огда^дос^шшчН^^словтш^существования матриц коэффициентов
усиления K(t) и F(t), t >¦ t0, при которых объединенная система
экспоненциально устойчива, состоят в том, что система E.40)
должна быть равномерно полностью управляемой и равномерно
полностью восстанавливаемой или что система должна быть экс-
экспоненциально устойчивой. В случае системы с постоянными пара-
параметрами [т. е. когда все матрицы, входящие в выражения E.40)—
E.42), являются постоянными] необходимые и достаточные усло-
условия существования матриц стабилизирующих коэффициентов
усиления К и F состоят в том, что система E.40) должна быть
одновременно стабилизируемой и обнаруживаемой. В случае систе-
системы с постоянными параметрами необходимые и достаточные усло-
условия для произвольного распределения полюсов регулятора и наблю-
наблюдателя (с ограничением, что комплексные полюса должны' состав-
составлять комплексно-сопряженные пары) заключаются в том, что
система должна быть полностью управляемой и полностью восста-
восстанавливаемой.
Доказательство этой теоремы основано на теоремах 3.1 (разд.
3.2.2), 3.2 (разд. 3.2.2), 3.6 (разд. 3.4.2), 4.3 (разд. 4.2.2). 4.4 (разд.
4.2.2) и 4.10 (разд. 4.4.3).
5J3. Оптимальные линейные регуляторы
при неполных измерениях,
содержащих шум
5.3.1. ПОСТАНОВКА ЗАДАЧИ И РЕШЕНИЕ
В этом разделе рассматривается задача оптимального линейного
регулирования, когда наблюдения системы являются неполными и
неточными, т. е. когда измерить полный вектор состояния нельзя,
а доступные измерения содержат шум. Кроме того, предполагает-
предполагается, что на систему действуют случайно изменяющиеся возмущения.
Точная постановка этой задачи следующая.
Определение 5.1. Рассмотрим систему
x{t) = A (t)x(t) +B(t)u (t) + и?, (t), t > t0,
E.43)
где x0 — стохастический вектор со средним значением xQ и матри-
СУ с обратной связью по выходной переменной 447
цей дисперсий Qo. Наблюдаемая переменная описывается выражени-
выражением
у (t) = C.(t)x(t) -\-w2{t), t :> t0. E.44)
Совместный случайный процесс col {iu\-, ц?.г) является белым шу-
шумом с интенсивностью
/МО vlt(t)\
т \ > t > to- E.45)
\VTl2(t) V2(t) )
Управляемую переменную можно представить в виде
z{t) = D(t)x(t), t>-t0. E.46)
Тогда задача стохастического линейного оптималь-
оптимального регулирования с обратной связью по выходной
переменной является задачей нахождения такого функционала
и (О = f \У (т). to*? х *? t], t0 < t <: tu E.47)
при котором критерий
а = Е J j [ zT (t) R3 (t) z (t) + uT (t) R, (t) и (t)] dt + xT (t1)P)xl(t)\ E.48)
достигает минимума. Здесь R3(t), i?2@ u Pi — симметрические ¦
весовые матрицы, такие, что R2(t) > О, Rs(t) > О, t0 <: t <
< ty и Рх > О.
Решение этой задачи, как и ожидалось, является комбинацией
решений задачи стохастического оптимального регулирования из
гл. 3 (теорема 3.9, разд. 3.6.3) и задачи оптимального восстанов-
восстановления из гл. 4. Этот результат известен как принцип разделения
и устанавливается в следующей теореме.
Теорема 5.3. Оптимальное линейное решение задачи стохастичес-
стохастического линейного оптимального регулирования с обратной связью
по выходной переменной является точно таким же, как и решение
соответствующей задачи стохастического оптимального регулиро-
регулирования с обратной связью по состоянию (теорема 3.9, разд. 3.6.3^ за
тем исключением, что в законе управления состояния x(t) заменя-
л
стся на линейную оценку x(t) no минимуму среднего значения квад-
квадрата ошибки, т. е. входная переменная выбирается в виде
u(t) = — F°{t)x(t), E.49)
где FQ(t) — матрица коэффициентов усиления, определяемая вы-
выражением C.344), a x(t) — выходная переменная оптимального
448 Глава 5
наблюдателя, построенного в разд. 4.3.2 — 4.3.4, для несингуляр-
несингулярного некоррелированного, несингулярного коррелированного и сингу-
сингулярного случаев соответственно.
Доказательство этой теоремы в общих чертах для несингуляр-
несингулярного случая с некоррелированными шумами дано в разд. 5.3.3.
Отметим, что решение, как указывалось, является наилучшим ли-
линейным решением. Можно доказать [60, 102, 103, 186, 188], что
если процессы wx и w.z являются гауссовскими шумами и начальное
состояние х0 является гауссовским процессом, то оптимальное
линейное решение является оптимальным решением (без ограниче-
ограничений).
Ограничиваясь случаем, когда задача оценки является несин-
несингулярной, а шум, возбуждающий состояние, и шум наблюдений
не коррелированы, запишем более подробно решение задачи сто-
стохастического линейного регулирования с обратной связью по цы-
ходной переменной. Для входной переменной имеем
u(t)=—F°(t)x{t), E.50)
где
F° (t) = R~l {t)BT{t)P{t). E.51)
Здесь P(t) — решение уравнения Риккати
- Р (t) = DT (t) R3 (t) D(t)~P (t) В (t) R-1 (t) BT (t) P (t) +
+ AT(t)P(t) + P(t)A(t),
P(td = Pi- E-52)
Оценка x(t) получается как решение уравнения
^ Л Г Л 1
х @ = А @ х (t) + В (t) и @ + К" (t) [у (t) —C(t)x (t)\ ,
E.53)
л _
х ('о/ = хо>
где
T(t)V~'(t). E.54)
Матрица дисперсий Q(t) является решением уравнения Риккати
Q (t) = V, @ - Q (t) CT (t) У'1 (t) С (t) Q(t) + A (t) Q(t) + Q (t) AT(t),
E.55)
Q
На рис. 5.6 Приведена блок-схема этой стохастической опти-
оптимальной системы управления с обратной связью по выходной
переменной.
\
I Р.егулятор
Рис. 5.6. Оптимальный линейный регулятор при неполных измерениях, содержащих шум.
450 Глава 5
5.3.2. ОЦЕНКА ХАРАКТЕРИСТИК
ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ С ОБРАТНОЙ СВЯЗЬЮ
по выходной переменной
Продолжим анализ характеристик оптимальных систем управ-
управления с обратной связью по выходной переменной, все еще огра-
ограничиваясь несингулярным случаем с некоррелированными шумом,
возбуждающим состоянием, и шумом наблюдений. Объединение
системы E.43), оптимального наблюдателя E.53) и закона управ-
управления E.50) образует систему размерности 2/г, где п —размерность
состояния х. Определим, как и раньше, ошибку восстановления
л
e(t) = x(t)—x(t). E.56)
Легко найти из уравнений E.43), E.50) и E.53), что расширенный
вектор col [e(t), x(t)] удовлетворяет дифференциальному уравне-
уравнению
' A(t)~K°(t)C(t) 0
,K°{t)C(t) A(t)-B(i)F«{t)J
E.57)
,0 K°\t) J \w2(t)
с начальным условием
л('°М=( *<'»_!_-М. E.58)
x(to)J \ х0 J
л
Причина, по которой рассматривается col (e, х), состоит в том,
что, как ото будет показано, матрицу дисперсий для этого расши-
расширенного вектора относительно легко определить. Из этой матрицы
дисперсий затем можно определить все интересующие средние
значения квадратов величин. Обозначим матрицу дисперсий col
л
[e(t), x(t)\ через
[(e(t) — E{e(t)} \( - ' гл -гл пг\1
Е л л | ){le(t)-E{e{t)}]T, [x{t)-E {x(t))\ j =
\\x(t)-E\x(t)f J j
" |. ¦ E.59)
Q Q It) I
Дифференциальные уравнения для матриц Qn, Qlz и Qi2 можно
получить, используя теорему 1.52 (разд. 1.11.2). Нетрудно уста-
установить, что матрицы удовлетворяют уравнениям
СУ с обратной связью по выходной переменной 4Г>1
<?п(О = U (t)-K°(t)С(*)] Qu(t) + Qu (t)[A (t) - Ко (t)C(t)]T +
0T(
K°(t)V2(t)K0T(t),
(t) + Qi2(t)lA(t)-B(
[A(t)~K°(t)C(t)]Qi2(t)-K°(t)V,(t)K0T(t), E.60)
+ K«{t)C (t)Qn(t) + [A{f) -B (t)F°(t)]QM(t) + K" (t)V2(t) K0T (t)
с начальными условиями
'<?н('о) = <?о. QM = 0, Q22(i0) = 0. E.61)
Рассматривая эти уравнения, легко заметить, что
Таким образом, в дифференциальном уравнении для матрицы
Ql2{t) члены Qu{t)CT (t)K0T{t) и — К°^)У.^)К0Т^) уничтожаются,
так как K°(t) = iQ(t)CT (t)V2~1(t). Оставшаяся часть уравнения для
Quit) является однородным дифференциальным уравнением с на-
начальным условием Qn{t-o) = 0, которое имеет решение
<?н@ = °. <>*о- " E-63)
^^ОчевЕщно, e{t) и x{t) являются некоррелированными стохасти:
ческими процессами. Вот почему используется совместный про-
процесс col (e, х). Отметим, что процессы e(t) и х (t) некоррелированы
независимо от того, как выбрано входное воздействие в объекте.
Это объясняется тем, что поведение ошибки восстановления е не
зависит от входного воздействия, а влияние входной переменной
Л ь
"(T)i ^о <С т ^ на восстановленное состояние x{t) характери-
характеризуется известной величиной, которая вычитается с целью вычисле-
л
ния ковариации процессов e(t) и j(t). Используем этот факт при
доказательстве принципа разделения в разд. 5.3.3.
Дифференциальное уравнение для матрицы Q.2.,(t) теперь сво-
сводится к виду
QM(t)=lA(t)-B(t)F°(t)\Qtt(t) + Qtt{t)[A(t) - B(t)F°(t)f +
+ K°(t)V2(t)K0T(t) E.64)
с начальным условием
Си @ = 0. E.65)
После того как матрица Q22,(t) вычислена, становится известной
452 Глава 5
матрица дисперсий совместного процесса col (e, х), и.можно по-
получить все интересующие пас средние или интегральные средние
значения квадратов величин, так как
x(t) = e(t) + x(t). E.66)
Таким образом, можно вычислить среднее значение квадрата ошиб-
ошибки регулирования
Е { zT (t) We(t) z @) = E {xT (t) DT (t) We (t) D (t) x(t)) =
= \,i[DT(t)We(t)D(t)E{x(t)xT(t))] =
= lT{DT(t)We(t)D(t)[I(t)HT(t) + Qu(t) + Qti(t)]\ , E.67)
где We(t) — весовая матрица, a x(t) — среднее значение x(t).
Аналогично можно вычислить среднее значение квадрата входной
неременной:
E{uT(t)Wu(t)u(t))=E{xT(t)F0T(t)Wu(t)F°(t)x(t) =
= lT[F°T(t)Wu(t)F°(t)E{x(t)xT(t)}\^ ¦ . '
= tr [F°T(t) Wu (t)F° (t) [x (t) xT(t) + Qaa(t)]\ , E.68)
где Wu(t) — весовая матрица для среднего значения квадрата
входной переменной.
Из этого следует, что для вычисления оптимальной матрицы
F°(t) коэффициентов усиления оптимального регулятора, матрицы
коэффициентов усиления K°(t) оптимального фильтра, среднего
значения квадрата ошибки регулирования и среднего значения
квадрата величины входной переменной необходимо решить три
п' X /г-матричных дифференциальных уравнения: уравнение Рик-
Риккати E.52), чтобы получить матрицу P(t) и затем F°(t); уравнение
Риккати E.55), чтобы определить матрицу Q(t) и затем K°(t); на-
наконец, линейное матричное дифференциальное уравнение E.64),
чтобы получить матрицу дисперсии Q.22(t) для x(t). В следующей
теореме, однако, устанавливается, что если среднее значение
квадрата ошибки регулирования и среднее значение квадрата
входной переменной можно не разделять, а требуется лишь мини-
минимизировать величину критерия а, заданного выражением E.48),
то необходимо решить только основные уравнения Риккати для
матриц P(t) и Q(t).
Теорема 5.4. Рассмотрим стохастическую задачу регулирова-
регулирования в соответствии с определением 5.1. Предположим, что
V2(t)>0,. Vi2{t)^- 0 при всех t. E.69)
СУ с. обратн'ой связью по выходной переменной 453
Тогда справедливо следующее:
а) Все интересующие нас средние значения квадратов величин
можно определить из матрицы дисперсий diag [Q(t), Q^t)] для
col[e(i), x(t)\, где e{t) = x{t) — x(t), Q(t) — матрица дисперсий
eft), а матрицу Qi2 (t) можно получить как решение матричного
дифференциального уравнения
+ K\t) V2(t)K0T (t), t > t0. E.70)
б) Минимальную величину критерия E.48) можно выразить в
•двух следующих возможных формах:
[и
} E.71)
и
<Р = ~хТ0 P(t0) х0 + tr JP (^0) <?0 + f' [P (t) Vt (t) +
+ Q(t)F0T(t)R2(t)F°(t)]dt}. E.72)
Здесь
Л1(«) = /)г(*)Л.(О^@. E-73)
a P(t) и Q(t) — решения уравнений Риккагпи E.52) и E.55) соот-
соответственно.
в) Кроме того, если уравнения Риккати для оптимального наб-
наблюдателя и регулятора имеют установившиеся решения Q(t) и
P(t) при t0 —>¦ —оо и t1 —*¦ оэ соответственно, то осредненный по
времени критерий
Ъ = и1}™„ ^ E\f[zT(t)Ra (t) z (t) + uT (t) Д2 @ и (t)]dt\, E.74)
если он существует, может быть выражен в альтернативных фор-
формах
to
U
tr ( f tТОF>.@ + ^@ JT(О
454 Глава 5
Здесь K(t) и F(t) — коэффициенты, соответствующие уста-
установившимся решениям Q(t) и P(t).
, . г) Наконец, в случае постоянных параметров, где Q(t) и
Р (t) и, таким образом, также F(t) и K(t) являются постоян-
постоянными матрицами, справедливы следующие выражения:
~o = E{Zz(t)R3z(t)+uT(t)R2u(t)} = tv[PKV2KT + (ЗД E.77а)
~o^lr[~PVi + QFTRiF]. E.776)
Эту теорему можно доказать следующим образом. Полагая
Wu(t) = R2(t) и We(t) = R3(t) в выражениях • E.67) и E.68), за-
запишем критерий E.48) в виде
({zT(t)R3(t)z(ty+uT(t)R2(t)u(t)]dt+xT(ti)Pix(ti)} =
h _ _ _ _ _
= [ [zT(t)Ra(t)z(t)+uT(t)R2(t)u(t)]dt +xT(tl)Pl_z(ti)
и
2(tM- E.78)
Рассмотрим отдельно выражение
U^ + P&^tjV E.79)
где, как известно, Qi2 (t) является решением матричного дифферен-
дифференциального уравнения
Qn{t)=lA{t)-B(t)F°(t)]Qn(t)-\-Qn(t)[A(t)-B(t)F°{t))T
+ K°(t)V2(t)K0T(t),
E.80)
Нетрудно показать (задача 5.5), что выражение E.79) можно
записать в форме
trj j S(t)K°(t)V2(t)K0T(t)dt\, E.81)
где S(t) ¦— решение матричного дифференциального уравнения
СУ с обратной связью по выходной переменной 455
E.82)
= л.
Очевидно, что решением этого дифференциального уравнения
является
S(t) = P(t), t^tv E.83)
Объединяя эти результаты и учитывая, что первые два члена
правой части выражения E.78) можно заменить на 3.1 V(tQ)xu,
получим из E.78) выражение E.71).
Выражение E.72) для критерия можно получить, подставляя
выражение
Ri{t) = P(t)B(t)R-x(t)BT{t)P{t)-AT(t)P(t)-
— P(t)A(t)-P(t) E.84)
в E.71) и интегрируя по частям. Доказательства частей (в) и (г)
теоремы 5.4 следуют из выражепий E.71) и E.72), если положить
t0 -> —оо и ([ ->¦ оо.
конечно, в любой практической ситуации, когда интервал
tx — t0 велик, следует использовать установившиеся матрицы ко-
коэффициентов усиления K(t) и F(t), даже если интервал tx—ta
не является бесконечным. В частности, так поступают в
случае системы с постоянными параметрами, когда матрицы К и
F постоянны. Из теории оптимального регулирования и наблюде-
наблюдения с учетом результатов разд. 5.2 известно, что установившаяся
система управления с обратной связью по выходной переменной
асимптотически устойчива всегда, когда соответствующие регуля-
регулятор с обратной связью по состоянию и наблюдатель асимптотичес-
асимптотически устойчивы.
Перед тем как завершить этот раздел примером, сделаем два за-
замечания. Во-первых, заметим, что в установившемся случае с пос- .
тояшшмипараметрами выражения E.77а), E.776) имеют следую-
следующие нижние границы:
lim a> ti (QRi), E.85a)
lim a >tr(F^1). E.856)
v, -> о
Эти неравенства можно интерпретировать следующим обра-
образом. Даже если совсем не взвешивать входную переменную и и,
таким образом, не ограничивать ее амплитуду, то критерий а
456 Глава 5
все равно не может быть меньше, чем tr (QRi), в соответствии с
выражением E.85а). Эта минимальная составляющая критерия
обусловлена неизбежной неточностью восстановления состояния.
Аналогично, даже когда отсутствует шум измерений, т. е. F2 при-
приближается к нулю, критерий а не может быть меньше, чем tr (PVi).
Такой результат не удивителен, так как эта величина точно явля-
является величиной критерия для стохастического регулятора с обрат-
пой связью по состоянию (см. теорему 3.9, разд. 3.G.3).
Второе замечание касается размещения полюсов системы
управления в установившемся случае с постоянными параметрами.
Из разд. 5.2 следует, что полюса системы управления состоят из
полюсов регулятора и полюсов наблюдателя. Хороший практичес-
практический подход, по-видимому, заключается в том, что весовые матрицы
R2 и Vz пеобходимо выбирать таким образом, чтобы полюса регу-
регулятора и полюса наблюдателя находились на расстоянии от начала
координат приблизительно одного порядка. По-видимому, неэко-
неэкономично иметь регулирование с очень высоким быстродействием,
когда процесс восстановления является медленным, и наоборот.
В частности, когда шум наблюдений значительно больше шума,
возбуждающего состояние, полюса наблюдателя относительно
близки к началу координат и процесс восстановления является
медленным. Если теперь сделать быстродействие регулятора не-
несколько большим, чем у наблюдателя, то следует ожидать, что
регулятор будет сдерживаться наблюдателем. Дальнейшее увели-
увеличение быстродействия регулятора будет лишь увеличивать сред-
среднее значение квадрата входной переменной без уменьшения сред-
среднего значения квадрата ошибки регулирования. С другой стороны,
когда шум наблюдений весьма мал, ограничивающим фактором в
системе становится допустимое среднее значение квадрата входной
переменной. Тем самым ограничивается быстродействие регулято-
регулятора и становится нецелесообразным выбор наблюдателя с очень
большим быстродействием, даже если характеристики шума до-
допускают это.
Пример 5.3. Система управления положением
Рассмотрим систему управления положением, описанную во
многих предыдущих примерах. Дифференциальное уравнение
состояния имеет вид
(°n i)x(t) + (°\v-{t). E.86)
0 —а/ \ х/
Здесь x(t) = col[ |,(?), ?2(OI> ii@ — угловое положение, |2@
угловая скорость сиетемы. Входной переменной и,(?) является вход-
входное напряжение.
СУ с обратной связью по выходной переменной 457
Управляемой переменной является положение, описываемое
уравнением
С@=A, 0)х{1). E.87)
В примере 3.8 (разд. 3.4.1). решена детерминированная задача
построения регулятора с критерием
@1 <#• E.88)
f [С*
При численных значениях
х = 0,787 рад/(В-с2),
а=4,6сЛ E.89)
р = 0,00002 Рад2/В2
найдем установившуюся матрицу коэффициентов усиления обрат-
обратной связи /
F = B23,6 18,69). E.90)
Установившееся решение уравнения Риккати для регулятора
определяется выражением
-р ( 0,1098 0,005682 \
10,005682 0,0004753 )'
Полюса замкнутого регулятора равны —9,66 ± /9,09 с.
И-з рис. 3.9 (разд. 3.4.1) следует, что время переходного процесса
системы составляет ~-0,3 с, тогда как начальное отклонение по
положению 0,1 рад вызывает входное напряжение с пиковым зна-
значением 25 В.
В примере 4.4 (разд. 4.3.2) предполагалось, что система возму-
возмущается внешним моментом на валут^)- Тогда дифференциальное
уравнение состояния преобразуется к виду
СУА1)' E-92)
где 1/у — момент инерции вращающихся частей. Кроме того,
предполагается, что наблюдаемая переменная описывается выра-
выражением
7i@ = (I, O)*(O + vm(f), E.93)
где vm(t) — шум наблюдений. В этом выражении полагается,
что угловое перемещение доступно измерению. Считая, что td(t)
458 Глава 5
и vm(?) адекватно представляются в виде некоррелированных белых
шумов с интенсивностями
Frf= 10 Н2 ¦ м2- с E,94)
Vm = 10-' рад2 • с, E.95)
соответственно, находим для примера 4.4, что при у = 0,1 кг-1х
хм установившийся оптимальный наблюдатель описывается
уравнением
— a) \ •/¦!
где установившаяся матрица коэффициентов усиления равна
/ 40,36
I 814,3
Полюса наблюдателя равны —22,48 + /22,24 с, а установив-
установившаяся матрица дисперсий имеет вид
-г /0,04036 • 10-* ' 0,8143 • Ю-4 \
(о-, о I- E-97>
E.98)
\ 0,8143 • 10 36,61 • 10-* 1
При
_ л
установившийся оптимальный регулятор с обратной связью по
выходной переменной описывается уравнениями
i (*) = (!! i)x(t) -(°)Fx(t) +K\rt(t)~(l, 0)x(t)\,
\ 0 — a/ U/
E.100)
_ л
Из этого следует
= 0,00009080 рад2. E.101)
Теиерь можно найти границы для среднеквадратическои ошиб-
ошибки слежения и среднеквадратическои величины входного напря-
напряжения
lim YE{;2@}<1 ^0,00009080 ~ 0,0095 рад, E.102а)
СУ с обратной связью по выходной переменной
459
lim E{py.2{t)}< 0,00009080 рад2,
так что
lim
E.1026)
E.103)
Точные значения установившихся среднеквадратической ошиб-
ошибки слежения и среднеквадратического входного напряжения пе-
обходимо получить путем определения установившейся матрицы
дисперсий расширенного вектора состояния collx(t), x(t)\. Как
подчеркивалось выше в настоящем разделе, это более эффективно
достигается путем предварительного вычисления установившейся
матрицы дисперсий diag {Qu, Q22) Для с°1 Ie(^)» x(t)], для чего тре-
требуется только решить дополнительные 2 X 2-линейные матричные
уравнения. Можно найти, что установившаяся матрица дисперсий
П для co\[x(t), x{t)\ определяется выражением
1Г =
0,00004562 0
0 . 0,006119
0,00004158 —0,00008145 0,00004158 —0,00008145 Г
, — 0,00008145 0,002458 —0,00008145 0,002458 '
E.104)
Тогда установившееся значение среднего квадрата ошибки
слежения равно
0,00004158 — 0,00008145\
— 0,00008145- 0,002458 \
lim
to ->— 00
A, 0, 0, 0)"
= 0,00004562 рад2
E.105)
и среднеквадратическая ошибка равна ] 0,00004562 ~ 0,00674
рад. Видно, что это несколько меньше, чем граничное значение
E.102а). Аналогично получим для среднего значения квадрата
входного напряжения
lim Е {;х2 (t)} = tr Г-lf (' °..* ) @, F) I = 2,258 В2, E.106)
/.-*-оо I \F / J
а средпеквадратическая величина входного напряжения составит
~1,5 В. Конечно, это зависит от того, будут ли приемлемы эти
параметры.
4(Ю Глава 5
Заметим, что полюса регулятора (—9,66 ± /9,09) и полюса
наблюдателя (—22,48 ± /22,24) имеют один порядок, что благо-
благоприятно. Если, например, полюса наблюдателя сильно удалены от
полюсов регулятора, то можно приблизить полюса наблюдателя к
началу координат без существенного ухудшения характеристик.
5.3.3*. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА РАЗДЕЛЕНИЯ
Ниже будет доказан принцип разделения, сформулированный"
в теореме 5.3 для несингулярного некоррелированного случая,
т. е. когда предполагается, что интенсивность Vz(t) шума наблю-
наблюдений является положительно определенной и V^t) = 0 на ин-
интервале [t0, tj. Относительно просто доказать, что данное решение-
является наилучшим линейным решением задачи построения сто-
стохастического линейного регулятора с обратной связью по выходной
переменной. Обозначая
Rl(t) = DT(t)R3(t)D(t), E.107)
напишем
Е [ / (t) R3 (t) z (t)] = E [xT{t) Ri (l) x (*)] = E \[x (t) — x(t) +
AT Г /\ ' Л II (Г
+ x(t) Ri(t)[x_{t) — x{t) +x(t)\{ = E\\x(l) —
Г Л 11 (Г Л ]Г Л 1
Rl(t)[x(t)-x(t)\\+2E\[x(t)-x(t)\Rl(t)X(t)) +
+ E{xr(t)Ri(t)x(t)} . E.108)
T
Здесь x(t) — линейная оценка x.(t) с минимальным средним
значением квадрата ошибки, использующая г/(т) и к(т), t0 ^ x <^f.
Из теории оптимального наблюдения известно, что
E{[x{t)-x(t)YRtWlxW-xit)]} ^.trlRMQit)], E.109)
— матрица дисперсии ошибки восстаповления x(t) — x(t).
Кроме того,
(Г л \г л 1
E\[x{t) — x(t)\ Rx{t)x{t)\ =
= tr\E \\x(t)~x(t)\xT(t)} Ri(t)] = O, E.110)
так как из разд. 5.3.2 следует, что величины e(t) — x{t) — x(t)
и x(t) нскоррелированы.
СУ с обратной связью по выходной переменной 461
Таким образом, можно написать
Е {xT(t)Ri(t)x(t))
E.111)
Е {хт (*,) PiX (*,)} = tr [P,Q (*,)] + E \xT (*x) рД (*,)} .
Используя соотношение E.111), напишем для критерия E.48)
Е ( ( [xT(t) Д, (t) x if) + uT (t) R% (t) и (t)} dt + xT (tt) P, x (tj j +
I to )
+ tr I f Д, @ Q (t) dt + P{Q (*,) 1. E.112)
и
Заметим, что два последних члена в этом выражении не зависят от
управления на входе системы. Кроме того, из теории оптималь-
оптимального наблюдения известно, что можпо написать (так как по пред-
предположению задача восстановления является несингулярной)
x(t) = A(t)x(t)+B(t)u(t) 4-Я°@к@ —?(')*(')] . E.113)
где K°(t) — оптимальная матрица усиления. Однако в разд. 4.3.6
• . л ¦ - ¦
было установлено, что процесс обновления y(t) — C(t)x(t) является
белым шумом с интенсивностью V2(t). Тогда задача минимизации
л
критерия E.112), в которой x(t) описывается уравнением E.113),
является задачей стохастического линейного регулирования, где
можпо наблюдать полный вектор состояния, как описывалось в
разд. 3.6.1. Из теоремы 3.9 следует, что оптимальным линейным
решением задачи построения стохастического регулятора с обрат-
обратной связью по состоянию является линейный закон управления
_'u(t) = —F°(i)x(t), E.114)
где F°(t) определяется выражением E.51).
Тем самым завершается доказательство теоремы 5.3 для слу-
случая, когда задача восстановления является несингулярной, а
шум, возбуждающий состояние в системе, и шум наблюдений не-
коррелированы. Доказательство можно распространить на слу-
случай сингулярной задачи с коррелированными шумами.
4(J2 Глава 5
Л.4. Линейные оптимальные следящие
системы с пеполными
и неточными измерениями
В разд. 3.6.2 были рассмотрены задачи слежения как специ-
специальные случаи стохастических задач регулирования с обратной
связью по состоянию. В связи с этим были определены законы уп-
управления, для которых требуется, чтобы было известно состояние
объекта и состояние эталонной переменной. В этом разделе рассмат-
рассматривается аналогичная задача, в которой, однако, полагается, что
можно измерить только некоторые линейные комбинации компо-
компонент состояния, которые к тому же засорены аддитивным шумом.
Кроме того, полагается, что можно измерить только саму эталон-
эталонную переменную, также возмущаемую белым шумом.
Таким образом, принимается следующая модель для эталонной
переменной zr(t):
zr(t) = Dr{t)xr{t), E.115)
где
xr(t) = Ar(t)xr(t)±wri(t). E.И6)
Vri(t).
E.117)
В этой выражении wri — белый шум с интенсивностью Vri(t).
Кроме того, полагается, что наблюдается переменная
Здесь wr2 — белый шум с интенсивностью Vr2(t).
Управляемая система описывается дифференциальным урав-
уравнением состояния
где ivt — белый шум с интенсивностью Vi(t). Система имеет управ-
управляемую переменную
z(t) = D(t)x{t)- . E.119)
и наблюдаемую переменную
(t) + w2(t). E.120)
Здесь w2 — белый шум с интенсивностью V2(t). Предполага-
Предполагается, что VrZ(t) > 0, V2(t) > О, Ц < t < tt.
Чтобы получить задачу оптимизации, рассмотрим критерий
г и ¦
Е\ \ [2@ — Zr(«)l Д«@[2@ -2,@1 +
+ иг@Да@и@1Л} • E.121)
СУ с обратной связью по выходной переменной 463
Здесь R3(t) > 0, /?2@ > О, t0 <; t <^ tt. Первый член подын-
подынтегральной функции оказывает воздействие па управляемую пере-
переменную z(t), позволяя отслеживать эталонную переменную zr(t),
тогда как второй член ограничивает амплитудьг входной перемен-
переменной.
Теперь сформулируем задачу стохастического оптимального
слежения при неполных и неточных наблюдениях в следующем
виде.
Определение 5.2. Рассмотрим систему
x(t) = A (t) x (t) + В (t) и (t) + Wi(t), t>t0, E.122)
где x(t0) — стохастическая переменная со средним значением х0,
и матрицей дисперсий Qo, wt — белый шум с интенсивностью
Vift). Управляемой переменной является
z(t) = D(t)x(t), E.123)
а наблюдаемая переменная определяется выражением
y(t) = C(t)x(t) + wt(t), • E.124)
где w2 — белый шум с интенсивностью V2ft), где V2(t) > О, /o <t
<^ t -^ t{. Рассмотрим также эталонную переменную
zr(t) = Dr(t)xr(t), E.125)
где
x,(t) = A,(t)x,(t) + wri(t), t>t0. E.126)
Здесь xr(ta) — стохастическая переменная со средним значе-
значением хг0 и матрицей дисперсий Qr0, wri — белый шум с интенсив-
интенсивностью Vri(t). Наблюдаемая переменная для процесса хг описыва-
описывается выражением
yr(t) = C,(t)x,{t)-i-wra(t), E.127)
где wr2 —• белый шум с интенсивностью Vr2(t) > 0, t0 ^ t <^ t{.
Тогда задача оптимального Линейпого слежения при
неполных и неточных наблюдениях является задачей
выбора входной переменной для системы E.122) в функции у(х)
и уГ(х), t0 -^ ¦: <; t таким образом, чтобы критерий
Е I ( [[z (t) -z, (t)\T R3 (t) [z @ - zr (t)\ + uT @ R2 @ и (t)]dt\ E.128)
1 и . ¦ i
достигал минимума, где Rs(t) > 0 и R2(t) > 0 при t0 ^ t ^
< h.
Чтобы решить задачу, объединим эталонную модель и объект
464 Глава 5
в расширенную систему. Используя компоненты расширенного
состояния x{t) = -zo\[x{t), xr(t)], напишем
A(t) ° )x(t) + (B^)u(t) + (w^). E.129)
0 Ar(t)j w 4 О У У> \wrl(t)l K
Наблюдаемой переменной в расширенной системе является
W 0
yr(t)l { 0 Cr{t)l K'^\w(t)J
Напишем в качестве критерия
Е j j' [ ~хт (О S7" (О Л3@ 3 @ z@ + ит (t) R2{t) и (t)} dt\ , E.131)
где
D(t) = [D(t), -Dr(t)\. E.132)
Задача слежения теперь представлена в форме стандартной
стохастической задачи регулирования и может быть решена путем
использования теоремы 5.3. Из этого следует, что можно написать
Если принять, что все белые шумы и начальные величины, свя-
связанные с объектом и эталонным процессом, некоррелированы, то
можно построить два отдельных наблюдателя: один — для сос-
состояния объекта, а другой — для состояния эталонного процесса.
Кроме того, из разд. 3.6.3 известно, что вследствие специальной
структуры задачи слежения можно написать
. ^@ ==[/¦,(*), -Ft(t)], С5'134)
где разделение согласуется с другими разделениями, а матрица
коэффициентов усиления обратной связи Ft(t) не зависит от свойств
.эталонного процесса.
На рис. 5.7 представлена блок-схема оптимальной следящей
системы в предположении, что можно использовать два отдельных
наблюдателя. Видно, что контур обратной связи совершенно не
зависит от свойств эталонной переменной.
Завершим этот раздел анализом передаточной матрицы T(s)
системы с постоянными параметрами в установившемся состоянии.
Простой способ определения этой матрицы состоит в следующем.
Положим х@) = х@) = 0 и допустим, что в системе отсуствуют
СУ с обратной связью по выходной переменной
465
Г "^
У^
Наблюдатель
эталонной
переменной
... 1 +/"
i
Регулятор
F,(tl
ult)]
Ш)
Объект
Наблюдатель
объекта
ylt)
J
1
1
1
1
1
1
Рис. 5.7. Структура оптимальной следящей системы.
шумы. В этом случае x(t) = x(t) при t ^> 0. Тогда можно пол-
полностью не учитывать наблюдатель объекта при вычислении мат-
матрицы T(s) и заменить x(t) на x(t). В результате получим следующие
соотношения:
z(t)=>Ax(t)
E.135)
x{t) = A?(t)+K,[y,{t)-C,x,(t)\ .
Из этого непосредственно следует
Z{8)=T(8)\,(8), E.136)
где Z(s) и Yr(s) — преобразования Лапласа для z(t) и yr(t) и где
Т (s) = D (si — А + ВГУ Bl2 (si — Ar + K, С,)'1 Кг. E.137)
В общем случае Г@) не равно единичной матрице, поэтому сту-
ступенчатые изменения эталонной переменной вызывают установив-
установившуюся ошибку. Причина этого состоит в том, что рассматриваемая
система управления не рассчитана на ступенчатые изменения эта-
эталонной переменной. Если требуется, чтобы система управления
имела нулевую ошибку в установившемся состоянии при постоян-
постоянной эталонной переменной, то необходимо использовать метод,
предлагаемый в следующем разделе. В' заключение отметим, что
в передаточной матрице имеются только полюса регулятора • и
наблюдателя, а полюса наблюдателя объекта исчезают.
16—394
466 Глава 5
Пример 5.4. Система управления положением
Вернемся теперь к рассмотренной выше системе управления
положением. Рассмотрим задачу построения такой системы
управления, в которой угловое положение отслеживает эталонную
переменную. Для моделей системы управления, возмущений и шума
наблюдений используем уравнения и численные данные из приме-
примера 5.3 (разд. 5.3.2). Представим эталонную переменную в виде
экспоненциально коррелированного шума
U0 = U0 * E-138)'
с
Здесь wrl — скалярный белый шум с постоянной интенсив-
интенсивностью Vri. Предполагается, что эталонная переменная наблюда-
наблюдается с аддитивным белым шумом, так что измеряется
^@ = 1,@+^@. E-140)
где шум wr2 имеет постоянную интенсивность Vr2 и не коррелиро-
коррелирован с шумом wri. Легко определить установившийся оптимальный
наблюдатель для эталонного процесса; он описывается уравнением
где
~К = — 4- Л/ — +-Уп ¦ E 1424)
Критерий оптимальности выражается в виде
"' НС (О -С^@12 + Р[*2 @1 dt\. E.143)
.<„ J
Результирующий установившийся, закон управления описыва-
описывается выражением
_ _ I» @ = - Ft х @ 4- Т2 i @- E.144)
Матрицы Рц и Ft были вычислены в примере 3.8 (разд. 3.4.1) и
были получены следующие результаты:
1 \ г г- . E.145)
н \ V V?
СУ с обратной связью по выходной переменной 467
Используя результаты разд. 3.6. 3, можно найти
1 1 / 2% \7.
+ 7Г + -7- K4-T7
VTTe«
Поскольку теперь имеется наблюдатель эталонной переменной
и известны коэффициенты усиления регулятора, можно использо-
использовать выражение E.137) для вычисления передаточной матрицы T(s)
замкнутой системы слежения. Получим
Г E) =
2% у/. х х 1 1 / . 2* у/.
/f - E.147)
Отметим, что частота срыва системы, по крайней мере, не мень-
меньше частоты срыва замкнутого объекта и частоты срыва наблюдате-
наблюдателя эталонной переменной. Частота срыва замкнутого объекта равна
со0, где со0а = */]/р , а частота срыва наблюдателя эталонной пере-
переменной равна
( ^УЛ. E.148)
Какая частота срыва из указанных двух является меньшей,
зависит от отношения сигнал — шум Vri/Vr2 для эталонной пере-
переменной и величины р, которая в свою очередь определяется допус-
допустимыми амплитудами входной переменной объекта. Рассмотрим
сначала влияние Vri/Vr2- Если эталонная переменная измеряется
точно (т. е. Vr2 мала), то частота срыва наблюдателя эталонной
переменной высока и частота срыва замкнутой системы является
определяющей. С другой стороны, если эталонная переменная
измеряется неточно, то наблюдатель эталонной переменной ограни-
ограничивает полосу пропускания всей системы.
Рассмотрим теперь влияние весового коэффициента р. Видно,
что если р мал, т. е. допустимы большие амплитуды входной пере-
переменной, то частота срыва замкнутой системы высока и наблюдатель
эталонной переменной определяет частоту срыва. И наоборот,
если коэффициент р велик, то частота срыва ограничивается зам-
замкнутым объектом управления.
16*
468 Глава 5
Примем следующие численные значения для эталонного про-
процесса:
9 = 5 с,
E.149)
Vri = 0,4 Рад2/с.
Тогда частота срыва эталонной неременной равна 0,2 рад/с,
а среднеквадратическая величина эталонной неременной составля-
составляет 1 рад. Кроме того, примем, что шум измерений эталонной пере- _
менной wr2 является экспоненциально коррелированным шумом
со среднеквадратическим значением 0,181 рад и постоянной вре-
времени 0,025 с. Это делает частоту срыва шума измерений эталонной
неременной равной 40 рад/с. Так как эта частота весьма высока
в сравнении с 0,2 рад/с, аппроксимируем шум измерений белым
шумом с плотностью
Fr2 = 2 • 0Да • 0,0816 = 0,001632 рада/с. E.150)
Найдем величину частоты срыва наблюдателя эталонной пере-
переменной при численных значениях E.149) и E.150):
Так как частота срыва наблюдаемой эталонной переменной
меньше частоты срыва шума измерений эталонной переменной
(равной 40 рад/с), можно сделать вывод, что обоснованно аппрокси-
аппроксимировать шум измерений белым шумом.
Наконец, необходимо определить наиболее подходящую вели-
величину весового коэффициента р. С этой целью оценим закон управ-
управления для различных величин р и вычислим соответствующие сред-
неквадратические величины ошибок слежения и входного напря-
напряжения. Исключая возмущающий момент т^ и шум измерений в
системе vm, запишем уравнения системы в виде
KrUr(t)-i(t)], E.152)
Объединяя их, получим дифференциальное уравнение расши-
расширенного состояния
СУ с обратной, связью по выходной переменной
469
x(t)
л
МО
ш
=
A— bFi
0
0
о —L
x(t)
л
E.153)
Из этого уравнения можно определить установившуюся матрицу
дисперсии расширенного состояния co\[x{t), \r{t), ?,r(t)] и затем
вычислить среднеквадратическую ошибку слежения и среднеквад-
среднеквадратическую величину входного напряжения. Конечно, можно так-
также использовать метод, рассмотренный в разд. 5.3.2. В табл. 5.1
приведены результаты для последовательно уменьшающихся зна-
значений р. Заметим, что влияние шума wri, возбуждающего эталон-
эталонную переменную, и шума измерений wr2 эталонной переменной
задано вместе и по отдельности.
Таблица 5.1
Влияние весового коэффициента р на характеристики
системы управления положением
0,1
0,01
0,001
0,0001
0,00001
Составляющая средне-
квадратической ошибки
слежения, рад
обуслов-
обусловленная
эталонной
перемен-
переменной
0,8720
0,6884
0,4942
0,3524
0,2596
обусловлен-
обусловленная шумом
измерений
эталонной
переменной
0,0038
0,0125
0,0280
0,0472
0,0664 •
Суммарная
средне-
квадрати-
ческач
ошибка
слежения,
рад
0,8720
0,6885
0,4950
0,3556
0,2680
Составляющая средне-'
квадратической величины
входного напряжения, В
обуслов-
обусловленная
эталонной
перемен-
переменной
1,438
4,365
10,32
21,84
43,03
обусловлен-
обусловленная шумом
измерений
эталонной
переменной
0,222
0,825
2,69
8,15
23,08
Суммарная
среднеквад-
ратическая
¦ величина
1,455
4,442
10,67
23,31
48,82
Если максимально допустимое входное напряжение составляет
/~100 В, то весовой коэффициент р, конечно, нельзя выбирать мень-
меньше 0,00001; для этой величины среднеквадратическое значение
входного напряжения составляет почти 50 В. Соответствующая
среднеквадратическая величина ошибки слежения равна~0,2? рад,
что все же является весьма большой величиной в сравнении со
среднеквадратической величиной эталонной переменной (-~1 рад).
Если эта среднеквадратическая величина слишком ^велика, то
требования к ширине полосы пропускания эталонной переменной
470 Глава 5
необходимо снизить. Необходимо, однако, отметить, что получен-
полученные среднеквадратические значения ошибки слежения и входной
переменной, возможно, больше фактических значений, поскольку
моделирование стохастических процессов экспоненциально корре-
коррелированных шумом обычно приводит к функциям спектральной
плотности, которые уменьшаются гораздо медленнее с увели-
увеличением частоты, чем фактические функции плотности.
При р = 0,00001 из выражения E.152) можно вычислить пе-
передаточную матрицу при нулевой чаетоте Т@) = 0,8338. Это оз-
означает, что в предполагаемой системе управления установившаяся
ошибка весьма велика при постоянной эталонной переменной.
Это происходит, во-первых, из-за того, что экспоненциально корре-
коррелированный шум имеет относительно большую мощность на высоких
частотах, и, во-вторых, потому, что член, который взвешивает
входную переменную в критерии оптимальности, стремится ограни-
ограничить входную переменную небольшой величиной за счет точности
слежения. В следующем разделе рассмотрим, каким образом можно
построить системы слежения с нулевой установившейся ошибкой.
Среднеквадратические значения, приведенные в табл. 5.1, не
включают влияние возмущений в системе и ошибок наблюдений.
Результаты, полученные в примере 5.3, свидетельствуют о том,
что это влияние незначительно в сравнении с влиянием эталонной
переменной.
5.5. Системы регулирования и следящие
системы с ненулевыми заданными
точками и постоянными возмг/гцениями
5.5.1. НЕНУЛЕВЫЕ ЗАДАННЫЕ ТОЧКИ
В гл. 2 было показано, что в отдельных случаях весьма важной
задачей является построение следящей системы с нулевой устано-
установившейся ошибкой при постоянных значениях эталонной перемен-
переменной. Представленный в предыдущем разделе метод не позволяет
разработать такие следящие системы, так как член в критерии оп-
оптимальности, который взвешивает входную переменную, всегда
уменьшает величину входной переменной за счет ненулевой ошибки
слежения. При малых весах входной переменной установившаяся
ошибка слежения уменьшается, но никогда не исчезает полностью.
В этом разделе рассмотрим задачу получения нулевой установив-
установившейся ошибки слежения, как и в разд.3.7.1, с использованием
переменной заданной точки. Рассмотрим систему
E.154)
СУ с обратной связью по выходной переменной 471
с управляемой переменной
z(t) = Dx(t). E.155)
В разд. 3.7.1 был получен оптимальный закон управления с
ненулевой заданной точкой
и(*)=— 7х @ + #7' @) z0, E.156)
где F — установившаяся матрица коэффициентов усиления в
критерии
[ / (t) R3z (t) + ит (t) R2 u (t)] dt, E.157)
a Hc(s) — передаточная матрица замкнутой системы
Hc(s) = D(sI—A + ВТУ1 В. E.158)
Предполагается, что размерность и равна размерности z и что
передаточная матрица разомкнутой системы H(s) = D(sl—А)~ХВ
не имеет нулей в начале координат. Эти предположения гаранти-
гарантируют существование матрицы Нс~1{§). Наконец, z0 является задан-
заданной точкой для управляемой переменной. Закон управления. E.156)
заставляет систему управления достигать заданной точки из на-
начального состояния оптимальным образом и делает оптимальным
переход к новой заданной точке при изменении z0.
Рассмотрим теперь стохастический вариант задачи регулирова-
регулирования при ненулевой заданной точке. Предположим, что объект опи-
описывается уравнением
wl(t), E.159)
где Wi — белый шум. Управляемая переменная вновь определяет-
определяется выражением
z(t) = Dx{t), ' E.160)
однако теперь вводится наблюдаемая переменная
t), E.161)
где хог — также белый шум. Предположим, что заданная точка z0
для управляемой переменной в этой системе известна точно. Тог-
Тогда оптимальным регулятором при ненулевой заданной точке для
этой оистемы в установившемся состоянии, очевидно, является
u(t)=— Fx(t)+HJl@)z0,
E.162)
472 Глава 5
x{t)= Az{t)+Bu(t)+K[y(t)—Cz(t)] ,
где К — установившаяся матрица коэффициентов усиления опти-
оптимального наблюдателя, a F и Hc(s) определяются, как и раньше.
Если шум, возбуждающий состояние, и шум наблюдений отсутст-
отсутствуют, то управляемая переменная будет постепенно приближаться
к zQ при возрастании t.
Закон управления является оптимальным в том смысле, что
установившаяся величина
Е { zT(t) R3z (t) + ит (t) R2 и (*)} E.163) у
достигает минимума, когда z и 'и берутся относительно их
заданных значений. Когда заданная точка изменяется, произво-
производится оптимальный переход к новой заданной точке.
Регулятор, описываемый уравнениями E.162), может дать очень
хорошие результаты, когда заданная точка z0 является медленно
меняющейся величиной. Если заданная точка иногда претерпевает
ступенчатые изменения, то это может привести к входной перемен-
переменной, при которой переходный процесс будет значительным, и тогда
необходимо уменьшать коэффициент усиления системы. Это в свою
очередь снижает способность системы противодействоватьвозмуще-
ниям. Такую трудность можно, преодолеть, рассматривая быстрые
изменения заданной точки как шум. Запишем тогда закон управ-
управления E.162) в форме
u(t)= -Тх(г) + Н^(О)гоA), E.164)
где zo(t) — оцениваемая заданная точка. Наблюдаемая заданная
точка r(t) определяется выражением
r(t) = zo(t) + ws(t), E.165)
где ws — белый шум, a z0 — фактическая заданная точка. Чтобы
определить zo(t) (ср. с примером 4.3, разд. 4.3.2, по оценке констан-
константы), представим z0 в виде
'z0(t)=w0(t), • E.166)
где w0 — другой белый шум. Установившийся оптимальный наб-
наблюдатель для заданной точки описывается выражением
E.167)
где Ко — соответствующая матрица коэффициентов установив-
установившегося наблюдателя.
СУ с обратной связью по выходной переменной
473
Г"
I
I Предварительный фильтр I
наблюдатель
заданной
точки
Hi'(O)
)
—\j_
X
Закон
управления
Объект
Наблюдатель
объекта
z ^
1
Рис. 5.8. Оптимальный регулятор с ненулевой заданной точкой и наблюдате-
наблюдателем заданной точки.'
Регулятор, определяемый соотношениями E.164) и E.167),
обладает таким свойством, что если шум отсутствует и наблюдае-
наблюдаемая заданная точка ф) является постоянной, то управляемая пе-
переменная в установившемся состоянии точно равна r(t). Это сле-
следует из соотношения E.167), так как в установившемся состоянии
Л Л
zo(t) = ф), поэтому в выражении E.164) zo(t) заменяется на r{t),
что в свою очередь приводит z(t) к величине r(t). Видно, что в том
случае, когда г, z0, и.ж z являются скалярами, предварительный
фильтр (рис. 5.8), определяемый соотношениями E.164) и E.167),
есть не что иное, как фильтр первого порядка. В системе высокой
размерности получается обобщение случай фильтра первого по-
порядка. Если предполагается,' что компоненты белых шумов w0 и
ws некоррелированы, то легко.показать, что матрица Ко является
диагональной. Тогда предварительный фильтр состоит просто из
параллельного соединения скалярных'фильтров первого порядка.
Предполагается, что постоянные времени этих фильтров должны
определяться по заданной реакции на ступенчатые изменения ком-
компонент эталонной переменной с учетом величин ступенчатых изме-
изменений и допустимых амплитуд входной переменной.
Пример 5.5. Система управления положением
В примере 5.3 (разд. 5.3.2) был построен оптимальный регуля-
регулятор с нулевой заданной точкой для системы управления положени-
положением. Построим соответствующую систему? управления положени-
положением с ненулевой заданной точкой. Сначала определим оптимальный
закон управления с ненулевой заданной точкой. Из примера 3.8
(разд. 3.4.1) следует, что передаточная функция Hc(s) замкнутой
системы определяется выражением
474 Глава 5
1
0,2
0,6 0,8
t,c
'20
Рис. 5.9. Реакции системы управления положением как системы управления с
ненулевой заданной точкой на ступенчатое изменение заданной точки на 1 рад
при различных значениях коэффициента усиления предварительного фильт-
фильтра ко.
(*) = -
\7« х
E.168)
Следовательно, закон управления E.164) при ненулевой задан-
заданной точке имеет вид
\>.(t)=—Fx(t)
V?
E.169)
где Со@ — оцениваемая заданная точка. Рассмотрим случай сту-
ступенчатых изменений наблюдаемой заданной точки. Наблюдатель
E.167) для заданной точки записывается в форме
E.170)
СУ с обратной связью по выходной переменной 475
где r(t) — эталонная переменная, а Аг0 — скалярный коэффици-
коэффициент усиления. На рис. 5.9 представлены переходные процессы в
системе управления с ненулевой заданной точкой, определяемой
соотношениями E.169) и E.170), для ступенчатого изменения 1 рад
в эталонной переменной r(t) при различных значениях коэффици-
коэффициента к0 и для численных значений из примера 5.3. Предполагая,
что допустимо входное напряжение до 100 В, получим, что допус-
допустимая величина к0 составляет ~20 с. Соответствующая постоян-
постоянная времени предварительного фильтра равна Ик0 = 0,05 с.
5.5.2*. ПОСТОЯННЫЕ ВОЗМУЩЕНИЯ
В предыдущем разделе были рассмотрены фильтры с ненулевой
заданной точкой. В настоящем разделе исследуется вопрос о
постоянных возмущениях, который в некотором отношении подо-
подобен задаче управления с ненулевой заданной точкой. Метод, пред-
представленный в этом разделе, в некоторой степени отличается от ме-
метода, предложенного в разд. 3.7.2. Однако, как и в разд. 3.7.2,
будут построены регуляторы с интегрирующим действием.
В задачах управления нередко встречается случай постоянных
возмущений. Часто эти возмущения вызываются неточностью оп-
определения соответствующих номинальных величин входной пере-
переменной, состояния и управляемой переменной. Обычно такие воз-
возмущения можно представить с помощью дополнительной постоян-
постоянной вынужденной составляющей v0 в дифференциальном уравнении
состояния
. х (t) = Ax (t) + Bu (t) + v0. E.171)
Как и в предыдущем разделе, ограничимся рассмотрением слу-
случая с постоянными параметрами. Напишем для управляемой пе-
переменной
z{t) = Dx(t). E.172)
Предположим, что полное состояние x(t) можно наблюдать но
все моменты времени. Рассмотрим тогда закон управления
u(t)=-Fz(t) + u0, E.173)
где F — матрица коэффициентов усиления, выбираемая в соот-
соответствии с некоторым квадратическим критерием оптимальности
обычной формы, и где необходимо выбрать постоянный вектор щ
таким образом, чтобы в установившемся состоянии влияние по-
постоянного возмущения v0 на управляемую переменную z исчезло.
Уравнения замкнутой системы с законом управления E.173)
имеют вид
476 Глава 5
()+o + o,
E.174)
z(t)=Dx(t).
Так как предполагается, что замкнутая система асимптотически
устойчива, управляемая переменная постепенно приближается к
постоянной величине, которая, как легко видеть, определяется
выражением
(t) = D(-A)~1Bu0+D(-J)~1v0. E.175)
Введем обозначение
А = А — В?. E.176)
Возникает вопрос, существует ли такая переменная и0, при ко-
которой установившаяся Неличина z(t), определяемая выражением
E.175), равна нулю. Как и в задаче управления с ненулевой задан-
заданной точкой, должны быть выделены три случая.
а) Размерность z больше размерности и. В этом случае вектор-
векторное уравнение
D(~Ay1Buo + D(—A)~1vo=O E.177)
представляет собой уравнения, число которых больше числа пере-
переменных. Это означает, что в общем случае не существует решения.
Обычно при этом делается попытка управлять переменной z{t) с
помощью входной переменной u(t) меньшей размерности и имеется
слишком мало степеней свободы.
б) Размерности uuz одинаковы. В этом случае уравнение E.177)
можно решить относительно и0 следующим образом:
Здесь Hc{s) — передаточная матрица замкнутой системы:
1 В. E.179)
Из теоремы 3.10 (разд. 3.7) известно, что обращение матрицы
Нсф) существует, если передаточная матрица разомкнутой систе-
системы D(sl—А)~гВ не имеет нулей в начале координат.
>з в) Размерность z меньше размерности и. В этом случае сущест-
существует много степеней свободы, и размерность z можно увеличить,
добавляя компоненты к управляемой переменной.
В случае (б), для которого dim(z) = dim(u), закон управления
u(t)^-'Fx(t)~irli0)D(-A)'1v0 E.180)
СУ с обратной связью по выходной переменной 477
обладает таким свойством, что постоянные возмущения компенси-
компенсируются оптимальным образом. Этот закон управления, который
приведен в работе [54], будем называть оптимальным законом уп-
управления с нулевой установившейся ошибкой. Очевидно, что этот
закон существует, когда dim(z) = dim(w) и разомкнутая система
не имеет нулей в начале координат.
Предположим теперь, что в дополнение к v0 на систему также
действуют случайные возмущения, а состояние'системы может наб-
наблюдаться только неполно и с ошибками. Тогда заменим дифферен-
дифференциальное уравнение состояния на уравнение
х (t) = Ax(t) + Bu(t) + v0 + wl(t), E.181)
где г;0 — постоянное возмущение, a wx — белый шум с интенсив-
интенсивностью Fj. Кроме того, примем для наблюдаемой переменной
у (t) = Cx(t) + w2(t), E.182)
где w2 — белый шум с интенсивностью F2.
В этом случае закон управления E.180) необходимо заменить на
ц(/)= —Jx(t) — HJl@)D(~J)~1v0, E.183)
где x(t) и v0 — оценки x(t) и v0 с минимальным средним значением
квадрата ошибки. Оптимальный наблюдатель можно получить,
представляя постоянное возмущение в виде
"vo(i) = O. E.184)
Результирующий установившийся оптимальный наблюдатель,
однако, будет иметь нулевую матрицу коэффициентов усиления
при оценке и0, так как в соответствии с моделью E.184) величина
v0 не изменяется (ср. с примером 4.3, разд. 4.3.2, оценка констан-
константы). Так как на практике v0 изменяется медленно или изредка, то
лучше представить v0 в виде
'vo(t) = wo(t), E.185)
где интенсивность Vo белого шума w0 выбирается таким образом,
чтобы увеличение флуктуации у0 отражало бы аналогичные изме-
изменения в медленно меняющемся возмущении. В случае использова-
использования этой модели результирующий установившийся оптимальный
наблюдатель непрерывно отслеживает г;0B) и описывается уравне-
уравнениями
E.186)
uo(t)^Kt\y(t)~€x{t)]. ¦ . ¦ >
478 Глава 5
Система управления, являющаяся результатом объединения
рассмотренного наблюдателя с законом управления E.183), обла-
обладает таким свойством, что в отсутствие других возмущений и шума
наблюдений постоянное возмущение всегда компенсируется так,
что ошибка регулирования или слежения в установившемся goc-
тоянии равна нулю [54]. Как и ожидалось, это достигается
за счет «интегрирующего действия» регулятора (см. задачу
2.12.3). Процедура, изложенная в этом разделе, позволяет ввести
такое интегрирующее действие и одновременно улучшить пере-
переходный процесс в системе управления и подавление флуктуирую-
флуктуирующих возмущений. Эта процедура одинаково легко применима как
к многосвязным системам, так и к системам с одним входом и од-
одним выходом.
Нетрудно заметить, что процедуру-, изложенную в данном раз-
разделе, можно объединить с процедурой, рассмотренной в
разд. 5.5.1, для систем слежения-или регулирования с ненулевы-
ненулевыми заданными точками и при постоянных возмущениях, если вы-
выбрать входную переменную следующим образом:
и(*)= -Fx(t)-HJl@)D(-A)~1v0 + ITl@) z0. E.187)
Здесь z0 — оцениваемая заданная точка, которую можно по-
получить, как описывалось в разд 5.5.1, или фактическая заданная
точка.
Отметим, что часто можно отслеживать постоянные возмущения
от одного или двух источников в обратном направлении. В таком
случае v0 можно заменить на
v0 = Gvu E.188)
где G -=- заданная матрица, vL — постоянное возмущение с раз-
размерностью, меньшей, чем у- v0. Представляя v^ в виде интеграль-
интегрального белого шума, можно таким способом значительно снизить
размерность наблюдателя.
Пример 5.6. Интегральная система управления положением
В этом примере дается построение системы интегрального
управления положением. Предположим, что на вход системы по-
поступает постоянное возмущение в форме постоянного момента т0
на валу в дополнение к возмущающему моменту Td, который из-
изменяется быстро. Преобразуем тогда дифференциальное уравнение
состояния E.92) из примера 5.3 (разд. 5.3.2) к виду
v E-189)
Как и в примере 5.3, представим переменную часть возмущаю-
возмущающего момента в виде белого шума с интенсивностью VЛ.
СУ с обратной связью по выходной переменной 479
Из уравнения E.189) легко увидеть, что оптимальный закон
управления с нулевой установившейся ошибкой описывается вы-
выражением
^t)=-Fx(t)—l-x0, E.190)
где F — соответствующая установившаяся оптимальная матрица
коэффициентов усиления обратной связи, а т0 — оценка т0.
Чтобы получить наблюдатель, представим постоянную часть
возмущения в виде
-;„(*) = u>0(t). E.191)
где белый шум wa имеет интенсивность Fo. Как и в примере 5.3,
наблюдаемая переменная описывается выражением
4@ = (*. O)s(t) + vm(t), E.192)
где vm — белый шум с интенсивностью Vm. Установившийся
оптимальный наблюдатель имеет вид
^ 0
E.193)
где скалярные коэффициенты усиления кл,к%ж к3 определяются из
установившегося решения соответствующего уравнения Риккати
для наблюдателя. При численных значениях из примера 5.3 и
-F0 = 60 H2-m2.c-i E.194)
следует, что эти коэффициенты усиления равны
Лх = 42,74, ?, = 913,2, Л, = 24 495. E.195)
Значение E.194) предполагает, что среднеквадратическая вели-
величина приращения т0 эа период 1 с составляет |^60 <=й 7,75 Н-м.
Этот момент эквивалентен входному напряжению ~1 В. Полюса
наблюдателя, соответствующие коэффициентам усиления E.195),
равны —22,44 ± /22,27 и —2,450 с.
Подставляя закон управления E.190) в уравнение наблюдателя
E.193), легко установить, что регулятор имеет полюс в начале ко-
координат и поэтому оказывает интегрирующее действие, как и ожи-
ожидалось. В качестве матрицы F выберем установившуюся оптималь-
480 Глава 5
Рис. 5.10. Реакция системы управления положением с нулевой установившей-
- ся ошибкой на постоянный момент 10 Нм на валу двигателя.
ную матрицу коэффициентов усиления E.90), полученную в при-
примере 5.3. Соответствующие полюса регулятора равны —9,66 ±
+ /9,09 с. На рис. 5.10 приведен переходный процесс в системе
управления из нулевых начальных условий на постоянное возму-
возмущение т0 = 10 Н-м. Видно, что максимальное изменение углово-
углового перемещения, вызванного .этим постоянным моментом, не пре-
превышает 0,008 рад.
3.6*. Чувствительность- оптимальных
линейных систем управления
с постоянными параметрами
В гл. 3", разд. 3.9, было показано, что линейные оптимальные
системы управления с обратной связью по состоянию и постоян-
постоянными параметрами нечувствительны к возмущениям и изменени-
изменениям параметров в том смысле, что матрица возвратной разности
J(s), полученная путем размыкания контура обратной связи по
состоянию, удовлетворяет неравенству в форме
JT(—j<u)WJ(j(s>) >РГ при всех вещественных ©, E.196)
где W — весовая матрица F7 R2F.
В этом разделе показывается, что оптимальные системы с об-
обратной связью по выходной переменной в общем случае не облада-
обладают таким свойством, хотя могут быть весьма близки к нему. Рас-
СУ с обратной связью по выходной переменной
481
w,(t)
Рис. 5.11. Упрощенная схема системы управления с обратной связью ио
выходной переменной.
смотрим систему с постоянными параметрами
w1{t), E.197)
где w1 — белый шум с постоянной интенсивностью Vv Наблюдае-
Наблюдаемая переменная определяется уравнением
y{t) = Cx(t) + w2(t), E.198)
где wt — белый шум, ив коррелированный с wx, с постоянной ин-
интенсивностью V.,. Управляемая переменная имеет вид
z(t)= Dx(t), , E.199)
а критерий оптимальности описывается выражением
Е \( [ zT{t) Rsz (t) + ит (t) R2u (t)] dt |,
E.200)
где R3 и Ru — симметрические постоянные положительно опре-
определенные весовые матрицы.
Для упрощения анализа предположим, что управляемая пере-
переменная является также наблюдаемой переменной (без учета шума
наблюдений), т. е. С = D. Тогда систему управления можно
схематически представить, как на рис. 5.11, где наблюдатель и
закон управления объединены в регулятор. Рассмотрим теперь
установившийся регулятор, который получается, если положить
482 Глава 5
tu —>¦ — оо и tx —*¦ оо. Тогда установившийся наблюдатель описы-
описывается уравнением
x(t) = Az(t) + Bu(t) + K[y(t)~Dz(t)] , E.201)
где К — матрица коэффициентов усиления установившегося на-
наблюдателя. Преобразование Лапласа для уравнения E.201) и ре-
л л
шение относительно преобразования X(s) для x{t) дает
X (в) = (si ~ A + KD)'1 [BV(s) + Л: Y (*I, E.202)
где U(s) и Y(s) — преобразования Лапласа для и (t) и y(t) соответ-
соответственно. Полагается, что все начальные условия равны нулю. Для
входного воздействия имеем (через преобразование Лапласа)
¦ U(s)=~FX(s), E.203)
где F — установившаяся матрица коэффициентов усиления об-
ратнбй связи. Подстановка E.203) в E.202) и решение для L)(s)
дают
U(s)'=— G(s)Y(s), E.204)
где
G(s) = [I + F(sI~A +'KD)~1B]-iJ(sI—A + KDylK. E.205)
Рассмотрим теперь матрицу возвратной разности
J(s) = I + H(s)G(s) . {5.206)
для системы управления, где
H(s) = D(sI — А)-1 В E.207)
есть передаточная матрица объекта. В общем случае не существует
такой неотрицательно определенной весовой матрицы W, для ко-
которой неравенство вида
>>W E.208)
удовлетворяется при всех вещественных частотах ю. Действитель-
Действительно, легко доказать (см. задачу 5.6), ^что в случае системы с одним
входом и одним выходом неравенство E.208) никогда не удовлетво-
удовлетворяется при всех значениях со, если W > 0. Конечно, неравенство
E.208) должно удовлетворяться в некотором рациональном диапа-
диапазоне частот, согласованном с частотным диапазоном возмущений,
действующих на объект, так как из оптимальности регулятора
следует, что влияние заданных возмущений, на которые рассчи-
рассчитана система управления, ослабляется.
Докажем теперь, что при определенных условиях выполнение
СУ с обратной связью по выходной переменной 483
неравенства E.208) на всех частотах можно получить асимптоти-
асимптотически. Рассмотрим алгебраическое уравнение Риккати
0= DTR3D~PBRJ1 ВТР~+АТ Р + ТА, E.209)
которое необходимо решить, чтобы получить коэффициент регули-
регулирования F =В2~1ВТР. Предположим, что
Ла = pN, E.210)
где р — положительный скаляр, а N — положительно опреде-
определенная матрица. Тогда из теоремы 3.14 (разд. 3.8.3) следует, что
если dim(z) = dim(w), а передаточная матрица, разомкнутой сис-
системы H(s) — D(sl—Ау^В имеет нули только с положительными
вещественными частями, то прир | 0 желаемое решение Р урав~
нения E.209) приближается к нулевой матрице. Это означает, что
lim'PB—N-1BTP^DTB3D, E.211)
или
lim р?гN7 = DTR3D. E.212)
p|0
Теперь общее решение матричного уравнения Хт X = Мт М,
где X и М имеют одинаковую размерность, можно записать в фор-
форме X = UM, где U является произвольной унитарной матрицей,
т. е. U удовлетворяет условию UT U = I. Поэтому на основании
выражения E.212) делаем вывод, что при р | 0 матрица коэффи-
коэффициентов усиления стремится к
J-^-^N' UR'J'D. E.213)
В результате имеем
G(s)-+[D(sI—A + KD)rl В]'1 D(sl—A + ZZ)) К E.214)
при р 4 0. Нетрудно доказать, что
[D (si — А + К D)'1 В]'1 D(SI — A+1( D)'1 ~К =
= [D(sl — Ay1 В]-1 D (si —Ay1 К. E.215)
Из этого следует, что для системы со структурой, представлен-
представленной на рис. 5.11, при R2 -*¦ 0 матрица возвратной разности
J(s)->J0(s), E.216)
где __
/„(*)= I + D(sl — АУ1К. E.217)
Получим теперь неравенство для асимптотической матрицы
возвратной разности Jq(s). Установившаяся матрица дисперсий Q
484 Глава 5
удовлетворяет алгебраическому решению уравнения Риккати
O = V1—QDTV^lDQ+AQ+QAr E.218)
в предположении, что шум, возбуждающий состояние, и шум наб-
наблюдений некоррелированы, F2 > 0; а дифференциальное уравне-
уравнение Риккати имеет установившееся решение. Проделаем теперь
процедуры, подобные описанным в разд. 3.9, где рассматривался
вопрос о чувствительности регулятора с обратной связью по сос-
состоянию. Прибавляя и вычитая sQ и проводя преобразования,
получаем
0= Fj— 7)DTV-X DQ ~(si — A)Q —<?(s/ — At). E.219)
Предварительное умножение на D(sl—А)'1 и последующее ум-
умножение на (—si—AT)~1DT дают
0 = D (sI—A)-l(vi—QDr V^1 DQ)(—sI—AT)~1 DT —
( rT1r Ay1QDr. E.220)
Прибавляя и вычитая член F2, это выражение можно преобра-
преобразовать к виду
[/ + D(sI -A)'Q DTVJ1 ]V,[I + F-1 DQ(-sI -A7)'1 DT] =
= V2 + D(sI — i)-iFj(—si— AT)~iDT. E.221)
На основании QDT Vf1 = К устанавливаем, что это выражение
является, равенством
Л (s) V% JTQ (—s) = Fa + D (si — A)-1 Vi (— si — AT )"* DT. E.222)
Подставляя s = /со получаем, что второй член в правой части
представляет собой неотрицательно определенную эрмитову мат-
матрицу. Таким образом, имеем
/0(;й)O2^о (—/ю) > ^а Для всех вещественных со. E.223)
Из теоремы 2.2 (разд. 2.10) следует, что
S[(—j<o)VJl SQ(/u>)< VJ1 для вещественных а, E.224)
где Su(s) — асимптотическая- матрица чувствительности
ВД =-Г'00- E-225)
Имеем также
Получаем, таким образом, следующий результат [104].
СУ с обратной связью по выходной переменной 485
Теорема 5.5. Рассмотрим установившийся стохастический опти-
оптимальный регулятор с обратной связью по выходной переменной и
постоянными параметрами. Предположим, что наблюдаемая пе-
переменная является также управляемой переменнойТ т. е.
z(t) = Dx(t).
Предположим также, что шум wx(t), возбуждающий состояние,
и шум наблюдений w%(t) некоррелированы, задача наблюдений яв-
является несингулярной, т. е. F.2 > 0, и установившийся регулятор
с обратной связью по выходной переменной асимптотически устой-
устойчив. Тогда, если dim(u) = dim(z) и передаточная матрица разом-
разомкнутой системы H(s) = D{sI—Ay1B не имеет нулей в правой
полуплоскости, матрица обратной разности замкнутой системы
асимптотически достигает J0(s) при Д2 ->• 0, где
J0(s)=*I + D(sI — Ay*K E.227)
и К — установившаяся матрица коэффициентов усиления наблю-
наблюдателя. Асимптотическая матрица возвратной разности удов-
удовлетворяет соотношению
/0 (s) F2 JTa (— s) = F2 + D {si — A)-1 Fj (— si — A7) DT. E.228)
Асимптотическая матрица возвратной разности Ja(s) и ее об-
обращение, асимптотическая матрица чувствительности SJ^s) =
= /0~1(s) удовлетворяют неравенствам
JQ{i&)VzJTQ{—i&)^>V2 для всех вещественных со,
ST0{—j(o)V~l S0(/co)<F~1 для всех вещественных (й, E.229)
/[(—/ю) F/0 (/со) > Ff1 для всех вещественных со.
Эта теорема устанавливает, что асимптотически матрица чув-
чувствительности системы регулирования с обратной связью по вы-
выходной переменной удовлетворяет неравенству в форме E.196),
которое означает, что в асимптотической системе управления воз-
возмущения всегда уменьшаются в сравнении с эквивалентной уста-
установившейся разомкнутой системой управления независимо от мат-
матрицы спектральной плотности возмущений. Это также означает,
что асимптотическая система управления уменьшает влияние всех
(достаточно малых) изменений характеристик объекта в отличие от
разомкнутой установившейся эквивалентной системы.
Целесообразно отметить следующее:
а) Весовая матрица в критерии чувствительности равна Fa.
Это неудивительно. Предположим для простоты, что матрица
486 Глава 5
V.2 является диагональной. Тогда, если один из диагональных эле-
элементов матрицы V2 мал, соответствующая компонента наблюдае-
наблюдаемой переменной может быть измерена точно. Это означает, что в
соответствующем контуре с обратной связью коэффициент усиле-
усиления может быть большим и будет оказываться значительное влия-
влияние на подавление возмущений и изменение характеристик объек-
объекта по этой выходной переменной, следствием чего будет большой
весовой коэффициент в критерии чувствительности.
б) Вышеуказанная теорема несправедлива для систем, которые
имеют нули в правой полуплоскости.
в) В практических случаях невозможно выбрать матрицу В2
очень малой. Это означает, что критерий чувствительности нару-
нарушается в определенном диапазоне частот. Примеры показывают,
что такой случай является типичным для области высоких частот.
Следует ожидать, что уменьшение чувствительности не будет
очень большим, если матрица R2 выбирается настолько малой, что
удаленные полюса регулятора находятся на большем расстоянии
от начала координат, чем полюса наблюдателя.
г) Правую часть соотношения E.228) можно оценить непосред-
непосредственно, без решения уравнений Риккати. Это соотношение можно
использовать для исследования поведения матрицы возвратной
разности, в частности, в случае системы с одним входом и с одним
выходом.
д) Можно показать [104], что результат, подобный теореме 5.5,
справедлив, когда
{t) + w%{t), E.230)
т. е. y(t) включает управляемую переменную z(t).
Пример 5.7. Система управления положением
Рассмотрим снова систему управления положением, описывае-
описываемую дифференциальным уравнением состояния
Здесь %d(t) — белыйшум с интенсивностью Vd. Наблюдаемая
переменная равна
4@ = A, 0)*@ + vm@, E,232)
где vm(t) — белый шум с интенсивностью Vm. Управляемая пере-
переменная записывается в виде
С@ = A, 0)x(t). E.233)
Система удовлетворяет условиям теоремы 5.5, так как управ-
СУ с обратной связью по выходной переменной
487
Рис. 5.12. Асимптотические диаграммы Воде для функции чувствительности
системы управления положением р =• 0 и р — 0,5 • 10~в.
ляемая переменная является наблюдаемой переменной и предпо-
предполагается, что шум, возбуждающий состояние, и шум наблюдений
некоррелированы, а передаточная функция разомкнутой системы
#(*) = ¦
'¦-— E.234)
S (s + a)
не имеет нулей в правой части. Чтобы вычислить асимптотическую
возвратную разность Jo(s), рассмотрим соотношение E.228), из
которого получим
J0(s)J0(-s)=l
Подстановка s = /со дает соотношение
о1* -I- «2 /
или
2
E.235)
E.236)
E.237)
откуда видно, что [б'оО'ю)! < 1 Для всех вещественных значений со.
На рис. 5.12 приведена асимптотическая диаграмма Боде
|S(/co)|, которая показывает, что предельный регулятор обеспе-
обеспечивает противодействие всем возмущениям и изменению парамет-
параметров вплоть до частоты {у2Уа^т)^1- При численных значениях
E.238)
Y = 0,1 кг • м,
Vd =10 Н2 - м2 • с,
Vn = 10" рад2 • с
488 Глава 5
частота срыва составляет ^-31,6 рад/с.
Диапазон частот, в котором обеспечивается противодействие
возмущениям, уменьшается, когда весовой коэффициент р в крите-,
рии
\ \ . E.239)
выбирается больше нуля. Разумно предположить, что подавление
возмущений остается эффективным, пока частота срыва регулято-
регулятора гораздо больше частоты срыва наблюдателя. Поскольку часто-
частота срыва регулятора (пример 5.3, разд. 5.3.2) равна (xj/pJ, то
приходим к заключению, что при х = 0,787 рад/(В-с2) коэффи-
циентр должен быть равен 0,5-10~6 или меньше (для этой величи-
величины р частота срыва регулятора равна 33,4 рад/с). Можно вычислить,
используя теорему 5.4 (разд. 5.3.2), что при такой величине р
имеем '
lim E {Са (t) + p(x2 (*)} = 0,00001906 рад2. E.240)
Из этого следует, что среднеквадратическая величина входного
Напряжения ограничена значением
^6,17В, E.241)
которое является вполне приемлемой величиной, когда допускают-
допускаются амплитуды входной переменной до 100 В. Можно вычислить,
что функция чувствительности установившегося регулятора для
этой величины р определяется выражением
S(S) = *(s + 4'6) (s8 + 87>9s + 3859> ' E 242)
^ ' (s2-|-47,5s -f1125) (S2 -(-44,96s -f1000) '
Асимптотическая диаграмма Воде |?(/a>)| приведена также на
рис. 5.12 и сравнивается с диаграммой дляр = 0. Видно, что час-
частота среза при ослаблении возмущений смещается с 30 до 20 рад/с,
тогда как возмущения в диапазоне частот ~30 рад/с несколько
увеличиваются. Выбирая р меньше 0,5-10, можно точнее аппрок-
аппроксимировать асимптотическую функцию чувствительности.
При помощи методов разд. 5.5.1 легко построить оптимальный
регулятор с ненулевой заданной точкой для этой системы. На
рис. 5.13 приведена реакция системы управления с обратной связью.
по выходной переменной при ненулевой заданной точке на ступен-
ступенчатое изменение заданной точки 0,1 рад по угловому положению
из нулевых начальных условий для номинальных значений пара-
параметров, а также для двух групп неноминальных -значений. Здесь,
как и в примере 3.25 (разд. 3.9), предполагается, что неноминаль-
СУ с обратной связью по выходной переменной
489
0,1
JJU-
I
О
0,2
t,c
Рис. 5.13. Влияние изменения параметров на реакцию системы управления
положением с обратной связью по выходной переменной.
а — номинальная нагрузка; б — 2/з номинальной нагрузки; в — 3/2 номинальной нагрузки.
ные значения констант объекта а и х обусловлены изменениями
инерционной нагрузки двигателя постояного гока. Видно, что
влияние изменения параметров является умеренным.
5.7*. Линейные оптимальные регуляторы
пониженной размерности
с обратной связью
по выходной переменной
5.7.1*. ВВЕДЕНИЕ
В разд. 5.3.1 было получено решение задачи построения сто-
стохастического линейного оптимального регулятора с обратной
связью по выходной переменной. Вполне очевидно, что размер-
размерность регулятора равна размерности объекта, так как оптималь-
оптимальный наблюдатель имеет размерность объекта. Это может быть весь-
весьма существенным недостатком рассматриваемых методов синтеза,
так как в некоторых случаях регулятор гораздо более низкой раз-
размерности обеспечивает вполне удовлетворительные, хотя и не оп-
оптимальные характеристики. Кроме того, размерность математичес-
математической модели системы определяется точностью модели. Модель может
включать некоторые граничные эффекты, которые значительно'
увеличивают размерность модели без существенного улучшения
ее точности. В таком случае, по-видимому, нет оснований также
увеличивать размерность регулятора.
Учитывая тот факт, что сложность и стоимость регулятора воз-
возрастают с увеличением его размерности, исследуем в данном раз-
разделе методы построения регуляторов с размерностью более низкой,
490 Глава 5
чем у регуляторов, описанных методами разд. 5.3. Один из оче-
очевидных методов решения задачи построения регуляторов более
низкой размерности состоит в описании объекта более грубой ма-
математической моделью низкой размерности. В различных работах
(см., например, [5, 39, 40, 44, 62, 101, 128]) разработаны методы
снижения размерности модели путем рассмотрения только «су-
«существенных режимов» модели. В этом случае методы разд. 5.3
приводят к регуляторам более низкой размерности. Существуют,
однако, случаи, в которых не так легко достичь снижения размер-
размерности объекта. Встречаются также ситуации, когда снижение раз-
размерности за счет пренебрежения «второстепенными» эффектами
приводит к построению регулятора, который делает реальную сис-
систему управления неустойчивой [155].
Наш подход к задаче построения регуляторов пониженной раз-
размерности состоит в следующем. Используются математические мо-
модели систем, которые являются точными, насколько это возможно,
и учитываются все граничные эффекты, которые могут иметь, а
могут и не иметь значение. Однако при этом размерность регуля-
регулятора ограничивается некоторым фиксированным числом т < п,
где п — размерность модели. Следует выбрать наименьшее число
т, которое позволяет построить удовлетворительную систему
управления. Этот метод, по-видимому, является более надежным,
чем метод снижения размерности объекта. Данный метод впервые
был предложен в работе [132] и в дальнейшем был развит в рабо-
работах [84, 153, 162], а также в других работах.
5.7.2*. РЕГУЛЯТОРЫ ПОНИЖЕННОЙ РАЗМЕРНОСТИ
Рассмотрим систему, описываемую уравнениями
х (t) = A (t) х (t) + В (t) и (t) + Wi (*), х (t0) = x0,
E.243)
(t) + wt((),
где, как обычно, x{t) — «-мерный вектор состояния, u(t) — /с-мер-
ная входная переменная, y(t)—I- мерная наблюдаемая переменная,
a wt и и>2 — белые шумы. Совместный процесс со1(и>х, w2) имеет
интенсивность V(t). В дальнейшем полагается, что начальное сос-
состояние ха является случайным вектором, который не коррелирован
с 10^ ш w2, имеет среднее значение х0 и матрицу дисперсий @0.
Рассмотрим теперь регулятор для этой системы, который опи-
описывается следующими уравнениями:
q(t)=L(t)q(t) + K (*) у (*),' q (tQ) = q0,
E.244)
u(t)=-F(t)q(t),
СУ с обратной связью по выходной переменной 491
где q — m-мерный вектор состояния регулятора'. Наблюдаемая
переменная у служит в качестве входной переменной регулятора,
а входная переменная и в объекте является выходной переменной
регулятора. Заметим, что в регуляторе не допускается прямая
связь. Причина этого состоит в том, что прямая связь позволяет
белому шуму Юп проникать непосредственно во входную перемен-
переменную и, вследствие чего амплитуда входной переменной становится ,
бесконечно большой.
Теперь можно сформулировать задачу линейного оптимально-
оптимального управления с обратной связью по выходной переменной для ре-
регуляторов пониженной размерности [105].
Определение 5.3. Рассмотрим систему E.243) с заданными ста-
статистическими характеристиками. Тогда задача оптимального
управления с обратной связью по выходной переменной для регуля-
регулятора пониженной размерности состоит в определении для заданного
числа т, 1 ¦< т <с п, и заданного конечного момента времени tx
матричных функций L(t), K(t) и F(t), t0 < t <: tx, и распреде-
распределения вероятностей q0, таких, чтобы минимизировалось (Ут, где
ат = е[^[хт@i?4 @х (t) + uT(t)R,(t)u (t)} dt|. E.245)
Здесь Rx(t) и Rz(t), ta <: t <¦ t± — заданные матрицы, неот-
неотрицательно определенная и положительно определенная соответст-
соответственно, для всех t.
В частном случае, когда т = п, решение этой задачи следует
из теоремы 5.3, которая устанавливает, что F(t) и K(t) в E.244)
являются коэффициентами усиления оптимального регулятора и
наблюдателя соответственно, и
L(t) = A(t) — B(t)F(t) — K(t)C(t). . E.246)
Легко показать, что am, m =1,2, ..., образует монотонно не-
возрастающую последовательность чисел, т. е.
о±>>ог>.о3> ... , E.247)
поскольку т -мерный регулятор является частным случаем (т+1)-
мерного регулятора. Кроме того, при т > п величина ат больше
не уменьшается, так как из теоремы 5.3 известно, что оптималь-
оптимальный регулятор (без ограничения его размерности) имеет размер-
размерность п. Таким образом, имеем
Cj > а2 > а3 > ... > с,,.! > сгя = сг„+1 = а„+2 = .... E.248)
Один из методов решения задачи, поставленной в определении
5.3, состоит в преобразовании исходной задачи в детерминирован-
детерминированную, задачу динамической оптимизации. Это выполняется следую-
492 Глава 5
щим образом. Объединим уравнение объекта E.243) с уравнением
регулятора E.244). Тогда система управления описывается диф-
дифференциальным уравнением расширенного состояния
-B{t)F(t)\fx{t)\
q(t)J \K(t)C(t) L(t) )\q(t)J-
E.249)
0 K(t)J\w2(t)
Введем теперь матрицу смешанных моментов второго порядка
*Г(о> qT(t))}' E'250)
Из теоремы 1.52 (разд. 1.11.2) следует, что 1S(t) является реше-
решением матричного дифференциального уравнения
S(t) = M(t)S(t) + S(t)MT(t)+N(t)V(t)NT{t),
E.251)
где
М@ -B{t)F(tU ,1 0 ч
\K(t)C(t) L(t) ) \0 K{t)l
E.252)
г гТ г пТ
^о -о о Н
т
Используя матричную функцию S(t), можно представить кри-
критерий E.245) в следующей форме:
E.253)
где Su(t) и S2.,(t) — п X п- и m X m-диагональные блоки матри-
матрицы S(t) соответственно.
Задача определения оптимального поведения матричных функ-
функций L(t), F(t) и K(t) и распределения вероятностей q0 теперь сво-
сводится к задаче выбора этих матричных функций и So таким обра-
образом, чтобы минимизировалась величина <jm, описываемая выраже-
выражением E.253), где матричная функция S(t) определяется из E.251).
При использовании методов динамической олтимизации в этой за-
задаче [162] получаем двухточечную краевую задачу с нелинейными
матричными дифференциальными уравнениями. Эта задача может
быть весьма громоздкой с точки зрения вычислений.
СУ с обратной связью по выходной переменной 493
Чтобы упростить задачу, ограничимся теперь системами с пос-
постоянными параметрами и сформулируем установившийся вари-
вариант, который бы было легче оценить с количественной стороны
и, кроме того, легче реализовать. Предположим, что матрицы
А, В, С, V, RL и R> являются постоянными. Кроме того, ограни-
ограничимся также выбором регулятора с постоянными параметрами и
постоянными матрицами L, К и F. Предполагая, что соединение
объекта и регулятора асимптотически устойчиво, получим предел
am = lim E {хт (t) RAx (t) + ит (t) R2 и (t)} . E.254)
Как и раньше, индекс m обозначает размерность регулятора. Рас-
Рассмотрим теперь задачу выбора постоянных матриц L, К и F (задан-
(заданной размерности ) таким образом, чтобы достигался минимум от.
Как и раньше, можно утверждать, что
ст4 > ст2 > а3 > ../ > оп_г > оп = аи+1 = an+2 = ... . E.255)
Минимальная величина, . которую вообще можно получить,
достигается при т = п, так как из теоремы 5.4 (разд. 5.3.2) из-
известно, что критерий E.254) минимизируется путем объединения
установившегося оптимального наблюдателя с установившимся
оптимальным законом управления.
Задачу минимизации критерия E.254) по L, К и F можно пре-
преобразовать в задачу математического программирования следую-
следующим образом. Так как по предположению замкнутая система управ-
управления асимптотически устойчива, т. е. постоянная матрица М
имеет все характеристические числа только в левой половине ком-
комплексной плоскости, то при t0 ->—оо матрица дисперсий S(t)
расширенного состояния достигает постоянной установившейся
величины S, которая является единственным решением линейного
матричного уравнения
= 0. E.256)
Кроме того, ат можно выразить в виде
ат = tr (Jn Rt + Si2 FTR,F), E.257)
где Sn и 522 — n X n- и т X m-диагональные блоки матрицы
S соответственно.
Таким образом, решение установившегося варианта задачи
линейного оптимального управления с обратной связью и постоян-
постоянными параметрами для регуляторов пониженной размерности сво-
сводится к определению постоянных матриц L, К и F указанной выше
размерности, которые минимизируют соотношение
ат = tr (Sn Д, + J22 FT R2F) E.258)
494 Глава 5
и удовлетворяют ограничениям
MS + lMT + NVNt = 0, E.259а)
Re[A,,(itf)J<0, i= 1, 2, ... , n + m. E.2596)
Здесь Х;(.М), i = 1, 2, ..., re + m, обозначают характеристи-
характеристиМ R
;(), , р
ческие числа матрицы М, a Re — вещественную часть.
Заметим, что задача определения переменных во времени мат-
матриц L(t), K(t) и F(t), t0 < t < ti, которые минимизируют крите-
критерий <зт, всегда имеет решение, если матрица A(i) является непре-
непрерывной, а все другие матрицы, встречающиеся в постановке зада-
задачи, кусочно-непрерывныТ] Установившийся вариант задачи, т. е.
минимизация ат относительно постоянных матриц L, К и F,
имеет решение, если для заданной размерности регулятора т
существуют такие матрицы L, К ж F, что сложная матрица М будет
асимптотически устойчивой. При т = ге необходимые и доста-
достаточные условия существования матриц L, К и F (делающих матри-
матрицу М асимптотически устойчивой), налагаемые на матрицы Л, В, С,
состоят в том, что пара {А, В) должна быть стабилизируемой, а
{А, С} — обнаруживаемой (разд. 5.2.2). Для случая т <; п та-
такие условия не существуют, хотя известно, что наименьшая раз-
размерность регулятора должна быть такой, чтобы все полюса зам-
замкнутой системы можно было распределить произвольно (см.,
например, [23]).
Некоторые правила вычисления матриц L, К и F будут даны
ниже. Завершим же этот раздел замечанием о выборе соответст-
соответствующей размерности регулятора. Предположим, что для заданных
матриц -flj и Rz решена задача оптимизации при т — 1, 2, ..., п и
что аи <т2, ..., о„ вычислены. Тогда можно было бы сравнить вели-
чинъ* (Tj, a2, ..., зп и выбрать наиболее рациональную величину т,
при которой достигается достаточно малое значение ат. Однако'
•такой подход, по-видимому, нецелесообразен, так как для всех
систем средние значения квадратов входной переменной различ-
различны. Максимально допустимое среднее значение квадрата входной
переменной является заданной величиной, которая не связана со
сложностью выбранного регулятора. Поэтому рационально про-
проводить сравнение, когда для каждой величины т весовая матрица
i?2 выбирается таким образом, что получается максимально допус-
допустимое среднее значение квадрата входной переменной. Этого можно
достигнуть, если положить
Д9 = РтД2о, E-260)
гДе Рот — положительный скаляр, i?20 — положительно опреде-
определенная весовая матрица, которая характеризует относительную
важность компонент входной переменной. Сформулируем теперь
СУ с обратной связью по выходной переменной 495
поставленную задачу следующим образом. Для заданных ш, /?4 и
.#2о необходимо минимизировать критерий
FTR20F) E.261)
относительно постоянных матриц L, К и F с учетом ограничений
E.259), гдерт выбрано так, что след матрицы
tr (~S2zFTR20F) E.262)
равен максимально допустимому среднему значению квадрата
входной переменной.
5.7.3*. АНАЛИТИЧЕСКОЕ ПОСТРОЕНИЕ
ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ
ПОНИЖЕННОЙ РАЗМЕРНОСТИ
В этом разделе приведены некоторые результаты, которые ока-
оказываются полезными при разработке эффективной вычислительной
программы решения установившегося варианта задачи линейного
оптимального управления с обратной связью и с постоянными па-
параметрами для регулятора пониженной размерности. В частности,
описывается метод вычисления градиента целевой функции (в
данном случае вт) по неизвестным параметрам (которые в данном
случае являются элементами матриц L, KeF). Этот градиент можно
использовать в любом стандартном алгоритме минимизации функ-
функции, использующем градиенты, таком, как метод сопряженных
градиентов и метод Пауэлла — Флетчера (см*, например, работы
[136] или [16] для углубленного ознакомления с методами оптими-
оптимизации при отсутствии ограничений).
Градиентные методы, в частности, полезны для решения нас-
настоящей задачи минимизации функции, поскольку, как будет по-
показано, градиент можно легко вычислить. Кроме того, довольно
просто удовлетворить ограничение E.2596), так как система управ-
управления является асимптотически устойчивой, если начальные зна-
значения матриц L, К nF специально выбираются так, чтобы удовлет-
удовлетворялось это ограничение. Затем производится движение достаточ-
достаточно малыми шагами по указанным направлениям поиска, так как
с приближением границы области, в которой система управления
устойчива, критерий становится бесконечным, и, таким образом,
создается естественный барьер движению из области устойчивости.
Здесь следует сделать замечание о математическом описании
регулятора. Очевидно, что величина критерия лут определяется
только внешним описанием регулятора, т.е. его матричной переда-
передаточной функцией F(sl—L)~XK или матрицей импульсной реакции
Fexp[L(t—т)]К. Хорошо известно, что при заданном внешнем
описании возможны различные внутренние описания (в форме
496 Глава 5
дифференциального уравнения состояния совместно с уравнением
для выходной переменной). Поэтому если задача оптимизации на-
начинается с внутреннего описания регулятора, как это обычно при-
принято, а все входы матриц L, К и F считаются свободными парамет-
параметрами, то минимизирующие значения матриц L, К mF вовсе не яв-
являются единственными. Это может создать трудности вычисления.
Кроме того, размерность задачи минимизации функции чрезмерно
возрастает. Такие трудности можно преодолеть, выбирая канони-
каноническое представление уравнений регулятора. Например, если
регулятор является системой с одним входом, то в канони-
канонической форме фазовой переменной уравнений состояния (см.
разд. 1.9) имеется минимальное число свободных параметров.
Аналогично, когда регулятор представляет собой систему с одним
выходом, минимальное число свободных параметров имеет кано-
каноническая форма удельной фазовой переменной (см. также разд.
1.9). Для многомерных систем можн.о использовать связанные
канонические формы [28]. Заметим, однако, что часто можно
существенно уменьшить число свободных параметров, налагая
ограничения на структуру регулятора, например объединяя в
блоки некоторые малосущественные обратные связи.
Рассмотрим, наконец, вопрос об оценке градиента от по вхо-
входам матриц L, К и F. Пусть у является одним из свободных пара-
параметров. Тогда, вводя матрицу
Rl ° Л E.263)
O FRF7) '
можно записать градиент вт по у в следующем виде:
Кроме того, беря частную производную выражения E.259а)
по тому же параметру, найдем
Здесь удобно ввести линейное матричное уравнение, которое
является сопряженным для уравнения E.259а) и определяется в
виде
MTU + UM + Я = 0. ' E.266)
Используя тот факт, что для любых матриц А, Б и С одинаковой
размерности tr {АВ) = tv(BA) и tr(C) = tr(Cr), напишем с по-
помощью выражений E.265) и E.266) для градиента E.264)
д ЗГ
а-.
СУ с обратной связью по выходной переменной 497
дМ 77 77 , 77 9
IU + U (NVN) + S]. E.267)
Таким образом, чтобы вычислить градиент функции цели ат по
одному из свободных параметров у, необходимо решить линейные
матричные уравнения E.259а) и B.266) относительно S и7/ соот-
соответственно, а получающиеся значения подставить в уравнение
E.267). Если рассматриваются различные параметры, то нет необ-
необходимости повторять весь объем вычислений, которые состоят из
решения двух матричных уравнений. В разд. 1.11.3 были рассмот-
рассмотрены численные методы решения линейных матричных уравнений
указанного типа.
Пример 5.8. Система управления положением
В этом примере будет построена система управления положе-
положением с ограничением на размерность регулятора. Управляемая
система представляет собой двигатель постоянного тока из приме-
примера 5.3 (разд. 5.3.2), который описывается дифференциальным урав-
уравнением состояния и уравнением для наблюдаемой переменной
E.268)
= A, O)x(t) + vm(t),
гдет^ и vm — белые шумы с интенсивностью VdB Vm соответст-
соответственно. Как и в примере 5.3, выберем критерий, который необходи-
необходимо минимизировать, в виде
lim E{^(t) + p^(t)}, E.269)
to -*— с»
где С@ = A, 0)x(t) — управляемая переменная. Как следует из
примера 5.3, оптимальный регулятор без ограничения размернос-
размерности имеет размерность,, равную 2. Единственным возможным регу-
регулятором меньшей размерности без прямой связи является регуля-
регулятор первого порядка, который описывается "скалярными уравнения-
уравнениями
E.270)
17-394
498 Глава 5
Здесь без потери общности принимается т](?) =1. Тогда ре-
решаемая задача формулируется таким образом: найти константы б и
е, при которых критерий E.269) достигает минимума.
В примере 5.3 использовались следующие численные значения:
к = 0,787 рад/(В • с2), а = 4,6 с, у = 0,1 кГ • м2,
E.271)
Vd = 10 Н2 • м2 • с, Vm = 10 рад2 • с.
Характеристики оптимального регулятора, полученные при
р = 0,00002 рад2/В2, представлены в первой колонке табл. 5.2.
Таблица 5.2
Сравнение характеристик систем управления положением
с регуляторами первого и второго порядков
Характеристика
Среднеквадратическое
входное напряжение, В
Среднеквадратическая
ошибка регулирования,
Е {$>Д@} +PEIlJ-2@}.
10~6 рад2
Полюса замкнутой систе-
системы , с~х
Оптимальный ре-
регулятор второго
порядка при
р=0,00002 рад'/В»
1,5
0,00674
9,08
—9,66±/9,09
—22,48±/22,24
Оптимальный регулятор первого
порядка
при .
р=0,00002 радг/В*
1,77
0,00947
15,2'
—400
-2,13+/11,3
при среднеквад-
ратическом вход-
входном напряжении
1,5В
1,5
0,0406
15,8
—350
—2,15+/9,92
Нетрудно найти параметры регулятора первого порядка
E.270), при которых минимизируется критерий E.269). В данном
случае можно определить точные выражения'для среднеквадрати-
ческой ошибки регулирования и входного напряжения. Численная
или аналитическая оценка оптимальных величин параметров при
р = 0,00002 рад2/В2 приводит к значениям-
8 = — 400 с, е = 6,75 • 10* В/(рад • с) E.272)
Характеристики полученного регулятора указаны во второй
колонке табл. 5.2. Видно, что среднеквадратическая величина вход-
входного напряжения у этого регулятора больше, чем у оптимального
регулятора второго порядка. Несколько увеличиваяр, получаем
регулятор первого порядка с таким же среднеквадратичееким зна-
значением входного напряжения, как и у регулятора второго порядка.
В третьей колонке табл. 5.2 указаны характеристики регулятора
СУ с обратной связью то выходной переменной 499
второго порядка. Регулятор характеризуется следующими значе-
значениями параметров:
6 = — 350 с, в = 4,65 • 10* В/(рад • с). E.273)
Сравнение данных, приведенных в табл. 5.2, показывает, что
оптимальный регулятор первого порядка имеет среднеквадрати-
ческую ошибку регулирования, которая приблизительно в 1,5 ра-
раза больше, чем у регулятора второго порядка. Приемлемо это или
нет, зависит от назначения системы. Заметим, что доминирующие
полюса замкнутой системы управления пониженного порядка (в
точках —2,15 ± /9,92) удалены от доминирующих полюсов систе-
системы второго порядка (в точках —9,66 ± /9,09). Наконец, нахо-
находим, что передаточная функция регулятора первого порядка равна
G (s) = _i- = 4-^-^i В/рад. E.274)
- s — s s + 350
Этот регулятор имеет очень широкую полосу пропускания.
Если.полоса пропускания шума наблюдений (который аппрокси-
аппроксимируется белым шумом, однако на практике имеет ограниченную
полосу пропускания) не больше полосы пропускания регулятора,
то регулятор можно заменить постоянным коэффициентом усиле-
усиления
- 4'65'104 »133-В/рад. E.275)
Однако при этом предполагается, что процедуру оптимизации,-
возможно, придется повторить, вводя шум наблюдений с соответ-
соответствующей полосой пропускания и определяя регулятор нулевого
порядка в виде постоянного коэффициента усиления.
6.8. 'Заключение
В этой последней главе, посвященной синтезу непрерывных
оптимальных линейных систем управления с обратной связью,
было показано, каким образом можно объединить результаты
предыдущих глав р целью построения оптимальных систем управ-
управления с обратной связью по выходной переменной. Был также про-
проведен анализ свойств таких систем. В табл. 5.3 указаны основные
свойства и характеристики линейных оптимальных систем управ-
управления полного порядка с обратной связью по выходной переменной.
Рассмотрим сначала аспекты вычислений. Для синтеза линей-
линейной оптимальной системы обычно необходимо использовать вы-
вычислительную машину, и это вряд ли вызовет возражение в связи
с широкой доступностью вычислительных средств. В действитель-
действительности необходимость использования ЦВМ можно рассматривать
17*
500 Глава 5
Таблица 5.3
Характеристики линейвых оптимальвых систем управления
с обратной связью
Характеристики системы
Устойчивость гарантируется
Можно получить хорошие реакции на начальные
условия и ва эталонную переменную
Имеется информация о полюсах замкнутой системы
Легко регулируется амплитуда входной переменной
или, что эквивалентно, коэффициент усиления
Можно получить хорошее противодействие возмуще-
возмущениям
Можно получить адекватное противодействие шуму
наблюдений
Система управления обеспечивает противодействие
изменению параметров объекта
Для синтеза системы управления обычно необходимо
цифровое моделирование
Система управления может оказаться довольно слож-
сложной
Характеристики:
благоприятные (+)
нейтральные (?)
неблагоприятные (—)
+
+
+
+
+
+
D
как преимущество, .так как можно разработать вычислительные
программы, которые в значительной степени автоматизируют про-
процедуру синтеза системы управления и в то же время дают весьма
детальную информацию о разрабатываемой системе. В табл. 5.4
перечислены различные подпрограммы, которые могут содержать-
содержаться в библиотеке вычислительных программ для синтеза и анализа
непрерывных линейных оптимальных систем управления с посто^
янными параметрами. Помимо перечисленных подпрограмм в такой
библиотеке должны быть программы для координации подпрограмм
и обработки данных.
Сложность линейных оптимальных регуляторов с обратной
связью по выходной переменной является серьезной проблемой.
В разд. 5.7 обсуждались методы построения регуляторов понижен-
пониженной сложности. Однако опыт применения таких методов синтеза
в настоящее время пока недостаточен для того, чтобы можно было
сделать вывод, что этот метод решает проблему сложности регуля-
регуляторов.
Перспектива практического применения линейной теории оп-
оптимального управления для решения реальных и сложных линей-
линейных задач управления весьма привлекательна. Действительно,
эта теория является достойным преемником традиционной теории
управления.
СУ с обратной связью по выходной переменной
501
Таблица 5.4
Вычислительные подпрограммы для анализа и синтеза
линейной оптимальной системы управления
с обратной связью по выходной переменной
Назначение подпрограммы
Вычисление матричной экспоненты
Моделирование линейной системы с постоянными
ПО riuliОТТ1 ^ TLMTM
lid UcLMC 1 рЛш.11
Вычисление передаточной матрицы и характеристи-
характеристических чисел линейной системы с постоянными па-
паматп&шп
pdMBIJJciniU
Вычисление нулей квадратной передаточной матрицы
Моделирование линейной системы с постоянными па-
параметрами, возмущаемой белым шумом
Решение линейного матричного уравнения МгХ -\-
. | Y ЛЛ — JVT
"у*Л Irl q ¦"¦* 3
Решение алгебраического уравнения Риккати и вы-
вычисление соответствующих полюсов замкнутого ре-
регулятора и полюсов наблюдателя
Численный расчет оптимального регулятора пони^
женного порядка
Описание (раздел)
1.3.2
1:3.2
1.5.1
1.5.3
1.11.2
1.11.3
3.5
. 5.7.3
6.9. Задачи
5.9.1. СИСТЕМА РЕГУЛИРОВАНИЯ УГЛОВОЙ СКОРОСТИ
Рассматривается система регулирования угловой скорости,
описывается дифференциальным уравнением состояния
-а?(О
E.276)
Здесь \ — угловая скорость; ц, — управляющее напряжение;
wi — возмущение, представляемое4 в виде белого шума с интенсив-
интенсивностью N. Управляемой переменной является угловая скорость
' E-277)
Наблюдаемой переменной также является угловая скорость
l(t) + w2(t), E.278)
где и>2 — белый шум с интенсивностью М. Принимаются следующие
численные значения:
502 Глава 5
а = 0,5 с,
х= 150 рад/(В-с2),
E.279)
N = 600 рад2/с3,
М = 0,5 рад2/с.
Предполагается, что рассматриваемая система должна быть сис-
системой регулирования, поддерживающей постоянную величину
угловой скорости. Постройте оптимальный регулятор с обратной
связью по выходной переменной так, чтобы среднеквадратическая
величина входного напряжения была равна 10 В. Вычислите сред-
неквадратическую ошибку регулирования и -сравните ее со сред-
неквадратичеекой ошибкой регулирования для случая, когда уп-
управление отсутствует. v
5.9.2. СИСТЕМА ОТСЛЕЖИВАНИЯ УГЛОВОЙ СКОРОСТИ
Предполагается, что систему из задачи 5.9.1 необходимо преоб-
преобразовать в систему отслеживания угловой скорости. Для эталон-
эталонной леременной принимается экспоненциально коррелированный
шум с постоянной времени 9 и среднеквадратической величиной
ст. Кроме того, предполагается, что эталонная переменная изме-
измеряется с аддитивным белым шумом с интенсивностью Мг. Построй-
Постройте оптимальную следящую систему. Примите следующие значения:
6 = 1 с,
а = 30 рад/с, . E.280)
Мг = 0,8 рад2/с3.
Определите такую оптимальную следящую систему, чтобы сум-
суммарная среднеквадратическая величина входного воздействия
составляла 10 В. Вычислите суммарную среднеквадратическую
ошибку слежения и сравните ее со среднеквадратической величи-
величиной эталонной переменной. ¦>
5.9.3. СИСТЕМА УПРАВЛЕНИЯ УГЛОВОЙ СКОРОСТЬЮ
С НЕНУЛЕВОЙ ЗАДАННОЙ ТОЧКОЙ
Следящая система из задачи 5.9.2 не обладает тем свойством,
что при постоянной величине эталонной переменной установившая-
установившаяся ошибка слежения равна нулю. Чтобы построить такой регуля-
регулятор, нужно провести синтез регулятора е ненулевой заданной точ-
точкой, как предлагалось в разд. 5.5.1. Для закона управления с
обратной связью по состоянию выбирается закон, полученный в
задаче 5.9.1. Предварительный фильтр выбирается так, чтобы сту-
СУ с обратной связью по выходной переменной i 503
пенчатому изменению эталонной переменной на 30 рад/с соответ-
соответствовало пиковое входное напряжение 10 В или меньше. Сравните
получившийся регулятор с регулятором из задачи 5.9.2.
5.9.4*. ИНТЕГРАЛЬНОЕ УПРАВЛЕНИЕ СИСТЕМОЙ
РЕГУЛИРОВАНИЯ УГЛОВОЙ СКОРОСТИ
Рассматривается система регулирования угловой скорости,
описанная в задаче 5.9.1. Предполагается, что в дополнение
к переменному возмущению, представленному шумом wt(t), суще-
существует также постоянное возмущение vo(ty, действующее на двига-
двигатель постоянного тока, так что дифференциальное уравнение
состояния принимает вид
i(t)=raZ(t) + *V.(t)+.u>l(t) + v0(t). E.281)
Наблюдаемая переменная определяется выражением E.278),
и принимаются численные значения E.279). Управляемая перемен-
переменная задается выражением E.277). Постройте для данного, случая
регулятор с нулевой установившейся ошибкой, как в разд. 5.5.2.
С этой целью предположите, что vQ(f) представляется в виде интег-
интегрального белого шума, и примите интенсивность этого белого шума
равной 250 рад2/с2. Вычислите реакцию системы на ступенчатое
изменение постоянного возмущения v0 на 50рад/с2 из установивших-
установившихся условий и проанализируйте эту реакцию. Каков эффект увели-
увеличения или уменьшения принятой интенсивности белого шума
B50 рад2/с3)?
5.9.5*. СОПРЯЖЕННЫЕ МАТРИЧНЫЕ
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
Рассматривается матричное дифференциальное уравнение
Q{t) = A(t)Q(t) + Q(t)AT{f) + R(t), Q(to) = Qo, E.282)
совместно с линейным функционалом
tr m?(*)'s'(O<ft + (?(*i)J\ • E.283)
Докажите, что выражение E.283) равно
tr Г P(t)R(t)dt + P(to)Qo], E.284)
504 Глава 5
His)
G(s)
z(t)
Рис. 5.14. Линейная система управления с обратной связью и постоянными
параметрами.
где P(t) — решение сопряженного матричного дифференциального
уравнения
T ,- P{tl)=Pl. E.285)
5.9.6*. СВОЙСТВА СКАЛЯРНЫХ
ФУНКЦИЙ ЧУВСТВИТЕЛЬНОСТИ
В разд. 5.6 отмечалось, что в оптимальных линейных системах
с обратной связью по выходной переменной обычно не происходит
ослабление возмущений на всех частотах в сравнении с эквивалент-
эквивалентной разомкнутой системой. Для систем со скалярными входной и
выходной переменными это вытекает из следующей теоремы
[21, 176].
Рассмотрим линейную систему с одним входом и одним выходом
с постоянными параметрами и передаточной функцией H(s). Обоз-
Обозначим передаточную функцию регулятора (рис. 5.14) через G(s);
передаточная функция всей системы управления определяется
выражением
E.286)
E.287)
Обозначим через v разность степени знаменателя L(s) и числи-
числителя. Предполагается, что система управления асимптотически
устойчива.
L(s) = H(s)G(s).
Функция чувствительности равна
5(s)=^'
СУ с обратной связью по выходной переменной
505
Тогда
где
zt oo при v = О,
— i-j при v= 1, E.288)
О при v = 2,
= lim sL(s). E.289)
Докажите этот результат. Сделайте вывод, что для объектов
и регуляторов без прямых связей неравенство
|5(/<в)|<1 E.290)
выдерживается не при всех со. Указание: интегрируйте ln[?(s)]
по контуру, который состоит из участка мнимой оси, охватываемо-
охватываемого полуокружностью в правой половине комплексной s-плоскости,
когда радиус полуокружности стремится к бесконечности.
6 ЛИНЕЙНАЯ ТЕОРИЯ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
ДЛЯ ДИСКРЕТНЫХ СИСТЕМ
6.1. Введение
В предыдущих главах подробно изложена линейная теория уп-
управления для непрерывных систем. В данной главе дается сжатый
обзор этой теории для дискретных систем. Поскольку теория ли-
линейных дискретных систем тесно связана с теорией линейных не^
прерывных систем, многие результаты являются подобными. По
этой причине комментарии в тексте главы являются краткими, за
исключением тех случаев, когда результаты для дискретных систем
значительно отличаются от непрерывного случая. По той же при-
причине опущены многие доказательства.
Дискретные системы можно разделить на два типа.
1.Собственно дискретные системы, такие, как цифровые вычис-
вычислительные машины, цифровые фильтры, монетные автоматы и сис-
системы релейной автоматики. Состояние таких систем принято рас-
рассматривать только в дискретные моменты времени; то, в каком
состоянии находится система в промежуточные интервалы вре-
времени, не имеет значения.
2. Дискретные системы, которые получаются в результате ис-
использования непрерывных систем только в дискретные моменты
времени. Либо это делается по причине удобства (например, при
исследовании непрерывной системы с помощью ЦВМ), либо такие'
системы возникают естественно, когда непрерывные системы сое-
соединяются с собственно цифровыми системами (такими, как цифро-
цифровые регуляторы или цифровые управляющие машины).
Теория дискретного линейного оптимального управления пред-
представляет большой интерес в связи применением ее при цифровом
управлении.
6.2. Теория линейных дискретных систем
6.2.1. ВВЕДЕНИЕ
Ниже дается краткий обзор теории линейных дискретных систем.
Раздел построен в соответствии с планом гл. 1. Многие результаты,
приведенные в данном разделе, более детально обсуждаются в
книге [64].
Теория для дискретных систем 507
6.2.2. ОПИСАНИЕ СОСТОЯНИЯ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ
В ряде случаев используются системы, функционирование
которых представляет интерес лишь в определенные моменты вре-
времени tt, i = 0, 1, 2, .... В таких случаях доведение системы часто
можно характеризовать дискретными значениями, определенными
в эти моменты времени. Для таких систем естественным эквивален-
эквивалентом дифференциального уравнения состояния является разност-
разностное уравнение состояния
*(« + 1) = /И0, "@. SL F-1)
где x(i) — состояние, a u(i) — входная переменная в момент вре-
времени tt. Подобным же образом предположим, что выходная пере-
переменная в момент времени tt определяется уравнением еыходндй
переменной
() {), u(i), i). F.2)
' Линейные дискретные системы описываются разностными урав-
уравнениями состояния вида
x(i + l) = A(iyx(i) + B{i)u(i), F.3)
где A(i) и B(i) — матрицы соответствующих размерностей. Соот-
Соответствующее уравнение выходной переменной имеет вид
y(t) = C{i)x{i) + D(i)u{i). F.4)
Если матрицы А, В, С и D не зависят от i, то система имеет
постоянные параметры. ^
Пример 6.1. Счет сберегательной кассы
Пусть скалярная величина х(п) является балансовым счетом
сберегательной кассы в начале и-го месяца, а а — месячная про-
процентная ставка. Пусть также скалярная величина и(п) обозначает
итог взносов и изъятых сумм в течение и-го месяца. Полагая, что
величина капитала вычисляется ежемесячно на основании баланса
на начало месяца, последовательность х(п), п = 0, 1, 2, ..., удов-
удовлетворяет линейному разностному уравнению
*(n + l)«(l+a)*(n) + u(n), n = 0,1, 2 F.5)
где х0 — начальный баланс. Эти уравнения описывают линейную
дискретную систему с постоянными параметрами.
6.2.3. СОЕДИНЕНИЯ ДИСКРЕТНОЙ И НЕПРЕРЫВНОЙ СИСТЕМ
Часто встречаются системы, состоящие из дискретной и непре-
непрерывной систем. Примером, представляющим особый интерес, явля-
является система, где ЦВМ используется для управления непрерывным
508 Глава 6
fit)
fit)
Импульсный
элемент
i i i
to ti tz t3
Время
tot, h t3
Время
Рис. 6.1. Преобразование непрерывной функций в дискретную.
объектом. В таких системах должны иметься некоторые согласую-
согласующие устройства, которые осуществляют связь между дискретной и
непрерывной системами. Рассмотрим два наиболее простых вида
согласующих устройств, а именно преобразователи непрерывной
величины в дискретную (Н/Д) и преобразователи дискретной вели-
величины в непрерывную (Д/Н).
Преобразователь Н/Д называется также импульсным элемен-
элементом (рис. 6.1); он является прибором, образующим из непрерыв-
непрерывной функции на его входе/(?), t > t0, последовательность действи-
действительных чисел/+@, i = 0, 1, 2, ..., на его выходе в моменты
времени tt, i = 0, 1, 2, ..., при этом справедливо следующее со-
соотношение:
Последовательность моментов времени tu i = О, 1, 2, ...,
t0 < ti < tz < •••) задается. Надстрочный индекс + в данном раз-
раздело используется, чтобы отличать последовательности от соот-
соответствующих непрерывных функций.
Преобразователь Д/Н является прибором, на который поступает
последовательность чисел/+(i), i = 0, 1, 2, ..., в данные моменты
времени tt, i = 0, 1, 2, ..., t0 <C tt
t2
..., и который выра-
вырабатывает непрерывную функцию f(i), t > t0, в соответствии с за-
заданным предписанием. Рассмотрим самый простой тип преобразо-
преобразователя: Д/Н, известный под названием фиксатор нулевого порядка.
Другие преобразователи описываются в соответствующей литера-
литературе (см., например, [156]). Фиксатор нулевого порядка (рис.
6.2) описывается соотношением
tt<t<tM, « = 0,1,2,.... F.7)
Рис. 6.3 иллюстрирует типичный пример соединения дискрет-
Теория для дискретных систем
509
fit)
од
Время
Время
Рис. 6.2. Преобразование дискретной функции в непрерывную
Дискретная
система
rfOl
фиксатор
нулевою
порядка
Непрерывная
система
Импульс-
Импульсный
элемент
Дискретная
система
¦ '^Эквивалентная дшкретная_сиспкма _|
Рис. 6.3. Соединение дискретной и непрерывной систем.
ной и непрерывной систем. При анализе такой системы часто
удобно рассматривать непрерывную систему вместе с преобразова-
преобразователями Д/Н и Н/Д как эквивалентную дискретную систему.
С целью показать, как определяется эквивалентная система в кон-
конкретном случае, предположим, что преобразователь Д/Н является
фиксатором нулевого порядка, а преобразователь Н/Д — импульс-
импульсным элементом. Кроме того, предположим, что непрерывная сис-
система на рис. 6.3 является линейной системой с дифференциальным
уравнением состояния
и уравнением выходной переменной
Поскольку используется фиксатор нулевого порядка,
и(*) = u(<i), tt<t<tM, i = 0,l, 2
Тогда, используя A.61), можно записать выражение для
ния системы в момент времени tt+i:
F.8)
F.9)
имеем
F.10)
состоя-
состоя, F.11)
510 Глава 6
где Ф(?, t0) — переходная матрица системы F.8). Это выражение
является линейным разностным уравнением состояния вида F.3).
При выводе соответствующего уравнения выходной переме'нной
предположим, что моменты времени, в которые квантуется выход-
выходная переменная, могут не совпадать с моментами, в,которые изме-
изменяется входная переменная. Таким образом, рассмотрим выходную
переменную в i-м интервале квантования, которая определяется как
У [ti], F.12)
где
ti^t)<tux, F.13)
при i = 0, 1, 2,.... Напишем
h 1
с(*;)jф(*;,-с)в(т)d-. и(tt) + D[t,)u(«о. F.i4)
Заменяя теперь x(tt) на x*(i), u(tt) на u+(i), a y(t't) на y+(i), за-
запишем уравнения системы в виде
x+{t + l) = Ad(t)**(i) + Bd{i)u4l),
y+(i) = Cd(i)x+(i) + Dd{L)u+(i), i = 0,1,2 F.15)
где
F.16)
n
Заметим, что дискретная система, описываемая уравнениями
F.15), имеет прямую связь даже в том случае, если непрерывная
система, ее не имеет, потому что Dd(i) может отличаться от нуля,
даже когда D(t't) является нулем. Прямая связь, однако, отсутст-
отсутствует, если D{t) = Ои моменты t' г совпадают с моментами tu т. е.
t't = tit i = 0, i, 2, ... .
В особом случае, когда моменты квантования равноудалены
друг от друга, напишем
tM-tt = b F.17)
Теория для дискретных систем
511
Цифровая
вычислительная
машина
Фиксатор
нулевого
порядна
p(t)
Система
управления
положением
Импульсный
элемент
Рис. 6.4. Цифровая система управления положением.
t[—ti = A', F.18)
Дискретная система F.15), как и система F.8),F.9), также явля-
является системой е постоянными параметрами, и
А \
В, F.19)
ко J
' Д'
ЛА'
СИ = Се
Назовем А периодом дискретности, a VA — скоростью повто-
повторения.
После того, как получены дискретные уравнения, которые опи-
описывают непрерывную систему вместе с преобразователями, имеет-
имеется возможность изучать соединение такой системы с другими дис-
дискретными системами.
Пример 6.2. Цифровая система управления положением
Рассмотрим непрерывную систему управления положением из
примера 2.4 (разд. 2.3), которая описывается дифференциальным
уравнением состояния :
(О- F.20)
Предположим, что эта система является частью системы управ-
управления, которая управляется цифровой вычислительной машиной
(рис. 6.4). Фиксатор нулевого порядка производит кусочно-пос-
кусочно-постоянную входную функцию n(t), которая изменяет значение в рав-
равноотстоящие моменты времени, разделенные интервалами длиной
А. Переходная матрица системы F.20) равна
а
е~
F.21)
Отсюда нетрудно найти, что дискретное описание системы уп-
управления положением имеет вид
512 Глава 6
x+(i + 1) = Ax+(i) + fe[x+(i), ~ F.22)
где
(\ _L (i __ в-аД1\
F.23)
F.24)
Заметим, что хAг) заменено на x+(i), а ц(?г) — на ц.+(?)« При чис-
численных значениях
a =4,6 с,
х = 0,787 рад/(В-с2), F.25)
' Д = 0,1 с
получим разностное уравнение состояния
0,6313 Iх W
Пусть выходная переменная ц (t) непрерывной системы, где
Ч(О = A, O)x(t), F.27)
квантуется в моменты времени tit i — 0, 1, 2, ... . Тогда уравне-
уравнение для выходной переменной дискретной системы имеет вид
¦n+(i) = (i, 0)^+(г), . F.28)
где т] (tt) заменено на r\+(i).
Пример 6.3. Смесительный бак
Рассмотрим смесительный бак из примера 1.2 (разд. 1.2.3) и
предположим, что процессом управляет ЦВМ. В результате кла-
клапанная регулировка изменяется только в дискретные моменты вре-.
мени и остается постоянной в интервале между ними. Предполо-
жим, что эти моменты разделены временным интервалом постоян-
постоянной длины А. Непрерывная система описывается дифференциаль-
дифференциальным уравнением состояния
\u(t). F.29)
еЗ — се »
У,
Теория для дискретных систем
513
Расход Fr
Концентрация с}
Расход f2
Концентрация сг
Запаздывание
т
Объем V
Концентрация с
I Выходной расход F
^¦Концентрация с
Рнс. 6.5. Модифицированный смесительный бак.
где
Нетрудно найти, что дискретное описание имеет вид
x*(i + l) = Ax+(i) + Bu+(i),
О \ ' '
В
^2вD-е-*/B8)) 29A
,-А/»ч
|. F.30)
514 Глава 6
При численных значениях из примера 1.2 получим
F.31)
А _ /0,9512 0
\ О 0,9048
( 4,877 4,877\
^—1,1895 3,-569/ *
где выбрано
А = 5 с. F.32)
Пример 6.4. Смесительный бак с временнйм запаздыванием ,
В качестве примера системы с временным запаздыванием рас-
рассмотрим смесительный бак с дополнительным устройством, пока-
показанный на рис. 6.5. Здесь потоки перемешиваются до того, как они
поступают в бак. Это не приводит к какому-либо изменению дина-
динамического поведения системы, если не учитывать запаздывание т,
которое имеет место в общей секции трубы.
Переписывая выражение для баланса масс и проводя линеари-
йацию, найдем, что уравнения системы теперь имеют вид -
МО+ «*•(*). (б.зз)
=-у 5,@
где символы имеют те же самые значения, что и в примере 1.2
(разд. 1.2.3). Запишем уравнение в векторной форме
F-34)
Заметим, что изменения в расходах оказывают немедленное
влияние на объем, но запаздывающее влияние на концентрацию.
Предположим теперь, что бак является частью системы, уп-
управляемой от ЦВМ, так что клапанная регулировка изменяется
только в фиксированные моменты времени, разделенные интерва-
интервалами длиной А. Для удобства предположим, что временное запаз-
запаздывание равно к А, т. е. кратно периоду дискретности. Это означает,
что разностное уравнение состояния дискретной системы записы-
записывается в форме
х+ (i + 1) = Ах+ (i) + Btu+ @ + Б^и* (i — к). F,35)
Теория для дискретных систем
515
Можно показать, что при численных значениях из примера 1.2
и периоде дискретности
Д=5 с F.36)
матрица .А определяется выра>кением F.31), тогда как
/4,877 4,877
==( 0 0 }
0
О
— 1,1895 3,569/•
F.37)
Нетрудно привести разностное уравнение F.35) к стандартной
форме разностцого уравнения состояния. Проиллюстрируем это
для случая к == 1 (эффект действия от изменения клапанной регу-
регулировки задерживается на один интервал дискретности). В этом
случае, чтобы вычислить эффект от изменения клапанной регули-
регулировки, требуется помнить регулировку на предыдущем интервале.
Определим вектор расширенного состояния
F.38)
Используя зго определение, нетрудно найти, что в терминах
расширенного состояния система описывается разностным урав-
уравнением состояния
где
х> (i + 1) = А'х' @ + В'и* (О,
^0,9512 0 0 0
О 0,9048 —1,1895 3,569
0 0 0 0
0 0 0 0
F.39)
F.40)
Отметим, что матрица А' имеет два характеристических числа,
равных нулю. Дискретные системы, представляющие собой конеч-
конечномерные линейные дифференциальные системы с постоянными
параметрами и кусочно-постоянным входным сигналом, никогда
не имеют нулевых характеристических чисел, поскольку для таких
систем Ad — ехр(Л А) и всегда является неособой матрицей.
516 Глава 6
6.2.4. РЕШЕНИЕ РАЗНОСТНЫХ УРАВНЕНИЙ СОСТОЯНИЯ
Для решения разностных уравнений состояния имеем следую-
следующую теорему, аналогичную теоремам 1.1 и 1.3 (разд. 1.3).
Теорема 6.1. Рассмотрим разностное уравнение состояния
x(i + l) = A(t)x(i) + B(i)u(t). F.41)
Решение этого уравнения может быть представлено в виде
х (») = Ф (i, i0) х (i0) + 2 Ф (i, J + 1) В (j) и (j), i>io+l, F.42)
/=»¦„
где Ф(г, i0), i > i0, является матрицей
/ тгрц i = i0.
Переходная матрица Ф fj, ioj является решением раз-
разностного уравнения
Ф(*Ч-1, »«) = 4@Ф(Мо). *>*о.
F.44)
Ф (го. *о) = 7-
?"сли Л^М ке зависит от i, то
ФA, to) = Al-\ F.45)
Предположим, что система имеет выходную переменную
y(i) = C(i)x(i). F.46)
Если начальное состояние равно нулю, т. е. x(i0) = 0, то с
помощью F.42) можно написать
i
y(i) = ^ K{i, /)"(/). i » h-
/•='. •
Функцию
о /=-*%
назовем матричной импульсной переходной функцией системы.
Заметим, что в случае постоянных параметров К зависит только от
i—j. Если система имеет прямую связь, т. е. выходная переменная
определяется как
C(i)x(i) + D(i)u(i), F.49)
Теория для дискретных систем , 517
то выходная переменная может быть представлена в форме
i
y(i)=^K(i, j)u(j), i>>i0, F.50)
где
для /< i — 1,
D(i) для/-I. F1)
Также для случая дискретных линейных систем с постоянными
параметрами отметим, что диагонализация матрицы А иногда яв-
является полезной. Подытожим полученные результаты.
Теорема 6.2. Рассмотрим разностное уравнение состояния с
постоянными параметрами
х (i + I) = Ax (i). F.52)
Цредположим, что матрица А имеет п различных характерис-
характеристических чисел Xi, X2i •••! Хп с соответствующими собственными
векторами ех, е.г, ..., еп. Определим п X п-матрицы:
Т = (е{, е2,...,еп), F.53)
A = diag(X1, Х2,... Д„).
Тогда переходная матрица разностного уравнения состояния
F.41) может быть записана в виде
Ф (i, i0) = A1'1' = ТА^'Т-К F.54)
Предположим, что обратную матрицу Т~1 можно, представить
в виде
<и
F.55)
где fv fn ¦¦' fn — векторы-строки. Тогда решение разностного
уравнения F.52) может быть выражено как
Я!(О = 2^~"в/;я:о, F-56)
/=i
где х0 = x(i0).-
Выражение F.56) показывает, что поведение системы может
быть описано композицией расходящихся (при |Х^|> 1), устано-
установившихся (при | Ху| = 1) или сходящихся (при |А,у| < 1) движений
но собственным векторам матрицы А.
518 Глава 6
6.2.5. УСТОЙЧИВОСТЬ
В разд. 1.4 для непрерывных систем определены следующие
формы устойчивости: устойчивость в смысле Ляпунова, асимптоти-
асимптотическая устойчивость, асимптотическая устойчивость в целом и
экспоненциальная устойчивость. Все определения для непрерыв-
непрерывного случая распространяются на дискретный случай, если пере-
переменная непрерывного времени t заменяется переменной дискрет-
дискретного времени i. Устойчивость дискретных линейных систем с пос-
постоянными параметрами может быть исследована на основании
следующих результатов.
Теорема 6.3. Линейная дискретная система с постоянными пара-
параметрами
x(l + l) = Ax(i) F.57)
устойчива в смысле Ляпунова тогда и только тогда, когда
а) все характеристические числа матрицы А имеют модуль,
не превышающий 1, и
б) любому характеристическому числу с модулем, равным 1,
кратности т точно соответствует т собственных векторов мат-
матрицы А.
Доказательство этой теоремы для случая, когда матрица А
не имеет кратных характеристических чисел, легко проводится на
основании уравнения F.56).
Теорема 6.4. Линейная дискретная система с постоянными пара-
параметрами
' x{i+l) = Ax{i) F.58)
асимптотически устойчива в том и только том случае, если все
характеристические числа матрицы А по модулю строго меньше 1.
Теорема 6.5 Линейная дискретная система с постоянными пара-
параметрами
x(i + 1) = Ax(i) F.59)
экспоненциально устойчива в том и только том случае, если она
асимптотически устойчива.
Видно, что та роль, которую при анализе непрерывных систем
играет левая половина комплексной плоскости, в случае дискрет-
дискретных систем принадлежит единичному кругу. Аналогичным обра-
образом правая полуплоскость заменяется областью, лежащей вне
единичного круга, а мнимая ось — единичной окружностью.
Совершенно аналогична случаю непрерывных систем опреде-
определим подцространство устойчивых состояний линейных дискретных
систем.
Теория для дискретных систем 519
Определение 6.1. Рассмотрим п-мерную линейную дискретную
систему с постоянными параметрами
F.60)
Предполджим, что матрица А имеет п различных характерис-
характеристических чисел. Определим подпространство устойчивых состоя-
состояний этой системы как действительное линейное подпространство,
порожденное теми собственными векторами матрицы А, которые
соответствуют характеристическим числам, по модулю строго
меньшим 1. Аналогично подпространством неустойчивых состоя-
состояний системы яёляется действительное подпространство, порожден-
порожденное теми собственными векторами матрицы, А, которые соответ-
соответствуют характеристическим числам, по модулю равным или пре-
превышающим 1.
Для систем, где характеристические числа матрицы А не явля-
являются различными, имеем следующее определение.
Определение 6.2, Рассмотрим п-мерную линейную дискретную
систему с постоянными параметрами
F.61)
Пусть Nj — нуль-пространство матрицы (А — 'k/Jnij, где
Х;- — характеристическое число матрицы A, a mj — кратность
этого характеристического числа в характеристическом полиноме
матрицы А. Определим тогда подпространство устойчивых сос-
состояний системы как действительное подпространство прямой
суммы тех нуль-пространств Nj, которые соответствуют ха-
характеристическим числам матрицы А, по модулю меньшим 1^
Подобным же образом, подпространство неустойчивых состояний
является действительным подпространством прямой суммы тех
нуль-пространств Nj, которые соответствуют характеристичес-
характеристическим числам матрицы А, по модулю большим или равным 1.
Пример 6.5. Цифровая система управления положением
Нетрудно найти, что характеристические числа цифровой сис-
системы управления положением из примера 6.2 (разд. 6.2.3) равны 1
и ехр(—аД). Отсюда следует, что система является устойчивой в
смысле Ляпунова, но не асимптотически устойчивой.
6.2.6. АНАЛИЗ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ НА ОСНОВЕ
z-ПРЕОВРАЗОВАНИЯ
Естественным эквивалентом преобразования Лапласа для не-
непрерывных переменных является z-преобразование для дискретных
последовательностей. Определим z-преобразоваяие V(z) последо-
520 Глава в
вательности векторов v(i), i =0,1, 2, ..., в виде
, ' F-62)
где z — комплексная переменная. Это преобразование определя-
определяется для тех значений z, для которых сумма сходится.
Для иллюстрации применения z-преобразования к анализу
линейных дискретных систем с постоянными параметрами рассмот-
рассмотрим разностное уравнение состояния
x(t + i) = Ax(i) + Bu(t). F.63)
Умножение обеих частей уравнения F.63) и суммирование ло
i = 0, 1, 2, ... дает
zX(z) — zx(O) = AX(z) + BU(z), F.64)
где X(z) — z-преобразование переменной x(l), i = 0, Д, 2, ...,
a U(z) — преобразование u{i), i = 0, 1, 2, .... Решая относитель-
относительно X(z), получаем
X (z) = (z/ — A)'1 BU(z) + (zI—A)-1 zx@). F.65)
При вычислении (z/ — А)'1 может оказаться полезным алго-
алгоритм Леверье (теорема 1.18, разд. 1.5.1). Предположим, что вы-
выходная переменная y(i) определяется как
y(i)=Cx(i) + Du(l). F.66)
Преобразование этого выражения и подстановка F.65) при
х@) =0 дают в результате
Y(z) = #(z)U(z), F.67)
где Y(z) — z-преобразование y(i), i = 0, 1, 2, ..., а
AY1B + D F.68)
есть матричная z-передаточная функция системы.
Для вычисления обратного преобразования z-преобразованных
выражений существует несколько методов, которые читатель мо-
может найти в соответствующей литературе [156].
Нетрудно доказать, что матричная z-передаточная функция
системы H(z) является z-преобразованием матричной импульсной
переходной функции системы. Пусть K(i — /) — матричная им-
импульсная переходная функция системы с постоянными парамет-
параметрами. Тогда
F-69)
Теория для дискретных систем 521
Заметим, что H(z) обычно записывается в форме
Я(г)= ??>—, F.70)
v ; det (zI-A) '
где P(z) — матричный полином по z. Очевидно, что полюса мат-
матричной передаточной функции являются характеристическими чис-
числами матрицы А, если член вида z — Х;- не сокращается во всех
элементах матрицы H(z), где х, — характеристическое число мат-
матрицы А.
Так же, как и в разд. 1.5.3, для случая, когда H(z) является
квадратной матрицей, имеем
det [Я(*)] = ±« F.71)
<р B)
где ф(г) — характеристический полином tp(z) = det(z/—А), а
ф(г) — полином по z. Корни полинома ф(г) назовем нулями^ сис-
системы.
Частотную характеристику дискретной системы удобно ис-
исследовать с помощью матричной z-передаточной функции. Предпо-
Предположим, что имеем комплексную входную переменную вида
u(i) = umePl, 1 = 0, 1, 2 F.72)
где / = У—1.' Назовем величину 9 нормированной угловой час
тптой- Попытаемся сначала найти частное решение разностного
уравнения состояния F.63) в виде
xp(i) = xju, i = 0,1,2,.... F.73)
Нетрудно установить, что это частное решение описывается
выражением
xp(i) = ( e'V -Л) &*„«'¦", i = 0, 1, 2,... . F.74)
Общее решение однородного разностного уравнения имеет-вид
xh(i) = A% F.75)
где а — произвольный постоянный вектор. Общее решение не-
неоднородного разностного уравнения состояния, следовательно,
определяется выражением ,
x(i) = Aia + {e''iI--A)~1BumefH, I =- 0, 1, 2 F.76)
Если система асимптотически устойчива, то первый член при
i —>¦ оо стремится к нулю; тогда второй член соответствует уста-
установившейся реакции состояния на входную переменную F.72).
Соответствующая установившаяся реакция выходной переменной
522 Глава 6
F.66) определяется выражением
у @ = С ( Л - J)-12Ц,У« + DuJ" = Я ( «/») «„/'¦, F.77)
где #(z) — матричная передаточная функция системы.
Видно, что реакция системы на входную переменную вида
F.72) определяется поведением матричной z-передаточной функ-
функции при значениях z на единичной окружности. Установившиеся
реакции на действительные «синусоидальные» входные переменные,
т. е. входные переменные вида
u(i) = acos(i0) + psin(i0), i = 0, 1, 2,..., F.78)
могут быть определены с помощью модулей и аргументов элемен-
элементов матрицы Н(е^). Установившаяся реакция асимптотически
устойчивой дискретной системы с матричной ^-передаточной функ-
функцией H(z) на постоянную входную переменную
u(i) = um, 1 = 0,1,2,.... F.79)
описывается выражением
m. Fr80)
В особом случае, когда дискретная система является эквива-
эквивалентом непрерывной системы с фиксатором нулевого порядка и
импульсным элементом, положим
е = <»Д, - F.81)
где А — период дискретности. Гармоническая входная переменная
и @ = eiU ит = ehMum, i = 0, I, 2,... , F.82)
является дискретным апалогом непрерывной гармонической
функции
еыит, t > 0, F.83)
из которой функция F.82) получается дискретизацией в равноот-
равноотстоящие моменты времени со скоростью повторения 1/Д.
При существенно малых значениях угловой частоты ш частот-
частотная характеристика Н(е1шА) дискретного аналога системы прибли-
приближается к матричной частотной характеристике непрерывной систе-
системы. Заметим, что Я(е'шА) является периодической по ш с периодом
2я/Д. Это вызвано стробоскопическим эффектом; из-за процедуры
дискретизации высокочастотные сигналы не отличимы от низко-
низкочастотных сигналов.
Пример 6.6. Цифровая система управления положением
Рассмотрим цифровую систему управления положением из
Теория для дискретных систем
523
О 20 40 $0 ВО
Зискретная
Рис. 6.6. Частотные характеристики непрерывной .и дискретной систем управ-
управления положением.
примера 6.2 (разд. 6.2.3) и предположим, что в качестве выходной
переменной выбрано положение:
1/@= A, 0)x(i). F.84)
Нетрудяо найти, что s-передаточная функция равна
H(z)=
F 85)
B — 1) (г —0,6313)
На рис. 6.6 показаны графики модуля и аргумента функции
Ще'шЛ), где А = 0,1 с. На том же рисунке показаны соответству-
соответствующие графики частотной характеристики исходной непрерывной
системы, которая описывается выражением
0,787
4,6)
F.86)
Можно видеть, что в области низких частот (до 15 рад/с) частот-
частотные характеристики непрерывной и дискретной систем близки по
модулю, однако дискретный аналог имеет больший сдвиг по фазе.
Графики также иллюстрируют стробоскопический эффект.
6.2.7. УПРАВЛЯЕМОСТЬ
В разд. 1.6 определено понятие управляемости для непрерыв-
непрерывных систем. Это определение распространяется на дискретный слу-
случай, если переменная дискретного времени i заменяет переменную
524 Глава 6
непрерывного времени t. Для управляемости линейных дискрет-
дискретных систем с постоянными параметрами имеем следующий резуль-
результат, который эквивалентен случаю непрерывных систем.
Теорема 6.6. п-мерная линейная дискретная система с постоян-
постоянными параметрами и разностным уравнением состояния
x(i + l) = Ax(i) + Bu(i) F.87)
полностью управляема тогда и только тогда, когда векторы-
столбцы матрицы управляемости
Р = (В, АВ, А2В,..., Ап~хВ) F.88)
порождают п-мерное пространство.
Доказательство читатель может найти, например, в работе
[92]. Здесь необходим следующий комментарий. Часто полная
управляемость определяется как такое свойство, при котором на-
начальное состояние может быть приведено к нулевому состоянию
за конечное число шагов (или за конечный интервал времени в не-
непрерывном случае). Согласно этому определению, система с раз-
разностный уравнением состояния
ж (j+ 1)= 0 F.89)
является полностью управляемой, хотя из интуитивных сообра-
соображений очевидно, что она не является управляемой. Вот почему
определение управляемости обусловлено положением, что система
может быть приведена из нулевого состояния в любое ненулевое
состояние за конечное время. В непрерывном случае в противопо-
противоположность дискретному это различие определений несущественно.
Причина заключается в том, что в последнем случае переходная
матрица Ф(г, ?о)> как видно из выражения F.43), может быть осо-
особой из-за того, что одна или несколько матриц A{j) являются осо-
особыми (см., например, систему из примера 6.4, разд. 6.2.3).
Полная управляемость линейных дискретных систем с пере-
переменными параметрами может быть исследована следующим обра-
образом.
Теорема 6.7. Линейная дискретная система
x(i + l) = A(i)z(i) + B(i)u(i) F.90)
полностью управляема тогда и только тогда, когда для каждого
i0 существует такой момент времени it :> i0 + I, что симметри-
симметрическая, неотрицательно определенная матрица
' BT(i)®T(iu i + l) F.91)
Теория для дискретных систем ч 525
является неособой. Здесь O(i, i0) — переходная матрица системы.
Равномерная управляемость определяется следующим образом.
Определение 6.3. Система с переменными параметрами F.90)
является равномерно полностью управляемой, если суще-
существуют целое число к :> 1 и такие положительные константы а0,
«1, Ро, Pi, что
W(i0, io + /c)>O для всех i0; F.92),
б) q.0I <?.]/?-*¦ (i0, io + k)<.aj для всех i0; F.93)
в) р0/ < Фт (i0 + k, io)W-i{io, 10+к)ФA0+к,10)<.^1дляесехг0
F.94)
Здесь W(i, i^) — матрица F.91), а Ф(г, i0) — переходная
матрица системы.
Заметим, что это определение несколько отличается от соответ-
соответствующего определения для непрерывного случая. Это вызвано
тем, что в дискретном случае не было дано определения переход-
переходной матрицы Ф(г, j0) при i < j0, поскольку оно связано с матрица-
матрицами, обратными A(j), которые могут не существовать.
Для систем с постоянными параметрами имеем следующую тео-
теорему:
Теорема 6.8. Линейная дискретная система с постоянными па-
параметрами
( B F.95)
является равномерно полностью управляемой в том и только том
случае, если она полностью управляемая.
Для систем с достоянными параметрами полезно использовать
понятие подпространства управляемых состояний.
Определение 6.4. Подпространство управляемых состояний ли-
линейной дискретной системы с постоянными параметрами
F.96)
является линейным подпространством, состоящим из состояний,
которые могут быть достигнуты из нулевого состояния за конеч-
конечное число шагов. -
'Весьма удобной является следующая характеристика под-
подпространства управляемых состояний.
Теорема 6.9. Подпространство управляемых состояний п-мер-
ной линейной дискретной системы с постоянными параметрами
Bu{i) F.97)
526 Глава 6
является линейным подпространством, порожденным вектор-
столбцами матрицы управляемости Р.
В дискретных системах также можно осуществить декомпози-
декомпозицию на управляемую и неуправляемую части.
Теорема 6.10. Рассмотрим п-мерную линейную дискретную сис-
систему
. F.98)
Составим неособую матрицу преобразования Т = (Т^Т^^где
столбцы матрицы Тх образуют базис подпространства управляе-
управляемых состояний системы, а столбцы матрицы Тг вместе со столб-
столбцами матрицы Тх порождают все п-мерное пространство.
Определим преобразованную переменную состояния в виде
x%i) = T~lx (i). F.99)
Такая преобразованная переменная состояния удовлетворяет
разностному уравнению состояния
Аи А12\ ( В'Л
о а22; \oj
где пара {A'tl, B\} является полностью управляемой.
Здесь термин «пара {А, В} является полиостью управляемой»
означает краткую запись выражения «система x(i -f- 1) = Ax(i)-\-
+ Bu(i) является полностью управляемой».
Для дискретных систем также может быть введено понятие
стабилизируемое™.
Определение 6.5. Линейная дискретная система с постоянными
параметрами
x(i + l) = Ax(i)+Bu{i) ' F.101)
является стабилизируемой, если подпространство неустойчи-
неустойчивых состояний системы содержится в ее подпространстве управ-
управляемых состояний-
Стабнлнзируемость может быть исследована следующим об-
образом. . ' .
Теорема 6.11. Предположим, что линейная дискретная система
с постоянными параметрами
F.102)
преобразуется, согласно теореме 6.10, к виду F.100). Тогда систе-
система является стабилизируемой в том и только том случае, если все
Теория для дискретных систем 527
характеристические числа матрицы А\г имеют модуль, строго
меньший чем 1.
Аналогично непрерывному случаю определим характеристи-
характеристические числа матрицы А'п как полюса управляемости системы, а
оставшиеся полюса как полюса неуправляемости. Таким образом,
система является стабилизируемой тогда и только тогда, когда все
ее полюса неуправляемости устойчивы (где устойчивый полюс
определяется как характеристическое число системы с модулем,
строго меньшим 1).
6.2.8. ВОССТАНАВЛИВАЕМОСТЬ
Определение восстанавливаемости, данное в разд. 1.7, может
быть применимо для дискретных систем, если переменная непре-
непрерывного времени заменяется переменной дискретного времени.
Восстанавливаемость линейной дискретной системы с постоянными
параметрами может быть исследована следующим образом.
Теорема 6.12. п-мерная линейная дискретная система с постоян-
постоянными параметрами
x(i+l) = Ax(i) + Bu(i),
F.103)
является полностью восстанавливаемой тогда и только тогда, когда
вектор-строки матрицы восстанавливаемости
Q = С А2 F.104)
порождают все п-мерное пространство.
Доказательство зтой теоремы может быть найдено в работе
[125]L В общем случае.системы с переменными параметрами иссле-
исследуются следующим образом.
Теорема 6.13. Линейная дискретная система
x(ii-i) = A(.i)x(i) + B(i)u{i),
F.105)
() C()
является полностью восстанавливаемой в том и только том слу-
случае, если для каждого it существует такой i0 <: ?4 — 1, что сим-
528 Глава 6
метрическая неотрицательно определенная матрица
io + i) F.106)
'=¦'.+1
является неособой. Здесь ФA, io) — переходная матрица системы.
Доказательство этой теоремы имеется в работе [125].
Равномерная полная восстанавливаемость определяется сле-
следующим образом.
Определение 6.6. Система с переменными параметрами F.105)
является равномерно полностью восстанавливаемой, если существу-
существуют целое к 3> ,1 и такие положительные константы а0, а1;
Ро, Pi, что
a) M(i1 — k,i1)>0 для всех ц; . ' F.107)
б)" ao/<Af(i1 — k, ij) < сц/ для всех i,; F.108)
в) p0/<:O(i1, il — k)M-1{il—k, ii)OT(ii,i]i—k)<.^lI длявсех^.
F.109)
Здесь M(i0, i±) — матрица F.106), а ФA, io) — переходная мат-
матрица системы.
Здесь вводится матрица, обратная M(i0, ij), чтобы избежать
определения Ф(?, i0) для i, меньших чем i0.
Для систем с постоянными параметрами имеем следующий ре-
результат.
Теорема 6.14. Линейная дискретная система с постоянными па-
параметрами
х (i + I) = Ax (i), y(i) = Cx(i) F.110)
является равномерно полностью восстанавливаемой в том и только
том случае, если она полностью восстанавливаемая.
Для систем с постоянными параметрами введем понятие под-
подпространства невосстанавливаемых состояний.
Определение 6.7. Подпространство невосстанавливае-
невосстанавливаемых состояний п-мерной- линейной дискретной системы с по-
постоянными параметрами
F.111)
y(i) + Cx{i)
является линейным подпространством, состоящим из состояний
х0, для которых
y(i- хй, ia, O) = o, 1>г0. F.И2)
Теория для дискретных систем 529
Здесь F.112) обозначает выходную переменную у при движе-
движении системы из начального состояния x(i0) = х0 при u(i) =0 ,
i > i0. Следующая теорема дает больше информации о прост-
пространстве невосстанавливаемых состояний.
Теорема 6.15. Подпространство невосстанавливаемых состояний
линейной дискретной системы с постоянными параметрами
+ Bu(i),
F.113)
является нуль-пространством матрицы восстанавливаемости Q.
Используя понятие подпространства невосстанавливаемых сос-
состояний, в линейных дискретных системах также можно осущест-
осуществить декомпозицию на восстанавливаемую и невосстанавливаемую
части.
Теорема 6.16. Рассмотрим линейную дискретную систему с пос-
постоянными параметрами
F.114)
Образуем неособую матрицу преобразования
F.115)
где строки матрицы Ux составляют базис подпространства, кото-
которое порождается строками матрицы восстанавливаемости Q
системы. Матрица Uгвыбрана таким образом, что ее строки вмес-
вместе со строками матрицы V\ порождают все п-мерное пространство.
Определим преобразованную переменную состояния в виде
z'{i)=Ux(i). F.116)
Тогда в терминах преобразования переменной состояния систе-
система может быть описана следующими разностными уравнениями
состояния:
(ВЛ ...
F.117)
у@= -~ - ¦¦¦
где пара {А'п, С\} является полностью восстанавливаемой.
Здесь термин «пара {А, С} является полностью восстанавли-
18—394
530 Глава 6
ваемой» означает, что система x(i + 1) = Ax(iO y(i) = Cx(i)
является полностью восстанавливаемой.
Обнаруживаемые дискретные системы определяются следующим
образом.
Определение 6.8. Линейная дискретная система с постоянными
параметрами
F.118)
y(i) = Cz(i)
является обнаруживаемой, если ее подпространство невосста-
навливаемых состояний находится внутри подпространства ус-
устойчивых состояний.
Один из способов исследования обнаруживаемости вытекает из
следующего результата.
Теорема 6.17. Рассмотрим линейную дискретную систему с пос-
постоянными параметрами
x(i + l) = Ax(i)+Bu(i),
F.119)
y(i) = Cx(i).,
Предположим, что она преобразуется, согласно теореме 6.16, к
виду F.117). Тогда система является обнаруживаемой в том и
только том случае, если все характеристические числа матрицы
А'.22 по модулю строго меньше единицы.
Аналогично непрерывному случаю определим характеристи-
характеристические числа матрицы А'1Х- как полюса восстанавливаемости, а
характеристические числа матрицы A'i2 как полюса невосстанавли-
невосстанавливаемости. Тогда система является обнаруживаемой в том и только
том случае, если все ее полюса невосстанавливаемости устойчивы.
6.2.9. ДУАЛЬНОСТЬ
Как и в непрерывном случае, теории фильтрации и дискретных
регуляторов оказываются связанными посредством понятия ду-
дуальности. Удобно ввести следующее определение.
Определение 6.9. Рассмотрим линейную дискретную систему
F.120)
Теория для дискретных систем 531
Кроме того, рассмотрим систему
x*(i + l) = AT(i* T
F.121)
y*(i) = BT(i*-i)x*(i),
где i* — произвольное фиксированное целое число. Тогда систему
F.121) назовем дуальной системе F.120) относительно i*.
Очевидно, имеем следующий результат.
Теорема 6.18 Исходная система F.120) дуальна системе F.121)
относительно i*.
Управляемость и восстанавливаемость исходных и дуальных
систем связаны следующим образом.
Теорема 6.19. Рассмотрим систему F.120) и дуальную ей систе-
систему F.121).
а) Система F.120) является полностью управляемой в том и
только том случае, если система, дуальная ей, полностью восста-
восстанавливаема.
б) Система F.120) полностью восстанавливаема в том и только
том случае, если система, дуальная ей, полностью управляема.
в) Предположим, что система F.120) имеет постоянные пара-
параметры. Тогда система F.120) является стабилизируемой в том и
только том случае, если система F.121) обнаруживаема.
г) Предположим, что система F.120) имеет постоянные пара-
параметры. Тогда система F.120) является обнаруживаемой в том и
только том случае, если система F.121) стабилизируема.
Доказательство этой теоремы аналогично доказательству теоре-
теоремы 1.41 (разд. 1.8).
€.2.10. КАНОНИЧЕСКИЕ ФОРМЫ ФАЗОВОЙ ПЕРЕМЕННОЙ
Так же как и для непрерывных систем, для дискретных систем
могут быть определены канонические формы фазовой переменной.
Определение 6.10. Линейная дискретная система с постоян-
постоянными параметрами и скалярной входной переменной представлена
в канонической форме фазовой переменной, если она описывается
уравнениями вида
0 10
О 0 1 0. . .
F.122)
y(i) = Cx(i).
18*
532 Глава 6
Здесь at, i = О, 1, ..., п — 1, — коэффициенты характерис-
характеристического полинома
Jai*' . F-123)
системы, где ап = 1. Любая полностью управляемая линейная
дискретная система с постоянными параметрами может быть пре-
преобразована к этому виду в соответствии с приемом, указан-
указанным в теореме 1.43 (разд. 1.9).
Подобным же образом введем следующее определение для сис-
систем со скалярной выходной переменной.
Определение 6.11. Линейная дискретная система с постоянными
параметрами и скалярной выходной переменной описана в кано-
канонической форме дуальной фазовой переменной, если она
представлена в виде
ч
/0
' i
0
0
0
1
0
0
0
... 0
... 0
... 0
— а0
— а2
x(i)
0 1 -cw
F.124)
6.2.11. ДИСКРЕТНЫЕ ВЕКТОРНЫЕ
СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ
В настоящем разделе очень кратко рассматриваются дискрет-
дискретные векторные стохастические процессы; так называются беско-
бесконечные последовательности стохастических векторных перемен-
переменных вида v(i), i = ..., —1, 0, 1, 2, .... Дискретные векторные сто-
стохастические процессы могут быть охарактеризованы с помощью
совместных распределений вероятностейv
P{i;{fd)<i;d, v(i2)<. v2,...,v(im)<vm] F.125)
для всех действительных vlt v2, ..., vm, для всех целых г15 г2, ...,
im и всех целых т. v
Если
Р \и (i\) < vu v(i2)<vz,...,v (im) < vm} =
= P{v(i\+k)<vu v(i2 + k) < v2,..., v(im + k}< vm} F.126)
Теория для дискретных систем ' 533
для всех действительных vu v2, ..., ищ, всех целых il5 i2, ..., Ьщ и
любых целых тп и к, то процесс называется стационарным. Если
всё совместные распределения являются многомерными гауссовс-
кими распределениями, процесс называется гауссовским.
Введем далее следующие определения.
Определение 6.12. Рассмотрим дискретный векторный стохасти-
стохастический процесс v(i). Назовем
m(i) = E{v(i)} F.127)
средним значением процесса,
CV(U j) = E{v(i)vT(j)} F.129)
матрицей смешанных моментов второго порядка
R,(i,i) = E{[v(i)-m(i)}[v(i)-m(j)f} F.129)
ковариационной матрицей процесса,
Q(i) = E{[v(i)-m(i))[v(i)~m(i))T} = Rv(i, i) F.130)
матрицей дисперсий, Cv(i, i)— матрицей моментов
второго порядка процесса.
Если процесс v стационарный, то его среднее и матрица диспер-
дисперсий не зависят от i, а его матрица смешанных моментов Cv(i, j)
и ковариационная матрица Rv(i, j) зависят только от i—j.
Процесс, который не является стационарным, но характеризуется
постоянным средним значением и имеет конечную для всех i мат-
матрицу моментов второго порядка, а его матрица смешанных момен-
моментов второго порядка и ковариационная матрица зависят только от
i—/, называется стационарным в широком смысле.
Для дискретных процессов, стационарных в широком смысле,
дадим следующее определение. ""
Определение 6.13. Матрица спектралъныхплотностей
Hv((}), —я <: 9 < я, дискретного процесса v, стационарного
в широком смысле, если она существует, определяется в виде
*-'Д»@. Ь = е\ -1г<9<тг> F.131)
edeRv(i — к) — ковариационная матрица процесса, a j = \(—1.
Название «матрица спектральных плотностей» не означает
тесной связи с так же называемой матричной функцией для
непрерывных стохастических процессов. Следующий факт" пояс-
поясняет это.
534 Глава 6
Теорема 6.20. Пусть v — дискретный, стационарный в широком
смысле стохастический процесс с нулевым средним и матрицей
спектральных плотностей 2>V(Q). Тогда
(e)d6. F.132)
Нестрогое доказательство состоит в следующем. Напишем
h
F.133)
t=— оо
поскольку
2те для i — О,
F.134)
О для ?=5^0.
Матрицы спектральных плотностей особенно полезны при ана-
анализе реакции линейных дискретных систем с постоянными пара-
параметрами, если входной переменной является реализация дискрет-
дискретного стохастического процесса.
Теорема 6.21. Рассмотрим асимптотически устойчивую линей-
линейную дискретную систему с постоянными параметрами и матричной
z-передаточной функцией H(z). Пусть входной переменной систе-
системы является реализация стационарного в широком смысле дискрет-
дискретного стохастического процесса и с матрицей спектральных плот-
плотностей^ и (Q), который воздействует, начиная с момента времени
— оо. Тогда выходная переменная у является реализацией стацио-
стационарного в широком смысле дискретного стохастического процесса
с матрицей спектральных плотностей
Ъу (в) = И ( е/9) ЗД8) НТ ( е7/В)> —>!< е < *• 'F.135)
Пример 6.7. Последовательность взаимно некоррелированных пе-
переменных
Предположим, что стохастический процесс v{i), i = ..., —1,
0, 1, 2, ..., состоит из последовательности взаимно некоррелиро-
некоррелированных векторных стохастических переменных с нулевыми
средними и постоянной матрицей дисперсий Q. Тогда ковариа-
ковариационная матрица процесса определяется в виде
f Q для i = ;,
Д„(*—/)= п --и- F-136)
"v ' [0 для > -*- * v '
Теория Эля дискретных систем 535
Это стационарный в широком смысле процесс, матрица спектраль-
спектральных плотностей которого равна
2Д8) = <?. • F.137)
Этот процесс является дискретным эквивалентом белого шума.
Пример 6.8. Экспоненциально коррелированный шум
Рассмотрим скалярный стационарный в широком смысле дис-
дискретный стохастический процесс v с ковариационной функцией
F.138)
Здесь А — период дискретности, а Т — постоянная времени
процесса. Нетрудно найти, что функция спектральной плотности
имеет вид
2,(9) = а2A-е/) __ е
6.2.12. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ СИСТЕМЫ,
ВОЗБУЖДАЕМЫЕ БЕЛЫМ ШУМОМ
При рассмотрении линейных дискретных систем возмущения или
другие стохастически изменяющиеся явления мы обычно описыва-
описывали как выходные переменные линейных дискретных систем вида
x(i + l) = A(i)x(i) + B(i)w(i),
F.140)
y(i) = C(i)x(i).
Здесь x(i) — переменная состояния, y(i) — выходная переменная,
а w(i), г = ..., —1, 0, 1 , 2, ..., — последовательность взаимно
некоррелированных векторных стохастических величин с нулевыми
средними и матрицами дисперсий
E[w(i)wT(i)} = V{i). F.141)
Как видно из примера 6.7, процесс w имеет сходство с процес-
процессом типа белого шума, рассмотренного в непрерывном случае,
поэтому назовем его дискретным белым шумом. V(i) назовем мат-
матрицей дисперсий процесса.Если V(i) не зависит от i, то дискретный
процесс типа белого шума является, стационарным в широ-
широком смысле. Если w(i) имеет гауссовское распределение ве-
вероятностей для каждого i, то w является гауссовским дискретным
процессом типа белого шума.
Процессы, описываемые уравнениями F.140), могут возникать
при дискретизации непрерывных процессов, описывающих вы-
536 Глава 6
ходные переменные непрерывных систем, возбуждаемых белым
шумом. Пусть непрерывная переменная x(t) описывается уравнени-
уравнением
x(t) = A(t)x(t)+B(t)w(t), F.142)
где w — белый шум интенсивности V(t). Тогда, если ?,-, i = 0, 1,
2, ..., — последовательность моментов дискретизации, из A.61)
можно написать
w(t)dz, F.143)
где Ф(?, t0) — переходная матрица системы F.142)."Тогда, исполь-
используя правила интегрирования из теоремы 1.51 (разд. 1.11.1), можно
найти, что величины
)с/т. F.144)
Н
i = 0, 1, 2, ..., образуют последовательность взаимно некоррели-
некоррелированных стохастических величин с нулевыми средними и матрица-
матрицами дисперсий
(гг+1) х)Л. F.145)
Отметим, что F.143) представляется в виде F.140).
Иногда представляет интерес вычислить матрицу дисперсий
стохастического процесса, описываемого уравнением F.140). Не
трудно получить следующий результат.
Теорема 6.22. Пусть стохастический дискретный процесс явля-
является решением линейного стохастического разностного уравнения
ж(( + 1)= A(i)x(i) + B(i)w(i), F.146)
где w(i), i = —1, 0, 1, 2, ..., — последовательность взаимно
некоррелированных векторных стохастических величин с нулевыми
средними и матрицами дисперсий V(i). Предположим, что x-(i0) =
= х0 имеет среднее тп и матрицу дисперсий Qo. Тагда среднее зна-
значение процесса x(i)
m{i) = E{x{i)) F.147)
и матрица дисперсий x(i)
-m(i))T} ^ F.148)
Теория Эля дискретных систем 537
могут быть определены следующим образом. Среднее значение
равно
т (i) = Ф (I, i0) m0, i > i0, F.149)
где ФA, i(y) — переходная матрица системы, описываемой разно-
разностным уравнением F.146), a Q(l) является решением матрич-
матричного разностного, уравнения
F.150)
Q Co) = <?o-
Если матрица А, В и V постоянные, то об установившемся
поведении стохастического процесса х свидетельствует следующий
результат.
Теорема 6.23. Пусть дискретный стохастический процесс явля-
является решением стохастического разностного уравнения
z(i + l) = Az (i) + Bw (t),
F.151)
x (h) = ^o»
где А и В — постоянные матрицы, а некоррелированная последо-
последовательность стохастических величин w имеет нулевое среднее и
постоянную матрицу дисперсий V. Тогда, если все характери-
характеристические числа матрицы А имеют модуль, строго меньший чем
1, и i0 -*- — оо, ковариационная матрица процесса стремится к
асимптотическому значению Rx(i, j), которое зависит только от
i—j. Соответствующая асимптотическая матрица дисперсий Q
является единственным решением матричного уравнения
Q = AQAT + BVBT. F.152)
В последующих разделах будут встречаться квадратичные вы-
выражения. В связи с этим следующие результаты являются полез-
полезными.
Теорема 6.24. Пусть процесс х является решением уравнения
. F.153)
X [l0) = Хо,
где w(i) — последовательность взаимно некоррелированных сто-
стохастических величин с нулевыми средними и матрицами дисперсий
V(i). Пусть R(i) — заданная последовательность неотрица-
неотрицательно определенных симметрических матриц. Тогда
538 Глава 6
Е J2 xT(i)R(i)x(i)\ = tr \е{х6х1) P(io)
T ] F.154)
где неотрицательно определенные симметрические матрицы P(i)
являются решением матричного разностного уравнения
?=?,-1, 1,-2,..., i0;
F.155)
Если А и В. — постоянные матрицы, а все характеристические
числа матрицы А по модулю строго меньше чем 1, то P(i) при i1 —*¦
-*- оо приближается к постоянной величине Р, где Р— единствен-
единственное решение матричного уравнения
P~=ATPA+R. F.156)
Одним из методов решений линейных матричных уравнений
F.152) и F.156) является многократное использование уравнений,
F.150) или F.155). В работе [15] приводится другой метод. В ра-
работе [143] предлагается преобразование, которое приводит уравне-
уравнения типа F.152) или F.156) к виду
MiX+XMl=Ns F.157)
и наоборот, так что методы решений, пригодные для одного из
этих уравнений, могут быть также использованы для решения
другого [относительно уравнений типа F.157) см. разд. 1.11.3].
Особое место занимает случай гауссовских случайных величин.
Теорема 6.25. Рассмотрим стохастический дискретный процесс
х, описываемый уравнением
x(i + i) = A(i)x(i) + B(i)w(i),
F.158)
х (?0) = х0.
Тогда, если взаимно некоррелированные стохастические вели-
величины w(i) являются гауссовскими и начальное состояние х0 являет-
является гауссовским, х — гауссовский процесс.
Пример 6.9. Экспоненциально коррелированный шум
Рассмотрим стохастический процесс, описываемый стохасти-
стохастическим разностным уравнением
Теория для дискретных систем
539
= Ь». Jo->-°°. F-159)
где ca(i) образует последовательность скалярных некоррелирован-
некоррелированных стохастических величин с дисперсией aw2 и | а| < 1. Рассмот-
Рассмотрим | — выходную переменную дискретной системы с постоян-
постоянными параметрами и z-пёредаточной функцией
——, F.160)
z — а
а также последовательность со в качестве входной переменной.
Поскольку функция спектральной плотности процесса со равна
2ш(9)=а2, FШ)
найдем, что, согласно F.135), матрица спектральных плотностей
процесса | имеет вид
W-iTZtfT+Zr F162)
Заметим, что выражения F.162) и F.139) имеют одинаковую
форму; следовательно, уравнение F.459) описывает экспоненци-
экспоненциально коррелированный шум. Установившаяся дисперсия о^ 2
процесса | определяется из выражения F.152); при этом имеем
F.163)
of = а?о\ +
или
2
а =
F.164)
Пример 6.10. Смесительный бак. при наличии возмущений
В примере 1.37 (разд. 1.11.4) рассматривалась непрерывная
модель смесительного бака при наличии возмущений. Стохасти-
Стохастическое дифференциальное уравнение состояния такого бака имеет
вид
x{t) =
--i- 0
1
26
0
0
0
1
\
1
e
0
0
0
1
0
0
^20
Vo
0
1
X (t) -\-
1
cio—gp c2o—с
0
0
0
0
u(t)r
w(t),
F.165)
540 Глава 6
где w — белый шум интенсивности
F.166)
Здесь компонентами состояния являются мгновенный расход,
мгновенная концентрация в баке, мгновенная концентрация в по-
потоке Жг и мгновенная концентрация в потоке F.t. Изменения в кон-
концентрациях потоков представляются в виде экспоненциально кор-
коррелированных шумовых процессов со среднеквадратическими зна-
значениями ах и о2 и постоянными времени QL и 9^ соответственно.
Если предположить, что система управляется цифровой вычис-
вычислительной машиной так, что регулировка клапанов изменяется в
моменты времени, разделенные интервалом Д, то дискретный вари-
вариант описания системы может быть получен на основании ме'тода,
описанного в начале данного раздела. Поскольку вывод соответст-
соответствующих выражений является довольно громоздким, приведем
окончательный результат для численных значений из примера
1.37, дополненных следующими значениями?
о4 = 0,1 кмоль/м3,
а2 = 0,2 кмоль/м3,
Qt = 40 с, F.167)
62 = 50 с,
Д=5 с.
В результате стохастическое разностное уравнение состояния
приобретает .вид
'0,9512 0
0 0,9048
о 0
0 0
F.168)
где w(i), i >• i0, — последовательность некоррелированных сто-
стохастических векторов с нулевым средним и матрицей дисперсий
Теория для дискретных систем 541
О О
0,00004886 0,00009375
0,00009375 0,002212 0 | FЛ69)
0,0001 О
Посредством многократного применения уравнения F.150) можно
найти установившееся значение Q матрицы дисперсий состояния.
Имеем *
@ О
О 0,00390 .,
О 0,00339 0,0100 0 | F.170)
О 0,00504
Это означает, что среднеквадратическое значение изменений
объема бака равно нулю (что является очевидным, так как изме-
изменения концентраций не влияют на расходы), среднеквадратическое
значение концентрации в баке равно ]/0,00390<=* 0,0625 кмоль/м3,
а среднеквадратические значения концентраций в посту-
поступающих в бак потоках соответственно равны 0,1 и 0,2 кмоль/м3.
Последние два значения, конечно, в точности соответствуют аг и
(Т.,.
6*3. Анализ линейных дискретный
систем управления
6.3.1. ВВЕДЕНИЕ
Ниже дается краткий обзор методов анализа линейных дискрет-
дискретных систем управления. В отношении рассматриваемых тем дан-
данный раздел аналогичен гл. 2. »
6.3.2. ДИСКРЕТНЫЕ ЛИНЕЙНЫЕ
СИСТЕМЫ УПРАВЛЕНИЯ
В настоящем разделе кратко описываются задачи дискретного
управления, вводятся уравнения, которые будут использованы для
..описания объекта и регулятора, определяются среднее значение
квадрата ошибки слежения и "среднее значение квадрата входной
i й
jjHoii и устанавливается основной принцип проектирования.
Сначала введем пойятие объекта, который является управляемой
542 Глава 6
системой и представляется в виде линейной дискретной системы,
описываемой уравнениями
X (Iq) = Хо,
y(i) = C (i) x (i) + Ei (i) и (i) + vm (i), F.171)
z\i) = D(i)x(i) + E2(i)u(i)
при i = i0, io + l,... .
Здесь x — состояние объекта, х0 — начальное состояние, и —
входная переменная, у — наблюдаемая переменная, a z — управ-
управляемая переменная. Далее, vp представляет собой возмущающую
переменную, a vm — шум наблюдений. Наконец, введем эталон-
эталонную переменную r(i), i = i0, i0 + 1, ...,. Заметим, что в противо-
противоположность непрерывному случаю здесь допускается наличие пря-
прямой связи от входа объекта к наблюдаемой и управляемой пере-
переменным. Причина этого заключается в том, что в дискретных систе-
системах, полученных посредством дискретизации непрерывных систем,
при несовпадении моментов квантования выходных переменных
и моментов изменения входной переменной легко возникают пря-
прямые связи (разд. 6.2.3). Как и в непрерывном случае, рассмотрим
раздельно задачу слежения, где управляемая переменная z(i) долж-
должна следовать за изменяющейся эталонной переменной r(i), и зада-
чу^егулирования, где эталонная переменная является постоянной
или медленно меняющейся.
Аналогично непрерывному случаю рассмотрим замкнутые и
разомкнутые регуляторы. Замкнутый регулятор общего вида пред-
представляется линейной дискретной системой, описываемой разност-
разностным уравнением состояния и уранением выходной переменной
F.172)
u(i) = F (i) q @ + НГ (г) r (i) —Ef (i) у (V).
Заметим, что, согласно этим уравнениям, регулятор может одно-
одновременно обрабатывать входные данные r(i) и y(i), а также форми-
формировать входную переменную u(i) объекта. Если имеют место ощу-
ощутимые запаздывания в процессах, как, например, в случае циф-
цифрового управления при использовании высоких скоростей повто-
повторения, будем считать, что эти запаздывания учитываются при сос-
составлении уравнений объекта (разд. 6.2.3).
Уравнения разомкнутого регулятора общего вида следуют из
уравнений F.172), если положить Ку и Н* равными нулю.
Следуя теории непрерывных систем, будем оценивать качество
системы управления, разомкнутой или замкнутой, на основании
среднего значения квадрата ошибки слежения и среднего значения
Теория для дискретных систем 543
квадрата входной переменной. Среднее значение квадрата ошибки
слежения определяется в виде
Ce(i) = E{eT(i)We(i)e(i)}. F.173)
где
e(i) = z(l)-r(i), F.174)
a We(i) — неотрицательно определенная симметрическая весовая
матрица. Подобным же образом, среднее значение квадрата вход-
входной переменной определяется как
Cu(i)=E{uT(j)Wu(i)u(i)}, F.175)
где Wu(i) — другая неотрицательно определенная весовая матри-
матрица. ^Основной принцип при проектировании системы управления
заключается в минимизации среднего значения квадрата ошибки' \
слежения и в то же самое время в поддержании среднего значения \
квадрата входной переменной не выше приемлемой величины. Ц
Как и в непрерывном случае, определяющее значение имеет
следующий принцип проектирования.
Принцип проектирования 6.1. Система управления должна быть
асимптотически устойчивой.
Дискретные системы управления, так же как и непрерывные,
характеризуются тем, что неустойчивый объект может быть стаби-
стабилизирован с помощью замкнутого управления и не может быть
стабилизирован при разомкнутом управлении.
Пример 6.11. Цифровая система управления положением с про-
пропорциональной обратной связью
В качестве примера рассмотрим цифровую систему управления
положением из примера 6.2 (разд. 6.2.3). Эта система описывается
разностным уравнением состояния
1 0,08015\ / 0,003396 \ •
0,6313 H>+U06308 И' <6-178>
Здесь первой компонентой | ,(t) вектора a(i) является угловое
положение, а второй компонентой | ^(t) — угловая скорость. Да-
Далее, [i(i) обозначает входное напряжение. Предположим, что эта
система управляет положением посредством использования про-
пропорциональной обратной связи, как показано на рис. 6.7. Здесь
управляемая переменная С(г) является положением, а входное
напряжение определяется соотношением
1*@ = Мг@-С@1- F-177)
В этом выражении r(i) — эталонная переменная, а % — коэф-
544 , Глава 6
)
У-
А
¦ц@
Цифровая система
управления
положением
Рис. 6.7. Цифровая система управления положением с пропорциональной
обратной связью.
1т
Рис. 6.8. Корневые годографы цифровой системы управления положением.
X полюса разомкнутой системы; О нуль разомкнутой системы.
фициент усиления. Положим, что нет запаздывания в процессах,
так что моменты дискретизации выходной переменной совпадают с
моментами, в которые происходит обновление управления. Таким
образом, имеем
С@ = A, 0)*@. F.178)
В примере 6.6 (разд. 6.2.6) было найдено, что разомкнутая
z-передаточная функция объекта определяется выражением
0,003396 (г+ 0,8575)
F.179)
I w (г-1) (г —0,6313)
Используя это, нетрудно установить, что характеристический
полином замкнутой системы имеет вид
Теория для дискретных систем . 545
(z _ 1) (z — 0,6313) + 0,003396Х (z + 0,8575). F.180)
На рис. 6.8 показаны годографы корней замкнутой системы.
Видно, что при изменении % от 100 до 150 В/рад полюса замкнутой
системы выходят за пределы единичного круга, поэтому замкнутая
система становится неустойчивой. Кроме того, следует ожидать,
что в области устойчивости при увеличении \ система становится
все более колебательной, тан как полюса замкнутой системы все
ближе приближаются к единичной окружности. Чтобы избежать
резонансных эффектов и в то же время максимизировать X, необ-
необходимо выбрать значение X в пределах от 10 до 50 В/рад.
6.3.3. АНАЛИЗ ХАРАКТЕРИСТИК СЛЕЖЕНИЯ В УСТАНОВИВШЕМСЯ
И ПЕРЕХОДНОМ РЕЖИМАХ
В настоящем разделе изучается реакция линейной дискретной
системы управления на эталонное воздействие. Рассматриваются
какустановившаяся, так и переходная составляющие. Принимают-
Принимаются следующие допущения.
1. Принцип проектирования 6.1 удовлетворяется, т. е. система
управления асимптотически устойчива.
2. Система управления имеет постоянные параметры, а весовые
матрицы We и Wu постоянные.
3. Возмущающая переменная vp и шум наблюдения vm принима-
принимаются равными нулю.
4. Эталонная переменная может быть представлена в виде
г (i) =ro + rv (J), i = t0, h +¦ 1..» . F-181)
где ^постоянная часть г0 — стохастический вектор с мат-
матрицей моментов второго порядка ,
Е {г0 /0\ - Д01 [F.182)
а переменная часть rD — стационарный в широком смысле
векторный стохастический процесс с нулевым средним и матрицей
спектральных плотностей 2Г(9).
Принимая нулевые начальные условия, напишем z-преобразо-
вание Z(z) управляемой переменной и z-преобразование U(z)
входной переменной:
Z(z) = r(z)R(z),
F.183)
U(z) = AT(z)R(z).
Здесь T(z) — передаточная функция системы, N(z) — мат-
матричная передаточная функция от эталонной переменной до вход-
входной переменной системы управления, a R(z) — z-преобразование-
546 Глава 6
эталонной переменной. Система управления может быть замкнутой
либо разомкнутой. Поэтому, если E(z) — z-преобразование ошиб-
ошибки слежения e(i) — z(i) — r(i), имеем
— I]R(z). F.184)
Чтобы вывести выражения для установившихся средних зна-
значений квадратов ошибки слежения и входной переменной, исследу-
исследуем раздельно составляющие от постоянной и переменной частей
эталонной переменной. Постоянная часть эталонной переменной
дает в результате следующие установившиеся реакции ошибки
слежения и входной переменной:
@
(->0О
F.185)
Из разд. 6.2.11 следует, что в установившемся состоянии ре-
реакция ошибки слежения на переменную часть эталонной перемен-
переменной имеет матрицу спектральных плотностей вида
[Т ( е79) — I] 2, (9) [Т (е~р) — if. F.186)
Следовательно, установившееся среднее значение квадрата ошиб-_
ки слежения может быть представлено в виде
Сет - lim Ce (i) = E{ rl [T A) - I]rWe [T A) -1] r0} +
+ tr I— f [T (в/9) - I] S, F) [Г ( е-/9) - /fW^el F.187)
г J J
Это выражение можно переписать следующим образом:
Сеа, = tr [Т A) - if We [Т A) - /] i?0 +
+ — f [Г (e~/e) — lfWe[T{e>b) — I]-S.(Q)dQ . F.188)
—л j
Аналогично установившееся среднее значение квадрата входной
переменной может быть выражено в виде
Скоо = lim Си @ = tr {tfr A) WUN A) Яо +
+ — t\iNT{e~l'l)WuN{eie)l,r(Q)dQ\. F.189)
Теория для дискретных систем 547
Перед дальнейшим анализом этих выражений введем следую-
следующее дополнительное допущение.
5. Постоянная и переменная части эталонной переменной име-
имеют некоррелированные компоненты, т. е. i?u и 2Г(9) являются
диагональными и могут быть записаны в следующей форме:
i?0 = diag(i?0,i, i?o,2,-.., Bo.p),
F.190)
Sr(e) = diag[Srtl(9), 2^(9),..., 2,>р(9)],
где р — размерность эталонной и управляемой переменных.
При этом допущении выражение F.188) принимает вид
2
1=1
(=1
№(*)]T[[f)-l])tidQ. F.191)
где {М},;' обозначает i-й диагональный элемент матрицы М. Сле-
Следуя гл. 2, введем теперь следующие определения.
Определение 6.14. Пусть p(i), i = ..., —1, 0, 1, 2, ..., — ска-
скалярный стационарный в широком смысле дискретный стохастичес-
стохастический процесс с функцией спектральной плотности 2р (9). Тогда
нормированная полоса частот 0 этого процесса определяется мно-
множеством нормированных частот 9, 0 <: 9 <: л, для которого
Е^хх. .FЛ92)
Здесь а выбирается таким образом, что полоса частот содер-
содержит заданную часть 1—е (гдег — малая величина по сравнению с
\) от половины энергии процесса, т. е.
j F.193)
Как и в гл. 2, где полоса частот являлась интервалом [Qu 9.2],
определим 9Z — 9t как нормированную полосу пропускания про-
процесса. Если полоса частот представляет собой интервал [0, 8С],
определим 9С как нормированную частоту среза процесса.
В особом случае, когда дискретный процесс получается дискре-
тгизацией непрерывного процесса, полоса пропускания (ненорми-
(ненормированная) и частота среза определяются из соответствующих нор-
нормированных величин с помощью соотношения
Т ' F.194)
548 Глава 6
где А — период, дискретности, а со — угловая частота (ненор-
(ненормированная).
Перед тем как вернуться к анализу установившегося среднего
значения квадрата ошибки слежения, введем еще одно понятие.
Определение 6.15. Пусть T(z) — передаточная функция асимп-
асимптотически устойчивой линейной дискретной системы управления
с постоянными параметрами. Тогда определим нормированную
полосу частот i-го звена системы управления как мно-
множество нормированных частот 6, 0 <: 6 <: л, для которых
\[T{e-*)-l]TW.[T[S)-l]}u<*W.ia. F.195)
Здесь е — заданное число, малое по сравнению с 1, We — весо-
весовая матрица для среднего значения квадрата ошибки слежения,
a Wejt — i-й диагональный элемент матрицы We.
Здесь также будем говорить о полосе пропускания и частоте сре-
среза i-ro звена, если они существуют. Если дискретная система полу-
получается при дискретизации непрерывной системы, то полоса про-
пропускания (ненормированная) и частота среза могут быть найдены
с помощью соотношения F.194).
Теперь можно сформулировать следующее положение, которое
вытекает из рассмотрения уравнения F.191).
Принцип проектирования 6.2. Пусть T(z) — р X р-матричная
передаточная функция асимптотически устойчивой линейной дис-
дискретной системы управления с постоянными параметрами, для
которой и постоянная, и переменная части эталонной переменной
имеют некоррелированные компоненты. Тогда для того, чтобы по-
получить малое установившееся среднее значение квадрата ошибки
слежения, необходимо, чтобы полоса частот каждого из р звеньев
содержала полосу частот соответствующей компоненты эталонной
переменной.
Если i-я компонента эталонной переменной, i = 1, 2, ..., р, может
иметь ненулевую постоянную часть, то выражение {[ТA)—IV X
XWe[T(i)—¦/]};; должно быть сделано малым (предпочтительно
нулевым).
Рассмотрим теперь установившееся среднее значение квадрата
входной переменной, определяемое выражением F.189). При допу-
допущении 5 это выражение может быть переписано в виде
io,,{NT(l)WuN(l)}ll +
., t F) [NT (ё~'*) WUN ((?ь))н d%. F.196)
i
Теория для дискретных систем 549
Поскольку Сц0О не должно быть слишком большим, сформули-
сформулируем следующее положение.
Принцип проектирования 6.3. Чтобы получить малое установив-
установившееся среднее значение квадрата входной переменной в асимптоти-
асимптотически устойчивой линейной дискретной системе управления с пос-
постоянными параметрами и р-мерной эталонной переменной с не-
некоррелированными компонентами, значение
\NT{e-l3)WuN{e^}n . F.197)
нужно сделать малым в нормированной полосе частот г-й компо-
компоненты эталонной переменной при i = 1, 2, ..., р.
Как и в гл. 2, на первый член в F.196) не накладывается огра-
ограничений, так как рассматриваются только флуктуации входной
переменной относительно заданной точки.
Завершим этот раздел обсуждением поведения реакции систе-
системы управления на эталонную переменную в переходном режиме.
Как и в непрерывном случае, определим время установления
среднего значения квадрата ошибки слежения, среднего значения
квадрата входной переменной или другой величины, например
такой, как время, за которое указанная характеристика достигает
своего установившегося значения с заданной точностью. Это время
установления может быть представлено как число интервалов или
выражено в секундах, если известен период дискретности. Оче-
Очевидно, что весьма желательным является быстрое установление
среднего значения квадрата ошибки слежения после включения
системы либо действия возмущений. Таким образом, имеем сле-
следующее правило проектирования.
Принцип проектирования 6.4. Время установления среднего
значения квадрата ошибки слежения дискретной системы управ-
управления дблжно быть малым, насколько это возможно.
3 Поведение в переходном режиме среднего значения квадрата
входной переменной либо других интересующих величин может
быть исследовано с помощью методов, аналогичных методам, при-
применяемым для непрерывных систем. Для различных стохастических
процессов, оказывающих влияние на систему управления, прини-
принимаются математические модели в виде дискретных систем, возбуж-
возбуждаемых дискретным белым шумом. Матрица дисперсий состояния
системы, образованной путем добавления к разностному уравне-
уравнению системы управления уравнений этих моделей, может быть
вычислена согласно теореме 6.22 (разд. 6.2.12). Эта матрица диспер-
дисперсий позволяет получить все требуемые данные. Процедуру иллюст-
иллюстрирует пример в конце раздела. Часто, однако/ удовлетворитель-
удовлетворительная оценка времени установления заданного.параметра может быть
получена при вычислении реакции системы управления на посто-
550 Глава 6
янную часть эталонной переменной, что дает простой метод вычис-
вычисления переходных процессов.
Для систем управления с постоянными параметрами информа-
информация о времени установления часто может быть получена из анализа
расположения характеристических чисел замкнутой системы. Из
разд. 6.2.4 известно, что все реакции являются линейной комбина-
комбинацией функций вида %l, i — i0, i0 + 1, ..., где X — характеристи-
характеристическое число. Поскольку время, в течение которого |^|' достигает
1% начального значения 1, составляет (допуская, что \}„\ < 1)
2 F.198)
интервалов времени, оценка 1% времени установления асимптоти-
асимптотически устойчивой линейной дискретной системы с постоянными
параметрами равна
шах
i
Igio
\h
F.199)
интервалов времени, где ^, Z= 1, 2, ..., и, являются характерис-
характеристическими числами системы управления. Как и в случае непрерыв-
непрерывных систем, формула может приводить к ошибочным результатам,
поскольку некоторые характеристические числа могут отсутство-
отсутствовать в реакций некоторых переменных.
Завершим этот раздел указанием, что, если дискретная система
описывает непрерывную систему с дискретизацией, время установ-
установления, полученное из дискретной- модели, может дать совершенно
ошибочное представление о времени установления непрерывной
системы. Это объясняется тем, что иногда импульсная система по-
показывает вполне удовлетворительное поведение в моменты кван-
квантования, тогда как между моментами квантования происходят коле-
колебания, которые не затухают в течение продолжительного времени.
В последующих разделах приводятся примеры таких ситуаций.
Пример 6.12. Цифровая система управления положением с про-
пропорциональной обратной связью
Проиллюстрируем результаты данного раздела на системе со
скалярными входной и выходной переменными, в качестве которой
рассмотрим цифровую систему управления положением из примера
6.11. Здесь установившиеся характеристики слежения могут
быть проанализированы при рассмотрении скалярной передаточ-
передаточной функции T(z), которая после вычисления может быть приве-
приведена к виду
Теория для дискретных систем
551
1=100
so
25
15
10
5
со, рад/с
Рис. 6.9. Амплитудно-частотные характеристики цифровой системы управле-
управления положением при различных значениях коэффициента X.
0,003396Х (г+ 0,8575)
~w (z — 1)(г — 0,6313)+0,003396X(z +0,8575) ^' ' '
На рис. 6.9 показаны графики функции I Т{е^юЬ)\ при А =
= 0,1 с и значениях X в пределах от 5 до 100 В/рад. Видно,что
самое благоприятное значение К находится около 15 В/рад; при
этом значении полоса является максимальной и отсутствуют неже-
нежелательные резонансные эффекты.
Чтобы вычислить среднее значение квадрата ошибки слежения и .
среднее значение квадрата входного напряжения, предположим,
что эталонная переменная описывается моделью
r(i + l) = 0,9802r(i)+u>(i). F.201)
Здесь w образует последовательность скалярных некоррелиро-
некоррелированных стохастических величин с дисперсией 0,0392 рад2. При пе-
периоде дискретности 0,1 с она представляет собой импульсный экс-
экспоненциально коррелированный шумовой процесс с постоянной
времени 5 с. Установившееся среднеквадратическое значение пе-
переменной г равно 1 рад (пример 6.9).
Для простой замкнутой схемы управления из примера 6.11
входная переменная объекта имеет вид
l*@ = *r(i)—XMi), F.202)
что приводит к разностному уравнению замкнутой системы
г и 4- А\ - ( 0,94906 0,08015\ т m , /0,05094\ ,,;
^ ) > )*(») + (^9462 j
Здесь подставлено значение % = 15 В/рад. Расширяя вектор
552 Глава 6
состояния системы путем использования уравнения F.201), по-
получим
/ 0,94906 0,08015 0,05094 4/^@
1 = 1—0,9462 0,6313 0,9462 |[|г(»)| +
\T(i+l)J \ 0 0 ' 0,9802 Дг@
F.204)
Определим теперь матрицу дисперсий
Q(i) =
)
, г @) • F.205)
)
*
Здесь предполагается, что E{x(iu)} = 0 и ?{r(ia)} = 0, так
что x(i) и r{i) имеют нулевые средние для всех i. Обозначая эле-
элементы матрицы Q(i) как Qjh (i), j, к = 1, 2, 3, среднее значение
квадрата ошибки слежения можно представить в виде
ело = я {[МО - г (О!2) = я ^ @) - 2^i @ г @)+
+ Е {г2@} = <?«(*) -2(?13@ + <?зз(О =
0 0 0 . F.206)
1 0 1
Для среднего значения квадрата входной переменной получаем
Си @ = Е {[х2 (i)} = Е {X2 [г @ - Ei (О!2) = W. (О- F-207)
На основании теоремы 6.22 для матрицы дисперсии Q(i) имеем
матричное разностное уравнение
Q{i + l) = MQ(i)Mr+NVNT, F.208)
где М — матрица 3 X -3, N — матрица 3 X 1 в уравнении
F.204), а V — дисперсия процесса w(i). В качестве начального
условия этого матричного разностного уравнения выберем
/0 0 0\
0 0. F.209)
0 0 1/
Такой выбор ()@) означает, что при i = 0 объект находится
в покое, тогда как начальная дисперсия эталонной переменной
Теория для дискретных систем
О 10
Дискретное время с
Рис. 6.10. Среднеквадратическая ошибка слежения и среднеквадратическое
¦значение входного напряжения в цифровой системе управления положением.
1
10
Дискретное время L
20
Рис. 6.И. Реакция цифровой системы управления положением на ступенчатое
изменение 1 рад эталонной переменной.
равна установившейся дисперсии 1 рад2. На рис. 6.10 показано'
изменение среднеквадратического значения ошибки слежения и
среднеквадратического значения входного напряжения, Видно,
что время установления находится где-то между 10 и 20 периода-
периодами дискретности.
Установившаяся среднеквадратическая ошибка слежения при-
приближенно равна 0,4 рад, что является достаточно большой вели-
величиной. Это означает, что эталонная переменная не очень хорошо
отслеживается. Попытаемся объяснить это. Заметим, что непре-
непрерывный экспоненциально коррелированный шум с постоянной
времени 5 с (из которого получена эталонная переменная) имеет
1%-ную частоту среза, равную 63,66/5 = 12,7 рад/с (разд. 2.5.2).
Цифровая система управления положением является слишком
554 Глава 6
медленной, чтобы удовлетворительно следить за этой эталонной
переменной, так как ее 1%-ная частота среза, составляет ~1 рад/с.
При этом также видно, что установившееся среднеквадратическое
входное напряжение достигает величины ~4 В. Предположим, что
максимально допустимое среднеквадратическое входное напряже-
напряжение равно 25 В; тогда очевидно, что существуют возможности для
улучшения системы.
Наконец, на рис. 6.11 показана реакция цифровой системы уп-
управления положением на ступенчатое изменение 1 рад эталонной
переменной. Из графика видно, что время установления ошибки
слежения находится где-то между 10 и 20 периодами дискретности
в зависимости от требуемой точности. Из корневого годографа на
рис. 6.8 видно, что расстояние между полюсами замкнутой систе-
системы и началом координат составляет ~ 0,8. Соответствую-
Соответствующая оценка 1 % времени установления, найденная согласно
F.199), равна 20,6 периода дискретности.
6.3.4. НЕКОТОРЫЕ ДРУГИЕ ВОПРОСЫ
АНАЛИЗА КАЧЕСТВА ЛИНЕЙНОЙ
ДИСКРЕТНОЙ СИСТЕМЫ УПРАВЛЕНИЯ
В данном разделе кратко обсуждаются другие аспекты анализа
качества линейных дискретных систем управления, такие, как
влияние возмущений, влияние шума наблюдений и влияние неоп-
неопределенности в параметрах объекта. Исследование можно выпол-
выполнить методами, подобными методам для непрерывного случая.
Сформулируем кратко результаты такого анализа. Для описания
влияния возмущений на среднее значение квадрата ошибки сле-
слежения в системе со скалярными входной и выходной переменными
полезно ввести функцию чувствительности
S (г) = * F.210)
w 1 + Н (z) G («) ¦ ;
где
H(z) = D(zI— А^Б + Е F.211)
есть передаточная функция разомкнутого объекта,. а
G(z) = F(zI — L)-lKf + Hf F.212)
передаточная функция цепи обратной связи регулятора. 'Здесь
предполагается, что управляемая переменная объекта также яв-
является наблюдаемой переменной, т. е. в уравнениях F.171) С =
= D и Et = Е, = Е. Чтобы уменьшить влияние возмущений,
следует сделать значение \S(e>® )| малым в полосе частот эквива-
эквивалентного возмущения в управляемой переменной. При
9 < 1 для всех 0 < 9<-п; F.213)
Теория для дискретных систем 555
замкнутая система уменьшает влияние возмущений безотноситель-
безотносительно к.их статистическим свойствам. Если постоянные возмущения
необходимо подавить, то S(l) должно быть сделано малым (это
утверждение не является безоговорочно справедливым, если мат-
матрица А имеет характеристическое число 1). В случае многомерных
систем функция чувствительности F.210) заменяется матрицей
чувствительности
]-\ F.214)
и условие F.13) заменяется условием
ST{ e49) WeS { е>9) < We при всех 0 <: 9 < *, F.215)
где We — весовая матрица среднего значения квадрата ошибки
слежения.
В скалярном случа-fe уменьшение S(e№) в определенной полосе
частот может быть достигнуто увеличением передаточной функции
регулятора G{e&) в той же полосе частот. Это, однако, противоре-
противоречит требованиям ограничения среднего значения квадрата входной
переменней, подавления влияния шума наблюдений и, возможно,
требованию устойчивости. Здесь должен быть найден компромисс.
Условие малости S(e>®) в возможно большей полосе частот так-
также гарантирует, что замкнутая система защищена от изменения
параметров. Здесь условие F.213) или F.215) в многомерном слу-
случае гарантирует, что влияние малого изменения параметров всег-
всегда является меньшим, чем в эквивалентной разомкнутой системе.
6.4:. Оптимальные линейные дискретные
системы управления с обратной связью
по состоянию
6.4.1. ВВЕДЕНИЕ
В настоящем разделе дается обзор основных результатов ли-
линейной оптимальной теории управления для дискретных систем;
при этом предполагается," что состояние системы можно полностью
и точно наблюдать во все момен-ты времени. Как и в непрерывном
случае, основное внимание уделяется задаче регулирования, хотя
задача слежения также рассматривается. Раздел построен в соот-
соответствии с планом гл. 3.
556 Глава 6
6.4.2. ОБЕСПЕЧЕНИЕ УСТОЙЧИВОСТИ
С ПОМОЩЬЮ ОБРАТНОЙ СВЯЗИ ПО СОСТОЯНИЮ
В разд. 3.2 показано, что непрерывная линейная система может
быть стабилизирована с помощью соответствующей обратной свя-
связи, если она является полностью управляемой или стабилизируе-
стабилизируемой. То же справедливо и для дискретных систем.
Теорема 6.26. Пусть уравнение
х (i + 1) = Ах @ + Ви (i) F.216)
описывает линейную дискретную систему с постоянными пара-
параметрами. Рассмотрим закон управления с постоянной настройкой
u(i)= — Fx(i).^ F.217)
Тогда характеристические числа замкнутой системы, т. е.
характеристические числа матрицы А—BF, могут быть произ-
произвольно размещены ¦ в комплексной плоскости (при ограничении, что
комплексные характеристические числа образуют комплексно-
сопряженные пары) посредством соответствующего выбора F в
том и только том случае, если система F.216) полностью управ-
управляемая. Если система F.216) стабилизируемая, то можно выбрать
так F, что замкнутая система станет.устойчивой.
Поскольку доказательство теоремы всецело опирается на свой-
свойства матрицы А—BF, оно по существу идентично доказательству
для непрерывных систем.
Особый интерес представляет случай, когда все характеристи-
характеристические числа замкнутой системы находятся в начале координат.
Тогда характеристический полином матрицы А—BF имеет вид
'det(U— A + BF) = ln, 06-218)
где п—размерность системы. Поскольку, согласно теореме Кэли—
Гамильтона, каждая матрица удовлетворяет своему собственному
характеристическому уравнению, имеем
{A— BF)» = 0. ч' F.219)
Из теории матриц следует, что эта матрица является нильпо-
тентной с индексом п. Рассмотрим, какой это имеет смысл. Сос-
Состояние в момент i может быть представлено в виде
х (i) = (A— BFI х @). F.220)
Отсюда видно, что, если удовлетворяется F.219), любое на-
начальное состояние х@) может быть"приведено к нулевому состоя-
состоянию в момент п или ранее, т. е. за п или меньшее количество ша-
шагов [31, 57]. В таком случае говорят, что система обнаруживает
Теория для дискретных систем 557
апериодическую реакцию состояния. В разд. 6.4.7 встретятся сис-
системы с апериодической реакцией выходной переменной.
Рассмотренное выше показывает, что состояние любой пол-
полностью управляемой дискретной системы с постоянными парамет-
параметрами может быть приведено к нулевому состоянию самое большее
за п шагов, где п — размерность системы. Однако очень может
быть, что закон управления, который позволяет разместить полюса
замкнутой системы в начале координат, приводит к чрезвычайно
большим амплитудам входной переменной или к нежелательному
переходному процессу.
Подведем итог следующим образом.
Теорема 6.27. Пусть разностное уравнение состояния
+ Bu(i) F.221)
описывает полностью управляемую п-мерную линейную дискретную
систему с постоянными параметрами. Тогда любое начальное сос-
состояние моЖет быть приведено к нулевому состоянию самое боль-
большее за п шагов, т. е. для каждого х@) существует входная перемен-
переменная, которая обеспечивает х(п) = 0. Это может быть достигнуто
при помощи обратной связи с постоянной настройкой
u(i) = —Fx(i), " ч F.222)
где F выбирается таким образом, чтобы все характеристические
числа матрицы А—BF располагались в начале координат.
Пример 6.13. Цифровая система'управления положением
Цифровая система управления положением из примера 6.2
(разд. 6.2.3) описывается разностным уравнением состояния
r(iXU-(l 0,08015\ r ,,, , 70,003396\ {. 1п ,
*^ + ^-@ 0,6313 }хW + 1,0,06308 /М)- [
Эта система имеет характеристический полином вида
B — 1) (* — 0,6313) = г2 — 1,63132 + 0,6313. F.224)
Система может быть также представлена в канонической форме
фазовой переменной —
(i). F.225)
Преобразованное состояние x'(i) связано с исходным состоянием
x(i) посредством соотношения x(i) — Tx'(i), где матрица Т, со-
согласно теореме 1.43 (разд. 1.9), принимает вид
т — ( 0,002912 0,003396\ /fi ??оч
^—0,06308 0,06308;* \»-"Ч1
558 Глава 6
Юг-
St. I
r-
0,1 0,2 6,3
t,c
Рис. 6.12. Апериодическая реакция со-
Отсюда непосредственно
следует, что в терминах пре-
преобразованного состояния за-
закон управления, обеспечи-
_ вающии апериодический ха-
характер состояния, описыва-
описывается соотношением
!»(!) = —(—0,6313,
1,6313) х' (I). F.227)
В терминах исходного
состояния имеем
,[х(?)= —(—0,6313,
1,6313) Т~'х{1), F.228)
или
[х @ = -A58,5, .
17,33) х (*). F.229)
На рис. 6.12 показано
изменение состояния аперио-
апериодической цифровой системы
управления положением при
начальном условии х@) =
= col @,1, 0) не только в мо-
моменты дискретизации, но и в
промежуточные интервалы.
Эта реакция была получена
при моделировании непре-
непрерывной системы, которая
управлялась кусочно-посто-
кусочно-постоянными входными сигналами
в соответствии с дискретным
стояния цифровой системы управления законом управления F.229).
положением.
равное двум периодам
Видно, что система приходит
в состояние покоя за время,
дискретности.
6.4.3. ЗАДАЧА ПОСТРОЕНИЯ ЛИНЕЙНОГО
ДИСКРЕТНОГО ОПТИМАЛЬНОГО РЕГУЛЯТОРА
Аналогично задаче в непрерывном случае определим задачу
дискретного регулирования следующим образом.
Определение 6.16. Рассмотрим дискретную линейную систему
Теория для дискретных систем 559
x(i + l) = A(i)x(i)+B(i)u(i), F.230)
где
*(*о) = *о. F-231)
с управляемой переменной
z(i) = D(i)x(i). F.232)
Рассмотрим также критерий
+ хТA,)Р,хA,), F.233)
где R3(i + 1) > 0 и i?2(i) > 0 при i = i0, i0 + 1, ..., ^ — 1 и
Л > 0.
Задача определения входной переменной u(i) при i = i0, i0 + 1,
..., ij — 1 называется задачей построения дискретного
детерминированного линейного оптимального регу-
регулятора. Если все матрицы в постановке задачи постоянные,
то имеет место задача построения дискретного линей-
линейного оптимального регулятора с постоянными па-
параметрами.
Отметим, что два члена в критерии F.233), следующие после
знака суммирования, имеют разные индексы. Это объясняется сле-
следующим образом. Начальное значение управляемой переменной
z(i0) всецело зависит от начального состояния x(i0) и не может быть
изменено. Поэтому нет смысла вводить в критерий член с z(i0).
Аналогичным образом конечное значение входной переменной
w(ij) воздействует на поведение системы только после конечного
" момента времени it; поэтому член, включающий u(i^), также мо-
может быть исключен. Расширенный критерий, содержащий пере-
перекрестные члены, приведен в задаче 6.8.1. > -
Отметим также, что управляемая переменная не содержит пря-
прямой связи в постановке задачи (определение 6.16), хотя, как было
показано в разд. 6.2.3, такая прямая связь непосредственно воз-
возникает при дискретизации непрерывной системы. _Пренебрежение
прямой связью можно объяснить тем, что при выборе управляемой"
переменной обычно существует некоторая свобода, и поэтому до-
допустимо моменты изменения управляемой переменной выбирать
совпадающими с моментами дискретизации. В этом случае в управ-
управляемую переменную не входит, прямая связь (разд. 6.2.3). Однако
задачи построения регуляторов в случае наличия прямой
связи в управляемой переменной легко преобразуются к постанов-
постановке задачи 6.8.1.
Подход, применяемый при определении оптимального закона
управления, отличается от непрерывного случая, где использо-
560 Глава 6
валось элементарное вариационное исчисление; здесь будем ис-
использовать динамическое программирование [14, 93]. Определим
скалярную функцию a[x(i), i] следующим образом:
[У, [/G4-1) Да G + l)z (/ +
-.l) [pi
I (h-\
min
u(t) u<
-f- 1) -f- и {j)R2 (J) и (/)] +
F.234)
при i = i0, i0 + 1, ... ,il — l,
x (ij) Pja: (ij) при i = i{.
Видно, что a[x(i), i] представляет собой минимальное значение
критерия, вычисленное за период i, i + 1, ..., ij, если в момент
i система находится в состоянии x(i). Найдем рекуррентное урав-
уравнение для этой функции. Рассмотрим момент времени i — 1.
Тогда, если значение входной переменной u(i — 1) является про-
произвольным, a u(i), u(i + 1), ..., u(ii — 1) выбраны как оптималь-
оптимальные значения по отношению к состоянию системы в момент i,
можно записать значение критерия запериод i — 1, i,..., ii сле-
следующим образом:
2 [ zT(J + 1) Ra G + 1) z G + 1) + /G) R2 (j) и GI + x\ii) PAtd =
i=t-i
= [ zT (i) R3 @ z (i) +uT(i — 1) R, (i — l)u(i~ 1)] +
+ o[x(i),i]. F.235)
Очевидно, что для определения оптимального значения входной
переменной и0 (i— 1) в момент i — 1 необходимо выбрать u(i — 1)
так, чтобы минимизировалось выражение
zT (i) R3z (i) + u|(i — 1) R2u (i — 1) + a [x (i), i]. F.236)
Минимальное значение F.236) должно, конечно, быть мини-
минимальным значением критерия, вычисленного за периоды управ-
управления i — 1, г,..., ij — 1. Следовательно, имеем равенство
а [х (г — 1), ? — 1] = min { zT (г) Ra (г) г (г) +
+ итA — 1) Д2 (г — 1) и (i — 1) + a [x (i), i]}. F.237)
Используя F.230) и F.232), преобразуем это выражение к
виду
Теория для дискретных систем 561
а(х, i — 1) = min {[A (i— l)x + B(i — 1) uf Rt(i) [A(i — l)x +-
u
+ B(i — 1) u] + иг Д2 (i—1) м + a ([A{i—1) x + 5(i—1) м], i)}, F.238)
где
/?1@ = Or(i)/?s@O@. . F.239)
Это выражение является разностным уравнением относительно
функции <у(х, i), решение йоторого позволяет найти а(х, ij), <s(x,
ij — 1), а(х, ij — 2), так как а(х, jj) определяется, из F.234). Попы-
Попытаемся найти решение в виде
о (ж, i>= а;гР(г)^, F.240)
где /'(г), i = г0, iL + 1, •¦., г,,— последовательность матриц, кото-
которую надо определить. Из F.234) непосредственно" следует
Подставляя (С.240) в F.238) и проводя минимизацию, находим,
что оптимальная входная переменная определяется в виде
u(i~l) = -F(i — l)x(i — l), i = lo + l,...,i1, F.242)
где матрица коэффициентов F(i — 1) определяется из соотношения
-^[^(O + P^MO-l). F.243)
Обратная матрица в этом выражении всегда существует, пос-
поскольку R2(i — 1) > 0, и добавляется неотрицательно определен-
определенная матрица. Подстановка F.242) в F.238) вместе с F.243) приво-
приводит к следующему разностному уравнению относительно P(i):
Р (i - 1) = AT(i - 1) [Я, @ + P(i)] [A (i-i)-B(i-l)F(i- 1)],
i = io + l fi. F.244)
Нетрудно установить, что правая сторона является симметри-
симметрической матрицей.
Сформулируем эти результаты следующий! образом.
Теорема 6.28. Рассмотрим задачу построения дискретного детер-
детерминированного линейного оптимального регулятора. Оптималь-
Оптимальная входная переменная определяется соотношением
u{i)=~F(l)x{i), i=i0, io + lv..,il-s-l, F.245)
19—394
562 Глава 6
где
F (.0 = [R2 (i) + Вт (О [Л, (i + 1) + Р (i + 1)] В (i)}'1 Вт (i) [Д4 (i +
+ l) + P(i + l)]A(i). F.246)
Здесь обратная матрица всегда существует, кроме того,
Г. » = »о + 1, io +2, ..;,Ч.. F.247)
Последовательность матриц P(i), i = г0, i0 ~h 1, ¦.., ч —'U
удовлетворяет матричному разностному уравнению
* = »о. «оН- 1 Ч — 1, F.248)
конечном условии
P(*i) = Pi. F.249)
Значение критерия F.233), получаемое при этом законе управ-
управления, определяется выражением
xT(i0)P(i0)x(i0). F.250)
Заметим, что разностное уравнение F.248) удобно решать в об-
обратном порядке, при этом сначала в соответствии с F.246) из
P(i + 1) вычисляется F(i), а затем из Р{1 + 1) и F(i), согласно
F.248), находится P(i). При использовании ЦВМ это не вызывает
трудностей. Уравнение F.248) эквивалентно уравнению Рикка-
ти в непрерывном случае.
Нетрудно показать, что при условиях, указанных в опреде-
определении 6.16, решение задачи построения дискретного детерминиро-
детерминированного линейного оптимального регулятора, данное в теореме
6.28, всегда существует и является единственным.
Пример 6.14. Цифровая система управления положением
Рассмотрим цифровую систему управления положением из
примера 6.2 (разд. 6.2.3). В качестве управляемой переменной
примем положение, т. е. пусть
С@ = A, О)*@. 'F.251)
Выберем критерий
2Ка(*-г1) + РИа@.] F.252)
(=0
и произведем его минимизацию.
Теория для дискретных систем
563
Таблица 6.1
Поведение вектора, коэффициентов
обратной связи F;
в цифровой системе управлении
положением
0,1--
\
i
9
8
7
6
5
4
3
2
1
0
F
A07,7,
A14,0,
A09,4,
A10,3,
A10,4,
A10,4,
A10,4,
A10,4,
AЮ,4,
(Н0,4,
@
8,63)
12,66)
12,58)
.12,64)
12,66)
12,66)
12,66)
12,66)
12,66)
12,66)
14
I
1
о to
Дискретное время L
О 10
Дискретное Время I
II
10
Данные табл. 6.1 характеризу-
характеризуют поведение вектора коэффициен- °§
тов F(i) при jj = 10 ир = 0,00002. J3
Видно, что с увеличением i F(i)
приближается к установившемуся
значению
7 = A10,4 Г2.66). F.253)
Реакция соответствующей замкну-
замкнутой системы при начальном состоя- °^
нии х@) — col @,1, 0) показана на 2
рис. 6.13. =»-
I
Рис. 6.13. Реакция оптимальной цифровой !g -1Q
системы управления положением при на- •*>
чальном состояния х@) = col @,1, 0). ^
6.4.4. УСТАНОВИВШЕЕСЯ РЕШЕНИЕ ЗАДАЧИ
ДИСКРЕТНОГО РЕГУЛИРОВАНИЯ
В настоящем разделе рассматривается случай, когда период
управления расширяется от i0 до бесконечности. Следующие ре-
результаты по существу идентичны выводам для непрерывного случая.
19*
564 Глава 6
Теорема 6.29. Рассмотрим задачу построения дискретного детер-
детерминированного оптимального регулятора и ее решение, данное в
теореме 6.28. Предположим, что A(l), B(l), R^i + 1) и R2(i)
ограничены при i > i0, и предположим, что
R9(i + l)>.al, R2 (i)>p/, »>*о. F.254)
где а и C — положительные константы.
1) Тогда, если система F.230)
а) полностью управляемая или
б) экспоненциально устойчивая,
решение P(i) разностных уравнений F.246) и F.248) с конечным ус-
условием P(ii) = 0 при i\ —*- оо сходится к неотрицательно опре-
определенной последовательности матриц P(i), которая является ре-
решением разностных уравнений F.246) и F.248).
2) Далее, если система F.230) и F.232) либо:
в) равномерно полностью управляемая и равномерно' пол-
полностью восстанавливаемая, либо
г) экспоненциально устойчивая,
то решение P(i) разностных уравнений F.246) и F.248) с конечным
условием P(li) = Pi при it ->-oo сходится к РA) для любого
Pi > 0.
Устойчивость установившегося закона управления, который
соответствует установившемуся решению Р, вытекает из сле-
следующего факта.
Теорема 6.30. Рассмотрим задачу построения дискретного детерми-
детерминированного линейного оптимального регулятора и предположим,
что удовлетворяются допущения теоремы 6.29 относительно А,
В, Ru Rs и R2. Тогда, если система F.230) и F.232) либо
а) полностью равномерно управляемая и равномерно полностью
восстанавливаемая, либо
б) экспоненциально устойчивая, справедливы следующие ут-
утверждения.
1) Установившийся оптимальный закон управления
u(i) = —F(i)x(i), F.255)
где F(i) получается заменой P(i) на P(i) в F.246), является
экспоненциально устойчивым.
2) Установившийся оптимальный закон управления F.255)
минимизирует выражение
lim y[( + K( + )( + ) B{)
+ xT(ii)Pix(ii)} - F.256)
Теория для дискретных систем ' 565
при всех Pi > 0. Минимальное значение выражения F.256), кото-
которое достигается при установившемся оптимальном законе управ- '
ления, равно ,
xT(io)P(io)x(io). F.257)
Доказательства этих теорем можно провести по плану дока-
доказательств Калмана [86] для непрерывных систем. Теоремы, дуаль-
дуальные этим теоремам (применительно к восстанавливаемости), рас-
рассматриваются в работе [51]. Для случая постоянных параметров
устанавливаются следующие результаты [32, 33].
Теорема 6.31. Рассмотрим задачу построешгя дискретного линей-
линейного оптимального регулятора с постоянными параметрами. Тог-
Тогда, еСЛи система и стабилизируема, и обнаруживаема, справедливо
следующее:'
1) Решение P(i) разностных уравнений F.246) и F.248) с ко-
конечным условием P(it) = Pi при il -*~ <» сходится к постоянному
установившемуся решению Р для любого Pi з> 0.
2) Установившийся оптимальный закон управления имеет
постоянные параметры и является асимптотически устойчивым.
3) Установившийся оптимальный закон управления миними-
минимизирует F.256) для всех Pt > 0. Максимальное значение этого вы-
выражения равно
xT(i0)Tx(i0). F.258)
В заключение получим результат, который полезен при изу-
изучении местонахождения полюсов замкнутой системы, соответст-
соответствующих оптимальному'регулятору с постоянными параметрами в
установившемся режиме. Определим величину
рA) = [Щ1 + 1)+РA + 1)]хA + 1), * = *о. «o + l Ч — 1. F-259)
где Л( иР вводятся в теореме 6.28. Найдем разностное уравнение
для р(?). Из конечного условия F.249) непосредственно следует, что
p(ii-1) =--.[/?! (Ч) + Л1 г (it). F.260)
Далее, используя F.248), получаем
= Rt (i) x (i) + AT (i) [7?t (i + 1) -f P(i + 1)] x (i +.1) =
= Ri(i)x(i)+AT(i)p(i). F.261)
Наконец, выразим u°(i) через p(i). Рассмотрим следующую це-
цепочку равенств:
566 Глава 6
- Л (i) Br(i) Р(О = - Я~' (О BT(i) [
= -л^1 (О я7" (О [/?! (i + i) - P(i +1)] И (»)*(») + В(Ои°(О1 =
= — Л (ОSr (i) f/?, (i + 1) -u p (j + I)] Л (i) х (i) —
— Я (i)BT(i)[Rl(i -i-1) + P(i + i)]B{i)u°(i). F.262)
Теперь из F.246) следует
BT(i)\Rl(i + l) + P(i + l)]A(i)x(i) =
= {R2(i) + BT(i) [R, (i + i) + P(i + l)j В (i)} F(i) x (I) =
= -{/?2(O + S7'@[fii(J + l)-hJP(i + l)]S(J)Uo(O. F.263)
Подстановка этого выражения в F.262) дает
-R~l(i)BT(i)p(i) = u°(i). • F.264)
Подставляя это выражение для u°(i) в разностное уравнение
состояния, получим следующую двухточечную краевую задачу:
х ('о) = ^о.
F.265)
Эти уравнения можно было получить непосредственно, испол-
зуя аналогично непрерывному случаю вариационный подход к ре-
решению задачи построения дискретного регулятора.
Рассмотрим теперь случай установившегося режима и постоян-
постоянных параметров. Для этого случая p(i) определяется соотношением
(Bl + P)x(i + l), i^i0, io + l...... F.266)
При условии постоянных параметров разностные уравнения
F.265) принимают вид
x(i + i) = Ax(i) — BR~lBTP(i), i = i0, i0 + 1, ...,
p(i —lJ^^tO-^p^), i = io + l, »o + 2, ... • F.267)
Без потери общности примем i0 = 0; таким образом, перепишем
уравнения F.267) следующим образом:
Теория для дискретных систем . 567
x(i + 1) = Ax(i)~BR~x BTp(i), i = О, 1, 2.
F.268)
p(i) = Rix(i + i) + ATp(i + i), J-O, 1, 2
Исследуем эти разностные уравнения с помощью z-преобразо-
вания. Применяя 2-преобразование к обоим уравнениям, получим
F.269)
P(z) = zR,X(z)— zR.xn -\- zA P (?)—zA pn,
где x0 — x@), p0 = p@), a X(z) и P(z) являются z-преобразования-
ми соответственно переменных х и р. Решая F.269) относительно
X(z) и P(z), получим
zI — A BR-1 BT ,,--,„ , F270)
-R, z-4~-ATj {^R.x.-A^,
Каждая компонента X(z) и P(z) в этом выра.кении является
рациональной функцией от z с особыми точкгуни нри тех г, где
Uo F.271)
--Rt z-4-AT)
Пусть Zj, / = 1, 2, ..., обозначают корни этого выран-.ения,
левая часть которого является полиномом от z и 1/z. Если zy.—
корень, то i/zj также является корнем. Нуль никогда не монч*ет быть
корнем выражения F.271), и существует самое большее In корней
(п — размерность состояния х). Отсюда следует, что как x(i),
так и p(i) могут быть описаны линейной комбинацией выражений
вида z), iz), i2z), ... для всех значений /. Члены вида ikz), к =
= 0, 1, ..., I — 1, имеют место, если z;- имеет кратность I. Извест-
Известно, что при соответствующих условиях, указанных в теореме
6.31, установившаяся реакция замкнутого регулятора является
асимптотически устойчивой. Это означает, что начальные условия
разностных уравнений F.268) таковы, что в выражении для x(i)
коэффициенты при членах со степенью z;, где |z;|> 1, являются
нулевыми. Следовательно, x(i) является линейной комбинацией
степенных членов с теми корнями Zj, для которых \zj\<i 1. Это оз-
означает, что указанные корни являются характеристическими
числами замкнутого регулятора. Поскольку F.271) имеет мень-
меньше чем In корней, то может существовать меньше чем п корней,
по модулю строго меньших чем 1 (в разд. 6.4.7 показано, что это
имеет место, только когда матрица А имеет одно или более нуле-
нулевых характеристических чисел). Это приводит к заключению, что
остальные характеристические числа замкнутого регулятора ну-
568 Глава 6
левые, так как в знаменателях выражения в правой части F. 270)
после обращения матрицы появляется z.
Эти результаты будут использоваться в дальнейшем (разд.
6.4.7) при анализе поведения характеристических чисел замкнутой
системы. Подытожим полученные результаты следующим обра-
образом.
Теорема 6.32. Рассмотрим задачу построения дискретного детер-
детерминированного линейного оптимального регулятора с постоянными
параметрами. Предположим, что п-мерная система
F.272)
• г (i) = Dx (i)
является стабилизируемой и обнаруживаемой. Пусть Zj, j =
= 1, 2, ..., г, где г <: п, обозначают те корни уравнения
) 0, F.273)
~DTR3D z-4-AT) '
которые по модулю строго меньше чем 1. Тогда Zj, j =1, 2, ..., г,
представляют собой г характеристических чисел замкнутого
оптимального регулятора, работающего в установившемся режиме.
Остальные п — г характеристических чисел являются нулевыми.
В работе [1721 приводится основанный на таком подходе метод
нахождения установившегося решения задачи регулирования с
помощью диагонализации. ч ,
Пример 6.15. Смесительный бак
Рассмотрим задачу регулирования смесительного бака из при-
примера 6.3 (разд. 6.2.3), который описывается разностным уравне-
уравнением состояния
0,9512 0 \ ... , /4,877 4,877 \ ,.4 .„ 07/ч
. )x(i) + l )u{i). F.274)
0 0,9048/ '1—1,1895 3,569/ '
В качестве управляемых переменных выберем расход и кон-
концентрацию на выходе из бака, т. е,
i)^(°- ' F'275)
Используемый критерий имеет вид
uT (i) /?2 и (i)] F.276)
i=0
Теория для дискретных систем
569
ч
10
Дискретное время L
5
I*
1
I I П
о 10
Дискретное Время L
X 0,1
3 л
II
О 10
Дискретное время с
г:
I"
Si ic
0,1
11
0 10
Дискретное время с
Рис. 6.14. Реакции замкнутой системы регулирования смесительного бака
(дискретный вариант).
Слева — реакции переменных, характеризующих обг1ем и концентрацию, ври начальных
условиях Е, @) = 0.1 ма и Е. @) = 0 кмоль/м3; справа — реакции переменных, характери-
характеризующих объем и концентрацию, при начальных условиях Et @) = 0 м3 и Е2 @) =0,1 кмоль/м3.
Весовые матрицы выберем такими же, как и в непрерывном
случае (пример 3.9 из разд. 3.4.1):
50 0
0 0,02
F.277)
где р — скалярная константа, которую следует определить.
Матрица установившихся коэффициентов обратной связи мо-
может быть найдена повторяемым применением выражений F.246)
и F.248). При р = 1 численные расчеты приводят к следующему
результату:
°'7029). F.278)
0,0.1357 0,04548/
у= /0,07125
570 Главк С)
Характеристические числа замкнутой системы равны 0,5982 ±
± ./'0,08988. На рис. 6.14 показана реакция замкнутой системы при
начальных условиях ж@)'—col@,l, 0) и х@) — col@, 0,1).
Реакция довольно похожа на реакцию системы в соответствующем
непрерывном регуляторе (рис. 3.11, разд. 3.4.1).
6.4.5. СТОХАСТИЧЕСКИЙ ДИСКРЕТНЫЙ ЛИНЕЙНЫЙ
ОПТИМАЛЬНЫЙ РЕГУЛЯТОР
Задача построения стохастического дискретного линейного
оптимального регулятора формулируется следующим образом.
Определение 6. 17. Рассмотрим дискретную линейную систему
x(i + l) = A(i)x(i) + B(i)u(i) + w(i),
F.279)
Z (*о) = хо>
где w(i), i — i0, i0 + 1, ..., ^ — 1 образует последовательность
некоррелированных стохастических величин с нулевым средним и
матрицами дисперсий V(i), i = i0, ..., it — 1. Пусть
z (i) = D (i) x (i) F.280)
является управляемой переменной. Тогда задачу минимизации,
критерия
Е 2
+ xT(ii)Pix(ii)}, F.281)
еде R3(i + l) > 0, R2(i) >0 при i — i0,..., i±-—1 и Pt > 0,
назовем задачей построения стохастического диск-
дискретного линейного оптимального регулятора. Если все
матрицы в сформулированной задаче постоянные, то имеет место
задача построения стохастического дискретного ли-
линейного оптимального регулятора с постоянными
параметрами.
Как и в непрерывном случае, решение задачи стохастического
регулирования идентично решению детерминированного экви-
эквивалента [7, 103, 167].
Теорема 6.33. Критерий F.281) в задаче построения стохастичес-
стохастического дискретного линейного оптимального регулятора миними-
минимизируется выбором входной переменной согласно закону управления
u(i) = -^F(i)x(i), i = i0, io + i, ...,i{— 1, F.282)
Теория для дискретных систем 571
где
F (i) = {R2 (i) -Ь Sr (О [Д, (i + l) + P(i + 1)] 5 (ОГ1 Вт (О [Л, (i -Ь
+ 1) + РA+1)]Л(г). F.283)
Последовательность матриц P(i), i — i0,..., г"!—1, является
решением матричного разностного уравнения
Р {i) = АТ (г),[Й! (г + 1) + Р (i -t- 1)] И @ -5 (О F (I)],
j = 'o, io+.l, ... ,4 —1, F.284)
с конечным условием
Jp(t1)=p1. F.285)
Здесь
/?1(j) = JDr(i)R3(i)D(l). ' F.286)
Значение критерия F.281), получаемое при этом законе управ-
управления, определяется выражением
T tr ^ (/~ 1I^ G).+#i (/)]}• F-287)
Эта теорема может быть доказана путем использования прин-
принципов динамического программирования из разд. 6.4.3. Заметим,
что теорема 6.33 определяет линейный закон управления F.282)
как оптимальное решение без каких-либо ограничений. Это от-
отличается от непрерывного случая (теорема 3.9, разд. 3.6.3), где
рассмотрение было ограничено линейными законами управления.
Как и в непрерывном случае, задача стохастического регули-
регулирования включает в себя задачи регулирования с учетом возму-
возмущений, задачи слежения в отсутствие возмущений и задачи сле-
слежения при наличии возмущений. И в этом случае структура ре-
решений каждого из указанных вариантов задачи такова, что на
коэффициент обратной связи по состоянию объекта не оказывают
влияния свойства возмущений в эталонной переменной (см. за-
задачи 6.2 и 6.3).
Здесь также можно исследовать, в каком смысле установивший-
установившийся оптимальный закон управления является оптимальным. Как
и в непрерывном случае, можно предположить, что установив-
установившийся закон управления минимизирует выражение
1 i
-i-? У [zT(i+l)R3(i + l)z(i + l) +
N I ?a
T F.288)
572 Глава 6
(полагая, что это выражение существует для установившегося оп-
оптимального закона управления) относительно всех линейных за-
законов "управления, для которых это выражение существует. Ми-
Минимальное выражение F.288) принимает вид
ij+.V _ '
-1)}, F.289)
A 'J+'V
i 2
где P(j), } >¦ i0, является установившимся решением уравнения
F.284). В случае постоянных параметров установившийся закон
управления, кроме того, минимизирует
lim Е { / (i + 1) R3z (i -f 1) + ит (i) Щи {i)\ , F.290)
относительно всех законов управления с постоянной настройкой.
Минимальная величина выражения F.290) р^вна
F.291)
Эти результаты обсуждаются в работе [103].
Пример 6.1€. Смесительный бак при наличии возмущений
В примере 6.10 (разд. 6.2.12) с помощью стохастического раз-
разностного уравнения F.168) была описана модель смесительного
бака при наличия возмущений в концентрациях входных потоков.
Если в качестве компонент управляемой переменной выбрать вы-
выходной расход и концентрацию в баке, то получаем
0,01 0 0 0\ ... /соооч
о 10 о)х{1)- F-292)
... /
@ - (
Рассмотрим критерий
2 I *г (* + 1) Ъ* (* + !)+ «Т @ Я<и (О! . " F.293)
i=o
где весовые матрицы i?3 и ^2 выбираются такими же, как и в при-
примере 6.15. При р = 1 после численных расчетов получим следую-
следующую матрицу установившихся коэффициентов обратной связи
j_ /0,07125 —0,07029 —0,009772 —0,003381 \
~\ 0,01357 0,04548 0,008671 0,003052/
Сравнение с решением из примера 6.15 показывает, что, как
и в непрерывном случае, введение в модель возмущений (см. за-
задачу 6.8.2) на обратную связь закона управления (описываемую пер-
первыми двумя столбцами матрицы F) не влияет.
Теория для дискретных систем 573
Установившиеся среднеквадратические значения выходного
расхода, концентрации и входных расходов могут быть вычисле-
вычислены посредством составления разностного уравнения состояния
замкнутой системы и решения относительно (^-матрицы устано-
установившихся дисперсий состояния расширенной системы.
€.4.6. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ РЕГУЛЯТОРЫ
ДЛЯ СИСТЕМ С НЕНУЛЕВЫМИ ЗАДАННЫМИ ТОЧКАМИ
И ПОСТОЯННЫМИ ВОЗМУЩЕНИЯМИ
В данном разделе рассматриваются линейные дискретные ре-
регуляторы для систем с ненулевыми заданными точками и постоян-
постоянными возмущениями. Ограничимся случаем систем с постоянными
параметрами и сначала рассмотрим регуляторы для систем с не-
ненулевой задапной точкой. Предположим, что система
x(i + l) = Ax(i)+Bu(i),
F.295)
z (?) = Dx (i)
должна функционировать относительно заданной точки
z(i) = z0, F.296)
где z0 — заданный постоянный вектор. Как и в непрерывном слу-
случае (разд. 3.7.1), введем смещенные состояние, входную и управ-
управляемую переменные. Тогда установившийся закон управления,
который переводит систему из любого начального условия в задан-
заданную точку оптимальным образом, в смысле того, что минимизи-
минимизируется критерий
^[z'T(i + i)R3z'{i + l) + u'T(i)Rtu'{i)], F.297)
имеет вид
и'(?)= — Jx'(i), F.298)
где и', х' и з'— соответственно смещенные входная переменная,
состояние и управляемая переменная и где F — матрица устано-
установившихся коэффициентов обратной связи. В терминах перемен-
переменных исходной системы этот закон управления должен принять
вид
u(i)=-Fx(iy+uQ, ¦ (С. 299)
где и0' — постоянный вектор. При таком законе управления сис-
система описывается уравнениями
574 Глава 6
x(i + i) = 'Ax (i) + Bu'o ,
F.300)
*(i) = Dx(i),
где _ _
A = A—BF. F.301)
В случае асимптотически устойчивой замкнутой системы уп-
управляемая переменная будет стремиться к постоянному устано-
установившемуся значению
(i) = #c(l)u0, F.302)
i —>со
где Hc(z) — матричная передаточная функция замкнутой системы:
Hc{z) = D(zI—A)~1 В, F.303)
Выражение F.302) показывает, что нулевая установившаяся
ошибка получается, если и0' выбрано в виде
uQ = HJl(l)z0 F.304)
при условии существования обратной матрицы. Здесь предпола-
предполагается, что dim(u) = dim(z). Назовем закон управления
u(i)=- Fx (i) + H~l A) zT (i) ¦ F.305)
оптимальным законом управления при ненулевой заданной точке.
Видно, что существование этого закона управления опреде-
определяется существованием матрицы, обратной Hc(i). Совершенно
аналогично непрерывному случаю можно показать, что
det [Hc (z)] = -Ш- , F.306)
Чс (?)
где фс (z) — характеристический полином замкнутой системы:
cpc(z) = det(z/— A + BF), ¦ F.307)
а ф(г) — полином числителя передаточной функции разомкнутой
системы, т. е. <b(z) определяется из выражения
det [Я (z)] =-Ш-. • F.308)
Здесь
H(z) = D(zI—A)-1B F.309)
есть матричная передаточная функция разомкнутой системы, а
Ф (z) = det (z/— A) F.310)
Теория для дискретных систем 575
— характеристический полином разомкнутой системы. Из соот-
соотношения F.306) видно, что Н~1 A) существует при условии фA) Ф
Ф 0. Поскольку Н(е'9) описывает частотную характеристику ра-
разомкнутой системы, это условие эквивалентно требованию, чтобы
матричная частотная характеристика разомкнутой системы име-
имела такой полипом в числителе, который н& равен нулю при 9=0.
Подведем итоги следующим образом.
Теорема 6.34. Рассмотрим дискретную линейную систему с пос-
постоянными параметрами
x(i + l) = Ax(i) + Bu(i),
F.311)
z(i)--=Dx(i),
где dim(z) = dim(w). Рассмотрим произвольный асимптотически
устойчивый закон управления с постоянной настройкой
u(i)r=-Fx(i)+u0. - F,312)
Пусть H(z)—матричная передаточная функция разомкнутой
системы
H(z) = D(zI — A)-1B, F.313)
а Нс (z) — матричная передаточная функция замкнутой системы
B. F.314)
'Тогда матрица Нс(\) является неособой, а управляемая пере-
переменная z(i) в установившемся режиме может удерживаться около
постоянной заданной точки z0 выбором
в том и только в том случае, если H(z) имеет ненулевой полином в
числителе, который не имеет нулей при z — 1.
Заметим, что эта теорема справедлива не только для оптималь-
оптимального закона управления, но и для любого устойчивого закона
управления.
Теперь весьма кратко рассмотрим регуляторы систем при пос-
постоянных возмущениях. Предположим, что объект описывается
разностным уравнением состояния и уравнением выходной пере-
переменной вида
x(i + l) = Ax(i) + Bu{i) + v0,
F.316)
,
где v0 — постоянный вектор. Смещая состояние и входную пере-
576 Глава 6
менную, приходим к заключению, что закон управления, который
оптимально приводит смещенное состояние к нулю, должен иметь
вид
u(i) = — Fx(i) + u0, F.317)
где щ — соответствующий постоянный вектор. Установившаяся
реакция управляемой переменной при указанном законе управ-
управления описывается выражением
lim z (i) = tfc A) и0 + D (I —I)1»0. F.318)
где Hc(z) =D{zI — A + BFY1B. Установившаяся реакция мо-
может быть сделана нулевой, если выбрать
и'0 = - Н-1 A) D (I -I)'1 v0 F.319)
при условии dim(z) = dim(u) и неособой матрице Не(Х). Таким
образом, оптимальный закон управления, обеспечивающий нулевую
установившуюся ошибку, определяется в виде
a(*)=-F:c(i)-tf71(l)?(/-I)~4, F-320)
Условия существования матрицы Нс~1 A) приводятся в тео-
теореме 6.34.
Недостаток закона управления F.320) заключается в том, что
его применение требует измерения постоянного возмущения v0.
Эту трудность можно обойти, используя «интегральное состояние»
системы q (ср. с разд. 3.7.2), определяемое разностным соотноше-
соотношением-
q(i + l) = q(i)+z(i), i>i0 F.321)
при заданном q(l0). При этом любой асимптотически устойчивый
закон управления вида
u(i)=—F1x(i) — F%q(i) F.322)
подавляет влияние постоянных возмущений на управляемую пе-
переменную, т. е. z(i) принимает в установившемся состоянии нуле-
нулевое значение независимо от того, каково значение v0 в F.316).
Необходимые и достаточные условия существования такого асим-
асимптотически устойчивого закона управления состоят в том,. что
система F.316) должна быть стабилизируемой, а [предполагая,
что dim(u) = dim(z)] матричная передаточная функция разомкну-
разомкнутой системы не должна иметь нулей в начале координат.
Пример 6.17. Цифровая система управления положением
В примере 6.6 (разд. 6.2.6) показано, что пифровая система
Теория для дискретных систем
577
управления положением, рас-
рассмотренная в примере 6.2
(разд. E.2.3), имеет передаточ-
передаточную функцию
„, 0,003396(г + 0,8575)
• B—1) B — 0,6313)
F.323)
Так как полипом в числите-
числителе передаточной функции не
имеет нуля при z = 1, может
быть построен оптимальный
регулятор при непулевой задан-
заданной точке. В примере 6.14
(разд. 6.4.3) был получен век-
вектор установившихся коэффи-
коэффициентов обратной связи F =
= A10,4, 12,66). Нетрудно убе-
убедиться, что соответствующий оп-
оптимальный закон управления
при ненулевой заданной точке
описывается выражением
F.324)
где Со — (скалярная) заданная
точка. На рис. 6.15 показана
реакция, замкнутой системы на
ступенчатое изменение задан-
заданной точки не только в моменты
квантования, но и в промежу-
промежуточные интервалы; реакция по-
получена при моделировании не-
непрерывной системы. Система
обладает хорошей реакцией, не
такой быстрой, как апериоди-
апериодическая реакция на рис. 6.12, но
зато с меньшими амплитудами
входного сигнала.
Рие. 6.15. Реакции цифровой систе-
системы управления положением на сту-
ступенчатое изменение заданной точки
0;1 рад.
10'-
I
1
и с
578 Глава 6
6.4.7. АСИМПТОТИЧЕСКИЕ СВОЙСТВА ОПТИМАЛЬНЫХ ЗАКОНОВ
УПРАВЛЕНИЯ С ПОСТОЯННОЙ НАСТРОЙКОЙ
В данном разделе рассматриваются асимптотические свойства
установившихся оптимальных законов управления с постоянной
настройкой; при этом в критерии весовая матрица В2 заменяется
на
/?2 = pN, F.325)
где р | 0. Сначала рассмотрим поведение полюсов замкнутой систе-
системы. Из теоремы 6.32 (разд. 6.4.4) следует, что ненулевые харак-
характеристические числа замкнутой системы являются теми корнями
уравнения
В 1 = 0, F.326)
z-ч — ат !
которые по модулю меньше 1, причем R^ — DTR3D. Используя
леммы 1.2 (разд. 1.5.4) и 1.1 (разд. 1.5.3), напишем
dot 2 = (let(г/— 4) det [г1/ — AT + Ri(zI^
V—Hi z-4~ATJ
— A)~'BR~X Bt ] - det (z/ — A) det (z'4 — AT) det [/ + RL (zl —
— А)-1ВВ?1Вт(г*11—Ату1] =detB/— A) detfr1/—AT) det[/ +
+ Л71 5r (z/ — Ат У1 R^zl— A)-1 B] = det (zl — Л) det {z~lI ~
— 4r) det Г/ ¦+- — N-1 BT (z-4 — Ат У1 DT R3D (zl — A)~l B] =
L p
+ —N-1 НтBГ1)RSH(z)l, F.327)
где
9(z) = det(z/ —Л) F.328)
является характеристическим полиномом разомкнутой системы, а
H(z) = D(zI—A)-1B ' F.329)
матричной передаточной функцией разомкнутой системы.
Чтобы изучить поведение характеристических чисел замкнутой
системы, рассмотрим сначала случай скалярных входной и выход-
выходной переменных. Предположим, что скалярная передаточная
функция может быть записана в виде
#(z) = J4^-,' • F.330)
cp(z)
Теория для дискретных систем
579
где
F.331)
при q <. n является характеристическим полиномом системы и
где
Ф (z) = си** П (z — у{), v^°- i = l,2, .... р, F.332).
при р < s < и — 1 является полиномом числителя системы.
Тогда F.327) принимает следующий вид (в предположении, что
R3=l и TV ¦= 1):
П (* - «,)(^- --/) + — П (*- v,)(± - v,) . F.333)
Чтобы применить обычный метод корневого годографа, приве-
приведем это выражение к виду
ч
П (-
^ п
F.334)
Сделаем следующие - выводы относительно годографов 2q
корней этого выражения, считая, что q>- p (см. задачу 6.8.4 для
случая q < р).
1. 2q годографов начинаются при р =» в точках я; и 1/яг,
i =1,2, .... g.
2. При р \ 0 годографы ведут себя следующим образом:
a) р корней стремятся к нулям v;, i = 1, 2, ..., р;
б) /> корней стремятся к значениям, обратным нулям, l/v;,
i=l,2,...,p;
b) Q — Р корней стремятся к нулю; '
г) остальные q ^- p корней стремятся к бесконечности.
3. Те корни, которые перемещаются к бесконечности при
р \ 0, асимптотически удалены на расстояние
гъ,
(=1
q
1=1
1/С/-Р)
F.335)
580 Глава 6
от начала координат. Следовательно, те корни, которые пере-
перемещаются к нулю, асимптотически находятся на расстоянии
q \Цч-р)
U щ
1=1
«2
р
П V,
F.336)
от начала координат.
Информация о полюсах оптимальной замкнутой системы полу-
получается при отборе тех корней, которые по модулю меньше 1.
¦Сделаем следующий вывод.
Теорема 6.35. Рассмотрим установившееся решение задачи пост-
построения дискретного линейного регулятора с постоянной настрой-
настройкой в скалярном случае. Пусть передаточная функция разомкнутой
системы имеет вид
p
П (г-'
гп-ч П (z-щ)
(=1
F.337)
где лi =/= 0, i = 1, 2, ..., q, являются ненулевыми характерис-
характеристическими числами разомкнутой системы, a v,- =yfe 0, i = 1, 2,...
..., р, — ненулевыми нулями. Предположим, что п >¦ q :> р,
п — l>s>p « что в критерии F.233) i?3 = 1, о. Rz =p. Тог-
Тогда справедливо следующее.
а) Из п характеристических чисел замкнутой системы п — q
всегда находятся в начале координат.
б) При р | 0 из q оставшихся характеристических чисел замк-
замкнутой системы р стремятся # числам vf, i = 1, 2, ..., р, еде
г, если | vj [ < 1,
— , если I v, I > 1.
F.338)
в) При р | 0 q — р других характеристических чисел замкнутой
системы перемещаются к нулю. Эти полюса замкнутой системы
асимптотически находятся на расстоянии
q
П Щ
t=l
Р
П v,
1=1
F.339)
Теория для дискретных систем 581
«та начала координат. ;
г) При р —коо q ненулевых характеристических чисел замкну-
замкнутой системы стремятся к числам nit i = 1, 2, ..., q, где
если | тч \ <; 1.
F.340)
если [ я,. | > 1.
Проанализируем теперь оптимальный закон управления для
ненулевой заданной точки, который получен в разд. 6.4.6. В
¦случае системы со скалярными входной и выходной переменными
нетрудно видеть, что передаточная функция от (скалярной) за-
заданной точки Со(?) (которая здесь является переменной) до управ-
управляемой переменной С (О определяется выражением
T{z) = lf^)' F.341).
где Hc(z) — передаточная функция замкнутой системы. Как и в
непрерывном случае (разд. 3.8.2), нетрудно убедиться, что можно
написать
F.342)
c() ^
<fc B)
где ф(г) — полином числителя передаточной функции разомкнутой,
системы, a cpc(z) — характеристический полином замкнутой сис-
системы. Выражепие для <b(z) имеет вид
р
ф (z) - az*-P П (z — v,), , F.343)
тогда как в пределе при р \ 0 характеристический полином замк-
замкнутой системы равен
<Pc(z)= zny П U— vj . F.344)
i=\
Подстановка F.342) в F.341) с учетом F.343) и F.344) показы-
показывает, что в пределе при р \ 0 передаточная функция системы управ-
управления может быть записана в виде
}еЯ F-345)
Теперь, если передаточная функция разомкнутой системы не
имеет нулей вне единичного круга, передаточная функция предель-
582 Глава 6
ной системы управления сводится к выражению
ГоB) = -^7- F-346)
Это представляет собой чистое запаздывание, т. е. управляе-
управляемая переменная и переменная заданная точка связаны следующим
образом:
С @ = ^1*-(»-*)]¦ . F-347>
Подытожим полученные результаты.
Теорема .6.36. Рассмотрим оптимальный закон управления для
ненулевой заданной точки, описанный в разд. 6.4.6, применительно
к системе со скалярными входной и выходной переменными. Пусть-
R3 = 1 и Я2 = р. Тогда при р \ 0 передаточная функция замкну-
замкнутой системы от заданной точки до управляемой переменной стре-
стремится к выражению
П()П(^\ F-348)
1=1 V Z— ;
где v;, i = 1, 2, ..., р, определяются из ненулевых нулей разомкну-
разомкнутой системы, как показано в F.338), п — размерность системы,
as — степень полинома числителя системы. Если передаточная,
функция разомкнутой системы не имеет нулей вне единичного
круга, то передаточная функция предельной системы равна
что представляет собой чистое запаздывание.
Таким образом, если разомкнутая система не имеет нулей
вне единичного круга, реакция управляемой переменной на еди-
единичное воздействие по заданной точке для предельной замкнутой-
системы достигает нулевой ошибки слежения после п — s времен-
временных интервалов. Этот случай соответствует апериодической реак--
ции выходной переменной.-
Обсудим теперь асимптотическое поведение характеристичес-
характеристических чисел замкнутых систем в случае многомерной входной пере-
переменной. Возвращаясь к F.327), рассмотрим корни выражения
Ф (z)q? (г-1) det Г/ + — ЛГ НТ (г) R3 H (z)j . F.350)
Очевидно, что при р =оо конечные корни этого выражения-
' являются корнями выражения
N Ф(г)ф(г). F.351)
Теория для дискретных систем 583
Пусть
Ф (*) = *»-» П (z-ic,). F.352)
Предположим, что яг =^= 0, i. = 1, 2, ..., g. Тогда имеем
Ф (z) cp (z-i) = П (z - ^) (z - *,), F.353)
откуда видно, что 2q корневых годографов выражения F.350) при
tp = оо начинаются из ненулевых характеристических чисел ра-
разомкнутой системы и чисел, обратных им.
Рассмотрим теперь корни выражения F.350) при р | 0. Ясно,
что те корни, которые остаются конечными, стремятся к нулям
выражения
^(z)(f(z-1)dei[HT(z-1)R3H(z)]; F.354)
Предположим теперь, что входпая и управляемая переменные
имеют одинаковую размерность, так что H(z) является квадратной
матричной передаточной функцией, у которой
det[tf(z)]=^-. (G.355)
<P(z)
Тогда нули выражения F.354) являются пулями выраже-
выражения
«Кг^Ж*). F.356)
Пусть полином числителя <}i(z) записывается в виде
Ф(г) = аг*-" П (z-v,), F.357)
i=\
где v,- Ф 0, I = 1, 2, ..., р. Тогда F.356) может быть представлено
как
^rWz-vjMr1-^). F.358)
j=i .
Отсюда видно, что 2р корневых годографов выражения F.350)
•оканчиваются при р =0 в ненулевых нулях Vj, i = 1, 2, ..., р,
л в числах, обратных нулям ihif i =1,2, ..., p.
Предположим, что q > р (случай q <; р см. в задаче 6.8.4).
Тогда существуют 2q корневых годографов выражения F.350),
которые при р = оо начинаются из ненулевых нулей разомкну-
разомкнутой системы и чисел, обратных им. Как было показано, 2р годо-
584 Глава в
графов при р = 0 оканчиваются в ненулевых нулях разомкнутой
системы и числах, обратных им. Из остальных 2q — 2р годогра-
годографов q — р годографов стремятся к бесконечности при р \ 0, тбгда
как другие q — р годографов стремятся к началу координат.
Ненулевыми полюсами замкнутой системы являются те кор-
корней выражения F.350), которые лежат внутри единичного круга.
Сформулируем в заключение следующее.
Теорема 6.37. Рассмотрим установившееся решение задачи регули-
регулирования с постоянной настройкой. Предположим, что dim(w) =
= dim(z), и пусть H(z) является матричной передаточной
функцией разомкнутой системы
= D(zI~A)-1B. F.359)
Далее, пусть
det [Я (г)] = -i^- , F.360)
где
Ф(г) = г»-» ПB-1:,) F.361)
при лг Ф 0, i = 1, 2, ..., q, является характеристическим поли-
полиномом разомкнутой системы. Кроме того, предположим, что
" р
ф (z) = azs~P П (z — v;) F.362)
при р < q и Vj ф 0, i = 1, 2, ..., р. Наконец, пусть R2 =pNr
где N > О, ар —положительный скаляр. Тогда имеем следующее.
а) Из п полюсов замкнутой системы п — q полюсов всегда на-
находятся в начале координат.
б) При р | 0 из остальных q полюсов замкнутой системы р
полюсов стремятся к числам vb i = 1, 2, ..., р, где
Vj, если | v? | < 1,
! . F.363)
— , если | V; | > 1.
I
в) При р | О g — р других полюсов замкнутой системы пере-
перемещаются к нулю.
г) Л/ш р -> оо g ненулевых полюсов замкнутой системы стре-
стремятся к числам nt, i =1,2, ..., q, где
Теория для дискретных систем , 585
л(, если | itj | < 1,
! F.364)
, если | тсг I > 1.
г
Заметим, что в противоположность непрерывному случаю по-
полюса замкнутой системы остаются конечными, когда весовая мат-
матрица R2 стремится к нулевой матрице. Аналогично матрица коэф-
коэффициентов обратной связи F также остается конечной. Часто, не
не всегда предельная матрица коэффициентов обратной связи
может быть найдена при подстановке R2 = 0 в разностные урав-
уравнения F.246) и F.248) и применении итерационной процедуры
до тех пор, пока не будет найдено установившееся значение (см.
примеры, а также работы [135, 147]).
При анализе реакции замкнутой системы с таким предельным
законом обратной связи надо ожидать следующего. Как было по-
показано, предельная замкнутая система асимптотически имеет
п — р- характеристических чисел в начале координат. Если все
нули разомкнутой системы находятся внутри единичного круга,
они компенсируют соответствующие предельные полюса замкнутой
системы. Это означает, что реакция определяется п — р полюсами
в начале координат, и за и — р шагов возпикает апериодическая
реакция управляемой переменной. Будем называть это аперио-
апериодической реакцией выходной переменной в отличие от апериоди-
апериодической реакции состояния, рассмотренной в разд. 6.4.2. Если сис-
система обнаруживает апериодическую реакцию выходной перемен-
переменной, то выходная переменная достигает требуемого значения точ-
точно через конечное число шагов, но система в целом может оставать-
оставаться в движении в течение продолжительного времени; это иллю-
иллюстрирует один из примеров в конце настоящего раздела. Если ра-
разомкнутая система имеет нули вне единичного круга, то эффекта
сокращения числа полюсов не происходит, и в результате пре-
предельный регулятор не обнаруживает апериодической реакции^.
Отметим, что эти замечания являются предположениями, осно-
основанными на аналогии с непрерывным* случаем. Закопченная тео-
теория рассматриваемого дискретного случая еще не создана. Приме-
Примеры в конце раздела подтверждают сделанные предположения. Су-
Существенная разница между дискретной и непрерывной теориями
заключается в том, что в дискретном случае установившееся ре-
ше-пие Р матричного уравения F.248) в общем не стремится к ну-
нулевой матрице, когда R2 уменьшается До нуля, даже если матрич-
матричная передаточная функция разомкнутой системы не имеет нулей
вне единичного круга.
Пример 6.18. Цифровая система управления положением
Рассмотрим цифровую систему управления положением из
586 Глава 6
Рис. 6.16. Годографы полюсов замкнутой системы и величин, обратных по-
полюсам, в цифровой системе управления положением.
примера 6.2 (разд. 6.2.3). Из примера 6.6 (разд. 6.2.6) известно,,
что передаточная функция соответствующей разомкнутой системы
равна
„. 0,003396 (г+ 0,8575)
(г—1) (г —0,6313)
F.365)
Из теоремы 6.37 следует, что полюса оптимальной замкнутой
системы стремятся к 0 и —0,8575 при р \ 0. Нетрудно найти годо-
графы, соответствующие характеристическим числам замкнутой
системы. Выражение F.334) для данной системы принимает вид.
(г _ 1) B
0,6313) (г — 1) (z — 1,584) + °'00001566 z (z
р
+ 0,8575) (z + 1,166). F.366>
Годографы корней этого выражения показаны на рис. 6.16. Те-
Теория для дискретных Систем
587
лгодографы, которые ле-
лежат внутри единичного
круга, являются годо-
годографами полюсов замк-
замкнутой системы. Можно
найти, что предельная
матрица коэффициентов
обратной связи Fo си-
системы при р = 0 имеет
вид
То = B94,5, 23,60).
F.367)
Определим опти-
оптимальный закон управ-
управления, соответствую-
соответствующий ненулевой задан-
заданной точке. В качестве
передаточной функции
предельной замкнутой
•системы имеем
-2
Л л >
YV-
= 0,003396 (г+ 0,8575) _
z (г +0,8575)
= 0,0033% F368)
Z
Следовательно,
Нс{\) = 0,003396, а оп-
оптимальный закон управ-
управления для ненулевой
заданной точки имеет
вид
H0 >@ +
+ 294,5 Со (i). F.369)
20
г
Й -20
-40й
Рис. 6.17. Реакция выходной цеременной
апериодической цифровой системы управ-
управления положением на ступенчатое изме-
изменение заданной точки 0,1 рад.
На рис. 6.17 показана реакция системы на ступенчатое изме-
изменение заданной точки не только в моменты дискретизации, но и
в промежуточные интервалы времени.
Сравнивая этот процесс с найденной в примере 6.13 апериоди-
588 Глава 6
ческой реакцией состояния той же самой системы, обнаруживаем
следующее.
а) Когда рассматривается реакция углового положения толь-
только в моменты дискретизации, система показывает апериодическую-
реакцию выходной переменной за один период дискретности. В
промежуточные моменты времени, однако, реакция имеет боль-
большое перерегулирование, а действительное время установления
имеет порядок 2 с, но никак не 0,1 с.
б) Амплитуда входного сигнала и угловой скорости принимает
большие значения. '
Эти недостатки являются характерными для систем управ-
управления с апериодической выходной переменной. Лучшие резуль-
результаты можно получить, не допуская, чтобы р стремилось к нулю..
При р = 0,00002 полюса замкнутой системы равны 0,2288 ±
± /0,3184. Реакция соответствующей замкнутой системы на сту-
ступенчатое воздействие показана в примере 6.17 (рис, 6.15) и, оче-
очевидно, является "намного лучшей, чем реакция на рис. -6.17.
Недостатки апериодической реакции выходной переменной
менее выражены, если период дискретности А выбирается боль-
большим. Это принуждает нуль разомкнутой системы в —0,8575 дви-
двигаться к началу координат; в результате система управления с
апериодической выходной переменной в целом приходит к уста-
установившемуся состоянию гораздо быстрее. В качестве альтернативы
в задаче 6.8.5 рассматривается решение, которое учитывает пове-
поведение системы между моментами дискретизации.
Пример 6.19. Смесительный бак при наличии временного запазды-
запаздывания
Рассмотрим смесительный бак из примера 6.4 (разд. 6.2.3)
при наличии запаздывания. В качестве компонент управляемой
переменной выберем выходной расход и концентрацию; поэтому
0,01 0 0 0\ ... .„ о„„.
\x(i). F.370)
0 ¦ 1 0 0/ .
Можно найти, что матричная передаточная функция разомкну-
разомкнутой системы равна
4,877 4,877
— 1,1895 3,569
г (г — 0,9048) г (г —0,9048)
Определитель матричной передаточной функции равен
det [Я (гI = —¦ Д^ . F.372)
W z (г —.0,9512) (г — 0,9048) '
Теория для дискретных систем ' 589
Поскольку характеристический полином разомкнутой системы
имеет вид
9(z) = z2(z—0,9512) (г—0,9048), F.373)
полином числителя матричной передаточной функции равен
ty(z) = 26,62 z. F.374)
В результате два полюса замкнутой системы всегда находятся
в начале координат. Годографы двух других полюсов при р --- оо
начинаются соответственно при 0,9512 и 0,9048, и оба при р \ О-
стремятся к началу координат. Это означает, что в данном случае
закон управления, обеспечивающий апериодическую выходную
переменную, обеспечивает также апериодическое состояние.
. Рассмотрим критерий
оо
2 [ zr (i + i) #sz (i + !) + ¦иг-@ Я2и (')!• F.375)
где, как и в предыдущих примерах,
50 ° ), Дя = р( "з ' I- F-376)
0 0,02/ 2 \ ' '
При попытке вычислить предельный закон обратной связи при
р ¦--- 0, полагая Rz = 0 в разностном уравнении относительно
/J(i) и ^(г), возникают трудности из-за того, что для определешшх
Pi матрица
R2 + 5r'[i?j -Ь Р (i + 1I 5 F.377)
становится особой при первой итерадии. Этого можно избежать
выбором для р очень малого значения (например, р = 10"?). Ис-
Используя этот численный метод,- в результате-вычислении получим
предельную матрицу коэффициентов обратной связи
F.378)
¦На рис. 6.18показана апериодическая реакция для двух началь-
начальных условий. Видно, что начальные ошибки в объеме |j уменьша-
уменьшаются до нуля за один период дискретности. Для концентрации |2
требуется два периода дискретности; это обусловлено наличием в
системе запаздывания.
f 0,1463
V 0,04875
— 0
0
,1720
,1720
0,
-0,
2262
2262
— 0
0
,6786 \
,6786/'
590 Глава 6
С, 01
Mr-
3:
L
0,01
-•—•
0,01
"tl
0002
-0,002
0002
-OfiOZ
> «
<g -0:002L -0,00?- '
Дискретное время I
Рис. 6.18. Апериодическая реакция смеси-
смесительного бака при наличии временного за-
запаздывания.
Слева — реакции обьема. концентрации, расхода
потока № 1 и расхода потока J* 2 при начальном
условии 6о @) = 0,01 м' (все другие компоненты
начального состояния нулевые); справа — реакции
обьема, концентрации, расхода потока К!и рас-
расхода потока № 2 при начальном условии 52 @) =
= 0,01 кмоль/м3 (все другие компоненты началь-
начального состояния нулевые).
6.4.8. ЧУВСТВИТЕЛЬНОСТЬ
В разд. 3.9 было пока-
показано, что непрерывный
замкнутый регулятор с
постоянной настройкой
всегда уменьшает влияние
возмущений и изменения
параметров, что не свойст-
свойственно разомкнутой систе-
системе. В данном разделе при-
приводится противоположный
пример, который показы-
показывает, что для дискретных
систем такое уменьшение
влияния обычно не имеет
места. Тот же пример тем
не менее показывает, что
удовлетворительная защи-
защита может быть достигнута
в широком диапазоне час-
частот.
Пример 6.20. Цифровая
система управления угло-
угловой скоростью
Рассмотрим систему
управления угловой ско-
скоростью из примера 3.3
(разд. 3.3.1), которая опи-
описывается скалярным диф-
дифференциальным уравне-,
нием
F.379)
Предположим, что вход-
входная переменная является кусочно-постоянной на интервалах
продолжительностью Д. Тогда соответствующая дискретная си-
система описывается уравнением
1_гГаА)|л(;), F.380)
—¦ на fi(i). При численных
значениях а. =0,5 с, х = 150 рад/(В-с2) и А =0,1 с получаем
где i(JA) заменяется на
05 1
Теория для дискретных систем
591
101
ы, рад Iс
Рис. С. 19. Поведение возвратной разности в случае дискретного регулятора
первого порядка.
I Запаздывание
при обработке
данных
tl t-L t^.f Время
Рис. 6.20. Расположение момента управления ij и момента наблюдения
I (i + 1) = 0,95121@ + 14,64 (л (г).
F.381)
Управляемой переменной С(г) является угловая скорость
т. е.
F.382)
Рассмотрим задачу минимизации
592 Глава 6
V?(i)]. , F.383)
При р = 1000 для установившегося решения получаем
Р= 1,456,
F.384)
^ = 0,02240.
Возвратная разность замкнутой системы, равная
/ (z) = Z + (а / — Ау1'В Т, F.385)
может быть представлена в виде
7(г) 2-°'6232 '
0,9512
F.386)
Чтобы определить поведение J(z) при г, находящемся на еди-
единичной окружности, положим
, z==e' ,
где Д =0,1 с — период дискретности. Тогда находим
\j(e~^)\2-^ 1.388-1 ..246 cos (..Д) _ F387)
1 1,905 —1,902 cos (<.>Д)
На рис. 6.19 показан график поведения |/(е'даЛ)|. Видно, чт,о
уменьшение чувствительности достигается при низких частотах—
до 7 рад/с, но никоим образом не для всех частот. Однако в случае
значительных возмущений в полосе частот до 7 рад/с можпо ожи-
ожидать соответствующего уменьшения чувствительности.
6.5. Оптимальное линейное
восстановление состояния
линейных дискретных систем
6.5.1. ВВЕДЕНИЕ
Данный раздел представляет собой обзор по оптимальному вос-
восстановлению состояния линейных дискретных систем. По струк-
структуре раздел аналогичен гл. 4.
Теория для дискретных систем 593
6.5.2. ФОРМУЛИРОВКА ЗАДАЧ ДИСКРЕТНОГО
ЛИНЕЙНОГО ВОССТАНОВЛЕНИЯ
В настоящем разделе обсуждается формулировка задач линей-
линейного дискретного восстановления. Этому вопросу уделяется особое
внимание, так как существуют определенные отличия от непре-
непрерывного случая. Как и ранее, примем концепцию, что рассматри-
рассматриваемая линейная дискретная система получается из линейной
непрерывной системы при кусочно-постоянной входной перемен-
переменной, как показано на рис. 6.20. Моменты времени, в которые изме-
изменяется величина входной переменной, обозначаются tt, i = 0,
1, 2, ...; они называются моментами управления и образуют основ-
основную решетку времени. Кроме того, введем моменты наблюдения
t/, i =0, 1, 2, ..., — такие моменты времени, чв которые проис-
происходит дискретизация наблюдаемой переменной непрерывной сис-
системы y(i). Предполагается, что момент наблюдения tt' всегда
предшествует моменту управления tl+i. Разницу ti+i—t/ назовем
запаздыванием при обработке данных; в системе управления за
этот отрезок времени требуется на основании процесса наблюде-
наблюдения y(tt') определить входную переменную u(ti+l).
Положим, что непрерывная система описывается уравнением
i(*) = 4 (*)«(*) + ? (*)"(*) +«МО. *>*.о. F-388)
где Wi — белый шум с переменной интенсивностью Vi(t). Кроме
того, предположим, что наблюдаемая переменная определяется
соотношением
y(t'i) = C(ttl)x(t'l)-\-wi(t'i), t = 0, 1, 2 F.389)
где шум наблюдений w^t/), i =0, 1, 2, ..., представляет собой
последовательность некоррелированных стохастических векторов.
С целью получения дискретного описания системы напишем
h+i "I
j Ф (tM, x) wj (т) dz F.390)
и
20-394
[
c(,;)( ф( <;.,).
u(tt) +
594 Глава 6
i
F-391)
Здесь в обоих уравнениях i = 0, 1, 2, ..-., аФ(г, ?0) — переходная
матрица системы F.388). Уравнения F.390) и F.391) можно пред-
представить в виде
х+ (i + 1) = Ad (i) x+ (i) + Bd (i) u+ (i) + w+(t),
F.392)
У+ @ = Cd (i) x+ (i) + Ed (i) и? (i) + w+(i).
Этот метод постановки дискретного варианта задачи имеет
следующие характерные черты.
1. В дискретном варианте задачи восстановления предпола-
предполагается, что y+(i) является последним наблюдением, которое может
быть обработано для получения восстановленного значения
x+{i + 1).
2. В уравнении выходной переменной, как правило, имеется
прямая связь. Как видно из F.391), прямая связь отсутствует
[т. е. Ed(i) = 0], если запаздывание при обработке данных равно
целому интервалу (tt, ti+i).
3. Даже если в непрерывной системе шум возбуждения сос-
состояния Wi и шум наблюдений w2 являются некоррелированными,
шум возбуждения состояния w{+ и шум наблюдений w2+ в дискрет-
дискретном варианте задачи будут коррелированными, потому что, как
видно из уравнений F.390) — F.392), обе функции w^li) и w2+{i),
зависят от Wi(t) при tt <. t «с t/. Ясно, что Wi+(i) и w2+(i) являются
некоррелированными, если t/ = tt, т. е. если запаздывание при
обработке данных равно целому интервалу (tt, ti+i).
Пример 6.21. Цифровая система управления положением
Рассмотрим цифровую систему управления положением и»
примера 6.2 (разд. 6.2.3). Предполагалось, что период дискрет-
дискретности равен А. Предположим теперь, что наблюдаемой переменной
является угловое перемещение |4, так что в непрерывном варианте
С = A, 0). F.393)
Далее предположим, что существует запаздывание обработки дан-
данных Ad, т. е. моменты наблюдения предшествуют на интервал вре-
времени Ad моментам управления. Пренебрегая шумами, которые,
видимо, присутствуют, и используя уравнение F.391), нетрудно
найти, что уравнение наблюдений имеет вид
Теория для дискретных систем 595
У @, F.394)
а 1
где
А' = А — Ad. F.395)
При значении
Ad=0,02c * F.396)
получим уравнение наблюдений
7]+ (i) = A, 0,06608) х+ (i) + 0,002381 ja+ (i). F.397)
6.5.3. ДИСКРЕТНЫЕ НАБЛЮДАТЕЛИ
В данном разделе рассматриваются динамические системы, ко-
которые способны восстановить состояние другой, наблюдаемой
системы.
Определение 6.1.8. Система ;
х(i + 1) = A (i) х(i) +B(i)u(i) + C(i)y (i) F.398)
является наблюдателем полного порядка для системы
)u(t),
. F.399)
)
если
z(io) = x(io) F.400)
приводит к
'x{i) = x{t), i>iot F.401)
для всех u(i), i > ?0.
Заметим, что в соответствии, с изложенным в разд. 6.5.2 по-
последним наблюдением, которое обрабатывает наблюдатель для
определения x(i + 1), является y(i). Следующая теорема дает до-
дополнительную информацию о структуре наблюдателя.
Теорема 6.38. Система F.398) является наблюдателем полного
порядка для системы F.399) тогда и только тогда, когда
E F.402)
C
20*
596 Глава 6
для всех i >• i0, где K(i) является произвольной матрицей с пере-
переменными параметрами.
Эту теорему нетрудно доказать вычитанием разностных урав-
уравнений состояния F.399) и F.398). С помощью F.402) наблюдатель
может быть представлен следующим образом:
x{i + i) = A(i)x (i) +B (i) и (i) +K(i) [у (i) — C(i)x (i) —
— E(i)u(i)]. F.403)
Наблюдатель состоит из модели системы с дополнительным воз-
воздействием в качестве входной переменной, которое пропорциональ-
пропорционально разности y(i)— y(i) наблюдаемой переменной y(i) и его предска-'
занного значения
y(i)=C(i)x(i) + E(i)u(i). F.404)
Обсудим теперь вопросы об устойчивости наблюдателя и о
поведении ошибки восстановления e(i) = x(i) — x(i).
Теорема .6.39. Рассмотрим наблюдатель F.398) для системы
F.399). В этом случае ошибка восстановления
e(i) = x(i)—x(i) F.405)
удовлетворяет разностному уравнению
e(i + l) = [A(i)—K(i)C{i)]e(i), i > i0. F.406)
Ошибка восстановления обладает таким свойством, что
е(г)->0 при г->оо F.407)
для всех e(i0) тогда и только тогда, когда наблюдатель является
асимптотически устойчивым.
Разностное уравнение F.406) нетрудно получить вычитанием
разностных уравнений состояния F.399) и F.398). Поведение
A{i) — K{i)C{i) определяет как устойчивость наблюдателя,- так
и поведение ошибки восстановления; таким образом, доказывается
и вторая часть теоремы. '
Как и в непрерывном случае, рассмотрим теперь, при каких ус-
условиях существует матрица коэффициентов К, которая стабили-
стабилизирует наблюдатель и, таким образом, всегда обеспечивает стрем-
стремление к нулю ошибки восстановления. Ограничиваясь рассмотре-
рассмотрением систем с постоянными параметрами, имеем следующий ре-
результат.
Теория для дискретных систем 597
Теорема 6.40. Рассмотрим наблюдатель с постоянными парамет-
параметрами
x(i + 1) = Ax(i) +Bu(i) + K[y(i) — Cx(i)—Eu(i)} F.408)
для системы с постоянными параметрами
x(i + l) = Ax(i)+Bu(i),
F.409)
y(i) = Cx(i) + Eu(i).
В этом случае полюса наблюдателя (т.е. характеристические
числа матрицы А — КС) могут быть произвольно расположены в
комплексной плоскости (при ограничении, что комплексные полюса
образуют комплексно-сопряженные пары) соответствующим вы-
выбором матрицы коэффициентов К тогда и только тогда, когда
система F.409) является полностью восстанавливаемой.
Доказательство этой теоремы непосредственно следует из рас-
рассмотрения непрерывного эквивалента (теорема 4.3, разд. 4.2.2).
Для систем, которые являются только обнаруживаемыми, имеем
следующий результат.
Теорема 6.41. Рассмотрим наблюдатель с постоянными парамет-
параметрами F.408) для системы с постоянными параметрами F.409).
В этом случае соответствующий выбор матрицы коэффициентов
К обеспечивает асимптотическую устойчивость наблюдателя тог-
тогда и только тогда, когда система F.409) является обнаруживаемой.
Особый интерес представляет случай, когда все полюса наблю-
наблюдателя размещаются в начале координат, т. е. все характеристи-
характеристические числа матрицы А — КС являются нулевыми. Тогда харак-
характеристический полином матрицы А — КС имеет вид
det [XI — (А— КС)} = Xя, F.410)
так что по теореме Кэли—Гамильтона
{А — КС)п = 0. F.411)
Отсюда повторяемым применением разностного уравнения F.406)
для ошибки восстановления получим соотношение
е(п) = {А — КС)пеф) = 0 F.412)
для любого е@); отсюда следует, что любое начальное^ значение
уменьшается до нуля самое большее за п шагов. Аналогично апе-
апериодическому закону управления наблюдатели с таким свойством
назовем апериодическими наблюдателями. Такие" наблюдатели
осуществляют полное точное восстановление самое большее за
п шагов.
598 Глава 6
Наконец, отметим, что, если система F.409) имеет скалярную
наблюдаемую переменную у, получается единственное решение
матрицы коэффициентов К для заданного множества полюсов
наблюдателя. Однако в случае многомерных систем существует
в общем много различных матриц коэффициентов, которые при-
приводят к одному и тому же множеству полюсов наблюдателя.
Наблюдатели, рассматривавшиеся пока что в этом разделе,
являются системами той же размерности, что и наблюдаемая сис-
система. Поскольку уравнение выходной переменной имеет вид
y(i) = C(i)x(i) 4- E(i)u(i), имеем т уравнений относительно неиз-
неизвестного состояния (полагая, что т — размерность переменной
у); ясно, что необходимо построить наблюдатель пониженного по-
порядка размерности п — т, чтобы восстановить x(i) полностью.
Этот наблюдатель может быть построен более или менее аналогич-
аналогично непрерывному случаю (разд. 4.2.3).
Пример 6.22. Цифровая система управления положением
Рассмотрим цифровую систему управления положением из
примера 6.2 (разд. 6.2.3), которая описывается разностным урав-
уравнением состояния
0,08015\ ... , /0,003396\ .,. .. ,.Оч
x(j)+ ' )lx(i)- F.413)
0,6313 ) WTU,06308 Г } K '
|Как и в примере 6.21, предположим, что наблюдаемой перемен-
переменной является угловое положение, но существует еще запаздывание
при обработке данных, равное 0,02 с. Это приводит к следующему
уравнению наблюдаемой переменной:
ч] (i) = A, 0,06608) х (г) + 0,002381 р (i). F.414)
Нетрудно убедиться, что рассматриваемая система является
полностью восстанавливаемой, так что теорема 6.40 применима.
Пусть К = со1(&1? к2). Тогда найдем
А_КС<1-Ь 0,08015 - 0,06608 к, ]
— к2 0,6313 — 0,06608^
Эта матрица имеет характеристичевкий полином
z2 + (—1,6313 + Jfcj + 0,06608 к2) z + @,6313 — 0,6313 kt +
+ 0,01407fea). t F.416)
Апериодический наблюдатель получаем из системы
— 1,6313 + кх + 0,06608 к2 = 0,
F.417)
0,6313—0,6313 А4 +0,01407*2 = 0.
Отсюда определяем матрицу коэффициентов
Теория для дискретных систем 599
). F.418)
7,143/ * ;
Наблюдатель с такими коэффициентами уменьшает любую на-
начальную ошибку восстановления до нуля самое большее за два
шага.
6.5.4. ОПТИМАЛЬНЫЕ ДИСКРЕТНЫЕ ЛИНЕЙНЫЕ НАБЛЮДАТЕЛИ
В данном разделе исследуются линейные дискретные наблю-
наблюдатели, которые являются оптимальными в определенном смысле;
при этом предполагается, что на рассматриваемую систему дей-
действуют возмущения, а наблюдения искажаются шумом наблюде-
наблюдений. Затем находятся такие наблюдатели, которые оптимально
восстанавливают состояние в смысле минимума среднего значения
квадрата ошибки восстановления. Сформулируем задачу следую-
следующим образом.
Определение 6.19. Рассмотрим систему
x(r + l) = ^@x@ + 5@u@ + ^@,
F.419)
y(i) = C (i) x(i) + E (i) и (i) +w2(i), i> i0.
Здесь col [w±(i), w2(i)], i > io> представляет собой последова-
последовательность некоррелированных векторных стохастических величин
с нулевыми средними и матрицами дисперсий
,. i>i0. F.420)
VFi2W, v2(i) j
Далее, пусть x(i0) — векторная стохастическая величина, не-
некоррелированная с Wi и w2; при этом
Е {х (»„)} = х0, Е \[х (i0) -хо][х (i0) - х0 ]Т } = Qo. F.421).
Рассмотрим наблюдатель
x(i+l)=A(i)x(i) + B(i)u(i) +
+ K(i)[y(i)-C(i)x(i)-E (г) и (I)] F.422)
для этой системы. Тогда задача нахождения последовательности
матриц K°(i0), K°(i0 + 1), ..., K°(i —i) и начального условия
x(i0), минимизирующих
E[eT(i)W(i)e(i)}, ¦ F.423)
где e(i) = x(i)—x(i), a W(i) — положительно определенная сим-
600 Глава 6
метрическая весовая матрица, называется задачей построе-
построения дискретного оптимального наблюдателя. Если
V2(i)>0, i>Jo> mo задача построения оптимального наблюдателя
называется неособои (невырожденной).
~ Чтобы решить задачу построения дискретного оптимального
наблюдателя, сначала найдем разностное уравнение, которому
удовлетворяет ошибка восстановления e(i). Вычитание из разност-
разностного уравнения состояния системы F.419) уравнения наблюдателя
F.422) приводит к уравнению
e(i + l)T[A (i) -K(i)C @1 е (i) + wl (i) - К (i) w2 (i),
i > i0. F.424)
Обозначим теперь через Q(i) матрицу дисперсий процесса
e{i), а через e(i) — среднее значение процесса e(i). Тогда напишем
Е Hi) / @) = <?(*) + 7{i) 7r(i), F.425)
так что
W(i)]. F.426)
Первый член этого выражения, очевидно, минимизируется
при e(i) =0. Это можно получить, положив e(i0) =0, что в свою
очередь получается, если выбрать
x(io)=io. F.427)
Второй член в выражении F.425) можно минимизировать неза-
независимо от первого члена. На основании теоремы 6.22 (разд. 6.2.12)
из F.424) следует, что Q удовлетворяет рекуррентному соотно-
. шению
Q{i + 1) = [A (i) -КЩС (i)] Q @ [А @ -K(i)C (i)f + Vx (i) -
-Vl2(i)KT(i)-K(i)VTl2(i) + K(i)V2(i)KT(i), i>i0, F.428)
при
Q(io) = Qo. F.429)
Многократное применение этого рекуррентного соотношения
позволяет выразить Q(i + 1) в виде функции K(i), K(i —1), ...
..., K(i0). Рассмотрим теперь задачу минимизации выражения
tr[^(i + l)W{i + 1)] относительно K(i0), K{i0 +1), ••¦, ^@- это
эквивалентно минимизации Q(i + 1), т. е. нахождению такой по-
последовательности матриц K°{i0), K°(i0 + 1), ..., K°(i), которая для
соответствующего значения Q(i + 1) выражения Q(i + 1)
Теория для дискретных систем 601
обеспечивает Q(i + 1) <: Q(i + 1). Теперь F.428) представляет
Q(i + 1) как функцию K(i) и Q(i), где-<?@ является функцией
K(i0), ..., /f(i — 1). Ясно, что для данного K(i) Q(i + 1) является
монотонной функцией от Q{i), т. е. если Q(i)^ <?@> то Q(i + 1) <
<S Q(i + 1), где Q(i + 1) получается из Q(i) с помощью F.428).
Следовательно, Q(i + 1) можно минимизировать, сначала миними-
минимизируя Q(i) относительно K(i0), K(i0 + 1), ..., K(i — 1), затем под-
подставляя минимальное значение Q(i) выражения Q(i) в F.428)
и, наконец, минимизируя Q(i -f- 1) относительно K(i).
Предположим, что минимальное значение Q(i) выражения Q(i)
найдено. Заменяя Q(i) на Q(i) в F.428) и выполняя преобразования,
получаем
Q{i + l) = [K- (AQCT + У12) (V 2 + CQCT)-»] (F2 + CQCT ){K~
- (AQCT + V12) (У2 + CQCT Г ]г - (AQCT + Vи) (У2 +
+ С<?СГ )"х (С(?ЛГ + У?) + Л(?ЛГ + Vu F.430)
где для краткости опущены аргументы i в правой части равенства
и где предполагается, что матрица
V*{i) + C(i)Q{i)CT(i) F.431)
является неособой. Такое допущение всегда справедливо в неосо-
неособой задаче построения наблюдателя, где F2(i) >0. Рассматривая
F.430), замечаем, что Q(i -f- 1) минимизируется относительно
K(i), если выбрать K(i) в качестве K°(i), где
?° @ = [Л @ <? (О СГ @ + Va (i)] [V, (i) + C(i)Q @ Cr (i)]. F.432)
Соответствующее значение Q(i -f- 1) определяется в виде
С (i + 1) = И @ - ?° (О С @1Q (i) AT (о +
+ 7i @ — ^@^12@ F.433)
при
<? (io) = <?о- F-434)
Соотношения F.432) и F.433) вместе с начальным условием
F.434) дают возможность вычислить последовательность матриц
коэффициентов рекуррентно, начиная с K(i0).
Сформулируем следующий вывод.
602 Глава 6
Теорема 6.42. Матрицы оптимальных коэффициентов K°(i),
i >• i0, при неособой задаче построения оптимального наблюдателя
могут быть получены из рекуррентных соотношений
Я» @ = [А (О Q (О СТ @ + F12 @1 [F2 @ + C(i)Q (О Ст (i)]'1 ,
F.435)
T ^
для которых i :> i0 при начальном условии
Q (*„) = <?о- F.436)
В качестве начального условия для наблюдателя может быть
выбрано
x(io) = xe. F.437)
Матрица Q(i) является матрицей дисперсий ошибки восстанов-
ления e(i)=x(i)—x(i). Для оптимального наблюдателя среднее зна-
значение квадрата ошибки восстановления определяется выражением
. F.438)
Особые задачи оптимального наблюдения могут быть исследо-
исследованы методом, более или менее аналогичным методу в непрерыв-
непрерывном случае 122, 168]. Задачи дискретного наблюдения, где шум,
возбуждающий состояние, и шум наблюдений являются окрашен-
окрашенными шумами, а не процесрами типа белого шума [79], могут быть
сведены к особым или неособым задачам построения дискретных
наблюдателей.
Отметим в заключение, что в литературе постановка задачи
построения дискретного линейного оптимального наблюдателя
отличается от рассмотренной здесь, так как в ней допускается,
что y(i + 1), а не y(i) является последним наблюдением, до-
доступным для восстановления x(i + 1). В задаче 6.8.6 показыва-
показывается, как решение этого альтернативного варианта задачи может
быть получено из данного варианта.
В настоящем разделе рассматривались оптимальные наблюда-
наблюдатели. Как и в непрерывном случае, можно доказать (см., напри-
например, [125]), что оптимальный наблюдатель в действительности яв-
является линейным оценивателем с минимальным средним значением
квадрата ошибки процесса x(i + 1) по данным u(J) и y(j), j = i0,
i0 +" 1, •••, i; т.е. невозможно найти какой-либо другой линейный
оператор, который по этим данным давал бы оценку с меньшим
средним значением квадрата ошибки восстановления. Более
того, если начальное состояние х0 является гауссовским, а после-
последовательности типа белого шума wx и w.2 являются совместно гаус-
совскими, то оптимальный наблюдатель является оценивателем
Теория для дискретных систем . 603
с минимальным средним значением квадрата ошибки процесса
x(i + 1) по данным u(J), y(j), j = i0, i0 + 1, ..., i, т. е. невозможно
найти какой-либо другой оцениватель, использующий зти данные,
с меньшим средним значением квадрата ошибки восстановления
(см., например, [79]).
Пример 6.23. Смесительный бак при наличии возмущений
В примере 6.10 (разд. 6.2.12) был рассмотрен дискретный ва-
вариант смесительного бака. Объект описывается разностным урав-
уравнением состояния
0,9512
0
0
0
' 4,877
0
0,9048
0
0
4,877
— 1,1895 3,569
0 0
^ 0
0
0
0,0669
0,8825
0
\
)«@-
/
0
0,02262
0
0,9048
4-«MO.
F.439)
где u>i(i), i >¦ i0,— последовательность некоррелированных сто-
стохастических величин с нулевым средним и матрицей дисперсий
F.169). Компонентами состояния являютея приращение объема
жидкости в баке, приращение концентрации в баке и прираще-
приращения концентрации двух поступающих потоков.. Допустим, что
в каждый момент времени i можно наблюдать приращение объема
и приращение концентрации в баке. Оба вида наблюдений иска-
искажаются некоррелированными шумами наблюдений с нулевыми
средними и стандартными отклонениями соответственно 0,001 м3
и 0,001 кмоль/м3. Кроме того, предположим, что цедый период
дискретности используется для обработки данных, так что урав-
уравнение наблюдений принимает вид
[J)(9 + «%(9. F.440)
где w2(i), i > io> имеет матрицу дисперсий
10 0
F.441)
Процессы wt и и?2 являются некоррелированными. В примере
6.10 было найдено, что установившаяся матрица дисперсий имеет
вид
604 Глава 6
0.2Q-
i
о о о о о о
Среднеквадратическая
ошибка Восстановления
концентрации потока М*2
Среднеквадратическая
ошибка восстановления
концентрации потоки N'1
Средкеквадратическая
ошибка Восстановления
концентрации в баке
Дискретное время с
Рис. 6.21. Поведение среднеквадратических ошибок восстановления в системе
регулирования смесительного бака при наличии возмущений.
0
0
0
0
0
0,00369
0,00339
0,00504
0
0,0039
0,0100
0
0
0,00504
0
0,0400
F.442)
Используя эту матрицу дисперсий в качестве начальной мат-
матрицы дисперсий (?@)= (?0! можно решить рекуррентные соотно-
соотношения F.435). На рис. 6.21 показано изменение среднеквадрати-
среднеквадратических ошибок восстановления последних трех компонент состоя-
состояния, полученных из анализа изменения Q(i), i > 0. Среднеквадра-
Среднеквадратическая ошибка восстановления первой компоненты состояния —
объема — конечно, остается нулевой все время, поскольку объем
не подвергается флуктуациям, и, таким образом, его значение
точно известно во все моменты времени.
Из графиков видно, что концентрации потоков не могут быть
восстановлены очень точно, потому что среднеквадратические
ошибки восстановления стремятся к установившимся значениям,
которые едва ли меньше среднеквадратических значений флуктуа-
флуктуации концентраций самих потоков. Средиеквадратическое значение
ошибки восстановления концентрации в баке стремится к уста-
установившемуся значению около 0,0083 кмоль/м3. Причиной, по
которой эта ошибка' больше среднеквадратического значения
Теория для дискретных систем 605
ошибки наблюдений @,001 кмоль/м3), заключается в наличии за-
запаздывания при обработке данных — наблюдатель должен пред-
предсказывать концентрацию на целый период дискретности вперед.
6.5.5. НЕВЯЗКИ
В данном разделе установим следующий факт, который более
или менее аналогичен соответствующему результату для непре-
непрерывного случая.
Теорема 6.43. Рассмотрим оптимальный наблюдатель из теоремы,
6.42. Тогда процесс, образуемый невязками {процесс обновления)
y(i)—E(i)u(i) — C(i)x(i), *>*„, F.443).
является последовательностью некоррелированных етохастичес~
ких векторов с нулевыми средними и матрицами дисперсий
CT(i) + V2(i), »>i0. . F.444)
То, что последовательность невязок является дискретным бе-
белым шумом, может быть доказано аналогично непрерывному
случаю. В том, что матрица дисперсий процесса F.443) определя-
определяется выражением F.444), также можно убедиться после неслож-
несложного анализа.
6.5.6. ДУАЛЬНОСТЬ ЗАДАЧ ПОСТРОЕНИЯ ОПТИМАЛЬНЫХ
НАБЛЮДАТЕЛЯ И РЕГУЛЯТОРА;
СВОЙСТВА ОПТИМАЛЬНОГО НАБЛЮДАТЕЛЯ
В УСТАНОВИВШЕМСЯ РЕЖИМЕ
В данном разделе показывается дуальность задач построения
линейных дискретных оптимальных регуляторов и наблюдателей.
Здесь имеются следующие результаты.
Теорема 6.44. Рассмотрим задачу построения линейного дискрет-
дискретного оптимального регулятора (ЗПЛДОР) по определению 6 .16
(разд. 6.4.3^ и задачу построения линейного дискретного оптималь-
оптимального наблюдателя (ЗПЛДОН) по определению 6.19 (разд. 6.5А).
Пусть в задаче наблюдения матрица V\(i) определяется выра-
выражением
Vl(i) = G(i)V,(i)<f(i), t>t0, F.445)
где
F,(*)>0, »>*„. F.446)
Предположим также, что шум возбуждения состояния и шум
наблюдений являются некоррелированными в ЗПЛДОН, т.е.
606 Глава 6
F12@ = 0, *>»„• F.447)
Пусть различные матрицы, встречающиеся в ЗПЛДОР и-
ЗПЛДОН, связаны следующим образом:
А @ в ЗПЛДОР равна АТ (i* — i) в ЗПЛДОН,
B(i) в ЗПЛДОР равна Cr(i* — i) в ЗПЛДОН,
D (г + 1) в ЗПЛДОР равна GT (i* — i) в ЗПЛДОН,
R3(i + 1) в ЗПЛДОР равна V3(i* — i) в ЗПЛДОН,
Rs(i) в ЗПЛДОР равна V2(i* — i) в ЗПЛДОН,
Pt в ЗПЛДОР равна Qo в ЗПЛДОН
для всех i <; ix —1. Здесь
j* = fo+f1 —1. F.448)
При этих условиях решения ЗПЛДОР (теорема 6.28, разд. 6.4.3)
и. ЗПЛДОН (теорема 6.42, разд. 6.5.4J связаны следующим об-
образом:
а) P(i+l)e ЗПЛДОР равна Q(i*- I) — V^i*- i) в
ЗПЛДОН при i < 1Х—1; *
б) F(i) в ЗПЛДОР равна К° (i*— i) в ЗПЛДОН при i <:
< h—l;
в) замкнутый регулятор в ЗПЛДОР
x(t + l) = [A (i) -B(i)F @1 * @, F.449)
и уравнение ошибки восстановления в ЗПЛДОН
e(i + i) = [A(i)-K°(i)C(i)]e{i) F.450)
являются дуальными по отношению к i* в смысле определения 6.9.
Доказательство этой теоремы следует из сравнения рекуррент-
рекуррентных матричных уравнений, которые определяют решения/ задач
регулирования и наблюдения. Вследствие дуальности вычисли-
вычислительные программы для задач регулирования могут быть исполь-
использованы для задач наблюдения и наоборот. Более того, используя
дуальность, нетрудно получить следующие результаты относитель-
относительно установившихся свойств неособого оптимального наблюдателя
с некоррелированными шумами возбуждения состояния и наблю-
наблюдений цг соответствующих свойств оптимального регулятора.
Теорема 6.45. Рассмотрим неособую задачу построения оптималь-
оптимального наблюдателя, с некоррелированными шумами возбуждения
Теория для дискретных систем 607
состояния и наблюдений. Допустим, что A(i), C(i), V\(i) =
—G(i)V3 (i)Gr(t) и V.2(i) ограничены для всех i и что
Vs(i)^al, 7гA)>Р/ для всех i, F.451)
где аир — положительные константы.
1. Тогда, если система F.419) либо
й) полностью восстанавливаемая, либо
б) экспоненциально устойчивая,
а начальная дисперсия Qo = 0, дисперсия Q(i) ошиб-
ошибки восстановления сходится к установившемуся решению Q(i)
при i0 -> — оо, которое удовлетворяет матричным разностным
уравнениям F.435).
2. Если система
z(i + l) = A(i)z(i) + G{i)w3(i), y(i) = C(i)x(i), F.452)
либо
в) равномерно полностью восстанавливаемая и равномерно
полностью управляемая (по w3), либо
г) экспоненциально устойчивая,
дисперсия Q(i) ошибки восстановления сходится к Q(i) при i0 ~~*¦
-> — оо для любой начальной дисперсии Qo ^ 0.
3. Если выполняется условие (в) или условие (г), то установив-
установившийся наблюдатель, который получается с использованием мат-
матрицы коэффициентов К, соответствующей установившейся диспер-
дисперсии Q, является экспоненциально устойчивым.
4. Наконец, если выполняется условие (в) иЛи условие (г),
то установившийся наблюдатель минимизирует
lim E{eT(i)W(i)e(i)} F.453)
для любой начальной дисперсии Qo. Минимальное значение выраже-
выражения F.453), которое достигается при установившемся оптималь-
оптимальном наблюдателе, равно
ir [~Q (i) W (i)]. F.454)
Подобным же образом, из. «дуализации» теоремы 6.31 (разд.
6.4.4) следует, что в неособой задаче построения оптимального
наблюдателя с постоянными параметрами при некоррелированных
шумах возбуждения состояния и наблюдения свойства, упомяну-
упомянутые в п. 2—4, выполняются при условии, что система F.452) яв-
является и обнаруживаемой, и стабилизируемой.
Предоставим читателю в качестве упражнения установить ду-
дуальность теоремы 6.37 (разд. 6.4.7) относительно асимптотичес-
асимптотического поведения полюсов регулятора.
608 Глава 6
6,6. Оптимальные линейные дискретные
системы с обратной связью
по выходной переменной
.6.6.1. ВВЕДЕНИЕ
В данном разделе рассмотрим построение оптимальных линей-
линейных дискретных систем управления, состояние объекта которых
не может быть полностью и точно наблюдаемым, вследствие чего
к системе должен быть присоединен наблюдатель. Этот раздел
соответствует по проблематике гл. 5.
6.6.2. РЕГУЛИРОВАНИЕ СИСТЕМ
С НЕПОЛНЫМИ ИЗМЕРЕНИЯМИ
Рассмотрим линейную дискретную систему, описываемую раз-
разностным уравнением состояния
z(i + l) = A(i)z (i) +B(i)u (i), F.455)
с управляемой переменной
z(i) = D(i)x(i). F.456)
В разд. 6.4 рассматривалось управление этой системой посред-
посредством обратной связи по состоянию с законом управления
u(i) = —F(i)x(i). F.457)
Очень часто, однако, не представляется возможным точно из-
измерить полное состояние, и доступной оказывается лить наблю-
наблюдаемая переменная вида
y(i) = C(i)z(i) + E(i)u(i). F.458)
Допуская, как и ранее, что y(i) является последним доступным
наблюдением для^ восстановления z(i + 1), к данной системе
можно присоединить наблюдатель вида
— C(i)x(i)]. F.459)
Тогда наиболее естественным действием является замена срс-
л
тояния х в F.457) на его восстановленное значение х:
u(i) = —F(i)x(i). F.46.0)
Сначала рассмотрим устойчивость соединения объекта, задан-
Теория для дискретных систем 609
ного уравнениями F.455) и F.458), наблюдателя F.459) и закона .
управления F.460). Имеем следующий результат, полностью ана-
аналогичный результату из теоремы 5.2 (разд. 5.2.2) в непрерывном
случае.
Теорема 6.46. Рассмотрим соединение системы, описываемой урав-
уравнениями F.455) и F.458), наблюдателя F.459) и закона управления
F.460). Тогда достаточные условия существования таких матриц
коэффициентов F(i) и K(i), i >• z0, при которых вся система яв-
является экспоненциально устойчивой, состоят в том, что система,
описываемая уравнениями F.455) и F.458), должна быть либо
равномерно полностью управляемой и равномерно полностью восста-
восстанавливаемой, либо экспоненциально устойчивой. В случае постоян-
постоянных параметров [т.е. все матрицы в уравнениях F.455), F.458) ¦—
F.460) являются постоянными] необходимые и достаточные усло-
условия существования стабилизирующих матриц коэффициентов К
и F состоят в том, что система, заданная уравнениями F.455)
и F.458), должна быть и стабилизируемой, и обнаруживаемой.
Кроме того, в случае постоянных параметров необходимые и дос-
достаточные условия для произвольного размещения всех полюсов
замкнутой системы в комплексной плоскости (при ограничении,
что комплексные полюса должны образовывать комплексно-сопря-
комплексно-сопряженные пары) посредством соответствующего выбора матриц
коэффициентов К и F состоят в том, что система должна быть
полностью восстанавливаемой и полностью управляемой.
Доказательство этой теоремы следует после того, как устанав-
устанавливается, что ошибка восстановления
e(i) = x(i) —x(i) F.461)
удовлетворяет разностному уравнению
e{i + l) = [A (i) -K(i)C (i)] e (i), F.462)
-ч.
Подстановка x(i) = x{i) + e(i) в F.460) и использование полу-
полученного соотношения в F.455) приводит к уравнению
- x(i + l) = [A(i)—B(i)F(i)]x(i) + B(i)F(i)e(i). F.463)
Затем при доказательстве теоремы 6.46 применяются теорема
6.29 (разд. 6.4.4), теорема 6.45 (разд. 6.5.4), теорема 6.26
(разд. 6.4.2) и теорема 6.41 (разд. 6.5.3). Кроме того, из F.462)
и F.463) видно, что в случае постоянных параметров характеристи-
характеристические числа объединенной системы включают в себя характерис-
характеристические числа матрицы А — BF (полюса регулятора) и харак-
характеристические числа матрицы А — КС (полюса наблюдателя).
610 Глава 6
0,1
I5
I
г
О -о
О'
л? О
-1
-1
5 . Ю
Дискретное
время С
5 10
Дискретное
время I
Особый интерес представляет
случай, если при постоянных
параметрах все полюса регуля-
регулятора и все полюса наблюдателя
размещаются в начале коорди-
координат. Из разд. 6.5.3 известно,
что наблюдатель будет восста-
восстанавливать состояние полностью
и точно самое большее за п
шагов (в предположении, что
п — размерность состояния х),
а из разд. 6.4.2 следует, что
после этого регулятор будет
приводить систему к нулевому
состоянию самое большее за
следующие п шагов. Таким об-
образом, получена оптимальная
замкнутая система управления,
которая приводит любое на-
начальное состояние к началу ко-
координат самое большее за In ша-
шагов. Назовем такие системы
системами управления с аперио-
апериодическим состоянием и обрат-
обратной связью по выходной перемен-
переменной.
i
-40
I 5 10
Дискретное время, i
Рис. 6.22. Реакция системы управ-
управления, положением с апериодическим
состоянием и обратной связью по
выходной переменной при начальном
состоянии col[z@), 2@)] = col@,l, 0,
0, 0).
Реакции показаны только в дискретные мо-
моменты времени.
Пример 6.24. Цифровал система
управления положением с апери-
апериодическим состоянием и обрат-
обратной связью по выходной перемен-
переменной
Рассмотрим цифровую си-
систему управления положением
из примера 6.2 (разд. 6.2.3).
В примере 6.13 (разд. 6.3.3) был
выведен закон управления с
апериодическим состоянием для
этой системы, а в примере 6.22
(разд. 6.5.3) был найден апе-
апериодический наблюдатель. На
рис. 6.22 приводится реакция
соединения из апериодического
закона управления, апериоди-
апериодического наблюдателя и системы
Теория для дискретных систем- 6П
при начальном состоянии
х @) = col @,1, 0), г@)=0. F.464)
Видно, что начальное состояние приводится к нулевому сос-
состоянию за четыре шага. Сравнение с апериодической реакцией
той же самой системы с обратной связью по состоянию, представ-
представленной на рис. 6.12 (разд. 6.3.3), показывает, что система управ-
управления с обратной связью по выходной переменной перед приходом
к нулевому состоянию обнаруживает сравнительно большие откло-
отклонения состояния и требует больших амплитуд входного сигнала.
6.6.3. ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ РЕГУЛЯТОРЫ
С НЕПОЛНЫМИ И ИСКАЖЕННЫМИ ШУМОМ ИЗМЕРЕНИЯМИ
Начнем этот раздел с определения основной задачи,.
Определение 6.20. Рассмотрим линейную дискретную систему
x(i + l) = A(i)x (i) +B(i)u @ + iPt (i),
F.465)
? (lo) == xo> l -^ lo>
где x0 — стохастический вектор со средним значением х0 и матри-
матрицей дисперсий Qo. Наблюдаемая переменная системы имеет вид
y{i) = C (i) x(i) + E (i) и (i) + w2 (I). F.466)
Переменные collwjfi), w2(i)] образуют последовательность не-
некоррелированных стохастических векторов, некоррелированных с
х0, с нулевыми средними значениями и матрицами дисперсий
Управляемая переменная может быть выражена в виде
z(i) = D{i)x(i). F.468)
Тогда задача построения стохастического линей-
ного дискретного оптимального регулятора с обрат-
обратной связью по выходной переменной является задачей
нахождения такого функционала
). »(*о + 1). -. »(* — *). *], io< »<*! — !, F.469)
612 Глава 6
который бы минимизировал критерий
F.470)
Как и в непрерывном случае, решение этой задачи удовлетво-
удовлетворяет принципу разделения [6, 68, 103].
Теорема 6.47. Решение задачи построения стохастического ли-
линейного дискретного оптимального регулятора с обратной связью
по выходной переменной заключается в следующем. Оптимальная
выходная переменная описывается соотношением
u(i) = —F(i)x(i), »„<»<», —1, F.'471)
zdeF(i), i0 <: i <; ix—1,— последовательность матриц коэффици-
коэффициентов для детерминированного оптимального регулятора, опреде-
определяемая в теореме 6.28 (разд. 6.4.3^. Далее, x(i) является линейной
оценкой состояния x(i) с минимальным средним значением квад-
квадрата ошибки, полученной по данным y(j), i0 < / < h—1*. щенка
x(i) для неособого случая [т.е. V2(i) >0, io< i < ii—И может
быть получена как выходная переменная оптимального наблю-
наблюдателя, описанного в теореме 6.42 (разд. 6.5.4^.
Теорема 6.47 может быть доказана аналогично непрерывному
эквиваленту.
Рассмотрим теперь вычисление критерия F.470), где ограни-
ограничимся неособым случаем. Замкнутая система управления описы-
описывается соотношениями
x(i + l) = A(i)x @ + B(i)u (i) + wt (i),
¦ y(i) = C(i)x(i) + E(i)u(i) + w2(i), F.472)
) )()
x(i + 1) = A(i)x(i) + В (i)u(i) + К (i)[y(i) ~
В терминах ошибки восстановления
e(i)=x(i)~x(i) F.473)
' л
и состояния наблюдателя x(i) систему F.472) можно переписать
в виде
Теория Зля дискретных систем 613
A(i)~K(i)C(i) О Ue@>| +
F.474)
F.475)
Определяя матрицу дисперсий векторного процесса col[e(i),
x(i)] в виде
О if(i)/W0
с начальным условием
I
и применяя теорему 6.22 (разд. 6.2.12), нетрудно найти, что мат-
матрицы Qjk(i), j, k — 1,-2, удовлетворяют разностным уравнениям,
из которых приведем только уравнение дяя матрицы Qti:
qz% (i +1) = if (о с (о <?u (i) cT(i) кт (i) +
+ [A @ - Б (i) F @1 <?[2 (i) Cr (») ifr @ +
+ if (г) С (i) Qi2 (i) [A (i)~B(i)F (j)]r +
+ [A (i) ~B(i)F (i)\ <?22 (i) [Л @ ~B(i)F (i)f +
+ K(i)V2(i)KT(i), i^i0, F.477)
при начальном условии
) = 0. F.478)
Теперь очевидно, что Qn(i) = Q(i), где (^>(i) является матрицей
дисперсий ошибки восстановления. Кроме того, составляя разност-
разностное уравнение для QLi, можно доказать, что Q12(i) =0, i0 <
<: i <: ^—1. Это означает аналогично непрерывному случаю, что
величины e{i) и x(i) являются' некоррелированными при i0 < i <:
<: tx—1. В результате Q22 может быть найдено из разностного урав-
уравнения
614 Глава &
QZ2 (i + l)=K (О [С (О Q (О Ст (i) + V2 (i)] Кт (i) +
+ [A(i)-B(i)F(i)]Q22(i)[A(i)-B(i)F (i)f,
F.479)
<Ыго) = О.
Если матрица дисперсий векторного процесса col[e(t), x(i)]
известна, то средние значения квадратов и среднеквадрэтически©
значения всех интересующих величин могут быть вычислены.
В частности, рассмотрим критерий F.470). В терминах матрицы
дисперсий векторного процесса col(e, х) запишем критерий
<т= x'0P(in)zn+ tr,
+ F' (i)R2(i)F(i)Q22(i)} +Pi[Q(ii) +Q22(h)]\, F.480)
-где J
¦ Rl(i) = DT(i)Ra(i)D(i), ¦ F.481)
a /^i) определяется в F.248). Рассмотрим отдельно члены
tr J 2 iRi (i + 1) <?22 (i + 1) + FT A) R2 (i) F (») <?22 (»)] +
+ ^1 <?22 (^l) I = tr I 2 [^t (i) + ^Г (i) i?2 @ -^ (*I <?22 @ +
+ [Pt + Rt (i)] Q2i (i) ,. F.482)
где использовалось условие Q22 (i0) = 0. Теперь на основании ре-
результата задачи 6.8.7 выражение F.482) можно переписать в виде
Ji. ~
1F.483)
где Р удовлетворяет матричному разностному уравнению
-l)F(i- 1)] + Rt (i) + FT (i) R2 (i) F (»),
F.484)
Теврия для дискретных систем 615
Нетрудно установить, что P(i) = P(i) + R^i), ia -H 1 < i <if.
С использованием этого равенства подстановка F.483) в F.480)
приводит к следующему выражению для критерия:
а^ xT0P(io)xo + ^tv {Rt(i + l)Q (i + I) + [P (i + I) +
+ Ri(i + 1)] К (i) [C(i)Q@CT(i) + V2(i)] KT(i)\ +
+ tc[PlQ(i1)], , F.485)
С помощью соответствующих преобразований нетрудно найти,
что критерий можно выразить и в иной форме:
а = xT0P(io)xo + tv [P (i0)Q0] +
("=l"o
+ <? (i)FT (i)\R2(i) + BT(i) [Д,(*+1)Ч- Р (i + i)]B(i))-F@ ¦ F.486)
Теперь можно сформулировать следующую теорему.
Теорема 6.48. Рассмотрим задачу построения стохастического
регулятора с обратной связью по выходной переменной, представ-
представленную в определении 6.20. Предположим, что V2(i) >0- для
всех i. Тогда можно сделать следующие выводы.
а) Минимальное значение критерия F.470) может быть выра-
выражено в альтернативных формах F.485) и F.486).
б) В случае постоянных параметров, в котором задачи опти-
оптимального наблюдения и регулирования имеют установившиеся ре-
решения при i0 —*¦—оо и it —»-оо, характеризуемые матрицами
Q и Р с соответствующими матрицами установившихся коэффи-
коэффициентов К и F, справедливо следующее:
l=io
= lim E\zT{i + l)R3z(i + l) + uT(
to ->— oo
= tr [Rtf + ( P + R^YiCQC7 + V2)TT] =
[R2 + BT(Ri + P)B]F} . F.487)
в) Средние значения квадратов интересующих величин могут
быть получены из матрицы дисперсий dia.g[Q(i), Q^(i)] процесса,
<o\[e(i), x(i)\. Здесь e(i) = x(i) — x(i), Q(i)— матрица диспер-
616 Глава 6
сий процесса e(i), a Q2i(i) может быть получено как решение мат-
матричного разностного уравнения
Q2Z (i + i) = [A @ ~B(i)F (»)] Q22 (i) [A (i)-B
+ к (О [с (о Q (о сТ (о + f2 (ol кт (о, i > »0,
<?и(«в) = 0. F.488)
Доказательство части (б) настоящей теоремы выполняется с
использованием части (а).
" Общая задача стохастического регулирования может быть
подразделена на задачи слежения, задачи регулирования систем
при наличии возмущений и задачи слежения при наличии возму-
возмущений точно так же, как в непрерывном случае.
6.6.4. НЕНУЛЕВЫЕ ЗАДАННЫЕ ТОЧКИ
И ПОСТОЯННЫЕ ВОЗМУЩЕНИЯ
Методы исследования регуляторов с постоянной настройкой а
следящих систем с ненулевыми заданными точками и постоянными
возмущениями, разработанные в разд.5.5,могут также применять-
применяться в дискретном случае. Сначала рассмотрим случай, когда управ-
управляемая переменная системы имеет ненулевую заданную точку z0.
Разностное уравнение состояния системы имеет вид
+ Bu(i) + Wi(i), i > iq, F.489)
управляемая переменная равна
z'(i) = Dx (*), i > ia, F.490)
а наблюдаемая переменная описывается выражением
y(i) = Cx(i) + Eu(i) + wt(i), i>»0. F.491)
Совместный процесс соЦи^, w%) сформулирован в определе-
определении 6.20 (разд. 6.6.3). Из разд. 6.4.6 следует, что регулятор сис-
системы с ненулевой заданной точкой определяется соотношением
_ и(о = —^(О + ЯГ'^К. F-492>
где F — соответствующая матрица коэффициентов обратной свя-
связи, а
Hc(z) = D(zI—A + Bl У1 В F.493)
является (квадратной) матричной передаточной функцией замкну-
замкнутой системы [в предположении, что dim(z) = dim(u)]. Кроме то-
того, x(i) — оценка x(i) с минимальным средним значением квадрата
ошибки, a z0 — оценка z0.
Теория для дискретных систем . . 617
Получение z0 зависит от способов моделирования заданной точ-
точки. Если предполагается, что заданная точка изменяется согласно
уравнению
, . • zo(i + l) = zo(i) + wo(i) F.494)
и наблюдается
r(i) = zo(i) + ws(i), ' . F.495)
где co\(w0, ws) представляет собой последовательность типа белого
шума, то установившийся оптимальный наблюдатель для заданной
точки имеет вид
z0 (» + !) = z0 (i) + ~КГ [г @ - z0 @ ] . F.496)
Этот наблюдатель в соединении с законом управления F.492)
приводит к нулевой установившейся реакции, если эталонная пе-
переменная r(i) является постоянной.
Случай наличия постоянных возмущений может быть проанали-
проанализирован следующим образом. Пусть разностное уравнение состоя-
состояния задается в виде
x(i + l) = Ax @ + Ви @ +vo + wl (»), F.497)
где v0 — постоянное возмущение. Управляемая и наблюдаемая
переменные описываются так же, как и ранее. Тогда из разд. 6.4.6
получим закон управления для нулевой установившейся ошибки
в (t) = — 7x(i) — ЯГ1 A) D (I —Af^v0, F.498)
где все параметры определены выше, А = А — ВТ, a v0 — оцен-
оценка у0. Чтобы получить v0, смоделируем постоянное возмущение
в виде
vo(i + l) = vo(i) + wo(i), F.499)
где ц>0 представляет собой последовательности типа белого шума.
Установившийся оптимальный наблюдатель для x(i) и zo(i) прини-
принимает вид
— E(i)u(t)], F.500)
v0 (» + !) = v0 @ + Тг [у (t) — Сх (i) - Е (i) и (i)] .
Этот наблюдатель вместе с законом управления F.498) при-
приводит к реакции с нулевой установившейся ошибкой при постоян-
618 Глава 6
ном возмущении. Это соответствует форме интегрального управ-
управления.
Пример 6.25. Интегральное управление в цифровой системе управ-
управления положением
Рассмотрим цифровую систему управления положением из
предыдущих примеров. В примере 6.14 (разд. 6.4.3) был получен
закон управления с обратной связью по состоянию
u(i) = ~Fx(i) = — A10,4, 12,66) х (i). F.501)
Предполагая, что на двигатель действуют постоянные возмущения
в форме постоянных моментов на валу, введем параметр вида
/ 0,003396 \ .„ КЛОЧ
v0 = la F.502)
V 0,06308 ; '
в разностное уравнение состояния F.26), где a — постоянная.
Нетрудно видеть, что обратная связь по состоянию F.501)
приводит к закону управления для нулевой установившейся
ошибки
^(i) = —Fx(i)—a(i). F.503)
Наблюдатель F.500) в этом случае имеет вид
Л/- .44 /! О,08015\л /0,003396
я (t + l) )x(i) +
0 0,6313 / Wl0,06308
r(i, 0)*(«)
F.504)
a(i + l) = a(i) + ks[rl(i)-(l, 0)x(i)].
Здесь предполагается, что
tj@ = A, 0)x(i) F.505)
является наблюдаемой переменной (т.е. целый период дискретнос-
дискретности используется для обработки данных), aklt k2 и кЛ представляют
«обоц скалярные коэффициенты, которые требуется выбрать. Вы-
Выберем эти коэффициенты такими, чтобы наблюдатель являлся апе-
апериодическим; в результате получим следующие значения:
^ = 2,6313, ^ = 18,60, к3= 158,4. F.506)
На рис. 6.23 показана реакция полученной системы управле-
управления с нулевой установившейся ошибкой при нулевых начальных
условиях и относительно большом постоянном возмущении 10 В
Теория для дискретных систем
619
(т. е. возмущающий момент эк-
эквивалентен постоянному допол^
нительному входному напряже-
напряжению 10 В). Видно, что амплиту-
амплитуда возмущения идентифициру-
идентифицируется за три периода дискрет-
дискретности и что системе требуется
еще от трех до четырех перио-
периодов дискретности, чтобы пол-
полностью компенсировать возму-
возмущение.
6.7. Заключение
В настоящей главе подыто-
подытожены главные результаты ли-
линейной оптимальной теории уп-
управления для дискретных си-
систем. Как было показано, во
многих случаях теория непре-
непрерывных систем может быть не-
непосредственно распространена
на случай дискретных систем.
В главе дается обзор основных
результатов, необходимых для
проектирования линейных дис-
дискретных систем управления.
Хотя во многих .отношениях
теория дискретных систем сле-
следует непрерывной теории, су-
существуют некоторые отличия.
Одно из главных расхождений
состоит в том, что теоретически
непрерывные системы могут
обладать произвольно большим
быстродействием. Этого нельзя
добиться в дискретных систе-
10
10
Дискретное бремя L
10
1
-10
• CQ
I
-20
0,1
0,1
I
0 10
Дискретное Время, I
Рис. 6.23. Реакция цифровой систе-
системы управления положением с инте-
мах, где быстродействие огра- тральным управлением при нулевых
ничиваётся ~ периодом "дискрет- начальных условиях и постоянном
. ... „.„ ....;.- к ^ - " г возмущении,
ности. Самым быстрым видом J^
управления, которого можно
добиться в дискретных системах, является апериодическое уп-
управление.
В данной главе, как правило, рассматривались линейные дис-
дискретные системы! -полученные из непрерывных систем посредством
620 Глава 6
дискретизации. Вопросу о том, что происходит внутри интервала
дискретности, не уделялось большого внимания, за исключением
однбго или двух примерев, где поведение системы в моменты дис-
дискретизации может ввести в заблуждение относительно поведения
в промежутках между ними. Эти факты настораживают. Как
было показано в тех же примерах, часто имеется возможность нес-
несколько изменить постановку задачи синтеза дискретной системы
с тем, чтобы получить более приемлемый результат.
Наиболее плодотворные результаты применения линейной дис-
дискретной теории управления связаны с быстро развивающейся
областью управления посредством цифровых вычислительных
машин.
6.8. Задачи
6.8.1.МОДИФИЦИРОВАННАЯ ЗАДАЧА ДИСКРЕТНОГО РЕГУЛИРОВАНИЯ
Рассматривается линейная дискретная система
x(i + l) = A(i)x (i) + В (i) и (i) F.507)
с модифицированным критерием
1T r T
(il). F.508)
Покажите, что минимизация выражения F.508) для системы
F.507) эквивалентна обычной задаче дискретного регулирования,
где минимизируется критерий
«4-1
T
+ zT(ii)Pix{il) F.509)
для системы
x(i + 1) = A' (i)x(i) + B(i)u' (i) F.510)
при
F.511)
Теория для дискретных Систем 621
6.8.2. ЗАДАЧА ПОСТРОЕНИЯ СТОХАСТИЧЕСКОГО РЕГУЛЯТОРА
С ОБРАТНОЙ СВЯЗЬЮ ПО СОСТОЯНИЮ
КАК ЗАДАЧА РЕГУЛИРОВАНИЯ
ПРИ НАЛИЧИИ ВОЗМУЩЕНИЙ А
Рассматривается линейная дискретная система
x(i + I) = A(i)x(i) + B(i)u(i) + v(i),
F.512)
z(i) = D(i)x(i).
Здесь возмущающая переменная v моделируется в виде
v(i)==Da(i)xd{i),
F.513
**(» + *) = Ad(i)xd(i) + wd(i), . ,
»
где wd (i), i>- i0, представляет собой последовательность некоррели
рованных векторов с заданными матрицами дисперсий.
Используется критерий
Е ( У [zT(i + 1) Rs(i + l)z(i + 1) + uT(i)R2(i)u(i)] + ¦
F.514)
а) Покажите, как задача управления системой с минимизацией
критерия F.514) может быть преобразована в обычную задачу
стохастического регулирования.
б) Покажите, что оптимальный закон управления может быть
представлен в виде
u{i) = ~F{i)x{i)-Fd(i)xd{i), i = i0, io + i,...,*i —1, F.515)
где матрицы коэффициентов обратной связи F(i), i = ц, ..., i1—1,
не зависят от свойств возмущающей переменной.
6.8.3. ЗАДАЧА ПОСТРОЕНИЯ СТОХАСТИЧЕСКОГО РЕГУЛЯТОРА
С ОБРАТНОЙ СВЯЗЬЮ ПО СОСТОЯНИЮ
КАК ЗАДАЧА СЛЕЖЕНИЯ
Рассматривается линейная дискретная система
F.516)
622 Глава 6
Используется эталонная переменная zr, которая модели-
моделируется с помощью уравнений
zr(i) = Dr(i)xr(i),
F,517)
xr(i + l) = Ar(l)x,(i) + wr(j),
где wr(i), i з> i0, представляет собой последовательность некорре-
некоррелированных стохастических векторов с матрицами дисперсий
Vr(i). Используется также критерий
Е ( ^ [z (i + 1) - zr (i + l)]TR3 (i + 1) [z(i + i)-zr(i + 1)] +
+ uT(i)R2(i)u{i) . F.518)
а) Покажите, как задача управления системой с минимизацией
критерия F.518) может быть преобразована в обычную задачу
построения стохастического дискретного оптимального регулятора.
б) Покажите, что оптимальный закон управления может быть
представлен в виде
u(i) = —F(i)x(i) + FT(i)xr{i), i=i0, io + l,..., (j —1, F.519)
где матрицы коэффициентов обратной связи F(i), i = i0, ..., ix—1,
не зависят от свойств эталонной переменной.
6.8.4. ПОЛЮСА ЗАМКНУТОГО РЕГУЛЯТОРА
Докажите следующее обобщение теоремы 6.37 (разд. 6.4.7).
Рассматривается установившееся решение задачи построения
линейного дискретного оптимального регулятора с постоянной
настройкой. Предположим, что dim(z) = dim(u), и пусть
H(z) = D (zl — Л)"* В, F.520)
] ,
—««) при тг(.^О ( = 1,2,...,?,
(=1
П(г-»;) при v;
Теория для дискретных систем 623
где N >0 ир — положительный скаляр. Наконец, положим
г = шах(р, q). Тогда:
а) Из п полюсов замкнутого регулятора п — г всегда остаются
в начале координат.
б) При р \0 из оставшихся г полюсов замкнутого регуля-
регулятора р стремятся к числам v;, i = 1, 2, ..., р, которые определяют-
определяются в уравнении F,363).
в) Прир \ 0 г — р других полюсов замкнутого регулятора стре-
стремятся к началу координат.
г) При р | оо из г ненулевых полюсов замкнутого регулятора
q стремятся к числам nt, i = 1, ..., q, которые определяются в
уравнении F.364). -
д) При р [ оо г — q других ненулевых полюсов стремятся к
началу координат.
6.3.5. ЗАДАЧА ПОСТРОЕНИЯ ГИБРИДНОГО
НЕПРЕРЫВНО-ДИСКРЕТНОГО РЕГУЛЯТОРА
Рассматривается дискретная система, которая получается в
результате воздействия кусочно-постоянной переменной на непре-
непрерывную систему
x(i) = A(t)x(t)+B(t)u(t). F.521)
При переходе от непрерывного описания к дискретному ис-
используется процедура и обозначения разд. 6.2.3. Желательно
учесть поведение системы между моментами дискретизации, поэ-
поэтому используется интегральный (а не суммарный) критерий
f [ хт (t) Rt (t) x(t) + uT (t) R2 (t) и (t)] dt + xT( tk )PiX{ tk у F.522)
tl° .
Здесь ti0—первый момент дискретизации, a t^—последний.
а) Покажите, что минимизация критерия F.522) при управ-
управлении системой F.521) посредством ступенчатых входных сигна-
сигналов эквивалентна минимизации выражения вида
'i ' '
[ хТ <*i) Ri (I) х (*,) + 2хт (tt) R']2 (i) и (tt) +V (tt) R2 (i) и (tt)] +
l=lo
для дискретной системы
хт
[
(ui
1 ф
J г ( t
]
В (х) dx
u(t
0-
F
F
.523)
.524)
624 Глава 6
где Ф(?, t0)—переходная матрица системы F.521). .Найдите выраже-
выражения для Ri'(i), -Rj2'@ И -^'(О-
б) Предполагается, что А, В, Ri и R2 — постоянные матрицы,
а период дискретности tUi — tt = А постоянный. Покажите, что,
если период дискретности мал, первые приближения для i?/,
Riz' и Rz определяются соотношениями
R\2~ — Л45А2, ¦ F.525)
R2 ~ (R2 + — Вт R, В Д2 U.
6.8.6. АЛЬТЕРНАТИВНЫЙ ВАРИАНТ ЗАДАЧИ ДИСКРЕТНОГО
ОПТИМАЛЬНОГО НАБЛЮДЕНИЯ
Рассматривается система
z(i + l) = A(i)x (i) + B (г) и (г) + Щ (О-
F.526)
y(i) = C(i)x(i) + E(i)u(i)+w2(i), i>i0,
где процесс col[u?i(f), iv2(i)], i >¦ it>, образует последовательность
некоррелированных векторных стохастических переменных с
нулевыми средними и матрицами дисперсий
i>i0. F.527)
Далее, x(i0)— векторная стохастическая величина, некоррели-
некоррелированная cw(h w2, со средним значением х0 и матрицей диспер-
дисперсий Qo.
Покажите, что наилучший линейный оцениватель процесса
x(i) по данным о y(J), г0 < / < г (а не i - 1, как в разд. 6.5), мо-
может быть описан выражением
x(i + l) = [I-K(i + l)C(i + l))[A(i)x(i) + B(i)u(i)
+ K(i + l)[y(i + i)—E(i + i)u(i + l)], ,»>»0. F.528)
Здесь матрицы коэффициентов К получаются из итеративных
соотношений
i) AT(i) + V, (i),
Теория для дискретных систем 625
Q (i + 1) = [/ - К (i +1) С (i -f 1)] S(i + 1)-K{t + 1) У[2 (i), F.529)
для всех ? > i0. Здесь Q(i) — матрица дисперсий ошибки восста-
восстановления x(i) — x(i), a S(i) — вспомогательная матрица. Началь-
Начальное условие для F.528) определяется в виде
х (t0) = [I-K (ia) С (*„)] ха + К (i0) [у (i0) -Е (i0) u ((„)], F.530)
где
* (го) = <?о Ст (J0) [С (i0) <?0 Сг (i0) + F2 (io)P . F.531)
Начальная матрица дисперсий, которая служит в качестве на-
начального условия для итеративных соотношений F.529), определя-
, ется выражением
Q(io) = [I-K(io)C(io)]Qo. F.532)
Примечание: Чтобы получить уравнение наблюдателя, надо
выразить y(i + 1) через x(i) и использовать стандартный вариант
задачи наблюдения, приведенный в тексте.'
6.8.7. СВОЙСТВА МАТРИЧНОГО РАЗНОСТНОГО УРАВНЕНИЯ
Рассматриваются матричное разностное уравнение
Q(i + l) = A(i)Q(i)AT(i)+R(i), io<f<i1-l, F.533)
и линейное выражение
\ F.534)
Докажите, что это выражение может быть записано в виде
tr \
q0P(i0) + • 2 RU-i)P(/)] . F-535)
J
где последовательность матриц P(j), i0 <€¦ j <: iit удовлетворяет
матричному разностному уравнению
Р (i -1) = Ат (t-l)P (i) A(i-1)+S(i- 1),
i0 + 1 •<: i < i1(. F.536)
P(h) = Pf
21—394
626 Глава 6
6.8.8. ЛИНЕЙНЫЕ ДИСКРЕТНЫЕ ОПТИМАЛЬНЫЕ РЕГУЛЯТОРЫ
ПОНИЖЕННОЙ РАЗМЕРНОСТИ С ОБРАТНОЙ СВЯЗЬЮ
ПО ВЫХОДНОЙ ПЕРЕМЕННОЙ
Рассматривается линейная дискретная система с постоянными
параметрами
x(i + i) = Ax @ + Ви (I) + v>i (i), х (Q = хр,
z(i) = D(i)x(i), F.537)
для всех i >- i0, где процесс collw^i), iv2(i)\, i >¦ i0, образует после-
последовательность стохастических векторов, некоррелированных меж-
между собой и с х0. Рассматривается регулятор с постоянной настрой-
настройкой
iy(),
F.538)
u(i) = -Fq(i)—Kty(i).
Делается предположение, что соединение регулятора и объекта
является асимптотически устойчивым.
а) Найдите матричные соотношения, которые можно исполь-
использовать для вычисления выражений вида
lira E {zT(i)R3z(i)} ¦ F.539)
и
lim E {uT(i)R2u({)\. F.540)
Предполагая, что могут быть разработаны вычислительные
программы для определения таких матриц регулятора L, Kiy
F и К2, при которых F.539) минимизируется, а F.540) ограничи-
ограничивается заданной величиной, разработайте схему метода для по-
построения дискретных оптимальных регуляторов пониженной раз-
размерности с обратной связью по выходной переменной. (Ср. с под-
подходом для непрерывного случая, рассмотренным в разд. 5.7.)
б) При использовании градиентных методов для численного
решения задачи оптимизации (а) полезен следующий результат.
Пусть М, N и R являются заданными матрицами совместимых
размеров и зависят от параметра у. Пусть 5 представляет собой
решение линейного матричного уравнения
S=MlMT+N, - F.541)
а скаляр
\tCSR) F.542)
Теория для дискретных систем 627
является функцией у. Тогда градиент выражения F.542) отно-
относительно у определяется в виде
??) F.543)
где U является решением вспомогательного матричного урав-
уравнения
R. F.544)
Докажите это
21»
ЛИТЕРАТУРА
1. Anderson В. D. 0., The inverse problem of optimal control, Technical
* Report No. 6560-3, Stanford Electronics Laboratories, Stanford University,
Stanford, Calif., 1966.
2. Anderson B. D. 0., Solution of quadratic matrix equations, Electron. Let-
Letters, 2, 10, pp. 371-372 A966).
3. Anderson B. D. 0., Luenberger D. G., Design of multivariable feedback
systems, Proc. IEE, 114, 3, pp. 395—399 A967).
4. Anderson B. D. 0., Moore J. В., Linear Optimal Control, Prentice-Hall,
Englewood Cliffs, N. J., 1971.
5. Aoki M., Control of large-scale dynamic systems by aggregation, IEEE
Trans. Autom. Control., 13, 3, pp. 246—253 A968).
6. Astrom K. J., Introduction to Stochastic Control Theory, Academic Press,
New York, 1970; русский перевод: Острей К. Д., Введение в стохастичес-
стохастическую теорию управления, М., изд-во «Мир», 1973.
7. Astrom К. J., Koepcke R. W., Tung F., On the control of linear discrete
dynamic systems with quadratic loss, Research Report RJ-222, IBM,
San Jose Research Laboratory, San Jose, Calif., 1962.
8. Athans M., Falb P. L., Optimal Control, An Introduction to the Theory
and Its Applications, McGraw-Hill, New York, 1966; русский перевод:
Атане М., Фалб П., Оптимальное управление, М., изд-во «Машинострое-
«Машиностроение», 1968.
9. Barnett S., Storey С, Remarks on numerical solution of the Lyapunov mat-
matrix equation, Electron. Letters, 3, p. 417 A967).
10. Barnett S., Storey C, Matrix Methods in Stability Theory, Nelson, Lon-
London, 1970.
11. Barrow В. В., IEEE takes a stand on units, Spectrum, 8, 3, pp. 164—173
A966).
12. Bass R. W., Machine solution of high-order matrix Riccati equations, Dou-
Douglas Paper № 4538, Douglas Aircraft, Missile and Space Systems Division,
1967.
13. Bass R. W., Gura I., High order system design via state-space considera-
considerations, Preprints, 1965 Joint Automatic Control Conference, pp. 311—318,
Rensselaer Polytechnic Institute, Troy, N. Y., June 22—25, 1965.
14. Bellman R. E., Dynamic Programming, Princeton Univ. Press, Princeton,
N. J., 1957; русский перевод: Беллман Р., Динамическое программиро-
программирование, М"., ИЛ, 1960.
15. Berger С. S., A numerical solution of the matrix equation Р=уР<(' -f- S,
IEEE Trans. Autom. Control, 16, 4, pp. 381—382 A971).
16. Beveridge G. S. G., Schechter R. S., Optimization: Theory and Practice,
McGraw-Hill, New York, 1970.
17. Bickart Th. A., Matrix exponential: Approximation by truncated power
series, Proc. IEEE, 56, 5, pp. 872—873 A968).
Литература 629
18. Blackburn Т. R., Solution of the algebraic Riccati equation via Newton-
Raphson iteration, Preprints, 1968 Joint Automatic Control Conference,
pp. 940—945, University of Michigan, Ann Arbor, Mich., June 26—28,
1968.
19. Blackburn T. R., Bidwell J. C, Some numerical aspects of control enginee-
engineering computations, Preprints, 1968 Joint Automatic Control Conference,
pp. 203—207, University of Michigan, Ann Arbor, Mich., June 26—28,
1968. „
20. Блейклок Дж., Автоматическое управление самолетами н ракетами,
М., изд-во «Машиностроение», 1969.
21. Боле Г., Теория цепей и проектирования усилителей с обратной
связью, М., ИЛ, 1948.
22. Brammer К. G-, Lower order optimal filtering of nonstationary ran-
random sequences, IEEE Trans. Autom. Control, 13, 2, pp. 198—199 A968).
23. Brasch F. M , Pearson J. В , Pole placement using dynamic compensators,
IEEE Trans. Autom. Control, 15, 1, pp. 34—43 A970).
24. Brockett R. W., Finite Dimensional Linear Systems, Wiley, New York,
1970.
25. Bryson A. E., Johansen D. E., Linear filtering for time-varying systems
using measurements containing colored noise, IEEE Trans. Autom. Cont-
Control, 10, 1, pp. 4—10 A965); см. также Брайсон А., Хо Ю-Ши, При-
кладпая_теория оптимального управления, М., изд-во «Мир», 1972.
26. Bucy R. S., Global theory of the Riccati equation, /. Сотр. Systems Sci.t "
1, p. 349—361 A967).
27. Bucy R. S., Two-point boundary value problems of linear Hamiltonian
systems, SI AM J. Appl. Math., 15, 6, pp. 1385—1389 A967).
28. Bucy R. S., Ackermann J., Ueber die Anzahl der Parameter von Mehr-
grossensystemen, Regelungstechnik, 18, 10, pp. 451—452 A970).
29. Bucy R. S., Joseph P. D., Filtering for Stochastic Processes with Applica-
Applications to Guidance, Interscience, New York, 1968.
30. Butman S., A method for optimizing control—free costs in systems with
linear controllers, IEEE Trans. Autom. Control, 18, pp. 554—556 A968).
31. Cadzow J. A., Nilpotency property of the discrete regulator, IEEE Trans.
Autom. Control, 13, 6, pp. 734—735, A968).
32. Caines P. E., Mayne D. Q., On the discrete time matrix Riccati equation
of optimal control, Intern. J. Control, 12, 5, pp. 785 — 794 A970).
33. Caines P. E., Mayne D. Q., On the discrete time matrix equation of opti-
optimal control — A correction, Intern. J. Control, 14, pp. 205—207 A971).
34. Cannon R. H., Jr., Dynamics of Physical Systems, McGraw-Hill, New
York, 1967.
35. Chang S. S. L., Synthesis of Optimal Control Systems, McGraw-Hill,
New York, 1961; русский перевод: Чяит Ш., Синтез оптимальных
систем автоматического управления, М., Изд-во «Машиностроение»,
' 1964.
36. Chen С. Т.,' Stability of linear multivariable feedback systems, Proc.
IEEE, 56, 5, pp. 821—828 A968).
37. Chen С. Т., A note on a pole assignment, IEEE Trans. Autom. Control,
18, 5, 597—598 A968).
630' Литература
38. Chen С. F., Shich L. S., A note on expanding PA -b Ar P = —Q, IEEE
Trans. Autom. Control., 13, 1, pp. 122— 123 A968).
39. Chen C. F., Shich L. S., A novel approach to linear model simplificatipn,
Preprints, 1968 Joint Automatic Control Conference, pp. 454—461, Uni-
University of Michigan, Ann Arbor, Mich., June 26—28, 1968.
40. Chidambara M. R., Schainker R. В., Lower order generalized aggregated
model and suboptimal control, IEEE Trans. Autom. Control, 16, 2, pp.
. 175—180 A971).
41. Cruz J. В., Perkins W. R., A new approach to the sensitivity problem in .
multivariable feedback system design, IEEE Trans. Autom. Control., 9,
3, pp. 216—222 A964).
42. Cumming S. D. G., Design of observers of reduced dunamics, Electron.
Letters, 5, 10," pp. 213—214 A969).
43. Davenport W. В., Root W. L., An Introduction to the Theory of Random
Signals and Noise, McGraw-Hill, New York, 1958; русский перевод: Да-
венпорт У., Рут У., Введение в теорию случайных сигналов и шумов,
М., ИЛ, I960.
44. Davis H. Т., Introduction to Nonlinear Differential and Integral Equati-
Equations, Dover, New York, 1962.
45. Davison E. J., A new method for simplifying large linear dynamical sys-
systems, IEEE Trans. Autom. Control., 13, 2, pp. 214—215 A968).
«46. Davison E. J., On pole assignment in multivariable linear systems, IEEE
Trans. Autom. Control., 13, 6, pp. 747—748 A968).
47. Davison E. J., Man F. Т., The numerical solution of A'Q -f QA = — C,
IEEE Trans. Autom. Control., 13, 4, pp. 448—449 A968).
48. Davison E. J., Smith H. W., Pole assignment in linear time-invariant
multivariable systems with constant disturbances, Automatica, 7, 4, pp.
489—498 A971).
49. D'Azzo J. J., Houpis С. Н., Feedback Control System Analysis and Synt-
Synthesis, 2nd ed,, McGraw-Hill, New York, 1966.
50. Desoer С A., Notes for a Second Course on Linear Systems, Van Nostrand
Reinhold, New York, 1970. '
51. Deyst J. J., Jr., Price С F., Conditions for asymptotic stability of the dis-
discrete minimum-variance linear estimator, IEEE Trans. Autom. Control.,
13, 6, pp. 702—705 A968).
52. diCaprio U., Wang P. P., A study of the output regulator problem for
linear systems with input vector, Proc. Seventh Annual Allerton Confe-
Conference on Circuit and System Theory, pp. 186—188, Institute of Electri-
Electrical and Electronics Engineers Catalog № 69 C48-CT. 1969.
53. Doob J. L., Stochastic Processes, Wiley, New York, 1953; русский перевод:
Дуб Дш., Вероятностные процессы, М., ИЛ, 1956.
54. Eklund К., Multivariable control of a boiler — An application of linear
quadratic control theory, Report 6901, Lund Institute of Technology, Di-
Division of Automatic Control, Lund, Sweden, 1969.
55. Elgerd O. I., Control Systems Theory, McGraw-Hill, New York, 1967.
56. Everling W., On the evalution of eAT by power series, Proc. IEEE, 55, 3,
p. 413 A967).
Литература 631
57. Farison J. В., Fu F.-C, The matrix properties of minimum-time discrete
linear regulator control, IEEE Trans. Autom. Control, 15, 3, pp. 390—391
A970).
58. Fath A. F., Evalution of a matrix polinomial, IEEE Trans. Autom.
Control, 13,2, pp. 220—221 A968).
59. Fath A. F., Computational aspects of the linear optimal regulator problem,
IEEE Trans. Autom.. Control., 14,, 5, pp. 547—550 A969).
60. Fleming W. H., Controlled diffusions under polynomial growth conditions,
in Control Theory and the Calculus of Variations, A. V. Balakrishnan, Ed.,
pp. 209—234, Academic Press, New York, 1969.
61. Forsylhe G. E., Strauss L. W., The Souriau-Frame characteristic equation
algorithm on a digital computer,/. Math, Phys.,%1, pp. 152—156 A955).
62. Fossard A., On a method for simplifying linear dynamic systems, IEEE
Trans. Autom. Control.,5, 2, pp. 261—262 A970).
63. Frame J. S., Matrix functions and applications, Part IV, Spectrum, 1,
6, pp. 123—131 A964).
64. Freeman EL, Discrete-Time Systems, Wiley, New York, A965).
65. Freested W. C, Webber R. F., Bass R.W., The GASP computer program—
An integrated tool for optimal control and filter design, Preprints, 1968
Joint Automatic Control Conference, pp. 198—202, University of Michigan,
Ann. Arbor, Mich., June 26—28, 1968.
66. Гальперин Е. А., Красовский Н.Н., О стабилизации установившихся
движений в нелинейных системах управления, ПММ, т. 27, вып. 6
A963).
67. Гихман И. И., Скороход А. В., Введение в теорию случайных процес-
процессов, М., изд-во «Наука», М., 1965.
68. Gunckel Т. L., Franklin G. F., A general solution for linear, sampled-
data control, /. Basic Eng., Trans. ASME, Ser. D., 85, pp. 197—203 A963).
69. Hagander P., Numerical solution of A?S + SA -+• Q = 0, Informati-
Information Sci., 4, pp. 35—50 A972).
70. Haley P.H., Design of low-order feedback controllers for linear multiya-
riable systems, Report CCS-10, Department of Engineering-Economic
Systems, Stanford University, Stanford, Calif., 1967.
71. Hendricks T. C, Haynes G. W., The «GASP» Computer Program, Confe-
Conference Record. Second Asilomar Conference on Circuits and Systems, Pa-
Pacific Grove, Calif, 1968.
72. Heymann M., Comments on pol& assignment in multi-input controllable
linear systems, IEEE Trans. Autom. Control, 13, 6, pp. 748—749 A968).
73. Hida Т., Stationary Stochastic Processes, Mathematical Notes, Princeton
University Press, Princeton, N. J., 1970.
74. Горовец И., Синтез систем с обратной связью; М., изд-во «Советское ра-
радио», 1970.
75. Hsu С.-Н., Chen С.-Т., A proof of the stability of multivariable feedback
systems, Proc. IEEE, 56, 11, pp. 2061—2062 A968).
76. IEEE Standards Committee, ,,IEEE recommended practice: Rules for
the use of units of the international system of units", adopted December 3,
1970, reprinted in Spectrum, 8, 3, pp. 77—78 A971).
632 Литература
77. International Organization for Standardization (various dates from 1958
to 1965), Recommendations, IS0/R31, Parts I—V, VII and XI.
78. Jameson A., Solution of the equation AX -\- XB = С by inversion of an
m X m or n X n matrix, SI AM J. Appl. Math., 16, 5, pp. 1020—1023
¦ A968).
79. Jazwinski A. H., Stochastic Processes and Filtering Theory, Academic
Press, New York, 1970.
80. Johnson G. D., A unified canonical form for controllable and uncontrollab-
uncontrollable linear dynamical systems, Intern. J. Control, 18, 3, pp. 497—518 A971).
81. Johnson C. D., Accommodation of. external disturbances in linear regula-
regulator and servomechanism problems, IEEE Trans. Autom. Control, 16, 6(
pp. 635—644 A971). "
82. Johnson С. D., Wonham W. W., Another note on the transformation to
canonical (phase-variable) form, IEEE Trans. Autom. Control, 11, 3,
pp. 609-610 A966).
83. Johnson G. W., A deterministic theory of estimation and control, IEEE
Trans. Autom. Control, 14, 4, pp. 380—384 A969).
84. Johnson T. L., Athans M., On the design of optimal constrained dynamic
compensators for linear constant systems, IEEE Trans. Autom. Control,
15, 6, pp. 658-660 A970)..
85. Kailath Т., An innovations approach to least-squares estimation — Part
I: Linear filtering in additive white noise, IEEE Trans. Autom. Control,
13, 6, pp. 646—654 A968).
86. Kalman R. E., Contributions to the theory of optimal control, Bol. Soc.
Mat. Mexicana, 5, pp. 102—119 A960).
"87. Kalmaa R. E., When is a linear control system optimal? /. Basic. Eng.t
Trans: ASME, Ser. D, 86, pp. 51—60 A964).
88. Kalman R. E., Toward a theory of difficulty of computation in optimal
control, Proc. Fourth IBM Scientific Computing Symposium, 1966, pp. 25—
43.
89. Kalman R. E., Bertram J. E., Control system analysis and design via the
„Second method of Lyapunov", I. Continuous-time systems, /. Basic
Eng, Trans. ASME, Ser. D, 82, pp. 371—393 A960).
90. Kalman R. E., Bucy R. S., New results in linear filtering and-prediction
theory", /. Basic Eng., Trans. ASME, Ser. D, 88, pp. 95—108 A961);
русский перевод: Калман Р. Е., Бьюси Р- С, Новые результаты в теории
линейной фильтрации и упреждения, Труды американского общества
инженеров-механиков, серия Д, № 1 A961).
91. Kalman R. E., Englar Т. S., Auser's manual for the automatic synthesis
program, NASA Report CR-475, 1966.
92. Kalman R. E., Falb P. L., Arbib M., Topics in Mathematical System Theo-
Theory, McGraw-Hill, New York, 1969; русский перевод: Калман Р.,
Фалб П., Арбиб М., Очерки по математической теории систем, М., изд-во
«Мир», 1971.
93. Kalman R. E., Koepcke R. W., Optimal synthesis of linear sampling cont-;
rol systems using generalized performance indexes, Trans. ASME, Ser.
D, 80, pp. 1820—1826 A958).
94. Kleinman D. L., On an
on, IEEE Trans. Auto
iterative technique for Riccati equation computati-
computation. Control, 13, 1, pp. 114—115 A968).
Литература 633
95. Kleinman D. L., An iterative technique for Riccati equation computations,
Technical Memorandum, Bolt, Beranek, and Newman, June 30, 1970.
96. Kleinman D. L., An easy to way to stabilize a linear constant system,
IEEE Trans. Autom. Control, 15, 6, p. 692 A970).
97. Kreindler E., On the definition and application of the sensitivity function,
/. Franklin Inst., 285, 1, pp. 26—36 A968).
98. Kreindler E., Closed-loop sensitivity reduction of linear optimal control
systems, IEEE Trans. Autom. Control, 18, 3, pp. 245—262 A968).
99. Kreindler E., Sensitivity of time-varying linear optimal control systems,
/. Optimal Theory Appl., 3, 2, pp. 98—106 A969).
100. Krouse C. L., Ward E. D., Improved linear system simulation by matrix
exponentiation with generalized order hold, Preprints, 11th Joint Automa-
Automatic Control Conference, pp. 794—802, Georgia Institute of Technology,
Atlanta, Georgia, June 22—26, 1970.
101. Kupperajulu A.,' Elangovan S., System analysis by simplified methods,
IEEE Trans. Autom. Control, 15, 2, pp. 234—237 A970).
102. Купшер Г. Д., Стохастическая устойчивость и управление, М., изд-во
«Мир», 1969.
103. Kushner H. J., Introduction to Stochastic Control, Holt, Rinehart and
Winston, New York, 1971-
104. Kwakernaak H., Optimal low-sensitivity linear feedback systems, Automa-
tica, 5, 3, pp. 279—286 A969).
105. Kwakernaak H., Siyan R., Linear stochastic optimal controllers of fixed
dimension, Proc. Fifth Annual Princeton Conference on Information Sci-
Sciences and Systems, Princeton, N. J., March 25—26, 1971.
106. Kwakernaak H., Sivan R., The maximally achievable accuracy of linear
optimal regulators and linear optimal filters, IEEE Trans,- Autom. Cont-
Control, 17, 1, pp. 79—86 A972).
107. Leake R. J., Return difference Bode diagram for optimal system design,
IEEE Trans. Autom. Control, 10, 3, pp. 342—344 A965).
108. Летов А. М., Аналитическое конструирование регуляторов, 1., Автома-
Автоматика и телемеханика, т. 21, № 4 A960).
109. Levis A. H., Some computational aspects of the matrix exponential, IEEE
Trans. Autom. Control, 14,4, pp. 410—411 A969). 3j
110. Levy S., Sivan R., On the stability of a zero-output system, IEEE Trans.
Autom. Control, 11, 2, pp. 315—316 A966).
111. Liou M. L., A novel method of evaluating transient response, Proc.
IEEE, 54, 1, pp. 20—23 A966)
112. Liou M. L., Steady-state response of linear time-invariant systems, Proc.
IEEE, 54, 12, pp. 1952—1953 A966).
113. Liou M. L., Response of linear time-invariant systems due to periodic
inputs, Proc. IEEE, 55, 2 pp. 242—243 A967).
114. Liou M. L., Evaluation of state transition matrix and related topics,
Conference Record Second Asilomar Conference on Circuits and Systems,
Pacific Grove, Calif., Oct. 30—Nov. 1, 1968.
115. Lu C. S., Solution of the matrix equation AX -f XB = C, Electron.
Letters, 7, 8, pp. 185—186 A971).
634 Литература
116. Luenberger D. G., Observing the state of a linear system, IEEE Trans.
Mil. Electron., 8, pp. 74—80 A964),
117. Luenberger D. G., Observers for multivariable systems, IEEE Trans.
Autom. Control, 11, 2, pp. 190 — 197 A966).
IIS. Luenberger D. G., Canonical forms for linear multivariable systems, IEEE
Trans. Autom. Control., 12, 3, pp. 290—293 A967).
119. Lukes D. L., Stabilizability and optimal control, Funkcialaj Ekracioi,
11, pp. 39—50 A988).
120. McClamroch N. H., Duality and bounds for the matrix Riccati equation,
/. Math. Anal. Appl., 25, pp. 622—627.A969).
121. MacFarlane A. G. J., The calculation of functionals of the time and fre-
frequency response of a linear constant coefficient dynamical system, Quart.
J. Mech. Appl. Math., 15, Pt. 2., pp. 259—271 A963).
122. Man F. Т., Smith H. W., Design of linear regulators optimal for time-mul-
time-multiplied performance indices, IEEE Trans. Autom. Control, 14, 5, pp. 527—
529 A969).
123. Martensson K., On the matrix Riccati equation, Information Sci., 3, pp.
17-49 A971).
124. Mastascusa E. J., Simes J. G., A method for digital calculation of linear
system response, Preprints, 11th Joint Automatic Control Conference, pp.
788—793, Georgia Inst. of Technology, Atlanta, Georgia, June 22—26,
1970.
125. Meditch J. S., Stochastic Optimal Linear Estimation and Control, McGraw
-Hill, New York, 1969; русский перевод: Медич Дж., Статистически опти-
оптимальные линейные оценки и управление, изд-во «Энергия», М., 1973.
126. Mehra R. К., Digital simulation of multi-dimensional Gauss-Markov
random processes, IEEE Trans. Autom. Control., 14, 1, pp. 112 —
113 A969).
127. Melsa J. L., Computer Programs for Computational Assistance in the Stu-
Study of Linear Control Theory, McGraw-Hill, New York, 1970.
128. Mitra D., The equivalence and reduction of linear dynamical systems,
Ph. D. thesis, University of London, 1967.
129. Moore J. В., Anderson B. D. O., Extensions of quadratic minimization
theory. I. Finite-time results, Intern. J. Control, 7, 5, pp. 465—472 A968).
130. Muller P. Chr., Solution of the matrix equation AX + XB = —Q and
STX -f XS = —<?, SIAM J. Appl. Math., 18, 3, 682^687 A970).
131.-Newell R. В., Fisher D. G., Optimal multivariable computer corilrol of a
pilot plant evaporator, Preprints, Third International Conference on Digi-
Digital Computer Applications to Process Control, Helsinki, June 2—5, 1971.
132. Newton G. C, Gould L. A., Kaiser J. F., Analytical Designs of Linear
Feedback Controls, Wiley, New York, 1957; русский перевод: Ньютон
Дж. К., Гулд Л. А., Кайзер Ф., Теория линейных следящих систем,
М., Физматгиз, 1961.
133. Noble В., Applied Linear Algebra, Prentice-Hall, Englewood Cliffs, N. J.,
1969.
134. O'Donnell J. J., Asymptotic solution of the matrix Riccati equation of
optimal control, Proc. Fourth Allerton Conference on Circuit and Sys-
Systems Theory, pp. 577—586, University of Illinois, Urbana, 111., Oct.
5-7, 1966.
Литература ¦ 635
135. Pearson J. В., A note on the stability of a class of optimum sampled-
|f data systems, IEEE .Trans. Autom. Control, 10, 1, pp. 117—118 A965).
136. Pierre D. A., Optimization Theory with. Applications, Wiley, New Yorkt
1969.
137. Plant J. В., On the computation of transition matrices for time-invariant
systems", Proc. IEEE, 57, 8, pp. 1397—1398 A969).
138. Plotkin M., Matrix theorem with applications related to multi-variable
control systems, IEEE Trans. Autom. Control, 9, 1, pp. 120—121 A964).
139. Polak E., Wong E., Notes for a First Course on Linear Systems, Van Nost-
rand Reinhold, New York, 1970.
140. Porter В., Optimal control of multivariable linear systems incorporating
integral feedback, Electron. Letters, 7, 8, pp. 170—172 A971).
141. potter J. E., Matrix quadratic solutions, SIAM J. Appl. Math., 14, 3|
pp. 496-501 A964).
142. potter J. E., Van der Velde W. E., On the existence of stabilizing compen-
compensation, IEEE Trans. Autom. Control, 14, 1, pp. 97—98 A969).
143. Power H. M., A note on the matrix equation A'LA— L — —K, IEEE
Trans. Autom. Control, 14, 4, pp. 411—412 A969).
144. Power H. M., Porter В., Necessary conditions for controllability of multi-
variable systems incorporating integral feedback, Electron. Letters, 6, 25,
pp. 815-816 A970).
145. Ramaswami В., Ramar K., Transformation to the phase-variable canoni-
canonical form", IEEE Trans. Autom. Control., 18, 6, pp. 746—747 A968).
146. Rane D. S., A simplified transformation to (phase-variable) canonical
form, IEEE Trans. Autom. Control, 11, 3, p. 608 A966).
147. Rappaport D., Silverman L. M., Structure and stability of discrete-time
optimal systems, IEEE Tran». Autom. Control, 16, 3, pp. 227—233 A971).
148. Rohrer R. A., Circuit Theory: An Introduction to the State Variable Ap-
Approach, McGraw-Hill, New York, 1970,
149. Rome H. J., A direct solution to the linear variance equation of a time-
invariant system, IEEE Trans. Autom. Control, 14, 5, pp. 592—593 A969).
150. Roseau M., Vihrations non lineaires et theorie de la stabilite, Springer-
Verlag, Berlin, 1966.
151. Rosenau G., Hohere Wurzelortskurven bei Mehrgrossensystemen, Prep-
Preprints, IFAC Symposium on Multivariable Systems, DQsseldorf, Oct. 7—8,
1968.
152. Rothschild D., Jameson A., Comparison of four numerical algorithms for
solving the Liapunov matrix equation, Intern, J. Control, 11, 2, pp. 181 —
198 A970).
153. Sage A. P., Eisenberg B. R., Closed loop optimization of fixed configura-
configuration systems, Intern. J. Control, 3, 2, pp. 183—194 A966).
154. Sain M. K., On the control applications of a determinant equality related
to eigenvalue computation, IEEE Trans. Autom. Control, 11,1, pp. 109—
111 A966).
155. Sannuti P., Kokotovi6 P. V., Near-optimum design of linear systems by a
singular perturbation method, IEEE Trans. Autom. Control, 14, 1, pp. 15—
22 A969).
636 Литература
156. Saucedo R., Schiring E. E., Introduction to Continuous and Digital
Control Systems, Macmillan, New York, 1968.
157. Schultz D. G.,Melsa J. L., State Functions and Linear Control Systems,
McGraw-Hill, New York, 1967.
158. Schumitzky A., On the equivalence between matrix Riccati equations,
and Fredholm resolvents, /. Сотр. Systems Sci., 2, pp. 76—87 A968).
159. Schwarz R. J., Friedland В., Linear Systems, McGraw-Hill, New York,
1965.
160. Soifert W. W., Steeg С W., Ed., Control Systems Engineering, McGraw-
Hill, New York, I960.
161. Shih Y.-P., Integral action in the optimal control of linear systems with
quadratic performance index, Ind. Eng. Chem. Fundamentals, 9, 1, pp.
35—37 A970). ,
162. Sims C. S., Melsa J. L., A fixed configuration approach to the stochastic
linear regulator problem, Preprints, 11th Joint Automatic Control Confe-
Conference, Atlanta, Georgia, pp. 706—712, 1970.
163. Sivan R., On zeroing the output and maintaining it zero, IEEE Trans.
Autom: Control, 10, 2,. pp. 193—194 A965).
164. Smith P. G., Numerical solution of the matrix equation AX + XAT -+-
-f В = 0, IEEE Trans. Autom. Control, 16, 3, pp. 278—279 A971).
165. Smith R. A., Matrix eguation XA -ф- BX ¦= C, SlAM J. Appl. Math.,
16, 1, pp. 198—201 A968).
166. Sorenson H. W., Least-squares estimation: From Gauss to Kalman,
Spectrum, 7, 7, pp. 63—68 A970).
167. Tou J. S., Modern Control Theory, McGraw-Hill, New York, 1964; рус-
русский перевод: Ту Ю., Современная теория управления, М., изд-во
«Машиностроение», 1971.
168. Tse E., Athans M., Optimal minimal-order observer-estimators for dis-
discrete lineat time-varying systems, IEEE Trans. Autom. Control, 15, 4,
pp. 416-426 A970).
169. Tuel W. G., Jr., On the transformation to (phasevariable) canonical
form, IEEE Trans. Autom. Control., tl, 3, p. 607 A966).
170. Van Ness J. E., Inverse iteration method for finding eigenvectors, IEEE
Trans. Autom. Control, 14, 1, pp. 63—66 A969).
171. Vaughan D. R., A negative exponential solution for the matrix Riccati
equation, IEEE Trans. Autom. Control, 14, 1, pp. 72—75 A969).
172. Vaughan D. R.,A nonrecursive algebraic solution for the discrete Riccati
equation, IEEE Trans. Autom. Control, 15, 5, pp. 597—599 A970).
173. Wallacb. Y., On the numerical solution of state equations, IEEE Trans.
Autom. Control, 14, 4, pp. 408—409 A969).
174. Walter О. Н. D., Eigenvector scaling in a solution of the matrix Riccati
equation, IEEE Trans Autom. Control, 15, 4, pp. 486—487 A970).
175. Weinberg L., Network Analysis and Synthesis, McGraw-Hill, New York,
1962.
176. Westcott J. H., The development of relationships concerning the frequen-
frequency bandwidth and the mean square error of servo systems from properties
of gain-frequency characteristics, in Automatic and Manual Control, A.
Tustin, Ed., Butterworths, London, 1952.
Литература - 637
177. Whitney D. E., Propagated error'bounds for numerical solution of transi-
transient response, Proc. IEEE, 54, 8, pp. 1084—1085 A966).
178. Whitney D. E., Forced response evaluation by matrix exponential, Proc.
IEEE, 54, 8, pp. 1089-1090 A966).
179. Whitney D. E., Propagation and control of roundoff error in the matrix
exponential method, Proc. IEEE, 54, 10, pp. 1483—1484 A966).
180. Wolovich W. A., On the stabilization of controllable systems, IEEE Trans.
Autom. Control, 13, 5, pp. 569—572 A968).
181. Wolovich W. A., Falb P. L., On the structure of multivariable systems,
SI AM J. Control, 7, 3, pp. 437—451 A969).
182. Wonham W. M., Stochastic problems in optimal control, 1963 IEEE Con-
mention Record, Part 2, pp. 114—124 A963).
183. Wonham W. M., On pole assignment in multi-input controllable linear
systems, IEEE Trans. Autom. Control, 12, pp. 660—665 A967).
184. Wojiham W. M., On matrix quadratic equations and matrix Riccati equa-
equations, Report, Center i'or Dynamical Studies, Brown University, Provi-
Providence, R. I., 1967.
185. Wonham W. M., On a matrix Riccati equation of stochastic control,
SIAM J. Control, 6, 4, pp. 681-697 A968).
186. Wonham W. M., On the separation theorem of stochastic control, SIAM
J. Control, 6, 2, pp. 312-326 A968).
187. Wonham W. M., Dynamic observers—Geometric theory, IEEE Trans.
Autom. Control, 15, 2, pp. 258—259 A970).
188. Wonham W. M., Random differential equations in control theory, in
Probabilistic Methods in Applied Mathematics, A. T. Barucha-Reid.Ed.,
pp. 131—212, Academic Press, New York, 1970.
189. Wonham W. M., Cashman W. F., A computational approach to optimal
control of stochastic stationary systems, Preprints, Ninth Joint Automatic
Control Conference, pp. 13—33, University oi Michigan, Ann Arbor, Mich.,
June 26—28, 1968.
190. Zadeh L. A., Desoer С A., Linear System Theory: The State Space App-
Approach, McGraw-Hill, New York, 1963; русский перевод: Заде Л., Де-
эоер Ч., Теория линейных систем. Метод пространства состояний, М.,
. изд-во «Наука», 1970. ¦
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Амплидин, описание 137—138
— регулирование 367
— — с пропорциональной обрат-
обратной связью 139
— регулятор при ненулевой задан-
заданной точке 369 ,
Анализ переходных процессов сис-
систем уцравления см. Следящих
систем свойства
Анализ посредством преобразования
Лапласа 47—69
— — — — дискретных систем
519—522
Анализ установившегося состояния
систем управления см. Следящих
систем свойства
Апериодическая реакция выходной
переменной 557, 582, 585
— — состояния 557, 610
Апериодические наблюдатели 597
Баттерворса передаточная функция
345
— полином 345
— размещение полюсов 325
Белый шум 118—122
— — воздействие на линейнункдис-
кретную систему 535—538
— — — — — дифференциальную
систему 118—136
— — гауссовский 535
— — — дискретный 535
— — дискретный 535
— — интенсивность 118
— — правила интегрирования 119
Боде функция 212
Броуновское движение 121
Взаимовлияние 185
Винер 414
Винера — Леви процесс 110
Винера процесс 110
Возвратной разности матрица 60, 217
— — — асимптотическая 485
Возмущающая переменная 145, 153,
542
Возмущения постоянные, влияние
их в системах управления 196—
204, 215-217, 219
— — _____ дискретных
554-555
— — эквивалентные в управляемой
переменной 200; также см. Пос-
Постоянные возмущения
Восстанавливаемости каноническая
форма 92
— — — дискретные системы 529
— матрица 86
— — дискретные системы 527
Восстанавливаемость 83—99
— дискретные системы 527—530
— линейные системы с переменными
параметрами 98—99
— — — — постоянными парамет-
параметрами 85—88
— пары {А, С) 87
— полная 83
— равномерно полная 99
— — — дискретные системы 528
Восстановление состояния 378—389
— — дискретные системы 592—607
— — — — формулировка задачи
593-595
— — оптимальное см. Задача по-
построения наблюдателя
Время установления 167, 194
— — граница 194
— — дискретный случай 550
Входная переменная 14, 145, 542
— —• амплитуда в задачах регули-
регулирования 234
— — динамический диапазон 176
— — интегральная квадратическая
237
— — смещенная 313
— — среднее значение квадрата 156
— — — — — вычисление 157, 177
— — — — — установившееся 168
¦— — среднеквадратическое (с. к.)
значение 156
Выходная переменная 14
Выходной переменной уравнение 14
— — — в дискретных системах 507
Вычислительные аспекты линейного
Предметный указатель
639
оптимальною управления 499—501
Вычислительные программы для
линейпого оптимального управ-
управления 501
Годограф квадратичный корневой 327
Датчик 143
Дискретные системы 506
— — теория линейного оптималь-
оптимального управления 506—627
Дискретный эквивалент непрерыв-
непрерывной системы 509
Дуальность задач построения опти-
оптимальных регулятора и наблюда-
наблюдателя 418—419
— — — — — — — дискретных
605-607
— систем 99—101
дискретных 530—531
Жордапова нормальная форма 31—34
Заданная точка 148, 168, 313
— — ненулевая в регуляторах с
обратной связью по состоянию 313—
318
дис-
дискретный случай 573—576
-, — — — — — — — — — ВЫ-
ВЫХОДНОЙ переменной 470—473, 478
дискретный случай 616—619
Задача построения наблюдателя вы-
вырожденная с постоянными пара-
параметрами 405—409
— — — невырожденная при шумах
коррелированных 403—405
— — — — — — некоррелирован-
некоррелированных 392—398
— — — оптимальная 391
— — — — дискретная 599—603
— — — — — альтернативный ва-
вариант 624—625
— — — — при цветном шуме 409—'
.410 .
Задача построения регулятора 148
— — — выбор весовых матриц 237
— — — детерминированная линей-
линейная оптимальная 234—256, 236
дискретный слу-
случай 558—562, 559
— — — — с постоянными
параметрами 447—461
— — — — дис-
дискретный случай 611—612
— — — оптимальная, гибридный
непрерывно-дискретный регуля-
регулятор 623—624
— — — — линейная стохастичес-
ная 293—296, 300—308, 356
— — — — — — дискретный слу-
случай 570—572
— — — — — с обратной связью
по выходной переменной 447—
461
дискретный случай 611—612
— — — — решение 241—246
— — — — — в частотной области
374—375
— — — — — методом диатонали-
зации 282—287
— — — — — установившееся 256
—287
— — — — — — свойства 305—307
— — — при возмущениях 293—
296, 303—305
— — — — — дискретный случай
620-621
— — — существование решения 255
— —• — — — оптимального 369—
370
— — — — — — дискретный слу-
случай 620
— — — уравнения в вариациях 244
Задача построения регулятора с
обратной связью по выходной
переменной 434, 489
, оп-
оптимальная стохастическая линей-
линейная 446—448
— дискретный случай 611—612
Задача сглаживания оптимальная
415
Закон управления 225—234
— — асимптотические свойства, оп-
оптимальный 325—359
дискретный 578—
585
— — асимптотически устойчивый
226
— — линейный 226
— — оптимальный при ненулевой
заданной точке 316, 470
— — — — — — — дискретный
574, 616
— — — с нулевой установившейся
ошибкой 447
640 Предметный указатель
— — — — — — — дискретный
576, 617
— — — установившийся 257, 269
— —г — — дискретный 564
— — — — с постоянной настрой-
настройкой 276, 282
— — соединение с наблюдателем
434-438 . ¦
— — устойчивость оптимального ус-
установившегося 256, 269
— — — — — дискретного 565
— — — — с постоянной настрой-
настройкой 276
Запаздывание при обработке данных
542, 593
Импульсный элемент 508
Интегральное состояние 321
— — для дискретных регуляторов
~ 576
Интегральное управление в регуля-
регуляторах с обратной связью по выход-
выходной переменной 475—478
. дискретных 617
— — — — — — — — состоянию
320-325
- дис-
дискретных 576
Интегрирующее действие регулятора
201, 212, 222—223, 320, 478
Калмана — Бьюси фильтр 329, 396,
см. также Наблюдатель оптималь-
оптимальный
Каноническая форма фазовой пере-
переменной 101—104
— — — —¦ дискретные системы
531—532
— — — — дуальной 104
— — — — —¦ дискретные системы
532
Квадратические выражения для
стохастических процессов 115—
117
— — интегральные 131—135
— суммы для дискретных стохасти-
стохастических процессов 537—538
Квантования момент 508
— период дискретности 511
— скорость повторения 511
Ковариационная матрица см. Сто-
Стохастические процессы
Корневые годографы квадратичные
327
— — полюсов оптимального наблю-
наблюдателя 423—425
— — — — регулятора 325—335
— — — — — дискретный случай
580, 583—585, 622
Коэффициентов усиления матрица
наблюдателя 382
— — — регулятора 226
Кэли — Гамильтона теорема 103
Лапласа преобразование 47
Леверье алгоритм 49, 291, 520
Линеаризация 14—16, 45—47
Ляпунова уравнение 126V 134, 291
— — численное решение 127
Марковский процесс 141
Матрица спектральных плотностей
см. Стохастические процессы
Матрицы неотрицательная опре-
определенность 107, 111
— нильпотентность 556
— след 116
Механизм для намотки проволоки
272-274
Мода 29, 34
Моделирование линейных систем 26
Момент наблюдения 593
— управления 5f>S
Наблюдаемая переменная 145, 153,
377, 542
Наблюдаемость полная 83, ем. так-
также Восстанавливаемость
Наблюдатель, определение априор-
априорных данных для вырожденной за*
дачи 432
— оптимальный 389—417
— — дискретный 599—603
— — с постоянными параметрами,
асимптотические свойства 423—427 •
— — установившийся 397, 419—421
свойства 357, 420—422
— — — — дискретный случай
606—607
— полного порядка 379
— дискретный случай 595
— полюсы 382
— пониженной размерности 379,
385—387
— — — дискретный случай 598
— размещение полюсов 382, 384
— — — дискретный случай 597
— — — пониженной размерности
387
Предметный указатель
641
— соединение с законом управления *
434—439
— — — — — дискретный случай
608—610
— стабилизация 384—385
— — дискретный случай 597
— устойчивость 381—382
— — дискретные случай 597
Низкочастотные процессы стохасти-
стохастические 174
— системы 172
Номинальная входная переменная 15
— передаточная функция объекта 209
— траектория 15
Номинальное решение S7
Нули в правой полуплоскости 347,
355—356
— влияние на чувствительность,
правая полуплоскость 463—464
— — — — — — в системах с
обратной свиаью по выходной пе-
переменной 486
— вне единичного круга 585
— компенсация в разомкнутой сис-
системе 334, 336
— передаточной функции 54
— матричной 54—57
— разомкнутый контур 67
— систем 54—57, 56
— — дискретный случай 521
Нуль-пространство 31
Нуль системы в правой полуплос-
полуплоскости 349—352, 357—359
Обнаруживаемость 95—98
— дискретных систем 530
— пары (А, СУ 96
Обновления процесс 414—417
— — дискретный 605
Обратная связь 58
_— — в регуляторе/ 305
— — достоинства 144
Обратная связь по состоянию 225—
376
— — — — дискретные системы
555—592
— — — — для улучшения дина-
динамических свойств 225—234
— — — ,— — — — — дискретные
системы 556—558
— — — — оптимальная см. За-
Задача построения регулятора'
Объект 143, 152-153
— динамический диапазон 176
Оценивание константы 398—400
Оцепиватель линейный с минималь-
минимальным средним значением квадрата
ошибки 396, 602
Ошибка восстановления 381, 390
— — среднее значение квадрата 390
Ошибка регулирования интеграль-
интегральная квадратическая 237
Ошибка слежения 156
— — среднее значение квадрата .
156-158, 177
— — —¦ — — вычисление 157—158
— — среднеквадратическая (с.к.о.)
156
Ошибка терминальная взвешенная
квадратическая 237
Перевернутый маятник, восстанав-
восстанавливаемость 85, 87—88
— — — каноническая форма 94—95
моды 29—31
— — —. без трения 35—36
— — наблюдатель системы 429—430
— — обнаруживаемость 98
— — описание 16—19
— — подпростракства устойчивых и
неустойчивых состояний 44—45
— — — — — — — без трения 45
— — стабилизируемость посредст-
посредством обратной связи по выходной
переменной 441—445
— — — — — — — состоянию
165—166, 227-228
— — управление с пропорциональ-
пропорциональной обратной связью 63—65
— — управляемость 73—74
Переходная матрица 24
— — дискретный случай • 516
— — системы с постоянными пара-
параметрами 26—27
Период переходный 167
— установившийся 167
Подпространство восстанавливаемых
сестояний 94
— невосстанавливаемых состояний
88-95
— — — дискретных систем 528—
529
— неуправляемых состояний 78
— неустойчивых состояний 43
— — — дискретных систем 519
— управляемых состояний 74—78,
140
— — — дискретных систем 525—
526 •
— инвариантность 74
— устойчивых состояний 43
— — — дискретных систем 519
642 Предметный указатель
Полином характеристический, сие- —устойчивые 42
тема замкнутая 61, 317 — — дискретных систем 527
— — — разомкнутая 317. ¦ Постоянные возмущения, влияние в
Полоса пропускания нормированная системах управления 200—202,
' дискретного стохастического про- 223—-224 ,
цесса 547 • — — подавление в регуляторах
— — — дискретной системы управ- 320—325
ления 548 . — — — — — дискретных 575
— — системы управления 172 — — — — системах управления с
— — стохастического процесса 174 обратной связью по выходной пе-
Полоса частот i»ro звена 184 ременной 475—478
— — нормированная дискретного — — — — — — — — — — —
стохастического процесса 547 — дискретных 616
— — — i-го звена Дискретной си- Предварительный фильтр 473
стемы управления 548 Преобразование состояния 23, 139,
— — системы управления 172 140, 141
— — стохастического процесса 173 Преобразователь величины дискрет-
Полюсы, асимптотическое поведение, ной в непрерывную 508
замкнутый регулятор 325—335 — — непрерывной в дискретную 508
— — — — — дискретный случай Принцип проектирования основной
580-585 156, -543
— — — в наблюдателе 423—427 Прямая связь 14
— близко расположенные 334 — — в дискретных системах 510,
— восстанавливаемости 93 594
— — дискретные системы 527 — — — регуляторе 305
— замкнутого контура 67 Прямая сумма 32
— матричной передаточной функции
50
— наблюдателя 382, 438, 609 Равновесия состояние 37
— невосстанавливаемости 93 Развязывание 185
— — дискретные системы 530 — статическое 185
— неуправляемости 78 Размерность линейной оистемы 14
— — дискретные системы 527 Разностная функция 184, 191—192
— неустойчивые 42 Расширение пространства состояний,
— поведение в замкнутом регуля- метод 58—60
торе 325—335 Рауса — Гурвица критерий 42
дискретный случай Регулятор 143, 147
578—585 — замкнутый 147—148, 152 — 156,
— размещение в наблюдателях 382, 542
384—385 — разомкнутый 147, 152, 542
— — — — дискретных 597 Регулятор с обратной связью по
— — — регуляторах 226, 229—232 выходной переменной
— — — — дискретных 556—557 — — — — — — — оптимальный
— — — системах с обратной связью 447—448
по выходной переменной 445—446 — ___ — _^ — — дис-
— — — — — — —' — — — дис- кретный 611—612
кретных 609 — — — — ___ — оценка
— разомкнутого контура 67 характеристик 450—456
— расстояние до начала координат, — — — — — — — — — — дис-
замкнутый регулятор 329, 333—335 кретный 612—616
— — — — — — логарифмические Регуляторы, асимптотические свой-
частотные характеристики 376 • ства при ненулевой заданной точке
— регулятора 438, 609 343—349
— системы 29, 50 — — — — — — — дискретный
— удаленные 329, 333 случай 582—583
— управляемости 78 — — — оптимальных регуляторов
— — дискретных систем 527 325—357
Предметный указатель
643
— — — — — дискретный случаи
578—585
— ненулевая заданная точка 313—
319
— — — — дискретный случай
573—575
— оптимальные, установившиеся
свойства 267—282
— — чувствительвость 359—364
— — — дискретный случай 590
— —полюсы, размещение 226, 229 —
232
— — — дискретный случай 556—
557
— — — оптимальных регуляторов
с постоянными параметрами 286,
326-328, 330
— — — — — ___ дискрет-
дискретный случай 568, 578—579, 582—
583
— при неполных измерениях 434—
446
— — — — дискретный случай 608—
610
— — — и неточных измерениях
446—449
— — — — — — дискретный слу-
случай 611—614
Регуляторы пониженной размернос-
размерности с обратной связью по выходной
переменной 490—499
-— ди-
дискретные 626
Режимы скрытые в оптимальных ре-
регуляторах 356
Резольвента 48
Риккати уравнение 251
— — алгебраическое 257, 274, 282,
370-371
— — — решение 250—255
вывод 250—255
— — дискретный эквивалент 562
— — наблюдателя 357—397, 420—
421, 431—432
— — отрицательное экспоненциаль-
экспоненциальное решение 373
— — существование решения 255
— — численное решение 287—293
— — — — диагонализацией 289—
291
— — — — интегрированием чис-
численным 287—288
— — — — методом Калмана —
Энглара 288—289
— — — — — Ньютона — Раф-
сона 291—293
— — установившееся решение 257,
267—271
— — — — с постоянными пара-
параметрами 275—276
Риккати уравнение для наблюдателя
395-398
— — — — алгебраическое 397,
422
— — — — решение 431—432
— — — — — асимптотическое по-
поведение 425—427
— — — — — установившееся 397,
420—422
Самолет, управление продольным
движением 339—343
— — — — асиптотическое пове-
поведение 357
— — углом тангажа 336—339
— — — — при ненулевой заданной
точке 348
Сберегательной кассы счет 507
Система автономная 36
— дифференциальная 14
Система отопления 143—144
Система следящая оптимальная ли-
линейная с неполными и неточными
измерениями 462—465
— — — стохастическая 297—299
— — — — дискретный случай
570—572
Система управления положением, ин-
интегральное управление 323 — 324
— — — — — с обратной связью по
выходной переменной 478—480
— — — как задача регулирования
239-241
¦— — — — — — двигателя пос-
постоянного тока без трения 366—367
— — — — — — стохастическая
368-460
— — — — — — — с обратной
связью по выходной переменной
456—460
— — — — — слежения с обрат-
•ной связью по выходной перемен-
переменной 466—470
¦— — — — — управления с об-
обратной связью по выходной пере-
переменной 439—441
— — — наблюдатель 382—384
— — — — оптимальный 400—403
— — — — — асимптотические
свойства 427—428
— — — — при цветном шуме
410—414
644 Предметный указатель
— — — пониженной размерности
наблюдатель 387—389
— — — — — регулятор 497—499
— — — стабилизация 366.
— — — терминальное управление
152
— — — управления закон при не- >
нулевой заданной точке 318
-^ — — — ..— с обратной овязью по
выходной переменной 473—475
— — — установившееся решение
задачи регулирования 259^-262
— — — чувствительность опти-
оптимальных регуляторов 364—365
— — — — — систем управления с
обратной связью по выходной пе-
переменной 486—489
Система управления положением как
позиционная следящая система,
влияние возмущений 202—204
— — — — — — — — шума на-
наблюдений 206—208
— — — — — — измене-
изменений параметров 212—214
— — — — — — — время уста-
установления ошибки слежения 195—
196
—- — — — — — — описание 148
— с обратной связью
по положению 161—162
— и скорости 160—161
— — — — — — — — про-
пропорциональной 159—160
устойчивость 163—165
— — — — — — — регуляторы
158-162
— — — — — — — точность сле-
слежения 1Z7—182
Система управления угловой ско-
скоростью, интегральное управление
503 '
— — — — как задача построения
регулятора 239—240
— — — — — — с обрат-
обратной связью по выходной перемен-
переменней 501—502
— — — — — — стохастическая
построения следящей системы
299—300, 369
— __ __ ___ — —_ — _™. __ _™. ? 00**
ратной связью по выходной пере-
переменной 502
— — — — наблюдатель 430
— — — — решение задачи по-
построения регулятора 247—250
— — — — — — — — устано-
установившееся 257—258
— — — — — — — следящей си-
системы 308—312
— — — — — уравнения Риккати
255
— — — — с пропорциональной
обратной связью 220—222
— — — — цифровой вариант 590—
592
Системы управления, анализ ли-
линейных систем 143—224
— — дискретные 541—555
— — стабилизация 163
— — — разомкнутыми регулятора-
регуляторами 215, 219
устойчивость 162—163, 215,
219, 543
Системы управления с обратной свя-
связью по выходной переменной,
оптимальные 446—480
___ дис-
дискретные 608—619
— — —. — — — — — — по-
пониженной размерности 490—497
дискретные 626
.— — — — — — — — — — при
ненулевой заданной точке 470—473
— — дискретные 616—617
^ — — — — — — — — при по-
постоянных возмущениях 475—478
_ ус-
установившиеся 455
дискретные 617
— — — — — — — — размеще-
размещение полюсов 445—446
— дис-
дискретный случай 609—610
— — — — — — _— стабилиза-
стабилизация 445—446
— — — — — — — — — дискрет-
дискретный случай 609—610
— — — — — — — — структу-
структура 434-439 • , ,
— — — —• — — — — численное
определение регуляторов пони-
пониженной размерности 495—497
— — — — — — — — чувстви-
чувствительность 480—486
Следящая антенна 143—144, 148
Следящие системы с обратной связью
по выходной переменной 462—465
Следящих систем свойства, анализ
переходных процессов 194—195
Предметный указатель
645
— — — — — — дискретный слу- ной обратной связью 65—66
чай 549—550 — — управляемость 71, 78—79
— — — — установившегося состо- — — устойчивости 40, 42
яния 167—194 — — функция матричная переда-
— — — — — — . дискретный точная 50—51
случай 545—549 переходная 27—28
— — — — — — многомерный, — — — — — импульсная 27—28
случай 182—186 — — характеристика матричная
— — — — — — скалярный слу- частотная 53
чай 171—177 . Смесительный бак с временным за-
— — — разомкнутые системы, паадывапием 514—515
переходные процессы 215, 219 — — — — — апериодическое уп-
— — — — — установившееся со- равление 588—590
стоянио 215, 219 • ¦ - — — — — — описание 514—515
Сложность систем управления с Соединение последовательное 58
обратной связью по выходной пере- Соединения дискретных ^и непре-
непременной 500 рывных систем 507—511
Смесительный бак, анализ следя- — линейных систем 58—63
щей системы в установившемся Состояния переменная 14
режиме 186—194 расширенная 59
— — демпфирования эффект 141 — — смещенная 313
— — динамические свойства, улуч- Спутник, вращенио 136—137
шение 228—229 Стабилизнруемость 79—81
— — дискретный вариант 512—515 — дискретных систем 526
— — ¦ — — задача регулирования — пары (А, В) 80
568—570 Степени свободы системы управле-
—' — о возмущениями 539— ния 315—316, 323, 354, 476—477
541 Стохастические процессы 105—108
— — — — — — стохастическая — — гауссовские 108
572—573 дискретные -533
— — — — наблюдатель оптималь- — — дискретные 532—534
ный 603—605 — — матрица дисперсий 106
— — описание 512—514 '. — — — — дискретная 533
—'— задача регулирования 150— — — — ковариационная 106
152 — .— дискретная 533
— — — — установившееся реше- — — — моментов второго порядка
нив 262-266 106 ,
— — — стохастического регулиро- — — — — — — дискретная 533
вания 296—297 — — — смешанных моментов вто-
— — — решение 307—308 рого порядка 106
квадратический интегральный — — — — — — — дискретная
критерий, вычисление 135—136 533
нули 57—58 — — — спектральных плотностей
описание 19—22 111
— — размещение полюсов опти- — — — — — дискретная 533
мального регулятора 335—336 — — моделирование 128
— — регулирование при ненуло- — — независимость 107
вой заданной' точке 319—320 — — некоррелированность 107
— — система управления развязан- — — реакция линейных систем
ная 222 112—114
— — среднер значение квадрата из- — — — — — дискретный случай
менений концентрации 117—118 534
— — стабилизируемость 81—82 — — реализации 105
— — стохастические возмущения — — с некоррелированными при-
114—115 ращениями 109—111, 120—122
моделирование 129—131 среднее значение 106
— — управление с пропорциональ- — — — — дискретный случай 533
646 Предметный указатель
— — стационарность 105
— — — дискретный случай 533—
534
— — — в широком смысле 107
— — — — — — дискретный слу-
случай 533
— — функция спектральной плот-
плотности 111
Стробоскопический эффект 523
Сурьё метод 49
Теорема разделения 415, 447
— — Доказательство 460—461
Терминальное управление 152
Точность максимально достижимая
следящих систем и систем регули-
регулирования 352—357
Управляемая переменная 146, 153,
542
— — смещенная 319
Управляемость 70—83
— каноническая форма 77
¦ — дискретные системы 525—526
— линейных систем дискретных
523—527
— — — с переменными парамет-
параметрами 82—83
— — — — постоянными парамет-
параметрами 71—74
— матрица 71
— — дискретные системы 524
— пары (А, В) 73
— полная 70
— равномерно полная 82—83
— — — дискретных систем 525
Уравнение сопряженное дифферен-
дифференциальное матричное 503—504
— состояния дифференциальное 14
— — — линеаризованное 15
— — — линейные системы, реше-
решение 23—36
— — — — — — посредством пре-
преобразования Лапласа 47—50
— — разностное 507, 516—517
Уравнения системы 14
Усиления контура матрица 60
Установившаяся реакция на гармо-
гармоническое входное воздействие 52
— — — — — — дискретные сис-
системы 521
.— — — постоянное входное воздей-
воздействие 53
— — — — — — дискретные сис-
системы 522
Установившаяся эквивалентная схе-
схема управления, разомкнутая 214—
220
Установившееся решение задачи по-
построения регулятора см. Задача
построения регулятора
Устойчивость 36—47 -
— асимптотическая 37—38, 41
в целом 38—39
— — дискретных систем 518
— в смысле Ляпунова 37—38, 41
— — — — дискретных систем 5J8
— дискретных систем 518—519
— линейных систем 39
— — — с постоянными параметрами
41-42
—> матрицы 42
— нелинейных систем, исследование
45—47
— решений 36—37
— соединений систем 61
— экспоненциальная 39, 42
— — дискретных систем 518
Устройства согласующие 508
Фаддеевой метод 49
Фиксатор нулевого порядка 508
Функция матричная импульсная пе-
переходная 25
— — — — системы дискретной 516
— — — — — с постоянными пара-
¦ метрами 29, 49
Функция матричная передаточная 49
— — — замкнутый контур, регу-
регулятор с постоянными параметра-
параметрами 316
— передаточная 50
Функция передаточная замкнутой
системы управления 168
— — — дискретной системы 545
— — системы второго порядка 173
— — — первого порядка 173
Функция матричная переходная 25
Характеристика частотная 51—53
— — дискретных систем 521—522
— — логарифмическая 53
— — матричная 52
Цифровая система управления поло-
положением 543—545, 557—558
— — — — апериодический наблю-
наблюдатель 598—599
— — — — апериодическое управ-
управление с обратной связью по выход-
Предметный указатель
647
пой поременпой 610—611
со-
состоянию 557—558
— — — — иптегральное управле-
управление 618—619
— ¦— — — наблюдаемая перемен-
переменная 594—595
— — — — описание 511—512
— — — — обратная связь по сос-
состоянию оптимальная 562—563
— — — — — I— пропорциональ-
пропорциональная 550—554
— — — — регулятор при ненуле-
ненулевой паданной точке 576—577
— — — — устойчивость 519
— — — — — с пропорциональ-
пропорциональной обратной связью 543—545
— — — — частотная характерис-
характеристика 522—523
Цифровое управление 506
Частота нормированная угловая 521
Частота среза l-то звена 184
— — нормированная дискретного
стохастического процесса 547
— — — дискретной системы управ-
управления 548
— — системы управления 172
— — стохастического процесса 174
Частота срыва системы управления
173
— — стохастического процесса 174
Числителя полином 56
— — вычисление 56—57
Чувствительности матрица 216
—'¦ — асимптотическая 484
— — дискретной системы управле-
управления 555
— функция 198, 212
— — дискретной системы управле-
управления 554
— — свойства 504—505
Чувствительность систем управления
359-366
— — — к возмущениям 196—201,
215-217, 219
— — — — изменениям параметров
объекта 208—212, 218—219
— — — оптимальных с обратной
связью по выходной переменной
480-486
— — — — — — — — состоянию
359—364
_ _ дис-
дискретный случай 590—592
Шум, возбуждающий состояние 390
Шум измерений 390, см. также Шум
наблюдений
Шум наблюдений 145, 390, 542
— — влияние в системах управле-
управления 204—206
— — — — — — дискретных 554—>
555
— — — — — — разомкнутых
218, 219
Шум экспоненциально коррелирован-
коррелированный дискретный 535—539
— — —, дисперсия 109
— — — моделирование с помощью
системы первого порядка 127—128
— — — определение 108—109
— — — постоянная времени 109
— — — функция спектральной плот-
плотности 112
— — — частота среза 175
— — — частота срыва 175
Эвклидова норма 37
Экспоненциал матрицы 26,33
— — вычисление 26
— — — посредством диагонализа-
ции 28—29, 33
— — — — преобразования Лапла-
Лапласа 48
Эталонная переменная 146, 153, 542
— — переменная часть 168
— — постоянная часть 168
Якоби матрица 15
z-передаточная функция матричная
520
z-преобразование 519—521
ОГЛАВЛЕНИЕ
Предисловие к русскому изданию 5
Предисловие авторов 9
Глава 1. ЭЛЕМЕНТЫ ТЕОРИИ ЛИНЕЙНЫХ СИСТЕМ . . . . 13
1.1. Введение ¦ 13
1.2. Описание состояния линейных систем 13
1.3. Решение дифференциальных уравнений состояния линейных
систем 23
1.4. Устойчивость 36
1.5. Анализ систем с постоянными параметрами на основе преоб-
преобразования Лапласа 47
1.6. Управляемость 70
1.7. Восстанавливаемость 83
•1.8. Дуальность линейных систем 99
1.9. Канонические формы фазовой переменной 101
1.10. Векторные стохастические процессы ......... 105
1.11. Реакция линейных дифференциальных систем на белый шум 118
1.12. Задачи 136
Глава 2. АНАЛИЗ ЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ . . 143
2.1. Введение 143
2.2. Формулирование задач управления 145
2.3. Замкнутые регуляторы: основной принцип проектирования 152
2.4. Устойчивость систем управления 162
2.5. Анализ точности слежения в установившемся режиме . . 167
2.6. Анализ переходных процессов в следящих системах . . 194
2.7. Влияние возмущений в скалярном случае 196
2.8. Влияние шума наблюдений в скалярном случае . . . 204
2.9. Влияние неопределенности параметров объекта в скалярном
случае 208
<!.10. Разомкнутая установившаяся эквивалентная схема управле-
управления 214
Оглавление 649
2.11. Заключение 220
2.12. Задачи . 220
Глава 3. ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
С ОБРАТНОЙ СВЯЗЬЮ . . . . 225
3.1. Введение 225
3.2. Улучшение динамических свойств линейных систем с по-
помощью обратной связи 225
3.3. Задача детерминированного линейного оптимального управ-
управления 234
3.4. Установившееся решение задачи построения детерминиро-
детерминированного линейного оптимального регулятора 256
3.5. Численное решение уравнения Риккати 287
3.6. Задачи стохастического линейного оптимального регулирова-
регулирования и слежения 293
3.7.- Системы регулирования и следящие системы с ненулевыми
ааданными точками и постоянными возмущениями ... 313
3.8. Асимптотические свойства оптимальных законов управления
с постоянными параметрами 325
3.9. Чувствительность линейных систем управления с обратной
связью по состоянию 359
3.10. Заключение*' . 366
3.11. Задачи 366
Глава 4. ОПТИМАЛЬНОЕ ЛИНЕЙНОЕ ВОССТАНОВЛЕНИЕ СОС-
. ТОЯНИЯ 377
4.1. Введение 377
4.2. Наблюдатели - 378
,- 4.3. Оптимальные наблюдатели 389 s
4.4. Дуальность оптимального наблюдателя и оптимального регу-
регулятора. Установившиеся свойства оптимального наблюдателя 418
4.5. Заключение 428
'4.6. Задачи 429
Глава.5. ОПТИМАЛЬНЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
G ОБРАТНОЙ СВЯЗЬЮ ПО ВЫХОДНОЙ ПЕРЕМЕННОЙ 433
5.1. Введение 433
• 5.2. Регулирование, линейной системы при неполных
измерениях . 434
5,8. Оптимальные линейные "регуляторы при неполных измерени-
измерениях, содержащих шум 446
5.4. Линейные оптимальные следящие системы с неполными и
неточными измерениями 462
650 Оглавление
5.5. Системы регулирования и следящие системы с ненулевыми
заданными точками и постоянными возмущениями. . . . 470
5.6. Чувствительность оптимальных линейных систем управле-
управления с постоянными параметрами 480
5.7. Линейные оптимальные регуляторы пониженной размерности
с обратной связью по выходной переменной .... 489
5.8. Заключение 499
5.9. Задачи 501
Глава 6. ЛИНЕЙНАЯ ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
ДЛЯ ДИСКРЕТНЫХ СИСТЕМ 506
6.1. Введение -506
6.2. Теория линейных дискретных систем 506
6.3. Анализ линейных дискретных систем управления . . . 541
6.4. Оптимальные линейные дискретные системы управления с
обратной связью по состоянию 555
6.5. Оптимальное линейное восстановление состояния линейных
дискретных систем 592
6.6. Оптимальные линейные дискретные системы с обратной связью
по выходной переменной 608
6.7. Заключение 619
6.8. Задачи 620
Литература 628
Предметный указатель : . . . . 638
Уважаемый читатель!
Ваши замечания о содержании книги, ее оформ-
оформлении, качестве перевода и другие просим при-
присылать по адресу: 129820, Москва, И-110, ГСП,
1-й Рижский пер., 2, издательство «Мир».
X. Квэкернаак, Р. Сивап
ЛИЙЕИНЫЕ ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
Редактор Ю. Воронов
Художник Г. Коняхина
Художественный редактор Н. Блинов
Технический редактор И. Кренделева
Корректоры М. Колотилина, М. Смирнов
Сдано в набор 16/IV1976 г. Подписано к печати 7/Х 1976 г. Бумага кн.
журн.60х901Д«=20,50бум. л. 41 печ. л.,Уч.-изд. л. 36,49.Изд. №20/8527.
Цена 2р. 73 к. Зак. 394.
ИЗДАТЕЛЬСТВО «МИР»
Москва. 1-й Рижский сер., 2.
Ярославский полиграфкомбинат Союзполиграфпрома при Государ-
Государственном комитете Совета Министров СССР по делам издательств,
полиграфии и книжной торговли. 150014, Ярославль, ул. Свободы, 97.
В издательстве „Мир"
вышла книга
Вукобратович М. Шагающие роботы и антропоморф-
антропоморфные механизмы, пер. с англ., 1976, 30 л., 3 р. 27 к.
Монография посвящена новой, интенсивно разви-
развивающейся области технической кибернетики — робото-
робототехнике. Создание шагающей антропоморфной системы
представляет собой сложную комплексную проблему.
Наряду с трудными технологическими задачами прихо-
приходится, решать ряд научных проблем по динамике таких
систем, связанных с моделированием, управлением по-
походкой и поддержанием равновесия при ходьбе. В.дан-
В.данной монографии автор предлагает оригинальный путь
решения указанных проблем и приводит данные по ре-
результатам разработки и испытания первого действую-
действующего макета шагающего антропоморфного робота типа
«Экзоскелета».
Книга представляет интерес для специалистов^в об-
области технической кибернетики, автоматического управ-
управления, роботостроения и протезирования.