Text
                    р Изерман
ЦИФРОВЫЕ
СИСТЕМЫ
УПРАВЛЕНИЯ
Перевод с английского
кандидатов техн, наук С. П. ЗАБРОДИНА,
А. И. ТИТКОВА, А. В. ШАЛАШОВА
под редакцией чл.-корр. АН СССР
И. М. МАКАРОВА

ББК 32.965.9 И 36 УДК 62.50 Изерман Р. И 36 Цифровые системы управления: Пер. с англ.— М.: Мир, 1984.—541 с., ил. В труде специалиста из ФРГ рассмотрены современные методы расчета и проек- тирования цифровых систем управления с детерминированными н случайными воз- i мущеннями. Значительное внимание уделено теории многосвязных и адаптивных систем управления. Для специалистов в области автоматического управления и вычислительной техники, а также аспирантов и студентов соответствующих специальностей. * 1502000000-108 И 041 (01J-84 4'84’ ч* 1 ББК 32.965.9 ] 6Ф6.5 । Редакция литературы по новой технике © Springer-Verlag, Berlin, Heidelberg, 1981 | All Rights Reserved. Authorized translation from , English language edition published by Springer-Verlag, ] Berlin — Heidelberg — New York © Перевод на русский язык, «Мир», 1984 1
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Интенсивное развитие современных средств вычислительной техники привело к широкому распространению цифровых систем управления, которые в настоя- щее время используются в различных отраслях промышленности. Внедрению циф- ровых систем управления в значительной степени способствовало создание микро- процессоров и построенных на их основе микро-ЭВМ. Методы проектирования подобных систем существенно отличаются от классических методов, применяемых ври анализе и расчете систем непрерывного типа. Во-первых, это связано с тем, что основой математического аппарата проектирования цифровых систем являются разностные схемы, которые заменяют дифференциальные уравнения, описываю- щие непрерывные системы. Соответственно методы, связанные с использованием обычного преобразования Лапласа, заменяются различными формами z-преобра- зования. Во-вторых, алгоритмы, применяемые при расчете цифровых систем, в частности построение дискретных моделей, зачастую могут быть реализованы только с помощью ЭВМ. Предлагаемая вниманию читателя книга известного ученого Р. Изермана по- священа методам проектирования цифровых систем управления, обладающих вы- сокими показателями качества. Основное внимание автор уделяет методам синтеза систем во временной области с использованием метода пространства состояний. Преимущество данного подхода заключается в том, что алгоритмы синтеза могут быть наиболее просто реализованы на ЭВМ. Книга состоит из тридцати глав, объединенных в семь разделов, и приложе- ния. В первом разделе приводятся основные понятия и определения теории циф- ровых систем, а также способы их описания с помощью z- и w-преобразований, по- лучивших широкое практическое применение. Здесь автор исследует методы пре- образования непрерывных сигналов в цифровую форму и их воспроизведение с помощью экстраполяторов различных типов. Анализируются ошибки, связанные с квантованием сигналов по времени и по уровню. На основе этих представлений строятся модели цифровых систем в пространстве состояний. В конце раздела из- лагаются основные положения теории устойчивости. Приводимые алгебраические н частотные критерии устойчивости удобны для выполнения расчетов на ЭВМ. Второй раздел посвящен синтезу цифровых систем управления при детермини- рованных воздействиях. Описываются основные типы непрерывных регуляторов и способы их реализации на управляющих ЭВМ с помощью схем непосредственно- го, последовательного и параллельного программирования. При этом осуществля- ется оптимизация параметров полученных цифровых регуляторов. Особый интерес для проектировщиков представляет методика построения цифровых регуляторов, обеспечивающих сокращение нулей и полюсов в неизменяемой части системы. Это упрощает процесс проектирования систем высоких порядков, описываемых слож- ными передаточными функциями. Определенный интерес также представляют ме- тоды расчета регуляторов, в которых для получения заданных показателей ка- чества используется информация по всем переменным состояния или лишь по части состояний, когда остальные воспроизводятся с помощью наблюдателей раз- личных типов. Достаточно подробно в разделе освещены вопросы синтеза регуля- торов, обеспечивающих конечное время установления переходных процессов в сис- теме управления. Большое значение имеют описываемые автором способы оценки чувствительности системы к изменению собственных параметров объекта управле- ния, которые необходимы при выборе рабочих алгоритмов управляющей ЭВМ. В третьем разделе рассматриваются стохастические цифровые системы управ-
6 Предисловие редактора перевода лепия. Предлагаемый автором подход к построению систем со случайными воздей- ствиями базируется на математическом аппарате дискретных марковских процес- сов. Подробно исследуются методы расчета цифровых регуляторов по квадратич- ному критерию качества для объектов с различными передаточными функциями, в том числе и с запаздыванием. Значительное внимание автор уделяет способам решения задач оптимизации, приводящим к матричным уравнениям Риккати. В конце раздела рассматривается проблема оценивания состояний] объекта, кото- рые формируются с помощью фильтра Калмана. Можно отметить, что все методы, излагаемые в этом разделе, имеют конкретное практическое значение. В четвертом разделе изложены методы синтеза многоконтурных систем управ- ления. Для повышения качества их работы вводятся дополнительные регуляторы в цепях прямой и обратной связи. Такие системы являются работоспособными лишь при наличии измерений внутренних координат объекта или действующих извне возмущений. Для выбора параметров подобных регуляторов используются методы синтеза, описанные в предыдущих разделах, что представляет определен- ный интерес для проектировщиков. Автор сравнивает различные схемы построения регуляторов, приведенных в данном разделе. Пятый раздел содержит синтез многомерных систем управления с учетом вза- имных связей между отдельными частями системы. Учитывая сложность проекти- рования систем подобного рода, автор рекомендует применять методы декомпози- ции, не приводящей к нарушению качества функционирования системы. Для этих целей предлагается вводить дополнительный цифровой регулятор, что явля- ется наиболее простым способом развязывания каналов многомерных систем. Не оставлено без внимания и представление многомерных систем в виде мат- ричных полиномиальных уравнений, которые справедливы при одинаковом числе входов и выходов. Рассматриваются также методы синтеза алгоритмов управления таких систем, позволяющие получать высокие показатели качества управления. Много внимания в книге автор уделяет адаптивным системам. Им полностью посвящен шестой раздел. Как и обычно, данный раздел начинается с изложения теории оценивания параметров в условиях нормальной эксплуатации системы. Для этого рекомендуется применять следующие методы: наименьших квадратов, вспомогательных переменных и максимума правдоподобия. Автор показывает, что ввиду малой скорости сходимости и низкой точности получаемых оценок при- менять метод стохастической аппроксимации в адаптивных системах нецелесооб- разно. Следует отметить, что все указанные методы исследованы при наличии шу- мов. Особенностью этого раздела является значительное число примеров построе- ния адаптивных систем управления с замкнутыми и разомкнутыми контурами са- монастройки. Седьмой раздел посвящен техническим средствам, используемым в цифровых системах управления: аналого-цифровым и цифро-аналоговым преобразователям, датчикам, цифровым фильтрам для подавления шумов, исполнительным устройст- вам. Здесь также обсуждаются принципы автоматизации проектирования цифро- вых систем и состав пакетов прикладных программ. В заключение раздела приве- дены конкретные примеры проектирования систем цифрового управления техно- логическими объектами различных классов. К большим достоинствам книги можно отнести последовательность изложе- ния материала — от основных теоретических положений до конкретной реализа- ции методов проектирования сложных цифровых систем. Теоретические результа- ты подкрепляются данными математического моделирования. Используя мате- риалы этой книги, можно вести не только расчетно-теоретическую проработку цифровых систем управления, но и осуществлять их практическую реализацию. Книга рассчитана на научных сотрудников и инженеров, занимающихся про- ектированием, доводкой и испытаниями цифровых систем управления. Ее также можно рекомендовать аспирантам и студентам старших курсов, специализирую- щимся в области автоматического управления и вычислительной техники. Перевод книги выполнен канд. техн, наук С. П. Забродиным (главы 1,4—11, 16—21), канд. техн, наук А. И. Титковым (главы 25, 28—30) и канд. техн, наук А. В. Шалашо- вым (Введение, главы 2, 3, 12—15, 22—24, 26, 27). Член-корреспондент АН СССР И. М. Макаров
ПРЕДИСЛОВИЕ Стремительное совершенствование технологии производства интегральных полупроводниковых компонентов, обеспечившее возможность создания высокоэко- номичных цифровых устройств обработки и хранения информации, а также появ- ление эффективных средств программирования оказывают все более существенное влияние не только на развитие техники измерений и управления, но и на подход к автоматизации вообще. Первые попытки применения цифровых устройств для автоматизации производственных процессов относятся к началу 60-х гг., когда были разработаны первые управляющие вычислительные машины. В 70-х гг. ЭВМ, непосредственно связанная с объектом в составе замкнутого или разомкнутого кон- тура управления, стала обычным элементом оборудования автоматизированных систем. В последнее десятилетие ежегодный прирост числа ЭВМ, используемых в подобных системах, составлял от 20 до 30%. При этом обнаружилась тенденция к снижению стоимости аппаратуры и увеличению относительных затрат на при- кладное программное обеспечение. Для начального этапа внедрения цифровых систем управления в сфере авто- матизации производственных процессов было характерно стремление к максималь- ной централизации задач, решаемых на одной и лишь в отдельных случаях на не- скольких управляющих ЭВМ. Однако такой подход далеко не всегда позволял ре- ализовать все преимущества цифровой обработки сигналов и получить ощутимый экономический эффект от использования цифровой техники. Последнее в значи- тельной степени объясняется тем, что для обеспечения надежного функционирова- ния систем при отказах центральной ЭВМ в параллель к ней приходилось ставить вспомогательные цифровые или аналоговые вычислители. Положение изменилось после того, как в 1971 г. был начат серийный выпуск микропроцессоров. На базе этих новых элементов, а также модулей ввода/вывода и полупроводниковых запоминающих устройств на больших интегральных схе- мах были созданы управляющие микро-ЭВМ, обладающие высокими экономичес- кими характеристиками. От более мощных универсальных машин такие ЭВМ от- личает простота адаптации их аппаратного и программного обеспечения к реше- нию специальных, достаточно узких прикладных задач. В то же время следует от- метить, что пока микропроцессоры, как правило, уступают большим ЭВМ в раз- рядности и быстродействии. Они имеют менее обширные системы команд и ос- нащаются несложными операционными системами. Постоянное расширение сферы применения микропроцессоров обусловливает быстрый рост их выпуска и, соот- ветственно, снижение стоимости производства. На основе управляющих микро-ЭВМ в настоящее время строятся децентрали- зованные автоматизированные системы. Задачи, которые до сих пор возлагались на одну центральную ЭВМ, теперь распределяются по нескольким специализиро- ванным микровычислителям. Последние обмениваются информацией через общие шины или закольцованные линии связи, которые в свою очередь подключаются к более мощным управляющим ЭВМ. Таким образом могут формироваться разнооб- разные многоуровневые системы, структуры которых выбираются исходя из осо- бенностей объектов управления. Децентрализация позволяет снизить требования к быстродействию отдельных вычислителей, рассредоточить и упростить приклад- ное программное обеспечение, повысить стойкость к отказам и тем самым устранить основные недостатки, свойственные системам с центральными ЭВМ. Кроме того, децентрализованные системы можно вводить в эксплуатацию по частям; в них мо- гут использоваться общие резервные блоки (отсюда — еще более высокая надеж- ность), они обеспечивают некоторую экономию в соединительных линиях и т. д.
8 Предисловие Итак, можно констатировать, что текущий этап развития методов цифровой об- работки сигналов характеризуется переходом к децентрализованным системам. Однако сфера применения микро-ЭВМ не ограничивается только децентрали- зованными автоматизированными системами. Они все более широко используются в качестве автономных вычислителей в различных измерительных и управляющих устройствах. Начиная с 1975 г. в промышленность стали поступать цифровые регу- ляторы и программируемые системы управления. Один цифровой регулятор, как правило, может выполнять функции нескольких аналоговых. Обычно на его входе ставится аналого-цифровой преобразователь, поскольку пока в основном приме- няются датчики, усилители и линии связи аналогового типа. Для того чтобы регу- лятор мог приводить в действие исполнительные устройства с аналоговым входом, он снабжается выходным цифро-аналоговым преобразователем. Вероятно, в буду- щем будет освоен выпуск оцифрованных датчиков и исполнительных устройств. Это позволит не только обойтись без аналого-цифровых и цифро-аналоговых пре- образователей, но и устранить ряд источников помех, а также даст возможность осуществлять предварительную обработку сигналов в цифровых измерительных устройствах (например, с целью выбора наилучшего диапазона измерений, ком- пенсации нелинейностей, автоматического выявления неисправностей и т. д.). Что же касается исполнительных устройств с цифровым входом, то уже сейчас выпускаются, например, шаговые электроприводы. Цифровые регуляторы не только заменяют по нескольку аналоговых, но они могут реализовать также дополнительные функции, выполнявшиеся ранее дру- гими устройствами, или совершенно новые функции. Упомянутые дополнительные функции включают, в частности, программируемую проверку номинальных режи- мов, автоматический переход к обработке различных управляемых и регулируе- мых переменных, подстройку параметров регулятора, осуществляемую по разомк- нутому циклу в соответствии с текущим режимом работы системы, контроль пре- дельных значений сигналов и т. п. Можно привести и примеры новых функций — это обмен информацией с другими регуляторами, взаимное резервирование, ав- томатическая диагностика и поиск неисправностей, выбор требуемых управляю- щих алгоритмов, и в первую очередь реализация адаптивных законов управления. На основе цифровых регуляторов могут быть построены системы управления лю- бых типов, включая системы с последовательным управлением, многомерные сис- темы с перекрестными связями, системы с прямыми связями. При этом програм- мное обеспечение подобных систем можно без труда корректировать как в пред- пусковой период, так и в процессе их эксплуатации. Немаловажно и то, что циф- ровые регуляторы позволяют изменять их параметры в весьма широких диапазо- нах и способны работать с практически любыми тактами квантования. Таким образом, все вышесказанное позволяет утверждать, что цифровая измерительная и управляющая техника со временем получит самое широкое распространение и в значительной степени вытеснит традиционную аналоговую технику. Отметим некоторые особенности систем с управляющими ЭВМ обычного типа или с микро-ЭВМ, отличающие их от аналоговых систем: — законы управления с прямыми или обратными связями реализуются в форме алгоритмов, запрограммированных с помощью аппаратных или программных средств; — обрабатываются квантованные (дискретные во времени) сигналы; — сигналы могут принимать только определенные дискретные значения вслед- ствие квантования по амплитуде в аналого-цифровых и цифро-аналоговых преобра- зователях и в центральном процессоре. Благодаря гибкости средств программного обеспечения при построении уп- равляющих алгоритмов возможности проектировщика не ограничиваются толь- ко выбором между стандартными звеньями П-, И- или Д-типов, как в случае ана- логовых систем. Он может применять и более сложные алгоритмы, основанные на современных методах теории дискретных систем, использующих различные мате- матические модели объектов управления. К настоящему времени опубликован целый ряд работ, посвященных теоретическому анализу и синтезу линейных дис- кретных систем, описываемых скалярными и векторными разностными уравнения-
Предисловие 9 ми или с использованием аппарата z-преобразования. Однако до сих пор не издано книги, в которой содержался бы всесторонний обзор и сравнение существующих методов цифрового управления, представленных в форме, которая позволяла бы непосредственно воспользоваться ими при разработке управляющих алгоритмов для объектов различных классов. Наряду с другими проблемами проектировщика интересуют такие вопросы, как выбор способа описания объекта управления и степень адекватности его математической модели, вычислительная трудоемкость методов проектирования, свойства получаемых алгоритмов, в том числе соотноше- ние между качеством процессов и затратами на управление, вариации характе- ристик алгоритмов при переходе от объекта к объекту и при наличии разного рода возмущений, чувствительность к изменениям динамики объектов. Большой ин- терес представляет также сравнительное исследование цифровых и непрерывных систем с целью анализа эффектов, вносимых квантованием сигналов по времени и по уровню. Настоящая книга адресована инженерам, работающим в промышленности и в исследовательских организациях, а также студентам технических специаль- ностей, которые освоили методы проектирования непрерывных линейных систем управления и хотели бы ознакомиться с основами теории цифровых систем и во- просами их практической реализации. Конечно, желательно, чтобы читатель рас- полагал определенными сведениями в линейных дискретных системах, однако он может почерпнуть их из гл. 3, которая содержит краткое введение в теорию циф- ровой обработки сигналов и где приводятся базовые математические соотношения, необходимые в инженерной практике. Этот математический аппарат послужил ос- новой для создания и дальнейшего развития эффективных методов проектирования дискретных систем управления. Значительная часть книги посвящена описанию управляющих алгоритмов с параметрической оптимизацией, с компенсацией нулей и полюсов и конечным вре- менем установления переходных процессов, синтез которых осуществляется в рам- ках классических методов, а также алгоритмов управления по состоянию и алго- ритмов с минимальной дисперсией, полученных с помощью современных методов, основанных на представлении систем в пространстве состояний и использующих параметрические стохастические модели сигналов и объектов управления. С целью демонстрации свойств различных алгоритмов в цепях прямых и обратных связей замкнутых контуров управления проводилось их математическое моделирование па универсальных ЭВМ. Кроме того, многие алгоритмы были реализованы на уп- равляющих ЭВМ, оснащенных пакетами прикладных программ. Работоспособ- ность этих алгоритмов оценивалась по результатам практических эксперимен- тов, в которых к управляющим ЭВМ подключались аналоговые модели, а также тестовые и реальные технологические объекты. Большое место в книге уделено алгоритмам параметрической идентификации, методам построения самооптимизирующихся цифровых адаптивных систем уп- равления и вопросам их практического применения. Рассмотрены также некоторые проблемы реализации цифровых систем, в том числе фильтрации помех и учета характеристик исполнительных устройств. Читатель может сделать вывод, что в большинстве случаев синтез дискретных систем не отличается особой сложностью, если в распоряжении проектировщика имеются математические модели объектов управления, причем для построения моделей и расчета управляющих алгоритмов целесообразно использовать те же цифровые вычислители. Следует отметить, что разностные уравнения, описывающие функционирование дискретных систем, зна- чительно проще с точки зрения их анализа и программной реализации, нежели дифференциальные уравнения, применяемые для описания непрерывных си- стем. Книга построена таким образом, что при первоначальном ее чтении некоторые главы могут быть пропущены. Это потребовало введения многочисленных ссылок на материал, содержащийся в предшествующих и последующих главах, а также некоторых повторений. Многие из представленных в книге методов, теоретических выкладок и экспе- риментальных результатов были получены в ходе научно-исследовательских работ
10 Предисловие по проекту «Prozesslenkung mit DV-Anlagen» финансируемому федеральным министерством исследовании и технологии ФРГ, а также опытных проектов, суб- сидировавшихся фондом общих поисковых исследований ФРГ. Автор хотел бы высказать признательность своим коллегам, в течение несколь- ких лет принимавшим деятельное участие в проведении указанных работ, за их помощь в подготовке примеров, создании пакетов прикладных программ, матема- тическом и полунатурном моделировании, практических экспериментах с объек- тами управления различных типов и, наконец, в сверке текста книги. Первое издание книги вышло в 1977 г. на немецком языке под названием «Di- gitale Regelsysteme» 2>. Настоящая книга представляет собой английский перевод первого издания, дополненного рядом материалов. Для того чтобы читатель мог подробнее ознакомиться с математическими основами теории линейных дискрет- ных систем, была расширена гл. 3. Обзор многосвязных систем управления до- полнен разд. 18.1.5, гл. 20 (матричные полиномы), а также разд, с 21.2 по 21.4 (управление состоянием). В то же время содержимое гл. 21 и 22 было перенесено в гл. 27 и 15 соответственно. В результате номера всех глав, начиная с 22-й, ста- ли на единицу меньше, чем в первом издании. Был добавлен разд. 23.8, в котором излагаются некоторые новейшие рекуррентные методы параметрической иденти- фикации. Существенно расширена и переработана с учетом последних достижений в области адаптивного управления гл. 25. Кроме того, заново написана гл. 30, содержащая примеры практической реализации цифровых систем. Я хотел бы выразить свою признательность сотрудникам издательства «Шприн- гер-Ферлаг», оказавшим большую помощь в подготовке английского,, перевода кни- ги. Наконец, я хотел бы особо поблагодарить г-жу Дж. Контаг, превосходно отпе- чатавшую текст всей книги. Дармштадт, сентябрь 1980 г. * Рольф ИзерМОН Х) Применение цифровой техники для управления объектами (перев. с нем.)» 9) Цифровые системы управления (перев. с нем.).
ГЛАВА 1 Введение ИЕРАРХИЧЕСКАЯ СТРУКТУРА УПРАВЛЕНИЯ В обобщенной структуре управления технологическими объек- тами можно выделить несколько уровней (рис. 1.1). На первом уровне осуществляется непосредственное управление объектом по реально измеряемым координатам у с помощью регу- ляторов с прямой или обратной связью. Сигнал задающей пере- менной при этом либо является постоянным, либо формируется на Уровень 5 Уровень 4 Уровень 3 • Уровень 2 Уровень 7 Планирование, Рис. 1.1. Многоуровневая структура управления. одном из более высоких уровней управления. Если управление ведется по более чем одной регулируемой переменной, оно назы- вается многомерным. Автоматическое управление началом и окон- чанием цикла работы объекта управления также относится к пер- вому уровню. Второй уровень объединяет операции контроля за объектом управления. Здесь осуществляется наблюдение за определенными
18 Гл. 1. Введение характеристиками объекта, например фиксируется превышение контролируемыми переменными заданных предельно допустимых значений. При контроле можно ограничиться оценкой текущего поведения переменных объекта или же учитывать их предсказывае- мые (будущие) значения. Информация, полученная на этом уровне управления, используется для предупреждения обслуживающего объект персонала о возможности возникновения аварийной ситуа- ции. Автоматически предпринимаемые при этом действия для устра- нения возмущений или остановки процесса называют аварийным управлением. К третьему уровню можно отнести выполнение процедур опти- мизации, в результате которых максимизируется эффективность или выход объекта управления либо минимизируется потребление или стоимость. Часто наиболее важной оказывается оптимизация уста- новившегося состояния процесса, которая называется статической оптимизацией. При выполнении оптимизации в ходе нормальной эксплуатации объекта показатель качества вычисляется на основа- нии измеряемых значений регулируемых переменных объекта у, а поиск экстремума производится целенаправленным изменением входных сигналов, т. е. значений задающих переменных w в соот- ветствии с используемым методом оптимизации. Если несколько объектов работают совместно, то управление их взаимодействием или координация осуществляется на четвертом уровне. Например, для группы термических или гидромеханических объектов координация состоит в распределении нагрузки, а для комплекса процессов производства стального проката — во взаим- ном согласовании работы доменных печей, выплавки стали и про- катных станов. Самый верхний, в нашем случае пятый, уровень предназначен для организации управления. Вся система объектов (заводы, сети связанных предприятий, большие производственные комплексы) организуется с учетом планируемых рынков сбыта, необходимого объема сырья и персонала для их обслуживания. На каждом из рассмотренных уровней можно использовать ме- тоды управления с прямой и обратной связью. Если на всех уровнях данной структуры используется управление с обратной связью, то кроме контуров непосредственного управления объектами можно говорить о контурах контроля, оптимизации и координации, т. е. о многоуровневой структуре контуров управления. Раньше многие задачи управления объектами выполнялись вручную, что до сих пор имеет место на некоторых предприятиях. Развитие автоматизации производства прежде всего начиналось с нижних уровней управления. Приблизительно до 1960 г. автома- тическое управление технологическими объектами осуществлялось с помощью аналоговых электрических, пневматических или гидрав- лических регуляторов. Последовательностное управление реали- зовывалось с помощью электрических или пневматических элемен-
Иерархическая структура управления 13 тов с использованием двоичных сигналов. Для контроля применя- лось аналоговое или цифровое оборудование. Оптимизация и коорди- нация работы объектов либо выполнялись вручную, либо вообще отсутствовали. Применение цифровых ЭВМ позволяет частично автоматизировать управление на высших уровнях. Применение управляющих вычислителей Появление цифровых управляющих вычислителей постепенно привело к изменению как структуры, так и функций автоматизиро- ванного управления. Внедрение средств автоматизации проходило поэтапно. В 1959 г. впервые для управления объектами в режиме нормальной эксплуа- тации были использованы первые специализированные вычислите- ли, предназначенные в основном для регистрации и обработки данных, а также для целей контроля. Непосредственное управление объектом выполнялось с помощью аналоговых средств, что объяс- нялось малой надежностью выпускавшихся тогда управляющих вычислителей. Затем цифровые управляющие вычислители стали использоваться для формирования задающих переменных для ана- логовых регуляторов (программное управление), например с целью оптимизации объекта. С 1962 г. управляющие вычислители приме- няются для непосредственного цифрового регулирования процессов в замкнутых контурах управления объектами химического произ- водства и на электростанциях [1.1] — [1.6]. В результате создания более мощных управляющих вычислите- лей и необходимого математического обеспечения их применение для управления объектами существенно расширилось. В настоящее время вычислители являются неотъемлемой частью автоматизиро- ванных систем управления [1.5], [1.6]. Более подробно об этом ска- зано в работах [1.7] — [1.14]. До последнего времени управляющие вычислители использовались преимущественно для непосредствен- ного управления, контроля и координации, а также для регистрации и обработки данных [1.7] — [1.11] и очень редко—для целей оптимизации в процессе функционирования объектов. Характер- ным результатом 15-летнего применения управляющих вычислите- лей явилась централизация управления, т. е. выполнение всех необходимых функций на одном вычислителе. При этом часто приходилось использовать дублирующий аналоговый или цифро- вой вычислитель для повышения надежности. Применение микро-ЭВМ Дешевые микропроцессоры появились в 1971 г. В связи с этим открылась возможность создания микро-ЭВМ, состоящих из микро- процессоров, полупроводниковой памяти и устройств ввода/вывода, и решения задач управления объектами на нескольких вычислите-
14 Гл. 1. Введение лях. Это привело к разработке систем децентрализованного управ- ления. В 1975 г. начали выпускаться микро-ЭВМ, которые были специально предназначены для контроля и управления объектами с 8—16 регулируемыми переменными. Они стали использоваться вместо аналоговых устройств и мини-ЭВМ на нижних уровнях рассмотренной выше структуры управления технологическими объектами. В настоящее время сфера их использования расширя- ется, и микро-ЭВМ оказывают и будут оказывать существенное влияние на развитие теории и техники измерений и управления. Цифровые системы управления Обычное аналоговое или цифровое программное управление предназначено для выполнения небольшого числа основных функ- ций. Применение же цифровых вычислителей для целей управления позволяет существенно расширить круг решаемых задач, поскольку они являются программируемыми и могут выполнять сложные расчеты. Поэтому для цифрового управления объектами можно разработать много новых методов, которые на нижних уровнях могут быть использованы в виде запрограммированных алгорит- мов, а на верхних уровнях — в виде программ для реализации проб- лемно-ориентированных вычислительных методов. Поскольку на всех уровнях формируется обобщенное управление с обратной или прямой связью, следует проектировать и использовать применитель- но к конкретному объекту многоуровневые алгоритмы управления. В этой книге рассмотрены вопросы цифрового управления на нижнем уровне общей структуры управления технологическими объектами. Однако многие из рассмотренных ниже методов синтеза алгоритмов управления можно также применить при проектирова- нии цифровых систем контроля, оптимизации и координации. Содержание книги В книге описаны методы синтеза цифровых систем управления, ориентированных на использование управляющих вычислителей и микро-ЭВМ. Книга включает семь частей. Часть 1. Объекты и управляющие вычислители. В гл. 2 рассмотрены обобщенная структура цифровых систем уп- равления и основные этапы их проектирования. Краткое введение в теорию линейных дискретных систем содержится в гл. 3. В ней же рассмотрены основные типы технологических объектов и спосо- бы построения их математических моделей для дискретных сигналов. Остальные части книги содержат следующий материал: Часть 2. Системы управления с детерминированными возмущениями. Часть 3. Системы управления со случайными возмущениями. Часть 4. Связные системы управления. Часть 5. Многомерные системы управления.
Системы управления ОВОВ - Парам, оптим. а. у. (5, 13,25) \-a.y. с зад. расп. полюсов (11) - компенсационные а.у. (6) -Апериодические а.у. (1) -Предикторы (S) - А.у. по состоянию (8,15) -А.у. с мин. дисперсией (14) Связные системы управления Системы управления МВМВ -Каскадные а. у. (16) -А.у. с прямой связью (17) - Парам, оптим. а. у. (18,19) - А.у. по состоянию (18,21) - Матричн. полином. а.у. (21) | С постоянными I параметрами Правила настройки (5, 19) Г Автоматизированное проектирование (29) Алгоритмы у п\р а в л е н и я j Адап п!и вные Самоошпимизир. парам, адаппг. а.у. (22-25) л (25) Фильтр шума (27) Управление ист устрой- ствами (28) Измеряемые сигналы Оценивание параметров (3,23, 24) Модель объекта (3,18,23) 0 Состояние, -наблюдатель (8) -оценивание (15) Модель сигнала (12, 15,23) X Иерархическая структура управления Рис, 1.2. Обзор рассмотренных в книге структур систем управления, используемой ими информации об объектен сигналах и способов согласования систем объектов. 4 ) номер славы; а. у.— алгоритм управления (см. гл. 2); ОВОВ == один вход / один выход; МВМВ — много входов / много выходов, СП
16 Гл. 1. Введение Часть 6. Адаптивные системы управления. Часть 7. Цифровое управление с управляющими вычислителями и микро-ЭВМ. Основное содержание глав книги отражено в схеме на рис. 1.2 с помощью ключевых слов. Предлагаемый подход к проектированию цифровых систем управления следует из этой схемы и гл. 2. Модели объектов и сигналов представлены в книге главным обра- зом параметрически, т. е. описываются скалярными или вектор- ными разностными уравнениями, поскольку современные методы синтеза основаны именно на таком представлении. Описания объек- тов даются в компактном виде с малым числом параметров, а методы синтеза во временной области не требуют больших объемов вычис- лений и обеспечивают получение структурно оптимизируемых регуляторов. Модели объектов получены в результате применения методов оценивания параметров и могут быть непосредственно использованы для наблюдения или оценивания состояний. Непара- метрические модели, такие, как переходные функции или частотные характеристики, представляемые в виде таблиц, указанными пре- имуществами не обладают. Их использование ограничивает возмож- ности синтеза, в частности, это касается автоматизированного про- ектирования и адаптивных алгоритмов управления. Обзор алгоритмов управления для детерминированных и сто- хастических воздействий содержится в гл. 4, в частности на рис. 4.3 и в разд. 12.1. В гл. 5 рассмотрены вопросы синтеза параметрически оптими- зируемых алгоритмов управления, основанного на использовании обычных непрерывных алгоритмов управления П-, ПИ- и ПИД-типа. Здесь же описаны основные дискретные регуляторы низкого по- рядка. Правила выбора параметров регуляторов собраны из имею- щейся литературы. Они дополнены соображениями, основанными на результатах моделирования. Показаны возможности автомати- зации проектирования таких регуляторов. Регуляторы с конечным временем установления переходных процессов — апериодические регуляторы — описаны в гл. 7. Ме- тод их синтеза характеризуется весьма малыми вычислительными затратами. Модифицированные апериодические регуляторы повы- шенного порядка особенно пригодны в адаптивных системах управ- ления. Гл. 8 посвящена регуляторам состояния и наблюдателям. Кро- ме всего остального здесь излагается метод синтеза регуляторов для внешних постоянно действующих воздействий и рассматрива- ются другие модификации регуляторов состояния. Их синтез осно- ван на минимизации квадратичного критерия качества или на зада- нии желаемого расположения полюсов. Вопросы управления объектами с большим запаздыванием, включая использование регуляторов-предикторов, изложены в гл. 9.
Иерархическая структура управления 17 Поскольку при проектировании систем управления почти всегда следует учитывать изменения параметров объекта, в гл. 10 иссле- дуется чувствительность различных алгоритмов управления и даются рекомендации для ее уменьшения. В гл. И проведено под- робное сравнение наиболее важных алгоритмов управления для детерминированных сигналов. Оцениваются расположение полюсов и нулей замкнутых систем, качество процессов и затраты на управ- ление. Исследование свойств алгоритмов завершается приведением рекомендаций по их использованию. После краткого описания ма- тематических моделей дискретных стохастических сигналов (гл. 12) в гл. 13 рассмотрены среди прочего вопросы выбора оптимальных параметров параметрически оптимизируемых алгоритмов управ- ления при наличии стохастических возмущающих сигналов. Регу- ляторы с минимальной дисперсией, синтезируемые на основе парамет- рических моделей объектов и сигналов, выводятся и анализируются в гл. 14. Для применения в адаптивных системах управления пред- ложены модифицированные регуляторы с минимальной дисперсией. В гл. 15 описаны регуляторы состояния для стохастических воз- действий и приведены иллюстративные понятия оценки состояний. На нескольких примерах показана методика синтеза связных си- стем'. каскадных систем управления (гл. 16) и систем управления с прямой связью (гл. 17). Различные методы синтеза алгоритмов управления с прямой связью, например основанные на параметри- ческой оптимизации или принципе минимальной дисперсии, допол- няют описанные ранее методы синтеза алгоритмов управления с об- ратной связью. Для синтеза многомерных систем управления (гл. 18) сущест- венное значение имеет форма представления структуры многомер- ного объекта. При этом используются передаточные функции и представление в пространстве состояний. При рассмотрении много- мерных параметрически оптимизируемых алгоритмов управления в гл. 19 вводятся понятия главного регулятора и регулятора связи (который может использоваться как для усиления перекрестных связей, так и для развязки систем), исследуются области устойчи- вости и взаимное влияние главных регуляторов, а также приведены правила настройки параметров двумерных систем управления. Матричное полиномиальное представление может быть использо- вано при синтезе многомерных апериодических регуляторов и регу- ляторов с минимальной дисперсией (гл. 20). Методы проектирования многомерных систем управления с регуляторами состояния, изло- женные в гл. 21, основаны на использовании заданного расположе- ния полюсов, решении матричного уравнения Риккати и проведе- нии развязки контуров. Здесь также рассмотрены многомерные регуляторы состояния с минимальной дисперсией. Другой важной частью содержания книги является изложение теории адаптивных алгоритмов управления, чему посвящены гла- вы 22—25. После краткого обзора этого вопроса в гл. 22 приведены
18 Гл. 1. Введение описание и сравнительные оценки различных методов текущей идентификации динамических объектов и стохастических сигналов, использующих алгоритмы рекуррентного оценивания параметров (гл. 23). Оценивание параметров в замкнутом контуре управления при наличии и отсутствии внешнего возмущения обсуждается в гл. 24. Наконец, в гл. 25 рассмотрены системы управления с под- стройкой параметров, в которых используются различные сочета- ния методов синтеза регуляторов и оценивания параметров. Для этой цели больше всего подходят алгоритмы управления, характери- зующиеся малыми вычислительными затратами на синтез и удов- летворяющие требованиям к идентификации в замкнутом контуре, т. е. регуляторы с конечным временем установления (апериодичес- кие) и регуляторы с минимальной дисперсией. Были запрограм- мированы и проверены различные алгоритмы управления с под- стройкой параметров, после чего было проведено их сравнение по результатам моделирования работы систем с реальным объектом и аналоговой моделью объекта. В некоторых примерах были отмече- ны быстрая сходимость и хорошее качество управления этих циф- ровых алгоритмов с подстройкой параметров. Принцип параметри- ческой адаптации был также использован для адаптивного управле- ния с прямой связью и многомерного управления. Нелинейности, обусловленные квантованием по уровню или ошибками округления, и порождаемые ими эффекты, например статические ошибки и пре- дельные циклы при цифровом управлении с обратной связью или зоны нечувствительности в цифровых системах с обратой связью и фильтрах, исследуются в гл. 26. Гл. 27 связана с аналоговой и циф- ровой фильтрацией сигналов возмущения. В ней рассмотрены вопро- сы реализации цифровых фильтров высоких и низких частот и ре- куррентного сглаживания. Различные способы управления испол- нительными устройствами с помощью прямой и обратной связи описаны в гл. 28. В гл. 29 кратко изложена методика автоматизи- рованного проектирования алгоритмов управления. Последняя глава содержит практические примеры применения методов идентификации и автоматизированного проектирования цифровых алгоритмов управления теплообменником и барабанной сушилкой. Кроме того, в ней на примере модели парогенератора проведено сравнение двух подходов к построению систем управле- ния — использования идентификации в сочетании с автоматизи- рованным синтезом и построения адаптивной системы с подстройкой параметров.
ЧАСТЬ I Объекты управления и управляющие ЭВМ ГЛАВА 2 Принципы управления с помощью ЭВМ Квантование информации Данные, обрабатываемые управляющими ЭВМ, предварительно квантуются по времени и преобразуются в цифровую форму. Сле- довательно, они представляют собой дискретные сигналы, кванто- ванные как по времени, так и по амплитуде, что иллюстрируется рис. 2.1. В отличие от непрерывных сигналы, поступающие в ЭВМ, при- нимают дискретные значения в дискретные моменты времени. Таким образом формируется последовательность амплитудно-модулиро- ванных импульсов, высота каждого из которых пропорциональна величине непрерывного сигнала. В аналого-цифровом преобразова- Квантователь Аналого-цифровой преобразователь Временная шкала: Непрерывная Дискретная Дискретная Рис. 2.1. Модулированный по амплитуде, дискретный во времени и по уровню сигнал, получающийся в результате квантования и аналого-цифрового преобра- зования непрерывного сигнала.
20 Ч. I. Объекты управления и управляющие ЭВМ теле значение амплитуды импульса подвергается либо округлению, либо усечению в зависимости от типа устройства. Квантование по времени обычно представляет собой периодиче- ский процесс, характеризующийся тактом дискретности То. Эта операция выполняется мультиплексором, конструктивно объединен- ным с устройством автоматического масштабирования и аналого- цифровым преобразователем. Оцифрованные входные данные посту- пают далее в центральный процессор. Здесь они обрабатываются по запрограммированным алгоритмам, в результате чего формируются Рис. 2.2. Управляющая ЭВМ как средство обработки оцифрованных данных. k=0, 1, 2, 3..... выходные данные. Если исполнительное устройство имеет аналого- вый вход, эти данные поступают в цифро-аналоговый преобразова- тель, на выходе которого имеется фиксатор (эстраполятор нулевого порядка). Упрощенная блок-схема описанной системы изображена на рис. 2.2. Замыкание ключей, стоящих на входе и выходе системы, проис- ходит не одновременно, а с интервалом Tr. Эта задержка равна времени, затрачиваемому на преобразование аналоговой информа- ции в цифровую форму и последующую ее обработку в центральном процессоре. Поскольку интервал TR, как правило, значительно меньше постоянных времени исполнительных устройств, датчиков и объектов управления, им часто пренебрегают, полагая, что входные и выходные квантователи действуют синхронно. Кроме того, при использовании ЭВМ, работающих со словами длиной 16 разрядов или более, и аналого-цифровых преобразователей, имеющих не менее 10 двоичных разрядов, эффекты квантования по уровню прак- тически незаметны. Поэтому в первом приближении можно считать, что амплитуды дискретных сигналов изменяются непрерывно. С учетом указанных упрощений структура замкнутого контура управления с ЭВМ в качестве средства обработки дискретной ин- формации приобретает вид, показанный на рис. 2.3. В этой системе
Гл. 2. Принципы управления с помощью ЭВМ 21 квантователи, действуя синхронно, вырабатывают сигналы, диск- ретные только во времени. Управляемая переменная и вычисляется по запрограммированному алгоритму, входными величинами для которого служат регулируемая переменная у и задающая перемен- ная w. Дискретные контуры, подобные описанному, характерны не Рис. 2.3. Замкнутый контур управления с ЭВМ, используемой для обработки дискретных данных. только для систем управления динамическими объектами, постро- енных на базе ЭВМ. Проблемы обработки дискретных данных возникают и в других приложениях, например: — при решении задач, в которых измеряемые переменные до- ступны лишь в определенные моменты времени (в частности, таковы данные, поступающие с вращающихся антенн радиолокаторов, полу- чаемые при измерении расстояний с помощью радиодальномеров; в газовой хроматографии, при отборе проб вещества с целью его последующего лабораторного анализа; используемые в социально- экономических, биологических, метеорологических исследованиях и т. п.); — при мультиплексировании дорогостоящего оборудования связи (кабельных линий, каналов). Проектирование цифровых систем управления При разработке электронных, пневматических или гидравличе- ских аналоговых регуляторов проектировщик по техническим или экономическим соображениям вынужден пользоваться достаточно узким набором элементов, действующих как интеграторы (И), диф- ференциаторы (Д) или пропорциональные усилители (П). В силу этого при синтезе систем управления аналогового типа приходится сталкиваться с весьма серьезными ограничениями. Иначе обстоит дело с алгоритмами для управляющих ЭВМ. Гибкость программных средств существенно расширяет возможность реализации сложных алгоритмов. Это создает предпосылки для практического примене- ния новейших методов современной теории управления, но одно- временно ставит перед проектировщиком вопрос: какой управляю- щий алгоритм наиболее эффективен при решении конкретной при- кладной задачи? Естественно, ответ на этот вопрос возможен лишь в том случае, когда имеется достаточно полное описание объекта в форме его математической модели и известны показатели, по ко-
'££ Ч. I. Объекты управления и управляющие ЭВМ торым можно сравнивать алгоритмы различных типов. Такими показателями служат качество управления, обеспечиваемое алгорит- мом, сложность его реализации, чувствительность к изменению параметров и воздействию помех, требуемая производительность ЭВМ, а также некоторые свойства объекта управления (его линей- ность или нелинейность, расположение полюсов и нулей, наличие задержек, структура связей в многосвязном объекте). По теории дискретных систем опубликовано значительное число работ. Кроме того, во многих книгах по технической кибернетике имеются главы, посвященные решению задач цифрового управле- ния. В первых монографиях по теории дискретных систем изложе- ние основывалось на разностных уравнениях ([2.1], [2.2]). За ними последовали книги, в которых использовался аппарат z-преобразо- вания ([2.3] — [2.13], [2.15], [2.20]), и, наконец, был разработан метод пространства состояний ([2.14], [2.17] — [2.19], [2.21]). К пере- численным работам можно добавить многочисленные труды конфе- ренций. Что же касается книг прикладной направленности, то в них в основном рассматриваются алгоритмы, полученные путем дискре- тизации аналоговых регуляторов с пропорциональными, интеграль- ными и дифференцирующими связями. В рамках методики проектирования цифровых систем управле- ния, описываемой в этой книге (см. также обзорную схему на рис. 1.2), должны быть решены следующие проблемы: 1. Получение информации об объекте управления и о сигналах. Отправной точкой процесса проектирования системы управления является информация об объекте управления и о сигналах, участ- вующих в его описании. Она может быть представлена в различных формах, например: — в виде доступных непосредственному измерению входов, вы- ходов, переменных состояния; — в форме моделей объектов управления и моделей сигналов; — в форме оценок сигналов и состояний объектов управления. Для построения моделей объектов управления и сигналов могут применяться методы идентификации и оценивания параметров. Модели объектов, кроме того, могут быть получены и с помощью теоретических выкладок. Недоступные измерению переменные со- стояния можно восстанавливать, используя методы теории наблю- дателей или оценки состояния. 2. Выбор структуры системы управления. Описав математическую модель объекта управления и задав соответствующий набор регулируемых и управляемых переменных, проектировщик должен определить тип системы управления. Суще- ствуют, в частности, следующие типы систем: * — системы управления с одним входом и одним выходом; , — системы управления с перекрестными связями; — системы управления со многими входами и многими выходами.
Гл. 2. Принципы управления с помощью ЭВМ 23 3. Разработка алгоритмов для управления в прямой цепи и це- пях обратных связей (синтез и настройка). Завершающим этапом проектирования является синтез алгорит- мов управления в цепях прямой и обратных связей, а также их настройка (или подстройка) с учетом конкретных условий функцио- нирования системы. Последнее можно выполнять различными спо- собами: — проводя подстройку параметров вручную, руководствуясь несложными правилами; — с помощью автоматизированного расчета на ЭВМ; — используя самооптимизирующиеся адаптивные алгоритмы управления. Как правило, применяя различные методы синтеза, можно получить несколько алгоритмов управления, отличающихся по своим харак- Синтез сис- Рис. 2.4. Общая схема проектирования цифровых систем управления. теристикам. Среди них необходимо выбрать наилучший, исходя из совокупности различных показателей. 4. Фильтрация шумов. Высокочастотные шумы, вносящие помехи в измерения управ- ляемых переменных, но сами недоступные измерению, должны подав- ляться с помощью аналоговых и цифровых фильтров. 5. Корректирующие алгоритмы в прямых цепях и цепях обрат- ных связей исполнительных устройств. В цепях прямых и обратных связей исполнительных устройств в зависимости от их конструкции могут применяться различные алго- ритмы коррекции. При разработке алгоритмов управления объектом следует учитывать динамические свойства корректирующих алго- ритмов.
24 4. I. Объекты управления и управляющие ЭВМ Работоспособность всех алгоритмов управления и фильтрации должна анализироваться с учетом эффектов квантования по уровню. На рис. 2.4 представлена общая схема процесса проектирования цифровых систем управления. Если для параметрической оптимиза- ции простых алгоритмов управления применяются несложные про- цедуры подстройки параметров, то можно ограничиться простей- шими моделями объектов. При проведении однократного расчета алгоритмов на ЭВМ необходимы точные модели объектов управле- ния и сигналов, для формирования которых наиболее целесообразно использовать методы идентификации и оценивания параметров. Если же.процесс получения информации и расчета алгоритма управ- ления носит непрерывный характер и может протекать в реальном времени, возможно построение самооптимизирующейся адаптивной системы управления.
ГЛАВА 3 Дискретные системы управления Эта глава представляет собой краткое введение в математическую теорию линейных дискретных систем (т. е. систем обработки дискретной информации). В ней приводятся лишь наиболее важные соотношения, лежащие в основе методов проектирования цифровых систем управления. С целью более глу- бокого изучения теории дискретных систем читателю следует ознакомиться с такими широко известными работами как, например, [2.3], [2.4], [2.10] — [2.14], [2.17], [2.18]. 3.1. ДИСКРЕТНЫЕ СИГНАЛЫ 3.1.1. Дискретные по времени функции и разностные уравнения Дискретность (и, следовательно, разрывность) сигналов обуслов- лена их квантованием по уровню и (или) по времени. В противо- положность непрерывным сигналам, которые описываются непре- рывными функциями времени, дискретные сигналы могут прини- мать лишь дискретные значения в дискретные моменты времени. В дальнейшем будут рассматриваться сигналы, дискретные только во временной области. Они представляют собой последовательности импульсов, появляющихся в определенные моменты времени. Обыч- но дискретный сигнал получается в результате периодического прерывания непрерывного сигнала с постоянным тактом. Сущест- вуют разные способы модуляции отдельных импульсов, входящих в последовательность. Они отличаются допустимыми значениями ам- плитуд, шириной импульсов и модулирующей частотой. В цифровых системах управления обычно применяется лишь амплитудная моду- ляция импульсов, причем в основном тот ее вариант, при котором высота импульса пропорциональна текущему значению непрерыв- ного сигнала, ширина постоянна, а интервалы между импульсами одинаковы и равны такту квантования (см. рис. 3.1.1). Поскольку к дискретным сигналам этого типа применима теорема суперпозиции, они описываются линейными соотношениями, аналогичными по форме уравнениям линейных динамических систем. Рис. 3.1.1 ил- люстрирует принцип получения последовательности импульсов, основанный на пропускании непрерывного сигнала x(t) через ключ, который периодически, с тактом квантования То, замыкается на время h. Если длительность импульса h существенно меньше такта квантования То, а за ключом стоит линейное звено с постоянными времени Ti h, то последовательность импульсов хр (t) можно
26 4. J. Объекты управления и управляющие ЭВМ приближенно рассматривать как дискретный сигнал хт(кТ0), пока- занный на рис. 3.1.2. В этом случае ключ действует как идеальный квантователь, и величины хт(кТ0) равны мгновенным значениям амплитуд. x(t) Xp(t) Рис. 3.1.1. Формирование амплитудно-модулированного дискретного сигнала путем пропускания непрерывного сигнала через ключ с периодом замыкания То и продолжительностью замыкания h. Модулированная по амплитуде дискретная функция хт (t), получаемая путем квантования по времени непрерывного сигнала x(t) с постоянным тактом То, математически описывается выраже- нием xT(t) = x(kT0) при t = kT0, 1 , ' п + ? к = 0, 1,2, .... (3.1-1) zT(t) = O при kT0 < t < (к+ 1) То; J Формирование дискретных по времени функций различных типов иллюстрируется приведенными ниже примерами. Ко Рис. 3.1.2. Дискретный сигнал хт(к), получаемый на выходе квантователя (h<T0). Пример 3.1.1. а) В результате квантования непрерывная функция времени х (t) = e~aZ преобразуется в дискретную по времени функцию (t = kT0) х (кТ0) = е-«кт<>, к = 0, 1, 2, ....
Гл. 3. Дискретные системы управления 27 Таким образом, эти функции связаны явным соотношением хт (t) — х (kT0). б) Операция интегрирования t х (t)==T$ w dt о выполняется численно путем аппроксимации w (t) ступенчатой функцией- При этом интеграл заменяется суммой к- 1 х (кТ0) =2- У Tow (vT0). Т Zt Поскольку х (кТ0) зависит от второй дискретной функции, т. е. хт (t)=x(kTo)=f[w(vTo), kT0], результат записывается в неявной форме. В следующем примере показывается, как неявную функцию можно представить в виде разностного уравнения. Пример 3.1.2. Из выражения, полученного в примере 3.1.1, б, следует, что к х ((к 4-1) То)=2- Tow(vTo). 1 v=0 После вычитания имеем х ((к4- 1) Т0)-х (кТ0) = 21 w (кт0) или х (к4-1) 4~ахх (к) = bxw (к). Уменьшив к на 1, приходим к окончательному соотношению х (к) 4- aix (к— 1) = biw (к— 1), где ai =—1; Ьг = Т0/Т. Это—линейное разностное уравнение первого порядка. Для получения разностного уравнения достаточно любую диск- ретную функцию, зависящую от другой дискретной функции, пред- ставить в рекуррентной форме. Линейное разностное уравнение по- рядка m имеет вид x(k)4-a1x(k—1)4- . .. 4-amx(k—m) = = bow(k)4-brw(k— 1)4- . . . 4-bmw(k —m). (3.1-2) Здесь аргумент kT0 заменен индексом к. Величину выходного сигнала при любом к можно вычислить с помощью рекуррентной формулы х(к) = — ахх(к—1)—..атх(к-т)4- 4-b0w(k)4-b1w(k —1)4-... 4-bmw(k—т), (3.1-3)
28 Ч. 1. Объекты управления и управляющие ЭВМ. если известны текущее значение входа w(k) и m предшествующих значений w(k—1),. . w(k—m), а также соответствующие значе- ния выхода х(к—1),. . х(к—т). Другой способ построения разностных уравнений состоит в дискретизации дифференциальных уравнений. При этом дифферен- циальное уравнение первого порядка аппроксимируется разност- ным уравнением первого порядка, дифференциальное уравнение второго порядка — разностным уравнением второго порядка и т. д. При замене дифференциалов левыми разностями справедливы сле- дующие соотношения: Непрерывная функция первая производная dx (t) “dt- = lim At-»-o x (t) — x (t — At) At вторая производная dx (t) “dt~ d2x (t) —л = hm dta д+->< dx (t — At) dt At Дискретная функция разность первого порядка Ах (к) = х (к) —х (к— 1) разность второго порядка А2х(к) = Дх(к)—Ах (к—1) = = х (к) — 2х (к— 1) -J-х (к — 2) В следующем примере показано, как осуществляется дискрети- зация дифференциального уравнения первого порядка. Пример 3.1.3. Дифференциальное уравнение первого порядка имеет вид T^=w(t): Заменяя дифференциал левой разностью, полученной при такте квантова- ния Т0) имеем выражение х (к)—х (k—l)=^?w(k). Если для дискретизации применяется правая разность Ах' (к) = х (к+1) — х (к), то получается то же уравнение, что и в примере 3.1.2: х(к-Н)— x(k)=^?w(k). Описанные способы аппроксимации дают удовлетворительные результаты только в тех случаях, когда такт квантования То мал по сравнению с постоянной времени Т. Выражение (3.1-2) является наиболее распространенной формой записи разностных уравнений. Если использовать разности высших порядков вплоть до m-го, разностное уравнение можно представить
Гл. 3. Дискретные системы управления 29 в виде, аналогичном дифференциальному уравнению: отДтх (к) + ат_1Дт-1х(к) + ... +а,Дх (к) + х (к) = = M’"w(k) + 0n_1A"1-1w(k)+ ... +₽Iaw(k)+₽,w(k). (3.1-4) Впоследствии будет описан еще один метод получения разност- ных уравнений, справедливый и при больших значениях такта квантования То. 3.1.2. Решетчатые функции Эффективный математический метод описания дискретных функ- ций основывается на замене последовательности импульсов xp(t) решетчатой функцией, состоящей из идеальных импульсов. Идеаль- ный импульс определяется как [О, t=£0, 6<‘)=и t = o, (31-5) а его площадь равна $ 6(t)dt = lc. (3.1-6) — со Если продолжительность замыкания ключа значительно меньше такта квантования, т. е. h То, импульсы последовательности xp(t), имеющие площадь x(t)h, можно приближенно заменить иде- альными импульсами 6(f) той же площади: 00 xp(t)«xe(t)-^P-L «(t-kT.). (3.1-7) k=0 Решетчатая функция x6(t) физически нереализуема: она служит лишь удобной формой представления последовательности реальных Условие Рис. 3.1.3. Приближение последовательности реальных импульсов последователь- ностью идеальных импульсов. импульсов хр (t). Введение идеального квантователя, формирую- щего 6-импульсы, позволяет значительно упростить математический .шпарат, используемый для описания процессов прохождения ди- скретных сигналов через линейные динамические-звенья. Этот приближенный переход иллюстрируется рис. 3.1.3. Предполагается,
30 Ч. 1. Объекты управления и управляющие ЭВМ что площади реальных и соответствующих им идеальных импульсов одинаковы. Учитывая, что последовательность идеальных импульсов опре- делена лишь в моменты времени t = kT0, k=0, 1,2, . . ., уравне- ние (3.1-7) можно переписать в виде М‘) = 1гЁ x(kT0)6(t-kT0). (3.1-8) k = 0 При анализе динамических систем с одинаковыми, синхронно работающими ключами на входе и выходе, продолжительность замы- кания h не учитывается. Фактически эта величина не влияет на ко- нечный результат, если за ключом стоит экстраполятор. Поэтому ее можно выбрать произвольно, например положить для простоты h-=l с. В этом случае последовательность идеальных импульсов описывается выражением x*(t)=Sx(kT,)6(t-kT,). (3.1-9) k = 0 В уравнении (3.1-9), полученном после нормализации (3.1-8), выходные сигналы квантователя (см. рис. 3.1.2) умножаются на идеальные импульсы 6(t—kT0). Напомним, что вывод этого уравнения опирался на следующие допущения: a) h < То; б) выход квантователя подается на линейную реализуемую систему G (s)=Z (s)/N (s). 3.2. ПРИМЕНЕНИЕ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА ДЛЯ АНАЛИЗА ДИСКРЕТНЫХ ФУНКЦИЙ ВРЕМЕНИ 3.2.1. Преобразование Лапласа Применение к единичному идеальному импульсу преобразова- ния Лапласа х (s) = L |х (t))= $ х (t) e-st dt, (3.2-1) о где s = o-}-i(i)—комплексная переменная, дает Lp(t)) = $ б (t) e~st dt = 1, (3.2-2) а применение того же преобразования к импульсу, за кТ0, дает сдвинутому (3.2-3) L (б (t—кТ0)} =e-kT»s.
Гл. 3. Дискретные системы управления 31 С учетом этих соотношений уравнение (3.1-9) приобретает вид L {х* (t)} = х* (s) = 2 х (кТ0) e-kT°s. (3.2-4) к=0 Отсюда следует, что преобразование Лапласа дискретной функ- ции времени является периодической функцией с частотой повто- рения со0 = 2л/Т0, (3.2-5) поскольку х* (s -f- ivco0) — х* (s), v = 0, ±1, ±2, .... (3.2-6) Для того чтобы получить последнее условие, достаточно в урав- нении (3.2-4) заменить s на s-f-ivcoo. Подставим s = o+ico в выражение (3.2-6): х* (o + i (co + vco0)) = х* (о+ ico), v = 0, ±1, ±2, .... (3.2-7) Очевидно, функция х* (s) повторяется с периодом vco0. Следо- м.ггельно, если х* (6+ico) известна при всех значениях переменной а и.-I интервале —со0/2^со^со0/2, т. е. в пределах основной полосы плоскости s, она определена на всей плоскости. Функции х* (s) имеют одни и те же значения в конгруэнтных точках, принадлежа- щих различным дополнительным полосам, соответствующим более in.icoким частотам. 3.2.2. Теорема прерывания Если непрерывный сигнал х (t) квантуется с малым тактом То= •= At, то его преобразование Лапласа, определенное соотношением (3.2-1), можно приближенно заменить бесконечной суммой х (s)« 2 х (kAt) e~kAts At. (3.2-8) к = 0 Сравнивая выражение (3.2-8) с уравнением (3.2-4), можем .ишсать Tox*(s)«x(s) или Тох* (о-|-ico)«x (о+ico), (3.2-9) если’такт То достаточно мал. Если непрерывный сигнал х (t) имеет ограниченную полосу 'i.ictot, его преобразование Фурье (рис. 3.2.1, а) удовлетворяет условиям х(ко)^0 при — сотах < со < сотах; х(ко) = 0 при со < — сотах и со > сотах. Предположим, что такой сигнал подвергается квантованию с малым тактом То, после чего аппроксимируется последователь- ностью х* (t). Если величина То достаточно мала, преобразование
32 Ч. I. Объекты управления и управляющие ЭВМ. Фурье, как показано на рис. 3.2.1, б, распадается на «основной спектр» T0x*(ico)«x(ico), —comax<co<comax, и совокупность повторяющихся с периодом со0 «дополнительных спектров» Тох* (ico + vcoo)«x (ico), v=±l, ±2, .... Таким образом, в спектре квантованного сигнала по сравнению со спектром непрерывного появляются дополнительные высокочас- тотные составляющие. в Рис. 3.2.1. а — преобразование Фурье для непрерывного сигнала; б — преобразование Фурье для им- пульсного сигнала; в — амплитудная частотная характеристика идеального полосового фильтра. Допустим, исходный непрерывный сигнал восстанавливается с помощью идеального полосового фильтра, имеющего следующую характеристику (рис. 3.2.1, в): |G(ko)|~= 1, |G(ko)| = 0, ^шах ® ®шах» (0 С0тах И СО > <Отах.
Гл. 3. Дискретные системы управления 33 1 Ьдобная операция может быть выполнена без ошибки только при условии соо/2 ©max- Если же частота квантования недостаточно велика, т. е. a>0/2«<comax, на основной накладываются дополнитель- ные спектры и точное выделение исходного спектра становится невозможным. Следовательно, в этом случае нельзя восстановить без ошибки непрерывный сигнал, даже если он обладает ограни- ченной полосой частот. Для того чтобы непрерывный сигнал со спектром, ограниченным максимальной частотой сотах, можно было точно восстановить по последовательности его дискретных значений, необходимо; чтобы частота квантования соо удовлетворяла условию о>о>2Ютах. (3.2-10) Следовательно, для такта квантования То, согласно уравне- нию (3.2-5), должно выполняться условие Т0<л/сотах. (3.2-11) Полученный результат составляет содержание теоремы преры- вания, сформулированной Шенноном 1). Квантователь Рис. 3.2.2. Квантователь с экстраполятором нулевого порядка. Заметим, что в системах управления или передачи информации на практике непрерывные сигналы с ограниченными спектрами не встречаются. Тем не менее в теории цифрового управления шенно- новская частота cosh==w(1/2 = л/Т0 (3.2-12) играет роль своего рода эталонной константы. Она определяет полосу пропускания дискретной системы. з.2.3. Фиксирующий элемент Если в дискретной системе после квантователя стоит фиксатор । жстраполятор нулевого порядка), который на период, равный i.iKTy квантования, фиксирует мгновенное значение дискретного и гнала х(кТ0), на его выходе формируется ступенчатый сигнал ipiic. 3.2.2). ]) Данную теорему в отечественной литературе называют теоремой Ко- Ъ’1ьникова.— Прим, перев.
34 Ч. 1. Объекты управления и управляющие ЭВМ. Передаточную функцию экстраполятора нулевого порядка можно получить следующим образом. Предположим, на вход его поступает последовательность импульсов 00 , x'(t)=Sx(kT,)6(t-kT,), k=0 для которой преобразование Лапласа имеет вид х* (s) == ^ х (kT0) e~kT»s. к=0 Выходом экстраполятора является ступенчатый сигнал m(t) = J х(кТ0)[1 (t-кТ0) —1 (t-(к4- 1) То)]. к=0 Для него преобразование Лапласа определяется выражением m(s)==]£ х(кТ0)е-кТ<>5--^[1 — e*T»s]. к=о x*(s) Отсюда получаем передаточную функцию экстраполятора ну- левого порядка На низких частотах он ведёт себя подобно фильтру с переда- точной функцией апериодического звена: lim Н (ico) = lim Л /1-----75-----------------А =' гтХ°~- ~ • (о-*0 <о->о1Сй . | Tpico (Т0ко)а 1+То1® \ II 21 / (3.2-14) 3.3. Z-ПРЕОБРАЗОВАНИЕ 3.3.1. Введение в метод z-преобразования Определив новую переменную z = ет»'== eTo(0+£a) = ет»а [cos Тосо + i sin Т0со], (3.3-i) подставим ее в уравнение (3.2-4). В результате получаем z-npe- образование импульсного сигнала x*(t): х(z)3{х(kT0)} = 2 x(kTo)z-k=x(O)4-x(l)z-J4-x(2)z'2+... . к=0 (3.3-2)
Гл. 3. Дискретные системы управления 35 Этот бесконечный ряд сходится, если все его члены |х(кТ0)| ограничены и если справедливо условие |z|>1. Поскольку величина о может выбираться произвольно, сходимость имеет место для широкого класса функций х(кТ0). Следует иметь в виду, что метод /.-преобразования основывается на тех же предположениях, что и преобразование Лапласа, причем особенно важно выполнение условия х(кТ0)—0 при к<0. Ниже приводится несколько примеров вычисления z-преобразо- ваний. Пример 3.3.1 а) Дана ступенчатая функция: х(кТ0) = 1 (кТ0), к = 0, 1, .... В соответствии с определением (3.3-2) z-преобразование для этой функ- ции имеет вид X (z) = 1 +z~1 + z~2 +, . . . (’.умму полученной бесконечной геометрической прогрессии можно записать |’. явной форме: Z \ I I 1 х (z) = ----г==----г, если z > 1. 1 — z-1 z — 1 1 б) Дана экспоненциальная функция: х (кТ0) = е~акТо (а—действительное число). х (z) == 1 + (eaToz)-1 -f- (eaToz)-24-,.. =-j— JT . =-Z n~-= —7—, ' ’ 1 ’ 14 7 1 1 — (eaToz)-1 z—e~aTo z-f-aj если | eaToz | > 1. в) Дана синусоидальная функция: x (kT0) =sin ед kT0. Записав эту функ- цию в виде sin сО1кТ0=^г [eic°ikTo — e-i“ikTo], используем результат предыдущего примера при a=icof (или а = — . ч 1 Г z z ~]____ z sin одТр_____________b|Z Х Z' 2i |_ z — ei“iT0 z — e_i“iTo J z2 — 2z cos CO1T0+1 z24-a1z4-l* Приведенные примеры иллюстрируют методику получения z- преобразований для некоторых простейших функций. Аналогичным способом составляются таблицы, содержащие наиболее часто упот- ребляемые функции. Небольшая таблица такого рода помещена в приложении к данной книге. В ней для нескольких непрерывных функций времени даны преобразования Лапласа и z-преобразова- ния. Анализ этой таблицы позволяет заключить следующее: а) Имеется непосредственная взаимосвязь между знаменателями выражений для x(s) и x(z), т. е. (s_S1)n ^(2_21)П’ где z1=eT°s». б) Прямое соответствие между числителями x(s) и x(z) отсутст- вует. В частности, у х (z) числитель может описываться полиномом, даже если числитель x(s) — функция иного типа.
36 Ч. 1. Объекты управления и управляющие ЭВМ. 3.3.2. Теоремы z-преобразования Ниже приведены некоторые важнейшие теоремы, используемые при вычислении z-преобразований. Вывод этих теорем читатель сможет найти в книгах, перечисленных в начале этой главы. а) Линейность 5 {ах, (кТ0) + Ьх2 (кТ 0)} = ag{х, (кТ0)} + bg {х2 (кТ0)}. б) Сдвиг по времени вправо 3{х(кТ0 — dT0)} = z~dx(z), d>0. в) Сдвиг по времени влево d>0. г) Изменение масштаба по переменной z 3 {х (к) е-акт°} = х (zeaT°). д) Начальное значение х (+0) = lira х (z). Z->00 e) Конечное значение 7 — - 1 lim x (kT0) = lim-------x (z) = lim (z—1) x (z). k->oo z->l z z-> 1 3.3.3. Обратное z-преобразование В отличие от преобразоваия Лапласа, для которого прямой и обратный переходы x(t)->x (s) и х (s)->x (t) выполняются однозначно, z-преобразование x(t)->x(z) и обратное z-преобразование x(z)-> ->х (t) не обладают этим свойством. Объясняется это тем, что они не учитывают поведения функции х (t) в промежутках между моментами срабатывания квантователя. В то же время преобразование х(кТ0)-> ->х(г)и обратное преобразование x(z)->x(kT0) взаимно однознач- ны. На практике обратное z-преобразование вычисляют, записывая функцию x(z) как сумму элементарных членов, содержащихся в таблицах z-преобразований, или просто поделив числитель x(z) на ее знаменатель. В последнем случае получается ряд вида x(z) = c0 + c1z-1 + c2z-2+... . Из уравнения (3.3-2) следует, что х(О) = со; х(1) = с,; х(2) = с2 и т. д.
Гл. 3. Дискретные системы управления 37 3.4. ДИСКРЕТНАЯ ПЕРЕДАТОЧНАЯ ФУНКЦИЯ 3.4.1. Сумма свертки I Гредположим, что квантователь стоит на входе линейной си- гмы с передаточной функцией G(s) или переходной функцией I), как показано на рис. 3.4.1. Импульсный входной сигнал, Рис. 3.4.1. Линейная система с импульсным входом и выходом. поступающий в систему, описывается выражением u«(t)=2u(kT0)d(t-kT0). (3.4-1) k=0 Учитывая, что переходная функция g(t) определяет реакцию системы на единичный импульс 6 (t), ее выходной сигнал выражается суммой свертки y(t)=2u(kT0)g(t-kT0). . (3.4-2) k=0 Если квантование входного и выходного сигналов осущест- вляется синхронно, при t = nT0 имеем У (пТ0) = 2 u(kT0)g((n—k)T0)= 2 u((n —v) T0)g(vT0). (3.4-3) k=0 v=0 3.4.2. Дискретная передаточная функция Для того чтобы получить преобразование Лапласа импульс- ного сигнала на выходе системы, воспользуемся уравнением У* (s) = 2 У (nT0) e-nT°s = 2 2 u (кТ0) g (n—k) To) e-nT»s. n=0 n=0k=0 Подставим в эту формулу q = n — k: CO 00 y*(s)= 2 2 u(kT0)g(qT0)e-qTose-kToS = q = -k k = 0 =-Sg(4T«)e-<iT.5 £ q = 0 k=0 y* (s) = G* (s) u* (s). ) (3.4-4) (3.4-5)
38 Ч. I. Объекты управления и управляющие ЭВМ Отсюда дискретную передаточную функцию можно определить как G*(s) =^=Sg(4'r°)e'(1ToS- (3.4-6) Переходя к переменной z = eT«s, введем также дискретную пере- даточную функцию по переменной z: СО G (z) =|g- = Е g (qT.) = J (g (q)}. (3.4-7) Вычисление z-передаточных функций иллюстрируется двумя примерами. Пример 3.4.1. Апериодическое звено без экстраполятора на входе. Аиериодическое звено с передаточной функцией К _ К' 1 1-f-Ts a-f-s ’ где а — 1/Т, К' = К/Т, имеет импульсную переходную функцию g(t) = K'e~at. Подставим в это выражение t = kT0. g (kT0) = К'е-<*т0. Используя определение (3.4-7) и результат примера 3.3.1, б, получим дискрет- ную передаточную функцию G (z) = К' У (eaToZ) - я=-К-дТ-=—г-, ' ' 1—е-а,То l + aiz~i 4=0 Вычислим параметры этой передаточной функции при К=1, Т = 7,5с, Т0 = 4с: Ьо = К' = К/Т = 0,1333; ai = — е~ «т» = — 0,5866. Описанное выше преобразование можно условно выразить как переход G « = J {[L-* {G (s)}]„kT.} = 8(G (s)}. (3.4-8) Символ % {х (s)} подразумевает, что функция х (z), соответст- вующая х (s), отыскивается непосредственно по таблице z-преоб- разований. Так, можем записать G(z) = gjG(s)(-z{^}-7^- (З-М) Если на входе непрерывной системы стоит экстраполятор нулевого порядка, как показано на рис. 3.4.2, дискретная передаточная
Гл. 3. Дискретные системы управления 39 Санкция импульсной системы меняется: HG (z) = > {Н (s) G (s)} = > G (s)| I s J z Is) (3.4-10) Пример 3.4.2. Апериодическое звено с экстраполятором на входе. Рис. 3.4.2. Линейная система с экстраполятором нулевого порядка и импульсным входом и выходом. Воспользуемся уравнением (3.4-10) и таблицей z-преобразований, поме- щенной в приложении: HGw-izl2 ( К' (-e-T-)z £_ ' ' z (s(a + s)J z (z—1) (z — e'aT°) a (l — e-aT0) b^-1 (z — e_flTo) a 1 — ajz-1 ’ Подставив в полученное выражение те же значения параметров, что и в предыдущем примере, имеем ах = —е~аТо = —0,5866, bf = (1-—еаТо)-^- = 0,4134. Сравнивая эти величины с полученными в примере 3.4.1, обратим вни- мание на то, что bf отличается от Ьо. Примеры, в которых рассматриваются системы более высокого порядка, приводятся в разд. 3.7.2. Динамические свойства линей- ной стационарной системы с сосредоточенными параметрами пол- ностью определяются его дифференциальным уравнением, имеющим вид аиу(т> (t) +ат-/У(т-1) (t)+ • •. +aty (t) + y (t) = = bOTu(m> (t) + bm. (t) +...&/ ii (t) + b0 u (t). (3.4-11) Применяя к этому уравнению преобразование Лапласа, полу- чаем передаточную функцию по s: Г 7 > У(5) — Ьо + Ь15+---+Ь’П-15т~1 + Ьп&т B(S) , 19. u(s) 4-Om-7Sm-14-arosra A(s) • l i
40 4.1. Объекты управления и управляющие ЭВМ Аналогичным образом, имея разностное уравнение У (к)+ а1У (к—1) + . .. 4-агау (к —т)— = bou (к) -f- bjU (к— 1) 4- • • • 4- bmu (к—т), (3.4-13 можно построить дискретную передаточную функцию, использовав теорему о сдвиге вправо: y(z)[14-a1z-14- • • • 4-3mz~m] = u (z) [b0 4-bjZ-14- ... 4-braz-m], Гт — У (z) — b04-biz-1+...+bmz-m _ в (Z-1) n 4 1 u(z) “ 14-a]z-i + ...+amz-m “ A (z-1) ’ 3.4.3. Свойства дискретной передаточной функции Статические системы Если объект управления является статическим, коэффициент усиления импульсной системы можно определить, воспользовав- шись теоремой о конечном значении K = .y-(L-2.”)_= lim G(z)= . (3.4-15) u (k<ю) z_>1 v ’ 14-ai4-..,4-am v Системы с астатизмом Если в объекте управления содержится «чистый» интеграл, импульсная передаточная функция системы имеет полюс при z=l G(z) = 7i-~zn bo + biz.~1 + --- + bmz-"-- . (3.4-! 6) V (1-z 4 l+aiz-i-4..--ramz-<m-o 4 ' «Установившаяся» скорость изменения выходного сигнала такой системы при подаче на ее вход ступенчатого сигнала и0 равна ду (ц=у (^ - у (к ~ и = -,4ь-4"4ь-ге и»- <з-4-17> 14-ai4-...4-am Если Ьо=£О, выход объекта претерпевает скачок при к=0. Од- нако для большинства реальных систем коэффициент Ьо равен нулю, поскольку при синхронной работе квантователей скачки невозможны хотя бы в силу инерционности исполнительных устройств и датчиков. Системы с запаздываниями Звену запаздывания, имеющему передаточную функцию D(s) = e-Tts, согласно теореме о сдвиге влево, соответствует импульсная пере- даточная функция D(z) = z~d, (3.4-18) если Tt = dT0, где d=l, 2, 3, ... . Таким образом, при нали- чии запаздывания дискретная передаточная функция системы
Гл. 3. Дискретные системы управления 41 имеет вид DG(z) = f^- = G(Z)Z-<1. (3.4-19) Реализуемость Условия реализуемости формулируются по-разному, в зависи- мости от того, как записана дискретная передаточная функция — в виде функции переменной z или обратной ей переменной z~x. q /7-1\__ У (z) _bp-j-biZ-1-!- ... --|-bm2~m ' ' ' u (z) ao + a^-1-]-... 4-anz-n Данная передаточная функция и соответствующее ей разност- ное уравнение реализуемы, если бесконечный ряд G(z-1) = g(0) + g(l)z-1 + g(2)z-2+... , полученный путем деления полинома числителя на полином знаме- нателя (ср. с уравнением (3.4-7)), не содержит членов со.степенями z1, z2,. . ., поскольку реакция импульсной системы должна подчи- няться принципу причинности. Отсюда имеем следующие условия реализуемости: 1) если Ьо =#0, то ао=#О; если Ьх =/= 0, то ах =# 0; (3.4-20) 2) m<n б) G (z) = У = bo + blz+---+bmZm ' u (z) ap-l-aiz-f-•. • 4~anZn Эта передаточная функция реализуема, если в соответствующем разностном уравнении ару (к)+ ... +а„у (к + п) = Щи (к)+ ... + b^u (k-f-m) выходной сигнал у (к+п) не зависит от более поздних значений выходного сигнала u(k-bm), что нарушало бы принцип причин- ности. Таким образом, для второй формы записи передаточной функции G(z) условием реализуемости является выполнение нера- венства m<n. (3.4-21) При этом предполагается, что Эп=#0. Связь с импульсной переходной функцией Импульсную переходную функцию можно определить по разност- ному уравнению (см. (3.4-13)), положив U (0)= 1, и (к) = 0 для всех к > 0.
42 У. I. Объекты управления и управляющие ЭВМ Согласно уравнению (3.4-1), это означает, что на вход системы подан единичный импульс. Подставив указанные величины в разностное уравнение, запи- санное в форме у (k) = bou(к) 4-... +bmu(к—m)—aty (к—1)—... —(к—п), получим последовательность значений функции: g(O) = bo, g (1) = b£—axg (0), g (2) = Ьз—axg (1) —a2g(0), импульсной переходной (3.4-22) g(k) = bk—atg(к— 1)—...— akg(0) при k<m, g(k)= —axg(k—1)—amg(k —m) при k> m. Последовательное соединение подсистем При вычислении дискретной передаточной функции для совокуп- ности линейных подсистем, соединенных последовательно, сначала следует объединить подсистемы, между которыми нет квантовате- * Ш "* Gz(s} a) y(z) • u(z)Z{Gi(s)G2(s)} - u(z)-GiGi(z) о—* (s) d) y(z) ₽ u(z)Z{Gj(s)}1{G2(s)] = n(z)-G/(zl<2(z) ±u(z)-G,G2(z) Рис. 3.4.3. Вычисление дискретной передаточной функции для ряда последова- тельно соединенных подсистем. лей, и получить их передаточные функции. Далее эти передаточные функции перемножаются. Указанное правило поясняется приме- рами, представленными на рис. 3.4.3. Заметим, что в результирую- щих выражениях каждому квантователю *) соответствует один знак умножения. 1 В последнем примере квантователи на входе системы и в цепи обратной связи объединяются. — Прим, перев.
Г л. 3. Дискретные системы управления 43 3.5. ПОЛЮСА ПЕРЕДАТОЧНОЙ ФУНКЦИИ И АНАЛИЗ УСТОЙЧИВОСТИ 3.5.1. Расположение полюсов на плоскости z Действительные полюса В примере 3.4.1 было показано, что апериодическому звену с передаточной функцией 0(8)=^- = ^-^ = -^-, (3.5-1) v ’ u (s) 14-Ts a-f-s ’ v ' на входе которого нет экстраполятора, соответствует дискретная передаточная функция G (z) = , К' -г (3.5-2) 4 ’ u (z) z — zj 1 — axz 1 4 * с полюсом в точке Z1 = ai = e-aTo. (3.5-3) Разностное уравнение, описывающее эту систему, имеет вид у (к)— аху (к— 1) = К'и(к). (3.5-4) Полагая, что сигнал на входе системы отсутствует, т. е. и(к) = О, к^О, и начальное значение выхода равно у (0)^=0, приходим к однородному разностному уравнению у (к)—а1У (к—1) = 0. (3.5-5) Отсюда можно получить следующую последовательность вы- ходных сигналов: у (1) = агу (0), У (2)=а1у(1)=а1у (0), у(к)= а*у(0). (3.5-6) Переходный процесс в системе сходится к нулю, а сама система, следовательно, асимптотически устойчива только при условии |ах |<1. Вид переходных процессов для различных положений по- люса aj на плоскости z иллюстрируется рис. 3.5.1. Заметим, что при отрицательных значениях ах наблюдаются колебания. Полюса передаточных функций системы по s и по z связаны соотношением z1 = a1 = e“aT<’. Отсюда следует, что полюсам на плоскости s, расположенным в области —оо<са<с4-оо, на плоскости z соответствуют полюса оо>
44 Ч. 1. Объекты управления и управляющие ЭВМ Таким образом, на плоскости s отсутствует действительный полюс, соответствующий отрицательному значению zr. Комплексно-сопряженные полюса Система второго порядка с передаточной функцией G = y(s) =_________к = К (а2+<»1) _ К(а2+«1) U u(s) T2s24-2DTs4-1 (sa)2(s—S1) (s—s2) ’ где tz = D/T, co|= 1/T2 (1—D2), sL^ = —a ± i(of, без экстраполятора нулевого порядка при входе обладает дискретной передаточной Рис, 3.5.1. Переходные процессы в системе с одним действительным полюсом, функцией .. f «К Ю1 sin «>11(3 z . G = y (z) = V 051 / - bf ' ' u (z) z2—(2acos tt>i To) z-{-a2 (z—zx) (z—z2) ’ Здесь a = e“eTo. Полюса этой дискретной передаточной функции равны zi, 2 = a Lcos“До ± i эшюДо] =ae± i<B‘T% (3.5-7) а соответствующее ей разностное уравнение имеет вид у (к) — (2a cosco/ToJy (к— l)-|-a2y (к—2) = 0. Запишем решение этого уравнения при начальных условиях у(0) = 0 и y(l) = acosco1T0: у (k) = akcosco1kT0-y (0). (3.5-8) Графики изменения у (к) для положительных значений а изоб- ражены на рис. 3.5.2. При отрицательных а переходные процессы носят колебательный характер. Следует, однако, иметь в виду, что на плоскости s соответствующие этим значениям полюса не сущест- вуют.
Гл. 3. Дискретные системы управления 45 Рис. 3.5.2. Переходные процессы в системе с парой комплексно-сопряженных полюсов (граничная частота a>sh=n/T0). 3.5.2. Условие асимптотической устойчивости Линейная система именуется асимптотически устойчивой, если после конечного однократного воздействия она возвращается к свое- му положению равновесия. Проведенный выше анализ влияния расположения полюсов на переходные процессы показал, что данное условие соблюдается только в том случае, когда полюса находятся внутри единичного круга на плоскости z. Иными словами, корни характеристического уравнения (z—zx)(z—z2). . .(z—zm) = 0 (3.5-9) должны удовлетворять неравенству IzJ < 1, i= 1, 2, ..., m. (3.5-10) 3.5.3. Билинейное преобразование и критерии устойчивости Билинейное преобразование Z—1 7+Т w = (3.5-11) переводит точки единичной окружности на плоскости z в точки, лежащие на мнимой оси плоскости w, а внутренность круга пере- ходит в левую полуплоскость w. Поскольку плоскость w в теории дискретных систем служит аналогом плоскости s для непрерывных систем, в ней можно применять критерии устойчивости Рауса или Гурвица.
46 Ч. I. Объекты управления и управляющие ЭВМ С этой целью произведем подстановку 14-w rt 1 (3.5-12) 1 —W в знаменатель A(z) = zm-)-a1zm-1+ ... + am (3.5-13) передаточной функции U A (z) * (3.5-14) В результате имеем A (w) = ( ' ' \ 1 — W , ) "Ф ( T ) ' 1 1 \ 1 — w/ + • • • + am> (3.5-15) а после умножения на (1—w)m—полином A (w) = (1 -}-w)m-(-a1 (1 + w)m-1 (1 —w)+ .. . 4-am (1 —w)m. (3.5-16) Применим критерий Гурвица к уравнению A(w) = 0. (3.5-17) Согласно данному критерию, все коэффициенты характеристи- ческого уравнения должны отличаться от нуля и иметь одинаковый знак. При этом условии в системе не могут возникнуть монотонно расходящиеся процессы. Для того чтобы в системе отсутствовали расходящиеся колебательные процессы, необходимо, чтобы были по- ложительны главные определители матрицы Гурвица (или должны выполняться условия критерия Рауса). Пример 3.5.1. Передаточная функция системы второго порядка имеет знаменатель A (z) = z24-a1z-f-a2. гт 1-Н W После подстановки z=gj-_-— имеем A (w) —— ( j-- I -4-aj I г- I a2. 4 \ I — w / * \1— w) 1 й Полученное выражение запишем в виде A (w) = (l-f-w)2+a1 (1 -рw) (1— w)-}-a2 (1 — w)2 = = (1 — ai_ha2) w2-[-2 (1 — a2) w-f- (1 4~af-ba2)- Для системы второго порядка все коэффициенты A (w) строго положительны, если А (—1)— 1 — ai4-a2 > О, А (1)— 1 + а1Ч"а2 > О, а2 < 1. Применение данного критерия к системам порядка выше второго вызывает существенные затруднения, поскольку для его проверки
Гл. 3. Дискретные системы управления 47 необходимо вычислять определители матрицы Гурвица. Описание других критериев устойчивости читатель сможет найти в литературе нз списка, приведенного в конце книги. 3.6. ПРЕДСТАВЛЕНИЕ СИСТЕМ В ПРОСТРАНСТВЕ СОСТОЯНИЙ Важнейшую роль в современной теории систем управления, в особенности при проектировании многомерных систем, играет метод пространства состояний. Переход к описанию в пространстве состояний может осуществляться различными способами. Ниже демонстрируются два из них. Первый заключается в прямой под- становке новых переменных в разностное уравнение, основу второго составляет аналитическое решение дифференциального уравнения, описывающего линейную систему с экстраполятором нулевого порядка. Запись разностного уравнения в векторной форме (метод прямого программирования) После подстановки в разностное уравнение (3.4-13) индексов, изменяющихся от к до к+п, получим У (к + и) + аху (к + п— 1) + .. . + апу (к) = = bou(k + n)-f-b1u(k + n —1) +... +bnu(k). (3.6-1) Соответствующая дискретная передаточная функция имеет вид с 17\ — У & — bo4-biz-14-.. ,4-bnz~n b0zn4-b1zn-14-.--+bn ' ' u (z) 14-aiz-14----4~anZ-n zn 4-3izn-14-,., 4-зп (3.6-2) Введем следующие переменные состояния: У (к) У (к 4-1) У (к 4-2) = Xi (к) = х2(к) = хх (к 4-1) = х3 (к) = х2 (к 4-1) (3.6-3) (3.6-4) у(к4-п —1) = хп (к) = хп_1(к4-1) tx(k4-n) =хп(к4-1) Подставим выражения (3.6-4) в уравнение (3.6-1), положив b„= 1, а Ьо, Ьх, ..., bn_x = 0: у (k 4- n) = xn (k 4-1) = —axxn (k)—a2 xn_x(k) —... — a^ (k) 4- 1 u (k). (3.6-5)
50 Ч. 1. Объекты управления и управляющие ЭВМ Рис. 3.6.2. Блок-схема системы, описываемой векторным разностным’уравнением первого порядка. векторного дифференциального уравнения х(1) = Дх (t)+^u (t), дополненного уравнением выхода y(t) = crx (t) + du (t). (3.6-18) Решение дифференциального уравнения (3.6-18) при начальном состоянии х (0) описывается выражением t x(t) = O(t) х(0)+ J Ф(1—х) Ьи (т) dx. (3.6-19) 6 Матрица <D(t) = e-4t, (3.6-20) которую называют переходной, определяется как ряд .4t_V IdllL — v! * v= (3.6-21) Если входной и выходной сигналы подвергаются квантованию по времени, описание дискретной системы в пространстве состоя- ний можно получить непосредственно из уравнений (3.6-18) и (3.6- 19), полагая, что на выходе линейного объекта управления стоит экстраполятор нулевого порядка (см. рис. 3.4.2). Пусть входной сигнал остается постоянным на протяжении такта квантования, т. е. u(t) = u(kT0) при kT0 < t < (к 4- I) То. В этом случае для начального состояния х(кТ0) уравнение состояния на интервале кТ0 < (к 4- 1) То приобретает вид t x(t) = O(t—kT0)x(kT0)4-u(kT0) $ Ф (t—х) b dx. (3.6-22) кТ0 Если интерес представляет только состояние в момент t = = (к 4- 1) То, то оно определяется как (к +1) То X ((к 4-1) То) = Ф (То) X (кТ0) 4- U (кТ0) $ Ф ((к 4- 1) Т0-х) b dx. кТ0
Гл. 3. Дискретные системы управления 5! Подставляя в это выражение новую переменную q = (к 4- 1) х ХТО—т, для которой dq = —dr, получим т0 х(к 4- 1) = Ф (То) х (к) 4- и (к) J Ф (q) b dq. (3.6-23) О С целью сокращения записи введем следующие обозначения: А = Ф (То) = елт«, (3.6-24) т0 b=$®(q)&dq. (3.6-25) О При этом векторное разностное уравнение принимает оконча- тельный вид х (к 4-1) = Ах (k) 4-bu (к). (3.6-26) Воспользовавшись соотношением (3.6-18), запишем также урав- нение выхода у (k) = cTx(k)4-du (к), (3.6-27) где ст = сг и d = d. Со способами вычисления выражений (3.6-24) и (3.6-25) мож- но ознакомиться в книге [2.19]. Канонические формы Применяя линейные преобразования вида xt = Tx, (3.6-28) можно получать различные формы представления моделей линейных объектов управления в пространстве состояний. Запишем преобра- зованные уравнения состояния и выхода: xt(k4-l) = Atxt(k)4-btu(k), (3.6-29) у (k) = CjTxt(k)4-du(k), (3.6-30) где At —TAT-1, bt = Tb, (3.6-31) Некоторые варианты описания в пространстве состояний, ко- торым соответствуют At, bt и ct, обладающие определенной струк- турой, называют каноническими формами. Наиболее часто при- меняемые канонические формы представлены в табл. 3.6.1, а соответствующие им структурные схемы изображены на рис 3.6.3. Объекты управления с запаздыванием Предположим, что в пространстве состояний требуется построить модель объекта, вносящего задержку, равную d=Tt/T0=l,2,. . . . Указанная модель должна иметь динамическую часть с ограничен-
52 Ч. I. Объекты управления и управляющие ЭВМ Таблица 3.6.1 Канонические формы описания в пространстве состояний Название At bt ct Примечания Диаго- нальная канони- ческая форма г " 1 О- • • ON О’ • * К1 О -о'о 1 J = ’bl, D “ b2> D -bm, D- 'Ci, D C2, D -Cm D - Все собственные значения zi, z2, zm различны. Каждое из них соответ- ствует отдельной состав- ляющей движения. Мат- рица At определяется из соотношения T-1At = =АТ-1. Векторы bt или ct = [I 1 ... 1]т, если объект полностью управ- ляем и наблюдаем Верти- кальная сопрово- ждающая канони- ческая форма 1 1 о • • • т* о к-: . . о о 1 1 1 3 э 1 t ' Г 1 1 0 _ 6_ rcTb cTAb _стАт~гЬ _ ct SC2, S" • sl- С? = [g(I), g(2), g(m)] Канони- ческая форма уп- равляе- мости (нормаль- ная фор- ма) 1 1 МО- • • о 3 М О “ 3 1 : £= : и. . . о । । -0- 6 _ 1 - bm - b2 - bi . Горизон- тальная сопрово- ждающая канони- ческая форма г 0 1 ...0- • • • 6 о ’ i _—am—am_f... - —aj rcTb cTAb LcTAm—!b. J' • • • _0 J b^ = [bi в b2 В ... bm> в], b? = [g(l), g(2), , ,,,g(m)] Канони- ческая форма наблюда- емости 1 "" " 1 1 ее Csj Csj • • • СП 1 1 1 о о • * • —. <L °l г bm bm-i * • L t»! r On 0 » _ i _
Гл. 3. Дискретные системы управления 53 Рис. 3.6.3. Структурные схемы, соответствующие каноническим формам описания в пространстве состояний,
54 Ч. I. Объекты управления и управляющие ЭВМ ными параметрами. При этом элементы задержки можно располагать на входе модели, на ее выходе или между переменными состояния. Модель с задержкой на входе имеет вид x(k+l) = Ax(k)4-bu(k—d), (3.6-32) y(k) = cTx(k), (3.6-33) с задержкой на выходе— x(k+l) = Ax(k)4-bu(k), (3.6-34) у (к + d) = стх (к). (3.6-35) Запаздывание можно представить в виде совокупности d единич- ных задержек, помещаемых на входе или на выходе системы. При Рис. 3.6.4. Структурная схема линейного объекта управления с задержкой на входе. этом переменные состояния, соответствующие элементарным за- держкам, должны включаться в вектор состояния. Задержке на входе (ср. с рис. 3.6.4) соответствует следующая форма описания в пространстве состояний: *1 1 где xj(k)=[u(k—d; ! (к 4-1) — Аихи (к) 4- i(k—d)=cjxu (к), и (к — d — 1) ... и ГО 1 0 ... 0" 001... 0 Ьии (к (к —1 )L “0“ 0 (3.6-36) (3.6-37) Аи = • ьи = , (3.6-38) с? = [ 6 о о ... i _0 0 0 ... 0_ 1 0 0 ... 0]. i Объединив уравнения (3.6-32) и (3.6-36), получим расширенную систему х (к 4- 1) ' 'A bcj" _xu (к 4-1) — 0 Аи у (к) = [ст0] 'х(к) ' _Хц (к). х (к) Ли (к). 01 b U (Ю. ми _ (3.6-39) (3.6-40)
Гл. 3. Дискретные системы управления 55 которую можно представить в более компактном виде: xd (к + 1) = Adxd (к) + bdu (к), (3.6-41) у (к) = cjxd (к). (3.6-42) Запишем матрицу расширенной системы, полагая, что матрица имеет структуру, соответствующую канонической форме управляе- мости: " 0 1 0 .. . 0 0 0 ... 0" Ad — 6 0, 0 . am am-i . i • — ai 6 i 0 ... 0 ... 6 0 (3.6-43) о . 0 0 1 ... 0 О О О О 1 О Методы описания систем с задержками в пространстве состояний рассматриваются в ряде работ, в частности [3.1] и [3.2] (см. также раздел 9.1). Решение векторного разностного уравнения Ниже предлагаются некоторые способы решения разностного уравнения х (к + 1) =s Ах (к) + bu (к), (3.6-26) у (к) = стх (к) + du (к). (3.6-27) Первый из них заключается в построении рекуррентной проце- дуры решения разностного уравнения для заданной последователь- ности входных сигналов и (к) при начальных условиях х(0). Эта процедура описывается соотношениями х(1) = Ах (0)4-bu (0), х(2) = Ах (l)-f-bu (1), = А2х (0)4-Abu (0) 4- bu (1), к х (к) = Ак х (0) 4- ^Ai-1bu(k — i). i = i Решение Частное однородного решение уравнения (сумма свертки) Здесь Ак = А-А. ..А. (3.6-44)
56 Ч. I. Объекты управления и управляющие ЭВМ Выходной сигнал у (к) вычисляется из уравнения (3.6-27). Если и(к) задается неявно, в форме z-преобразования, можно воспользоваться вторым способом решения. Запишем z-преобра- зование для вектора состояния: Их (k)} = x(z), 3{x(k + l)} = z[x (z)—х (0)] (применяется теорема о сдвиге влево). С другой стороны, из уравнения (3.6-26) следует, что z[x (z) — х (0)] = Ах (z) 4- bu (z) (3.6-45) или x(z) = [zl—A]-1zx (0) + [zl—A]-1 bu (z). (3.6-46) Подставляя это выражение в уравнение (3.6-27), получаем у (z) — ст [zl —A]-1 zx (0) +[ст [zl —A]-1b 4-d] u (z). (3.6-47) Сравнивая уравнения (3.6-46) и (3.6-44), можно вывести сле- дующее условие: Ак = з-1 {[zl—A]-1 z}. (3.6-48) Вычисление z-передаточной функции Из уравнения (3.6-47) при нулевых начальных условиях х(0) = 0 следует, что G (Z) = 44- = с’ [zl -A]-1 b + d = «TadJ tzl-Ajb+ddetrzI-A] (3.6-49) Знаменатель полученной передаточной функции составляет левую часть характеристического уравнения det[zl —А] = 0. (3.6-50) Вычисление импульсной переходной функции Объединим уравнения (3.6-27) и (3.6-44), положив х(0) = 0: к у (k) = ^cTAi~1b и (к — i)4-du (к). (3.6-51) i=l Пусть входной сигнал имеет вид /1, к = 0, и(к) = \0, к>0. При этом импульсная переходная функция определяется ре- куррентной формулой g(O) = d, (3.6-52) g (k) =cTAk-1b для k > 0.
Гл. 3. Дискретные системы управления 57 Отсюда можно получить соотношение, связывающее импульс- н\ю переходную функцию и z-передаточную функцию [ср. с урав- нением (3.4-22)]: G(z)=S g(k)z~k = d+ У cTAk-1bz~k. (3.6-53) k=o k=i ,Vправляемость Линейный динамический объект называют управляемым, если существует реализуемая последовательность управляющих воздей- ствий u(k), позволяющая перевести объект из произвольного на- чального состояния х (0) в любое конечное состояние х (N) на огра- ниченном интервале времени, равном N тактов квантования. Для того чтобы получить указанную последовательность и (к), можно воспользоваться уравнением (3.6-44). Для объекта со ска- лярным входом x(N) = ANx(0) + [b, Ab, ... AN-1b]uN, (3.6-54) где u£ = [u(N —l)u(N —2) ... u(0)]. (3.6-55) При N = m неизвестный вектор входных воздействий опреде- ляется однозначно по формулам um = Qs-1[x(rn) — Amx(0)], (3.6-56) Q3 = [b Ab ... Am”1b], (3.6-57) если detQs#=O. (3.6-58) Матрица Qs называется матрицей управляемости. Она не должна иметь линейно зависимых столбцов (строк). Следователь- но, объект управляем, если выполняется условие RankQs = m, (3.6-59) где ш — порядок матрицы А. Если N < ш, решения относительно вектора и не существует, а при N > ш оно становится неодно- значным. Наблюдаемость Линейный динамический объект с выходной переменной у (к) называют наблюдаемым, если произвольное состояние х (к) можно определить, имея конечный набор выходных переменных у (к), у(к+1),. . ., y(k+N—1). Условия наблюдаемости выведем следую- щим образом. Воспользовавшись уравнением выхода у(к)=стх(к)
58 Ч. I. Объекты управления и управляющие ЭВМ и векторным разностным уравнением (3.6-26), сформируем последо- вательность уравнений у (к) =стх(к), у (к 4-1) = стАх (к) 4-cTbu (к), у (к 4-2) =стА2х (к) 4-cTAbu (к) 4-cTbu (к 4-1), у (к 4-N—1) =cTAN-1 х (к) 4-[0, стЬ, стАЬ....cTAN"2b] uN. (3.6-60) Здесь u£ = [u (к 4- Af—1) ... и (к 4-1) и (к)]. (3.6-61) Если все составляющие вектора входных воздействий uj изве- стны, для однозначного определения m неизвестных, образующих вектор состояния х(к), из системы (3.6-60) достаточно взять m уравнений. Таким образом, N=m. При этом систему (3.6-60) можно записать в виде ym = QBx(k)4-Sum, (3.6-62) где Ут = [У (Ю У (к 4-1) ... у (к4-т —1)], ut=[u (к4-т— 1) ... и(к 4-1) и(к)], QB = [cTcTA ... "0 ... 0 S= • _0 сТЬ стАЬ ... cTAm-2b_ Отсюда найдем искомый вектор состояния х (k) = QB! [ym —Sum]. (3.6-63) Решение существует, если det QB =/= 0. Следовательно, дина- мический объект наблюдаем, если его матрица наблюдаемости QB имеет полный ранг, т. е. RankQB = m. (3.6-64) Иными словами, все m строк (столбцов) матрицы QB должны быть линейно независимы. 3.7. МАТЕМАТИЧЕСКИЕ МОДЕЛИ ОБЪЕКТОВ УПРАВЛЕНИЯ Проектированию сложных, высококачественных алгоритмов уп- равления предшествует построение математических моделей объек- тов управления. Учитывая это, в данном разделе мы обсудим некото- рые методы получения дискретных моделей объектов с сосредото- ченными параметрами, иллюстрируя изложение примерами.
Гл. 3. Дискретные системы управления 59 3.7.1. Основные типы технических объектов управления Динамическое поведение технических объектов отличается раз- нообразными особенностями. Ниже мы перечислим наиболее важ- ные их свойства. Во всех технических объектах происходят процес- < ы преобразования и/или переноса материалов, энергии и/или ин- формации. Объекты можно классифицировать, руководствуясь сле- дующими показателями: — характером изменения сигналов во времени и по амплитуде — способом переноса материалов, энергии, информации — типом математической модели 1. Характер изменения сигналов во времени и по амплитуде На рис. 3.7.1 изображены основные типы сигналов: • непрерывные по амплитуде — непрерывные во времени (объекты с непрерывными сигналами) • непрерывные по амплитуде — дискретные во времени [объекты с дискретными (квантованными по времени) сигналами. Полу- чающиеся импульсы могут впоследствии подвергаться ампли- тудной, широтной или частотной модуляциям] • дискретные по амплитуде — непрерывные во времени (объекты со ступенчатыми сигналами) Рис. 3.7.1. Различные типы изменения сигналов во времени и по амплитуде. • дискретные по амплитуде — дискретные во времени (объекты с дискретными цифровыми сигналами) • двоичные по амплитуде — непрерывные или дискретные во времени (объекты с двоичными сигналами)
60 4.1. Объекты управления и управляющие ЭВМ 2. Способы переноса материалов, энергии и информации В зависимости от способа переноса материалов, энергии и/или информации технические объекты можно разделить на следующие группы: • Непрерывные объекты — перемещение материалов, энергии, информации в виде не- прерывных потоков — непрерывное функционирование — сигналы: возможны любые сочетания сигналов всех типов, изображенных на рис. 3.7.1 — математические модели: линейные и нелинейные, описываемые дифференциальными уравнениями (обыкновенными или в частных производных) либо разностными уравнениями — примеры: трубопроводы, электроэнергетические установки, электрические кабели для передачи аналоговых сигналов. Разнообразные процессы, используемые в энергетике и хими- ческой промышленности 9 Объекты с периодически возобновляемыми процессами — перемещение материалов, энергии, информации «группами» или в виде прерываемых потоков — протекание процессов за ограниченное время — сигналы: возможны многие сочетания сигналов, изображен- ных на рис. 3.7.1 — математические модели: в основном нелинейные, описываемые либо обыкновенными дифференциальными (или в частных производных) уравнениями, либо разностными уравнениями — примеры: многие процессы в химической промышленности — некоторые химические реакции, процессы промывки, окраски, вулканизации 9 Объекты с разовыми процессами — перемещение материалов, энергии, информации в виде отдель- ных «элементов» — однократное протекание процессов — сигналы: в основном дискретные по амплитуде (двоичные), непрерывные или дискретные во времени — математические модели: блок-схемы, программы для модели- рования на ЭВМ — примеры: разнообразные процессы в машиностроении. Обра- ботка деталей, транспортировка запасных частей, передача информации в запоминающих устройствах 3. Типы математических моделей Математические модели, применяемые для описания процессов, происходящих в объектах непрерывного и периодического типов, можно разделить на следующие классы:
Гл. 3. Дискретные системы управления 61 обыкновенные дифференциальные уравнения (модели с сосредото- ченными параметрами) линейные линейные по параметрам стационарные параметрические с непрерывными сигналами —дифференциальные уравнения в частных производных (модели с распределенны- ми параметрами) —нелинейные — нелинейные по параметрам — изменяющиеся во времени — непараметрические — с дискретными сигналами Обоснование идей, лежащих в основе подобной классификации математических моделей, читатель сможет найти в широкоизвест- ных работах по теории систем и технической кибернетике. В этой книге проблемы проектирования алгоритмов управления рассматриваются главным образом применительно к непрерывным объектам и объектам с периодическими процессами, для описания которых могут использоваться модели, линеаризованные относи- тельно некоторой рабочей точки. Поскольку при разработке циф- ровых систем управления основной интерес представляют матема- тические модели с сигналами, дискретными во времени, в следую- щих разделах будут изложены некоторые методы построения таких моделей. 3.7.2. Построение дискретных моделей на основе непрерывных моделей В данном разделе рассматриваются способы получения дискрет- ных моделей, если известны модели непрерывного типа, описываю- щие поведение объектов с сосредоточенными параметрами. При малых тактах квантования разностные уравнения можно получать из дифференциальных путем дискретизации последних. В частности, дифференциалы могут приближенно заменяться ле- выми разностями: df (t) ~ Af (k)_f(k) — f (k— 1) dt ~ To ~ To d2f (t) ~ A2f (k) = Af (k)~Af (k—1) = dt2 ~ To “ To ~ J(k)-2f(k-l) + f (k-2) . rp2 ’ Ao (3.7-1) При вычислении разностных уравнений и дискретных передаточ- ных функций, соответствующих более продолжительным тактам квантования, обычно пользуются таблицами ^-преобразований.
62 Ч. 1. Объекты управления и управляющие ЭВМ. Исходной информацией служит либо весовая функция g(t)=f(t), представленная в аналитической форме, либо передаточная функ- ция G(s)=f(s). По ним в таблице z-преобразований отыскивается требуемая передаточная функция f(z) = G(z). Передаточные функ- ции объектов высокого порядка предварительно раскладываются в сумму дробно-рациональных членов, каждый из которых пред- ставлен в таблице. Если имеется экстраполятор нулевого поряд- ка, следует использовать формулу (3.4-10), а из таблицы z-преоб- разований брать передаточную функцию, соответствующую G(s)/s. (В дальнейшем G (s) будет обычно заменяться G(s)/s, как в примере 3.7.1.) Передаточную функцию высокого порядка р+1 (s—s0)P JI (S —s.) i= 1 (3.7-2) сначала необходимо представить в виде суммы + Ё Ар q=l Is soJ 4 i=i (S— si) Неопределенные коэффициенты вычисляют, используя формулы .вычетов 1 Г dp_q . A0q = (^)l[^Fq [(S —So)PG(s)]Js=So> (3.7-3) Ai = [(s — sO G (s)]SSSj. Как было показано в разд. 3.5.1, полюсы G(s)hG(z) связаны •однозначным преобразованием z = eT»s. Зная дискретную передаточную функцию, можно сразу записать разностное уравнение, поскольку у него те же коэффициенты, что и у G(z). Пример 3.7.1. Требуется вычислить дискретную передаточную функцию объекта, имеющего непрерывную передаточную функцию G (s) =^=______________*_____________ u(s) (14-T1S) (1+T2s)..,(l+Tms) с экстраполятором нулевого порядка на входе. Решение: 1. Раскладываем G (s)/s на элементарные дроби:
Гл. 3. Дискретные системы управления 63 i = 1, ..., гл, Ао = К. 2. Отыскиваем соответствующие им z-преобразования. Если G (s) s m 3. Согласно уравнению (3.4-10), имеем HG (z) = (l-2->)g m mm Ц (l-e-T«/Tiz-1)+ 2 (1-z-i) As fl (1-e-T°/Tj z-1) flO-e-b/T^-x) i = i В таблице 3.7.1 приведены коэффициенты G (z) для различных значений такта квантования при m = 3; К= 1; Ti=10c; Т2=7,5с; Тз = 5с. Можно отметить, что с увеличением такта коэффициенты изменяются определенным образом: а) абсолютные значения параметров а, уменьшаются; б) значения параметров bj увеличиваются; в) сумма коэффициентов 2bi— aj возрастает. При больших значениях такта квантования справедливы неравенства | а31 •< 1 а1 и I ьз I zL bi- В силу этого коэффициенты а3 и Ь3 можно считать нулевыми. Практически это означает, что полученная модель объекта имеет не третий, а второй порядок. Еще один метод расчета HG (z) по G (s), в котором не исполь- зуются таблицы z-преобразований, основан на приближенном соот- ношении, введенном Тастином [3.3]: 2 z—1 То (3-7-4) Вывод этой приближенной формулы не представляет затрудне- ний. Рассмотрим интегральное уравнение t y(t) = ^fu(t)dt, (3.7-5) о
64 Ч. 1. Объекты управления и управляющие ЭВМ Таблица 3.7.1. Коэффициенты передаточной функции G(z) для объекта, имеющего передаточную функцию G (s) = 5sy с экстраполятором нулевого порядка на входе, при различных тактах квантования То, с 2 4 6 8 10 12 bi 0,00269 0,0186 0,05108 0,09896 0,15867 0,22608 ь2 0,00926 0,0486 0,1086 0,17182 0,22570 0,26433 Ь3 0,00186 0,0078 0,01391 0,01746 0,01813 0,01672 31 —2,25498 —1,7063 — 1,2993 —0,99538 —0,76681 —0,59381 а2 1,68932 0,958 0,54723 0,31484 0,18243 0,10645 а3 —0,42035 —0,1767 —0,07427 —0,03122 —0,01312 —0,00552 2bj = l-j-Sa, 0,01399 0,0750 0,17362 0,28824 0,40250 0,50712 которому соответствует преобразование Лапласа Если идеальный интеграл заменить численной операцией инте- грирования по формуле прямоугольников, то при малых значениях То справедливы следующие соотношения: к у(к) « u(i—1), i = I к-1 y(k-l)«bS«(i-4. i = 1 y(k)-y(k-I)«bu(k_1), (3.7-7) y(z) [1— rq»Y’u(s)z-‘, У (z) ,, Toz-X To u (z) ~ T(l —Z-1) T(z — 1) • Учитывая, что при малых тактах квантования уравнения (3.7-6) и (3.7-7) должны практически совпадать, мы можем записать s-^~(z—1). Ао Более точного приближения можно достичь с помощью опера-
Гл. 3. Дискретные системы управления 65 ции интегрирования по формуле трапеций-. к у(к) [н (i)+u(i — 1)], i= 1 к-1 у (к—1)« yS -Hu (0+u(i —1)], i=1 (3.7-8) У (к) — У (к— 1) « -^-[и (к) + и (к—1)], у (г) ~ т0 z+1 u (z) ~ 2Т z—1 ‘ Следовательно, при малых То имеет место зависимость Этот же результат можно получить, ограничиваясь первым членом разложения в ряд функции z — eT°s: 8 = ^1пг~тД^+зот + ---Ь <3-7-10> Пример 3.7.2. В таблице 3.7.2 приведены точные значения параметров дискрет- ной передаточной функции HG (z) при различных тактах квантования для объекта с непрерывной передаточной функцией 1 (l + 10s)(l + 5s) ’ на входе которого стоит экстраполятор нулевого порядка. Там же для срав- нения помещены параметры, полученные с использованием приближенного соотношения (3.7-4): HG(z) = G(s)| _ 2 z,_!. Is- т„ Т+Т Кроме того, в таблице указаны значения ошибок, возникающих при рас- чете переходного процесса у (к) по приближенной модели. Введены следующие обозначения: Ду (к) = у (к) —у (к), у (оо) = limy (к). к->«о От точной передаточной функции HG (z) приближенная функция HG (z) отличается тем, что в ней присутствует параметр Ьо 0. Таким образом, между ними имеется определенное структурное различие. При малых тактах квантования (Т0=С2с) оба способа дают достаточно близкие значения коэф- фициентов аг и а2, а максимальная ошибка в переходном процессе составляет менее 5%. Однако с увеличением такта ошибки растут. Время установления переходного процесса, за которое он достигает 95% от конечного значения у (оо), обозначим Т95. Для рассматриваемого объекта Т95 = 37с. Анализируя данные табл. 3.7.2, можно заключить следующее: если при вычислении пере- ходного процесса допускаются ошибки (Ду/У^Хаа* в пределах от 0,05 до 0,1, то максимальное относительное значение такта квантования Т95/То может со- ставлять от 17,5 до 8. 3 № 2067
66 Ч. 1. Объекты управления и управляющие ЭВМ Таблица 3.7.2 — 2 Z——1 Параметры функций HG(z) и HG(z), полученные путем подстановки s = —-------—, ' о z-f-1 а также максимальные значения ошибки в переходном процессе для HG (z). Здесь G (s) = (1 ^-5S) То,С Ьо bi Ьз а1 а2 2bi (^У/Усо)тах при t, С 1 0,00433 0,00906 0,00866 0,00819 0,00433 —1,72357 —1,72294 0,74082 0,74026 0,01725 0,01732 4-6»,024 6 2 0,01515 0,03286 0,03030 0,02690 0,01515 —1,48905 —1,48485 0,54881 0,54546 0,05976 0,06061 +0,048 6 4 0,04762 0,10869 0,09524 0,07286 0,04762 — 1,11965 —1,09524 0,30119 0,28571 0,18155 0,19048 +0,087 8 6 0,08654 0,20357 0,17308 0,11172 0,08654 —0,85001 —0,78846 0,16530 0,13462 0,31529 0,34615 +0,124 6 8 0,12698 0,30324 0,25397 0,13625 0,12698 —0,65123 —0,53968 0,09072 0,04762 0,43949 0,50794 +0,146 8 12 0,20455 0,48833 0,40909 0,15708 0,20455 —0,39191 —0,15909 0,02732 —0,02273 0,63541 0,81812 +0,20 0 3.7.3. Упрощенное представление моделей объектов управления для дискретных сигналов Если линейный функцией вида объект описывается моделью с передаточной ш G /s) — У — u(s) II "+v> _______Р=1_________________ m— 2 (14-2DTs-j-T2s2) fj (1 + Tas) <z= 1 -T.s =-----------------------р t ii । । m 1 H-fl/S-l-- е Tts = (3.7-11) его динамические свойства могут оставаться практически постоян- ными независимо от того, охвачен он обратной связью или нет. Было показано (см. [3.4], [3.5]), что условием этого является неиз- менность обобщенной суммы постоянных времени: ш —2 m TX = 2DT + 2 Т„- STu+T.-lai-W+T,. (3.7-12) а = 1 3=1 Отсюда можно сделать вывод, что упрощение моделей объектов должно проводиться таким образом, чтобы суммарные значения
Гл. 3. Дискретные системы управления энергий, масс или моментов, накапливаемых на протяжении пере- ходного процесса, менялись незначительно. Логично предположить, что данное правило сохраняет силу и для дискретных моделей объек- тов, по крайней мере при малых тактах квантования. Если интерес для проектировщика представляют только соот- ношения между входом и выходом объекта, непрерывную модель последнего перед переводом в дискретную форму желательно мак- симально упростить. В частности, в уравнении (3.7-12) следует за- менить одним суммарным запаздыванием т,-2 т, 1=1 совокупность I постоянных времени Tt и сократить близкие друг другу нули и полюса ([3.4], [3.5]). Если для получения моделей объектов управления применяются методы идентификации, величину запаздывания нужно выбирать такой, чтобы результирующая модель имела как можно меньший порядок т. Рассмотрим теперь некоторые условия, которые должны соблю- даться при построении упрощенных дискретных моделей. Будем полагать, что исходная модель описывается передаточной функцией вида q , . _ у (z) _ Ьо biz ~х bmz ,3 । u (z) ap-j-aiZ-1-)- ... -|-amz m В отличие от нормализованных динамических моделей измене- ния в параметрах at и Ь} сказываются не только на динамических свойствах модели (3.7-13), но и на ее поведении в статическом ре- жиме, так как влияют на коэффициент усиления. Следовательно, необходимо установить, при каких условиях отклонения парамет- ров и bj от номинальных значений не приводят к изменению коэф- фициента усиления и обобщенных показателей, характеризующих динамику переходного процесса. Для объекта управления стати- ческого типа подобный показатель можно записать по аналогии с непрерывным случаем в виде А' = Т. 2 [и (к)-у (к)]. (3.7-14) к=0 Предположим, что в качестве входного сигнала выбрана ступен- чатая функция с уровнем ц0, причем y(k)«k Up для k^l, где коэффициент усиления К определяется отношением m m к = 2 2 ai- i = 0 i=0 Введем новый обобщенный показатель A" = A7T0u0, для кото- рого справедлива приближенная формула (3.7-15) А'«А = Л-2 [и(к)-у(к)] = Ц (/ + 1)и0-2 У (О ио к=0 ио к=0 (3.7-16)
68 Ч. I. Объекты управления и управляющие ЭВМ Просуммируем последовательность выражений, полученных из разностного уравнения, соответствующего передаточной функции (3.7-13): аоу(О)= bou(O); аоу(1) =—агу(0) + bou(l)4-b1u(O); аоу (m) = — аху(т — 1)... — ату (0) +bou(m) ...4-bm(0); аоу (0 = — аху (/— О ату(/—m)+bou(/) ••+Ьтн(/—т); а0у(/4-т)=—axy(Z4-m—1)...—amy(/)4-b0u(Z4-rn) ...4-bmu(Q a02y(k)=—ах 2 У (к)---—am2y(k)+b02u(k) + ...+bm 2 u(k) k=0 k=0 k = 0 k = 0 k = 0 (3.7-17) Преобразовав это выражение с учетом (3.7-15) для u(k) = u0 при к 0 2 ах 2 У (к) = (/+1)н0 2 bi + u0[mb04-(m—1)^4-... i=C к=0 i=0 — Ku0 [ma0 4-(m—1) ах 4- 4-am_x], подставим его в уравнение (3.7-16): А =—-------[m (а0—b0) + (m — 1) (ах—Ьх)4-...4-(ат_х—Ьт_х)]. 2ai i = 0 (3.7-18) При малых отклонениях параметров имеем ДА «^-Дах4----+^-Дат+^-ДЬ04--..4-ДдЬт. (3.7-19) даТ * 1 1 1 дат т ' дЪ0 01 dbm т v ’ Отсюда следует приближенное соотношение Гт — 1 т ДА«-Л_ У (ш—ДЬ,)—А^, Да, s ai Li-o 1=0 (3.7-20)
Гл. 3. Дискретные системы управления 69 Данное соотношение позволяет выявить некоторые свойства показателя А: а) Чувствительность А к отклонениям параметров Aat и Abj тем выше, чем меньше номер i: дА/да-у (т—i) — А (j dA/da0 т — A i dA/dbj__т — i f (3.7-21) dA/db0 m J б) Введем коэффициент относительной чувствительности dA/dbj = (m— i) = x dA/daj A—(m—i) Нетрудно видеть, что 1 при A || 2 (m— i). Если коэффициент усиления K=l, из уравнения (3.7-15) следует, что при малых отклонениях параметров m m [^Aa. + ^-AbJ-V-SlAb-Aa,). i=o 2 ai i=0 j=0 (3.7-22) Положив AA = 0 и AK = 0, составим два уравнения, связыва- ющих величины Да, и Abj. Поскольку при mZ>l неизвестных Аа£ и Abj всегда больше двух, эти уравнения имеют бесчисленное множество решений. Одно из возможных решений можно получить непосредственно из уравнений (3.7-20) и (3.7-22), задавшись Д3) = ДЬь i = 0, 1, ..., ши 2 А&1 = 0. (3.7-23) i =о Таким образом, величины А и К остаются практически неиз- менными при малых отклонениях параметров, если Аа1 = АЬ1, Да2 = ДЬ2 и т. д. и одновременно Ааг + Аа2 + • • • + Аага = 0, Можно, однако, найти и другие решения, одно из которых иллюстрируется приведенным ниже примером. Пример получения упрощенной модели объекта управления (понижение порядка модели). Из табл. 3.7.2 определим дискретную передаточную функцию объекта управления для такта квантования Т0=10с: Hu (z) 0 7g6gz-i_|_0) 1g24z-2_oioi3iz-3 • Данный объект характеризуется показателями К=1 и А = 2,75. Заме- ।м, что параметры его передаточной функции связаны соотношениями < 1 + 2 а, и Ь3 < 2 bj. Это дает основания предполагать, что объект может лъ с достаточной точностью описан моделью порядка т — 2.
70 Ч. 1. Объекты управления и управляющие ЭВМ Из уравнения (3.7-20) следует, что ДА ~ [2 (Дах—ДЬ1)4-(Да2—ДЬг)—А (Дах-|-Да2-|-Да3)] =0, а из уравнения (3.7-22) ДК w у— [(Дах—ДЬх)-|-(Да2—ДЬ2) —(Да3—ДЬ3)]~ 0. Если положить а3 —О и Ь3 = 0, то Да3 = —а3 и ДЬ3 = —Ь3. После этого в двух полученных выше уравнениях остается четыре не- известные величины. Следовательно, две из них можно задавать произвольно. Положим, например, Да2 = —Да3 и ДЬ1 = 0. При этом имеем 2Дах (а3—ДЬ2) —А (ДахЦ- а3 — а3) =0 или —0,75Дах—ДЬ2=0,0131 и Дах+(а3—ДЬ2) -(— а3-|-Ь3)=0 или Дах—ДЬ2=0,0181. Отсюда Дах = —0,0178; Да2 = —0,0131; ДЬ2 = +0,0003; ДЬХ = О. В результате получена новая модель, описываемая дискретной переда- точной функцией нем— °- 1587z-14-0,2260z~2 Н 0,7847г-1 + 0,l693z-2 ‘ Эта приближенная модель имеет коэффициент усиления К= 1,000, а ее обобщенный показатель А изменился по сравнению с прежним всего на 1%. Таким образом показано, что при построении упрощенных дис- кретных моделей объектов управления можно исходить из усло- вий ДА = 0 и ДК = 0, используя уравнения (3.7-20) и (3.7-22). Подобный подход основывается на предположении о том, что опре- деленные физические показатели, характеризующие динамические свойства объекта, должны оставаться постоянными. Известны и другие способы понижения порядка модели. В част- ности, для этого предлагалось отбрасывать собственные значения, оказывающие незначительное влияние на динамику объекта [3.14]. Однако ответ на вопрос, какими именно собственными значениями можно пренебречь, далеко не всегда бывает однозначным. Кроме того, этот метод не позволяет скорректировать остающуюся после редукции часть модели. 3.7.4. Построение моделей и идентификация объектов Модели динамических объектов определяются либо с помощью теоретических выкладок, либо путем обработки экспериментальных данных [3.4, 3.6—3.13]. Теоретический анализ, т. е. построение модели исходя из неко-
Гл. 3. Дискретные системы управления 71 н>рых физических законов, заключается в составлении уравнений, определяющих положение равновесия, а также уравнений, описы- вающих внутреннее состояние объекта и внешние явления. Как пра- вило, в результате подобного анализа получают систему дифферен- циальных уравнений (обыкновенных или в частных производных), которая и является математической моделью объекта. Эта система определяет структуру модели, а также параметры, если она может быть решена в явной форме. Вывод дискретных моделей рекоменду- ется проводить, придерживаясь следующей традиционной схемы: исходная непрерывная модель заменяется приближенной с сосре- доточенными параметрами, затем производится упрощение послед- ней, после чего она подвергается дискретизации или к ней применя- ется z-преобразование, описанное в разд. 3.7.2. При экспериментальном анализе (или идентификации) объектов исходной информацией для построения математических моделей служат сигналы, доступные непосредственному измерению. Вход- ные и выходные сигналы объекта обрабатываются с использованием методов идентификации, которые позволяют описать соотношения между этими сигналами в виде некоторой математической зависимос- ти. Полученная модель может быть непараметрической (например, переходная функция или частотная характеристика, заданные в табличной форме) или параметрической (например, системы диффе- ренциальных или разностных уравнений, зависящих от парамет- ров). Для построения непараметрических моделей обычно применя- ются методы, основанные на преобразовании Фурье или корреля- ционном анализе. Параметрические модели получают с помощью статистических методов оценки параметров или методов настройки параметров по заданным частотным характеристикам или реак- циям на ступенчатое воздействие. При синтезе алгоритмов для уп- равляющих ЭВМ целесообразно пользоваться параметрическими мо- делями, поскольку современная теория систем в основном ориенти- рована на описание объектов, содержащее параметры в явной фор- ме. Кроме того, для синтеза алгоритмов управления по параметри- ческим моделям могут применяться аналитические методы. Идентификацию дискретных параметрических моделей наиболее удобно проводить с использованием статистических методов оценки параметров. В этом случае линейные стационарные объекты обычно описываются моделями вида y(z) = A7l^z“dMz)+e^ijv(z) (3.7-24) Модель объекта Модель возмущений [ср. с уравнениями (3.4-14) и (12.2-31)]. Оценки неизвестных параметров моделей объекта и случайных возмущений определяются путем обработки измеряемых сигналов и (к) и у (к) [3.13].
72 4.1. Объекты управления и управляющие ЭВМ В основе алгоритмов обработки лежат такие известные методы идентификации, как метод наименьших квадратов, метод вспомога- тельных переменных, метод максимального правдоподобия, реали- зуемые либо в рекуррентной, либо в нерекуррентной формах. В по- следние годы разработке методов идентификации уделялось боль- •шое внимание. Были созданы и успешно опробованы методы, пред- назначенные как для работы в реальном времени, так и для обра- ботки накопленной информации. В настоящее время с достаточно высокой точностью можно выполнять идентификацию объектов раз- личных классов — линейных и нелинейных, в составе разомкнутых или замкнутых контуров управления, при наличии случайных воз- мущений и без них. Созданы пакеты прикладных программ, с по- мощью которых можно определять порядок моделей и величину за- паздывания (см. гл. 23, 24 и 29).
ЧАСТЬ II Системы управления с детерминированными возмущениями ГЛАВА 4 Детерминированные системы управления Детерминированные системы управления являются системами управления, проектируемыми для детерминированных внешних воздействий или детермини- рованных начальных условий. Детерминированными воздействиями или началь- ными условиями считаются те, которые в отличие от стохастических могут быть точно описаны в аналитической форме. Системы управления можно разделить на системы управления с задающим сигналом и терминальные системы управления, В даль- нейшем предполагается, что объекты управления имеют одну управ- ляющую переменную и (к), одну регулируемую переменную у (к), вектор состояния х (к) и возмущающие воздействия v (к), как пока- зано на рис. 4.1. В системах управления с задающим сигналом регу- лируемая переменная у (к) должна как можно более точно отраба- тывать задающий сигнал w(k), т. е. изменяться так, чтобы ошибка управления e(k)=w(k)—у (к) была как можно меньше (е(к)«0). Если задающая переменная изменяется во времени, то необходимо проектировать систему управления с переменным задающим сигна- лом или следящую систему управления. Если регулируемой пере- менной является положение, скорость или ускорение, то соответст- вующую систему управления также называют серворегулятором. Если задающая переменная системы управления остается постоян- ной, то такая система называется системой стабилизации. В терминальных системах управления конечное результирующее состояние x(N) процесса должно быть достигнуто в заданный или произвольный момент времени N. Как в системах управления с задающим сигналом, так и в терминальных системах управления влияние начальных условий х(0) и возмущающих воздействий v(k) должно быть скомпенсировано, насколько это возможно. Более того, задачей управления также является обеспечение с помощью обрат- ных связей устойчивости всей системы при неустойчивом процессе. Указанные задачи, как правило, могут быть решены за счет вве- ! пин обратной связи по выходной координате у (к) или состояниям
в г Рис. 4.1. Блок-схемы основных типов систем управления с одной регулируемой переменной. а одноконтурная система; б — система с прямой связью; в — каскадная система управления; г — обратная связь по состоянию.
Гл. 4. Детерминированные системы управления 75 х (к) объекта. Введение обратных связей часто сопровождается фор- мированием дополнительных элементов управления в прямой цепи. I l.i рис. 4.1 представлены блок-схемы систем управления для слу- ч.н'в, когда управление выходной переменной у (к) осуществляется помощью одного контура обратной связи или одной прямой цепи. I l.i рисунке использованы следующие обозначения: GR — регулятор или управляющий алгоритм, использующий обратную связь; G§— регулятор или управляющий алгоритм с прямой связью. На рис. 4.1,а показана одноконтурная система управления с обратной связью. Если возмущающее воздействие v(k) может быть намерено, то можно использовать регулятор с прямой связью, по- казанный на рис. 4.1,6, в сочетании с обратными связями для тех Рис. 4.2. Схема процесса проектирования алгоритмов управления. возмущений, которые не могут быть скомпенсированы данным регу- лятором. Если между точкой приложения управляющего воздей- ствия и регулируемой переменной существуют измеримые перемен- ные объекта, которые можно использовать для формирования об- ратных связей, то можно сформировать вспомогательные контуры управления или, как показано на рис. 4.1,в, каскадные системы управления с основными и дополнительными контурами управле- ния. Схема введения обратных связей по состоянию для повышения устойчивости системы или изменения характера собственных дви- жений объекта показана на рис. 4.1, г. Обобщенная схема процесса проектирования систем управления приведена на рис. 4.2. В качестве исходных данных для проектиро- вания используются точные или приближенные математические
76 Ч. П. Системы управления с детерминированными возмущениями модели объектов управления и сигналов (возмущающих воздействий, задающих сигналов, начальных условий), что зависит от требова- ний к системе и выбранных методов проектирования. В разд. 3.7 описаны методы построения математических моделей объектов уп- равления. Часто модели сигналов могут быть получены лишь в при- ближенном виде. Например, нередко предполагается ступенчатое изменение сигналов, хотя на практике такого типа сигналы доста- точно редки. Однако применение современных ЭВМ позволяет до- статочно просто получить более точные модели детерминированных и стохастических сигналов. В книге будут рассмотрены методы проектирования линейных систем управления для линеаризуемых инвариантных объектов с сигналами, которые измеряются дискретно. Схема классификации основных систем управления и методов их расчета приведена на рис. 4.3. На схеме выделены две основные группы: параметрически и структурно оптимизируемые системы управления. Системы, струк- тура которых, т. е. вид и порядок описывающих их уравнений, задана, а свободные параметры подстраиваются под управляемый объект с использованием критерия оптимизации или определенных правил настройки, называются параметрически оптимизируемы- ми. Системы управления называются структурно оптимизируемы- ми, если и структура, и параметры регулятора оптимально подстра- иваются под структуру и параметры модели объекта. В каждой из рассмотренных двух основных групп регуляторов можно выделить несколько подгрупп: для параметрически оптимизируемых регуля- торов это различные типы ПИД-рег.уляторов невысокого порядка. Структурно оптимизируемые регуляторы подразделяются на ком- пенсационные регуляторы и регуляторы с управлением по состоя- нию (регуляторы состояния). Обычно при проектировании исполь- зуют правила настройки, критерии качества или задают располо- жение полюсов замкнутой системы. На рис. 4.3 приведены также названия наиболее важных регуляторов и указана возможность их использования для детерминированных и стохастических возму- щений . Решающую роль при проектировании играет выбор критерия уп- равления. Компенсационные регуляторы задают качество процессов по управляемым переменным либо на протяжении всего времени переходного процесса, либо после некоторого конечного интервала времени. Использование заданного распределения полюсов опреде- ляет характер поведения управляемых переменных лишь прибли- женно, поскольку полюсы соответствуют изолированным собствен- ным движениям. В то же время суперпозиция полюсов, нули сис- темы и характер внешних возмущений при таком подходе не учиты- ваются. Более полно задать поведение систем управления позволяют пря- мые методы расчета, которые основаны на использовании различных
Рис, 4,3. Линейные регуляторы, Детерминированные системы управления
78 Ч. II. Системы управления с детерминированными возмущениями критериев качества. В последнее время при проектировании непре- рывных систем управления, как правило, используют интегральные критерии качества — интеграл от ошибки управления, квадрата ошибки управления, абсолютной величины этой ошибки и т. д. Следует отметить, что в этих интегральных критериях можно так- же учитывать и время. Для построения дискретных систем управ- ления соответствующие критерии задаются в следующем виде: 00 Ii= 2 е(Ю — сумма ошибок, к=0 00 12= 2 е2(к) — сумма квадратов ошибок, к=0 00 13= 2 Iе (Ю| — сумма абсолютных значений ошибок, к=0 00 1.= £ к[е(к)|— сумма произведения абсолютных значений оши- к=0 бок на время. Поскольку критерий It неприменим в случаях, когда значения ошиб- ки являются знакопеременными, наиболее часто при проектирова- нии используют критерий 12. Однако использование второго кри- терия приводит к значительным колебаниям переходного процесса, поэтому для обеспечения переходного процесса по управляемой пе- ременной с большим демпфированием следует использовать крите- рии 13 или 14. При аналитическом расчете систем управления определенными преимуществами обладают квадратичные критерии качества. Это связано с тем, что при отыскании оптимальных значений квадрати- ческой функции ее первые производные представляются в виде ма- тематических соотношений, линейных относительно ошибки е(к). Для введения дополнительных ограничений, в частности связанных с возможностью непосредственного влияния на степень демпфиро- вания процессов в системе, при формировании критерия достаточно ввести квадратичный член, учитывающий величину отклонения уп- равляемой переменной, с соответствующим весовым коэффициен- том г. Таким образом, в наиболее общем случае квадратичный кри- терий может быть представлен в следующем виде: 00 Is= S e!(k) + ru’(k). (4.1) k = 0 Записывая последнее соотношение в пространстве состояний, получим другую форму представления квадратичного критерия: I.= S V(k)Qx(k)+ru’(k). (4.2) k=0
Гл. 4. Детерминированные системы управления 79 Поскольку эти квадратичные критерии можно использовать при проектировании как детерминированных, так и стохастических систем, в данной книге им уделяется основное внимание. Независимо от выбора критерия качества необходимо также задать качество системы в установившемся состоянии. Как пра- вило, к таким требованиям относится отсутствие статической ошибки регулирования при постоянном значении задающей пере- менной, а также при постоянных возмущающих сигналах n(k), v (к) и uf(k), т. е. должно выполняться условие lime(k) = 0. к -* да Используя теорему z-преобразования о конечном значении, в этом случае можно записать Игл (z — l)e(z) = O. z-> 1 Для системы с одной обратной связью выражение для сигнала ошибки имеет следующий вид: 1г Gp (z) С <z) = 1+Gr(z) Gp(z) ~n <Z)1 ~ 1+Gr (z)Gp(z) Uv (z)’ (4,3) поэтому при единичном ступенчатом сигнале 1 (z) = z/(z—1) раз- личным возмущениям соответствуют различные условия, налагае- мые на передаточные функции компонентов системы. 1. w(k)=l (к), п(к)=1 (к), lim 1-ug (z\ G < х= °’ т- е< lira GR <z) Gp (z) = 00 • z-* 1 1 -TUR W (z) z —> 1 2. uv(k)=l (к) (возмущение на входе объекта), G (z)z lim . , a , . . =0; z->i 1 4"Gr(z)Gp (z) a) lim GP(z)^= oo, limGR(z) = oo и z-> 1 z -* 1 lim Gr (z) GP (z) = oo; Z-> 1 6) lim Gp (z) = oo, lim GR (z) = oo. z -► 1 z -* 1 Из приведенных соотношений следует, что во всех случаях для получения нулевой статической ошибки должно выполняться условие lim GR (z) = оо. (4.4) Z-* 1 Эго условие удовлетворяется, если передаточная функция регуля- тора имеет полюс в точке z=l: Gn(z)==_Q^) , (4.5)
80 Ч. 11. Системы управления с детерминированными возмущениями т. е. в том случае, когда регулятор обладает интегрирующей ха- рактеристикой. Если же используется пропорциональный регуля- тор, а в передаточной функции объекта содержится полюс z=l, то при w(k) = l(k) и uv(k)=l(k) происходит уменьшение статической ошибки. Однако для постоянного возмущения n(k) = l(k) это не- справедливо. Аналогичные требования могут быть сформулированы для обес- печения нулевой установившейся ошибки при подаче в систему ли- нейно или квадратично изменяющихся задающих сигналов. В этом случае регулятор голмн содержать двукратный или трехкратный полюс в точке z=l <см. [2.19]),
ГЛАВА 5 Параметрически оптимизируемые регуляторы 5.1. ДИСКРЕТНОЕ ПРЕДСТАВЛЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ НЕПРЕРЫВНЫХ ПИД-РЕГУЛЯТОРОВ Поскольку обычно к параметрически оптимизируемым относят широко используемые П-, ПИ- или ПИД-регуляторы, первоначально предпринимались попытки просто преобразовать их уравнения с помощью дискретизации. Такой подход позволяет использовать накопленный опыт работы с аналоговыми регуляторами и в принципе применять уже хорошо известные правила настройки параметров. Более того, в этом случае нет необходимости прово- дить переподготовку обслуживающего персонала [5.1—5.5]. Идеализированное уравнение ПИД-регулятора имеет вид u(t) = K [e(t) + i£e(r)dT + TD^] , (5.1-1) где вгедены следующие обозначения: К — коэффициент передачи, Tj — постоянная интегрирования; Td — постоянная дифференциро- вания. Для малых, тактов квантования То это уравнение можно преоб- разовать в разностное с помощью дискретизации, состоящей в за- мене производной разностью первого порядка, а интеграла — сум- мой. Непрерывное интегрирование может быть заменено интегри- рованием по методу прямоугольников или трапеций (см. разд. 3.2). При использовании метода прямоугольников получаем к и(к) = К е(к)4-Ь]Г e(i-l) + l2(e(k)-e(k-l)) . *1 = 0 0 (5.1-2) Таким образом, мы получили нерекуррентный алгоритм управле- ния. В нем для формирования суммы необходимо помнить все пре- дыдущие значения сигнала ошибки e(t). Поскольку каждый раз значение управляющего сигнала и (к) вычисляется заново, этот ал- горитм называют «позиционным» [5.1, 5.31. Однако для программирования на ЭВМ более удобны рекуррент- ные алгоритмы. Эти алгоритмы отличаются тем, что для вычисле- ния текущего значения управляющей переменной и (к) исполь- зуются ее предыдущее значение и (к—1) и поправочный член. Для получения рекуррентного алгоритма достаточно вычесть из уравне- ния (5.1-2) следующее уравнение: и(к— 1) = К е k-J .J. (k-l) + ^Ee(i-l)+^ (е (к—1)—е(к —2» . (5.1-3)
82 Ч. 11. Системы управления с детерминированными возмущениями В результате получим где и (к)—и (к — 1) = qoe (к) + q3e (к— 1) + qae (к—2), (5.1 -4) X *0 / Ч1 = _ к(1+21=2— Ь). (5.1.5) X *0 м/ л -- к ТР q2 lx у . *0 Теперь вычисляется только текущее приращение управляющей переменной: Ди (к) ;= и (к)—и (к—1), и поэтому этот алгоритм называют «скоростным». Следует отметить, что после небольшой модификации способа интегрирования в уравнении (5.1-2) под знаком суммы можно ис- пользовать значения е(к—1) вместо е(к). При этом коэффициенты q0 и qj изменятся и не будут соответствовать коэффициентам, полу- ченным в разд. 5.2 для больших тактов квантования. Если для аппроксимации интеграла использовать метод трапе- ций, то на основании уравнения (5.1-1) будет получено следующее соотношение: и (к) = К е(к)+^(5<а±5Д.»4 * I \ 2 2-еф)+Т7(е(к)~е(к—1)1 ’ (5.1-6) Вычитая из него соответствующее уравнение для и (к—1), получим другое рекуррентное выражение, описывающее динамику дискрет- ного закона управления: u (k) = и (к — 1) + qoe (к) + qae (к — 1) + qae (к - 2), где Qo= К (1 +2^ +17) ’ q^ —к(1 +2—— q2= К-т^- • (5.1-7) Для малых тактов квантования параметры q0, qf и q^ можно вычислить, используя параметры К, Tj и TD аналогового ПИД-ре- гулятора в соответствии с соотношениями (5.1-5) или (5.1-7).
Гл. 5. Параметрически оптимизируемые регуляторы 83 5.2. ПАРАМЕТРИЧЕСКИ ОПТИМИЗИРУЕМЫЕ ДИСКРЕТНЫЕ АЛГОРИТМЫ УПРАВЛЕНИЯ НИЗКОГО ПОРЯДКА При больших тактах квантования рассмотренные в разд. 5.1 способы дискрет- ной аппроксимации непрерывных регуляторов становятся несправедливыми. Поскольку к тому же непосредственное использование прямого z-преобразова- ния невозможно из-за наличия дифференцирующих членов, связь между непрерывными и дискретными регуляторами в этом разделе будет опущена. Рассмотрим простой контур управления, изображенный на рис. 5.2.1. Дискретная передаточная функция объекта управления с экстраполятором нулевого порядка имеет вид GP (z) - = = b"+blZ~,‘ + ''+bm2~" z-. (5.2-1) ' ' u (z) A (z *) l + aiz 1 -p... 4-amz m ' ' Обобщенная дискретная передаточная функция линейного регу- лятора записывается как G м _u (z) _Q(z-1) qo+qiz~1+• • • +qvz-y ' e(z) Plz-1) po + piZ-14~...+pM,z-n ' v ' ' Этот алгоритм может быть реализован, если ро^О- Однако соотно- шение порядков числителя и знаменателя может быть различным: или v>pi. Обычно в таких регуляторах qo^O, а значение р0. выбирается равным 1. В структурно оптимизируемых регуляторах порядки числителя и знаменателя передаточной функции ц и v являются функциями со- Рис. 5.2.1. Одноконтурная система управления. ответствующих порядков модели объекта. Например, для аперио- дических регуляторов V—ш и p,=m+d. Однако в параметрически оптимизируемых регуляторах порядок регулятора может быть мень- ше порядка модели объекта, и ц^ш+d. Следовательно, пара- метрически оптимизируемые регуляторы требуют меньших затрат машинного времени в процессе эксплуатации. При выборе структуры параметрически оптимизируемых регу- ляторов обычно необходимо гарантировать, чтобы изменения задаю- щей переменной w(k) и возмущений uv(k) и n(k) (см. рис. 5.2.1) не приводили к появлению статической ошибки по сигналу е(к). I l.i основании теоремы z-преобразования о конечном значении для исполнения этого условия необходимо, чтобы передаточная функ- ция регулятора имела полюс z=l. Следовательно, простейшие ал- горитмы управления v-ro порядка будут иметь следующую струк-
84 Ч. II. Системы управления с детерминированными возмущениями туру: . G (7) — Q (z-1) — q°+qiZ-1 + • • • + %z-v /к о 04 При v=l и соответствующем выборе параметров получаем регуля- тор типа ПИ, при v=2— типа ПИД, при v=3 — типа ПИД2 и т. д. Разностное уравнение, описывающее регулятор с передаточной функ- цией (5.2-3), имеет вид и (к) = u (к— 1) + qoe (k) + qte (k— 1) + . •. + qve (к — v). (5.2-4) Для получения хорошего качества процессов управления параметры q0, qi, q2, • • •, qv должны выбираться с учетом характеристик объек- та. Расчет этих параметров может быть выполнен следующим обра- зом: а) на основе метода, использующего модель объекта управления, в результате минимизации критерия качества с использованием па- раметрической оптимизации, причем аналитическое решение воз- можно лишь для объектов и регуляторов очень низкого порядка; в остальных случаях следует применять численные методы; б) с использованием алгоритмов параметрической настройки, позволяющих получить параметры регулятора, близкие к оптималь- ным для некоторого критерия. Обычно для этого необходимо оце- нивать либо параметры переходного процесса в системе при ступен- чатом задающем воздействии, либо критическое значение коэффи- циента усиления и период колебаний на границе устойчивости сис- темы (см. разд. 5.6); в) путем последовательного увеличения значений параметров от малых начальных значений до тех пор, пока процесс в замкну- той системе не приобретет значительной колебательности. После этого следует понемногу уменьшать значения параметров (метод проб и ошибок). Если к системе управления не предъявляется каких-либо специ- фических требований и если ее переходный процесс отличается прос- тотой и малым временем установления, то для оптимизации пара- метров регулятора достаточно использовать методы, упомянутые в пп. б) и в). Если же требования строги или переходный процесс ока- зывается сложным, медленным или существенно изменяющимся, то следует применять метод, упомянутый в п. а). Этот метод также при- годен для автоматизации проектирования регуляторов. Оценка качества процессов управления должна выполняться с учетом требований, предъявляемых конкретным объектом управле- ния. Однако и в этом случае оценка оказывается несколько субъек- тивной. Существует много способов оценки качества управления, которые зависят как от характера прилагаемых возмущающих воз- действий, так и от свойств рассматриваемого объекта и регулятора. Для упрощения процессов настройки параметров регуляторов и более наглядного сравнения различных систем управления часто
Гл. 5. Параметрически оптимизируемые регуляторы 85 используют ступенчатое изменение возмущающих воздействий и задающего сигнала. При синтезе параметрически оптимизируемых систем для оцен- ки качества управления удобно использовать какой-либо единст- венный показатель. В частности, для непрерывных систем таким показателем с большим успехом может служить интегральный кри- терий качества (для дискретных систем вместо интеграла берется сум- ма). Следует отметить, что критерий суммы квадратов ошибок управ- ления предпочтительнее с математической точки зрения, кроме того, он может быть интерпретирован как средняя мощность и в связи с этим использоваться в других методах проектирования регуляторов. Таким образом, в дальнейшем для параметрической оптимизации будут использоваться квадратичные критерии качества, представ- ленные в следующем виде (см. гл. 4): м S|u= 2 (е!(к)+ГAus(k)), (5.2-6) к = 0 где e(k) = w(k) — у (к) —ошибка управления; Ди (к) = и (к) — и — «отклонение управляемой переменной» от установившегося значения u = u(oo) для ступенчатых возмущений или от математического ожидания u = E(u(k)} для стохастических возмущений; г —весо- вой коэффициент при управляющей переменной. В этом квадратичном критерии качества соотношение среднего квадрата ошибки управления м S? = Щк) = jjTi Е е’ (к) (5.2-7) “И к = 0 и усредненного квадратичного отклонения управляющей перемен- ной или средней входной мощности м s; = ДЩк) = Л £ Ли2 (к) (5.2-8) ' к=0 определяется выбором весового коэффициента г. Если значение г мало, то малая величина Se может быть получена при весьма большой величине S®. Чем больше весовой коэффициент г при Ди2 (к), тем меньше изменяется входной сигнал и больше стано- вится ошибка управления, т. е. система управления становится более инерционной. При оптимизации параметров регулятора пара- метры qT = [q04i • • • 4v] должны выбираться таким образом, чтобы доставить минимальное значение S|u, т. е. обеспечить выполнение условия ^ = 0. (5.2-9)
86 Ч. II. Системы управления с детерминированными, возмущениями Для объектов высокого порядка следует использовать числен- ные методы оптимизации, например простые методы поиска (экви- дистантный поиск, метод Хуки—Дживса), градиентные методы первого или второго порядка (Ньютона — Рафсона) или комбина- ции различных методов (Флетчера — Пауэла) [5.6], [5.19—5.21]. 5.2.1. Алгоритмы управления первого и второго порядков а) Алгоритмы управления второго порядка. Рассмотрим сначала алгоритмы управления второго порядка. Алгоритмы первого порядка будут получены затем путем упроще- ний. Задав v=2 в уравнении (5.2-3), получим Gr (z) = qo+q;z£- +q-Z— • (5.2-10) Запишем в соответствии с уравнением (5.2-4) следующее соотно- шение: u (k) = и (к— 1) + qoe (к) + qte (к— 1) + q2e (к — 2). (5.2-11) Рассматривая единичное ступенчатое изменение сигнала ошибки [ 1 для к 0; е(к)=1 (к)= п . (5.2-12) ' v ’ [0 для к < 0, ' ' сформируем систему уравнений для последовательных значений выходного сигнала регулятора и (к), следующих из (5.2-11); u(O) = qo; u(l) = u(0)4-qo + q1 = 2qo + q1; u (2) — u (1) 4- q0 + q! + q2 — 3q0 + 2qt 4- q2; (5.2-13) u (к) = u (к - 1) 4-q0 + Qi 4-q2 = (k 4-1) q0 4-kqx 4-(к—1) q2. В случае когда u(l)<u(0), дискретный регулятор соответствует непрерывному ПИД-регулятору с дополнительной задержкой сиг- нала на один такт. Если параметр регулятора q0>0, то можно за- писать следующие соотношения для параметров q0, qi и q2: при u(l) <u(0): q0+4i<° или qt< —q0; при u(k)< u(k—1)дляк^ 2: qo + qj-y q2 > 0 или q2 > —(q04-qx)- Для положительного коэффициента передачи регулятора вы- полняется условие q0>q2 (см. 5.2-15)^ Таким образом, обобщая до- пустимые диапазоны изменения параметров регулятора, получим q0 > 0; qi < — q0; — (q«4- qj < q2 < q0- (5.2-i4>
Гл. 5. Параметрически оптимизируемые регуляторы 87 Реакция регулятора на единичное ступенчатое входное воздей- ствие приведена на рис. 5.2.2, а, а допустимые области изменения его параметров изображены на рис. 5.2.3. Как видно из рис. 5.2.2, начальное значение управляющей переменной и (0) при рассмотрен- ном входном сигнале определяется величиной параметра q0. Определим следующие коэффициенты, характеризующие свой- ства регулятора: К = q0—q2 —коэффициент передачи; cD = q2/K —коэффициент опережения; (5.2-15) ci — (Чо+Чх+ q2)/K— коэффициент интегрирования. Эти коэффициенты, определяющие вид переходного процесса ре- гулятора, изображены на рис. 5.2.4. Коэффициенты (5.2-15) при ма- Рпс. 5.2.3. Диапазоны изменения параметров q0, qi и q2 ПИД-регулятора. Для заданного значения q0(- значения параметров qi, и q2i должны лежать в областях, выделенных точками (как показано линией 1—2—3—4).
88 Ч. II. Системы управления с детерминированными возмущениями лых значениях такта квантования связаны с соответствующими ко- эффициентами непрерывных ПИД-алгоритмов управления (5.1-5) следующими соотношениями: К —К; cD = TD/T0; с^Т/Т,. (5.2-16) Из (5.2-16) видно, что для малых тактов квантования коэффици- енты передачи регуляторов тождественно равны. Коэффициент Рис. 5.2.4. Переходный процесс для алгоритма управления второго порядка, где К — коэффициент пе- редачи; cD — коэффициент опере- жения; С[ — коэффициент интегри- рования. опережения cD равен отношению постоянной дифференцирования к такту квантования, а коэффициент интегрирования с1 — отно- шению такта квантования к постоянной интегрирования. Учитывая условия (5.2-14), получим, что cD > 0; с, > 0; с, < cD. (5.2-17) Если рассмотренные выше коэффициенты подставить в выражение (5.2-10), то дискретная передаточная функция регулятора при- мет вид К [(1-^ст,) + (с[ —2сп—1) z_1 + cnz~2l Gr(z) = ' pl ' °_Д-------- ° . (5.2-18) (1-z-i) Следует отметить, что рассмотренный выше алгоритм управле- ния второго порядка является аналогом непрерывного ПЙД-регу- лятора с положительными параметрами только в том случае, если выполняются условия (5.2-14) или (5.2-17). В общем случае пара- метры регулятора, определенные в результате оптимизации, могут и не удовлетворять этим условиям, что зависит от характеристик конкретного объекта управления, вида критерия оптимизации и возмущающего сигнала. б) Алгоритм управления первого порядка. Положив q2=0, получим из (5.2-10) передаточную функцию Gr (z) = 1—Z-1 (5.2-19) <оторой соответствует разностное уравнение u(k)-=u(k—l)+qoe(k)4q1e(k—1).
Гл. 5. Параметрически оптимизируемые регуляторы 89 Реакция регулятора на единичное ступенчатое входное воздей- ствие определяется следующей системой управлений: u(O) = qo; u(2) = u(l) + q0 + g1 = 3g(, + 2g1; (5.2-20) u(k) = u(k— l) + g0 + q1 = (k+ 1) g0 + kga. При и(1)>и(0) алгоритм управления первого порядка аналоги- чен непрерывному ПИ-алгоритму без дополнительной задержки. Если коэффициент q0>0, то выполняется условие до+дх>О или qi> до- На рис. 5.2.2, б показана реакция дискретного регулятора пер- вого порядка на единичный ступенчатый сигнал. По аналогии с (5.2-15) определим следующие характерные коэффициенты алго- ритма: К=д0 —коэффициент передачи; ci = (д0 + дх)/К —коэффициент интегрирования. Для ПИ-алгоритма с положительными коэффициентами сх > 0. (5.2-22) Подставляя введенные коэффициенты в выражение для пере- даточной функции (5.2-19), получим Gr(z) = K11 + (27_‘1)z~*1 (5.2-23) Если параметр д0 выбран равным нулю, то будет получен регу- лятор интегрирующего типа с передаточной функцией = (5.2-24) и соответствующим разностным уравнением u(k) = u(k—l)-|-g1e(k—1). (5.2-25) Другими частными случаями являются регулятор пропорцио- нального типа, передаточная функция которого GR(z) = g0 или u(k)=goe(k) (5.2-26) получена из (5.2-23) при Cj ~ 0, и регулятор пропорционально- дифференциального типа с передаточной функцией Gr (z) = g0 —g2z-1 или и (к) = дое (к) — д2е (к— 1), (5.2-27) полученной из (5.2-18) при с^О.
90 Ч. П. Системы управления с детерминированными возмущениями 5.2.2. Алгоритмы управления с заданным начальным значением управляющей переменной Передаточная функция замкнутой системы управления, описы- вающая связь между задающей и управляющей переменной, запи- сывается следующим образом: u (z) _ Gr (z) w(z) l + GR(z) Gp(z) • (5.2-28) Используя передаточные функции объекта управления (5.2-1) и регулятора второго порядка (5.2-10) и полагая, что Ьо = 0, . получим [(1 -z-i) (1 + a.z"1 + ... + amz~m) 4- + (q0 + QiZ"1 + q2z-2) (biZ-1 + ... + bmz-m) z-d] u (z) = = (qo+qiZ~1 + q2z-2) (1 4-a1z-14- •.. +amz~m) w (z). (5.2-29) Запишем полученное выражение в виде разностного уравнения, разрешив его относительно управляющей переменной: u (k) =(1 — аг)и (к— 1) 4~(а1 — а2) и (к—2)4- ... — — qobiU (к — d — 1) — (q0b2 + q1b1)u(k — d — 2)4-... 4- 4- qow (к) + (q^ 4- qj w (k— 1) 4- + (qoa2 4- q^j + q2) w (k 2)4-... . (5.2-30) Первые два значения управляющей переменной при подаче на вход системы ступенчатого задающего воздействия w (к) = 1 (к) будут определяться следующими соотношениями: а) при d = 0 и (0) = q0, i /о . (5.2-31) u(l) = q0(2 — q0bl)4-qi; б) при d Дг 1 u(0) = q0, u(l) = 2q04-qi. (5.2-32) Как видно из последних соотношений, величина ц(0) при сту- пенчатом изменении входного сигнала определяется только значе- нием параметра q0 регулятора и не зависит от постоянного запазды- вания d. Поэтому для того, чтобы задать начальное значение управ- ляющей переменной и(0), следует зафиксировать параметр q0 ре- гулятора. Соответствие между начальным значением управляющей пере- менной и параметром q0 может быть использовано в процессе про- ектирования регулятора для задания допустимого диапазона изме- нения управляющей переменной. Для этого необходимо выбрать рабочую точку контура управления и задать максимальное прира-
Гл. 5. Параметрически оптимизируемые регуляторы 91 щсние сигнала и(0) на входе объекта управления при ступенчатом изменении на величину w0 задающей переменной w(k) (или ошибки е(к)) и после этого положить qo?=u(O)/wo. Для того чтобы значение и(1) управляющей переменной было меньше и(0), параметр qx регуля- тора следует выбирать с учетом определенных неравенств. Из урав- нений (5.2-31) и (5.2-32) следует, что для выполнения условия и(1)^ (0) параметры регулятора должны удовлетворять неравенствам а) при с1=0 q. (1-q.bt); (5.2-33) б) при qo. Эти же неравенства справедливы и для регуляторов первого по- рядка. Если задано достаточно малое значение и(0) и в результате система становится сильно задемпфированной, то в квадратичном критерии оптимизации (5.2-6) можно задать г^=0. Если значение параметра q0 определено на основании ограниче- ний, наложенных на и(0), то в регуляторе второго порядка могут быть оптимизированы только два параметра, а в регуляторе перво- го порядка — только один параметр. Это приводит к уменьшению объема необходимых вычислений. Конечно, такой подход к проек- тированию регуляторов не позволяет построить систему, в которой учтены ограничения на управляющую переменную, обусловленные всеми возмущающими воздействиями. Рассмотренный способ зада- ния параметра q0 является приемом проектирования, в результате применения которого ограничения на управляющую переменную, связанные лишь с одним возмущающим воздействием, становятся превалирующими. 5.3. МОДИФИКАЦИИ ДИСКРЕТНЫХ АЛГОРИТМОВ УПРАВЛЕНИЯ Было опубликовано большое число модификаций дискретных алгоритмов управления, основанных на дискретизации дифференциальных уравнений непрерывных ПИД-регуляторов (5.1-1—5.1-4). Некоторые из этих модифика- ций будут рассмотрены ниже. Для уменьшения больших изменений управляющей переменной при резких изменениях задающего сигнала задающее воздействие w(k) исключают из дифференцирующего члена [5.3]. В результате этого вместо обычного алгоритма ПИД-регулятор а (5.1-4) u (k) —и (к— 1) = К ^е (к)—е (к — 1) +^е (к—1) + +^.(е(к)-2е(к-1)+е(к-2))] (5.3-1)
92 Ч. II. Системы управления с детерминированными возмущениями используется модифицированный алгоритм и (к)—и (к—1) = К Ге (к)—е (к— 1) + ^е (к— 1) -J- + 4^(-у(к) + 2у(к-1)-у(к-2))] , (5.3-2) где e(k) = w(k)— у (к). Дополнительного уменьшения амплитуды управляющей пере- менной добиваются, оставляя значения задающего сигнала только в интегрирующем члене алгоритма [1.12, 5.1, 5.3]: и (к)—и (к—1) = К [—у (к)+у (к—1)4- + £е (к-1) +4Н~ У <к) +2У (|!-1)-У (к-2))] . (5.3-3) В последнем алгоритме, кроме того, предпочтительнее исполь- зовать сигнал е(к) вместо е(к—1), см. стр. 82. Рассмотренные моди- фицированные алгоритмы менее чувствительны к высокочастотным составляющим сигнала w(k) по сравнению с сигналом у (к). Поэтому параметры регуляторов, полученные в результате оптимизации для определенных типов возмущений, например для возмущений на входе объекта и на входе системы, будут отличаться незначительно (см. 15.81). Существенные изменения управляющей переменной мо- гут быть также уменьшены путем ограничения скорости изменения задающей и (или) управляющей переменной. Поскольку такие огра- ничения оказываются эффективными для всех типов возмущений, их применение предпочтительнее использования модифицированных алгоритмов управления, описываемых уравнениями (5.3-2) и (5.3-3). Другие модификации алгоритмов управления состоят в различ- ных способах реализации дифференцирующей части. Часто регули- руемая переменная содержит относительно высокочастотный шум, который не измеряется, что приводит к нежелательным сущест- венным колебаниям управляющей координаты, если дифференци- рующая часть алгоритма сформирована с использованием первой разности в нерекуррентной форме (5.1-2) ТоЦД)=Тп (e(k)-e(k-l)) 1 0 10 или в рекуррентной форме (5.3-1) ГЯ(е(к)-2е(к-1)+е(к-2)). м Введение дифференцирующего члена в алгоритм управления час- то может быть необходимым для улучшения качества процессов управления при наличии среднечастотных шумов не слишком боль- шого уровня, поскольку в этом случае происходит приближенное сокращение полюсов объекта, что приводит к расширению областей устойчивости и возможности увеличения коэффициента передачи.
Гл. 5. Параметрически оптимизируемые регуляторы 93 Следовательно, при введении дифференцирующего члена в алгоритм управления следует, учитывая сказанное выше, выбирать его пара- метры для обеспечения допустимого компромисса. Одна из возможностей состоит в том, чтобы выбирать отноше- ние TD/T0 меньшим его оптимальной величины. Можно также сгладить дифференцирующие свойства алгоритма, используя 4 по- следовательных значения сигнала ошибки для формирования пер- вой разности [5.2]. Для этого сначала оценивается среднее зна- чение ошибки ?k=T[e(k)+e(k-l)+e(k-2)+e(k-3)], после чего все аппроксимации первой производной усредняются по отношению к ею Дифференцирующий член, представленный в нерекуррентной форме, в этом случае запишется в следующем виде: т ek _ Td Ге (к) — ек . е (к— 1) — ек . ек — е (к — 2) ек — е (к—3) __ DT0 — 4 [ 1,5Т0 О,5То О,5То + 1,5Т0 J = [е (к) 4-Зе (к- 1) — Зе (к —2)—е (к —3)]. (5.3-4) Для рекуррентной формы имеем 2Д[е(к)+2е(к— 1)—бе (к-2) 4-2е (к—3)4-е (к —4)]. (5.3-5) Еще один подход, применимый лишь при выборе малых так- тов квантования в системе, состоит в использовании дифферен- цирующего члена, такого, как в непрерывной передаточной функции о(8)=к[1+т^+Дгу, и применении соотношения s—>2(z—1)/Т0 (z-f-1) для аппрокси- мации непрерывных зависимостей [2.19] (см. разд. 3.7). В резуль- тате такой подстановки получим из приведенного непрерывного следующий дискретный алгоритм управления: u(k) = p,u(k—1) + p2u(k—2) + qoe (k) + q,e(k—1) + q2e(k —2), (5.3-6) параметрами которого являются Pi = —4c,/(l 4-2c,), p2 = (2с,—1)/(1 4-2c,), q0 = К [ 1 + 2 (c, + cD) + (1 + 2c,)] /(1 + 2c,), q, = К [Cj — 4 (с, 4- cD)]/( 1 4- 2c,), q2=K ^(2—c,)4-2cD4--y—1]/(1 4-2c,),
94 Ч. II. Системы управления с детерминированными возмущениями где С1 = ТХ/ТО, с1 = Т0/Т1, cD = TD/T0. Другие возможности улучшения работы системы управления связаны с осуществлением фильтрации регулируемой переменной у (к) с помощью фильтров, включаемых в систему перед алгоритмом управления и поэтому влияющих на все компоненты ПИД-алгорит- ма. Об этом будет сказано в гл. 27. 5.4. РЕЗУЛЬТАТЫ МОДЕЛИРОВАНИЯ При проектировании систем управления ставится задача выбора прием- лемых значений свободных параметров алгоритмов. В случае параметриче- ской оптимизации дискретных алгоритмов управления такими параметрами являются такт квантования То и весовой коэффициент г квадратичного функ- ционала при управляющей переменной или заданное начальное значение управляющей переменной и (0). Для того чтобы помочь в выборе начальных значений этих параметров, ниже приведены некоторые результаты моделиро- вания [5.7]. Свободные параметры не могут выбираться независимо от объекта управления и его технических характеристик. Поэтому здесь приведены наиболее общие правила их выбора. В то же время из результатов моделиро- вания двух тестовых объектов будет видно, что полученные качественные результаты справедливы и для других подобных объектов. 5.4.1. Тестовые объекты Для исследования алгоритмов управления в замкнутом кон- туре использованы объекты II и III, описанные в [5.9] (см. при- ложение). Объект II. Это объект с неминимальнофазовой характеристикой, описы- ваемый непрерывной передаточной функцией G л (s) = (1 _]_Tis) (1+Tas) ’ (5.4-1) где К = 1; Tj = 4 с; Т2 = 10 с. Соответствующая дискретная передаточная функция объекта II имеет вид GnW = 4‘?Jz'+^>,. (5.4-2) Параметры передаточной функции для различных значений так- тов квантования приведены в табл. 5.4.1. Переходный процесс объекта при подаче на его вход единичного ступенчатого воз- действия показан на рис. 5.4.1, а. Объект III. Это объект, обладающий характеристиками фильтра нижних частот (низкочастотный) и чистым запаздыванием, с передаточной
Гл. 5. Параметрически оптимизируемые регуляторы 95 Параметры объекта II Таблица 5,4.1 Тент кванто- вания То, с 1 4 8 16 Ь1 —0,07289 —0,07357 0,13201 0,55333 ь2 0,09394 0,28197 0,34413 0,23016 «1 —1,68364 — 1,03820 —0,58466 —0,22021 а2 0,70469 0,24660 0,06081 0,00370 фу пкцией (3 (s)_________К (14~T4s)________e-Tts hi 1 ~ (1+T1S) (1 + T2s) (14-T3s)е (5.4-3) где к=1; Т1=10 с; Т2 = 7с; Т3 = Зс; Т4 = 2с; Tt = 4c. Дискретная передаточная функция объекта III имеет вид ( \___b04-biz b2z 2-ф-b 3z 3 d III \ / i_|_aiZ-i_|_a2Z-2_|_a3Z-3 (5.4-4) Параметры передаточной функции Gni (z) для различных значений такта квантования приведены в табл. 5.4.2. Переходный процесс для тестовых объектов II и III: а — объект II, б — объект III. объекта при подаче на ствия показан на рис. его вход единичного ступенчатого воздей- 5.4.1, б.
96 Ч. II. Системы управления с детерминированными возмущениями Параметры объекта III Таблица 5.4.2 Такт кванто- вания То» с 1 4 8 16 d 4 1 1 1 ьо 0 0 0,06525 0,37599 К 0,00462 0,06525 0,25598 0,32992 Ьг 0,00169 0,04793 0,02850 0,00767 Ь3 —0,00273 —0,00750 —0,00074 —0,00001 Я1 —2,48824 — 1,49863 —0,83771 —0,30842 аг 2,05387 0,70409 0,19667 0,02200 аз —0,56203 —0,09978 —0,00995 —0,00010 5.4.2. Результаты моделирования алгоритмов управления второго порядка а) Алгоритмы управления с незаданным начальным значением управляющей переменной Здесь рассмотрены некоторые результаты моделирования на универсальной ЭВМ систем управления, состоящих из тестовых объектов II и III и регуляторов с алгоритмами управления второго порядка, для которых начальное значение управляющей перемен- ной не задано. Значения всех трех параметров алгоритмов получены в результате оптимизации. Далее будет использоваться сокращен- ная запись названия регуляторов такого типа, описываемых пере- даточной функцией (5.2-1) — ЗПР-З (3-параметрический регулятор с 3 оптимизируемыми параметрами). В качестве критерия оптими- зации использован квадратичный критерий (5.2-6). Параметры q0, qi и q2 регулятора определялись с помощью численного метода Флет- чера — Пауэла. Время моделирования М=128 с. Качество процессов управления при ступенчатом изменении сигнала задающей переменной определяется следующими парамет- рами: ----- / N- е2(к)=1/ __L_ У е2 (к) —среднеквадратическая ' k=o ошибка управления; (о.4-о) Уш = Ушах (t)—w (0—максимальное перерегулирование; (5.4-6) kx — время установления, при котором | е (к) | 0,01 | w (к) |. (5.4-7) Среднеквадратическое отклонение управляющей переменной (зат- раты на управление) определяется в соответствии с выражением S„ - /дПДк) = у Д-р V ди= (к). (5.4-8) к = о
Гл. 5. Параметрически оптимизируемые регуляторы 97 Значения указанных параметров качества являются функциями такта квантования То и весового коэффициента г при управляющей переменной в критерии оптимизации (5.2-6). Время моделирования 1N выбрано равным 128 с, что с избытком достаточно для того, что- бы ошибка управления стала практически равной нулю. Отсюда получаем N —128 с/Т0. Параметры Se и Su названы среднеквадрати- ческими, что эквивалентно термину «эффективное значение» или термину «корень квадратный из эффективной мощности». Замечание. Ступенчатое возмущение возбуждает преимущественно низкоча- сточные движения системы и приводит к подчеркиванию интегрирующих свойств регулятора. В гл. 13 рассмотрены стохастические возмущения, содер- жащие высокочастотные компоненты и приводящие в связи с этим к подчер- киванию пропорциональных и дифференцирующих свойств регулятора. ВЛИЯНИЕ ТАКТА КВАНТОВАНИЯ То На рис. 5.4.2а и рис. 5.4.26 приведены графики переходных про- цессов по управляющей (дискретные значения) и регулируемой пе- ременным соответственно в системах с двумя тестовыми объектами при ступенчатом изменении задающего сигнала и значениях такта квантования То— 1, 4, 8 и 16 с (при г=0). Для относительно малого значения То, равного 1 с, переходные процессы практически совпа- дают с процессами в непрерывном ПИД-регуляторе. Для То=4 с непрерывный сигнал регулируемой переменной для обоих тестовых объектов все еще можно считать вполне удовлетворительным. Од- нако уже при Т0=8 с для объекта II и при То—16 с для обоих объек- тов качество переходных процессов становится неудовлетворитель- ным. Следовательно, критерий качества Se (5.4-5) следует использо- вать с осторожностью для оценки поведения системы при такте дис- кретности, превышающем 4 с. Тем не менее, поскольку для упроще- ния вычислений параметрическая оптимизация выполняется в клас- се дискретных сигналов, значения Se используются для сравнения. На рис. 5.4.3 показана зависимость критерия качества Se и среднеквадратического отклонения управляющей переменной Su от величины такта квантования То. Для объекта II среднеквадра- гнческая ошибка управления, максимальное значение перерегули- рования ут и время установления регулируемой координаты kf возрастают с увеличением такта квантования То, т. е. происходит ухудшение качества регулирования. Кривая, изображающая из- менение параметра Su имеет минимум при То=4 с и возрастает при То>4 с и То<4 с. Для объекта III все три характеристики ухудша- ются с увеличением такта квантования, а параметр Su принимает минимальное значение при Т0:=8 с. Улучшение качества управле- ния для Т0<8 с обусловлено тем, что при уменьшении То значение Su существенно увеличивается и поэтому возрастает величина и(0) (см. рис. 5.4.2). Исходя из анализа результатов моделирования, можно заклю- чить, что для данного критерия оптимизации при г=0 допустимая
98 Ч. II. Системы управления с детерминированными возмущениями Рис. 5.4.2а. Переходные процессы при изменении задающего сигнала для объекта II при различных значениях тактов квантования Ти и г—0.
Гл. 5. Параметрически оптимизируемые регуляторы 99 Рис. 5.4.26. Переходные процессы при изменении задающего сигнала для объекта III при различных значениях тактов квантования То и г=0,
100 Ч. II. Системы управления с детерминированными возмущениями величина такта квантования для обоих объектов лежит в диапазоне 4ч-8 с, причем меньшее значение такта соответствует лучшему ка- честву управления. Такт квантования То=1 с непригоден для объек- Рис. 5.4.3. Зависимость качества управления и затрат на управление от величины То при г=0. та III, так как затраты на управление становятся слишком боль- шими по сравнению с улучшением показателей качества. Такт кван- тования То= 16 с непригоден для обоих объектов из-за низкого ка- чества управления.
Гл. 5. Параметрически оптимизируемые регуляторы 101 При выборе такта квантования можно также воспользоваться зависимостью критерия Setl (5.2-6) от То. Этот критерий учитывает как качество управления Se, так и затраты на управление Su. На рис. 5.4.3 показаны кривые изменения SetI для значения весового Таблица 5.4.3 Параметры регулятора для различных тактов квантования То при г = 0 Объект II Объект III 1 То» с 4 8 16 1 То, 4 С 8 16 Чо 5,958 2,332 2,000 1,779 19,408 4,549 2,437 1.957 41 — 10,337 —3,074 - -2,080 — 1,089 —36,623 —7,160 —2,995 —1,660 42 4,492 1,105 0,748 0,361 17,370 3,030 1,158 0,667 К 1,466 1,227 1,252 1,418 2,038 1,519 1,279 1,290 CD 3,065 0,901 0,597 0,255 8,524 1,994 0,905 0,517 CI 0,077 0,297 0,534 0,742 0,076 0,275 0,469 0.748 коэффициента г при управляющей переменной в критерии оптими- зации, равного 0,25. Из анализа «смешанного» критерия видно, что он имеет пологий минимум при Т0=5 с для объекта III и при Т0=8с для объекта II. Следовательно, приемлемые значения такта кванто- вания лежат в диапазоне Т0=3-г-8 с для объекта III и Т0=1Ч-8 с для объекта II. Используя значение Т95 для времени установле- ния процесса, т. е. для того времени, за которое выходная величина достигает 95% установившегося значения при ступенчатом входном сигнале, запишем следующие условия для выбора такта квантова- ния: Объект II: |3 = Т95/Т0 = 4,4 ... 11,7; щ 4 91 Объект III: |3 = Т95/Т0 = 5,6 ... 15,0. 1 ' В табл. 5.4.3 приведены параметры регулятора для различных значений То. При увеличении такта квантования параметры q0, qr и q2 уменьшаются. Коэффициент передачи регулятора К сущест- венно изменяется при Т0^4 с, коэффициент опережения cD умень- шается, а коэффициент интегрирования с, возрастает. При значе- ниях тактов квантования То= 1,4 и 8 с параметры регулятора удов- летворяют неравенствам (5.2-14) или (5.2-17), т. е. алгоритм управ- ления обладает свойствами обычного ПИД-регулятора. ВЛИЯНИЕ ВЕСОВОГО КОЭФФИЦИЕНТА Г ПРИ УПРАВЛЯЮЩЕЙ ПЕРЕМЕННОЙ На рис. 5.4.4а и 5.4.46 показаны переходные процессы при сту- пенчатом изменении задающего сигнала для такта квантования То — 1 с и различных значений весового коэффициента г в критерии оп- шмизации. Как видно из приведенных графиков, изменение вели-
102 Ч. 11. Системы управления с детерминированными возмущениям и is Т0-1с г-0,25 Рис. 5.4.4.а. Переходные процессы при из- менении задающего сигнала для различ- ных значений весового коэффициента г при управляющей координате. Объект II. Такт квантования То=1 с. чины г от 0 до 0,1 гораздо больше влияет на качественные характе- ристики переходного процесса, чем изменение г от 0,1 до 0,25. На рис. 5.4.5 приведены графики изменения параметров качества управления и затрат на управление для То= 1,4 и 8 с в зависимости от величины весового коэффициента г. Для обоих объектов возраста-
Гл. 5. Параметрически оптимизируемые регуляторы 103 10 25 * 50 t,G г - 0,25 Рис. 5.4.4.б. Переходные процессы при изменении задающего сигнала для раз- личных значений весового коэффици- ента г при управляющей координате. Процесс III. Такт квантования T0=i с. ние г ведет к увеличению Se и уменьшению затрат на управление Su, причем для объекта III этот эффект оказывается большим, чем для объекта II. Выбор значения весового коэффициента г оказывает более сильное влияние на Se и Su для объекта III. Кроме того, влия- ние г тем больше, чем меньше величина такта квантования.
104 Ч. II. Системы управления с детерминированными возмущениями 0,15 1,5 - -----$и Se Su ~ Se 0,50 1,0 -• 200 Рис. 5.4.5. Зависимость качества управления и затрат на управление от величины весового коэффициента г в критерии оптимизации. Значение максимального перерегулирования ут уменьшается с увеличением г. Время регулирования kf увеличивается вместе с г для То=1 с. Однако для То=4 и 8 с кх сначала убывает, а затем воз- растает при большем значении г. Выбор коэффициента г в гораздо большей степени влияет на параметры ут и kj, чем на Se и Su для всех значений такта квантования. Увеличение весового коэффициен- та при управляющей переменной в критерии оптимизации (5.2-6),
Гл. 5. Параметрически оптимизируемые регуляторы 105 таким образом, приводит к уменьшению затрат на управление Su, ь.ирастанию Se и уменьшению перерегулирования ут. Выбор коэф- фициента г в значительной степени зависит от конкретных условий применения регулятора. Приемлемый компромисс между хорошим качеством процессов в системе и малыми затратами на управление может быть получен при 0,1^г^0,25, если коэффициент передачи объекта равен единице. Таблица 5.4.4 Параметры регулятора для различных весовых коэффициентов при Т0 = 4сиТ0 = 8с Г„=4 с Объект 11 Объект III 0 Г 0,1 0,25 0 Г 0, 1 0,25 Чо 2,332 1,933 1,663 4,549 2,688 2,049 Qi —3,076 —2,432 —2,016 —7,160 —3,798 —2,723 q2 1,117 0,816 0,637 3,030 1,398 0,916 к 1,215 1,117 1,026 1,519 1,290 1,133 CD 0,919 0,730 0,621 1,994 1,083 0,808 С[ 0,307 0,284 0,277 0,275 0,223 0,213 Г Г Tq — 8 с 0 0,1 0,25 0 0,1 0,25 q0 2,000 1,714 1,512 2,437 1,944 1,653 41 —2,080 — 1,685 —1,423 —2,995 —2,222 — 1,795 Чг 0,748 0,557 0,440 1,158 0,780 0,587 к 1,252 1,175 1,072 1,279 1,164 1,066 CD 0,597 0,481 0,410 0,905 0,669 0,550 CI 0,534 0,507 0,494 0,469 0,431 0,417 В табл. 5.4.4 приведены параметры регулятора для тактов кван- тования Т0=4 с и Т0=8 с. При увеличении веса г управляющей пере- менной значения параметров q0, qi и q2 уменьшаются. Коэффициен- ты К и cD также убывают, в то время как с, меняется мало. б) Алгоритм управления с заданным начальным значением управ- ляющей переменной и(0) В разд. 5.2.2 было показано, что при ступенчатом изменении за- дающей переменной на 1 или w0 параметр q0 алгоритма управления равен значению управляющей переменной и(0) или u(O)/wo (см. 5.2-6). Выбрав и(0) с учетом допустимого диапазона изменения \ правляющей переменной, можно сразу же определить значение параметра q0. Теперь можно проводить оптимизацию только двух
106 Ч. Н. Системы управления с детерминированными возмущениями параметров: qi и q2. Следовательно, такой алгоритм управления бу- дет обозначаться ЗПР-2. Поскольку диапазон изменения управляющей переменной мож- но ограничить заданием относительно малой величины и(0), весовой коэффициент г в критерии оптимизации (5.2-10) может быть выбран равным нулю. ВЛИЯНИЕ ЗАДАННОЙ УПРАВЛЯЮЩЕЙ ПЕРЕМЕННОЙ На рис. 5.4.6 приведены графики переходных процессов при сту- пенчатом изменении задающей переменной для различных началь- ных значений управляющей переменной u(0) = qo. Уменьшение за- Рис. 5.4.6. Переходные процессы при ступенчатом изменении задающей перемен- ной для различных заданных начальных значений управляющей переменной и(0). Такт квантования То=;4 с. данной величины q0 от значения q0orn, полученного в результате оптимизации по всем параметрам в соответствии с квадратичным критерием при г=0, приводит к сглаживанию переходного про- цесса в системе. Перерегулирование уга при этом убывает. На рис. 5.4.6, б показан переходный процесс для случая, когда qtl выбрано таким, что первые два значения управляющей переменной и(0) и и(1) равны. Однако в этом случае перерегулирование возрастает. Аналогичный результат получается и для объекта II. На рис. 5.4.7 приведены характеристики качества управления и затрат на управление для реально приемлемых значений такта кван- тования То=4 с и Т0=8 с. При снижении заданного начального зна- чения управляющей переменной и(0), т. е. уменьшении qo, затраты
Гл. 5. Параметрически оптимизируемые регуляторы 107 200 200 о Т0 = ёс Ут 0,3 0,2 0,1 Рис. 5.4.7. Зависимость качества управления и затрат на управление от величины заданного начального значения управляющей переменной u(0)=q0. - с _----------- 150 - ~Ут Ут с 0,3 150 1,5 2,0 . 2,5 1,5 2,5 Чо а) Объект U б) Объект Щ и.'1 управление убывают, а параметр Se незначительно возрастает. 11еререгулирование ут и время регулирования kt также убывают 1ля Т0=8 с. Для То=4 с сначала аналогичные тенденции сохраня- ются, однако при существенном уменьшении qu оба последних ко- н|к})ициента начинают возрастать. Таким образом, существует мини- мум характеристик уш и кх.
108 Ч. II. Системы управления с детерминированными возмущениями Если начальное значение управляющей переменной u(O) = qo задано не слишком малым, параметр качества Se ухудшается незна- чительно. Однако затраты на управление Su, перерегулирование ут и время регулирования кг уменьшаются существенно. Удачный выбор начального значения управляющей переменной и(0) обеспечивает не только хорошее качество процессов управле- ния, но и снижение объема необходимых вычислений в процессе параметрической оптимизации. В табл. 5.4.5 приведены параметры Таблица 5.4.5 Параметры регулятора для различных начальных значений управляющей переменной u(O) = qo для То = 4 с и Т0 = 8 с Объект II Объект Ill То=4 с ЗПР-2 ЗПР-З 1,500 1,750 2,000 2,332 41 -1,593 -2,039 —2,484 — 3,076 4а 0,376 0,591 0,810 1,105 К 1,125 1,159 1,190 1,227 CD 0,333 0,511 0, 681 0,901 С1 0,251 0,261 0, 274 0,295 То=8 с ЗПР-2 ЗПР-З Чо 1,500 1,750 2,250 1,999 41 — 1,338 1,717 —2,405 —2,079 42 0,364 0,556 0,936 0,748 К 1,136 1,194 1,314 1,251 CD 0,321 0,466 0,712 0,597 С1 0,464 0,494 0,594 0,534 То = 4 с ЗПР-2 ЗПР-З Чо 1,500 2,000 2,500 4,549 41 — 1,499 —2,406 —3,320 —7, 160 42 0,223 0,656 1,097 3, 030 К 1,277 1,244 1,403 1,519 CD 0,175 0,488 0,783 1,994 С1 0,176 0,186 0,198 0,275 То=8 с ЗПР-2 ЗПР-З Чо 1,500 1,750 2,000 2,437 41 — 1,451 —1,864 —2, 280 — 2, 995 42 0,372 0,576 0,784 1,158 К 1 , 128 1 , 174 1,21 6 1 , 279 CD 0,330 0,490 0,645 0,905 С1 0,374 0,393 0,414 0,469 регулятора для различных заданных значений ц(0). Как видно из этой таблицы, параметры qx и q2 изменяются в соответствии с тен- денцией изменения q0, однако с, меняется мало. Остальные парамет- ры регулятора при одинаковых значениях q0 мало изменяются для обоих объектов. в) Выводы по результатам моделирования Для параметрически оптимизируемых алгоритмов управления первого и второго порядков коэффициенты К, Ci и cD, т. е. коэффи- циенты передачи, интегрирования и опережения, могут быть просто вычислены по известным значениям параметров q0, qj и q2 с исполь- зованием соотношений (5.2-15). Эти коэффициенты нет необходи- мости определять по соответствующим коэффициентам дифферен-
Гл. 5. Параметрически, оптимизируемые регуляторы 109 шальных уравнений аналогового регулятора. Соотношения (5.2-15) справедливы и для больших значений тактов квантования. Задавая параметр q0, можно определить начальное значение уп- равляющей переменной и(0) или начальную ошибку управления при ступенчатом изменении задающего сигнала. При этом уменьшается на единицу число оптимизируемых с помощью численных методов параметров регулятора, что сокращает время расчетов. Более того, такой подход позволяет в достаточной степени задемпфировать про- цессы управления без введения в критерий оптимизации весового ко- эффициента г. Результаты моделирования объекта второго порядка с немини- мальнофазовой характеристикой и объекта третьего порядка с чис- тым запаздыванием позволяют сделать следующие выводы для ал- н>ритмов управления второго порядка. ВЫБОР ТАКТА КВАНТОВАНИЯ То Чем меньше величина такта квантования, тем лучше качество процессов управления. Однако при очень малых значениях такта квантования дальнейшее улучшение качества достигается лишь при существенном возрастании затрат на управление. Поэтому не сле- дует выбирать такт квантования слишком малым. Для выбора при- емлемого такта квантования можно руководствоваться следующим ^отношением: ТО/Т9В « 1/15 ... 1/4. (5.4-10) Здесь Т9В— время достижения регулируемой координатой величи- ны, равной 95% ее установившегося значения при ступенчатом из- менении задающего сигнала. ВЫБОР ВЕСОВОГО КОЭФФИЦИЕНТА Г Если на основании оптимизации выбираются значения всех трех параметров алгоритма управления второго порядка (ЗПР-З), то оптимальным с точки зрения хорошего качества процессов управле- ния и малых затрат на управление будет значение параметра г, удовлетворяющее условию г/К?«0,1 ... 0,25, (5.4-11) где K = Gp(l) — коэффициент передачи объекта. Чем больше величина такта квантования, тем меньше влияние коэффициента г на значения параметров алгоритма управления. ВЫБОР НАЧАЛЬНОГО ЗНАЧЕНИЯ УПРАВЛЯЮЩЕЙ ПЕРЕМЕННОЙ u(0) = qo Величина q0 зависит от допустимого диапазона изменения управ- ляющей переменной и от характеристик конкретного объекта управ- ления. Так, для неминимальнофазового объекта (объект II) значе- ние q0 выбрано равным 1,75, а для инерционного объекта (объект III) q0;=2,5. Однако значение q0 можно выбирать из большего диа-
НО Ч. II. Системы управления с детерминированными возмущениями пазона, зависящего от допустимого диапазона изменения управляю- щей переменной. При оценке величины q0 следует учитывать мак- симально возможное значение ступенчатого изменения сигнала зада- ющей переменной. Если такт квантования не слишком мал, начальное значение и уп- равляющей переменной и (0) можно оценить с помощью следующего неравенства: и (0) 1/(1 —аг) (Ь1+Ь8+ ... + bm). (5.4-12) Это неравенство получено на основании анализа характеристик мо- дифицированного апериодического регулятора АР(т-Ы) [см. урав- нение 7.2-13)]. 5.5. ВЫБОР ТАКТА КВАНТОВАНИЯ ДЛЯ ПАРАМЕТРИЧЕСКИ ОПТИМИЗИРУЕМЫХ АЛГОРИТМОВ УПРАВЛЕНИЯ Как хорошо известно, дискретные регуляторы обычно обладают худшими качественными характеристиками, чем непрерывные. Иногда это объясняют тем, что дискретные выборки сигналов содержат меньше информации, чем не- прерывные сигналы. Однако интерес представляет не только количество информации, но и то, как она используется. Поскольку кроме этого важную роль играют класс и частотный спектр возмущающих сигналов, то оказы- вается достаточно сложным сделать обобщающие выводы о качестве процессов регулирования в дискретных системах. В случае параметрически оптимизи- руемых регуляторов, как правило, принято считать, что качество управления ухудшается с ростом величины такта квантования. Следовательно, если по- ставлена задача обеспечения качества управления, такт квантования следует выбирать как можно меньшим Выбор такта квантования зависит не. только от достижимого качества управления. Необходимо учитывать следующие факторы: — требуемое качество управления; — динамику объекта; — спектры возмущений; — исполнительное устройство и его привод; — измерительные приборы; — требования оператора; — вычислительные затраты или стоимость одного контура управления; — исполь'’уемую модель объекта. Рассмотрим, какое влияние оказывают эти факторы Из рис. 5.4.2 и 5.4.3 видно, что задание такта квантования То = =4 с приводит к незначительному ухудшению процессов по сравне- нию с процессами при То=1 с, представляющими хорошее прибли- жение к непрерывному случаю. Такшм образом, если нас интересует только требуемое качество управления, величина такта квантования часто может быть выбрана большей, чем та, которая обеспечивает близкую аппроксимацию непрерывного контура управления. Прак- тические рекомендации по выбору такта квантования, основанные на аппроксимации характеристик непрерывного контура управления, приведены в табл. 5.5.1. На выбор такта квантования существенное влияние оказывает динамика объекта управления, поскольку она определяет как стру к-
Правила для определения тактов квантования для низкочастотных объектов Критерий определения такта квантования Литература Определение такта квантования Такт кванто- вания для объекта III, с Замечания [5.10], [5.3] [5.10], [5.3] То®(1/8... 1/16) (1/f) То®(1/4. ..1/8) Tt 3...1 Объекты с преобладающим временем запаздывания Время установления, большее, чем для непрерывного ПИ-ре- гулятора: 15% [5.11], [5.17] То«(1,2.. .0,35) Ти Т()« (0,35...0,22) Ти 4,5 0,1 -С Ти/Т<; 1,0 1,0^Ти/Т< 10 Компенсация возмущений до частоты ©max- как в непрерыв- ном контуре Т0 = Л/©тах 8...2 Условие выбора: |G(®max) 1 = 0,01... 0,1 Моделирование разд. 5.4 [5.7] То«(1/6... 1/15) ТЯ5 8...3 Идентификация модели объекта [3.13] Т0«(1/6... 1/12) ТЯ5 8...4 f —собственная частота замкнутой системы (1/с); Т^ — время запаздывания; Т93 —время достижения 95% установившегося значения; Тц — время задержки (см. табл. 5.6.1). Параметрически оптимизируемые регуляторы
112 Ч. 11. Системы управления с детерминированными возмущениями туру передаточной функции, так и ее постоянные времени. В связи с этим соотношения для выбора такта квантования (табл. 5.5.1) представлены как функции времени задержки, чистого запаздыва- ния и т. д. Как правило, чем больше постоянная времени, тем боль- ше такт квантования. Рассмотрим теперь зависимость такта квантования от спектра возмущающих сигналов или ширины их полосы. Хорошо известно, что для контура управления можно выделить три области частот [5.14] (см. разд. 11.4): низкочастотная область (ОС®^®!)—воз- мущения управляющей переменной подавляются; среднечастотная область (со^со^Оа) — возмущения усиливаются; высокочастот- ная область (со2<До-<оо) — контур управления не оказывает дей- ствия на возмущения. Обычно контуры управления проектируют таким образом, чтобы их среднечастотная область охватывала такой диапазон частот, в котором амплитуда возмущающих действий была незначительной. Кроме того, возмущающие сигналы высокой и средней частоты не- обходимо подвергать фильтрации, чтобы исключить нежелательные отклонения управляющей переменной. Если возмущающие сигналы вплоть до частоты comax^coi необходимо отрабатывать, как и в непрерывной системе, такт квантования должен выбираться в соот- ветствии с теоремой Шеннона: Т0^л/(отах. Эту же теорему можно использовать для определения такта кван- тования в том случае, когда известно собственное значение системы с наибольшей собственной частотой.сошах. Она будет максимальной частотой, пропускаемой дискретным регулятором без искажений. В частности, если исполнительное устройство обладает значитель- ной инерционностью, в общем случае не следует выбирать слишком малый такт квантования, поскольку может случиться, что предыду- щий сигнал управляющей переменной окажется неотработанным к моменту прихода следующего сигнала. Если в системе используют- ся измерительные приборы, выдающие сигналы дискретно, как, например, в химических анализаторах или во вращающихся радио- локационных антеннах, то такт квантования дискретного регулято- ра оказывается заданным. Оператору, как правило, желательно иметь в системе быстрый отклик управляющей или регулируемой переменной на ступенчатое изменение задающего сигнала в произ- вольный момент времени. Поэтому такт квантования не должен пре- вышать нескольких секунд. Более того, если учитывать возможность возникновения опасной ситуации, например появления сигнала тре- воги, такт квантования следует выбирать малым. Для минимизации вычислительных затрат или стоимости каждого контура управления такт квантования следует брать как можно большим. Если расчет системы управления выполняется на основе иденти- фицированной модели объекта и если для идентификации исполь-
Гл. 5. Параметрически оптимизируемые регуляторы 113 эуются методы оценки параметров, то такт квантования не должен быть слишком малым, иначе могут возникнуть вычислительные трудности, обусловленные близкой к линейной зависимостью урав- нений системы при малых То [3.13]. Из сказанного выше следует, что такт квантования нужно выби- p.i гь, исходя из большого числа требований, часть из которых ока- и.шаются противоречивыми. Поэтому приходится в каждом конкрет- ном случае принимать компромиссное решение. К тому же для упро- щения структуры программного обеспечения часто приходится выбирать один и тот же такт квантования в различных контурах си- стемы управления. В табл. 5.5.1 сведены рекомендации по выбору i.iKTOB квантования, взятые из современных источников. Заметим, 'но эти рекомендации, основанные на аппроксимации качества про- тесов управления в непрерывных системах, часто приводят к зада- нию слишком малых значений тактов квантования. Для обеспече- ния хорошего качества управления вполне достаточно, по крайней мере для низкочастотных объектов, иметь от 6 до 15 выборок за пе- риод, определяемый временем установления Т95. Для некоторых объектов в тяжелой и химической промышленности рекомендуется использовать такты квантования, значения которых приведены а работах [5.12], [5.13], [5.5]. 5.6. ПРАВИЛА НАСТРОЙКИ ПАРАМЕТРИЧЕСКИ ОПТИМИЗИРУЕМЫХ АЛГОРИТМОВ УПРАВЛЕНИЯ Для того чтобы получить приближенно оптимальный набор параметров непрерывных ПИД-регуляторов, часто применяют так называемые «правила настройки». Обычно эти правила предназначены для низкочастотных объектов и основаны на определении пределов устойчивости системы с П-регулятором или использовании постоянных времени объекта управления. Обзор таких правил содержится в работе [5.14]. Хорошо известны, например, правила Циглера и Никольса [5.14]. Рассмотрим возможность модификации правил настройки для дискретных ПИД-регуляторов. В [5.15] приведены соотношения для расчета параметров регулятора, предназначенного для управления объектами, динамика которых может быть аппроксимирована пере* даточной функцией (5.6-1) Однако с помощью этих соотношений для непрерывных регуля- торов можно получить параметры дискретных регуляторов, если вместо чистого запаздывания Tt подставить величину (Tt+T0/2). Здесь Т0/2—-аппроксимированное время задержки, обусловленное процедурами квантования и фиксации сигналов. Правила настройки параметров, основанные на определении ха- рактеристик переходного процесса или пределов устойчивости, предложены в [5.16] для модифицированных алгоритмов управле-
Таблица 5.6.1 Правила настройки параметров регуляторов, предложенные Такахаши [5.16] на основании критерия Циглера — Никольса Алгоритм управления: и (к)—и(к— 1) = К [у (к— 1)—у (к)-|-^Л [w(k) —у(к)] 4-4^- [2у (к — I) — у (к—2) —у (к)] 1 L и io J К То/Т, Td/T0 К То/Т, Td/T0 п Тс, Тц+ь — — Ккрит/2 — — пи 0,9Tg 0.135TqTo 0,27TgTo — |0,45ККрИт-.-0.27ККрИТ] X Х(Т0/Тр) меньшее значение для ТО~4ТЦ . . Ккрит То 0,54 К Тр — Ти + Т0/2 (Ти -v Т0/2)2 К (Ти Н-Т0/2)2 ПИД 1,2Tg 0,3TgTo O,6TGTo 0’5ТС] КТо [0,6ККрИТ...0,6Ккрит]-- ‘р Справедливо для То<21 Не рекомендуется для Тс Ккрит То к тр U~4TU 3 ККрИТ Тр 40 К То (TU+TOJ (Ти + Т0/2)2 Не примени K(Tu4-T0/2)2 ио для Тц/Т0 —* 0 у' I 4^— Xi У1 ./ 1 "7 t *4*—-! t Ти С -IfJ » Измерение параметров переходного процесса Измерение параметров колебаний II. Системы управления с детерминированным, и возмущениям и
Гл. 5. Параметрически оптимизируемые регуляторы 117 Ти/^ Г ~ 0,25 о-------° Га1Т^О,1 о-------о То1т-О,5 о-------о Т0[Т = 1,0 Рис. 5.6.3. Оптимальные по квад- ратичному критерию (5.6-4) при г=0,25 параметры алгоритма уп- равления ЗПР-З(ПИД-алгоритма) для объектов Gp(s)=~- • В соответствии с (5.2-15) К= =q0—q2. CD=q2/K, Ci=(qo+ +qi+q2)/K. тора нулевого порядка при различных значениях такта квантова- ния: Т/То=О,1; 0,5 и 1,0. Параметры q0, qx и q2 регулятора опреде- лялись на основании оптимизации квадратичного критерия качест- ва управления (см. 5.2-6) м Se2u= 2 [е* (к) 4-Г Ди2 (к)] (5.6-4) к= 0 для ступенчатого изменения задающей переменной w (к) и трех значений весового коэффициента при управляющей переменной г = 0, 0,1 и 0,25. На основании полученных параметров были опре-
116 У. //. Системы управления с детерминированными возмущениями с-------- То/Т~0'1 о----То/Т = 0,5 °-------° То/Т-1,О Рис. 5.6.2. Оптимальные по квад- ратичному критерию (5.6-4) при г—0,1 параметры алгоритма уп- равления ЗПР-З(ПИД-алгоритма) для объектов Gp (s)=-^-^s^ . В соответствии с (5.2-15) K=q0— —q2> CD=q2/K, ci=(q0+q1+q2)/K, ровое моделирование [5.18]. Моделирование выполнялось для объек- тов с непрерывной передаточной функцией вида Gp (s) == ц_|_у^п > (5.6-3) где п принимало значения 2, 3, 4 и 6. Указанные передаточные функции были переведены в дискретную форму с учетом экстраполя-
[л. 5. Параметрически оптимизируемые регуляторы 115 ния, представленных в виде (5.3-3). Эти правила сведены в табл. 5.6.1. Для более детального исследования зависимости параметров ал- горитма управления u (к) = и (к—l) + qoe(k) + q,e(k—l) + q2e (к —2) (5.6-2) от характеристик объекта управления (для низкочастотных объек- тов), вида критерия качества и такта квантования проводилось циф- ------о Го/Г = 0,1 о-----о^/Г = 0,5 о-----о То/Т = 1,0 Рис. 5.6.1. Оптимальные по квадратичному критерию (5.6-4) при г=0 параметры алгоритма управления ЗПР-З (ПИД-алго- ритма) для объектов (s)= — "Л~~г т~'„- • В соответствии с (1+Ts)n (5.2-15) K=q0—co=q2/K, С1=(Чо+Ч1+Ч2)^К, 0,5 0,4 0,3 0,2 0,1 О 0,2 0,4 0,6 Т<Л
118 Ч. 11. Системы управления с детерминированными возмущениями делены характеристические коэффициенты регулятора К, cd и с, в соответствии с выражениями (5.2-15). Результаты этих иссле- дований (диаграммы настройки) приведены на рис. 5.6.14-5.6.3. Коэффициенты регулятора изображены на них как функции отно- шения постоянных времени TU/TG передаточных функций объектов. Зависимость характеристик Ти/Т или TG/T от отношения Tu/Tg иллюстри- руется рис. 5.6.4. Из анализа приведенных зависи- мостей следует: а) с ростом отношения Tu/Tg (с рос- том порядка п) — коэффициент передачи К убы- вает; — коэффициент опережения cD воз- растает; — коэффициент интегрирования с( убывает; б) с ростом такта квантования Гв — К убывает; — Cd убывает; — с, возрастает; Рис. 5.6.4. Характеристики объекта Gp (s)= , — l/(14~.Ts)n 13.11]. Величины Tu и Tg пояс- иГЬ йены в табл. 5.6.1. в) с ростом весового коэффициента г в критерии качества — К убывает; — Cd убывает; — С] убывает. Используя эти номограммы и характеристики переходного про- цесса при ступенчатом изменении задающего сигнала, можно опре- делить параметры регулятора, реализующего алгоритм управления второго порядка. Процесс выбора параметров состоит в следующем: 1. Проводится касательная в точке перегиба кривой переход- ного процесса и определяются значения Tu, Tg и T-u/Tg, а также коэффициент передачи К> == у (оо)/ц (оо) (см. табл. 5.6.1). 2. Из номограммы на рис. 5.6.4 определяются значения Ти/Т'' и TG/T". После этого вычисляется значение 1=у(Т'ф-Т"). 3. После выбора такта квантования То определяется отноше- ние То/Т. 4. По номограммам, приведенным на рис. 5.6.1—5.6.3, после выбора весового коэффициента г определяются значения коэффи- циентов Ко; cd и Ср которые зависят от отношений Т.,/TG и То/Т.
Гл. 5. Параметрически оптимизируемые регуляторы 119 Здесь Ко—коэффициент разомкнутого контура регулирования: К(, = К-Кр. 5. На основании уравнения (5.2-15) и полученных значений К = Ко/Кр, cD и ct определяются параметры регулятора: ql<=K(l+cI), q, = K (с, —2cd— 1), q2 = KcD. Хотя диаграммы настройки, приведенные на рис. 5.6.1-4-5.6.3, построены для равных постоянных времени объекта, рассмотрен- ная процедура определения параметров регуляторов может быть также использована для низкочастотных объектов с существенно отличающимися постоянными времени. Это подтверждается резуль- татами цифрового моделирования (см., например, разд. 3.2.4), а также данными, приведенными в табл. 5.6.2. В ней для сравнения приведены оптимальные параметры регулятора для объекта III, а также параметры, полученные на основе правил настройки (табл. 5.6.1) и с использованием диаграмм 5.6.14-5.6.3 для соответствую- щих объектов. Параметры регулятора, выбранные на основе диа- грамм настройки, хорошо согласуются с оптимальными. Примене- ние правил настройки из табл. 5.6.1 (левая часть таблицы) приводит к значительному завышению коэффициента передачи К. Значения коэффициентов cd и с1, напротив, оказываются достаточно близ- кими к оптимальным. Таблица 5.6.2 Сравнение результатов настройки параметров по характеристикам переходного процесса. Объект III. То = 4 с; К = 1; Tu/Tg = 6,6 с /25 с = 0,264 Объект III Т„=4 с к То/^ । — С] rD/'r«=cD Модель объекта Оптимизация парамет- ров для г = 0...0,25 (табл. 5.4.4) 1,52...1,13 0,28...0,21 1,99...0,81 Объект III 1; кахаши [5.16] (та-л. 5.6.1) 2,34 0,33 1,3 1 т - — е— 1us TGs Ри-.. 5.6.1—5.6.3 длу г = О...О,25 1,7...1,2 0,27...0,17 3,8...0,85 1 (1+Ts)n
ГЛАВА 6 Компенсационные регуляторы Основная задача проектирования следящих систем управления состоит в том, чтобы регулируемая переменная у как можно более точно воспроизводила входной задающий сигнал w. Если модель GP устойчивого объекта задана точно, то при отсутствии возмущений эта задача может быть решена введением регулятора в прямой це- пи, как показано на рис. 6.1. В идеальном случае можно потребовать, чтобы выходная координата точно отслеживала входной сигнал w. Это требование может быть выполнено, если GST (z) = GgT (z) = Qp^ . (6.1) Если передаточная функция G£T является реализуемой, то такой регулятор полностью «компенсирует» динамику объекта, поскольку Gp Рис. 6.1. Система управления с прямой связью. обладает обратными к объекту динамическими характеристиками. Однако, если объект обладает чистым запаздыванием, регулятор оказывается нереализуемым, и в его передаточную характеристику приходится вводить дополнительный элемент, позволяющий сфор- мировать реализуемый алгоритм управления: Gs(z) = GST(z)GsR(z)=a-y-GJW- (6.2) UP (z) Конечно, такая модификация приводит к некоторому отличию сигналов w и у. Рассматривая вопросы сокращения нулей и полюсов регулятора и объекта, следует учитывать соображения, изложенные на стр. 122—123. Если же изложенные выше предположения не оправдываются, т. е. если модель объекта оказывается неточной и в системе присутствуют возмущающие воздействия, то для упра- вления следует использовать систему с обратной связью, изобра- женную на рис. 6.2. В отличие от компенсационной в системе с обратной связью нель- зя требовать выполнения условия e(t)=w(t)—y(t)=O для Е>0. Дело в том, что в системах с обратной связью управляющая перемен- ная формируется из сигнала ошибки, который отличен от нуля по крайней мере в течение переходного процесса. Поэтому задается
Гл. 6. Компенсационные регуляторы 121 передаточная функция замкнутой системы Ow(z)=xa, yi°p(z) <б.з) ’ w(z) 1 + Gr (z) Gp (z) заведомо отличная от 1, и передаточная функция регулятора имеет вид Г' / \ 1 (z) /а л\ Gr(z)- Gp(z) 1 —Gw(z) • (6-4) Передаточная функция регулятора (6.4) состоит из обратной передаточной функции объекта управления и дополнительного чле- на, вид которого зависит от заданной передаточной функции замк- нутой системы. Поэтому только часть регулятора используется для Рис. 6.2. Система управления с обратной связью. сокращения нулей и полюсов объекта. «Компенсационный» регуля- тор может быть спроектирован не только для отработки задающего воздействия, но и для заданного возмущающего воздействия. На- пример, для заданной передаточной функции по возмущению Gn(z)=y (z)/n (z) передаточная функция регулятора имеет вид Gr (z) = гЛ-г -7-^v- (6-5) R v ' Gp (z) Gn (z) v > Вопросам разработки «компенсационных» регуляторов, особен- но непрерывных, посвящено большое число работ. Дискретные ре- гуляторы рассматриваемого типа описаны в [6.1—6.3, 2.4, 2.141. Задавая желаемую замкнутую передаточную функцию Gw(z) или Gn(z), следует учитывать следующие ограничения: а) Реализуемость. Если задана дискретная передаточная функция вида G(z) = (6б) то условие реализуемости состоит в том, что п^гп, если am=^0 (см. разд. 3.4). В передаточных функциях рг /7\ _ Gv z-j ?Z4 Bn (z) Gr(z)-p^) и Gp(z)~a^) индексами обозначены порядки полиномов числителя и знамена- теля. Тогда с учетом выражения (6.3) получим для передаточной
122 Ч. И. Системы управления с детерминированными возмущениями функции замкнутой системы Q .Вп Gw (Z)==P^Am+QvBn- Если передаточные функции GR (z) и GP (z) реализуемы, т. е. v и и п т, то порядки полиномов числителя и знаменателя Gw (z) определяются следующим образом: Гг м- ПоРяДок (v+n) Порядок (fi+m) Следовательно, разность порядков (рп) передаточной функции Gw(z) будет равна рп = (ц —v) + (m —и). (6.7) Для получения минимально возможной величины рп выбирают p, = v. Тогда разность порядков замкнутой передаточной функции рп (Gw) = (m—и) оказывается равной разности порядков передаточной функции объекта управления Gp (z): рп (GP)==(m— n) = pn(Gw). (6.8) Это значит, что исходя из условий реализуемости разность поряд- ков передаточной функции замкнутой системы Gw(z) должна быть либо равна, либо быть больше разности порядков передаточной функции объекта, если порядок регулятора [2.19]. Обычно в передаточной функции объекта, соответствующей вы- ражению (3.2-8), коэффициент Ь0=О, поскольку либо чувствитель- ный элемент, либо управляющий орган объекта имеют временную задержку. Тогда из уравнения (6.6) следует, что n=m—1, т. е. разность порядков равна единице, так что, например, передаточная функция минимального порядка будет равна Gw(z)=z-1. б) Сокращение полюсов и нулей. Когда компенсационный регулятор GR(z) с передаточной функ- цией (6.4) и объект Gpo(z) объединены в замкнутую систему управ- ления, то полюса и нули объекта сократятся с нулями и полюсами регулятора, если модель GP(z) точно описывает объект. Однако ис- пользуемые при проектировании модели GP(z)=B (z)/A(z) никогда точно не описывают динамику объекта, поэтому соответствующие нули и полюса сокращаются не точно, а только приближенно. Что касается полюсов (корней полинома A+(z)) и нулей (корней полино- ма B+(z)), которые расположены на z-плоскости внутри круга еди- ничного радиуса, то неточность их сокращения, как правило, при- водит лишь к незначительным отклонениям характеристик замкну- той системы от заданных. Если же полюса A~(z) или нули B~(z)
Гл. 6. Компенсационные регуляторы 123 объекта расположены вблизи или вне окружности единичного ра- диуса, то надо быть очень осторожным. Для анализа этой проблемы [2.4] запишем передаточную функ- цию объекта в следующем виде: 0ро(2,=1Шлг- f69) Соответствующая ему модель будет (7\ в + (z) В (z) . Gp(Z) —А+(z) A-(z)' . <61°) Если регулятор точно компенсирует устойчивые нули и полюса, расположенные внутри единичного круга, т. е. G (Z) = AHz^jz) Gy(z) , (6.U) Bf (z) В" (z) 1 —Gw (z) ’ ' ’ то передаточная функция замкнутой системы примет следующую форму: Gw, res (z) =--------А~ (z) в« (z) Gw (z)--- (6.12) A,7(z)B- (z) [1-Gw(z)] + A- (z)B,7(z)Gw(z) 4 1 Если теперь учесть, что A~(z)=A (z> -f- ЛА" (z), В" (z) = В (z) -p AB~ (z), то мы получим Gw, res (Z) =----A°..^Gw + AA B°Gw--- . (6. i 3) АГВ74-А7АВ [1-Gw] + AA“B9Gw При AA~(z)=0 и AB-(Z)=O полюса этой передаточной функции располагаются вблизи или вне окружности единичного радиуса, однако они точно сокращаются нулями. Если разности AA~(z) и AB-(z) отличны от нуля, полюса системы смещаются и точной ком- пенсации не происходит. В результате этого процессы управления становятся существенно колебательными или даже неустойчивыми, если полюса находятся вне единичной окружности. Поэтому при- менять компенсационные регуляторы для объектов с нулями или полюсами, расположенными вблизи или вне окружности единич- ного радиуса на z-плоскости, не рекомендуется, поскольку разнос- ти AA~(z) и AB"(z) всегда отличны от нуля. Следовательно, область применения компенсационных регуля- торов (6.4) ограничена объектами, которые достаточно задемпфи- рованы, асимптотически устойчивы и не обладают неминимальнофа- зовыми свойствами. в) Межтактовое поведение систем.
124 Ч. II. Системы управления с детерминированными возмущениями В отличие от непрерывных компенсационных регуляторов ана- логичные дискретные регуляторы обеспечивают заданное качество управления в соответствии с заданной передаточной функцией Gw(z) только в тактовые моменты времени. Если передаточная функция Gw(z) выбрана неверно, то, хотя в тактовые моменты времени задан- ное поведение системы будет обеспечено, между тактами могут воз- никнуть колебания регулируемой переменной. Как правило, эти колебания слабо демпфированы, что приводит к значительным от- клонениям управляющей переменной по сравнению со случаем, соответствующим так называемому «отклику минимального прото- типа» [2.4, 2.19]: Gw(z) = z-1, или 2z-1—z-2, или 3z-1 — 3z~24-z-3. Предотвратить появление межтактовых колебаний можно, тре- буя, чтобы передаточная функция системы имела вид Gw (z) = j^-GP(z), где КР — коэффициент передачи объекта управления. В этом слу- чае мы получаем так называемый предсказывающий регулятор, при- менение которого особенно эффективно для объектов с большим вре- менем запаздывания (см. гл. 9). Хотя процесс проектирования компенсационных регуляторов оказывается достаточно простым, применять их в общем случае не рекомендуется из-за соображений, рассмотренных выше. В част- ности, это касается систем с объектами высокого порядка, где дос- таточно трудно определить желаемый характер процессов регули- рования, и поэтому удобнее применять другие методы проектирова- ния.
ГЛАВА 7 Регуляторы для систем с конечным временем установления (апериодические регуляторы) Межтактовые колебания, которые могут возникать в системе, включающей в себя компенсационные регуляторы (см. гл. 6), можно устранить, задавая конечное время установления управляющей и регулируемой переменных. Джури [7.1, 2.3] назвал такой характер протекания процессов «апериодиче- ским». При ступенчатом изменении задающей переменной входной и выход- ной сигналы объекта должны при этом принимать новое установившееся зна- чение после определенного конечного интервала времени. Ниже описаны методы проектирования апериодических регуляторов, которые весьма просто выводятся и требуют при синтезе небольшого объема вычислений. 7.1. ОБЫЧНЫЙ АПЕРИОДИЧЕСКИЙ РЕГУЛЯТОР Предполагается, что ступенчатое изменение задающей перемен- ной происходит в момент времени к = 0, т. е. w(k)=l для к == 0, 1, 2, .... (7.1-1) Если время запаздывания d = 0, то требования для минимального конечного времени установления переходного процесса записываются следующим образом: y(k) = w(k)=l для к>т, /71-9^ u(k) = u(m) для к>т. ( 1 Для случая Ьо = О z-преобразования задающей, регулируемой и управляющей переменных имеют следующий вид [7.2]; = (7.1-3) у (z) =y(l)z~1 + y (2)z-2+ .. + 1 [z-m + z-(ra+1)+ . . .], (7.1-4) u (z) =u (0) + u (1) z-1 Д-. .. Д-u (m) [z_m -j-z-(ra+1)+ ...]. (7.1-5) Разделив уравнения (7.1-4) и (7.1-5) на (7.1-3), получим ^. = piZ-i_(_p2z-2+ ... +pmz-m = P(z), -(7.1-6) Pi = У (1), Р2 = У (2) —У (1), Pm= 1— У (m — 1), V^y = q« + qiZ 1 + ... + qmz-ra = Q (z), (7.1-7)
126 Ч. 11. Системы управления с детерминированными возмущениями Чо = L1 (0), q3 =u (1)—и (0), qm=u (m)—u (m — 1). Следует учесть, что Pi + Рг + • • + Рш — I - (7 1-8) Чо + ЧтН- •• • +cm=u(in) =|=оД1). (7.1-9) Передаточная функция замкнутой системы будет равна v Gг, (z) G<_ (z) Gw (Z) = (z)Gp(z) (7.1-10) Следовательно, передаточная функция компенсационного регу- лятора [см. (6-4)] имеет пи i П'-ч) Сравнивая уравнения (7.1-6) и (7.1-10), получим Gw(z) = P(z). (7.1-12) Более того, из уравнений (7.1-6) и (7.1-7) следует, что GpW = ^. (7.1-13> и с учетом (7.1-11) передаточная функция регулятора принимает вид G* <z>~ ГЛП7. = ч»+ч*2'' + ' - + ч-Т". - (7.1-14) Параметры этого регулятора можно получить, используя урав- нения (7.1-13), (7.1-8) и (7.1-9): q° = Ь. + ^ + .-.+Ьп,= u <0)’ q3 = a1q0, Pi=^i4(i, q2 = a2q0, p2 = b2q0, (7.1 15) 4m ^m4o> Pm ^тЧо1
Гл. 7. Апериодические регуляторы 127 Таким образом, параметры регулятора могут быть вычисле- ны очень просто. Начальное значение управляющей переменной и(0) зависит только от значения суммы коэффициентов bj объекта. Поскольку значение этой суммы убывает с уменьшением такта кван- тования, начальное значение управляющей переменной и (0) будет тем больше, чем меньше такт квантования. Такой апериодический регулятор можно считать компенсацион- ным регулятором (см. 7.1-11), однако передаточная функция замк- нутой системы (7.1-12) и (7.1-6) в данном случае определяется в про- цессе проектирования, а не задается заранее, как это было описано в гл. 6. Результирующая передаточная функция замкнутой системы с учетом уравнений (7.1-12) и (7.1-6) принимает вид Gw(z) = P(z) = p1z-1+ . . . + pmz-ra= —--"r:; + Pm- Ее характеристическое уравнение равно 1 +Gr (z)GP(z)=zra = 0. (7.1-16) Таким образом, контур управления с апериодическим регуля- торОхМ имеет m полюсов в начале координат плоскости z. Если d=#0, необходимо использовать следующую модель объекта [5.7]: GP (z) b1Z-<1+d)+,..+bmz-<m^ 1-yaiz-1+• • •-гamz m _ bjZ"1 -|-bd4-iz (1+d|-}-•••+bvz 1.. 4-amz m 4-avZ (7.1-17) Коэффициенты этой модели удовлетворяют соотношениям Ь3 — о2 — . . . 0, am+J 0, Ц +d = ^i, b2+d = ba, av = 0 (7.1-18) ь> = ьш; На процесс управления наложены теперь следующие ограни- чения: y(k) = w(k) = l для k>v = m + d, /7 1-19) u(k) = u(m) для k m. \ )
128 Ч. //. Системы управления с детерминированными возмущениями Далее можно применить уравнения (7.1-3) 4-(7.1-15), учитывая (7.1-17). Из уравнений (7.1-17) и (7.1-13) следует, что q° = b1+b2+...+bm = u (0)’ 41 =Я14о, q2 =a2q0, Pi = Ьгцо = О, 4m ат4о» Pd =bdqo = 0, (7.1-20) 4m+i = ат+14о = 0, Pd+i ~ bd+14<>= b-jQo, qv = avq() = O, Pv = bvq0 = bmq0 Следовательно, передаточная функция регулятора имеет вид q ________Чо + Ч1г~~1 • • •+Чн17- m_ —-(i+d) __n _-(m + d) • 1—Pi + dz —•••—Pm + dz (7.1-21) Из уравнений (7.1-20) и (7.1-21) получим передаточную функцию апериодического регулятора АР (v) Gr (z) — u (z) __ q0A (z-1) e(z) 1—q0B(z-1)z'<1' (7.1-22) Отсюда следует, что передаточная функция по задающему сигналу при использовании точной модели объекта будет равна а /71_4oB(z-1)z~d_q°B'(z) i — z(m+d) ’ а ее характеристическое уравнение есть z(m + d) = 0. (7.1-23) (7.1-24) Следует иметь в виду, что применение апериодического регуля- тора приводит к сокращению полюсов объекта управления. Пример 7.1. Апериодический регулятор АР (у) (v = rn-[-d). Для низкочастотного объекта III, описанного в разд. 5.4.1 и приложении, при такте квантования Т0 = 4 с на основании соотношений (7.1-20) получены следующие коэффициенты апериодического регулятора: q0 = 9,523; qi = —14,285; q2 = 6,714; q3 = —0,952; Pi = 0; p2= 0,619; p3 = 0,457; p4 = —0,0762. На рис. 7.1.1 изображены переходные процессы при ступенчатом измене- нии задающей w и возмущающей v переменных. Как видно из рисунков, регулятор обеспечивает заданный апериодический характер протекания пере- ходного процесса при ступенчатом изменении сигнала w.
Гл. 7. Апериодические регуляторы 129 Рис. 7.1.1. Переходные процессы в контуре управления с апериодичес- ким регулятором порядка v (нор- мальный порядок) и объектом III для ступенчатого изменения сигна- лов w и V. а — блок-схема контура управления; б—изменение регулируемой переменной; в изменение управляющей перемен- ной. 7.2. АПЕРИОДИЧЕСКИЙ РЕГУЛЯТОР ПОВЫШЕННОГО ПОРЯДКА Если увеличить конечное время установления на один такт с m до ш-Н, то можно заранее определить начальное значение управля- ющей переменной и (0). Поскольку этот сигнал обычно имеет макси- мальную величину, его можно ограничить, задав допустимое зна- чение и (0) при синтезе регулятора [5.7]. Добавим еще один член в уравнения (7.1-4) и (7.1-5), тогда урав- нения (7.1-6) и (7.1-7) примут вид Р ф — + ... + pm+iz-<”+ (7.2-1) Q (z) = q„ + q,z- + ... + qffl+)z_(m+ ». (7.2-2) Приравнивая коэффициенты этих полиномов коэффициентам из уравнения (7.1-13), получим bl2"1 ~Ь • • • 4~втг т _ Pl2"1 Ч~ • • • Ч~ Pm + lz 'm+1* 2«3) 14-aiZ~1+---4-araz га q0 + qiZ-1+. •-+qm + iZ <т+1) Это равенство справедливо только в том случае, когда его пра- вая часть содержит общий корень в числителе и знаменателе. 5 № 2067
130 Ч. 11. Системы управления с детерминированными возмущениями Таким образом, Р (z) = (piz~14~ • • • 4~ Pmz~m) (a—z-1) . (7 2-4) Q(z) (q0'+-------Hmz“ra) (а —z-1)' После деления на ql, получим связь между коэффициентами урав- нения (7.2-4) и коэффициентами уравнения (7.2-3): Qi == aiQo, pi = Цг = агЧо» Pa = b2q0, (7-2-5) Qm — atnQo» Pm bmq0. Теперь выпишем параметры полных полиномов числителя и зна- менателя уравнения (7.2-4) и, приравнивая коэффициенты в пра- вых частях уравнений (7.2-3) и (7.2-4), запишем следующие соот- ношения: q0 = aq;, Pi = «Pi, q! = (aqi-q;), р2 = (®р1 — pl), (7.2-6) Qm= (a4m Чгп-1), Pm = (aPm Pm-1), Qtn+1= 4m> Pm + 1 = Pm« Из уравнения (7.1-7) имеем qo = aqo==u(O), а из уравнений (7.2-1) или (7.1-6) получим Pi + • • • 4-Pm+i ~ 1- Наконец, из уравнений (7.2-6) и (7.2-5) следует, что 1 __ 1 q°“q° bl+b2+tf.+bra-qo 2ы' Теперь на основании уравнений (7.2-7) и (7.2-8) можно (7.2-7) (7.2-8) записать соотношения для определения параметров регулятора q0= и (0)—задано, qi = q0(ai— о + > q2 — q0 (а2 ail Ф (7.2-9) Эт-t ’ qm q0(qra ат-<)
Гл. 7. Апериодические регуляторы 131 Pj=q<>bi, p2 = q0(b2—Ьх) bi £ bi’ (7.2-10) Pm 4o (bm bm~i) 4 bm —1 2 bi’ Pm+1 bm| Qo 1 \ Sbi/ По аналогии с уравнением (7.1-14) запишем передаточную функ- цию регулятора qo+qiz-1-!- Hm + iZ (m + 1) 1—Piz-1—... —pm + 1z_(m+1) (7.2-11) однако в отличие от регулятора, описываемого выражением (7.1-14), в данном случае начальное значение управляющей переменной и (0) задано. Второе значение управляющей переменной в соответствии с уравнениями (7.1-7) и (7.2-9) будет равно J—— u(l) = q14-qo = a1u(0) (7.2-12) Значение и (0) не следует задавать слишком малым, так как при этом и(1) будет больше и(0), что в большинстве случаев неже- лательно. Для выполнения условия u(l)^u(0) необходимо, чтобы удов- летворялось соотношение u(O) = qo>l/(l-ai)2bi. (7.2-13) Выполнение условия u(l)<u(0) вовсе не гарантирует, что |u(k)|< С |u (0) | для ki>2. Поскольку расчет параметров регулятора до- статочно прост, значение и(0) обычно изменяют до тех пор, пока не будет получена желаемая последовательность управляющих сигналов. Часто условие u(l) = u(0) приводит к хорошим резуль- татам. Для объектов с запаздыванием (d>0) расчет регулятора выпол- няют с использованием уравнений (7.1-17)4-(7.1-21). В этом случае передаточная функция апериодического регулятора AP(v-|-l), определяемая уравнением (7.2-11) и соотношениями (7.2-9) и (7.2-10), принимает вид G (7\ QqA (z О В z 1/а] /у о 1 д\ “ Г- q0B (z-i) z-d [1—z-i/ocj ’ ('14) где l/a=l —l/q0Sbi- (7.2-15) 5*
132 Ч. 11. Системы управления с детерминированньши возмущениями Характеристическое уравнение регулятора записывается следую- щим образом: Zm + d + i = 0. (7.2-16) Пример 7.2. Апериодический регулятор AP(v-|-l). На рис. 7.2.1 приведены переходные процессы в системе с объектом, ана- логичным использованному в примере 7.1, при подаче ступенчатого задающего Рис. 7.2.1. Переходные процессы в контуре управления с апериодиче- ским регулятором порядка v-pl (по- вышенный порядок) и объектом III для ступенчатого изменения сигна- лов w и v. При синтезе было задано условие u(0)=u(l) в соответствии с уравнением (7.2-13). воздействия. Параметры регулятора при заданном сигнале ц (0) имеют следую- щие значения: qo = 3,81O; qx = —0,0012; q2 = —5,8840; qa = 3,647; q4«-0,571; Pi = 0; p2 = 0,247; p3 = 0,554; p4 = 0,244; p5 = —0,046. Как видно из переходных процессов, при ступенчатом изменении сигнала за- дающей переменной обеспечивается сглаженный характер переходного про- цесса. Начальное значение управляющей переменной уменьшилось по сравне- нию со значением и (0) на рис. 7.1.1 на 60%. Длительность конечного пере- ходного процесса по регулируемой переменной увеличилась на один такт. Система достаточно хорошо подавляет ступенчатый сигнал возмущения v. Однако выбранное начальное значение управляющей переменной ц (0) приводит к не- которому увеличению показателя качества регулирования. Тем не менее аперио- дический регулятор такого типа может применяться достаточно широко, по- скольку он обеспечивает меньшие амплитуды отклонений управляющей пере- менной. Переходные процессы апериодических регуляторов, рассмот- ренных в примерах 7.1 и 7.2, показаны на рис. 7.2.2. Регулятор AP(v) формирует отрицательное значение управляющего сигнала и(1) после положительного сигнала и(0) большой амплитуды, что
Гл. 7, Апериодические регуляторы 133 обусловлено достаточно большой величиной и(0). Значение и (2) положительно: далее после небольшого числа колебаний процесс приобретает интегрирующий характер, при котором происходит постоянное ступенчатое возрастание сигнала и (к). Что касается переходного процесса регулятора AP(v-j-l), то в нем значения Рис. 7.2.2. Переходные процессы регулятора с конечным временем установления для объекта III. а — AP(v); б— AP(v-f-l). сигналов и(0) и ц(1) равны. Это объясняется тем, что запаздывание d в объекте равно 1 и, следовательно, pi=0 и, кроме того, при его расчете было введено условие равенства ц(0) и и(1) в замкнутом контуре управления. Далее появляется отрицательное значение ц(2), и затем характер процесса после нескольких колебаний при- ближается к интегрирующему. По характеристикам переходных процессов регуляторы с конеч- ным временем установления отличаются от обычных ПИД-регу- ляторов тем, что они характеризуются более сильно выраженными опережающими свойствами и большим подавлением колебаний управляющей переменной, в результате чего и обеспечивается конечное время установления процессов в системе. 7.3. ВЫБОР ТАКТА КВАНТОВАНИЯ ДЛЯ АПЕРИОДИЧЕСКИХ РЕГУЛЯТОРОВ Из уравнения (7.1-15) следует, что начальное значение управ- ляющей переменной ц(0) обратно пропорционально сумме коэф- фициентов числителя дискретной модели объекта управления. Од- нако значение этой суммы возрастает с увеличением такта кванто- вания (см. табл. 3.7.1), что в свою очередь приводит к уменьшению амплитуды сигнала управления. Таким образом, такт квантования можно определить, задавая допустимый диапазон отклонения уп- равляющей переменной. В табл. 7.3.1 приведена зависимость на- чального значения управляющей переменной и (0) от величины
134 Ч. II, Системы управления с детерминированными возмущениями такта квантования для объекта управления третьего порядка, параметры которого содержатся в табл. 3.7.1. Для того чтобы значение и(0) не было слишком большим, такт квантования То для регулятора АР (v) должен быть не меньше 8 с. Таблица 7.3.1 Влияние такта квантования на начальное значение управляющей переменной и (0) для апериодических регуляторов с объектом 3-го порядка из табл. 3.7.1 Регулятор То. с 2 4 6 8 10 АР (v) u(0) = qo 71,5 13,3 5,75 3,81 2,50 (1 —ах) 3,25 2,71 2,30 2,00 1,77 АР (v-H) u (O) = qo 22,0 4,91 2,50 1,91 1,41 Отсюда следует, что T0/Ts>0,36 или Т0/Т95 >0,18, где Ts — сумма постоянных времени объекта управления; Т95 — время достижения выходной координатной величины, равной 95% ее установившегося значения. Если увеличить конечное время установления на один такт, т. е. использовать регулятор AP(v+l), то при выборе такта квантования следует учесть, что значение и(0)в этом случае оказывается меньшим на величину, равную (1—ах). Это следует из уравнения (7.2-13). Поэтому для примера из табл. 7.3.1 в зависимости от выбранного значения такта квантования управляющая переменная уменьшается в 1,8-4-3,3 раза. Для регулятора AP(v+l) такт квантования То должен быть не меньше 5 с, т. е. То/Тх>0,22 или То/Т95 > 0,11. Если для регуляторов AP(v + l) и АР (v) анализировать мак- симально возможные значения сигнала п(0), которые определя- ются допустимым диапазоном изменения управляющей перемен- ной, такт квантования для регулятора AP(v+l) может быть выбран меньшим. В табл. 7.3.2 приведены для сравнения значения допустимых тактов квантования для параметрически оптимизируемого регу- лятора ЗПР-З и регуляторов с конечным временем установления, рассчитанных с учетом параметров объекта III. Наименьшие ре- комендованные величины тактов квантования для регуляторов ЗПР-З и AP(v+l) приблизительно равны. Для регулятора АР (v) величина такта квантования вдвое больше.
Г л. 7. Апериодические регуляторы, 135 Расчет рассмотренных в данном разделе регуляторов с конечным временем установления оказывается очень простым. Поэтому им следует отдавать предпочтение в тех случаях, когда процесс син- теза регулятора должен выполняться достаточно часто, например Таблица 7.3,2 Сравнение тактов квантования параметрически оптимизируемого и апериодического регуляторов для объекта III при условии, что u (0)тах 4,5 Регулятор ЗПР-З (ПИД) (Г= 0) АР (V) АР (v+ 1) т0/т95 0,12 5s 0,20 5s0,10 в адаптивных системах управления. Однако, поскольку такие регуляторы используют сокращение полюсов объекта, как это видно из уравнений (7.1-22) и (7.2-14), их не следует применять для объектов, полюса которых расположены вне или вблизи ок- ружности единичного радиуса на z-плоскости (см. гл. 6, [7.1]). Таким образом, применение апериодических регуляторов ограни- чено классом асимптотически устойчивых объектов (см. разд. 11.1).
ГЛАВА 8 Регуляторы состояния При проектировании регуляторов с использованием методов, изложенных в предыдущих главах, необходимо задавать структуру регулятора и определять его параметры на основе минимизации некоторого критерия качества (гл. 5) либо формировать структуру и определять параметры регулятора, исходя из требуемых характеристик замкнутой системы управления (гл. 6 и 7). При этом в обоих случаях предполагается, что замкнутая система находится в равновесном состоянии перед появлением возмущающих сигналов. При проектировании регуляторов с управлением по состоянию (в дальнейшем называемых регуляторами состояния) таких предположений не требуется. Структура и параметры регуляторов состояния определяются в результате минимизации квадратичного критерия качества, при этом начальные и конечные условия могут быть отличны от нуля. Сначала будем считать, что все пере- менные состояния измеряются. В разд. 8.1 рассматривается оптимальное управление объектом при пере- воде его из заданного начального состояния в нулевое. Проектированию опти- мальных регуляторов состояния для внешних возмущений посвящен разд. 8.2. И в том и в другом случае для получения оптимального регулятора необхо- димо решать матричное уравнение Риккати. Параметры линейных регуляторов состояния можно также определить, исходя из заданных коэффициентов характеристического уравнения (разд. 8.3), что оказывается достаточно простым с вычислительной точки зрения. Пара- метры регулятора после приведения уравнений объекта в диагональную форму могут быть определены в результате независимого задания полюсов замкнутой системы, обеспечивающих выполнение заданных требований. Такой подход следует из теории модального управления (разд. 8.4). Кроме того, параметры регуляторов состояния могут быть легко определены, если задано требование конечного времени установления (разд. 8.5). Если некоторые переменные не измеряются, их необходимо восстановить с помощью наблюдателя (разд. 8.6). Система управления, включающая регулятор состояния, наблюдатель и объект управления, рассмотрена в разд. 8.7. Нако- нец, в разд. 8.8 изложена методика построения наблюдателя пониженного порядка, а в разд. 8.9 приведены соображения о выборе свободных параметров регуляторов состояния. Поскольку различие в выводе уравнений регуляторов состояния для много- мерных и одномерных систем управления состоит только в записи управляю- щей и регулируемой переменной в векторной форме и использовании матриц вместо соответствующих векторов, ниже будет рассмотрен более общий много- мерный случай. 8.1. ОПТИМАЛЬНЫЕ РЕГУЛЯТОРЫ СОСТОЯНИЯ ПО НАЧАЛЬНЫМ УСЛОВИЯМ Предполагается, что заданы уравнение объекта управления в про- странстве состояний х (к 4-1) = Ах (к) 4-Ви (к) (8.1-1) е постоянными матрицами А и В, а также начальные условия х (0) (см. рис. 8.1.1). Будем сначала считать, что все переменные состоя- ния могут быть измерены точно.
Гл. 8. Регуляторы состояния 137 Задача состоит в построении регулятора, формирующего такой вектор управляющих переменных и (к) из вектора переменных со- стояния х(к), который переводит систему в конечное состояние х (N) « 0 и минимизирует квадратичный критерий качества N- 1 I - хт (N) Sx (N) + 2 [хт (k) Qx (к) + ит (к) Ru (к)]. (8.1 -2) к =0 Матрицы, входящие в этот критерий, обладают следующими свойствами: S—положительно полуопределена и симметрична; Q — положительно полуопределена и симметрична; R — положительно Рис. 8.1.1. Модель линейного объекта в пространстве состояний. определена и симметрична, так что выполняются условия xTSx 0, xTQx^0 и uTRu>0. Требования, наложенные на матрицы S, Q и R, вытекают из условий существования оптимума критерия I и обусловлены следующими соображениями. Решение поставленной задачи, имеющее смысл с инженерной точки зрения, может быть получено только в том случае, если все члены уравнения (8.1-2) имеют один и тот же знак, например являются положительными. В связи с этим все матрицы, упомянутые выше, должны быть по крайней мере положительно полуопределены. Если S = 0, т. е. ко- нечное состояние x(N) в критерии не учитывается, a Q#=0, т. е. все состояния х (0), . . ., х (N — 1) входят в критерий с определен- ным весом, то имеющее смысл оптимальное решение также суще- ствует. Отсюда следует, что если матрица Q положительно опреде- лена, то матрица S может быть положительно полуопределена. Справедливо также и обратное утверждение. Следует, однако, исключить случай, когда S = 0 и Q = 0, т. е. все состояния в кри- терии не учитываются и только вектор управляющих переменных имеет вес, определяемый матрицей R^O, что не имеет смысла. В случае непрерывных регуляторов состояния матрица R должна быть положительно определена, поскольку значение R’1 входит в выражение для закона управления. Для дискретных регуляторов это требование может быть исключено, как об этом будет сказано ниже. Так как далее рассматривается случай, когда х (N) « 0, матрицы S и Q выбраны равными. Следовательно, и матрица Q должна быть положительно определена. Отметим также, что здесь не рас-
138 Ч. 11. Системы управления с детерминированными возмущениями сматривается влияние задающих переменных и внешних возмуще- ний, а выходные переменные у(к) = Сх(к) (8.1-3) не используются для формирования обратных связей. Мы исследуем лишь изменение собственных движений и стаби- лизацию объекта управления с помощью обратных связей по состоя- нию Если найдена оптимальная управляющая переменная и (к), то I N-1 min I = min \ хт (N) Qx (N) 4- У [хт (к) Qx (к) + ит (к) Ru (к)], и<к)( к=о (8.1-4) к==0, 1, 2......N —1. Определение оптимальной управляющей переменной является задачей динамической оптимизации, которая может быть решена с использованием методов вариационного исчисления, принципа максимума Понтрягина или принципа оптимальности Веллмана [8.1]. Решение, представленное ниже, было дано Калманом и Кепке 18.2]. Замечания а) В соответствии с принципом максимума каждый отрезок оп- тимальной траектории также является оптимальным. Это озна- чает, что, если известна конечная точка, оптимальная траектория может быть найдена в обратном направлении (т. е. от конечной точки к начальной). б) Из уравнений состояния (8.1-1) следует, что сигнал управ- ления и (к) определяет последующие значения состояний x(k-f-l), х(к-|-2)......Следовательно, оптимальный сигнал управления и (к) можно получить путем обратного расчета. Итак, запишем уравнение (8.1-4) в следующем виде: min 1 = min min <xT(N)Qx(N) + u (к) u (N — 1) ( k = 0, 1, ..., N —2 (8.1-5) 4- 2 [xT (k)Qx(k)4-uT (k) Ru(k)] к =0 Можно показать, что N-l N-2 min {...} = 2 xT(k)Qx(k)4- 2 uT(k)Ru(k)-f- u(N-l) k=0 к = 0 + min {xt(N)Qx(N)4-ui(N — 1) Ru(N — 1)}, u (N- 1) (8.1-6) ^-1, N
Гл 8. Регуляторы состояния 139 где первые два слагаемых не зависят от u (N — 1), а слагаемое In-i n определяет вклад от и (N — 1) для значений к, изменяющихся от N—1 до N. Если учесть, что уравнение состояния для k = N записывается следующим образом: х (N) = Ах (N — l)4-Bu(N — 1) или xT(N) = xT(N —1) AT + uT(N —1) Вт, то из уравнения (8.1-6) следует, что 1N_1N= min (х'(N)Qx(N) + uT(N —1) Ru (N —1)} = = min {xT(N—1) ATQAx(N—l)+2xT(N—l)ATQBu(N—1) + u (N—1) 4-uT(N— 1) BTQBu (N—l)4-uT (N —1) Ru(N—1)} = = xT(N—l)ATQAx(N—1)+ min {2xT(N—l)ATQBu(N—l)-f- + uT(N—1) (BTQB-f-R) u (N —1)}. (8 1-8) Для минимизации уравнения (8.1-8) необходимо обеспечить выпол- нение соотношений min {...} =----------{...} = О, ---------{... u(N-l) du(N —1) du(N—I)2 (8.1-9) Отсюда, используя правила вычисления производных от векто- ров и матриц, которые даны в приложении, получим - {. ..} - 2BTQAx (N— 1) + 2 (BTQB + R) u (N — 1) = 0, u° (N—1)= —(BTQB + R)-1 BTQAx (N—1) = — К (N—1) x (N —1). (8.1-10) Здесь K(N — 1) = (BTQB + R)-1BTQA, (8.1-11) -£t-l7 = 2(B’QB + R)>0. (8.1-12) Теперь можно записать выражение для Im.j, n в виде функции текущих начальных условий х (N — 1): IN_1( n = xt(N—1) ATQAx (N — 1) — — 2xT(N—1) ATQB (BTQB+ R)-i BTQAx (N —1) + + xT (N- 1) ATQB (BTQB+ R)-i BTQAx (N— 1) = = xT(N-1) [ATQ A - ATQB (BTQB + R)-1BTQA] x (N - 1) = = xT (N —1) [ATQA — — KT(N— 1)(BTQB + R) K(N-l)]x(N-l) = = xt(N-1)Pn_1; nx(N-I) (8.1-13)
140 Ч. 11. Системы управления с детерминированными возмущениями где PN_X N = ATQ [I - В (BTQB+ R)-1BTQ] A = = ATQA-KT(N — l)(BrQB R)K (N-l). (8.1-14) Значение I или mini, соответствующее уравнениям (8.1-5) или (8.1-6), можно представить как функцию состояния х(к), к = 0, 1, N — 1 и управления и (к), к = 0, 1, N — 2, в которой отсутствуют неизвестные значения х (N) и u (N—1). Для этого сначала подставим выражение для IN_X> N (8.1-13) в уравнение (8.1-6), в результате чего получим {N-1 xT(N)Qx(N)+ 2 [xT(k)Qx(k) + uT(k) Ru(k)] к = 0 N-l N-2 = 2 xT(k)Qx(k)+ 2 uT (к) Ru (к) + ХТ (N- 1) PN_b nx(N-1) = к=0 к =0 N-2 = S [xT(k)Qx(k)4-uT(k)Ru(k)]4-xT(N —1)(Pn-i,n+Q)x(N —1). к = 0 - _, TN-1 (8.1-15) Теперь введем сокращенное обозначение Pn-i == Pn-i, n + Q- (8.1-16) Используя его, запишем выражение для IN_X в уравнении (8.1-15) в следующем виде: In-i = In-x. n + х? (N — 1) Qx (N — 1) =’ = хт (N- 1) (PN_lf N + Q) х(N- 1) = xT (N-1) PN_1XT (N — 1). (8.1-17) В последней сокращенной записи учитываются вклад в мини- мизируемый критерий от последнего шага и вычисление соответст- вующего начального отклонения x(N—1). (Введение сокращений позволяет упростить вывод последующих соотношений.) Подстав- ляя уравнение (8.1-16) в уравнение (8.1-15), а полученный резуль- тат в уравнение (8.1-5), получим ( N-2 min 1 = min min < 2 [хт (k) Qx (k) 4-uT (k) Ru(k)] ti (k) |_u (N-2) (k =0 k = 0, ..., N —3 4-xT (N - 1) PN_iX (N— 1)| . (8.1-18) Здесь вместо min используется min , так как в уравнение под- ставлены вычисленные оптимальное значение сигнала u (N — 1) и ко- нечное состояние x(N). Запишем по аналогии с уравнением (8.1-6)
Гл. 8. Регуляторы состояния 141 выражение для минимизируемого члена min {...} = 2 xT(k)Qx(k)+ 2 uT(k)Ru(k)4- + min {ut(N-2)Ru(N-2) + xt(N-1)Pn_1x(N-1)}. (8.1-19) u (N-2) *N-2. N В этом выражении член IN_2t N определяет вклад в функционал от двух последних шагов оптимального процесса In-2, N = uT (N - 2) Ru (N -2) + хт (N - 1) Qx (N - 1) + IN_X> N. (8.1-20) Теперь, используя уравнение состояния для предпоследнего шага x(N —l) = Ax(N —2)-J-Bu(N —2), получим In-2, n= min {uT (N —2) (R + BTPN_1B) u (N —2) u(N—2) + 2uT(N— 2)BtPn_1Ax(N—- 2)+xT(N— 2)AtPn_1Ax(N— 2)} = = xT (N - 2) AtPn_1Ax (N - 2) + + min {uT(N —2) (R+BtPn_1B)u(N-2)4- u (N —2) + 2uT (N - 2) B^n.jAx (N-2)}. (8.1 -21) Следовательно, по аналогии с уравнением (8.1-10) оптимальный сигнал управления на шаге (N—2) равен u° (N — 2) = — (R + B^-JB)-1 BtPn_xAx (N—2) = —KN-2x(N—2), (8.1-22) а матрица регулятора Kn-2 определяется выражением Kn_2 = (R 4- B^BH BtPn_tA- (8.1-23) Отсюда следует, что минимальное значение IN_2) N для двух последних шагов с учетом уравнения (8.1-21) будет равно IN_3 K = xT(N —2) AtPn_1Ax (N—2)4- 4-xT (N —2) AtPn_tB (R 4-BtPn_1B)~1 B^n^Ax (N-2)- —2xt (N — 2) AtPn_jB (R 4-BtPn_1B)~> BtPn_1Ax (N —2) = = xT(N —2) [A^n^A — — AtPn_,B (R 4- BtPn_1B)"1BtPn_1A] x (N-2) = = xT (N-2) [AtPn_jA- KS-2 (R + BTPN_TB) Kn-2]x(N -2) = = xT (N —2) PN_2, Nx (N —2), (8.1-24) где Pn-2, n = AtPn_i [I - В (R 4- В Ф^, B)1 BTPN_X] A = = AtPn_1A-K^-2(R + BtPn_1B)Kn-2. (8.1-25)
142 Ч. 11. Системы управления с детерминированными возмущениями Теперь минимальное значение I по отношению к управлению u (N— 2) с использованием выражения (8.1-19) запишется в сле- дующем виде: N-2 N-3 min I = хт (k) Qx (к) + ит (к) Ru (к) + u (N —2) к =0 к =0 N-3 + хт (N—2) Pn_2, nx (N—2) = [хт (к) Qx (к) + ит (к) Ru (к)] + + хт (N -2) (PN_2, N + Q) х (N-2). (8.1 -26) < - - — - _ _ - 'N-2 Если теперь снова ввести сокращенное обозначение Pn_2-Pn_2>n + Q, (8.1-27) то вклад от последних двух шагов с учетом взвешенного значения начального отклонения x(N—2) будет определяться выражением In-2 = In-2, n + *т (N-2) Qx (N-2) = = xT (N-2) (Pn-2, n + Q) x (N-2) = — xT (N —2) PN_2x (N —2). (8.1-28) Используя уравнение состояния, значение I можно представить как функцию от х (к) и и (к) для к = 0, .... N—3 и последова- тельно вычислять оптимальный сигнал управления u° (N — 3) и т. д. Рис. 8.1.2. Модель объекта в пространстве состояний с регулятором состояния К для управления по отклонениям начальных условий х(0). Предполагается, что вектор состояния х(к) измеряется полностью. В общем получаем регулятор состояния с переменными пара- метрами u°(N — j) = — Kn-jX(N — j), j= 1, 2, ..., N, (8.1-29) который формирует пропорциональную отрицательную обратную связь по состоянию на входе объекта с помощью изменяющейся матрицы коэффициентов передачи Kn-j (рис. 8.1.2). Параметры
Гл. 8. Регуляторы состояния 143 такого регулятора определяются в результате решения рекуррент- ных уравнений Kn-j = (R + BtPn_j+1B)"*B1Pn_j+1A; (8.1-30) Pn-j = Q + AtPn_]+1A—Kb)-j (R + BTPN_J+1B) Kn_j = = Q — Kn-jRKn-j + [A — BKn-j]T Pn-j+i[A + BKn-j] = = Q + AtPn_j+1 [I - В (R + BTPN_] + 1 B)-1 BTPN_J + 1] A (8.1 -31) с исходной матрицей PN —Q. Последнее из приведенных уравнений является разностным матричным уравнением Риккати. Значение критерия качества (8.1-2) равно min 1= 10 = хт (0) Рох (0) (8.1-32) и (к) для к = 0, 1, ..., N — 1. Следовательно, минимальное значение квадратичного критерия может быть непосредственно представлено как функция начального состояния х (0). Как будет показано ниже в примере, Кn-j сходится для j= 1, 2, ..., N, т. е. Kn-i, Kn-з, • •• ..., К2, Кп Ко к фиксированному конечному значению К при N —> ОО. Ко=К= lim Kn-J‘ N -> oo Таким образом, в пределе получаем регулятор с постоянными параметрами u°(k) = — Kx(k). (8.1-33) Матрица этого регулятора удовлетворяет уравнению К = (R + ВТРВ)-1 ВТРА (8.1-34) при Р = Р0, являющемся решением стационарного матричного урав- нения Риккати Р= lim PN_j = Q ф-АТР [I —В (R + ВТРВ)-1 ВТР] А. (8.1-35) N -> со Решение этого нелинейного уравнения может быть получено с по- мощью рекуррентного уравнения (8.1-31). Регулятор состояния с постоянными параметрами (8.1-33) наиболее пригоден для практи- ческого применения. Из правил обращения матриц следует, что для уравнения (8.1-35) должно удовлетворяться условие det [R +ВТРВ]=#=О. В то же время из-за рекуррентности вычислений или условий существования оптимума должны выполняться условия det [R + BTQB] ^0 для уравнения (8.1-11), det [R 4- BrPN_]+1B] Ф0 для уравнения (8.1-30).
144 Ч. 11. Системы управления с детерминированными возмущениями Следовательно, члены в скобках должны быть положительно опре- делены. Эти условия в общем случае выполняются, если матрица R положительно определена. Если же допустить, 4toR=0, то необ- ходимо, чтобы второй член последнего уравнения для j — 1,2, ., N и матрица Q были больше нуля. Поскольку матрица PN_I+1 априорно не известна, в общем случае необходимо, чтобы матрица R была положительно определена. Для замкнутой системы из уравнений (8.1-1) и (8.1-33) имеем х (к 4-1)= [А—ВК]х(к). (8.1-36) Соответствующее уравнению (8.1-36) характеристическое урав- нение записывается в виде det[zl—А4-ВК] = 0. (8.1-37) Эта замкнутая система является асимптотически устойчивой, если объект (8.1-1) обладает свойством полной управляемости. Если же Таблица 8.1.1 Вид матрицы Pn—j в функции к при рекуррентном решении матричного уравнения Риккати для объекта III [8.5] 0,0000 0,0000 0,0000 0,0000 р 0,0000 0,0000 0,0000 0,0000 г 2d 0,0000 0,0000 1,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 р А 0,0000 1,0000 1,5000 0,0650 0,0000 1,5000 3,2500 0,0975 0,0000 0,0650 0,0975 0,0105 0,9958 1,4937 1,5385 0,1449 р 1,4937 3,2405 3,8078 0,2823 г 27 1,5385 3,8077 5,6270 0,3214 0,1449 0,2823 0,3214 0,0253 6,6588 6,6533 5,8020 0,7108 р . 6,6533 7,9940 7,7599 0,8022 5,8020 7,7599 8,9241 0,7529 0,7108 0,8022 0,7529 0,0822 7,8748 7,5319 6,4262 0,8132 7,5319 8,6296 8,2119 0,8763 Г21 6,4262 8,2119 9,2456 0,8056 0,8132 0,8763 0,8056 0,0908 7,9430 7,5754 6,4540 0,8184 р,, 7,5754 8,6573 8,2296 0,8796 г19 6,4540 8,2296 9,2570 0,8077 0,8184 0,8796 0,8077 0,0912 7,9502 7,5796 6,4564 0,8189 Р- 7,5796 8,6597 8,2310 0,8799 6,4564 8,2310 9,2578 0,8079 0,8189 0,8799 0,8079 0,0913
Гл. 8. Регуляторы состояния 145 это не так, то неуправляемая часть системы должна иметь по крайней мере асимптотически устойчивые собственные значения [8.4] Пример 8.1.1. В этом примере использован тестовый объект III, представляю- щий собой низкочастотный фильтр третьего порядка с запаздыванием, который был описан в разд. 5.4. В табл. 8.1.1 приведены коэффициенты матрицы Rn-j, 1,0 10 , 20 30 к Рис. 8.1.3. Зависимость коэффициентов регулятора состояния k^-j от k=N—j для объекта III при рекуррентном решении матричного уравнения Риккати [8.5]. а па рис. 8.1.3 показана зависимость коэффициентов kjj-j от k = N—j (см. также пример 8.7.1). Рекуррентный процесс решения матричного уравнения Риккати начинался с j = О, R — г — 1, N = 29 и -0000' оооо ц ~ 0 0 10 ' .0000. '1.1кой вид матрицы Q выбран для того, чтобы в квадратичном критерии при* с) штвовала только выходная координата у (к): хт (к) Qx (к) = у2 (к)
146 Ч. 11. Системы управления с детерминированными возмущениями (разд. 8.9.1). Коэффициенты матрицы Pbj— j и вектора кк-j мало изменяются после примерно десяти шагов, т. е. установившееся решение достигается быстро. В этом разделе предполагалось, что вектор состояния х (к) может быть измерен непосредственно и полностью. Это иногда справед- ливо, например, для некоторых механических или электрических объектов, таких, как самолеты или электрические сети. Однако переменные состояния часто измеряются не полностью, поэтому их следует восстановить с помощью эталонной модели или наблю- дателя (разд. 8.6). 8.2. ОПТИМАЛЬНЫЕ РЕГУЛЯТОРЫ СОСТОЯНИЯ ДЛЯ ВНЕШНИХ ВОЗМУЩЕНИЙ Полученный в предыдущем разделе регулятор состояния с постоянными параметрами для отработки отклонений начальных условий х (0) обладает про- порциональной характеристикой. Поэтому постоянные возмущения по пере- менным состояния не могут быть скомпенсированы без статической ошибки. Для отработки постоянных возмущений регулятор состояния следует модифи- цировать [8 3, 8.6, 8.7, 8.4]. Предположим, что в системе присутствуют постоянные сигналы задающей переменной w(k) и возмущения n(k). Эти постоянные сигналы могут быть сформированы из определенных начальных условий v (0) и у (0) с помощью модели задающих воздействий (рис. 8.2.1): v (к 4-1) = Av (к) 4~ By (к), у(к+1) = у(к), . (8.2-1) w (k) = Cv (к). Здесь размерность вектора у (к) равна размерности w (к). Напри- мер, если требуется получить ступенчатое изменение задающей переменной w(k) = wol(k) для объекта пропорционального типа, используются начальные условия у(О) = уо. В результате того что при этом на модель (В, А, С) задающей переменной поступает постоянный ступенчатый сигнал, на ее выходе формируется задаю- щий сигнал viу (к), который отличается от ступенчатого на величину w (к) — wv (к) = wv (к). Эту разность можно скомпенсировать путем задания в модели соответствующих начальных условий v(0). Таким образом, выбирая подходящие значения у (0) и v(0), удается смоделировать ступен- чатое изменение переменной w(k). Значение у0 зависит от w0 йот коэффициента передачи модели (В, А, С). Если коэффициент пере- дачи равен единице, то y0 = w0. Задавая другие значения v(0), можно получить другие сигналы w(k), которые при к —» оо будут сходиться к постоянному значению w0.
Гл, 8. Регуляторы состояния 147 Аналогично модели задающей переменной вводится модель воз- мущающих воздействий: Я(к + 1) = Ат) (к) + В? (к), g (к + 1) =g(k), (8.2-2} n(k) = Ci] (к), где размерность ?(к) равна размерности п(к) (рис. 8.2.1). Исполь- зуя начальные условия £(0) и т](0), с ее помощью можно сфор- мировать постоянный сигнал п(к). Применяя другие структуры моделей с переменными состояния у (к) и £ (к), можно моделировать другие типы внешних сигналов. Например, линейно нарастающий сигнал первого порядка можно получить из модели следующего вида: v (к+ 1) = Av (к) + В у2 (к), у2(к+1) = у2(к)+у1(к), (8.2-3) Vi (к+0 = 71 (к)- Из переменных состояния модели объекта и моделей задающих и возмущающих воздействий формируются переменные состояния век- тора ошибки 8 (к), так что для ошибки управления можно записать е (k) = w (к)—у (к) — п (к) = C[v (к)—х (к) — i)(k)] = Ce (к). (8.2-4) Общая модель всей системы описывается уравнениями -8 (к + 1) 7(k+l)-g(k+l) ГВ] 'А В] Ге (к) 1 О l] [7(к)-? (к)] “ |0 и (к). (8.2-5) Как и в предыдущем разделе, предполагается, что все переменные состояния—8 (к), у (к) и £(к) — измеряются полностью. Теперь представим управляющую переменную в виде двух управляющих сигналов: u(k) = u1(k)+ua(k). (8.2-6) Если в качестве управляющего сигнала щ (к) выбрать U1(k) = y(k)-g(k), (8.2-7) то влияние у (к) и £ (к) на у (к) будет полностью скомпенсировано. Следовательно, щ(к) будет использоваться для устранения влия- ния начальных условий у (0) и £(0), т. е. выступать в роли идеаль- ного регулятора с прямой связью. Управляющая переменная и2 (к) должна использоваться для отработки начальных условий 8(0) = v(0)—х(0)—Т](О) (8.2-8) с помощью регулятора состояния в обратной связи. Таким образом, мы уже не проводим синтеза оптимального регулятора состояния
148 Ч. II. Системы управления с детерминированными возмущениями для начальных значений системы 8(к+1) = А8(к) — Ви2(к). (8.2-9) В данном случае нам необходимо минимизировать следующий квад- ратичный критерий качества: I, = 8Т (N) Qe (N) + s' [sT (k) Qe (k) + uj (k) Ru, (k)]. (8.2-10) k =0 Однако аналогичная задача уже была решена в разд. 8.1, откуда следует (8.1-33), что оптимальный регулятор состояния с постоян- ными параметрами описывается уравнением u2(k) = Ke(k). (8.2-11) В отличие от регулятора для начальных условий х(0), описан- ного в разд. 8.1, этот регулятор состояния используется для управ- ления системой с начальными условиями е (0). Рис. 8.2.1. Модель линейного объекта управления с моделями задающей и возму- щающей переменных, позволяющими формировать постоянные значения задаю- щего w(k) и возмущающего n(k) сигналов. Пунктирными линиями изображен ре- гулятор состояния.
Гл. 8. Регуляторы состояния 149 Таким образом, регулятор для постоянных возмущений состоит из — регулятора состояния для начальных значений s(0), формирую- щего управляющий сигнал u2(k); — регулятора с прямой связью для переменных у (к) и ?(к), фор- мирующего управляющий сигнал их (к). Следовательно, управляющий сигнал и (к) с учетом уравнений (8.2-6), (8.2-7) и (8.2-11) определяется уравнением Ге (к) “<к) = ГК>][;(к)_Е(к)]. (8-2-12) Этот регулятор изображен на рис. 8.2.1 пунктирными линиями. Для описания расширенной модели (8.2-5) введем следующие сокращенные обозначения: В I х*(к) = В* = е (к) У (k)-g(k). А* = А .0 ; С* = [С 0], (8.2-13) с использованием которых запишем х* (к 4-1) = А*х* (к) -{-В*и (к), (8.2-14) е (к) = С*х* (к). (8.2-15) Регулятор состояния с постоянными параметрами описывается уравнением и (к) = К*х* (к), (8.2-16) где К* = [К1]. (8.2-17) Если для каждой выходной переменной yj (к) имеется соот- ветствующая задающая переменная Wj (к) и возмущение гц (к), то их размерности должны удовлетворять условию dim х* = dim 8 4- dim у == m 4-г. Следовательно, размерность матрицы А равна (т 4-г) X (т 4-г). Характеристическое уравнение замкнутой системы с оптималь- ным регулятором состояния для внешних ступенчатых возмущений равно det[zl — A*—B*K*] = det ^1—А4-ВК = det [zl — А 4-ВК] (z —l)q = 0, (8.2-18) (2-1)1 = если dim у (k) = dim g (k) = dim u, (k) = dim u (k) = q. С учетом моделей внешних возмущений замкнутая система управления с q управляющими переменными имеет q полюсов в точке z = l, т. е. содержит q «интеграторов», которые компен-
150 Ч. II. Системы управления с детерминированными возмущениями сируют статические ошибки. Для системы с одним входом и одним выходом характеристическое уравнение имеет вид det (zl—A-f-bkT](z—1) = 0. (8.2-19) Следовательно, оно имеет (т-|-1) корней. Заметим, что характе- ристическое уравнение имеет полюс z = 1, поскольку система разомкнута по отношению к дополнительным переменным состоя- ния у (к) и £ (к). Другой способ нейтрализации статических ошибок, возникаю- щих при воздействии на систему внешних возмущений и управ- ляющих сигналов, состоит в добавлении полюса z = 1 в модель объекта. Для объекта с уравнением выхода y(k) = Cx(k) это соответствует введению дополнительных переменных состояния z(k+ l) = z(k) + Fy(k), (8.2-20) т. е. добавлению в модель суммирующих элементов или «интегра- торов». Здесь F—диагональная матрица. При реализации инте- грирования по методу прямоугольников диагональные элементы матрицы F можно представить в виде отношения такта кванто- вания То к постоянной интегрирования Ти, т. е. fli = T0/Th. Соответствующий регулятор состояния [8.4, 8.5] теперь описы- вается соотношением u(k) = — Kx(k)-KlZ(k). (8.2-21) Добавление интегрирующих элементов по сравнению с введением моделей задающей и возмущающей переменных имеет существенный недостаток: при постоянном сигнале возмущения uv (к) на выходе системы возникает статическая ошибка (гл. 4). Кроме того, постоян- ные интегрирования fn могут выбираться произвольно, так как их значения не определяются в процессе минимизации критерия (8.1-2), используемого при синтезе регулятора. Поэтому регулятор с уче- том введенных добавок перестает удовлетворять требованиям, за- данным при его синтезе. Если переменные состояния не могут быть измерены точно, что подразумевалось в этом разделе, их необходимо восстановить с помощью модели объекта. Только в этом случае могут быть реа- лизованы все преимущества системы управления по состоянию, изображенной на рис. 8.2.1 (см. разд. 8.7.2). 8.3. РЕГУЛЯТОРЫ СОСТОЯНИЯ С ЗАДАННЫМ ХАРАКТЕРИСТИЧЕСКИМ УРАВНЕНИЕМ Динамика управляемого объекта, описываемого уравнением состояния x(k+l) = Ax(k) + Bu(k), (8.3-1)
Гл. 8. Регуляторы состояния 151 может быть так изменена с помощью обратной связи по вектору состояния u(k) = — Kx(k), (8.3-2) что полюсы замкнутой системы x(k + l) = [A-BK]x(k) (8.3-3) или коэффициенты ее характеристического уравнения det [zl — А 4-Вк] = О (8.3-4) будут равны заданным. Рассмотрим методику получения заданного расположения полюсов в системах с обратной связью по состоянию для объектов с одним входом и одним выходом. Преобразуем урав- нение состояния к канонической форме управляемости, приведен- ной в табл. 3.6. " 0 1 0" Г0“ х(к4-1) = • • О raS _1 0 am-i 1 • — ai_ х(к)4- : 0 и_ и (к). (8.3-5) Уравнение обратной связи по состоянию имеет вид Подстав ля? и (к) = — к I последнее 0 Тх (к) = —[ктк выражение в 1 m_i---k1]x(k) уравнение (8 0 3-5), (8.3-6) получим х(к4-1) = 0 _.( ат кт) 0 ( ат km_j) • 1 ••(—а,—kJ. х(к). (8.3-7) Таким образом, соответствующее характеристическое уравне- ние есть det[zl—A-f-bk ] = = (am + km) + (am_! + km_J z 4- (a, -|-kJ z-m-1 4-zm — = am + am-izH-----l-a^-1 4- zra = 0. (8.3-8) Из уравнения (8.3-8) следует, что коэффициенты вектора обратной связи по состоянию определяются соотношениями ki = ai—аь i=l, 2, ..., m. (8.3-9) Коэффициенты kj равны нулю, если обратная связь не изменяет характеристического уравнения объекта, т. е. aj=aj. Значения kj возрастают, если коэффициенты ai замкнутой системы увеличивать в положительную сторону по сравнению с коэффициентами аь
152 Ч. 11. Системы управления с детерминированными возмущениями В результате значения управляющей переменной и (к) становятся тем больше, чем больше разница между он и аь обусловленная введением регулятора. Таким образом, влияние обратной связи по состоянию на собственное движение объекта может быть легко интерпретировано. При синтезе по заданному расположению полюсов zb 1=1, . . . . . . , ш сначала необходимо выбрать желаемые полюса замкнутой си- стемы det [zl — A-f-bkT] = (z — zj (z — z2)- • • (z—zm). (8.3-10) После этого вычисляются значения коэффициентов характеристи- ческого уравнения замкнутой системы и компонентов вектора состояния kj по уравнению (8.3-9). Случай многомерных систем рассмотрен, например, в работе [2.19] и в разд. 21.2. Следует, однако, отметить, что рассмотренный метод задания полюсов обеспечивает лишь желаемое поведение изолированных собственных движений замкнутой системы. Что же касается их взаимного влияния и парирования внешних возмущений, то этого предложенный подход не учитывает. Поэтому в общем случае сле- дует отдавать предпочтение тем методам синтеза, в которых управ- ляющая и регулируемая переменные вычисляются непосредст- венно. Преимущество же рассмотренного метода состоит в том, что зависимость коэффициентов он характеристического уравнения от изменения постоянных kj обратной связи представлена в явном виде. В гл. 7 было показано, что характеристическое уравнение апериодического регулятора есть zm=0. Из уравнения (8.3-8) сле- дует, что в этом случае aj=0. Такой апериодический регулятор с управлением по состоянию будет рассмотрен в разд. 8.5. 8.4. МОДАЛЬНЫЕ РЕГУЛЯТОРЫ СОСТОЯНИЯ В разд. 8.3 для задания расположения полюсов использовалось описание системы в канонической форме управляемости. Изменение коэффициентов к, вектора обратной связи непосредственно влияет на величину коэффициентов а, характеристического уравнения. При этом kj влияет только на cq, так что kj и «j при i Ф j оказываются независимыми. В этом разделе будет рассмот- рен метод задания полюсов в системах управления по состоянию с использо- ванием векторно-матричного описания в диагональной форме. Поскольку в этом случае коэффициенты к[ непосредственно влияют на собственные значения (моды) Zj, такое управление называется модальным. Для многомерных систем модальное управление впервые было описано в работе [8.9]. Более подробно о модальном управлении сказано в [5.17 и 8.10]. Рассмотрим линейный стационарный объект с несколькими вхо- дами и выходами x(k+ 1)=Ах(к)4-Ви(к), (8.4-1) у(к) = Сх(к), (8.4-2) предполагая, что все собственные значения матрицы А различны. Преобразуем описание объекта с использованием преобразования
Гл. 8. Регуляторы состояния 153 (3.2-29) xt (k) = Tx(k) (8.4-3) к следующей форме: xt (k 4-1) = У(к) = < Теперь матрица системы Mt (k)4-Btu( Dtxt (k). -zx ... 0 " Z2 k), (8.4-4) At=TAT’1 = = A (8.4-5) _0 ... zm_ в диагональной форме, а матрицы Bt и Ct опреде- представлена ляются как Bt = TB, Ct = CT-\ (8.4-6) (8.4-7) Характеристическое уравнение исходной модели объекта есть detfzl—А] —0. (8.4-8) Для преобразованного описания соответствующее уравнение будет равно det [zl — А] = det [zl — TAT-1] = = det T [zl — A] T-1 = det [zl — A] =< = (z —zj(z—z2).. .(z —zm) = 0. (8.4-9) Диагональные элементы матрицы А являются собственными значениями матрицы At (8.4-4). Они идентичны собственным зна- чениям матрицы А из уравнений (8.4-1). Матрица преобразования Т может быть определена следующим образом [5.17]. Запишем урав- нение (8.4-5) в форме AT-1==T-iA (8.4-10) Представим теперь матрицу Т-1 в виде набора векторов- столбцов T-1 = [v1vs...vm], (8.4-11) тогда из (8.4-10) получим A[v1va...vm] = [v1v2...vm]f~Zf ... 0“>^ ’ Z2 L_0 ... zm_ = [z1Vi z2v2.. .zmvm], (8.4-12)
154 Ч. II. Системы управления с детерминированными возмущениями Для каждого столбца можно записать Av1 = ziv1, 1 = 1, 2, ..., m, (8.4-13) или [zj—A]Vj = O. (8.4-14) Матричное уравнение (8.4-14) содержит m уравнений для m не- известных векторов vb которые в свою очередь состоят из m эле- ментов vil( vi2, . . ., vim. Если исключить тривиальный случай Vj —0, то система (8.4-14) не имеет единственного решения. Для каждого значения i можно получить лишь направление вектора vb а не его длину. Для определения длины векторов потребуем, чтобы элементы матриц В< или Ct принимали значения только О и 1 [2.19]. Векторы Vj называют собственными векторами. Для объектов с одним входом и одним выходом представление в пространстве состояний в диагональной форме соответствует разложению диск- ретной передаточной функции на элементарные составляющие по m различным собственным значениям: G(z) = ctT[zl — At]-1bt = ^^4-^^+... 4-3s£li". (8.4-15) Из последнего уравнения также следует, что значения коэф- фициентов bti и cti нельзя определить однозначно. Если, напри- мер, выбрать btl=l, то значение cti может быть получено из уравнения Cti = [(Z — Z1)G(z)]z=zi (см. уравнение (3.7-3)). Матрица А может содержать не только действительные собственные значения zit но и комплексно-сопря- женные. Как поступать в случае наличия комплексных собствен- ных значений, показано, например, в работе [5.17]. Изменив в уравнении (8.4-4) вектор управления и (к) с по- мощью преобразования ut(k) = Btu(k), (8.4-16) получим xt (к 4-1) = Axt (к)-]-ut (к). (8.4-17) Теперь сформируем управление в виде обратной связи по век- тору состояния ut (к) = — Ktxt (к). (8.4-18) В результате получим однородное векторное разностное уравнение x(k-bl) = [A-Kt]xt(k). (8.4-19)
Гл. 8. Регуляторы состояния 155 Если матрица обратной связи Kt также является диагональной rktl ... • kt2 к* = (8.4-20) _0 . . . то результирующее характеристическое уравнение замкнутой си- стемы будет иметь вид det [zl—(A—Kt)] = = (z—(Zl — ktl)) (z—(Zj—kt2)).. .(z—(zm—ktm)) = 0. (8.4-21) Собственные значения Zj объекта могут быть теперь изменены не- зависимо с помощью соответствующего выбора значений ktl, по- скольку матрицы в уравнениях (8.4-17) и (8.4-18) представлены в диагональной форме. Таким образом, замкнутая система состоит из ш независимых контуров управления первого порядка. Реальный вектор управления и (к) вычисляется из уравнений (8.4-16) и (8.4-6): и (к) = ВгЧ (к) = В -1T"'1ut (к). (8.4-22) Поскольку в последнем уравнении необходимо обращать мат- рицу В, она должна быть регулярной, т. е. квадратной, и detB^O. Модальный Модальный Модальный синтезатор регулятор анализатор Рис. 8.4.1. Блок-схема системы с модальным управлением по состоянию. Это означает, что m собственных значений матрицы А или Л могут быть изменены независимо одно от другого только тогда, когда в объекте есть m различных управляющих входов. Следовательно, число управляющих переменных в этом случае должно быть равно порядку объекта. Блок-схема системы с модальным регулятором состояния пока- зана на рис. 8.4.1. Переменные состояния xt (к) развязаны с по- мощью преобразования (8.4-3); этот блок назван модальным ана- лизатором. Преобразованный вектор управления ut (к) поэлементно формируется в модальном регуляторе К<- Наконец, восстанавли-
156 Ч. 11. Системы управления с детерминированными возмущениями вается реальный вектор управления и (к) путем обратного пре- образования в модальном синтезаторе. Так как регулярные мат- рицы управления В встречаются редко, рассмотренный метод модального управления не может найти широкого применения. Если многомерный объект управления порядка m имеет р вхо- дов, т. е. размерность матрицы В равна (тХр), то независимо изменены могут быть только р собственных значений с помощью диагональной матрицы К размерности (рХр). Остальные (ш—р) собственные значения остаются неизменными [8.11], [5.17]. Рассмотрим теперь линейный объект с одним входом (р = 1). Его преобразованное уравнение, аналогичное (8.4-3), имеет вид xt (к 4-1) = Afxf (к) 4- btu (к), у (k) = ctTxt (к), (8.4-23) (8.4-24) где bt = Tb, с? = стТ-1. (8.4-25) (8.4-26) Для управления этим преобразованным объектом используется обратная связь по состоянию u(k) = — k1xt(k) = — [kjkg.. .km]xt(k). (8.4-27) Подставляя это выражение для и (к) в уравнение (8.4-23), по- лучаем xt (к 4- 1) = [Л —btkr] xt(k) = Fxt (к). (8.4-28) Если для исходного описания выбрано преобразование, в результате которого все элементы вектора bti равны единицам, то ~(Zj — kJ —k2 ... —km ~i [j (za ^г) (8.4-29) L km k2 ... (zm km)_ В этом случае отдельные переменные состояния уже не будут развязаны, и собственные значения матрицы F в отличие от мат- рицы Л будут изменяться взаимосвязанно. Так что применение обратной связи в соответствии с уравнением (8.4-27) не сохраняет преимуществ модального управления, о которых было сказано выше. Однако если сформировать обратную связь только по одной переменной состояния xt) u (к) == — kjXtj (к),
Гл. 8. Регуляторы состояния 157 то может быть изменено одно собственное значение, а остальные собственные значения объекта останутся неизменными; к, ...О" F= 0 .. .(Zj —kj).. .0 . (8.4-30) _0 —к, ...zm_ Соответствующее этой матрице характеристическое уравнение бу- дет равно det[zl — F] = (z—zj.. .(z—(г, —к,)).. .(z — zm). (8.4-31) Выше предполагалось, что собственные значения матрицы А различны. Если же объект содержит кратные собственные значе- ния, то вместо диагональной матрицы Л следует использовать матрицу в жордановой форме [8.10]. Применение модального управления по состоянию при про- ектировании регуляторов позволяет только обеспечить заданное расположение полюсов системы, поэтому для этого метода остаются справедливыми замечания, приведенные в конце разд. 8.3. Отме- тим, однако, что модальное управление может быть с успехом применено для объектов с распределенными параметрами, имеющих несколько управляющих переменных [8.11, 3.10, 8.12]. 8.5. регуляторы состояния с конечным ВРЕМЕНЕМ УСТАНОВЛЕНИЯ Рассмотрим управляемый объект порядка m с одной управ- ляющей переменной: х (к 4-1) = Ах (к) 4- bu (к). (8.5-1) В разд. 3.2.2 было показано, что этот объект может быть пере- веден из произвольного начального состояния х(0) в нулевое конечное состояние x(N) = 0 за N = m шагов. Необходимая для этого последовательность значений управляющей переменной мо- жет быть вычислена с помощью уравнения (3.2-7). Она может быть также сформирована через обратную связь по состоянию: u(k) = — kTx(k). (8.5-2) В результате получим х (к 4-1) = [А —Ькт] х (к) = Rx (к) (8.5-3)
158 Ч. II. Системы управления с детерминированными возмущениями ИЛИ х (1) = Rx (0), х (2) = R2x (0), х (N) = RNx (0). Из условия х (N) = 0 следует, что RN = 0. (8.5-4) Запишем характеристическое уравнение замкнутой системы: detfzl — R] = am4-am_1z4-. . . 4-aIzm-1 4-zm=0. (8.5-5) Из теоремы Кели — Гамильтона следует, что квадратная матрица удовлетворяет своему характеристическому уравнению, т. е. am1+am-iR+ • • 4-a1Rm“1 + Rm = 0. (8.5-6) Уравнение (8.5-4) удовлетворяется при N = m и а, = а2 = . .. = аго = 0. Следовательно, характеристическое уравнение (8.5-6) примет вид detfzl —R] = zm = 0. (8.5-7) Наличие кратного полюса порядка пГв точке z=0 является при- знаком системы управления с конечным временем установления переходных процессов (см. уравнение (7.1-16)). Если объект представлен в канонической форме управляемо- сти, как в уравнении (8.3-5), то апериодический регулятор состоя- ния можно получить с учетом уравнения (8.3-9), задавая kj=—ар u(k) = [amam_1...a1]x(k). (8.5-8) При использовании канонической формы наблюдаемости каждая из переменных состояния xt умножается в регуляторе состояния на 3j и заводится как обратная связь на вход объекта. При этом знак каждой такой обратной связи противоположен знаку связи по соответствующей координате состояния в модели объекта (см. рис. 3.6.3). Поэтому по первой переменной состояния последо- вательно m раз формируются нулевые значения, которые на каж- дом такте присваиваются последующей переменной состояния (сдви- гаются через элементы задержки) до тех пор, пока при k = m все переменные состояния не станут равными нулю [2.19]. Апериодический регулятор АР (v), описанный в разд. 7.1, при- водит объект из произвольного начального состояния х (0) 0
Гл. 8. Регуляторы состояния 159 за m тактов к постоянному значению выходной координаты y(m)=y(m+l) = . . .=у(оо) при постоянном значении входного сигнала u(m) = u(m+l)=. . . —u(oo). Поэтому такой регулятор называют «апериодическим регулятором выхода». Апериодический регулятор, рассмотренный в этом разделе, приводит объект из произвольного начального состояния х (0)^=0 к результирующему состоянию х(т)=0. Следовательно, его можно назвать «апериодическим регулятором состояния». Поскольку обе замкнутые системы имеют одинаковые характе- ристические уравнения zm=0, они одинаково отрабатывают одни и те же возмущения по начальным условиям х(0), так как реакция на такое возмущение зависит только от вида характеристического уравнения. Следовательно, апериодический регулятор AP(v) также приводит систему в нулевое состояние х(т)=0 за т шагов для любых начальных условий х(0). 8.6. НАБЛЮДАТЕЛИ СОСТОЯНИЯ Поскольку все переменные состояния х(к) для большинства объектов не могут быть непосредственно измерены, их следует определять с использованием измеряемых величин. Рассмотрим Объект Рис. 8.6.1. Динамический объект с наблюдателем состояния.
160 Ч. II. Системы управления с детерминированными возмущениями динамический объект х (к + 1) = Ах (k) -f- Ви (к), у(к) = Сх(к) Предположим, что в объекте точно могут быть измерены только вектор входа и (к) и вектор выхода у (к), а все переменные со- стояния х (к) наблюдаемы. Включим параллельно объекту модель, имеющую такую же структуру (рис. 8.6.1). Сигнал коррекции состояния Ах(к) формируется путем введения обратной связи по сигналу ошибки между выходными координатами модели и объекта Де (к) = у (к)—у (к), (8.6-2) умноженному на матрицу Н. Когда процесс сойдется, состояния модели будут повторять состояния объекта. Такая модель назы- вается наблюдателем Льюинбергера [8.13], [8.14]. Если исполь- зуется полная модель объекта, то наблюдатель называется экви- валентным. Постоянная матрица обратной связи наблюдателя Н должна выбираться так, чтобы вектор состояния модели х (к) асимптоти- чески сходился к х (к) при к—> оо. Из рис. 8.6.1 следует, что уравнения наблюдателя имеют следующий видз х (к + 1) = Ах (к) + Ви (к) 4- НДе (к) = = Ах (к) + Ви (к) + Н [у (к) —Сх (к)]. (8.6-3) Ошибка состояния равна х(к+ 1) = х(к4-1)—х(к + 1). (8.6-4) Из уравнений (8.6-1) и (8.6-3) получим х(к + 1) = [А —НС]х(к). (8.6-5) Таким образом, мы имеем однородное разностное уравнение. Ошибка по переменным состояния зависит только от начального значения ошибки х (0) и не зависит от входного сигнала и (к). Для того чтобы процесс сходился, необходимо, чтобы hm х (к) = 0, к —> оо т. е. уравнение (8.6-5) должно описывать асимптотически устой- чивый процесс. Следовательно, характеристическое уравнение det [zl — A-j-HC] = (z—zj (z—z2). . .(z—zro) = = Ym+Ym-iz+ • • • 4-zm = 0 (8.6-6) должно иметь корни внутри единичной окружности , zx ] < 1, i=l, 2, ..., tn, т. е устойчивые корни. Это условие может быть выполнено при соответствующем выборе матрицы Н регуля-
Гл. 8. Регуляторы состояния 161 тора. Для выбора этой матрицы можно использовать методику выбора матрицы регулятора состояния. Поскольку det W = det W1, можно записать det [zl — А -I- НС] = det [zl — AT + CT H T]. (8.6-7) Из сравнения последнего уравнения с характеристическим урав- нением регулятора состояния для соответствующего объекта (см. уравнение (8.1-37)) следует, что необходимо модифицировать урав- нения для синтеза регулятора состояния. Для этого произведем следующую замену: А—>АТ, В—*СТ, К-+Нт. (8.6-8) Вместо объекта х (k + 1) = Ах (к) + Ви (к), у(к)=Сх(к) с обратной связью и (к) = — Кх (к) введем для определения полюсов наблюдателя «транспонирован- ный дополнительный объект» I (к + 1) = Ат£ (к) + СТФ (к) (8.6-9) с обратной связью « (к) = — Нт| (к), (8.6-10) для которого могут быть использованы уравнения синтеза регу- лятора состояния. Теперь матрицу Н наблюдателя можно опреде- лить различными способами, например следующими! а) Определение характеристического уравнения в соответствии с разд. 8.3. Для скалярного входа и (к) и выхода у (к), а следовательно, для вектора h (вместо матрицы Н) уравнение наблюдателя будет иметь вид х (к-|-1) = [А —hcT] х (к) -|- bu (к) -f-hy (к). (8.6-11) Здесь удобно применить каноническую форму наблюдаемости вместо канонической формы управляемости, использованной в разд. 8.3. Таким образом, х(к + 1) = '0 1 0 ...(—am—hm) 0 ...( am_j hffl_ х(к) -f-bu(k) -f- ’hffl ' У (к)- .0 0 ’1 (-^-ЬД -hi _ i (8.6-12)
162 Ч. II. Системы управления с детерминированными возмущениями Аналогично уравнению (8.3-9) в данном случае получим hi = yl—ab i=l, 2, m. (8.6-13) Здесь Yj — коэффициенты желаемого характеристического уравнения (8.6-6), которые следует задать. б) Конечное время установления. Задав hi = — ais (8.6-14) получим регулятор с минимальным конечным временем установле- ния, обладающий апериодическим характером переходных процессов (см. разд. 8.5). в) Минимизация квадратичного критерия качества. В уравнении (8.6-8) параметры вектора h могут быть выбраны из условия минимизации квадратичного критерия качества 1В = г (N) (N) + S [Г (k) Qbs (к) + V1 (к) R„v (к)], (8.6-15) к =0 как это было описано в разд. 8.1. Результирующие рекуррентные уравнения PN-i = Qt, + APN_1 + 1AT-HN-I[Rb + CPN_! + 1CT]Hl_1 получены на основании уравнений (8.1-30) и (8.1-31). Таким образом, характеристики наблюдателя, а следовательно, и характеристики его собственных движений могут быть выбраны различными способами. При практической реализации наблюдателей наличие шумов, присутствующих в выходной переменной, ограничивает теорети- чески достижимое время установления переходных процессов. Рас- смотренные выше наблюдатели предназначались для получения всех переменных состояния х(к). Однако некоторые из перемен- ных состояния объекта могут быть определены непосредственно, например, они могут содержаться в выходной переменной у (к). В этом случае можно использовать наблюдатель пониженного порядка (см. разд. 8.8). Из рис. 8.6.1 видно, что переменные состояния наблюдателя отслеживают состояния объекта без за- держки по сигналу и (к). Однако они будут запаздывать по на- чальным условиям х (0) и возмущениям по выходной коорди- нате у (к), что приведет к появлению ошибок в наблюдаемых со- стояниях. 8.7. РЕГУЛЯТОРЫ СОСТОЯНИЯ С НАБЛЮДАТЕЛЯМИ При построении регуляторов состояния в разд. 8.1-^8.5 пред- полагалось, что все переменные состояния объекта могут быть измерены точно. Однако для реальных объектов это условие не
Гл. 8. Регуляторы состояния 163 выполняется, и для формирования закона управления приходится вместо истинных переменных состояния объекта х(к) (см. рис. 8.1-33)) использовать переменные состояния, восстановленные с Рис. 8.7.1. Регулятор состояния с наблюдателем для начальных условий х(0). помощью наблюдателя. Таким образом, и (к) = — Кх (к). (8-7-1) Соответствующая блок-схема системы показана на рис. 8.7.1. 8.7.1. Наблюдатель для начальных условий Уравнения состояния замкнутой системы управления из уравнений (8.1-1), (8.6-3) и (8.7-1): А — ВК1 Гх(к)’ следуют (8.7-2) (8.7-3) 'х(к + 1)1 х(к-Ь 1) | ~ [НС А —ВК—НС] [х (к) J * У (к)=Сх (к), где векторы состояния х (к) и х (к) оказываются взаимосвязанными. На основании (8.1-36) запишем уравнение свободного движения объекта с обратной связью по состоянию без наблюдателя x(k-f-l) = [A —ВК]х(к). Свободное движение наблюдателя (8.6-5) описывается уравне- нием х (к-р 1) — х (к -|-1) =х (к-}> 1) ==[А — НС] х (к).
164 Ч. II. Системы управления с детерминированными возмущениями Для сравнения с этими уравнениями уравнения (8.7-2) используем следующее преобразование состояния: "х (к 4-1)1 Г1 01 Гх(к-|-1)1 x(k-H)J = [I — I] [х (к 4-1)] (8.7-4) откуда I —I х (к) -л « (8.7-5) х(к)_ ' ' В результате получим х(к+1)1 ГА —ВК ВК _х (к + 1)] = [ 0 А —НС А* х (к)" у(к) = [С 0] . (8.7-6) Собственное движение этой системы определяется характеристиче- ским уравнением det[zl—А*] = det [zl — А4- ВК] det [zl — А4- НС] = 0. (8.7-7) Следовательно, полный набор полюсов системы управления с ре- гулятором состояния и наблюдателем будет состоять из полюсов замкнутой системы управления без наблюдателя и полюсов наблю- дателя. Таким образом, полюса системы и полюса наблюдателя могут быть определены независимо, поскольку они не влияют друг на друга. Это следует из так называемой теоремы разделения. При этом, однако, следует учитывать, что временное поведение переменных состояния х(к) зависит от свойств наблюдателя, что ясно видно из уравнения (8.7-5). Наблюдатель обладает собст- венной динамикой и поэтому вносит дополнительные задержки в систему управления. Если используется эквивалентный наблюда- тель, то из уравнения (8.7-7) следует, что контур управления с объ- ектом порядка m имеет 2m полюсов и соответственно его порядок равен 2m. Влияние задержек, обусловленных введением наблюдателя, ясно видно при использовании апериодического регулятора со- стояния (разд. 8.3), объединенного с апериодическим наблюдателем (8.6-14). Характеристическое уравнение такой системы будет равно det[zl — A*] = zmzm = z2m. (8.7-8) Следовательно, установившееся состояние после отработки ненуле- вых начальных условий будет достигнуто только через 2m тактов работы системы, а не Через m тактов, как при использовании апе- риодического регулятора, описанного в разд. 8.5. В этом случае простой апериодический регулятор, о котором шла речь в гл. 6,
Гл. 8. Регуляторы состояния 165 оказывается более быстрым, чем регулятор состояния с наблюда- телем. В разд. 8.7.2 и 8.8 показано, как можно частично скомпен- сировать задержки, обусловленные введением наблюдателя. 8.7.2. Наблюдатель для внешних возмущений В разд. 8.2 было описано, как можно сформировать постоян- ные внешние возмущения с помощью начальных условий в рас- ширенных моделях состояния. Для того чтобы управлять постоян- ными возмущениями, вектор управляющих переменных и (к), опре- деляемых уравнением (8.2-12), должен формироваться из вектора состояния в (к) в регуляторе состояния и из векторов состояния у (к)—g (к) в пропорциональном регуляторе с прямой связью. Однако, поскольку в этом случае эти переменные состояния не могут быть измерены, их следует восстановить с помощью наблю- дателя. В дальнейшем, как и в предыдущем разделе, будем счи- тать, что входные и (к) и выходные переменные у (к) измеряются точно. Расширенный вектор состояния х* (к) полной системы, опи- сываемый уравнениями (8.2-14) и (8.2-15) с учетом введенных в (8.2-13) обозначений, содержит все переменные состояния объекта и моделей возмущений. Уравнением наблюдателя для такого век- тора состояния будет х* (к 4-1) = А*х* (к) 4- В*и (к) 4- Н*[е (к)—С*х* (к)]. (8.7-9) Для объектов с m переменными состояния и г выходами размер- ность матрицы обратной связи наблюдателя Н равна (m-|-r)xr. Ее можно определить с помощью методов, описанных в разд. 8.6. Из уравнения (8.2.16) следует, что уравнение регулятора, ис- пользующего наблюдатель, имеет вид и(к) = К*х*(к). (8.7-10) На рис. 8.7.2 представлена блок-схема системы для случая постоянных значений сигналов задающей переменной. Блок-схема, приведенная на рис. 8.7.3, соответствует описанию системы с уче- том сокращенных обозначений из соотношений (8.2-13). При из- менении возмущающей п (к) или задающей переменной w (к) не- известные переменные состояния х* (к) сначала определяются с помощью наблюдателя, в результате чего принятая модель воз- мущения или задающего воздействия точно воспроизводит сигналы п (к) или w (к) на своем выходе. Из рис. 8.7.2 видно, что _ u,(k) = r(k), (8.7.11) Т (к + 1) = V (к) + Н"(гхг|Де (к).
166 Ч. 11. Системы управления с детерминированными возмущениями Модель задающей переменной Объект Наблюдатель L_________________________________ Оптимальный регулятор состояния для ступенчатых измерений задающей переменной Рис. 8.7.2. Регулятор состояния с наблюдателем (для ступенчатых изменений за- дающей переменной). Сравни с рис. 8.2.1. где матрица Н*гхг) является соответствующим блоком матрицы Н*. Для системы с одним выходом (г—1) из уравнения (8.7-11) сле- дует, что u.W=-f^rhm+xAe(z), (8.7-12) т. е. наличие наблюдаемой переменной состояния у (к) приводит к формированию обратной связи по (т-Н)-й переменной состояния
Гл. 8. Регуляторы состояния 167 Рис. 8.7.3. Регулятор состояния с наблюдателем для постоянных значений за- дающей переменной w(k) и возмущения п(к). и появлению дополнительного компенсирующего элемента управ- ления Ui(k), обладающего интегрирующей характеристикой по отношению к сигналу ошибки Де (к). При введении переменной состояния у (к) (или t(k)) в наблюдателе появляется элемент, об- ладающий «интегрирующими свойствами», что приводит к отсут- ствию статических ошибок. Соответствующая постоянная инте- грирования равна коэффициенту обратной связи hm+1 наблюдателя. Значение этой постоянной определяется автоматически при синтезе наблюдателя и поэтому удовлетворяет требованиям, налагаемым данным методом синтеза регуляторов состояния. Рассмотрим теперь свободное движение гипотетического расши- ренного объекта (8.2-14) с расширенным наблюдателем (8.7-9) и регулятором состояния (8.7-10). По аналогии с уравнениями (8.7-5) и (8.7-6) запишем х*(к-}-1)' А*-)-В*К* —В*к* х*(к-}-1) О А* —Н*С* у (к) = [С* 0] х* (к)’ _х* (к). "х* (к)' x*(k)J ’ (8.7-13)
168 У. II. Системы управления с детерминированными возмущениями Следовательно, соответствующее характеристическое уравнение имеет вид det [zl — А* — В*К*] det [zl — А* 4- Н*С*] = 0. (8.7-14) Из последнего уравнения видно, что полюса регулятора и на- блюдателя гипотетической системы оказываются независимыми. Поведение замкнутой системы, состоящей из объекта (8.6-1) с рас- ширенным наблюдателем (8.7-9) и регулятором (8.7-10), описы- вается следующей системой уравнений: х(кЧ-1) ' х* (к 4-1) А — Н*С* ВК* (А*-)-В*К*—Н*С*) х(к) И ГО х* (k)J + [Н* X(w (к)—п(к)). х (8.7-15) Таким образом, после применения z-преобразования [zl — А] х (z) — ВК*х* (z), (8.7-16) [zl — (А*-)- В*К*—Н*С*)] х* (z) = — Н*С*х (z) 4- Н* (w (z) —n (z)) (8.7-17) и исключения х* (к) получим [zl — А4- ВК* [zl — (А*4- В*К* — Н*С*)]-Х Н*С*] х (z) == = BK*[zI — (А*4-В*К*— Н*С*)]"Х H*(w(z) — n(z)). (8.7-18) Учитывая уравнение выхода y(z)=Cx(k), можно вычислить пере- даточные функции по задающей или возмущающей переменной. В обоих случаях полюса замкнутой системы определяются из уравнения det [zl - А 4- ВК* [zl — (А* 4- В*К*— Н*С*)]“Х Н*С*] = 0. (8.7-19) Теперь полюса регулятора и наблюдателя не являются независи- мыми, и динамика наблюдателя влияет на характер вынужденного движения всей системы как по задающей, так и по возмущающей переменной. Следует отметить, что регулятор состояния с наблюдателем может быть спроектирован так, что динамика наблюдателя не будет влиять на вынужденное движение системы по задающей переменной. В этом случае точка входа задающей переменной w(k) переносится за наблюдатель и регулятор состояния, т. е. вводится опережение по сигналу и (к) [2.19]. Однако при такой структуре системы отсутствует непосредственное сравнение сиг- налов регулируемых и задающих переменных, параметры элемен- тов опережения зависят от параметров объекта управления, и могут возникнуть статические ошибки, если параметры объекта известны неточно или если они изменяются во времени. При методе синтеза, описанном выше, эти недостатки отсутствуют, так как ошибки управления е(к) формируются перед наблюдателем
Гл. 8. Регуляторы состояния 169 и регулятором путем непосредственного сравнения регулируемых и задающих переменных. Поэтому в системе не может возникнуть статических ошибок при ступенчатом изменении внешних возму- щений из-за наличия полюса в точке z=l. Задержки, обусловлен- ные наличием наблюдателя, могут быть частично ском- пенсированы, как это будет показано ниже. На рис. 8.7.4 приведены переходные процессы по ре- гулируемой и управляющей координате для объекта III с регулятором состояния для внешних возмущений при сту- пенчатом изменении возму- щающего сигнала n(k). Как видно из рисунка, статическая Рис. 8.7.4. Изменение регулируе- мой и управляющей переменных для объекта III с регулятором со- стояния для внешних возмущений. Ступенчатое изменение возмуще- ния n(k) [8.5]. ошибка отсутствует. Управляющая переменная, однако, начинает из- меняться только после истечения одного тактового интервала. Эта задержка возникает из-за того, что изменяющийся сигнал ошибки регулирования пропускается через элемент задержки z'1 в регу- ляторе, прежде чем сформируется необходимый сигнал управ- ляющей переменной (см. рис. 8.7.2). Таким образом, применение наблюдателей в отличие от параметрически оптимизируемых или компенсационных регуляторов приводит к появлению нежелатель- ной задержки сигнала управляющей переменной. Эта начальная задержка, однако, может быть исключена. Так, наблюдатель на рис. 8.7.2 восстанавливает все переменные состояния, хотя одна переменная состояния может быть измерена непосредственно, если она совпадает с выходной переменной у (к). Это условие вы- полняется при описании системы в пространстве состояний в ка- нонической форме наблюдаемости (см. рис. 3.6.3). В этом случае вместо задержанного элемента управляющей переменной um (k) = kmxm (к) - кту (к) используется незадержанный (реальный) сигнал u'm(k) = kmy(k) (8.7-20)
170 Ч. II. Системы управления с детерминированными возмущениями (см. рис. 8.7.5 и 8.7.6). Реальный сигнал выходной переменной у (к) может быть также использован при построении наблюдателя пониженного порядка (см. разд. 8.8). Пример 8.7.1. В качестве примера рассчитаем регулятор состояния, описан- ный в разд. 8.2, с наблюдателем для внешних возмущений, описанным v(K) Объект III Регулятор состояния Рис. 8.7,5. Блок-схема объекта III и регулятора состояния с наблюдателем для внешних возмущений и компенсацией начальной задержки. в разд. 8.7.2, для объекта III (см. разд. 5.4.1). Описание объекта III в про- странстве состояний представим в канонической форме наблюдаемости. Так как процесс обладает запаздыванием d= 1, то из уравнений (3.2-40) и (3.2-41)
Гл. 8. Регуляторы состояния 171 следует, или У (k) = cdxd (к). или Блок-схема всей системы приведена на рис. 8.7.5. Структура наблюдателя для ступенчатых изменений внешних переменных w (к) или п (к) задается уравнениями (8.7-9) и (8.2-13): ~0 0 —аз Ь3 0~ г°- 1 0 —32 Ь2 0 0 А* = 0 1 —at bi 0 , b* = 0 > 0 0 0 0 1 1 .0 0 0 0 1J _6 J с*т = [0 0 1 0:0], h*T = [ht* h2* Ьз* hl ! h5*]. Коэффициенты вектора обратных связей h* наблюдателя вычислены в ре- зультате минимизации квадратичного критерия качества (8.6-15) для наблю- дателя, представленного в форме (8.6-9) и (8.6-Ю), с использованием рекур- рентного решения матричного уравнения Риккати (8.6-16). Для весовой матрицы QB и коэффициента гв, заданных в следующем виде: - 1 0 0 0 о - 0 10 0 0 0 0 10 0 > гв=5, 0 0 0 1 0 _ 0 0 0 0 25 _ получено следующее решение для вектора обратных связей наблюдателя h*T = [0,061 —0,418 0,984 1,217 1,217]. При расчете регулятора состояния в соответствии с уравнениями (8.2-17), (8.2-11) или (8.1-33) в результате рекуррентного решения матричного урав- нения Риккати в соответствии с уравнениями (8.1-30) и (8.1-31) весовая матрица Q для переменных состояния (уравнение (8.9-4)) была выбрана так, что только регулируемая переменная имела единичный весовой коэффициент, т. е. ГО 0 Q = CdCd = L0 0 0 0" 0 0 1 0 0 0_ 0 0 0 0
172 Ч. П. Системы управления с детерминированными возмущениями При задании весового коэффициента при управляющей переменной г —0,043 получен следующий вектор обратных связей регулятора: к*т = [4,828 5,029 4,475 0,532 1,000], а для г = 0,18 к*т= [2,526 2,445 2,097 0,263 1,000] На рис. 8.7 6 показаны переходные процессы в системе по регулируемой и управляющей переменным 10 ----- Переходные про- регулируемой и переменным Рис. 8.7.6. цессы по управляющей для объекта III с регулято- ром состояния для внешних возмущений и модифициро- ванным наблюдателем для компенсации начальной за- держки. Ступенчатое изме- нение возмущения п (к) [8.5]. этого объекта, суммарный порядок которого m-|-d = 4, должны быть просчитаны алгоритмы, предназначенные для вычисления • ошибки на выходе наблюдателя. Де (к— 1)=е(к— 1) — х3(к — 1); • оценки переменных состояния: Х1(к)= —азх'з (к —1) + Ь3Х4 (к—l)-f-hi Де (к — 1), х2 (k) = Xi (к—1) —а2х3 (к—1) + Ь2х4 (к— 1) -{- hj Де (к—1), х3 (к) = х2(к— 1) — arx3 (к—l)-|-biX4 (к —l) + h3 Де (к —1), х4 (к) = х5 (к— 1) + и (к— 1) +Ь*Де(к —1), х5(к) = х5(к—1) + hs Де (к — 1),
Гл. 8. Регуляторы состояния 173 • управляющей переменной: — без компенсации задержки z-1 в наблюдателе для у (к) u(k) = k]Xj (к) + ках2 (к) + кз£з (к)+ ^£4 (к) + к&х5 (к), — с компенсацией задержки z-1 в наблюдателе для у (к) u (k) = kiX! (к) + к1х2(к)+кзу (к) + к^£4 (k)4-ksx5 (к). Таким образом, на каждом такте необходимо выполнить 15 операций умно- жения и 16 операций сложения При подсчете числа операций было учтено, что к6 = 1 При реализации алгоритма управления на цифровом вычислителе к указанным операциям необходимо добавить 8 операций сдвига 8.8. НАБЛЮДАТЕЛЬ СОСТОЯНИЯ ПОНИЖЕННОГО ПОРЯДКА Эквивалентный наблюдатель, описанный в разд. 8.6, восста- навливает все переменные состояния х(к). Однако, если некоторые переменные состояния могут быть непосредственно измерены, вычислять их нет необходимости. Например, в объекте т-го порядка с одним входом и одним выходом одна переменная со- стояния может быть получена на основании измерения выходной переменной у (к), так что только (ш—1) переменная состояния должна быть восстановлена с помощью наблюдателя. Наблюдатель, порядок которого меньше порядка модели объекта, называется наблюдателем пониженного порядка (см. [8.13], [8.15]). Ниже описан метод построения наблюдателя пониженного порядка, изложенный в работах [8.15] и [2.19]. Пусть объект описывается уравнениями x(k+l) = Ax(k)4-Bu(k), (8.8-1) y(k) = Cx(k). (8.8-2) Размерность векторов в уравнениях равна х (к) —> (тх 1), u(k)—>(рх1), у (к) —> (г х 1) • При г независимых измеримых выходных переменных у (к) можно непосредственно вычислить г переменных состояния. Следова- тельно, вектор состояния х (к) можно разделить на измеряемую хь (к) и наблюдаемую ха (к) части: ха(к+1)' xb(k-J-1) — Ац А12 А А ^21 ^*22 3 Ха (к) ' ХЬ (к). + ‘со со &9 Hl u(k), (8.8-3) У (к) = [< Jxa( к)' к). • (8.8-4) Заменим измеряемый вектор состояния хь (к) вектором выходных переменных у (к). В этом случае вектор состояния v определяется
174 Ч. 11. Системы управления с детерминированными возмущениями с помощью линейного преобразования: ха .У. = Тх = Тп т12- _T2i Т22 Ха хь (8.8-5) v = Из уравнения (8.8-4) следует, что Ta = Cj и Т22 = С2. Поскольку ха (к) не изменяется, Тп = 1, а так как xb(k) не зависит от ха(к), то Т12 = 0. Таким образом, матрица преобразования имеет вид а преобразованное уравнение объекта примет вид v(k-|-l) = Atv(k) + Btu(k), (8 8-7) y(k)=Ctv(k). (8.8-8) Из уравнения (3.2-32) следует, что At = TAT-1, Bt = TB, (8.8-9) C^CT-^fO I]. Перепишем уравнение (8.8-7) с учетом блочной структуры матрицы из уравнения (8.8-3): ха (к + 1) = Atllxa (к) 4- А}12у (к) 4- Btlu (к), (8.8-10) У (к4- О = Ашха (к) 4- At22y (к) 4- Bt2u (к). (8.8-11) Запишем на основании (8.6-3) уравнение эквивалентного наблю- дателя (т—г)-го порядка для объекта, описываемого уравнением (8.8-10): ха (к4-1) = Atuxa (к) 4-Atl2y (к)4- Btlu (к) 4- Het (к). (8.8-12) Выходной сигнал ошибки эквивалентного наблюдателя полного порядка т, определяемый уравнением (8.6-2), представляет собой разность между выходными сигналами наблюдателя и объекта Однако, поскольку наблюдатель пониженного порядка не вычис- ляет явно весь вектор у (к), а вектор у (к) не содержит инфор- мации о ха(к), следует переопределить вектор ошибки et(k). Для этого можно использовать уравнение (8.8-11), поскольку именно оно определяет ошибку et (к), пока ха (к) не соответствует изме- ряемым переменным у (к), у(к4-1) и и (к): e,(k)=y(k+l)-At!li,(k)-AtMy(k)-Bt,a(k). (8.8-13) < - - - - - - ---------------- у (к +1)
Гл. 8. Регуляторы состояния 175 На основании уравнений (8.8-12) и (8.8-13) запишем уравнение наблюдателя ха (к 4- 1) — Atllxa (к) + At| 2у (к) Btlu (к) 4- -к Н [у (к 4- 1) - At22y (к) - Bt2u (к)- AtS1£a (к)]. (8.8-14) Соответствующая блок-схема приведена на рис. 8.8.1. Входя- щее в уравнение (8.8-14) значение у (к 4-1) в момент времени к Рис. 8.8.1. Блок-схема наблюдателя пониженного порядка, описываемого урав- нением (8.8-14). неизвестно. Из рис. 8.8.1 видно, что выходной сигнал ха (к) не изменится, если связь xa(z) = Hz-1y (z)z будет заменена на ха (z) = Ну (z). Однако в этом случае нам придется ввести новый вектор пере- менных состояния наблюдателя Д (к) = ха (к) — Ну (к). (8.8-15) С учетом вышесказанного уравнение наблюдателя пониженного порядка (рис. 8.8.2) будет иметь вид р, (к 4- О = Atllji (к) 4- [Atl2 4- AtllH]y (к) 4- Btlu (к) 4~ 4- Н [ —АшНу (к) —At32y (к) —Bt2u (к)—Ашц (к)] или М- (к 4* О — [Atn — HAt21] fi (к) -'г + [^ti2 — HAt22 4- AtllH — HAt21H] у (к) 4- [Btl —HBt2Ju(k) (8.8-16)
176 Ч. 11. Системы, управления с детерминированными возмущениями Рис. 8.8,2. Модифицированная блок-схема наблюдателя пониженного порядка, описываемого уравнением (8.8-15). Подлежащие восстановлению переменные состояния ха(к) форми- руются так: ха (к) = н (к) 4-Ну (к). (8.8-17) Таким образом, полный вектор состояния определяется уравнением '?(к)=[Ха/и)] = [1 (8.8-18) Ly(k) L° I J Ly(k) Учитывая, что ошибка наблюдателя по переменным состояния равна ха (к + 1) = ха (к4- 1)-ха (к4- 1), (8.8-19) из уравнений (8.8-10) и (8.8-13) получим, что ха (к 4-1) = [Аш — HAt21] ха (к). (8.8-20) В отличие от эквивалентного наблюдателя в это однородное раз- ностное уравнение вместо матрицы объекта А входит блок А1и преобразованной матрицы объекта, соответствующий вектору со- стояния ха, а вместо матрицы выхода С входит блок Аш преоб- разованной матрицы объекта, определяющий связь между ха (к) и у (к 4-1) в соответствии с уравнением (8.8-11). Характеристическим уравнением наблюдателя пониженного порядка является следующее: det[zl — Atn4-HAt21] = (z — zx) (z —z2) ... (z—zm_r)=0. (8.8-21) Полюса наблюдателя можно задать с использованием методики, изложенной в разд. 8.6.
Гл. 8. Регуляторы состояния 177 Преимущества наблюдателя пониженного порядка по сравнению с эквивалентным наблюдателем (разд. 8.6) состоят в уменьшении порядка его уравнений (на величину г — числа непосредственно измеряемых выходных переменных) и использовании текущих значений выходных переменных у (к), что позволяет исключить задержки, о которых было сказано в разд. 8.7. Эти преимущества, однако, компенсируются существенным увеличением числа необхо- димых вычислений. Более того, добавляется дополнительное урав- нение (8.8-17) для вычисления подлежащих восстановлению пере- менных состояния. При цифровой реализации на ЭВМ наблюдатель пониженного порядка обычно оказывается предпочтительнее только тогда, когда непосредственно измеряется достаточно много пере- менных состояния объекта. Во всех других случаях, например для объектов с одним входом и выходом, лучше использовать эквива- лентный наблюдатель, модифицированный в соответствии с рекомен- дациями разд. 8.7, так как его проще рассчитывать, а потенциаль- ное уменьшение числа межтактовых вычислений при понижении порядка такого наблюдателя относительно мало. 8.9. ВЫБОР ВЕСОВЫХ МАТРИЦ И ТАКТА КВАНТОВАНИЯ Если регулятор состояния проектируется не для конечного времени установления (апериодического характера процессов), то приходится выбирать достаточно большое число их свободных параметров по сравнению с другими структурно оптимизируемыми регуляторами. При синтезе регуляторов без оптимизации квад- ратичного критерия качества приходится задавать либо коэффици- енты характеристического уравнения (разд. 8.3), либо собственные значения замкнутой системы (разд. 8.4). Квадратично оптимальные регуляторы состояния требуют выбора весовых матриц: матрицы Q для переменных состояния и матрицы R для управляющих пере- менных. Для синтеза наблюдателей также необходимо выбрать свободные параметры, которые опять же являются либо коэффи- циентами характеристического уравнения, либо весовыми мат- рицами Qb и Rb квадратичного критерия качества (разд. 8.6). К тому же на процесс синтеза наблюдателей влияют параметры принятых моделей внешних воздействий (разд. 8.2), а также ве- личина такта квантования (что относится и к регуляторам). Воз- можность выбора такого относительно большого числа свободных параметров при синтезе регуляторов состояния, с одной стороны, позволяет достаточно полно учесть характеристики объекта и требования к качеству управления, а с другой стороны, допускает определенный произвол при задании столь большого числа пара- метров. Поэтому расчет регуляторов состояния редко выполняется за один прием, а чаще проводится итеративно с использованием оценок качества процессов регулирования (изложенных в гл. 4),
178 Ч. II. Системы управления с детерминированными возмущениями полученных на очередном этапе синтеза системы. Однако при наличии некоторого опыта проектирования число свободных пара- метров может быть сокращено. 8.9.1. Весовые матрицы для регуляторов состояния и наблюдателей При проектировании регуляторов состояния на основе критерия качества (8.1-2) вес каждой управляющей переменной можно за- дать независимо, так что матрица R может быть представлена в диагональной форме: гГ1 0 ... О "1 О г8 (8.9-1) L_0 • • • гР_ Для того чтобы матрица R была положительно определена, ее элементы гь 1 = 1, 2, . . ., р должны быть положительными. В осо- бых случаях, допускающих положительную полуопределенность матрицы R, некоторые из элементов rt могут быть нулевыми (см. разд. 8.1). Веса отдельных переменных состояния в большинстве случаев также задаются с помощью диагональной матрицы Q: гЧ1 О ..-.О’) о qa (8.9-2) ... qt J Матрица Q должна быть положительно определена, откуда сле- дует, что qt > 0 для 1 = 1, 2, ..., г (см. разд. 8.1). Если требуется, чтобы диагональная матрица Q содержала весовые ненулевые элементы только для выходных переменных у (к) (как в случае параметрически оптимизируемых регуляторов, про- ектируемых на основе квадратичного критерия качества (5 2-6)), то из уравнения (8.1-2) получим хт (k) Qx(k) = yT(k) Ly (к), откуда с учетом уравнения (8.1-3) можно записать ут (к) Ly (к) = хт (к) CTLCx (к). Из последнего уравнения следует, что Q = CTLC. (8.9-3)
Гл. 8. Регуляторы достояния 179 Следовательно, для объектов с одним входом и одним выходом выполняются соотношения R = r, Q = ccT. (8.9-4) Заметим, что при синтезе регуляторов состояния параметр г яв- ляется весовым коэффициентом при управляющей переменной и2 (к), а в уравнении (5.2-6) — при Au2(k) = [u(k)—u(oo)]2. Однако для объектов пропорционального типа с регулятором состояния и (оо)=0, откуда следует, что u (к)=Аи (к), так что принципиального различия между ними нет. При синтезе наблюдателей с использованием квадратичного критерия качества (8.6-15) для транспонированной системы (8.6-9) и (8.6-10) весовые матрицы Qb и Rb могут быть заданы по аналогии с методами синтеза регуляторов состояния. В общем случае, од- нако, можно спроектировать наблюдатель, который оказывается более «быстрым» по сравнению с объектом. Для этого достаточно, чтобы элементы матрицы Rb были меньше элементов матрицы Qb. 8.9.2. Выбор такта квантования При выборе подходящего такта квантования То можно вос- пользоваться преимуществом, которое присуще предложенному методу синтеза по сравнению с рассмотренными ранее. Оно состоит в аналитической зависимости оптимального значения квадратичного критерия качества от параметров объекта управления. Из урав- нения (8.1-32) получим Iopt (Т0) = хт (0)-Ро (То)х(0), где Р0=Р— стационарное решение матричного уравнения Рик- кати (8.1-31). Однако получение аналитического соотношения, позволяющего установить связь между значением критерия каче- ства и тактом квантования, оказывается сложной задачей [8.16]. Можно показать, что при малых значениях такта квантования То значение Iopt(T0) монотонно возрастает с увеличением То, если объект является полностью управляемым. Последнее условие выполняется для объектов с действительными корнями и нарушается для объектов с комплексно-сопряженными корнями, если значение такта квантования близко к величине полупериода соответствующих собственных колебаний [8.16]. В общем случае наименьшие зна- чения критерия достигаются при То=0, т. е. для непрерывных регуляторов состояния. Для дискретных регуляторов при значе- ниях То, близких к нулю, значение критерия мало отличается от непрерывного случая. И только для больших тактов квантования качество управления существенно ухудшается.
180 Ч. Ц. Системы управления с детерминированными возмущениями На основании имеющегося опыта можно рекомендовать выбирать такт квантования для регуляторов состояния в соответствии с рекомендациями, приведенными в разд. 5.5 и 7.3. Для регуляторов состояния, так же как и для регуляторов с конечным временем установления, существует связь между требу- емыми изменениями управляющей переменной и тактом кванто- вания, если необходимо обеспечить отработку возмущающего воз- действия за конечный период времени. Если задан допустимый диапазон изменения управляющей переменной, его следует учиты- вать при выборе величины такта квантования [2.19].
ГЛАВА 9 Регуляторы для объектов с большим запаздыванием Методы синтеза регуляторов, описанные в предыдущих главах, позволяют непосредственно учитывать реальные запаздывания, присутствующие в объекте управления. Это осуществляется достаточно легко, так как запаздывание просто вводится в модель объекта, представленную в дискретной форме, что является еще одним преимуществом дискретного представления по сравнению с описанием объекта в классе непрерывных сигналов. В связи с этим регу- ляторы для объектов с запаздыванием могут быть непосредственно синтези- рованы с использованием ранее изложенных методов. Управление объектами с запаздыванием, малым по сравнению с их другими динамическими характе- ристиками, уже рассматривалось в некоторых примерах. Малое запаздывание или является допустимой аппроксимацией малых постоянных времени объекта управления, или соответствует действительно присутствующим в объекте задержкам в передаче сигналов. Если же запаздывание велико по сравнению с другими динамическими характеристиками объекта, то здесь возможно несколько особых случаев, о которых речь пойдет ниже. Следует подчеркнуть, что большие значения запаздывания необходимо рассматривать исключительно как наличие задержек в передаче сигналов. В общем случае объекты управ- ления с запаздыванием можно разделить на два класса: объекты, характери- зующиеся только задержкой в передаче сигналов, т. е. объекты с чистым запаздыванием, и объекты, обладающие запаздыванием и собственной дина- микой. 9.1. МОДЕЛИ ОБЪЕКТОВ С ЗАПАЗДЫВАНИЕМ Объекты с характеристикой чистого запаздывания, время кото- рого равно Tt = dTfl, можно описать дискретной передаточной функцией GP(z) = ^ = bz-\ d —1, 2... (9.1-1) или разностным уравнением у (k) = bu (k—d). (9.1-2) Здесь Tt—время запаздывания, кратное такту квантования То. Объекты с запаздыванием и собственной динамикой имеют пере- даточную функцию Gp(z) = = г- д -+ МУ г- (9.1-3) v ’ u(z) A(z-1) l + aiZ-l+...+amZ-m v > или описываются соответствующим разностным уравнением типа (3.4-13). Уравнение (9.1-1) может быть получено из (9.1-3) либо с помощью замены коэффициентов d'==d—1, b1 = b, b2=... —
182 Ч. II. Системы управления с детерминированными возмущениями = bm = 0 и ах= . .. = ат = 0: GP (z) = b1z-1z~d' = bz~d, (9.1-4) либо в результате прямой подстановки d = 0 в z~d, m==d в B(z-1), bm = bd = b, b1= ... =bm_1 = 0 и a1=...=am = 0: GP(z) = bmz-m = bz-d. (9.1-5) Представление объектов с одним входом и одним выходом в про- странстве состояний дает возможность использовать различные способы описания запаздывания (см. разд. 3.2.3). 9 Запаздывание по входу: x(k+l) = Ax(k) + bu(k—d), y(k) = cTx(k). ( • - ) О Запаздывание, включенное в матрицу системы А [см. уравнение (3.6-41)]: x(k+l) = Ax(k) + bu(k), y(k) = cTx(k). ( • ’ ) 9 Запаздывание по выходу: x(k+ l) = Ax(k) + bu(k), у(к) = стх(к—d) или у (k4-d) = cTx(k). ' ’ ' Во всех рассмотренных случаях матрица А может быть пред- ставлена в различных канонических формах (см. разд. 3.6). В урав- нениях (9.1-6) и (9.1-8) матрица А имеет размерность mXm, а в уравнении (9.1-7) — (m+d)X (m+d). Таким образом, введение запаздывания в матрицу А системы приводит к появлению d до- полнительных переменных состояния. Характеристики объекта относительно входа/выхода не зависят от формы представления запаздывания, однако с точки зрения синтеза это имеет сущест- венное значение, поскольку влияет на структуру и параметры синтезируемых регуляторов. Способ введения запаздывания (по входу или по выходу) зависит от технологической структуры ре- ального объекта и в общем случае может быть достаточно просто обоснован. Для объектов с чистым запаздыванием введение запаздывания в матрицу соответствующей системы разностных уравнений, пред- ставленной в канонической форме управляемости, приведет к опи- санию объекта в виде (3.6-36) с вектором состояния х(к) размер- ности d. В противоположность этому в уравнениях (9.1-6) и (9.1-8) в рассматриваемом случае А = а=О, a d следует заменить на d' = d—1. Следовательно, описание объекта в пространстве состояний в этом случае теряет смысл. Заметим, что задержки могут возникать как на входе, так и между переменными состояния модели объекта. В непрерывном случае этому соответствует векторное дифференци-
Гл. 9. Регуляторы для объектов с большим запаздыванием 183 альное уравнение вида х(1) = Л7 x(t) + A2x(t —TtA) + #u (t), y(t) = Cx(t). В дискретном случае, однако, такая система с запаздыванием может быть описана уравнением (9.1-7) путем соответствующего расширения вектора состояния и матрицы системы. 9.2. ДЕТЕРМИНИРОВАННЫЕ РЕГУЛЯТОРЫ ДЛЯ ОБЪЕКТОВ С ЗАПАЗДЫВАНИЕМ Существует большое число работ, связанных с проектированием непрерывных регуляторов для объектов с запаздыванием (см. [9.1] — [9.7] и [9.14]). В них детально рассмотрены как парамет- рически оптимизируемые регуляторы пропорционального и инте- грального типа, так и регуляторы-предикторы, предложенные в работе Ресвика [9.1]. В последних модель объекта с запаздыванием включена в обратную связь регулятора, в результате чего удается получить наименьшее время установления переходных процессов. Недостатки таких регуляторов-предикторов и их модификаций (см. [5.14]) состоят в их относительно высокой эксплуатационной стоимости и высокой чувствительности к несоответствию реального и заложенного при синтезе времени запаздывания. В общем случае для управления объектами с запаздыванием рекомендуется исполь- зовать пропорционально-интегральные регуляторы, динамические характеристики которых являются аппроксимацией регуляторов- предикторов. Однако применение цифровых вычислителей позво- ляет существенно снизить их эксплуатационную стоимость. По- этому мы ниже снова рассмотрим дискретное управление объектами с (большим) запаздыванием. 9.2.1. Объекты с большим запаздыванием и дополнительной динамикой Для управления объектами с большим запаздыванием пригодны параметрически оптимизируемые регуляторы, описанные в гл. 5, которые представлены в форме, позволяющей сформировать уп- равление для конечного времени установления переходных про- цессов (гл. 7), а также регуляторы состояния, описанные в гл. 8. При этом структура параметрически оптимизируемых регуляторов типа ]ПР-] остается той же, однако их параметры могут сущест- венно измениться. Апериодические регуляторы AP(v) и AP(vH-l) для объектов с запаздыванием уже были рассмотрены ранее. Для регуляторов состояния способ введения запаздывания в векторно- матричную модель объекта управления играет существенную роль. Этот раздел содержит дополнения к методам синтеза регуляторов, изложенным выше.
184 Ч. 11. Системы управления с детерминированными возмущениями Регулятор-предиктор (РПР) Сначала рассмотрим дискретный регулятор-предиктор [9.1], который был специально разработан для объектов с запаздыванием. В указанной работе параллельно объекту с передаточной функ- цией Gp (z) был включен элемент параллельной передачи Ger (z), в результате чего общая передаточная функция получилась равной коэффициенту передачи объекта Кр. Вместо элемента параллельной передачи Ger (z) было предложено использовать внутреннюю обрат- ную связь регулятора Gr (z) [5.14]. При Gr—> оо из уравнения (6-4) получим компенсационный регулятор, с которым передаточ- ная функция замкнутой системы будет равна GW (z) == Gp (z) К7 A (Z-1) z d- (9-2-1) Эта передаточная функция замкнутой системы затем приравнива- лась передаточной функции объекта с единичным коэффициентом передачи, что вполне допустимо для объектов с запаздыванием. Из этого условия с учетом уравнений (6-4) и (9.2-1) далее получена передаточная функция регулятора-предиктора1. с I \ — 1 — A(z-r) 'JR (z1 — Кр_Gp(z) -• КрА (z-1) —В (z-^z-d — _________________1 4~ aiz~1~l~ • • • ~l~amz Ш_____ Кр + KPa1Z-i +... + (Kpai+a-bO z~(1+d) +... -bmz-(m+d’' (9.2-2) Характеристическое уравнение замкнутой системы, следующее из (9.2-1), равно zdzmA(z-1) = zd[zm + a1zm-1+ ... +am_1z + am] = 0, (9.2-3) т. е. характеристические уравнения объекта и замкнутой системы оказываются идентичными. Следовательно, регулятор-предиктор может использоваться только для асимптотически устойчивых объ- ектов. Для уменьшения высокой чувствительности регулятора Рес- вика (см. разд. 9.2.2) к изменению времени запаздывания Смит предложил модификацию регулятора [9.2] — [9.4], [9.15], для ко- торого передаточная функция замкнутой системы имеет вид Gw(z) = ji-Gp(z).G'(z). (9.2-4) В эту передаточную функцию входит дополнительный элемент задержки G'(z). Таким образом, модифицированный регулятор- предиктор описывается передаточной функцией GRfe> = K^gg.G72)- (9.2-5) Обычно задержка G' (z) выбирается равной одному такту.
Гл. 9. Регуляторы для объектов с большим запаздыванием 185 Регулятор состояния (PC) Если запаздывание d не включено в матрицу системы А [см. уравнение (9.1-7)], а представлено лишь задержкой по входу и (к—d) или задержкой по переменным состояния х(к—d), что соответствует уравнениям (9.1-6) и (9.1-8), преимущество регулятора состояния, заключающееся во введении обратных связей по всем переменным состояния, не может быть реализовано. При синтезе регуляторов состояния для объектов с запаздыванием его следует вводить в матрицу системы А, если переменные состояния могут быть непо- средственно измерены. Хотя при этом для большого времени за- паздывания размерность (m+d)x (m+d) матрицы А становится большей, алгоритм синтеза регулятора состояния не изменяется. Как можно видеть из уравнений (3.6-39) и (3.6-40), изменяются лишь А, b и с по сравнению с обычными дискретными моделями объектов. В структурно оптимизируемых регуляторах относительно входа/ выхода для объектов с запаздыванием порядок числителя переда- точной функции зависит только от порядка объекта ш. Он равен ш для регуляторов AP(v) и РПР, а для регулятора с минимальной дисперсией РМД-d равен (ш—1) (см. гл. 14). Запаздывание влияет только на порядок числителя, который будет равен (m+d) или (m+d—1) соответственно. Таблица 9.2.1 Ненулевые параметры апериодических регуляторов, регуляторов-предикторов и регуляторов с минимальной дисперсией (гл. 14) для объектов порядка rn^l с запаздыванием d Чо 41 - Чт-, Чт Ро Р1 pl + d pm+d-l ptn + d АР (v) X X X X X — X X X РПР X X X X X X х X X РМД-d X X X — X X X X — 9.2.2. Объекты с чистым запаздыванием Регуляторы вход/выход (апериодические, предикторы и ПИ-регу- ляторы) Передаточная функция структурно оптимизируемого регулятора вход/ЙЫход для объектов, обладающих только чистым запазды- ванием Gp(z) ==^fj = bz-d (9.2-6) получена из описания регулятора для объектов с m элементами задержки и запаздыванием d с использованием уравнений (9.1-4)
186 Ч. 11. Системы управления с детерминированными возмущениями или (9.1-5). Апериодические регуляторы AP(v) и регуляторы- предикторы РПР, относящиеся к компенсационным регуляторам, имеют одну и ту же передаточную функцию °'(г>=Т1Ат (9.2-7) или соответствующее разностное уравнение u(k) = u(k — d) + qoe(k), (9.2-8) где q0=l/b. Текущее значение управляющей переменной и (к) вычисляется из управляющей переменной и (к—d), задержанной на время запаздывания, и ошибки управления е(к). Переходный процесс компенсационного регулятора, описываемого уравнением Рис. 9.2.1. Переходный процесс ком- пенсационного регулятора u(k)= =u(k—d)+qoe(k) для d=3. Пунктир- ная линия — аппроксимация ПИ-ре- гулятором, описываемым уравнением (9.2-9). (9.2-7), приведен на рис. 9.2.1. В начале этой главы уже отмеча- лось, что регулятор для объектов с запаздыванием может быть аппроксимирован ПИ-регулятором, как показано на рис. 9.2.1, В этом случае получаем алгоритм управления u (k) = u (к — 1) + qje (к) + qie (к — 1) с параметрами По = q0/2 = 1/2Ь, , Г 1 11 41 “q° [d 2 J (9.2-9) 1 (d-2) 2b d ' J Характеристические коэффициенты алгоритма, введенные в разд. 5.2.1, будут равны K^q^-^-—коэффициент передачи; q = _ q°+.qL. —А коэффициент интегрирования. Запишем теперь ха- Чо ° рактеристическое уравнение результирующей системы с обратной связью при точном и неточном задании времени запаздывания. Это позволит оценить чувствительность замкнутой системы по отношению к запаздыванию. Для компенсационного регулятора с точно заданным запаздыванием имеем 14-GR(z)GP(z) = zd«0. (9.2-10)
Гл. 9. Регуляторы для объектов с большим запаздыванием 187 Это характеристическое уравнение совпадает с характеристическим уравнением объекта. Из него можно определить чувствительность регулятора к неточному заданию времени запаздывания. Если регулятор, синтезированный для запаздывания d, используется для управления объектом с запаздыванием d-f-l, т. е. заданное запаздывание оказалось меньшим, то характеристическое уравнение замкнутой системы будет иметь вид zd+1—— z+l=0. (9.2-11) Для d 1 его корни расположены на единичной окружности или вне ее, что ведет к развитию неустойчивости (см. табл. 9.2.2). Если же запаздывание в объекте равно d—1, получим zd + z—1=0. (9.2-12) В этом случае неустойчивость возникает при d^2 (табл. 9.2.2). В табл. 9.2.3 приведены наибольшие значения неустойчивых кор- ней для значений d, равных 1, 2, 5, 10 и 20. Для очень больших запаздываний замкнутая система с компенсационным регулятором становится настолько чувствительной к изменению даже на один такт запаздывания в объекте, что всегда возникает неустойчивость. Следовательно, такой регулятор можно применять только в тех случаях, когда запаздывание известно точно. При использовании ПИ-регулятора (2ПР-2) характеристиче- ское уравнение будет равно zd+1—zd4-bqoz+qib =0 (9.2-13) или, используя параметры (9.2-9), 2zd+1—2zd-|-z—-^- = 0. (9.2-14) Если запаздывание в объекте изменяется с d на d 4-1, то имеем 2zd+2—2zd+,4-z~^р- = 0. (9.2-15) При замене d на d — 1 получим 2zd—2zd-'4-Z--~^- = 0. (9.2-16) В табл. 9.2.4 приведены значения соответствующих корней. Если исключить случай d=l, неустойчивости не возникает. Следова- тельно, система с ПИ-регулятором менее чувствительна к измене- нию запаздывания в объекте. Только при использовании ПИ- регулятора, синтезированного для d=l, возникает неустойчивость при запаздывании в объекте d=2. Более того, можно заметить, что большие значения корней характеристического уравнения соответствуют большим значениям запаздывания в объекте, превы- шающим выбранное для расчета регулятора. Поскольку при этом
Таблица 9.2.2 Значения модулей | г-х | корней характеристических уравнений (9.2-10), (9.2-11) и (9.2-12) для объектов с чистым запаздыванием с регулятором Gr (z) = 1/(1—z—d) Объект d=l d = 2 d = 5 z—d 0 — 0 0 — 0 0 0 0 0 Z- (d+D 1,0 1,0 1,325 0,869 0,869 1,126 1,126 1,050 1,050 0,846 Z~ (d—1) 0,5 - 1,62 0,618 — 1,151 1,151 1,000 0,755 — Таблица 9.2.4 Значения модулей | z-x | корней характеристических уравнений (9.2-14), (9.2-15) и (9.2-16) для объектов с чистым запаздыванием с ПИ-регулятором (9.2-9) Объект d=l d = 2 d = 5 Z—d 0,707 0,707 0,707- 0,707 0 0,886 0,886 0,829 0,829 0,701 Z- (d+ 1) 1,065 1,065 0,441 0,941 0,941 0,565 0 0,923 0,923 0,858 0,858 0,856 O',856 - — — Z- (d-1) 0,333 0,500 0 0,796 0,796 0,789 0,789 0,760 II. Системы управления с детерминированными возмущениями
Гл. 9. Регуляторы для объектов с большим запаздыванием 189 Таблица 9.2.3 Наибольшие значения модулей | zj | корней характеристического уравнения для объекта с чистым запаздыванием с регулятором Gr (z) = l/(l—z“d) Объект d=l d=2 d = 5 d=10 d=20 Z —d 0 0 0 0 0 Z — (d+ 1) 1,0 1,320 0,126 1,068 1,034 Z — (d — 1) 0,5 1,618 1,151 1,076 1,036 Таблица 9.2.5 Наибольшие значения модулей | Zj |fflax корней характеристического уравнения для объекта с чистым запаздыванием с ПИ-регулятором (9.2-9) Объект d=l d=2 d = 5 d= 10 d = 20 Z—d 0,707 0,707 0,886 0,938 0,970 Z— (d+ 1) 1,065 0,941 0,923 0,951 0,974 Z—(d—1) 0,333 0,500 0,796 0,923 0,967 происходит приближение к пределу устойчивости, лучше синте- зировать ПИ-регулятор для времени запаздывания, заведомо пре- вышающего запаздывание в объекте. В разд. 14.3 рассмотрены ре- гуляторы для объектов с чистым запаздыванием и стохастическими возмущениями, проектируемые на основании принципа минималь- ной дисперсии. Регулятор состояния Если запаздывание включено в матрицу системы, как в урав- нениях (9.1-7) и (3.6-41), и предполагается, что все переменные состояния измеряются непосредственно, то характеристическое уравнение для объекта с чистым запаздыванием и регулятором состояния (8.3-8) будет равно det [zl —А + bkT] = kd 4- kd_jZ 4-... 4- kjZd_14- zd = = (z —zi) (z—z2) ... (z—zd)==0 (9.2-17) Для того чтобы это характеристическое уравнение было тем же, что и для компенсационных регуляторов вход/выход, т. е. zd=0,
190 Ч. 11. Системы управления с детерминированными возмущениями все d коэффициентов пропорциональных обратных связей должны быть равны нулю, т. е. ki=0 для i=l, . . d. Смысл состоит в том, чтобы разомкнутый объект с запаздыванием при сокращении числа обратных связей по состоянию имел наименьшее время уста- новления для начальных значений х(О'), соответствующее процессу с конечным временем установления z —0. Если же не сокращать число обратных связей, полюса zt из уравнения (9.2-17) могут быть не равны нулю. Поскольку переменные состояния для запаздыва- ния, введенные в модель объекта (3.6-41), в общем случае не могут быть измерены непосредственно, их следует восстанавливать или оценивать. Теперь возникает вопрос, имеют ли регуляторы состоя- ния с наблюдателями (разд. 8.6, 8.7) или с устройствами оценки (разд. 22.3, 15.2 и 15.3) преимущества перед регуляторами вход/ выход, рассмотренными выше. Ответ на этот вопрос, основанный на результатах моделирования, дается в следующих разделах. 9.3. СРАВНЕНИЕ КАЧЕСТВА ПРОЦЕССОВ УПРАВЛЕНИЯ И ЧУВСТВИТЕЛЬНОСТИ РАЗЛИЧНЫХ РЕГУЛЯТОРОВ ДЛЯ ПРОЦЕССОВ С ЗАПАЗДЫВАНИЕМ Для сравнения качества управления и чувствительности к не- точному заданию времени запаздывания различных алгоритмов управления и регуляторов для объектов с большим запаздыванием было проведено моделирование процессов регулирования на ЭВМ с помощью пакета программ CADCA, описанного в гл. 29 [30.1]. При моделировании использовались два типа объектов: объект с чистым запаздыванием Gp(z-i)-iS = z-’ при d=10 (9.3-1) и низкочастотный объект III (см. уравнение (5.4-4) и Приложе- ние) с запаздыванием d = 10 GP (Z-Ч = ТГ~‘У (9.3-2) v ' u (z) l-j-aiz х-{-а3г 2-f-a3z 3 v ' Соответствующие переходные процессы при единичном ступенчатом воздействии в момент времени к=0 изображены на рис. 9.3.1 и 9.3.2. Значения среднеквадратической ошибки управления Г~ м 8. = У мТгЕМЮ (9.3-3) к=0 и среднеквадратического отклонения управляющей переменной Su=l/ мТгХ [ч(М —и(°°)]2 (9.3-4) к=0
Гл. 9. Регуляторы для объектов с большим запаздыванием 191 л-1. 1 I I I I I I 20 40 60 80 к ЗПР-З pl I J--I I I I 1 I 20 40 60 80 1,0 - -.......... О - 1.0 ! 0- _J__l_l__I_I—J__l_ 20 40 60 80 к AP(P+1) _l___I.l I__l—J___L_ 20 40 60 80 к 1,0 ts Q Ц-I I..I.l I.. 20 40 , 60 80 к Рис. 9.3.1. Изменение регулируе- мой у (к) и управляющей и (к) пе- ременных для объекта с чистым за- паздыванием Gp(z)=z-d при d= 10 и ступенчатом изменении устано- вившегося состояния. приведены на рис. 9.3.3 для М=100 и различных значений запаздывания 6е, принятых при синтезе: точное соответствие dE = d= 10; ошибка в меньшую сторону — 6е = 8 и dE = 9; ошибка в большую сторону — dE = 11 и dE = 12. В таблицу 9.3.1 сведены
192 Ч. II. Системы управления с детерминированными возмущениями 1,0- ------- / — • П ,..1—1 1. J_ I .1—I 20 40 , 60. 80 к 3,0 ЗПР-З 2,0 Да. U..I . । .1_1 i_i । 20 40 , 60. 80 к ЗПР-2 л1-....1 U.I.IJ—I LJ I 20 40 60 80 к л L.L—I—I I J-Л 1—JL_L 20 40. 60 80 к AP(Pi-l) д1 1—I. I I -I, 20 40 60 80 к 2,0 - Ьз ----------------------- п ..1.1 I I 1—I _L 20 40 , 60 80 к Рис. 9.3.2. Изменение регулируемой у (к) и управляющей и (к) переменных для объекта III с запаздыванием d= 10, Gp(z)=B (z-1)z-d/A(z-1) при ступенчатом изменении установившегося состояния.
Гл. 9. Регуляторы для объектов с большим запаздыванием 193 Неустойчивость 0,2- РПР 2ПР-1 2 ПР-2 ЗПР-2 ЗПР-З 0,1 8 3 10 11 12 0,5 Неустойчивость А 6 dE Рис. 9.3.3. Зависимость параметров управления Se и Su от величины запаздывания dg, использованного при синтезе, для: а — объекта с чистым запаздыванием z при d=10; б — объекта III в запаздыванием d=10.
194 Ч. 11. Системы управления с детерминированными возмущениями Таблица 9.3.1 Параметры регуляторов для исследуемых аффектов с большим временем запаздывания Параметры регулятора Op=z~d d=10 „ — d GP A (z-Ч z (Объект HI c d=10) ЗПР-3 (r=0) 2ПР-2 (r=0) ЗПР-3 (r=0) ЗПР-2 2ПР-2 (r=0) Чо 0,6423 0,5198 3,4742 2,0000 0,6279 Чх —0,6961 —0,4394 —6,2365 —3,3057 —0,5714 92 0,1372 0 2,8483 1,3749 0 К 0,5052 0,5198 0,6258 0,6251 0,6280 CD 0,2725 0 4,5515 2,1993 0 С1 0,1651 0,1547 0,1373 0,1106 0,0921 AP (v+ 1) AP (v) AP (v+ 1) AP (v) РПР Чо 1,25 1 3,8810 9,5238 1 41 -0,25 0 -0,1747 —14,2762 —1,4990 42 0 0 —5,7265 6,7048 0,7040 9з 0 0 3,5845 0,9524 —0,1000 44 0 0 =—0,5643 0 0 Ро 1 1 1 1 1,0000 Pi 0 0 0 0 —1,4990 Р2 0 0 0 0 0,7040 Рз 0 0 0 0 —0,1000 Р4 0 0 0 0 0 Pd 0 —1,25 0 0 0 Pd + 1 0 0 —0,2523 -0,6190 0,0650 Pd + 2 0 0 —0,5531 —0,4571 0,0480 Pd + s 0 0 —0,2398 0,0762 —0,0451 Pd+4 0 0 0,0451 0 — PC (r = = 1) *’ PC (i=l) - kj 0 0,0680 k2 0 0,0473 ^3 0 0,0327 k4 0 0,0807 k5 0 0,0691
Гл. 9. Регуляторы для объектов с большим запаздыванием 195 П родол жение Параметры регулятора Gp=z-d d = 1 0 r -B (z~‘>7— d P A (z-1) (Объект III c d = 1 0) ЗПР-З (r=0) 2ПР-2 (r = 0) ЗПР-З (r=0) ЗПР-2 2ПР-2 (r = 0) PC (r= = 1) *> PC (r= =1) *> к 6 0 0,0551 к7 0 0,0420 kg 0 0,0311 ^9 0 0,0226 *) kfo 0 0,0161 гь=^5; kff l.o 0,0114 Qb из при- ki2 0,0080 мера 8.7.1 kig 0,0056 kii 1,0 значения параметров регуляторов для dE = d=10. Анализ полу- ченных результатов позволяет сделать следующие выводы. • Объекты с чистым запаздыванием Для объектов с чистым запаздыванием ПИ-регулятор 2ПР-2, относящийся к классу регуляторов с параметрически оптимизи- руемыми алгоритмами управления, обладает несколько лучшим качеством управления по сравнению с ПИД-регулятором ЗПР-З, поскольку характеризуется меньшей колебательностью регулируе- мой и управляющей переменных. Коэффициент передачи в обоих случаях равен приблизительно 0,5. Введение весового коэффици- ента г>0 при управляющей переменной оказывает незначительное влияние на качество регулирования. Чувствительность этих пара- метрически оптимизируемых регуляторов к неточному заданию величины запаздывания оказывается меньшей, чем для любых других регуляторов. Наилучшее возможное качество переходного процесса по регулируемой переменной достигается в системе с апериодическим регулятором AP(v) или с идентичным ему регуля- тором-предиктором РПР. Модифицированный апериодический ре- гулятор AP(v-H) позволяет достичь нового установившегося со- стояния на такт позже. Однако и апериодический регулятор, и регулятор-предиктор не рекомендуется использовать в том случае, когда запаздывание в объекте известно не точно, поскольку при отличии реального и принятого при синтезе запаздывания система становится неустойчивой. Хорошее качество управления обеспе- чивает регулятор состояния с наблюдателем. Здесь и(0)=0, по- скольку при оптимизации квадратичного критерия качества (8.1-2)
196 Ч. II. Системы управления с детерминированными возмущениями обратная связь по состоянию kd равна нулю, а также все коэффи- циенты обратных связей kt=0 для 1 = 1, . . d—1. Только коэф- фициент kd+i, соответствующий обратной связи по переменной состояния y(k)=xd+1(k) в наблюдателе расширенного порядка, равен 1 (см. рис. 8.7.2, 8.7.3 и пример 8.7.1). Качество управления для этого регулятора не зависит от значения весового коэффи- циента г при управляющей переменной. Однако чувствительность регулятора состояния к неточному заданию времени запаздывания для |Ad|=|dE—d|=l оказывается большей, чем для параметри- чески оптимизируемых регуляторов. При |Ad|>l возникает не- устойчивость. Следовательно, для управления объектами с чистым запаздыванием, которое известно достаточно точно (|Ad|<l), можно рекомендовать регуляторы состояния с модифицированным наблюдателем. Если же запаздывание известно не точно или оно изменяется во времени (|Ad|>1), то предпочтение следует отдавать параметрически оптимизируемым ПИ-регуляторам. • Низкочастотный объект III с большим запаздыванием Применение регуляторов, реализующих синтезированные для г=0 параметрически оптимизируемые ПИ-алгоритмы управления (2ПР-2, 2ПР-1), приводит к существенным колебаниям регулируе- мой и управляющей переменных. Переходный процесс по регули- руемой переменной быстрее устанавливается для ПИД-регулятора ЗПР-З, однако для этого требуются большие значения отклонений управляющей переменной. Регулятор ЗПР-2 с q0=2 обеспечивает наилучшее среди параметрически оптимизируемых регуляторов качество управления с хорошим • демпфированием регулируемой и управляющей переменных. Он также характеризуется меньшей из всех параметрически оптимизируемых регуляторов чувствитель- ностью к неточному заданию запаздывания. Регулируемая переменная в системе с апериодическим регулято- ром достигает нового установившегося состояния быстрее, чем при использовании любых других регуляторов. Однако требуемые для этого значения сигналов управляющей переменной получа- ются слишком большими для регулятора АР (v) и достаточно боль- шими даже для регулятора AP(v+l). Кроме того, чувствитель- ность апериодических регуляторов к неточному заданию запазды- вания оказывается наибольшей из всех регуляторов. Как следует из результатов моделирования, ошибка AdE=±l еще допустима, особенно для регулятора AP(v+l). Большие же ошибки, к сожа- лению, ведут к неприемлемому качеству управления. Регулятор-предиктор является моделью самого объекта управ- ления, и поэтому управляющая переменная сразу же достигает своего установившегося значения. Регулятор состояния с наблю- дателем, синтезированный для г=1, обеспечивает гораздо лучшее качество переходного процесса по регулируемой переменной по сравнению с регулятором-предиктором. Начальное значение управ-
Гл. 9. Регуляторы для объектов с большим запаздыванием 197 ляющей переменной и(0) достаточно мало, что обусловлено малой величиной коэффициента к3 обратной связи по состоянию, как это видно из табл. 9.3.1 и рис. 8.7.5. Управляющая переменная дости- гает своего максимального значения при к=1 и затем плавно схо- дится к новому установившемуся значению. Регулятор-предиктор и регулятор состояния с наблюдателем характеризуются малой чувствительностью к неточности задания времени запаздывания. Таким образом, лучшее качество управления для низкочастот- ного объекта с большим запаздыванием обеспечивается регуля- тором состояния, регулятором-предиктором и параметрически оптимизируемым регулятором ЗПР-2 (или ЗПР-З с г«1). Регулятор- предиктор характеризуется наименьшими, регулятор ЗПР-2 — наи- большими, а регулятор состояния — средними значениями откло- нений управляющей переменной. Из сравнения качества управления следует, что переходный процесс в разомкнутой системе при ступенчатом изменении уста- новившегося состояния может существенно отличаться от переход- ного процесса самого объекта управления, если очень большие изменения, входной переменной должны быть исключены. При больших отклонениях управляющей переменной, что характерно для апериодических регуляторов, можно достичь меньшего времени регулирования. Однако это ведет к увеличению чувствительности системы к величине запаздывания. Поэтому в общем случае приме- нять апериодические регуляторы для объектов с большим запаз- дыванием не рекомендуется. Так как регуляторы-предикторы можно использовать только для асимптотически устойчивых объектов, при управлении низкоча- стотными объектами с большим запаздыванием рекомендуется при- менять регуляторы состояния с наблюдателями и параметрически оптимизируемые ПИ- и ПИД-регуляторы.
ГЛАВА 10 Управление нестационарными объектами с помощью регуляторов с постоянными параметрами В рассмотренных ранее методах синтеза предполагалось, что модель объ- екта известна точно. Однако на практике такого не бывает. Как при теорети- ческом моделировании, так и при экспериментальной идентификации необхо- димо всегда учитывать наличие малых, а часто и больших отличий в поведении определяемой модели системы и реального объекта. Если считать, например, что структура и порядок модели объекта заданы точно, то упомянутые отличия можно считать следствием ошибок в параметрах. Более того, в процессе нормальной эксплуатации часто возникают изменения в поведении объектов управления, обусловленные, например, смещением рабочей точки (нагрузки), а также изменениями энергии, массы или моментов. Поэтому при проектиро- вании регуляторов необходимо исходить из того, что • принятая модель объекта не точна, • характеристики объекта изменяются в процессе его функционирования. В этой главе будет кратко рассмотрено влияние изменений характеристик объекта на поведение замкнутой системы. Под изменением характеристик будем подразумевать как несоответствие модели объекту, так и изменение его параметров. Ниже при синтезе регуляторов изменения параметров будут оце- ниваться по отношению к номинальному вектору параметров 0П. Представ- ляет интерес исследование зависимости' характеристик замкнутой системы для небольших отклонений вектора параметров от номинального значения при использовании регулятора с постоянными параметрами. В дальнейшем предполагается, что порядок модели объекта не должен изменяться, а скорость изменения параметров существенно меньше скорости протекания переходных процессов в замкнутой системе. Последнее предположение позволяет считать, что объект является квазистационарным. При малых вариациях параметров объекта синтез регуляторов можно проводить с использованием методов теории чувствительности ([10.1] — [10.7]). Если известна чувствительность системы по отношению к изменению парамет- ров объекта, то при синтезе можно обеспечить требования хорошего качества процессов регулирования и малой чувствительности замкнутой системы к из- менениям параметров объекта управления. Такой подход будет рассмотрен в разд. 10.1. Однако при больших изменениях параметров указанные методы теории чувствительности для синтеза непригодны. В этих случаях проекти- руют регуляторы с постоянными параметрами, оптимальные относительно усредненных моделей объектов с различными векторами параметров. Такой подход является более общим по сравнению с методами, основанными на оценке чувствительности. В связи с тем что при этом подразумеваются большие изменения параметров, один и тот же регулятор рассчитывается для управления объектом в его двух или более рабочих точках, а не только для одной рабочей точки, как в случае синтеза с применением методов теории чувствительности, обеспечивающего малую чувствительность системы к (малым) изменениям параметров объекта. Однако этот вопрос будет рас- смотрен в разд. 10.2 очень кратко. Такая задача была впервые поставлена в работе [8.8] для непрерывных регуляторов.
Гл. 10. Управление нестационарными объектами 199 10.1. ЧУВСТВИТЕЛЬНОСТЬ СИСТЕМ С ОБРАТНОЙ СВЯЗЬЮ В отличие от систем управления с прямой связью системы уп- равления с обратной связью позволяют не только уменьшить влия- ние внешних возмущений на выходную переменную, но и снизить влияние изменения параметров объекта на качество управления по регулируемой координате. Для иллюстрации этого хорошо из- вестного свойства [10.1] рассмотрим регулятор с прямой связью и регулятор с обратной связью, изображенные на рис. 6.1 и 6.2 соответственно. Далее будем использовать следующие обозначе- ния: GP(z) — передаточная функция объекта управления, GR(z) — передаточная функция регулятора с обратной связью, Gs (z) — пере- даточная функция регулятора с прямой связью. Обе системы син- тезированы для номинального вектора параметров объекта 0П, так что при одном и том же сигнале управления w(k) выходные сигналы у (к) в обеих системах будут идентичны. Предположим, что объект Gp(z) является асимптотически устойчивым, в резуль- тате чего после затухания свободных движений в системах перед подачей сигнала управления оба объекта находятся в одинаковом установившемся достоянии. Передаточная функция замкнутой системы с обратной связью в номинальной рабочей точке опреде- ляется соотношением Gw (0n, z) = . 9* (z),z) . . (10.1-1) W\ П’ / w(z) 1-|-Gr (z) Gp (0n, z) ' ’ Передаточная функция регулятора с прямой связью, обеспечиваю- щего то же, что и в случае регулятора с обратной связью, по- ведение системы относительно переменных вход/выход, равна G (0n, z) = а- в?&— (10.1-2) n w (z) 1-|-Gr (z) Gp (0n, z) v ’ Предположим теперь, что параметры объекта изменились на бесконечно малую величину d0. Дифференцируя передаточную функцию для системы с обратной связью по вектору параметров объекта, получим dGy (0П1 z) I_______Gr (z)______5Gp (Од, z) „ 50 Ir — [14-Gr (z) Gp (0n> z)]a 50 • Аналогично поступим и для системы с прямой связью! 5GW (0д, z) I _ r v 5Gp (0n, z)________Gr (z)______5Gp(0n, z) 50 |s-'usl°n> ae “ 1-|-GR (z) Gp (0n, z) 50 (10.1-4) Учитывая, что для обеих систем = (10.1-5)
200 Ч. И. Системы управления с детерминированными возмущениями получим следующее соотношение: Ml = R(0 Z)MI (10.1-6) 30 |r v п» / 30 |s’ \ / где R (0n, z) = . , F ,а—г . (10.1-7) 4 n 14-Gr (z)Gp(0n, z) v ’ Коэффициент R (0n, z) называется динамическим показателем уп- равления. Частная производная ду/дО определяет параметрическую чувствительность выходной переменной у. Как видно из урав- нения (10.1-6), относительная чувствительность к изменению пара- метров объекта для обеих рассматриваемых структур систем уп- равления зависит от частоты со сигнала задающей переменной w(k). Если |R(z)|<l, то система с обратной связью оказывается менее чувствительной к изменению параметров объекта, чем система с прямой7 связью, однако при |R(z)|>l справедливо обратное. Тем не менее в общем случае системы с обратной связью рассчитываются так, что в существенном диапазоне частот (О^со^сотах) для полу- чения хорошего качества управления величина |R(z)| должна быть меньше единицы. Поэтому в большинстве случаев парамет- рическая чувствительность систем с обратной связью оказывается меньшей, чем чувствительность систем с прямой связью. Парамет- рическая чувствительность возрастает с увеличением частоты задающего сигнала и, следовательно, принимает минимальное значение при ю=0, т. е. в установившемся состоянии. Коэффициент чувствительности рассмотренных систем к изме- нению параметров объекта и коэффициент влияния возмущения n(k) на выходную переменную у (к) описывается одним и тем же уравнением: У-Ф1 =R (Z) . (10.1-8) n (z) [R ' ’ П (z) |s V ' Из уравнений (10.1-3) и (10.1-1) следует, что для систем с об- ратной связью выполняется соотношение = S (0n, z) ~ (9п’ ,z) , (10.1-9) где функция чувствительности S (0n, z) описывается передаточной функцией S(0n, z) = R(0n, z) = ; , p , * —r. (10.1-10) 14-Gr (z) Gp(0n, z) ' ’ Эта функция чувствительности показывает, как относительное изменение поведения замкнутой системы по входу/выходу зависит от изменения передаточной функции объекта. Поскольку эта функ- ция совпадает с коэффициентом параметрической чувствительности
Гл. 10. Управление нестационарными объектами 201 рассмотренных систем, замечания, сделанные ранее, могут быть 1акже отнесены и к функции чувствительности. Функцию чувствительности можно также использовать в случае непараметрических моделей. Меньшей чувствительности поведения замкнутой системы к изменению параметров можно добиться, выбирая малую величину динамического показателя управления | Rn (6П, z) | в существенном диапазоне частот О^сой^а)тах для внешних возбуждающих сигналов n (z) или yw (z) = GR (z)GP(z)w(z). Заметим, что параметрическая чувствительность выходной пере- менной и функция чувствительности после их обратного преобра- зования во временную область соответствуют временным функциям dy (k)/dO или s(k). Для объектов, представленных в пространстве состояний урав- нением х (к 4- 1) = Ах (к) 4-bup (к) -f- buw (к), (10.1-11) с регуляторами состояния вида uR (к) = — ктх (к) (10.1-12) и соответствующей передаточной функцией замкнутой системы Gr (z) Gp (z) =^- = kT[2l -A]-' b (10.1 -13) up (4; динамический показатель управления, теперь определяемый как R' (z) = uP(z)/uw (z) при up = uR, будет равен R4z) = -^# = -, ,-ITf J- лГ-7г-. (10.1-14) 4 ' uw (z) l-(-kT[zI — A] xb v ' В работе [10.8] на стр. 132 было показано, что уравнение (10.1-6) при подстановке R'(z) вместо R (z) определяет парамет- рическую чувствительность выходной переменной y(k)=cTx(k) разомкнутой системы с регулятором состояния. Оптимальные регу- ляторы состояния для непрерывных сигналов всегда характеризо- вались меньшей по сравнению с регуляторами с прямой связью параметрической чувствительностью во всем диапазоне частот ([10.2]; [8.4], стр. 314; [10.8], стр. 126). Регуляторы состояния с наблюдателями и дискретные регуляторы состояния этому пра- вилу не подчиняются ([8.4], стр. 419, 520). Функция чувствительности S (0n, z) из уравнения (10.1-10) служит для описания влияния относительных изменений параметров передаточной функции объекта. Абсолютные значения изменений поведения замкнутой системы при изменении параметров можно получить из уравнения (10.1-9) и соотношения Gw = RGrGp: I AGw (0„, z) | = | R (0., z) |’| Gr (z) 11 AGp (0n, z) |. (10.1-15)
202 Ч. II. Системы управления с детерминированными возмущениями Как видно из последнего выражения, изменения параметров объекта | AGP | связаны с изменениями в замкнутой системе | AGW | коэффициентом |R|2|Gr|. Соответствующее соотношение для сигналов |y(z)| = |R(z)||n(z)| (10.1-16) может быть использовано для оценки качества процессов управ- ления. Изменения | AGW | связаны с | у (z) | линейно: | Ду (в„, z) | = | AGW (0„, z) 11 w (z) |. (10.1-17) Умножение | AGP | на коэффициент |R|2|Gr| означает, что из- менения параметров объекта |AGP| оказывают существенное влия- ние на характеристики системы в частотных диапазонах II и III для динамического показателя управления, как показано на рис. 11.4.1. В области очень малых частот для регуляторов интегри- рующего типа справедливо соотношение |R|2|Gr|»|R|. В этом слу- чае влияние оказывается таким же, что и для показателя качества управления (10.1-16). Нечувствительности системы к изменениям параметров объекта можно добиться, уменьшая величину |R(z)|, насколько это возможно, особенно в высокочастотном диапазоне I, а также в диапазонах II и III, если спектр возмущений лежит в этой области. Из рис. 11.4.2 и табл. 11.4.2 следует, что в системах управления с обратной связью, нечувствительных к низкочастотным возмуще- ниям, весовой коэффициент г при управляющей переменной должен быть большим, т. е. реализуется «жесткое» управление. Однако, если компоненты сигнала возмущения и (к) близки к резонансной частоте, необходимо уменьшать резонансный пик и поэтому умень- шать г, т. е. реализовать более «мягкое» управление. Из сказанного следует, что при синтезе нечувствительных систем управления необходимо учитывать спектр сигнала возмущения. Если рассмат- ривать величину | R (z) |2, то из рис. 11.4.2 и рис. 11.4.3 видно, что высокой чувствительностью к изменениям параметров объекта обладают следующие регуляторы: в диапазоне I — 2ПР-2; в диа- пазоне II — 2ПР-2, АР (г) и PC. Малой чувствительностью в диа- пазоне I обладает регулятор PC, а в диапазоне II — AP(v + l). Заметим, однако, что параметрически оптимизируемые и аперио- дические регуляторы были синтезированы для ступенчатого изме- нения установившегося состояния, т. е. для малых возбуждающих воздействий в диапазонах II и III. Для ступенчатого изменения задающего сигнала w(k) эти результаты в основном согласуются с результатами исследования чувствительности в разд. 11.3, в. До сих пор мы рассматривали только некоторые коэффициенты чувствительности. Кроме них существуют следующие меры оценки чувствительности относительно заданного номинального вектора
Г л. 10. Управление нестационарными объектами 203 параметров 0П: Чувствительность переменных состояния _д* । (траекторий) х дО ’ ' 7 Чувствительность критерия качества <tj =^» (10.1-19) Чувствительность собственных значений <тЛ = ^1. (10.1-20) Чувствительность выходных переменных определяется из чувстви- тельности переменных состояния о (10.1-21) Чувствительность к изменению параметров можно учитывать при синтезе регуляторов, формируя положительно полуопределен- ную функцию f (о) 0 в номинальном состоянии и вводя ее в критерий качества 1а= 1П+ f (<*), (10.1-22) который должен быть минимизирован. При использовании пара- метрической чувствительности критерия качества управления {(а)=хт<л = хг , (10.1-23) где элементы вектора хт являются весовыми коэффициентами, вместо 1п следует оптимизировать по отношению к неизвестным параметрам регулятора критерий вида 1»=1п + ’‘т^Г- (10.1-24) Если необходимо синтезировать нечувствительную систему управления с обратной связью для изменяющихся параметров объ- екта, таких, как изменение нагрузки, мощности или производи- тельности ДМ, то нужно вычислить производную <Э0/дМ для 0 = f (М) и оптимизировать критерий (10.1-25) В результате получим зависимости, аналогичные изображенным на рис. 10.1, где показана зависимость только от коэффициента пе- редачи К. Из рис. 10.1, а видно: • минимуму 1п соответствует 1х для Кх; • минимуму 10 соответствует 12 для К2; • К2 < Кх; • менее чувствительное управление характеризуется худшим ка- чеством: 12>11.
204 Ч, П. Системы управления с детерминированными возмущениями Из рис. 10.1, б следует, что ф синтез без учета чувствительности обеспечивает лучшее каче- ство управления для Mk < М < Mg; • синтез с учетом чувствительности обеспечивает лучшее качество управления только вне диапазона Mk < М < Mg. Приведенный пример показывает, что синтез системы, нечувст- вительной к изменениям параметров объекта, нужно выполнять а — зависимость показателя качества управления 1 от коэффициента передачи регулятора К в номинальном режиме Мп; б — зависимость показателя качества управления I от изменения режима М. лишь в том случае, когда чувствительность dIn/dM управления с обратной связью высока и, следовательно, область Мк—Mg отно- сительно мала. Для оптимизации критерия 1ст в общем случае сле- дует использовать численные методы параметрической оптимиза- ции. Каждый из учитываемых параметров объекта и каждый шаг оптимизации требуют решения разностного уравнения. Поэтому вычислительные затраты оказываются достаточно большими даже для объектов низкого порядка. 10.2. УПРАВЛЕНИЕ ОБЪЕКТАМИ С БОЛЬШИМИ ИЗМЕНЕНИЯМИ ПАРАМЕТРОВ Применение методов теории чувствительности требует, чтобы чувствительность в заданном интервале изменения параметров изменялась незначительно. Следовательно, в этом случае можно учесть только влияние относительно малых изменений параметров объекта. Часто возникает задача синтеза регуляторов с постоянны- ми коэффициентами для объектов с большими изменениями пара- метров, и как показывает практика, это оказывается возможным. Задача управления с обратной связью объектами с большими, но
Г л. 10. Управление нестационарными объектами 205 медленными изменениями параметров с помощью регуляторов с по- стоянными параметрами была исследована в работе [8.8]. Там весь диапазон изменения параметров разбивался на ряд отрезков, для каждого из которых записывалась отдельная модель объекта. Так, для М отрезков будет получено М моделей объекта: х. (k + 1) = (к) -|- Вгц (к), yi(k) = Cixi(k). 1=1, 2, .... М. (10.2-1) Для этих М различных объектов должен быть спроектирован один регулятор состояния с постоянными параметрами u(k) = —К-хДк), (10.2-2) который является усредненно оптимальным. В этом случае можно использовать глобальный критерий качества _ м 8^, 0<8i<l, i=i м Sei = l. (10.2-3) i = i Здесь li—локальный квадратичный критерий качества, описывае- мый выражением 1,= 2[хт (к) Q.x, (к) + < (к) R1U1 (к)], (10 2-4) к= 0 а 8| — весовые коэффициенты критерия для различных рабочих то- чек или моделей объекта (10.2-1). Для непрерывных систем было доказано, что существуют регуляторы К, обеспечивающие устой- чивое поведение замкнутой системы во всех N рабочих точках. На наглядном примере объекта с матрицами параметров А, В и С был рассчитан регулятор с постоянными параметрами, который был усредненно оптимальным по отношению к критерию (10.2-3). Для этого было необходимо решить М матричных уравнений Рик- кати. В последнее время рассмотренная задача решается с помощью так называемых «робастных» регуляторов.
ГЛАВА 11 Сравнительный анализ регуляторов для детерминированных возмущений В конце части II книги исследуются сравнительные характеристики раз- личных методов синтеза и соответствующих регуляторов или алгоритмов управления для линейных объектов с запаздыванием и без него. В разд. 11.1 сравниваются структуры регуляторов, и в частности нули и полюса замкнутых систем. Затем рассмотрены количественные оценки качества процессов управ- ления двумя тестовыми объектами с различными регуляторами (разд. 11.2 и 11.3). Динамические показатели управления для различных регуляторов срав- ниваются в разд. 11.4. Наконец, в разд. 11.5 содержатся рекомендации по применению различных алгоритмов управления. И.1. СРАВНЕНИЕ СТРУКТУР РЕГУЛЯТОРОВ: ПОЛЮСА И НУЛИ Обобщенный линейный регулятор с передаточной функцией G„ (z)="~a= q;+q,Z-;+...+4vZ-> (1111) e(z) P(z-!) l + pjZ-i-H-.+Pp.z ц ’ и некоторые параметрически оптимизируемые регуляторы низкого порядка, компенсационные, апериодические и регуляторы-предик- торы могут быть отнесены к классу регуляторов входа)выхода в про- тивоположность регуляторам состояния. С учетом передаточных функций объекта управления GP(z) = = z~d = z~d (H I-2) ' ’ u (z) A (z-1) 14-a1z1-|-...-|-amz m ’ и регулятора (11.1-1) можно определить передаточную функцию замкнутой системы по задающему входному сигналу гт /7\ — У (z> _ gR (2) Gp (z)_______Q(z-i)B (z-Qz-d_________ w — w (z) j Gr (z)Gp (z) — p (z-l) A (Z-1)_|_Q (Z-1) В (z-1) z-d (11.1-3) и следующие передаточные функции замкнутой системы (см рис. 5.2.1): Гт /7 1 - У(2) _ 1___________________P(Z-4 A(Z-l)_________ n w П (z)“1H-Gr (z) Gp (z)~P(z-1) A (z-^+Q (z-1) В (z-^z-d’ (11.1-4) G M — y (z)_________Gp (z)______________P (z"1) В (z-1) z-d__ u W “ uv(z) ~ 14-Gr (z) Gp (z) ~ P (z-X) A (z-i)+Q (z-1) В (z-1) z-d ' (11.1-5)
Гл. 11. Сравнительный анализ регуляторов 207 В общем виде эти передаточные функции могут быть записаны в следующей форме: G*(z) = = [Po+P^-i+.-.+PrZ-rL * Л (z т) 14-a1z-1-(-... + azz-/ ’ ' ’ где символ # соответствует w, и или и. Порядок передаточной функции I определяется соотношением 1 = max[m4-p,; m + d-j-v]. (11.1-7) Рассмотрим теперь порядки v и ц различных регуляторов и распределение полюсов и нулей введенных выше передаточных функций замкнутых систем. Для этого представим полиномы чис- лителя и знаменателя G^(z) в виде суммы положительных степе- ней z°, z1, z2.....Записав передаточную функцию регулятора GR(z)=Sfi (11.1-8) и объекта управления [см. уравнение (6-9)] g»(z)=tvvt-. (Ч>-9) Аь (z) za получим обобщенную передаточную функцию Gt(z) = &§>, (11.1-10) характеристическое уравнение которой для замкнутой системы будет равно Л(г) = Р(г) Ао (z) zd + Q (z) B0(z) = (z — za])(z—za2). . .(z—zaZ)=0. (11.1-11) Здесь zai—полюса замкнутой системы. Нули передаточных функ- ций G$(z) определяются из полиномов числителя ^(z)=(z — Z₽1)(Z — Z₽2). . .(Z—Zps)=O, которые для различных входных сигналов имеют вид ^w(z) = Q(z) Bo(z) = O, (Z) = р (Z) Ао (z) zd = 0, •®n (z) = P (z) Bo (z) =0. (11.1-12) (11.1-13) приложения Как видно из (11.1-13), нули системы зависят от точки входных воздействий. В следующем разделе рассмотрено наличие и распределение полюсов и нулей различных замкнутых систем и регуляторов. Это же сделано и для регуляторов состояния. Поскольку обобщенные линейные регуляторы допускают большую свободу в задании полю- сов, по крайней мере по сравнению с другими регуляторами входа/ /выхода, описанными здесь, они рассмотрены первыми.
208 Ч. 11. Системы управления с детерминированными возмущениями 11.1.1. Обобщенные линейные регуляторы с заданным расположением полюсов Если полюса zai знаменателя передаточной функции замкнутой системы Л (z) = (z—zai) (z —za2).. .(z — zaZ) = 0 (11.1-14) или соответствующего характеристического уравнения Л (z~') = 1 4-a1z"1+ • • 4-azz-z = 0 (11.1-15) заданы, то параметры регулятора можно определить, приравнивая коэффициенты при соответствующих степенях z-i в уравнении Л(г“1) = (1 . 4-puz-^)(l+a1z-1+ ... 4-amz~m)4- + (Чо + 41Z-1 4- . •. +qvz-v)(1z-1+ ... 4- bmz-m)z-d = 0 (11.1-16) и в уравнении (11.1-15). Для устранения статических ошибок сле- дует выбирать значение Gw(l) равным единице. Из уравне- ния (11.1-3) следует, что Р(1)А(1) = 0, и это условие справед- ливо, если и 2й = -1. (11.1-17) 1 = 1 Для определения (p-f- v-f-1) параметров регулятора есть (/4-1) уравнений. Следовательно, для их однозначного определения необходимо, чтобы выполнялось условие p4-v4-l = / + l. (11.1-18) При рассмотрении уравнения (11.1-7) можно выделить два случая: а) р v 4- d —> I = in 4- р. Из уравнения (11.1-18) следует, что v = m. Следовательно, рЗД- m4- d. б) ps^v4-d—>-1 = m4-d4~v. Из уравнения (11.1-18) следует, что p = m 4-d. Следовательно, v^m. Если выбрать наименьшие возможные порядки числителя и знаменателя передаточной функции регулятора v==m и p=in4-d, (11.1-19) то во всех случаях параметры регулятора могут быть определены единственным образом. На основании уравнений (11.1-16) и (11.1-17)
Гл. 11. Сравнительный анализ регуляторов 209 составим систему уравнений R-0R=a следующего вида: Г I аг 1 0 0 .. 0 01 .. 0 " ~Р1 ' «1 —aj ’ ах 1 0 6 6J .. 6 • ’о Ьг0 . bi .. 0 0 • ' . 1 -Эт Ьщ / 0 bi Pm + d Чо 41 я я в в * 1 со 5 6 6 • ' • 6 •• bm a2m+d 1 1 ... 1 0 .. 0 Qm — 1 L m + d тн 1 I— L J (11.1-20) откуда неизвестные параметры вычисляются с помощью уравнения Or = R-1a, (11.1-21) если det R =#0. Как уже было отмечено в гл. 4, здесь существует больше возможностей для задания полюсов, расположенных в области устойчивости. Поэтому даже метод проб и ошибок позволяет получить приемлемое качество переходных процессов по регули- руемой и управляющей переменным. Заметим, что при заданном характеристическом уравнении или заданных полюсах нули поли- номов числителя ^$(z) = 0 передаточных функций (11.1-3) — (11.1-5) также оказываются заданными, если система уравнений (11.1-20) единственна, т. е. выполняется условие (11.1-18). Если же v > т, то нули передаточной функции Gw(z), а если ji>m+d, то нули передаточных функций Gn(z) и Gu(z) будут зависеть от заданных полюсов. При v = m и p = m4-d в передаточных функ- циях Gw(z) и Gu (z) появляются нули объекта, а среди нулей пе- редаточной функции Gn (z) будут присутствовать полюса объекта. Таким образом, параметры объекта управления определяют неко- торые нули передаточной функции замкнутой системы.
210 Ч. 11. Системы управления с детерминированными возмущениями 11.1.2. Параметрически оптимизируемые регуляторы низкого порядка При расчете параметрически оптимизируемых регуляторов низ- кого порядка, например ПИД-регулятора ЗПР-З с передаточной функцией g /74_Q(z~])__qo+qiz"1+q2z-2 ™ ------------------’ следует помнить, что в противоположность обобщенному парамет- рически оптимизируемому регулятору (11.1-1) в этом случае число полюсов составляет Z=m-i-d + 2, а число настраиваемых пара- метров равно трем. Поэтому коэффициенты характеристического уравнения для объектов порядка т>1—d оказываются зависи- мыми. Более того, нули передаточных функций Gn(z) и Gu(z) определяются свойствами объекта управления и полюсом регуля- тора z=l, как это видно из уравнения (11.1-13). Следовательно, только часть нулей Gw(z) зависит от параметров регулятора. 11.1.3. Обобщенный компенсационный регулятор В гл. 6 было показано, что характеристическое уравнение ком- пенсационного регулятора при задании желаемой передаточной функции замкнутой системы Gw(z) в соответствии с уравнением (6-4) записывается в виде Л (z) = Ао (z) zd В (z) 4- [A (z) zd Во (z) — Ао (z) zd В (z)] Gw (z) = 0. (11.1-22) Для приближенного соответствия объекта и его модели можно считать, что Gw (z) = ^w0 (z)Mw0 (z), т. e. Ao (z) zd В (z) Лда0 (z) = 0. (11.1-23) Поэтому обобщенный компенсационный регулятор может приме- няться только для объектов, нули и полюса которых расположены на плоскости z внутри окружности единичного радиуса. В частных случаях эти условия могут не выполняться, например для аперио- дических регуляторов и регуляторов-предикторов. 11.1.4. Апериодический регулятор Апериодический регулятор АР (v) описывается передаточной функцией с, -Q (2~х) _ ЯоА (z~x) uRW-p(z-i) 1 —q0B(z-i)z-d [см. уравнение (7.1-22)]. Умножая числитель и знаменатель на z(m + d)t ПОЛУЧИМ
Гл. 11. Сравнительный анализ регуляторов 211 В последней передаточной функции A (z) zd и В (z) являются по- линомами модели объекта. Соответствующее характеристическое уравнение имеет вид Л (z) = z(m+d) Ао (z) zd—q0A0 (z) zd В (z) + q0A (z) zd Bo (z) =0. (11.1-25) Если объект и его модель приближенно совпадают, т. е. A (z) zd« « Ао (z) zd и B(z)«B0(z), то из (11.1-25) получим Л (z) « z<m+d) Ао (z) zd =0. (11.1-26) Нули передаточных функций определяются из уравнений ^w(z) = qoA(z)zdBo(z)=0, ] (г) = [z,(ra+d)— quB (z)] Ao (z) zd = 0, [ (11.1-27) ®u(z) = [z<m+d’ —qoB(z)]Bo(z)=O. I Используя уравнение (11.1-26), получим передаточные функции с g0B0 (z) A (z) zd = q0B0 (z) A (z) z<m + d)Ao(z)zd z(m + d)Ao(z) ’ G — [z(m + d) —gpB (z)]Aq (z) zd = [z(m + d)_qoB _ p (Z) nV' z(m+d)A() (Z) zd z(m + d) z(m+d)’ G (z) — [z(m+d)—gpB (z)] Bo (z) _ P(z) Q HI 2g z(m+d) Ao (z) zd — z(m+d)Up I1 b 1 Если модель и объект совпадают точно, т. е. A (z) = Ао (z) и B(z) = = B0(z), то полином Ао (z) в передаточной функции Gw (z) сокра- щается, так что (И.1-29) Л (z) = 1 + Gr (z) Gp (z) - z<m+d> = 0. (11.1 -30) Таким образом, конечное время установления в системе достигается только при точном совпадении модели объекта с самим объектом. Если такое совпадение отсутствует, то помимо процесса z<m+d) возникают свободные колебания, задержанные на величину Ао (z) zd, как это следует из уравнения (11.1-26). Следовательно, апериоди- ческие регуляторы могут быть использованы только для объектов, полюса которых расположены внутри единичного круга на плоскос- ти z вблизи начала координат, т. е. для хорошо задемпфированных асимптотически устойчивых объектов. Нули передаточной функции замкнутой системы в основном определяются нулями объекта. Как видно из уравнения (11.1-25), разности АВ (z) = В (z) — Во (z) между полиномами числителей объекта и его модели влияют на вид характеристического уравнения (при A(z) = A0(z)): Л (z) =А0 (z) zd[z<m+d) — q0AB (z)] = 0. (11.1-31)
212 Ч. 11. Системы управления с детерминированными возмущениями Малые изменения AB (z) мало влияют на устойчивость системы. Следовательно, нули объекта могут располагаться вне единичной окружности на плоскости z, поскольку в случае апериодических регуляторов они не компенсируются. 11.1.6. Регулятор-предиктор Передаточная функция регулятора-предиктора задается уравне- нием (9.2-2) G /7\ Q (z ~ 9 A (z~1) R() P(z-9 KPA(z-X)-B(z-X)z-d или (11.1-32) fl (7Х_Q (z) _, __A (z) Z____ R р(г) KpA(z)zd —В (z) ’ а соответствующее характеристическое уравнение (11.1-11) этого регулятора есть Л (z) == Кр A (z) zdA0 (z) zd —Ао (z) В (z) zd + A (z) Bo (z) zd = 0. (11.1-33) Если объект управления и его модель приближенно соответствуют друг другу, то ^(z)«KPA(z)zdAo(z)zd = 0. (11.1-34) Дискретные передаточные функции по различным внешним воздей- ствиям имеют вид Gw(z) = KpA0(z)zd G ПО .[KPA(z)zg-B(z)] _ P(z) 11 KpA(z)zd KpA (z) zd ’ Gu (z) = Gn (z) Gp (г). (11.1-35) В передаточных функциях Gw (z) или Gn (z) полюса полиномов A (z) zd или Ao (z) zd всегда компенсируются соответствующими нулями. Замкнутые системы с регуляторами-предикторами устой- чивы только тогда, когда объекты являются асимптотически устой- чивыми, как это видно из уравнения (11.1-34). Следовательно, нули объекта могут лежать вне единичной окружности на плос- кости z. Нули замкнутой системы определяются нулями объекта только для задающего входного сигнала. Если полюса объекта лежат вблизи начала координат плоскости z, то небольшие значе- ния разностей АВ (z) = В (z) — Во (z) не влияют на устойчивость системы, как это следует из уравнения (11.1-33).
Гл. 11. Сравнительный анализ регуляторов 213 11.1.6. Регулятор состояния Для простой системы с управлением по состоянию с одной регулируемой и одной управляющей переменными и регулятором и (к) — — ктх (к) при отсутствии внешних возмущений можно запи- сать следующую систему уравнений: х (к-|- 1) — [А — Ькт] х (к), у(к) = стх(к). (11.1-36) Подадим на эту систему управления внешний сигнал возмущения v(k)i х (к + 1) = [А— Ькт] х (к) + fv (к). (11.1 -37) Если f — b, то возмущение приложено ко входу объекта. При со- ответствующем выборе вектора f можно подать возмущение на все переменные состояния. Передаточная функция изолированного объекта, как это следует из уравнения (3.2-50), равна GP (z) = = ст [z I — А]-гЬ = -Ь"»+. (11.1 -38) U (Z) L J am-}-...+zm A(Z) v ’ Поэтому передаточная функция замкнутой системы управления по состоянию имеет вид Gv(z) = 7^ = cT[z|—A + bkT]-‘f _ ст adj [zl —A+bkT] _ ^(z) det [zl —A-}-bkT] Л(?) ' (11.1-39) На основании уравнения (8.3-8) получим характеристическое урав- нение системы ^(z) = (am + km)+(am_14-km_1)z+ ... +zm=am+«m_1z+.. . 4-zm=0. (11.1-40) Выбирая необходимые значения kb можно получить произвольные коэффициенты для произвольных коэффициентов а^ Таким обра- зом* можно сделать устойчивыми неустойчивые объекты. Если воз- мущение приложено к входу объекта управления, т. е. f = b, то нули передаточной функции Gv (z), определяемые из выражения 53(z)=cTadj[zI — A + bkT]b, (11.1-41) остаются равными нулям объекта [см. уравнения (11.1-38) и (11.1-39)]. Это происходит потому, что коэффициенты полиномов числителя Si (z) = В (z) входят либо в вектор с, либо в вектор Ь, что зави- сит от использованной канонической формы представления в про- странстве состояний. Если же возмущение v воздействует только на одну переменную состояния, то нули передаточной функции Gv (z) также зависят от параметров регулятора состояния.
214 Ч. II. Системы управления с детерминированными возмущениями Пример. Порядок объекта, представленного в канонической форме управляе- мости, т=2. В этом случае ап . , г. ь 1 + + 11 33 (z) = [b2bi] f. L—(a24-k2) zj Отсюда следует, что при tT=bT = [0 1] (z) = biz-}-b2 = В (z), и, следовательно, при fT = [l 0] выражение для полинома числителя переда- точной функции объекта будет иметь вид 3i (z) — b2 (z)-{- [b2 (ai-j-kj) — bi (a2-|- k2)] Как видно, в последнем случае полюса закона управления влияют на величину нулей. Вопрос о полюсах систем с регуляторами состояния и наблю- дателями был рассмотрен в разд. 8.7. Использование наблюдателей приводит к появлению дополнительных нулей и полюсов в системе [см. уравнения (8.7-7), (8.7-18) и (8.7-19)]. Только в том случае, когда внешние возмущения могут быть точно измерены и непосред- ственно использованы в наблюдателе, а модель точно соответствует объекту, наблюдатель не вносит дополнительных полюсов, для которых Ае(к)=0 (см. рис. 8.7.1). Если при этом возмущение приложено к входу объекта, нули также не изменятся и поэтому ^(z)-B(z). В табл. 11.1.1 приведены наиболее важные структурные свой- ства различных регуляторов для объекта В (z-1)z-d/A(z~1). Регу- ляторы входа!выхода имеют порядки и |E^m+d, если они являются структурно оптимизированными по отношению к объекту. Порядки характеристических уравнений и, следовательно, число полюсов для разных регуляторов различны. Наименьшее число полюсов равно (m-pd) для точно настроенного апериодического ре- гулятора. Во всех случаях нули объекта являются нулями пере- даточных функций Gw(z) и Gu(z). Далее, полюса регуляторов P(z)=0 становятся нулями передаточных функций Gn(z) и Gu(z). Для линейных объектов в общем случае пригодны обобщенные ли- нейные и параметрически оптимизируемые регуляторы. Апериоди- ческие регуляторы и регуляторы-предикторы могут использоваться только для объектов, полюса которых лежат внутри окружности единичного радиуса на плоскости z, а обобщенные компенсационные регуляторы — только для объектов, полюса и нули которых рас- положены внутри единичной окружности. Для регуляторов состоя- ния без наблюдателей вектор обратных связей кт имеет порядок не меньший, чем (m-|-d). Порядок соответствующих характеристи- ческих уравнений также равен (m-|-d) и является наименьшим по сравнению с другими регуляторами входа/выхода, за исключением апериодических регуляторов. Это преимущество, однако, не реали- зуется, если необходимо использовать наблюдатель. Регуляторы состояния применимы к весьма широкому классу объектов управ- ления.
Таблица 11.1.1 Структурные характеристики различных детерминированных регуляторов Gr (z) = Q (z-1)/P (z-1). A- (z) — полюса объекта вблизи или вне единичной окружности; В- (z)— нули объекта вблизи или вне единичной окруж- ности; *'>— при точном соответствии модели и объекта Тип регулятора Обозначе- ние Порядок Нули SB* (z) Возможность возникновения неустойчи- вости регулятора хар. ур-ния (z) Gn (z) Gu(z) Q (z-1) Р (Z-l) Л (z) = 0*) A- (z) в- (z) Регуляторы вход/выход Обобщенный ли- нейный регулятор ЛР m m + d 2m-f-d QB PAzd PB Нет Нет Параметрически оптим. регулятор низкого порядка ЗПР-З (ПИД) 2 1 m-j-d-|-2 QB PAzd PB Нет Нет Обобщенный ком- пенсационный ре- гулятор КР 5а m-p 1 m-j- d-f- 1 2s2m+d QB PAzd PB Да Да Апериодический АР (v) m m-j- d m-j- d q0B P PB Да Нет Регулятор-предик- тор РПР m m-j- d m-|-d или 2 (m-j-d) в P PB Да Нет Регуляторы состояния Регулятор состоя- ния без наблюда- теля PC б. н. — — m + d — — В Нет Нет Регулятор состоя- ния с наблюдате- лем PC с. н. — — 2 (m + d) Задаются объектом, регулятором и наблю- дателем Нет Нет "л. 11. Сравнительный анализ регуляторов
216 Ч. II. Системы управления с детерминированными возмущениями 11.2. СРАВНЕНИЕ ПОКАЗАТЕЛЕЙ КАЧЕСТВА В предыдущем разделе были рассмотрены структурные особен- ности регуляторов разного типа. Здесь будет проведено сравнение показателей качества управления наиболее важных типов регуля- торов. Под качеством будем подразумевать следующее: непосредст- венно качество процессов управления и требуемые затраты на уп- равление; чувствительность к неточности задания модели объекта; вычислительные затраты на один такт квантования и на расчеты при проведении синтеза. Поскольку количественное сравнение показателей невозможно без конкретных параметров систем, будем использовать два объекта, описанных в разд. 5.4.1 и Приложении: Объект II: второй порядок, неминимально-фазовая характери- стика, То—2 с; Объект III: третий порядок с запаздыванием, характеристика низкочастотного фильтра, То-4 с. Сравниваются характеристики следующих алгоритмов управления: А. Параметрически оптимизируемые алгоритмы управления низ- кого порядка: 2ПР-2, ПИ-типа с незаданным начальным значением 'I управляющей переменной; I Г9 1О\ 2ПР-1, ПИ-типа с заданным начальным значением | ‘1У' управляющей переменной; J ЗПР-З, ПИД-типа с незаданным начальным значением ' управляющей переменной; I ~ in\ ЗПР-2, ПИД-типа с заданным начальным значением Vх управляющей переменной. Б. Алгоритмы управления с конечным временем установления (апериодические): AP(v), v-ro порядка с незаданным начальным значе- нием управляющей переменной; (7.1-21) AP(v4-l), (v-j-l)-ro порядка с заданным начальным значением управляющей переменной. (7.2-11) В. Регуляторы состояния для внешних возмущений с наблюдателями: РС-1, малый весовой коэффициент г при управ- 'j ляющей переменной; 1(8.7-9,10), РС-2, большой весовой коэффициент г при управ- | (рис.8.7.5) ляющей переменной. ) Алгоритмы управления исследуются на примере системы с од- ним входом и одним выходом, изображенной на рис. 5.2.1. Подроб- ное сравнение будет проведено по отношению к синтезу алгоритмов управления с помощью самого управляющего вычислителя [8.5].
Гл. 11. Сравнительный анализ регуляторов 217 Поскольку управляющий вычислитель часто может использоваться одновременно для решения ряда задач, следует стремиться к пре- дельному сокращению времени синтеза алгоритмов управления. Кроме того, требуемый объем оперативной памяти не должен быть слишком велик, так как в качестве управляющих вычислителей применяют малые вычислительные машины и микро-ЭВМ. Еще одним характерным параметром являются вычислительные затраты на обсчет алгоритмов управления между тактами квантования. Таким образом, не только вычислительные затраты на синтез алго- ритмов, но и объем необходимых вычислений в процессе работы систем управления следует рассматривать в тесной связи с харак- терными показателями, например, такими, как качество управле- ния, требуемые затраты на управление, заданный диапазон управ- ляющих сигналов, чувствительность к неточному заданию модели и изменениям параметров объекта. Для сравнения качества управления используются следующие показатели: среднеквадратичная ошибка управления Г -.. / j м 5. = Ге»(к) = ]/ йТг£е’<к>> М = 63; <И 2-1) к = 0 Q среднеквадратичное. изменение управляющей переменной (затраты на управление) г..... ' / ; м 5ц=Ии>(к) = у мК£Ди*<кГ (11.2-2) к = 0 значение квадратичного критерия качества (5.2-6) для г = 0,1 и г = 0,25; перерегулирование Ут = Утах (k)—W (к), (11.2-3) время установления выходной координаты к3 для | е (к) | 0,03 | w (оо) | или j е (к) | ^0,031 v (оо) |. начальное значение управляющей переменной и (0) при ступен- чатом изменении сигнала w(0); чувствительность к неточности параметров модели объекта 81=(j6y/o6g. (11.2-4) Об этой величине будет сказано в разд. 11.3. Для оценки вычислительных затрат между тактами используются следующие параметры: число операций типа сложения — Zadd; число операций типа умножения — общее число операций —= /add -f- /тиП.
218 4. 11, Системы управления с детерминированными возмущениями 11.3. СРАВНЕНИЕ КАЧЕСТВА АЛГОРИТМОВ УПРАВЛЕНИЯ Алгоритмы управления, рассматриваемые в этой главе, были синтезированы для ступенчатого изменения задающего сигнала w(k) в установившемся состоянии. Это также соответствует ступен- чатому изменению сигнала возмущения n(k) на выходе объекта. Результирующий частотный спектр при таком входном сигнале содержит более высокочастотные компоненты по сравнению с ди- Таблица 11.3.1 Параметры исследуемых алгоритмов управления Объект 11 | Объект 111 Пара- метры Алгоритм управления 2ПР-1 2ПР-2 ЗПР-2 ЗПР-З 2ПР-1 2ПР-2 ЗПР-2 ЗПР-З Чо 2,00 1,364 2,00 3,485 2,00 1,615 2,00 4,562 41 —1,886 — 1,229 —2,596 —5,433 —1,802 — 1,405 —2,400 —7,200 42 0 0 0,753 2,150 0 0 0,649 3,033 К 2,00 1,364 1,247 1,335 2,00 1,615 1,351 1,534 CD 0,0 0,604 1,610 0,0 0,0 0,480 1,977 С) 0,057 0,099 0,126 0,151 0,099 0,129 0,184 0,257 АР (v-f-1) АР (v) АР (v+ 1) АР (у) Чо 5,840 14,084 3,810 9,523 41 —0,078 —20,070 —0,001 —14,285 42 —8,851 6,985 —5 ,884 6,714 Чэ 4,089 3,647 —0,952 44 — 0,571 Р1 —0,595 —1,436 0 0 Р2 0,169 2,436 0,247 0,619 Рз 1,426 0,554 0,457 Р4 0,244 —0,076 Р5 —0,046 — РС(1) PC (2) РС(1) PC (2) kj 4,157 2,398 4,828 2,526 kg 3,441 1,983 5,029 2,445 kg 1,0 1,0 4,475 2,097 k4 — 0,532 0,263 kf; — 1,532 1,263
Гл. 11. Сравнительный анализ регуляторов 219 намикой объекта. Поведение системы исследуется также по от- ношению к ступенчатому изменению возмущения v(k) на входе объекта. Влияние весового коэффициента г рассматривается от- дельно. Значение г в квадратичном критерии качества (5.2-6) для параметрически оптимизируемых алгоритмов управления типа 2ПР-2 и ЗПР-З выбрано равным нулю, поскольку это позволяет расширить диапазон изменения управляющей переменной. Для алгоритмов управления 2ПР-1 и ЗПР-2 также принято, что весовой коэффициент г равен нулю, а первое значение управляющей пере- менной и(0) выбрано таким, что u(l)«u(0) [см. уравнение (5.2-31)]. Это позволяет получить относительно малые значения отклонений управляющей переменной. При синтезе регуляторов состояния вид весовой матрицы Q выбирался так, чтобы сформировать критерий качества вида (5.2-6). При синтезе было задано R=r, чтобы полу- чить то же начальное значение управляющей переменной и(0), что и для алгоритмов ЗПР-З и 2ПР-2, в результате чего оказывается возможным их непосредственное сравнение. На начальное значение управляющей переменной и(0) апериодического алгоритма управ- ления AP(v + l) было наложено условие u(0)=u(l) для того, чтобы минимизировать отклонения управляющей переменной. Со- ответствующие показатели всех алгоритмов сведены в табл. 11.3.1. Переходные процессы по регулируемой и управляющей пере- менным приведены на рис. 11.3.1 и 11.3.2 для трех наиболее эффек- тивных алгоритмов управления объектами II и III при ступенча- том изменении задающего сигнала в установившемся состоянии. На рис. 11.3.3 представлены графические зависимости показателей, перечисленных в разд. 11.2, для объекта II (□) и объекта III (О) при ступенчатом изменении w(k) в установившемся состоянии (ле- вая сторона) и ступенчатом изменении v(k) (правая сторона). На этих рисунках приведены различные характеристики простых ал- горитмов управления (для рассматриваемых объектов). а) Ступенчатое изменение w(k) в установившемся состоянии При ступенчатом изменении задающего сигнала в установившем- ся состоянии (т. е. для того случая, по отношению к которому вы- полнялся синтез) наиболее важные выводы приведены ниже. Объект III (низкочастотный фильтр) ЗПР-З (ПИД-типа) ' Выбор г=0 приводит к большому значению и(0) и к большим колебаниям переходного процесса. Значение среднеквадратичной ошибки управления Se относительно велико. Перерегулирование ут и время установления к3 имеют среднее значение. ЗПР-2 (ПИД-типа, с заданным начальным значением управляю- щей переменной)
220- Ч. 11. Системы управления с детерминированными возмущениями Объект Ц 1^0 -— Q --------1------1----- Ю . 20 к 5,0- PC (2) ы Рис. 11.3.1. Переходные процессы по регулируемой и управляющей переменным в системах с различными алгоритмами управления и объектом II с неминимально- фазовой характеристикой.
Гл. И. Сравнительный анализ регуляторов 221 Объект Ш 1,0 зпр-2 5,0- и 10,0 АР(М) 5,0- ts 1,0 - -л- О — _|_________1_ 10 , 20 И -5,0 Рис. 11.3.2. Переходные процессы по регулируемой и управляющей переменным в системах с различными алгоритмами управления и низкочастотным объектом III. Задание относительно малого начального значения управляю- щей переменной и(0) приводит к значительно менее колебательному по сравнению с ЗПР-З переходному процессу, несколько большему значению Se при существенно меньшем значении Su, меньшей ве- личине ут и несколько меньшей величине к8. 2ПР-2 (ПИ-типа)
222 Ч 11. Системы управления с детерминированными возмущениями Рис. 11.3.3. Характеристики процессов управления для различных алгоритмов управления.
Гл. 11. Сравнительный анализ регуляторов 223 2ПР-2 ЗПР-З АРМ РС(2) б Рис. 11,3,3 (продолжение),
224 У 11. Системы управления с детерминированными возмущениями Рис. 11.3.3 (продолжение).
Гл. 11. Сравнительный анализ регуляторов 225 По сравнению с ЗПР-З этот регулятор обеспечивает несколько большее значение Se при меньшем значении Su, много меньшее значение и(0), большие величины ут и к3, а также несколько мень- шие вычислительные затраты /2. 2ПР-1 (ПИ-типа с заданным начальным значением управляю- щей переменной) По сравнению с 2ПР-2 величина п(0) была выбрана большей, в результате чего получены несколько большее значение Se и боль- шее значение Su, большие величины ут и к3. Все это говорит о худ- шем качестве регулирования, чем для алгоритма управления 2ПР-2. РС-1 (регулятор состояния с г = 0,043) Поскольку величина п(0) для этого алгоритма управления близ- ка к соответствующему значению управляющей переменной для ЗПР-З, будем непосредственно сравнивать параметры этих алго- ритмов. Из рис. 11.3.2 видно, что по сравнению с регулятором ЗПР-З переходные процессы для РС-1 лучше задемпфированы, зна- чения Se и Su чуть-чуть меньше, величина уга меньше, а величина к3 намного меньше соответствующих параметров для ЗПР-З. Вы- числительные затраты оказываются, однако, в шесть раз боль- шими. РС-2 (регулятор состояния с г = 0,18) Величина и(0) та же, что и для ЗПР-2, по сравнению с которым обеспечиваются более гладкие переходные процессы. Значения показателей Se и Su приближенно те же, в то время как величины ут и к3 существенно меньше. По сравнению с РС-1 значение Se больше, Su — меньше, величина уга меньше, а величина к3 — приближенно та же. AP(v) (апериодический регулятор) Установившееся состояние достигается за к=4 тактов при су- щественно большой величине ц(0) и больших изменениях Au (к). По сравнению со всеми другими алгоритмами управления полу- чается наименьшее значение Se при наибольшем значении Su, наибольшая величина и(0), относительно малая величина ут и наименьшая величина к3. Вычислительные затраты между тактами примерно в два раза больше, чем для алгоритма ЗПР-З. AP(v+l) (апериодический регулятор с заданным начальным значением управляющей переменной) Увеличение времени установления до к=5 тактов приводит к существенному уменьшению начального значения управляющей переменной и(0), а следовательно, и величины Au (к) по сравнению с регулятором AP(v). Значение Se становится несколько большим при существенном уменьшении значения Su; величины ут и к3 возрастают. Вычислительные затраты /2 возрастают из-за увели- чения порядка на единицу. По сравнению с регулятором ЗПР-З получаем примерно то же значение Se и большее значение Su,
226 Ч. II. Системы управления с детерминированными возмущениями однако меньшие величины ут и и(0), значительно меньшую вели- чину к3 и втрое большие вычислительные затраты /2. Обобщенная оценка качества управления для всех алгоритмов управления возможна при использовании квадратичного критерия качества Seu. Этот критерий качества отражает характер поведения регулируемой переменной и управляющей переменной, умножен- ной на весовой коэффициент г. Для меньшего значения весового коэффициента при управляющей переменной г=0,1 наилучшее качество управления обеспечивают регуляторы ЗПР-2, РС-2 и РС-1. При большем значении весового коэффициента г=0,25 лучшими оказываются регуляторы ЗПР-2, РС-2 и 2ПР-2. Параметрически оптимизируемые алгоритмы управления ЗПР-З и ЗПР-2 незначи- тельно отличаются по своим характеристикам от регуляторов РС-1 и РС-2. Объект II (с неминимально-фазовой характеристикой) Из рис. 11.3.1 видно, что апериодический регулятор AP(v) в данном случае неприменим, так как формируемая им управляю- щая переменная слишком сильно изменяется. Возрастание затрат на управление Su при этом не приводит, как это было при управ- лении объектом III (для всех алгоритмов управления), к умень- шению среднеквадратичной ошибки управления Se. Слишком боль- шие затраты на управление или слишком большая величина и(0) ведут к ухудшению качества управления. Наименьшие значения Se при достаточно малых значениях Su, т. е. при относительно хоро- шем Seu, получены при г=0,1 и г=0,25 для регуляторов 2ПР-2, ЗПР-2, ЗПР-З, РС-1 и РС-2. Малый начальный выброс и малое перерегулирование может быть получено при использовании ре- гулятора ЗПР-2. б) Подавление возмущения v(k) на входе объекта Ступенчатое изменение сигнала возмущающей переменной v(k) приводит к приближенно одинаковым результатам для объектов III и II. Хорошее подавление: AP(v), AP(v-j-l), РС-1, ЗПР-З (это регуля- торы с наибольшим коэффициентом пере- дачи). Плохое подавление: 2ПР-2, 2ПР-1, ЗПР-2. Следует отметить, что в этом случае отличия сравнительных показателей оказываются меньшими, чем при отработке ступенча- того задающего сигнала в установившемся состоянии. Это объяс- няется тем, что при ступенчатом изменении сигнала возмущающего воздействия v(k) в меньшей степени возбуждает высокочастотные составляющие регулируемой переменной, чем при изменении за- дающего воздействия w(k), для которого проводился синтез регу- ляторов. Для оценки качества систем при учете обоих воздействий,
Гл. 11. Сравнительный анализ регуляторов 227 v(k) и w(k), вычислялся следующий усредненный показатель: $eu= ($eu)w+ ($eu)y Хорошее качество управления по усредненному показателю обес- печивает использование регуляторов для объекта III: при г = 0,1 PC-1, РС-2, ЗПР-2, ЗПР-З; при г = 0,25 РС-2, ЗПР-2, РС-1, 2ПР-2; для объекта II: при г = 0,1 РС-1, ЗПР-З, ЗПР-2, РС-2; при г = 0,25 РС-1, РС-2, ЗПР-2, ЗПР-З, 2ПР-2. в) Чувствительность к неточному заданию параметров модели В большинстве случаев модель объекта является аппроксима- цией реального объекта, так что алгоритмы управления нельзя оценивать без учета их чувствительности к ошибкам в модели объекта. Как для теоретических, так и для экспериментальных (идентифицированных) моделей объектов ошибки в отдельных параметрах редко оказываются независимыми. Поэтому оценка чувствительности только по отдельным параметрам может при- вести к неверным заключениям. В дальнейшем чувствительность рассматриваемых алгоритмов управления оценивается по отношению к неточно идентифициро- ванным моделям объектов. Для этого объекты II и III были иден- тифицированы несколько раз с помощью четырех различных мето- дов оценки параметров в режиме нормальной эксплуатации при двух различных значениях отношения шума к полезному сигналу (т]=0,1 и т]=0,2) и трех различных временных интервалов [3.131. После этого для полученных в результате идентификации моделей был проведен синтез управляющих алгоритмов. Затем были вы- числены результирующая регулируемая переменная у (к) для неточной модели объекта и истинная регулируемая переменная у (к) для точной модели объекта (т. е. реального объекта). Ошибка Ду (к), обусловленная неточностью идентификации модели объекта, вычисляется по формуле Ду (к) = у (к)—у (к). (11.3-1) На основании полученной величины Ду (к) может быть вычислена среднеквадратическая ошибка управления - N N Т 1/2 «,= S Ay‘(k)/S yS(k) [к=0 к=0 J (11.3-2) к=0 Здесь у0(к)—регулируемая переменная в системе с точной моделью объекта и в соответствии с ней синтезированным алго- ритмом управления. Ошибка регулируемой переменной 6у рас- сматривается как функция ошибки импульсной переходной функ-
228 Ч. II. Системы управления с детерминированными возмущениями ции 6g модели объекта: 6g = [Ag2 (k)/g2(k)]1/2> (11.3-3) Ag(k) = g(k)-g(k). (11.3-4) идентифицированная точная Для уменьшения влияния статистических флуктуаций в каждом из пяти процессов идентификации были вычислены дисперсии об и об для этих ошибок. В работе [8.5] было показано, что в слу- чае использования алгоритма управления ЗПР-З для обоих иссле- дуемых объектов при О^ое 5^0,2 наблюдается приближенно ли- нейная зависимость ое = f(o,fl ). Это также справедливо для всех остальных алгоритмов управления. Прямой зависимости между ошибками в отдельных параметрах модели не наблюдалось. Поэтому ошибки в весовой функции, с помощью которой описывается пове- дение объекта относительно входа/выхода, могут быть использо- ваны для иллюстрации зависимости качества управления замкнутой системы от неточного задания модели объекта. Теперь можно оценить «чувствительность системы к неточности задания модели» Ei = o6y/o6g. (11.3-5) Чем меньше величина elt тем меньше влияет неточность модели на поведение замкнутой системы. Из рис. 11.3.3, в видно, что чувстви- тельность для объекта II в общем случае больше, чем для объекта III. Наименьшая чувствительность систем для обоих объектов по- лучена при использовании алгоритмов управления ЗПР-2 и РС-2, а наибольшая — для алгоритма 2ПР-1. Высокой чувствительностью обладает система с апериодическим регулятором AP(v) для объек- та II. Это можно объяснить неминимально-фазовым характером это- го объекта. Однако для объекта III алгоритм управления AP(v) обеспечивает ту же чувствительность, что и алгоритм ЗПР-З. Апе- риодический регулятор AP(v-M) оказывается для обоих объектов менее чувствительным, чем AP(v). г) Вычислительные затраты между тактами При оценке вычислительных затрат для работы алгоритмов управления использовались следующие показатели: = /add+^muit— общее число операций; /add—число операций типа сложения; /mult — число операций типа умножения. Из табл. 11.3.2 видно, что параметрически оптимизируемые ал- горитмы управления требуют наименьших, алгоритмы управления по состоянию — наибольших, а алгоритмы с конечным временем установления — средних вычислительных затрат между тактами.
Гл, 11. Сравнительный анализ регуляторов 229 Таблица 11.3.2 Вычислительные затраты между тактами и время синтеза различных алгоритмов управления для объекта III при использовании вычислителя HP 2100А Алгоритм управления ЗПР-2 ЗПР-З РС АР (V) АР (v+1) Вычислительные затраты меж- ду тактами /х 6 б 34 14 18 Время синтеза [с] 20...30 40...60 1 0,004 0,004 Объем памяти для синтеза [слов] 1881 1881 1996 342 342 д) Затраты на синтез алгоритмов управления Затраты на синтез состоят из потребной памяти и времени вычислений при синтезе алгоритмов управления. Оба этих ком- понента зависят от состава программного обеспечения используе- мых цифровых вычислителей (включая математические подпро- граммы). Цифры, приведенные в табл. 11.3.2, получены для вычис- лителя Хьюлетт-Паккард HP 2100А с ферритовой памятью объемом 24К, внешней дисковой памятью и аппаратур но реализованной арифметикой с плавающей запятой. Время вычислений является наименьшим при синтезе апериодических регуляторов, средним при синтезе регуляторов состояния и наибольшим для параметри- чески оптимизируемых регуляторов. Заметим, что для параметри- ческой оптимизации использован метод Хуки — Дживса, для ко- торого нужен относительно малый объем памяти. Условием окон- чания оптимизации служит |Aq|=0,01. Требуемый объем памяти для синтеза распределяется аналогично времени вычислений: наименьший для апериодических регуляторов, средний для регу- ляторов состояния и наибольший для параметрически оптимизи- руемых регуляторов. е) Зависимость между качеством управления и затратами на управление На рис. 11.3.4 показана зависимость показателя качества уп- равления Se от требуемых затрат на управление Su для различных алгоритмов управления, синтезированных для ступенчатых изме- нений в установившемся состоянии. Если исключить алгоритмы управления первого порядка (2ПР-1 и 2ПР-2), то для алгоритмов второго и более высоких порядков наблюдается прямая зависи- мость между Se и Su. Для объекта III возрастание значения Su
230 4. IJ. Системы управления с детерминированными возмущениями приводит к уменьшению значения Se по следующим группам: ЗПР-2 I РС-2 / РС-1 ЗПР-З АР (v4-l) АР (v) 1-я группа и(0) = 2,0, 2-я группа и(0) = 3,81.. .4,56, 3-я группа и (0) = 9,52. Таким образом, группы формируются по величине начального значения управляющей переменной и(0). Далее будет видно, что, 2ПР-1 2ПР-2 ЗПР-2 • ЗПР-З ° АРМ АР(Р+1) ж РС(1) ° \РС(2) Рис. 11.3.4. Зависимость качества управления Se от затрат на управление Su для исследуемых алгоритмов управления и объектов II и III. начиная с первой группы, небольшие улучшения качества управ- ления Se всегда достигаются за счет увеличения затрат на управ- ление Su. В случае объекта II видно небольшое улучшение каче- ства управления Se для ЗПР-2 1 1 -группа РС-2 / и(0) = 2,0 ЗПР-З I 2-я группа РС-1 J и (0) = 3,44.. .3,49. Однако при возрастании затрат на управление Su качество уп- равления становится хуже прежде всего для AP(v-H) при и(0) — =5,84 и для AP(v) и и(0) = 14,09. Можно также видеть, что при одинаковых значениях показателя Su алгоритмы управления пер- вого порядка 2ПР-1 и 2ПР-2 обеспечивают худшее качество управ- ления Se по сравнению с алгоритмами управления второго и более высоких порядков. При одних и тех же значениях Su качество уп- равления для объекта II оказывается худшим, чем для объекта III.
Гл. 11. Сравнительный анализ регуляторов 231 Из рис. 11.3.4 видно, что для алгоритмов управления второго и бо- лее высоких порядков, а также для других алгоритмов управления существует зависимость между достижимым качеством управления Se и требуемыми затратами на управление Su. Однако это справед-< либо только в том случае, когда синтез выполняется для ступенча- того изменения задающей переменной w(k) [8.5]. И.4. СРАВНЕНИЕ ДИНАМИЧЕСКОГО ПОКАЗАТЕЛЯ УПРАВЛЕНИЯ В разд. 11.3 проводилось сравнение качества управления в зам- кнутых системах с различными алгоритмами управления при сту- пенчатом изменении сигнала w(k) в установившемся состоянии и сигнала v(k) на входе объекта. В гл. 13 приведены соответствую- щие результаты моделирования систем с параметрически оптимизи- руемыми регуляторами для стохастических возмущений п(к). Оценка различных алгоритмов управления при стохастических и детерминированных возмущениях с точки зрения их применения в адаптивных алгоритмах управления была проведена в работе [2.22] (см. разд. 26.2). Оценка качества управления для входных сигналов с различным частотным спектром может быть осуществлена при использовании динамического показателя управления [5.14] R<Z)=1+Gr(z)Gp’(z)’ (Н.4-1) если реакция замкнутой системы на входной сигнал описывается соотношениями У (z) = R (z) Gr (z) Gp (z) w (z) или у (z) = R (z) n (z), (11.4-2) а сигнал возмущения v (k) пропускается через произвольный фильтр с передаточной функцией Gpv (z) =n (z)/v (z), обеспечивающий у (z) — R (z) GPv (z) v (z) = R (z) n (z). (11.4-3) Уравнение (11.4-3) можно получить из уравнения (11.4-2) при v (z) = n (z) Gpv (z) =: 1 или при v (z) = w (z) и Gpv (z) — Gr (z) Gp (z). Для детерминированных возмущений амплитудная частотная харак- теристика описывается выражением |ii(z)H|Gpv(z)||v(z)| (11.4-4) при z = eT«lw и O^co^cos, где cos—частота Шеннона а>5 = л/Т0 (см. разд. 27.1). Следовательно, амплитудная частотная характе- ристика регулируемой переменной равна | у (z) | - | R (z) 11 n (z) | = | R (z) 11 GPv (z) 11 v (z) |. (11.4-5)
232 Ч. II. Системы управления с детерминированными возмущениями Для стационарных стохастических возмущений со спектральной плотностью $Ш1 (z) = 2 Rnn (т) z~ Т > т=-® (11.4-6) где Rnn(x) = E{[n(k)—п][п(к + т)~п]} — автоковариационная функция, Snn(z)= |GPv(z)|aSvv(z). (11.4-7) Спектральная плотность сигнала у (к) в этом случае будет равна Syy (z) = | R (z) |2 Snn (z) = | R (z) |21 GPv (z) |2 Svv (z). (11.4-8) Модуль динамического показателя управления |R(z)| или его квадрат |R(z)|2 показывают, насколько амплитуда или спектраль- ная плотность уменьшаются, проходя через замкнутую систему. Поэтому в дальнейшем для различных регуляторов приводится зависимость |R (z) | от частоты в диапазоне 0<(o<cos. Кроме того, будет показано влияние величины весового коэффициента при уп- равляющей переменной. Динамический показатель управления R (z)=y (z)/n(z) можно легко определить даже для регуляторов состояния с наблюдателя- ми. Для этого на аналоговом вычислителе моделируется низкочас- тотный объект с несколькими постоянными времени Gp = (1+4,2s) (1 + is) (1 + 0,9s) (1 + 0,6s) (1 + 0,55s)2 ‘ 1'4'9> По непрерывным сигналам производится его идентификация с по- мощью управляющего цифрового вычислителя при подаче на вход объекта псевдослучайного двоичного сигнала. При использовании метода «корреляции и оценки параметров по методу наименьших квадратов» и программы упорядоченного поиска ([3.13], [29.1]— [29.3]) получим дискретную передаточную функцию с тактом кван- тования То=2 с: G М - Ш - Q,0600z-] -f-Q,1617z^+ 0,0328z~3 . ’ u(z) 1— 0,9470z_1-|-0,2164z'2 — 0,0005z*3 ’ После этого для полученной модели объекта с помощью того же уп- равляющего вычислителя проводится синтез алгоритмов управле- ния для ступенчатых изменений в установившемся состоянии (см. гл. 29). Затем экспериментально определяется |R(z)| на основании измерений частотных характеристик замкнутой системы, состоя- щей из аналогового и цифрового управляющего вычислителей. Полученные результаты приведены ниже. Диапазон частот дина-
Гл. 11. Сравнительный анализ регуляторов 233 мического показателя управления как хорошо известно, можно разделить на три основные области [5.14] (см. рис. 11.4.1): Область I: 0 со < сог для 0 | R | < 1 (низкие частоты) Возмущения п (к) подавляются Область II: coj -Ссосои для 1 < |R] (средние частоты) Наличие резонанса. Возмущения п (к) усиливаются Область III: соп < со < cos для | R | « 1 (высокие частоты) Возмущения п(к) остаются без изменения Следовательно, эффективность действия замкнутой системы огра- ничена областью I. Изменения параметров регулятора, приводя- щие к уменьшению показателя |R| в одной области, вызывают Рис. 11.4.1. Частотные области динамического показателя управления |R(z)|. ®s ^/T0-®res резонансная частота. его возрастание в другой области [5.14]. Графики значений динами- ческого показателя управления для различных регуляторов при- ведены на рис. 11.4.2. Параметры регуляторов сведены в табл. 11.4.1, а влияние увеличения весового коэффициента г при уп- равляющей переменной показано в табл. 11.4.2. Из этой таблицы видно, что значение |R| в области I возрастает, что приводит к мень- шему подавлению низкочастотных возмущений и, следовательно, к худшему качеству управления. То же происходит и на низкочас- тотном участке области II. Однако в оставшейся части области II за резонансным пиком (®>(oies) значение |R | убывает для всех регуляторов, и качество управления соответственно улучшается. В области III значение |R | меняется несущественно. Можно сделать вывод, что для всех регуляторов увеличение веса управляющей переменной или уменьшение величины ц(0) приводит к уменьшению резонансного пика и его смещению в сторону низких частот. При оценке изменения динамического показателя управления для ре- гуляторов состояния читатель может руководствоваться уравне- ниями (10.1-11) — (10.1-14) и соответствующими замечаниями и ссылками.
234 У. II. Системы управления с детерминированными возмущениями Рис. 11.4.2. Динамический показатель управления для различных регуляторов при различном весе управляющей переменной или различных значениях и(0). а — параметрически оптимизируемый регулятор 2ПР-2 (ПИ-типа); б — параметрически опти- мизируемый регулятор ЗПР-З (ПИД-типа); в — апериодический регулятор; г — регулятор состояния с наблюдателем. Из вышесказанного снова следует, что оценка качества управ- ления в значительной степени зависит от частотного спектра воз- буждающих сигналов [см. уравнение (11.4-4)]. Только в том случае, когда на замкнутую систему действуют очень низкочастотные сиг- налы, можно выбирать малое значение весового коэффициента г или большую величину и(0). Сигналы, близкие к резонансной частоте, требуют большого значения г или малой величины и(0). Если на систему действуют средне- или высокочастотные сигналы без дополнительной фильтрации (см. разд. 27.1), апериодический
Гл. И. Сравнительный анализ регуляторов 235 Таблица 11.4.1 Параметры регуляторов для различных значений динамического показателя управления Параметр регулятора 2ПР-2 ЗПР-З r = 0 r=0, 1 r=0 r=0, 1 q0 = u (0) 1,9336 1,5781 3,6072 2,4141 41 — 1,5586 —1,2266 —4,8633 —2,9219 q2 — — 1,9219 1,0000 к 1,9336 1,5781 1,6957 1,4141 CD — — 1,1475 0,7072 С1 0,1939 0,2225 0,3992 0,3481 Mres 0,35 0,33 0,55 0,60 Параметр регулятора AP (v) AP (V+ 1) q0 = u (0) 3,9292 2,2323 41 —3,7210 —0,4171 q2 0,8502 — 1,1240 Чз —0,0020 0,3660 44 — —0,0009 Po 1,0000 1,0000 Pl —0,2359 —0,1340 p. —0,6353 —0,4628 p3 —0,1288 —0,3475 P4 — —0,0556 litres 0,73 0,58 Параметр регулятора PC r=0, 03 r=0, 05 kf 2,6989 2,3466 k2 3,1270 2,5798 kg 2,3777 1,9358 k4 1,0000 1,0000 u(0) 2,3777 1,9358 ®res 0,57 0,50 регулятор AP(v) применять нельзя (см. рис. 11.4.2, в). Для других регуляторов в этом случае надо задавать большее значение г или меньшую величину и(0). На рис. 11.4.3 приведены графики динамических показателей управления для различных регуляторов. Вес управляющей перемен- ной был выбран так, чтобы после ступенчатого изменения задающей переменной в установившемся состоянии величина и(0) управляю- щей переменной для разных регуляторов была примерно одина- кова, т. е. и(0)^1,93...2,41. Значение показателя |R| не очень
236 Ч. 11. Системы управления с детерминированными возмущениями Таблица 11.4.2 Изменение показателя | R (z) | при различном весе управляющей переменной Регулятор Изменение при синтезе | R (z) | становится Область I Область И Область III 0 < ® < (Oj “I < “ < “res (Ojj < (0 < 2ПР-2 г = 0 —> 0,1 Больше Больше Меньше —- ЗПР-З г== 0 —> 0,1 » Больше/ /Меньше » — АР v -> v4-1 » Больше » — PC г = 0,03 ->0,05 » » » — сильно отличается для регуляторов ЗПР-З, АР (v 4-1) и PC. Только регулятору 2ПР-2 соответствует значительно более высокий резо- нансный пик на нижних частотах. В области I лучшим является регулятор PC, в области II — АР (v4~l), а в области III — снова PC. Динамический показатель управления пригоден не только для оценки качества управления как функции спектра сигналов воз- Рис. 11.4.3. Динамический пока- затель управления для четырех регуляторов: 2ПР-2: u (0)= 1,93; ЗПР-З: и(0)=2,41; АР (v+1): и (0)= =2,23; PC: и(0)=2,38. О 0,6 10 мущения. Из уравнения (10.1-10) следует, что динамический пока- затель качества идентичен функции чувствительности S(0n, z) замкнутых систем, которая позволяет оценить влияние изменений характеристик объекта на качество управления. Малое значение |R (z)| означает не только хорошее качество управления, но и малую чувствительность (см. гл. 10).
Гл. 11. Сравнительный анализ регуляторов 237 11.5. РЕКОМЕНДАЦИИ ПО ПРИМЕНЕНИЮ АЛГОРИТМОВ УПРАВЛЕНИЯ Наиболее’важные характеристики исследуемых алгоритмов по- мещены в табл. 11.5.1 для заданных тестовых объектов пропорцио- нального действия — низкочастотного и неминимально-фазового. Таблица 11.5,1 Оценка наиболее важных свойств алгоритмов управления (1 — «хорошее», «малое», 2 — «среднее», «среднее», 3 — «плохое», «большое») Алгоритм управления Качество управления Чувствит. к ошибкам в модели Вычисли- тельные затраты между тактами Затраты на синтез Объект Объект Ш 11 III 11 ПИ 2ПР-2 2 2 2 3 1 3 2ПР-1 2 2 2 2 1 3 ПИД ЗПР-З 1 1 2 2 1 3 ЗПР-2 1 1 1 1 1 3 Апериодический АР (v) 3 3 2 3 2 1 АР (v+D 2 3 2 3 2 1 По состоянию РС-1 1 1 2 2 2 2 РС-2 1 1 1 1 2 2 Параметрически оптимизируемые алгоритмы управления Алгоритмы ПИД-типа с тремя параметрами лучше алгоритмов ПИ-типа с двумя параметрами, поскольку они обеспечивают луч- шее качество управления при меньших затратах на управление, более быструю отработку задающих сигналов при меньшем пере- регулировании и меньшую чувствительность к неточному заданию модели объекта. Параметрически оптимизируемые алгоритмы низ- кого порядка отличаются весьма малыми вычислительными за- тратами между тактами, но вычислительные затраты на синтез оказываются относительно большими из-за применения численных методов оптимизации. Однако существуют методы синтеза с малыми вычислительными затратами, описанные в разд. 25.2.3. В отличие от других алгоритмов управления для параметрически оптимизи- руемых алгоритмов низкого порядка можно применять простые
238 Ч. II. Системы управления с детерминированными возмущениями правила настройки. Поэтому параметрически оптимизируемые ал- горитмы управления можно рекомендовать в следующих случаях: • для многоконтурных систем управления; 9 при проведении синтеза один раз или редко; 0 при необходимости автономной адаптации параметров регуля- торов к изменяющейся рабочей точке объекта. Таким образом, эти регуляторы пригодны для широкого класса объектов. Алгоритмы управления по состоянию Достижимое качество управления алгоритмов управления по состоянию мало отличается от качества параметрически оптимизи- руемых алгоритмов для рассмотренных тестовых объектов. При тех же начальных значениях управляющей переменной и(0) алгоритмы управления по состоянию обеспечивают несколько более задемп- фированные переходные процессы по регулируемой переменной и меньшее время установления. Вычислительные затраты между тактами оказываются большими для объектов, начиная со второго порядка, однако их синтез на ЭВМ более прост. Поэтому алгорит- мам управления по состоянию следует отдавать предпочтение в сле- дующих случаях: 0 для систем с небольшим числом контуров; 9 при выполнении синтеза один раз или редко; • для неустойчивых объектов, для обеспечения устойчивости ко- торых необходимо вводить обратные связи по многим перемен- ным состояния. Алгоритмы управления с конечным временем установления Из-за больших колебаний управляющей переменной апериоди- ческие алгоритмы управления порядка v = m+d не рекомендуется использовать при малых тактах квантования. Однако, если такт квантования достаточно велик, апериодические алгоритмы порядка v+1 будут лучше, так как они характеризуются меньшим измене- нием управляющей переменной. Время установления и перерегу- лирование для апериодических алгоритмов меньше, чем для пара- метрически оптимизируемых. Вычислительные затраты между так- тами примерно в три раза больше для объектов четвертого порядка. Главное преимущество апериодических алгоритмов состоит в вы- числительной простоте их синтеза. Поэтому их можно рекомендо- вать для © асимптотически устойчивых объектов; © адаптивного управления, при котором синтез регулятора повто- ряется неоднократно.
Гл. И. Сравнительный анализ регуляторов 239 Эти утверждения справедливы для тестовых объектов, исследо- ванных выше, однако они могут быть обобщены для других подоб- ных линейных объектов без чрезмерных ошибок. В гл. 9 уже были кратко описаны объекты пропорционального действия с большим временем запаздывания, а результаты сравне- ния различных алгоритмов для стохастических возмущений поме- щены в гл. 13 и 25. Трудно выбрать алгоритмы управления для мно- гомерных объектов, так как они существенно отличаются друг от друга. Преимущества и недостатки параметрически оптимизируе- мых алгоритмов и алгоритмов управления по состоянию необходимо исследовать в каждом конкретном случае (см. ч. 5).
ЧАСТЬ III Системы управления со случайными возмущениями ГЛАВА 12 Стохастические системы управления 12.1. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ При расчете регуляторов, обсуждавшихся в предшествующих главах, пред- полагалось, что действующие в системе возмущения являются детерминиро- ванными, т. е. представляют собой сигналы определенного типа, которые могут быть описаны аналитически. Однако реальные возмущения, как правило, носят случайный характер, и в явном виде описать их невозможно. Детерминиро- ванные сигналы, используемые при проектировании систем управления, могут служить лишь приближенными «моделями» действительных сигналов. Обычно рассматриваются только модельные сигналы простейшей формы, что дает воз- можность проводить качественную оценку реакций систем управления и сущест- венно упрощает процедуры их расчета. В то же время синтезированная система оказывается оптимальной только по отношению к определенным модельным сигналам в рамках принятого критерия оптимальности. При всех остальных сигналах система может считаться лишь квазиоптимальной, хотя в боль- шинстве случаев этого бывает вполне достаточно. Если же к качеству управ- ления предъявляются повышенные требования, при синтезе регуляторов сле- дует учитывать не только динамику объектов управления, но и свойства реальных возмущений. Для этого необходимо применять методы теории слу- чайных процессов. В разделе 12.2 кратко описываются рекуррентные математиче- ские модели случайных сигналов, используемые в последующих гла- вах. Далее рассматриваются три типа регуляторов, специально предназначенных для работы в условиях помех. Как будет показа- но в гл. 13, все параметрически оптимизированные регуляторы, исследованные в гл. 5, также могут быть адаптированы к случай- ным возмущениям. В гл. 14 подробно обсуждаются различные регуляторы с минимальной дисперсией, получаемые путем миними- зации квадратичных критериев качества. Они имеют структуру, оптимальную по отношению как к параметрам объекта, так и к характеристикам случайных помех. Наконец, в гл. 15 рассматри- ваются различные варианты регулятора состояния, который также обладает оптимальной структурой, но дополнен фильтром для получения оценки случайных переменных состояния.
Гл. 12. Стохастические системы управления 241 Теория стохастических систем управления возникла совсем недавно. По дискретным стохастическим системам управления с тех пор было опубли- ковано сравнительно немного книг, из которых можно рекомендовать следую- щие: [12.1] —[12.5] и [8.3]. 12.2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ СЛУЧАЙНЫХ СИГНАЛОВ В этом разделе приводится ряд уравнений, описывающих случайные сиг- налы, которые далее будут использованы при синтезе стохастических регуля- торов и фильтров переменных состояния. За недостатком места мы не имеем возможности представить подробные доказательства и выкладки, ввиду чего читатель отсылается к специальным публикациям, в том числе по теории непрерывных случайных процессов [12.6—12.8] и по теории дискретных слу- чайных процессов [12.9], [12.10], [12.4], [3.13]. 12.2.1. Основные понятия Рассмотрим дискретную последовательность случайных сигналов {х(к)}; к=1, 2.......................N. Статистические свойства случайных сигналов характеризуются плотностями вероятностей их амплитуд, а также плотностями все- возможных совместных распределений. Если указанные функции зависят от времени, случайный сигнал называется нестационар- ным. Если плотности вероятностей и совместных вероятностей инвариантны к сдвигу во времени, сигнал называют стационарным (в узком смысле). Стационарный случайный процесс является эр- годическим, если усреднение по множеству для него может быть заменено усреднением по времени. Эргодический сигнал можно описать его математическим ожиданием (средним арифметическим значением) N x = E{x(k)} = lim 4Sx(k) (12.2-1) N -* 00 к = 1 и автокорреляционной функцией N Фхх(т) = Е{х(к)х(к + т)}= Нт ^22 х(к) х (к + т). (12.2-2) N~*» k=i Автокорреляционная функция является мерой взаимозависимо- сти отдельных значений случайного сигнала. Из определения авто- корреляционной функции следует, что она зависит от математи- ческого ожидания сигнала. Если же анализируются только откло- нения от среднего, функция (12.2-2) переходит в автоковариацион- ную функцию Rxx (т) = COV [х, т] = Е {[х (к) — х] [х (к -|-т) —х]} =ФХХ (т) —ха. (12.2-3)
242 4. III. Системы управления со случайными возмущениями При т = 0 формула (12.2-3) дает дисперсию сигнала N = Rxx (0) = lim S tx (к) — х]2. (12.2-4) N -* ® к=1 Если амплитуда сигнала распределена по нормальному закону, он полностью описывается математическим ожиданием и автокова- риационной функцией. Случайный сигнал называют стационарным в широком смысле, если его характеристики х и Rxx (т) не зависят от времени. Степень взаимозависимости двух различных случайных сигналов определяется взаимной корреляционной функцией N Фху(т) = Е{х(к) у(к + т)}= lim Е х (к) У (к 4-т) (12.2-5) N -> оо 1 к=] или взаимной ковариационной функцией Rxy (т) = cov [х, у, т] = Е {[х (к)—х] [у (k-f-т) —у]} = Фху (т)—ху. (12.2-6) Два случайных сигнала называются некоррелированными, если cov[x, у, T] = Rxy(T) = 0. (12.2-7) Они являются ортогональными, если, кроме того, выполняется условие ху = 0 или эквивалентное ему Фху(т)=б. (12.2-8) Белый шум отличается от случайных сигналов других типов тем, что его текущее значение не зависит от всех предшествую- щих. Поскольку внутренняя взаимосвязь между значениями белого шума отсутствует, то в случае, когда его амплитуда распределена по нормальному закону, он полностью описывается математическим ожиданием х и ковариационной функцией cov [х, т] = (т), (12.2-9) где ох — дисперсия сигнала х (t); 6 (т) — функция Кронекера, опре- деляемая как ( 1 при т = 0, 6(т) = < п Н (12.2-10) (О при | Т | =7^= 0. 4 До сих пор рассматривались лишь скалярные случайные сиг- налы. Векторный случайный сигнал порядка п представляет собой совокупность « скалярных сигналов {хт (к)} = [хх (к) Xj (к) .. . х„ (к)]. (12.2-11)
Гл. 12. Стохастические системы управления 243 Если все составляющие векторного сигнала стационарны, его математическое ожидание есть хт = Е{хт(к)} = [х1, х2...х„]. (12.2-12) Взаимосвязь отдельных скалярных составляющих описывается ковариационной матрицей cov [х, т] = Е {[х (к) — х] [х (к-|-т)—х]т} = "Rx1X1(t) Rx,x2 (Т) • . . Rx1Xn(T)- Rx2xt (т) R Х2х2 (т) ••• Rx2X„ (т) t-Rv,(*) Rx’x.W ... Rx‘,„(t). (12.2-13) Диагональными элементами (12.2-13) являются автоковариацион- ные функции, внедиагональными — взаимные ковариационные функ- ции скалярных сигналов. Отметим, что ковариационная матрица симметрична при т = 0. Пример. 12.2.1. Если хх (к) и х2 (к)—два некоррелированных случайных сиг- нала типа белого шума, их ковариационная матрица определяется выражениями cov [х, т = 0] — 0 cov [х, т # 0] =0. 0 aL Ковариационные и корреляционные функции являются непара- метрическими моделями случайных сигналов; в следующих двух разделах будут рассмотрены их параметрические модели. 12.2.2. Марковские процессы Случайный сигнал называют марковским процессом первого по- рядка, если его условная плотность вероятности подчиняется соот- ношению р [х (к) | х (k—1), х (к — 2), ..., х (0)] = р [х (к) | х (к—1)]. (12.2-14) Таким образом, вероятность реализации значения х(к) зависит только от предыдущего значения х(к—1) и не зависит от всех ос- тальных предшествующих элементов случайной последовательно- сти. Отсюда следует, что очередное значение зависит лишь от те- кущего. Данному выше определению марковского процесса соответствует сигнал, описываемый скалярным разностным уравнением первого порядка х (k-f-1) = ах (k) + fv (к), (12.2-15)
244 4. III. Системы управления со случайными возмущениями которое устанавливает связь между будущим значением х(к-|-1) и текущими значениями х (к) и v(k). Если v (к) — это статисти- чески независимый сигнал (т. е. белый шум), то х (к) является марковским процессом. В том случае, когда скалярное разностное уравнение имеет порядок выше единицы, например х (k + 1) = а,х (к) + аах (к— 1) 4- fv (к), (12.2-16) его можно преобразовать в систему уравнений X (к) = Xj (к), /19 9 17"» x(k-M) = Xi(k+l)«x8(k). 1 ' Последнюю можно записать в виде векторного разностного урав- нения первого порядка 'Xi(k+D' = х2 (k-|-l)J О 11[х£(к)’ .Э/ а2. _х2 (к). О’] v (к) (12.2-18) или для произвольного порядка x(k+l) = Ax(k)4-fv (к). (12.2-19) Матрица А и вектор f в (12.2-19) предполагаются постоянными. При этом условии каждый элемент х(к-|-1) зависит только от состояния х (к) и значения v(k), т. е. лишь от текущих величин. Рис. 12.2.1. Модель векторного марковского сигнала х (к) с белым шумом v(k) на входе. Такого типа сигнал х (к) называют векторным марковским про- цессом первого порядка. Случайный сигнал, зависящий от любого конечного числа предшествующих значений, всегда можно описать как векторный марковский процесс, представив его в форме век- торного разностного уравнения первого порядка. Таким образом, широкий класс случайных сигналов может опи- сываться параметрическими моделями, представляющими марков- ские процессы (рис. 12.2.1). Если параметры А и f постоянны и, кроме того, v = 0, процесс является стационарным. Нестационар- ность марковского процесса может быть обусловлена изменениями A (k), f(k) или v(k).
Гл. 12. Стохастические системы управления 245 Получим выражение для ковариационной матрицы X (k-|- 1) век- торного сигнала х(к4-1). Согласно данному выше определению, cov [х (к 1), т==0] = Е {[х (к 4-1) —х (к 4- 1)] [х (к 4- 1 4-т) — -х (к4-1 +т)]т} = Х (к4-1), (12.2-20) если х(к4-1) является марковским процессом с постоянными пара- метрами: x(k4-l) = Ax(k)4-Fv(k). (12.2-21) Предположим, справедливы следующие соотношения: Е {v (k)} = v, ( V при т = 0, cov [v (к), т] = \ Л , _ J ( 0 при т#=0, Е {х (0)} =х (0), cov [х (0), т = 0] = Х(0), Е{[х(к)—x][v(k) — v]1} = 0. , (12.2-22) Возьмем математическое ожидание от обеих частей уравнения (12.2-21) х(к4-1) = Ах (к) 4- Fv (12.2-23) и вычтем результат из (12.2-21): х (к-|- 1)—х (к 1) = А [х (к) —х (к)] 4- F [v (к) — v]. (12.2-24) Протранспонировав выражение (12.2-24) и умножив его справа на вектор (12.2-24), вновь возьмем математическое ожидание. При этом получим разностное уравнение, которому подчиняется иско- мая ковариационная матрица: X (к4- 1) = АХ (к) Ат 4- FVFT. (12.2-25) Если все корни характеристического уравнения det [zI4-A]=0 расположены внутри единичной окружности на плоскости z и если А и F—постоянные матрицы, то при k—> оо уравнение (12.2-25) дает установившееся значение ковариационной матрицы X. Послед- нюю можно получить с помощью рекуррентной процедуры из уравнения (12.2-25), записанного относительно установившегося значения: X = AXAT4-FVF\ (12.2-26) Далее мы будем требовать, чтобы математическое ожидание квадратичного члена вида ха (k)Qx(k), гдех(к) — марковский про- цесс с ковариационной матрицей X, было положительным, а X и Q были неотрицательно определенными матрицами. Воспользуемся
246 Ч. III. Системы управления со случайными возмущениями тождеством xTQx = tr[QxxT], (12.2-27) где tr обозначает след матрицы, т. е. сумму ее диагональных эле- ментов. При х(к) = 0 отсюда следует Е {хт (к) Qx (к)} = Е {tr [Qx (к) хт (к)Д = tr [QE {х (к) хт (к)} = = tr[QX], (12.2-28) Если же математическое ожидание х(^)==х#=0, то соответст- венно Е (хт (к) Qx (к)} = xTQx + tr [QX], (12.2-29) 12.2.3. Скалярные стохастические разностные уравнения Стохастическое разностное уравнение с постоянными коэффи- циентами имеет вид n(k)4-c1n(k—1)4-... 4-cmn(k—m) = dov (k)4-dxv(k—1)4- ... . . . 4-dmv(k — m). (12.2-30) Сигнал n (k) можно рассматривать как выход некоторого фильтра, имеющего дискретную передаточную функцию П (z) _ d04-d1z-14----4-dmz-m Diz-1) 9 V (z) 1 4-C1Z~14- • • • 4-cmZ~m C(z-1) ’ ' ‘ ' на вход которого подается белый. шум v (к) с математическим ожиданием v = 0 и дисперсией с^=1. Таким образом, стохасти- ческое разностнде уравнение описывает случайный сигнал п (к) как функцию статистически независимого сигнала v(k). Эквива- лентом скалярного стохастического уравнения (12.2-31) является векторное стохастическое разностное уравнение вида (12.2-19), в котором ГО 1 ... 01 ПЛ (12.2-32) п(к) = сгх (к) + dov (к), ст = [(dm docm) (dm-x docm_1) ... (dx dgCj)]. В зависимости от типа передаточной функции (12.2-31) будем различать авторегрессионные процессы n <z> С (z°-x) v (12.2-33)
Гл. 12. Стохастические системы управления 247 и процессы со скользящим средним n (z) = D (z-1) v (z). (12.2-34) Сигнал, описываемый функцией (12.2-31) общего вида, будем именовать смешанным авторегрессионным процессом со скользя- щим средним. Если корни знаменателя С (z-1) лежат внутри единич- ной окружности на плоскости z, все эти процессы являются стаци- онарными. Можно, однако, распространить описание (12.2-31) и на случай нестационарных процессов, если допустить существование корней, лежащих непосредственно на единичной окружности. В этом случае n(z) D(z-i) v(z) С' (Z-1)(1— z-!)P ’ (12.2-35) Более подробное обсуждение стохастических процессов читатель сможет найти в книгах [12.4], [12.9], [12.10].
ГЛАВА 13 Параметрически оптимизируемые регуляторы при случайных возмущениях Параметрически оптимизированные регуляторы, рассмотренные в гл. 5, можно несколько видоизменить, учитывая при их синтезе наличие случайных помех. В тех случаях, когда случайные возму- щения n(k) поддаются измерению, синтез может быть основан на квадратичном критерии качества вида м s:,= 2 [е2 (к) 4-гДи3 (к)]. (13-1) к=0 Если в,контуре управления стоит ЭВМ, значения помехи могут накапливаться в ее памяти и в дальнейшем использоваться для оп- тимизации параметров регулятора. В случае стационарного возму- щения при достаточной продолжительности измерения и накопле- ния сигналов помехи после однократной подстройки параметров регулятор может считаться оптимальным и по отношению ко всей по- следующей реализации случайного возмущения. При этом опти- мизация параметров осуществляется без использования математи- ческой модели шума. Ниже будут представлены некоторые результаты математиче- ского моделирования, которые позволят продемонстрировать, как меняются параметры оптимизированного регулятора по сравнению с теми, что были получены для детерминированных воздействий сту- пенчатой формы. Сравнение проводилось для тестовых объектов II и III (см. гл. 5), для управления которыми был использован алгоритм, описываемый передаточной функцией Gr (г) = qo+qir^+qad (13.2) с тремя параметрами, аналогичный (5.2-10). Случайное возмущение v(k), как показано на рис. 5.2.1, действует на входе объекта. Пред- полагается, что это нормально распределенный дискретный белый шум с математическим ожиданием E{v(k)}=0 (13-3) и средним квадратичным отклонением ov = j/E{v2 (к)} = 0,1. (13-4) Следовательно, помеху на выходе можно записать в виде n(z) =
Гл. 13. Параметрически оптимизируемые регуляторы 249 =GP(z)v(z). Параметры регулятора, оптимальные по отношению к данному возмущению, определялись путем численной миними- зации критерия (13-1) при М=240 и г=0 методом Флетчера — Пау- элла. Значения полученных таким способом параметров представ- лены в таблице 13.1. Там же приведены средние квадратичные зна- чения ошибки Se, характеризующей качество управления, и средние квадратичные значения управляемой переменной Su, характери- зующие затраты на управление, а также значения показателя эф- фективности введения стохастического регулятора X = 1 /~у2 (к) с регулятором . (13.5) у у2 (к) без регулятора Все перечисленные характеристики, рассчитанные при двух различных тактах квантования, помещены в колонках, озаглавлен- ных «Se, стох. -> min». Аналогичные характеристики, полученные для оптимизированного регулятора с детерминированным ступен- чатым входным сигналом, помещены в колонках, обозначенных «Se, дет. -> min». Анализ таблицы показывает, что для алгоритма управления типа ЗПР-З при оптимизации с учетом случайных воз- мущений параметры q0 и К имеют меньшие значения, а параметр cD — большее (исключение составляет лишь регулятор объекта II при Т0=4 с), нежели при оптимизации по отношению к ступенча- тому входному воздействию. Постоянная интегрирования во всех случаях близка к нулю ввиду отсутствия постоянного возмущения, поскольку E{v(k)}=0. Судя по снижению показателя Su, в среднем интенсивность управления несколько снижается. Соответственно улучшается качество управления, что подтверждается уменьше- нием показателя х. Более низкое качество и повышенная интенсив- ность управления, свойственные регуляторам, оптимизированным по отношению к ступенчатому воздействию, свидетельствуют о том, что случайные шумы возбуждают собственные движения замкну- того контура управления. Значения спектральной плотности случай- ного возмущения n(k) в области высоких частот достаточно велики, и этим объясняется то, что показатель х для стохастически оптими- зированных регуляторов лишь немногим меньше единицы. Поэтому средняя величина отклонения выходного сигнала за счет введения регулятора снижается незначительно; эта особенность проявляется наиболее отчетливо для объекта II. При меньшем такте квантования То=4 с качество управления объектом III значительно выше, чем при Т0=8 с. Для объекта II данный показатель в обоих случаях примерно одинаков. В регуляторе ЗПР-2 оптимизировались два параметра — qx и q2, в то время как q0 задавался равным началь- ному значению выходного сигнала и(0). Для объекта II величина данного параметра была чрезмерно завышена, что сказалось на ка- честве управления, которое хуже, чем при использовании регуля- тора ЗПР-З. В случае объекта III при обоих тактах квантования
Таблица 13.1 Параметры регуляторов, показатели качества и интенсивности управления при случайных возмущениях v (к) Т„=4с Se,ctox. —min Se, дет. —> min 3PC-3 3PC-2 3PC-3 3PC-2 Чо 0,477 1,750 2,332 1,750 41 —0,512 —3,010 —3,076 —2,039 q2 0,014 1,239 1,105 0,591 к 0,463 0,511 1,227 1,159 CD 0,031 2,425 0,901 0,511 С1 —0,045 —0,041 0,095 0,261 Se 0,0346 0,037 0,0435 0,0411 su 0,0207 0,0604 0,0786 0,0595 X 0,903 0,966 1,13 1,08 c —> min s —> min Tq~8c 3PC-3 3PC-2 3PC-3 3PC-2 Чо 0,913 1,500 1,999 1,500 4i — 1,488 —2,154 —2,079 —1,338 42 0,557 0,652 0,748 0,364 К 0,356 0,848 1,251 1,136 CD 1,564 0,770 0,597 0,321 CI —0,051 —0,002 0,534 0,464 Se 0,0423 0,0452 0,0528 0,0519 Su 0,0387 0,0658 0,0858 0,0663 X 0,90 0,95 1,11 1,09 T0=4c e e, ctox —> min s e, дет. —> min 3PC-3 3PC-2 3PC-3 з'рс-2 4o 3,966 2,500 4,549 2,500 Ч1 —7,171 —3,983 —7,160 —3,320 42 3,181 1,455 3,030 1,097 К 0,785 1,045 1,519 1,403 CD 4,051 1,392 1,994 0,783 Cl —0,030 —0,026 0,275 0,198 Se 0,0216 0,0213 0,0245 0,0249 su 0,0572 0,0361 0,0673 0,0438 X 0,70 0,71 0,82 0,83 s e, ctox. —> min Se ГАТ —> min T — Rr 3PC-3 3PC-2 3PC-3 j 3CP-2 Чо 1,494 2,000 2,437 2,000 Ч1 —2,565 —3,370 —2,995 —2,280 q2 1,052 1,394 1,158 0,784 к 0,442 0,606 1,279 1,216 CD 2,378 2,300 0,905 0,645 Cl —0,044 0,040 0,469 0,414 Se 0,0356 0,037 0,0432 0,0431 Su 0,0485 0,0677 0,0807 0,0672 X 0,85 0,88 1,02 1,03 111. Системы управления со случайными возмущениями
Гл. 13. Параметрически оптимизируемые регуляторы 251 (Т0=4 с и То=8 с) различия в значениях q0 у регуляторов ЗПР-З и ЗПР-2 сказываются на качестве управления не столь заметно. Результаты математического моделирования контуров управле- ния с 3-параметрическим регулятором позволяют заключить сле- дующее. Если по отношению к ступенчатым воздействиям он дей- ствует подобно ПИД-регулятору, то при наличии случайной стаци- онарной помехи n(k) с математическим ожиданием Е{п(к)}=0 его поведение более напоминает регулятор типа ПД. Поскольку отсутст- вует постоянное воздействие, интегрирующие свойства регулятора не проявляются. Если в уравнении (5.2-18) положить Ci=0, то по- люс в точке z=l сокращается и передаточная функция (13-2) пре- образуется в передаточную функцию ПД-регулятора: GR (Z) =^ = К [(1 + cD)-cDz-‘] = q0-q,z-. (13-6) которой соответствует алгоритм управления u (k) = qoe (k)—— q2e (k—1). (13-7) Если случайная помеха n(k) стационарна, причем E{n(k)}—О, можно использовать параметрически оптимизированный регулятор с передаточной функцией (13-6). Однако на практике подобные воз- действия встречаются крайне редко, ввиду чего рекомендуется применять регуляторы (13-2) или (5.2-10), обладающие хотя бы в не- значительной степени интегрирующими свойствами. Для регулято- ра такого типа производятся оптимизация параметров и расчет коэффициентов К и cD- Постоянная интегрирования Cj задается отличной от нуля, что позволяет управлять регулярными состав- ляющими случайного возмущения и снижать величину статической ошибки.
ГЛАВА 14 Регуляторы с минимальной дисперсией Регуляторами с минимальной дисперсией будем называть регуляторы, рас- чет которых основан на минимизации дисперсии регулируемой переменной у (t) var [у (к)] = Е {у2 (к)}. Данный критерий применялся в работе [12.4], причем предполагалось, что формирующий фильтр шума задается уравнением (12.2-31), в котором С (z~x)= =A(z-1). Ввиду того что в этот критерий не входит (со своим весом) управ- ляемая переменная u (t), во многих случаях наблюдались весьма значительный изменения сигнала на входе регулятора. Поэтому в [14.1] было предложена дополнить критерий взвешенным значением управляемой переменной и мини-Т мизировать величину Е {y2(k + i) + ru2(k)}, i = d+l, ; Шум л (к) может описываться как непараметрическими моделями (напри-и мер, переходной характеристикой формирующего фильтра), так и параметрит ческими, типа (12.2-31). Введение управляющего воздействия не позволяем получить минимум дисперсии регулируемой переменной; вместо нее минимизи! руется взвешенная сумма дисперсий регулируемой и управляемой перемен- ных. Регуляторы, оптимизированные по такому критерию, будем именовать регуляторами с минимальной обобщенной дисперсией. Ниже излагается методика расчета регуляторов с минимальной обобщен- ной дисперсией для объектов с запаздыванием и без него. Обычные регуля- торы с минимальной дисперсией могут быть получены как частный случай при г = 0. Для описания формирующих фильтров используются параметри- ческие модели, которые наиболее удобны при синтезе адаптивных алгоритмов управления, основанных на идентификации параметров. 14.1. РЕГУЛЯТОРЫ С МИНИМАЛЬНОЙ ОБОБЩЕННОЙ ДИСПЕРСИЕЙ ДЛЯ ОБЪЕКТОВ БЕЗ ЗАПАЗДЫВАНИЯ Допустим, что объект управления имеет передаточную функцию ' 7 u (z) A(z-1) l + aiZ-1-]-• • 4-amz-m ’ v ’ формирующий фильтр шума— Ст n(z> ^D(z-1) X[l + d1z-14-...4-dniz-'n] . А. Gpv (z) = .-(14.1-2) Предполагается, что v (k) — это некоррелированный случайный сигнал, причем 1 при Е {v (k) v (к + т)} = < 1 ’ [0 при т = О, т Oj (14.1-3) Е {v (к)} == у =з0.
Гл. 14. Регуляторы с минимальной дисперсией 253 Структурная схема рассматриваемой системы управления пред- ставлена на рис. 14.1.1. Будем считать, что задающее воздействие w(k) = 0; при этом е(к) = —у (к). Требуется построить регулятор, обеспечивающий минимум критерия I (к+ 1) = Е {у2 (к + 1) + ruB (к)}. (14.1-4) Этот регулятор должен вырабатывать такую последовательность входных воздействий и (к), которая минимизирует ошибку вида (14.1-4), вызванную случайным возмущением {v(k)}. Отметим, что Рис. 14.1.1. Регулятор с минимальной обобщенной дисперсией в системе управле- ния с объектом без запаздывания. в критерии качества I используется величина у (к+1), а не у (к), поскольку в исходной модели Ьо=О (т. е. прямая передача отсутст- вует), в силу чего управляющее воздействие и (к) не оказывает вли- яния на величину регулируемой переменной у (к). Ввиду этого не- обходимо выразить у (к+1) в функции ранее наблюдавшихся зна- чений у (к), у (к—1), . . . ; и (к), и (к—1), .... Согласно уравне- ниям (14.1-1) и (14.1-2), предсказанное значение у (к+ 1) можно получить из выражений ZY(Z) =I{^)ZU(Z) + ZC^)ZV(Z)’ (14.1-5) A (z-1) С (z-1) zy (z) = В (z-1) C (z-1) zu (z) + kA (z-1) D (z-1) zv (z). (14.1-6) Последнее перепишем в развернутой форме: (l+a1Z-1+.. + amz-m) (1+ c1z-1+ .. . +cmz~m) zy (z) = = (b1z"1+ . . . +bmz-m) (l+c1z-1 + . . . +cmz~m) zu (z)+ (14.1-7) + Z(l + a1z-1+ .. . +amz-m) (1 +d1z~1+ . .. +dmz-“')zv (z). Выполнив умножение и возвратившись во временную область, имеем У (к+ 1) + (Hj + cJ у (к) + ... +amcmy (к—2m + 1) = — bjU (k)+(b2+bxCf) и (к— 1) + ... + bmcmu (к—2m + 1) + (14.1-8) + Z [v (к + 1) + (aj + d£) v (к) + ... + amdtav (k—2m + 1)].
254 4. HI. Системы управления со случайными возмущениями Подставим полученное соотношение в критерий (14.1-4): I(k+1) = E{[— (ах4-сх) у (к) —... —amcmy (k—2m4- 1)4- + b1u(k) + (b2 + b1c1)u(k —1) + . .. (14.1-9) ... +bmcmu (k—2m + l)4-X[(a14-d1)v(k)+... ... +awdmv(k—2m 4- 1)] 4- Xv (k-Ь l)]24-ru2(k)}. В момент времени k все величины, входящие в (14.1-9), извест- ны, за исключением u(k) и v(k-H)- Поэтому, беря математическое ожидание последней, учтем, что она не зависит от остальных пере- менных: I (к4-1) = [— (ах-f-cj у (к)— ... —amcmy (к—2m + 1)4- 4-bjU (k)+(b2+b1cl)u (к — l)+...4-bmcmu (к—2m+l) + +^ [(ai + dx) v (k)+... +amdmv (k—2m + 1)]]2+ -p?E {v2 (k + 1)}+ (14.1-10) +2X[— (a1+c1) у (k)—... 4-bmcmu (k—2m+l) + +4(af + dx) v (k)+ ... +amdmv (k —2m + l)]]x xE{v(k+l)) + ru2(k). Оптимальное значение управляющей переменной и (к) опреде- лим из условия = 2 [— (а± + Gj) у (к) —... — атсжу (к—2m + 1) + bxu(к) + +(b2+b1ci) и (к—l)4-...-}-bmcmu (к—2m+l)+ (14.1-11) + [(ах+dj v (к) +... +aradmv (к — 2т +1)]] X X bf + 2ru (к) = 0. Преобразуем множитель при Ьх в уравнении (14.1-11), воспользо- вавшись соотношением (14.1-8): [zy(z)—Azv (z)] bj-j-ru (z) = 0. (14.1-12) Подставив выражение (14.1-5) в (14.1-12) Xzv <z> = +4zу <z> — -A(s-i)D(s->) ZU (Z)’ получим окончательный результат в виде передаточной функции регулятора с минимальной обобщенной дисперсией (далее он сокра- щенно именуется РМД1): rz _u(z) Q(z-1) _ A (z-1) [D (z-1)-C(z~1)] z <аРМд 1 (z) = —у = =---------------------------------. ) zB(z-l)C(z~1)4-4-A(z-1)D(z-1) Df (14.1-13) Как следует из (14.1-13), в описание этого регулятора входят элементы модели объекта управления (полиномы A (z-1) и В (z-1))
Гл. 14. Регуляторы с минимальной дисперсией 255 и модели случайного возмущения (полиномы c(z-1) и D(z-1)). При г = 0 (14.1-13) дает упрощенный вариант регулятора с мини- мальной дисперсией (сокращенное обозначение — РМД2): G A(Z-i)[D(Z-i)-C(z-i)]z _ zA(z-i) rD(z-i) 1 <JPMA2(Z) zB (z-1) C (z-1) zB(z~1) Lc(z-J) J • (14.1-14) В случае C (z-1) = A (z-1), рассмотренном в работе [12.4], пере- даточная функция регулятора, обозначаемого РМДЗ, приобретает вид Срмдз (z) = - tD^-^-Mz-^z . (14.1-15) zB (z-il + ^-Dtz-i) При r = 0 (14.1-15) переходит в передаточную функцию регу- лятора РМД4: Gpma4(z)=—|Р(г~в72-1(у1)12- (14.1-16) Синтезированные регуляторы существенно отличаются по своим характеристикам. а) Порядки передаточных функций Числитель Знаменатель РМД1 2m — 1 2m РМД2 2m —1 2m —1 РМДЗ m — 1 m РМД4 m— 1 m— 1 Ввиду того что регуляторы РМД1 и РМД2 имеют более высокий порядок по сравнению с РМДЗ и РМД4, предпочтительнее пользо- ваться моделью шума со знаменателем C(z~1)==A(z~1). б) Сокращение полюсов и нулей Эффекты, возникающие в системах с регуляторами и объектами управления, у которых имеются близкие или совпадающие нули и полюса, обсуждались в гл. 6. Принимая во внимание результаты этого анализа, можно установить следующее: РМД1: Сокращению подвергаются полюса объекта управления (A(z-1)=:0). Следовательно, регулятор этого типа нельзя исполь- зовать для управления неустойчивыми объектами или объектами с малым запасом устойчивости. РМД2: Сокращаются как полюса, так и нули объекта управления (A(z)—0; B(z)=0). Это означает, что данный регулятор ограничен тем же классом объектов, что и РМД1. Кроме того, он не может
256 4. III. Системы управления со случайными возмущениями применяться для управления объектами с неминимально-фазовыми звеньями. РМДЗ: Ограничений нет. РМД4: Сокращаются нули объекта (В(г~*)=0). Следовательно, регулятор этого типа нельзя использовать с объектами, имеющими неминимально-фазовые характеристики. Таким образом, наиболее универсальным является регулятор типа РМДЗ. в) Устойчивость Будем полагать, что ограничения п. а) соблюдены. Характери- стическое уравнение замкнутого контура управления 1— —Gr(z~1)Gp(z~1)=0 с регулятором РМД1 или РМД2 имеет вид A(z-1)H-zB(z~1)] D(z~1)z2m= [j- A(z) +zB(z)] D(z)«O. J (14.1-17) Устойчивость контура управления обеспечивается при выпол- нении следующих условий: РМД1 и РМДЗ (г#=0): < 1 Нули полинома числителя D(z) передаточной функции форми- рующего фильтра шума должны располагаться внутри единич- ной окружности на плоскости z. < 1 Нули полинома A (z) + zB (z)^j должны располагаться вну- три единичной окружности. Чем больше весовой коэффициент г, с которым входит управляющая переменная в критерий качества, тем ближе эти нули к корням -полинома A(z), иначе говоря, к полюсам объекта управления. РМД2 и РМД4 (г-0): • При г = 0 характеристическое уравнение замкнутого контура переходит в zB (z) D (z) = 0. • Таким образом, необходимо, чтобы нули числителей передаточ- ных функций объекта В (z) и формирующего фильтра шума D (z) лежали внутри единичной окружности. • Полюса формирующего фильтра (т. е. корни уравнения C(z) =0) не влияют на характеристическое уравнение замкнутого контура с регулятором РМД2 Поэтому на распределение этих полюсов не накладывается никаких ограничений. г) Динамический показатель регулирования Для регулятора РМД1 данный показатель определяется форму- лой ! zB(z^)C(z-i)+~-A(z-1)D(z-i) R П0 1—GR(z)Gp(2) £_L_A(z-i) +zB (z-i)j Dfz-1) (14.1-18)
Гл. 14. Регуляторы с минимальной дисперсией 257 При г = 0 (т. е. для регулятора РМД2) эта формула приобре- тает вид Рассматриваемый показатель при г = 0 связан обратной пропор- цией с передаточной функцией формирующего фильтра шума. Нетрудно видеть, что Gv (z-1) = - R (z) Gpv (z) 1 = 1. (14.1 -20) Следовательно, замкнутый контур ведет себя подобно системе с передаточной функцией, обратной по отношению к передаточной функции формирующего фильтра. Полюса и нули модели объекта управления не входят в выражение (14.1-19), поскольку они сокра- щаются с полюсами и нулями регулятора. Тем не менее с увеличе- нием веса управляющей переменной г полюса объекта, как следует из соотношения (14.1-18), оказывают все большее воздействие на динамику замкнутого контура. д) Регулируемая переменная y(k) В контуре управления с регулятором типа РМД1 влияние слу- чайного возмущения на регулируемую переменную характеризует- ся передаточной функцией . . т- Gp (z) G (Z-J) = у!?)- — __ x v__________ v z-v (z) 1 — Gr (z) Gp (z) Л A (z->) D (z-X) + zB (z-1) C (z-1) JLA(z-1)[d(z-1)-C(z-1)1 __ _ 1 | D1______I______________J [_LA(z-J) + zB(z-i)] C(z-!) |JLA(z-1) + zB(z-4] C(z-1) ’ (14.1-21) При r=£0 регулируемая переменная у (k) представляет собой авторегрессионный процесс со скользящим средним порядка 2m для РМД1 и порядка m для РМДЗ. Устремляя г к нулю, т. е. переходя к регуляторам РМД2 и РМД4, видим, что в пределе у (z) —> Xv (z). Таким образом, при г = 0 регулируемая переменная превращается в процесс с независимыми значениями, т. е. в белый шум, обладающий дисперсией Оу = Х2о2. Чем меньше становится весовой коэффициент г при управляющей переменной, тем меньше дисперсия регулируемой переменной у (к) и тем ближе последняя к белому шуму Xv(k). Следовательно, наименьшее значение Оу, которое можно получить при использовании регуляторов с мини- мальной дисперсией, равно min var [у (k)] = Z2. (14.1-22)
258 4. III. Системы управления со случайными возмущениями е) Особый случай Если D(z’1)=C(z~1), передаточные функции всех рассматривав' мых регуляторов с минимальной дисперсией обращаются в нуль. Действительно, в том случае, когда статистически независимый шум n(k)=Xv(k) непосредственно воздействует на регулируемую пере- менную, никакой регулятор не способен снизить ее дисперсию. Дисперсию можно уменьшить лишь при наличии «окрашенного» шума, и, чем сильнее он «окрашен», т. е. чем больше разность [D(z-1)—C(z-1)], тем значительнее эффект от введения в контур управления регулятора с минимальной дисперсией. ж) Поведение регуляторов с минимальной дисперсией в при- сутствии случайного возмущения с постоянной составляю- щей Е (v (к)} #=0 Статистический коэффициент усиления регулятора РМД1 можно найти из уравнения (14.1-13), подставив z=1j ОрМД1(1) =______лонщо—с ())___. (14л.23) В (1) С (1) +4- А (1) D (1) ВЬ|Вс,— ~ йцЗД bf bi m В этой формуле 2 обозначает 2 • Если объект управления i = 0 в установившемся состоянии ведет себя подобно статическому звену, т. е. если 2ai#=0 и 2Ь4 #= 0, то аналогичные свойства про- являет и регулятор РМД1. Следовательно, присутствие детерми- нированной составляющей в случайном возмущении приводит к воз- никновению постоянного смещения регулируемой переменной. Этот эффект имеет место и в системах с регуляторами РМД2, РМДЗ и РМД4. Для того чтобы устранить смещение, структуру регуля- торов с минимальной дисперсией следует несколько видоизменить. Данный вопрос обсуждается в разделе 14.3. Основные характеристики описанных регуляторов представлены в табл. 14.1.1. Их анализ позволяет заключить, что в целом наилучшими свойствами обладает регулятор типа РМДЗ. Таким образом, при практической реализации регуляторов с минимальной дисперсией целесообразно рассматривать случай С (z-1) = A (z-1). При выводе уравнений регуляторов предполага- лось, что Ьо = 0. Если это условие не выполняется, т. е. Ьо =^= О, достаточно заменить Ьх на Ьо и использовать далее В (z-1) =5 == b0 4- bfz-1 4- Ьтг~т. з) Выбор весового коэффициента Для того чтобы оценить влияние коэффициента г на величину управляющей переменной, определим первое значение сигнала п(0), полагая, что на вход замкнутого контура управления подается сту-
Гл. 14. Регуляторы с минимальной дисперсией 259 Таблица 14.1.1 Характеристики регуляторов с минимальной дисперсией (А- = 0 обозначает, что корни полинома А располагаются либо на единичной окружности, либо вне ее) Тип регуля- тора gr Условия возмож- ной потери устойчи- вости Условия неустой- чивости Условия отсутствия смещения W = n=Uv= 1 w=n = 1 РМД1 zA [D—С] А-=0 D"=0 — — zBC-p--— AD bx РМД2 г = 0 zA (D —C) zBC 1 03 > 1 1 II II о о 03 и 1 1 II II о о с (1) = 0 С(1)=0 РМДЗ С = А z[D —A] — D~ = 0 — А(1)=0 ZB + -T-D bi РМД4 И ° | О Л z [D —A] zB в- = о 03 о 1 1 II || о о — А (1)=0 пенчатый сигнал w (k) = 1 (к). Из уравнения (5.2-30) следует, что в этом случае и (0) = qow (0) = q0. Очевидно, величина сигнала на входе объекта однозначно определяется показателем q0. Если алго- ритм управления записан в форме обобщенного линейного регуля- тора (11.1-1), то для РМД1 (14.1-24) ь>+к для РМДЗ (14.1-25) ь‘+т- bl Из этих формул видно, что при r/bj^bf коэффициент q0 при- близительно обратно пропорционален отношению г/Ьг При г = 0 имеем q0 = (d1—cJ/bj (регулятор РМД2) и q0 = (dx — aJ/bj, (регуля- тор РМД4). Эти значения можно уменьшить вдвое, взяв г = Ь=. (14.1-26)
260 4. 111. Системы управления со случайными возмущениями Величину Ьх можно оценить, подавая на вход объекта постоян- ный входной сигнал и0. При этом Ьх= у (1)/и0. Если модель объекта управления содержит запаздывание (см. раздел 14.2), получаем одну и ту же формулу как для РМД1-3, так и для РМДЗ-з: q,_—!и—. (14.1-27) ь‘+-ь7 14.2. РЕГУЛЯТОРЫ С МИНИМАЛЬНОЙ ОБОБЩЕННОЙ ДИСПЕРСИЕЙ ДЛЯ ОБЪЕКТОВ С ЗАПАЗДЫВАНИЕМ Объект управления может описываться передаточной функцией, учитывающей наличие запаздывания: GP(z) = ^=^z- = г~>. (14.2-1) v ' u (z) A (z x) 14-atz 1+---+aniZ m x Структура системы управления с объектом такого типа изобра- жена на рис. 14.2.1. В систему включен фильтр, формирующий Рис. 14.2.1. Регулятор с минимальной дисперсией в системе управления с объек- том, содержащим запаздывание. в соответствии с уравнением (14.1-2) случайное возмущение n(k) из белого шума v(k) с характеристиками (14.1-3). Поскольку управляющая переменная и (к), подаваемая на вход объекта с за- паздыванием d, оказывает воздействие на значения регулируемой переменной, начиная лишь с у (k+d+1), используем в данном слу- чае критерий I (к + 1) = Е {у2 (к + d + 1) + ru2 (к)}. (14.2-2) Согласно (14.1-5), предсказанное значение y(k-|-d4-l) можно определить из соотношения z<a+1’y (z) = ги (г) z'd+1’ v (z)- (14.2-3) В момент времени к, для которого рассчитывается управле- ние и (к), значения случайного шума v (k-ф 1), ..., v(k + d-{-l)
Гл. 14. Регуляторы с минимальной дисперсией 261 еще неизвестны Учитывая это, разделим выражение, описывающее формирующий фильтр в (14 2-3), на две части: z'd+” у w(г)+’1 [F <z‘‘) г“‘+” +г<А]v <z)- <14-2’4> На рис 14 2.1 формирующий фильтр также представлен в виде двух составляющих: F (z-1), описывающей ту часть последователь- ности значений и (к), которые не могут быть подавлены за счет и (к), и z_(d+1) L (z-1)/C (z-1), соответствующей тем значениям п (к) в у (к), на которые и (к) воздействует. Введенные в (14 2-4) поли- номы имеют вид F (z-1) = 1 + fjZ-1 + . . . + fdz-d, (14.2-5) L (z~x) = Zo + Z.z-1 + .. + (14 2-6) Их параметры можно определить путем непосредственного сравне- ния коэффициентов при одинаковых степенях z в уравнении D (z-1) = F (z-1) С (Z’1) + z-(d+1) L (z-1). (14.2-7) Пример 14.2.1. При т = 3 и d=l из выражения (14 2-7) получаем fl = di—Cl, Iq — d2— C2— Cifl, Zl — dg— Cg — C2fi, /2 —— Cgfi, а при m = 3 и d = 2: fl = di — Cl, f2 = d2 — C2 — Cifl, Zfl = dg — Cg — Cif24~C2fi, Zl = — c2f2 — Cgfi, Z2 — — Cgf2 Для того чтобы определить коэффициенты полиномов при т==2, достаточно ПОЛОЖИТЬ Cg— dg = O; при m = l c2 = d2 —Cg—d3 = 0. Уравнение (14 2-4) можно переписать в форме A(z~1) С (z-1) z(d+1) у (z) = В (z’1) С (z*1) zu (z)-F + XF (z"1) A (z-1) C (z"1) z<d+1> v (z) -F XL (z~x) A (z~4) v (z). (14 2-8) По аналогии с уравнениями (14.1-7) — (14 1-10) произведем перемножение полиномов и, вернувшись во временную область, получим выражение для I (k-|- 1). Из условия di (кф- l)/du (к) =0 следует [z(d + 1) у (z) — XF (z"1) z(d + 1) v (z)] bi-|-ru (z) = 0. (14 2-9) Подставим в (14-2-9) выражение для z(d + 1)y(z) из уравнения (14.2-3): . . . C(z-i) . . В (z-1) C(z-i) . XV <Z’ = У <Z)-A(z--jD(z-‘)Z U <Z>-
262 Ч. III. Системы управления со случайными возмущениями Отсюда имеем окончательный результат в виде передаточной функции GpMDi з (z) = u(z) = — A<z-1> = y(z) zB (z-1) С (z-1) F(z-1)-J-JL A(z-1)D(z-1) bl A (z-1) L (z-1) zB (z-1) C (z-1) F (z-i) A (z-1) D (z-1) (14.2-10) При r = 0 (14 2-10) переходит в передаточную функцию GpMD2.3(z) = -zB(zA_<yc1)(zL.<yF;>.1). (14.2-11) Если С (z-1) = A (z-1), то при гт^О (14.2-10) дает GpmD3-3 (z) =-----------L(z~1)-r------, (14.2-12) zB (z-i)F(z-i)+-£-D(z-i) а при г = 0 Gpmo..,(z) = - (14.2-13) Перечислим основные особенности регуляторов для объектов с запаздыванием (d#=0). а) Порядки передаточных функций РМД1-3 и РМД2-з. Числитель: 2m—I; знаменатель: 2m-|-d—1 (d^ 1). РМДЗ-з и РМД4-з. Числитель: m—1; знаменатель: m-|-d—l(d^l). б) Сокращение полюсов и нулей Явления, аналогичные тем, что возникают в системах с объ- ектами без запаздывания. в) Устойчивость Запишем характеристические уравнения регуляторов РМД1-3 и РМДЗ-з: |j-A(z) + zB(z)]D(z)=0, (14.2-14) а также регуляторов РМД2-3 и РМД4-з: zB(z)D(z) = 0. (14 2-15) Очевидно, данные уравнения совпадают с соответствующими характеристическими уравнениями регуляторов для объектов без
Гл. 14. Регуляторы с минимальной дисперсией 263 запаздывания. Следовательно, все выводы относительно устойчи- вости систем с этими регуляторами остаются в силе. а) Динамический показатель регулирования Для регулятора РМД1-3 данный показатель определяется выражением v м zB (z-1) с F <z-1)+t~ а (z-1) d (z-1) R(z)=^ =-----------Г?-------------' <14-2’16’ U |^-A(Z-1)+ZB(Z-1)JD(Z-1) При r = 0 (для РМД2-з) имеем d zz\ — C(z~1)F(Z~1) _ % p/z-i\_i z-(d+D L(z-1) D(z-1) - Gp (z) r^Z Z D(z-1)' (14.2-17) Из (14.2-17) следует, что динамический показатель регулиро- вания, как и прежде, обратно пропорционален передаточной функ- ции формирующего фильтра. Однако на этот раз в нем присут- ствует сомножитель F (z-1), учитывающий те члены последова- тельности случайных возмущений v (к 4-1).. .v (k4-d+ 1), кото- рые не могут быть подавлены с помощью управления и (к). д) Регулируемая переменная Для систем с регуляторами РМД2-з и РМД4-3 (случай г = 0) отношение полезного сигнала к шуму выражается формулой X^=R(z)Gpv(z)|=F(z-‘). (14.2-18) Таким образом, у (к) представляет собой процесс со скользя- щим средним: у (k) = [v (к) + f1V (к-1) + ... + fdv (к—d)l X, (14.2-19) причем его дисперсия равна var [у (к)] = Е {у’ (к)} = [1 + + ... + f5] V. (14.2-20) Очевидно, что увеличение продолжительности запаздывания должно приводить к росту дисперсии регулируемой переменной. 14.3. РЕГУЛЯТОРЫ С МИНИМАЛЬНОЙ ДИСПЕРСИЕЙ БЕЗ СТАТИЧЕСКОГО СМЕЩЕНИЯ Для того чтобы постоянные внешние возмущения или ступенча- тые изменения задающей переменной не приводили к появлению постоянных смещений регулируемой переменной, передаточная функция регулятора должна удовлетворять условию (см. гл. 4) limGR(z) — оо. (14.3-1) Z—>1
264 Ч. III. Системы управления со случайными возмущениями Поскольку это условие не выполняется для синтезированных регу- ляторов с минимальной дисперсией, в их структуру должны быть внесены некоторые изменения. Ниже излагаются три метода построения регуляторов без статического смещения. 14.3.1. Введение дополнительного интегрирующего члена В простейшем случае для устранения статических смещений достаточно включить в передаточную функцию регулятора с мини- мальной дисперсией полюс в точке z=l. Более гибким методом является введение в регулятор Сид(г) = ЩЙ (14.3-2) звена пропорционально-интегрирующего типа, описываемого пере- даточной функцией Gn" <z> = 1 +^Т = (14.3-3) Это равносильно добавлению разностного уравнения u (k) —и (к— 1) = и' (к) —(1 — а) и' (к— 1). (14.3-4) Варьируя коэффициент а, можно получать регуляторы с различ- ными свойствами: а = 0: u(k) = u'(к) —регулятор П-типа; а = 1: и (к)— и (к—1) = и'(к) — регулятор ПИ-типа с равными весами И- и П-звеньев. Если а=^0, условие lim Gr (z) = lim Омд (z) Gnn (z) — oo z-> 1 z-> 1 выполняется для регуляторов РМД1 и РМД2 при D(1)=/=C(1), а для РМДЗ и РМД4 — при D(1)=#A(1). В тех случаях, когда ука- занные соотношения между полиномами не соблюдаются, можно изменять их, вводя дополнительные полюса при z=l: в РМД2 C'(z)=(z—l)C(z); в РМДЗ и РМД4 A'(z)=(z—l)A(z). Данный способ не дает желаемого эффекта лишь для регулятора РМД1. Влючение в регулятор звеньев интегрирующего типа позволяет избавиться от статического смещения. В то же время это приводит к возрастанию дисперсии переменной у (к), особенно в случае высокочастотного возмущения v(k). Надлежащим выбором а можно добиться ошимального соотношения между этими явлениями.
Гл. 14. Регуляторы с минимальной дисперсией 265 14.3.2. Минимизация ошибки регулирования Синтез регуляторов с минимальной дисперсией в разделе 14.2 проводился в предположении, что задающий сигнал отсутствует, т. е. w(k)=0, ввиду чего у(к)=—е(к). Используя расширенный критерий качества I (к 4-1) = Е {[у (к 4- d + 1)—w (к)]2 4- г [и (к) — uw (к)]2}, (14.3-5) можно минимизировать дисперсию регулируемой переменной в ра- бочей точке lw(k); uw(k)J, соответствующей ненулевому задающему сигналу. Здесь величина u„(k)=|^w<k)=KFw(k) <14'3’6’ равна такому значению и (к), при котором отсутствует статическое смещение, т. е. y(k)=w(k). Выполнив те же преобразования, что и в разделе 14.2, получим уравнение модифицированного регуля- тора с минимальной дисперсией [14.2]: /4 L (z-1) [D (Z-1)—C(z-i)] z ... U (z) =------------11---------->---Д----U-----------У (z) + zB (z-1) C (z-1) F (г-г)4--г- A (z"1) D (z"1) bi °РМД1-з (z> ____________A (z-1) D (z~~4)________ zB (z-1) C (Z-1) F (z-44-4- a (z-1) D (z-1) bi (14.3-7) Данный регулятор обеспечивает устранение смещений, возни- кающих в результате изменения задающей переменной w(k). Дру- гой подход к построению регуляторов с аналогичными свойствами, основанный на оценивании параметров замкнутого контура управ- ления, изложен в разделе 25.3. 14.4. РЕГУЛЯТОРЫ С МИНИМАЛЬНОЙ ДИСПЕРСИЕЙ ДЛЯ ОБЪЕКТОВ ТИПА ЧИСТОГО ЗАПАЗДЫВАНИЯ Полученные в разделе 14.2 регуляторы с минимальной дисперсией обла- дают оптимальной структурой по отношению к объектам вида В (z-1) z~d/A (z-1) и формирующим фильтрам шума D (z-1)/C (z-1). При их выводе предполага- лось, что объект описывается разностным уравнением, в котором учтено на- личие запаздывания. Как следует из уравнений (14.2-18)—(14 2-20), в этом случае в системах с регуляторами РМД2-3 и РМДЗ-з регулируемая перемен- ная представляет собой процесс со скользящим средним порядка d, причем его дисперсия резко возрастает с увеличением d. Здесь мы рассмотрим регуляторы с минимальной дисперсией применительно к объектам, которые, как и в разделе 9.2.2, опи- сываются моделями типа чистого запаздывания: GP (z) = В (z-1) z-^"1» = b1z-1z-<d-1> = bxz-d, (14.4-1)
266 Ч. III. Системы управления со случайными возмущениями Воспользовавшись результатами раздела 14.2, получим следую- щие уравнения регуляторов (ср. с уравнением (9.1-4)): а) Формирующий фильтр шума имеет вид Gpv = c . GPmai.,=--------------L (г~‘Ц----------, (14.4-2) b,C(Z->) F(2-i)+-i-D (г->) с№мдг., = - (14.4-3) где, согласно (14.2-5), F(z~1) = l 4-fjZ-1-!- . .. +fd_1z-(d-1). (14.4-4) В соответствии с (14.2-7) полиномы, входящие в формулы (14.4-2) и (14.4-3), связаны соотношением D (z-1) = F (z-1) С (z-1) + z~dL (z-1). (14.4-5) Следовательно, передаточные функции регуляторов отличаются от нуля только в тех случаях, когда полином С (z-1) имеет поря- док m^l и/или D (z~x) — порядок m^d. б) Формирующий фильтр шума имеет вид Gp (z-1) = D (z"1); C (z"1) = A (z~x) == 1. r- / \ L (z-1) ОрМДЗ-з (z) — --------- b1F(z-x) + ^-D(z-x) Ормд4-з (z) = -b1F(z-xr (14.4-6) (14.4-7) Согласно уравнению (14.2-7), в данном случае L(z-1)=0 (т. е. регулятор нереализуем), если у полинома D(z-1) порядок med—1. Это еще раз подтверждает принцип, лежащий в основе синтеза ре- гуляторов с минимальной дисперсией. Он состоит в получении оцен- ки регулируемой переменной у (k+d+1) по известным значениям u(k—1), u(k—2), ... и v(k—1), v(k—2), .... Предсказанная оценка используется далее для вычисления управляющего сигнала u(k). В соответствии с уравнениями (14.2-4) и (14.2-19) значения регулируемой переменной и элементов последовательности случай- ного шума связаны соотношением Yv (k + d4- 1) = [v (к + d) 4- fxv (к4-d— 1) + ... 4- fd_iv (к -j- 1)] Л. (14.4-8) Очевидно, данная величина при med—1 не поддается оценке, ввиду чего регулирование невозможно. Если m=d—1, то yv (k-Fd 4-1) — [v (к 4- d) 4- dxv (к d — 1) 4- • • • + dd -iv (к 4-1)] (14.4-9)
Гл. 14 Регуляторы с минимальной дисперсией 267 В этом случае D(z-1)=F(z-1), т. е. возмущающий сигнал содер- жит только те составляющие, на которые не воздействует управле- ние u(k). Следовательно, регулятор с минимальной дисперсией при m=d—1 не оказывает никакого влияния на функционирование замкнутого контура управления. Только при m^d регулятор этого типа позволяет уменьшить дисперсию у (к) по сравнению с той, которая наблюдается на выходе разомкнутого контура. Таким образом, если модель объекта управления представляет собой чистое запаздывание, регуляторы с минимальной дисперсией способны повысить качество управления лишь в том случае, когда возмущение n(k), действующее на у (к), является авторегрессион- ным процессом со скользящим средним (окрашенным шумом) или процессом со скользящим средним порядка m^d. 14.5. результаты математического моделирования В этом разделе представлены данные экспериментального исследования свойств регуляторов с минимальной дисперсией. Они получены в результате моделирования на ЭВМ контуров управления тестовым объектом второго порядка с регуляторами РМДЗ и РМД4. Объект VII (низкочастотный фильтр второго порядка) А (г"1) = 1—1,036г-14- 0,263г"2 В (z"1) = 0,1387г"1 4-0,0889г"2 D(z"1) = l 4-0,5z"14-0,25z"2 (14.5-1) Полиномы A(z“x) и В (г"1) получены путем дискретизации пере- даточной функции G = (14-7,5s) (14-5s) с тактом квантования Т0=4 с. В процессе моделирования контура управления с регулятором РМД4, описываемого уравнением (14.1-5), оценивались средние квадратичные отклонения сигнала помехи n(k), регулируемой пере- менной у (к) и сигнала на входе объекта и (к). Значения весовых ко- эффициентов при входной переменной и интегральной составляющей регулятора (14.1-25) изменялись в пределах г=0—0,5 и а=0—0,8 соответственно. Определялась зависимость показателя стохастиче- ского управления ______ х=]/y2Tkj/]/'n?(k) . (14.5-2) от величины ____ su = -/^W. На рис. 14.5.1 построены кривые, полученные в результате усреднения по 150 реализациям. Анализ этих графиков позволяет сделать следующие выводы:
268 Ч. III. Системы управления со случайными возмущениями — Наилучшее качество управления (минимальное значение по- казателя х) достигается при г=0 и а=0, т. е. с помощью регулятора типа РМД4. — При небольшом увеличении весового коэффициента г до 0,01—0,02 среднее квадратичное значение управляющей перемен- ной снижается на 48—60% по сравнению с тем, которое наблюдается Рис. 14.5.1. Зависимость показателя х от затрат на управление Su для объекта VII с регулятором РМД4 при различных значениях весовых коэффициентов г и а. при г=0. В то же время эффективная-величина регулируемой пере- менной возрастает незначительно, всего на 12—17% (все приведен- ные цифры соответствуют а=0). Лишь при г^0,03 показатель х начинает заметно расти. — Если значения весового коэффициента при интегральной со- ставляющей регулятора невелики (ас0,2), с его уменьшением эф- фективная величина регулируемой переменной несколько увеличи- вается (на 3—18%, в зависимости от г). Однако при а>0,3 показа- тель эффективности стохастического управления резко возрастает. На рис. 14.5.2, а показан фрагмент реализации случайной по- мехи n(k) при Х=0,1, а также соответствующие значения сигналов управления n(k) и регулируемой переменной у (к), полученные для регулятора типа РМД4 (г=0) с передаточной функцией г . . 11,0743—0,0981г-1 <JPMfl4(Z)— 14-0,6410z-i и для регулятора РМДЗ (г = 0,02) с передаточной функцией 5,4296 — 0,0481Z-1 UPMA3(Z)— 14-0,569z-1 + 0,1274z-2 •
Гл. 14. Регуляторы с минимальной дисперсией 269 10 1П а) Случайте возмущение п(к) й) Ступенчатый задающий в) Ступенчатый За- сигнал (2=0 дающий сигнал ю(Н), а=о,г Рис. 14.5.2. Переходные процессы в контурах управления объектом VII с регу- ляторами РМДЗ и РМД4. Из приведенных графиков видно, что величина среднего квадра- тичного отклонения у регулируемой переменной у (к) существенно ниже, чем у возмущения п(к), причем особенно заметно сглажива- ются выбросы значительной амплитуды. Однако указанный эффект
270 4. 111. Системы управления со случайными возмущениями достигается за счет подачи больших управляющих сигналов п(к). При переходе к регулятору РМДЗ, рассчитанному для г=0,02, амплитуды сигналов управления уменьшаются, но в то же время несколько возрастают максимальные значения регулируемой пере- менной. На рис. 14.5.2, б показано, как изменяются регулируемая и уп- равляющая переменные, если на вход системы поступает ступен- чатый задающий сигнал. Сигнал управления, формируемый регу- Рис. 14.5.3. Переходные процессы в контурах управления объектом VII с регу- ля юрами РМДЗ и РМД4 при различных г и а. лятором РМД4, отличается в этом случае высокой колебательностью и значительной амплитудой. Колебания проявляются и на выходе объекта; имеется также статическое смещение. В аналогичных ус- ловиях апериодический регулятор AP(v) выдает входной сигнал с максимальной амплитудой u(0) = l/(b14-b2)=4,4; значения вход- ных сигналов, генерируемых регулятором РМД4, более чем вдвое превышают эту величину. Кроме того, контур управления, на вы- ходе которого наблюдается статическое смещение при подаче детер- минированного ступенчатого сигнала w(k), не отвечает требованиям,
Г л. 14. Регуляторы с минимальной дисперсией 271 предъявляемым к качеству регулирования. Характеристики уп- равления, получаемого с помощью регулятора РМДЗ при г=0,02, значительно лучше. Однако и в этом случае амплитуда сигнала и(0) превосходит соответствующее значение для регулятора AP(v), а величина смещения даже больше, чем в контуре с регулятором РМД4. Как видно из рис. 14.5.2, в, при введении а=0,2 смещение исчезает, а регулируемая и управляющая переменные изменяются более плавно, чем при а=0 (см. рис. 14.5.2, б). Графики переход- ных процессов на выходе регуляторов при различных сочетаниях параметров изображены на рис. 14.5.3. Моделирование на ЭВМ было проведено также для объекта III (фильтр третьего порядка с запаздыванием). Оно показало, что с увеличением порядка объекта получение удовлетворительной ре- акции в ответ на ступенчатое изменение задающей переменной ста- новится затруднительным.
ГЛАВА 15 Регуляторы состояния при случайных возмущениях 15.1. ОПТИМАЛЬНЫЕ РЕГУЛЯТОРЫ СОСТОЯНИЯ В СЛУЧАЕ БЕЛОГО ШУМА Рассмотрим ту же модель объекта, что ранее была использо- вана в гл. 8 при выводе уравнений регулятора состояния с детер- минированными начальными' условиями. На этот раз вход этой модели содержит случайную составляющую, описываемую вектор- ным сигналом v (к): х (к4-1) ~ Ах (к) 4-Ви (к) 4- Fv (к). (15.1-1) Предполагается, что помеха v(k) распределена по нормаль- ному закону с математическим ожиданием E(v(k)} = 0 (15.1-2) и ковариационной матрицей cov[v(k), T=i —j] = E (v(i) vT (j)} = V6M, (15.1-3) где Sjj—функция Кронекера, причем /1 при i = j, M ~ j 0 при i #= j. Кроме того, будем полагать, что сигнал помехи v (к) не зави- сит от вектора состояния х(к), а начальное состояние х (0) также случайно и распределено по нормальному закону со статистиками Е{х(0)}=0; ,15М) cov [х (0)] = Е (х (0) хт (0)} = Хо. ' ' Матрицы ковариаций V и Хо положительно полуопределены. Нашей целью является построение регулятора, вырабатываю- щего последовательность входных сигналов и (к), формируемых на основе векторов состояния х (к), все координаты которых до- ступны непосредственному измерению. Эта последовательность сигналов должна обеспечивать достижение конечного состояния х (N)«0, минимизируя одновременно квадратичный критерий качества {N-1 \ хт (N) Qx (N) + 2 [хт (k) Qx (к) + ит (к) Ru (к)] к к =0 f (15.1-5) Предполагается, что в выражении (15.1-5) Q является симметри- ческой положительно-полуопределенной матрицей, a R — симмет-
Гл. 15. Регуляторы состояния при случайных возмущениях 273' рической положительно-определенной. Поскольку и переменные состояния, и входные сигналы в модели (15.1-1) случайны, значе- ние критерия качества I также представляет собой случайную величину. Ввиду этого минимизации подвергается не сама функция I, а ее математическое ожидание (15.1-5). Как и в разд. 8.1, сначала будет получен закон управления, в котором не участвует выходная переменная у (к). Случай, когда переменные состоя- ния не поддаются измерению и для управления используются измеримые, но содержащие случайные погрешности значения выходной переменной, будет рассмотрен ниже, в разделе 15.3. Первые публикации, посвященные исследо- ванию стохастических регуляторов состояния, относятся к 1961 г. Подробное обсуждение регуляторов этого класса можно найти в работах [12.2]—[12.5], [8.3]. Для получения оптимальной последовательности входных сиг- налов u(k) воспользуемся принципом оптимальности Веллмана,, изложенным в разд. 8.1: min Е {I} = min Е < хт (N) Qx (N) + u (к) 1 N—1 ] + S [xT (k) Qx(k)+UT (k) Ru(k)]> = k =0 J = min E min E xT (N) Qx (N) 4- N-i Ц 4- 2 [xT (k) Qx (k) 4-uT (k) Ru(k)] >>, k=0, 1, 2, .N—1. k =0 J J (15.1-6) Если минимум функции I существует, то для него справедливо равенство (см. [12.4], стр. 260) min Е = Е (min 1}. (15.1-7) U U Таким образом, операции поиска минимума и вычисления матема- тического ожидания коммутативны. Отсюда можно сделать вывод, что стохастические регуляторы должны описываться уравнениями того же типа, что и детерминированные. Следовательно, управление определяется соотношением (см. [12.4]) u (N — j) = -Kn-jx (N - j) (15.1-8) совместно с уравнениями (8.1-30) и (8.1-31). Устремив N к бесконеч- ности, получим установившееся решение и (к) = — Kx(k). (15.1-9) Данное выражение описывает стационарный регулятор состоя- ния, принцип действия которого можно пояснить, исходя из сле- дующих соображений. Согласно уравнению (15.1-1), сигнал управ-
274 4. III. Системы управления со случайными возмущениями ления и (к) должен уменьшать величину x(k-f-l). Однако как состояние x(k-j- 1), так и управление и (к) зависят только от теку- щих значений х (к) и v (к) и не зависят от х (к—1), х(к — 2), ... ..., а также от v(k—1), v (к — 2), .... Кроме того, случайное возмущение v(k) не коррелировано с v (к—1), v (к—2)....... Поэтому при больших N в закон управления должны входить только текущие величины, т. е. u(k) = f (х (к)), и уравнение (15.1-9) отвечает этому условию. При сравнительно малых N в законе управления необходимо учитывать также случайное начальное состояние х (0) и помеху v(k). Следовательно, в этом случае не- обходимо пользоваться нестационарным уравнением оптимального регулятора (15.1-8). Поскольку оптимизация по отношению к де- терминированному начальному состоянию приводит к аналогичному по форме соотношению, оказывается, что уравнение (8.1-33) описы- вает регулятор, обеспечивающий оптимальное управление как при детерминированных, так и при случайных помехах (при условии, что в соответствующих критериях качества используются одни и те же весовые матрицы). Получим теперь выражение для ковариационной матрицы X (k -f-1) вектора состояния замкнутого контура управления в установив- шемся режиме. Объединяя соотношения (15.1-1) и (15.1-9), запи- шем уравнение замкнутого контура: х (k-Ь 1) == [А—ВК] х (к) + Fv (к). (15.1-10) Согласно определению (12.2-25), Х(к-М) = [А—ВК]Х(к)[А—• BK]T-|-FVFT. (15.1-11) Это уравнение при к —юо дает искомую ковариационную матрицу X = [А—ВК] X [А—ВК]Т + FVFT. (15.1-12) Значение критерия качества, которое достигается при вклю- чении в контур управления оптимального регулятора состояния, можно определить следующим способом. Подставим в уравнение (8.1-6) выражение (15.1-1) вместо (8.1-7), как это было сделано в разд. 8.1, и выполним последующие преобразования вплоть до (8.1-19). В результате имеем E{In_i,n} = E{xt (N-1)Pn-i,nx(N-1)+vt(N-1)FtQFv(N — 1)}, E{In-i} = E (хт (N—1) Pn_1X (N— 1) + vt (N —1) FTQFv(N — 1)} или для N — 2 E ]IN_2) = Е (xT (N —2) Pn_2x (N — 2)+vT (N—2) FTQFv (N — 2)}+ 4-vT (N — l)FTQFv (N — 1)). Проделаем аналогичным образом все N шагов, учитывая, что v (к) — стационарный случайный процесс: Ь {!«} = Е ]хт (0) Рох (0)} + NE (vT (к) FTQFv (к)). (15.1-13)
Гл. 15. Регуляторы состояния при случайных возмущениях 275 Обозначим установившееся значение Ро = Р и возьмем в ка- честве начального состояния х (0) случайное возмущение Fv(k). Воспользовавшись соотношением (12.2-28), получим окончательное выражение в виде Г = 3J- Е {Io} = Hm, Е {NvT (k) FTPFv (к) + + NvT(k) FTQFv (к)} = tr[FT (Р-Е Q) FV]. (15.1-14> 15.2. ОПТИМАЛЬНЫЕ РЕГУЛЯТОРЫ С ОЦЕНКОЙ СОСТОЯНИЯ В СЛУЧАЕ БЕЛОГО ШУМА В разд. 15.1 предполагалось, что вектор состояния х (к) под- дается точному измерению. Однако на практике это далеко не всегда осуществимо, и, как правило, переменные состояния при- ходится восстанавливать по измеримым координатам системы. Далее будет рассматриваться объект х (k -j- 1) = Ах (k)H- Bu (k) + Fv (к), (15.2-1) у которого вектор измерений выхода определяется уравнением у (к) = Сх (к) + п (к) (15.2-2) или эквивалентным ему у (к+ 1) = Сх (к 4- 1)4-п (к 4- 1). Считается, что погрешности измерения выходных координат представляют собой векторный белый шум со статистиками Е{п(к)} = 0, cov[n(k); т = 1—j]==E{n(i)nT(j)} = N6i). ’ ; В разд. 15.4 будет показано, что неизвестные переменные со- стояния можно оценить с помощью рекуррентной процедуры, име- нуемой дискретным фильтром Кал мана. Этот фильтр, в котором используются измерения у (к) и и (к), описывается разностным уравнением х (к + 1) = Ах (к) -Е Ви (к) + Г (к -j- 1) [у (к + 1) —САх (к) — СВи (к)], (15.2-4) где Г (к 4-1)—матрица коррекции, определяемая из соотношений (15.4-24) и (15.4-26). В пределе при к—>• оо она сходится к по- стоянной матрице Г. Отметим, что для вычисления оценки состоя- ния необходимо знать параметры шумов N, V и F. В работе [12.4] показано, что в законе управления (15.1-9) вектор состояния х (к) можно заменить его оценкой: u(k) = — Kx(k). (15.2-5) При этом вновь получается оптимальный регулятор, миними- зирующий критерий качества (15 1-5), а вся система в целом при-
276 Ч. III. Системы управления со случайными возмущениями А —ВК ] Гх(к)' д—ВК— ГСА] [х(к)_ О Гу (к) ] (15.2-6) обретает вид Гх(к+1) _ х(к+1)] “[ГСА ГР + |rCF Г] [п (к4-1) • Как и в разд. 8.7, введем ошибку оценки вектора состояния x(k) = x(k)—x(k) (15.2-7) и, воспользовавшись линейным преобразованием (8.7-4), запишем систему (15.2-6) в форме [А—ВК О х(к + 1) _ _х (к 4- 1)J “ [i [F + [(1 — ГС) F —rj Ln(k + 1) • ВК 1 Гх(к)’ А— ГСА] [х(к) Гу(к) О (15.2-8) Полученное разностное уравнение отличается от уравнения (8.7-5) присутствием второго слагаемого, определяющего случай- ную составляющую. Кроме того, здесь вместо обратной связи по выходу наблюдателя Ax(k) = HCx(k) используется обратная связь по выходу фильтра состояния Ах (к 4- 1) == ГСАх (к). Она зависит от частотных свойств объекта, поскольку коррекция оценки со- стояния выполняется на основе предсказанного значения Ах (к). Полюса системы управления с регулятором состояния и фильтром находятся из характеристического уравнения системы (15.2.8) det [zl — А*] = det [zl — А 4- ВК] det [zl — А 4- ГСА] = 0. (15.2-9) Как следует из этого уравнения, они включают m полюсов замкнутой системы без фильтра состояния, описываемой соотно- шением (15.1-10), и ш полюсов, принадлежащих фильтру. Таким образом, полюса регулятора и фильтра не зависят друг от друга и могут задаваться отдельно. Следовательно, стохастические регу- ляторы состояния, так же как и детерминированные, подчиняются теореме о разделении. Действительно, в уравнениях фильтра со- стояния не участвуют весовые матрицы Q и R, входящие наряду с матрицами объекта управления А и В в критерий качества, на основе которого рассчитывается линейный регулятор. С другой стороны, при синтезе регулятора не используются ковариационные матрицы V и N, а также матрица случайного возмущения F. Общими в описании этих двух элементов стохастической системы являются только параметры объекта управления, т. е. матрицы А и В. Поскольку регулятор остается неизменным независимо от того, используются ли в нем точные переменные состояния или их опти-
Гл. 15. Регуляторы состояния при случайных возмущениях 277 мальные оценки, к нему применим принцип эквивалентности. Со- гласно этому принципу, при расчете регулятора переменные со- стояния можно считать известными, а затем использовать вместо них оценки, получаемые с помощью фильтра. Последний в свою очередь синтезируется на основе квадратичного критерия и дает оценки с наименьшей дисперсией. Однако подобная схема уже не позволяет минимизировать критерий качества управления (15.1-14), как в случае точного измерения переменных состояния. Это объяс- няется наличием задержки на вычисление оценок и разбросом их значений [12.4]. Необходимо отметить, что принцип эквивалентности справед- лив лишь при условии, что регулятор используется только для управления текущим состоянием, и вырабатываемый им сигнал не оказывает никакого влияния на последующие оценки состояния [15.1]. Более подробное обсуждение принципов разделения и экви- валентности читатель найдет в гл. 25. 15.3. ОПТИМАЛЬНЫЕ РЕГУЛЯТОРЫ С ОЦЕНКОЙ СОСТОЯНИЯ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ При выводе стохастического регулятора состояния (15.2-5) предполагалось, что на вектор состояния х(к-]-1) действует слу- чайное возмущение в виде векторного сигнала v(k). Очевидно, при отсутствии шума измерений, т. е. при n(k)=0, y(k)=Cx(k). В этом случае внутреннее возмущение v (к) проявляется на выходе как yv(k)=Cxv(k), (15.3-1) где xv (к + 1) = Axv (к) + Fv (к). (15.3-2) Однако случайная составляющая выходного сигнала yv (к) может быть вызвана и внешним возмущением £ (к). При этом справед- ливы следующие соотношения (см. рис. 15.3-1)5 гц (к) = Ст] (к), (15.3-3) i](k4-l) = An(k) + F|(k). (15.3-4) Ковариационная матрица сигнала | (к) определяется как cov [|(k), r = i— j] == Збц. (15.3-5) Если возмущение £ (к) рассматривается как внешнее, то к нему применимы все выводы разд. 8.2 и 8.7.2. Когда | (к) играет роль v (к), фильтр выдает оценки переменных состояния модели случай- ной помехи т) (к), полученные на основе измерения векторов щ (к) или у (к). Эти оценки можно использовать в регуляторе состоя- ния (15.2-5) для того, чтобы оптимальным образом подавлять по- меху £ (к) аналогично тому, как ранее подавлялось возмущение v (к).
278 Ч. III. Системы управления со случайными возмущениями Рассмотрим теперь способы построения формирующих фильтров Па(2) = 0ра(г)£(2); j= 1, 2___г, (15.3-6) для случайного возмущения, описываемого уравнениями (15.3-3) и (15.3-4). Будем полагать, что объект управления имеет один Рис. 15.3.1. Объект управления с внешним возмущением. вход и один выход. При этом п^ = гц, и из уравнения (3.2-50) следует, что ns (z)-e’ [zl - A]-1 (z) = (z). (15.3-7) Если F—диагональная матрица, то ru (z) = cT [zl—A]"1 (15.3-8) В этом случае можно, зная величины fi( построить для каж- дой составляющей Ei (z) свой фильтр помехи GPE,(z)=^|-}; i-1,2, (15.3-9) где A (z) = det [zl — А]; (15.3-10) DT (z) = [Dra (z)... Dt (z). .. (z)]T = cT adj [zl — A] F. (15.3-11) Напомним, что объект управления обладает передаточной функ- цией С У (Z) _ В (z) сг adj [zl — А] b (15 3-12) W~u(z)“ A (z) ~ detlzl-A] '
Гл. 15. Регуляторы состояния при случайных возмущениях 279 Нетрудно видеть, что знаменатель GPg совпадает со знаменате- лем GP, а числители этих передаточных функций имеют общие множители. Ниже приведен пример, в котором показано, как опре- деляются числители Di(z) для двух различных канонических форм представления модели объекта управления (см. разд. 3.6). Пример 15.3.1. Рассмотрим объект второго порядка с передаточной функцией Cm (7\ = B(Z) — Н^ + Ьг2-2 _ Ьхг-фЬ2 '' A (z) 1-фахг-1-фа2г-2 г2-фахг-фа2 ’ а) Каноническая форма управляемости: A (z) = det [zl — A] = г2-фахг-фа2; ВИ=(Ь.Ь.1 [(Z+a!ai) z] [?] = = [[b2 (z -ф ах)-фа2Ьх] [b2-фbxz]] j =biz-j-b2. В случае диагональной матрицы F имеем DT (z) = [(b2 (z-ф ax)-ф a2b j) (Ь2-ф bxz)] ° ] = ___Г f2b2z—ф f2axb2 -ф a2bx“l LfibiZ-ф^Ьг J Если входной сигнал (k) представляет собой белый шум, коэффициенты полиномов числителей в уравнении (15.3-9) Dj (z) = ф,г-ф<121 можно опреде- лить, задаваясь следующими условиями: (Ю #0; g2(k) = 0; fx 0; f2 = 0; du = fxbx; d2l = fjb2. 51 (k)=0; g2(k) #0: fx = 0; f2 # 0; du = f2b2; d22 = Г2ахЬ2-фа2Ьх. Таким образом, параметры dxj и d2i не могут принимать произвольные значения, поскольку они зависят друг от друга, и выбор одного коэффициента однозначно определяет величину другого. б) Каноническая форма наблюдаемости: A (z) = г2-фахг-ф а2; В (z) = [0 1] [(z+ai) za2j Z1 [b*]=blZ + b2; dt(z)=[i z] [J2 °] = П2 Г. Следовательно, для данной формы описания числители фильтров помехи имеют вид Di (z) = d2Xz = fxz при gx(k) ф 0; g2(k)=0; D2 (z) = di2 = f2 при gx (k) = 0; g2 (k) # 0.
280 4. Ill. Системы управления со случайными возмущениями Вновь коэффициенты du и d2j нельзя задавать произвольно, так как один из этих параметров всегда должен быть равен нулю. Приведенный пример позволяет заключить, что в тех случаях, когда сигнал возмущения | (к) или v (к) является векторным бе- лым шумом с независимыми случайными компонентами, параметры числителей соответствующих формирующих фильтров могут при- нимать лишь вполне определенные значения. Однако данное пра- вило не действует, если, например, все составляющие случайного возмущения равны между собой: (k) = g2 (к) = ... = Нга (к) = g (к). (15.3-13) При этом матрица F преобразуется в вектор T-nX-i-.-f.]- (15.3-14) Числитель формирующего фильтра в примере 15.3.1 принимает вид D (z) = d1z + d2, причем а) для канонической формы управляемости d2l _Г(а1Ь2 + а2Ь1) Ь21 Г f21 ^1. _^2 fj_ * б) для канонической формы наблюдаемости d2 f2> d^f, Очевидно, параметры полинома D не зависят друг от друга. Из уравнения (15.3-13) следует, что -все элементы ковариационной матрицы возмущения имеют одинаковые значения, т. е. 1 1 ... 1 (15.3-15) Поскольку при эта матрица положительно полуопреде- лена, по-прежнему справедлива модель (15.1-1). Не нарушается и условие (15.4-4), используемое при выводе уравнений фильтра Калмана. диагональна. В общем В частности, для при- (15.3-16) До сих пор считалось, что матрица F случае все ее элементы не равны нулю, мера 15.3.1 _ ^22 ^211 f f ’ 1'12 'll J При этом параметры dn d2, ... могут принимать любые зна- чения. Таким образом, основной результат, полученный в настоящем разделе, а ранее—в разд. 8.2 и 8.7.2, заключается в том, что регулятор (15.2-5) оптимален по отношению к коррелированному
Гл. 15. Регуляторы состояния при случайных возмущениях 281 внешнему возмущению гц(к). Данный вывод основан на предпо- ложении о том, что (к) формируется из векторного белого шума | (к) или v(k), пропускаемого через фильтр, который описывается уравнениями (15.3-3) и (15.3-4). При заданных элементах f фор- мирующие фильтры определяются в форме передаточных функций п х ns (z) D (z) /1 E 5 17\ GpEW=T(^ = TO-. (15.3-17) причем D (z) =cr adj [zl — A]-1 f = б^ф- . .. 4-dm_iZ-k dm, (15.3-18) где, например, |(k) = [1... 11]т £ (k), (15.3-19) или v (k) = [1... 11]T v (k); = (15.3-20) Параметры f и 0 или V, а следовательно, и коэффициенты числи- телей формирующих фильтров D (z) используются лишь при рас- чете фильтра состояния и не влияют на синтез регулятора. Матрица шума для фильтра состояния V = 0 (15.3-21) задается либо согласно уравнению (15.3-15), причем в этом слу- чае F = f (15.3-20), либо все элементы F выбираются таким об- разом, чтобы обеспечивалась оптимальная фильтрация коррелиро- ванного случайного возмущения ng (к). 15.4. АЛГОРИТМ ОЦЕНКИ СОСТОЯНИЯ (ФИЛЬТР КАЛМАНА) В данном разделе рассматриваются случайные векторные сиг- налы, которые могут быть описаны марковским процессом х(кф- 1) = Ах (к) ф-Fv (к), (15.4-1) дополненным уравнением измерений у (к) = Сх (к) ф- п (к) или у (к ф-1) = Сх (к ф- 1) ф-п (к ф-1) (15.4-2) (см. рис. 15.4.1 и разд. 12.2.1). В дальнейшем в число перемен- ных состояния будут включены также измерения входа и (к). Ниже используются следующие обозначения: х(к) — вектор состояния (mxl); v (к) — входной векторный случайный сигнал (pxl) с ковариа- ционной матрицей V; у (к) — вектор выходных измерений (гх 1); n(k)—вектор шума измерений (rxl) с ковариационной ма- трицей N; А — матрица системы (mxm)j F—матрица входа (шхр); С—матрица выхода (гхш).
282 Ч. III. Системы управления со случайными возмущениями Предполагается, что матрицы A, F и С не зависят от времени. Требуется получить оценку вектора состояния х (к) на основе из- мерений выхода у (к), содержащих случайные погрешности, пред- ставленные векторным белым шумом п(к). Априорная информация Рис. 15.4.1. Динамический объект, описываемый векторным марковским процес- сом. включает следующие параметры: А, С и F; Е {v(k)} = v^k); (15.4-3) cov[v(k), т = 1 —j] = E {v (i) vT (])}:= У6Ц; (15.4-4) E{n(k)} = 0; cov[n(k), T = i—j]= E (n(i)n’(j)} = N6ij, (15.4-5) где функция Кронекера g _ f 1 при-i = j; 13 (0 при j. Шумы измерений входа v (к) и выхода п (к) считаются стати- стически независимыми. Оценки состояний являются функциями времени, и поэтому в большинстве приложений предпочтение от- дается рекуррентным процедурам оценивания, позволяющим вы- числять оценки х (к) по мере поступления измерений у (к). Вывод алгоритма оценивания может опираться на различные теоретические методы, в том числе: — метод, использующий свойство ортогональности невязок и вы- ходных измерений, Е {хут} = 0 ([15.4], [15.6], [15.2]); — рекуррентный метод наименьших квадратов [15.7]; — метод фильтрации с минимальной дисперсией [15.8]; — метод максимального правдоподобия; — метод Байеса [3.12]. Ниже для построения алгоритма будет использован рекуррент- ный метод оценивания с минимальной дисперсией. Он наиболее удобен, поскольку не требует никаких предварительных теоретиче- ских выкладок и допускает простую и наглядную интерпретацию результатов.
Гл. 15. Регуляторы состояния при случайных возмущениях 283 15.4.1. Взвешенное усреднение двух векторных величин Алгоритм оценивания, известный как фильтр Калмана, форми- рует взвешенное среднее двух независимых векторных оценок. Предположим, для некоторого m-мерного вектора х найдены две статистически независимые оценки хх и х2. Их взвешенным сред- ним назовем величину х=(1 — К')х14-К'х2 = х1- + К/ (х2—xj, (15.4-6) где К'—это весовая матрица (mxm), которая выбирается таким образом, чтобы дисперсия оценки х была минимальна. Далее будет рассматриваться динамическая система, для которой в качестве х2 берется ее вектор состояний размерности т. Вместо х2 будет ис- пользован вектор выходных измерений у2 размерности р < ш, свя- занный с х2 соотношением у2 = Сх2. (15.4-7) С учетом этого уравнение (15.4-6) принимает вид X = хх + КС (х2— хх) = Xi + К (у2—Схх) = (I — КС) Xi + Ку2. (15.4-8) — у—' К' Случайный вектор х3 имеет ковариационную матрицу Q = E {(хх— Е {xj) (xt — Е {х^1} (mxm); (15.4-9) вектор у2—ковариационную матрицу Y = E (у2 — Е {у^) (у2— Е {у2))т} (рхр). (15.4-10) Воспользовавшись условием статистической независимости х3 и у2, введем формулу для ковариационной матрицы оценки х (15.4-8): Р = Е{(х—Е{х}) (х—Е{х})т} = = Е {[(I -КС) Х1 + Ку2—(I- КС) Е {xJ-KE {у2)]х (15.4-11) X [(I - КС) Х1 + Ку2 — (I - КС) Е {Х1} - KE {у2}]т j. = = (I — КС) Q (I — КС)Т + кY кт. Найдем теперь такую матрицу К, которая минимизировала бы дисперсии ошибок оценивания (т. е. диагональные элементы ма- трицы Р). Для того чтобы определить ее, не прибегая к диффе- ренцированию, несколько преобразуем уравнение (15.4-11). Выпол- ним умножение, учитывая, что Q = QT, поскольку Q — симметри- ческая матрица: Р = Q 4- (КС) Q (КС)т — (КС) Q — Q (КС)т + КY Кт = = Q+K (CQCT4-Y) Кт —К (CQ) —(CQ)T Кт. (15.4-12) В уравнении (15.4-12) желательно выделить слагаемое, являющееся полным квадратом относительно К. С этой целью введем две новые
284 4. Ill, Системы управления со случайными возмущениями матрицы R и S [15.9], такие, что (KS— R) (KS—R)T = К (SST) Кт— KSRT — RSTKT + RRT = = K(SST) KT — K(SRT) — (SRT)TKT + RRT. (15.4-13) Положив в (15.4-13) SST =CQCT + Y; (15.4-14) SRT = CQ, (15.4-15) приходим к выражению (KS —R) (KS—R)T = K(CQCT + Y) Кт — К (CQ) — (CQ)T KT+RRT. (15.4-16) Правая часть данного выражения совпадает с разностью (Р—Q), полученной из (15.4-12). Исключение составляет лишь член RRT, который можно определить, воспользовавшись уравнениями (15.4-14) и (15.4-15): STSRT==STCQ; RT= (STS)-1 STCQ; R = QCTS (STS)~i; RRT = QCTS (S’S)'1 (STS)“1 STCQ; STWS = (STS) (S’S)"1 (STS)~X (STS) = I; SSTWSST = SIST = SST. Таким образом, W = (SST)7. Согласно (15.4-14), отсюда следует RRT = QCT (CQCT + Y)’1 CQ. (15.4-17) Подставляя (15.4-16) и (15.4-17) в уравнение (15.4-12), получаем окончательно p = Q4-(KS—R) (KS — R)T — QCT (CQCT+Y)-1 CQ. (15.4-18) В уравнении (15.4-18) только слагаемое (KS—R) (KS — R)T зависит от К. Диагональные элементы этой матрицы, равные квад- ратам соответствующих элементов (KS—R), всегда больше или равны нулю. Следовательно, диагональные элементы Р достигают минимума при KS—R = 0. Отсюда, используя (15.4-14) и (15.4-15), можно записать KS = R; К = RST (SST)-1; K = QCT(CQCT+ Y)’1. (15.4-19) Ковариационная матрица оценки с минимальной дисперсией, согласно (15.4-12), определяется выцажедием P = Q — KCQ, (15.4-20)
Гл. 15. Регуляторы состояния при случайных возмущениях 285 а сама оценка имеет вид x = Xj + К (у2—CxJ, (15.4-8) где К находится из уравнения (15.4-19). 15.4.2. Рекуррентный алгоритм оценивания вектора состояния Применим процедуру определения взвешенного среднего двух векторных величин, описанную в предыдущем разделе, к оцени- ванию вектора состояния х (к 4-1) марковского процесса (15.4-1), (15.4-2). Для этого переобозначим переменные, участвующие в урав- нении (15.4-8): хт х (к1)—значение х(к4-1), предсказанное на основе ранее полученной оценки х(к); у2 = у(к+1) — новое измерение выхода. Предсказанное значение вектора состояния определяется по формуле ____ х (к 4-1) = Ах (к) 4-Fv~(k). (15.4-21) Здесь вместо неизвестной точной величины v (к) использовано ее математическое ожидание v (к). С учетом введенных обозначе- ний рекуррентный алгоритм оценивания приобретает вид х(к4-1) = х(к4-1) 4-К (к4-1)(у (к4-1)—Cx(k-f-1)). (15.4-22) Как следует из соотношений (15.4-19), для того чтобы вычис- лить матрицу коррекции К (к4-1), необходимо знать ковариацион- ные матрицы Q(k4-1) вектора х (к 4-1) и Y вектора у (к 4-1)- Ковариационная матрица ошибки оценки х (к) равна Р (к) — Е {(х (к) — Е {х (к)}) (i (к) — Е {х (к)})т}. (15.4-23) Учитывая, что векторы х (к) и v (к) не коррелированы, сог- ласно (15.4-21), при Е {х (к 4-1)} = Е {х (к 4-1)} имеем Q(k4-l) = E{(x (к4-1)-Е{х (к4-1)}) (х (к4- 1) — Е {х(к4-1)})т} = = АР(к) At4-FVFt. (15.4-24) Аналогичным образом уравнение (15.4-2) дает Y(k4-l) = E{(y (к4-1)-Е (у (к4-1)}) (у(к4-1)-Е{у (к4-1)})т} = = Е(п (к4- l)nT(k-f-l)} = N. (15.4-25) Отсюда следует, что матрица корреляции (15.4-19) в рассматри- ваемом случае определяется как K(k4-1) = Q (к4- 1) Ст [CQ (к4- 1) Ст 4- N]'1, (15.4-26)
286 4. III. Системы управления со случайными возмущениями •а ковариационная матрица оценки х(к4-1)—как V P(k+l) = Q(k+l)-K(k+l)CQ (k-Ь 1). (15.4-27) Имея все необходимые соотношения, подставим предсказанное значение x(k-b 1), задаваемое формулой (15.4-21), в уравнение (15.4-22) с учетом v(k) = 0. В результате получаем рекуррентный алгоритм оценивания, описывающий фильтр Калмана'. x(k+l) = Ax(k) -ЬК(k-Ь 1) [у(k-Ь 1)—CA£(k)]. (15.4-28) Новая _ Оценка, пред- . оценка сказанная на коррекции основе преж- ней оценки Матрица ГНовое из- Измерение,”1 предсказан- ное на ос- нове преж- ней оценки_ мерение Отметим некоторые особенности реализации алгоритма. Исходное состояние Для того чтобы можно было начать вычисления по рекуррент- ной формуле (15.4-28), необходимо иметь исходное значение оценки вектора состояния. Если нужная информация отсутствует, задается £(0) = М0). Требуется знать и начальное приближение для ковариационной матрицы оценки Р(0). Однако, даже если параметры х(0) и Р (0) не отличаются особой точностью, уже при небольших к они прак- тически не сказываются на результатах вычислений (в частности, см. пример 22.2.1 в [2.22]). Матрица коррекции Матрица коррекции не зависит от измеряемых сигналов, ввиду чего все ее значения могут быть вычислены заранее. Подстановка (15.4-27) в уравнение (15.4-26) дает у К (к-Ь 1) = Р (к-Ь 1) CTN-1. (15.4-29) Если в системе действуют стационарные процессы, при к —> оо матрица К (к+ 1) стремится к своему установившемуся значению. Следовательно, в этом случае ковариационные матрицы Р и Q также сходятся. Как показано в работе [3.12], их предельные значения можно определить, решив систему уравнений P“1 = Q“14-CTN“1C; (15.4-30) Q = APAt + FVFt. (15.4-31) Структурная схема Полученный алгоритм оценивания иллюстрируется блок-схемой, изображенной на рис. 15.4.1 для v(k) = 0. Из нее видно, что составной частью фильтра Калмана является модель объекта управления. Текущее измерение выхода у (к 4-1) и его предска-
Гл. 15. Регуляторы состояния при случайных возмущениях 287 занное значение у (к 4-1) сравниваются, и определяется невязка е(к4- 1) = у(к4- 1)—у (к 4- 1) = у (к 4-1)—Сх (к 4-1) = = у(к4-1)— САх(к). (15.4-32) Эта величина используется для вычисления поправки х(к4-1) предсказания х(к4-1). Динамические объекты с измеримым входом и (к) Если на объект воздействует детерминированный или случай- ный входной сигнал и (к), взвешенный матрицей В, предсказанное Объект v(k) F n(k+l) х(л у (k+1) \z1 Измеряемый выход Старая оценка х(к) ъ(к+1) Предсказанное значение оценки Новая оценка Предсказанное значение выхода -I Ошибка выхода (невязка} &(k+1) Коррекция предсказанного значения Новая оценка Фильтр Рис. 15.4.2. Применение фильтра Калмана для получения оценки состояния мар- ковского процесса. состояние вычисляется по формуле х (к 4-1) = Ах (к) 4-Ви (к) 4-Fvfk), (15.4-33) которая после подстановки в уравнение (15.4-22) (см. рис. 15.4.2) дает х (к 4-1) = Ах (к) + Ви (к) 4- FV(kj 4- К (к 4-1) (у (к 4-1) — —САх(к) — СВи(к)— CFv(k)). (15.4-34)
288 Ч. III. Системы управления со случайными возмущениями Ортогональные свойства В основополагающей работе Калмана [15.4] рекуррентный алгоритм оценивания был выведен из условия ортогональности текущей оценки предшествующим измерениям выхода; Е {х (i) ут (j)[ = 0; j<i. (15.4-35) Однако можно показать, что оценки с минимальной диспер- сией обладают и другими ортогональными свойствами: Е (х (i) хт (i)[ = 0, (15.4-36) •а при у (i) =Сх (1) E{x(i)y(i)} = 0. (15.4-37) Из этих соотношений также следует, что значения сигнала ошибки (называемой часто невязкой) е (к 4-1) = у (к-{- 1)—С Ах (к) статистически независимы, т. е. Е {е (i) ет (])} = 0 при i=#j. (15.4-38) Обобщения фильтра Калмана После 1960 г. было опубликовано много работ, в которых проб- лемы построения алгоритмов фильтрации исследовались при более общих условиях по сравнению с исходным фильтром Калмана. Среди них наибольший интерес представляют следующие вопросы: • оценивание при наличии корреляции между входным возмуще- нием v(k) и шумом измерений п (к); • оценивание при коррелированном окрашенном входном возму- щении v (к); • оценивание при коррелированном шуме измерений n(k); • анализ влияния ошибок в задании начального состояния, кова- риационных матриц и параметров объекта на сходимость (расхо- димость) оценок; • параллельное оценивание неизвестных ковариационных матриц; • исследование проблем нелинейной фильтрации: одновременное получение оценок состояния и параметров объекта; оценивание состояния нелинейных объектов. Перечисленные вопросы обсуждаются во многих работах, в частности [15.2], [15.3], [15.9] — [15.11]. В работе [2.22] демонстри- руются результаты моделирования фильтра Калмана.
ЧАСТЬ IV Связные системы управления До сих пор при исследовании методов синтеза регуляторов и алгоритмов управления предполагалось, за исключением регуляторов состояния, что входной сигнал объекта управления и зависит только от регулируемой пере- менной у. При этом получается одноконтурная система. Однако в гл. 14 было показано, что введение в одноконтурную систему дополнительных свя- зей по измеряемым переменным — например, по сигналам внешних воздейст- вий или возмущений — позволяет улучшить качество управления. Системы управления, использующие кроме основной обратной связи дополнительные, называют связными системами управления. Обзор непрерывных систем управ- ления такого типа содержится, например, в работах [5.14], [16.2], [16.3]. К основным структурным классам связных систем относятся каскадные сис- темы управления, системы со вспомогательными обратными связями по ре- гулируемым переменным и системы с прямыми связями. При каскадном управлении и введении вспомогательных обратных связей по регулируемым переменным дополнительные (регулируемые) измеряемые переменные объекта, расположенные между точками приложения управляю- щих воздействий и выходными сигналами, применяются для формирования управляющих сигналов. В качестве дополнительных обратных связей часто используют (непрерывные) производные вспомогательных переменных, кото- рые добавляются к входным или выходным сигналам регулятора. В этом случае кроме регулятора достаточно ввести в систему дифференцирующий элемент, как правило не требующий усиления по мощности. Стоимость аппа- ратурной реализации алгоритмов управления на цифровых вычислителях является незначительной частью полной стоимости системы, поэтому основ- ное внимание будет уделено каскадной схеме управления. Использование такой структуры позволяет использовать более систематические методы син- теза одноконтурных систем. В связи с этим ниже из всего класса систем управления со вспомогательными обратными связями будут рассмотрены только схемы каскадного управления (гл. 16). Значительный интерес пред- ставляет также применение систем с прямыми связями (гл. 17), в которых кроме обратных связей присутствуют связи по измеримым внешним возмуще- ниям объекта управления.
ГЛАВА 16 Каскадные системы управления При проектировании оптимальных регуляторов состояния ис- пользуются обратные связи по всем переменным состояния объекта. Если же измеряются лишь некоторые из переменных состояния, например только одна переменная состояния между входом и выхо- дом объекта, то для улучшения характеристик одноконтурной системы, например с параметрически оптимизируемым регулятором, по этой координате, которая считается вспомогательной регулируе- мой переменной у2, вводится обратная связь на вход объекта через Объект Рис. 16.1. Блок-схема каскадной системы управления. вспомогательный регулятор, как это показано на рис. 16.1. В этом случае часть объекта с передаточной функцией GPu2 и дополнитель- ный регулятор GR2 составляют вспомогательный контур управле- ния, задающим сигналом которого является выходная переменная основного регулятора GR1. Основной регулятор формирует ошибку управления в виде раз- ности задающего сигнала wx и (основной) регулируемой перемен- ной ух. Следовательно, основной регулятор управляет внутренним контуром управления и частью GPux объекта управления. Таким образом, вспомогательный контур управления совместно с основным оказываются включенными каскадно. Каскадные системы управления характеризуются лучшим ка- чеством управления по сравнению с одноконтурными системами. Это обусловлено следующими причинами: • Возмущения, поступающие на часть объекта GPu2, т. е. на его входную область, прежде чем воздействовать на регулируемую
Гл. 16. Каскадные системы управления 291 переменную уъ подвергаются предварительным изменениям во вспомогательном контуре управления. • Наличие вспомогательной системы с обратной связью уменьшает влияние изменения параметров входной части GPu2 объекта управления (о снижении чувствительности при введении обрат- ной связи сказано в гл. 10). Поэтому при первоначальном син- тезе регулятора GR1 оказывается возможным учитывать только те изменения параметров, которые относятся к выходной части Gp,n объекта. Незначительные изменения параметров вспомо- гательного контура управления можно учесть позже. • Поведение регулируемой переменной ух становится более быст- рым (менее инертным), если вспомогательный контур управле- ния обеспечивает более быстрые собственные движения GPu2 по сравнению с исходными. Общая передаточная функция каскадной системы управления определяется следующим образом. Считая, что входным сигналом вспомогательного контура является задающий сигнал, поступаю- щий от основного регулятора, получим fl („\__ У 2 (Z) _ GR2(z)GPu2 (z) /]П 1» W (z) ! +Gr2 (z) Gpu2 (z)• ' Передаточная функция этого контура относительно управляющего сигнала w2 равна ч (z)_______Gr2 (z)____ / 1 R w2(z)~1 + Gr2(z)GpU2(z)- ' Учитывая, что У1 (z) =GPul (z) GPu2 (z) u (z) = GPu (z) u (z), запишем передаточную функцию части каскадной системы, кото- рую будем считать объектом управления для основного регуля- тора: (16-3) У1 (Z) —- ___GR2 (Z)___ fl (7\ (Z' [7\ w2 (z) 1 + Gr2 (z) GPu2 (Z) Pu (z) ~ Upu (Z) • Таким образом, передаточная функция объекта управления для основного регулятора состоит из передаточной функции самого объекта и дополнительного члена, обладающего «ускоряющими» свойствами. Следовательно, объект становится более «быстрым». Теперь запишем общую передаточную функцию замкнутой кас- кадной системы: G (z) = У1 = Gri (Z1 Gpu (Z1 — w w*(z) 14-GR1(z)GPu(z) ____________GR1 (z) Gr2 (z) GPu (z)__ .. .. 14-GR2 (z)Gpu (z)4-GR1 (z) Gr2 (/) Gpu (z) • На процесс проектирования каскадных систем управления су- щественное влияние оказывает расположение точек приложения
292 У. IV. Связные системы управления внешних воздействий, так что к расчету каждой каскадной системы следует подходить индивидуально. Рассмотрим на простом примере свойства каскадной системы. Пример 16.1. Объект управления состоит из двух частей, непрерывные пере- даточные функции которых имеют вид Gpu2 (S) = (14-7,5s) ’ Gpu 1 (S) = (14-10s) (14-5s) • При такте квантования T0 = 4c получим соответствующие передаточные функции, аналогичные полученным в разд. 3.7.2: b12z~1 _ 0,4134z-i _ 0,4134 <JPu2 (z) — 1+ aj2Z-i— j — o^seez-i — z—0,5866’ 0,1087z-140,0729z~2 Gpm (z> — j _ 1>1197z-i_|_o,3O12z-2’ n . . „ „ . . 0,0186z-1+0,486z-2+0,0078z-3 pu(z) GpU2 Gpm (z) J_ 1)7063z-i + 0)958z-2_0)1767z-3 — _ 0,0186 (z4-0,1718) (z42,4411) — (z — 0,5866) (z —0,6705) (z —0,4493)' В качестве вспомогательного используем пропорциональный регу- лятор G R2 (Z) = Qo2- Полученная в результате передаточная функция вспомогательного контура управления имеет вид q /_\ _____________________________902^12___ w2 14* (а12 4*Ч02Ь12) z-1 г4'(а12 4*Ч02Ь1г) Для обеспечения асимптотической устойчивости вспомогательного контура управления необходимо, чтобы его полюса были располо- жены внутри единичной окружности на плоскости z, для чего долж- но выполняться условие 1 < (^12 “4" Чо2^1г) < !• Следовательно, коэффициент передачи пропорционального регуля- тора должен удовлетворять соотношению — 4^2 < q02 < Ц™ или — 1 < q02 < 3,838. и12 и12 (Заметим, что дискретный пропорциональный регулятор, управ- ляющий объектом первого порядка, оказывается структурно не- устойчивым в отличие от непрерывного случая.) Если задано поло- жительное значение q02, то: для q02 0,7 Gw2 (z) ~ q 2972 ’ ДЛЯ q02 1,3 Gw2 (z) — g 0492 *
Гл. 16. Каскадные системы управления 293 Как видно, с возрастанием величины q02 полюс смещается к началу координат, достигая его при q02=l,42. Следовательно, вре- мя установления переходных процессов в замкнутом вспомогатель- ном контуре управления оказывается меньшим, чем для исходной части объекта GPu2. Результирующие характеристики замкнутой каскадной системы будут лучше характеристик одноконтурной системы только для q02>l,3. Если значение q02 слишком мало, то процессы в каскадной системе управления становятся слишком медленными, что объясняется меньшим значением коэффициента передачи в контуре по сравнению со случаем оптимизированного основного регулятора. Заметим, что параметры основного регуля- тора изменяются в зависимости от величины коэффициента передачи вспомогательного контура управления. Коэффициент передачи вспо- могательного контура изменяется в диапазоне 0<q02^l,3 при 0<Gw2(l)<0,54. Поэтому предпочтительнее в качестве вспомо- гательного использовать ПИ-регулятор с передаточной функцией GR2 (z) __ЧогЧ-Чхг2-1 1—z-1 для которого Gw2(1) = 1. В этом случае дискретная передаточная функция замкнутого вспомогательного контура управления будет иметь вид р / \ __________402^12 z~1 ~1~Ч1гЬ12 z~2____ w2 1 j ~ 14- (Э12 + Чо2Ь12— 1)Z-1 + (q12b12-а12) z~2' Если соответствующие параметры ПИ-регулятора выбраны рав- ными q02 = 2,0 и q12 = —1,4, то эта передаточная функция будет равна С ( \— 0,8268 (z —0,7000) Uw2 (z) — (z —0,7493) (z —0,0105)' Здесь нуль и один из полюсов близки между собой (т. е. прак* тически сокращаются), а второй полюс близок к началу коорди- нат. Время установления координаты у2 (к) становится меньше, чем в исходной области объекта GPu2(z) (см. рис. 16.2, а). Общая передаточная функция объекта для основного регулятора может быть получена из уравнения (16-3). Она равна С 1 0,0372 (z—(0,6433 +0,0528i)) (z— (0,6433 —0,0528i)) (jPu(Z)— (z —0,7493) (z —0,0105) X (z+0,1718) (z + 2,4411) X (z —0,5866) (z—0,6705) (z —0,4493)' Наличие вспомогательного контура управления приводит к появлению в передаточной функции GPu дополнительных полюсов GW2 и комплексно-сопряженной пары нулей по сравнению с пере- даточной функцией исходного объекта GPu. Из рис. 16. 2, б видно, что объект управления для основного регулятора оказывается
294 У. IV. Связные системы управления 1 ...................... о!-------1------1-------1_ 5 ь 10 15 К ТРц 10 15 к 10 15 а) Дополнительная регули- б) Регулируемая переменная руемая переменная у3 без основного регулятора Рис. 16.2. Переходные процессы в контуре управления при наличии и отсутствии дополнительного каскадного регулятора. Основной регулятор — ПИД-типа, дополнительный — ПИ-типа. О без вспомогательного регулятора; • с вспомогательным регулятором. в) Регулируемая переменная у, с основным и дополнительны- ми регуляторами менее инерционным. Наконец, поведение всей системы становится более быстрым, однако достаточно хорошо демпфированным, что, естественно, требует больших отклонений управляющей перемен- ной на входе объекта (см. рис. 16.2, в). В табл. 16.2.1 приведены значения параметров основного регу- лятора, откуда видно, что при введении вспомогательного регуля- тора значения К и Cj возрастают, а значение Cd уменьшается. Алгоритмы управления для вспомогательного ПИ-регулятора и основного ПИД-регулятора, которые должны быть реализованы на управляющем вычислителе, записываются в виде следующих разностных уравнений: ei(k) = wr(k)—у, (к), (16-5) w2 (к) = w2 (к— 1) 4- q01ex (к) + quex (к — 1) Д- q21ex (к —2), (16-6) е2 (к) = w2 (к)—у2 (к), (16-7) и (к) = и (к — 1) + q02e2 (к) Д- q12e2 (к — 1). (16-8)
Гл. 16. Каскадные системы управления 295 Таблица 16.2.1 Оптимизированные параметры основного регулятора. Критерий качества (5.2-6) с г=0,1 ЗПР-З, г=0,1 Чо 41 К CD ci Без вспомогатель- ного контура уп- равления 2,859 —4,012 1,407 1,488 0,9456 0,1950 С вспомогатель- ным контуром управления 2,6723 —3,3452 1,036 1,6363 0,6330 0,2219 Относительно небольшие дополнительные вычислительные зат- раты, обусловленные отличием структуры каскадного регулятора от обычной одноконтурной схемы, состоят в измерении переменной уг(к) и вычислении значений е2(к) и и (к) в соответствии с алгорит- мами (16-7) и (16-8). В качестве основных и вспомогательных регу- ляторов можно применять все рассмотренные ранее регуляторы для объектов с одним входом и одним выходом. Таким образом, кас- кадные системы управления могут состоять из различных комбина- ций регуляторов. Исчерпывающий анализ свойств каскадных систем управления с регуляторами П- и ПИ-типов для непрерывных сигналов содержит- ся в работе 116.2], где показано, что в качестве вспомогательных следует использовать П-регуляторы, а в качестве основных — регуляторы ПИ-типа. Кроме того, при наличии возмущений на входе объекта управления в качестве вспомогательной регулируе- мой переменной следует выбирать ближайшую к точке приложения возмущения, а при равномерно распределенных возмущениях в объекте его часть GPu2 должна иметь порядок, примерно равный половине порядка всего объекта. В дискретных системах управления коэффициент передачи вспомогательного регулятора следует выбирать достаточно малым, что обусловлено его малой областью устойчивости (см. пример 16.1). Это приводит к тому, что вспомогательный контур управления становится более медленным, а статические ошибки возрастают. К тому же изменения параметров части объекта GPu2 будет больше влиять на настройку параметров основного регулятора. При добав- лении интегрирующего члена во вспомогательный регулятор коэф- фициент передачи вспомогательного контура всегда будет равен Gw2(1) = 1 независимо от любых изменений параметров части объек- та GPu2. В этом случае при настройке вспомогательного ПИ-регуля- тора, обеспечивающей выполнение необходимых требований устой-
296 Ч. IV. Связные системы управления чивости, даже большие изменения параметров первой части объекта при синтезе основного регулятора можно не учитывать, так как ди- намика вспомогательного контура управления оказывается значи- тельно более быстрой по сравнению с оставшейся частью объекта управления. В качестве основных регуляторов можно применять параметри- чески оптимизируемые и апериодические регуляторы, а также регу- ляторы с минимальной дисперсией. При их синтезе в роли объекта управления (16-3) выступают вторая часть объекта и вспомогатель- ный контур с уже настроенным П- или ПИ-регулятором. При ис- пользовании регуляторов состояния следует учитывать наличие непосредственно измеряемой вспомогательной переменной у2. По- этому соответствующий наблюдатель может иметь пониженный порядок (см. разд. 8.8), поскольку эта переменная является одной из наблюдаемых переменных состояния наблюдателя полного порядка (см. разд. 8.7.2). Наличие двух измеряемых вспомогательных регулируемых пере- менных позволяет построить двухкаскадную систему управления с двумя вспомогательными контурами управления [16.1]. Если же все переменные состояния объекта могут быть измерены, то получится мультикаскадная система управления, имеющая структуру, ана- логичную системе с регулятором состояния. Из теории оптимального регулирования по состоянию известно, что отдельные вспомогатель- ные регуляторы являются пропорциональными (см. гл. 8). Поэтому каскадные системы с П-регуляторами можно рассматривать как первое приближение к оптимальному управлению по состоянию. Практическое преимущество разделения системы на контуры с основным и вспомогательным регуляторами состоит в том, что на- стройку их параметров можно выполнять независимо и последова- тельно. Причем это справедливо как в случае применения правил настройки регуляторов, так и в случае автоматизированного син- теза системы с помощью ЭВМ. Для каскадных систем управления начальные оценки параметров q02 для вспомогательного и qOi для основного регуляторов могут быть просто получены в результате задания начального значения управляющей переменной и (0) при ступенчатом изменении величины задающей переменной wx(0). Из уравнений (5.2-31) и (5.2-32) получим и (0) = q02w2 (0), w2 (0) = q01wx (0) и, следовательно, и (0) =qO2qoiW1 (0). (16-91 Это соотношение, в частности, может быть использовано при выбора значения qox для параметрически оптимизируемого основного регу-1 лятора, когда начальное значение управляющей переменной и(0)? должно быть согласовано с допустимым диапазоном ее изменениям
Гл. 16. Каскадные системы управления 297 при условии, что параметр q02 вспомогательного регулятора уже задан. Каскадные системы управления могут найти широкое примене- ние. Для систем с повышенными требованиями к качеству при нали- чии в объекте измеряемой вспомогательной регулируемой перемен- ной всегда следует использовать каскадные регуляторы. Они особенно рекомендуются для регулирования потоков с помощью вентилей. Коэффициент передачи вентиля является нелинейным, поскольку он, кроме всего прочего, зависит от перепада давления на вентиле, которое может существенно изменяться в процессе функционирования. Применение вспомогательного регулятора ПИ- типа позволяет полностью скомпенсировать эти изменения. Еще более широко могут применяться дискретные каскадные системы управления, так как дополнительная стоимость вспомогательных регуляторов мала.
ГЛАВА 17 Регуляторы с прямой связью Если воздействующее на объект внешнее возмущение v можно измерить, прежде чем оно проявится в изменении регулируемой переменной у, то ка- чество управления по отношению к этому возмущению часто может быть улучшено благодаря использованию регуляторов с прямой связью, как пока- зано на рис. 17.0.1. Здесь одновременно с изменением возмущающего воздей- ствия v происходит изменение управляющего сигнала объекта с по- мощью регулятора Gs, что позволяет не дожидаться, пока, как в сис- темах управления с обратной связью, это возмущение повлияет на регу- лируемую переменную у. Однако существенного улучшения качества управле- ния можно добиться только в том случае, когда динамика объекта Gpu не Объект с прямой связью Рис. 17.0.1. Введение прямой связи в объекте с одним выходом и одним входом. медленнее динамики части объекта Gpv. Это обусловлено ограниченным диа- пазоном изменения управляющей переменной. При проектировании систем управления всегда следует стремиться, на- сколько это возможно, уменьшить влияние измеряемых возмущений с по- мощью регуляторов с прямой связью, оставляя на долю регуляторов с обрат- ной связью отработку не полностью нейтрализованных возмущений и неизме- ряемых возмущений, приложенных к регулируемой переменной. Поскольку для линейных объектов цепь регулятора с прямой связью не влияет на устойчивость и параметры основного контура управления, такой регулятор может быть введен в систему после того, как настроен регулятор с обратной связью. В данной главе будут рассмотрены следующие методы синтеза регуляторов с прямой связью Если элемент Gs можно реализовать так, что передаточная функция по возмущению Gpv точно совпадает с GsGpu, то любое изменение (детермини- рованное или стохастическое) возмущающей переменной v не будет вызывать изменения регулируемой переменной у. Это соответствует применению идеаль- ного регулятора с прямой связью. Вопросы его реализуемости и построения других регуляторов сокращающего типа с прямой рассмотрены в разд. 17,1. В разд. 17.2 описаны системы управления с параметрически оптимизируе- мыми регуляторами с прямой связью, в которых структура такого регулятора задана заранее и которые применимы для широкого класса объектов. При этом сразу же ограничим задачу использованием неидеальных регуляторов с прямой связью Системы управления с параметрически оптимизируемыми регуляторами с прямой связью можно проектировать как для детерминирован-
Г л. 17. Регуляторы с прямой связью 299 пых, так и для стохастических возмущений. Регуляторы состояния для внешних возмущений уже содержат идеальный регулятор с прямой связью для соот- ветствующей модели возмущения. Системы управления с регуляторами со- стояния с прямой связью для непосредственно измеряемых возмущений по переменным состояния, удовлетворяющие требованиям, предъявляемым к регуляторам состояния для внешних возмущений, описаны в разд. 17.3. На- конец, можно также синтезировать регуляторы с прямой связью с минималь- ной дисперсией (разд. 17.4), соответствующие обычным регуляторам с мини- мальной дисперсией. В дальнейшем предполагается, что известны математические модели объекта по управляющей координате Gp (z)=;y^ = B(z~1)z-d =_b^1+---+b.™C2.z-tl (17.0-1) ' ' u (z) A (z-1) 1-l-aiZ-1-)-,,, и по сигналу возмущения Gd f7j_n(z)_D(z-i)_d04-d1z-i + ... + dqz-q . °р'(г,-Гй-сД^)- 1+е12-Ч-...+с,г-« • Для управления по состоянию используется модель в пространстве со- стояний х (к —|—1) = Ах (к) —|—Ви (к); (17.0-3) у(к) = Сх(к), (17.0-4) которая считается известной. I7J. КОМПЕНСАЦИОННЫЕ РЕГУЛЯТОРЫ С ПРЯМОЙ СВЯЗЬЮ При использовании идеального регулятора с прямой связью выполняется соотношение Gs(z)GPu(z)==GPv(z). (17.1-1) Следовательно, Гт‘ (7\ = US (Z1 — GPv (Z1 = M2"1)0 (Z-1) _ ' v (z) Gpu (z) В (z-1) z-d C (z-1) ________ho + hlZ-^ + .-.+hm + gZ-tni + q)____H (z~l) fdz-d +f1 + dz-(1+d) +.., +fm + q + dZ-<m+q+d) -F(z-l)- Таким образом, влияние возмущения на объект может быть пол- ностью нейтрализовано регулятором с прямой связью [17.1]. Однако этот регулятор будет более простым, если для фильтра возмущения выполняется условие С (z-1) = A (z-1). В этом случае GS(z) = b^^, (17.1-3) и сокращается лишь числитель передаточной функции объекта управления. Если такой регулятор с прямой связью оказывается реализуе- мым и устойчивым, то влияние возмущения v (к) на выходную пере- менную полностью скомпенсировано. Одно из условий реализуе- мости уравнения (17.1-2) состоит в том, что если присутствует
300 Ч. IV. Связные системы управления элемент h0 в числителе, то и в знаменателе должен присутствовать элемент f0. То же должно выполняться для элементов hx и fx и т. д. Это означает, что для принятой структуры модели объекта (17.0-1) и (17.0-2) должно выполняться условие d=0 и do=O. Поэтому с са- мого начала будем считать, что d=0, если передаточная функция Gpv(z) не обладает свойством прямой передачи входного сигнала и не содержит запаздывания d'^d. В этом случае сокращается лишь часть В/А. Для получения устойчивого регулятора с прямой связью корни Zj знаменателя F (z) передаточной функции (17.1-2) должны удовлет- ворять условию |Zj|-<l, т. е. нули полиномов B(z) и C(z) должны лежать внутри единичной окружности на плоскости z. Следователь- но, идеальная компенсация возмущений невозможна для объектов с запаздыванием и прямой передачей сигналов, а также для объектов, нули передаточных функций которых по управляющей или возму- щающей переменным расположены вне или на окружности единич- ного радиуса на плоскости z (неминимально-фазовые объекты). Пример 17.1.1. Для иллюстрации рассмотрим применение регуляторов с прямой связью для тестовых объектов I, II и Шс различными передаточными функциями по управляющим сигналам и одинаковыми передаточными функ- циями по возмущению (см. табл. 17.1.1, 17.1,2 и приложение). Таблица 17.1.1 Параметры передаточных функций Gpu (z) То, с а. а2 а8 bi Ь2 Ьз d Объект I 2 —1,5 0,7 — 1,0 0,5 — — Объект II 2 — 1,425 0,496 — — 1,102 0,173 — Объект III 4 — 1,5 0,705 —0,100 0,065 0,048 —0,008 1 Таблица 17.1.2 Параметры передаточных функций Gpv (z) Tq, с С1 С2 di d2 Объект I и объект II 2 —1,027 0,264 0,144 0,093 Объект III 4 —0,527 0,070 0,385 0,158
Гл. 17. Регуляторы с прямой связью 301 Объект I (неминимально-фазовый второго порядка) Из уравнения (17.1-2) следует, что /-о, ч _di~|-(aidi-1-d2) z~* + (aid2 —|— a3dj) z~2 + a2d2z~3_ S bi + (biCi+b2) z-1 + (b1c2 + b2ci) z-24- b2c2z-3 0,144 — 0,123г-1 —0,039z-3 + 0,065z-3_ “”1,0 — 0,527г-1 — 0,237z-24-0,132z-3 ~ _(z+ 0,646) (z —(0,750 + 0,3691)) (z — (0,750—0,3691)) ~(z + 0,494) (z —(0,510 + 0,0821)) (z— (0,510 — 0,0821))’ Эта передаточная функция является реализуемой и устойчивой. На рис. 17.1.1 показан переходный процесс по управляющей переменной при ступенчатом Рис. 17.1.1. Вид управляющей пере- менной u(k) для объекта I. изменении возмущения v (к). Выходная переменная при этом не меняется, так как происходит полная компенсация. Объект II (неминимально-фазовый второго порядка) Регулятор для этого объекта имеет действительный полюс в точке z= 1,695, по- скольку нуль передаточной функции Gpu (z) находится вне единичной окруж- ности. Это значит, что регулятор с прямой связью оказывается неустойчи- вым. Таким образом, идеальная компенсация оказывается невозможной. Объект III (третий порядок с запаздыванием) Регулятор с прямой связью для объекта III, определяемый уравнением (17.1-2), оказывается нереализуемым из-за присутствия запаздывания d + 0. Если исключить запаздывание d в уравнении (16.1-2), что будет означать со- кращение только множителя В/A без запаздывания, то передаточная функция регулятора с прямой связью будет иметь вид Go (z —0,675) (z—0,560) (z —0,264) 0,385 (z + 0,441) _ s(Z}~ 0,065 (z + 0,879) (z —0,140) z2 —0,527z + 0,07 _5,923—6,448z_1 + 0,526z“2+l,121z“3—0,243z-4 1+0,212z-1 —0,443z“2 + 0,117z“3 —0,009z~4 * Этот регулятор является реализуемым. Однако компенсация в этом случае приводит к большим отклонениям управляющего сигнала на входе объекта управления, что можно видеть из следующего уравнения: us (0) = (0,385/0,065) v (0) = 5,923v (0). Приведенные примеры показывают, что идеальная компенса- ция часто оказывается нереализуемой или ведет к недопустимо большим отклонениям управляющей переменной. В этих случаях
302 Ч. IV. Связные системы, управления можно, как и в гл. 6, ввести в передаточную функцию регуля- тора с прямой связью дополнительный множитель (z): Gs(z)-G?(z)G«(z), (17.1-4) что ведет к появлению колебаний по выходной переменной! у. При проектировании компенсационных регуляторов можно исполь- зовать задание желаемой передаточной функции всей системы G„ (z) = GPv (z) + Gs (z) GPu (z) и на ее основании вычислить передаточную функцию регулятора с прямой связью: Gs = G^(>) !-Gv ~Gpv ’ Хотя вычисления по этому методу просты, его нельзя рекомен- довать здесь, как в случае компенсационных регуляторов, из-за произвольности задания Gv(z), сокращения нулей и полюсов и появления межтактовых колебаний. Поэтому рассмотрим другие методы синтеза. 17.2. ПАРАМЕТРИЧЕСКИ ОПТИМИЗИРУЕМЫЕ РЕГУЛЯТОРЫ С ПРЯМОЙ СВЯЗЬЮ При синтезе параметрически оптимизируемых регуляторов с прямой связью предполагается, что их структура (реализуемая) фиксирована, как и при синтезе параметрически оптимизируемых регуляторов, т. е. структура и порядок алгоритма регулятора с прямой связью заданы, а свободные параметры определяются в про- цессе параметрической оптимизации [17.1]. Будем считать, что структура передаточной функции такого регулятора имеет вид Gs(z)^^ = g^ = h»+h‘z~1 + - + h-z-,'. (17.2-1) SV' V (z) F (z-1) i + + v Поскольку она может не точно соответствовать объекту, нами в общем случае не будет получено идеальной компенсации, в резуль- тате чего возмущение будет влиять на выходную переменную. 17.2.1. Параметрически оптимизируемые регуляторы с прямой связью без заданного начального значения управляющей переменной Неизвестные параметры алгоритма регулятора с прямой связью aT = [h0 hx...hz i f, h...fj (17.2-2) определяются при минимизации функции стоимости, например вида X М S!„=2[y2(k) + Mu!(k)l. (17.2-3) k=0
Гл. 17. Регуляторы с прямой связью 303 т. е. ^ = 0. (17.2-4) да v ’ При этом сигнал возмущения может быть детерминированным или стохастическим. Для отклонения управляющей переменной можно записать Ди (k) =и (к)—й, (17.2-5) где u = u(oo) — конечное значение, например, для ступенчатых возмущений, или u = E{u(k)}— среднее значение для стохастиче- ских возмущений. Во многих случаях удается получить удовлетворительное ка- чество подавления возмущения для Z^2. Поскольку коэффи- циент передачи регулятора с прямой связью определяется соот- ношением G /11 — Gpv — К — h« + /17 2-61 Us(1)~Gpu(1)“Ks“ l+fi + f2 ’ (l/.^b) то в результате минимизации приходится определять для I = 2 четыре параметра, а для 1 = 1—всего два. 17.2.2. Параметрически оптимизируемые регуляторы с прямой связью с заданным начальным значением управляющей переменной Рассмотрим теперь поведение переменной и (к) при ступенча- том изменении возмущающей переменной v (к) = 1 (к). Для 1 = 2 из уравнения (17.2-1) получим дифференциальное уравнение и (к) = — fru (к — 1) — f2u (к—2) ф- hov (к) ф- hrv (к — 1) + h2v (к—2). (17.2-7) Для v (к) — 1 (к) из этого уравнения получим u(0)=ho; u(l) = (l-f1)u(O)+h1; u(2) = - f1U (1) + (1 - f2) u (0) + h, + h2; (17.2-8) u (k) =— fjU (к — 1) — f2u (k —2) + u (0)4-hi4-h2. Начальное значение управляющей переменной u (0) равно h0 или hov(O). Поэтому значение h0 можно задать заранее, выбрав под- ходящую величину и (0) и тем самым обеспечив выполнение требо- вания ограниченного диапазона изменения управляющей перемен- ной. С учетом заданного значения и (0) число оптимизируемых пара- метров регулятора при 1=2 сокращается до трех, а при 1 = 1 — до одного параметра. Исходя из уравнений (17.2-8) и (17.2-6), для 1=1
304 У. IV. Связные системы управления получим h0==u (0); f u(0-Ks. 11 “ u(0)-Ks’ h, = u (1) —u (0) (1— fj. (17.2-9) (17.2-10) (17.2-11) Здесь u (1) теперь можно выбрать в качестве единственной независи- мой переменной параметрической оптимизации, а его значение долж- Рис. 17.2.1. Функция потерь VLu(l)] для объекта II, 10— 10 о Без регулятора с прямой связью С регулятором С прямой связью Рис. 17.2.2. Переходные про- цессы по управляющей и (к) и регулируемой у (к) переменным для объекта II при fi=—0,8; А 20 но обеспечивать выполнение соотношения -^_ = 0. d [и (1)] (17.2-12) Из соображений устойчивости следует, что (17.2-13) и поэтому из уравнения (17.2-10) получим, что U (1) < U (0), (17.2-14) а из уравнения (17.2-11) — hr < ки (0). (17.2-15) Таким образом, для 1 = 1 синтез регулятора с прямой связью с заданным начальным значением управляющей переменной и(0)
Гл, 17. Регуляторы с прямой связью 305 сводится к оптимизации одного параметра с учетом ограничения (17.2-14). Вычислительные затраты на минимизацию в этом случае оказываются незначительными. Для оптимизации с использованием ЭВМ можно рекомендовать улучшенные градиентные методы, опи- Рис. 17.2.4. Переходные процессы по управляющей и (к) и регулируемой у (к) переменным для объекта III при fj—0,3; ho=3,O; h^—2,3. санные в разд. 5.2. Критерий прекращения оптимизации не следует выбирать слишком малым. Ниже будут рассмотрены примеры использования параметри- чески оптимизируемых регуляторов с прямой связью первого поряд- ка (1=1) с заданным начальным значением управляющей перемен- ной для объектов II и III при ступенчатом изменении возмущения v(k). Пример 17.2.1 Объект II. На рис. 17.2.1 показана зависимость V от ц(1), а на рис. 17.2.2 соответствующие переходные процессы по управляющей и регулируемой пе- ременным для ц(0) = 1,5. Из-за наличия в объекте неминимально-фазовой характеристики начальное отклонение у (к) при наличии регулятора с прямой связью оказывается большим, однако для к^=гЗ отклонение убывает. Объект III. На рис. 17.2.3 показана зависимость V от u (1) для различных значений ц (0). Минимум для больших и (0) оказывается относительно пло- ским Из рис. 17.2.4 видно, что регулятор с прямой связью улучшает про- цесс для к ^2.
306 Ч. IV. Связные системы управления Рассмотренный выше метод синтеза систем с параметрически оп- тимизируемыми регуляторами с прямой связью пригоден для устой- j чивых объектов как минимально-фазовых, так и неминимально- * фазовых. Вычислительные затраты при синтезе, однако, оказыва- ются большими по сравнению с компенсационными регуляторами рассматриваемого типа. Тем не менее определение параметров регу- ляторов с прямой связью первого и второго порядка с помощью минимизации является в общем случае простой задачей для автома- тизированного синтеза с помощью ЭВМ. 17.3. РЕГУЛЯТОРЫ С ПРЯМОЙ связью < ДЛЯ ПЕРЕМЕННЫХ СОСТОЯНИЯ - Предполагается, что измеряемые возмущения v (к) воздейст- вуют на переменные состояния х (к-|- 1): х(кф-1) =Ax(k)H-Bu(k)4-xv(k); ' xv (к) = Fv (к); у(к)=Сх (к). (17.3-1) Если переменные состояния х(к) непосредственно измеряются, то отклонения переменных состояния xv (к) будут учтены при формировании сигнала управления с помощью регулятора состоя- ния (8.1-33) и (к) = — Кх (к) с запаздыванием на один такт, так что при использовании регулятора состояния дополнительной цепи пря- мой связи не требуется. При косвенном измерении переменных состоя- ния измеряемые возмущения v (к) -могут быть добавлены к на- блюдателю. Для наблюдателей рис. 8.7.1 или рис. 8.7.2 алго- ритм регулятора с прямой связью имеет вид х (k-|- 1) = Fv (к) или е (к + 1) == Fv (к). (17.3-2) 17.4. РЕГУЛЯТОРЫ С ПРЯМОЙ связью С МИНИМАЛЬНОЙ ДИСПЕРСИЕЙ По аналогии с соответствующими регуляторами с обратной связью регуляторы с прямой связью, обеспечивающие минимальную дисперсию выходной переменной у (к), могут быть синтезированы для измеряемых стохастических возмущений v(k). Здесь, как и при определении регуляторов с минимальной дисперсией в гл. 14 для объектов без запаздывания, минимизируется квадратичная функция стоимости I (k+ 1) = Е {у2 (к4-1) + гп2 (к)}. (17.4-1) Заметим, что управляющая переменная и (к) может воздействовать только на выходную переменную у (к+1), так как Ьо=О. Вывод уравнений регулятора с прямой связью выполняется так же, как и для обычных регуляторов с минимальной дисперсией [см. уравнения
Гл. 17. Регуляторы с прямой связью 307 (14.1-5) — (14.1-12)]. Единственное отличие состоит в том, что v (к) измеряется, и в результате вместо уравнения регулятора с обратной связью u(z)/y(z) = . . . нас интересует прежде всего урав- нение регулятора с прямой связью u(z)/v(z)=. . . . Из уравнения (14.1-12) следует, что zy (z) — Azv (z) 4- u (z) = 0. (17.4-2) В этом случае вместо zy (z) вводится выражение (14.1-5), в ре- зультате чего получим передаточную функцию регулятора с пря- мой связью с минимальной дисперсией: ОрПМд1(г)=^ =----------¥A(z^HD_(£2.)zz£(^)1- . (17.4-3) 1’ zB (z-1) С (z-1) A (z~4 С (z-1) bl Будем его обозначать как РПМД1. Если г = 0, то г XzA(z-4[D(z-i)-C(z-4] /17 4 4\ Орпмд2(2) =--------zB"(Fi)C<z-ij----• (17.4-4) Если С (z-1) = A (z-1), то из уравнения (17.4-3) следует, что Орпмдз(г) = -Ь1Р , (17.4-5) zB (z-1)4--A (Z-1) bl II для r = 0 получим ОРПМД<(2) = - |D ^в\~* (г~‘>1 ' <17Л-6> Регуляторы РПМД2 и РПМД4 оказываются аналогичными регуля- торам с минимальной дисперсией РМД2 и РМД4, за исключением коэффициента X. Так как описанные регуляторы с прямой связью обладают в основном теми же свойствами, что и регуляторы с мини- мальной дисперсией в гл. 14, то ниже будут отмечаться только наи- более важные их свойства. Поскольку рассматриваемые регуляторы с минимальной диспер- сией сокращают полюса и нули объекта, как и обычные регуляторы с минимальной дисперсией, может возникнуть неустойчивость в случаях, приведенных в табл. 14.1.1. Чтобы неустойчивость не возникала, корни полинома C(z-1) для РПМД1 и РПМД2 должны лежать внутри окружности единичного радиуса на плоскости г. Влияние регулятора РПМД1 на выходную переменную опреде- ляется передаточной функцией Gv(z) у (z) __ W (Z-4 , В (Z-1) v (z) C(z-!) tusWa(Z-1) __XD (z-1) Г, ~ C (z-i) _____zB (z-1)____ zB(z-i)4-^-A(z-i) FC(z-i) [d (z-4 1]1. (17.4-7)
308 Ч. IV. Связные системы управления Для регулятора РПМДЗ должно выполняться условие С (z”1) = A (z-1). Если г —>оо, toGv (z) —»ZD (г-Д/С (z”1) и примене- ние регулятора с прямой связью теряет смысл. При г = 0, т. е. для регуляторов РПМД2 или РПМД4, получим G (z)=^=x. v 4 ’ v (г) (17.4-8) Последнее выражение означает, что наличие регулятора с прямой связью приводит к формированию на выходе объекта сигнала белого шума у (z)=Zv (z) с дисперсией X2. Для объектов с запаздыванием d для вывода уравнений регулятора с прямой связью с минимальной дисперсией можно использовать уравнения (14.2-2) — (14.2-9). При этом в уравнение (14.2-9) необходимо только подставить урав- нение (14.2-4), чтобы получить передаточную функцию обобщенного регулятора с прямой связью: ХА (z-1) L (z-i) Српмдьз (z) = (17.4-9) zB (z-i) С (z-1) +£ A (z-1) С (z-i) или при г = 0 Г / \ _ (z-1) L (Z-1) <ЗрпМД2-з (Z) — zB (z_x) c (z_X). Если C (z“3) = A (z-1), то получим Српмдз-з(г) =----------—Ц— ------- zB (z-i)4-^-A(z-9 или при г=0 ri (7\_______ ZL (z 9 ОрПМД4-з(2)- — zg (17.4-10) (17.4-11) (17.4-12) Результирующая передаточная функция по выходной координате для регуляторов РПМД2-3 и РПМД4-3 будет равна Таким образом, как и в случае регуляторов с минимальной диспер- сией при наличии обратной связи, получаем объект порядка d со скользящим средним (14.2-19). При увеличении времени запаздыва- ния дисперсия выходной координаты резко возрастает, как и в уравнении (14.2-20). Регулятор с прямой связью с передаточной функцией впервые был предложен в работе 125.9].
ЧАСТЬ V Многомерные системы управления ГЛАВА 18 Структуры многомерных объектов Этот раздел посвящен рассмотрению методов синтеза регуляторов для линейных дискретных многомерных объектов. Как показано на рис. 18.0 1, входы Uj и выходы yj многомерных объектов влияют друг на друга, что приводит к взаимозависимости цепей прямой передачи сигналов щ> yi, н2—> у2 и т. д. Внутренняя структура многомерных объектов оказывает су- щественное влияние на проектирование многомерных систем управления Та- кая структура может быть получена в результате теоретического моделиро- Рис. 18.0.1. Многомерный объект. вания, если знания об объекте оказываются достаточными. Структуры раз- личных технологических объектов имеют существенные отличия и поэтому не могут быть описаны небольшим набором стандартизованных структур. Однако реальные структуры часто можно привести к канонической форме, используя преобразования подобия или простые правила преобразования блок-схем. В следующем разделе рассмотрены специальные формы структур многомерных объектов, основанные на их представлении в виде передаточных функций, матричных полиномов или в пространстве состояний. Эти структуры служат основой для синтеза многомерных регуляторов, о которых речь пойдет в по- следующих главах.
310 Ч. V. Многомерные системы управления 18.1. СТРУКТУРНЫЕ СВОЙСТВА ПРЕДСТАВЛЕНИЯ ОБЪЕКТОВ В ВИДЕ ПЕРЕДАТОЧНЫХ ФУНКЦИЙ 18.1.1. Канонические структуры В качестве примера рассмотрим блок-схему испарителя и пере- гревателя парового котла с естественной циркуляцией, изображен- ную на рис. 18.1.1. Регулируемыми переменными этого двумерного объекта являются давление пара у3 в парособирателе и температура пара У1 на выходе перегревателя. Управляющими переменными Топливный Лм вентиль Фильтр возму- .р. щения Перегреватель /р Датчик Испаритель ._.УД давления £/4 % Уг Рис 18.1.1. Блок-схема испарителя и перегревателя парового котла с естествен- ной циркуляцией [18.5], [18.6]. являются расход топлива и2 и расход воды щ. На основании блок- схемы запишем следующие непрерывные передаточные функции: Перегреватель: Gn = Й)= G1 Ga ® G® G* Испаритель: G„ (s) = ШЙ = G„ (s) G„ (s) G„ (s) G„ (s). Связь перегреватель — испарительj G„ (s) = ^ = G. (s) G. (s) GM (s) G„ (s). Связь испаритель — перегреватель: G21 Ф = та = Gl° GiS ® G« G‘ U2 V9
Гл. 18. Структуры многомерных объектов 311 Элементы с передаточными функциями Gn и G22 называют глав- ными, а элементы с передаточными функциями G12 и G21 — элемен- 1ами связи. Предполагая, что входные и выходные сигналы кванту- ются синхронно с тактом квантования То, получим, применяя z-пре- образование, соответствующие дискретные передаточные функции указанных элементов относительно квантователей (см. приложение): an(l) = 5T(5 = Q‘G’G>a*(z); Gja (z) = = G10G13G14Gu (z); G„(z)=^=G„G,G,G4(z). u2 (z) (18.1-1) Из приведенного примера видно, что в этом представлении относи- 1ельно входа/выхода передаточные функции содержат общие эле- менты. Полученные передаточные функции можно записать в мат- ричной форме с помощью матрицы G (z): У1 = fGu G*x (z)] u* .y»(z)J“ LGi2 (z) (z) J lu2 (z) или y(z)=G(z)u(z). (18.1-2) В рассмотренном примере число входов равно числу выходов, в результате чего матрица G(z) оказывается квадратной. Если число входов и выходов различно, эта матрица будет прямоугольной. Следует отметить, что передаточные функции описывают только управляемые и наблюдаемые части объекта. Как известно, неуправ- ляемые и ненаблюдаемые части объектов не могут быть представ- лены с помощью передаточных функций. Наиболее важные канонические структуры, используемые для описания многомерных объектов относительно входа/выхода, пока- заны на рис. 18.1.2 [18.1]. В случае Р-канонической структуры каждый вход действует на все выходы, а точки суммирования расположены на выходах объек- та; Р-канонические многомерные объекты описываются уравнением (18.1-2). Изменения в одном из передающих элементов влияют только на соответствующий выход, а число входов и выходов может быть различным. Особенность V-канонической структуры состоит в том, что каждый вход воздействует только на соответствующий выход, а каждый выход воздействует на другие входы; эта структура позволяет описать только те объекты, у которых число входов равно числу выходов. Измерения в одном из передающих элементов влияют на сигналы всех других элементов. Двумерному объекту в V-кано-
312 Ч. V. Многомерные системы управления нической форме соответствует следующее уравнение: У/ .У2. Gu 0 ' О G22 uil Г о + р u2j У1 _Уа. о или в обобщенной записи y=GH{u + GKy}. (18.1-3) Здесь Gh—диагональная матрица, содержащая главные элементы передачи. В матрице содержатся элементы связи, а ее диа- Рис, 18.1.2. Канонические структуры многомерных объектов на примере двумер- ных объектов: а — Р-каноническая структура; б — V-каноническая структура. тональные элементы равны нулю. Аналитическая зависимость у от и описывается выражением у = [I - GhGk]’1 Ghu. (18.1-4) Поэтому матрица передачи объекта в V-канонической форме равна G = [I-G11Gk]-iGh. (18.1-5) Она существует, если det [I—GHGK]^=0. Используя уравнение (18.1-5), V-каноническую структуру можно привести к Р-канони- ческой. И наоборот, квадратную Р-каноническую структуру можно привести к V-канонической. Для этого необходимо выполнить следующие преобразования. Уравнение (18.1-2) нужно записать в форме, соответствующей уравнению (18.1-3) [18.4], разложив матрицу G (z) на матрицу GH, содержащую только диагональные элементы, и матрицу GN, содержащую оставшиеся элементы. В результате получим y = GHu + GNu = GH [и4-G^Gnu]. Если матрица G неособая, то u = G-1y, так что у =sGH [u-J-Gh GNG-Xy]. (18.1-6) Сравнивая последнее уравнение с уравнением (18.1-3), получим Gk^Gr’GnG-1. (18.1-7)
Гл. 18. Структуры многомерных объектов 313 Следовательно, каждую из канонических форм можно преобразо- вать в другую, однако при этом нужно учитывать их реализуемость. Для двумерных объектов вычисление элементов передачи, напри- мер, изложено в работе [18.2]. Если характеристики многомерных объектов определяются на основе непараметрических моделей, например на основе частотных характеристик или импульсных переходных функций, их описание удается получить только в виде Р-канонических структур. Если же необходимо оценить другие формы внутренних структур, следует использовать соответствующие параметрические модели или методы параметрической оценки. Обобщенная структура описывает только пути передачи сигна- лов. Реальное же поведение многомерных объектов определяется передаточными функциями главных и связывающих элементов, включая их знаки и взаимное расположение. Различают симметрич- ные многомерные объекты, для которых Gu(z) = Gi)(z),'l 1 = 1, 2, .... Gi|(z) = G,i(z)J j = l, 2, .... и несимметричные многомерные объекты, для которых О„(г)¥=Ои(г)Д 1=1, 2, .... G1( (z) ^G,, (z), I j=I, 2, .... С точки зрения времени установления для развязанных главных контуров управления медленные элементы объекта Gn могут быть связаны с быстрыми^элементами объекта G^. В объектах с сосредо- точенными параметрами сигналы на входе и выходе представляют собой изменение запасов энергии, массы или моментов. Часто глав- ные и связывающие элементы содержат одни и те же компоненты запасов, так что главный и связывающий элементы передачи могут иметь общие множители в передаточных функциях. Поэтому часто бывает, что Gji^Gjj или Gn^Gji. 18.1.2. Характеристическое уравнение и коэффициент связи Другие структурные свойства многомерных процессов далее будем рассматривать на примере дискретной системы, состоящей из двумерного объекта с Р-структурой (18.1-2) и двумерного ре- гулятора pl (z)j _Г—Rn(z) 0 1ГУ1(г)’ u2(z)J [ 0 — R22(z)J [y3(z) или u(z) = R (z) у (z), (18.1-8) состоящего только из двух главных регуляторов. Предполагается, что такты квантования во всей системе одинаковы и квантование
314 Ч. V. Многомерные системы управления всех сигналов выполняется синхронно. Кроме того, будем считать, что Wi-w.,-0, С учетом этих условий запишем [I-G(z)R(z)]y(z)=0 (18.1-9) ri+GxxRxx G2XR22 1ГУ11Г0 G12Ru 1 + G22R22J yj ~ _0 Умножив матрицу на вектор, получим следующие уравнения: (1 +G11R11)y1 + G21R22y2 = 0, GiaRiiYi + U 4-G22R22) у2 = 0. Разрешим первое уравнение относительно у2 и полученное вы-’ ражение подставим во второе уравнение. Результирующее выраже- ние будет иметь вид [[1 + Gu (z) Rxx (z)] [1 + G22 (z) R22 (z)] — G12 (z) Rxx (z) G21 (z) R22 (z)] yi — 0. Следовательно, характеристическое уравнение двумерной системы управления записывается следующим образом: [1 + Gu (z) RxX (z)] [1 + G22(z)R22 (z)] — G12(z)Rx1(z)G21 (z) R22 (z) = 0. (18.1-10) Для характеристического уравнения (18.1-9) можно записать det [I — G(z) R (z)]«0. (18.1-11) Выражения 1 + GXXRXX и 1 + G22R22 являются характеристичес- кими полиномами несвязанных контуров управления, состоящих из главных элементов передачи и главных регуляторов. Член — GX2RXXG2XR22 описывает взаимосвязь собственных движений глав- ных контуров управления при наличии элементов перекрестной связи GX2 и G2X. Этот член определяет изменение характеристичес- ких уравнений изолированных контуров управления, обусловлен- ное влиянием элементов связи. Если GX2=0 и/или G2X=0, то коэф- фициенты отдельных контуров управления не изменяются. Рассмотрим теперь другую форму записи характеристического уравнения двумерной системы управления. Для этого представим уравнение (18.1-10) в следующей форме: (1 +GX1RXX) (1 +G22R22) [1 — (1 + G11ru) (1 + g22r22)] =0- Введем передаточные функции замкнутой системы относительно задающих сигналов G М — - ' — G'1'1 i —1 9 /18 1-191 <z> — (z) — 1+Gu (X) Ки(г) ’ ' (18 ‘ * откуда получим (1 +G..R,,) (1 +G„R„)(l-xG„Gw,)-0. (18.1-13)
Гл. 18. Структуры многомерных объектов 315 Множитель (1—xGw1Gw2) = 0 содержит дополнительные собствен- ные значения, возникающие при наличии взаимной связи между контурами управления. Здесь v /7 \ __ G12 (z) G21 (z) Л W Gu (z) G22 (z) (18.1-14) является динамическим коэффициентом связи. Из уравнения (18.1-13) видно, что набор собственных значений многомерной системы с P-структурой состоит из собственных значений отдельных главных контуров управления и дополнительных собственных значений, обусловленных наличием элементов связи Gi2 и G2i. И снова при Рис. 18.1.3. Структура «объекта управления» для регулятора Ru. G12=0 и/или G2i=0 собственные значения двумерной системы идентичны собственным значениям отдельных несвязных контуров управления. Из уравнения (18.1-10) после деления на (1 + G22R22) следует, что 1 (1 —xGw^) =0 (18.1 -15а) или, если делить на (1 H-G^Rn), 1 +G2-2R22 (1 —xGwl) =0. (18.1-156) При наличии взаимного влияния контуров «объекты» управления главных регуляторов изменяются: Gii—“Си (1 — xGwa). G22 ► G22 (1 xGwl), как это видно из рис. 18.1.3, а. Вторые контуры передачи сигна- лов GjixGWj оказываются включенными параллельно главным объектам управления Gu.
316 Ч. V. Многомерные системы управления Теперь рассмотрим, как изменяются коэффициенты передачи «объектов» управления при учете влияния соседних контуров. Для регулятора Rn (z) коэффициент передачи объекта равен GH (1) при разомкнутом контуре j и равен Gn (1) [1 — x0Gw1 (1)] в случае замкнутого соседнего контура. Множитель [1 — x0Gwj (1)] = ей определяет изменение коэффициента передачи при замыкании со- седнего контура. Этот множитель называется статическим коэф- фициентом связи: и.=и(1)-б-(11!о”т = ^Х!~- (18Л-16) (1) Cl22 (1) i\lli\22 Этот коэффициент существует для элементов передачи с пропор- циональными или интегрирующими свойствами, причем в послед- нем случае оба элемента Gu (z) и G^ (z) должны обладать интег- Рис. 18.1.4. Зависимость параметра Бц от статического коэффициента свя- зи х0 двумерной системы управления с Р-канонической структурой. рирующими свойствами. На рис. 18.1.4 показана зависимость коэффициента еь от х0. Для разомкнутого соседнего контура j] коэффициент eh = 1. Если же соседний контур замкнут, возможны следующие случаи: 1) х0 < 0 (отрицательная перекрестная связь)—>£Г1> 1, 2) х0 > 0 (положительная перекрестная связь): а) Gwj (1) хо > 0 -* 0 < 1, б> х° > ё~Д) £н < °- Таким образом, двумерный объект может быть положительно или отрицательно связанным. В случае 1 коэффициент передачи «объекта» возрастает при подключении соседнего контура, так что в общем случае коэффициент передачи регулятора может быть выбран меньшим. В случае 2а коэффициент передачи «объекта» управления убывает и коэффициент передачи регулятора может быть увеличен. Наконец, в случае 26 коэффициент передачи «объекта» управления
Гл. 18. Структуры многомерных объектов 317 изменяется так, что оказывается необходимым изменять знак коэф- фициента передачи регулятора RH. В области 8и«0 управление переменной yt практически невозможно. Так как коэффициент связи x(z) зависит только от передаточных функций объектов, включая их знаки, положительная и отрицатель- ная перекрестная связь между контурами определяется свойствами двумерных объектов. Наличие цепи, параллельной главному эле- менту Си (рис. 18.1.3, б), приводит к появлению дополнительного сигнала, который передается элементами связи. Если эти элементы являются достаточно инерционными, соседний контур оказывает незначительное влияние на ух. Если же элементы GX2 и G21 не слиш- ком инерционны по сравнению с элементом передачи Gu, то «быст- рый» соседний контур более существенно влияет на переменную ух, чем «медленный». 18.1.3. Влияние внешних сигналов Переходные процессы многомерных объектов при наличии внешних возмущений и задающих сигналов зависят как отточек их приложения, так и от того, действуют ли они последовательно или одновременно. Рассмотрим на примере двумерных процессов сле- дующие случаи (см. рис. 19.0.1): а) Возмущение v воздействует на оба контура В этом случае ni=GvxV и n2=GV2v. Такая ситуация возникает, например, при изменении рабочей точки или нагрузки, что в боль- шинстве случаев выражается в одновременном изменении энергии, массопередачи или движущих сил. Отметим, что передаточные функции GvX и Gv2 могут иметь как совпадающие, так и противопо- ложные знаки. б) Возмущения пх и п2 независимы Оба возмущения могут изменяться одновременно, как, например, в случае статистически независимых шумов. Однако они могут появ- ляться последовательно, как обычные детерминированные возмуще- ния. в) Задающие переменные Задающие переменные wx и w2 могут изменяться одновременно: Wx(k)=w2(k) или Wj (k)^w2 (к). Они, конечно, могут изменяться и независимо. На примере парового котла (рис. 18.1.1) эти случаи соответст- вуют следующим возмущениям: а) — изменению расхода пара из-за изменения нагрузки; — изменению теплотворной способности топлива (угля); — загрязнению поверхности испарителя.
318 Ч. V. Многомерные системы управления б) Пх — загрязнению поверхности перегревателя; — изменению выходной температуры пара в перегревателе, вызванному колебаниями потока воды или ее темпера- туры; п2— изменению потока воды. 1 в) В случае изменения нагрузки задающие переменные Wx и < w2 могут изменяться одновременно, в частности при выравни- вании давления. Однако допустимы и их независимые изме- нения. Наиболее часто в рассматриваемом примере возмущения дейст- • вуют одновременно на оба контура. Эти возмущения, как правило, , имеют наибольшую амплитуду. j 18.1.4. Взаимодействие главных регуляторов ] В зависимости от вида внешних возбуждающих воздействий и i передаточных функций главных элементов и элементов связи глав-j ные регуляторы могут действовать, усиливая или ослабляя друг друга* [18.7]. При ступенчатом изменении возмущение v воздействует на! оба контура (рис. 19.0.1), где Gvi и Gv2 имеют одинаковые знаки, а| все главные элементы и элементы связи имеют низкочастотный^ характер и P-структуру. В табл. 18.1.1 показаны четыре соответ- ствующие группы комбинаций знаков, полученных на основании^ анализа по блок-схеме изменения сигналов исходных переходными процессов, где в общем случае проявляются наибольшие изменения.! Разделение на группы зависит от знаков отношений | К12 и К21 ' Ku к22- Их произведение равно статическому коэффициенту связи х0. По- этому для положительного коэффициент а х0 > 0 можно выделить группы.’ J I) Иц усиливает R22, R22 усиливает Ru; | II) Ru ослабляет R22, R22 ослабляет Ru, ’ а для отрицательного коэффициента х0 < 0 — группы: I]]) Ru усиливает R22, R22 ослабляет Rxx', IV) Rxx ослабляет R22, R22 усиливает Rxx- Если передаточные функции Gvx и Gv2 имеют различные знаки, то комбинации знаков для групп I и II или III и IV должны быть изменены. Передаточная функция по возмущению Gn ' Gvi р GwjGyj g _______________ril_______ vyl v 1+GiiRii (1-xGwj) показывает, что переходные процессы по регулируемой переменной оказываются идентичными для различных комбинаций знаков в рам- ках одной группы. Если же только одно возмущение Их воздействует
Гл. 18. Структуры многомерных объектов 319 Таблица 18.1.1 Взаимное влияние главных регуляторов как функция знаков главных элементов и элементов связи для ступенчатого изменения возмущения v, одновременно воздействующего на оба контура. Gvi и Gv2 имеют одинаковые знаки. (Заимствовано из [18.7].) Перекрестная связь Знак К„ К22 К21 к12 Взаимное влияние главных регуляторов Группа Положительная (х0 > 0) + + + + + — — + - + + - Усиливают друг друга О О ” А А ei - сч] м н| м 1 1 + + 1 + 1 + + 1 + 1 + + 1 1 Ослабляют ДРУГ друга ^1^ м м n In м w »м А А >— о о Отрицательная (х0 < 0) 1 1 ++ 1 + 1 + + 1 + 1 1 1 + + Rn усиливает R22 R22 ослабляет Ru III ^<0 *\22 >0 Кц 1 + 1 + 1 + 1 + + + 1 1 Rn ослабляет R22 R22 усиливает Rn IV > 0 К22 ^<0 ^11 на выходной сигнал у1( а п2=0, то влияние соседнего регулятора R 22 можно оценить по табл. 18.1.2. Регулятор R22 ослабляет действие регулятора Rn при положительной связи между контурами управ- ления и усиливает его действие при отрицательной связи. После сравнения всех случаев: • GV1 и Gv2 имеют одинаковые знаки; • GV1 и Gv2 имеют различные знаки; © Gvl=0, a Gv2+=0 или Gv1=/=0, a Gv2=0 можно сделать вывод, что здесь нет такой комбинации знаков, при которой происходит только усиление или ослабление действия
320 Ч. V. Многомерные системы управления Таблица 18.1.2 Влияние главного регулятора R22 на главный регулятор Rn при воздействии возмущения nx на регулируемую переменную yv Комбинации знаков и группы те же, что и в табл. 18.1.1 Перекрестная связь Влияние R22 на R,, Группа Положительная Ослабляет I (х0 > 0) » II Отрицательная Усиливает III (х„ < 0) » IV регуляторов во всех случаях. Это означает, что взаимодействие главных регуляторов для двумерного объекта всегда зависит от конкретного внешнего возмущения. С этой точки зрения каждуи| многомерную систему управления следует рассматривать индивЛ дуально. 1 В качестве примера снова рассмотрим паровой котел (рис. 18.1.1)| Возмущающие элементы имеют одинаковые знаки передачи сигна| лов изменения расхода пара, так что результаты, приведенные в табл. 18.1.1, оказываются в этом случае справедливыми. Анализ знаков дает комбинацию-----F + +, что соответствует группе IV. Перегреватель и испаритель связаны отрицательно, и соответст- вующий статический коэффициент связи х0——0,1145. Регулятор давления пара R22 усиливает действие регулятора температуры пара Rn, см. [18.5]. Однако Ru- незначительно ослабляет действие R22, так как элемент G8 на рис. 18.1.1 имеет относительно низкий коэффициент передачи. Изменение теплотворной способности влия- ет на обе выходные переменные с одним знаком, так что ее можно включить в ту же группу. 18.1.5. Представление в матричной полиномиальной форме Кроме представления в виде передаточных функций для линей- ных многомерных систем используется матричное полиномиальное представление [18.10] A(z у (z) = В (z-1) u (z), где A (z 1) = A04~A1z 14-• • • 4~ Amz m, В (z-1) = B1z-1+...+Bmz-m. (18.1-17) (18.1-18) Если A (z-1)—диагональная полиномиальная матрица, то объект с двумя входами и двумя выходами можно описать следующим
Гл. 18. Структуры многомерных объектов 321 уравнением: Au (Z"1) О (18.1-19) Эта запись соответствует Р-канонической структуре с общими поли- номами знаменателя Gu(z) и G21(z) или G22(z) и Gi2(z) —сравни- те с уравнением (18.1-2). Структурам более общего вида соответст- вует наличие внедиагональных полиномов в А (г-1). 18.2. СТРУКТУРНЫЕ СВОЙСТВА ПРЕДСТАВЛЕНИЯ В ПРОСТРАНСТВЕ СОСТОЯНИЙ Распространяя представление линейных объектов с одним входом и одним выходом в пространстве состояний (3.6-16), (3.6-17) на ли- нейные многомерные объекты с р входами и (к) и г выходами у(к), получим следующие матричные уравнения: х (к+ 1) = Ах (к) +Ви (к), (18.2-1) у (k) = Cx(k) + Du(k), (18.2-2) где х(к)—вектор состояния размерности (mxl); и (к) — вектор управления размерности (pxl); у (к) — вектор выхода размерно- сти (rxl); А—матрица системы размерности (mxm); В—мат- рица управления размерности (mxp); С — матрица выхода (изме- рений) размерности (rxm); D—матрица входа/выхода размерно- сти (гхр). Представление многомерных систем в пространстве состояний обладает рядом преимуществ по сравнению с записью в виде пере- даточных функций. Например, оно позволяет описать произволь- ные внутренние структуры с помощью минимального числа пара- метров, а также описать неуправляемые или ненаблюдаемые части объекта управления. Кроме того, переход от объектов с одним входом и одним выходом к многомерным объектам связан лишь с заменой векторов параметров Ь, с и коэффициента d соответствую- щими матрицами параметров В, С и D. Поэтому методы анализа и синтеза регуляторов для объектов с одним входом и одним выходом могут быть непосредственно использованы для объектов со многими входами и многими выходами. Однако для многомерных объектов существует большое число канонических структур представления в пространстве состояний. Поэтому выбор подходящей структуры состояния является весьма сложной задачей. Для первоначального ознакомления с формами матриц А, В и С и соответствующими им структурами блок-схем рассмотрим, как и в разд. 18.1, три примера двумерных объектов.
322 Ч. V. Многомерные системы управления а) Двумерный объект с непосредственной связью переменных состояния главных элементов передачи На рис. 18.2.1 изображены два главных элемента передачи, переменные состояния которых непосредственно связаны между собой матрицами А^2 и A2'i. Физически это означает, что все источ- ники энергии и переменные состояния являются составной частью Рис. 18.2.1. Двумерный объект с непосредственными перекрестными связями между переменными состояния главных элементов. главных элементов передачи. Элементы связи не имеют независимых источников энергии или собственных переменных состояния. Урав- нения состояния в этом случае имеют вид Х11(к + 1)' _x22(k-f-l) _ AjaI™.?.1.! Хч (к) А12 j А, Гу1 (к)1 _ .Уа (k)J 22. .^22 (к)_ с‘п о 1 Гхн (к)' 0 cJ2J [х22 (к) ‘ Ьц О‘1Ги1(к)1 .° b22J |_u2(k)J ’ (18.2-3) (18.2-4) Матрицы Ап и А22 главных элементов передачи являются диаго- нальными блоками, а матрицы связи А^2 и А2) являются внедиа- гональными блоками общей матрицы системы А. Главные элемен- ты передачи могут быть представлены в одной из канонических форм, приведенных в табл. 3.6.1. Матрицы связи содержат лишь параметры связи в соответствующей форме и нулевые элементы. б) Двумерные объекты с Р-канонической структурой Двумерный объект в Р-канонической форме, аналогичный изоб- раженному на рис. 18.1.2, а, приведен на рис. 18.2.2. Предполага- ется, что главные элементы и элементы связи имеют различные
Гл. 18. Структуры многомерных, объектов 323 iочники энергии и переменные состояния при отсутствии непо- редственной связи между ними. Уравнения состояния записы- ваются следующим образом: -хп (к+1)" х12 (к +1) *21 (к+1) _х22 (к+1)_ ГАи О О О о А12 о о о о А21 о О - о о ^22 _ Хц (к)’ Х12 (к) х21 (к) _Х22 (к). "bn Ь12 О О - 0 Ги1(к)1 b2i [и2(к)]’ Ь22_ (18.2-5) о Ух (к)’ .У2 (к). Г *11 (к)" Сп 0 cjj 0 х18 (к) О сЪ О cjJ х21(к) _Х22 (к)_ (18.2-6) В этом случае все матрицы главных элементов и элементов связи являются диагональными блоками матрицы А. Рис. 18.2.2. Двумерный объект с Р-канонической структурой. в) Двумерные объекты с V-канонической структурой Двумерные объекты с V-канонической структурой, изображенной на рис. 18.2.3, имеют независимые источники энергии и переменные состояния, соответствующие различным элементам передачи, в ре-
324 Ч. V. Многомерные системы управления зультате чего их представление в пространстве состояний имеет вид + + + 4Й r-i eq гч r-i i-i ei XXX 1 = ГАП Ь12С11 0 0 Ala 0 bncL 0 A2i b 0 " 0 21C22 1 XXX ьа м м l-S ЬО M (k)n (k) (k) + -bn 0 0 0 -1 0 0 X _Х22 (k + lL У1 (k) .У2 (k). = 0 cK 0 0 0 b22C12 0 0 0 C22_ 1 1 x x x x x to to H. ) Л ‘Ui (b _u2 0 (k)~l (k) (k) s(k)_ L22 01. 0J ’ _^22 (k)J 0 Ьг2_ ( ( 18.2-7) 18.2-8) Кроме матриц, соответствующих главным элементам передачи и элементам связи и расположенных на диагонали матрицы А, здесь Рис. 18.2.3. Двумерный объект с V-канонической структурой. появляются четыре дополнительные матрицы, как в случае струк- туры с непосредственной связью (см. (18.2-3)). Матрицы В и С имеют аналогичную структуру. Результаты теоретического моделирования показывают, что ре- альные объекты в очень редких случаях имеют такие упрощенные структуры. В общем случае структуры реальных объектов описы- ваются комбинацией различных специальных структур. Если опи- сание в пространстве состояний формируется непосредственно по
Гл. 18. Структуры многомерных объектов 325 передаточным функциям элементов рис. 18.1.2, то одни и те же переменные состояния могут быть включены в описание неоднократ- но. Так происходит, когда составляющие объект элементы имеют общие переменные состояния, как, например, в уравнении (18.1-1). В этом случае матрицы параметров содержат избыточные элементы. Однако если описание в пространстве состояний составлено с учетом наличия общих переменных состояния, так что они не используются двукратно или многократно, то оно содержит минимальное число состояний. Такая форма описания соответствует минимальной реа- лизации объекта. Минимальная реализация является наблюдаемой и управляемой. Следовательно, неминимальное представление в пространстве состояний должно быть не полностью управляемо п/или не полностью наблюдаемо. Методы получения минимальной реализации даны, например, в работах [18.9] и [18.3]. После обсуждения некоторых структурных свойств многомерных объектов рассмотрим несколько методов синтеза многомерных систем управления, изложенных в следующих главах.
ГЛАВА 19 Параметрически оптимизируемые многомерные системы управления Параметрически оптимизируемые многомерные регуляторы характеризу- ются тем, что имеют заданную структуру, свободные параметры которой определяются в результате оптимизации некоторого критерия или с помощью правил настройки. В отличие от обычных систем управления структура мно- Рис, 19.0.1. Различные структуры двумерных регуляторов. а — главные регуляторы; б — перекрестные регуляторы, расположенные после главных; а «= перекрестные регуляторы, параллельные главным; г — перекрестные регуляторы, рас- положенные перед главными.
Гл. 19. Параметрически оптимизируемые системы управления 327 юмерных регуляторов зависит не только от порядка входящих в них алго- ритмов управления, но и от структурного расположения элементов связи, как об этом было сказано в гл. 18. Аналогично главному и связывающему элементам передачи многомерных объектов управления введем понятия главных и связывающих (перекрестных) регуляторов. Главные регуляторы Кц предназначены для непосредственного управления главными элементами Gjj и обеспечивают требуемое качество пе- реходных процессов по переменным у] относительно задающих переменных Wj (рис. 19 0 1, а) Регуляторы используются для связи контуров управ- ления со стороны регулятора (рис. 19.0 1, б—г). Перекрестные регуляторы можно синтезировать так, чтобы развязать контуры управления полностью или частично или же усилить их взаимосвязь. Выбор того или иного решения зависит от свойств объекта, действующих возмущающих и управляющих сигналов, а также от требований к качеству управления Перекрестные регуляторы могут быть синтезированы в Р-канонической форме и располагаться до, параллельно или после главных регуляторов. То же можно сказать и о регуляторах в V-канонической форме. При реали- зации регуляторов с помощью аналоговых средств положение перекрестных регуляторов зависит от места расположения усилителя мощности. Что же касается цифровой реализации алгоритмов управления на специальном вы- числителе, то в этом случае можно использовать любые структуры из приве- денных на рис. 19.0 1. В дальнейшем из соображений большей простоты и наглядности будем рассматривать двумерные объекты управления. Получен- ные результаты могут быть легко распространены на объекты с большим числом регулируемых переменных. 19.1. ПАРАМЕТРИЧЕСКАЯ ОПТИМИЗАЦИЯ ГЛАВНЫХ РЕГУЛЯТОРОВ В гл. 18 уже было показано, что существует много структурных комби- наций элементов двумерных объектов и знаков их связи. Поэтому большин- ство исследований двумерных объектов связано с определенными вариантами их структур и передаточных функций. Способы управления и вопросы вы- бора параметров, описанные в работах [19.1] — [195] и [19.7], основаны на специальном Р-каноническом представлении непрерывных объектов. Ниже обсуждаются некоторые результаты, содержащиеся в указанных публикациях, которые оказываются справедливыми для дискретных многомерных систем. Двумерные объекты, представленные в Р-канонической форме, с синхронным квантованием всех сигналов и равными тактами кван- тования характеризуются следующими свойствами, важными о позиций управления (см. разд. 18.1): 1. Устойчивость, качество: а) передаточные функции главных элементов Gu, G22 и элемен- тов перекрестной связи G12, G21: • симметричные объекты GU=G22, Gi^Gai; • несимметричные объекты Gu¥=G 22, G12=#G21;
328 У. V. Многомерные системы управления б) коэффициент связи: • динамический х (z)=G12(z)G21(z)/Gu(z)G22(z); • статический х0=К12К21/КиК2а; х0 < 0: отрицательная перекрестная связь; х0 2> 0: положительная перекрестная связь. 2. Качество управления, параметры регулятора (в дополнение к п. 1): а) влияние возмущений (рис. 19.0.1): Ф возмущение v одновременно воздействует на оба контура (т. е. изменяется рабочая точка или нагрузка объекта) ni = Gvlv и Ha^Gy^. — GV1 и GV2 имеют одинаковые знаки; — GV1 и GV2 имеют противоположные знаки; ф возмущения пл и п2 независимы: — П1 и п2 действуют одновременно; — П1 и п2 действуют поочередно (детерминированные возмуще- ния); б) изменения задающих переменных Wi и w2: Ф одновременные fwi (k)=w2(k), lwx (k)=#w2(k); ф поочередные; в) взаимодействие главных результатов: ф Ru и R22 усиливают действие друг друга; ф Rn и R22 ослабляют действие друг друга; Ф Rn усиливает R22, R22 ослабляет Ru; Ф Ru ослабляет R22, R22 усиливает Rn- В случае дискретных сигналов такты квантования обоих глав- ных контуров управления могут быть одинаковыми и различными. Квантование может также быть синхронным и асинхронным. В следующем разделе рассмотрены области устойчивости и спо- собы выбора параметров регуляторов для двумерных объектов, представленных в Р-канонической форме. Результаты были полу- чены главным образом для непрерывных систем управления, однако качественно они справедливы и для дискретных систем с относитель- но малыми тактами квантования. 19.1.1. Области устойчивости При исследовании характеристик устойчивости двумерных си- стем управления с главными регуляторами пропорционального типа оказывается весьма удобным использовать зависимость границ устойчивости от величины коэффициентов передачи Kru и Kr22. На рис. 19.1.1 и 19.1,2 изображены области устойчивости сим- метричных двумерных объектов с передаточными функциями GM<s)=(iTf55’ 22, 12,21, (19.1-1)
Гл. 19. Параметрически оптимизируемые системы управления 329 Рис. 19.1.1. Области устойчивости симметричной двумерной системы с отрица- тельной перекрестной связью и П-регуляторами [19.1]. для положительных и отрицательных значений коэффициента связи [19.1] x0=KiaK2i/KnK22. Зависимость коэффициентов передачи регуляторов KR11 от критических значений коэффициентов переда- чи Kruk для границ устойчивости при отсутствии связи между главными контурами, т. е. при хо=О, такова, что область устойчи- вости представляет собой квадрат, ограниченный линиями Рис. 19 1.2. Области устойчиво- сти симметричной двумерной си- стемы управления с положитель- ной перекрестной связью и П-ре- гуляторами [19,1],
330 Ч. V. Многомерные системы управления Кки/Кипк—! и осями координат. При увеличении значения отри- цательного коэффициента связи (х0<1) в средней части область неустойчивости возрастает, а с обеих сторон возникают дополнитель- ные пики (рис. 19.1.1). При увеличении значения положительного коэффициента связи (х0>0) область устойчивости уменьшается и при х0=1 ограничена треугольником (рис. 19.1.2). Для х0>>1 двумерная система с главными регуляторами интегрирующего типа становится структурно неустойчивой, как это видно из рис. 18.1.3, а. В этом случае GW1 (0) = 1, GW2(0) = l и при х0=1 возникает положи- тельная обратная связь. Еслих0>1, следует либо изменить знак коэффициента передачи регулятора, либо изменить коэффициенты связи управляющих и регулируемых переменных. Из рис. 19.1.1 и 19.1.2 видно, что область устойчивости при увеличении значения коэффициента связи убывает, если не учитывать наличия пиков при Рис. 19.1.3. Области устойчивости симметричной двумерной системы а отрицательной перекрестной связью (х0=—1) с непрерывными П-, ПИ- и ПИД-регуляторами [19.1]. ПИ- регулятор: Т[=Тр. ПИД-регуля- тор: Т]=Тр; Td=0,2Tp. Тр — пе- риод колебаний при КйН=КкНК (при критическом коэффициенте передачи на границе устойчивости), см. рис. в табл. 5.6.1. отрицательных значениях коэффициента связи, которые на прак- тике не используются. На рис. 19.1.3 показано изменение областей устойчивости при введении в П-регулятор интегрирующего (ПИ-регулятор) и диффе- ренцирующего (ПИД-регулятор) членов для случая отрицательного коэффициента связи. В первом случае область устойчивости убы- вает, а во втором — возрастает. До сих пор границы устойчивости рассматривались для систем с непрерывными сигналами. Если же рассматривать дискретные регуляторы, то их области устойчивости при малых тактах кванто- вания То/Т95^0,01 близки к непрерывным. Однако при больших значениях тактов квантования области устойчивости существенно сокращаются, как это видно из рис. 19.1.4.
Гл. 19. Параметрически оптимизируемые системы управления 331 В работе [19.1] даны границы устойчивости асимметричных объектов. Постоянные времени (19.1-1) были изменены так, чтобы периоды устойчивых колебаний Тр. несвязанных контуров с П-регуляторами на границе устойчивости удовлетворяли условию Тр2/Тр1>1. На рис. 19.1.5 изображены типовые формы областей Рис. 19.1.4. Области устойчивости для той же системы, что изображе- на на рис. 19.1.3, при использова- нии дискретных регуляторов с раз- личными тактами квантования То. устойчивости двумерных систем. На основании приведенных здесь и содержащихся в работе [18.7] исследований можно сделать сле- дующие выводы о свойствах двумерных систем управления с Р-канонической структурой: а) При отрицательной перекрестной связи между контурами об- ласти устойчивости имеют пики, причем приближенно симметрич- ным объектам соответствуют два пика, а остальным — только один пик. б) При положительной перекрестной связи с возрастанием асим- метрии объекта существенно увеличивается область устойчивости, в) При возрастании асимметрии, когда, например, контур 1 ока- зывается более быстрым, граница устойчивости приближается к верхней части квадратной области устойчивости, соответствующей несвязанным контурам. Это означает, что более медленный контур меньше влияет на устойчивость более быстрого контура. Знание этих областей устойчивости позволяет сформулировать правила настройки двумерных регуляторов. 19.1.2. Оптимизация параметров и правила настройки двумерных регуляторов Параметры оптимизируемых главных регуляторов с передаточ- ной функцией R,.w=m, (19.1.2) ei \Z) И (Z ) 14
332 Ч. V. Многомерные системы управления Увеличение асимметрии Tpl/Tpl Рис. 19.1.5. Типичный вид областей устойчивости для двумерных систем управле- ния с П-регуляторами; TPj— период колебаний изолированных контуров на гра- нице устойчивости. где чаще всего v—1 или v^=2, могут быть получены с помощью численной оптимизации критериев качества, в результате задания желаемого расположения полюсов или в соответствии с правилами настройки. В отличие от одноконтурных систем весовые коэффи- циенты при регулируемых переменных могут иметь различные зна- чения, например при использовании смешанного критерия вида; р м j s:„=s«! 2 [е? (k)+ I-! Auf (k)]. (19.1-3)! 1=1 k= 0 < Здесь — весовые коэффициенты главных контуров, причем’ Sai==l. Если этот критерий имеет единственный минимум, удов-]
Гл. 19. Параметрически оптимизируемые системы управления 333 летворяющий условию dS|u/dq = O, (19.1-4) io вектор оптимальных параметров регулятора будет равен чт = [Чо1, Чи, •••, qvii ..-;чор, QiP, • ••, qVP]- (19.1-5) Однако необходимые вычислительные затраты при увеличении числа р регулируемых переменных существенно возрастают. Удачный выбор начальных значений параметров регулятора может привести к ускорению сходимости процесса оптимизации. Результаты сильно Рис. 19.1.6. Области допустимых значений коэффициентов передачи двумерных систем. Отрицательная перекрестная связь: а — симметричная, б — асимметрич- ная. Положительная перекрестная связь: в — симметричная, г — асимметрич- ная. зависят от того, какие сигналы воздействуют на систему (см. разд. 19.1). Для главных регуляторов двумерных систем были разработаны правила настройки. Они основывались на правилах Циглера — Никольса и предназначались для непрерывных систем [9.1] — [9.5] и [9.7]. Дополнительное практическое требование состоит в том, что один контур должен оставаться устойчивым, когда другой разомк- нут. Поэтому их коэффициенты передачи должны удовлетворять соотношению Кии/Киик<1 и лежать внутри заштрихованных областей на рис. 19.1.6. На основании исследования областей устойчивости можно сфор- мулировать следующие правила настройки (ссылки на а—г отно- сятся к рис. 19.1.6).
334 Ч. V. Многомерные системы управления 1. Определение границ устойчивости 1.1. В качестве главных регуляторов берем П-регуляторы. 1.2. Задаем Kr22=0 и увеличиваем Krh до тех пор, пока не дости- гаем границы устойчивости (Kru=Kriii<, точка А). 1.3. Задаем Krh=0 и, изменяя KR22, находим точку В, т. е. Kr22k« 1.4. Задаем Krii=Kriu< и увеличиваем Kr22, пока не будут полу- чены колебания с постоянной амплитудой (точка С для а и б). 1.5. Если в предыдущем пункте не будет наблюдаться промежуточ- ной устойчивости, задаем Krii=Krhk/2 и увеличиваем Кн2з> пока не получим точку С' (случаи в и г). 1.6. Для случаев а и б повторим пункт 1.4, задавая Kr22=Kr22k и изменяя Kru, чтобы найти точку D (случай а). Таким образом, оказывается приближенно выясненным вид области устойчивости, а следовательно, и тип системы (т. е. соответствие случаям а—г на рис. 19.1.6). 2. Выбор коэффициентов передачи KRn <п> для П-регуляторов Случай а. Если более важно качество управления по переменной у15 то KR11 = 0,5KR1ik и Kr22 = 0,5KR22c- Если более важно качество управления по переменной у2, то Kr22 ==0,5KR22k, KR1i = 0,5KR1id- Случай б. Обычно значения коэффициентов передачи выбираются так, чтобы они лежали вблизи середины области устойчивости: Kru = 0,5Kr11k» KR22 = 0,5KR22c- Случай в. KRn = 0,25KRnK, Kr22 = 0,5Kr22c- Случай г. KR11 = 0,5KR11K, KR22 =0,5KR22K. 3. Выбор параметров ПИ-регуляторов Коэффициент передачи как в случае П-регулятора. Постоянная интегрирования: Случаи а н б: Т1П(пи>= (0,8... 1,2) ТрС или Т1П(ПИ) = 0,85ТрИК; Случаи в и г: Tjii(nH) = (0,3.. .0,8)ТрС или Т!11(ПИ) ==0,85ТрНК. Здесь ТрС или ТрНК—периоды устойчивых колебаний на гра- нице устойчивости в точках С или А для i =s 1 или в точке В для i=2. 4. Выбор параметров ПИД-регуляторов Крп<пид>= 1,25Кин(П» Тп](пид)=®0,5ТШ(ПИ), Тон =:0,25Т1П(Пид)- Приведенные правила настройки позволяют получить лишь приближенные значения параметров регуляторов, поэтому во многих случаях их приходится корректировать. Хотя эти правила были даны для непрерывных регуляторов, они могут быть исполь- зованы и для дискретных регуляторов, поскольку в этом случае также требуется обеспечить необходимый запас устойчивости. Свойства переходных процессов различных двумерных систем управления, представленных в Р-канонической форме, были рас-
Гл. 19. Параметрически оптимизируемые системы управления 335 смотрены в работе [18.7]. При одновременном воздействии возмуще- ний на обе регулируемые переменные коэффициент перекрестной связи х0 (как положительный, так и отрицательный) не оказывает существенного влияния на перерегулирование, затухание и т. д. Качество процессов управления определяется главным образом взаимным влиянием главных регуляторов (группы с I по IV в табл. 18.1.1). Если система симметрична, то качество управления ухудшается для рассматриваемых групп в следующей последователь- ности I->111«IV->11, а для несимметричных систем III ->I->IV-> -> II. Наилучшее качество управления достигается в системах с отрицательной перекрестной связью, если Ru усиливает R22 и R22 ослабляет Rn. В случае положительной связи аналогичный эффект достигается, если оба регулятора усиливают действие друг друга. Здесь в обоих случаях усиливается действие главного регулятора бо- лее инерционного контура. Наихудшим качеством регулирования характеризуются объекты с отрицательной перекрестной связью, когда Rn ослабляет R^ и R22 усиливает Rn и особенно, если пере- крестная связь между регуляторами, ослабляющими действие друг друга, положительна. В последних случаях всегда ослабляется действие главного регулятора более инерционного контура. Из ска- занного выше следует, что более быстрый контур мало зависит от более медленного, а влияние более быстрого контура на более медленный имеет существенное значение. Более подробное сравнение качества связных двумерных систем с качеством их отдельных несвязанных контуров содержится в ра- боте [18.7]. Для симметричных объектов отличия оказываются незначительными. Для несимметричных объектов показано, что качество управления более медленного контура при наличии связи улучшается в том случае, когда действие его регулятора или обоих регуляторов усиливается. В этом случае нет необходимости выпол- нять развязку контуров. Качество управления ухудшается, если оба регулятора ослабляют друг друга или если ослабляется действие регулятора более медленного контура. Развязку контуров следует проводить только тогда, когда перекрестные связи в объектах уп- равления положительны, а главное, регуляторы ослабляют действие друг друга. 19.2. РАЗВЯЗКА С ПОМОЩЬЮ ПЕРЕКРЕСТНЫХ РЕГУЛЯТОРОВ Если связная система управления обеспечивает низкое качество регулирования или если требуется нейтрализовать перекрестные связи в объекте, можно в дополнение к основным использовать перекрестные регуляторы. В общем случае полная развязка возмож- на только для определенного типа сигналов. Рассмотрим многомерную систему управления (рис. 19.2.1), в которой dim у = dim u = dim w. Для внешних сигналов v и w
336 У. V. Многомерные системы управления получим y = [I+GpR]-1GPvv + [l -J-GpRpGpRw. (19.2-1) <?v <?w Соответствующее характеристическое уравнение, определяющее собственные движения (моды) системы, имеет вид [I +GPR] у = 0. (19 2-2) Различают три типа развязки многомерных систем ([18.2], [19.6]). • Развязка по задающим сигналам. V Рис. 19.2.1. Многомерная система управления. Задающая переменная Wj влияет только на регулируемую переменную yt и не влияет на остальные переменные yjt В этом случае матрица Gw = [I + GpR]-1 GPR = Dw (19.2-3) должна быть диагональной. ф Развязка по возмущающим сигналам. Возмущение vs влияет только на переменную yj и не влияет на остальные ур При этом матрица GV = [I-}-G?R]-1GPv = Dv (19.2-4) должна быть диагональной. ф Развязка по собственным движениям (модам). Собственные движения отдельных контуров не влияют друг на друга, если отсутствуют внешние возмущения. В этом случае эле- менты вектора у развязаны, и из уравнения (19.2-2) следует, что матрица разомкнутой системы GPR==D0 (19.2-5) должна быть диагональной. Система с независимыми модами явля- ется также развязанной по сигналам задающей переменной. Элементы диагональных матриц могут выбираться произвольно из некоторой ограниченной области. Например, передаточные функции можно задавать так же, как и в случае несвязанных кон- туров. После этого следует рассчитать перекрестные регуляторы R ij и оценить их реализуемость. Поскольку трудно синтезировать
Гл. 19. Параметрически оптимизируемые системы управления 337 развязанную систему по возмущению и она часто оказывается нереа- лизуемой [18.2], в дальнейшем кратко будет рассмотрена развязка по собственным движениям, при которой система оказывается также развязанной по задающим сигналам. Из уравнения (19.2-5) получим R=G₽'D«=^D«- <19-2-6) Элементы матрицы Do и структура регулятора R могут быть за- даны произвольно, если выполняются условия реализуемости и входные сигналы объекта укладываются в допустимый диапазон. Кратко рассмотрим несколько вариантов двумерных систем управ- ления. а) Объект Р-структуры, регулятор Р-структуры Передаточная матрица объекта в соответствии с уравнением (18.1-2) равна р ___ Gn Gai иР — р _ » .'J12 'Jaa. а матрица регулятора имеет вид R = ^21 R12 R22 Матрица регулятора (19.2-6) определяется следующим образом: adjGp Грх1 о 1 Г G22Dfl —G21D22 011^22--G12G21 О D22 G11G22-G12G21 --- G12Dn GnD22 I— 66-1 l_ 1-6 11 XX 66- (19.2-7) Если матрица D описывает поведение развязанных контуров си- стемы, D11 = G11R1 и D22 = G22R2, тогда R = 1 GhG22 — Gi2G2j G^GuRf—G21G22R2 G12G11R1 GUG22R2 (19.2-8) Если регулятор оказывается нереализуемым, следует изменить матрицу D. б) Объект P-структуры, регулятор V-структуры Из схемы развязки, изображенной на рис. 19.2.2, при R, .= и Rk = О R21 LR12 о Rh о . ° r22. следует, что матрица, описывающая весь регулятор, определяется выражением r^u-Rk]-* 1 Rh. (19.2-9)
338 Ч. V. Многомерные системы управления Рис. 19.2.2. Развязка Р-канонического объекта с помощью V-канонических пере- крестных регуляторов, ' расположенных после главных. Развязка собственных движений для задающих сигналов (см. урав- нение (19.2-6)) достигается, если выполняются соотношения [I RK] 1Rh==GpD0, /'19 2-101 RhHI-RkWDo. 10) Следовательно, для двумерной системы с Du ==GiiR1 Ru = Ri. R22 = R2, (19.2-11) R., = -T-’. R,i=-5r- (19.2-12) ^22 ^11 Развязка оказывается очень простой. При этом не вводится дополни- тельных элементов в главные регуляторы, а перекрестные регуля- торы не зависят от главных регуляторов. Если порядки главных Рис. 19.2.3. Развязка V-канонического объекта с помощью Р-канонических пере- крестных регуляторов, расположенных после главных.
Гл. 19. Параметрически оптимизируемые системы управления 339 элементов объекта выше порядков элементов перекрестной связи или они имеют нули вне единичной окружности на плоскости z, то R12 и R21 будут нереализуемыми. Анализ блок-схемы показывает, что перекрестные регуляторы представляют собой идеальные регуля- торы с прямой связью. в) Объект V-структуры, регулятор Р-структуры Если развязка выполняется в соответствии с рис. 19.2-3, снова получим простые соотношения для регуляторов: Rh = Ru R22 = R2. (19.2-13) R12 = -GuG12, R21 = -G22G2l. (19.2-14) В этом случае проблем реализуемости не возникает. 19.3. параметрическая оптимизация главных И ПЕРЕКРЕСТНЫХ РЕГУЛЯТОРОВ В разд. 19.1 было показано, что перекрестные связи в объекте управления могут либо ухудшать, либо улучшать качество управле- ния по сравнению с развязанными контурами. Поэтому введение перекрестных регуляторов должно служить для развязки контуров в первом случае и для усиления перекрестной связи во втором случае. Об этом было сказано в работе [18.7]. В качестве перекрест- ных регуляторов часто вполне достаточно использовать пропорцио- нальные регуляторы: Ui(z)=qoijej (z)=KRljej (z). Соответствующие коэффициенты передачи таких регуляторов могут быть найдены в результате численной параметрической опти- мизации. Результаты моделирования показывают, что для Р-струк- турных низкочастотных симметричных объектов введение перекре- стных регуляторов не приводит к улучшению качества регулирова- ния. Однако для несимметричных объектов можно добиться некото- рого улучшения. Дополнительные регуляторы должны использо- ваться для усиления перекрестных связей, если главные регуляторы усиливают действие друг друга, и для развязки контуров, если главные регуляторы взаимно ослабляют друг друга.
ГЛАВА 20 Многомерные матричные полиномиальные системы управления Методы синтеза несвязанных регуляторов входа/выхода могут быть пере- несены на многомерный случай при использовании матричного полиномиального представления многомерных объектов управления, описанного вразд. 18.15, если число входов объекта равно числу его выходов 20.1. ОБОБЩЕННЫЙ МАТРИЧНЫЙ ПОЛИНОМИАЛЬНЫЙ РЕГУЛЯТОР Обобщенный матричный полиномиальный регулятор описывается уравнением Р (z-1) u (z) = Q (z“ ) [w (z)—у (z)] = Q (z-1) e (z), (20.1-1) где полиномиальные матрицы имеют вид P(z-1) = P04-P1z-l+ • •• +Р^, ,20 . Q(z-1) = Q04-Q1z-1+...+Qvz-\ ' > Управляющие переменные вычисляются с помощью выражения u (z) = Р-1 (z-1) Q (z-1) е (z), (20.1-3) если матрица Р (z-1) неособая. Подставляя последнее выражение в уравнение объекта A (z-1) у (z) = В (z-1) z'd u (z), (20.1-4) получим выражение, описывающее замкнутую систему у (z) = [A (z-1)4-B (z-1) Р-1 (z-1) Q (z-1) z-d]-1 В (z-1) P-1 (z-1) x xQ (z-1) z-d w (z). (20.1-5) Сравнение последнего уравнения с уравнением (11.1-3) подтвержу дает формальное соответствие многомерного случая с одномерным.| 20.2. МАТРИЧНЫЙ ПОЛИНОМИАЛЬНЫЙ < АПЕРИОДИЧЕСКИЙ РЕГУЛЯТОР Предположим, что все полиномы модели объекта имеют оди- наковый порядок m и запаздывание по всем входам равно d. Тогда для получения апериодического регулятора необходимо, чтобы выходные координаты объекта при ступенчатом изменении задающего сигнала w (к) устанавливались за m-J-d тактов, а его управляющие сигналы—за m тактов. В случае систем с одним входом и одним выходом из этого условия получим передаточные
Г л. 20. Многомерные матричные полиномиальные системы управления 341 функции (см. разд. 7.1) УД = В-Х(1) B(z-1)z-d, = A(z-1) и передаточную функцию апериодического регулятора G М В-ЧОА^-1) R w e(z) 1-В-1 (1) В (г-1) z-d ’ По прямой аналогии запишем уравнение синтеза для многомер- ного апериодического регулятора (MAPI) [20.1]: [I —В'1 (1) В (z-1) z“d] u (z) = В-1 (1) A (z-1) е (г). (20.2-1) Этот регулятор обеспечивает конечное время установления пе- реходных процессов по переменным u (z) = В-1 (1) A (z-1) w (z), (20.2-2) у (z) = A-1 (z-1) В (z-1) z-d В-1 (1) A (z-1) w (z) = R (z-1) w (z), (20.2-3) если матрица R (z-1) имеет порядок m-f-d. Уравнение регулятора можно также записать в следующем виде: u (z) = В-1 (1) A (z-1) [w (z) — у (z)] -f- В -1 (1) В (z-1) z-d u (z). ( 20.2-4) Для уменьшения величины входных сигналов объекта управления можно увеличить время установления в системе. Если увеличить время установления на один такт, до ш 4- 1 и ш d + 1, то пере- даточная функция апериодического регулятора для объекта с одним входом и одним выходом будет равна (см. (7.2-14)) Ст (?\ — u (z) q° [1 — z~V0^] A (Z-Q R ' ' e (z) 1—q0 (1—z-1/a) В (z-1) z~d ’ где l/a=l — l/q0B(l). Значение q0 может быть выбрано произ- вольно в диапазоне 1/(1-ах) В (1) < q0 < 1/В (1), так чтобы выполнялось условие u(l)^u(0). Наименьшие значения управляющего сигнала объекта соответ ствуют значению q0, равному qe=l/(l - а,) В (1), откуда следует, что 1/а = а1. Соответствующее уравнение многомерного регулятора (МАР2) имеет вид [1—Q0[l —Hz-1] В (z-1) z-d] u (z) = Q0 [1—Hz"1] A (z-1) e (z), (20.2-5) где H = l-Q0-1B-i(l). (20.2-6)
342 Ч. V. Многомерные системы управления Матрица Qo может быть произвольно выбрана в диапазоне Qomax = B-41), (20.2-7)] причем если выбрано Qo==Qomin, то u(l)=u(0). Таким образом,’ для наименьшей величины входных сигналов в этом случае ' Q0 = B-‘ (1)[1-А,]"1, (20.2-8) откуда следует, что Н = АГ (20.2-9)’ 20.3. МАТРИЧНЫЕ ПОЛИНОМИАЛЬНЫЕ РЕГУЛЯТОРЫ С МИНИМАЛЬНОЙ ДИСПЕРСИЕЙ Предположим, что матричная полиномиальная стохастическая модель описывается выражением A (z-i) у (Z) = В (z-1) z"d u (z) + D (z-1) v (z), (20.3-1) где D (z-1) =D0 + D1z-1+ . . • +Dfflz-m. (20.3-2) Синтез обобщенного регулятора с минимальной дисперсией выпол- няется на основании минимизации критерия [20.1], который имеет вид I (k + d4-1) = Е{[у (k + d+1)—w (k)]T [у (k-f-d +1) —w (k)]-f- + [u (k) —uw (k)]T R [u (k) —uw (k)]}, (20.3-3) где матрица R = RT положительно полуопределена. Переменная uw (k) определяет установившееся значение сигнала u (к), которое вычисляется с помощью выражения uw (к) = В-1 (1) А (1) w (к). (20.3-4) Как и в случае уравнения (14.2-4), модель объекта и сигнала представляется в виде Z(d + D у (z) — д-i (z-i) [в (z-1) zu (z) -Ь L (z-1) v (z)] + + F (z-1) z(d+1) v (z), (20.3-5) где матричные полиномы F (z-1) и L (z-1) описываются выраже- ниями F (z-1) = I + FjZ-1-}- .. . + Fdz-d, (20.3-6) L (z-1) = Lo4- L.z-1 + •.. + Ljh.jZ-'"1"1’. (20.3-7) Параметры этих полиномов определяются из уравнения D(z-1)=A(z“1) F (z-1)-J-z-(d+1)L(z-1). (20.3-8) После этого выполняется преобразование уравнения (20.3-5) во временную область и по аналогии с уравнениями (14.1-7)—(14.1-10)
Гл. 20. Многомерные матричные полиномиальные системы управления 343 формируется I (k-J-d + 1). Затем вычисляется<31 (k+d +1 )/ди (к)=0, в результате чего будет получено уравнение Bl [A-1(z-1) [В (z-1) zu (z) 4- L (z-1) v (z)] — w (z)]4- 4-R[u(z)-uw(z)] = 0, (20.3-9) где вектор v (z) может быть заменен (восстановлен) выражением v (z) = D-1 (z-1) [A (z-1) у (z) — В (z-1) z“d u (z)]. (20.3-10) После подстановки выражения (20.3-4) в (20.3-9) будет получено уравнение обобщенного матричного полиномиального регулятора с минимальной дисперсией (МРМД1): u (z) = [F (z-1) D-1(z-1) В (z-1) z + (Bi)-1 R]-1x X {[I + (В?)'1 RB1 (1) А (1)] w (z) — A'1 (Z"1) L (z"1) D"1 (z"1) х xA(z-1)y(z)}. (20.3-11) Если положить R = 0, то из уравнений (20.3-9) и (20.3-1) будет получен регулятор с минимальной дисперсией (МРМД2) [20.2], u (z) = В'1 (z-1) 1_zZ_(TO [A (z-1) [w (z) —у (z)] -р + [D(z-1) —L(z’1)v(z)], (20.3-12) где v (z) следует заменить соответствующим уравнением (20.3-10). Уравнение замкнутой системы с этим регулятором имеет следую- щий вид: у (z) = F (z-1) v (z) 4-z-td+n w (z). (20.3-13) Примеры приведены в разд. 25.8.
ГЛАВА 21 Многомерные системы управления с регуляторами состояния детермини- Вопросы синтеза регуляторов состояния для многомерных объ- ектов уже были рассмотрены в гл. 8. Поэтому здесь будут лишь приведены некоторые дополнительные соображения. В рованном случае уравнения объекта имеют вид x(k-|- 1) ==Ах(к) 4-Ви(к), (21-1) у (к)=Сх (к). (21-2) Предполагается, что объект имеет m переменных состояния, р входов и г выходов. Тогда оптимальный регулятор состояния описывается уравнением и(к) = —Кх(к). (21-3) Если каждая переменная состояния воздействует на каждый вход объекта, то матрица регулятора содержит рх m коэффициентов. 21.1. МНОГОМЕРНЫЕ РЕГУЛЯТОРЫ СОСТОЯНИЯ С ЗАДАННЫМ РАСПОЛОЖЕНИЕМ ПОЛЮСОВ Характеристическое уравнение замкнутой системы х (k-f-1) = [А —ВК] х (k) = Fx (к) (21.1-1) определяется выражением (см. разд. 8.3) 1 det [zl —А 4- ВК] = det[zl —F] = am4- am_iZ4-... +a1zm~’ + zm. 3 (21.1-2) Коэффициенты регулятора (их число равно рХт), однако, нельзя определить однозначно, задавая m коэффициентов оц характеристи- ческого уравнения. Поэтому необходимо задать дополнительные требования. Как показано в [2.22], выбор определенного вида струк- туры матрицы К или F упрощает вычисление коэффициентов а-х. Например, для введения обратной связи можно использовать только переменные состояния главного элемента передачи или кроме них учитывать перекрестные связи при формировании «прямых» связей. В такой упрощенной структуре можно однозначно определить коэф- фициенты регулятора, задавая коэффициенты характеристи- ческого уравнения. Другие подходы к синтезу регуляторов с задан- ным расположением полюсов описаны, например, в работе [2.19].
Гл. 21. Многомерные системы управления с регуляторами состояния 345 21.2. МНОГОМЕРНЫЕ РЕГУЛЯТОРЫ, ОСНОВАННЫЕ НА РЕШЕНИИ МАТРИЧНОГО УРАВНЕНИЯ РИККАТИ Об этих регуляторах речь шла в разд. 8.1. Минимизация квад- ратичного критерия качества приводит к получению стационарного решения матричного уравнения Риккати (8.1-31) К = —(R4-BTPB)“1BTPA. (21.2-1) 21.3. МНОГОМЕРНЫЕ РЕГУЛЯТОРЫ состояния ДЛЯ РАЗВЯЗКИ СИСТЕМ Многомерная система с регулятором состояния, выходные пере- менные которой не влияют друг на друга, описывается уравнением у (k + 1) = Ау (к) = АСх (к), ' „ A = diag(Ai), 1 = 1, .... г ( d } (развязанная система, см. разд. 19.2). Сравнивая уравнения (21.1-1) и (21.3-1), получим у (к+ 1) =Сх (к-f-1) =С[А—ВК]х (к). (21.3-2) Следовательно, уравнение регулятора будет иметь вид К = [СВ]-1 [СА —АС], (21.3-3) где диагональные элементы матрицы А являются собственными значениями системы, т. е. корнями уравнения (21.1-2). 21.4. МНОГОМЕРНЫЕ РЕГУЛЯТОРЫ СОСТОЯНИЯ С МИНИМАЛЬНОЙ ДИСПЕРСИЕЙ В разд. 15.3 рассматривались оптимальные регуляторы состояния для стохастических возмущений, синтез которых связан с миними- зацией критерия качества (15.1-5) и в которых используется оце- нивание переменных состояния. Вывод уравнения такого регулято- ра состояния выполнялся на основе изложенной в гл. 8 методики построения регуляторов состояния для детерминированных возму- щений. В этой главе приведен другой метод, основанный на принци- пе минимальной дисперсии, о котором шла речь в гл. 14. Такой подход использует предсказание характеристик шума и оказыва- ется особенно эффективным для адаптивного управления многомер- ными объектами. Для получения стохастических регуляторов с минимальной дисперсией воспользуемся моделью в пространстве состояний (что оказывается удобным для идентификации) x(k+ 1) = Ах (k) + Bu(k) + Fv (к), (21.4-1) y(k)=Cx(k) + v(k), (21.4-2) где v (к) — гауссовский белый шум с нулевым средним. Квадра- тичный критерий, подлежащий минимизации, описывается выраже-
346 Ч. V. Многомерные системы управления нием I (к 4- 1) = Е {хт (к + 1) Qx (к + 1) + ит (к) Ru (к)}, (21.4-3) где Q — положительно определенная, a R—положительно полу- определенная матрицы. Этот критерий совпадает с критерием, опи- сываемым уравнением (8.1-8). Единственное отличие состоит в том, что в данном случае входным сигналом объекта является шум v (к). Следовательно, мы можем непосредственно использовать резуль- таты, полученные в гл. 8 [см. уравнения (8.1-9) и (8.1-10)], и записать ШЩ- = 2Вта [Ах (к) 4-Ви (к) + Fv (к)] +2RU (к) = 0. (21,4-4) Уравнение обобщенного многомерного регулятора состояния с минимальной дисперсией (МРМДС1) имеет следующий вид: и (к) = — (Вт QB + R)'1 Вг Q [Ах (к) 4- Fv (к)]. (21.4-5) Сигнал шума может быть восстановлен в соответствии с урав- нением v (к) =у (к)—Сх (к), (21.4-6) где х (к) предсказывается с помощью уравнения (21.4-1). Если запаздывание не включено в матрицу системы А, уравнение регу- лятора принимает вид [20 1] u (k) = — (Вт QB 4- R)'1 Вт Q [Ах (к + d) + AdFv (к)],(21.4-7) а уравнение предсказания запишется как а-1 x(k + d) = E [x(k + d)| k— l[ = Adx(k) + 2 Ad~i-1 Bu(k —d-j-i). i =0 (21.4-8) Другая разновидность регулятора с минимальной дисперсией, которая была рассмотрена в гл. 14 и разд. 20.3, была получена в результате минимизации критерия I(k + d+l) = E]yT (k + d + 1) Sy (k + d+ l) + uT (k)Ru(k)[. (21.4-9) В этом критерии в отличие от (21.4-3) минимизируется диспер- сия выходной координаты объекта. Вводя весовую матрицу вида Q = CTSC, получим уравнение регулятора МРМДС2: u (k) = — (BTCTSCB 4- R)'1 BTCTSC [Ах (к + d) 4-AdFv (к)]. (21.4-10) Наконец, положив R = 0, получим уравнение многомерного регулятора состояния с минимальной дисперсией МРМДСЗ: и (к) = — (СВ) -1 С [Ах (к 4- d) 4- AdF v (к)]. (21.4-11)
Гл. 21. Многомерные системы управления с регуляторами состояния 347 Анализ уравнений регуляторов показывает, что их можно пред- ставить состоящими из двух частей — детерминированного контура управления с обратной связью, формирующего сигнал их (к), и сто- хастического контура управления с прямой связью, формирующего сигнал uv(k): u (k) = их (к) 4- uv (к) = Кхх (к 4- d) 4- Kvv (к). (21.4-12) Детерминированный регулятор с обратной связью в обобщенном регуляторе с минимальной дисперсией представляет собой регуля- тор, получаемый на основании решения матричного уравнения Рик- кати (если матрицу Р в уравнении (21.2-1) или (8.1-34) заменить матрицей Q). Детерминированный регулятор в регуляторе с ми- нимальной дисперсией, описываемом уравнением (21.4-11), является регулятором состояния для развязки многомерных систем (см. уравнение (21.3-3)), если Л = 0 [20.1].
ЧАСТЬ VI Адаптивные системы с идентификацией параметров объектов управления ГЛАВА 22 1 Адаптивные системы j управления | Краткий обзор . 1 Средства цифровой техники, т. е. управляющие ЭВМ и мик- ропроцессоры, открывают значительно более широкие возможности для построения адаптивных регуляторов (или адаптивных алгорит- ; мов управления), нежели применявшиеся до недавних пор аналого- i вые вычислители. Стремительное развитие технологии произвол- 1 ства цифровых интегральных схем создало предпосылки для прак- тического внедрения сложных законов управления, которые либо вовсе нельзя реализовать с помощью аналоговой техники, либо принципиально возможно, но лишь ценой неприемлемых затрат. Следует отметить, что сама форма описания регуляторов и моделей динамических объектов в дискретном времени обладает существен- ными преимуществами по сравнению с описанием в непрерывном времени, позволяя упростить как синтез алгоритмов, так и их техническую реализацию. Для создания адаптивных алгоритмов управления, отвечающих требованиям практики, большое значение имели также результаты новых теоретических исследований в об- ласти цифрового управления и идентификации, проводившихся начиная примерно с 1965 г. Не удивительно поэтому, что интерес к проблемам адаптивного управления за последние 10 лет сущест- венно возрос. Немало статей по вопросам адаптации публиковалось и в 1958—1968 гг. Однако большинство из них было посвящено методам обработки непрерывных сигналов с помощью аналоговых вычислителей. Обзоры первых работ по адаптивным системам можно найти в [22.1] — [22.10]. Сложность реализации систем этого типа и, самое главное, отсутствие универсальных методов их построения
Гл. 22. Адаптивные системы управления 349 привели к тому, что в последующие годы интерес к ним несколько угас. В этой вводной главе дается краткий анализ основных схем адап- тации. Сравнение различных направлений в области разработки адаптивных систем показывает, что само понятие «адаптация» за- частую толкуется по-разному. Некоторые трактовки этого термина были приведены в работе 122.15]; здесь же предложен и ряд новых определений. Ниже обсуждаются лишь такие схемы адаптивных регуляторов, которые основаны на описании систем управления по их входным и выходным сигналам. В последующих главах исследу- ются различные принципы адаптивного управления и соответствую- Рис. 22.1. Основные схемы настройки регуляторов, а — настройка с прямой связью (адаптация по разомкнутому циклу); б — настройка с обратной связью (адаптация по замкнутому циклу). А — алгоритм настройки, Р — регулятор, О — объект управления. щие вычислительные алгоритмы. С целью упрощения выкладок рас- сматриваются только объекты с одним входом и одним выходом. Главное отличие адаптивных систем управления от систем с фик- сированными параметрами и структурой состоит в том/что они могут приспосабливаться (подстраиваться) к изменяющимся харак- теристикам объектов и протекающих в них процессов. Существует два основных способа настройки регуляторов, которые иллюстри- руются рис. 22.1. Динамические свойства некоторых объектов полностью опреде- ляются внешними факторами, доступными прямому измерению (например, интенсивностью потока, скоростью объекта и т. п.). Если известно, как должен настраиваться регулятор в зависимости от этих факторов, можно применять прямой метод настройки, или адаптацию по разомкнутому циклу (см. рис. 22.1, а). В этой схеме адаптации сигналы обратной связи, идущие от замкнутого контура управления к регулятору, отсутствуют. В условиях, когда невозможно оценить динамические свойства объекта непосредственно, приходится использовать настройку с обратной связью, или адаптацию по замкнутому циклу (см. рис. 22.1, б). При этом необходимый минимум информации об объ- екте (его порядок, параметры) получают путем обработки измерений входных и выходных сигналов. Для оценки характеристик объекта
350 Ч. VI. Адаптивные системы с идентификацией параметров могут применяться методы идентификации (по измерениям входа и и выхода у) или определения показателей качества управления (по измерениям ew и и). Исходя из полученных данных произво- дится расчет и настройка регулятора. Структурно это равносильно введению второй обратной связи и соответственно второго замкну- того контура, в котором информация циркулирует следующим образом: сигналы в контуре управления — алгоритм настройки — регулятор — сигналы в контуре управления. Далее рассматриваются только системы с адаптацией по замкну- тому циклу, поскольку настройка с прямой связью (если она вообще возможна) реализуется традиционными способами. Все адаптивные регуляторы можно разделить на два больших класса. К первому относятся самооптимизирующиеся регуляторы, Рис. 22.2, Основные схемы адаптивных систем с настройкой регуляторов по замкнутому циклу. а — самооптимизирующийся адаптивный регулятор (СОАР); б — адаптивный регулятор о эталонной моделью (АРЭМ). РР — расчет регулятора, ИО — идентификация объекта, ЭМ — эталонная модель. задачей которых является достижение наилучшего качества управ- ления при заданном критерии оптимальности и наличии определен- ной информации об объекте и о его сигналах (рис. 22.2, а). Процесс адаптации в системах управления с регуляторами этого типа проходит в три этапа: 1. Идентификация объекта или системы управления в целом. 2. Расчет регулятора. 3. Настройка регулятора (или изменение его структуры [22.16]). Обзоры современных методов построения самооптимизирую- щихся регуляторов содержатся в работах [22,14], [25.6], [25.12]. Во вторую группу адаптивных регуляторов входят регуляторы с эталонной моделью (рис. 22.2, б). Их задача состоит в получении такой реакции замкнутого контура управления на определенный входной сигнал, которая была бы максимально близка к реакции на этот же сигнал заданной эталонной модели. Очевидно, данный принцип адаптации предполагает наличие некоторого измеряемого внешнего сигнала (например, задающего воздействия в следящей системе), причем адаптация производится лишь в те периоды, когда этот сигнал начинает изменяться. В данном случае процесс адап- тации также состоит из трех этапов:
Гл. 22. Адаптивные системы управления 351 1. Сравнение реакций замкнутого контура управления и эталон- ной модели. 2. Расчет регулятора. 3. Настройка регулятора.- Если в системе используется эталонная модель с фиксированными параметрами, со временем реакция системы приближается к реакции этой модели, которая не обязательно должна быть «оптимальной». Обзоры по системам с эталонной моделью можно найти в работах [22.12], [22.13], [22.17]. Достоинством систем этого класса является их способность к быстрой адаптации при подаче входных сигналов определенной формы. Немаловажно и то, что для них разработаны хорошо себя зарекомендовавшие методы синтеза, в основе которых лежит теория устойчивости нелинейных систем. В то же время сле- дует иметь в виду, что системы данного типа не могут адаптировать- ся к внешним условиям, если измеряемый входной сигнал остается неизменным. В этом смысле самооптимизирующиеся регуляторы обладают существенным преимуществом, поскольку адаптируются к внешним возмущениям даже в тех случаях, когда они не поддаются измерению. Далее будут рассматриваться только самооптимизирующиеся регуляторы, основанные на идентификации параметров объекта. Проблемы идентификации объектов управления и моделей случай- ных сигналов обсуждаются в гл. 23. Идентификации объектов в замк- нутом контуре посвящена гл. 24. В гл. 25 описывается специальный тип самооптимизирующихся регуляторов — регуляторы с настраи- ваемыми параметрами.
ГЛАВА 23 Методы текущей идентификации динамических объектов и моделей случайных сигналов Задачей идентификации является экспериментальное определение харак- теристик динамических объектов и связанных с ними сигналов. Оценивание параметров системы производится в рамках математической модели опреде- ленного класса. При этом различие между реальным объектом или сигналом и соответствующей математической моделью должно быть по возможности минимально [3.-12], [3.13]. Текущей идентификацией будем называть процедуру определения параметров путем обработки на ЭВМ данных, которые поступают от объекта идентификации непосредственно в процессе его функционирования. В некоторых случаях измеряемые сигналы объекта первоначально накапли- ваются в виде блоков или массивов информации. Обработку такого типа принято именовать пакетной. Если же сигналы обрабатываются по истечении каждого такта квантования, то говорят, что обработка ведется в реальном масштабе времени. В области адаптивных систем управления основное внимание уделяется методам текущей идентификации в реальном времени. Кроме того, при син- тезе регуляторов главным образом используются параметрические модели объектов и возмущений. Такие модели характеризуются конечным числом параметров. Для них разработаны эффективные алгоритмы расчета, требую- щие относительно небольших затрат вычислительных ресурсов. Эти алгоритмы могут применяться при проектировании систем управления объектами раз- личных типов. Для идентификации в реальном времени созданы рекуррентные методы оценивания параметров стационарных и нестационарных линейных объектов, нелинейных объектов определенного класса, а также стационарных и неко- торых нестационарных случайных сигналов. В этой главе представлен крат- кий обзор наиболее известных рекуррентных методов параметрической иден- тификации. Подробное обсуждение этих методов, в том числе их вывод и анализ условий сходимости, читатель сможет найти в работах [3.12], [3.13], а также в литературе, отмеченной в ссылках. 23.1 . МОДЕЛИ ОБЪЕКТОВ И СЛУЧАЙНЫХ СИГНАЛОВ Будем полагать, что исследуемый объект устойчив и может быть описан линеаризованной моделью в форме линейного разност- ного уравнения Уи (Ю + эхУи (к—1)4-... 4-arayu (k — m) = b1u(k—d — l)4- 4-... 4-bmu (к —d —m), (23.1-1) где u(k) = U (к)—U,,,, 1 „ y(k) = V (к) —Vo0 Г ( ’ Переменные и (к) и у (к) являются вариациями, т. е. отклонениями «абсолютных» сигналов U (к) и Y (к) от их установившихся значе-
Гл. 23. Методы текущей идентификации 353 ний Uoo и Yoo. Величина d определяет запаздывание, равное целому числу тактов квантования. Уравнению (23.1-1) соответствует дискретная передаточная функция Gp(z) = XjL^ = 5-^z-d = ^z-1+- z-d (23.1-3) v ’ u(z) A (z-1) l + aiz-1+...+amz”m v ’ Измеряемый выход у (k) содержит аддитивную случайную помеху n(k)j y(k) = yu(k) + n(k). (23.1-4) Модель объекта, учитывающая шум измерений, изображена на рис. 23.1.1. Сигнал помехи п (к) рассматривается как авторегрес- Рис. 23.1.1. Модель объекта с шумом изме- рений. сионный процесс со скользящим средним (см. разд. 12.2.3): п (к) + сгп (к—1) + .... 4-срп (к—р) = v (к) 4-dxv (к— 1) + ... ... 4-dpv (к—р). (23.1-5) Здесь v (к)—последовательность нормально распределенных статистически независимых случайных величин (дискретный белый шум) с математическим ожиданием E{v(k)} = 0 и ковариационной функцией cov [v (к), т] = Е {v (к) v (к + т)} == (т), где а*—дисперсия, <5 (т)—функция Кронекера. Запишем дискретную передаточную функцию фильтра шума: с n(z)_D (z-i)_l + d1z-1-V... +dpz р v(Z?==v(z) C(z-i) i+clz-i + ...+cpz-p ‘ (23.1-6) Объединив соотношения (23.1-3) и (23.1-6), сформируем модель объекта, в которой участвует внешняя помеха: y<z>=i&;z_',uw+y^Tv<z)' (2зл-7) (Л ) ) Задача параметрической идентификации состоит в получении оце- нок параметров модели (23.1-7), т. е. коэффициентов полиномов
354 Ч. VI. Адаптивные системы с идентификацией параметров A(z-1) и B(z-1), а также C(z-1) и D(z-1) по результатам измерений входа n(k) и выхода у (к). Предполагается, что порядки моделей объекта m и помехи р известны. Если такая априорная информация отсутствует, можно воспользоваться методами определения порядка, описанными в [3.13]. Считается, что помеха является стационарной и корни полинома С (z-i) лежат внутри единичной окружности на плоскости z. Рассматриваемые ниже методы идентификации основываются на различных предположениях относительно типа модели шума, при которых гарантируется сходимость оценок параметров. Поэтому в дальнейшем наряду с общей моделью (23.1-7) будут использоваться две модели частного вида: МП-модель [23.14] У (z)==I^‘)z’du(z) (23.1-8) и НК-модель У (z> = I^)z’du(z) + A7FJ)v^- (23.1-9) 23.2. РЕКУРРЕНТНЫЙ метод наименьших КВАДРАТОВ (РМНК) 23.2.1. Идентификация модели динамического объекта Подставим в уравнение (23.1-1) значения измеренных сигналов входа u(k) и выхода у (к), соответствующих такту к, а также оценки параметров, полученные после (к—1)-го такта: y(k) + a1(k—1)у (к—1)+ ... 4-ат(к—т)у(к—т) — — 6, (к—l)u(k—d—1)—... ...—Ью(к—l)u(k —d—т) = е(к). (23.2-1) Здесь нуль, стоящий в правой части (23.1-1) после переноса всех слагаемых в левую часть, заменен величиной е(к), которую на- зывают ошибкой уравнения или невязкой. Введение этой ошибки отражает наличие погрешностей измерения выхода и неточность оценок параметров. В уравнении (23.2-1) выделим член, который можно трактовать как предсказанное в момент (к—1) значение у (к | к — 1) выходного измерения у (к)! у (к | к—1) = —aj (к—1) у (к —1)—... —am (к —1) у (к —m) 4- 4-Ьг (к— 1) и (к—d—1)4- ... ... 4- bm (к— 1) и (к—d — ш) = фт (к) 0 (к — 1), (23.2-2) где фт (к) — [— у (к—-1).».— у (к—m) и (к — d—1).. .и (к—d—ш)] (23.2-3)
Гл. 23. Методы текущей идентификации 355 вектор данных, вт (k —1) = [а1.. .ат 6,...Б„] (23.2-4) - вектор оценок параметров. Используя введенные переменные, запишем выражение для ошибки уравнения: e(k) = y(k) — y(k|k —1). (23.2-5) Ошибка = Новое — Предсказанное значение уравнения измерение измерения Предположим теперь, что измерения выполнены на интервале 1< — 1, 2, m-f-d-i-N. Тогда совокупность из (N-j-1) уравне- ний вида у (k) = фт (к) 0 (к — 1) 4- е (к) можно представить в векторно-матричной форме у (ш + б + Ы) = Т(т4-б4-Ы)0(ш4- З-ф-N — 1)—e(m4-d-)-N), (23.2-6) где ут (m + d + N) = [у (m -}-d) у (ш 4- d 1)... у (m 4-d 4-N)]; (23.2-7) 'F(m4-d4-N)= -y(m-bd-l) — y(m4-d — 2) ... —y(d) j — y(m-f-d) —y(m4-d—1) ...—y(d-f-l)i i —у (m 4~ d 4- N— 1) —у (ш 4~ d 4~ N—2) ... — y(N4-d) u (m — 1) u (m—2) u(m) u(m —1) ..u(0) • -u(l) (23.2-8) u(m4-N — 1) u(m4-N—2) . ..u(N)_ eT (m4-d4-N) =[e (m4-d)e (m-j-d-f-1) ... e (m 4-d 4-N)]. (23.2-9) Минимум функции потерь V = eT (m 4-d 4-N) e (m 4-d4-N) = 2 e2 (k) (23.2-10) k = m + d находится из условия SI - =0. (23.2-11) de |e =0 v ' Полагая, что N^2m, обозначим P(m4-d4-N)=[iFT (m4-J4-N)T(m4-d4-N)]-1.(23.2-12) 4Э*
356 Ч. VI. Адаптивные системы с идентификацией параметров С учетом (23.2-12) оценка, минимизирующая функцию (23.2-10), имеет вид ([3.12], [3.13]) | 0(m4-d4-N—1) — Р (ш + d-pN) Ф*т (m J-dN) у (шd-f-N). (23.2-13) Данное выражение описывает нерекуррентный алгоритм иден- тификации, поскольку вычисление оценок параметров произво- дится лишь после того, как сформирован массив, содержащий все измерения входных и выходных сигналов. Для получения рекур-1 рентного варианта алгоритма достаточно, записав выражения для ' оценок 0 (k-4-1) и 0 (к), вычесть второе из первого: в(к+1)-9(к) +т(й [у(к+1) -*т(к+1)в(к)]. Новая я Старая + Вектор Новое — Предсказанное значение ] оценка оценка коррекции измерение нового измерения j (23.2-14) < Вектор коррекции определяется соотношением i у (k) = Р (к +1) ф (к 4-1) = !-----------Р (к) ф (к 4- 1), ’ п / tj,T{k+1)p{k)ll,(k+1)+1 / ’ J . Z* 1D) j где р (к4-1) ==[!—у (к) фт (к4-1)] Р (к). (23.2-16) Исходными значениями для рекуррентного алгоритма служат 0(0) = 0 и Р(0)=а1, (23.2-17) причем число а должно быть достаточно велико [3.13]. Отметим, что математическое ожидание матрицы Р с точностью до скаляр- ного множителя равно, ковариационной матрице вектора оценок параметров Е {Р (к 4- 1)} =-L cov [Д0 (к)], (23.2-18) Ое где а* = Е{ете[, (23.2-19) а ошибка оценивания определяется как Д0(к)=0(к)— 0О. Таким образом, рекуррентный алгоритм идентификации позволяет контро- лировать дисперсии отдельных оценок, которые определяются со- ответствующими диагональными элементами ковариационной ма- трицы. Уравнение (23.2-14) можно записать в форме 0 (к 4-1) = 0 (к) 4-у (к) е (к 4-1). (23.2-20) Условия сходимости оценок. j В общем случае любой метод параметрической идентификации* должен задавать оценки параметров, которые являются несмещен- ными, т. е. E{0(N)[ = 0o при конечном N, (23.2-21)
Гл. 23. Методы текущей идентификации 357 и состоятельные в среднем квадратичном, т. е. lim E{0(N)[ = 0o, (23.2-22) N -> оо lim E ][0 (N)—0O] [0 (N) —0O]T} = 0. (23.2-23) N -> oo Можно показать ([3.13], [3.12]), что метод наименьших квад- ратов, примененный к устойчивому разностному уравнению, ли- нейному по параметрам, отвечает указанным требованиям, если выполняются следующие условия: • Порядок объекта m и величина запаздывания d известны. • Измерения входного сигнала u(k)=U(k)—Uoo производятся без ошибок, и известно установившееся значение входа Uoo. • Входной сигнал представляет собой возбуждающий процесс порядка не ниже m ([23.15], [23.16]). При этом матрица Н = {Ьи = <р^0 —j)}, i, j= 1, 2, .... m, положительно определена (det Н > 0) и, кроме того, сущест- N-l N-1 вуютпределы Uoo = lim 2 U (к) и cpuu (т)=Пт 2 и(к)и(к+т). к=0 N-хю к = 0 • На выходной сигнал у (k) = Y (к) — Yoo может действовать воз- мущение в виде стационарного шума п(к). Установившееся значение Yoo известно и равно величине Uoo, умноженной на статический коэффициент усиления объекта. • Ошибка уравнения е (к) не коррелирована с элементами вектора данных фт(к). Это означает, что значения е(к) статистически независимы. • Е{е(к)}=0. Сходимость оценок, получаемых с помощью рекуррентного алгоритма, зависит и от выбора исходных значений Р (0) и 0 (0) [3.13]. Условие, согласно которому корреляция между элементами последовательности ошибок е(к) должна отсутствовать, существенно ограничивает возможность применения метода наименьших квадра- тов для идентификации сильно зашумленных объектов. Для полу- чения несмещенных оценок параметров необходимо, чтобы форми- рующий фильтр шума имел вид Gv(z) = ^ = T747. , (23.2-24) v v ' v (z) A (z -1) ’ v ’ что на практике выполняется весьма редко. Отсюда можно сделать вывод, что для идентификации объектов с шумами высокой интен- сивности целесообразно использовать другие методы. Тем не менее, как будет показано ниже, при построении адаптивных систем управ- ления метод наименьших квадратов в конечном итоге оказывается одним из наиболее эффективных.
358 Ч. VI. Адаптивные системы с идентификацией параметров Методы оценивания установившихся значений Поскольку при идентификации параметров объекта вместо сиг- налов U (к) и Y (к) приходится использовать соответствующие вариа- ции и(к) и у (к), необходимо либо иметь оценки установившихся значений Uoo и Yoo, либо таким образом перестроить алгоритм иден- тификации, чтобы данные величины в нем не участвовали. Для этого можно предложить следующие методы: МЕТОД 1; ИСПОЛЬЗОВАНИЕ РАЗНОСТЕЙ Наиболее простой способ получения вариаций в отсутствие ин- формации об установившихся значениях переменных состоит в переходе к разностям U (k) — U (к— 1) = ц(к) — u(k— l)=Au(k) 1 /24 9 2^ Y (к) —Y (к —1) =у (к)—у (к—1) = Ду (к) f 1 При этом вместо u (z) и y(z) в алгоритме идентификации исполь- зуются величины Au(z)=u(z)(l—z-1) и Ay(z)=y(z)(l—z-1). Дан- ное преобразование можно интерпретировать как прохождение входного и выходного сигналов через один и тот же высокочастотный фильтр. Учитывая, что фильтрации подвергаются оба сигнала, процесс получения оценок параметров не претерпевает никаких изменений по сравнению с тем случаем, когда измеряются вариации u(k) и у (к); лишь в процедуре идентификации эти переменные заменяются разностями Ди (к) и Ду (к). Если требуются сами установивщиеся значения, следует приме- нять другие методы. МЕТОД 2: УСРЕДНЕНИЕ Оценку установившегося значения нетрудно получить, восполь- зовавшись формулой усреднения: 1 м *00 = 4-к2у(к)- <23-2-26) Рекуррентный вариант этой формулы имеет вид Yo0 (к) = Yoo (к -1) + 1 [Y (к) - V,. (к -1)]. (23.2-27) В тех случаях, когда установившиеся значения медленно ме- няются, целесообразно использовать рекуррентную процедуру взве- шенного усреднения v,o (k) = Y,. (к-1) + (1 -X) Y (к), (23.2-28) где %< 1. Аналогичным образом можно получить и оценку Uoo. Вариации и (к) и у (к) вычисляются затем по формулам (23.1-2).
Гл. 23. Методы текущей идентификации 359 МЕТОД 3; ОЦЕНИВАНИЕ КОНСТАНТЫ Установившиеся значения U00 и Уоо можно оценивать совместно с параметрами объекта. Для этого подставим выражения (23.1-2) в уравнение (23.1-1). В результате имеем Y(k) = -a1Y(k-l)-...-amY (k-m) + bxU(k-d-1) + ... ... +bmU(k—d—m)+C, (23.2-29) причем C = (1 4-Щ + • • • +am) Yoo — (bx -}- . . . -f-bm) Uoo. (23.2-30) Расширим вектор оценок параметров 0, введя в него константу С, а вектор данных фт (к) дополним еще одной составляющей, рав- ной 1. После этих преобразований в процедуре идентификации можно непосредственно использовать измерения Y(k) и U (к), по- лучая наряду с оценками параметров и оценку С. Если одно из установившихся значений известно, второе можно определить из выражения (23.2-30). В том случае, когда идентификации подвер- гается объект, стоящий в замкнутом контуре, полагают Y00 = W(k) (23.2-31) и вычисляют Uoo. Пример 23.1. Рассмотрим последовательность операций, выполняемых в про- цессе идентификации параметров объекта первого порядка с помощью рекур- рентного метода наименьших квадратов. Модель объекта описывается разностным уравнением у (к) -фа1У (к— l) = bju (к—l)-}-v (к). Для построения алгоритма идентификации это уравнение записывается в виде у (к) = фт(к) 0 (к)-ф-е (к), где Фт (к) = [— У (к— 1) и (к— 1)], 6 (к) = [а£ (к) bt (к)р. Алгоритм вычисления оценок параметров (в форме, наиболее удобной для использования в адаптивных системах) включает следующие шаги: 1. Определяются новые значения у (к) и и (к), соответствующие моменту времени к 2. е (к) = у (к) — у (к — 1) и (к — 1)] 3. Вычисляются новые оценки параметров ai (к) = ГЭ1 (к— 1) 1 , ГТ1 (к — 1)1 е ,к) ,bi(k)J Lbi(k-l)J^Ly2(k-l)2 из п. 7 4 Формируется новый вектор данных фт (к4-1) = [—у (к) и (к)]. 5. Р (к) ф (к 4- 1) = ГР11 (к) р12 (к)1 Г- У (к) ] IР21 <к) Р22 (к) J I и (к)] = Г— Рп (к) у (к)4- Р12 (к) и (к)] Г к 1 I— Р21 (к) У (к) Ч-Р22 (к) и (к) j |_ ia J
360 Ч. VI. Адаптивные системы с идентификацией параметров 6 х|зт (к + 1) Р (к) (к+ 1) = [- у (к) и (к)]‘‘ = - 11У (к) + i2u (к) = j. из п 5 7 Г Vi (к+1)1_1_ Г ill LT2 (k + 2)J / + ^ L J 8 Р (к+ 1) =1 [Р (к)-Y (к) г|?т (к+1) Р (к)] = = у [р (к) — Y (Ю [Р (к) гр (к + 1)1т] = =1 гр (k)_v /к) Г1 = 1 ГРи (к) — Till Pi2 (к)—Tii2l . А, X |_P2i (к)—7г1! Р22 (к) — 72*2! 9. к увеличивается на 1, и вновь выполняется вся последовательность действий, начиная с п 1 Для того чтобы можно было начать вычисления в момент к==0, необхо- димо задать исходные значения 6(О)_[“], ₽(»)=[“’], где а—произвольное, достаточно большое число 23.2.2. Случайные сигналы Рекуррентный метод наименьших квадратов может быть исполь- зован и для оценивания параметров моделей случайных сигналов. Будем полагать, что случайный сигнал представлен стационарным авторегрессионным процессом со скользящим средним: У(к) + сху (к—1)+ . .. +сру(к — p) = v(k) + dxv (к—1) + ... + + dpv(k —р). (23.2-32) В этом уравнении, аналогичном по форме (23.2-5), неизмеримая помеха заменена измеримым сигналом у (к). Преобразуем (23.2-32) в соответствии с формулами (23.2-1) — (23.2-5): у (к) = фт (к) 0 (к—1) + v (к), (23.2-33) где фт(к)==[—у (к —1)... —у (к—р) v (к—1).. .V (к—р)], (23.2-34) 0T=[c1...cpd1...dp]. (23.2-35) Применение рекуррентного метода наименьших квадратов, опи- сываемого соотношениями (23.2-14) — (23.2-17), к уравнению (23.2- 32) было бы возможно при известных значениях v(k—1), . . . . . ., v(k—р). В этом случае величину v(k) в (23.2-33) можно была бы рассматривать как ошибку уравнения, которая, согласно опреде| лению, должна быть случайной, статистически независимой пере- менной. К тому моменту, когда производится очередной замер у (к), величины у (к— 1), ..., у (к — р) уже известны. Считая, что к этому
Гл. 23. Методы текущей идентификации 361 моменту получены также оценки v (к— 1), ..., v (к— р) и 0 (к — 1), оценку текущего входного сигнала v (к) можно определить из урав- нения (23.2-33) ([23.1], [23.2]): v (к) = у (к)-(к) 0 (к-1), (23.2-36) где (к) = [- у (к-1)... -у (к- р) v (к-1) ...v (к-р)]. (23.2.37) После этого вычисляется новая оценка фт (к + 1) = [-—у (к)... —-у (к —р + 1) v (к).. .v (к—р+1)]. (23.2-38) Таким образом, с помощью рекуррентного алгоритма (23.2-14) — (23.2-17) можно получить и оценку вектора параметров форми- рующего фильтра 0 (k+ 1), если использовать в алгоритме вместо точного вектора данных ф(к + 1) его оценку ф(к+1). Затем определяются оценки v(k+ 1) и 0(кф2) и т. д. В качестве исход- ных значений берутся v(0) = y(0), 0(0) = 0, Р(0) = а1. Если v(k)—дискретный белый шум, корреляция между v (к) и фт (к) отсутствует. При этом условии оценки параметров ока- зываются несмещенными и состоятельными в среднем квадратич- ном. Модель (23.2-32) должна быть устойчива, ввиду чего корни знаменателя С (z) и числителя D (z) ее передаточной функции должны располагаться внутри единичной окружности. Как пока- зано в [3.13], оценку дисперсии v (к) можно найти по формуле к (к) = ii+i+p Z(0. (23.2-39) или е помощью ее рекуррентного аналога S (к +1) == г? (к) + к + 2‘_2р |v> (к +1) - 4 (к)] (23.2-40) 23.3. ОБОБЩЕННЫЙ РЕКУРРЕНТНЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ (ОРМНК) В тех случаях, когда вместо НК-модели (см. разд. 23.1) A (z-1) у (z) - В (z-1) z~du (z) = 8 (z) (23.3-1) с некоррелированной ошибкой e(z) объект описывается МП-мо- делью A (z-1) у (z)—В (z-x) z-du (z) = D (z“x)e(z), (23.3-2)
362 Ч. VI. Адаптивные системы с идентификацией параметров в которую входит коррелированный сигнал s (z) = D (z-1) е (z), сле- дует применять обобщенный метод наименьших квадратов [23.2], [23.3], объединяющий рекуррентные методы параметрической иден- тификации динамических объектов и случайных сигналов. Для данного метода исходным является уравнение у (к) = фт (к) 0 (к -1) + е (к), (23 3.3) в котором используются расширенные векторы фт (к) = [— у (к — 1)... —у (к — m) и (к — d — 1).. .и (к — d — т) v(k— 1). . .v(k-p)], (23.3-4) 0Т = [&!••.ат b,...^ dx...dm]. (23.3-5) Оценки параметров вычисляются с помощью рекуррентной формулы О (к4-1) = 0 (к) + у (к) [у (k-f- 1)-фт (к 4- 1) О (к)], (23.3-6) а также вспомогательных уравнений, аналогичных (23.2-14)— (23.2-16). Для оценки значений случайного сигнала v (к) = е (к), которые являются компонентами вектора ф (k-f-1), применяется соотношение (23.2-36). Отметим, что корни уравнения D(z)~0 должны лежать внутри единичной окружности на плоскости z. Если при этом все условия сходимости метода наименьших квадратов, перечисленные в разд. 23.2, остаются справедливыми и для модели (23.3-3), обобщен- ный метод дает несмещенные оценки параметров, состоятельные в среднем квадратичном. 23.4. РЕКУРРЕНТНЫЙ МЕТОД ВСПОМОГАТЕЛЬНЫХ ПЕРЕМЕННЫХ (РМВП) Оценки, получаемые по методу наименьших квадратов, сходятся к истинным значениям параметров лишь в том случае, когда отсут- ствует корреляция между ошибкой е(к) и элементами вектора ф (к). В методе вспомогательных переменных данное условие выполняется благодаря введению специальным образом сформированного вектора w(k), компоненты которого не коррелированы с е(к). В то же время эти вспомогательные переменные должны быть максимально коррелированы с соответствующими элементами невозмущенного вектора ф (к). Вектор вспомогательных переменных имеет вид wT(k) = [—h(k—1)... —h(k—m) u(k—d — 1).. .u(k—d —m)], (23.4-1) причем в качестве h (k) = yu (k) = wT (k) 0aux (k) (23.4-2) используются выходные сигналы дополнительной модели с пара- метрами 0aux(k).
Гл. 23. Методы текущей идентификации 363 Алгоритм идентификации по методу вспомогательных переменных структурно аналогичен рекуррентному алгоритму на основе метода наименьших квадратов (см. [23.5], [23.6], а также табл. 23.7.1). Для того чтобы уменьшить степень корреляции между вспомогатель- ными переменными и ошибкой е(к), в работе [23.6] параметры допол- нительной модели предлагается определять как выход низкочастот- ного дискретного фильтра первого порядка с запаздыванием, на вход которого подается оценка параметров объекта 0аих (к) = (1 -р) 0аих (к-1) +130 (к- 6), 0,01 С ₽ С 0,1. (23.4-3) На начальном этапе вычислений данный вариант метода вспо- могательных переменных весьма чувствителен к выбору исходных значений 6(0) и Р (0), а также коэффициента |3. Учитывая это, для повышения устойчивости рекомендуется вначале применять метод наименьших квадратов [23.11]. Перечислим условия, при которых метод вспомогательных пере- менных обеспечивает получение несмещенных и состоятельных оценок параметров: • Е(п(к)} = 0 и Е (и (к)} = const или Е (п (к)} = const и Е(и(к)} = 0. • Е (и (к —т) п (к)} =0 при |т|>= 0. • Должны быть известны вариации u (k) = U (к)—Uoo. ® Должно быть известно установившееся значение Yoo, если Е(и(к)}=#0. Важным достоинством метода вспомогательных переменных является то, что он не накладывает никаких ограничений на струк- туру формирующего фильтра шума. Благодаря этому полиномы его передаточной функции C(z"1) и D(z-1) не обязательно должны быть связаны с полиномами передаточной функции объекта A(z-1) и В (z-1). Метод вспомогательных переменных позволяет вычислять только оценки параметров объекта идентификации aj и ЬР Если же требуются и оценки параметров модели шума щ и d1; то их можно определять с помощью метода наименьших квадратов (см. разд. 23.2.2), используя в качестве оценки сигнала помехи величину n(k) = y (k) —уи (к) — у(к) — h (к). (23.4-4) 23.5. РЕКУРРЕНТНЫЙ МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ (РММП) Для идентификации параметров по методу максимального прав- доподобия наиболее удобно описывать объект МП-моделью (23.1-8): A (z-1) у (z) = В (z-1) z-d u (z) ф-D (z-1) v (z). (23.5-1)
364 Ч, VI, Адаптивные системы с идентификацией параметров Если воспользоваться обозначениями фт (к) = [—у (к—1)... ~у (к —т) и(к — d— l)...u(k — d — m)v(k — l)...v (к — m)], (23.5-2) 0T = [ax... am bx...bm df... dm], (23.5-3) модель (23.5-1) можно представить в виде у (к) = фт (к) 0 + v (к). (23.5-4) Здесь, как и при выводе обобщенного метода наименьших квад- ратов, будем полагать, что переменная v (к) играет роль ошибки уравнения е(к), а значения сигнала помехи v(k—1),. . ., v(k—m) заменим их оценками, которые вычисляются из уравнения (23.2-32). В результате получаем модель у (к) = фт (к) 0 (к -1) + е (к), (23.5-5) где фт (к) определяется согласно формуле (23.3-4). В работах [3.12], [3.13] показано, что в случае нормально распределенного сигнала ошибки метод максимального правдоподобия дает то же выраже- ние для функции потерь, что и метод наименьших квадратов: N V(0)=4L НЮ- (23.5-6) к = 1 Для получения искомых оценок данная функция минимизируется по отношению к параметрам at, bj и dv Поскольку в функцию потерь указанные параметры входят нелинейно, ее минимизацию осуществляют с помощью численных итерационных алгоритмов, например градиентных. Ввиду этого метод максимального правдопо- добия в своем исходном виде может быть реализован только в нере- куррентной форме. Однако путем внесения некоторых изменений в градиентный алгоритм можно получить и рекуррентный вариант ММП [23.71, [23.8]. Вначале рассмотрим основные соотношения, описывающие нере- куррентный метод максимального правдоподобия. Разложим функ- цию потерь в ряд Тейлора: V (0 + Д0) = V (0) 4- Vq (0) Д0 + у Д0Т V00 (0) Д0 + ..., (23.5-7) где V©(0) обозначает вектор первых производных по параметрам, a V00(0)—матрицу вторых производных. Выполним минимизацию этой функции, ограничившись первыми тремя членами разложе- ния (23.5-7). В результате приходим к известному алгоритму Ньютона— Рафсона: 0(k+ l) = O(k)-Ve01 (0(к), k + l)V0(0(k), к + 1). (23.5-8)
Гл. 23. Методы текущей идентификации 365 Для построения рекуррентной процедуры идентификации запи- шем в рекуррентной форме функцию потерь: V(0, k + l)=V(e, k)4-ye2(0, k^-l). (23.5-9) Отсюда можно получить следующие выражения: V9(0, k+l) = V9 (0, k)+e(0, k 4-1) (23.5-10) « о Vee(0, k+ 1) = Vw (9, k) + [-8e %k + l)],8e (9'э„к+° + + e(6, k + l)^^+l) . (23.5-11) «'o В этих формулах отмечены составляющие, которые можно счи- тать равными нулю [23.8]. Объединяя соотношения (23.5-8)— (23.5-11), получаем рекуррентный алгоритм идентификации по методу максимального правдоподобия (РММП)1 0(k4-l) = 0(k)4-V(k)e(k4-l), (23.5-12) где v(k) = Р(к +1)<Р(к +1) = ,+ф1(Р^У(к+;)(к + 1). (23.5-13) P(k) = V9-91 (0(к —1), к), (23.5-14) Р (к 4-1) = (1 — у (к) <рт (к+ 1)) Р(к), (23.5-15) ф(к+1) = [_^Щ^Д±1)]. (23.5-16) е (к 4- 1) = У (к 4* 1)-Фт (к 4-1)0 (к), (23.5-17) v(k4- 1) = е (к 4- 1). (23.5-18) В данном случае вектор фт (к 4- 1) в уравнении (23.5-5) имеет вид фт(к4- 1) = [—у (к)... — у (к—ш 4-1) и (к—d).. .и (к — d—m 4-1) е(к)...е(к — m4-l)- (23.5.19) [3.13]) к выражению (23.5-11). Уравнение (23.5.-15) является результатом применения леммы об обращении матрицы ([23.8], Элементы вектора де (к 4-1) дщ де (к 4-1) де (к 4- 1) де (к 4-1) дз pi де (к-р 1) ddm <ЭЬг де (к 4~ 1) dbm (23.5-20) 3dx
366 Ч. VI. Адаптивные системы с идентификацией параметров можно определить из уравнения (23.5-1), положив e(k) = v(k): z — = -—-— у (z) z-(t-l) — у' (z) z~6-о, zai D(z-1) Z = — -—-— u (z) z_(i-1)z_d = — u' (z) z-tl-1) z-d, dbi D(z-J) v v — — —-—e (z) z-(1-i) = —e' (z) z~ D (z-* 1 2 3 4) V i - 1, ..., m. (23.5-21) (23.5-23) Вводя новые обозначения для этих элементов, <рт (к + 1) = [—у' (к). .. —у' (к — m-f-1) и' (к — с!). .. . ..и'(к — d — ш4-1) е'(к)...е'(к — ш+1)], (23.5-22) будем рассматривать их как выходные сигналы одинаковых филь- тров, описываемых разностными уравнениями У' (k)=y(k) —djy' (k —1)—... — dmy' (k —m), u' (k — d) =u (k —d) — d^u' (k — d — 1)— ... — — dmu' (k —d—m), e' (k) = e (k) —dxe' (k—1)— ... — dme' (k—m), причем в качестве коэффициентов d~ берутся текущие оценки dj(k). Необходимо отметить, что рекуррентный алгоритм на основе метода максимального правдоподобия является лишь приближением исходного нерекуррентного метода, поскольку при его выводе были допущены некоторые упрощения. Начальные значения для алго- ритма задаются следующими: 0(0)= О, Р(0)=а1, <р(0)=0. (23.5-24) Рекуррентный вариант ММП отличается от обобщенного рекур- рентного метода наименьших квадратов ОРМНК тем (см. табл. 23.7.1), что вместо ф(кД-1) в нем при вычислении вектора коррекции у (к) используется ср (к ф-1). Перечислим условия, необ- ходимые для получения несмещенных и состоятельных оценок с помощью описанного метода: 1. Должны быть известны точные значения вариаций и(к) = =U(k)-U00. 2. Должно быть известно точное установившееся значение Уоо, соответствующее Uoo. 3. Для того чтобы ошибки е(к) не были коррелированы, форми- рующий фильтр шума должен иметь передаточную функцию вида D (z-1)/A (z-1). 4. Необходимо, чтобы уравнения (23.5-23) были устойчивы. Данное условие выполняется, если корни полинома D(z) лежат внутри единичной окружности на плоскости z.
Гл. 23. Методы текущей идентификации 367 23.6. МЕТОД СТОХАСТИЧЕСКОЙ АППРОКСИМАЦИИ (MCA) Методы стохастической аппроксимации рекуррентны по своей природе и отличаются малой трудоемкостью. В них поиск минимума функции потерь осуществляется с помощью градиентных алгорит- мов, которые применяются к стохастическим уравнениям так, как если бы это были уравнения детерминированные. Предлагались различные способы стохастической аппроксимации ([3.12], [3.13]). Один из возможных вариантов описывается соотношением е (к+1)=в (к) + р (к+1) ф (к +1) [у (к +1)-г (к+ 1)9 (к)]. Данный алгоритм минимизирует функцию потерь V=(l/2)e2(k). По форме он совпадает с алгоритмом РМНК (23.2-14), отличаясь от последнего лишь наличием переменного коэффициента р(к-Н). Сам метод не дает возможности определить этот коэффициент, и он выбирается произвольно, но таким образом, чтобы гарантировалась сходимость оценок параметров. Наиболее часто, выбрав соответст- вующую константу а, полагают р (к + 1) = а/(1 4-к). (23.6-2) К сожалению, этот простой алгоритм обеспечивает несмещенность оценок только в случае статистически независимых сигналов ошибки е(к). Кроме того, при сравнительно небольших объемах измерений оценки параметров характеризуются значительным разбросом [3.13]. 23.7. ОБЩАЯ СХЕМА РЕКУРРЕНТНЫХ АЛГОРИТМОВ ИДЕНТИФИКАЦИИ Все рассмотренные выше рекуррентные алгоритмы параметри- ческой идентификации — РМНК, ОРМНК, РМВП, РММП и MCA — могут быть приведены к единой форме описания, включающего следующие уравнения: 0 (k-f- 1)= 0 (к) -t-у (к) е (к-f- 1), (23.7-1) у (к) = И (к + 1) Р (к) <р (к + 1), (23.7-2) е (к + 1) = у (к + 1) -фт (к + 1) 0 (к). (23.7-3) Для различных алгоритмов уравнения (23.7-1)—(23.7-3) отли- чаются только векторами параметров 0, векторами данных ф (k+ 1) и векторами коррекции у (к). Основные формулы, используемые в алгоритмах, сведены в табл. 23.7.1. До сих пор считалось, что параметры идентифицируемого объекта на интервале измерений к=0, . . ., N остаются постоянными, ввиду чего как отдельные измерения и (к), у (к), так и ошибки урав- нения е(к) входили во все соотношения с одинаковыми весами,
Таблица 23.7.1 Единая схема описания рекуррентных алгоритмов параметрической идентификации (bo=d=O). e(k-H) = 0(k)+Y (k)e(k-H); у (k) = p (k+ 1) P (k) ф (k+ 1); e (k+ 1) = у (k + 1)-фт (k-f-1) 0 (k). Алгоритм 0 фТ (k+ 1) и <к + 1) Р (к +1) ф (к +1) Тип фильтра шума, при ко- тором оценка ие смещена и состоятельна РМНК а1 — [— у (к)... — — у (к — т-|~ 1) 1 [1-у(к) фт(к+ 1)]Х ХР(к) ф (к +1) 1 и (к)... .. .и (к—т + 1)] 1 + ФТ (к+1)р (к)ф(к+1) A (z-i) РМВП а bl Как в РМНК 1 [I —у (к) фт(к + 1)]Х [- h(k)...- — h (к — ш+ 1) D(z“i) 1 + 4т (к+1)Р(к)ф (к+1) ХР(к) и(к)... .. .и (к—ш + 1)] C(z-i) MCA ОРМНК • Как в РМНК [—у (к)...— —у (к—т-Н) и (к)... ..»и (к—т+1) е(к)... ...е (к —m-J-l)] 1 Как в РМНК 1 P(k+i)i = ^i Как в РМНК [1-у(к)фт(к+1)]х ф(к+1) 4 (к + 1) [— у' (к)...— — у'(к—т + 1) и' (к)... ...и' (к—т+ 1) е' (к)... .. ,ez (к —т+ 1)] 1 Ьщ а1 аш Ь1 A(z-i) D (z-1) A(z-i) Ьщ а1 ат 1 + фт (к 4- 1)Р (к) ф (к +1) ХР (к) D (z-1) A (z-i) РММП Как в ОРМНК VI. Адаптивные системы с идентификацией параметров
Гл. 23. Методы текущей идентификации 369 не зависящими от переменной к. Если же с помощью алгоритма идентификации требуется отслеживать медленно меняющиеся пара- метры нестационарного объекта, новым измерениям следует при- давать большие веса, нежели тем, что были получены ранее. Следова- тельно, в алгоритмах идентификации должен быть предусмотрен своего рода механизм постепенного забывания. В методе наименьших квадратов он может быть реализован путем введения в функцию потерь множителя, зависящего от времени (метод наименьших взве- шенных квадратов [3.13]): (m + d + N) V= 2 w (k) е2 (k). (23.7-4) k=(m +d) В табл. 23.7.2 показано, как меняются весовые коэффициенты при ошибках е (к), если указанный множитель задается в виде w(k)=%(ra+d+N>-k =ZN'~k, гдеО<Х<1, (23.7-5) для N' = 50. Если используется функция потерь (23.7-4) с множителем (23.7-5), отдельные формулы, приведенные в табл. 23.7.1, необходимо изме- Таблица 23.7 2 Значения множителя (23.7-Е) для различных к при N' = 50 к 1 10 20 30 40 47 48 49 50 А, = 0,99 0,61 0,67 0,73 0,82 0,90 0,97 0,98 0,99 1 Л. = 0,95 0,08 0,1г» 0,21 0,35 0,60 0,85 0,90 0,95 1 нить: в знаменателе р(к-Н) единица заменяется константой к. В частности, для РМВП ц (к + 1) = х+^т(к+1) р (к)ф (к + 1) ’ (23.7-6) матрица Р (к 4-1) умножается на 1/Z: Р(к+1)=[1-?(к)<р’(к+ 1)]Р(к)|. (23.7-7) Задаваясь показателем затухания X, приходится выбирать между более высокой степенью подавления шума и лучшим отслеживанием меняющихся параметров объекта. Обычно X выбирается в диапазоне 0,90<Х<0,995. Было отмечено, что на начальном этапе вычислений в методах РММП и ОРМНК из-за отсутствия точных значений e(k):==v(k) оценки сходятся весьма медленно. Однако скорость сходимости можно повысить, умножая сигнал ошибки на переменный коэффи-
370 Ч. VI. Адаптивные системы с идентификацией параметров циент Х(к), который имеет относительно небольшое начальное значение и, постепенно возрастая, приближается к 1. Например, в работе [23.13] предлагалось использовать формулу X (k +1) = Х0Х (к)-Ь (1 — Хо), (23.7-8) где Хо < 1; X (0) < 1. В частности, при Хо = к(О) =0,95, согласно этой формуле, имеем X (5) = 0,9632; X (10) = 0,9715; X (20) =0,9829, причем нетрудно видеть, что lim X (к 4-1) = 1. к-> оо Свойства весовых множителей (23.7-8) и (23.7-5) сочетаются в следующем алгоритме: X (к-Ь1) =Х0Х (к) Н-Х (1 — Zo). (23.7-9) Первоначально этот алгоритм дает небольшие значения весов, за- висящие от выбора Хо и Х(0), а при больших к они стремятся к коэффициенту затухания, определенному в (23.7-5): lim X (к + 1) = L к -> оо Сравнительный анализ рекуррентных алгоритмов параметричес- кой идентификации с точки зрения точности получаемых оценок, их сходимости и требуемого объема вычислений проводился различ- ными способами: путем математического моделирования ([23.9], [3.13], [23.10], [23.13]), по результатам практических экспериментов ([23.11], [23.12]), с использованием теоретических методов ([23.13]). Следует отметить, что теоретический анализ рекуррентных алгорит- мов идентификации весьма сложен вследствие их нелинейности и нестационарности. В работе [23.17] было показано, что асимптоти- ческие свойства оценок, получаемых с помощью таких алгоритмов, можно приближенно описать посредством разностного уравнения первого порядка с параметрами, зависящими от времени. После перехода к новой временной шкале оно преобразуется в обыкновен- ное стационарное дифференциальное уравнение. Результаты многочисленных исследований различных рекур- рентных алгоритмов идентификации можно обобщить в виде следую- щего краткого перечня их свойств: РМНК: Применим при малых отношениях интенсивности шума к полезному сигналу; в противном случае дает сильно смещенные оценки параметров. Отличается надежной сходимостью оценок. Требует относительно небольшого объема вычислений. ОРМНК: Если справедлива модель шума вида D/А, применим при более высоких отношениях шума к сигналу. На начальном этапе оценки сходятся медленно. Иногда наблюдается расходимость оце- нок (ср. с РММП). Вычисляются оценки параметров числителя фор- мирующего фильтра D, которые сходятся более медленно, чем оцен- ки параметров В и А. Требует несколько большего объема вычисле- ний по сравнению с РМНК.
Гл. 23. Методы текущей идентификации 371 РМВП: Обеспечивает достаточно высокую точность оценок параметров. Для ускорения сходимости на начальном этапе реко- мендуется использовать РМНК. Объем вычислений больше, чем в РМНК. РММП: Если справедлива модель шума вида D/А, обеспечивает высокую точность оценок параметров. На начальном этапе оценки сходятся медленно. Расходимость наблюдается реже, чем в ОРМНК. Вычисляются параметры полинома D, но оценки сходятся весьма медленно. Требует большего объема вычислений, нежели РМНК, ОРМНК и РМВП. MCA: Приемлемая точность оценок достигается лишь при очень большом числе измерений. Сходимость определяется выбором пара- метра а. Объем вычислений невелик. При небольшой продолжительности измерений и шуме высокой интенсивности все методы (исключая MCA) обеспечивают примерно одинаковое качество оценок параметров. Ввиду этого предпочтение обычно отдают РМНК, поскольку он проще других методов иденти- фикации и гарантирует надежную сходимость оценок. Преимуще- ства РМВП и РММП, позволяющих получать более точные оценки параметров, проявляются лишь при больших объемах измерений. 23.8. МЕТОДЫ ПОВЫШЕНИЯ ЧИСЛЕННОЙ УСТОЙЧИВОСТИ РЕКУРРЕНТНЫХ АЛГОРИТМОВ ИДЕНТИФИКАЦИИ В некоторых случаях идентификация параметров связана с решением плохо обусловленных систем уравнений. В этих условиях один из способов повышения точности оценок состоит в переходе к методу взвешенных наименьших квадратов, в котором роль ве- совой матрицы играет ковариационная матрица вектора ошибок W. Запишем функцию потерь с этой матрицей, представленной в виде произведения квадратных корней: V = eTWe—[W1/2e]T [W'^e]. (23.8-1) Вектор ошибок в (23.8-1) определяется выражением е = у— == [Ч'-у] = D0. (23.8-2) Основная идея метода заключается в приведении матрицы D к верхней треугольной форме Dt, Dt = TD, (23.8-3) с помощью ортогонального преобразования Т, которое не изменяет значения функции потерь V = eTTrWTe = eTWe, (23.8-4)
372 Ч. VI. Адаптивные системы с идентификацией параметров так как ТтТ = 1. Минимизация (23.8-4) приводит в итоге к оценке параметров в форме O^FeVFeR, (23.8-5) где Fee и F6R—верхние треугольные матрицы, что весьма упро- щает решение уравнения (23.8-5). Подробное изложение этого диск- ретного алгоритма фильтрации по методу квадратного корня можно найти в работах [23.20], [23.19], [23.18]. В данном алгоритме не нужно задавать никаких начальных значений, благодаря чему и в нерекуррентном, и в рекуррентном вариантах он обеспечивает быструю сходимость оценок. В [23.20] приведен также модифици- рованный алгоритм фильтрации по методу квадратного корня. Предлагались и другие усовершенствования известных рекуррент- ных методов идентификации. Все они имеют своей целью сокра- щение вычислений, выполняемых в каждом такте. Эти методы, в которых используются свойства инвариантности матриц определен- ных типов к сдвигам во времени, получили наименование быстрых алгоритмов идентификации [23.21]. Таблица 23 8.1 Характеристики модифицированных вычислительных алгоритмов 1 на основе РМНК Тип алгорит- ма Число операций умножения Объем памяти (в словах) Сходимость Дисперсии оценок параметров РМНК 2п2-|-5п 354 Надежная; скорость средняя Средние БРМНК (р2 —J— 7р —J—2)п -}— 4-2р34-Зр2 1136 Чувствительна к на- чальным значениям; иногда медленная Большие MCA 2п 134 Недостаточно надеж- ная; очень медленная Очень боль- шие ДФКК у (п+ 1)2-|- 4*у (П-Ь 1)4* + |(и+1) 385 Надежная; очень быстрая Малые МФКК с 2 |<м + м С ю |сч 371 Надежная; очень быстрая Малые РМНК —рекуррентный метод наименьших квадратов; БРМНК—быстрый рекуррентный метод наименьших квадратов; MCA—метод стохастической аппроксимации; ДФКК—дискретный алгоритм фильтрации по методу квадратного корня; МФКК — модифицированный алгоритм фильтрации по методу квадратного корня; п—число параметров; р—число обновляемых элементов в векторе(РМНК; Р = 2).
Гл. 23. Методы текущей идентификации 373 В работе [23.22] было проведено сравнение модифицированных рекуррентных алгоритмов идентификации по продолжительности вычислений, требованиям к памяти, сходимости и точности оценок. Этот анализ базировался на результатах моделирования шести различных тестовых объектов (тестовых объектов I, II, III и IV, описание которых приведено в приложении, а также двух других объектов). Программы алгоритмов идентификации были составлены на языке Фортран и выполнялись на 16-разрядной управляющей ЭВМ. Основные результаты исследования представлены в табл. 23.8.1. Для сравнения в ней приведены также соответствующие показатели для РМНК. Как следует из этой таблицы, по объему вычислений быстрый алгоритм идентификации имеет преимущество перед РМНК, лишь когда число параметров п>10 (порядок ш>5). В то же время он требует значительно больше памяти, чем другие алгоритмы, и весьма чувствителен к выбору исходных значений. При несколько большем объеме измерений очень точные оценки параметров дает дискретный алгоритм фильтрации по методу квад- ратного корня. Однако на начальном этапе его оценки характери- зуются значительной колебательностью, что делает этот алгоритм не слишком удобным для применения в адаптивных системах уп- равления. В целом наилучшие показатели демонстрирует модифи- цированный алгоритм фильтрации по методу квадратного корня, но для типовых объектов он незначительно превосходит РМНК. Лишь в тех случаях, когда требуются оценки повышенной точ- ности, а использование РМНК сопряжено с трудностями вычисли- тельного характера, можно рекомендовать МФКК. Однако в боль- шинстве приложений наиболее эффективным оказывается простей- ший рекуррентный алгоритм идентификации на основе метода наи- меньших квадратов или его расширения (ОРМНК, РММП).
ГЛАВА 24 Идентификация в замкнутом контуре | В самооптимизирующихся адаптивных системах настройка регулятора осуществляется в соответствии с оценками параметров объекта, получаемых в процессе его функционирования внутри замкнутого контура управления. Есть и другие приложения, в которых идентификация динамических объек- тов может выполняться только в замкнутом контуре. В связи с этим возни- кает вопрос: возможно ли использование методов, предназначенных для иден- тификации объектов, не охваченных обратными связями, для оценивания параметров объектов в замкнутых контурах управления? Очевидно, что при этом должны соблюдаться условия, при которых обеспечивается сходимость оценок. В отношении корреляционных методов данная проблема решается достаточно просто. Для того чтобы сходилась взаимная корреляционная функция входного сигнала и (к) и выходного сигнала у (к), необходимо, чтобы вход и (к) не был коррелирован с шумом измерений выхода п (к). Однако любая обратная связь нарушает это условие, ввиду чего корреляционные методы в их исходном виде для идентификации в замкнутом контуре непри- годны. Что же касается методов параметрической идентификации, то здесь ситуация несколько иная. Для их сходимости достаточно того лишь, чтобы сигнал ошибки е (к) не был коррелирован с элементами вектора ф (к). Данное^ обстоятельство, как будет показано ниже, существенно расширяет возможно-! сти применения этих методов для идентификации в замкнутом контуре. 1 В разд 24.1 и 24.2 обсуждаются условия сходимости оценок параметров при идентификации в замкнутом контуре в отсутствие и при наличии внеш-1 них возмущающих сигналов. Затем в разд 24.3 проводится сравнение мето- дов с точки зрения эффективности их использования для идентификации в замкнутом контуре. Для того чтобы более систематично подойти к анализу проблем, возникающих при оценивании параметров в замкнутом контуре, выделим ряд типовых случаев (см рис. 24.1.1 и 24.2.1): Случай А: Косвенная идентификация объекта управления. Оцениваются параметры замкнутого контура. Если параметры регулятора известны, модель объекта определяется на основе полученной модели замкнутого контура Случай Б: Прямая идентификация объекта управления. Параметры модели объекта определяются непосредственно, минуя промежуточный этап иденти- фикации модели замкнутого контура. Параметры регулятора не используются. Случай В: Измеряется только выходной сигнал у (к). Случай Г: Измеряются только входной сигнал и (К) и выходной сигнал у (к). Случай Д: Внешние возмущения отсутствуют. Случай Е: На объект воздействует внешнее возмущение us (к) — неизмеримое или поддающееся измерению, но не используемое непосредственно в алгорит- мах идентификации Случай Ж: Внешнее измеримое возмущение us (к) используется в алгоритме идентификации. Ниже будут рассматриваться следующие комбинации перечисленных случаев: А-}-В-)-Д и Бф-Г + Д разд. 24.1 А-)-Ж и Б + Г + Е разд. 24.2 и 24.3.3 В этой главе, если специально не оговорено иное, предполагается, что объекты управления линейны, а регуляторы линейны, стационарны и не подвергаются воздействию помех.
Гл. 24. Идентификация в замкнутом контуре 375 24.1. ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ В ОТСУТСТВИЕ ВОЗМУЩЕНИЙ На рис. 24.1.1 изображен линейный стационарный объект с ди- скретной передаточной функцией GP (Z) = = z-d = blZ 1+",.t.-Sz—L_ z-d (24.1-1) v ’ u (z) A(z-1) 1 '-----1 ' 1 - ----- 'maz-m и формирующий фильтр шума G„ M__ о C-1) _ 1 + d-z~‘ + '--+ W12. <24 1 -2) Gp',(Z'-v(z) A(z->) -1 + ai2- + ...+amaz-".’ (24Л 2> идентификация которых должна проводиться внутри замкнутого контура управления. Задача определения искомых оценок парамет- Объект Рис. 24.1.1. Схема идентификации объекта в замкнутом контуре без внешних воз- мущений. ров в отсутствие внешних возмущений существенно упрощается, если положить С (z-1) = A (z-1). При этом передаточная функция регулятора имеет вид gr (z) = u<z) = Q(z-1) = qo+qjg~1+---+qvzv. (24>j_3) ew(z) Р (z-1) l + piz-1-)----|-Puz u В контуре формируются следующие сигналы! y(z) = yu (z) + u(z), ew (z) = w(z) —y(z). Обычно считается, что w (z) = 0 и тем самым ew (z) = — у (z). Будем полагать, что случайный сигнал v (к) представляет собой неизме- римый статистически независимый шум с математическим ожида- нием E{v(k)} = 0 и дисперсией о*.
376 Ч. VI. Адаптивные системы с идентификацией параметров 24.1.1. Косвенная идентификация объекта управления (случай А-|-В-|-Д) Реакция замкнутого контура на шум, играющий роль входног сигнала, определяется передаточной функцией у (z) __ gpv (z)_______ v (z) 1 4~Gr (z) Gp (z) D(z~1) P (Z-1) A (z-1)? (z-^ + B (z-1)z"dQ (z-i) = l + piz-1^-... +Prz~r =Жг-1) 1 -|-alz -14- +®/Z 1 (Z-1) (24.1-4) Из полученного выражения следует, что регулируемая пере- менная у (к) является случайным авторегрессионным процессом со скользящим средним (АРСС). Он вырабатывается в контуре в ответ на подачу шума v(k), причем замкнутый контур действует в этом случае как формирующий фильтр шума. Полиномы в (24.1-4) имеют следующие порядки: ч / = max [ma-J-р, г = md 4- (24.1-5) Если измеряется только выход у (к), параметры АРСС , = •&] (24.1-6)3 можно оценить с помощью одного из-методов, изложенных в гл. 23. Для этого необходимо, чтобы нули уравнения 4(z) = 0 лежали внутри единичной окружности на плоскости z и отсутствовали одинаковые корни у полиномов D (z-1) и Л (z"1). Далее, имея оценки oq и можно определить искомые пара- метры «’ = &• -а». • -К 4 • ХД (24.1-7) Однозначное восстановление этих параметров возможно лишь при соблюдении определенных условий, которые именуются условиями идентифицир уемости. Условия параметрической идентифицируемости Объект (входящий в состав замкнутого контура управления) будем называть параметрически идентифицируемым, если с по- мощью некоторого метода идентификации можно получить состоя- тельные оценки его параметров. Последнее означает, что должен существовать предел lim Е {0 (N)} == 0О, (24.1-8) N-> ®
Гл. 24. Идентификация в замкнутом контуре 377 1де 0О обозначает истинный вектор параметров, a N — число вы- полненных измерений. Выведем условия параметрической иденти- фицируемости, полагая, что измеряется только выходной сиг- нал у (к). Первое условие идентифицируемости Запишем в компактной форме z-преобразование для уравнения объекта управления: Ay=Bu+Dv. После подстановки уравнения регулятора оно приобретает вид Ау = В y + Dv. Обе части полученного выражения дополним произвольным полиномом S(z-1): (A+S)y = B (--2.)у +Sy + Dv, (A + S)y = (B-Si) (_2.y)+Dv, ^A-t-S)Qy = (BQ-SI2 (-£y) + DQy A*" Й*""” 4-----' D* u В результате имеем новое выражение A*y = B*u + D*v. (24.1-9) Нетрудно видеть, что замена моделей объекта В/А и шума D/A соответствующими моделями В* _ BQ —SP т D* DQ A*=AQ+SQ И A*- AQ+SQ (24.1-10) не приводит к изменению сигналов и (к) и у (к) при одном и том же v(k). Поскольку полином S(z-1) выбирался произвольно, это оз- начает, что порядки полиномов А и В нельзя установить однозначно по измерениям и (к) и у (к). Следовательно, порядки моделей объ- екта и шума должны быть точно известны заранее [24.1]. Второе условие идентифицируемости Оценки параметров объекта управления гц и число которых равно ma4-mb, определяются из уравнения (24.1-4) по I парамет- рам аь Если у полиномов D и Л нет общих корней, то для полу- чения однозначного решения необходимо, чтобы выполнялось нера- венство 1та + ть или эквивалентные ему неравенства max[ma + p, mb + v + d]>ma4-mb 1 шах[ц— mb, v-f-d— ma]^0 J
378 Ч. VI. Адаптивные системы с идентификацией параметров Отсюда следуют условия, которым должны подчиняться порядки полиномов в уравнении регулятора: v > р,— d4-ma — mb —> v ma— d или v > p,— d4-ma—mb—*p^mb. (24.1-12) Если в объекте показатель запаздывания d = 0, порядки поли- номов передаточной функции регулятора должны удовлетворять условиям v>ma или p^mb. Соответственно, если d > 0, необхо- димо, чтобы v^ma — d или ц^шъ. Согласно (24.1-4), при этом не имеет значения, где возникает запаздывание—в объекте управ- ления или в регуляторе. В частности, из этого следует, что вто- рое условие идентифицируемости не нарушается, если берется регу- лятор с запаздыванием d = ma и v = 0 или ц = 0. Оценки парамет- ров (ф числителя передаточной функции (24.1-2) однозначно опре- деляются по коэффициентам Bj (24.1-4), если г^ша, что эквива- лентно ц^О. (24.1-13) Последнее условие выполняется при любом регуляторе. Если у полиномов Л (z-1) и D (z-1) имеется р одинаковых корней, они сокращаются и оценить их, следовательно, невозможно. В этом случае могут быть определены только 1 — р параметров оц и г — р параметров ввиду чего второе условие идентифицируемости приобретает вид тах[ц—тъ, v + d —-та]>р. (24.1-14) Заметим, что в (24.1-14) учитываются лишь общие корни Л и D, в то время как соотношение между корнями Л и S3 может быть любым, поскольку $? = DP, а коэффициенты полинома Р известны. Таким образом, имеет значение только число общих нулей у числителя и знаменателя передаточной функции G (z)--- D(z-1) : _____________Р^-1)_____________ 1(И ЛР"1) А р-1) Р (z~1) + B (z-1) z'dQ (z-1) (24.1-15) Если порядок регулятора недостаточно велик, идентификацию в замкнутом контуре можно проводить дважды, для двух различных наборов параметров регулятора ([24.2], [24.3]). При этом получа- ется дополнительное уравнение, благодаря чему искомые оценки определяются однозначно. Ниже приводятся примеры, поясняющие второе условие идентифицируемости. Пример 24.1.1. Требуется определить параметры объекта первого порядка (ma==mb = m = 1), у (k) -(-ау (к — 1) = bu (к — 1) +v (k)4~dv(k— 1), включенного в замкнутый контур управления. Рассматриваются регуляторы различных типов. а) Один П-регулятор: и (к) = —qoy (к) (v = 0; jx = O).
Гл. 24. Идентификация в замкнутом контуре 379 Передаточной функции (24.1-4) соответствует авторегрессионный процесс > скользящим средним (АРСС) у (k) + (a+bqy) у (к — 1) = v (к) + dv (к — 1) или у(к)-|-ау(к — 1) = v (к) + ₽v (к — 1). Приравнивая коэффициенты, получаем уравнения относительно а и Ь: а = a-|-bq0 $=d. Однозначно определить а и b невозможно, так как а^ = а0 + Аа и b = Ьо-----являются решениями этих уравнений при любом Аа Следова- ло гельно, в данном случае параметры а и b не могут быть идентифицированы. Действительно, согласно (24.1-12), должны выполняться условия v^l или p.Ss 1. б) Один ПД-регулятор: u (k) = —- qoy (к) — qxy (к — 1) (v=l; ц = 0). В этом случае имеем процесс АРСС второго порядка: У (k) + (a4-bq0) у (к — l)4-bqTy (к—2) = v (k) + dv (к—1), у(к)+ а1у(к—1)+ а2у (к—2) = v(k) + pv(k—1). Приравнивая коэффициенты этих уравнений, получаем искомые оценки параметров объекта управления: а = ах; b=a2/qj. в) Два П-регулятора: и (к) =— q01y (к); и (к) =— q02y (к). Действуя аналогично п. а), запишем два уравнения относительно а и Ь: ац = а + bq01; af2 = a-|-bq02. Отсюда а = [«!!—— а121/|1—— | , b —— [ai2 — а]. L Чог J / L Чо2Д Я«2 Параметры объекта идентифицируемы, если q01 0 q02. Если оба условия идентифицируемости выполнены, оценку век тора параметров объекта 0 обычно определяют путем подстановки ранее найденных параметров АРСС .. cq в выражение (24.1-4). В том случае, когда d = 0, а ша = шь, число параметров АРСС 1 = 2m. Поэтому для того, чтобы удовлетворялись условия (24.1-12), по- рядки полиномов в передаточной функции регулятора должны подчиняться соотношениям v = m, p^m. Положив Ро=1, имеем следующую систему уравнений» 4-bTq0 =at — Pl, aiPi +а3 + b1qi Д- b|q0 =a2—pg, aiPj-l + a2pj-§+--- +amPj-m + biqj-l+ • • • +bmqj-m = aj—
380 Ч. VI. Адаптивные системы с идентификацией параметров Эту систему можно представить в матричной форме; Г1 0 ... 0 q0 0 ... 0 - ai ai —Pi “ Р1 1 ... 0 qx q0 ... 0 a2 a2 Pa • Р1 • qf рц • 1 q0 am «ц—Рц о рц Р1 qffl 4i bl — au+ 1 0 0 о qm b2 a|l+2 Q _J L ^2m _J S 0 = «*. (24.1-17) Если матрица S квадратная, вектор параметров объекта нахо- дится по формуле (24.1-18) Из соотношения (24.1-17) вновь следует, что однозначное ре- шение может быть получено только в том случае, когда матрица S имеет ранг г 2m, т. е. когда справедливы неравенства v гл или р^ш. Если v>m или р > т, система (24.1-17) становится пере- определенной и для ее решения используется формула псевдо- обращения: 6 = [STS]'W. (24.1-19) Как уже говорилось в разд. 24.3, оценки параметров объекта сходятся крайне медленно, если для его идентификации приме- няются косвенные методы. Достоинство такого подхода лишь в том, что он позволяет непосредственно установить условия пара- метрической идентифицируемости в замкнутом контуре. 24.1.2. Прямая идентификация объекта управления (случай Б+Г+Д) Рассматривая метод косвенной идентификации, мы полагали, что параметры регулятора заданы. Поэтому использовались только измерения выхода у (к), так как- при наличии уравнения регулятора входной сигнал и (к) однозначно восстанавливается по у (к) и, следовательно, не несет никакой дополнительной инфор- мации. Можно, однако, проводить прямую идентификацию объ-
Гл. 24. Идентификация в замкнутом контуре 381 екта, не прибегая к разложению уравнения замкнутого контура, включив в процедуру вычисления оценок измерения входа. При лом отпадает необходимость в знании параметров регулятора. Для идентификации объекта с передаточной функцией GP(z), входящего в замкнутый контур, можно было бы воспользоваться иепараметрическими методами, например корреляционными, при- меняя их непосредственно к измеряемым сигналам и (к) и у (к). Однако можно показать, что в силу соотношений 44 = (24.1-20) v (z) 14- Gr (z) Gp (z) v 1 (V (24.1-21) v (z) 14- Gr (z) Gp (z) ' ’ результат идентификации в этом случае представлял бы собой передаточную функцию Ш=У^Ф)=__ 1 (24.1-22) u (z) u (Z)/V (z) Gr (z) ’ V ’ обратную передаточной функции регулятора, взятой с противопо- ложным знаком. Причина этого в том, что отсутствует информа- ция о невозмущенном выходном сигнале уц(к) = у (к) — п(к). Если бы этот сигнал был доступен измерению, то можно было бы иден- тифицировать передаточную функцию регулятора, так как = y(z)/v(z)-n(z)/v(z) „G (г) (24.1-23) u (z) u (z) u (z)/v (z) \ \ > Приведенные выкладки показывают, что прямая идентификация объекта в замкнутом контуре связана с необходимостью опреде- ления параметров формирующего фильтра шума n(z)/v(z). Ввиду этого в дальнейшем используется модель, объединяющая уравне- ния объекта и шума: A (z-1) у (z) = В (z-1) z-du (z) + D (z"*)v (z). (24.1-24) В то же время для косвенной идентификации основной мо- делью служит процесс АРСС, определяемый соотношением (24.1-4): [A (z-1) Р (z-1) 4- В (z~x) z-dQ (z-1)] у (z) = Ь (z-1) P (z"1) v (z). (24.1-25) Подставляя в (24.1-25) уравнение регулятора Q (z'1) у (z) = — P (z~1) u (z), (24.1-26) получаем выражение A (z-1) P (z-1) у (z) — В (z-1) z-d P (z-1) u (z) = D (z-1) P (z-1) v (z), (24.1-27) которое после сокращения P (z-1) переходит в уравнение, по форме аналогичное уравнению модели объекта в разомкнутом контуре
382 У. VI. Адаптивные системы с идентификацией параметров (24.1-23). Между ними, однако, имеется принципиальное различие, поскольку, согласно (24.1-26), управление u (z) или P(z-1)u(z) зависит от выхода у (z) или Q (z-1) у (z) и не может задаваться произвольно. Условия идентифицируемости для случая прямой идентифика- ции в замкнутом контуре будем рассматривать с двух точек зре- ния. Сначала мы обсудим условия существования единственного минимума функции потерь N V-Se«(k), (24.1-28) k=l полагая, что модель объекта имеет вид A (z-1) у (z) —В (z-1) z~d u (z) = D (z-1) e (z), (24.1-29) а управляющий сигнал u (z) определяется соотношением (24.1-26). Учитывая это, запишем уравнение для ошибки: gH— [A (z-‘) + В (г-*) z- у (z) = е (z). (24.1 -30) Для того чтобы функция потерь V имела единственный минимум в пространстве неизвестных параметров объекта, эти параметры, объединенные в выражение 4- [ А + Bz~d — 44--- = 4, (24.1-31) D L Р J DP S3 должны однозначным образом зависеть от сигнала ошибки е. Отно- шение (24.1-31) совпадает с правой- частью уравнения (24.1-4). Последняя содержит полиномы А, В и D, параметры которых однозначно определяются исходя из передаточной функции у (z)/v (z), если выполнены первое и второе условия идентифицируемости. Сле- довательно, для сходящихся оценок при е (z) = v (z) в случае пря- мой идентификации условия параметрической идентифицируемости сохраняют прежний вид. Сравнивая уравнения (24.1-4) и (24.1-30, 24.1-31), заметим, что сигнал ошибки е (к) как при косвенной, так и при прямой идентификации определяется одним и тем же выра- жением. Действительно, если оценки сходятся, А = А; В = В; D = D и, таким образом, в обоих случаях e(k) = v(k). Второй подход к выводу второго условия идентифицируемости базируется на анализе основных соотношений, описывающих любой из нерекуррентных методов параметрической идентификации. В част- ности, для метода наименьших квадратов, согласно (23.2-2), у (к) = фт (к) 0 = [—-у (к—1). . .у (к — ша) u(k —d—1).. .u(k—d— mb)]0. (24.1-32) Здесь фт (к) обозначает одну из строк матрицы ф в системе урав- нений (23.2-6). В присутствии обратной связи, определяемой урав-
Гл. 24. Идентификация в замкнутом контуре 383 пением (24.1-26), между элементами вектора ф(к) существует функциональная зависимость: и (к — d— 1) = — pTu (к—d—2)—... —p„u (к—р.— d — 1) — — qoy (к —d—1)—... —qvy (к —v —d—1). (24.1-33) Следовательно, при p^mb—1 и v^ma — d—1 переменная u (к — d—1) является линейной комбинацией остальных элементов ф(к). Только в том случае, когда р^шь или vi>ma — d, данная линейная связь отсутствует. Приведенные рассуждения справед- ливы и для всей системы уравнений (23.2-6). Таким образом, если второе условие идентифицируемости не выполнено, эта система, описывающая метод наименьших квадратов, содержит линейно зависимые уравнения. Теперь остается выяснить, можно ли при непосредственном оценивании параметров объекта в замкнутом контуре пользоваться теми же методами идентификации, которые ранее применялись в разомкнутом контуре. Согласно (23.2-5) и (23.5-5), для обоих основных методов — наименьших квадратов и максимального правдо- подобия—невязка или ошибка предсказания на один такт иденти- фикации задается выражением е (к) = у (к) - у (к | к -1) = у (к) -фт (к) 9 (к). (24.1 -34) Условием сходимости оценок является отсутствие статистической зависимости между ошибкой е (к) и элементами вектора данных ф (к). Последний в МНК имеет вид Фт (к)=[—у (к—1).. ,ц(к —d—1)...], в ММП— Фг (к) = [— у (к —1).. .u(k—d— 1).. .v(k —1)...]. Если оценки сходятся, можно положить e(k)=v(k). Поскольку сигнал v(k) воздействует только на у (к), у (к~Н), . . ., а эти ве- личины не входят в ф(к), ошибка е(к) не может зависеть от элемен- тов вектора ф(к). Данный вывод справедлив и в том случае, когда на и(к) действует обратная связь через регулятор. Это означает, что в замкнутом контуре ошибка е(к) и элементы ф(к) статисти- чески независимы. Следовательно, если выполняются условия идентифицируемости, все методы оценивания параметров, осно- ванные на минимизации невязок, могут использоваться для иден- тификации в замкнутом контуре точно так же, как и в разомкну- том. Вопросы применимости методов, основанных на других кри- териях, обсуждаются в разд. 24.3. Обстоятельное исследование задач идентификации в замкнутом контуре содержится в работах [24.2], [24.4]. Там же рассмотрены проблемы, связанные с исполь- зованием нестационарных и нелинейных регуляторов.
384 Ч. VI. Адаптивные системы с идентификацией параметров Сформулируем наиболее важные выводы относительно возмож- ностей идентификации в замкнутом контуре в отсутствие внешних, возмущений, для случаев линейного стационарного детерминиро- ванного регулятора: 1. При проведении идентификации параметров в замкнутом кон- туре (прямой или косвенной) должны удовлетворяться первое и второе условия идентифицируемости. 2. Для прямого оценивания параметров в замкнутом контуре ме- тоды идентификации, использующие невязки или ошибки пред- сказания, могут применяться таким же образом, как и в разомк- нутом контуре. При этом информация о регуляторе не нужна. 3. Если структура регулятора не отвечает второму условию иден- тифицируемости (он имеет недостаточно высокий порядок), для получения сходящихся оценок параметров рекомендуются следующие способы: а) попеременное подключение двух регуляторов с различными параметрами ([24.4], [24.5]); б) введение запаздывания ф>та—v+p в обратной связи; в) использование нелинейных или нестационарных регуляторов. 24.2. ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ ПРИ ВНЕШНИХ ВОЗМУЩЕНИЯХ Предположим теперь, что на замкнутый контур действует внеш- нее возмущение us(k), как показано на рис. 24.2.1. В этом слу- чае на входе объекта присутствует сигнал u(k) = uR(k) + us(k), (24.2-1) причем u.W=-^y» (24.2-2) Можно считать, что дополнительное воздействие ug (к) возни- кает в результате подачи сигнала з (к), проходящего через некото- рый фильтр: us(z) = Gs(z)s(z). (24.2-3) Если Gs (z) = GR (z) — Q (z-1)/P (z_J), сигнал s(k) играет роль задающего воздействия w (k)^ Возмущение us (k) может формиро- ваться различными способами. Важно лишь, чтобы это был внеш- ний сигнал, не коррелированный с шумом объекта v(k). Учитывая, что косвенная идентификация обычно неэффективна, ниже рассматривается только задача прямой идентификации объ- екта. Выход замкнутого контура управления описывается выра- жением У ~ АРЦ-Bz-dQ v + АР-рBz-dQ us (z) (24.2-4)
Гл. 24. Идентификация в замкнутом, контуре 385 или эквивалентным ему уравнением [АР 4- Bz"dQ] у (z) = DPv (z) + Bz~dPu8 (z). Подставим в это уравнение соотношения (24.2-1) и (24.2-2): Л (z-1) Р (z"1) у (z) — В (z"x) z-d Р (z"1) u (z) = D (z"1) P (z-1) v (z). (24.2-5) Сократив затем обе части (24.2-5) на P(z-1), получаем следую- щее уравнение объекта: A (z-1) у (z) — В (z-1) z~d u (z) = D (z"1) v (z). (24.2-6) Оно не тождественно (24.1-27), поскольку в и (к) присутствует не только составляющая, вырабатываемая регулятором из сигнала Объект Рис. 24.2.1, Схема идентификации объекта в замкнутом контуре при наличии внешнего возмущения s. у (к), но и возмущение us (к). Следовательно, сигнал обратной связи, ранее определявшийся выражением (24.1-33), в данном случае равен и (к—d—1) = — рщ (к—d—2) —... —рци (к—р—d—1)—- — qoy (к —d—1)—... —qvy (к—v—d—1) + + us(k—d— O+piUs (k—d—2) —... — рцп8 (к—p—d— 1). Если us(k)*H=0, u(k—1), согласно (24.1-32), при любых порядках полиномов передаточной функции регулятора р и v не является линейной комбинацией элементов вектора данных ф(к). Таким образом, прямая идентификация объекта, описываемого уравне- нием (24.2-6), всегда возможна, если внешнее воздействие пред- ставляет собой возбуждающий процесс достаточно высокого по- рядка. При этом выполнение второго условия идентифицируемости уже не обязательно. В то же время первое условие идентифици- руемости должно соблюдаться. Отметим также, что сигнал возму- щения можно не измерять и состоятельность результатов обеспе- чивается при любом формирующем фильтре шума D/С. Для полу- чения оценок могут применяться те же методы идентификации, основанные на предсказании выходного сигнала, которые исполь- зовались для оценивания параметров в разомкнутом контуре.
386 Ч. VI. Адаптивные системы с идентификацией параметров 24.3. МЕТОДЫ ОЦЕНИВАНИЯ ПАРАМЕТРОВ В ЗАМКНУТОМ КОНТУРЕ В этом разделе обсуждаются возможности применения методов идентификации, рассмотренных в гл. 23, для оценивания пара- метров в замкнутом контуре. । 24.3.1. Косвенная идентификация параметров объекта в отсутствие возмущений Для определения параметров ccj и 0] случайного авторегрес- сионного процесса со скользящим средним (АРСС) вида (24.1-4) можно использовать рекуррентный метод наименьших квадратов (РМНК) (разд. 23.2.1) или рекуррентный алгоритм оценивания корреляционной функции на основе метода наименьших квад- ратов РКОР-МНК 124.3]. При этом, однако, следует иметь в виду, что из-за большого числа коэффициентов (l^ma+mb, r=md+p), а также невозможности измерения входного сигнала помехи v(k) оценки параметров сходятся крайне медленно. Поэтому в боль- шинстве случаев предпочтение отдается прямым методам иденти- фикации. 24.3.2. Прямая идентификация параметров объекта в отсутствие возмущений Как было показано в разд. 24.1, все ранее описанные методы, в основе которых лежит минимизация ошибок предсказания (на- вязок), т. е. РМНК, РОМНК и РММП, могут применяться для идентификации в замкнутом контуре. Эти методы, использующие измерения сигналов и (к) и у (к), обеспечивают получение несме- щенных и состоятельных оценок параметров, если формирующий фильтр шума имеет передаточную функцию вида 1/А (для МНК) или D/А (для РОМНК и РММП). Несмещенные оценки параметров могут быть получены и с помощью РМВП, но лишь в том случае, когда вектор вспомогательных переменных wT(k), определяемый выражением (23.4-1), не коррелирован с ошибкой е(к). Отсюда следует, что он не должен быть коррелирован и с шумом изме- рений и (к) [3.13]. Однако в замкнутом контуре существует корре- ляция между входными сигналами и (к—т) и помехой п (к) при т 0. Таким образом, если вектор вспомогательных переменных выби- рается в соответствии с (23.4-1), РМВП в замкнутом контуре дает смещенные оценки параметров. Корреляция между и (к—т) и е(к) прит^ 1 отсутствует только тогда, когда ошибки е(к) независимы, а это означает, что для РМВП, как и для РМНК, фильтр шума должен описываться передаточной функцией вида 1/А (см. [3.13], стр. 66, 67).
Гл. 24, Идентификация в замкнутом контуре 387 24.3.3. Прямая идентификация параметров объекта при наличии возмущений Если измерению доступны только сигналы и (к) и у (к), для вычисления оценок параметров следует применять такие методы, как РМНК, РОМНК и РММП. Измеримое возмущение можно использовать для формирования вектора вспомогательных перемен- ных, и в этом случае идентификация параметров может осуществ- ляться с помощью метода РМВП. Особенности применения в замкнутом контуре метода РКОР- МНК [3.13] для всех трех способов идентификации параметров объекта проанализированы в работе [24.3]. Если стоящий в контуре управления регулятор таков, что второе условие идентифицируемости для него не выполняется, оценки параметров объекта тем не менее можно получить, перио- дически включая в контур другой регулятор (см. пример 24.1.1, в). Как показано в работе [24.5], оценки параметров в этом случае имеют минимальный разброс, если период переключения регулято- ров выбирается в пределах (5—10) То.
ГЛАВА 25 Регуляторы с подстройкой параметров В данной главе рассматриваются алгоритмы управления с подстройкой параметров, основанные на применении обычных алгоритмов управления сов- местно с рекуррентными методами оценивания параметров. В соответствии с определениями, данными в гл. 22, такие регуляторы относятся к классу самооптимизирующихся адаптивных регуляторов. Рекуррентные методы оце- нивания параметров и их применение для определения параметров замкнутых контуров управления рассматривались в гл. 23 и 24. Данная глава посвящена главным образом обсуждению различных сочетаний методов оценивания пара- метров и алгоритмов управления. Отдельные принципы построения самоопти- мизирующихся адаптивных регуляторов излагаются в разд. 25.1. В разд. 25.2 дается краткий обзор соответствующих алгоритмов управления. Различные типы регуляторов с подстройкой параметров описываются в разд. 25.3, их сравнительный анализ дается в разд. 25.4. Примеры реализации регуляторов указанного типа приводятся в разд. 25.5. Наконец, в разд. 25.6 рассматри- ваются многомерные регуляторы с подстройкой параметров. 25.1. ВВЕДЕНИЕ Кратко изложим принципы построения самооптимизирующихся адаптивных регуляторов, основанных на оценивании параметров. Будем полагать, что объект управления является линейным, а его параметры либо постоянны, либо меняются во времени. Адап- Рис. 25,1.1. Структурная схема самооптимизирующихся адаптивных регуляторов, основанных на идентификации объекта управления. тивные регуляторы рассматриваемого класса различаются по следующим признакам: Ф тип математической модели объекта управления; • метод оценивания параметров и переменных состояния; Ф априорная информация об объекте управления;
Гл. 25. Регуляторы с подстройкой параметров 389 • критерий, используемый при расчете регулятора; • тип алгоритма управления. Рассмотрим наиболее важные случаи. а) Математические модели объекта управления Классификация математических моделей объектов управления была проведена в гл. 3. Применительно к системам с самонастрой- кой интерес представляют лишь параметрические модели объекта управления'. — модели вход-выход в виде стохастических разностных урав- нений или дискретных передаточных функций A (Z"1) у (z)—В (z-1) z-d u (z) — D (z-1) v (z) (25.1-1) (модель максимального правдоподобия—>МП), A (z-1)y (z) — В (z-1)z_du (z) = v (z) (25.1-2) (модель наименьших квадратов—>НК). Здесь v (к) является пос- ледовательностью независимых случайных величин с математическим ожиданием E{v(k)} = 0 и дисперсией о$. Предполагается, что эле- менты вектора параметров 0T = [aI. ..am; bx. ..bm; dx...dm] по- стоянны или медленно меняются во времени; — модели состояния в виде векторных стохастических разност- ных уравнений x(k4-l) = A(0)x(k)4-B (0)u(k)4-Fv (k), y(k) = C(0)x(k) + n(k). (25.1-3) В общем случае v (к) и n (к) являются статистически независимыми случайными векторами (гл. 15). Элементы вектора 0 постоянны, медленно меняются во времени или могут быть описаны с помощью случайного процесса 0(k+l) = <p0(k) + |(k), (25.1-4) где | (к) последовательность статистически независимых случай- ных векторов. Приведенные модели учитывают случайные возмущения. Если возмущения Vi и щ являются детерминированными сигналами или отсутствуют, используются обычные скалярные или векторные разностные уравнения. б) Оценивание параметров и- переменных состояния Используемые на практике методы оценивания параметров зам- кнутых контуров управления рассмотрены в гл. 23 и 24. Методы оценивания и наблюдения переменных состояния изложены в разд. 8.6 и 15.4.
390 Ч, VI. Адаптивные системы с идентификацией параметров в) Информация об объекте управления | Информация об объекте управления получаемая в виде оценок параметров и переменных состояния, является основой для расчета систем управления и может содержать следующие компоненты: Ф При оценивании параметров'. — оценки параметров объекта управления ^п=[6] = Га1» £ц]т или [ab 6b di]T, (25.1-5) — оценки параметров объекта управления и их погрешности ^12 = [0, Д0]\ (25.1-6) Ф При оценивании переменных состояниях —оценки состояний ^21 = [x(k +1)], (25.1-7) — оценки состояний и их погрешности ^22 = [i(k + l), Ax(k-f-l)]’. (25.1.8) Ф При оценивании сигналов'. — если при оценивании параметров используется модель шума, то неизмеряемые величины Vj(k) и гц (к) могут быть описаны с по- мощью оценок = [vi (к)] или [fit (к)]; (25.1-9) — будущие значения выходного сигнала y(k-f-j), j 1, могут быть предсказаны по известным входам щ (к — /), /^0 и оценкам шума Vi (к — Z), /^0. В зависимости от вида используемой информации можно выде- лить несколько типов адаптивных регуляторов. Излагаемые далее принципы самонастройки рассмотрены для случая стохастических систем управления. Следует отметить, что терминология, исполь- зуемая в литературе, не всегда совпадает (см. [25.1], [25.2] и [22.14]). УПРАВЛЕНИЕ НА ОСНОВЕ ПРИНЦИПА РАЗДЕЛЕНИЯ Стохастический регулятор функционирует в соответствии с принципом разделения, если процедура оценивания параметров или переменных состояния выполняется раздельно с вычислением параметров устройства управления (см. гл. 15 и [22.14]). Закон управления в этом случае имеет вид u(k) = fs[y (к), у (к— 1)...u(k— 1), и(к—2)........0 (к), х (к)].
Гл. 25. Регуляторы с подстройкой параметров 391 УПРАВЛЕНИЕ НА ОСНОВЕ ПРИНЦИПА СТОХАСТИЧЕСКОЙ ЭКВИВАЛЕНТНОСТИ Стохастический регулятор подчиняется принципу стохастиче- ( кой эквивалентности, если закон управления " (k) = fD[y (к), у (к— 1), и (к— 1), и (к —2)......0О, х0 (к)] получен относительно истинных значений параметров 0О и пере- менных состояния х0 (к), которые затем заменяются своими оценками u (k) = fQ[y (к), у (к—1), и (к — 1), и (к—2)....0 (к), х(к)]. Этот принцип является частным случаем принципа разделения. Принцип стохастической эквивалентности теоретически обосно- ван для решения задачи синтеза управления линейным объектом с известными параметрами по квадратичному критерию качества [25.2]. При этом оценивание переменных состояния производится при наличии возмущений v(k) и n(k) в виде белого шума. Для си- стем управления со случайно изменяющимися параметрами объ- екта принцип стохастической эквивалентности справедлив только для случая статистической независимости параметров [25.3], [25.4], [22.14]. Для синтеза стохастического управления с подстройкой параметров принцип стохастической эквивалентности, вообще го- воря, неприменим. Однако он часто используется в качестве спе- циального метода проектирования. Реализация изложенных выше принципов приводит к созданию двух типов адаптивных регуляторов [22.14]: СТОХАСТИЧЕСКИ ЭКВИВАЛЕНТНЫЕ РЕГУЛЯТОРЫ Регуляторы, синтезированные в соответствии с принципом сто- хастической эквивалентности, будем называть «стохастически эк- вивалентными регуляторами». При вычислении их параметров предполагается, что оценки параметров и переменных состояния совпадают с их действительными значениями. В полученном законе управления не учитываются погрешности оценок, а используется информация только в форме или ^21. РЕГУЛЯТОРЫ ПОНИЖЕННОЙ ЧУВСТВИТЕЛЬНОСТИ Регуляторы, реализующие принцип разделения и использу- ющие оценки параметров совместно с характеристиками их ошибок, будем называть «регуляторами пониженной чувствительности». В этом случае используется информация в форме ^12 или ^22. Учет при управлении характеристик ошибок обеспечивает более «осторожное» воздействие на объект.
392 Ч. VI. Адаптивные системы с идентификацией параметров г) Критерий, используемый при расчете регулятора ДУАЛЬНЫЕ АДАПТИВНЫЕ РЕГУЛЯТОРЫ Качественные характеристики самооптимизирующихся адап- тивных систем управления зависят главным образом от точности идентификации параметров объекта управления и свойств исполь- зуемых алгоритмов управления. Сигнал на входе объекта управ- ления должен быть определен из условия одновременного выпол- нения двух требований: Ф хорошей компенсации текущих возмущений; Ф хорошей сходимости последующего процесса идентификации объекта управления. Это приводит к возникновению дуальных регуляторов [25.5]. Ука- занные требования могут быть противоречивыми. Если, например, оценки параметров объекта неверны, регулятор должен «дейст- вовать осторожно», т. е. мало изменять величину входного сигнала и (к); в то же время для улучшения оценок параметров необходимы значительные изменения и (к). Поэтому дуальные регуляторы долж- ны обеспечивать приемлемый компромисс между выдвинутыми требованиями. Следовательно, при выборе критерия надо учиты- вать как текущие сигналы управления, так и будущую инфор- мацию НЕДУАЛЬНЫЕ РЕГУЛЯТОРЫ Эти регуляторы используют сигналы, выработанные в текущий и предшествующие моменты времени, а также текущую информацию описывающую объект управления. Критерии качества и ме- тоды, наиболее часто используемые при синтезе недуальных ре- гуляторов, были рассмотрены в предшествующих главах. Это глав- ным образом квадратичный критерий или специальные критерии, такие, как принцип конечного времени установления переходного процесса, методы компенсации нулей и полюсов или обеспечения заданного расположения полюсов. д) Алгоритмы управления Фактический синтез алгоритма управления осуществляется до его реализации на вычислительной машине. А затем вычисля- ются параметры регулятора как функции параметров объекта уп- равления. Алгоритмы управления, используемые в адаптивных системах управления, должны обладать следующими свойствами: Ф удовлетворять второму условию идентифицируемости замкну- того контура управления; Ф обладать малыми потребностями в объеме памяти и быстродей- ствии ЭВМ для расчета параметров регулятора; Ф быть применимыми ко многим классам объектов управления и сигналов.
Гл. 25. Регуляторы с подстройкой параметров 393 В следующем разделе рассмотрим алгоритмы управления, от- । ечающие перечисленным требованиям. В классе самооптимизи- рующихся адаптивных регуляторов с идентификацией объекта уп- равления недуальные методы, основанные на принципе стоха- тической эквивалентности и рекуррентном оценивании парамет- ров, зарекомендовали себя положительно как в теории, так и в практике. Полученные с их помощью алгоритмы будем называть алгоритмами управления с подстройкой параметров', также будет встречаться термин самонастраивающиеся регуляторы [26.8], [26.13]. Следует различать понятия «самонастраивающийся» и «адаптив- ный», поскольку использование первого предполагает постоянство параметров объекта управления. Однако при анализе применения этих терминов выясняется, что разграничения между ними не делается, поэтому будем считать, что различия между ними вто- ростепенны. 25.2. АЛГОРИТМЫ УПРАВЛЕНИЯ При реализации алгоритма управления с подстройкой парамет- ров минимальных затрат на расчет параметров требуются регуля- торы следующего типа: О апериодические регуляторы AP(v), AP(v-H); О регуляторы с минимальной дисперсией РМДЗ, РМД4; О регулятор с оптимизируемыми параметрами 1ПР-]. Больший объем вычислений необходим для: О обычного линейного регулятора, обеспечивающего заданное расположение полюсов — ЛРП; О регулятора с управлением по состоянию — PC. Далее перечисленные алгоритмы управления рассматриваются с точки зрения выполнения второго условия идентифицируемости (24.1-14) и требуемого объема вычислений. Для алгоритмов управ- ления, основанных на сокращении нулей и полюсов объекта уп- равления, следует различать случаи точной и неточной настройки регулятора. Приводятся методы, ускоряющие вычисление пара- метров регулятора. 25.2.1. Алгоритмы управления с конечным временем установления Дискретная передаточная функция алгоритма АР (v) имеет вид GR (z) =------------------кА(г~1} .. (25.2-1) RV l-qoB^z-d 1 } Порядки числителя и знаменателя соответственно равны v=ma и p,=mb+d. Для случая неточной настройки параметров регуля- тора (см. (24.1-15)) передаточная функция алгоритма управления
394 Ч. VI. Адаптивные системы с идентификацией параметров равна ' Gld(z)=-------₽--------D -v-------------. (25 2-2) A(z-i)[l-q0B(z-i)z'd]4-q0B(z-i)z-dA(z-i) V Здесь второе условие идентифицируемости удовлетворяется, так как сокращение нуля и полюса не происходит (р = 0). Полагая в уравнении (25.2-2) А = А и В=В, получим дискретную пере- даточную функцию регулятора аи<г’“Х(Я ,25 2‘3) при точной настройке его параметров. В этом случае также не происходит никаких сокращений и объект управления остается идентифицируемым. Аналогичные результаты получены для регу- лятора AP(v-H) повышенного порядка с v = ma+l и p,=mb+d4-l. 25.2.2. Регуляторы с минимальной дисперсией Алгоритмы РМДЗ и РМД4 целесообразно использовать при воздействии на систему окрашенного шума (см. (24.1-2)). Дискретная передаточная функция алгоритма РМДЗ-з (14.2-12) имеет вид Gr(z)=—-------- L(2~‘) - .-----, (25.2-4) zB (z-1) z-dF (z-1)D (z-1) bi где D (z-1) = F (z-1) A (z-1) +z-(d+DL (z-l). (25 2-5) Коэффициенты и определяются на основе рекуррентной формулы [25 16] f0= 1, i-i fi = di— 2 fpai , i»l.....d; p=o d ^i = dl+d+i 2 ^i+d+i-p^p’ i —0, •••» hi 1 p = 0 (a^dj^O для i^m-j-l). Порядки полиномов равны v = max[md) ma]—1 p = max[mb—1, md] v = max[md—d—1, ma—1] p = max [mb-|-d—1, md] ?d = 0; d>l.
Гл. 25. Регуляторы с подстройкой параметров 395 Для d = 0 из второго условия идентифицируемости следует max[md—mb, md—ma—1]>р, (25.2-6) н для d^ 1 max[d—1, md—mb, md—ma4-d—1] ^p. (25.2-7) При неточной настройке регулятора G,„ = , -,Р . .-------— • (25.2-8) D zB+^-A +zF[AB — BA] bi J Обычно в этом случае общих корней не возникает (р = 0) и усло- вие идентифицируемости удовлетворяется при md mb или md ^та4-1 для d = 0 или d^l соответственно. Однако если рас- сматривать регулятор с точной подстройкой под объект управле- ния, т. е. А = А, В = В, D = D, то из уравнения (25.2-8) получим Gld = —г---2-Г-Т-- (25.2-9) D zB+-7- А I bi J При этом возникает p = md общих корней, и объект становится неидентифицируемым при d = 0. При d^ 1 уравнение (25.2-7) при- нимает вид max[d—1, md—ma4-d—l]>md. (25.2-10) Отсюда следуют окончательные требования d>md4-l или d>ma4-l, (25.2-11) которые удовлетворяются только при относительно большом запаз- дывании. Полагая г = 0, получим регулятор РМД4-3 (см. (14 2-13)) Gr (z) = . L(z~1}---. (25.2-12) R v ' zB (Z-1) F (z-1) ' 1 Для d = 0 идентифицируемость в случае неточной настройки имеет место при md^ma-]-l, для d^ 1—при произвольном соотношении порядков. В случае точной настройки (p = md) при г = 0 появля- ются общие корни (см 25 2-9) и для d = 0 объект становится не- идентифицируемым. Для d 1 снова должно выполняться условие d^md+l или d^ma4-l. (25.2-13) Если РМД-регуляторы дополняются пропорциональным и интеграль- ным членом (14.3-3), порядки v и р возрастают на единицу и объект управления становится идентифицируем при тех же усло- виях, что и для неточно настроенных регуляторов РМДЗ-з и РМД4-3.
396 Ч. VI. Адаптивные системы с идентификацией параметров 25.2.3. Регуляторы с оптимизируемыми параметрами Регулятор с дискретной передаточной функцией Gr (z) = = q°-tqiZ *±.’..7+Sz~V (25 2-14) к ' ew (z) 1 — z-1 v ' удовлетворяет условию идентифицируемости (24.2-12), если его порядок связан с параметрами объекта управления неравенством vi>ma—d и в уравнении (24.1-15) отсутствуют общие корни. Сле- довательно, ПИД-регуляторы пригодны для работы с объектами, у которых ma<2-|-d. Если объект управления не обладает запаз- дыванием, его максимально допустимый порядок равен двум. Для объектов управления более высокого порядка можно увеличить такт квантования настолько, чтобы коэффициенты при старших степенях стали близкими к нулю, и тем самым получить модель второго порядка (см. табл. 3.7.1). Небольшие временные задержки аппроксимируются с помощью запаздывания d. Следовательно, некоторые типы объектов управления могут быть описаны с по- мощью моделей второго порядка ш=2 и элемента запаздывания d—0, 1, 2, ... . Существуют различные способы расчета ПИД- регуляторов в качестве регуляторов с подстраиваемыми парамет- рами. а) Расчет по заданному расположению полюсов Вид передаточной функции относительно задающей входной переменной приводился в уравнении (11.1-3). При ш=2 и d=0, 1, 2, . . . соответствующее характеристическое уравнение запишется в виде Р (z-1) A (z-1) 4- Q (z-1) В (z-1) z-d = 0 или (1— Z"1) (1 -|-a1z-1+a2z-2) + (q0-|-q1z-1-|-q2z-i!) (b^-J-b^"2) z"d = = 1 4-a1z-1 + a2z-24- . .. 4-a4+dz~(4+d) = 0, (25.2-15) где коэффициенты a, определяются следующим образом: d = 0: a1 = — 14-aj+qo^, a2 = a2—aI + q0b24-q1b1, »3 = —a2 + q1b2 + q2b1, a4 = d=l: «1 = 3,—1, a2 = a2-а1 + Чо^!» a8 = —aa4-4ob2+4ibi, О^ЧД+ЧгЬп a5 = 42b2-
Гл. 25. Регуляторы о подстройкой параметров 397 Поскольку для определения трех коэффициентов регулятора имеются четыре уравнения, необходимо задать только три коэф- фициента характеристического уравнения. Эти коэффициенты в свою очередь определяются заданными полюсами замкнутой си- стемы (см. уравнения (11.1-14), (11.1-15)). А коэффициенты регуля- тора вычисляются с помощью следующих соотношений: d=0: Чо = Б;(а1 — а, Ч- О, 41 = (а2--а2 + а1-ЧоЬ2), Ч2 = ^(а3 + а2—Ч1Ь2) или q2=^. d=l: Чо = ^(а2 —аг+ а1), Ч1=^(аз+а2—q0b2), 42=^(а4—чЛ) или q2 Параметр регулятора q0 может быть определен с помощью фор- мулы (7.2-13) 1 Чо“ (l-ai) (ЬгЦ-Ь2) ’ и остается вычислить только величины цг и q§. Здесь следует отметить, что результаты расчета, конечно, зависят от правиль- ного задания полюсов. б) Расчет путем аппроксимации апериодического регулятора Поскольку апериодический регулятор повышенного порядка АР (v 4-1) легко поддается расчету и во многих случаях при вы- боре q0 = обеспечивает хорошее качество управления, быстрый расчет ПИД-регулятора с дискретной передаточной функ- цией Gr(z) = -H^—<Ч+Т1+1<|»,~* (25.2-16) R ' ’ ew (z) 1—z-1 v ' может быть осуществлен с помощью аппроксимации передаточной функции регулятора AP(v4-l) (см. уравнения (7.2-11) и (7.2-14)). о- (г)_ = (25.2-17) ew(z) ]_ p1+dz-«+i>----
398 Ч. VI. Адаптивные системы с идентификацией параметров для к = 0 и к—>оо (см. рис. 5.2.2 и 7.2.2). Реакция регулятора АР (v-4-1) на ступенчатое входное воздействие определяется из соотношения m + 1 т+1 и’(к) - 2 Pj*+dU*(к—d-—j) + 2 qfe (к—— j) (25.2-18) j=l ]=0 для k = 0, 1,2, ..., полагая, что при к < 0 u*(k)-0 и ew (к)=0. С учетом уравнения (7.2-13) отсюда следует u(0) = q;=(,_-^b|. (25.2-19) Поведение регулятора при больших к определяется рекуррентно с помощью уравнения (25.2-18). Приращение 6 выходного сигнала регулятора за такт квантования То определяется соотношением 6= lim [u* (к)—и* (к—1)], (25.2-20) к->оо из которого для достаточно больших значений М, например М = = 4(m-|-d), следует, что б «и* (М) —и* (М—1) или (25.2-21) б»-| [и* (М)-и’ (М—£)]. С другой стороны, это приращение можно найти для к> m-|-d, последовательно применяя соотношение б » Ди* (к) = и* (к)~и* (к—- 1) (25.2-22) до тех пор, пока не выполняется условие Ди* (к)—Ди* (к—1) < ей* (к), (25.2-23) где 8 полагается равным, например, 0,02. Используя уравнение (25 2-17) для 1=1,2, ...,т, определим приращение б явным об- разом: 6 = k1^[U(k)~ u(k— 0] = [d+l-q^bj Sbi + Sibi • (25-2-24) Тогда для определения параметров ПИД-регулятора типа ЗПР-2 получим следующие выражения (см. рис. 5.2.2): a) q0 = q0*; (25.2-25) б) q0 —q2 = u*(M)—Мб, Ч2 = Чо-[и*(М)-Мб]; (25.2-26) в) Qo + qi + q2 = s> qi = S-q0-q2- (25.2-27)
Гл. 25. Регуляторы с подстройкой параметров 399 Указанный метод расчета ПИД-регулятора не представляет слож- ности. Однако он применим лишь в том случае, когда запазды- вание d у объекта управления либо отсутствует, либо мало. 25.2.4. Линейные регуляторы, обеспечивающие заданное расположение полюсов В разд. 11.1.1 показано, что для заданного набора полюсов параметры регулятора могут быть однозначно определены из уравнения (11.1-21), если полиномы его знаменателя и числителя имеют порядки v = ma и p = mb4-d соответственно. Второе условие идентифицируемости удовлетворяется при d^O, если в уравнении (24.1-15) не происходит сокращения корней. Недостатком регу- лятора является относительно большой объем вычислений. 25.2.5. Регуляторы состояния При выводе условий идентифицируемости в гл. 24 были рас- смотрены регуляторы с управлением по входу/выходу. Эти ре- зультаты применимы при рассмотрении регуляторов, использую- щих для управления переменные состояния, с наблюдателями или оцениванием вектора состояния, если алгоритмы управления могут быть представлены в виде связи входных и выходных сиг- налов (см. разд. 8.7). В соответствии с (8.7-19) характеристическое уравнение имеет порядок Z^2m. Поэтому второе условие иденти- фицируемости выполняется при отсутствии в уравнении D(z-1)=0 общих корней со знаменателем модели объекта. Регулятор с уп- равлением по состоянию может быть рассчитан с помощью мето- дов, обеспечивающих желаемое расположение полюсов или на ос- нове рекуррентного решения матричного уравнения Риккати, достигаемого за несколько итераций (см. разд. 8 1). В табл. 25.2.1 представлены сравнительные характеристики различных алгоритмов управления. В табл. 25.2.2 даны оценки вычислительных затрат и необходимого объема памяти. 25.3. СОЧЕТАНИЕ АЛГОРИТМОВ ОЦЕНИВАНИЯ ПАРАМЕТРОВ И УПРАВЛЕНИЯ (СЛУЧАЙ СКАЛЯРНЫХ ВХОДА И ВЫХОДА) Синтез алгоритмов управления с подстройкой параметров осу- ществляется на основе методов оценивания параметров, описан- ных в гл. 23 и 24, а также алгоритмов управления, рассмотренных в разд. 25.2. Для сходимости процесса адаптации необходимо, чтобы алгоритмы оценивания параметров обеспечивали иденти- фикацию параметров замкнутого контура управления, а алгоритмы управления удовлетворяли условию идентифицируемости этого контура. В разд. 25.1 раскрыты широкие возможности для соз- дания различных сочетаний алгоритмов идентификации и уп-
Таблица 25.2.1 Характеристики алгоритмов управления с точки зрения их использования для адаптивного управления Тип регулятора Второе условие идентифицируе- мости замкну- того контура Вычислительные затраты Условие возникновение неустойчивости1) Возможности применения в адаптивных системах управления вычисление параметров ! реализация i управления Апериодические регуля- торы АР (v), АР (v+ 1) Выполняется Очень малые Средние A" (z)=0 Применим для асимптотически устойчивых объектов управле- ния Регулятор с мин. дис- персией РМДЗ-з d Ss md 4- 1 Малые D“ (z) = 0 Применим при наличии случай- ных возмущений Регулятор с мин. дис- персией РМД4-3 d —|— 1 » си 1 1 SS II II о о Применим для объектов управ- ления с нулями внутри еди- ничного круга и при наличии случайных возмущений Регулятор с оптимизи- руемыми параметрами ШР-] v ma — d Средние Малые (v=2) — Применим при корректности метода синтеза Линейный регулятор ЛРП v = ma p = mb-|-d Большие Средние — Применим при возможности обеспечить заданное расположе- ние полюсов Регулятор по состоянию с наблюдением Выполняется Средние или большие Большие Применим при отсутствии огра- ничений на объем вычисления *) См табл 11.1.1. и 14.1.1.
Гл. 25. Регуляторы с подстройкой параметров 401 Таблица 25.2.2 Вычислительные затраты и требования к объему памяти для различных алгоритмов управления [25.16] Алгоритм управле- ния Вычисление параметров регулятора Реализация алгоритма управления количество предложений ФОРТРАНа объем памяти, бит количество алгебраи- ческих операций количество операций пересылок АР (v) 12 171 4m+ 2 2m 4-d АР (v +1) 19 328 4m6 2m 4-d 4-2 РМД4 32 508 4m-J-2d-|-2 2m 4-d 4-2 РМДЗ 39 612 max [4m, 4m-[-2d—2] max [2m—1, 2m 4- 4-2d-2] ЗПР-2 34 631 8 3 [cm. (25.2-23) — (25.2-27)] ЛРП 78 1187 4m + 2d —2 2m 4- d равления. Так, например, использование принципа разделения приводит к адаптивным стохастически эквивалентным регуляторам или к регуляторам с пониженной чувствительностью. Применение принципа дуальности в свою очередь приводит к дуальным адап- тивным регуляторам. 25.3.1. Стохастически эквивалентные регуляторы с подстройкой параметров В этом разделе рассматриваются алгоритмы управления с под- стройкой параметров, основанные на принципе стохастической эквивалентности и не нуждающиеся для сходимости во внешних возмущающих воздействиях. На основании изложенного в преды- дущих главах, помимо алгоритмов оценивания и управления в систему необходимо включать дополнительные алгоритмы для оце- нивания постоянной составляющей сигналов и компенсации сме- щения. Таким образом, регуляторы с подстройкой параметров, использующие принцип стохастической эквивалентности, состоят (на данном этапе) из следующих алгоритмов: 1) рекуррентного оценивания параметров —>0 (к); 2) оценивания постоянной составляющей сигналов —». U00 (к), YOo(k); 3) управления —>u(k-[-l) = f[y (к), w(k);6(k)]; 4) компенсации смещения, если lim ew (к) Ф 0. к->оо Как было показано в предыдущей главе, для рекуррентного оцени- вания параметров замкнутых контуров управления в наибольшей степени пригодны:
402 Ч. VI. Адаптивные системы с идентификацией параметров 9 рекуррентный метод наименьших квадратов (РМНК); 9 рекуррентный обобщенный метод наименьших квадратов (РОМНК); 9 рекуррентный метод максимального правдоподобия (РММП)Ч Они могут быть объединены с алгоритмами управления, реализо- ванными в виде следующих регуляторов: 9 апериодического регулятора AP(v), AP(v4~l); 9 регулятора с минимальной дисперсией РМДЗ, РМД4; 9 регулятора с оптимизируемыми параметрами iFIP-j; 9 обычного линейного регулятора, обеспечивающего заданной расположение полюсов, ЛРП; 9 регулятора состояния PC. Для определения постоянных составляющих UOo и Уоо могут быть использованы методы, рассмотренные в разд. 23.2. Предполагая, что на контур управления воздействуют только случайные возму- щения с математическим ожиданием E{v(k)}=0, Uoo и Yoo могут быть получены простым усреднением (метод 2 в разд. 23.2) перед началом работы адаптивной системы управления. Регуляторы, минимизирующие дисперсию, и регуляторы с управлением по состоянию не требуют дополнительных средств для компенсации смещения, так как последнее отсутствует. Однако, если возмущения имеют ненулевые средние (как бывает в большинстве случаев) и имеют место изменения задающей переменной w(k), следует учитывать величину постоянной составляющей, и для регулято- ров, минимизирующих дисперсию, а также регуляторов с управ- лением по состоянию, не обладающих астатизмом, необходимо рассматривать задачу компенсации смещения. Простейшим спо- собом решения этой проблемы является использование при оце- нивании параметров разностей первого порядка Ди (к) и Ду (к) (метод 1 в разд. 23.2). Смещение может быть исключено введением в модель оцениваемого процесса дополнительного полюса в точке Zj —1 путем добавления множителя 0/ (z—1) и последующим рас- четом регулятора для расширенной модели. Это тем не менее приводит к возникновению смещения при постоянных возмуща- ющих воздействиях на входе объекта управления и не позволяет обеспечить наилучшее качество управления. Другая возможность заключается в замене у (к) на [у (к)—w(k)] и и (к) на Ди (к)—и (к)— —и (к—1) как при оценивании параметров, так и в алгоритме управления [25.9]. Однако это приводит к ненужным изменениям оценок параметров при изменении уставок и, следовательно, к отрицательному влиянию на переходный процесс. Относительно хорошие результаты были получены при оценивании константы (метод 3 в разд. 23.2). Полагая YOo=w(k), можно легко вычислить постоянную составляющую Uoo таким образом, чтобы смещение не возникало. Затем можно непосредственно использовать регу- лятор, не обладающий интегрирующими свойствами.
Гл. 25. Регуляторы с подстройкой параметров 403 На выбор соответствующих комбинаций методов (1), (2), (3) и (4) влияют главным образом следующие свойства результирующих алгоритмов управления с подстройкой параметров: • устойчивость системы управления с подстраиваемыми пара- метрами; • сходимость и поведение управления вблизи установившегося состояния (асимптотическое поведение); • сходимость и поведение управления в переходном процессе (короткопериодическое поведение); • вычислительные затраты. а) Устойчивость Как правило, системы управления с подстройкой параметров являются нелинейными, нестационарными и стохастическими. По- этому очень сложно получить общие критерии устойчивости. Од- нако следующие два условия устойчивости являются очевидными: Первое условие устойчивости (необходимое) Замкнутый контур с точно настроенным фиксированным регуля- тором является устойчивым. Второе условие устойчивости (достаточное) Все оценки параметров, требуемые для синтеза алгоритмов управ- ления, должны сходиться к их истинным значениям. Чтобы обеспечить первое условие, необходимо учитывать за- дачу компенсации нулей и полюсов, решение которой зависит от структуры объекта управления и регулятора. В табл. 25.2.1 при- ведены объекты управления и регуляторы, которые не следует объединять из-за возникновения неустойчивости. Что касается второго условия устойчивости, то здесь возмож- ны следующие комбинации. Так как алгоритм РМНК идентифици- рует только модель объекта управления (в виде отношения поли- номов В/A), выбор регулятора в первую очередь ограничен такими типами детерминированных регуляторов, как АР, iFIP-j, ЛРП, PC. Алгоритмы РОМНК и РММП позволяют идентифицировать как модель объекта управления В/A, так и модель шума D/А. Следо- вательно, совместно с ними могут быть использованы стохастиче- ские регуляторы типа РМД. Однако РОМНК и РММП могут также быть объединены с де- терминированными регуляторами, а РМНК — со стохастическими регуляторами, если D(z-1) = l и замкнутый контур управления устойчив. Поэтому, основываясь на структурах моделей объекта управления и шума, можно рассматривать всевозможные комби- нации алгоритмов, используя их соответствующие модификации. Требуемая сходимость к истинным значениям параметров оз- начает, что
404 Ч. VI. Адаптивные системы с идентификацией параметров 9 выполнено условие идентифицируемости замкнутого контура] управления; J • оценки параметров являются состоятельными оценками. I Для анализа условий идентифицируемости замкнутого кон-1 тура управления рассмотрим два типа внешних воздействий. Пусть на систему действует стационарное случайное возмущение v(k). Допустим, что объект управления и фильтр шума описы- ваются уравнением В (z~J) D fz-1) У (Z) = (z)+ V (z), (25.3-1) точно известны порядки m и d, коэффициент значимости оценки Х=1 и что задающее воздействие w(k)=0. Для рассматриваемого случая подходят регуляторы РМДЗ и РМД4, минимизирующие дисперсию. Во время переходного процесса, когда регулятор еще не подстроился к объекту управления и его параметры предпола- гаются кусочно-постоянными, второе условие идентифицируемости тах[р—mb, v-j-d —та]^р (24.1-14) выполняется при ma=mb=md=m, если d^O, для алгоритма РМДЗ и, если d^l, для алгоритма РМД4, поскольку р=0 (см. уравнения (25.2-6), (25.2-7)). В гл. 24 показано, что условие иден- тифицируемости замкнутого контура управления выполняется для любого регулятора с нестационарными параметрами. Поэтому в обоих рассмотренных случаях оценки параметров сходятся при возрастании к к истинным значениям параметров A (z-1) —»A (z-1), Bfz”1)—>-В (z“x), ГДг-1)—>D(z-1). Однако если алгоритм управления становится точно настроенным, то в уравнениях (24.1-15) или (25.2-9) появляются p = md общих корней и условие идентифицируемости, описываемое уравнением (24.1-14), нарушается. Это означает, что не существует единствен- ного решения задачи оценивания (при возобновлении процедуры получения оценки). Тем не менее при к -> оо оценки сходятся: A(z-X) = A (z“1 ), В (z-1) = В (z-1), D (z-1) = D (z-1), что является общим решением и в процессе настройки при 0<к<оо, и для точно настроенного регулятора при к=оо. Поэтому алго- ритмы управления с подстройкой параметров, основанные на со- четании рекуррентного обобщенного метода наименьших квадратов
Гл. 25. Регуляторы с подстройкой параметров 405 (РОМНК) или рекуррентного метода максимального правдоподо- бия (РММП) с алгоритмами управления, минимизирующими дис- персию РМДЗ (cL>0) и РМД4 (d^l), могут сходиться к точным значениям параметров регулятора при выполнении менее жест- кого условия идентифицируемости [25.16] тах[ц—-mb, vd — та]>0. (25.3-2) Условие идентифицируемости (24.1-14) остается справедливым для регуляторов с фиксированными параметрами. Эти свойства сходи- мости оценок показаны на рис. 25.3.1. Оценки параметров замк- нутого контура для алгоритма управления с точно настроенными и зафиксированными параметрами не сходятся, в то время как для алгоритма с подстройкой параметров имеет место хорошая схо- димость. В работе [25.16] показано, что для комбинации РОМНК или РММП с РМДЗ точная настройка регулятора достигается при d=0. Применение метода РМНК для оценивания параметров объекта управления, описываемого уравнением (25.3-1), дает смещенные оценки и не позволяет обеспечить точные настройки регуляторов РМДЗ или АР. Однако сочетание РМНК и РМД4 обеспечивает точную настройку регулятора РМД4 [25.8]. Это означает, что вто- рое условие устойчивости является лишь достаточным. Рассмотрим случай, когда изменяется задающее воздействие w (к), а шум отсутствует (v(k)=0). Объект управления описывается уравнением (25-3'3) В дальнейшем будем полагать, что порядки m и d точно из- вестны, коэффициент значимости оценки Х=1, а задающая пере- менная w(k) (детерминированная или стохастическая) является сигналом возбуждения, описываемым функцией порядка n^m. Поскольку задающая переменная w(k) может рассматриваться как возмущение, действующее на объект управления извне относительно измерений и (к) и у (к), то второе условие идентифицируемости в этом случае нарушается (см. разд. 24.2). Однако при правильном использовании методов оценивания, например РОМНК, РММП или РМНК, оценки параметров при к оо сходятся к истинным значениям A(z~1) = A (z-1), 6(z-1) = B (z-1). Следовательно, сочетание с любым регулятором, проектиру- емым с использованием параметров A(z-1) и B(z-1), обеспечивает сходимость параметров последнего к своим точным значениям. Оценивание коэффициентов D(z~3) с помощью РОМНК и РММП дает произвольное значение оценок из-за отсутствия возбуждения
406 Ч. VI. Адаптивные системы с идентификацией параметров фильтра шума. Поэтому алгоритмы управления с минимизацией дисперсии могут применяться только при фиксированном полиноме D(z-1). Если D(z-1) = 1,to вместо РОМНК и РММП следует ис- пользовать РМНК. При воздействии на адаптивную систему изменений как зада- ющего воздействия w(к), так и случайного возмущения v(k) соче- тание соответствующих методов оценивания (РОМНК и РММП) Рис. 25.3.1. Процесс получения оценок параметров объекта первого порядка (ai=—0,8; bx=0,2; ф=0,5) в замкнутом контуре управления с помощью РММП: а — для точно настроенного регулятора РМДЗ (г=0,05) с фиксированными параметрами; б — для регулятора с подстранваемымн параметрами РММП/РМДЗ (Л.о=0,99; Л.(0)=0,95; г=0,05) с любым типом регулятора обеспечивает возможность его точной настройки, так как при этом выполняется условие идентифици- руемости замкнутого контура управления и оценки параметров не имеют смещения. Для получения состоятельных оценок пара- метров необходимо использовать соответствующие методы оцени- вания, а также обеспечивать выполнение сформулированных в гл. 23 условий сходимости. В соответствии с этими условиями сигнал управления должен обладать достаточными возбуждающими свойствами (возбуждать все собственные движения объекта управ- ления).
Гл. 25. Регуляторы с подстройкой параметров 407 На основании изложенного могут быть рекомендованы следу- ющие комбинации методов оценивания параметров и алгоритмов управления. При случайных возмущениях v(k): РОМНК, РММП/РМДЗ, РМД4; РМНК/РМД4. При случайном или детерминированном задающем воздействии w(k): РМНК/АР, inP-j, ЛРП, PC, РМД (РМДЗ ИЛИ РМД4, если D(z-‘) = 1). Всестороннее моделирование и исследование с реальными объ- ектами управления показали, что алгоритмы управления с под- стройкой параметров устойчивы при выполнении перечисленных выше условий. Это может быть объяснено эвристически. Пред- положим, что модель объекта управления неверна, так что полюса замкнутого контура управления сдвинуты к границе устойчиво- сти. При этом амплитуда входного сигнала объекта управления увеличивается. Если предположить, что изменения входного воз- действия возбуждают все га собственных движений объекта управ- ления (см. гл. 23.2) и имеют достаточную амплитуду по сравнению с действующим шумом, то идентифицируемая модель уточняется. Вслед за этим также уточняются параметры регулятора и улуч- шаются характеристики замкнутого контура в целом. Входной сигнал будет обладать требуемыми свойствами, если он содержит m гармоник или его автокорреляционные функции связаны соотно- шением 0UU (O)>0Uu (1)>- • ->0uu(m)- Даже если входной сигнал возбуждает все собственные движения объекта управления кратко- временно, этого может быть достаточно для улучшения модели объекта управления. Изложенные результаты получены с по- мощью моделирования и эксперимента и не могут служить общим доказательством устойчивости. Поэтому получение новых ус- ловий глобальной устойчивости адаптивных систем управления с подстройкой параметров вносит свой вклад в решение общей проблемы. Обзор материалов по этой тематике дается в работе [25.12]. В следующем разделе приводятся некоторые общие ус- ловия для сочетаний РМНК, РОМНК, РММП с регуляторами РМД при случайных возмущениях. Эти условия базируются на анализе рекуррентных методов оценивания параметров. Дальнейшие ссылки делаются на работу [25.20]. б) Сходимость и поведение управления вблизи установившегося состояния Сходимость к установившемуся состоянию связана с асимпто- тической устойчивостью. Если параметры подстраиваемого регу- лятора сходятся к фиксированным значениям, то поведение управ- ления вблизи установившегося состояния приблизительно известно. Анализ асимптотического поведения вблизи установившегося со-
408 Ч. VI, Адаптивные системы с идентификацией параметров Я стояния может быть проведен в настоящее время лишь для отдель- ] ных сочетаний алгоритмов оценивания и управления (см. разд. 25.3.2). в) Качество управления и сходимость в процессе настройки Начальная сходимость подстройки зависит от алгоритма оце- нивания параметров, алгоритма управления, начальных оценок для рекуррентной процедуры оценивания, а также характеристик внешних сигналов. В настоящее время единственным целесооб- разным способом исследования характеристик сходимости яв- ляется моделирование (см. разд. 25.4). г) Вычислительные затраты Объем памяти вычислительного устройства, необходимый для реализации адаптивных законов управления, определяется глав- ным образом алгоритмом оценивания параметров (табл. 23.8.1) и алгоритмом расчета параметров регулятора (табл. 25.2.2). Время выполнения расчетов с использованием стандартной 16-разрядной управляющей ЭВМ и программы на языке Фортран составляет от 10 до 200 мкс. Для 8-разрядной микро-ЭВМ, программируемой на ассемблере, это время составляет около 500 мкс. В следующем разделе более детально рассматриваются отдель- ные алгоритмы управления с подстройкой параметров. 25.3.2. Стохастические регуляторы с подстройкой параметров РМНК/РМД4 Этот регулятор был предложен одним из первых [25.7—25.9]. Предполагается, что для модели объекта управления D(z-1) = l. Следовательно, A (z-1) у (z)—В (Z"1) z"du (z) = v (z) (25.3-4) и соответствующий регулятор с минимальной дисперсией РМД4-3, описанный уравнениями (14.2-13) или (25.2-12), имеет следующую передаточную функцию: л (7\__u (z) _Q (z~9 ________£ (z~9 (25 3 51 °R(Z)- y(Z) -P(z-i) ~ zg(z-i)F(z-9 ’ ( 3 } Коэффициенты полиномов L (z-1) и F (z-1) определяются из соотношений (14.2-5) (14.2-7) путем сравнения с коэффициен- тами уравнения 1 = F (Z"1) A (Z"1) + z‘(d + 1> L(z-i), (25.3-6) как это было сделано в примере 14.2.1, но при d1} . . ., dm=0. Для d^l из уравнения (25.2-13) при md=0 следует, что пара-
Гл. 25. Регуляторы с подстройкой параметров 409 метры объекта управления идентифицируемы. Это видно также из (ледующих рассуждений. В соответствии с уравнениями (24.1-5), (24.1-14) и при p = md (разд. 25.2.2) число параметров j, которое может быть оценено, равно j = l — p = max[ma4-p,; mb4-v + d]—md = max[ma4-mb— md4-d— —1; mb—-1] (25.3-7) и для md = 0 j = ma + mb + d—1. (25.3-8) При использовании алгоритма РМНК для d^l могут быть полу- чены оценки всех ma+mb параметров. Если d=0, следует допу- стить, что один параметр известен. Для упрощения вычислений коэффициентов уравнения (25.3-6) производится оценивание параметров' видоизмененной модели [25.8], [25.9]. Умножим уравнение (25.3-4) на полином F(z-1): FAy—BFz-du = Fv. (25.3-9) Подставляя (25.3-9) в (25.3-6), будем иметь у (z) = L (z-1) z_(d+1)y (z) + В (z-1) F (z~J) z-du (z) F (z~J) v (z). (25.3-10) Перепишем (25.3-10) с учетом (25.3-5): у (z) = —Q (z-1) z_(d+J)y (z) + P (z-1) z_(d+l)u (z) F (z“J) v (z). (25.3-11) Полученная модифицированная модель содержит параметры регу- лятора Qi и рь оценки которых можно непосредственно получить с помощью РМНК. С этой целью уравнение (25.3-11) перепишем в виде разностного уравнения с v = ma—1 и p, = mb4-d— 1: у (k)= —qoy (k — d —1) — .. . — qvy (k — d—ma) + + pou (k —d —1)4- ... 4-pgu(k —mb)4- 8(k —d—1), (25.3-12) где e(z)=F(z-1)v(z) является процессом скользящего среднего порядка d. Требуется получить оценки ma4-mb4-d параметров, так как уравнение (25.3-12) содержит та параметров qj и mb4-d параметров рь По сравнению с моделью, описываемой уравнением (25.3-4), для которой требуется оценивать ma4-mb параметров, в модели (25.3-12) надо оценивать на d параметров больше. Но так как здесь возможно получить оценки только для ma4-mb4-d—1 параметров, один параметр следует считать известным. Например, будем считать, что po=bi. Отсюда следует у (к) = фт (k —d) 0 4- роц (k —d — 1) + в (k - d - 1), (25.3-13) где e = [q0. • .qvpj, • •., pj, (25.3-14) фт (к —d) = [ —у (к —d—1).. . —у (к — d — ma) pou(k — d—2) . .. ...pou(k —mb)]. (25.3-15)
410 Ч. VI. Адаптивные системы с идентификацией параметров Применяя метод РМНК к уравнению (25.3-15), будем иметь ё (k + 1) = 0 (к) + у (к) [у (к + 1) - рои (к - d) - фт (к- d + 1) 0 (к)]. (25.3-16) Полученные оценки используются в алгоритме управления (25.3-5), и новый сигнал управления определяется соотношением u(k + 1) = -^[qoy(k+I)+ ••• +qvy(k—ma 4- 2)]— pxu(k) — ... ...—pgu (к —mb —d+ 2). (25.3-17) Отметим некоторые свойства рассмотренного алгоритма само- настройки: * Применение метода наименьших квадратов с модифицированной моделью (25.3-11) позволяет получить несмещенные оценки. • Применение адаптивного алгоритма управления, рассчитанного для D(z"1) = l, при управлении объектом, у которого D(z-1) = l + d1z-J+. . . + dmdz-n4 приводит к возникновению смещенных оценок. Тем не менее, как показано в работе [25.8], если оценки параметров объекта сходятся, то параметры регулятора (25.3-17) сходятся к опти- мальному регулятору с минимальной дисперсией. При этом выходной сигнал у (к) представляет собой процесс со скользя- щим средним порядка d (см. 14.2-19). • Точное знание предполагаемого известным параметра po=bi не является необходимым [25.8, 25.11]. Ф Регулятор с подстройкой параметров на базе алгоритмов РМНК/ РМД4 может быть использован только для объекта, у которого все нули расположены внутри единичной окружности (см. табл. 25.2.1). * Смещения оценок могут быть исключены введением в регулятор дополнительного полюса Zi=l. Это эквивалентно добавлению полюса к объекту управления. При этом в уравнениях (25.3-13) — (25.3-16) у (к) и и (к) заменяются соответственно на ew (к) = у (к)—w(k) и Ди (к) = и (к)—и (к—1). Тогда алгоритм управления принимает вид [25.9] Ди (к4. l)=J-[qoew(k+ 1)4-... +qvew (к—ma4-2)]— —р*Ди (к)— ... —РцДи (к — mb—d4-2), (25.3-18) а сигнал на входе объекта управления вычисляется по формуле и(к-ф 1)=гц(к)4Ди(к-ф 1). (25.3-19)
Гл. 25. Регуляторы с подстройкой параметров 411 Характеристики сходимости этого алгоритма самонастройки приведены в работе [25.10]. Преимущество теоретического под- хода состоит в том, что результаты анализа сходимости рекур- рентного метода оценивания могут быть непосредственно исполь- зованы для модифицированной модели ((25.3-11), [23.17]). В ра- боте [25.12] для объекта управления первого порядка показано, что алгоритм РМНК/РМД4 асимптотически устойчив в целом при 0<-^-<2. Алгоритм РМНК/РМД4 также асимптотически устой- чив для случая d = 0, если величина Н(г)=щ^—у положи- тельна и действительна [25.17]. Это означает, что Н (z) является передаточной функцией, реализованной на чисто пассивных элемен- тах. Другими словами, передаточная функция Н (z) должна быть устойчивой и Re{H(z)[>0, где zl£dT« и —л < соТо < л. Это означает, что j D (е!юТ») — 1] < 1, т. е. ошибка, возникаю- щая при допущении D(z'1) = l, имеет частотно-фазовую характе- ристику внутри единичного круга, и следовательно, не усилива- ется ни на каких частотах. РМНК/РМДЗ, РММП/РМДЗ, РОМНК/РМДЗ Так как в алгоритме РМД4 весовой коэффициент управления не используется, то для многих объектов управления возможны интенсивные колебания сигнала на входе. Как показано в гл. 14, расширенный регулятор с минимальной дисперсией РМДЗ позво- ляет контролировать управляющее воздействие на объект, а также может быть использован для управления объектом с нулями, рас- положенными вне окружности единичного радиуса. Сочетание алгоритмов РМНК/РМДЗ предложено в работе [25.13] и исследо- вано в работах [25.18], [25.19]. Алгоритмы РММП/РМДЗ и РОМНК/ РМДЗ исследованы в работе [25.15]. Пример 25.3.1: Уравнения для программы стохастического регулятора с под- стройкой параметров. Типичным примером уравнений, используемых в адаптивных регуляторах, с выделением в отдельные модули процедур оценивания параметров и расчета регулятора, является следующий комплекс уравнений: 1. Вычисление разностей (23.2-25) для исключения постоянных составляющих измеряемых сигналов: Au (k) = U (k) —U (k — 1), Ду (k) = Y (k) —Y (k —1), Au (k) = u (k); Ay (k) = y (k). 2. Оценивание параметров (РМНК, РОМНК, РММП) (см. табл 23.7.1): а) е (к) = у (к) — (к) 0 (к— 1); б) 0(k)=0(k — I)-)-у(к— 1) е (к); в) занесение у (к) и и (к — d) в вектор г|зт(к-{-1); г) у(к)=ц(к+1)Р(к)<р(к+1); д) Р (к+ !) = [!- Y (к)<рт (к+1)] Р (к) 1.
412 Ч. VI. Адаптивные системы с идентификацией параметров 3. Вычисление параметров регулятора (РМДЗ): Параметры расширенного регулятора с минимальной дисперсией опреде- ляются с помощью уравнений (25 2-4) и (25.2-5) (см. пример 14.2.1). 4. Вычисление нового значения управляющей переменной: -» а) новое значение регулируемой переменной: у (к-4-1); | б) новое рассогласование управления: ew(k-4-l)=W (k-f-1) —-Y (k-f-1); в) новая постоянная составляющая сигнала Y: YOo (k-f-l) = W (к-{-1); г) новая постоянная составляющая сигнала U: Uoo(k-j-l) = = А (1)/В (1) Y00(k+l), m 1 . Г m in . in A(l)/B(l) Y00(k+l)= l+£ai / ! 4—1 • 4—1 Yoo д) новое значение управляющей переменной: U (к-{-1) =Uoo-{~u (к—1) -{- -f-piii (к — 2)+ . . . 4-Pm+d-iu (к — m — d-f-1) — qo^w (Ю — Qiew (к—0"“ • • • qm-iew(k —m-j-1). 5. Организация цикла: а) замена у (к-)-1) на у (к) и и (к-(-1) на и (к); б) возврат к п. 1 Следует заметить, что с целью экономии машинного времени для вычис- ления управления и(к-}-1) между пунктами 4а) и 4д) используется предше- ствующая оценка 0 (к). 25.3.3. Детерминированный регулятор с подстройкой параметров Детерминированные управляющие устройства часто рассчиты- вают на ступенчатое задающее воздействие (это является очевид- ным для следящих систем управления). Но такой подход применим и к расчету регуляторов, так как при этом несложно оценить ре- зультаты управления. Более того, ступенчатые изменения зада- ющей переменной могут ускорить сходимость процесса адаптации на начальной стадии. РМНК/АР Наиболее простой регулятор с подстройкой параметров полу- чается при объединении РМНК с AP(v) или лучше с AP(v-H). Расчет регуляторов АР очень прост, при этом не возникает никаких проблем с компенсацией смещения. Общий алгоритм адаптации складывается из алгоритмов оценивания параметров, представ- ленных в табл. 23.1, и алгоритмов вычисления параметров регуля- тора, рассмотренных в гл. 8. Другими возможными регуляторами указанного типа являются регуляторы РМНК/ЗПР-З, РМНК/РС, РМНК/ЛРП, хотя они тре- буют большего объема вычислений. 25.4. ЭКСПЕРИМЕНТАЛЬНОЕ СРАВНЕНИЕ РАЗЛИЧНЫХ РЕГУЛЯТОРОВ С ПОДСТРОЙКОЙ ПАРАМЕТРОВ Для сравнения поведения различных алгоритмов управления с подстройкой параметров два метода оценивания параметров были объединены с шестью алгоритмами управления в соответствии с
Гл. 25. Регуляторы с подстройкой параметров 413 табл. 25.4.1. Алгоритмы адаптации были запрограммированы на Фортране для управляющей ЭВМ НР21МХ [25.15], [25.16] и были испытаны в замкнутом контуре управления с объектом, модели- руемым на аналоговом вычислителе. Заранее считались известны- ми порядок m и запаздывание d модели объекта управления, такт Таблица 25.4.1 Исследуемые регуляторы с подстройкой параметров Алгоритмы управления Метод оценивания \ Стохастические Детерминированные РМД4 РМДЗ АР (v) АР (v+ 1) ЗПР-З ЛРП рмнк X1,3» X1.3’ X X X X РММП Х3> Х3> X2) X2) Х2) Х2> *) При расчете регулятора предполагается D (z-1)=l. ») D (z-1) при расчете регулятора ие используется. •) Для компенсации смещения использован метод 3 (разд. 23.2) вычисления величины по- стоянной составляющей квантования То. В зависимости от алгоритма управления должен быть выбран весовой коэффициент управления г или г' (РМДЗ, AP(v-pi), ЗПР-З) или задано желаемое расположение полюсов (ЛРП). Для алгоритмов (РМД4, AP(v)) определять дополнитель- ные конструктивные параметры не нужно. Далее необходимо выб- рать коэффициент значимости оценки X. Для начала была взята непрерывная передаточная функция вто- рого порядка (тестовый объект VII, см. приложение) Gp = (14-3,75s) (1 + 2,5s) • Соответствующая дискретная передаточная функция квантования То = 2 с и экстраполяторе нулевого порядка г у (z) В (Z-1) _ 0,1387z-1 +0.0889Z-2 ир(г) — u(z)~A(z-^) 1 — l,036z-l + 0,2636z-2 ’ Постоянные составляющие измеряемых сигналов были равны нулю. Второй порядок объекта управления был выбран для того, чтобы получать оценки параметров с хорошей точностью и иметь возмож- ность сравнивать их с истинными значениями. Это трудно сделать для объектов более высокого порядка, даже если входной и выход- ной сигналы хорошо соответствуют друг другу [23.9]. (25.4-1) при такте имеет вид (25.4-2)
414 Ч. VI. Адаптивные системы с идентификацией параметров иМ К г и (к) Umax для к^Ю и(к) I / "1 п—1
Гл. 25. Регуляторы с подстройкой параметров 415 (лучайные возмущения Коррелированный шум воспроизводился с помощью формирую- щего фильтра с / \_n (z) _ 14-0(05z~4-0,8000z-2 'JPv w — v (Z) — 1—1,036г-Ч-0,2636г-2 ' На рис. 25.4.1 приведены примеры использования двух регулято- ров с фиксированными параметрами и двух регуляторов с подстраи- ваемыми параметрами. Фиксированные регуляторы были рассчи- таны для точных значений параметров объекта управления. Для алгоритмов с подстройкой параметров коэффициент значимости оценки Z был выбран равным 0,98. Из анализа приведенных резуль- татов следует, что * все рассмотренные регуляторы обеспечивают хорошее качество управления; * приблизительно через двадцать тактов квантования стохасти- ческий алгоритм управления с подстройкой параметров РММП/ РМДЗ обеспечивает такое же качество управления, как и фик- сированный регулятор РМДЗ; ® через 15 тактов квантования отклонения выходного сигнала у (к) даже меньше в случае регулятора PMMH/AP(v) по срав- нению с фиксированным регулятором AP(v). Оценки параметров объекта управления (к) и (к) представле- ны на рис. 25.4.2. После колебаний в начальной стадии они сходятся приблизительно к истинным значениям. Начальные колебания коэф- фициента передачи К = 2^/(1 + 2ai) имеют относительно боль- шую амплитуду, и для алгоритма РММП/АР (у) они более про- должительны. Но тем не менее обеспечивается хорошее качество управления. Исследование динамики всех 12 алгоритмов управления с под- стройкой параметров показало [25.16], что после 20 тактов кван- тования качество управления ® почти такое же, как у точно настроенных стохастических регу- ляторов с фиксированными параметрами (особенно это отно- сится к алгоритмам РМНК/РМД4, РММП/РМД4, РММП/ РМДЗ); ® лучше, чем у точно настроенных детерминированных регуляторов с фиксированными параметрами (за исключением PMHK/AP(v + + 1)). Это означает, что регуляторы (которые не были рассчи- таны для случайных возмущений) лучше настраиваются к случайным сигналам с помощью подстройки. Рис. 25.4.1. Управляющий и (к) и выходной у (к) сигналы при воздействии случай- ных возмущений (у (к) показана кусочно-постоянной). а — при отсутствии управления; б — фиксированный регулятор РМДЗ (г=0,01); в — адап- тивный регулятор РММП/РМДЗ (г= 0,01); г — фиксированный регулятор AP(V); О адап- тивный регулятор РММП/АР(У).
Рис. 25.4.2. Сходимость оценок параметров a^k), bt (к) и коэффициента передачи К (к) при воздействии случайных возмуще- „ n UMI li'nM ПЧ I,--------------------------------------ЛЛ11 Л ПЛЛ VI ГТ/Л Г> Ла VI. Адаптивные системы с идентификацией параметров
Гл. 25. Регуляторы с подстройкой параметров 417 Рис. 25.4.3. Управляющий U (к) и выходной Y (к) сигналы при ступенчатых изме- нениях задающей переменной W (к). а — вид изменений задающей переменной W(k), б — фиксированный регулятор РМДЗ (г=0,025), D(z-')iri 1; в — адаптивный регулятор РМНК/РМДЗ (г = 0,025), г — фиксирован- ный регулятор AP(v); д — адаптивный регулятор PMHK/AP(v).
00 Рис. 25.4.4. Сходимость оценок параметров aj (к), Ь, (к) и коэффициента передачи К (к) при ступенчатых (детерминированных) изменениях задающей переменной: а - РМНК/РМДЗ (г=0,025); б - РМНК/АР (v). VI. Адаптивные системы с идентификацией параметров
Гл. 25. Регуляторы с подстройкой параметров 419 Оценки параметров фильтра шума ф сходятся гораздо медлен- (l, чем оценки параметров объекта управления aj и bj. Наиболее и к трая общая настройка системы достигается при использовании .1 поритма РМНК- Моделирование показало также, что качество \ правления не может быть улучшено с помощью дополнительных । пешних возмущений. Изменения детерминированного задающего воздействия Из анализа рис. 25.4.3 и 25.4.4 следует, что • после замыкания контура управления изменения сигнала на входе объекта управления создаются адаптивным регулятором; это позволяет получить приближенные оценки параметров мо- дели объекта, поэтому реакция системы на первое ступенчатое воздействие обладает приемлемым качеством управления; • после второго ступенчатого воздействия параметры модели уже мало отличаются от их истинных значений; коэффициент пере- дачи также быстро сходится к истинному значению; О поведение систем управления с адаптивными регуляторами и точно настроенными регуляторами с фиксированной настройкой становится практически одинаковым после второго ступен- чатого воздействия. Различные объекты управления Рассмотренные алгоритмы управления с подстройкой парамет- ров были исследованы при управлении различными объектами: устойчивыми и неустойчивыми, пропорционального и интеграль- ного типов, минимально- и неминимально-фазовыми, передаточные функции которых представлены в табл. 25.4.2. На рис. 25.4.5 показаны результаты моделирования для ступенчатых изменений задающей переменной, при этом в каждом случае был использован наилучший алгоритм. Для всех устойчивых объектов управления и объектов управления пропорционального типа быструю сходи- мость к точным настройкам показал алгоритм РМНК/АР. Для неустойчивых объектов и объектов интегрального типа устойчи- вость замкнутого контура управления может быть обеспечена с помощью алгоритма РМНК/РМДЗ. Приведенные результаты моделирования могут дать первое представление о работе адаптивных алгоритмов управления в сочетании с различными типами сигналов и объектов управления. Они также показали, что сходимость к истинным значениям пара- метров не является необходимым условием устойчивости адаптив- ного управления. Эти и дополнительные результаты моделирования для реальных объектов управления обобщены в табл. 25.4.3 в виде рекомендаций по применению алгоритмов с подстройкой параметров. Вместо ал- горитма РММП можно попытаться использовать более простой в вычислительном аспекте алгоритм РОМНК-
Различные типы объектов управления Таблица 25.4.2 Объект ! епрерывиая передаточная функция G (s) Такт квантова- ния То Дискретная передаточная функция G (z) Характеристика 1 2,0 „ /4 0,1387z~1+0,0889z-2 Объект с ниэкочастот- (1+2,5s) (1+3,75s) I — 1,036z_1+0,2636z_2 ными свойствами 2,0 /_т 0,0186z-1+0,0486z-2+0,0078z-3 Объект с низкочастот- 2 ?“ (1 + 2,5s) (1 +3,75s) (1 4 5s) + (-) — i — ijoeSz^ + O.SSSz-2—0,1767z~3 ными свойствами. Один нуль вне окруж- ности единичного ра- диуса на z-плоскости 3 14-2s 3,0 0,1098z-1+0,0792z~2 —0,0229z-3 Объект с колебатель- (l + 3s) (25s2+5s+1) . i_ij654z-1—1,022z_2 —0,2019z-3 ными свойствами 4 G4 (s) = G3 (s) e~9s 3,0 G4 (z) = G3 (z) z-3 Объект с запаздыва- нием ,„ч ! —4s 2,0 _ /x —O.Wz-i+O.HSz-2 Широкополосный 5 G&(J (l + 10s) oW~ 1 — 1>425z-1 + 0,496z-2 объект Гт /сЧ 0,3 „ , x 0,0088z_1+0,0086z~2 Объект с интегрирую- 6 GeW~ s(l + 5s) 1 —l,9418z-1+0,9418z-2 щнми свойствами 7 G (S) s + °'03 0,5 0,1964z-1+0,0001z-2—0,1892z~3 Колебательно-неус- 7 W-(l + 2s) (s2—0,35s—(-0,15) ^7 W— i_2,930z-1+2,866z~2—0,9277z-3 тойчивый объект (мо- дель вертолета) 8 П /еЧ 1 0,5 x —0,0132г-1—0,0139z-2 GM Апериодически-неус- - (l+5s) (1 —2s) 1-2,1889z-1 + 1,1618z-2 тойчивый объект
Гл. 25. Регуляторы с подстройкой параметров 421 Рис, 25,4.5. Переходные функции и процессы управления с подстройкой парамет' ров для различных объектов управления из табл, 25,4,2,
422 Ч. VI. Адаптивные системы с идентификацией параметров Рис. 25.4.5 (продолжение).
Гл. 25. Регуляторы с подстройкой параметров 423 Таблица 25.4.3 Применимость регуляторов с подстройкой параметров в зависимости от типа объекта управления и сигналов Тип объектов управления Тип возмущений асимпто- тически устойчи- вые интег- ральные с нулями вне единич- ной окруж- ности случайные п (к) детерми- нирован- ные w (к) РМНК/API (2) X — X — X Р мнк/рмдз X X X X X РМНК/РМД4 X — — X — РММП/РМДЗ X X — X X РММП/РМД4 X — — X — 25.5. ВЫБОР АПРИОРНОЙ ИНФОРМАЦИИ Для работы алгоритмов управления с подстройкой параметров необходима следующая априорная информация: То — такт квантования; m —порядок модели объекта управления; d —величина запаздывания модели объекта управления; л —коэффициент значимости оценки; г —весовой коэффициент управления. Использование регуляторов с подстройкой параметров пока- зало, что качество управления мало чувствительно к выбору такта квантования То. Для объекта управления пропорционального типа с ПИД-регулятором хорошее качество управления обеспечи- вается при выборе То из следующего соотношения (гл. 5): 4 Т95 < То < 15 Г95, (25.5-1) где Т95 — время выхода регулируемой переменной объекта управ- ления на уровень 95% от установившегося значения. Однако для апериодических регуляторов с минимальной дис- персией необходимо выбирать такт квантования более тщательно. В частности, выбор слишком малого такта квантования может привести к чрезмерно большим изменениям сигнала управления. Моделирование с объектом управления третьего порядка (т0—3) показало, что адаптивное управление мало чувствительно к ошибке в определении порядка модели в диапазоне ш0 — l^m^mG-|-2. (25.5-2)
424 Ч. VI. Адаптивные системы с идентификацией параметров Это означает, что порядок объекта управления может быть точно не известен. Однако алгоритмы адаптивного управления чувстви- тельны к выбору величины запаздывания d модели. Если величина d не известна или меняется со временем, управление либо не обес- печивает требуемых показателей качества, либо делает систему неустойчивой. Решение этой задачи может быть достигнуто допол- нительным оцениванием задержки времени [25.21]. Выбор коэффициента значимости оценки Л при оценивании параметров зависит от скорости изменения характеристик объекта управления, порядка модели и типа возмущений. Для стационар- ных или очень медленно меняющихся со временем объектов управ- ления рекомендуется величина Л=0,99. Для более быстрых изме- нений параметров объекта и при наличии случайных возмущений допустимы значения 0,95 сХс0,99, а при ступенчатых изменениях задающей переменной — 0,85<2ic0,90. При этом меньшие зна- чения коэффициента Л соответствуют объектам управления более низкого порядка (ш=1, 2), а большие значения — объектам вы- сокого порядка. Влияние весового коэффициентах на управляющую переменную можно оценить, рассматривая первое значение входного сигнала и (0) после ступенчатого изменения уставки w(k)=wol(k). Для замкнутого контура управления имеет место и0 (0) = q0w0. Поэтому величина q0 является мерой входного сигнала объекта управления. Для регулятора АР (v 4-1) существует линейная связь между q0 и г': Qo = qomin + (1 Г ) (qomax qomin) Г 1)? (25.5-3) где qomin =1/(1— ах)2ьь Потах =1/2^ (разд. 7.2 И 20.2). Для регулятора РМДЗ из уравнений (14.1-25), (14.1-27) сле- дует, что q0 обратно пропорционально r/bf при r/bj > ЬР При q0 = qomax = 1/bf из уравнения (14.1-27) для г = 0 получим L—= г", г" < 1. (25.5-4) Чотах Ч-Г/Ь2 ’ V ’ Поэтому весовой коэффициент г должен быть связан с Ь®. Чтобы получить г = 0,5 или 0,25, необходимо выбрать г/Ь,= 1 или 3. 25.6. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ АДАПТИВНОГО УПРАВЛЕНИЯ Всестороннее изучение показало применимость алгоритмов управления с подстройкой параметров для тестовых процессов и реальных промышленных объектов. Краткий обзор применения самонастраивающегося регулятора РМНК/РМД4 для управления концентрацией пульпы в бумагоделательной машине и количеством руды, поступающей в дробильную установку, дан в ра- боте [25.235- Эти же алгоритмы были успешно применены при создании си- стемы управления танкера [25.22] и для регулирования содержания двуокиси титана в печи для обжига [25.23]. В работе [25.24] сообщается о применении алгоритма РМНК/РМДЗ, реализованного в виде самонастраивающегося регу-
Гл. 25. Регуляторы с подстройкой параметров 425 ля юра на микропроцессорах, для управления температурой помещения, водо- родным показателем PH и температурой внутри химического реактора. Алго- ритмы РМНК/РМДЗ и РМНК/АР были реализованы на микро-ЭВМ и исполь- -ваны для управления воздухонагревателем [25.25] и [25.26]. Применение I оритмов РМНК/РМД4 и РМНК/PC для управления процессом рН-нейтра- .шзации описано в [25.27]. В дальнейшем рассмотрены примеры использования адаптивных регуля- юров для управления воздухонагревателем и водородным показателем pH. Из-за нелинейности характеристик поведение обоих объектов управления в с 1атике и динамике зависит от их рабочей точки. 25.6.1. Адаптивное управление воздухонагревателем Структурная схема кондиционирующей установки представ- лена на рис. 25.6.1. Зависимость коэффициента передачи воздухо- нагревателя Ки, представляющего собой отношение изменения Воздухонагреватель Увлажнитель воздуха Рис. 25.6.1. Схема кондиционирующей установки. Ц— температура воздуха; Ф — относительная влажность; М — расход воздуха; — управление положе- нием вентиля впуска воды; U2 — управление положением вентиля распылителя воды. температуры воздуха Ф на выходе к изменению положения вен- тиля, регулирующего расход горячей воды на входе AUi, от вели- чины Ui изображена на рис. 25.6.2. Коэффициент значительно изменяется (приблизительно в 10 раз) в зависимости от положения вентиля Ui и скорости потока воздуха. Кроме того, динамические характеристики существенно меняются с изменением рабочей точки и направления изменения входного воздействия (нелиней- ности характеристик). Для управления был использован алгоритм РМНК/АР (v+1), реализованный на 8-разрядной микро-ЭВМ [25.25], [25.26]. Переходные процессы, представленные на рис. 25.6.3, показывают, что контур управления с адаптивным регулятором
426 Ч. VI. Адаптивные системы с идентификацией параметров стабилизирует уставочное значение температуры примерно за 10 тактов квантования. При последующих ступенчатых изменениях уставки температуры и расхода воздуха также обеспечивается хорошее качество управления. Входная величина меняется от 1 Рис. 25.6.2. Зависимость ко- эффициента передачи К11= =А$(оо)/Ди1 ( оо) от величи- ны управления Uj при U2= =-1 В. до 7 В, что соответствует практически полному диапазону поло- жений вентиля. Различная амплитуда входного сигнала при из- менении уставок на одинаковую величину (2°С) говорит о под- стройке коэффициентов регулятора. Аналоговый ПИ-регулятор с зафиксированными параметрами, рассчитанными на W=21°C и М=400 м3/ч, обеспечивает требуемое качество только для этой рабочей точки. Если уставочное значение температуры увеличить, то реакция системы становится слишком медленной и при умень- шении расхода воздуха до 300 м3/ч управление становится не- устойчивым [25.261. 25.6.2. Адаптивное управление водородным показателем pH На рис. 25.6.4 представлена схема управляемого химического процесса для получения заданного водородного показателя pH, в котором соляная кислота и раствор едкого натрия смешиваются с нейтральной водой. Управляющей переменной является расход щелочи (регулируемый частотой движения поршня насоса), регу- лируемой переменной — величина водородного показателя раст- вора pH, измеряемого с помощью стеклянного электрода на выходе смесительного бака. Как известно, этот процесс обладает нелиней- ной статической характеристикой, которая определяется кривой титрования. Зависимость коэффициента передачи К = АрН (оо)/ДМь (где АМЬ — приращение расхода щелочи) от величины управления U изображена на рис. 25.6.5. Как видно из рисунка, этот коэф- фициент изменяется в 6 раз. На рис. 25.6.6, а показаны результаты адаптивного управления процессом с применением регулятора
Гл, 25. Регуляторы с подстройкой параметров 427 Рис. 25.6.3. Переходные процессы в адаптивной системе управления температурой воздуха при постоянном расходе воды в разбрызгивателе и изменениях задающей переменной w(k) и расхода воздуха М. Адаптивный регулятор РМНК/АР (v | l). m=3; d=0; Х=0,9; То=70 с. Рис. 25.6.4. Схема рН-процесса.
428 Ч. VI. Адаптивные системы с идентификацией параметров I Рис. 25.6.5. Зависимость коэффициента К= ДрН (оо)/ДМь от расхода щелочи, Рис. 25.6.6. Переходные процессы в адаптивной системе управления pH. — расход кислоты; Мь — расход щелочи; Mw — расход нейтральной воды. а — РМНК/АР (v+D; г' = 0,5, То= 15 с; m=3; d=2; >.= 0,88; Р(0)=500 I; б — РМНК/РМДЗ, г"=0,15; То=15 с; m=3; d=2; >.= 0,88; Р(0)=500 I.
Гл. 25. Регуляторы с подстройкой параметров 429 1’МНК/АР (v+1). В момент времени t=0 начальное значение иектора оценок параметров 0(0)=0. Примерно через 2 мин система управления отрабатывает уставочное значение pH=7. Переход- ные процессы для ступенчатых изменений уставочного значения pH в противоположных направлениях имеют малое время установ- ления при отсутствии или малых значениях перерегулирования. Реакция системы при возмущении по расходу кислоты в момент времени t=14 мин также удовлетворяет требуемому качеству управления. Оценки коэффициента передачи в процессе этого эксперимента изменялись от 0,023 при t=5 мин до 0,144 при t = = 10 мин, т. е. в 6 раз. На рис. 25.6.6,6 представлены результаты испытаний адаптивной системы управления с регулятором РМНК/ РМДЗ. Первые 2 минуты перед началом работы системы осуществ- ляется предварительная идентификация разомкнутого контура управления путем подачи ряда пробных ступенчатых изменений управляющей переменной. При этом адаптивный регулятор исполь- зует в начальный момент более точную модель объекта управления и, следовательно, с самого начала обеспечивает целенаправленное управление объектом. После замыкания контура адаптации водо- родный показатель стабилизируется при значении pH=7. Система обеспечивает высокое качество управления при отработке ступен- чатых изменений уставок и возмущений по расходу кислоты и воды. Более подробный материал по этому вопросу представлен в работе [25.28]. Экспериментальные исследования с регуляторами PMHK/AP(v-f-l) и РМНК/РМДЗ показали, что они не только могут использоваться для регулирования величины pH, но и обеспечи- вают при этом более высокое качество управления по сравнению с обычным непрерывным ПИ-регулятором. Приведенные примеры показали, что адаптивные регуляторы могут быть использованы для настройки параметров регуляторов с учетом заданной рабочей точки, изменений статических харак- теристик нелинейных объектов управления (возникающих при изменении уставок), а также нестационарное™ характеристик объ- екта управления (связанной с наличием таких внешних возмущений, как, например, изменение расхода отдельных компонентов раст- вора). Адаптивные регуляторы обеспечивают более высокое каче- ство управления по сравнению с фиксированными регуляторами. Кроме того, применение самонастройки вместо ручной настройки регуляторов по заданной методике позволяет значительно эконо- мить время. 25.7. АДАПТИВНОЕ УПРАВЛЕНИЕ С ПРЯМОЙ СВЯЗЬЮ Для построения статистически эквивалентных адаптивных регу- ляторов с прямой связью (рис. 25.7.1) могут быть использованы те же принципы, что и для адаптивных регуляторов с обратными связями.
430 Ч. VI. Адаптивные системы с идентификацией параметров Допустим, что объект управления описывается уравнением у (z) =GP (z) u (z) 4-Gv (z) v (z), (25.7-1) где v (z) — измеримое возмущающее воздействие и Гт M - У (z) - B (Z-1) 7-dp - Gp(Z' u(z) A (z-1) bjZ 1—|— bm Z P = (25.7-2) 1 + alz 1 "Г • • • + ampZ p „ , . у (z) D (z-1) _d Gv (z) = — = r 14 Z V = v x ' v (z) c (z i) = Az~2_+: •2 + dT.v2./nI.. z-dv. (25.7-3) H e^'H-.’+CmvZ ™v Регулятор с прямой связью имеет передаточную функцию Рт /7 \ U (z) S (z~]) s0 + slz ~1 4~ • • • +svz~v /п E 74. Us^-v(z)-R (Z-1) - i+riZ-i+... +rHz-u ’ Тогда уравнение (25.7-1) можно переписать в виде A (z-1) у (z) =В (z-1) z~dp u (z) 4-D (z-1) z~dv v (z), (25.7-5) где A (z—1) = 1 4-ctjZ-1 4- . . . 4-anz-n 'i B(z-1) = (31z-1+ . . +|3nz-n . (25.7-6) D(z-1)-61z-1+...+6nz-n ' A (z-1) является общим знаменателем передаточных функций GP(z) и Gv (z), а В (z-1) и D (z-1) — расширенными числителями соогветст- Рис. 25.7.1. Блок-схема адап- тивного регулятора с пря- мой связью. вующих передаточных функций. Так как все сигналы, входящие в уравнение (25.7-5), измеримы, то параметры и 6, могут быть определены с помощью рекуррентного метода наименьших квадратов (РМНК) (см. разд. 23.2) с использованием следующих обозначений: 0T = [aj.. .a^.. фД.. ,6„], (25.7-7) (к) = [ —у (k—1)... —у (к —n) и (к —dp—1). . .u(k—dp—п), v (к —dv—1).. .v (к —dv —n)]. (25.7-8)
Гл. 25. Регуляторы с подстройкой параметров 431 Условие идентифицируемости для этого случая также должно удов- ютворяться, поскольку и (к) и v(k) коррелированы. Здесь может быть использован другой способ выведения второго условия иден- I ифицируемости из разд. 24.1 (см. уравнение (24.1-32)). Алгоритм управления, реализуемый регулятором с прямой связью, опреде- ляется выражением u (k —dp—1) = —гги (к —dp —2)—... —гци (к — dp—р,—1)4- 4-s0v (к —dp—1)4- .. . 4-svv (к —dp—v—1), (25.7-9) и элементы вектора (25.7-8) становятся линейно-независимыми только при выполнении условий max[p; v 4- (dp — dv)l > п для dp—dv>0, 1 (25 7 10) max [p 4-(dv —dp); vj^n для dp —dv^0. f { ' Используя модель (25.7-5) и вектор оценки параметров 0, можно спроектировать алгоритмы управления с прямой связью на основе методов компенсации (разд. 17.1), минимума дисперсии (разд. 17.4), принципа конечного времени установления переходного процесса [25.29] или оптимизации параметров (разд. 17.2). Полу- чаемые при этом адаптивные алгоритмы управления описаны в работе [25.29]. Все они обладают быстрой адаптируемостью. На рис. 25.7.2 показан пример использования одного из таких алго- ритмов. Комбинация алгоритмов РМНК и РМД4 была предложена в работе [25.9]. Применение регуляторов с прямой связью может существенно улучшить качество управления многими промышленными объек- тами. Обычно используют регуляторы пропорционального и диф- ференцирующего типов или дифференцирующего типа с задержкой. На практике не всегда удается заранее точно настроить их пара- метры. Поэтому применение самонастраивающихся или адаптив- ных алгоритмов управления с прямой связью позволяет добиться лучших показателей качества. 25.8. МНОГОМЕРНЫЕ РЕГУЛЯТОРЫ С ПОДСТРОЙКОЙ ПАРАМЕТРОВ Моделирование и практические результаты использования регу- ляторов с подстройкой параметров для объектов управления с одним входом и одним выходом показали быструю сходимость настроек параметров, обеспечивающую этим регуляторам ряд прак- тических преимуществ по сравнению с обычными ненастраиваемыми регуляторами. Поэтому естественно, что принципы управления с подстройкой параметров были использованы и для многомерных систем управления с учетом всех внутренних связей объекта уп- равления. Модификация самонастраивающегося регулятора РМНК/
432 Ч. VI. Адаптивные системы с идентификацией параметров Рис. 25.7.2. Переходные процессы в системе управления низкочастотным объек- том порядка т=3 с адаптивным регулятором с прямой связью и фильтром возму- щений порядка т=2. а —без ретулятора с прямой связью при ступенчатых возмущениях v(k); б — при введении адаптивного регулятора с прямой связью на основе РМНК/АР. РМД4 для многомерных систем была проведена в работах [25.30] — [25.32] с использованием матричных полиномиальных моделей. Обзор соответствующих комбинаций алгоритмов оценивания пара- метров и управления дан в работе [25.33]. Там же показано, что для этих алгоритмов применимы следующие линейные многомерные модели объектов управления с р входами и г выходами:
Гл. 25. Регуляторы с подстройкой параметров 433 (25.8-3) (25.8-4) ® р — каноническая модель Ап (z~]) у, (z) = 2 Blj(z-1)z-duj(z)+ 2 Dij (z-1)Vj (z), i= 1,.... г; j=i i= i (25.8-1) • матричная полиномиальная модель (уравнение (20.3-1)) A (Z'1) у (z) = В (z-1) z~du (z) 4- D (z-1) v (z); (25.8-2) • рекуррентная модель в пространстве состояний х (k 4- 1) = А х (к) 4- Ви (к) -j- Gv (к) у (к) = Сх (k)4-v(k) Эта модель может быть преобразована к канонической форме наблюдаемости (разд. 3.2) xt (к + 1) = Atxt (к) + Btu (к) 4- Gtv (к) у (к) = Ctxt (к) 4- v (к) с помощью преобразования xt(k) = Tx(k). (25.8-5) Для получения модели вход!выход, удовлетворяющей условию минимальной реализации, введем обозначение у*т (к) = [у (к) у (к 4-1). ..у (к 4“ п. — 1 )]т. (25.8-6) Тогда в соответствии с уравнением (3.6-62) получим у* (к) =С*х* (к) 4- В*и* (к) 4- v* (к) -|-G*v* (к). (25.8-7) Матрица С* содержит в качестве сомножителя матрицу преобразо- вания к канонической модели наблюдаемости Т, которая равна единичной матрице, если объект управления (25.8-3) записан в ка- нонической форме наблюдаемости (25.8-4). В этом случае перемен- ные состояния могут быть непосредственно вычислены без приме- нения наблюдателя. Более детальный вывод этой модели в детер- минированном случае рассмотрен в работе [2.19], а для стохасти- ческого случая — в работах [25.34], [25.33]. Оценки параметров указанных моделей могут быть получены на основе соотношений yi(k) = ^(k)G1 + vi(k), i = l... г, (25.8-8) с помощью методов РМНК или РОМНК- Алгоритм для получе- ния оценок имеет вид 0. (к 4- 1) = 01 (к) 4- Ъ (к 4- 1) et (к 4- 1)- (25.8-9) Для создания многомерных регуляторов с настраиваемыми параметрами эти алгоритмы оценивания параметров объединяются с алгоритмами многомерного управления, описанными в гл. 20 и 21 [25.33] и реализованными в виде следующих регуляторов.
434 Ч. VI. Адаптивные системы с идентификацией параметров Матричные полиномиальные регуляторы: • матричные полиномиальные апериодические регуляторы (MAPI, МАР2); • матричные полиномиальные регуляторы с минимальной диспер- сией (МРМД1, МРМД2). Многомерные регуляторы состояния: • многомерный регулятор по переменным состояния, обеспечи- вающий требуемое расположение полюсов (МПРС); • многомерный регулятор состояния на основе матричного урав- нения Риккати (МРРС); • многомерный регулятор с развязкой подсистем (МДРС); • многомерный регулятор состояния с минимальной дисперсией (МРМДС1, МРМДС2). На рис. 25.8.1 представлена структурная схема двумерного объекта управления, используемого в качестве примера для ис- а Рис. 25.8.1. Тестовый дву- мерный объект управления. б следования алгоритмов управления с подстройкой параметров. Результаты моделирования при ступенчатых изменениях задающих переменных и наличии случайных возмущений на выходах системы показаны на рис. 25.8.2 и 25.8.3 соответственно. В обоих случаях
Гл. 25. Регуляторы с подстройкой параметров 435 utftf) 1 Рис. 25 8 2. Переходные процессы в двумерной адаптивной системе управлением тестовым объектом (рис. 25.8.1) при ступенчатых изменениях wt (к) и w2(k). Ре- гулятор РМНК/МАР. То=4 с; т1=3, т2=5. Ограничения на управляющие воз- действия. —2<U!(k)<2 для 0<к<20. через 20—30 тактов квантования параметры адаптивного регуля- тора настраивались и обеспечивалось требуемое качество управ- ления.
436 Ч. VI. Адаптивные системы с идентификацией параметров Рис. 25.8.3. Переходные процессы в двумерной адаптивной системе управления тестовым объектом при случайных возмущениях. Регулятор РОМНК/МРМД1. То—4 с, R—0,005 I; S— I; т1=3; т2=5. Ограничения на управляющие воздейст- вия —5-^ut (к)-<:5 для 0<к<20. Многомерные регуляторы с подстраиваемыми параметрами были использованы для управления кондиционирующей установкой [25.35], структурная схема которой была приведена на рис. 25.6.1.
Гл. 25. Регуляторы с подстройкой параметров 437 Рис. 25.8.4. Переходные процессы в двумерной адаптивной системе управления кондиционирующей установкой. а — адаптивный апериодический регулятор РМНК./МАР2, m1 = m2=3; б — адаптивный регу- лятор состояния РМНК/МРРС, mt = 3, m2=2
438 Ч. VI. Адаптивные системы с идентификацией параметров Скорость потока воздуха полагалась равной М=400 м3/ч, такт квантования То=4О с, коэффициент значимости оценки л=0,95. Алгоритм управления был реализован на управляющей ЭВМ типа НР21МХ-Е. На все вычисления в каждый межтактовый промежу- ток времени требовалось менее 1 с. На рис. 25.8.4 показаны пере- ходные процессы в системе управления при использовании двух типов многомерных регуляторов с подстраиваемыми параметрами: апериодического и регулятора состояния. В начальной стадии процесса при изменении к от 1 до 10 управляющие переменные изменяются в диапазоне 2 B<Ui«:4 В и 0 B<U2<2 В соответст- венно. Оба регулятора стабилизируют объект управления за 20— 25 тактов квантования и обеспечивают приемлемые показатели качества при ступенчатых изменениях уставок температуры воз- духа и его влажности. Различные переходные процессы характе- ризуют динамику системы управления. Коэффициенты передачи объекта управления изменялись следующим образом: для воздухо- нагревателя в 2 раза, увлажнителя в 3 раза, перекрестных связей в 4 и 1,5 раза соответственно. В заключение можно сказать, что и моделирование, и исследо- вание при управлении реальными объектами показали высокую эффективность многомерных регуляторов с подстраиваемыми пара- метрами, которые хорошо зарекомендовали себя с точки зрения скорости и качества управления. Заключение Результаты, полученные в данной главе, показали, что пра- вильно выбранные алгоритмы управления с подстройкой парамет- ров являются асимптотически устойчивыми и обладают высокой скоростью сходимости при выполнении следующих условий: а) соответствие линейных моделей объекта управления и шума реальным процессам; б) постоянство параметров объекта управления и шума. Однако в большинстве практических случаев параметры объ- екта управления изменяются во времени. Использование при оце- нивании параметров коэффициента значимости оценки Х<Д по- зволяет алгоритмам управления с подстройкой отслеживать изме- нение характеристик объекта, если скорость их изменения сущест- венно ниже скорости протекания переходных процессов объекта управления. Для нормального хода процесса идентификации необходимо; в) наличие возбуждающего внешнего сигнала, действующего на замкнутый контур управления. Условие а) удовлетворяется, если объект управления линеаризуем в области управления и если параметры модели, определяющие структуру объекта (порядок т, величина запаздывания d, такт квантования То), выбраны правильно (см. разд. 25.4). Для неста-
Гл. 25. Регуляторы с подстройкой параметров 439 ционарных процессов также важен правильный выбор коэффици- ента значимости оценки X. Моделирование и практический опыт показали, что, за исключением величины запаздывания d, выбор в процессе синтеза параметров т, То, А, и весового коэффициента управления г не является критичным в определенном диапазоне. Эти конструктивные параметры могут быть определены опытным Уровень 3: координи- рование Уровень 2: адаптация Уровень 1: управление Рис. 25.8.5. Адаптивная система управления с третьим иерархическим уровнем обратной связи. путем. Между тем, исследуются методы их автоматического опре- деления. С этой целью в адаптивной системе управления (рис. 25.8.5) добавляется третий иерархический уровень обратной связи. Здесь осуществляется координирование процесса адаптации за счет автоматической подстройки параметров самого контура адап- тации. Например, в работе [25.20] рассматривается подстройка величины запаздывания. Использование такого координирующего уровня позволяет уменьшить до одного или двух число характе- ристик, используемых при синтезе системы, таких, как, например, коэффициент затухания, время установления переходного про- цесса, отношение дисперсий, полоса пропускания. Кроме того, координирующая обратная связь позволяет конт- ролировать работу контура адаптации, особенно когда режим функционирования системы приводит к нарушениям условий ус- тойчивости и сходимости. Примером таких режимов может служить слишком быстрое изменение параметров объекта управления или отсутствие надлежащего сигнала, позволяющего провести оценку параметров. В последнем случае может случиться так, что модель испортится («заснет») со временем до тех пор, пока изменения ал- горитма управления не приведут к нарушению устойчивости кон- тура. В результате на входе объекта управления появится сигнал, похожий на всплеск, вновь заработает процедура оценивания параметров модели и адаптивный контур станет устойчивым. Далее
440 Ч. VI. Адаптивные системы с идентификацией параметров весь цикл повторяется. Существует несколько путей для ликви- дации этого явления с помощью координирующей обратной связи, например изменять коэффициент значимости оценки X до 1 или «за- мораживать» параметры модели объекта управления, если вели- чина сигнала ошибки или управления находится в определенном диапазоне, иначе говоря, (ew (k)[ = (w(k)-y(k)(<ew. Моделирование и эксперименты с реальными объектами управ- ления показали также, что алгоритмы управления с подстройкой параметров применимы для объектов со скачкообразным харак- тером изменения параметров [25.16]. Рассмотренные алгоритмы адаптивного управления, основан- ные на оценивании параметров линейной модели объекта, могут быть использованы при управлении достаточно нелинейными объектами управления, для которых линейные регуляторы с по- стоянными параметрами либо неприменимы, либо не обеспечивают требуемого качества. Если методы оценивания параметров и расчета регуляторов распространить на модели нелинейных объектов управления, осо- бенно при сохранении линейности относительно параметров, то адаптивное управление с подстройкой параметров будет также применимо к явно выраженным нелинейным объектам управления. Представленные в данной главе результаты исследований по- казали, что алгоритмы управления с подстройкой параметров могут быть использованы: ф в качестве самонастраивающегося управления в процессе ввода в действие объекта управления: — на одной рабочей точке, а затем как регулятор с фиксиро- ванными параметрами; — для разных рабочих точек (нагрузок), а затем е адаптивным регулятором с прямой связью; Ф в качестве адаптивного управления объектами с медленно ме- няющимися во времени параметрами.
ЧАСТЬ VII Цифровое управление с помощью управляющих и микро-ЭВМ Помимо выбора соответствующих алгоритмов управления и их подстройки к объекту для обеспечения высокого качества управления с помощью циф, о- вых вычислительных устройств необходимо рассмотреть ряд важных аспек- тов. В гл. 26 рассматривается влияние квантования сигналов по уровню в пре- образователе аналог/код, центральном процессоре и преобразователе код/ана- лог на работу системы управления с точки зрения выбора необходимой дли- ны слова ЭВМ. Другим требованием является приемлемая фильтрация воз- мущений, которые не могут быть компенсированы с помощью алгоритмов управления. В связи с этим в гл. 27 исследованы вопросы фильтрации высоко- и среднечастотных сигналов с помощью непрерывных и цифровых фильтров Комбинации алгоритмов управления с различными типами исполнительных устройств исследуются в гл. 28 В этой же главе рассматривается задача линеаризации исполнительного устройства с ограничениями по скорости и положению. Гл. 29 посвящена автоматизации расчета алгоритмов управления с помощью ЭВМ. В последней главе методы идентификации и цифрового уп- равления демонстрируются на примерах управления теплообменником, сушиль- ной центрифугой и паровым котлом. ГЛАВА 26 Эффекты квантования по уровню в цифровых системах управления В предыдущих главах при исследовании цифровых систем управления рассматривались дискретные сигналы, квантованные только по времени. Пред- полагалось, что квантование по уровню вносит столь малые погрешности, что амплитуды сигналов могут считаться практически непрерывными. Данное предположение вполне оправдано, если сигналы изменяются в широком диа- пазоне и их обработка ведется на ЭВМ, обладающих большой разрядной сеткой Если же отклонения сигналов невелики, а цифровой вычислитель оперирует со словами малой разрядности, то возникают существенные погреш- ности, которые должны учитываться при анализе цифровых систем.
442 Ч. VII, Цифровое управление с помощью ЭВМ. 26.1. ИСТОЧНИКИ ОШИБОК, СВЯЗАННЫХ С КВАНТОВАНИЕМ ПО УРОВНЮ В управляющих ЭВМ и цифровых регуляторах обрабатыва- емые сигналы подвергаются квантованию по уровню на несколь- ких этапах. Если в системе управления используются цифровые датчики, их выходные сигналы могут принимать только определен- ные дискретные значения. Квантование по уровню происходит и в центральном процессоре (ЦП). Наконец, при переводе из цифровой в аналоговую форму в устройстве вывода сигналы также кван- туются. Три этапа квантования можно выделить и в тех системах, где используются датчики с аналоговым выходом. Данный случай рассматривается в следующем разделе. 26.1.1. Аналоговый вход Аналоговые входные устройства обычно выдают сигналы в виде напряжений стандартного диапазона (как правило, 0—10 В) или токов (0—20 мА или 4—20 мА). Эти сигналы квантуются по уровню в аналого-цифровом преобразователе (АЦП) и переводятся в цифровые коды. На выходе преобразователя сигнал бывает пред- ставлен в формате с фиксированной точкой. Шаг квантования А (определяющий точность преобразования) задается разрядностью преобразователя WL (т. е. длиной его слова за исключением зна- кового разряда) Максимальное количество различных чисел, представимых с помощью двоичного кода разрядности WL, равно NR = 2WL—1. (26.1-1) Отсюда можно найти шаг квантования: NR 2WL -1 2wl (26.1-2) Значения шага квантования, соответствующие АЦП с различной разрядностью WL, приведены в табл. 26.1.1. Таблица 26.1,1 Величина шага квантования в зависимости от разрядности слова на выходе АЦП (без учета знакового разряда) Длина слова, бит 7 8 10 12 15 Количество представимых чисел NR 127 255 1023 4095 32 767 Шаг квантования Л 0,00787 0,00392 0,00098 0,00024 0,00003 Шаг квантования А, % 0,787 0,392 0,098 0,024 0,003
Гл. 26. Эффекты квантования по уровню 443 Соотношения между разрядностью АЦП и величиной шага квантования проиллюстрируем следующим примером: Если максимальное значение напряжения равно 10 В = 10 000 мВ, при длине слова в 7 (15) двоичных разрядов минимальное преобразуемое напря- жение составляет А = 78,7 (0,305) мВ. Если измеряется температура в диапа- зоне до 100° С, это соответствует А = 0,787 (0,003)° С. На выходе АЦП формируется цифровое значение, равное це- лому числу L шагов квантования А, содержащихся в аналоговой величине у (например, напряжении), поданной на его вход: yQ=LA, L = 0, 1, 2, ..., NR. (26.1-3) Остаток бу < А либо округляется, в результате чего получается ближайшее снизу или сверху к величине у/А целое число, либо попросту усекается. В обоих случаях справедливо соотношение У=\ч+6у, (26.1-4) где ошибка квантования бу заключена в следующих пределах: Ф при округлении —0,5 «С (бу /A)r < 0,5; (26.1 -5) Ф при усечении 0^(бу/А)т<1. (26.1-6) Таким образом, квантование по уровню является первым ис- точником нелинейности (рис. 26.1.1). 26.1.2. Центральный процессор Цифровые коды с выхода АЦП пересылаются в центральный процессор (ЦП), где обычно преобразуются в слова большей раз- рядности, т. е. в двоичные коды длины WLN. Вычисления, связан- ные с реализацией линейных алгоритмов управления, включают следующие операции: ф вычисление отклонения регулируемой переменной eQ(k) = (yy (k))AD— wQ(k), (26.1-7) ф вычисление управляющей переменной Uq (k) = —piyiiQ (k —1) —. . PuqUq (k—p) + 4~ Рореу (k). . 4-qVQeQ(k v) (26.1-8) В ЦП возникают новые ошибки квантования, обусловленные конечной разрядностью чисел (WLcp), посредством которых пред- ставлены следующие величины: ф задающая переменная wQ (к); ф управляющие переменные uQ(k — i), i = 1, 2, . . .; Ф параметры piQ, qiQ;
444 Ч. VII. Цифровое управление с помощью ЭВМ • произведения piQUQ(k —i), qiQeQ(k—-i), i = 0, 1, 2, .. Ф сумма произведений uo(k). Если ЦП работает со словами длиной в 8—16 двоичных раз- рядов, ошибки квантования по уровню при выполнении арифме- тических операций в процессоре с числами, записанными в фор- мате с фиксированной точкой, имеют тот же порядок, что и в АЦП, Их можно существенно снизить, производя все вычисления с двой- ной точностью. Как правило, в управляющих ЭВМ предусмотрены средства для обработки чисел в формате с плавающей точкой, для записи которых отводится по два или более 16-разрядных слов. Если число с плавающей точкой L = M-2E (26.1-9) занимает, например, два 16-разрядных слова, то под его порядок Е, определяющий положение двоичной точки относительно младшего разряда числа, отводится обычно 7 разрядов, а под мантиссу М (предполагается, что условная точка стоит перед ее старшим раз- рядом) — 23 разряда. При этом диапазон чисел, представимых в указанном формате, таков: —0,8388608 • 2~128 < L < 0,8388607 • 2^ или —0,24651902 • 10-8» l < 0,14272476 • 1038. Следовательно, в данном случае значение шага квантования по уровню составляет Д«10~38, т. е. является пренебрежимо малой величиной. Если для записи чисел используются слова малой разрядности в формате с фиксированной точкой, при вычислении произведений могут возникать значительные ошибки квантования и соответственно заметные нелинейные искажения (рис. 26.1.1). Что же касается квантования задающей переменной и парамет- ров регулятора, то оно вызывает лишь определенные отклонения от номинальных значений указанных величин и, следовательно, не создает дополнительных нелинейностей в контуре управления. 26.1.3. Аналоговый выход Если в системе управления применяются исполнительные уст- ройства с аналоговым входом, квантованные по уровню значения управляющей переменной uQ(k) пересылаются в цифро-аналоговый преобразователь (ЦАП), за которым стоит фиксирующий элемент. Как показано на рис. 26.1,1, ЦАП также является источником нелинейности, причем его характеристика отличается неоднознач- ностью. Выше были перечислены те процессы в цифровом контуре уп- равления, которые становятся причиной возникновения нелиней-
Рис, 26,1,1, Упрощенная схема возникновения в цифровом контуре управления нелинейностей, связанных с квантованием по уровню.
446 4. VII. Цифровое управление с помощью ЭВМ ностей. Известно, что теоретический анализ влияния даже одной нелинейной характеристики на динамические и статические свой- ства системы сопряжен со значительными трудностями. Тем более сложную задачу представляет исследование всех эффектов, связан- ных с квантованием по уровню в цифровом контуре управления. В известных публикациях на данную тему обычно предполагается, что ошибки квантования случайны и распределены по равномер- ному закону, либо просто рассматривается наихудший вариант, когда все ошибки квантования принимают максимально возможные значения (см. [26.1] — [26.6], [2.17]). Для анализа устойчивости используют метод описывающих функций [5.14], [2.19] или прямой метод Ляпунова [5.17]. Однако, по-видимому, наиболее достовер- ные результаты при анализе нескольких нелинейностей, обуслов- ленных квантованием, а также нестандартных объектов и управ- ляющих алгоритмов дает все же математическое моделирование. Ниже на простых примерах исследуются явления, связанные с квантованием по уровню. Все источники квантования объеди- няются в три основные группы: Ф квантование переменных (округление регулируемой или управ- ляющей переменных, выполняемое в АЦП, ЦАП или ЦП); Ф квантование коэффициентов (округление значений параметров регулятора); Ф квантование промежуточных результатов при реализации ал- горитма управления (в частности, округление произведений, входящих в уравнение (26.1-8)). При изучении цифровых систем ‘управления наибольший ин- терес представляет анализ влияния эффектов квантования на динамику замкнутого контура, который в отсутствие подобных нелинейностей является асимптотически устойчивым. Возможны следующие случаи: а) Эффекты квантования настолько малы, что контур управ- ления практически сохраняет асимптотическую устойчивость. Поэтому ошибка регулирования, вызванная начальным рассогла- сованием, сходится к нулю, т. е. lim е (к) « 0. б) Контур управления не возвращается в устойчивое нулевое состояние, и возникает статическая ошибка по положению lim е (к) 0. к в) При подаче постоянного возбуждения в контуре вырабаты- вается дополнительный случайный сигнал — шум квантования или округления. г) Возникает предельный цикл с периодом М: lim e(k) = lim е (k-|-M) =#0.
Гл. 26. Эффекты квантования по уровню 447 26.2. АНАЛИЗ РАЗЛИЧНЫХ ЭФФЕКТОВ КВАНТОВАНИЯ 26.2.1. Влияние квантования на переменные величины Предположим, что в контуре управления присутствует един- ственный источник квантования — АЦП, работающий с шагом А (рис. 26.1.1). В этом случае ошибка квантования б задается урав- нением (26.1-5) или (26.1-6), если выполняется округление или усечение соответственно. Шум квантования Если переменная величина изменяется случайным образом, переходя различные уровни квантования, отдельные ошибки кван- тования б (к) могут считаться статистически независимыми. По- скольку ошибки б (к) способны принимать любые значения в соот- ветствующих интервалах, определяемых соотношением (26.1-5) -Л/2 $ Д/2 о 8 д a d Рис. 26.2.1. Плотность вероятности ошибки квантования при: а — округлении; б — усечении. или (26.1-6), можно полагать, что они распределены на этих ин- тервалах по равномерному закону, как показано на рис. 26.2.1. Следовательно, оцифрованный сигнал yQ можно рассматривать как аналоговый сигнал у, на который накладывается случайная помеха б. Согласно уравнению (26.1-4), yQ(k) = y(k)-6(k). (26.2-1) Найдем математическое ожидание шума квантования1, оно равно: • при округлении E{6(k)}=$“aop(6)6d6 = 0; (26.2-2) • при усечении Е{б(к)} = А/2. (26.2-3) Дисперсия в обоих случаях одинакова: al = J[б - Е {б (к)}]2 р (б) d6 = А2/12. (26.2-4)
448 Ч. VII. Цифровое управление с помощью ЭВМ Если описанная помеха возникает в АЦП, она действует по- добно белому шуму, наложенному на регулируемую переменную, и никакой регулятор не в состоянии уменьшить ее дисперсию. На- личие такого шума приводит к возникновению отклонений управ- ляющей переменной, величина которых может превзойти шаг квантования в ЦАП. Данное явление иллюстрируется приведенным ниже примером. Пример 26.2.1. Влияние ошибок квантования на управляющую перемен- ную Будем полагать, что объект управления ведет себя подобно низкочастот- ному фильтру. В гл. 13 было показано, что в этом случае динамика пара- метрически оптимизированного регулятора соответствует ПД-типу. При е (к)= = — у (к) алгоритм управления описывается уравнением и (к) = — qoy (к) — Чгу (к — 1), а аддитивный шум квантования — уравнением U6 (к) = — q0<5 (к) — qx6 (к — 1). Если помеха не (к) фильтруется низкочастотным объектом, в результате чего шум на выходе ув (к) « 0, дисперсию сигнала us (к), представляющего процесс со скользящим средним, можно определить по приближенной формуле 2 г 2 I 21 2 Оиб ~ [ЯоД-Чт] ав- Положив параметры регулятора q0 = 3; q1 = —1,5 и воспользовавшись уравнением (26.2-4), получим следующее значение среднеквадратичного откло- нения: Оиб ® 3,35аб = (3,35/|/"Т2) Л = 0,97Д. Таким образом, при наличии шума квантования в АЦП среднеквадратич- ное значение управляющей переменной более чем в три раза превосходит ошибку квантования. Учитывая, что при усечении математическое ожидание ошибки квантования отлично от нуля, более целесообразно использовать округление. Статические ошибки и предельные циклы Ниже рассматриваются два примера, иллюстрирующие эффекты квантования в тех случаях, когда в контуре управления действует детерминированный сигнал. Пример 26.2.2. Статическая ошибка, обусловленная квантованием непре- рывного сигнала в АЦП. Исследуемый контур управления включает объект первого порядка У (k + 1) = — агу (к) Ц- Ьги (к), где аг = —0,5867; Ь1 = 0,4133, и регулятор П-типа (см. пример 16.1). Ошибка регулирования описывается соотношением e(k) = w (к) —yQ (к).
Гл. 26. Эффекты квантования по уровню 449 В АЦП измеряемый аналоговый сигнал у (к) округляется до второй цифры после десятичной запятой, в результате чего получается оцифрованная вели- чина yQ(k). Реакции замкнутого контура с начальными условиями у(к)=О и ц (к) = 0, к < 0, на ступенчатый задающий сигнал w(k) = l(k) с учетом округления и без него приведены в табл. 26 2 1. Таблица 26.2.1 Влияние округления в АЦП на переходный процесс в замкнутом контуре. q0 = 1,3 к Без округления С округлением и (к) У (к) и (к) у (к) yQ (к) 0 1,3000 0 1,3000 0 1 0,6015 0,5373 0,5980 0,5373 0,54 2 0,5670 0,5638 0,5720 0,5640 0,56 3 0,5653 0,5651 0,5720 0,5649 0,56 4 0,5652 0,5652 0,5720 0,5649 0,56 5 0,5652 0,5649 0,56 В данном случае шаг квантования А = 0,01, а установившееся значение регулируемой переменной после округления равно yQ = 0,56. Возникающая при этом статическая ошибка Ду = 0,003 столь мала, что ею можно пре- небречь. Пример 26.2.3. Предельный цикл, обусловленный квантованием сигнала в АЦП. Предположим, что статический коэффициент усиления контура, рас- смотренного в примере 26.2.2, возрастает до 2,0, в то время как точность Таблица 26.2,2 Влияние округления в АЦП на переходный процесс в замкнутом контуре. q0 = 2,0 к Без округления С округлением и (к) У (к) Ц (к) У (к) yQ (к) 0 2,0000 0 2,0000 0 0 1 0,3468 0,8266 0,3400 0,8266 0,83 2 0,7434 0,6283 0,7400 0,6254 0,63 3 0,6482 0,6759 0,6600 0,6727 0,67 4 0,6711 0,6644 0,6600 0,6675 0,67 5 0,6656 0,6672 0,6800 0,6644 0,66 6 0,6669 0,6665 0,6600 0,6708 0,67 7 0,6667 0,6600 0,6663 0,67 8 0,6600 0,6664 0,67 9 0,6800 0,6637 0,66 10 £ 0,6600 0,6705 0,67 11 0,6600 0,6661 0,67 12 0,6800 0,6636 0,66 13 0,6600 0,6703 0,67 14 0,6600 0,6661 0,67 15 0,6800 0,6636 0,66
470 Ч. VII. Цифровое управление с помощью ЭВМ оценивания дисперсии o2 = E{[s(k)—s]2}; в) ® оценивания параметрической модели сигнала (разд. 23.2.2); вычисления предсказания у (k/k—1); ® оценивания дисперсии о2. Ниже кратко обсуждается лишь один метод из числа простейших. Для оценивания средних значений может быть использован алгоритм рекуррентного усреднения ytk-H^yfM + j^lyfk+O-yCk)]. (27.3-30) Усреднение медленно меняющихся сигналов целесообразно вы- полнять при постоянном коэффициенте коррекции, т. е. у (k +1) = у (к) + К [у (к + 1)—у (к)], (27.3-31) где К = 1/(1Ч-к) в соответствии с (27.3-21). Полагая Ду(к + 1) = У (к + 1)— У (к4-1), запишем рекуррентное соотношение для оценки дисперсии: 52 (k + 1) = (к) + К (к) [(у (к +1)-у (к + I))2—о* (к)], (27.3-32) где К (к) = 1/к или, лучше, К = const. Для выявления выбросов в общем случае необходимо знать вид функции распределения вероятности р(у). При этом все измерения, для которых выпол- няется неравенство |Ay(k + l)| = |y(k + l)-y(k+l)|>xay(k+l), (27.3-33) считаются ошибочными. В частности, при нормальном распределе- нии берется х^З. В алгоритме управления вместо ложного сиг- нала у (к + 1) используется при этом оценка среднего у (k-j- 1).
ГЛАВА 28 Объединение цифровых алгоритмов управления и исполнительных устройств / Данная глава посвящена вопросам стыковки алгоритмов управ- ления с различными типами исполнительных устройств. Поэтому вначале рассматриваются способы управления исполнительными устройствами и их динамические характеристики. Способы управления исполнительными устройствами На выходе ЭВМ требуемая величина управляющей переменной или ее приращения представлена в виде цифрового кода. Поэтому для управления исполнительными устройствами непрерывного типа (пневматическими, гидравлическими или электрическими приво- дами) необходимо включать преобразователи цифра/аналог (ЦАП) с промежуточной памятью и фиксирующие элементы, называемые иначе экстраполяторами, сохраняющие требуемое значение управля- ющей переменной в промежутках между тактовыми моментами вре- мени. Желаемое положение непрерывного исполнительного устройст- ва UB или его изменение ив обеспечивается подачей постоянного напряжения 0—10 В или заданием постоянного тока 0—20 мА на входе исполнительного устройства, в котором они усиливаются и преобразуются в требуемый пневматический, гидравлический или электрический сигнал. В зависимости от количества используемых преобразователей цифра/аналог возможны два способа управления непрерывными исполнительными устройствами, схемы которых представлены на рис. 28.1, а, б. Для исполнительных устройств с непосредственным цифровым управлением (рис. 28, 2, в) необходимы только устройства адресации, коммутации и промежуточной па- мяти. При управлении абсолютным положением U (к) (0—100%) преоб- разователь цифра/аналог может выдавать сигналы одного знака, но должен иметь относительно большую длину слова (8—12 бит). При управлении отклонением и (к) ЦАП должен учитывать оба знака, но может иметь меньшую длину слова (6—8 бит). Динамические характеристики исполнительных устройств В табл. 28.1 приведены некоторые характеристики наиболее часто используемых исполнительных устройств. Из-за большого раз- нообразия таких устройств в таблице рассмотрены лишь отдельные типы.
Ч. VII. Цифровое управление с помощью ЭВМ Адрес исполнитель- Адрес исполнитель- Адрес' исполнитель- Коммитатор Щее устрой- ство Рис. 28.1. Схемы управления исполнительными устройствами. а — непрерывное исполнительное устройство: один ЦАП и несколько непрерывных фиксиру- ющих элементов; 6 непрерывное исполнительное устройство: несколько ЦАП; в =* испол- нительное устройство с цифровым управлением.
Гл. 28. Объединение алгоритмов управления и исполнительных устройств 473 г Рис. 28.2. Способы управления непрерывными исполнительными устройствами. а — прямое управление положением; б — управление с непрерывной обратной связью по положению; в — управление с дискретной обратной связью по положению; г управление с подачей сигнала обратной связи в цифровой регулятор. По своим динамическим характеристикам исполнительные уст- ройства могут быть разделены на следующие группы.’ Группа I: Пропорциональные исполнительные устройства > приводы с пропорциональными характеристиками и задержками первого или более высокого порядка; • пневматические приводы; гидравлические приводы с механи- ческой обратной связью. Группа II: Интегрирующие исполнительные устройства с регули- руемой скоростью • линейные интегрирующие исполнительные устройства; • гидравлические приводы без обратной связи; приводы, исполь- зующие электродвигатели постоянного тока с регулируемой ско- ростью.
Таблица 28.1 Характеристики часто используемых исполнительных устройств Тип Конструкция Входной сигнал Устройство преобразова- ния цнф- ра/аналог Преобразо- ватель входного сигнала Временные характеристики Группа Мощность, ВТ Время нарас- тания, с Упрощенная блок-схема Пневма- тический Мембрана с пру- жиной Давление воздуха 0,2—1,0 кГ/см2 ЦАП Электро- пневматиче- ский Пропорциональ- ные с временной задержкой I 0,1— 2000 1—10 Гидрав- лический Клапан без ме- ханической об- ратной связи Давление масла ЦАП Электрогид- равличе- ски й Интегрирую- щие II 100— 750 000 1—10 Клапан с меха- нической обрат- ной связью Пропорциональ- ные с временной задержкой I 100— 750 000 1-10 Электро- механи- ческий Электродвига- тель постоянно- го тока с парал- лельным воз- буждением Постоян- ное на- пряжение ЦАП Электрон- ный усили- тель Интегрирующие с регулируемой скоростью II 10—4000 0,01— 60 ЫЕ. НО®51 Двухфазный электродвига- тель перемен- ного тока Перемен- ное на- пряжение Блок управ- ления Трехпози- ционное реле Интегрирующие с постоянной скоростью III 10—4000 1—60 да-ш2 Шаговый дви- гатель Импуль- сы напря- жения Исполни- тельное устройство Пропорциональ- ные ступенча- того типа IV 0,02— 60 И чо-ш 1
Гл. 28. Объединение алгоритмов управления и исполнительных устройств 475 Группа III: Интегрирующие исполнительные устройства с постоян- ной скоростью • нелинейные интегрирующие исполнительные устройства; • приводы, использующие электродвигатели переменного тока с трехпозиционным переключателем. Группа IV: Исполнительные устройства дискретного типа • интегрирующие или пропорциональные исполнительные уст- ройства; • шаговые электродвигатели. У правление исполнительным устройством с использованием обрат- ных и прямых связей Для более точной отработки выходным сигналом uA(k) испол- нительного устройства величины регулируемой переменной uR(k), выдаваемой алгоритмом управления, используются различные схе- мы управления, представленные на рис. 28.2: а) ПРЯМОЕ УПРАВЛЕНИЕ ПОЛОЖЕНИЕМ Выходной сигнал uR (к) с ЦАП непосредственно подается на исполнительное устройство. б) УПРАВЛЕНИЕ С НЕПРЕРЫВНОЙ ОБРАТНОЙ СВЯЗЬЮ ПО ПОЛОЖЕНИЮ Сигнал uR (к) рассматривается как задающая величина для не- прерывного регулятора положения. в) УПРАВЛЕНИЕ С ДИСКРЕТНОЙ ОБРАТНОЙ СВЯЗЬЮ ПО ПОЛОЖЕНИЮ Выход Цд(к) исполнительного устройства поступает в управ- ляющую ЭВМ, где формируется сигнал ошибки ue (k) = u(k) — uA (k). Далее, большей частью, используется П-регулятор, сигнал на вы- ходе которого равен u' (k) = qouue(k) = uR (к). г) УПРАВЛЕНИЕ С ПОДАЧЕЙ СИГНАЛА ОБРАТНОЙ СВЯЗИ В ЦИФРОВОЙ РЕГУЛЯТОР Изменение положения иА (к) исполнительного устройства по- дается в ЭВхМ. Алгоритм управления (объектом) вычисляет теку- щее значение управляющей переменной и (к) с использованием предшествующих перемещений исполнительного устройства иА (к—1), пА(к —2), ... u(k)=— p1uA(k-l) — р2иА(к—2)—.. .+qoe(k)4-q1e(k—1)4-... . (28-1)
476 Ч. VII. Цифровое управление с помощью ЭВМ Схема а является простейшей, но в ней отсутствует обратная связь по выходу исполнительного устройства. Схемы б — г реали-; зуют обратную связь по положению. К достоинствам схем б и в\ следует отнести наличие дополнительного регулятора положения,' обеспечивающего отработку исполнительным устройством требуе- мого сигнала на выходе. Реализация схемы в требует меньшего так- та квантования по сравнению с тактом управления объектом, что приводит к дополнительной нагрузке процессора. Схема г исклю- чает необходимость применения специального алгоритма управле- ния. Вычисление и (к) производится с учетом измерений реальных положений исполнительных устройств. Достоинством этой схемы является то, что при использовании алгоритма управления интег- рирующего типа в случае выхода исполнительного устройства на ограничения управляющая переменная не нарастает. Рассмотрим подробнее вопросы управления исполнительными устройствами. Пропорциональные исполнительные устройства При использовании пропорциональных исполнительных уст- ройств группы I изменение управляющей переменной, вырабатывае- мое алгоритмом управления, может непосредственно подаваться на исполнительное устройство, как это показано на рис. 28.2, а. Рис. 28.3. Характеристика исполнительного устройства пропорционального типа. Ur — выход с ЦАП регулятора; Ua — положение исполнительного устройства; Ur — изменение выхода регулятора; ид — изменение положения исполнитель- ного устройства. Для реализации управления с обратной связью по положению при- менимы схемы, представленные на рис. 28.2, б и г. Характеристика пропорционального исполнительного устройства вместе с исполь- зуемыми обозначениями переменных приведена на рис. 28.3.
Гл. 28. Объединение алгоритмов управления и исполнительных устройств 477 Исполнительные устройства интегрирующего типа с перемен- ной скоростью Схема управления, показанная на рис. 28.2, а, может быть при- менена для интегрирующих исполнительных устройств группы II, если эти интегрирующие свойства привода отражены в модели объек- та управления, используемой для синтеза закона управления. Схе- мы б и в обеспечивают получение пропорциональных характеристик в контуре отработки положения, поэтому величина и (к) или и'(к) может определяться, как в случае пропорционального исполнитель- ного устройства. Если алгоритм управления реализован относи- тельно приращения управляющей переменной Au (k)—и (к)—и (к— —1), то применима схема ас прямой передачей управления. Так, для ПИД-регулятора это приращение определяется соотношением Ди (k) = qoe (k) + qxe (к—l) + q2e (к—2). Соответствующая передаточная функция имеет вид Gr z) = = + qiz +q*z • Интегрирующему исполнительному устройству, имеющему пере- даточную функцию G(s) = l/Ts, соответствует дискретная переда- точная функция с фиксирующим элементом нулевого порядка: G UA (z) . .То-Г1 Ga W — Ди (z) “ Т 1—Z-1 • (28-1) Тогда общую передаточную функцию алгоритма управления и исполнительного устройства можно записать следующим образом! G„ (z)OA (z) = = Ь Иг±9-г-Д-.‘г~!‘1 Z~‘ • (28-2) Тем самым исполнительное устройство становится частью регу- лятора. Его постоянная интегрирования Т должна быть учтена при определении параметров регулятора. (Отметим, что при математи- ческом исследовании квантователь после исполнительного устрой- ства отсутствует.) Интегрирующие исполнительные устройства с постоянной ско- ростью Исполнительные устройства группы III с интегрирующими ха- рактеристиками и постоянной скоростью перемещения должны быть снабжены трехпозиционными переключателями для обеспече- ния правостороннего и левостороннего перемещения, а также оста- новки. Первый способ прямого управления положением исполни- тельного устройства состоит в непосредственной подаче сигнала и (к) на трехпозиционный переключатель. При этом рабочий орган
478 Ч. VII. Цифровое управление с помощью ЭВМ исполнительного устройства перемещается вправо или влево в те- чение межтактового промежутка времени, если |u(k)|>uRt, где uRt— величина зоны нечувствительности. Если же |u(k)|<uRt» то исполнительное устройство остается неподвижным. Чтобы изме- нения на выходе исполнительного устройства не были слишком большими, скорость перемещения должна быть относительно малой. Однако это может приводить к низкому качеству управления. Чтобы Устройство управления приводом Трех- позиционный переключатель Интегратор Ограничения по положению Рис. 28.4. Упрощенная блок-схема интегрирующего исполнительного устройства с постоянной скоростью перемещения. получить те же самые перемещения привода за более короткое вре- мя, необходимо повысить его скорость, а также вычислять и запоми- нать длительность включения ТА<Т. Для экономии процессорного времени эти задачи решаются с помощью специального устройства управления приводом [1.11], которое может рассматриваться как преобразователь цифра/аналог с выходом в виде последовательно- сти прямоугольных импульсов длительности ТА. На рис. 28.4 пред- ставлена упрощенная блок-схема исполнительного устройства с указанным управляющим устройством. Интегрирующие исполнительные устройства с постоянной ско- ростью перемещения описаны в табл. 28.1 с помощью трехпозици- онного переключателя и линейного интегрирующего звена. Пусть Ts — время, за которое исполнительное устройство проходит свой полный диапазон: UA тах = Ua max ^Amitr (28-3) Тогда с учетом того, что uR—+uR0, uR =—uR0 или uR~0 в за- висимости от положения трехпозиционного переключателя, имеем для скорости изменения положения привода fT, dUA AUa Ua max uRo dt At Ts |uRo| (28-4)
Гл. 28. Объединение алгоритмов управления и исполнительных устройств 479 Следовательно, изменение положения за период включения ТА равно AUX (Та) — UX (ТА) — UX (0) =ид (Та) = = ГАйл(‘)Л = иА1„„^|-^Г. (28-5) а ° Ч | uRo I Наличие трехпозиционного переключателя приводит к появлению нелинейных свойств. Если зона нечувствительности переключателя достаточно велика, эти нелинейности не приводят к возникновению предельного цикла и обеспечивается устойчивое установившееся состояние [5.14, гл. 52]. Для изменения положения исполнительного устройства вычисленного алгоритмом управления устройство уп- равления приводом вырабатывает импульсы с амплитудами иво, 0 или —uRo и длительностями ТА (к), т. е. модулированные по дли- тельности импульсы с тремя значениями амплитуды (рис. 28.4). Это приводит к еще большей нелинейности. Наименьшая реализуемая длительность включения ТАо определяет единицу квантования Да = Тао/Т5, (28-6) соответствующую минимальному перемещению исполнительного устройства. Эту величину целесообразно выбирать равной единице квантования соответствующего преобразователя код/аналог, Да = Дцап> т. е. около 6—8 бит. Наименьшая длительность вклю- чения должна быть достаточной для того, чтобы привести в дей- ствие исполнительное устройство. Пусть в течение тактового про- межутка времени требуется изменить положение исполнительного устройства на величину Ди (k) = и (к)—u(k — l) = jAA, j = l, 2, 3, .... Тогда из уравнения (28-5) необходимая длительность включе- ния ТА (к) определяется следующим образом: ТА(к) = )ТАс = Т5-ЦЩ^ЦЦ. (28-7) uR0 и A max Эта величина может, например, поступать на устройство управ- ления приводом в виде числа j. Наибольшее перемещение за такт квантования То в соответствии с уравнением (28-5) равно АТТ' ___ТТ Тр uuAmax—'-'Атах 'г *3 Отсюда следует, что изменение положения исполнительного устройства за один такт квантования при шаге квантования ДА лежит в диапазоне 0<ДиХ<иАтахТ0/Тз- (28-8) В результате переходный процесс принимает вид, показанный на рис. 28.4.
480 Ч. VII. Цифровое управление с помощью ЭВМ Поскольку исполнительные устройства с постоянной скоростью делают контур управления нелинейным, в следующем разделе крат- ко рассмотрены методы получения их линеаризованных моделей. А) МЕТОД МАЛЫХ ПОСТОЯННЫХ ВРЕМЕНИ Кусочно-линейный характер реакции исполнительных устройств с трехпозиционным переключателем и устройством управления на ступенчатое воздействие может быть приближенно описан моделью первого порядка, включающей временные задержки и апериодичес- кое звено с амплитудно-зависимой постоянной времени Ta = TsAU-a/U„„. (28-9) Если эти постоянные времени пренебрежимо малы по сравнению с постоянными времени объекта управления, то линеаризованное ис- полнительное устройство представляет собой звено пропорциональ- ного типа без задержки. Методы упрощения математических моде- лей путем пренебрежения малыми постоянными времени исследова- ны в работах [3.4, 3.5]. При использовании непрерывных ПИД- регуляторов для управления объектами порядка п=2, 4, 6 или 8 с одинаковыми постоянными времени Т, малыми постоянными вре- мени Tsm можно пренебречь, если Tstn/Ts <0,015, 0,045, 0,083 или 0,13, (28-10) где Т2=пТ является 'суммой постоянных времени (разд. 3.7.3). При этом ошибка квадратичного критерия качества (4-1) для г = 0 не превышает 20%. Уравнения (28-9) и (28-10) определяют диапа- зон изменения положений исполнительного устройства, в котором он может быть линеаризован WUAfflM<Tsn,/Ts. (28-11) Б) МЕТОД ЭФФЕКТИВНЫХ ЗНАЧЕНИЙ Еще один способ линеаризации основан на оценивании малых постоянных времени исполнительного устройства, исходя из отно- шения эффективных значений реакций на пилообразный знакопере- менный и ступенчатый входные сигналы: где ТА — величина, определяющая периодичность пилообразной функции (см. [3.11]). Если допустимы ошибки порядка 5—20%, что соответствует х = 0,95—0,80, то для искомой максимальной частоты сошах должно выполняться условие TAwmax< 1,1—2,25. (28-13) В общем случае сошах = оц = л/Т() (гл. 27). Следовательно, ТА/Т0< 0,35—0,72 (28-14)
Гл. 28. Объединение алгоритмов управления и исполнительных устройств 481 или с учетом уравнения (28-7) МД/иАтах < (0,35-0,72) T0/Ts. (28-15) Это приводит к следующему эмпирическому правилу: Исполнительное устройство с постоянной скоростью может быть линеаризовано, если максимальная длительность включения Тд составляет примерно половину такта квантования Т0. Заметим, что для использования этого правила такт квантова- ния должен быть выбран таким образом, чтобы ютах = ю8. В работе [2.27] и табл. 29.2 рассматривается применение этих двух методов при управлении впускным вентилем паронагревателя и вен- тилем расхода пара теплообменника. Линеаризуемый диапазон по- ложений находится в пределах от 12 до 50%. Проведенное исследование касалось непосредственного прямого способа управления исполнительными устройствами. Однако для исполнительных устройств интегрирующего типа с постоянной ско- ростью также может быть использован метод управления с цифровой или непрерывной обратной связью, а также метод введения в алгоритм управления обратной связи по положению. Пропорциональные исполнительные устройства дискретного типа ( шаговые двигатели) Исполнительные устройства дискретного типа (группа IV), на- пример шаговые двигатели, очень удобны для стыковки с управляю- щими ЭВМ или цифровыми регуляторами. ЦАП на их входе не ну- жен, а их выход пропорционален количеству управляющих импуль- сов. Усилитель преобразует маломощные импульсы на выходе уп- равляющей ЭВМ в мощные импульсы, поочередно возбуждающие обмотки статора двигателя. Угол поворота за один шаг варьируется от 1 до 240 град. Чем меньше угол поворота за один шаг, тем большее число обмоток необходимо для этого и тем меньшую величину имеет момент вращения. Возможна отработка как одиночных импульсов, так и последовательности импульсов с частотой до нескольких ки- логерц. На низких частотах шаговый двигатель может быть оста- новлен в пределах одного шага. На больших частотах, где рассмат- риваемое исполнительное устройство представляет собой синхронный электродвигатель, такая остановка невозможна из-за наличия инер- ции. Если необходима точная отработка положения, как, например, в случае прямого управления исполнительным устройством, момент инерции регулируемого вентиля или другого устройства, а также частота перемещения шагового двигателя должны быть выбраны малыми. Повышение скорости отработки положения может быть достигнуто с помощью цифровой обратной связи [2.18].
482 Ч. VII. Цифровое управление с помощью ЭВМ Исключение накопления ошибки Хорошо известно, что регуляторы интегрирующего типа продол- жают интегрировать ошибку управления и после того, как один из сигналов в контуре достигает своего предельного значения (обус- ловленного, например, механическим ограничением на перемещение привода). Поэтому при смене знака ошибки управления требуется достаточно длительный промежуток времени, чтобы восстановить состояние интегратора, соответствующее моменту возникновения насыщения. Во избежание этого явления возможны следующие ме- ры. При достижении исполнительным устройством ограничений Ча max или UA min в алгоритме управления следует использовать эти истинные значения выхода, а не вычисленные значения и (к—1), и (к—2)... . Это может быть достигнуто с помощью концевого вык- лючателя, обратной связи по положению или при наличии одноз- начной связи между выходами вычислителя и исполнительного устройства с помощью специальной программы вычисления по- ложения. Другой возможностью является введение обратной связи по реальному положению исполнительного устройства в алгоритме управления в соответствии с уравнением (28-1).
ГЛАВА 29 Автоматизированные методы проектирования алгоритмов управления Обычно непрерывные регуляторы и цифровые алгоритмы управ- ления ПИД-типа рассчитываются и настраиваются с помощью мето- да проб и ошибок, основанного на эмпирических правилах, а иногда и с помощью моделирования. Для объектов управления с большим временем установления переходных процессов или для многомер- ных объектов с сильными перекрестными связями эта процедура требует довольно много времени и не обеспечивает наилучшего качества управления. Более высокое качество управления с мень- шими временными затратами может быть достигнуто с помощью автоматизированных методов расчета цифровых систем управле- ния. На основе рассмотренных в этой книге методов проектирования алгоритмов управления с обратными и прямыми связями могут быть разработаны программы, позволяющие проектировать алгоритмы управления в диалоговом режиме. Необходимым предварительным условием является, конечно, знание соответствующих математи- ческих моделей объектов управления и, возможно, моделей сигна- лов. Разработка моделей может осуществляться как теоретическими методами, так и с помощью процедуры идентификации, описанной в разд. 3.7.4. Теоретические методы построения модели должны ис- пользоваться, если объект не доступен для исследования, напри- мер находится в стадии разработки. Однако существует ряд естест- венных факторов, ограничивающих точность теоретической модели. К ним относятся ограниченная точность получаемых данных и па- раметров объекта, упрощающие допущения, используемые при выво- де уравнений модели, а также неточности задания моделей приво- да, регулирующих элементов и датчиков. В частности, для многих промышленных объектов (химической, энергетической и тяжелой промышленности) физические или химические законы либо неиз- вестны, либо не могут быть выражены с помощью разумного числа математических уравнений. Поэтому, измеряя динамические ха- рактеристики существующего объекта, т. е. используя методы иден- тификации, можно построить модель значительно быстрее и с боль- шей степенью точности. Это может быть выполнено вне связи с объектом на автономной ЭВМ либо, если вычислитель уже состы- кован с объектом управления, в режиме нормальной эксплуатации. Поскольку для расчета алгоритмов управления более всего удобны параметрические модели объектов управления, применимы методы
484 У. VII. Цифровое управление с помощью ЭВМ идентификации, описанные в гл. 23. В работах 13.13], [29.1]—[29.4], [23.16] описаны пакеты программ для идентификации объектов уп- равления, включающие генерацию возмущающих сигналов, фильт- рацию сигналов объекта управления, различные методы оценивания параметров, определение порядка модели и проверку ее достовер- ности. Автоматизированное проектирование алгоритмов управле- ния с использованием полученных моделей может быть организовано в следующей последовательности при условии, что ЭВМ подключена к объекту управления в режиме on-line. 1. Выбор структуры системы управления — одноконтурная, каскадного типа, многоконтурная; — с прямой передачей сигнала; 2. Ввод информации о моделях объекта управления и сигналов в программу расчета регулятора. 3. Расчет различных алгоритмов управления. 4. Моделирование системы управления. 5. Модификация алгоритмов управления и их окончательный выбор. 6. Реализация алгоритмов управления на ЭВМ. 7. Задание реальных условий функционирования — ограничения на управляющие переменные; — задающие переменные. 8. Проверка работы системы и анализ качества управления. При использовании для автоматизированного проектирования ЭВМ в режиме off-line реализуются пункты 1—5. Такой подход к решению задачи синтеза имеет ряд преимуществ: 9 Расчет автоматизируется; его результатом является цифровой закон управления. 9 Моделирование системы управления с различной структурой и алгоритмами управления не нарушает нормальной работы объ- екта. Модификация алгоритма осуществляется просто. @ Экономится оборудование и время запуска, особенно для объек- тов управления с большим временем установления, сложными динамическими характеристиками или значительным взаимовли- янием между координатами. 9 Улучшается качество управления за счет более точно настро- енных простых алгоритмов или за счет применения более слож- ных логических алгоритмов управления. 9 Можно определить зависимость параметров регулятора от рабо- чей точки. Это обеспечивает быстроту расчета алгоритмов уп- равления о прямой связью. Непременным условием практической значимости описанной про-
Предметная область Задачи Алгоритмы Выполняемые функции Этап реализации регулятора Этап прямого цифрового управления Рис. 29.1. Структура пакета программ CADCA. Этап расчета регулятора 29. Автоматизация проектирования алгоритмов управления
486 Ч. VII. Цифровое управление с помощью ЭВМ цедуры проектирования является отсутствие изменений или незна- чительные изменения характеристик объекта управления за время между проведением идентификации объекта и применением резуль- татов проектирования для управления. Для объектов управления с медленно меняющимися характеристиками могут быть использо- ваны самонастраивающиеся или адаптивные алгоритмы управления (гл. 25). Так, например, на рис. 29.1 показана структура пакета прог- рамм CADCA-SISO (computer aided design of control algorithm for 0 20 40 t,c _____I____L_ 0 20 40 t,G fl L____i___I______ _____I---1--- 0 20 40 0 20 40 t,c t,c PC-регулятор ЗПР- 2 состояния с наблю- ПИД-регулятор дением с заданным q0 О 20 40 1,с АР (Я) Апериодический регулятор и-------------- ____I____1_______ О 20 40 t,c АР(М) Апериодический ре- гулятор повышен- ного порядка Рис. 29.2. Переходные процессы в замкнутом контуре с непрерывным объектом и алгоритмами управления, полученными с помощью пакета CADCA. Передаточная функция объекта Gp (s)= l,2/(H-4,2s)(l-J-s)(l+0,9s), T0=2c. a — входной и выходной сигналы объекта при идентификации с подключением ЭВМ в режи- ме on-line', б — входной и выходной сигналы объекта для четырех различных алгоритмов управления при ступенчатом изменении задающей переменной.
Гл. 29. Автоматизация проектирования алгоритмов управления 487 single input/single output processes), предназначенного для авто- матизированного проектирования алгоритмов управления для объектов с одним входом и одним выходом [29.5]—[29.7]. Развитие этого пакета показало, что иерархическая, модульная и наглядная структура программ с простыми и понятными средствами общения с пользователем имеет много преимуществ. На рис. 29.1 выделены четыре иерархических уровня и три этапа проектирования. На рис. 29.2 представлены результаты аналогового моделирования системы управления объектом третьего порядка, включающие процесс иден- тификации, с помощью пакета программ OLID-SISO [29.4]. Показа- тели качества управления хорошо согласуются с теоретическими ре- зультатами. Этот же пакет программ был использован для расчетов в разд. 11.4.
ГЛАВА 30 Практическое применение идентификации и цифрового управления В этой последней главе рассматривается применение различных методов идентификации и цифрового управления при разработке систем управления промышленными объектами. В предыдущих главах было показано, что суще- ствуют два способа совместного применения методов идентификации и расчета систем управления: ф Идентификация с последующим автоматизированным расчетом алгоритмов управления; ф Разработка самооптимизирующих адаптивных (самонастраивающихся) ал- горитмов управления. В первом случае идентификация модели объекта управления осуществляется один раз, после чего рассчитывается алгоритм управления с постоянными параметрами в режиме on-line или off-line (гл. 29). Во втором случае иденти- фикация модели объекта производится периодически и после очередного полу- чения оценок модели объекта в режиме on-line определяются параметры алго- ритма управления (гл. 25). В разд. 30.1 и 30.2 демонстрируется применение первого метода при расчете систем управления теплообменника и барабанной сушилки, а в разд. 30.3 приводятся результаты использования обоих методов для расчета и моделирования системы управления парогенератором. 30.1. ЦИФРОВОЕ УПРАВЛЕНИЕ ТЕПЛООБМЕННИКОМ На рис. 30.1.1 представлена схема теплообменника с паронагре- вателем, который состоит из 14 труб с внутренним диаметром d,= = 25 мм и длиной 1=2,5 м. Входом объекта является положение вен- Теплая Рис. 30.1.1. Схема теплообменника с паронагревателем. Вход: положение U пнев- матического вентиля, регулирующего подачу пара. Выход: температура воды Y. Mw=3100 кг/ч. Md=30 кг/ч. Pdl=2,5 бар.
Гл. 30. Применение идентификации и цифрового управления 489 тиля U, регулирующего с помощью пневматики подачу пара, а вы- ходом У — температура воды, измеряемая с помощью термопары. Для идентификации в режиме on-line была использована управля- ющая ЭВМ типа НР2100А. Вид псевдослучайного двоичного сиг- нала (ПСДС) на входе и соответствующий выходной сигнал показа- ны на рис. 30.1.2. С помощью рекуррентных методов корреляции и и 117 210 303 396 489 1,с Рис. 30.1.2. Входной и выходной сигналы объекта управления при идентификации в режиме on-line. ПСДС: период N=31. Период синхронизации %—1. Такт кван- тования То=3 с. наименьших квадратов РКОР-МНК за время идентификации около 10 мин была получена следующая модель объекта управления: С (7\ y(z) —0,0274г-1 —0,0692z-2 —0,0218z-3 “u (z) ~ 1 —l,2329z-1 + 0,0478z-2 —0,01276z-3 Z ‘ Такт квантования полагался равным Т0=3 с. Поскольку время уста- новления переходного процесса объекта Т95=60 с, то отношение Т95/Т0—20. С помощью программы оценивания порядка модели было найдено, что m=3, a d=l. Более детально вопрос рассмотрен в работах [29.1], [29.2]. На рис. 30.1.3а, 30.1.36 для различных алгоритмов управления, полученных с помощью пакета программ CADCA-SISO, показаны переходные процессы при ступенчатом изменении задающей пере- менной. Из-за нелинейности характеристик вентиля, регулирую- щего подачу пара, и теплообменника вид переходного процесса за- висит от знака ступеньки. Тем не менее результаты моделирования достаточно хорошо (в среднем) согласуются с реальным поведением объекта. Различные алгоритмы управления демонстрируют типовые переходные процессы, рассмотренные в гл. 11.
. i... WO t,c i,C 100 t,c О WO 200 #~Ь_______I______L_ 0 100 200 t,c Регулятор состояния с наблюдателем Регулятор с оптимизируемыми параметрами ЗПР-З (ПИД) Рис. 30.1.3а. Переходные процессы для различных алгоритмов управления, син- тезированных с помощью пакета программ CADCA-SISO на основе идентифика- ции модели объекта. Вариации задающей переменной имеют разные знаки. ----- результат измерения реакции объекта управления; . результат моделирования (в процессе этапа расчета). PC к, кг к, к4 к5 Г — 3,9622 -3,4217 — 2,7874 0,4472 1,3372 0,04 ЗПР-З Чо 41 q» 4з q« 4s Ро Pi Ра Рз Рз Рз —1,7125 2,3578 -0, 7781 — — — 1,0 —1,0 — — - - 0,01 . VII. Цифровое управление с помощью ЭВМ
Апериодический регулятор AP(i>) Апериодический регулятор повышен- ного порядка АР(Р+1) Гл. 30. Применение идентификации и цифрового управления Рис. 30.1.36. Переходные процессы для различных алгоритмов управления, синтезированных с помощью пакета программ CADCA-SISO на основе идентификации модели объекта. Вариации задающей переменной имеют разные знаки. --------------результат измерения реакции объекта управления;.результат моделирования (в процессе этапа расчета). Чо 41 Чо Ч» Ч« 4s Ро Pi Рг Рз Р4 Ps АР (V) —8,4448 10,4119 —4,0384 1,0775 0,0000 — 1,0000 0,0000 —0,2317 —0,5 841 —0,1842 — AP(v+I) —3,8612 0,1770 3, 8048 —1,6993 0,5848 0, 0000 1,0000 0,0000 —0, 1059 —0,3928 —0,4013 —0,1000
492 Ч. VII. Цифровое управление с помощью ЭВМ 30.2. ЦИФРОВОЕ УПРАВЛЕНИЕ БАРАБАННОЙ СУШИЛКОЙ При производстве сахара свежая свекловичная стружка или пульпа является промежуточным продуктом и идет на корм скоту. Пульпа термически высушивается в барабанной сушилке. Нормаль- но высушенная пульпа должна содержать 10% влаги или 90% сухо- го вещества. При более высокой влажности происходит самонагре- вание массы во время хранения, а также разложение питательных веществ. Если влажность меньше 10%, то пересушенная пульпа становится хрупкой. Кроме того, ее производство становится менее экономичным из-за увеличения расхода топлива и снижения веса. Поэтому необходимо поддерживать процентное содержание сухого вещества с точностью ±1%. На рис. 30.2.1 приведена схема барабанной сушилки. Нагрев сушильной печи осуществляется за счет сжигания мазута (жидко- го топлива). Нагретые газы из парового котла смешиваются с про- дуктами сгорания для охлаждения деталей сушильной печи. Вы- тяжной вентилятор прогоняет эту смесь через барабанную сушилку. Сырая пульпа (отжатая пульпа с содержанием влаги 75—85%) по- дается в барабан шнековым транспортером с регулируемой ско- ростью вращения шнека. Внутри барабана закреплены крестообраз- ные выступы для более равномерного распределения пульпы по ба- рабану. В конце барабана другой шнековой транспортер достав- ляет высушенную пульпу на элеватор. Теплопередача осуществля- ется главным образом конвекционным способом. В процессе сушки можно выделить три стадии. Вначале происходит испарение воды с поверхности пульпы, затем зона испарения смещается во внутрен- ние области свекловичных стружек и, наконец, на третьей стадии давление паров внутри свекличных стружек становится меньше дав- ления насыщенного пара из-за гигроскопических свойств пуль- пы. Управление процессом сушки весьма сложно из-за его немини- мально-фазовых свойств с временами запаздывания в несколько минут, длительного времени установления (около 1 часа), большого диапазона колебаний влажности сырой пульпы и неизмеримых из- менений свойств самой пульпы. По этой причине барабанные су- шилки управляются главным образом вручную с использованием непрерывных регуляторов температуры на некоторых участках про- цесса. Однако качество управления при этом неудовлетворительно, так как величина допуска превышает ±2,5% (рис. 30.2.2, а). На рис. 30.2.2 представлена блок-схема установки. Основным регули- руемым показателем является содержание сухого вещества в вы- сушенной пульпе. В качестве добавочных регулируемых парамет- ров могут быть использованы температуры газа на выходе сушиль- ной печи, в середине барабана и на выходе из сушилки. Основной управляющей переменной является расход мазута. Как дополни- тельная управляющая переменная может быть использована ско-
Вспомогательная вентиля- ционная труба Газы Скорость вращения OJ,U™ шнекового кость Барабан Высушен ная пульпа Измерение положения ленточного транспортера Расход жид- кого топлива MF Температура шранспор- пРсссо^ газов на вы шера ванной ходе сушиль- п пульпы ной печи Wps Температура газов в середине барабана Температура газов на выходе барабана Содержание сухого вещества Vts Рис. 30.2.1. Схема барабанной сушилки (Зюддойче Цукер АГ): диаметр барабана Dd=4,6 м; длина бара- бана Ld= 21,0 м; скорость подачи сырой пульпы Mps max = 80 т/ч; расход нагретого газа Mrg max= =80 000м3/ч; расход топлива Mf max =4,8 т/ч; температуры 1050°С; 0м=140—210°С; 0^=110—155°С, Г л, 30. Применение идентификации и цифрового управления
494 Ч. VII. Цифровое управление с помощью ЭВМ рость вращения шнека транспортера, подающего сырую пульпу. Возмущающим воздействием является содержание воды в прессо- ванной пульпе. Задача состоит в улучшении качества управления за счет при- менения управляющей ЭВМ. Из-за сложности динамических харак- теристик объекта управления и большого времени установления Рис. 30.2.2. Блок-схема модели барабанной сушилки. предпочтение было отдано автоматизированным методам расчета системы управления. Поскольку физические законы, описывающие процессы передачи тепла и массы, а также движения пульпы иссле- дованы недостаточно, необходимая математическая модель установки не может быть получена теоретическим путем. Предпочтительнее осу- ществить идентификацию объекта управления. Из-за наличия боль- ших возмущений по измерению реакции объекта на ступенчатое воз- действие трудно получить информацию о его динамических харак- теристиках. Поэтому при оценивании параметров объекта в качест- ве входного сигнала был использован псевдослучайный двоичный сигнал (ПСДС) [30.1], [30.2]. Для обработки информации было раз- работано специальное цифровое устройство на базе микро-ЭВМ. Это устройство в тактовые моменты времени измеряет соответствую-
Гл. 30. Применение идентификации и цифрового управления 495 щие сигналы, преобразует в цифровую форму и запоминает на перфо- ленте. Вычисление параметров выполняется в режиме off-line с использованием метода РКОР-МНК, реализованного в пакете про- грамм OLID-SISO. Предварительные эксперименты по идентифика- ции позволили определить значения следующих параметров: такт квантования Т0 = 3 мин; вариация расхода топлива AMF = 0,25 т/ч; вариация скорости шнека Ап = 1 рад/мин. Время идентификации менялось от 112 до 335 То, что составляет 5,6—16,8 ч. На рис. 30.2.3 показан один из экспериментов по иден- тификации. Реакция на ступенчатое воздействие идентифицирован- ной модели представлена на рис. 30.2.4. Наименьшее время уста- новления соответствует температуре газа на выходе сушильной пе- чи, и оно значительно возрастает для температуры газа в середине барабана и на его выходе. Изменение процентного содержания су- хого вещества в высушенной пульпе при изменении расхода жидко- го топлива имеет запаздывание порядка 6 мин, обратный выброс в течение приблизительно 30 мин, время установления 2,5 ч и может быть описано с помощью фазового фильтра. Наличие указанных свойств объясняет причину возникновения задачи управления. При рассмотрении в качестве входного воздействия скорости вращения шнека запаздывание в изменении содержимого сухого вещества сос- тавляет порядка 18 мин. Оценки порядков моделей и времен запаз- дывания также указаны на рис. 30.2.4. На основе идентифицированных моделей объектов управления с помощью пакета программ CADCA были синтезированы различные системы управления [30.1], [30.2]. Управляющей переменной явля- ется расход жидкого топлива, а главной регулируемой переменной служит содержание сухого вещества. Введение обратной связи лишь по регулируемой переменной не в состоянии обеспечить нужное качество управления; введение же обратных связей по температу- рам газа и $А значительно его улучшает. На рис. 30.2.5 приведе- ны результаты моделирования двухкаскадной системы управления с тремя ПИД-регуляторами и системы с регулятором состояния и наблюдателем при ступенчатом изменении скорости шнекового транс- портера. Лучшее качество управления (с точки зрения степени демп- фирования и числа колебаний) обеспечивается с помощью регулято- ра состояния. Значительное улучшение качества управления может быть достигнуто с помощью алгоритма второго порядка GF1 с пря- мой связью (рис. 30.2.5, б). Этот алгоритм использует информацию о скорости вращения шнека п и управляет расходом топлива. По ряду практических соображений двухкаскадная система управле- ния была реализована на управляющей ЭВМ SIEMENS 310 К (прос- тота передачи на другие установки, наглядность для операторов, на- личие пакета генерации программ SIMAT С).
496 Ч. VI1. Цифровое управление с помощью ЭВМ J5 4,0 49 3,8 3,7 3,6 1140 ИЗО И20 1110 1100 210 200 190 180 . 130 °- 120 110 95...... эз~ \ '. : ' 91 - ’ ' 89 - • 87 - 85 ~ -----------1-------1------1_______!_______L 1 2 3 4 5 t,4 Рис. 30.2.3. Экспериментальные данные для идентификации объекта управления при изменениях расхода топлива. Блок-схема реализованной системы управления представлена на рис. 30.2.6. На ней указаны алгоритмы управления положением исполнительных устройств, а также следующие устройства управ- ления с прямой связью: Gf2 для случая, если можно измерять влаж-
Гл. 30. Применение идентификации и цифрового управления 497 /77 = / 40 • > 30 £20 10 d = i t,4 т~з т = 5 d = 2 а Рис. 30.2.4. Переходные процессы идентифицированной модели, п— 13 рад/мин. То=3 мин. а =- изменение расхода топлива ДМр=1 т/ч; б— изменение cxopocia шнеконого транспор- тера Дп=1 рад/мии. ность поступающей пульпы; Gfs, регулирующее скорость конвейера таким образом, чтобы общее количество поступающей в сушилку воды оставалось неизменным; регулятор дифференцирующего типа Gf? для уменьшения неминимально-фазовых свойств установки по
498 Ч VII Цифровое управление с помощью ЭВМ 1,0 - > °-6 "г 0,2 - Каскадное управление Управление по состоянию Каскадное управление Управление по состоянию Каскадное управление / Управление по состоянию 15 Ю 5 О -5 Каскадное управление Управление по состоянию Каскадное управление Каскадное управление Управление го состоянию Управление по состоянию Без системы управления Каскадное управление / \ Управление по состоянию Без системы управления 1 2 3 4 5 t,4 Рис 30 2 5 Переходные процессы в системе управ тения барабанной сушилкой при ступенчатом изменении скорости шнекового транспортера Дп=1 рад/мин. Измеряются содержание сухого вещества и температуры О'м и 'О'а Т0=3 мин а —без регулятора с прямой связью б—при наличии регулятора с прямой связью Gp; регулируемой переменной путем изменения качества пара, посту- пающего из парового котла таким образом, чтобы при изменении рас- хода топлива общий объем газа, проходящего через сушильную установку, оставался неизменным На рис 30 2 7, а показаны за- писи сигналов при ручном непрерывном управлении (первоначаль- ный вариант), а на рис 30 2 7, б — запись тех же сигналов при циф- ровом каскадном управлении при использовании регулятора Gfi с прямой связью Хотя скорость поступления пульпы MPS доста- точно постоянна, при ручном непрерывном управлении содержание
Рис 30 2 6 Блок схема каскадной системы управления, реализованной на управляющей ЭВМ, Гл 30 Применение идентификации и цифрового управ гения___________499
500 Ч VII Цифровое управление с помощью ЭВМ Рис 30 2 7 Осциллограммы переходных процессов в барабанной сушилке Обоз- начения приведены на рис. 30 2 1 Мм — скорость потока патоки. а — ручное управление б — цифровая каскадная система управления с регулятором Gpj
Гл 30 Применение идентификации и цифрового управления 501 сухого вещества колеблется в диапазоне ±2,5%. При использова- нии цифрового управления относительная ошибка регулирования снижается до ±1% при больших возмущениях по расходу массы пульпы, чем на рис 30 2 7, а При постоянном расходе пульпы эта ошибка не превышает ±0,5% Таким образом, применение цифро- вого управления значительно повышает качество управления Практический эксперимент показал, что реализация цифрового управления тремя барабанными сушилками с помощью одной управ- ляющей ЭВМ позволяет экономить до 2,5% жидкого топлива, что со- ставляет около 329 тонн в год [30 3] Рассмотренная барабанная сушилка является типичным приме- ром объекта управления со сложными внутренними взаимодействи- ями и длительным временем установления переходных процессов, для которого ручная настройка параметров регулятора не обеспе- чивает удовлетворительного качества управления. Идентификация объекта управления совместно с автоматизацией расчета различных систем управления приводит к более глубокому пониманию свойств объекта и позволяет моделировать и проводить сравнение различ- ных вариантов систем управления Однако в связи с тем, что су- шильная установка обычно работает при полной нагрузке, в адап- тивных алгоритмах управления необходимости не возникает, и тре- буемые показатели качества обеспечиваются обычными алгоритмами управления с фиксированными параметрами 30.3. ЦИФРОВОЕ УПРАВЛЕНИЕ ПАРОГЕНЕРАТОРОМ В качестве примера для изучения различных методов идентифи- кации и управления была использована модель парогенератора ба- рабанного типа с естественной циркуляцией продуктов сгорания жидкого топлива Рассматривалась задача регулирования давления и температуры пара Блок-схема этой части парогенератора была приведена на рис. 18.1 1 Передаточные функции отдельных блоков были получены с помощью математического моделирования нагре- вателя и испарителя реального парогенератора [18 51, [18.6] и при- ведены в приложении Они хорошо согласуются с результатами из- мерений сигналов реальной установки Нагреватель необходимо рассматривать как объект с распределенными параметрами После проведения линеаризации трансцендентная передаточная функция для малых сигналов может быть аппроксимирована рациональной передаточной функцией с малой задержкой времени. Ошибки, воз- никающие при этих упрощениях, пренебрежимо малы Объект уп- равления с двумя входами/двумя выходами моделировался на ана- логовом вычислителе, который был состыкован с управляющей ЭВМ типа НР21МХ Чтобы упростить сравнение, в рассматривае- мом примере шум объекта в модели не учитывался Поскольку паро- генератор обладает малым собственным шумом, влияние последнего на основные результаты данных исследований относительно мало.
502 Ч. VII. Цифровое управление с помощью ЭВМ Рис. 30.3.1. Идентификация модели с двумя входами/двумя выходами и автома- тизированный расчет алгоритмов управления. а — идентификация Вход и2: ПСДС, N=127. Вход и2: Псевдослучайный четырехуровневый сигнал (ПСЧС), полученный из ut. Метод: КОР-МНК (многомерный) — 5, 0. Ш 22— 1, d22— 1 » m21=5, d2l=0; ml2=l, d12=0. 6 — переходные процессы при ступенчатом изменении уставки температуры пара wt(k). Сис- тема управления с двумя основными регуляторами с обратными связями. Регулятор температуры пара: ПИД, г = 0. Регулятор давления пара: ПИ, г=0. в — переходные процессы при ступенчатом изменении уставки давления пара w2(k). Два основных регулятора (см. пункт б). г — переходные процессы при ступенчатом изменении расхода пара v(k). Два основных регу- лятора (см. пункт б). д — переходные процессы при ступенчатом изменении расхода пара v(k). Два основных регу- лятора (см. пункт б) и одни пропорциональный регулятор с прямой связью между расходом пара v и расходом топлива и2. Так как двумерный объект управления обладает сильной пере- крестной связью G5 от расхода топлива к нагревателю, алгоритмы управления должны быть рассчитаны с использованием методов рас- чета многомерных систем. В работе [30.4] исследованы три способа идентификации и цифрового управления: (1) Идентификация по двум входам/двум выходам и автоматизи- рованный расчет регуляторов с оптимизируемыми парамет- рами. (2) Раздельное адаптивное управление подсистемами с одним входом/одним выходом. (3) Адаптивное управление по двум входам/двум выходам.
Гл. 30. Применение идентификации и цифрового управления 503 д2,бар uh% ghK и,% «л «>,% y2tfap Рис. 30.3.1 (продолжение). В каждом из перечисленных случаев применялись пакеты про- грамм на Фортране, которые используют 6—16 К слов основной па- мяти и 25—60 К слов памяти на дисках.
504 Ч. VI1. Цифровое управление с помощью ЭВМ. 30.3.1. ИДЕНТИФИКАЦИЯ ПО ДВУМ ВХОДАМ/ДВУМ ВЫХОДАМ И АВТОМАТИЗИРОВАННЫЙ РАСЧЕТ РЕГУЛЯТОРОВ С ОПТИМИЗИРУЕМЫМИ ПАРАМЕТРАМИ (ПАКЕТЫ ПРОГРАММ OLID-MIMO, CADCA-MIMO, CADCA-SISO) а) Два основных регулятора с обратными связями 1 Двумерная система возбуждается одновременно с помощью ПСДС и псевдослучайного четырехуровневого сигнала (оба некоррелиро- ваны), представленных на рис. 30.3.1, а. Применение метода иден- тификации КОР-МНК позволяет получить дискретные передаточя ные функции двумерной модели приблизительно через 130 мин. Н’ основе этой модели путем численной оптимизации параметров были рассчитаны два основных регулятора с оптимизируемыми парамет- рами для температуры пара (ПИД) и давления пара (ПИ). Время расчета составило от 5 до 10 мин. На рис. 30.3.1, б и в показаны пере- ходные процессы при ступенчатых изменениях задающих перемен- ных Wj(k) и w2(k). Из-за чрезвычайно малой взаимосвязи между впрыском воды (их) и давлением пара (у2) регулирование темпера- туры пара оказывает очень малое влияние на процесс управления его давлением (рис. 30.3.1, б). Однако существование сильной связи между расходом топлива (и2) и температурой пара (yj приводит к преобладающему влиянию процесса управления давлением пара на управление температурой (рис. 30.3. 1, в). На рис. 30.3.1, г приве- дены переходные процессы на Возмущение по расходу пара v (к). При уменьшении расхода пара его температура начинает увеличи- ваться. Однако затем из-за снижения расхода топлива температура пара резко уменьшается. Этот обратный выброс оказывает основное влияние на управление температурой. Его компенсация является главной задачей при повышении качества управления температурой пара [18.5]. б) Регуляторы с прямой связью Дополнительное включение пропорционального регулятора с прямой связью u2 (k)~cv2 v(k) (связывающий расход пара с расхо- дом топлива) приводит к существенному улучшению качества регу- лирования давления и температуры пара (рис. 30.3.1, <?). Сравнение переходных процессов на рис. 30.3.1, гид показывает, что макси- мальная статическая ошибка регулирования давления пара сни- жается с 3,3 до 0,9 бар, а время установления переходного процесса уменьшается со 100 до 25 мин. Статическая ошибка регулирования температуры пара также снижается с +2,7 до —2,4 К, а время установления уменьшается с 50 до 10 мин. Этот пример демонстри- рует эффективность применения хорошо настроенного регулятора с прямой связью. Общее время расчета двух основных регуляторов в режиме on-line составляет около 230 мин. Из них 130 мин требуется для идентификации, 30 мин для выбора и расчета алгоритмов управ- ления и 70 мин для проведения двух тестовых испытаний.
Гл. 30. Применение идентификации и цифрового управления 505 30.3.2. РАЗДЕЛЬНОЕ АДАПТИВНОЕ УПРАВЛЕНИЕ ПОДСИСТЕМАМИ С ОДНИМ ВХОДОМ/ОДНИМ ВЫХОДОМ (ПАКЕТ ПРОГРАММ ADREG) В этом разделе будет показано, как алгоритмы управления с на- стройкой параметров для систем с одним входом/одним выходом могут быть использованы для самонастройки двух основных регу- ляторов двумерной системы управления. Адаптивное управление нагревателем начинается с идентификации разомкнутого контура, используя в качестве возбуждения ПСДС (рис. 30.3.2, а). Это де- лается для грубой оценки начальной модели объекта управления и исключения тем самым неопределенности в начальной стадии наст- ройки при включении адаптивного алгоритма управления РМНК/ /АР (2). Реакция системы на ступенчатые изменения двух установоч- ных значений показала хорошее качество управления. Затем пара- метры этого регулятора фиксируются (самонастройка прекращает- ся). На следующем этапе производится идентификация модели ис- парителя в течение 15 мин без замыкания контура управления с по- следующим применением адаптивного регулятора РМНК/РМДЗ (рис. 30.3.2, б). На рис. 30.3.2, в показаны переходные процессы на ступенчатое изменение величины w2 (к) при фиксированных пара- метрах обоих регуляторов, а на рис. 30.3, 2, г — на ступенчатое возмущение v (к). Как показывает сравнение с переходными процес- сами, представленными на рис. 30.3.1, в и г, показатели качества полученной системы управления близки к соответствующим пока- зателям системы, реализ ующей регуляторы с оптимизируемыми па- раметрами. Общее время, необходимое для расчета системы, состав- ляет около 130 мин. Одновременное применение двух адаптивных регуляторов не обеспечивает сходимости настройки, так как харак- теристики объекта управления по каналам каждого из одномерных регуляторов очень сильно изменяются во времени. 30.3.3. АДАПТИВНОЕ УПРАВЛЕНИЕ ПО ДВУМ ВХОДАМ/ /ДВУМ ВЫХОДАМ (ПАКЕТ ПРОГРАММ MACS) На рис. 30.3.3 представлены результаты, полученные с примене- нием многомерного адаптивного регулятора [25.33]. Регулятор представляет собой сочетание рекуррентного метода наименьших квадратов (для многомерной модели) с регулятором состояния, син- тезируемого по минимуму квадратичного критерия качества РМНК- КК1/РС. В соответствии с рис. 30.3.3, а вначале на оба входа объек- та управления подаются два различных ПСДС, чтобы с помощью идентификации разомкнутого контура получить начальное прибли- жение модели объекта для адаптивного регулятора, который вклю- чается в контур управления через 35 мин. Система сразу приходит в установившееся состояние без наличия статической ошибки. Ка- чество управления при ступенчатом изменении двух уставок, как показывают переходные процессы на рис. 30.3.3, г, очень хорошее.
506 Ч. VI1. Цифровое управление с помощью ЭВМ. Рис. 30.3.2. Раздельное адаптивное управление подсистемами двумерного объекта управления. а — кратковременная идентификация разомкнутого контура о помощью ПСДС и адаптивное управление температурой пара с использованием РМНК/АР2 (г' = 1). Давление пара не регу- лируется. 6 — кратковременная идентификация разомкнутого контура (с помощью произвольного трехуровневого сигнала) и адаптивное управление давлением пара с использованием РМНК/ /РМДЗ (г=0,0096). Температура пара регулируется с помощью АР2. в — переходные процессы при ступенчатом изменении уставки w2(k). Оба регулятора имеют постоянные параметры. г =» переходные процессы при ступенчатом изменении v(k) (расход пара). Оба регулятора имеют постоянные параметры.
Гл. 30. П рименение идентификации и цифрового управления 507 SC Идентифи- кация Адаптивное управление РМЖ-КК1/РС 10 [ чо 20 40L 60 80 t,MUH РМНК-КК1/РС t,MUH io । । । । । 1 । । Z 20 40 60 80 t,MUH 5 1 а 5 / Рис. 30.3.3. Двумерное адаптивное управление на основе рекуррентного метода наименьших квадратов и регулятора состояния (РМНК-КК1/РС). с=[стс], R=[0,o2 °] а — идентификация разомкнутого контур а с последующим адаптивным управлением. б — адаптивное управление при ступенчатых изменениях уставок «^(к) и w2(k) в моменты времени t=0 и t=32 мин. в — адаптивное управление при ступенчатом измеиеиии уставки w2(k) в момент t=0 после завершения настройки. г — адаптивное управление при ступенчатых изменениях уставок wl(k) и w2(k) в момент t«=0 после завершения настройки.
Б08 Ч. VII. Цифровое управление с помощью ЭВМ. Затраты времени составляют около 90 мин. При другом способе до- статочно задать ступенчатые изменения уставок при t^= 0 и одновре- менно запустить адаптивный алгоритм с ограничениями на управ- ляющие переменные в диапазоне —10%^и^+10%. Переходные процессы, представленные на рис. 30.3.3, б, показывают, что система управления стабилизирует выходные переменные всего через 20 мин. Реакция системы на ступенчатое изменение уставки в момент t=32 мин демонстрирует очень хорошее качество управления. На реализацию этого варианта требуется около 70 мин. На рис. 30. 3.3, в приведена реакция двумерной системы управления с подстрой- кой параметров на ступенчатое изменение уставки давления пара. Сравнение этих результатов с результатами, представленными на рис. 30.3.1, в (регуляторы с оптимизируемыми параметрами), по- казывает существенное улучшение качества регулирования, осо- бенно температуры пара. При этом статическая ошибка и время установления уменьшаются от 4,2 до 1,3 К и от 50 до 25 мин соот- ветственно, а регулирование давления происходит без перерегули^ рования. Этот пример показывает, что использование регулятора о обратными связями по полному вектору состояния обеспечивает значительно более высокое качество управления, чем введение двух основных регуляторов с оптимизируемыми парам°трами. Время, затрачиваемое на реализацию многомерного управления с подстрой- Таблица 30.3.1 Оценки требуемого времени реализации различных методов идентификации и управления с обратной связью Способы реализации Идентифика- ция, мин Расчет регу- лятора, мин Адаптация, мин Тесты, мин Общее время, мин уставки wt w2 Одномерный 1. Идентификация и авто- объект (на- матизированный рас- греватель) чет алгоритмов управ- ления 60 15 — 20 — 95 2. Адаптивное управле- ние 15 — 25 20 — 60 Двумерный 1. Идентификация и авто- матизированный рас- чет алгоритмов управ- ления 130 30 — 20 50 230 2. Раздельное адаптивное управление одномер- ными подсистемами 15 15 — 25 35 20 40 | 150 3. Двумерное адаптивное управление — — 30 15 35 80
Гл. 30. П рименение идентификации и цифрового управления 509 кой параметров, составляет около 80 мин, включая получение пере- ходных процессов на два отдельных ступенчатых изменения уста- вочных значений. Таким образом, многомерное адаптивное управ- ление обеспечивает лучшее качество управления с наименьшим вре- менем адаптации. Рассмотренные методы расчета и необходимые для их реализа- ции времена объединены в табл. 30.3.1. Приведенные данные будут также справедливы при воздействии на объект управления возмущений малой или средней интенсивно- сти. Для расчета системы управления требуется гораздо меньше вре- мени при использовании алгоритмов управления с подстройкой параметров. Оценка этих, а также других результатов исследований, приве- денных в этой главе, дана в разд. 30.4. Результаты, характерные для управления парогенератором, заключаются в следующем: Если управление температурой пара рассматривается как одно- мерный процесс, то правильно настроенные ПИД-регулятор и ре- гулятор состояния обеспечивают примерно одинаковое качество уп- равления. Однако с учетом сильных перекрестных связей управ- ление с обратными связями по состоянию дает значительно более хорошие результаты, чем применение двух основных ПИД- и П-ре- гуляторов с обратными связями. Регулятор с прямой связью рас- хода топлива от расхода пара значительно улучшает качество уп- равления. 30.4. ЗАКЛЮЧЕНИЕ Рассмотренные в данной главе исследования позволяют обсудить некоторые результаты, касающиеся применения различных методов идентификации и управления. Идентификация и автоматизированный расчет алгоритмов управ- ления Достоинства: • может быть рассчитан и оценен любой алгоритм управления; • могут быть рассчитаны и сравнены путем моделирования системы управления различной структуры; 9 могут быть использованы методы идентификации в режимах on- line или off-line; • создается общая модель разомкнутого контура управления. Недостатки: ® объект управления должен быть стационарным в течение интер- вала времени, когда происходит идентификация и расчет регу- лятора; • метод требует большего времени, чем применение адаптивных алгоритмов управления.
510 Ч. VII. Цифровое управление с помощью ЭВМ Таким образом, метод следует применять как основной при вы- боре структуры системы управления и расчета регуляторов с фик- сированными параметрами или адаптивных регуляторов с прямой связью, если характеристики объекта управления не зависят от времени. Алгоритмы управления с подстройкой параметров Достоинства: Ф требуют меньшего времени, чем идентификация с последующим автоматизированным расчетом; Ф могут быть использованы при медленных изменениях парамет- ров объектов управления. Недостатки: Ф алгоритмы управления должны удовлетворять условию иденти- фицируемости замкнутого контура; Ф алгоритмы идентификации и управления должны требовать ма- лого объема вычислений; Ф определяется модель замкнутого контура специального вида. Поэтому алгоритмы управления с подстройкой параметров сле- дует использовать при медленных изменениях параметров объекта управления и при ограничениях по времени на расчет системы уп- равления. Эти алгоритмы могут быть использованы для настройки алгоритмов с фиксированными параметрами или для создания адаптивного управления.
Приложение Тестовые объекты управления для моделирования В данной книге моделирования типовых динамических характе- ристик различных объектов при исследовании систем управления с различными алгоритмами управления, методами идентификации и оценивания параметров и адаптивными алгоритмами управления использовались так называемые тестовые объекты. Эти тестовые объекты, являющиеся моделями реальных объектов с различными конфигурациями нулей и полюсов, временами запаздывания, были выбраны по ряду соображений. Приведенные дискретные передаточ- ные функции G(z) были найдены на основе z-преобразований от не- прерывных передаточных функций G(s) с учетом фиксирующего элемента нулевого порядка. Особые случаи оговариваются отдель- но. Объект I: второй порядок, колебательные свойства 1 ' ' 1 4-a1z14-a2z-a ’ ах = —1,5; аг = 0,7; b2 = 1,0; Ь2 = 0,5; Т0 = 2с. Здесь нет соответствующей передаточной функции G (s). Этот тестовый объект предложен в [23.15]. Объект П: второй порядок, стика неминимально-фазовая характери- z- , . К (1 —Tis) Gn(s)-(i+TiS)(i+T2s) ; “ .......... К= 1; Т1 = 4с; Т2= Юс; Г, biz-14-b2z-2 .* W - -i+aiZ-i + aaZ-2 • ( I 1 i » t.J f_ 1 I L , — f, . . ° - '"a \w
512 И риложение Значения параметров Gn (z) для То=1, 4, 8, 16 с приведены в табл. 5.4.1. Объект III: третий порядок с запаздыванием, низкочастотная характеристика G Р9- K(l+T4s) I!I'? (i + T1S)(l + T3s)(l + T3s)e K=I; Т1=10с; Т2 = 7с; Tt = 4c; Т3 = Зс; Т4 = 2с; G = b1Z-i + bgz-2+b3z-3 d 111 ' 1 4-ajz-14-a2z-2 + a3z-3 -V- Значения параметров GHI(z) для T0=l, 4, 8, 16 с приведены в табл. 5.4.2. Объекты II—III предложены в [23.9], [3.13]. Объект IV: пятый порядок, низкочастотная характеристика. Мо- дель паронагревателя [18.5], [18.6] r z (1 + 13,81s)2 (1 +18,4s) Г К ] . Giv(s) =----------(T+W-----------Ш ’ с /71 — b1z-1+b2z-g4-b3z-3~(-b4Z-44-b5z-5 IV ' ' 1 ajz-1a2z—2Ц-a3z-3 + a5z_? To = 20 c: a4 =—3,562473; a2 = 5,076484; a3 = -3,616967; a4 = 1,288535; a5 =—0,183615; Tn = 40 c: a4 =—2,538242; a2= 2,577069; a, =—1,308245; a4 = 0,332064; a5 = —0,033714; b1 = —1,73-10-3; b2 = —1,831 -IO"3; b,= 2,143-10-3; b4 = — 5,95-10-*; b5= 4,9 IO-5. b1 = —9,725-Ю"3; b2 = —2,1679-10-2; b3= 2,18-10-3; b4= 3,28-10-*; b8 = — 3,6-IO"8.
Тестовые объекты управления для моделирования 513 Объект V: двумерный объект—испаритель и паронагреватель парогенератора (рис. 18.1.1, [18.5], [18.6]) Gu (s) = GIV(s); С (я\ — 1,771 [ К ] . (1 4-153,5s) (1+24s) (14-15s) [%]’ G °-96 Г баР 1 . 22 k ' 695s (14-15s) [ % J ’ P , ._____ 0,0605 Г бар ] Ul2'S)'__695r’ "%"J ’ To = 2O c: Gn(z)=Giv(z) (см. объект IV); с x 2,476.10-2z-i4-5,744-10-2z-24-7,859-10-3z-3 . <J8i(Z)— 1 —l,576z-14-0,7274z-2—0,1006-z-3 ’ c . . _ 0,01237г-1 4-'0,00798г-2 . U22 (z>— 1 —l,264z-14-0,264z-2 ’ 0,001741z-1 1—z-1 G12 (Z) Объект VI: третий порядок, низкочастотная характеристика Gvi (s) (i 4-T1s) (1 4. t2s) (1 4- T3s) ' K = l; T, = 10 c; T2 = 7,5c; T„=5c; To = 4 c. G — biz~* + b2z~2+ b3z~3 . VI 1 ' 1 4~aiz-14- a2z-24-a3z_3 ’ aj = — 1,7063; a2 = —0,9580; a., =—0,1767; b1== 0,0186; b2 = 0,0486; b3 = 0,0078. Для T„ = 2, 6, 8, 10, 12 c см. табл. 3.7.1. Объект VII: второй порядок, низкочастотная характеристика Gvii (s)-(I + TaS)(1 + T4S); K = l; Т2 = 7,5с; T3 = 5g. г: Ь1г-14- Ь2г-2 ----------1----------X- 0 10 , 20 к Т„ = 4с1 а1 = —1,036; а2 = 0,2636; Ьх = 0,1387; Ь8 = 0,0889.
514 Приложение Объект VIII: второй порядок, низкочастотная характеристика Gvni (s) = (i + t1S) (l-f-T2s) ; K=l; Tj=10c; T2 = 5c. n _ b1z_1 + b2z_2 °vm & ~ l + aiZ-i + a2Z-2 • To = 4 c: a! = —1,1197; a2 = 0,3012; Ьх = 0,1087; b2 = 0,0729. Значения коэффициентов GVII1 (z) для T0 = l, 2, 6,8, 12 с при- ведены в табл. 3.7.2. ДИФФЕРЕНЦИРОВАНИЕ ВЕКТОРОВ И МАТРИЦ Пусть вектор х является функцией параметров ах, а5, ..., ап и существуют частные производные этого вектора по каждому из параметров. Определим оператор частной производной как вектор д да Г д ~ да\ д 1_ дЧ Поскольку этот оператор является вектором-столбцом, он не может быть применен к вектору х = Будем применять его к вектору-строке хт. Результатом является матрица Г dx, дх2 0хр daj дах дх1 е • ♦ да дхг 0*2 дап дхр <5ап J
Тестовые объекты управления для моделирования 515 Применяя оператор — к да торов скалярному произведению двух век- Г Wf X = VTW = [Vf...Vp] . получим - dvf — w, 4- daf 1 dvi дап = Н-v2w2+.. +vpWp, д г Т 1 dvT dw1 — [v'w =— w4------------v — да 1 да да . дУр dai dwj дап dwp dat dwP дап Если элементы вектора v не зависят от параметров 3j и если w = a, то — [v а] = v. да L J Если, наоборот, элементы вектора w не зависят от параметров flj и v = a: д да [a1 w]== w. р При замене векторов v и w на матрицы V и W последние два равенства остаются справедливыми — [Va] =VT; da 1 J 2_ra W] = W. da L J Пусть A—квадратная матрица. Тогда имеют место следующие ра- венства; ^-[х'Ау] = Ау; дх А[х'Ау]=Ах; — [х Ах] = 2Ах (А—симметричная матрица), дх
516 Приложение ТАБЛИЦА Z-ПРЕОБРАЗОВАНИЙ Данная таблица содержит некоторые часто используемые временные функ- ции х (t), их преобразование Лапласа х (s) и z-преобразования х (z). Такт квантования равен То- Более полные таблицы могут быть найдены в [2.15], [2.19], [2.21], [2.13], [2.14]. X (t) x(s) x (z) 1 1 z s z— 1 t 1 Toz s2 (z-1)2 t2 2 s3 Tgz(z4-l) (z—I)3 e-at 1 L s-[-a i г—е”ьТ» Toze-aT-> te-at (s-4-а)2 (д _ e_aT|*)2 t2e-at 2 Toze-al° (z4-e-aT°) (s-j-a)3 (z_e-aT0)3 1 —e-at a (1 —e~al °) z s(s-|-a) (z — 1) (z—e~aT°) e-al—e-bt b — a z (e~aT°—e-bT°) (s + a) (s4-b) (z — e"aTo) (z—e-bT°) sin wjt (Oj z sin u>iT0 s2 + ®? za—2z cos coiTo4- 1 COS COjt s Z (Z—COS (Oi Ty) S2 + (0? za—2z cos <0iTu4-1 8"at Sin Ю! ze~aT° sin (0i To (sa)2-|~coi z2—2ze-aT° cos <oiT„ -j-e~2aT° e-al cos (Oji ь —d z2—ze “ aT ° cos £OiT0 (s 4- a)2 4- cof za—2ze~ 1T<> cos ohT04-e_2aT'
Список сокращений и обозначений a, Ь — параметры разностных уравнений объекта с, d — параметры разностных уравнений стохастических сигналов d — время запаздывания d=Tt/T0=l, 2, ... е — ошибка управления e=w—у (а также ew=w—у); или ошибка урав- нения при оценивании параметров; или число е—2,718281 . . . f—частота, f=l/Tp (Тр— период); или параметр g — импульсная реакция (весовая функция) h — параметр 1, j — целое или индекс или j2=—1 к — индекс дискретного времени k=t/To=O, 1, 2, ... I — целое или параметр m—порядок полиномов А( ), В( ), С( ), D( ) п — сигнал возмущения (шум) р — параметры разностного уравнения регулятора или целое число р ( ) — плотность распределения вероятности q — параметры разностного уравнения регулятора с — весовой коэффициент при управляющей переменной или целое число s — переменная преобразования Лапласа s=o+i(B или сигнал t — непрерывное время и — входной сигнал объекта, управляющая переменная u(k)=U(k)—Uoo V — иеизмеряемый виртуальный сигнал возмущения w — величина задающего сигнала, задающая переменная, вариация уста- новившегося состояния w(k)—W (к)—Woo х — переменная состояния у — выходной сигнал объекта, регулируемая переменная y(k)=Y(k)—Yoo z — переменная z-преобразования : z=eT°s a, b — параметры дифференциальных уравнений объекта A(z) — полином знаменателя дискретной передаточной функции модели объекта B(z) — полином числителя дискретной передаточной функции модели объекта C(z) — полином знаменателя дискретной передаточной функции модели шума D(z) — полином числителя дискретной передаточной функции модели шума G(z) — дискретная передаточная функция Н( ) — передаточная функция фиксирующего элемента I — критерий качества управления К — коэффициент передачи Ь — длина слова М — целое число N — целое число или дискретный момент времени (число тактов) Р( ) — полином знаменателя дискретной передаточной функции регулятора Q( ) — полином числителя дискретной передаточной функции регулятора R( ) — динамический показатель управления S — спектральная плотность мощности или критерий качества Т — постоянная времени Т95 — время достижения переменной 95% установившегося значения при ступенчатом входном сигнале То — такт квантования Т\ — время запаздывания U — вход объекта (абсолютное значение) V — функция потерь
518 Список сокращений и обозначений W — задающая переменная (абсолютное значение) Y — выходная переменная объекта (абсолютное значение) b — вектор управления с — вектор выхода к — вектор параметров регулятора состояния п — вектор шума (гХ 1) и — вектор входных переменных (рХ1) v — вектор шума (рХ 1) w — вектор задающей переменной (гХ 1) х — вектор состояния (mX 1) у — вектор выходных переменных (гХ 1) А — матрица системы (mX т) В — матрица управления (тХр) С — матрица выхода (гХт) D — матрица входа/выхода (гХ р) или диагональная матрица F — матрица шума или F=A—В К G — матрица передаточных функций I — единичная матрица К — матрица параметров регулятора состояния Q — весовая матрица при переменных состояния (mXm) R — весовая матрица при входных воздействиях (рХр) или матрица ре- гулятора Л(г) — полином знаменателя дискретной передаточной функции замкнутой системы <Sl(z) — полином числителя дискретной передаточной функции замкнутой системы 3 — информация J?( )— преобразование Лапласа J( )— z-преобразование §( ) — соответствие между G (s) и G (z) а — коэффициент р — коэффициент у — коэффициент или переменная состояния модели задающей переменной 6 — отклонение или ошибка е — коэффициент С — переменная состояния модели шума т] — переменная состояния модели шума или отношение шум/сигнал х — коэффициент перекрестной связи или стохастический показатель управления X — среднеквадратичное отклонение шума v(к) |i — порядок Р (z) v — порядок Q (z) или переменная состояния модели задающей переменной л= 3,14159... о — среднеквадратичное отклонение, о3 — дисперсия или вспомогательная переменная в преобразовании Лапласа т — временной сдвиг со — угловая частота ш=2л/Тр (Тр — период) А — отклонение или изменение или уровень квантования 0 — параметр П — произведение 2 — сумма Q — относительная угловая частота х = dx/dt х0 — точное значение х — оцениваемая или наблюдаемая переменная х, Ах_= х—х0 — ошибка оценки х — среднее значение Хоо — значение в установившемся состоянии
Список сокращений и обозначений 51 МАТЕМАТИЧЕСКИЕ СОКРАЩЕНИЯ } — математическое ожидание случайной переменной var[ ] — дисперсия cov[ ] — ковариационная функция dim — размерность 1г — след матрицы: сумма диагональных элементов adj — присоединенная матрица det — определитель ИНДЕКСЫ Р — объект Ри — объект с входом и Pv — объект с входом v К или С — регулятор с обратной связью, алгоритм управления с обратной связью S или С — регулятор с прямой связью, алгоритм управления с прямой связью О — точное значение 00 — установившееся состояние СОКРАЩЕННОЕ ОБОЗНАЧЕНИЕ РЕГУЛЯТОРОВ И АЛГОРИТМОВ УПРАВЛЕНИЯ АР — апериодический регулятор ЛРП — линейный регулятор с заданным расположением полюсов РМД — регулятор с минимальной дисперсией РПР — регулятор-предиктор PC — регулятор состояния (обычно с наблюдателем) 1ПР-] — параметрически оптимизируемый регулятор с i параметрами, j из которых подлежат оптимизации СОКРАЩЕННЫЕ ОБОЗНАЧЕНИЯ МЕТОДОВ ПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ КОР-МНК — корреляционный анализ с идентификацией параметров по методу наименьших квадратов МВП — метод вспомогательных переменных ММП — метод максимального правдоподобия МН К — метод наименьших квадратов MCA — метод стохастической аппроксимации Для рекуррентных алгоритмов к сокращенному обозначению основного ме- тода добавляется буква Р, т. е. РМВП, РММП, РМНК ДРУГИЕ СОКРАЩЕНИЯ АЦП — аналого-цифровой преобразователь ПСДС — псевдослучайный двоичный сигнал ЦАП —• цифро-аналоговый преобразователь ЦП — центральный процессор М... — многомерный.,,
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Алгоритм идентификации 72, 372 ----быстрый 372 ----нерекуррентный 356 ----рекуррентный 352, 356, 393 — корректирующий 23 — Ньютона-Рафсона 364 — оценки состояния 281 — позиционный 81 — скоростной 82 — управления 16, 393. См. также Регуляторы — усреднения рекуррентный 466, 470 ---- адаптивный 17 ---- параметрически оптимизируе- мый 16, 83, 195, 237 — — по состоянию 136, 238 ----с минимальной дисперсией 17 --------подстройкой параметров 510 — фильтрации 462, 466—469 ----по методу квадратного корня 472 Анализ корреляционный 72 — теоретический 71 — экспериментальный 71 Анализатор модальный 155 Вектор собственный 154 Вентилятор 425 Водородный показатель 426 Воздухонагреватель 425 Возмущения детерминированные 76 — случайные 415 — стохастические 76 Время установления 96 Выбор априорной информации 423 Вычет 63 Двигатель шаговый 481 Дискретизация 28, 62 Дисперсия сигнала 242 Дифференциатор 21 Затраты вычислительные 228, 40s — на синтез 229 --- управление 96, 217, 229, 249 Зона нечувствительности 453 Идентификация в замкнутом контуре 374, 384 — косвенная 376, 386 — объектов 71, 350 — параметров 351, 375, 384 — прямая 380,, 384, 386 — текущая 18, 352 --- в реальном времени 352 Интегратор 21 Интегрирование по методу прямоуголь- ников 64 — — — трапеций 65 Испаритель 310 Качество управления 96, ПО, 249, 328 — — показатели 216 Квантование информации 19 — коэффициентов 446, 451 — переменных 446 — по времени 20, 26 — — уровню 18, 23, 441 — промежуточных результатов 446, 451 Компенсация смещения 402 Котел паровой 310 Коэффициент весовой 85, 109, 258, 424 — значимости оценки 424 — интегрирования 87 — опережения 87 — передачи 87, 295
532 Предметный указатель — связи 313, 330 --- динамический 315 ---статический 316 Критерий Гурвица 46 — качества 76, 78 ---квадратичный 78, 85, 137, 272 — Рауса 46 — «смешанный» 101 Матрица весовая 137, 177 — ковариационная 243, 274, 277, 283 — коррекции 286 — наблюдаемости 58 — переходная 50 — управляемости 57 Метод Байеса 282 — вспомогательных переменных 72 — градиентный 86 — Ляпунова 451 — максимального правдоподобия 72, 272 — малых постоянных времени 480 — наименьших квадратов 72, 282 — оценивания ---константы 359 --- параметров 352 ---рекуррентный 352 — — установившегося значения 358 — поиска 86 — «проб и ошибок» 84 — прямоугольников 81 — стохастической аппроксимации 366 — трапеций 82 — усреднения 358 — эффективных значений 480 Моделирование 94, 267, 450 Модель вход-выход 389 — математическая 61 --- объекта управления 389 — непараметрическая 16 — параметрическая 16, 389 — построение 71 Модификация алгоритмов управления 91 МП-модель 354 Мультиплексирование 21 Наблюдаемость 57 Наблюдатель 16 — Льюинбергера 160 — состояния 159 ----пониженного порядка 173 — эквивалентный 160 Настройка алгоритмов управления 23, 350 ----прямой метод 349 — с обратной связью 349 ----прямой связью 349 НК-модель 354 Области устойчивости 329 Обработка информации в реальном масштабе времени 352 ---- пакетная 352 Объект, параметрически идентифици- руемый 376 — тестовый 94, 511 — управления 58 ---- математические модели 389 ----многомерный 17, 309 --------несимметричный 313 -------- симметричный 313, 328 ----с запаздыванием 51, 260 Ожидание математическое 241 Операции типа сложения 217 ---- умножения 217 Описание систем в пространстве со- стояний 47 ----канонические формы 52, 53 Оптимизация параметров 84, 331 Отклонение среднеквадратическое 96 Оценивание параметров 389 ----в замкнутом контуре 386 — переменных состояния 389 — сигналов 390 ---- рекуррентное 393 Ошибка управления 85, 227 Парогенератор 501 Перегреватель 310 Передаточная функция ---- дискретная 38 Переменная регулируемая 73
Предметный указатель 533 — состояния 47 — управляющая 73 Перерегулирование максимальное 96 Показатель качества 217 — управления динамический 231, 256, 263, 456 — pH 426 Полюса действительные 43 — комплексно-сопряженные 44 Понижение порядка модели 67 Правила настройки 76, 113, 331 Преобразование билинейное 45 — Лапласа 30 — Фурье 31 Преобразователь аналого-цифровой 19 — цифро-аналоговый 19, 444 Приборы измерительные 112 Принцип максимума Понтрягина 138 — оптимальности Веллмана 138, 279 — разделения 390 — стохастической эквивалентности 391, 393 — эквивалентности 277 Проектирование автоматизированное 18, 483 Пространство состояний 47 Процесс авторегрессионный 246 — марковский 243, 281 ---- векторный 244 ----первого порядка 243 — со скользящим средним 247 Процессор центральный (ЦП) 443 Развязка 335, 345 — по возмущающим сигналам 336 ----задающим сигналам 336 ----собственным движениям 336 Расход щелочи 426 Реализация минимальная 325, 433 Реализуемость 121 Регулятор адаптивный с прямой свя- зью 429 — апериодический 16, 125, 195, 210, 225 — вспомогательный 290 — — коэффициент передачи 295 — главный 313, 339 — дуальный 392 — интегрирующего типа 89 — компенсационный 120, 127, 210, 299 — матричный полиномиальный 340, 434 -------- апериодический 340 — модальный 152 — недуальный 392 — основной 291, 296 — перекрестный 327, 339 — пониженной чувствительности 391 — предиктор 184, 195, 212 -----модифицированный 184 — пропорционального типа 89 — пропорционально-дифференциаль- ного типа 89 — робастный 205 — с минимальной дисперсией 17, 252, 345, 394 -----подстройкой параметров 388 -----прямой связью 298, 504 ----- эталонной моделью 350 — самооптимизирующийся 350, 338 -----адаптивный 388 — состояния 16, 136, 185, 189, 210, 214, 225, 272, 344 -----многомерный 344—347, 434 — стохастически эквивалентный 391 — стохастический 408 Ряд Тейлора 364 Серворегулятор 73 Сигналы векторные случайные 242 — некоррелированные 242 — непрерывные 13 — нестационарные 241 — ортогональные 242 — случайные 241, 360 — спектр 112 — стационарные 241 -----в широком смысле 242 — стохастические 17, 240 — эргодические 241 Синтезатор модальный 155 Системы, параметрически оптимизиру емые 76
534 Предметный указатель — с астатизмом 40 ----задающим сигналом 73 ----запаздыванием 40 — следящие 73 — стабилизации 73 — статические 40 — структурно оптимизируемые 76 — терминальные 73 — уравнений, плохо обусловленные 371 Системы управления адаптивные 349 — каскадные 17, 289 — с одним входом и одним выходом 22 ----перекрестными связями 22 ----подстройкой параметров 18 ----прямой связью 17, 120, 289 — со многими входами и многими вы- ходами 22 — связные 289 Сокращение нулей и полюсов 122, 255, 262 Сравнение регуляторов 206 Структура Р-каноническая 311, 312, 322, 337 —V-каноническая 311, 312, 323, 339 Сушилка барабанная 492 Такт квантования 25, 33, 133, 179, 328 Теорема Котельникова 458 — разделения 164 , 276 — Шеннона 33, 112 Теория чувствительности 198 Теплообменник 425, 488 Транспонирование частот 459 Управление децентрализованное 14 — иерархическая структура 11 — каскадное 289 — программное 14 — централизованное 13 — цифровое 14 Управляемость 57, 144, 262 Уравнение разностное 40, 49 — Риккати 143, 179, 345 — характеристическое 144, 149, 211, 256 Усилитель пропорциональный 21 Условия идентифицируемости 376, 382 — минимальной реализации 433 — реализуемости 41 — сходимости 356 Устойчивость 45, 327, 403 — асимптотическая 45, 446 — критерии 46 — условия 403 Устройства исполнительные 18, 470 — — динамическиехарактеристики 471 --- дискретного типа 475, 481 ---интегрирующие 474, 477 -------с переменной скоростью 477 —---------постоянной скоростью 478 --- ------ регулируемой скоростью 473 --- пропорциональные 473, 476 Фиксатор 20, 33 Фильтр аналоговый 459 — Баттерворта 460 — Бесселя 460 — Винера 456 — высокочастотный 465 — Калмана 275, 281, 283 , 288 — низкочастотный 462 --- второго порядка 464 --- первого порядка 462 — полосовой 456 — специального типа 466 — цифровой 462 — Чебышева 460 Фильтрация аномальных выбросов 469 — возмущений 456 — шумов 23 Формат с фиксированной точкой 444 ---с плавающей точкой 444 Функция автоковариационная 241 — автокорреляционная 241 — взаимно ковариационная 242 — дискретная — корреляционная 242 — Кронекера 272, 282 — описывающая 451 — решетчатая 29 — чувствительности 200, 236
Предметный указатель 535 Цикл предельный 446, 448 ЦП (центральный процессор) 443 Шаг кван’гования 442 Шум белый 242, 275 — квантования 446, 447 Частота среза 459 граничная 459 нормированная 459 Чувствительность 199, 227 — критерия качества 203 — параметрическая 200 — переменных состояний 203 — собственных значений 203 Экстраполятор нулевого порядка 20, 38 z-преобразование 34 обратное 36 — — теорема 36 Элемент главный 311, 316 — связи 311, 316
ОГЛАВЛЕНИЕ Предисловие редактора перевода .» .................... ........ 5 Предисловие..................................................... 7 Глава 1. Введение............................................... И Иерархическая структура управления........................... П Часть I Объекты управления и управляющие ЭВМ Глава 2. Принципы управления с помощью ЭВМ....................... 19 Глава 3. Дискретные системы управления............................ 25 3.1. Дискретные сигналы.................................... 25 3.1.1. Дискретные по времени функции и разностные уравнения 25 3.1.2. Решетчатые функции.................................... 29 3.2. Применение преобразования Лапласа для анализа дискретных функций времени....................................... , 30 3.2.1. Преобразование Лапласа................................ 30 3.2.2. Теорема прерывания.................................... 31 3.2.3. Фиксирующий элемент................................... 33 3.3. z-преобразование..................................... 34 3.3.1. Введение в метод z-преобразования..................... 34 3.3.2. Теоремы z-преобразования.............................. 36 3.3.3. Обратное z-преобразование............................. 36 3.4. Дискретная передаточная функция....................... 37 3.4.1. Сумма свертки......................................... 37 3.4.2. Дискретная передаточная функция....................... 37 3.4.3. Свойства дискретной передаточной функции.............. 40 3.5. Полюса передаточной функции и анализ устойчивости ... 43 3.5.1. Расположение полюсов на плоскости z . ................ 43 3.5.2. Условие асимптотической устойчивости.................. 45 3.5.3. Билинейное преобразование и критерий устойчивости ... 45 3.6. Представление систем в пространстве состояний....... 47 3.7. Математические модели объектов управления............. 58 3.7.1. Основные типы технических объектов управления .... 59 3.7.2. Построение дискретных моделей на основе непрерывных моделей.................................................... 61 3.7,3. Упрощенное представление моделей объектов управления для дискретных сигналов................................. 66 3.7.4. Построение моделей и идентификация объектов ...... 70 Часть II Системы управления с детерминированными возмущениями Глава 4. Детерминированные системы управления..................... 73 Глава 5. Параметрически оптимизируемые регуляторы................. 81 5.1. Дискретное представление дифференциальных уравнений непрерывных ПИД-регуляторов................................ 81
Оглавление 537 5.2. Параметрически оптимизируемые дискретные алгоритмы уп- равления низкого порядка .................................. 83 5.2.1. Алгоритмы управления первого и второго порядков ... 86 5.2.2. Алгоритмы управления с заданным начальным значением уп- равляющей переменной......................................... 90 5.3. Модификации дискретных алгоритмов управления .... 91 5 4. Результаты моделирования.............................. 94 5.4.1. Тестовые объекты......................................... 94 5.4.2. Результаты моделирования алгоритмов управления второго порядка................................................ 96 5.5. Выбор такта квантования для параметрически оптимизируемых алгоритмов управления...................................... ИО 5.6. Правила настройки параметрически оптимизируемых ал- горитмов управления............................................ ИЗ Глава 6. Компенсационные регуляторы ................................ 120 Глава 7. Регуляторы для систем с конечным временем установления (апе- риодические регуляторы)........................................... 125 7.1. Обычный апериодический регулятор................. . 125 7.2. Апериодический регулятор повышенного порядка........ 129 7.3. Выбор такта квантования для апериодических регуляторов 133 Глава 8. Регуляторы состояния....................................... 136 8.1. Оптимальные регуляторы состояния по начальным условиям 136 8.2. Оптимальные регуляторы состояния для внешних возму- щений ....... ............................................ 146 8.3. Регуляторы состояния о заданным характеристическим урав- нением ............................................... 150 8.4. Модальные регуляторы состояния.................. 152 8.5. Регуляторы состояния с конечным временем установления 157 8.6. Наблюдатели состояния .................................. 159 8.7. Регуляторы состояния с наблюдателями .......... 162 8.7 1. Наблюдатель для начальных условий ...................... 163 8.7.2. Наблюдатель для внешних возмущений.............. 165 8.8. Наблюдатель состояния пониженного порядка....... 173 8.9. Выбор весовых матриц и такта квантования . ..... 177 8.9.1. Весовые матрицы для регуляторов состояния и наблюдателей 178 8.9.2. Выбор такта квантования............................... 179 Глава 9. Регуляторы для объектов с большим запаздыванием , . , . . 181 9.1. Модели объектов с запаздыванием......................... 181 9.2. Детерминированные регуляторы для объектов с запаздыванием 183 9.2.1. Объекты с большим запаздыванием и дополнительной дина- микой ........................................... .......... 183 9.2.2. Объекты с чистым запаздыванием.......................... 185 9.3. Сравнение качества процессов управления и чувствительности различных регуляторов для процессов с запаздыванием . . 190 Глава 10. Управление нестационарными объектами с помощью регулято- ров с постоянными параметрами.................................... 198 10.1. Чувствительность систем с обратной связью . ............ 199 10.2. Управление объектами с большими изменениями параметров 204 Глава 11. Сравнительный анализ регуляторов для детерминированных воз- мущений ....................................................... 206 11.1. Сравнение структур регуляторов: полюса и нули .... 206 11.1.1. Обобщенные линейные регуляторы с заданным расположе- нием полюсов................................................... 208 11.1.2. Параметрически оптимизируемые регуляторы низкого по- рядка . * .. . . . ........ 210
538 Оглавление 11.1.3. Обобщенный компенсационный регулятор............... 210 11.1.4. Апериодический регулятор........................... 210 11.1.5. Регулятор-предиктор................................ 212 11.1.6. Регулятор состояния................................ 213 11.2. Сравнение показателей качества..................... 216 11.3. Сравнение качества алгоритмов управления........... 218 11.4. Сравнение динамического показателя управления .... 231 11.5. Рекомендации по применению алгоритмов управления . . . 237 Часть III Системы управления со случайными возмущениями Глава 12. Стохастические системы управления...................... 240 12.1. Предварительные замечания.......................... 240 12.2. Математические модели случайных сигналов............ 241 12.2.1 Основные понятия.................................... 241 12.2.2. Марковские процессы . , ,.......................... 243 12.2.3. Скалярные стохастические разностные уравнения ..... 246 Глава 13. Параметрически оптимизируемые регуляторы при случайных возмущениях.......................................... 248 Глава 14. Регуляторы с минимальной дисперсией................... 252 14.1. Регуляторы с минимальной обобщенной дисперсией для объектов без запаздывания................................. 252 14.2. Регуляторы с минимальной обобщенной дисперсией для объек- тов с запаздыванием...................................... 260 14.3. Регуляторы с минимальной дисперсией без статического смещения ................................................ 263 14.3.1. Введение дополнительного интегрирующего члена .... 264 14.3.2. Минимизация ошибки регулирования ... ........ 265 14.4. Регуляторы с минимальной дисперсией для объектов типа чистого запаздывания..................................... 265 14.5. Результаты математического моделирования............ 267 Глава 15. Регуляторы состояния при случайных возмущениях ..... 272 15.1. Оптимальные регуляторы состояния в случае белого шума 272 15.2. Оптимальные регуляторы с оценкой состояния в случае белого шума.............................................. 275 15.3. Оптимальные регуляторы G оценкой состояния при случай- ных возмущениях.......................................... 277 15.4. Алгоритм оценки состояния (фильтр Калмана)......... 281 15.4.1. Взвешенное усреднение двух векторных величин .... 283 15.4.2. Рекуррентный алгоритм оценивания вектора состояния 285 Часть IV Связные системы управления Глава 16. Каскадные системы управления.......................... 290 Глава 17. Регуляторы с прямой связью............................. 298 17.1. Компенсационные регуляторы с прямой связью.......... 299 17.2. Параметрически оптимизируемые регуляторы с прямой связью.................................................. 302 17.2,1. Параметрически оптимизируемые регуляторы с прямой связью без заданного начального значения управляющей переменной 302
Оглавление 539 17.2.2. Параметрически оптимизируемые регуляторы с прямой связью с заданным начальным значением управляющей переменной................................................. 303 17.3. Регуляторы с прямой связью для переменных состояния 306 17.4. Регуляторы с прямой связью с минимальной дисперсией 306 Часть V Многомерные системы управления Глава 18. Структуры многомерных объектов............................ 309 18.1. Структурные свойства представления, объектов в виде передаточных функций.................................. 310 18.1.1. Канонические структуры.......................... 310 18.1.2. Характеристическое уравнение и коэффициент связи , . . 313 18.1.3. Влияние внешних сигналов........................ 317 18.1.4. Взаимодействие главных регуляторов.............. 318 18.1.5. Представление в матричной полиномиальной форме . . . 320 18.2. Структурные свойства представления в пространстве сос- тояний ................................................... 321 Глава 19. Параметрически оптимизируемые многомерные системы уп- равления .................................................. . 326 19.1. Параметрическая оптимизация главных регуляторов . . . 327 19.1.1. Области устойчивости.................................. 328 19.1.2. Оптимизация параметров и правила настройки двумерных регуляторов............................................. 331 19.2 Развязка с помощью перекрестных регуляторов....... 335 19.3. Параметрическая оптимизация главных и перекрестных регуляторов........................................... 339 Глава 20. Многомерные матричные полиномиальные системы управления 340 20.1. Обобщенный матричный полиномиальный регулятор . . 340 20.2. Матричный полиномиальный апериодический регулятор 340 20.3. Матричные полиномиальные регуляторы с минимальной дисперсией............................................ 342 Глава 21. Многомерные системы управления с регуляторами состояния 344 21.1. Многомерные регуляторы состояния с заданным расположе- нием полюсов............................................. 344 21.2. Многомерные регуляторы, основанные на решении матрич- ного уравнения Риккати................................... 345 21.3. Многомерные регуляторы состояния для развязки систем 345 21.4. Многомерные регуляторы состояния с минимальной диспер- сией .................................................... 345 Часть VI Адаптивные системы с идентификацией параметров объектов управления Глава 22. Адаптивные системы управления............................. 348 Глава 23. Методы текущей идентификации динамических объектов и мо- делей случайных сигналов........................................ 352 23.1. Модели объектов и случайных сигналов.................. 352 23.2. Рекуррентный метод наименьших квадратов (РМНК) . . . 354 23.2.1. Идентификация модели динамического объекта............ 354 23.2.2. Случайные сигналы................................... 360 23.3. Обобщенный рекуррентный метод наименьших квадратов (ОРМНК).................................................. 361
540 Оглавление 23.4. Рекуррентный метод вспомогательных переменных (РМВП)....................................................... 362 23.5. Рекуррентный метод максимального правдоподобия (РММП) 363 23.6. Метод стохастической аппроксимации (MCA).............. 367 23.7. Общая схема рекуррентных алгоритмов идентификации . . 367 23.8. Методы повышения численной устойчивости рекуррентных алгоритмов идентификации ................................ 371 Глава 24. Идентификация в замкнутом контуре . ..................... 374 24.1. Параметрическая идентификация в отсутствие возмущений 375 24.1.1. Косвенная идентификация объекта управления (случай А+В+Д)...................................................... 376 24.1.2. Прямая идентификация объекта управления (случай Б+Г+Д)........................................................ 380 24.2. Параметрическая идентификация при внешних возмущениях 384 24.3. Методы оценивания параметров в замкнутом контуре . . . 386 24.3.1. Косвенная идентификация параметров объекта в отсутствие возмущений................................................... 386 24.3.2. Прямая идентификация параметров объекта в отсутствие возмущений.................................................. 386 24.3.3. Прямая идентификация параметров объекта при наличии возмущений ... 387 Глава 25. Регуляторы с подстройкой параметров ................... 388 25.1. Введение............................................ 388 25.2. Алгоритмы управления ... ............................ 393 25.2.1. Алгоритмы управления с конечным временем установления 393 25.2.2. Регуляторы с минимальной дисперсией 394 25.2.3. Регуляторы g оптимизируемыми параметрами 396 25.2.4. Линейные регуляторы обеспечивающие заданное располо- жение полюсов ....... .............. 399 25.2.5. Регутятор состояния .. .............................. 399 25.3. Сочетание алгоритмов оценивания параметров и управле- ния (случай скалярных входа и выхода) . .................. 399 25 3.1. Стохастически эквивалентные регуляторы с подстройкой параметров.............................................. . 401 25.3.2. Стохастические регуляторы с подстройкой параметров , . 408 25.3.3. Детерминированный регулятор с подстройкой параметров 412 25.4. Экспериментальное сравнение различных регуляторов с подстройкой параметров . ....... ............. .. 412 25.5. Выбор априорной информации ...................... . 423 25.6. Практическая реализация адаптивного управления .... 424 25.6.1. Адаптивное управление воздухонагревателем . . «... 425 25.6.2. Адаптивное управление водородным показателем pH , . . 426 25.7. Адаптивное управление с прямой связью ........ 429 25.8. Многомерные регуляторы с подстройкой параметров ... 431 Часть VII Цифровое управление с помощью управляющих и микро-ЭВМ Глава 26. Эффекты квантования по уровню в цифровых системах управ- ления ...................................................... 441 26.1. Источники ошибок, связанных g квантованием по уровню 442 26.1.1. Аналоговый вход ................................. 442 26.1.2. Центральный процессор . ......................... 443 26,1.3. Аналоговый выход . . ........................... 444
Оглавление 26,2. Анализ различных эффектов квантования................ 44/ 26.2.1. Влияние квантования на переменные величины........... 447 26.2.2. Влияние квантования числовых коэффициентов........... 451 26.2.3 Влияние квантования результатов промежуточных вы- числений .......................„........................... 451 Глава 27. Фильтрация внешних возмущений ............ 456 27.1. Источники шумов в системах управления и их спектральные характеристики ............... .............. , 456 27.2. Аналоговые фильтры.................................. 459 27.3. Цифровые фильтры.................................... 462 27.3.1. Низкочастотные фильтры............................... 462 27.3.2. Высокочастотные фильтры.............................. 465 27.3.3. Фильтры специальных типов............................ 466 Глава 28. Объединение цифровых алгоритмов управления и исполни- тельных устройств................................................. 471 Глава 29. Автоматизированные методы проектирования алгоритмов уп- равления .................................................. 483 Глава 30. Практическое применение идентификации и цифрового управ- ления ....................................................... 488 30.1. Цифровое управление теплообменником.............. . 488 30.2. Цифровое управление барабанной сушилкой.............. 492 30.3. Цифровое управление парогенератором.................. 501 30.3.1. Идентификация по двум входам/двум выходам и автомати- зированный расчет регуляторов с оптимизируемыми пара- метрами (пакеты программ OLID-MIMO, CADCA-MIMO, CADCA-SISO)................................................. 504 30.3.2. Раздельное адаптивное управление подсистемами с одним входом / одним выходом (пакет программ ADR EG) . . . 505 30.3.3. Адаптивное управление по двум входам/двум выходам (пакет программ MACS)........................................ . , , 505 30.4. Заключение......................................... 509 Приложение. Тестовые объекты управления для моделирования.......... 511 Дифференцирование векторов и матриц............................... 514 Таблица z-преобразований . . . . ................................. 516 Список сокращений н обозначений.................................., 517 Литература . ..................................................... 520 Предметный указатель , „ , . .................................. , 531
УВАЖАЕМЫЙ ЧИТАТЕЛЬ! Ваши замечания о содержании книги, ее оформ- лении, качестве перевода и другие просим присылать по адресу: 129820, И-110, ГСП, 1-й Рижский пер., 2, издательство «Мир».
Рольф Изерман ЦИФРОВЫЕ СИСТЕМЫ УПРАВЛЕНИЯ Научный редактор Т. Н. Шестакова Мл. научный редактор Н. Н. Титова Художник В. Е. Карпов Художественный редактор В. И. Шаповалов Технический редактор Е. С. Потапеикова Корректор В И. Постнова ИБ № 3597 Сдано в набор 27.06.83. Подписано к печати 31.01.84 Фор- мат 60Х901/ц- Бумага типографская № 2. Гарнитура литера- турная Печать высокая Объем 17,00 бум. л Усл. печ л. 34,00 Усл. кр.-отт 34,00. Уч.-изд. л. 31,60. Изд № 20/2603. Тираж 10 500 экз. Заказ № 2067 Цена 2 р 50 к ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер., 2 Ордена Октябрьской Революции и ордена Трудового Красного Знамени Первая Образцовая типография имени А. А Жданова Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 1 13054,Москва,Валовая, 28