/
Text
ББК 32.81 К 60 УДК 681.51 Колесников А. А. Синергетическая теория управления. Таганрог: ТРТУ, М.: Энергоатомиздат, 1994. 344 с. ISBN 5—230—24678—2 Предложена новая синергетическая концепция в теории управления, опирающаяся на фундаментальное свойство само- организации природных диссипативных систем. Инварианты, самоорганизация, нелинейность, оптимизация и синтез явля- ются базовыми понятиями развиваемой в книге синергетиче- ской теории управления, определяющими ее сущность, новиз- ну и содержание. Разработан принципиально новый подход к синтезу многосвязных систем управления нелинейными мно- гомерными объектами, основанный на идее введения притяги- вающих инвариантных многообразий — аттракторов, на ко- торых наилучшим образом согласуются естественные свойства (энергетические, механические, тепловые т. д.) объекта и тре- бования задачи управления. В развитом синергетическом под- ходе синтезируются законы управления, учитывающие внут- ренние кооперативные взаимодействия конкретных физиче- ских (химических, биологических) явлений и процессов. Этот подход позволил осуществить прорыв в решении проблемы аналитического конструирования систем управления сложны- ми нелинейными динамическими объектами различной природы. Книга предназначена для широкого круга читателей раз- ных специальностей — от профессора до инженера, аспиранта и студента, интересующихся проблемами управления и само- организации динамических систем. Печатается по решению редакционно-издательского совета Таганрогского государственного радиотехнического университета Рецензенты: В. Б. Яковлев/д-р техн, наук; профессор, завед^йщий ка- федрой автоматики и процессов управление Санкт-Петербург- ского государственного электротехнического университета, заслуженный деятель науки - и техники JPO, действительный член Международной академий, технологической кибернетики; В. Г. Герасимов, д-р^техн. наук, профессор/ президент академии электротехнических наук. ч ,7 1402010000 К 6КО (Д=03~) — 94~объявлеиия ISBN № 5—230—24678—2 ББК 32.81 к » (^'Таганрогский государственный радиотехнический университет, 1994. (g)Колесников А. А., 1994.
К ЧИТАТЕЛЮ В современных физических и технических науках стали рассматриваться столь сложные системы, что они по своим свойствам и поведению напоминают природные системы. Отсюда возникает насущная потребность выявления и использования механизмов, действующих в природных системах и определяющих основы их функционирования, прогноза развития ноосферы (по В.И. Вернадскому) с гармоничным вхождением искусственных систем в естественную картину мира. Такое объединяющее направление современной науки о раз- витии сложных процессов разнообразной физической, химической и биологической при- роды изучается синергетикой—наукой о самоорганизации в нелинейных диссипативных системах. Синергетика—это интегральная наука, которая исследует процессы самоорганизации и охватывает все отрасли знаний о косной и живой природе, технике и экономике. Именно синергетика позволяет нам теперь говорить о зарождении общего метаязыка естественника, инженера и гуманитария, т.е. перейти к целостному пониманию природы, техники и общества на основе единой синергетической концепции. Эта концепция дает возможность создать новое отношение к процессу интегрального познания и самой науки, убрав разъединяющие барьеры между отдельными отраслями науки и техники, уйти от узкого профессионализма. Разумеется, что переход на целостную, синергетическую концепцию требует проведения новых научных и прикладных исследований, отражающих кооперативные, синергетические явления в соответ- ствующих предметных области^ знаний. К такого рода исследованиям и относится предлагаемая читателю книга, в которой впервые в теории управления развит принципиально новый синергетический подход к синтезу систем управления нелинейными динамическими объектами различной физиче- ской (химической, биологической) природы. Этот подход основывается на концепции введения инвариантных притягивающих многообразий—синергий, на которых естествен- ные свойства объекта наилучшим образом согласуются с требованиями соответствующей задачи управления. Автор книги—Колесников Анатолий Аркадьевич, заведующий кафедрой систем автомати- ческого управления Таганрогского государственного радиотехнического университета, доктор технических наук, профессор, Заслуженный деятель науки и техники РФ, член Академии электротехнических наук РФ и международной Академии энергоинформационных наук. Про- фессор А.А. Колесников является выдающимся специалистом в области прикладной теории управления. Наиболее значительный вклад им внесен в решение фундаментальной проблемы синтеза и разработки методов автоматизированного проектирования оптимальных и многокри- териальных систем управления нелинейными объектами, а также в развитие принципиально нового синергетического подхода к аналитическому конструированию нелинейных агрегиро- ванных систем высокой размерности, что впервые позволило осуществить крупный прорыв в решении сложных задач управления широким классом динамических объектов различной природы. Им опубликовано 11 монографий и учебных пособий, более 180 научных статей в области синтеза нелинейных систем управления, он сформировал известную научную школу по оптимальным и синергетическим системам, в которой подготовлено более 20 докторов и кандидатов наук. Прочтите новую книгу проф. А.А. Колесникова “Синергетическая теория управления”, она во многом оригинальна, нетрадиционна и вызывает повышенный интерес. Внимательного читателя ожадает интеллектуальное удовольствие от целостности и естественности нового взгляда на теорию систем и процессов управления. Монография предназначена для широкого 3
круга читателей—от ученого до инженера и старшекурсника, интересующихся теорией само- организации и управления динамическими объектами самой разной природы. Эта монография выходит в серии книг видных российских ученых Таганрогского государственного радиотех- нического университета. Профессор В.Г. Захаревич, ректор ТРТУ 4
Хорошо все то, что в согласии с природой. Сенека ПРЕДИСЛОВИЕ Теория управления получила в свое время значительный импульс в развитии, когда учеными и инженерами было осознано, что базовые принципы управления не зависят от конкретной природы объекта. Основные законы механики, электротехники, теплотехники, гидравлики, газовой динамики и химии, которыми описывается поведение подавляющего большинства современных подвижных и технологических объектов, могут быть представлены аналогичными и даже совпадающими закономерностями в виде системы дифференциальных и алгебраических уравнений. Более того, многие из этих законов могут переходить друг в друга в результате инвариантных математических преобразований. Для подтверждения этого важ- ного положения достаточно лишь напомнить, например, о постулате Максвелла, согласно которому уравнения движения сложной электромеханической системы составляются на основе глубокой аналогии между механическими движениями и процессами, протекающими в элект- рических цепях. Нетрудно указать подобную аналогию и в системах другой природы, что во многих случаях связано с единством законов сохранения. Именно свойство инвариантности математических преобразований при составлении урав- нений движения по существу и косвенно лежит в основе универсального подхода теории управления к различным по своей физической (химической, биологической и т.п.) природе задачам управления. Однако дальнейшая формализация этого подхода привела в настоящее время к непомерной математизации современной теории автоматического управления (СТАУ). С одной стороны, это позволяет опереться на фундаментальную математическую базу и привлечь к решению задач СТАУ мощные аналитические и численные методы с применением современных и перспективных ЭВМ. С другой же стороны, чрезмерная формализация, например линейной, ТАУ фактически превратила ее в одну из областей алгебры—теории матриц или, по меньшей мере, в область теории дифференциальных уравнений. Более того, даже базовые, присущие только ТАУ, понятия нередко формулируются в терминах соответствующей математической теории. Примерами являются понятия управляемости, наблюдаемости и др. Обратимся теперь к фундаментальному понятию “оптимальная система”. Само по себе введение термина “оптимальность”—это лишь попытка отразить оценочное, субъективноё свойство через некоторое количественное соотношение, т.е. попытка объективизировать, вы- разить количественно то качество, которое желательно придать синтезируемой системе. На наш взгляд, введение в СТАУ методов оптимального управления, как базовых и составляющих ее математическую основу, является лишь первым шагом к новому пониманию прикладных задач автоматического управления. Представляется достаточно очевидным, что следующим шагом должно быть введение в самую сущность прикладной ТАУ фундаментальных естествен- ных закономерностей, отражающих физическое (химическое, биологическое и т.п.) начало управляемого объекта, f И Это требование в полной мере согласуется с известным положением о том, что природа объекта определяет физическое и математическое содержание основной проблемы прикладной теории автоматического управ- ления—синтеза, т.е. аналитического конструирования оптимальных регуляторов (АКОР). Поставленная таким образом проблема СТАУ является принципиально новой и порождает крупные самостоятельные проблемы и задачи. При этом возникает труднейшая задача пере- хода от естественных принципов, учитывающих своеобразие объекта, к количественным, 5
формализованным соотношениям. Для этого представляется перспективным использовать принципы (законы) сохранения, справедливые, как известно, для всех форм существования материи и являющихся инвариантами в тех предметных областях, к которым относится данный, конкретный объект управления. Развитие основной проблемы СТАУ—синтеза оптимальных нелинейных систем—показа ло, что теория управления по многим признакам оказалась в плену редукционистских методов когда путем “склеивания” локальных описаний системы пытаются построить ее глобально! поведение. Хотя эти методы оказываются иногда успешными, например в линейном случае однако перспективный путь развития прикладной нелинейной теории управления, по-видимо му, лежит в русле холистических, глобальных подходов, отражаемых путем применение всеобъемлющих принципов сохранения в процедурах синтеза оптимальных систем. В этох смысле можно утверждать, что эпоха подлинного, естественно-физического (химического биологического и т.д.) оптимального управления еще только наступает. Это означает, что i основу “подлинно оптимального” управления целесообразно положить не только математиче ское содержание, получившее значительное развитие, но и физическое начало задач управле ния,' которое в настоящее время выдвигается на первый план. Остановимся на этом положении Математика, как известно, занимается общими формальными закономерностями, в то времз как физика в первую очередь интересуется качественными свойствами и особенностей кон кретных явлений. В то же время и в физике имеются такие обобщающие фундаментальньк понятия, как законы сохранения, присущие всем физическим процессам и выраженные i основополагающем вариационном принципе. Этот принцип формально отражается в матема тической теории оптимального управления через критерии качества. Другими словами, i основу “подлинной оптимизации” нелинейных систем целесообразно положить не толькс математические конструкции стандартной теории оптимального управления, а в большей мер< естественно-математические соотношения, отражающие, во-первых, фундаментальные физи- ческие закономерности в форме соответствующего вариационного принципа и, во-вторых технологические требования задачи управления в виде соответствующего критерия качества Такой подход возвращает ТАУ к естественным источникам ее возникновения, но на новом естественно-математическом витке ее развития. Именно введение в нелинейную теорию уп- равления элементов физической (химической, биологической) естественности позволит по- новому подойти к построению процедур синтеза систем управления нелинейными объектами Наиболее общим физическим свойством всех объектов различной природы, как известно, является свойство сохранения—энергии, количества движения и др., в биологии—это гоме- остазис. В этой связи в основу нового направления нелинейной теории АКОР целесообразно положить преднамеренное введение в пространство состояний синтезируемых нелинейных систем некоторых постоянных функциональных соотношений между координатами системы, т. е. таких инвариантных интегральных многообразий, на которых естественные свойства объекта наилучшим образом согласуются с соответствующими требованиями технологической задачи управления, которая отражает цель функционирования данного объекта. Разумеется, что при этом должны гарантироваться общесистемные свойства—асимптотическая устойчи- вость движения в области или в целом, грубость, минимально возможное время переходных процессов и др. Введение инвариантных многообразий в процедуру синтеза наделяет замкнутую систему общими глобальными свойствами и позволяет выявить родство разнородных явлений, проис- ходящих в объектах управления различной природы. Представление этих явлений на матема- тическом языке—совокупности частных (первых) интегралов дифференциальных уравнений синтезируемой оптимальной системы—отражает единство принципа сохранения в многообра- зии управляемых процессов. Этот новый естественно-математический подхо^ к решению нелинейной проблемы оптимизации систем—основной проблемы СТАУ—глубоко связан с идеями синергетики и теории нелинейных диссипативных систем. Между идеями синергетики и развиваемой в этой книге нелинейной теорией управления, основанной на идее введения желаемых инвариантных мнгообразий в процедуру синтеза.
систем, существует глубокая концептуальная связь. Поэтому кратко остановимся на основных положениях синергетики, важных с точки зрения проблем управления. В настоящее время формируется новая интегральная наука—синергетика, изучающая коллективные вопросы самоорганизации и охватывающая практически все современные отрасли знаний о косной и живой природе, технические и экономические науки. Эта обобщенная наука основана на нелинейной динамике и термодинамике необратимых процессов. Буквально на глазах, в тече- ние короткого времени синергетика—теория неравновесных процессов превращается во все- общую теорию развития, имеющую весьма широкие мировоззренческие последствия. Смысл и содержание этой новой интегральной науки состоит в том, что в открытых системах, обме- нивающихся с внешней средой энергией, веществом и информацией, возникают процессы самоорганизации, т.е. процессы рождения из физического (биологического, экономического, социального) хаоса некоторых устойчивых упорядоченных структур с новыми свойствами систем. Это общее определение справедливо для систем любой природы. Подчеркнем два фундаментальных свойства высокоэффективных синергетических систем любой природы— это, во-первых, обязательный обмен с внешней средой энергией, веществом и информацией и, во-вторых, непременное взГаимосодействие, т.е. когерентность поведения между компонента- ми системы. Об этих кардинальных свойствах синергетических систем всегда следует помнить как руководителю коллектива, так и специалисту в конкретной научной или технической области. К синергетике как к науке, изучающей поведение нелинейных систем вдали от положения равновесия при изменении некоторых управляющих параметров, наиболее близка по своей идеологии прикладная теория управления. В этой связи представляется весьма перспективным для развития современной теории управления осуществить попытку переноса описанных выше свойств синергетических систем на конструируемые системы управления нелинейными техническими объектами. Необходимо отметить, что именно синтез такого рода систем является фундаментальной проблемой современной науки об автоматическом управ- лении, которая отличается от синергетики тем, что не отыскивает возможные диссипативные структуры, а формирует, “навязывает” нужные нам структуры для решения различных задач управления соответствующими динамическими объектами. Разумеется, что при этом возника- ет непростая проблема перехода от естественных синергетических принципов к количествен- ным соотношениям. Такой подход позволяет создать новую теорию синтеза систем управления нелинейными динамическими объектами, имеющую глубокое естественно-научное обоснова- ние как приложение принципов сохранения в проблемах управления. В целом ряде работ отечественных и зарубежных ученых в последнее время было показано, что для естественных динамических систем свойственно наличие некоторых поверхностей притяжения—инвариантных многообразий в их пространстве состояний. Такие установивши- еся режимы получили название аттракторов, т.к. они “притягивают” соседние режимы. Ат- трактор—это притягивающее множество в пространстве состояний, т.е. асимптотически устой- чивое множество. Аттракторы, отличные от состояний равновесия и периодических колебаний, получили название “странных аттракторов”. Внутри таких аттракторов траектории блуждают нерегулярным образом и являются весьма чувствительными к изменению начальных условий. Из последних работ по исследованию аттракторов нелинейных динамических систем следует, что для многих природных систем характерен режим движения по некоторым многообразиям в их пространстве состояний. Так, в природных системах переменные, характеризующие их состояние, стремятся к таким значениям, которые соответствуют некоторым соотношениям (уравнейиям баланса), т.е. инвариантным многообразиям в их пространстве состояний. Суще- ствуют также аналогичные связи, накладываемые непосредственно не на переменные состоя- ния, а на скорость их изменения. В природных системах наличие инвариантных многообразий обусловлено необходимостью выполнения законов сохранения, например закона сохранения массы, а в технических системах существование задаваемых инвариантных многообразий должно обеспечиваться самой процедурой синтеза законов управления. Природные системы, в отличие от технических систем управления, обладают целым рядом весьма необычных, с точки зрения современной теории управления, свойств, например, для природных систем не
существует известного “проклятия размерности”, которое в настоящее время приводит к существенным, а в случаенелинейных технических систем и к принципиальным затруднениям в отношении обеспечения их асимптотической устойчивости и желаемого качества. Оказыва- ется также, что в природных системах качество их функционирования может даже повышаться при расширении разнообразия входящих в них подсистем (например, разброса их параметров) и, более того, указанное разнообразие, как правило, играет стабилизирующую роль. В то же время известно, что в сложных технических системах управления подобное свойство обычно ведет к ухудшению их качества. В связи с отмеченными замечательными свойствами природ- ных систем представляется весьма полезным и перспективным для развития современной теории управления осуществить попытку переноса этих свойств на конструируемые системы управления техническими и, в первую очередь, нелинейными объектами. Выше уже отмечалось, что для многих природных систем основная цель функционирова- ния состоит в стабилизации соотношений между их переменными состояния. Математиче- ским следствием этого факта является вырожденность их уравнений динамики и наличие интегральных инвариантов, т.е. некоторых инвариантных многообразий в их пространстве состояний. Именно это свойство положено в основу развиваемого'в этой книге синергетиче- ского подхода и разрабатываемых на его основе теории и методов синтеза нелинейных систем управления. Применение инвариантных многообразий для решения задач управления различ- ными динамическими объектами основывается на глубокой аналогии между процессами в естественных системах и в технических управляемых системах. Указанная аналогия следует из фундаментальных принципов сохранения в физике—закона сохранения энергии, закона со- хранения количества движения (импульса), закона сохранения момента количества движения, закона сохранения массы и т.д. Инвариантные многообразия, которые присущи синтезируе- мым системам, представляют собой некоторые функции, которые во время движения не изменяются в силу указанных законов сохранения. В механике,'например, величины, которые подчиняются соответствующим законам сохранения, называют интегралами движения, явля- ющимися некоторыми постоянными величинами. Любое механическое движение с необходи- мостью содержит в себе те или иные инвариантные величины. Изучение механического дви- жения возможно именно в той мере, в какой удается найти эти величины и сформулировать на их основе некоторые количественные законы движения. Развитие науки показывает фунда- ментальное значение принципов сохранения, действующих не только в области механического движения. Основополагающей идеей, присущей предмету и методу науки, является идея сохранения, или, иначе, принцип инвариантности. Этот принцип содержится в структуре любой теории, описывающей то или иное природное явление. Выявление инвариантных свойств исследуемых систем позволяет сформулировать специфические закономерности функциони- рования разнообразных систем. Необходимо подчеркнуть, что в отличие от классического подхода механики, когда инва- риантные многообразия отыскиваются, в развиваемых в данной работе теории и методах синтеза они задаются как желаемые и имеют непосредственный физический смысл, связанный с природой исходного нелинейного объекта и требованиями технологической задачи, для решения которой и синтезируется система управления объектом. Итак, в книге разрабатывается новый синергетический подход к синтезу систем управления нелинейными многомерными динамическими объектами различной природы, основанный на естественном гомеостазисе—сохранении внутренних желаемых свойств динамических систем. Предлагаемое в данной книге введение инвариантов (синергий) в прикладную теорию управ- ления, как ее базовых элементов, позволяет придать этой теории естественно-математическое единство и концептуально-методологическую целостность. Язык инвариантов здесь играет роль базового языка науки, определяющего системную сторону теории управления и устанав- ливающего непосредственную связь этой теории с фундаментальными принципами современ- ного естествознания—принципами отбора действительных движений из множества возможных на основе инвариантных соотношений, отражающих законы сохранения в соответствующей предметной области.
Теперь еще раз вернемся к понятию “естественность”, которое ассоциируется в первую очередь с природным началом. Управление—это всегда то или иное воздействие на соответст- вующий объект. В этой связи возникает проблема создания прикладной теории управления, в возможно большей мере учитывающей естественные свойства объекта, при этом сами управ- ления желательно сделать минимально возможными для достижения поставленной цели уп- равления. Отсюда следует, что синергетическая теория—это, в первую очечредь, теория несилового управления,- не противоречащего естественному движению объекта. В мировозз- ренческом плане развиваемая в данной книге синергетическая теория управления представляет собой попытку выявить и установить гармонию естества—“-гонии” (от греческого слова “рождение”) и искусства создания, конструирования (“-ургии” от греческого “деятельность”), т.е. с позиций единства природы и труда. Ясно, что здесь очень важно соблюсти пропорцию и согласованность указанных двух компонентов—природного и искусственно сотворенного—в самой структуре новой теории. Тогда излагаемую в книге науку можно назвать “киберго- нией”—от слова кибернетика—управление, отражающего искусственно сотворенный (“-ур- гийный”) компонент, и слова “-гония”—порожденное™ естеством, подчеркивающего непос- редственный учет природного начала управляемого объекта. Однако такое название, по-види- мому, непривычно с лингвистической точки зрения, хотя оно в полной мере определяет сущность излагаемого в данной книге нового синергетического подхода в прикладной теории управления. Предлагаемая вниманию читателей книга, посвященная феномену, достижениям и перс- пективам синергетического подхода в теории управления, по своему содержанию во многом нетрадиционна с точки зрения классической теории управления. Это обстоятельство связано хотя бы с тем, что в ней впервые в научной литературе последовательно излагается новый синергетический подход, базирующийся на языке инвариантов (синергий), который непривы- чен для стандартных методов теории автоматического управления. Введенный в книге язык инвариантов, как основной элемент теории управления, позволяет установить непосредствен- ную связь с законами сохранения, т.е. фундаментальными естественными свойствами управ- ляемых динамических объектов различной физической (химической, биологической) приро- ды. Инварианты^ самоорганизация, нелинейность, оптимизация, синтез—это базовые основополагающие понятия концептуального лексикона развиваемой синергетической теории управления, определяющие ее сущность, новизну и содержание. Наша цель будет полностью достигнута, если книга послужит распространению среди специалистов, инженеров и студентов новых естественно-математических идей в теории авто- матического управления. Это обстоятельство становится тем более важным в связи с чрезвы- чайной актуальностью современной проблемы целостного видения и понимания окружающего мира (природы, техники, человека и общества) как единого эволюционного процесса. Учиты- вая же существующую непомерно узкую специализацию многих современных, в- первую очередь технических, наук, необходимо поставить весьма актуальный вопросе единой научной основе для формирования такого целостного взгляда на мир. Оказалось так, что в последние годы в силу самой лдгики развития науки в ней начались и в настоящее время значительно ускорились интеграционные процессы, связанные с изучением кооперативных явлений в сис- темах существенно разной природы. В этой связи синергетика—наука о кооперативных про- цессах—стала претендовать на роль базовой и целостной парадигмы современного естество- знания. Принципиальное отличие синергетического подхода от классических методов науки, на которых основано существующее естественно-научное и, следовательно, инженерное обра- зование, состоит в выявлении фундаментальной роли свойства самоорганизации в нелинейных динамических системах. Синергетика, по-видимому, становится тем эволюционным естество- знанием, которое позволяет теперь уже говорить о возникновении своего рода метаязыка целостного понимания различных природных и технических явлений на основе единой науч- ной концепции. Эта концепция позволяет построить новое отношение к процессу интеграль- ного познания различных наук. Именно такая цель преследуется в данной книге применитель-
но к теории управления. В какой мере попытка автора в достижении указанной новой и чрезвычайно трудной цели оказалась успешной—об этом судить читателю книги. Развитый в книге новый синергетический подход позволил осуществить своего рода про- рыв в области синтеза и проектирования многомерных и взаимосвязанных систем управления широким классом сложных нелинейных динамических объектов различной физической при- роды. Этот подход нашел конкретное применение в основном для решения проблемы управ- ления нелинейными техническими объектами (роботами, подвижными аппаратами, техноло- гическими агрегатами и т.д.). которая охватывает, как известно, обширную область конструк- тивной деятельности человека. Однако также очевидно, что синергетический подход весьма полезен и для других не менее важных применений, например, в задачах управления в экологии, биотехнологии и др. В книге приведены многочисленные конкретные примеры применения развитого синергетического подхода в задачах синтеза систем управления различ- ными нелинейными техническими объектами. При изложении материала книги автор стремил- ся следовать заповедям великих ученых: И.Ньютону о том, что “при изучении наук примеры не менее поучительны, чем правила”, и Д.Максвеллу о том, что “научная правда должна представляться в различных формах и должна считаться равно научной, будет ли она представ- лена в ясной форме и живых красках физической иллюстрации или в простоте и бледности символического выражения”. В книге явное предпочтение автор отдавал геометрическим и физическим соображениям, полагая, что именно такой подход в наибольшей мере соответст- вует потребностям прикладной теории управления. Написание и подготовка предлагаемой книги были бы невозможны без помощи многих людей. Выражаю свою признательность профессору А.В. Непомнящему, всячески побуждав- шему меня к написанию книги, основанной на естественном подходе к процессам управления. Я благодарен своим коллегам и ученикам, принявшим участие в разработке синергетического подхода: Н.В. Балалаеву (п. 4.8), В.Е. Беляеву (п.п. 2.7, 3.6), О.Т. Вавилову (п.п. 3.8, 4.7), Г.Е. Веселову (п. 2.8), Алекс. А. Колесникову (п. 3.4), В.Х. Пшихопову (п. 4.6), Ю.Г. Сотни- кову (п. 4.2), вместе с которыми написаны соответствующие разделы книги. Огромную работу по компьютерному набору книги выполнили А.М. Гарбуз и Е.В. Солодовник, которых я также искренне благодарю. Разумеется, что издание книги в нынешнее трудное для науки время невозможно без финансовой поддержки. Эту поддержку оказал ректорат Таганрогского государственного ра- диотехнического университета, которому выражаю свою признательность. Пользуясь случаем, хочу поблагодарить Конкурсный центр России по фундаментальным исследованиям в области автоматики и телемеханики, вычислительной техники, информатики, кибернетики, метроло- гии и связи при Санкт-Петербургском государственном электротехническом университете за предоставление грантов в 1992-94 гг., в рамках которых был получен ряд важных результатов,, изложенных в данной работе. Книга предназначена для научных работников, аспирантов, инженеров и студентов-стар- шекурсников, специализирующихся в области теории систем управления динамическими объ- ектами различной физической (химической, биологической) природы. Буду признателен всем читателям, которые выскажут свои соображения по содержанию этой книги. Таганрог, август 1994 г. Автор 10
ГЛАВА! СИНЕРГЕТИЧЕСКИЙ ПОДХОД В ТЕОРИИ УПРАВЛЕНИЯ Мир кажется кучей* мусора, рассыпанного нау- дачу, цо за игрой стихийных сил и случайносХсй скры₽ае?ся прекраснейшая гармония. Г‘раклит Вместо устойчивости и гармонии мы видим по- всюду, куда ни обращаем свои взор, эволюцион- ные процессы, приводящие ко все большему раз- нообразию и все возрастающей сложности. Л. Пригожин 1.1. СИНЕРГЕТИКА И ПРОБЛЕМА УПРАВЛЕНИЯ О редукционистском и целостном подходах в теории управления. Современная научная картина мира опирается в основном на классический редукционистский подход, согласно которому окружающие нас природные явления состоят из мира вещей и мира законов. Такое представление означает, что свойства целого объясняются свойствами частного, т.е. характе- ристики целого полностью определяются некоторой суммой характеристик егаэлементарных составляющих. Редукционистская парадигма (исследовательская программа) естествознания, берущая свое начало еще от Платона, нашла яркое и успешное воплощение в научном методе Галилея, который был затем обоснован и принципиально развит Ньютоном. Современное общество обязано этой парадигме крупными успехами в области науки, технологии и промыш- ленности. Фундаментальными, основополагающими понятиями редукционистской картины мира являются материя и движение, согласно ей природа—это машина, состоящая, как и любой механизм, из отдельных частей со своими индивидуальными свойствами и описываемая раз и навсегда установленными законами математического естествознания. Однако до Галилея и Ньютона доминировала в основном аристотелева система мира, согласно которой в природных процессах целое важнее ее составляющих. Это так называемый холистический, т.е. целостный, глобальный подход к пониманию картины мира*. По Аристоте- лю, наш мир представляет собой иерархическую систему, в которой одни формы подчинены другим формам, т.е. находятся в динамической взаимосвязи друг с другом. Холистический, целостный подход ориентированна системный характер того или иного явления, для него целое (представляет собой нечто большее, чем простая сумма составляющих. Этот подход уделяет важное внимание связям и взаимодействию между частями целого как некоторой системы. 1 Редукционистский подход отличается антропоцентризмом; здесь человек во всех проявле- ниях суть повелитель природы, которую он приспосабливает для удовлетворения своих “не- уклонно растущих потребностей”. В отличие от этого холистическая картина мира полагает, »нто человек и природа равны, что они находятся во взаимодействии и составляют нечто целое 11
и единое в своем существовании и развитии. В настоящее время появились многие проблемы, которые, по-видимому, не могут быть решены редукционистскими методами. С одной стороны, эти методы позволили создать к настоящему времени гигантскую технократическую цивили- зацию, а с другой—они не дают ответа на острые вопросы и проблемы, связанные, например, с возможностью возникновения экологической или ядерной катастрофы и вообще с разруши- тельными тенденциями в современном мире. В частности, существующие подходы редукцио- нистского толка не объясняют основополагающих причин быстрого разрушения даже самых лучших технических объектов и сооружений по сравнению с природными системами, которые не только восстанавливаются, но и усиленно развиваются, если, конечно, человек их оконча- тельно не погубил и некоторое время не вмешивается в их функционирование. С редукциони- стских позиций трудно также понять истинные причины существенного снижения устойчиво- сти и, следовательно, надежности искусственных сооружений и комплексов с ростом их раз- меров и сложности структуры, между тем для природных систем, наоборот, характерно явление повышения устойчивости и стабильности по мере того, как они становятся крупнее и функци- онально сложнее. Более того, природные системы в пределах их жизненного цикла обладают удивительными свойствами самосохранения и самоусовершенствования [225]. По-видимому, конструктивная мысль человека, приведшая к целому ряду выдающихся, эпохальных научно- технических достижений, все же не учитывает нечто фундаментальное и обобщающее, прису- щее природным системам. В этой связи перед современной наукой, в том числе и теорией управления, стоит трудная; проблема выявления и изучения механизмов построения природных (экологических, биоло- гических) систем, которые гарантируют высокую выживаемость и надежность функциониро-^ вания этих систем в условиях изменения внутренней и внешней среды обитания. Эти и другие подобного рода обстоятельства возродили интерес к изучению и развитию глобальных подхо- дов, что свидетельствует о возвращении к аристотелеву взгляду на картину и развитие мира, разумеется, на новом витке его познания. Холистические, целостные представления опираются на такие базовые понятия, как “симметрия", "структура", "связность” [222], которые здесь более важны, чем понятие “закон”, занимающее, как известно, доминирующее положение при редукционистском подходе. Для холистического взгляда на мир характерен системный подход,. в котором главенствуют процессы синтеза по сравнению с традиционной аналитикой класси-: ческого естествознания. Разумеется, что холистический подход [220] вовсе не антагонистичен’ редукционистскому, а стремится сохранить его положительные стороны, придав им большую^ органичность и системность. Необходимо подчеркнуть, что в классическом естествознании, до' многом опирающемся на редукционистский подход, элементы холистического взгляда на‘ природу явлений были всегда неизбежно включены в структуру самой науки в форме ее фундаментальных принципов (например, вариационные принципы физики, очевидно, отио-- сятся к холистическому подходу). Итак, современные холистические взгляды на естественно-научную картину мира, вклю- чающую физические, биологические и другие процессы, опираются на фундаментальных принцип всеобщей связи природных явлений и на принцип развития. При этом выделяете» физическое (биологическое) ядро природных систем как совокупность низших, редукциони-1 стских форм материи со своими законами движения. Высшие, холистические представления опираются на низшие формы, отводя первостепенную роль структурным характеристикам и свойствам связности природных процессов. Очевидно, что известная противоположность обо! их подходов в науке—редукционистского и холистического—относительна и взаимообратима| т.к. эти подходы по своему содержанию и смыслу преследуют одну и ту же цель—выявит^ интеграционные, синтезирующие положения в науке, и тем самым добиться ее единства я целостности. Тема о редукционистском и холистическом подходах в науке, которой мы здесь кратков несколько поверхностно коснулись, несомненно достойна более глубокого и развернутого изложения. Однако для нас важно здесь попытаться выявить- основные редукционистские особенности и холистические тенденции в теории управления, которые, возможно, могут бытг 12
положены в основу ее дальнейшего развития. Поэтому сначала остановимся на понятии “управление”. Дело в том, что издревле анализ природных систем носил пассивный, наблюда- тельный характер, т.е. он не предполагал целенаправленных воздействий на динамику изуча- емых систем. Ньютоновский и особенно современный взгляды на науку в большей мере связаны с управленческим подходом, при этом координаты состояния системы из первоначаль- но независимых в результате действия управления могут превращаться в частично или полно- стью зависимые с целью обеспечения движения системы по желаемой траектории. В дальней- шем нас в основном будут интересовать управляемые динамические системы и их свойства, т.к. именно управление отражает конструктивное начало и активную роль человека в создании рациональной техносферы и вообще в мировом эволюционном процессе [208]. Перейдем теперь к выявлению редукционистских и холистических тенденций в теории управления. Распространенное в современной теории управления внутреннее описание про- цессов в форме уравнений пространства состояний, очевидно, ближе к редукционистскому подходу. Это объясняется тем, что используемые координаты состояния фактически равны по значимости и между ними не устанавливается некоторая связь или иерархическая подчинен- ность, здесь координаты не сгруппированы в функциональные блоки или подсистемы, что позволило бы осуществить естественную декомпозицию системы на основе, например, ее физической структуры. В этом смысле внешнее описание системы в виде связи “вход—выход” в большей мере ближе к холистическому подходу, т.к. оно не содержит информации о локаль- ных процессах и основано только на отображении, связывающем выходы с входами системы. Однако внутреннее описание содержит существенно больше ийформации о способе действия системы, т.к. такое описание порождает ее внешнее описание. Известно, что при построении модели системы возникает так называемая задача реализации, согласно которой необходимо выяснить полноту соответствия внутреннего и внешнего описаний системы. Использование же критериального подхода в теории управления очевидно ближе к холистическому взгляду, т.к. непосредственно связано с вариационными принципами йауки. Функционал (или критерий качества) отражает глобальные свойства системы, которые накладывают ограничения на ее произвольные локальные движения. Эти движения непременно должны удовлетворять экстре- муму некоторого функционала. Отсюда следует, что оценка свойств систем управления по конкретным параметрам переходных процессов относится к редукционистскому подходу, т.к. находится на самой нижней ступени иерархической лестницы: функционал (критерий качест- ва) -*• уравнения состояния, доставляющие экстремум функционалу на траекториях движе- ния, -♦ переходные процессы, являющиеся решениями этих уравнений для частных граничных условий системы. Продолжим изучение холистических тенденций в теории управления и попытаемся вы- явить их сущность на основе некоторых общих физических закономерностей. К одному из важных холистических понятий относится понятие “связности”, т.к. является одной из базо-' вых качественных характеристик системы. Понятие “система” подразумевает связь совокуп- ности некоторых элементов, образующих структуру системы, и поэтому с разрушением струк- турной связности исчезает и сама система [222]. В системах управления, описываемых диф- ференциальными уравнениям, связность отражает характер динамического взаимодействия между компонентами, иерархически входящими в соответствующую систему. Отличительной особенностью систем управления, как известно, является их динамическое описание, т.е. представление физического (химического, биологического) объекта в движении. Происхо- дящие в этих системах процессы отражают реакции взаимодействия некоторых локальных подсистем (элементов), входящих в общую систему управления. Несмотря на кажущуюся тривиальность последнего утверждения, оно здесь подчеркивается, т.к. относится к принципи- альной, кардинальной черте теории управления, заметно отличающей ее от доминирующего во многих современных науках статистического подхода, когда соответствующие явления описываются как набор возможных ситуаций, как собрание сущностей. Динамический же подход определяет, какая сущность следует за другой сущностью и как они взаимодействуют 13
между собой. Согласно этому подходу первопричиной всего сущего в этом мире является динамика, т.е. взаимодействие между сущностями реального мира, а наблюдаемые нами физи- ческие явления и процессы представляют собой некоторые формы этого взаимодействия. Иначе, за явленным порядком вещей, т.е. реакцией, скрывается некоторый невидимый смысл, а это уже холистический взгляд на природные процессы [220, 221, 223]. Итак, динамическое описание окружающего нас реального мира придает особую значи- мость внутреннему взаимодействию компонентов в системах управления, которому совре- менная теория, как это и не покажется странным, все же не отводит решающей роли, во многом увлекшись чисто математической стороной задачи об управлении. Между тем любое природное явление познаваемо только во взаимосвязи с другими явлениями посредством соответствую- щих законов, в результате чего эти связанные явления и могут быть описаны как некоторое целостное представление о природном процессе. Указанный холистический взгляд все в боль- шей мере становится всеобщим в науке. Все природные системы, в том числе и живые организ- мы—от отдельной особи и популяции до биосистем и экологических комплексов, организова- ны в определенные функциональные образования, которые обмениваются между собой веще- ством, энергией и, очевидно, информацией. По-видиМому, информация как раз и служит источником управления поведением и состоянием как отдельных компонентов, так и природ- ных систем в целом. Следует, однако, отметить, что вплоть до последнего времени наука уделяла основное внимание изучению естественно-энергетической организации природных систем, оставляя несколько в стороне такую важную их особенность, как управление с целью самосохранения этих систем, причем в максимально возможной степени. В настоящее время возникла настоятельная необходимость выявления механизмов управления, действующих в природных системах и лежащих в основе их функционирования и развития. Представляется । достаточно очевидным, что указанные механизмы должны базироваться на динамике управ-! ляемого взаимодействия вещества, энергии и информации в природных системах [225]. Остановимся теперь на таком важном холистическом понятии, как симметрия в природных системах [208, 225-228]. Симметрия отностися к одному из фундаментальных понятий в современной теории физических взаимодействий. Она присутствует повсюду, где существуют связи между частями в составе какого-либо объекта или системы. Скрытые формы симметрии были обнаружены учеными в результате физического и математического анализа сил, которые ответственны за формирование материи. Этот анализ показывает, что силы можно рассматри-: вать как способ поддержания определенного рода симметрий в природе. На основе теории! взаимосвязей между симметрией, силовыми полямии частицами современные физики пришли! к весьма неординарному выводу о том, что мы живем в многомерном (точнее одиннадцатимер- < ном) мире. В соответствии с этой теорией, окружающий нас обычный трехмерный мир допол-’ няется пространственно-временными измерениями, которые как раз и проявляются как неко-* торые силы или взаимодействия [236]. Общий принцип симметрии пронизывает структуру и| функционирование любых естественных систем—от элементарных частиц и клеток до галак-1 тик и живых организмов. В симметрии проявляется общность структуры и свойств систем, в то: же время симметрия—это некоторые запреты на возможное число вариантов природных? процессов. Указанные запреты реализуются через законы сохранения в соответствующих! природных явлениях. В физике идея симметрии, например, лежит в основе классификации^ элементарных частиц, в химии она проявляется в виде периодического закона, в биологии^ симметрия проявляется в законе сохранения наследственности, в математике —в теории групп! и т.д. В общем случае симметрия представляет собой некоторую упорядоченность частей^ образующих нечто целое. В свою очередь, упорядоченность дает возможность сжать инфорЧ мацию о структуре природного объекта путем выделения лишь части его блоков и знания* правил их построения. Однако свойству симметрии в природных системах всегда сопутствует' асимметрия, т.е. нарушение. В симметрии проявляется некоторая общность свойств природных процессов, а в асимметрии—их различие й разнообразие. Все явления окружающего нас мира пронизывает единство симметрии и асимметрии, отражая свойства сохранения и изменения, являясь причиной порядка и беспорядка, единства закономерного и случайного [208]. • 14
Важно подчеркнуть, что фундаментальное свойство симметрии и асимметрии в природных системах—это не только некоторая общенаучная концепция, имеющая определенное фило- софское содержание, но она позволяет также выявить некоторое конструктивное начало, лежащее в основе рассматриваемого природного процесса. Так, с особой силой сказывается значимость понятий симметрии и структуры при исследовании нелинейных диссипативных систем, для которых характерны весьма интенсивные динамические взаимодействия. В таких системах могут возникнуть так называемые процессы самодвижения, точнее самоорганизации, невозможные в линейных системах. Для этих систем, описываемых нелинейными дифферен- циальными уравнениями, как известно, отсутствуют какие-либо общие методы поиска их решений. Именно здесь свойство симметрии дает возможность выделить некоторые частные, так называемые инвариантные решения, которые, как оказалось, часто содержат ценную и богатую информацию об общих свойствах природной системы. Исследование явлений самоор- ганизации позволяет указать новые пути понимания принципов построения природных систем. Учитывая, что перенос этих принципов на конструктивную деятельность человека дает воз- можность выявить новые подходы в проблеме естественного управления различными физиче- скими (химическими, биологическими) объектами, перейдем к более подробному изучению явления самоорганизации в природных системах. Для. этого целесообразно изучить пути и тенденции развития идеи самоорганизации в классической и современной науке. Обратимость и необратимость процессов в динамических и термодинамических систе- мах. Перейдем к краткому обзору причин и тенденций возникновения современных понятий о самоорганизации движущейся материи, уделяя основное внимание тем положениям, которые в той или иной мере связаны с проблемой управления.' В этом обзоре мы будем следовать содержанию замечательной книги лауреата Нобелевской премии Ильи Пригожина и Изабеллы Стенгере “Порядок из хаоса. Новый диалог человека с природой” [235]. Для рассмотрения столь крупной идеи следует сначала вернуться к ньютоновскому синтезу знаний о природе. Обратимость процессов в классической механике. Известно, что ньютоновское понимание науки—это представление о ней как о способе воздей- ствия на окружающий мир, позволяющего как предсказать, так и изменить ход протекающих природных процессов. Ньютоновская наука—классическая механика—это активная наука, сред- ство для построения устройств и механизмов, которая способна как обуздать, так и использовать силы и материальные ресурсы природы на “благо человека”. Современная наука, в том числе и теория управления, во многом базируется на указанном ньютоновском взгляде, она представляет собой союз теории и практики в стремлении как понять, так и структурировать, изменить окружа- ющий мир. В основе современной науки лежит экспериментальный диалог с природой, который предполагает активное вмешательство, а не пассивное наблюдение. Эта наука ставит перед учены- ми задачу научиться управлять физической сущностью, принудить ее действовать в соответствии со “сценарием”, вытекающим из выдвинутой учеными теоретической схемы [235]. В соответствии с этим подходом рассматриваемое явление предварительно изолируется, а затем препарируется и расчленяется на составные мелкие части, чтобы’ быть согласованным с некоторой идеальной ситуацией, вытекающей, в свою очередь, из принятых априорных принципов. Очевидно, что такое представление о природе может оказаться весьма упрощенным, а порой и искаженным. Однако эти обстоятельства вовсе не мешают экспериментальному методу отвергать подавляющее большинст- во теоретических схем и гипотез, выдвигаемых учеными. Как говорил Эйнштейн, природа обычно отвечает “нет” на задаваемые ей вопросы и только в исключительно редких случаях дает утеши- тельный ответ “может быть”. Отсюда следует, что экспериментальный диалог, несмотря на его в известной мере насильственный характер по отношению к природе, дает гарантию того, что природа в своем общении с человеком выступает как независимая от него сущность, она никогда не лжет и не берет своих ответов назад [235]. Однако чрезмерное увлечение экспери- ментальным методом может привести к весьма упрощенному пониманию природы и убежде- 15
нию, что язык природы единственен и это язык исключительно математический. Так, согласно классической механике, все разнообразие природы укладывается в универсальные истины, отражаемые математическими законами движения. Основной вывод классической механики гласит, что в этом мире “все задано” и, следовательно, все возможно. При этом высокая общность законов классической динамики уравновешивалась неограниченным произволом в выборе начальных условий системы. Именно допущение о полной независимости начальных условий является одним из постулатов классической динамики. Это означает, что если неко- торое существо способно управлять динамической системой, то оно также может вычислить требуемое начальное положение системы так, чтобы система самостоятельно, “спонтанно” могла перейти в желаемый момент времени в любое заранее заданное состояние. В классиче- ской механике основное внимание сосредоточено на изучение одного вида природных изме- нений, а именно на процессе механического движения, т.е. качественное разнообразие при- родных явлений сводится к относительному перемещению материальных тел. При этом время играет роль геометрического параметра. Итак,’ классическая наука, отождествляемая во мно- гом с классической механикой, была наукой активного действия и предсказания, основанных на законах Ньютона. Принципиальной отличительной особенностью классической динамики является обратимость динамических траекторий, что постулируется в соответствующих за- конах явным или косвенным образом. Суть указанной обратимости состоит в том, что обраще- ние времени t -*• — t приводит к обращению скорости V -* — V, а система движется вспять, т.е. эволюционирует назад во времени, заново проходя через все предыдущие состояния, в кото- рых она уже ранее побывала. Все изменения в такой динамической системе в результате обращения.времени могут быть полностью скомпенсированы вторым преобразованием—об- ращением скорости, что позволяет системе с абсолютной точностью вернуться в исходное состояние [235]. Описанное свойство обратимости—это основная симметрия классической динамики. Обратимость траекторий наряду с полной независимостью начальных условий ог законов движения являются теми принципиальными допущениями и идеализациями, которые были положены в основу классической динамики. Хотя эти ограничения подвергаются суще- ственному пересмотру в современной науке, однако они никоим образом не умаляют силу и мощь методов, развитых основоположниками классической науки. В идеальном мире этой науки динамическая система полностью и без какого-либо остатка передает все сообщаемое ей движение. Результатом этого является сохранение полной энергии в изолированной системе или при ее свободном движении, т.е. в любой момент времени изменение кинетической энергии полностью компенсирует изменение потенциальной энергии системы. В XIX в. эта базовая концепция ньютоновской механики была обобщена и формализована Гамильтоном и другими учеными путем введения гамильтониана Н, представляющего собой полную энергию консер- вативной системы, что целиком описывает ее динамику. Указанный гамильтонов формализм явился великим достижением науки, триумфом в математизации описания природных процес- сов, он до сих пор имеет первостепенное значение как база для разработки новых подходов, j Примером такого рода подхода может служить принцип максимума Л.С. Понтрягина в теории] оптимального управления, в основу которого как раз и положен гамильтониан. Именно в гамильтониане Я, заключены все возможные свойства классической механической системы. Так, если производная функции Я по координатам системы равна нулю, то соответствующие производные—импульсы являются интегралами движения, т.е. инвариантами системы. Если число указанных инвариантов совпадает с числом степеней свободы, то такие системы, назы- ваемые “интегрируемыми”, можно формально представить в виде совокупности подсистем^ (“свободных частиц”), каждая из которых осуществляет независимое от других подсистем^' вечное и неизменное движение. Иначе говоря, в “интегрируемых системах” путем подходяще-: го инвариантного преобразования можно “исключить” взаимодействие между ее подсистема- ми. Это означает, что в таких системах “все задано”, т.к. в любой момент все инварианта движения известны и ничего качественно нового произойти принципиально не может. Подве- дем теперь некоторые итоги в отношении выявленных свойств систем классической динамики. 16
Изложенное выше показывает, что “интегрируемые системы” состоят из совокупности невзаимодействующих элементов. Эти элементы при движении переносят свое собственное начальное состояние, но в то же время сосуществуют с другими элементами в рамках установ- ленного порядка. При этом, хотя каждый из элементов самоопределен, он до мельчайших подробностей отражает состояние изотропной системы. Каждая точка в любой момент времени знает все о своем состоянии, которое может быть использовано для предсказания любого другого состояния интегрируемой системы. Фактически в течение всего XIX в. (и даже многие годы в XX в.) целые поколения ученых занимались проблемой преобразования динамических систем к интегрируемому виду, т.к. считалось само собой разумеющимся, что любые динами- ческие системы сводимы к интегрируемым, т.е. к “свободным частицам”. Именно это положе- ние лежит в основе гамильтонова формализма классической динамики [235]. Однако в конце XIX в. Брунс и Пуанкаре получили сенсационные результаты, основанные, в частности, на задаче небесной механики о движении трех тел. Оказалось, что эта задача в общем случае неразрешима, а система не сводима к совокупности интегрируемых подсистем. Другими сло- вами динамические системы в общем случае не изоморфны и только простые (гамильтоновы) системы допускают их представление в виде некоторой совокупности невзаимодействующих “свободных частиц”. Существовавшая в течение многих десятилетий базовая посылка о внут- ренней однородности любых динамических систем в общем случае оказалось неверной. В действительности многие (если не подавляющее большинство) природные системы представ- ляют собой сложную совокупность непрерывно взаимодействующих и эволюционирующих подсистем, которые не сводимы к универсальной схеме гамильтоновых “свободных частиц” [235]. Описанный исторический урок в развитии классической механики важен и поучителен для современной теории управления. Дело в том, что вплоть до последнего времени продолжается поиск прямых или косвенных путей преобразования уравнений динамических систем в соот- ветствующих конкретных областях к системе полностью или частично интегрируемых уравне- ний, невзаимодействующих друг с другом. Сама по себе классическая идея такого преобразо- вания весьма привлекательна и необычайно красива. И поэтому вполне естественно попытаться в соответствующей области науки выявить предельные возможности построения указанных преобразований исходной динамической системы к совокупности интегрируемых подсистем. Такой подход позволяет установить общие, в частности энергетические, соотношения для рассматриваемой предметной области науки. В этой связи снова и снова продолжает ставиться фундаментальный вопрос классической механики о возможности преобразования всех или части уравнений динамики соответствующей предметной области через инвариантные соотно- шения (первые интегралы) к совокупности новых точно или приближенно интегрируемых подсистем. И в зависимости от ответа на этот кардинальный вопрос классической динамики ч можно даже говорить о полноте научного содержания ( в классическом смысле этого слова) той или иной отрасли знаний. И поныне в различных конкретных областях науки продолжа- ются поиски прямых или косвенных ответов на указанный труднейший вопрос динамики. В частности, получили развитие разные методы разделения движений и методы декомпозиции динамических систем, которые находятся в русле описанного подхода классической науки. В науке существует в целом отрицательный бтвет на вопрос о возможности инвариантных преобразований уравнений динамических систем общего класса к совокупности точно интег- рируемых, независимых подсистем. Однако взгляд на эту проблему с точки зрения идеологии управления позволяет существенным образом изменить как ее содержание, так и принципи- ально расширить область применения классической идеи инвариантных преобразований на более широкий класс нелинейных динамических систем. Сущность идеи, базирующейся на свойстве управления и позволяющей кардинально расширить возможности метода инвариан- тных преобразований, состоит не в поиске, а в преднамеренном вводе желаемых инвариантов в структуру исходных уравнений динамической системы. При этом вновь образованная систе- ма, состоящая из прежних уравнений динамики и добавленных к ним инвариантных соотно- шений, будет представлять собой совокупность т подсистем (т = п). Эти подсистемы наделены 17
индивидуальными свойствами и взаимодействуют друге другом через вводимые инвариантные соотношения. Иначе говоря, как и в подходе классической механики, вновь образованная система распадается на т интегрируемых подсистем, а коренным ее отличием является обяза- тельное взаимодействие между подсистемами. Причем, как вводимые интегральные соотноше- ния (уравнения связи), так и указанные взаимодействия, имеют информационный характер. Если говорить в более широком смысле, то кратко описанный здесь новый подход к инвариан- тным преобразованиям опирается в большей мере на концепцию синтеза, а не на традиционную аналитику классической механики. Именно такой подход к формированию желаемых “интег- рируемых систем” развивается в данной книге применительно к динамическим объектам различной природы. Обратимость и необратимость термодинамических процессов. Важнейшим понятием классической науки является понятие энергии. В процессе движения механической системы изменяются ее координаты и импульсы, однако полная энергия системы остается неизменной, а происходит лишь динамическое перераспределение между потенциаль- ной и кинетической энергией. На постулате о количественном сохранении “чего-то” при его качественных изменениях основывается идея превращения, проявляющаяся в механических, тепловых, химических процессах и в биологических объектах. Иначе говоря, среди огромного разнообразия возникающих в природе процессов был обнаружен некоторый унифицирован- ный элемент - сохранение энергии при различных ее преобразованиях. В науке общепринято положение о всеобщем характере закона сохранения энергии (первого закона термодинами- ки), который пронизывает все природные процессы. Это привело к его дальнейшему обобще- нию в форме постулата о фундаментальной инвариантности, которая охватывает все явления в природе. Однако в [235] отмечается, что процесс превращения энергии, очевидно, не может быть целью функционирования системы. То или иное превращение энергии может быть интерпретировано как уничтожение Лишь одного различия с одновременным формиро- ванием нового различия, т.е. за эквивалентными преобразованиями энергии скрыт, по-види- мому, более высокий уровень природных процессов. Одним из таких уровней является фун- даментальное свойство необратимости, находящееся за рамками эквивалентностей (в том числе сохранения энергии) и охватывающее тепловые и химические превращения, а также биологические объекты [235]. В науке давно возникла и существует проблема описания не только идеальных явлений, основанных на законе сохранения энергии, но и учета возникаю- щих в системе потерь. Эта проблема, как известно, связана со вторым началом термодинамики и непосредственно сводится к свойству необратимости. Второе начало основано на двух базо- вых положениях физики: превращении энергии и теплопроводности, что позволило сформу- лировать универсальную тенденцию к деградации энергии в механической или других ее формах. Следует подчеркнуть, что для механических превращений энергии характерна иден- тичность процессов сохранения и обратимости. Однако в реальных системах, кроме обратимых процессов, происходят также необратимые изменения внутри этих систем, что связано с производством энтропии—показателем необратимости процессов. Это означает определение состояния системы в зависимости от ее внутренней упорядоченности. Такое явление принци- пиально отличается от процессов сохранения и обратимости, изучаемых классической меха- никой. Для того, чтобы полнее понять необратимые процессы, происходящие в реальных термо динамических системах, рассмотрим подробнее явление приращения энтропии. С этой целью, i следуя [144, 232, 235], будем рассматривать приращение энтропии dS за короткий интервал! времени dt. В случае идеальной и реальной термодинамической системы ситуации в отношении । dS принципиально различны. Для идеальной (изолированной) системы приращение dS можно полностью выразить через теплообмен между системой и окружающей ее внешней средой.1 Идеальную систему можно поставить в такие условия, при которых она будет отдавать тепло 18
вместо того, чтобы поглощать его. При этом соответствующее приращение энтропии deS лишь изменит свой знак. Составляющая deS полного приращения энтропии dS может иметь как положительный, так и отрицательный знак, а это означает, что она обратима. В идеальной системе приращение deS отражает процесс обмена энергией с внешней миром. Это соответст- вует закону сохранения энергии, согласно которому энергия никогда не производится, а лишь переносится с одного места на другое в результате соответствующего преобразования. Отсюда и следует, что составляющая deS отражает процесс обмена энергией. Как показал еще Клау- зиус, величину потока энтропии deS можно количественно выразить через тепло, поглощаемое (или отдаваемое) системой. Итак, обратимые процессы возможны только в идеальных термо- динамических системах. В реальных же системах возникает совершенно иная ситуация, а именно: в них, помимо обратимого теплообмена, протекают также и необратимые процессы из-за тепловых потерь, трения и т.д. Другими словами, в реальных термодинамических системах происходит процесс производства энтропии внутри самих систем. При этом увеличение энтропии в виде состав- ляющей diS не может изменить знак при обращении теплообмена системы с внешней средой. Поток энтропии diS протекает только в одном направлении, как и все необратимые процессы, т.е. составляющая diS > 0 может быть только положительной или обращаться в нуль при отсутствии в системе необратимых процессов. Таким образом, в реальных термодинамических системах, в отличие от идеальных, протекают как обратимые процессы, отражающие свойство обмена энергией с внешней средой, так и необратимые процессы, свидетельствующие о про- изводстве энтропии внутри этих систем. Обобщим изложенное и, следуя [144, 232, 235], представим полное приращение энтропии dS в термодинамической системе в форме разложения dS = deS + diS , т.е. суммы двух составляющих, имеющих разный физический смысл. Первая составляющая deS отражает обмен энергией системы с внешним миром и в принципе обратима, а вторая составляющая diS > 0 всегда положительна и характеризует необратимые процессы, протека- ющие внутри системы. В изолированной системе, которая не обменивается ничем с внешней средой, составляющая deS = 0 и, следовательно, остается лишь составляющая diS, описываю- щая производство энтропии. В этом случае энтропия системы может оставаться постоянной либо возрастать и тогда diS > 0, что свидетельствует не столько о необратимых изменениях, а в большей мере о том, что возрастающая энтропия соответствует самопроизвольной эволюции системы. Изменения, происходящие с термодинамическими системами, не эквивалентны между собой, а именно: самопроизвольное изменение составляющей приращения энтропии diS, направленное к равновесию, существенно отличается от изменения составляющей deS, кото- рая управляется путем варьирования граничных условий, например температуры окружающей среды. Для изолированной термодинамической системы равновесие представляет собой неко- торое притягивающее множество (аттрактор) неравновесных состояний. Это означает, что такое состояние заметно отличается от всех иных изменений, в частности от изменений, происходящих в результате управляемого варьирования граничных условий системы. Еще Планк [237] подчеркивал существенное различие между двумя фундаментальными типами изменений, распространенных в природе. Он отмечал, что природа отдает очевидное “пред- почтение” выделенным, определенным состояниям. Внутри природных систем протекают необратимые процессы, возникающие в результате производства энтропии (diS > 0) Именно из-за необратимого увеличения энтропии система устремляется к некоторому “притягиваю- щему” состоянию, которое природа предпочитает перед другими, и поэтому из такого состоя- ния система по “доброй воле” выйти не может. “В природе,—писал Планк,—невозможны те процессы, при которых природа дает меньшее предпочтение конечному состоянию, чем на- чальному. Предельный случай представляет обратимые процессы; в них природа испытывает предпочтение как к начальному, так и к конечному состоянию, и поэтому переход из одного 19
состояния в другое может происходить в обоих направлениях” [237]. Подчеркнем еще раз, что именно свойство обратимости является наиболее характерным для динамических систем, рассматриваемых в классической механике. В этих системах все изменения сводятся к движе- нию вдоль заданной раз и навсегда траектории, не забывая начальную точку ввиду того, что именно начальные условия однозначно определяют всю траекторию для любого момента времени. В отличие от этого, в изолированных термодинамических системах все неравновес- ные ситуации порождают эволюцию системы к равновесному положению одного и того же типа, а в момент достижения равновесия система полностью забывает исходные начальные условия. В физической интерпретации описанное свойство термодинамических систем озна- чает, что удельная теплоемкость (“сжимаемость”) системы, достигшей равновесия, никак не зависит от того, как она была построена [235]. Итак, природные системы по их описанию можно разделить на две принципиально разные категории: во-первых, на динамические системы, описываемые обратимыми уравнениями движения классической механики, и, во-вторых, на сложные термодинамические системы, обладающие внутренней способностью эволюционировать в направлении увеличения энтро- пии [235]. Такая существенная разница в описании двух категорий систем сразу же ставит важный вопрос о взаимосвязи между ними, т.е. о возможности совмещения классической динамики и термодинамики. Этот вопрос требовал решения сложной проблемы перехода от микроскопического уровня к макроскопическому, которая явилась весьма плодотворной для науки и получила удовлетворительное разрешение только в последнее время [235]. Оказалось, что необратимые процессы—это не какие-то досадные помехи, отражающие, в частности, трение или тепловые потери и т.д. В действительности, необратимые явления играют важней- шую конструктивную роль в окружающем нас косном и живом мире. Второе начало термодинамики, из которого следует необратимость процессов, представля- ет собой некоторый принцип отбора начальных условий, который совместим, но не выводим из классической механики. По существу, второе начало ограничивает именно те возможные начальные условия, которые доступны для динамической системы. Причем это только те начальные условия, при которых система устремляется к положению своего равновесия в будущем. Суть указанного отбора, реализуемого вторым началом, состоит в энтропийном барьере, отделяющим разрешенные условия от неразрешенных. Этот барьер, аналогично барьеру предельной скорости распространения света, никогда не может быть технически преодолен. Дело в том, что для реализации начального распределения^ запрещенного вторым началом, необходимо чтобы указанное распределение обладало бесконечно большим инфор- мационным содержанием, а это принципиально невозможно в природе. Между тем, согласно постулатам классической механики, начальные условия могут быть произвольными. Это как раз и означает, что второе начало отбирает только реализуемые начальные условия, которые перестают быть независимыми от’динамики системы. Особенно сильно проявляется запрет второго начала для макроскопических состояний, где возникает свойство необратимости. В микроскопической же области запрещаются некоторые классы начальных условий, а различие между запрещённым и разрешенным поддерживается во времени законами классической динамики. Изложенная выше новая и глубокая трактовка Пригожиным [144,232,235] второго начала термодинамики, как принципа отбора допустимых начальных условий природных систем, этим еще не исчерпывается. Согласно Пригожину, энтропия, лежащая в основе второго начала,— это не просто постепенное и неизбежное образование равновесного состояния—хаоса, как до сих пор трактовалось в классической термодинамике. Оказывается, что при возникновении так называемых неравновесных условий энтропия может становиться источником не деградации, а порядка в системе. Эта неожиданная интерпретация Пригожиным [144, 232, 235] второго начала кардинально отличается от классических представлений термодинамики. Указанное толкование энтропии означает, что она утрачивает характер жесткой альтернативы, возника- ющей перед термодинамическими системами в процессе их эволюции: в то время как одни системы вырождаются и деградируют в сторону равновесного состояния, другие неуклонно
развиваются и, следовательно, могут достигнуть высокого уровня упорядоченности. Такой объединяющий подход позволяет сосуществовать явлениям классической динамики с процес- сами в термодинамических и биологических системах, вместо того чтобы находиться в отно- шении противоположности, а это принципиально отличается от традиционных представлений. Перейдем к краткому изложению современного понимания, указанных особенностей природ- ных систем. - Неравновесность и порядок в системах Согласно Пригожину [1.44, 232, 235], термодинамику можно разделить на три большие области: первая—это равновесная область, в которой производство энтропии, потоки и силы равны нулю; вторая—это слабо неравновесная, или линейная, область, где термодинамиче- ские силы еще слабы, а потоки линейно зависят от сйл; и, наконец, третья—это сильно неравновесная, или нелинейная, область, в которой потоки являются сложными функциями сил. Линейная неравновесная термодинамика, так же как и равновесная, описывают управля- емое, предсказуемое поведение системы. При этом, каким бы ни было начальное состояние, система обязательно перейдет в то положение, которое определяется заданными граничными условиями. Это как раз и означает предсказуемость реакции системы на изменение ее гранич- ных условий. В области же сильного неравновесия, описываемой, уравнениями нелинейной термодинамики, система может по-прежнему эволюционировать к некоторому стационарному состоянию, однако это состояние уже не определяется выбранным термодинамическим потен- циалом. И здесь возникает важный вопрос об устойчивости этого состояния, которое становит- ся заметно зависимым от вида конечных флюктуаций и возмущений, действующих на систему. Оказывается, что в этих случаях существует определенный порог, за которым флюктуации (из-за действия положительной обратной связи) могут приводить к новому режиму, отличному от “нормального” устойчивого’ состояния, присущего для равновесных или слабо неравновес- ных областей [235]. В результате в системе устанавливается некая глобальная структуру, причем возмущения или флюктуации не могут сразу преодолеть существовавшее до этого начальное состояние. Флюктуации должны сначала установиться в определенной конечной области и лишь затем, возможно, распространиться и заполнять все пространство системы. В зависимости от начальных размеров эта область либо затухает, либо распространяется на все пространство существования системы. Иначе говоря, в сильно неравновесных режимах суще- ствуют критические значения области флюктуации, т.е. некоторое ядро, которое принципи- ально разделяет свойства и поведение нелинейной системы. Критические размеры этого ядра возрастают.с повышением эффективности механизмов взаимодействия (диффузии), которые связывают между собой все области системы. При этом, чем быстрее передаются сигналы по * каналам связи внутри системы, тем будет больше затухающих, т.е. безрезультативных, флюк- туаций и, следовательно, тем больше область устойчивости системы. Требование увеличения критических размеров ядра флюктуаций соответствует увеличению способности внешней среды, окружающей это ядро, к погашению флюктуаций. В зависимости от эффективности каналов связи между флюктуирующей областью и окружающей ее внешней средой в составе системы, флюктуации затухают или, наоборот, усиливаются. Итак, критические размеры области флюктуаций определяются конкуренцией между ме- > ханизмами, усиливающие флюктуации, и интегративной, объединяющей силой системы. От исхода, этой конкуренции зависит порог и размеры области устойчивости системы. Отсюда . следует, что для преодоления перманентного-хаосй в системе необходимо увеличивать стаби- лизирующее влияние связей между "отдельными подсистемами-в-соетаве общей ийстемы,йли, говоря термодинамическим языком, повышать влияние диффузионных процессов. Поэтому в сложных природных системах, где отдельные виды растений, животных и индивиды вступают . в разнообразные взаимодействия между собой, связь между различными частями еистемы должна быть достаточно эффективной [235]. Природные системы, состоящие из большого 21
числа взаимодействующих компонентов, могут сопротивляться .внешним воздействиям и, < следовательно, вести себя в соответствии с “собственной волей”. Для таких систем каждое отдельное действие приобретает коллективный эффект, что может привести к неожиданному глобальному изменению в их поведении. Это указывает на нелинейный характер причинности взаимодействий в системе. Разумеется, что при управляемом воздействии на такие системы следует стремиться обратить на пользу нелинейные связи, обеспечивающие устойчивость предыдущего режима работы. Рассмотрим более’подробно свойства обратимости и необратимости процессов с точки зрения внешнего управления системой. Ранее уже неоднократно отмечалось, что обратимые преобразования лежат в основе классической механики и именно они определяют возможности* управления соответствующей системой, т.е. внешнего целевого воздействия на нее. Классиче- ским динамическим объектом в силу его консервативности всегда можно управлять путем изменения начальных условий. Что же касается термодинамических объектов, то ими также можно управлять путем внешнего изменения граничных условий, но только в области обрати- мых преобразований. Это связано с тем, что любая система, находящаяся в термодинамическом равновесии, при постепенном изменении таких ее макропеременных, как температура, объем или давление, проходит ряд равновесных состояний и при обращении указанных воздействий возвращается в исходное состояние. Управление объектом через изменение его граничных условий и обратимый характер указанных изменений представляют собой обязательно взаи- мосвязанные процессы. Отсюда следует, что с точки зрения управляемости термодинамиче- ским объектом необратимость—явление негативное, т.к. она проявляется в форме неуправля- емых изменений в объекте, что указывает на его уход из под внешнего контроля. Иначе говоря, необратимые процессы в природных системах можно представить себе как свойство самопро- извольной внутренней, активности природы. Итак, “отрицательное” с точки зрения управляемости свойство необратимости, связанное с диссипацией, показывает, что термодинамические объекты управляемы не до конца, а только в области обратимых преобразований. Такие объекты могут “выходить из.повиновения” и самопроизвольно изменить свое состояние, что принципиально отличает их от консервативных объектов классической механики. Исследования природных систем показывают, что дифференциальные уравнения, описы- вающие их поведение в сильно неравновесных областях, нередко содержат некоторые пара- метры, допускающие сдвиг в слабо неравновесную область, т.е. для этих систем не существует абсолютно жесткой схемы их эволюции. Это означает, что можно рассмотреть вопрос о параметрическом управлении системой, имея в виду увеличение порога критических размеров области флюктуаций, а также вопрос о структурной устойчивости, т.е. о реакции системы на введение в ее структуру новых единиц, влияющих на процессы взаимодействия между компо- нентами общей природной системы. Примером параметрического самоуправления в природ- ных системах может служить логистическая эволюция популяций, согласно которой эколо- гическая ниша последовательно заполняется теми видами популяций, у которых параметр “несущая способность” [235] становится больше, чем у других видов. Происходит последова- тельное вытеснение предшествующих видов, имеющих более низкую “несущую способность”. Именно возможность “управлять” указанными параметрами и позволяет соответствующим видам выжить в условиях экологической эволюции. Перейдем к основным выводам по проблеме обратимости и необратимости процессов в динамических и .термодинамических системах. В природе существуют изолированные (замк- нутые) системы с обратимым поведением, полностью описываемые законами классической и квантовой механики. Однако, по-видимому, большинство существующих и наблюдаемых в природе систем (термодинамических, химических, биологических) открыты, они обладают свойствами однонаправленности во времени на макроскопическом уровне. Причем оказыва- ется, что для таких систем нарушение временной симметрии присутствует и на микроскопиче- ском уровне. Это означает, что для той или иной системы необратимость, как правило, существует на всех уровнях описания, или же она отсутствует везде. Разумеется, что эффект 22
проявления необратимости различен для соответствующих уровней: он усиливается по мере перехода от микроскопического к макроскопическому уровням описания. Важнейший вывод,. сделанный Пригожиным [144, 232, 235], состоит в том, что источником порядка на всех уровнях описания природных систем является неравновесность, т.е. порождение порядка из хаоса. Необратимость как раз и есть тот механизм, который создает неравновесность и, следовательно, порядок на всех уровнях. Однако необратимость—это не универсальное свой- ство, обратимые и необратимые процессы сосуществуют в природных системах. Это означает, что не следует ожидать общего вывода свойства необратимости из уравнений классической механики. Таким образом, в природе сосуществуют два мира—это, во-первых, обратимый мир клас- сической и квантовой механики, в котором невозможна эволюция, а заложенная в динамиче- ских структурах информация остается неизменной; и, во-вторых, необратимый мир термоди- намических и биологических процессов, в котором возможно образование упорядоченных структур с новыми свойствами, возникающими в результате эволюции природных систем. В необратимых природных системах каждая область (равновесная, слабо неравновесная, сильно неравновесная) пространства состояний, ввиду неизбежной собственной неравномерности, имеет свой темп времени. При этом существует непосредственная взаимосвязь между энергией, пространством и временем. Понимание связи между порядком и хаосом, между простым и сложным определяется, согласно Пригожину [144, 235], именно отношением к понятию времени. Современную ситуацию в науке с отношением к времени Пригожин охарактеризовал в своей Нобелевской лекции: “Уровень развития теории, достигнутый уже сейчас, позволяет нам выделить различные уровни времени: время, выражаемое понятием классической или квантовой механики; время, связанное с необратимостью процесса через функцию Ляпунова; и время, характеризующее “историю” системы через бифуркацию” [243]. Современная тео- рия управления, по-видимому, находится на первых двух уровнях понимания времени. Изложенные соображения о проблеме обратимости и необратимости процессов в природ- ных системах носили достаточно общий характер и отражали взгляд с высоты “птичьего полета”. Сама по себе затронутая проблема чрезвычайно сложна- и важна для современной науки, т.к. затрагивает ее фундаментальные основы. Изучению этой проблемы посвящены работы многих ученых [83,84,99,109,144,214,231,232,235]. В завершение весьма краткого рассмотрения данной проблемы выделим ее базовые положения и выводы, существенные, на наш взгляд, для развития современной теории управления. Первым из таких выводов является наличие свойства управляемости систем с обратимым поведением, а именно: систем класси- ческой и квантовой механики, а также термодинамических систем, находящихся в равновесной или слабо неравновесной областях. Ко второму важному выводу следует отнести возникнове- ние свойства коллективного противодействия флюктуациям со стороны компонентов систе- мы, находящейся в сильно неравновесной области; и чем дальше ушла система в эту область, _ тем больше может быть эффект указанного противодействиям флюктуациям. Третьим выво- дом, вытекающим из предыдущего, является рекомендация усилить механизм взаимодействия между подсистемами в составе общей системы, что приводит к необходимости повышения быстродействия сигналов связи между компонентами систем. Итак, любые процессы в физических, химических и биологических системах можно раз- делить на два существенно разных класса. К первому классу относятся процессы в изолиро- ванных (в термодинамическом смысле) системах. Они ведут к равновесному состоянию, которому соответствует физический хаос. Эти процессы управляемы путем внешних воздей- ствий. Ко второму классу следует отнести процессы в открытых системах, в ходе которых могут возникнуть упорядоченные структуры, что характерно для явления самоорганизации. При этом целесообразно ввести количественную оценку степени упорядоченности—самооргани- збванности различных состояний систем, необходимую для выбора путей наиболее эффектив- ной структурной самоорганизации. Упорядоченные структуры в открытых системах возникают в результате изменения управляемых параметров, поэтому если таких параметров несколько, то, очевидно, можно выявить различные пути самоорганизации. Отсюда вытекает важная 23
задача оптимального управления процессом самоорганизации систем. Перейдем к более под- робному рассмотрению свойства самоорганизации в проблемах управления. Синергетика и управление. Недавно возникла и сейчас интенсивно формируется новая наука о коллективном, когерентном поведении нелинейных динамических систем различной природы—синергетика. Это слово является производным от древнегреческого “синергос”— вместе действующий, а сам термин “синергетика” в прошлом веке в науку впервые ввел Шарринггон для описания кооперативных действий мышечных систем при управлении ими со стороны мозга. В последующие годы термин широко использовался в физиологии [217, 218, 229, 230] для обозначения совместного поведения. В последнее время теорию совместного действия, по предложению известного физика Г. Хакена, стали называть “синергетикой”, основой которой являются общие закономерности процессов самоорганизации в нелинейных динамических системах самой различной природы. Сущность этой интегральной науки Г.Ха- кен определяет следующим образом [231]: “... в ней исследуется совместное действие многих подсистем (преимущественно одинаковых или несколько различных видов), в результате которого на макроскопическом уровне возникает структура и соответствующее функциониро- вание. С другой стороны, для нахождения общих принципов, управляющих самоорганизую- щимися системами, необходимо кооперирование многих различных дисциплин”. Из этого определения следует, что синергетика изучает свойства самоорганизующихся систем любой природы—физической, химической, биологической, причем это такие свойства, которыми не наделена ни одна из под систем, входящих в общую систему. По Хакену, самоорганизация—это такой процесс в нелинейных динамических системах, который приводит к возникновению внутренних пространственных и пространственно-временных структур. Основные понятия синергетики В основе самоорганизующихся процессов лежит синергетический принцип подчинения, согласно которому исходная сложная система может быть представлена в виде некоторой сложной иерархической системы, состоящей из совокупности динамических подсистем. Эти подсистемы подчинены друг другу и находятся между собой в определенной динамической взаимосвязи. В математическом плане принцип подчинения базируется на методе адиабати- ческого приближения или, говоря языком нелинейной механики, на идее разделения исходной системы на медленные и быстрые подсистемы. При этом осуществляется процедура адиабати- ческого исключения переменных с характерными временными масштабами. Помимо принципа подчинения, для синергетики важное .значение имеет также понятие параметра порядка. Выявим сущность этих основополагающих понятий синергетики на конкретном примере не- линейной системы второго порядка [83]: Xi (?) = Л1Х1- xi*2 ; х2 (0 = - А2Х2+ xi , где Л1 ^0, Л2 > 0. . Такими дифференциальными уравнениями описывается ряд процессов в физике, химии, экологии и т.д. Следуя [83], предположим, что коэффициент Ai очень мал и Л2> > IAj I. Тогда если переменные xi и х2 малы, т.е. можно пренебречь квадратичной формой xix2, то переменная *1 будет изменяться очень медленно. Из второго уравнения видно, что прирост х2 определяется членом xi, а так как переменная xi изменяется очень медленно, можно ожидать, что и х2 будет изменяться также достаточно медленно. Поскольку Л2>0 и много больше Ль то производной х2(Г) можно пренебречь по сравнению с величиной Л2х2. Изложенный приближенный анализ математических свойств исходной системы дифференциальных уравнений по существу озна- чает, что эта система может быть представлена медленной подсистемой, описываемой первым уравнением, и быстрой подсистемой, описываемой вторым уравнением. Изменение поведения 24
быстрой (гг) и медленной (Т1) подсистем определяется переходными процессами, длительность которых можно оценить следующим неравенством: Г2~Л.2 1<<Г1-гЛГ1. Это неравенство и описанные выше соображения позволяют положить xztf^O, т.е. записать исходные уравнения в виде xi(/) = Л1Х1- Х1Х2; 0~—Л2хг+ х?. о Отсюда находим выражение jq—j-, подставив которое в первое уравнение, получим • ГЛ 1 х* Xi(t) ~ Mxi- -Ц. В результате осуществлено алгебраическое исключение переменной хг- Теперь уже поведение исходной системы определяется в основном эволюцией медленной подсистемы, которая как бы “управляет” быстрой подсистемой. При этом переменная х? подчинена переменной -п системы. Поэтому медленная переменная к которой подстраивается быстрая переменная хг, и называется параметром порядка [83]. В многомерных системах параметру порядка х\ может быть подчинено весьма большое число других переменных. Это и позволяет принципи- ально упростить сложную задачу, а именно: исследовать лишь одно уравнение относительно xi, а затем выразить все остальные переменные через Xi на основе принципа подчийения. В общем случае в сложной многомерной системе таких параметров порядка может быть несколь- ко, но'Ъто часто небольшое число, существенно меньшее размерности исходной системы. К этим коллективным переменным—параметрам порядка подстраиваются остальные перемен- ные, которые можно исключить при описании макроскопического поведения системы. Именно небольшое число уравнений для выявленных параметров порядка и позволяет исследовать макроскопические свойства исходной нелинейной динамической системы. В этом случае для. многомерных систем удается найти автомодельные (самоподобные) решения, характерные только для далеких от положения равновесия состояний. Отличительной особенностью систем с описанными свойствами является “забывание” начальных условий и формирование нерав- новесных структур. Именно неравновесность и может служить причиной упорядоченности, т.е. самоорганизации нелинейной динамической системы. Итак, основополагающими понятиями синергетики являются принцип подчинения и пара- метры порядка. Оказывается, что между потерей устойчивости системы в линейном прибли- жении, возникновением параметров порядка и реализацией принципа подчинения существует важная внутренняя взаимосвязь. В результате изменения параметров управления нелинейная система может потерять устойчивость в линейном приближении. Для рассмотренной здесь системы второго порядка таким параметром управления является коэффициент^, i, в результате изменения которого Re(Ai) может стать очень малой величиной или изменить знак и тем самым послужить причиной неустойчивости системы в линейном приближении. В таких случаях и применим принцип подчинения. Отсюда следует, что в тех точках, в которых происходят структурные изменения, поведение системы определяется только параметрами порядка [83]. Связь между принципом подчинения, параметрами порядка и потерей устойчивости в линей- ном приближении позволяет выявить общие аналогии в свойстве самоорганизации при макро- скопическом поведении различных по своей природе нелинейных динамических систем. Сле- дует отметить, что адиабатический подход, изложенный на примере нелинейной системы второго порядка, не является принципиально новым и уже достаточно давно используется в нелинейной механике, химии и др. с целью упрощения исследования исходно сложных систем. Такого рода подходы основаны на свойстве редукции и в математическом отношении связаны с методами малого параметра при производных в теории нелинейных дифференциальных уравнений. Эти подходы и являются обоснованием принципа подчинения—базового принципа ^синергетики [83]. На этом принципе построена теория самоорганизации нелинейных динами- ческих систем. 25
Саморганизсщия и диссипативные структуры в динамических системах Самоорганизация в системе может -возникнуть из-за изменения некоторых ее параметров, называемых управляющими, в результате изменения числа компонент системы, а также из-за перехода системы в новое состояние. Примерами процессов самоорганизации являются: • в физике—образование сложных структур в гидродинамических системах, когерентные колебания в лазерах, упорядоченные состояния в плазме, эффект мультистабильности в физике твердого тела; • в технике—макроскопические изменения внешних параметров, например явление флаттера в авиации, резкие деформации оболочек; • в электро- и радиотехнике—когерентные электромагнитные колебаниям различ- ных осцилляторах, появление комбинационных частот в генераторах; • в химии—образование макроскопических колебательных структур типа реакции Белоусова-Жаботинского; • в биологии—процесс образования высокоупорядоченных, кооперативных структур морфогенеза, т.е. дифференциации клеток путем обмена информацией между ними для последующего образования жизненно важных структур; затем динамика популяций и эволюция как образование макроскопических структур и т.д. Приведенные примеры из весьма различных областей знаний показывают, что все они обладают некоторыми общими свойствами, а именно: системы состоят из огромного чйсла! элементов и подсистем и, что особенно важно, в этих системах без какого бы то ни было внешнего воздействия возникают упорядоченные, диссипативные структуры (от латинского dissipato—рассеивать), т.е. летучие формирования, возникающие при рассеивании свободной энергии системы [144, 243]. Понятие “диссипативные структуры” было введено в науку И. Пригожиным, характерна зуя которое он отмечал, что “...как удаленность от равновесия, так и нелинейность могут’ служить причиной упорядоченности в системе. Между упорядоченностью, устойчивостью и- диссипацией возникает в высшей степени нетривиальная связв. Чтобы выделить эту связь, мы будем называть упорядоченные конфигурации, появляющиеся вне области устойчивости тер- модинамической ветви, диссипативными структурами... Такие структуры могут существовать вдали от равновесия лишь за счет достаточно большого потока энергии и вещества... Диссипа- тивные структуры являют собой поразительный пример, демонстрирующий способность не-; равновесности служить источником упорядоченности” [214, 232]. Парадоксальность возник- новения упорядоченности в нелинейных открытых системах подчеркивается еще и тем обще- известным фактом, что в обычных равновесных системах именно свойство диссипации вовсе.; уничтожает всякий порядок и там всегда возникает термодинамическое равновесие, т.е. дру- гими словами хаос. Оказывается, что в открытых нелинейных системах диссипация приводит! к появлению некоторых структур соответствующего размера и формы, т.е. возникает процесс* самоорганизации. Другими словами, взаимодействие системы с внешним миром в сильно неравновесной области может привести к образованию новых по своим свойствам динамиче-' ских состояний, названных И. Пригожиным диссипативными структурами, чтобы подчерк-! нуть весьма неожиданную и тесную взаимосвязь между структурой и диссипацией, т.е. поте- рями в системе. Такие структуры могут привести к принципиально новым явлениям в поведе-, нии системы, а именно к высокой степени упорядоченности поведения огромного количества? частиц и вообще компонентов, входящих в состав общей системы. Открытие И. Пригожиным диссипативных структур означает обнаружение нового динамического состояния материи,' ранее неизвестного в классической науке [144, 235, 243]. Для теории управления понятие “диссипативные упорядоченные структуры”, которые возни- кают в нелинейных системах в сильно неравновесных областях, само по себе важно с разных точек зрения на проблему управления. Дело в том, что беспорядок (в пределе—хаос) достижим многими 26
способами. Порядок же, наоборот, может быть обеспечен лишь весьма небольшим числом способов и чем он выше, тем меньше это число, что в пределе означает оптимальное управление. Понятие “структура” также связано с понятием управления, т.к. означает некий объект, обладаю- щий устойчивостью и способностью сопротивляться внешним и внутренним воздействиям, оста- ваясь подобным самим себе и не изменяясь в целом [235, 243]. Однако, как отмечалось ранее, образование чрезвычайно жестких упорядоченных структур в сильно неравновесной области может стать негативным фактором с точки зрения управляемости и удовлетворения требования о достаточном разнообразии в поведении системы управления. В синергетических системах могут возникнуть как упорядоченные, так и хаотические колебания. Для того, чтобы в системе в -динамике существовали упорядоченные структуры вдали от положения равновесия, через эти системы должен непрерывно протекать непрерыв- ный поток энергии, вещества и информации. Именно самоорганизация и является общим свойством перечисленных выше весьма разнообразных систем, которые состоят из элементов и подсистем различной природы,—атомов, молекул, клеток, животных и т.д. Самоорганиза- ция, как это не кажется странным на первый взгляд, позволяет изучить динамические свойства различных по своей природе систем с единых математических позиций и единых понятий. Итак, во всех перечисленных выше разнообразных системах могут возникать процессы самооргани- зации, приводящие к образованию вдали от положения равновесия упорядоченных макроско- пических структур с принципиально новыми свойствами. Эти структуры, на которых могут возникать .когерентные или хаотические колебания, получили названия аттракторов. Аттрактор—это притягивающее множество в фазовом пространстве системы, т.е. некото- рая совокупность точек, к которой притягиваются все близкие траектории движения. И хотя, как известно, решения нелинейных дифференциальных уравнений в зависимости от начальных условий могут вести себя принципиально по-разному, однако, попав в область притяжения аттрактора, они непременно устремятся к нему. Другими словами, эти решения могут подчи- няться некоторым строгим законам поведения, что в известной мере можно трактовать как “аналог” принципа суперпозиции в нелинейных системах. Аттракторы в фазовом пространстве нелинейных систем могут быть различных типов; к основным из них относятся точка (в частности, устойчивый фокус), предельный цикл (периодически изменяющееся семейство состояний), тор и, наконец, странный аттрактор. Обычный аттрактор (точка, предельный цикл или тор) определяет установившийся режим движения системы, к нему устремляются все переходные режимы, попавшие в область его притяжения. Этот важный класс аттракторов отличается тем, что они всегда лежат на многообразиях или образуют некоторые многообразия в фазовом пространстве динамической системы. Многообразия, обладающие свойством при- тягивать к себе все траектории., начинающиеся в определенной его окрестности, называются притягивающими. -’Ёе же из них, которые остаются неизменными при движении системы, очевидно, следует назвать инвариантными многообразиями [83]. Теперь о так называемых “странных аттракторах”. Оказывается, что в ряде случаев ат- |ракторы могут и не быть многообразиями, однако траектории движения системы, попав в область действия такого аттрактора, остается в ней сколь угодно долго. Примером такого аттрактора может служить тор, расположенный в трехмерном фазовом пространстве системы (см. п. 1.8), Если движение по такому тору становится неустойчивым, т.е. траектории движения по тору многократно пересекают сами себя в точках бифуркации (раздвоения), то тогда возникает хаотическое движение. При этом характер поведения траекторий весьма чувствите- лен к изменениям начальных условий. Это означает, что с течением времени даже малые изменения и флюктуации могут значительно усиливаться в системе, что неизбежно приведет к хаотической динамике. В этом случае, когда бифуркации становятся множественными, поведение траекторий с течением времени становится столь сложным и таким запутанным, что ’Сложность, по существу, становится беспорядком, хаосом. Именно это свойство, присущее странным аттракторам, и принято называть детерминированным хаосом, или хаотической Динамикой [83, 99, ПО, 144, 169, 214, 232]. Описанное парадоксальное свойство, возможное нелинейных детерминированных системах, показывает, что между “упорядоченностью” и 27
“разупорядоченностью”, между простым и сложным не такая уж и огромная пропасть, как это до сих пор трактовала классическая наука. Ранее мы уже касались темы о динамическом и стохастическом (вероятностном) описании явлений в природных системах. Вернемся к этому вопросу, но рассмотрим его с другой точки зрения, связанной с обнаружением в природных системах странных аттракторов. Вплоть до последнего времени в большинстве наук все явления окружающего нас косного и живого мира было принято разделять на детерминированные и случайные процессы. Такой барьер между поведением детерминированных систем и хаотическими движениями издавна существовал в классической механике и физике, затем этот кажущийся неопровержимым факт перекочевал в современные науки—кибернетику, информатику, радиотехнику и т.д. И уж само собой разумеется, что в подавляющем большинстве учебников всячески подчеркивается этот прин- ципиальный раздел между детерминированными и хаотическими явлениями. У казанное резкое разделение явлений окружающего нас мира представлялось очевидным и само собой разуме- ющимся. При этом выдвигалось кажущееся бесспорным обоснование, что вероятностный, стохастический характер многих процессов в различных системах объясняется огромным числом элементов системы и ее степеней свободы. Именно эти положения лежали в понимании сложных явлений. Действительно, на первый взгляд, представляется очевидным, что много- мерность и есть суть сложного. В научной литературе даже имеется такой афоризм, как “проклятие размерности”. Однако оказалось, что не в размерности заключается суть сложного явления. В действительности, даже поведение одной частицы, движение которой описывается законами Ньютона, может оказаться непредсказуемым. И уже совсем неожиданно недавно было показано, что весьма простые детерминированные автономные динамические системы низкой размерности (л > 3) принципиально могут иметь существенно случайные, стохастиче- ские движения без какого-либо внешнего воздействия. Современная синергетика доказала, что подлинная случайность и вероятность окружающего нас мира принципиально определяется именно наличием хаотических движений в нелинейных детерминированных динамических системах, а вовсе не размерностью этих систем. Это совершенно поразительное открытие, коренным образом изменяющее основополагающие представления современного естествозна- ния, явилось крупнейшей сенсацией недавнего времени и может существенным образом изме- нить наше научное мировоззрение. Действительно, представляется неординарным и неочевид- ным установление и признание такого удивительного факта, как возникновение непредска- зуемых, хаотических движений в “простых” малоразмерных детерминированных системах различной природы. Это открытие, а также обнаружение фундаментального свойства самоор- ганизации в нелинейных динамических системах, позволяет объяснить и выявить новые нео- жиданные явления в окружающем нас мире и создать технические системы и устройства с необычными, по современным меркам, свойствами. Изложенное выше позволяет сделать ряд важных выводов. В настоящее время формиру- ется новая интегральная наука—синергетика, изучающая коллективные процессы самоорга низации, охватывающие практически все современные отрасли знаний о косной и живо» природе, технические и экономические науки. Эта обобщенная наука основана на нелинейно! динамике и* термодинамике необратимых процессов как базовых научных дисциплинах. Уч» тывая обобщенный характер синергетики как теории самоорганизации систем любой природы представляется весьма целесообразным осуществить перенос ее основных идей на констру» рование управляемых динамических систем. Синергетика и процессы управления Синергетические процессы обнаружены в различных физических и химических системах, но наиболее ярко они проявляются в биологии, где образование упорядоченных и эффективно функционирующих структур непременно происходит на основе кооперации между отдельным» частями целостного организма. Такого рода кооперативные, внутренне согласованные процесс» 28
обнаруживаются во всем многообразии биосистем, а синергетические процессы давно изуча- ются биологами. Так, еще в работе Н.А. Бернштейна [229], посвященной проблеме построения движений животных, сформулирована задача управления движениями как отыскание способов борьбы с избыточным числом механических степеней свободы. Очевидно, что такие способы могут быть различными, но наиболее простым и распространенным из них является способ введения жесткой связи между степенями свободы. В этом случае число степеней свободы редуцируется, а задача управления движениями существенно упрощается. Указанные формы движений, когда на механические степени свободы наложены связи, а сами движения каждый раз осуществляются идентично, получили в биологии название синергий [219]. Итак, в биологии уже давно изучаются синергетические процессы, во многом определяющие фундаментальные свойства биосистем. В последнее время в ряде работ биофизиков [217] обобщены и поставлены задачи управления, имеющие, на наш взгляд, принципиальное значение для развития теории управления не только биосистемами, но и системами любой природы. Кстати, о понятии “система”, которое стало повсюду применяться. Имеются разные определения этого понятия [222], базирующиеся в основ- ном на свойстве взаимодействия между компонентами, входящими в общую систему. Однако выдающийся физиолог П.К. Анохин считал это недостаточным и дал следующее замечательное определение системы: “Системой можно назвать только такой комплекс избирательно вовлечен- ных компонентов, у которых взаимодействие и взаимоотношение приобретают характер взаимо- содействия компонентов на получение фиксированного полезного результата” [230]. При этом свойство взаимодействия компонентов реализуется путем освобождения их от тех избыточных степеней свободы, которые в данный момент не нужны для достижения конкретного результата. Те же степени свободы, которые способствуют достижению поставленной цели, непременно сохраняются механизмом взаимодействия компонентов системы. Весьма важно, что сам результат является тем решающим фактором; который активно влияет на отбор степеней свободы, нужных для достижения поставленной цели, т.е. именно желаемый результат создает упорядоченную форму взаимодействия между'компонентами биосистемы. Другими словами, выделенное П.К. Анохиным фундаментальное свойство взаимосрдействия представляет собой ярко выражен- ный и повсеместно проявляющийся в биосистемах синергетический процесс. Буквально на глазах, в течение короткого времени синергетика—теория неравновесных процессов превращается во всеобщую теорию развития, имеющую весьма широкие мировоз- зренческие последствия. Если говорить кратко, то смысл и содержание этой новой интеграль- ной науки состоит в том, что в открытых системах, обменивающихся с внешней средой энергией, веществом и информацией, возникают процессы самоорганизации, т.е. процессы рождения из физического (химического, биологического и т.д.) хаоса некоторых устойчивых упорядоченных структур с существенно новыми свойствами систем. Это общее определение справедливо для систем любой природы. Подчеркнем два фундаментальных свойства высоко- эффективных синергетических систем любой природы—это, во-первых, обязательный обмен с внешней средой энергией, веществом и информацией и, во-вторых, непременное взаимодей- ствие, т.е. когерентность поведения между компонентами системы. Об этих кардинальных свойствах синергетических систем всегда следует помнить как руководителю коллектива, так и специалисту в конкретной научной или технической области. Ранее были перечислены многие явления различной природы, в которых возникают про- цессы самоорганизации. Это означает, что между синергетикой и другими физическими, техническими, химическими, биологическими, экономическими науками имеется внутренняя взаимосвязь. В то же время синергетика в каждую из наук вносит свои особенности и подходы, которые были не присущи или даже чужды традиционным направлениям этих наук. Синергетика—это синтетическая наука, опирающаяся на общую и глубокую концепцию само- организации в динамических системах различной природы. Ее следует понимать не только как некоторую совокупность физических идей и математических методов, но и как новый концептуаль- ный взгляд на. науку. Синергетический подход в науке во многом напоминает системный подход, а сама синергетика имеет важные точки соприкосновения с общей теорией систем [238,239,243]. Для синергетики, как и для теории систем, важны не поверхностные аналогии между явлениями различ- 29
ной природы, а достаточно строгое соответствие между всеми элементами сравниваемых систем. Такое требование означает поиск математически изоморфных законов различной физи- ческой (химической, биологической) природы. Общая теория систем изучает системы самого раз- личного характера—концептуальные, материальные, слабо и сильно структурированные, и т.д., в то время как для синергетики основным предметом исследования является самостоятельная междис- циплинарная область самоорганизующихся систем [243]. В синергетическом подходе, в отличие от общесистемного, изучаются конкретные принципы и механизмы самоструктурирования естествен- ных и технических систем. Иначе говоря, в отличие от общей теории систем, синергетика сосредото- чивает свое внимание на кооперативных, когерентных и самосогласованных процессах, возникаю- щих в сложных нелинейных системах. Необходимо также подчеркнуть, что как для общей теории систем [238,239] и кибернетики [45], так и для синергетики [243] объединяющим понятием является понятие системы. Однако, в синергетическом подходе, помимо формирования общей системной концепции—самоорганизации, обязательно учитывается конкретное физическое (химическое, биологическое) содержание рассматриваемых явлений и процессов [83, 144,243]. В основе классического понимания науки всегда лежала некоторая совокупность экспери- ментальных результатов и выдвинутых учеными принципов или гипотез. Современная же наука, в отличие от классической, все в большей мере становится концептуальной. В этом отношении синергетика—это не новая наука в классическом понимании слова, а по существу новая концепция, базирующаяся на теории самоорганизации систем. Синергетический подход стремится, в первую очередь, выявить макроскопические свойства того или иного процесса, например целых образований, популяций и т.д. Указанный подход не выделяет поведение отдельной особи или частицы, как это делается в классической механике, для него наиболее важным является количество отдельных компонентов, входящих в общую систему. В синерге- тическом подходе предполагается, что само это количество—параметр порядка управляет поведением каждого компонента (особи, частицы и т.д.) системы [83,144,243]. Итак, в основе синергетики лежит фундаментальное явление самоорганизации в сложных нелинейных дина- мических системах. Однако синергетика еще не построила всеобщую и единую теорию само- организации, справедливую для всех видов природных и технических систем, поэтому н зависимости от конкретных свойств предметной области той или иной науки синергетический подход приобретает свои отличительные особенности и содержание. В этой связи в настоящее время мы можем говорить пока о синергетическом подходе как о некоторой направляющей концепции в соответствующей науке. К синергетике как к науке, изучающей поведение нелинейных динамических систем вдали от положения равновесия при изменении некоторых управляющих параметров, по-видимому, наиболее близка по своей идеологии нелинейная теория автоматического управления. Разуме- ется, что в подходах этих наук существуют и свои заметные различия. Так, в [83] утверждается, что “и кибернетика, и синергетика придают первостепенное значение понятию управления, но при этом преследуют совершенно различные цели. Кибернетика занимается разработкой алгоритмов и методов, позволяющих управлять системой для того, чтобы та функционировала заранее заданным образом. В синергетике мы изменяем управляющие параметры более или менее непредсказуемым образом и изучаем самоорганизацию системы, т.е. различные состо- яния, в которые она переходит под воздействием “рычагов управления”. Приведенное выска- зывание Г. Хакена в отношении аналогий и отличий в подходах синергетики и кибернетики [45] указывает на охват этими интегральными науками общих закономерностей, включающих частные законы других наук, однако не следует, на наш взгляд, противостоять цели синерге- тики и кибернетики в отношении задач управления. Ведь, в конечном итоге, суть любой науки, в том числе и синергетики, состоит, во-первых, в познании человеком окружающего его мира и самого себя, и, во-вторых, в конструктивном использовании полученных знаний для форми- рования гармоничной окружающей среды и затем, по В.И. Вернадскому, ноосферы [209] в составе мирового эволюционного процесса. Итак, по Хакену, в синергетических процессах, где отсутствуют целеполагающие причины, происходит стихийное изменение управляющих параметров, что дает возможность изучить 30
свойство самоорганизации на диссипативных структурах фактически неуправляемой нелиней- ной системы. Другими словами, здесь важнейшими свойствами являются самодвижение и самоорганизация, а истинное понимание процессов заключается в изучении причин самоор- ганизации. В синергетическом же подходе, развиваемом в данной книге, предполагается осу- ществить переход от непредсказуемого поведения системы по алгоритму диссипативной струк- туры к управляемому движению вдоль желаемых инвариантных многообразий, к которым будут подстраиваться все другие переменные динамической системы. Здесь цель уже выступает как определяющая сущность процесса, а его истинное понимание состоит в самоуправлении и самоорганизации в соответствии с поставленной целью. Таким образом, в нелинейных динамических системах необходимо различать причинный и целевой способы их самоорганизации? Общим объединяющим началом, позволяющим раскрыть закономерности обоих способов самоорганизации процессов, является синергетический подход. Концептуальные положения синергетической теории управления Современная теория управления весьма успешно освоила методы довольно грубого внешнего воздействия на различные технические объекты, однако, на наш взгляд, наступило время пересмот- ра силовых подходов в задачах управления и перехода на идеи самоорганизации синергетики. Отсюда вытекает насущная потребность поиска путей целевого воздействия на процессы самоор- ганизации в нелинейных динамических системах. Другими словами, возникла необходимость создания способов формирования и возбуждения внутренних сил взаимодействия, которые могли бы породить в фазовом пространстве систем устойчивые диссипативные* структуры, адекватные физической (химической, бйЪлогической) сущности соответствующей системы. В философском плане такого рода подход к задачам управления согласуется с древнекитайским принципом Дао, который призывает действовать в этом мире в соответствии с природой (208,214] .По этому поводу китайский философ Люй Бу-Вэй писал: “Предположим, силач У Хо со всей силой тянет быка за хвост до такой степени, что хвост оторвался, а сила у силача иссякла. Между тем бык не сдвинулся ни на шаг с места. Это происходит оттого, что человек идет наперекор естественности. Теперь допустим, мальчик ростом пять чи ведет быка за уздечку и бык подчиняется ему вр всем. Это происходит оттого, что человек в данном случае следует естественности.” Последние результаты общей теории развития, и в частности, синергетики, позволяют надеяться, что теория управления, как и другие науки, способна пойти путем естественности с целью перехода на новые концептуальные основы. В этой связи представляется весьма перс- пективным для развития современной теории автоматического управления осуществить по- пытку переноса базовых свойств синергетических систем на конструируемые системы управ- ления нелинейными динамическими объектами. Для такого переноса выделим отличительные свойства синергетики, принципиально важные для формирования основ синергетической тео- рии управления. Процессы самоорганизации в системах различной природы имеют следующие отличитель- ные признаки [83, 144, 243]: во-первых, движение системы должно протекать в нелинейной области ее пространства; во-вторых, открытость (разомкнутость) системы, что равносильно обмену энергией или веществом .(и, возможно, информацией) с внешней средой; в-третьих, кооперативность, когерентность протекающих в системе процессов', в-четвертых, наличие неравновесной термодинамической ситуации, согласно которой приток энергии к. системе должен быть достаточным не только для погашения роста энтропии, но и для ее уменьшения, что усиливает порядок в системе. Выделенные четыре основных признака самоорганизации со всей очевидностью показывают, что синергетика имеет дело с неклассическими процессами и явлениями физики, в том числе и теории управления. Для применения методов синергетики в теории управления необходимо удовлетворить указанным четырем признакам самоорганизации. Из них первостепенным в концептуальном плане является второй признак, т.е. открытость системы, без выполнения которого обеспечить 31
другие признаки принципиально невозможно. В этой связи возникает важный вопрос о том, к какому виду следует относить системы автоматического управления: к изолированным или открытым системам (в термодинамическом смысле). Ответ на этот вопрос таков. В исходно: постановке стандартной задачи управления система описывается дифференциальными урав нениями объекта, в состав которых входят некоторые внешние силы, состоящие из искомы управлений //((), задающих q(t) и (возможно) возмущающих M(t) воздействий. Объект по действием этих сил может совершить соответствующее движение. Однако такая формулировк задачи управления еще недостаточна для возникновения явления самоорганизации. С целы перехода от описанной схемы “объект—внешние силы” к уравнениям самоорганизации необ ходимо эти силы соответствующим образом исключить. Для этого, очевидно, следует расти рить исходные уравнения системы “объект—внешние силы” таким образом, чтобы включен ные в уравнения системы внешние силы оказались для нее внутренними [243]. Тогда для новой расширенной системы ее уравнения могут стать уравнениями самоорганизации, т.е. в резуль тате указанного расширения можно перейти от организации системы к ее самоорганизации. Именно такого рода расширение, по существу, и происходит при соответствующей форму лировке проблемы синтеза систем управления^которая состоите определении законов управ ления и(х\,...,хп) в функции координат состояния системы. Эти законы, являющиеся уравне ниями регулятора, должны обеспечить желаемые динамические свойства замкнутой систем! “объект—закон управления (регулятор) ”. Тогда по отношению к новой, расширенной систем! (“объект—регулятор”) целесообразно и применить соотношения, характеризующие процесс! самоорганизации в сортветствии с выделенными выше признаками. Другими словами, исход ная система, состоящая из некоторого динамического объекта л действующих на него внешни сил (управляющих, задающих и возмущающих воздействий), в результате замыкания прямы ми и обратными связями преобразуется в новую, расширенную систему. При этом первона чальные воздействия, бывшие внешними силами по отношению к исходному объекту, стано вятся внутренними силами расширенной системы. Такая система действительно становита открытой (в термодинамическом смысле) и через нее будут протекать энергия или веществ и информация от соответствующего источника. Носителями же энергии или вещества и инфор мации как раз и будут синтезируемые управления. Итак, для применения синергетического подхода, основанного на кооперативных процес сах самоорганизации, в проблемах управления необходимо перейти от исходной задачи управ ления, включающей в себя уравнения объекта и внешние силы (в виде управляющих, задаю щих и возмущающих воздействий), к расширенной постановке задачи таким образом, чтобь указанные силы стали внутренними взаимодействиями общей (замкнутой) системы. Для этого, в частности, следует представить внешние задающие q(f) и возмущающе! воздействия М(0 как частные решения некоторых дополнительных дифференциальных урав нений и тем самым осуществить их “погружение” в общую структуру системы. Затем сам) проблему управления необходимо уже формулировать как задачу поиска законов взаимодей- ствия между компонентами расширенной системы, обеспечивающие возникновение в не» процессов самоорганизации. Конкретно эта проблема сводится к синтезу соответствующт законов замкнутого управления u(xi,...,xn,zi,...,zr) в функции координат состояния расширен- ной системы. Тогда путем подведения энергии или вещества в такой расширенной системе можно создать неравновесную ситуацию, необходимую для возникновения управляемых про- цессов самоорганизации. Именно указанное расширение исходной системы и формирование уравнений самоорганизации позволяет установить связь между методами синергетики и про- блемой синтеза нелинейных систем управления. Отсюда следует, что синергетическая теория управления—это, прежде всего, теория синтеза систем замкнутого управления на основе формирования самосогласованных, кооперативных процессов в системах различной природа. Сформулируем, теперь базовые положения синергетической теории управления. Во-первых, в синергетических системах в процессе самоорганизации и образования дисси- пативных структур (аттракторов) происходит уменьшение числа степеней свободы путем 32
выделения лишь нескольких координат, к которым подстраиваются остальные. Именно эти Выделенные переменные и определяют основные особенности динамики системы, и поэтому они получили название параметров порядка [83]. Указанные параметры порядка позволяют выявить глубокие закономерности в поведении нелинейных динамических систем на основе построения иерархии базовых упрощенных (агрегированных) моделей, учитывающих взаимо- действие лишь нескольких переменных. Иначе говоря, в нелинейных диссипативных системах в результате самоорганизации происходит динамическая декомпозиция фазового пространст- ва, приводящая к выделению параметров порядка—макропеременных, к которым подстраи- ваются остальные координаты систем. Очевидно, что образование параметров порядка сопро- вождается процессом сжатия объемов (площадей) в фазовом пространстве систем. Во-вторых, следствием процесса самоорганизации является образование аттракторов—инва- риантных многообразий, к которым притягиваются траектории системы. Такое поведение системы позволяет поставить вопрос о направлении процессов, об их целях. Указанные аттракторы имеют размерность, всегда меньшую размерности исходной системы, что означает “забывание” началь- ных условий, откуда начинаются траектории движения к аттрактору. Следствием этого является образование инвариантных решений нелинейных дифференциальных уравнений систем, представ- ляющих собой асимптотику большого класса других решений. В-третьих, каждый аттрактор имеет свою область притяжения в фазовом пространстве и поэтому можно выделить границу, разделяющую эти области. Тогда достаточно малое изме- нение начальных условий, находящихся вблизи указанной границы, может привести к качест- венно различному поведению всей нелинейной системы. Это будет означать, что, прилагая к системе достаточно малые воздействия, согласованные с ее внутренними свойствами, можно обеспечить качественно новое поведение нелинейной системы вдали от ее положения равно- весия. При этом часто оказывается, что амплитуда и продолжительность таких воздействий менее важны, чем их соответствие внутренним динамическим свойствам системы, определяе- мых типом и структурой аттракторов. Такое необычное свойство, объясняемое эффектом самоорганизации в диссипативных системах, открывает новые возможности в решении задач управления нелинейными динамическими объектами разной природы. Выделенные здесь основополагающие принципы и свойства синергетических систем имеют первостепенное значение для развиваемой в этой книге синергетической теории управления. Разумеется, что при этом возникает весьма непростая проблема перехода от естественных сине- ргетических принципов к количественным соотношениям, например, при решении известной своей сложностью современной фундаментальной проблемы синтеза нелинейных динамических систем. Непосредственное применение изложенных выше общенаучных фундаментальных концепций синергетики в задачах управления нелинейными динамическими объектами является весьма не- простой проблемой, связанной со следующими важными обстоятельствами. Во-первых, методы синергетики отражают явно целостный, холистический подход в науке, который пока не занимает доминирующего положения в теории автоматического управления и'в определенной мере'даже противоречит сложившимся в ней традиционным направлениям. Во-вторых, введение методов : синергетики неизбежно приводит к необходимости перехода на новый базовый язык науки—язык . инвариантов, который хотя и лежит в основе классического естествознания, однако во многом непривычен для современной теории управления. В-третьих, и это, возможно, самое важное, развиваемый в книге синергетический подход в нелинейной теории управления должен, по-види- мому, обязательно пройти трудный путь преодоления^ психологического барьера”, состоящего, согласно сложившейся в науке добротной консервативной традиции, из следующих известных этапов: “этого не может быть”—“в этом что-то есть”—и, наконец, “это само собой разумеет- ся”. По этому поводу М. Планк говорил, что: “...научная идея редко внедряется путем посте- пенного убеждения и обращения своих оппонентов... В действительности дело обстоит так, что оппоненты постепенно вымирают, а растущее поколение сразу осваивается с новой идеей”. . Эти, возможно, слишком пессимистические слова великого физика, основоположника кван- товой механики, объясняют известный в истории научного познания парадокс, согласно кото- • рому чем очевиднее фундаментальное положение, тем труднее к нему не только прийти, но и 33
особенно внедрить в существующие концепции соответствующей науки [243]. По-видимому, такого рода примером может служить базовый язык инвариантов, введение которого в теорию управления представляется совершенно очевидным и естественным. Именно эффективность и время преодоления указанного “психологического барьера” во многом определяют, как всегда в науке, успех среди ученых и специалистов той или иной новой теории, в том числе и синергетического подхода в нелинейной теории управления. Изложенные здесь обстоятельства приводят к целесообразности рассмотрения основной проблемы современной теории управления, а также изучения достоинств и недостатков суще- ствующих подходов к ее решению. И только выявив принципиальные трудности в дальнейшем развитии этой проблемы, можно перейти к формированию синергетических основ нелинейной теории автоматического управления. Имеются основания надеяться, что синергетический подход позволит создать теорию синтеза систем управления нелинейными объектами различ- ной природы, имеющую естественно-научное обоснование как применение фундаментальных принципов сохранения в проблемах управления. 1.2. ОСНОВНАЯ ПРОБЛЕМА ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Введение. Среда жизнедеятельности и существования современного человека—это мир весьма разнообразных систем—живых, технических, природных (экологических) и социаль- ных, непрерывно взаимодействующих друг с другом. Окружающая нас техносфера стала несравненно сложнее и гораздо подвижнее, чем когда-либо ранее. Такие сложные и динамичные комплексы, как авиационно-космические, энергосистемы, гибкие автоматизированные производства, биотехнические и транспортные системы и многие другие, а также отдельные современные агрегаты и установки имеют огромные мощности протекания происходящих в них процессов и создают для человека острые проблемы, требу- ющие от него быстрых и целесообразных управляющих воздействий. Ответом на эту ситуацию с целью проектирования и эксплуатации такого рода сложных систем явилось рождение множества новых научно-технических направлений, которые нередко обособляются, разраба- тывают свои частные методы и технические средства, но, по существу, занимаются весьма узкой областью знаний. Однако в современной науке и технике имеется и противоположная тенденция формирования общих единых представлений и принципов. К таким объединяющим наукам как раз и относится теория управления— кибернетика [45], которая в настоящее время испытывает бурный рост и все расширяющееся применение. Ни одна действительно настоящая наука, возможно за исключением физики, не знала такого развития и не вовлекала в свою сферу так много людей и технических средств. Наука об управлении является неотъемлемой и одной из основных частей научной революции нашего времени [84]. С помощью этой науки могут быть решены многие конкретные сложные проблемы, стоящие перед современной техникой, экономикой и социальным прогрессом общества. Наука об управлении возникла вовсе не на стыке разных наук, а в результате осмысления и обобщения многих из них и их объединения. Благодаря такому синтезу эта наука дала в руки человека методы и средства для отыскания и реализации эффективных стратегий управления в весьма широких областях—от технических комплексов до сложных биосистем, экономических и производственных систем. Другими словами, наука об управлении является наукой нового, синтетического типа, она базируется на единых принципах управления живыми, техническими, экономическими, эко- логическими и, во-многом, социальными системами [45]. В общем случае управлять—это значит достигать каких-либо целей, а любой процесс целенаправленной деятельности—это всегда управление. Принципиальное отличие биологи- ческих процессов от процессов, протекающих в неживой природе, состоит в том, что биологи- ческие—это, по меньшей мере, управляемые процессы. Для живых систем одна из главных целей управления сводится к их самосохранению—гомеостазису, поэтому подобные системы сконструированы таким образом, чтобы это свойство сохранить и максимально поддерживать 34
при действии на них различных возмущений со стороны окружающей внешней среды или других систем [106, 225]. Математическая модель объекта, обратная связь, информация, закон (алгоритм) управле- ния, критерий оптимальности и адаптация—вот базовые понятия современной науки об авто- матическом управлении, а автоматические регуляторы, микропроцессоры и микроЭВМ—это ключевые слова техники автоматического управления. Эти важнейшие понятия в совокупно- сти объединяются обобщающим определением “система автоматического управления”. При решении большинства современных трудных технических, экономических и т.п. проблем руководящей идеей является системный подход, позволяющий спроектировать наилучшую по многим показателям качества систему.. Именно достижения в решении проблемы проектиро- ! вания высокоэффективных систем управления во многом определяют перспективы создания нового класса технологических и подвижных объектов, автоматически функционирующих в Интенсивных режимах работы и предназначенных для решения различных технико-экономи- ‘ ческих, энергетических, транспортных, биотехнических, космических и другим проблем, сто- ящих перед человеком в настоящее время и в ближайшем будущем. Перспективы создания такого рода новых экономичных и экологически безопасных объектов определяются также и тем важным обстоятельством, что достигнутый в настоящее время уровень развития средств автоматики и вычислительной техники позволяет реализовать весьма сложные, оптимальные алгоритмы управления. Задача о регуляторе. Современный этап развития индустриального общества характери- зуется повсеместным внедрением во все отрасли промышленности и техники средств автома- ' тизации, начиная от простых локальных устройств и до сложных управляющих комплексов. Это связано с тем, что промышленность все в большей мере насыщается различными мощными ‘ агрегатами с повышенными технологическими показателями, и эти агрегаты представляют собой сложные динамические объекты, которыми необходимо наилучшим образом управлять. При этом конечной целью является создание в ближайшем будущем автоматизированных и робототизированных производств. Одной из центральных проблем, возникающих при созда- нии такого рода производств, является проектирование и реализация на современной техни- ческой базе эффективных систем автоматического управления, обеспечивающих высокое качество функционирования управляемых объектов и технологических процессов. На первом этапе проектирования указанных систем основной задачей является синтез таких управляю- щих устройств—автоматических регуляторов, которые могли бы гарантировать асимптотиче- скую устойчивость замкнутых систем и удовлетворить определенной совокупности инженер- ных требований (в целом ряде случаев—противоречивых) к качественным свойствам систем в Переходных процессах и установившихся режимах движения, а также к их технико-экономи- ческим показателям. Поставленная выше задача—так называемая задача о синтезе регулятора, является карди- нальной в теории и практике автоматического управления, она берет начало еще с работ И.А. Вышнеградского и прошла к настоящему времени впечатляющий путь своего развития. Сде- лаем весьма краткий обзор развития задачи о синтезе регулятора, которая имеет период выдающихся достижений и относительного затишья и достойна самостоятельного исследова- ния. Поэтому ограничимся лишь относительно беглым взглядом на этапы развития этой проблемы, попытавшись достаточно схематично выделить главные ее вехи, уделяя основное внимание прикладным методам решения и оптимальным системам, т.к. “главная задача специ- алиста по автоматике состоит, как указывал А.М. Летов [152], в управлении переходным процессом. Он должен найти и метод и средства гашения этого процесса в некотором смысле наилучшим образом”. В решении этой основной проблемы автоматического управления при- няли участие многие выдающиеся инженеры и математики разных стран. Первые практически важные результаты решения задачи о регуляторе были получены в 40-50-х годах, когда в работах В.В. Солодовникова, Б.Н. Петрова, Т. Честната, А.А. Фельдба- ума и ряда других ученых она была сформулирована как задача о выборе типа и параметров корректирующих устройств. В основу расчета корректирующих устройств были положены, в 35
первую очередь, частотные методы, а также корневые методы и интегральные оценки. Такая постановка и формализация задачи о регуляторе явилась существенным шагом вперед в проблеме проектирования линейных систем автоматического регулирования, следящих систем и до сих пор успешно используется для синтеза регуляторов различных одномерных объектов. Практическая ценность и распространение этого способа при проектировании регуляторов объясняется его физической ясностью, связанной с использованием первичных показателей качества систем (времени и характера затухания переходных процессов, перерегулирования, точности в установившемся режиме и др.), а также его предельной простотой. Этот способ во многом соответствовал инженерным представлениям о сущности и цели регулирования. Одна- ко указанный способ синтеза регуляторов ориентировался в основном на линейные одномер- ные объекты, инженерную интуицию и “ручные” методы расчета. Эти обстоятельства могут привести к пропуску и потере наилучшего решения в отношении структуры регулятора и к значительным затратам времени при проведении многовариантных расчетов корректирующе- го устройства. Эти трудности особенно возрастают и становятся доминирующими при синтезе регулятора многомерных и многосвязных систем. Аналитическое конструирование оптимальных регуляторов. Развитие теории управле- ния и ее применение для широкого класса динамических объектов разнообразной физической природы требовало дальнейшего поиска и разработки таких формализованных методов реше- ния задачи о регуляторе, которые позволяли бы математическим путем синтезировать законы оптимального управления, обеспечивающие желаемые качественные свойства проектируемых* систем. В этой связи в 60-х it. в работах А.М. Летова [2,12], Р. Калмана [ 16,157,199], Н.Н. Kpa-j совского [1, 129], В.И. Зубова [13], А.А. Красовского [14, 15], М.М. Атанса и П. Фалба [18] 1> многих других ученых существенное развитие получила теория аналитического конструиро-j вания оптимальных регуляторов (АКОР). Метод АКОР, согласно определению А.М. Летова! [12], представляет собой процедуру синтеза закона управления в функции координат состояв ния объекта чисто аналитическим путем, т.е. строго на основе математического анализа, исходя из единых требований к качеству переходного процесса в форме минимума некоторого выбран] ного оптимизирующего функционала (критерия качества). Таким образом, задача АКОР—эта задача синтеза закона управления, обеспечивающего минимум критерия качества на траекто^ риях движения объекта из произвольного начального (в некоторой допустимой области про4 странства состояний) в заданное конечное состояние. Очевидно, что закон управления, пол] ученный в результате применения метода АКОР, будет представлять собой некоторую сово-f купность обратных связей по соответствующим координатам объекта, т.е. уравнение оптимального регулятора. Подводя итоги начального этапа формирования теории АКОР < рассматривая перспективы ее развития, А.М. Летов сделал в докладе [152] на конгрессе ИФАК? следующие выводы: • проблема синтеза оптимальных регуляторов является основной для современной теории автоматического управления; • ее строгая постановка базируется на концепции Ляпунова возмущенного движения, служит вполне естественным продолжением и дальнейшим развитием этой концепции в качестве ее количественного аспекта; • физическое и математическое содержание проблемы определяется как природой объекта управления, так и видом критерия оптимальности; • во многих случаях детерминированных и стохастических систем, представляющих самостоятельный практический интерес, эффективное решение проблемы синтеза может быть достигнуто как применением методов вариационного исчисления, так и метода Беллмана-Ляпунова; • в этих случаях разрешение простейшей задачи об оптимизации линейных систем по квадратичному функционалу играет основную роль; 36
• ми располагаем теперь эффективными критериями, позволяющими сказать, является ли проблема синтеза разрешимой или нет; • наблюдаемые в литературе настойчивые поиски новых методов решения—методов функционального анализа и приближенных методов—а также новых случаев разрешимости проблемы, свидетельствуют о том, что начинает вырисовываться четкий контур стройной теории, основанной на едином методе; • тематика исследований по проблеме синтеза имеет хорошую перспективу развития на ближайшие роды. Со времени формулировки этих крупных и основополагающих выводов теория АКОР в работах многих отечественных и зарубежных ученых была распространена на многомерные линейные нестационарные системы и к настоящему времени превратилась в развитую матема- тическую теорию синтеза систем как в детерминированной, так и стохастической постановках {19, 30—33, 155, 156, 168]. Эта теория достигла сейчас высокой степени теоретической завершенности применительно, в первую очередь, к линейным объектам и квадратичным оптимизирующим функционалам—критериям качества. Методы АКОР предельно формали- зованы (см. п. 1.3), их отличает аналитичность и логическая завершенность, они позволяют (для линейных объектов) определить структуру закона управления, гарантирующего, по мень- шей мере, асимптотическую устойчивость замкнутой системы. Необходимо отметить, что методы АКОР уже вошли в учебные курсы для подготовки специалистов в области автомати- ческого управления. В известных учебных пособиях В.А. Олейникова [92], В.А. Иванова и Н.В. Фалдина [10], X. Квакернака и Р. Сивана [168] и др. показана неоспоримая значимость этих методов в деятельности современного инженера по автоматическому управлению различ- ными подвижными и технологическими объектами. Однако методы АКОР при практическом применении наталкиваются на целый ряд суще- ственных затруднений вычислительного и принципиального характера. Так, с повышением порядка объекта быстро нарастают численные и тем более аналитические трудности, связан- ные, как известно [12, 14], с необходимостью решения нелинейных уравнений в частных производных относительно производящей функции, к которым сводится процедура определе- ния законов управления. Для линейных стационарных объектов и квадратичных функциона- лов указанные уравнения приводят к нелинейным алгебраическим уравнениям типа Риккати, определяющим коэффициенты линейного закона управления. Следует отметить, что в насто- ящее время имеются стандартные программы решения алгебраических уравнений Риккати на ЭВМ. Несмотря на указанные здесь трудности применения методов АКОР, связанные, напри- мер, с численным решением уравнений Риккати, особенно высокого порядка, основной недо- статок этих методов с прикладной, инженерной точки зрения состоит в другом. Дело в том, что используемые в методах АКОР критерии качества представляют собой постулируемые (как правило, квадратичные) оптимизирующие функционалы с заранее выбранной структурой и заданными весовыми коэффициентами. Квадратичные критерии, в отличие от критериев быс- тродействия и минимума энергозатрат, являются в известном смысле косвенными, т.е. не связанными однозначно, напрямую с инженерными требованиями к качеству замкнутых сис- тем. Другими словами, то обстоятельство, что в теории АКОР непосредственно не рассматри- ваются общепринятые в инженерной практике прямые показатели качества синтезируемых систем, ставит под сомнение “оптимальность” получаемых при этом решений. Это и послужило поводом для критики методов АКОР, основанных на постулировании квадратичных критериев качества и чрезмерной формализации процедур синтеза, что в определенной мере даже подо- рвало интерес инженеров, занимающихся проектированием разного рода систем управления. В связи с изложенными трудностями практического применения методов АКОР было выдви- нуто несколько точек зрения. Так, В.В. Солодовников отмечал, что нерешенная задача проек- тирования регуляторов по заданным первичным показателям качества “была заменена другой, причем первая соответствовала самой сущности проблемы регулирования, а вторая была с ней лишь косвенно связана” [26]. Основоположник же теории АКОР А.М. Летов, с одной стороны, 37
указывал, что “АКОР, будучи чисто математической операцией, решает те же самые задачи, которые пытается разрешить инженер интуитивно, при обычном конструировании, используя при этом строгие понятия оптимальности”, а с другой стороны, отмечал, что основная задача АКОР сводится к выбору оптимизирующего функционала, т.е. он выступает как постулат. Поэтому, “... когда мы научимся решать проблему выбора, конструирование систем управле- ния будет выполняться на строго научной основе [12], в противном случае неизбежно возни- кает вопрос: не представляет ли постулирование попытку скрыть за словом “оптимальность” практическую бесполезность предлагаемых решений?” В этой связи А.М. Летов предлагал, как одно из возможных направлений в преодолении указанных выше трудностей применения методов АКОР, ввести вместо одного постулируемого критерия совокупность вторичных критериев, каждый из которых отражал бы некоторое частное требование к качеству системы. Эти вторичные критерии представляются в виде изопериметрических ограничений. При таком подходе исходный функционал уже не является неизменным и основная задача состоит не столько в том, чтобы достигнуть минимума функционала, сколько в том, чтобы завершить процедуру синтеза управления, удовлетворяющего совокупности технических требований к проектируемой системе. Однако поставленная таким образом проблема выбора технического рационального критерия качества системы до настоящего времени не получила в прикладном плане удовлетворительного решения. Имея в виду изложенные выше трудности в формировании структуры и весовых коэффи- циентов критериев качества в методах АКОР, основоположник современной теории оптими- зации нелинейных динамических систем по неклассическим критериям обобщенной работы академик А.А. Красовский считает [14], что эти методы вообще следует рассматривать не как полностью формализованные, а как методы поиска оптимальной структуры и параметров закона управления. И только в весьма редких случаях удается с первого раза выбрать целесо- образную форму и структуру критерия качества, который бы удовлетворял желаемой совокуп- ности инженерных требований к системе. Иначе говоря, процедуры АКОР должны быть в большинстве случаев итерационными при подборе весовых коэффициентов критериев. Это и подчеркивает отмеченное выше сомнение инженеров в отношении “оптимальности” систем, получаемых на основе строго постулируемых квадратичных критериев качества. Изложенные различные точки зрения на методы АКОР показывают, что помимо отмечен- ных достоинств этих методов, они непосредственно не опираются на прямые показатели качества синтезируемых систем, а это, в свою очередь, приводит к существенным затруднениям при их практическом применении. Проблема целесообразного выбора весовых коэффициентов постулируемых квадратичных критериев качества даже для линейных систем остается до сих пор в должной мере нерешенной. Необходимо отметить, что указанные точки зрения на синтез регуляторов отражают положение, сложившееся к настоящему времени в теории автоматического управления. С одной стороны, существует традиционный подход к синтезу регуляторов, опирающийся на длительный практический опыт применения классической теории автоматического регулиро- вания, когда качество регулятора оценивалось по характеру переходного процесса, который должен быть быстрозатухающим и с малым перерегулированием. С другой стороны, в насто- ящее время получил существенное развитие новый, оптимизационный подход к синтезу регу- ляторов, основанный на современной теории оптимального управления. Этот подход вовсе не противоречит классическому, основанному на желаемых свойствах переходного процесса, а развивает и уточняет его, т.к. базируется на использовании оптимизирующих функционалов, отражающих, как известно, существенно более широкие, глобальные свойства систем по сравнению с оценками их свойств по характеру переходных процессов. Это связано с тем, что, выбрав оптимизирующий функционал, можно минимизировать его и получить дифференци- альные уравнения Эйлера—Лагранжа, являющиеся желаемыми уравнениями движения замк- нутой системы. И только решив эти уравнения, можно говорить о характере переходных процессов. Это означает, что при оценке динамики синтезируемых систем очевидна следующая . иерархическая подчиненность: доминирующее положение занимает оптимизирующий функ- 1 38
ционал, отражающий всеобъемлющий вариационный принцип науки, за ним следуют диффе- ренциальные уравнения замкнутой системы, полученные из условий минимума функционала, и, наконец, переходные процессы, являющиеся решением этих дифференциальных уравнений. Итак, оценка свойств синтезируемых систем по характеру переходных процессов находит- ся на самой нижней ступени, а оптимизирующий функционал—на самой верхней ступени указанной выше иерархической подчиненности в динамике замкнутых систем. Это обстоятель- ство указывает не на антогонистичность оценок свойств систем на основе классических и современных подходов, как это может показаться на первый взгляд, а, наоборот, на их тесную связь и последовательное развитие. Отсюда со всей очевидностью следует, что ни одному из рассматриваемых подходов к оценке свойств синтезируемых систем не следует отдавать одно- значного предпочтения. Эти подходы находятся в тесной взаимосвязи, они должны дополнять друг друга при практическом синтезе регуляторов, в противном случае могут возникнуть непреодолимые противоречия. Примером такого противоречия является требование одновре- менно высокого качества стабилизации в условиях действия случайных возмущений и быстрого затухания переходных процессов [126]. При этом часто даже не оговаривается, о каком переходном процессе идет речь, для каких начальных условий и т.д. Один из распространенных первичных показателей—время регулирования по некоторой координате в многомерных сис- темах также точно не определено, а имеет интуитивный характер. Для некоторых воздействий и начальных условий, например для ступенчатых и гармонических, понятию времени регули- рования можно дать точное определение [155]. Аналогичные соображения можно высказать и по поводу других распространенных первичных показателей качества. С другой стороны, и современный подход к синтезу систем с помощью оптимизирующих функционалов, как это показано ранее, не приводит к полностью физически ясным и наглядным оценкам свойств систем. В то же время в практике проектирования регуляторов накоплен огромный опыт и установились традиции, приемы и рекомендации, которые целесообразно использовать и на современном этапе развития задачи о синтезе регулятора. Это и приводит к целесообразности установления алгоритмических или аналитических связей между классическим и современным подходами к оценке динамических свойств замкнутых систем. В последнее время появился ряд работ, в которых авторы предприняли попытки разрешить вопрос о целесообразном формировании структуры и выборе коэффициентов квадратичных критериев качества. Так, некоторые авторы [27, 28, 173] пытаются установить связи между весовыми коэффициентами критерия качества и корнями (а чаще—коэффициентами) харак- теристического уравнения замкнутой линейной системы, т.е. установить, по существу, неко- торые связи между методами АКОР и модального управления. Выявление такого рода связей несомненно полезно, в особенности это касается задач с несколькими управлениями. Это связано с тем, что число параметров законов оптимального управления обычно намного больше числа весовых коэффициентов квадратичных критериев качества. Так, для линейного объекта д-го порядка с т управлениями число параметров векторного закона управления будет равно тип, которое нужно найти в результате применения процедуры модального управления. Между тем, для квадратичного критерия качества с диагональной матрицей весовых коэффи- циентов требуется не более п таких коэффициентов. Однако в тех случаях, когда методами модального управления можно достаточно просто найти коэффициенты закона управления, исходя из желаемого распределения корней характеристического уравнения замкнутой систе- мы, возникает сомнение в целесообразности привлечения каких-либо квадратичных критериев качества. В работах Ю.П. Петрова [17,126] изложены методы проектирования регуляторов, доставля- ющих минимум среднеквадратичным критериям для линейных систем в условиях действия на них случайных возмущений. Синтезируемые регуляторы, кроме того, обеспечивают выполнение до- полнительных требований к системе, например стабильность при отклонениях параметров линей- ных объектов от расчетных значений, при этом разработана приближенная процедура расчета множителя Лагранжа—весового коэффициента среднеквадратичного критерия, выявлены пре- дельные свойства синтезируемых линейных систем и др. В работах А.Г. Александрова [155, 156], 39
по существу, впервые достаточно,успешно реализована попытка преодоления ранее отмечен- ных трудностей в применении методов АКОР для линейных многомерных систем, при этом синтезируемые регуляторы обеспечивают удовлетворение требований к точности, полосе пропу- скания, грубости, показателям колебательности и др. Разумеется, что установленные связи между первичными показателями качества синтезируемых систем, отыскиваемой формой и весовыми коэффициентами квадратичных, функционалов являются алгоритмическими, а это потребовало разработки объемного матекщуцческого обеспечения для реализации на ЭВМ процедур синтеза регуляторов многомерных с,истег*|. Подведем теперь некоторые, итоги изложенного выше краткого обзора работ по проблеме синтеза оптимальных регулятороа-тт-основной проблеме современной теории автоматического управления, которая была поставлена А.М. Летовым еще в докладе (152] и прошла с тех пор крупные этапы в своем развитии. К настоящему времени в автоматическом управлении сфор- мировалась фундаментальная теория АКОР— аналитического конструирования оптимальных регуляторов в детерминированной и стохастической постановках, которая совместно с теорией наблюдаемости и управляемости составила основу современной математической теории син- теза регуляторов для линейных многомерных и многосвязных систем. В линейной теории синтеза оптимальных систем, которая в математическом плане имеет фактически завершенный характер, существуют свои нерешенные задачи в основном прикладного характера, связанные, в первую очередь, с наличием постулируемых величин (формы и весовых коэффициентов оптимизирующего квадратичного функционала, коэффициентов наблюдающего устройства и др.). В рамках математической теории синтеза непосредственно не рассматриваются прямые инженерные показатели качества систем, что, вообще говоря, ставит под сомнение “оптималь; ность” получаемых законов управления и служит поводом для критики методов АКОР. В настоящее время во многих работах предпринимаются попытки для преодоления указанных недостатков этой теории синтеза, основанные на широком использовании ЭВМ, однако име- ется ряд принципиальных трудностей в применении данной теории к прикладным задачам управления. 1.3. ПРОБЛЕМА АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ НЕЛИНЕЙНЫХ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ Введение. В настоящее время общепринято, что действительный уровень развития той или иной науки определяется во многом видом используемых на данном этапе соответствующих математических моделей, описывающих предметную область этой науки. Так, классическая теория автоматического управления сначала оперировала в основном только линейными ста- ционарными моделями в виде “вход-выходных соотношений” (передаточных функций), а затем моделями, представленными в пространстве состояний, с учетом иногда лишь некоторых нелинейностей. Справедливость принципа суперпозиции (наложения) для линейных систем позволила разработать настолько общие и эффективные методы решения линейных задач управления, что невольно наталкивает студентов и некоторых исследователей на мысль: это основной принцип математического естествознания, а всякого рода нелинейности являются досадной неприятностью, которую следует тем или иным “способом” избежать. Такой взгляд ведет к повальной “линеаризации”, которая доминирует во многих монографиях и учебниках в необоснованных попытках упростить решение сложных, исходно нелинейных задач управ- ления. Однако это глубокое заблуждение—“... истинные законы не могут быть линейными”— указывал А. Эйнштейн. Более того, как это показано в разд. 1.1, последние достижения нелинейной динамики и синергетики позволили совершенно по-новому взглянуть на динамическую парадигму современ- ного естествознания и получить ряд исключительно парадоксальных результатов (“странные аттракторы”, “порядок в хаосе” и др.), которые никак не следуют из линейной теории. В этой связи возникает насущная потребность рассмотреть задачу об управлении как исходно нелинейную 40
проблему. Кроме того, доминирование линейного подхода, помимо очевидной научной ущер- бности, имеет существенные недостатки и в прикладном плане при разработке систем управления современными технологическими и подвижными объектами, т.к. многие из них функционируют в весьма интенсивных, а нередко и предельных, режимах работы, для которых характерны “боль- шие” отклонения координат. Естественно, что для таких режимов адекватными могут быть, как правило, только нелинейные модели движения объектов. Проблема синтеза систем управления нелинейными объектами в отличие от линейных систем несравненно более сложная и в настоящее время практически сделаны только первые шаги для ее решения, т.е. разработки методов проекти- рования нелинейных регуляторов. А ведь в большинстве случаев современные реальные системы управления должны рассматриваться как нелинейные, т.е. описываться нелинейными дифферен- циальными уравнениями. Нелинейность систем во многом определяется ограниченностью энергии и мощности процессов, протекающих в объектах различной физической природы, наличием механических, электрических и тепловых ограничений, насыщения и т.д. Учет этих ограничений в настоящее время становится обязательным в связи с требованиями интенсификации технологи- ческих процессов, когда рабочие режимы промышленных агрегатов и различных подвижных объектов становятся близкими к предельно допустимым. Кроме того, из теории управления известно, что именно в классе нелинейных моделей движения объектов можно добиться на прак- тике существенного повышения эффективности управления. На основе нелинейных моделей можно получить принципиально новые свойства процессов управления, т.е. реализовать подлинно оптимальное управление. Однако несправедливость принципа суперпозиции для нелинейных дифференциальных уравнений чрезвычайно затрудняет анализ и особенно синтез нелинейных систем управления. И здесь необходимо подчеркнуть, что несмотря на широкие возможности, которые предоставляют современные ЭВМ для численного исследования и моделирования нели- нейных систем, приходится констатировать, что наличие мощных ЭВМ привело лишь к опреде- ленному прогрессу в области параметрического синтеза, т.е. расчету параметров нелинейных систем при заранее выбранной^ структуре. Однако к принципиальному, качественному скачку в области структурно-параметрического синтеза систем управления нелинейными объектами высо- кого порядка применение современных ЭВМ пока не привело. Необходимо подчеркнуть, что в линейно-квадратичных задачах АКОР структура закона управления линейным объектом заранее предопределена и процедура синтеза сводится к вычислению его' параметров. Для нелинейных же объектов структура законов оптимального управления вообще неизвестна и поэтому здесь целесообразен поиск этих законов через соответствующий функционал, т.е. в нелинейных задачах управления теория АКОР выступает, в первую очередь, как направляющая структурно-параметрическая концепция в разработке методов синтеза нелинейных систем. Изложенные выше обстоятельства указывают на важ- ность и существенную необходимость разработки новых подходов к проблеме синтеза систем управлений нелинейными объектами, опирающихся, пр-видимому, не только на строгий ма- тематический формализм, но и на более широкие концепции современной науки о динамиче- ских системах различной природы. Порту лат устойчивости и нелинейная проблема АКОР. Применение метода АКОР Лето- ва-Калмана [12, 14} для нелинейных объектов сводит задачу синтеза к поиску решения уравнения Веллмана—нелинейного дифференциального уравнения в частных производных относительно производящей функции, кбторая определяет закон оптимального управления. В работах А.М. Летова [12, 152] установлена тесная'связь между функциями Ляпунова, разре- шающими задачу асимптотической устойчивости движения, и указанным уравнением Веллма- на. Эта связь состоит в том, что уравнению Веллмана удовлетворяет некоторое множество производящих функций. Оказывается, что действительное решение задачи оптимального син- теза могут дать лишь те из них, которые являются функциями Ляпунова для замкнутой системы. Соответственно, полученные на основе таких функций регуляторы будут оптималь- ными и, кроме того, они обеспечивают асимптотическую устойчивость движения системы. Следовательно, с помощью метода Ляпунова можно отбирать требуемые решения среди всех возможных, которые определяются уравнением Веллмана. Указанное единство и тесная связь 41
методов АКОР и Ляпунова представляет собой математически обоснованную фундаменталь- ную концепцию решения сложной проблемы, синтеза оптимальных систем управления нели- нейными объектами. В этой связи представляется важным подробнее рассмотреть существую- щие подходы к решению проблемы АКОР для нелинейных систем. Естественно сначала обратиться к свойству асимптотической устойчивости синтезируемых систем. Среди множества требований к динамическим показателям первостепенным и фундамен- тальным является свойство асимптотической устойчивости Движения замкнутой системы. Кроме того, как отмечено выше, задача устойчивости непосредственно связана с решениемтакнх важней- ших проблем теории автоматического управления, как проблемы качества систем и синтеза законов управления [1, 2]. В выдвинутом Н.Г. Четаевым “постулате устойчивости” .указывается, что “устойчивость—явление принципиально общее—как-то должна, по-видимому, проявляться в основных законах природы. Если знание конструируется по требованию малых отклонений от природы, то научное мышление отсюда должно (или может) опираться на некоторую функцию Ляпунова. Разумеется, эта функция будет всегда существовать из постулата устойчивости” [3,4]. Поставив вопрос: Какой вид должен иметь закон, постулирующий независимо дт отдельно дейст- вующих сил известного рода устойчивость?—он отвечал: “Согласно теореме Ляпунова об устой- чивости интересующий нас закон должен оговаривать существование некоторой функции со свойствами функций Ляпунова” [4]. Сформулированный Н.Г. Четаевым постулат устойчивости основан на замеченной им тесной связи проблемы устойчивости с принципами механики и физики. В его работах показано, что известные классические законы физики, основанные на единых вариационных принципах, а также выявленные путем построения соответствующих математиче- ских моделей рассматриваемых явлений на основе опытных данных, обладают-определенного рода устойчивостью. Из этого постулата вытекает, что при построении математического описания реальных процессов необходимо опираться на отбор устойчивых движений материальных объек- тов. Приложение постулата устойчивости Н.Г. Четаева к рассматриваемой здесь проблеме синтеза динамических систем означает, что в основу процедур синтеза должно быть положено построение асимптотически устойчивых движений, описываемых некоторой совокупностью дифференциальных уравнений. Свойство устойчивости таких движений можно выявить с помощью функций Ляпунова [5], удовлетворяющих определенным условиям. Эта общая концепция в динамике систем получила в последнее время существенное развитие в работах по синтезу асимптотически устойчивых нелинейных систем управления (1, 7, 8] и др. В этих работах в качестве единой методологической базы используется аппарат функций Ляпунова И(хь...,хя), являющихся непрерывными однозначными функциями и удовлетворяющих опре- деленным условиям [5]. Задача синтеза замкнутой системы формулируется в следующем виде: среди множества возможных законов управления и(х\,...,Хп}, являющихся функциями фазовых координат Х1,...,хи, требуется выделить некоторое подмножество или один закон управления объектом x^t) = Л(х|,...,х,„/л,...,ит), nt < п, (1.1) обеспечивающий асимптотическую устойчивость его возмущенного движения в определенной области фазового пространства или асимптотическую устойчивость в целом. Указанные зако- ны называют ртабилизирующими ust(x\,...,xn), или законами стабилизации систем [1,7, 8]. Сформулированная проблема синтеза имеет важное значение для теории и практики автома- тического управления, однако она весьма сложна и требует разработки эффективных методов решения. В настоящее время в литературе известны конструктивные результаты по решению этой проблемы в основном для линейных и некоторых частных классов нелинейных объектов [1,7,8]. Постулат Н.Г. Четаева существенно опирается на интуитивно ясное и привычное понятие асимптотической устойчивости. Как известно, это понятие может означать устойчивость рав-! новесия, устойчивое периодическое движение или движение, асимптотически приближающе-; еся к одному из указанных состояний. Согласно постулату устойчивости, только такие движе-- 42
ния и являются физически реализуемыми. Однако открытие “странных” (хаотических) ат- тракторов требует существенной корректировки постулата устойчивости. Оказывается, что в природе могут реализовываться и необычные движения на хаотическом аттракторе. На этом аттракторе отдельные траектории локально неустойчивы и поэтому не могут быть физически реализованы по отдельности, однако эти траектории реализуемы как определенная совокуп- ность движений, имеющих некоторые общие общества [85]. Напомним, что под локальной неустойчивостью здесь понимается экспоненциальное разбегание очень близких вначале фа- зовых траекторий. После того как эти траектории разойдутся на некоторое расстояние, они могут снова сблизиться, затем снова разойтись и т.д. Причина такого необычного поведения фазовых траекторий на “странном аттракторе” состоит в сочетании локальной неустойчивости этих траекторий со свойствами общего сжатия фазового потока (см. п. 1.8). Указанная особен- ность и приводит к образованию хаотических движений на некотором ограниченном притяги- вающем множестве. Для устойчивых же состояний равновесия и устойчивых периодических движений харак- терно общее сжатие фазового потока и локальная устойчивость траекторий. Именно для такого распространенного, но, как оказалось, частного варианта поведения природных систем и был Выдвинут постулат устойчивости Н.Г. Четаева, когда о возможном существовании “странных аттракторов” в фазовом пространстве ничего не было известно. В этой связи постулат устой- чивости справедлив, в первую очередь, для определенной группы природных процессов, которым всегда присущи порядок и ассимптотическая устойчивость. Итак, физически реализуемыми могут быть не только асимптотически устойчивые траек- тории, но и локально неустойчивые движения в форме некоторой совокупности траекторий, расположенных на хаотическом аттракторе. В этом и состоит современное уточнение постулата устойчивости. Что же касается синтезируемых технических систем, для которых существова- ние “странных аттракторов” во многих случаях обычно неприемлемо (кроме специальных случаев построения нового класса стохастических генераторов [85]), то постулат устойчивости остается базовой концепцией построения таких систем. Отсюда, однако, в теории синтеза нелинейных динамических систем возникает новая проблема предотвращения возможности возникновения так называемых “странных аттракторов”, т.е. своего рода “черных дыр” в фазовом пространстве этих систем; Указанная проблема была вовсе неизвестна в классической теории автоматического управления. Теория синтеза асимптотически устойчивых нелинейных систем продолжает развиваться в разных направлениях. Основой ее являются фундаментальные положения прямого метода Ляпунова. При этом большинство методов синтеза асимптотически устойчивых систем бази- руется преимущественно на теореме Ляпунова об асимптотической устойчивости и теореме Барбашина-Красовского об асимптотической устойчивости в целом [5, 11]. К настоящему времени в этой теории на основе теорем об устойчивости сформировался подход к получению достаточных условий стабилизируемости, который состоит в следующем [7]. Вводится опре- деленно положительная функция Ляпунова И(хь...,х„) > 0 и находится ее полная производная по времени в силу уравнений возмущенного движения объекта (1.1): dV dV (12) Задача состоит в выборе такого управления для которого выполняется условие ПО 2 - Ж(х1,...,х„,о, (1.3) ще Ж(хь...,хи,0—заданная определенно положительная функция. С учетом (1.3) выражение (1.2) примет вид ” dV dV (1.4) = 5 y^Z(X|.....х„,/гьW(xi,...,x„,0+ 0. Законы управления н4/(Х1,...,х„), обеспечивающие выполнение условия (1.4), являются зако- нами стабилизации. Однако поиск стабилизирующих управлений путем разрешения неравен- ства (1.4) в вычислительном отношении крайне труден, не говоря уже о получении аналити- 43
ческих решений. Этим, по существу, и объясняется отсутствие в литературе конструктивных результатов по синтезу стабилизирующих законов управления ust(x\.х;() для достаточно общих классов нелинейных объектов. Сложность этой задачи возрастает с повышением раз- мерности объектов. Для ряда классов систем удается несколько конкретизировать условия стабилизируемости [7, 8]. Изложенный подход к синтезу стабилизирующих законов управ- ления основан на применении функций Ляпунова, удовлетворяющих условиям типа (1.4). Анализ опубликованных работ показывает, что выбор таких функций пока еще наталкивается на значительные трудности не только при аналитическом, но и алгоритмическом синтезе законов управления нелинейными объектами [1, 7, 8]. В заключение краткого изложения основных существующих результатов по синтезу стабилизирующих законов управления от- метим, что на основе условия (1.3) можно получить следующую интегральную оценку: f BVi.......x„)dt< И(хь...,х„), о связанную с качеством переходных процессов в синтезируемых системах. Существующие результаты в нелинейной теории АКОР. Перейдем теперь к краткому анализу работ в области синтеза оптимальных систем, т.е. к рассмотрению проблемы АКОР для нелинейных объектов. Устойчивость далеко не исчерпывает совокупности требований, обычно предъявляемых к динамическим свойствам синтезируемой системы. Во многих случаях необходимо также обеспечить требования к качеству управления, которое в теории оптималь- ных систем оценивается интегральными критериями качества. Задача аналитического конст- руирования оптимальных регуляторов [12] или оптимальной стабилизации систем [1] форму- лируется в следующем виде: среди возможных стабилизирующих законов управления, гаран- тирующих асимптотическую устойчивость нелинейного объекта (1.1), найти такой закон управления //Op/(xi,...,x„), который обеспечивает минимум выбранного'критерия качества * (1.5) J = J Hr(x1,...,x„,tti,..u„l) dt, о где РИ(Х],...,х„)—некоторая неотрицательная функция на траекториях движения исходного объекта (1.1). В настоящее время решению этой задачй посвящена обширная литература [7—22] и др. В нелинейной теории АКОР имеется следующая теорема оптимальной стабили- зации [1, 8]: закон управления разрешает задачу стабилизации объекта (1.1) и обеспечивает минимум критерия качества 00 00 min J IF(xi,...,xH,H|1^m) dt = f W{x\,...,xn,u\ dt = о о = Уо(Х1....х„), (1.6) если выполняются условия: а) функция Ио(Х|,...,Хи) является определенно положительной, допускающей бесконечно малый высший предел; б) функция Ж(Х1,...,х„,/о opt,—,"т opt) является определенно положительной; в) справедливо равенство S(Xi,...,XnJlj optd) ~ S fi(,Xlt-“iXn,Uj Opt)~i~ B^(Xj,...,Xn,Zfy opt) + '= 0 ; г) для произвольных управлений u^x\,...,xn) 4jOpt{x\,...,xn), j— l,2,...,m справедливо неравенство 5(xi у dxt dV dt (1.8) Функции K0(xi,...,xZ|), удовлетворяющие условиям (1.6) — (1.8) теоремы оптимальной стаби- лизации, называются оптимальными функциями Ляпунова [12,152]. Таким образом, сущест- вует глубокая связь между задачами устойчивости и оптимальности систем управления. Так, из (1.7) следует, что 44
Vo(O = - Hz(xi,...,xnjz/Opf), i- l,2,...,m. (1.9) Уравнение (1.9) устанавливает отмеченную связь между методами функций Ляпунова и оптимального управления. Использование оптимальных функций Ляпунова Fo(xi,...,xn) позво- ляет из всего множества возможных управлений выделить те, которые обеспечивают как асимптотическую устойчивость движения, так и оптимальность системы по соответствующему t критерию качества. Следовательно, устанавливается связь между качественным свойством систем—устойчивостью и количественной оценкой переходных процессов. В зависимости от вида используемых подынтегральных функций W(x\,...,xn,Uj) критерия (1.6) можно получить различные динамические свойства систем. В отношении устойчивости это связано со следующим. Для определенно положительных функций W > 0 оптимальные управления обеспечивают синтезируемой системе асимптотическую устойчивость движения. Втех же случаях, когда объект (1.1) является собственно устойчивым (при и} = 0), а функция W > 0 определенно положительной, синтезируемая система обладает свойством асимптотиче- ской устойчивости движения в целом [12, 14]. Для неустойчивых объектов применение определенно положительных функций W > 0 приводит к асимптотической устойчивости дви- жения в некоторой области фазового пространства. При использовании же функций W, не принадлежащих к классу определенно положительных, необходимо удовлетворять дополни- тельным условиям, которые могут быть получены на основе функций Ляпунова, определяю- щим асимптотическую устойчивость движения на некоторых многообразиях или во всем фазовом пространстве. Возможности поиска решений уравнения (1.9), в силу исходных уравнений объекта (1.1), определяют успех в проблеме синтеза оптимальной системы. В этой связи следует отметить, что, формально говоря, все трудности синтеза нелинейных оптимальных систем сводятся к рациональному выбору в (1.6) подынтегральных функций W(xi,...,xn,ut,...,Um), отражающих инженерные требования к качеству систем, а также к поиску решений уравнения (1.9). Однако, io-первых, выбор функций Ж, которые были бы непосредственно связаны с желаемыми свойствами движения синтезируемых систем, представляет собой самостоятельную и нерешен- ную до сих пор задачу, и, во-вторых, к сожалению, поиск решения уравнения (1.9) наталки- вается в случае нелинейных объектов на непреодолимые трудности. Поэтому недостаточно (^основанный выбор функции W хотя и может привести к устойчивому движению системы, Однако построенные на ее основе стабилизирующие управления могут оказаться малопригод- ными в отношении выполнения инженерных требований к системе. Конкретизируем процедуру АКОР для нелинейных объектов (1.1) с линейно входящими управлениями: ™ (1.10) , *i(0 = f,{xi,...,xn)+ 2 Gi^xi,...,xn)uj, г = l,2,...,n, m < n. 7=1 Сначала рассмотрим метод AKOP Летова-Калмана [12, 16]. При этом обычно критерий качества имеет вид Т 1 7 / V A -u V 2 2\ <1-П) J = 5 J ( 2 PikXiXk+ 2 dt- х 0 '«•,*=! /=1 ' Тогда оптимальное управление, доставляющее минимум критерию (1.11) на траекториях движения объекта (1.10), будет следующим [14]: 1 v / ч дУ0 “ 2 2 ^чЛ*1’•••’*«) » Ш] |=1 «*1 Уо(*ъ—,хп)—решение уравнения (1.12) z=i dXi П 2m] / П dVn 1 i « 2 Gy ~ = — т’ 2 PikXiXk . (i = l O*Z j 4*=1 (1.13) прикладном плане теперь задача синтеза закона управления (1.12) сводится к поиску вынужденного решения Ио(*ь...,*«) уравнения (1.13), являющегося нелинейным дифферен- 45
циальным уравнением в частных производных. Методы аналитического и даже численного решения этого уравнения, к сожалению, отсутствуют. Это связано с существованием множе- ства возможных вынужденных решений, среди которых могут быть устойчивые и неустойчи- вые [14]. Таким образом, непосредственное применение метода аналитического конструиро- вания Летова-Калмана [12,14] для синтеза оптимальных управлений нелинейными объектами, наталкивается на практически пока непреодолимые трудности выявления структуры и пара- , метров законов управления. Положение здесь аналогично положению с решением уравнения (1.9), записанным для более общего класса критериев качества (1.6). Между тем, хотя как математическая процедура (1.6)—(1.9), так и уравнения (1.13), известны в литературе уже давно [1, 12, 14], однако до сих пор фактически отсутствуют не только какие-либо прибли- женные аналитические, но и численные метода их решения. Открытие и разработка таких методов несомненно привели бы к значительному прогрессу в решении нелинейной проблемы АКОР. Для линейных же объектов, например, вида xtf) = “ S OikXk+ bin, i = 1,2,...,л, 4=1 оптимальное по квадратичному критерию * (п \ / = J 2 0iiXt + « л О у-1 } управление при выборе Уо = 2 S А^х/х* согласно (1.13) имеет вид [12,14]: 4=11=1 « '• (1.14) и = - 2 5 biAikxk. 4=11=1 В выражении (1.14) коэффициенты А,* находятся из системы алгебраических уравнений' типа Риккати [12, 14]: п п п (1.15) X (AipUpk^ Акрвл\ + 2 ЬрАл£ ЬрАрк = Pik* p=i ' / p=i р=1 г Для определения закона управления (1.14) необходимо численными методами решить систему: нелинейных уравнений (1.15). Таким образом, в методе Летова-Калмана оптимальные по квадратичным критериям законы управления линейными объектами являются линейным^ комбинациями фазовых координат, а их коэффициенты определяются путем численною рс-’ шения нелинейных алгебраических уравнений. Аналогичные результаты получены при опта* мизации линейных систем по среднеквадратичным критериям качества [17], когда учитыва- ются статистические характеристики возмущений. Перейдем, далее, к весьма краткому рассмотрению широко известного в современном теории оптимального управления метода АКОР академика А.А. Красовского по критерию' обобщенной работы [14, 15]. В этом методе минимизируемый квадратичный критерий каче-t ства, в частности, имеет вид (1.16) 1 00 п т т т ду 7 J = i f 2 PikXiXk+ J Ё ) dt' , * О ,4=1 /=1 /=1 \ 1=1 ОЛ> / т.е. является полу определенным и отличается от критерия (1.11) в методе Летова-Кал манг добавочном членом 00 «I « Л К 9 L?, (”!?.<)л Оптимальный закон управления, обеспечивающий минимум критерия (1.16), определяется выражением „ ___Ly BW> где функция У0(Х1,...,х,() является вынужденным решением уравнения (1.17) 46
1 4 а (1Л8> dt ,5 dXifi~ 2£=fikXiXk' К характерной особенности уравнения (1.18) относится то, что его левую часть можно рас- сматривать как производную Vo(t) при uj = 0, т.е. Vo является функцией Ляпунова, а (1.18) — уравнением Ляпунова для неуправляемого объекта. Отсюда возникают возможные затрудне- ния с непосредственным применением метода А.А. Красовского для нелинейных объектов, которые при отсутствии управлений (щ = 0) должны быть устойчивыми или заранее стабили- зированы с помощью отдельной системы. В этой связи в [14,172] изложен способ применения этого метода для неустойчивых и нейтральных объектов, основанный на преобразовании исходных дифференциальных уравнений объекта и функционала (1.15) к специальным неста- вдонарным формам. Достоинство метода АКОР по критерию обобщенной работы (1.15) состоит в том, что уравнение (1.18), в отличие от (1.13), представляет собой уже линейное дифференциальное уравнение в частных производных. Это принципиальное отличие позволя- ет для уравнения (1.18) с различными граничными условиями разработать ряд приближенных методов его решения на основе использования степенных рядов, путем многократного приме- дсния некоторого оператора или опираясь на метод характеристик. Развитое к настоящему времени алгоритмическое и математическое обеспечение метода АКОР А.А.Красовского по- зволяет подойти к приближенному решению на ЭВМ основной задачи синтеза оптимального управления—поиску структуры закона управления нелинейным объектом через функционал обобщенной работы с последующей итерационной коррекцией его параметров. Наиболее эффективен этот метод при использовании прогнозирующей модели процесса,управления [14, 15, 172]. Метод оптимизации нелинейных динамических систем по критерию обобщенной работы академика А.А. Красовского имеет, помимо указанных преимуществ вычислительного характера, также и такое важное достоинство прикладного характера, как возможность совме- щенного синтеза законов управления, т.е. формализованного определения управлений в про- цессе движения объекта. Этот метод в настоящее время является фактически единственным в СТАУ, позволяющим практически осуществить обобщенный совмещенный синтез, когда реа- лизуется не только текущее формирование закона управления, но и может также происходить Текущая идентификация математической модели объекта. Разумеется, что совмещенный син- тез предъявляет дополнительные требования к программному обеспечению и вычислительной производительности синтезируемой системы управления. Указанный метод нашел широкое применение в задачах управления различными объектами и технологическими процессами, в первую очередь в разнообразных задачах управления летательными аппаратами [14,172]. м ? В литературе имеется и ряд других частных результатов по нелинейной теории АКОР [7, 13,18, 19], однако в общем же проблема прикладного синтеза нелинейных оптимальных регуляторов еще далека от своего разрешения, что является главной трудностью на пути создания принципиально нового класса систем управления различными современными техно- логическими и движущимися объектами. 1.4. ЕСТЕСТВЕННО-МАТЕМАТИЧЕСКИЙ ПОДХОД < К ОСНОВНОЙ ПРОБЛЕМЕ ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ У ' ' Основная проблема и подлинная оптимизация. Дфке беглый очерк этапов развития линейной и-нелинейной теории АКОР, изложенный в разделах 1.2 й 1.3, показал, что прогноз вотношении будущего основной проблемы теории автоматического управления, сделанный I AM. Летовым в обзорном докладе [152] на втором конгрессе ИФАК, полностью подтвердил- dfc За прошедшие с тех пор 30 лет теория оптимального управления в форме методов АКОР Достигла выдающихся результатов, особенно в той ее части, которая в [152] названа “матема- тическим содержанием” (см. п. 1.2). В этой теории за прошедшее время появились новые Тенденции и особенности, связанные с существом современных инженерных требований к 47
проектируемым системам управления. В известном уникальном справочнике по ТАУ [172], подготовленным группой отечественных ученых под руководством А.А. Красовского, содер- жание понятия “современная теория автоматического управления” (СТАУ) напрямую опре- деляется требованиями оптимального использования всех ресурсов систем управления (энер- гетических, информационных, вычислительных и др.) для достижения главной цели на каждом этапе движения объекта при соблюдении наложенных на систему ограничений. На основе этого положения оптимизация системы “в большом”, осуществляемая в реальном времени в процес- се управления, отнесена в [172] к центральной проблеме СТАУ. Эта фундаментальная про- блема приводит к необходимости рассмотрения и решения ряда самостоятельных крупньй проблем и задач. Итак, использование математических моделей объектов не только на стадии априорного проектирования систем, но и в процессе их функционирования, является согласно [172] одной из характерных черт СТАУ. Там же отмечается, что “центральной частью СТАУ является собственно теория оптимального или субоптимального управления в “большом”, т.к.’ согласно приведенному выше назначению СТАУ она должна на каждом этапе функциони- рования системы указывать алгоритм оптимального (субоптимального) достижения важной' обобщенной конечной цели”. К такого рода задачам относится, например, вывод на новый' режим работы различных подвижных объектов новой техники—летательных аппаратов, кос-| мических станций и т.п., а также современных технологических машин и агрегатов с обеспе-1 чением минимальных затрат. Таким образом, только оптимизация управления движением! объектов в процессе функционирования системы в текущей обстановке определяется в [172] i как “подлинная оптимизация” и в этой связи “теорию именнр такой оптимизации должна; содержать СТАУ”. I В целом, с указанным глобальным подходом, как идеалом в теории оптимизации, вообще! трудно не согласиться. Действительно, вполне очевидно, что в общем плане развития приклад-' ной теории управления тенденция по созданию методов совмещенного синтеза систем опти- мального управления будет нарастать и становиться все более главенствующей, особенно по| мере роста возможностей и снижения стоимости средств вычислительной, в частности микро-Г процессорной, техники. OgpQvr> опч^икает целый ряд вопросов, связанных, например, с| “важностью” того или иного объекта и затратами, необходимыми для реализации такой гло- бальной текущей оптимизации его системы управления, с самим смыслом оптимизации, т.е. 4 > ^ртхт^пирд пптимя ПТ.ППСГИ, И Т.Д, ОчвВИДНО. ЧТО ДЛЯ У НИ КЭЛЬ-! ных, сверхмощных и высокодинамических объектов, предназначенных, например, для реше-j ния особо важных технологических задач в быстроменяющейся, экстремальной обстановке,: выполнения боевых и других задач подобного рода, указанная в [172] “подлинная оптимиза-j ция” необходима и целесообразна. Однако такой подход может оказаться пока неприемлемым^ по экономическим и техническим причинам для многих промышленных и других объектов! “средней важности”, обладающих вполне приемлемой степенью детерминированности и пред- сказуемости своего поведения, для которых с целью реализации “подлинной” или близкой! ней оптимизации требуется лишь частичная коррекция математических моделей и алгоритмов управления только в некоторые моменты времени. Для таких объектов указанную коррекцию моделей и алгоритмов вообще технически целесообразно проводить в “нерабочее” время. Примерами могут служить такие распространенные электромеханические объекты как про- мышленные роботы, электроприводы станков и других аналогичных по режимам работы установок, турбоагрегаты и т.д. Необходимость априорной и, возможно, текущей оптимизации систем управления указанными объектами диктуется тем обстоятельством, что, например, промышленный ^др^р^^ривол потребляет около 60% всдй драче электро- энергии. Априорный структурный синтез оптимального по энергозатратам управленияэтими^ объектами с последующей коррекцией параметров настройки мог бы дать значительный тех- нико-экономический эффект. Аналогичная ситуация сложилась и в области синтеза систем; управления другими объектами и технологическими процессами. Указанный эффект оптимизации может принципиально возрасти, если удастся переломил существующую в проектно-конструкторской практике консервативную традицию раздельного 48
проектирования объекта и регулятора. При этом конструктор подсознательно нередко стре- мится создать малодинамичный, вялый объект с чрезмерными, на всякий случай, запасами по механической, тепловой и т.п. прочности, что в конечном итоге делает его слабоуправляемым и неэкономичным. Применение же оптимизационной идеологии не только при синтезе “опти- мального” регулятора для заранее заданного, неизменного объекта, но и в процессе проекти- рования оптимальной системы “объект—регулятор” как целостной и неразделяемой конструк- ции, позволит создать высокоэкономичные, экологичные и динамичные агрегаты, установки и технологические процессы нового поколения. Такой подход позволяет в известной мере приблизиться к “подлинной оптимизации”, которую следует начать осуществлять еще на стадии проектирования соответствующего динамического объекта, когда его энергетические, механические и другие внутренние, только ему присущие, свойства должны быть естественным образом согласованы (технический гомеостазис) с требованиями технологической задачи управления, часто имеющей по отношению к объекту внешний характер. Очевидно, что этот подход вовсе не исчерпывается “математическим содержанием” задачи оптимизации, как это принято в подавляющем большинстве работ по теории АКОР, а выходит за его рамки и приводит к необходимости включения в процедуру синтеза системы также и “физического содержания” проблемы управления конкретным нелинейным объектом. Само собой разуме- ется, что такая априорная оптимизация единой системы “объект—регулятор” совместно с последующей функциональной оптимизацией, осуществляемой в реальном времени в текущей обстановке, позволяет в большей мере приблизиться к подлинной, глобальной оптимизации систем. Изложенные соображения касались понятия “подлинная оптимизация” [172], которое в современной литературе, как правило, связывается с математическим содержанием основной проблемы СТАУ. Остановимся подробнее на этой части указанной проблемы. О математическом и физическом содержании основной проблемы. Подводя определен- ный итог развития методов решения основной проблемы СТАУ—синтеза оптимальных регу- ляторов, поставленной А.М. Летовым в докладе [152], можно с полным основанием утверж- дать, что математическое содержание этой проблемы в трудах крупных математиков получило существенное развитие. Особенно значительные, обобщающие результаты были достигнуты в решении линейно-квадратичной задачи как в детерминированной, так и стохастических поста- новках. Линейная теория АКОР приняла математически завершенный характер, чего никак нельзя сказать о нелинейной проблеме АКОР. Но дело здесь все же, по-видимому, в другом. Еще в обзоре работ по АКОР [152] А.М. Летов писал: “Трудность составления обзора возросла еще и потому, что в исследовании оптимальных процессов управления принимают участие выдающиеся математики многих стран. В своем стремлении схематизировать рассуждения, сделать их возможно более общими и подчинить всеобъемлющим законам математического формализма они добились выдающихся успехов. Методы принципа максимума и динамическо- го программирования служат этому яркой иллюстрацией. Поэтому всякая попытка подверг- нуть ревизии теорию оптимального управления неизбежно затронет установленные математи- ческие каноны, на что автор не может решиться”. С момента произнесения этого великолеп- ного пассажа в адрес математического содержания СТАУ теория оптимального управления развивалась в основном в математическом русле принципа максимума Понтрягина—для ис- следования качественных свойств оптимальных управлений и определения программных оп- тимальных движений и принципа оптимальности Веллмана—в попытках построить методы синтеза замкнутого оптимального управления. Особенно крупные результаты были получены в решении первого класса задач оптимального управления, т.е. определения оптимальных программных траекторий. Что же касается второго класса задач, управлений нелинейными объектами, как раз и определяющих основну?бт^|у8блему СТАУ, то Более того, ситуация в этой области приняла в настоящее время угрожающий и, по всем признакам Это обстоятельство и заставило авторов справочника [172] ^а^он^тъ^становленные математические каноны"” в связи с вполне справедливо пишут, что “...в раз- 49
витии СТАУ с точки зрения практики далеко не все обстоит благополучно. Классическую ТАР в основном создавали инженеры для инженеров. СТАУ создают в основном математики для инженеров и во все большей мере математики для математиков. Последнее с точки зрения практики вызывает определенное беспокойство... Главное негативное влияние на практическое внедрение методов СТАУ оказывает масса оторванных от практических потребностей и воз- можностей работ и даже направлений, интересных в математическом отношении, но бесплод- ных в отношении современных приложений. Нельзя отрицать право на существование мате- матической СТАУ как раздела математики, развивающегося по собственным законам и нахо- дящего применение по мере возникновения соответствующих потребностей. Однако такая математическая СТАУ должна быть достаточно четко выделена по отношению к прикладной СТАУ”. Приведенные здесь яркие высказывания А.М. Летова [152] и авторов современного спра- вочника [172] о математическом содержании основной проблемы СТАУ контрастируют друг с другом, внешне противоположны, хотя таковыми, по существу, и не являются, но свидетель- ствуют об острой ситуации, сложившейся в нелинейной теории АКОР. Дело в том, что А.М. Летов указывает на незыблемость математических канонов теории оптимального управления, установленных в 50—60 гг. этого столетия выдающимися математиками—Л.С. Понтрягиным, Р. Веллманом и др., и действительно составляющих математические основы этой теории. Резкое и негативное высказывание авторов справочника [172] в большей мере связано с последующим потоком математических работ, хлынувшим в СТАУ, которая, судя по много- численным публикациям в различных журналах, стала для многих неудавшихся математиков полигоном для упражнений, не имеющих отношения к прикладной теории управления. И суть вопроса здесь, на наш взгляд, вовсе не в проблеме подхода к математическим основам СТАУ, как и в любой другой науке, с позиций “чистых” или “прикладных” математиков, когда пытаются соблюсти некоторое равновесие между “террором дедукции” и “разгулом правдопо- добия”, о чем ведется давний спор в научной литературе [150]. Все дело в принципиальном игнопированиии “чистыми”, и “прикляпными,,у^тематикяы<* такого фундаментального поня- тия, как Физическая^химическая. биологическая и т.п.) ность ущнимлСКгого нелинейного объекта^ЛУпиня начальном этапе развития классической TAV,"'a й НОСЛеднее время в математической теории оптимального управления, такое абстра- гирование от физического содержания несомненно было полезным с точки зрения разработки основ теории (в первую очередь, линейной), то на данном этапе развития СТАУ это превра- тилось в свою противоположность. В разделе 1.2 отмечалось, что базовые принципы класси- ческой ТАУ не зависят от конкретной природы объекта и именно такой подход дал в свое время сильный импульс для развития теории управления. Сложившаяся же в настоящее время кризисная ситуация в СТАУ снова требует возврата и учета основополагающих естественных свойств объекта, но уже на новом качественном уровне развития теории управления. Таким образом, можно говорить о витке спирали в процессе развития теории управления, когда ранее исключенное свойство объекта—его физическая сущность—потребовалось снова включить в саму ткань прикладной СТАУ, которая несет большой ущерб от недостаточного взаимодействия математики с физикой (химией, биологией). Этот факт в полной мере согла- суется с изложенным в п.1.1 синергетическим подходом в современной науке о свойствах нелинейных динамических систем различной природы. Указанные обстоятельства требуют развития новых направлений в СТАУ, учитывающих, помимо математического, также и “физическое содержание”. А.М.Летов в выводах доклада [152] о перспективах развития теории АКОР (см. п. 1.2) поставил понятие “физическое” впереди “математического содержа- ния”, хотя четкого определения понятия “физическое Содержание” в [152] не дано. Требова- ние А.М. Летова о “физическом содержании” теории АКОР не получило должного развития и в известном смысле было игнорировано, за исключением, может быть, обычной физической интерпретации задачи управления конкретным объектом, имеющей вторичный, косвенный, а не сущностный, обобщающий характер. Другими словами, в СТАУ “математическое содержа- ние” во многом подавляет физическое начало, которое фактически отсутствует в самой фор- 50
мулировке основной задачи управления и, чт^г особенно важно, в подходах к ее решению. И только в последнее время в работе академика А.А. Красовского [171] была поставлена про- блема создания “физической теории управления”. Разумеется, что дать достаточно строгое определение понятия “физическая теория управления” представляется пока трудным делом, т.к. она еще находится на начальном этапе своего становления. В этой связи А.А. Красовский дает следующее первоначальное определение: “под физической теорией будем понимать такую теорию управления, которая базируется на фундаменте физических законов, учете ресурсов и приоритетах реального мира”. Затем в [171] отмечается, что “отличие физической теории управления от абстрактно-математической начинается с математических моделей и критериев систем и процессов управления. В физической теории модели и критерии создаются в физиче- ских (физически значимых, с физическими размерностями) величинах и терминах. Эти модели должны учитывать законы сохранения, другие законы природы и технологии. В абстрактно- математических моделях учет многих ограничений, факторов и закономерностей, как правило, отсутствует. Физическая теория строится так, чтобы заложенные в математических моделях и критериях реальные факторы и ограничения фигурировали и в конечных результатах, опре- деляя границы возможного и невозможного в управлении.” Ясно, что “физическую теорию” следует понимать в обобщенном смысле, т.е. она может включать химические, биологические и другие закономерности. Академик А.А. Красовский затем указывает, что в “физической теории управления” намети- лись такие направления: информационная теория управления; теория микроуправления; теория макроуправления физическими процессами, в том числе квантовыми и релятивистскими; теория систем управления с максимальным использованием физических моделей, критериев и перемен- ных. В настоящее время указанные направления получили определенное развитие, хотя практи- чески важных результатов, по-видимому, еще не достигнуто. Что же касается поставленной АА. Красовским фундаментальной проблемы “открытия или формулировки законов процессов управления, а не теорем, как в абстрактно-математической общей теории управления” [171], то указанная проблема еще находится в зачаточном положении, а эффективные подходы к ее решению I литературе фактически отсутствуют. Для этого необходимо развить новые базисные положения и методы физической (естественной) теории управления. Изложенное положение с физическим (химическим, биологическим и т.п.) и математиче- ским содержанием прикладной СТАУ ставит сложный вопрос об органичном их включении в ; постановку и решение нелинейной проблемы АКОР. Ясно, что физическое и математическое содержания этой проблемы должны быть парно дополнительными друг другу. Главная труд- ность при этом состоит в отражении при постановке задачи управления именно физического начала, которое обычно носит конкретный, частный, уникальный характер, в то время как • математическое содержание—это чистая формализация. В этом смысле физическое (химиче- ское, биологическое) начало во многом связано именно с нелинейными свойствами объекта, т. к. нелинейность—это индивидуальная, уникальная черта, а линейность—это типизация, по- гружение частного явления в общее описание и, следовательно, в большей мере связана с формальной, математизированной стороной явления. В этом плане теория управления линей- ными объектами ближе к общему математическому подходу, т.к. структура решения линейных дифференциальных уравнений, являющихся математическими моделями таких объектов, не зависит от начальных условий, в то время как для нелинейных дифференциальных уравнений отличительным, принципиальным свойством является зависимость как формы, так и самого существования решений, от начальных условий. Дело усугубляется еще и тем, что основная задача управления всегда сводится к граничной задаче, а вовсе не к задаче Коши в теории дифференциальных уравнений, для решения которой к настоящему времени разработаны эффективные численные методы. Возможно, что поэтому наука остановилась перед нелинейными свойствами реальных объектов как у крепости и неуверенно топчется возле нее. Несмотря на длительную математи- ческую осаду и мощные лобовые компьютерные атаки, эта крепость остается непобежденной. В этой связи в [172] отмечается, что “главной трудностью решения основной современной 51
проблемы автоматического управления—оптимального управления “в большом" весьма слож- ными процессами—остается вычислительная производительность. Преодоление этой трудно- сти возможно только на пути сочетания развитой аналитической прикладной СТАУ, как фундамента алгоритмического обеспечения, с численными методами, как формой реализации алгоритмов”, быстрый прогресс ЭВМ открывает определенные возможности в отношении вычислительной производительности. Однако необходимо подчеркнуть, что лобовой вычис- лительный подход к решению основной проблемы СТАУ не может быть самым перспективным направлением в развитии теории управления, несмотря на кажущуюся мощь современной вычислительной техники. Чтобы убедиться в этом, достаточно еще раз упомянуть о знаменитой задаче поиска решения основного функционального уравнения вида (1.13), которое опреде- ляет законы оптимального управления в нелинейной теории АКОР. Хотя это уравнение известно более 30 лет, с тех пор в поисках его численных решений фактически никакого продвижения вперед нет. Тем более эти трудности усугубляются при попытке реализация оптимизации систем “в большом” в реальном времени, т.е. в процессе управления. По-види- мому, дело не в “победе” над “крепостью” нелинейности реальных объектов, а в переходе на новое понимание основной проблемы СТАУ как целостной, естественно научной проблемы современной науки о нелинейной динамике процессов различной природы. Путь этот, на наш взгляд, представляет собой синергетический подход в теории автоматического управления. Естественно-математический подход к решению основной проблемы. Подведем некото- рые итоги рассмотрения основной проблемы СТАУ. Теория автоматического управления получила в свое время значительный импульс в развитии, когда учеными и инженерами было осознано, что базовые принципы управления не зависят от конкретной природы объекта. Основные законы механики, электротехники, теплотехники, гидравлики, газовой динамики я химии, которыми описывается поведение подавляющего большинства современных подвиж- ных и технологических объектов, могут быть записаны аналогичными и даже совпадающими закономерностями в виде системы дифференциальных и алгебраических уравнений. Более того, многие из этих законов могут переходить друг в друга в результате инвариантных математических преобразований. Для подтверждения этого важного положения достаточно, лишь напомнить, например, о постулате Максвелла, согласно которому уравнения движения1 электромеханической системы составляются в форме уравнений Лагранжа второго рода из аналитической механики. При этом функция Лагранжа L=LM+L9 представляет собой сумму функции LM, составленной для механической части системы, и функции £э, составленной для электрической части системы, что и образует в целом сложную электромеханическую систему. В основе постулата Максвелла лежит глубокая аналогия между механическими движениями и процессами, протекающими в электрических цепях [136]. Нетрудно указать подобную анало- гию и в системах другой природы, что во многих случаях связано с единством законов сохранения. Именно свойство инвариантности математических преобразований при составлении урав- нений движения, как по существу, так и косвенно, лежит в основе универсального подхода теории управления к различным по своей физической (химической, биологической и т.п.) природе задачам управления. Однако дальнейшая формализация этого подхода привела в настоящее вреМя к непомерной математизации СТАУ. С одной стороны, это позволяет опе- реться на фундаментальную математическую базу и привлечь к решению задач СТАУ мощные аналитические и численные методы с применением современных и перспективных ЭВМ. С другой же стороны, чрезмерная формализация, например линейной ТАУ, фактически превра- тила ее в одну из областей алгебры—теории матриц или, по меньшей мере, в область теории дифференциальных уравнений. Более того, даже базовые, только присущие ТАУ, понятия нередко формулируются в терминах соответствующей математической теории..Примерами являются понятия управляемости, наблюдаемости и др. Вернемся снова к понятию “оптимальная система”. Само по себе введение термина “опти- мальность”—это лишь попытка отразить оценочное, субъективное свойство через некоторое 52
количественное соотношение, т.е. попытка объективизировать, выразить количественно то качество, которое желательно придать синтезируемой системе. На наш взгляд, введение в СТАУ методов оптимального управления, как базовых и составляющих ее математическую основу, является лишь первым шагом к новому пониманию задач автоматического управления. Следующим шагом должно быть введение в самую сущность ТАУ фундаментальных естест- венных закономерностей, отражающий физическое (химическое, биологическое и т.п.) начало управляемого объекта. Необходимо синтезировать “...оптимальное управление с максималь- ным использованием естественных, собственных движений объекта. Именно такие управ- ления получаются на основе СТАУ” [172]. Это требование в полной мере согласуется с выводами, сделанными А.М. Летовым еще в докладе [152] о том, что природа объекта опреде- ляет физическое и математическое содержание основной проблемы теории автоматического управления. В работе [171] академик А.А. Красовский в общем виде сформулировал совре- мепую фундаментальную проблему физической (аналогично химической, биологической и т.п.) теории управления как проблему поиска общих объективных законов процессов управ- ления. Поставленная таким образом проблема СТАУ является принципиально новой и порождает крупные самостоятельные проблемы и задачи. При этом возникает труднейшая задача пере- хода от естественных принципов, учитывающих своеобразие объекта, к количественным, формализованным соотношениям. Для этого представляется перспективным использовать принципы (законы) сохранения, справедливые, как известно, для всех форм существования материи и являющихся инвариантами в тех предметных областях, к которым относится даетый, конкретный объект управления. Изложенный в п.п. 1.2 и 1.3 краткий очерк развития основной проблемы СТАУ показал, что теория управления по многим признакам оказалась в плену редукционистских методов и их доминирования, когда путем “склеивания” локальных Описаний системы пытаются построить ее глобальное поведение. Хотя эти методы оказываются иногда весьма успешными, например в линейном случае, однако перспективный путь развития нелинейной теории управления лежит в русле взаимосвязи и взаимообратимости редукциони- стских и холистических, глобальных подходов, отражаемых путем применения всеобъемлю- щих принципов сохранения в процедурах синтеза оптимальных систем. В этом смысле можно утверждать, что эпоха подлинного, естественно-физического (хими- ческого, биологического и т.д.) оптимального управления еще только наступает. Это означает, что в основу “подлинно оптимального” управления целесообразно положить не только мате- матическое содержание, получившее значительное развитие, но и физическое начало задач управления, которое в настоящее время выдвигается на первый план. Остановимся еще раз на этом положении. Математика, как известно, занимается общими формальными закономерно- стями, в то время как физика в первую очередь интересуется качественными свойствами и особенностями конкретных явлений. В то же время и в физике имеются такие обобщающие фундаментальные понятия, как законы сохранения, присущие всем физическим процессам и выраженные в основополагающем вариационном принципе. Этот принцип формально отража- ется в математической теории оптимального управления через критерии качества. Другими словами, в основу “подлинной оптимизации” нелинейных систем целесообразно положить не только математические конструкции стандартной теории оптимального управления, а в боль- шей мере естественно-математические соотношения, отражающие, во-первых, фундаменталь- ные физические закономерности в форме соответствующего вариационного принципа, и, во-вторых, технологические требования задачи управления в виде соответствующего критерия качества. Такой подход возвращает ТАУ к естественным источникам ее возникновения, но на новом, естественно-математическом витке ее развития. Именно введение в нелинейную тео- рию управления элементов физической (химической, биологической) естественности позво- лит по-новому подойти к построению процедур синтеза систем управления нелинейными объектами. При создании новой теории, в частности нелинейной теории автоматического управления, целесообразно, следуя великим научным принципам Галилея и Ньютона [213], в определен- 53
ной мере абстрагироваться от второстепенных свойств рассматриваемых явлений в объектах управления и попытаться за внешним разнообразием увидеть основные, базовые физические факторы, определяющие сущность рассматриваемого явления. Разумеется, что такой способ идеализации в известной степени уводит от точного соответствия реальности, однако, как это ни парадоксально, именно такой подход позволяет приблизиться к реальности в гораздо большей мере, чем скрупулезный учет очевидных, но второстепенных факторов. Об этом свидетельствует вся история современного естествознания—от Галилея и до науки наших дней. В этой связи возникает вопрос, почему достаточно простые законы классической механики и физики отменно работают в окружающем нас весьма сложном мире и тем самым дают возмож- ность вполне достоверно описать разнообразные физические явления. Ответ на этот вопрос дает современная нелинейная наука—синергетика [83, 85, 144, 169, 214]: все дело в том, что в сложных динамических природных системах, имеющих много степеней свободы, происходит. сомоорганизация. Ее суть состоит в том, что в физических процессах выделяются несколько главных степеней свободы, называемых “параметрами порядка”, к которым через некоторое, время “подстраиваются” все остальные степени свободы сложной природной системы. Обычно, число этих параметров небольшое, что и позволяет описать и исследовать сложную нелиней- ную динамическую систему. Однако выделение указанных факторов—“параметров порядка”, определяющих сущность соответствующего физического явления, вовсе не относится к про- стым задачам. Что же касается теории управления, то к таким основополагающим фактам, обобщенно охватывающим рассматриваемые физические процессы (объекты), очевидно, от- носятся принципы (законы) сохранения. Эти законы отражаются на языке инвариантов—си- нергий в рассматриваемой здесь синергетической теории управления. Итак, наиболее общим физическим свойством всех объектов различной природы является: свойство сохранения—энергии, количества движения и др., в биологии—это гомеостазис. В этой связи в основу нового направления в нелинейной теории АКОР целесообразно положить преднамеренное введение в пространство состояний синтезируемых нелинейных систем неко- торых постоянных функциональных соотношений между координатами системы, т. е. таких! инвариантных интегральных многообразий, на которых естественные физические (химиче- ские, биологические и т.п.) свойства объекта наилучшим образом согласуются с соответству- ющими требованиями технологической задачи управления, которая отражает цель функцио- нирования данного’объекта. Разумеется, что при этом должны гарантироваться общесистемные' свойства—асимптотическая устойчивость движения в области или в целом, грубость, мини-' мально возможное время переходных процессов и др. Введение инвариантных многообразий в процедуру синтеза наделяет замкнутую систему общими глобальными свойствами и позво- ляет выявить родство разнородных физических (химических, биологических и т.п.) явлений, происходящих в объектах управления различной природы. Представление этих явлений на математическом языке—совокупности частных (первых) интегралов дифференциальных уравнений синтезируемой системы—отражает единство принципа сохранения в многообразии управляемых процессов. Этот новый естественно-математический подход к решению нелиней- ной проблемы АКОР—основной проблемы СТАУ—глубоко связан с идеями синергетики и теории нелинейных диссипативных систем. Изложенное выше указывает на то важное обстоятельство, что путь развития ТАУ в концептуальном плане во многом был аналогичен развитию классической механики. Как известно [211], механика и в целом физика развивалась в русле двух основных взаимосвязан- ных путей—во-первых, по пути, указанному Ньютоном и базирующемуся на векторных понятиях силы и импульса, и, во-вторых, по пути проложенному Лагранжем и Гамильтоном, опирающемуся на вариационный принцип, а также на скалярные понятия кинетической энер- гии и силовой функции. Вариационный принцип стал “сквозным” обобщающим принципом^ современной физики и формулируется аналогично для всех теорий—от классической до квантовой механики. Это указывает на преемственность и взаимосвязь ее теорий, вытекающих из универсального вариационного принципа. Однако многие ученые считают неудовлетвори-. тельным и даже кризисным современное состояние механики и физики. В этой связи они 54
предлагают [102, 211] для дальнейшего развития механики и физики использовать третий путь, впервые указанный А. Пуанкаре и А.М. Ляпуновым и опирающийся, на такие понятия и теории, как инварианты, асимптотическая устойчивость, качественная теория дифференциаль- ных уравнений и общая теория структуры фазового пространства. Вершиной современной ТАУ является теория оптимального управления в форме методов АКОР в детерминированной и стохастической постановках, которая опирается на универсаль- ный вариационный принцип экстремального действия. И в ТАУ возникла в настоящее время описанная выше кризисная ситуация, для выхода из которой следует, на' наш взгляд, перейти на синергетический путь ее развития, базирующийся на фундаментальных понятияхсовремен- ной науки о нелинейных динамических системах—теории инвариантов (синергий), асимпто- тической устойчивости движения, теории аттракторов и общей теории структуры фазового пространства систем. Разумеется, что переход к новому этапу развития ТАУ будет сопровож- даться переосмыслением основных понятий и взгляда на ее предшествующие этапы. В насто- ящее время в ТАУ рождается новая общая синергетическая концепция, с которой старые классические концепции находятся в глубокой внутренней связи, наполняясь новым естест- венным (физическим, химическим, биологическим) содержанием. Это обстоятельство указы- вает на преемственность этапов развития и определенное единство теории управления как ^временной науки. . Опираясь на высказанные здесь и ранее общие соображения относительно подлинной Оптимизации, математического и физического содержания нелинейной проблемы АКОР и на идею естественно-математического подхода к ее решению, перейдем теперь к формированию базовых элементов синергетической теории управления, а именно: построению оптимизиру- ющего функционала, формулйровке новой задачи АКОР, выводу основного функционального Уравнения и естественно-геометрической интерпретации развиваемой в этой книге новой теории синергетического синтеза нелинейных систем управления. • 1.5. ПЕРЕМЕННЫЙ ОПТИМИЗИРУЮЩИЙ ФУНКЦИОНАЛ В ЗАДАЧАХ СИНЕРГЕТИЧЕСКОГО СИНТЕЗА НЕЛИНЕЙНЫХ СИСТЕМ О формах критериев качества и режимах работы нелинейных систем. Предпринимая в этой книге попытку дальнейшего развития теории АКОР применительно к нелинейным объ- ектам, подчеркнем еще раз то существенное обстоятельство, что при синтезе оптимальных систем одной из важных и самостоятельных задач является формированием соответствующих критериев качества, удовлетворяющих совокупности инженерных требований, предъявляе- йых к замкнутым системам. Выбор того или иного критерия, отражающего динамические свойства системы, является трудной и самостоятельной задачей, которая вообще имеет неод- нозначные решения. Критерий качества в теории АКОР формально выступает как постулат [12], от которого зависит сложность решения задачи синтеза и вид получаемых законов управления. На начальном этапе развития теории оптимального управления считалось, что набор формы критерия оптимальности находится вне ее рамок и должен быть осуществлен проектировщиком, конструирующим систему управления соответствующим конкретным объ- ектом или технологическим процессом. В дальнейшем в процессе развития теории синтеза оптимальных систем преобладающее применение получили критерии быстродействия и энер- гозатрат [18-24] и квадратичные критерии вида (1.11) и (1.16), которые были положены в основу теории АКОР [1, 6, 12, 14, 18]. В автоматическом управлении [21] инженерные требования к качеству переходных процессов часто формулируются путем задания предельных значений определенных величин—первичных показателей качества: допустимого времени регулирования, допустимого перерегулирования, колебательности и т.д., которые нередко носят противоречивый характер и далеко не всегда поддаются формализации. Оказывается, что одним и тем же предельным характеристиками переходных процессов можно удовлетво- рять не только с помощью различных комбинаций коэффициентов квадратичного критерия, 55
но и путем некоторого изменения самой его формы. Этим и определяется косвенность оценки свойств переходных процессов с помощью такого рода критериев качества. Изложенное ука- зывает на то, что применяемые в методах АКОР постулируемые квадратичные критерии не позволяют в полной мере отразить проблему синтеза нелинейных систем,.т.к. эти критерии могут оказаться менее удачными с прикладной точки зрения по сравнению, например, с критериями быстродействия и «минимума энергозатрат, которые для режимов больших откло- нений в полной мере отражают желаемые показатели качества систем. Другими словами, квадратичные критерии часто могут оказаться неадекватными напряженным режимам работы современных высококачественных систем. С учетом значительных трудностей, возникающих на пути однозначного выбора оптими- зирующего функционала, в литературе по теории АКОР [1,14] сформировалось даже мнение о целесообразности решения обратной задачи вместо основной. При этом считается, что задачу оптимизации следует вообще отнести на второй план, отдав предпочтение поиску законов управления, по меньшей мере гарантирующих основные свойства синтезируемых систем— асимптотическую устойчивость движения, возможно меньшее время и заданный характер затухания переходных процессов, их грубость и т.д. Н.Н. Красовский отмечал [ 1 ], что в задаче об оптимальной стабилизации предъявляется больше требований к управлению wePf(xi,...,x„), чем к стабилизирующему управлению uit(xi,...,xn) в задаче об асимптотической устойчивости систем. Однако поиск оптимального управления uopt(x\,...,хп) проще в том смысле, что задача об оптимальной стабилизации обычно имеет единственное решение, а выбор стабилизирующих управлений ust(xi ,...,хп) вообще содержит значительный элемент произвола. Тогда оказывается целесообразным следующий путь решения задачи синтеза асимптотически устойчивых систем. С целью уменьшения произвола в выборе стабилизирующих законов управления ust(xi,...,xn) в обычные условия этой задачи вводится требование минимума некоторого функционала, которое здесь выступает в виде дополнительного условия. Тогда исходная задача о стабилиза- ции трансформируется в некоторую вторичную задачу оптимизации, в которой функционал играет вспомогательную роль. В этих условиях выбор вида подынтегральной функции W(x\,...,xn,u\,...,um) должен быть связан не со строгими условиями оптимальности, а опреде- ляться простотой решения задачи синтеза закона управления. Указанный подход относится к проблеме синтеза допустимых законов управления, гарантирующих заданные первичные по- казатели систем, с использованием оптимизационных идеологий теории управления. Итак, необходимо отметить научную важность и прикладную целесообразность постано- вок двух оптимизационных задач: во-первых, когда ставится чисто оптимальная задача, а критерий качества выступает как строгий постулат, т.е. некоторый индекс совершенства сис- темы [12], которому обязательно нужно удовлетворить в процессе синтеза соответствующего: закона управления, и, во-вторых, когда тот или иной функционал выступает в роли вспомога- тельного средства [1, 14], позволяющего завершить сложную процедуру синтеза системы^ особенно это касается задач управления нелинейными объектами. Все это говорит о том, что в настоящее время необходимо искать новые способы формирования структуры функционала в общей проблеме АКОР для нелинейных объектов. Одним из таких перспективных способов; является, во-первых, варьирование подынтегральной формы оптимизирующего функционала*, в зависимости от области фазового пространства, где в данный момент времени находится изображающая точка системы, т.е. конструирование переменных в фазовом пространства» критериев качества, и, во-вторых, выбор и последующая коррекция весовых коэффициентов,' в частности, при квадратичных составляющих подынтегральной формы исходного функцией нала. Указанный подход задачи формирования функционала при решении нелинейной про- блемы АКОР конкретно означает разделение ее на задачу структурного синтеза закона управ* ления, гарантирующего такие общие фундаментальные свойства систем, как асимптотическая: устойчивость в области или в целом, грубость, предельное быстродействие в режимах большие отклонений и др., и задачу поиска параметров этого закона, обеспечивающих заданные требо- вания к переходным процессам, в частности в режимах малых отклонений от заданного; 56?
состояния системы. Целесообразность указанного способа формирования оптимизирующего функционала, помимо необходимости учета нелинейных свойств объекта, определяется также тем важным обстоятельством, что при построении эффективных систем управления современ- ными многорежимными объектами возникает сложная задача удовлетворения такой совокуп- ности инженерных требований [170], которые бывают настолько разнообразными и противо- * речивыми, что их невозможно отразить с помощью одного, неизменного для всех режимов работы системы, критерия качества. О многокритериальной оптимизации нелинейных систем управления. Поставленная здесь задача нелинейной теории АКОР по формированию переменного функционала относится также к проблематике многокритериальной оптимизации динамических систем. Рассмотрим кратко основные результаты в этой перспективной области автоматического управления. Итак, при синтезе нелинейных систем, к которым предъявляются повышенные и одинаково важные различные требования, может возникнуть необходимость использования некоторой совокуп- ности критериев качества. Одним из способов построения оптимального управления в этом случае является введение векторных критериев, состоящих из ряда вторичных критериев, которым одновременно должно удовлетворять движение объекта. Другими словами, возникает задача одновременной, параллельной оптимизации системы по совокупности частных крите- риев, каждый из которых отражает некоторое определенное требование к качеству движения. Но т.к. в общем случае достигнуть экстремума одновременно по нескольким критериям невозможно, то решение задачи векторной оптимизации требует определенного компромисса путем формирования некоторого нового функционала. Ввиду того, что конструирование тако- гообобщенного (комбинированного, глобального) функционала является неформальной про- цедУрой, то вид его полностью зависит от выбранной схемы компромиссов, что сводит вектор- нуюзадачу к скалярной. Методы векторной оптимизации получили к настоящему времени существенное развитие применительно к статическим задачам, однако эти методы не разрабо- таны для задач управления динамическими объектами. Сложность и трудность решения задач векторной оптимизации динамических систем связаны, в первую очередь, с решением сово-* купности нелинейных граничных задач. Наиболее важные результаты по теории векторной оптимизации линейных динамических систем получены в работах М.Е. Салуквадзе [34, 35], А:И. Воронина [36—40] и др. В этих работах показано, что постановка и последующее решение конкретных задач векторной оптимизации динамических систем существенным об- разом зависит от выбранной схемы компромиссов, т.е. принципа оптимальности. Из теории многокритериальной оптимизации следует [41], что применительно к динамическим системам большинство схем компромиссов сводится в основном к двум полярным принципам оптималь- ность—интегральному принципу в виде суммы взвешенных вторичных критериев т .2, . т (1-19) ; г А = min^ Ык : *=1 и принципу равномерности, т.е. минимакса Jx = minmaxJ*. (1.20) Остальные схемы компромиссов представляют собой модификации или комбинации этих или подобных им принципов оптимальности. Представляется естественным и целесообразным связать выбор той илииной схемы компромиссов с соответствующим режимом работы системы. Тода, для облегченных, например стационарных, режимов следует выбрать принцип интег- ральной оптимальности (1.19), а для напряженных режимов, когда характеристики систем ищут достигнуть предельно допустимых величин, более подходящим, по-видимому, является принцип равномерности (1.20) или сходные с ним принципы оптимальности. В промежуточных режимах, которые характерны для многих систем, а также при широком диапазоне изменения внешних воздействий и граничных условий целесообразен выбор в известной мере универсаль- ной схемы компромиссов, обеспечивающей соответствующую “степень” оптимальности син- тезируемой системы. Постановка и решение задачи оптимизации с универсальной схемой компромиссов является весьма сложной и трудной проблемой [36—40]. Эта проблема пока не 57
получила должного разрешения в важных задачах синтеза законов управления в функции фазовых координат, т.е. построения оптимальных и субоптимальных регуляторов, тем более применительно к нелинейным объектам. Таким образом, выбираемая схема компромиссов должна быть в определенной мере адекватной соответствующему режиму работы системы в данный момент времени. На практике для многих систем можно ограничиться рассмотрением двух основных режи- мов—малых и больших отклонений от заданного движения, которым соответствует разбиение фазового пространства системы на внутреннюю и внешнюю области. В режиме малых откло нений поведение объекта может быть описано линеаризованными дифференциальными урав- нениями, а наиболее распространенным требованиям к качеству движения для этого режима можно удовлетворить путем оптимизации системы по стандартным квадратичным критериям качества или с использованием методов модального управления. При напряженных режимах, когда изображающая точка находится в области больших отклонений, достаточно удаленной от начала координат, адекватная модель движения объекта, как правило, должна быть нели- нейной. Как уже отмечалось, в этих режимах подходящими являются минимаксные критерии качества, которые позволяют ограничить допустимое отклонение от заданного движения в течение всего времени переходного процесса, что выдвигается на практике для многих систем управления [42]. Однако минимаксный критерий [43, 44] не является аналитическим и поэтому для оптимизации систем в режиме больших отклонений следует использовать другие функционалы, которые аппроксимируют его в смысле близости получаемых при этом пере-; ходных процессов. Из критериев, используемых в теории оптимального управления, к мини- максному наиболее близок критерий быстродействия. В монографии [234] разработан новый подход к синтезу многокритериальных систем управления нелйнейными динамическими объ- ектами, основанный на оптимизации системы в режиме больших отклонений по критериям, быстродействия и минимума энергозатрат, а в режиме малых отклонений—по квадратичным критериям качества. . Иерархический подход к синтезу оптимальных систем. Ранее уже отмечалось, что в режимах больших отклонений математическая модель объекта является нелинейной, а эта существенно затрудняет синтез законов оптимального по быстродействию управления [23, 24]. В этой связи необходимо сформировать оптимизирующий функционал, который бы во внешней области фазового пространства эффективно подавлял возникшие большие отклоне- ния за возможно малое время переходного процесса. Весьма желательно использовать тот же функционал и для режима малых отклонений, чтобы путем удержания соответствующего числа его первых членов обеспечить оптимизацию системы во внутренней области фазового про-- странства. Тогда, разработав процедуры синтеза оптимальных по этому обобщенному крите-г рию законов управления нелинейными объектами, можно решить поставленную выше опти- мизационную задачу с использованием схемы компромиссов, приближающейся в той или иной мере к универсальной. Итак, возникает важная задача формирования некоторого .обобщенного оптимизирующего функционала, позволяющего построить единый подход к процедурам син- теза законов управления для режимов как малых, так и больших отклонений. Этот функцио-. нал, в зависимости от его структуры (числа удерживаемых членов в подынтегральном выра- жении) , должен обеспечивать приближение к описанной выше универсальной схеме компро- миссов и, кроме того, гарантировать асимптотическую устойчивость синтезируемой нелинейной системы в наибольшей области фазового пространства. Использование такого род! критериев приводит к последовательной оптимизации нелинейных систем. Сущность ее состо- ит в поэтапном конструировании законов управления, когда синтез каждого следующего уровня иерархической системы управления осуществляется с учетом уже синтезированной по своему критерию подсистемы предыдущего этапа. С этой целью и следует на каждом из последующих этапов синтеза использовать подсистему управления и математическую модель объекта предыдущего этапа. В зависимости от назначения и условий функционироваши объекта тот или иной режим движения может иметь преобладающий характер и, естественно^ 58
подсистеме управления этим режимом и следует отдать определенное предпочтение, однако нередко эти режимы одинаково важны. Применение описанного иерархического подхода к задаче синтеза по последовательно приме- няемым критериям оптимальности в зависимости от режима работы системы приводит к следующей методике. На первом этапе производится конструирование контуров управления, исходя из усло- вий оптимизации по первому (наиболее общему) критерию и удовлетворения общим очевидным требованиям в отношении асимптотической устойчивости, быстродействия и т. д., которые присущи всем последующим подсистемам управления различными режимами движения. Далее, на втором этапе, осуществляется оптимизация по второму критерию для нового подобъекта, размерность которого ниже размерности объекта первого этапа синтеза. При этом изменяются характеристики некоторых контуров управления, остальнь^еже контуры, синтезированные на предыдущем этапе, Фгаются неизменными. В зависимости от числа изменяемых на втором этапе характеристик контуров управления может изменяться степень оптимальности системы по второму критерию. Затем проводится оптимизация подсистемы, синтезированной на втором этапе, по третьему кри- терию с учетом нового подобъекта более низкой размерности и т. д. Указанная процедура и Позволяет осуществить оптимизацию системы по совокупности последовательно применяемых Критериев качества. Другими словами, производится оптимизация системы по переменным в фазовом пространстве функционалам. л ^ Разработке теории оптимизации по последовательно применяемым критериям посвя- щена работа [46], в которой рассматривается задача поиска разомкнутого управления 0(f) линейными объектами, когда все частные критерии могут быть ранжированы по важ- ности. Что же касается задачи синтеза, то в работе [47] построены законы управления линейными объектами второго и третьего порядков при переменном критерии оптималь- ности, который в области малых отклонений является квадратичным, а при больших отклонениях—критерием быстродействия. Аналогичные переменные критерии качества Использовались для синтеза законов управления нелинейными объектами в цикле работ [48—54], а в работе [59] разработана методика построения субоптимальных по перемен- йому критерию качества следящих систем. ./“Таким образом, литература по синтезу оптимальных по переменным критериям качества Сйстем далеко не так обширна, как литература по аналитическому конструированию с исполь- зованием неизменного, например квадратичного, критерия качества. Это обстоятельство объ- ясмется сложностью и новизной проблемы последовательной оптимизации, тем более приме- нительно к задачам управления нелинейными объектами. Для подтверждения существенной прикладной и теоретической важности проблемы после- довательной оптимизации замкнутых нелинейных систем рассмотрим постановку трех задач управления из весьма разных областей техники. В качестве первой рассмотрим одну из задач управления движением летательного аппарата (ЛА). Для управления боковым движением Щейгра масс ЛА нередко используют линейные модели, при этом обычно предполагается, что йяпалъные отклонения от заданной линии пути являются достаточно малыми [ 14]. Однако для выполненйя этих условий необходимо сначала вывести ЛА в окрестность заданной траектории Ш по боковому отклонению, так и по направлению движения, т.е. ликвидировать большие начальные отклонения от заданной линии пути. При этом адекватная модель движения уже будет нелинейной. На выход ЛА на эту линию при больших начальных отклонениях требуется значительное время и количество топлива. Поэтому целесообразна оптимизация процесса Вйхода на заданную линию пути. В целом, вместе с задачей управления боковым движением это приводит к целесообразности постановки задачи оптимизации системы управления ЛА по Ш^алениому критерию качества. - «. В качестве второго примера рассмотрим задачу построения системы управления напряжением возбуждения синхронных генераторов электроэнергетических систем. Изменение напряжения и тока возбуждения генератора ведет к соответствующему изменению его мощности, оказывая существенное влияние на протекание переходного процесса в системе. Управление напряжением возбуждения должно производиться так, чтобы предотвратить выпадение генератора из синхро- 59
низма и обеспечить требуемое демпфирование колебаний. Система управления напряжением при больших возмущениях должна обеспечивать интенсивное демпфирование колебаний и макси- мально возможную область д инамической устойчивости энергосистемы, желательно также в этом режиме иметь повышенное быстродействие системы. В то же время для режима малых колебаний предъявляются иные требования в отношении демпферных свойств энергосистем [60—63]. В работе [60] указывается, что одинаковые настройки системы управления возбуждением как для малых, так и больших отклонений, являются противоречивыми в отношении качественных свойств и вообще могут приводить даже к нарушению асимптотической устойчивости энергосистемы. Это объясняется тем,- что в режиме больших отклонений существенно проявляется нелинейность характеристик генератора, а это придает системе управления иные свойства, чем при малых отклонениях [60,61,125]. Можно совместить противоречивые требования к качественным свой- ствам системы управления при больших и малых отклонениях путем синтеза такой ее структуры, которая позволяет удовлетворить как требованию расширения области асимптотической устойчи- вости энергосистемы, так и заданному демпфированию колебаний [125]. Таким образом, рассмот- ренная исходя из физических'представлений задача управления напряжением возбуждения синх- ронного генератора приводит к необходимости оптимизации системы управления по переменным в фазовом пространстве критериям качества. И, наконец, рассмотрим задачу синтеза систем управления сложными электромеханиче-: скими объектами, к которым относятся, например, роботы и манипуляторы. В работе [64] обоснована и показана практическая целесообразность следующей процедуры синтеза систем; управления манипуляционными роботами: после выбора программы движения на первом этале синтезируется управление для отслеживания номинальных траекторий в том режиме, когда начальное состояние отличается от своего номинального значения, но принадлежит ограни- ченной области начальных состояний. Это режим малых отклонений и для него могут исполь- зоваться линеаризованные модели и квадратичные критерии качества. Затем, на втором этапе, синтезируется управление для режима больших отклонений от желаемого состояния. Введение этого управления диктуется необходимостью ослабления влияния взаимных динамических связей между подсистемами робота, которые выражаются в виде сил и моментов. Для режима больших отклонений целесообразно ввести обратные связи по силам, что и позволяет мини- мизировать дестабилизирующее влияние взаимных связей подсистем на устойчивость всей системы, т.е. расширить область ее асимптотической устойчивости. При этом синтез управле- ния для режима больших отклонений осуществляется на основе полной, т.е. нелинейной модели робота. Следовательно, при синтезе системы управления манипуляционным роботом также целесообразно использовать переменный в фазовом пространстве оптимизирующий функционал, который был бы близок к квадратичному критерию для режима малых отклоне- ний, а в режиме больших отклонений от номинальной траектории обеспечивал наибольшую область асимптотической устойчивости движения. Итак, приведенные выше самостоятельные задачи управления из различных областей техники—от летательного аппарата до манипуляционного робота—указывают на тесную связь между режимами работы объектов и формой оптимизирующего функционала, структуру которого целесообразно выбирать переменной в фазовом пространстве синтезируемых нели- нейных систем.* Это перспективный подход к решению трудной проблемы синтеза эффектив- ных систем управления Нелинейными динамическими объектами и технологическими процес- сами. Л Сопровождающий функционал в задаче синергетического синтеза нелинейных агреги- рованных регуляторов. Рассмотрим сначала предлагаемый метод выбора обобщенных опти- мизирующих функционалов. Так так такие функционалы выступают в роли вспомогательного средства для образования конкретных критериев качества в режимах малых и больших отклонении от заданного состояния объекта, то будем называть эти функционалы сопровождающими, которые позволяют достаточно успешно завершить сложную процедуру синтеза систем управления нели- нейными объектами. Указанная проблема поиска унифицированного оптимизирующего функци- онала, из которого могут быть образованы частные критерии качества, в общем случае, по-вида- 60
мому, является неразрешимой или сопряжена с чрезвычайными математическими трудностя- ми Однако эта проблема, сформулированная основоположником теории АКОР А.М. Летовым [12], продолжает существовать и даже отдельные случаи ее решения имеют важное прикладное значение для синтеза многокритериальных систем управления. С другой стороны, известно, что в естественных '(неуправляемых) системах существует высокая степень “единства” функционалов, ^естественных системах вариационные принципы, охватывающие огромное разнообразие при- родных процессов, отражаются небольшим числом сходных между собой функционалов, которые минимальны только для реальных процессов. Между процессами в естественных и управляемых (Технических) системах имеется как глубокая аналогия, вытекающая из фундаментальных прин- ; чипов сохранения, так и существенное отличие, связанное с непрерывной циркуляцией информа- цмгв управляемых системах, что препятствует, по-видимому, достижению в них высокого единства функционалов [172]. В этой связи можно надеяться, что развитие современной прикладной теории управления приведет к определенной унификации оптимизирующих функционалов, в первую вчередь, по структуре с последующей итерационной коррекцией их весовых коэффициентов (триметров компромисса), что и должно поставить на научную основу проектирование нелиней- ных систем управления. Перейдем к изложению метода конструирования оптимизирующих функционалов, имею- цек сопровождающий характер в отношении динамических свойств синтезируемых систем. Как показано ранее, желательно, чтобы такой функционал имел переменную в пространстве состояний структуру для того, чтобы полнее отразить требования к показателям систем в регамах малых и больших отклонений, т.е. в известной мере был бы близок к универсальной иеме компромисса. В данной работе предлагается использование сопровождающего функци- онала вида * (1 21) Л = / Fty$) dt, < .. • о —непрерывно дифференцируемая по своим аргументам определенно положитель- Шфункция; —агрегированная макропеременная, представляющая собой некото- рую произвольную дифференцируемую или кусочно-непрерывную функцию фазовых коор- ЛйИтх1,...,х„, ^(0,...,0) = 0. < Выберем подынтегральную функцию /?(^,ф) в (1.21) в виде следующей квадратичной фермы: = mV2(V’)+ cV2(0» функционал (1.21) принимает вид ' * г > т ->-> п (1.22) А = J |mV2(V’)+ cV(0 dt. и о L J ^подынтегральном выражении функции должны удовлетворять следующим условиям: fa) однозначности, непрерывности и дифференцируемости при всех значениях Тб)₽(0) = 0; s ..в) tptytyp > 0 при любых * 0. Иначе говоря, функции y?(VO при выполнении условий а), б) и в) будут того же знака, что в нуль они обращаются только на многообразии ^=0. Определим полную производную £=1 OXfc ияадставим вместо x^t) правые части исходной системы дифференциальных уравнений объ- •Ю» а. дХО = А^ь...,хД z = 1,2,...,л-1; к ««(О = Л(х1,..пх„)+ й, (1.23) ИИ^а получим 61
^-1 .....................<L24> и i *=i (Щ oxn На основе известного в вариационном исчислении [65] свойства инвариантности к замене переменных функционал (1.22) с учетом выражения (1.24) может быть записан в следующей форме: * г (п Alb Alb \ (1.25) /z = / Г"Лр2(^)+ te~u 1 dt- 0 L ycM ал* ОЛп у J Й Очевидно, что обобщенный функционал (1.25) характеризует некоторые свойства как исход- ного объекта (1.23), так и его системы управления. Это означает, что в рассматриваемом методе оптимизирующий функционал не строго постулируется заранее, как это предполагается в стандартных задачах АКОР [12], а конструируется путем выбора соответствующих функций ^>(V>) и с привлечением уравнений объекта (1.23). Такой подход позволяет в изве- стной мере учесть свойства исходного объекта, т.к. внешнее “навязывание” постулируемом критерия и игнорирование свойств объекта на этапе выбора критерия качества может привести к противоестественному или даже неприемлемому для нелинейного объекта протеканию пе- реходных процессов. Следующее отличие развиваемого здесь подхода состоит в формировании функционала (1.22), (1.25) относительно обобщенных макропеременных ф, являющихся некоторыми агрегатами координат состояния. В этой связи задачу синтеза регуляторов на основе сопровождающегофункционала (1.22), (1.25) с использованием агрегированных мак- ропеременных будем называть (по аналогии с аббревиатурой АКОР) задачей АКАР—анали- тическим конструированием агрегированных регуляторов. Агрегированные макропеременные ф могут выбираться из разных соображений, связанных с желаемыми переходными и устано- вившимися режимами движения объекта [56, 69—72]. Рассмотрим теперь синергетическую интерпретацию сопровождающего функционала (1.22) и макропеременных ^>(xi,...,x„), используемых в методе АКАР. Как отмечалось ранее (см. п. 1.1), базовыми понятиями синергетики [83,99] являются параметры порядка и управ- ляющие параметры систем. В этой связи в терминах синергетики [83] макроперемйшые ^(Х1,...,хп)—это задаваемые параметры порядка, оптимизируя которые можно добиться желаемого поведения нелинейной системы. Эти параметры отражают коллективные свойства систем и являются носителями синергетической информации [99] о процессах в нелинейной системе вдали от ее положения равновесия. Они определяют протекание процессов самоорга- низации в синтезируемых системах. Что же касается управляющих параметров, то в качестве таковых, в частности при ^>(VO=VS можно выбрать отношения весовых коэффициентов функ- ционала (1.22), т.е. величину ^=‘у=у- Тогда можно дать следующую синергетическую трак- товку сопровождающему функционалу (1.22) в развиваемом здесь методе АКАР. Согласно Хакену [99], мерой макроскопического действия самоорганизующихся систем может служить квадрат параметра порядка. Эту меру можно также назвать работой, производимой системой. Под эффективностью систем в синергетике [99] понимается скорость изменения указанной меры при изменении управляющего параметра, который нередко связан с входной мощностью. Отсюда следует, что в рассматриваемом синергетическом подходе аналогом меры макроско- пического действия синтезируемой системы является функция ф\х\,...,хп), а эффективность системы определяется величиной W = d ф2 dk ’ Изменяя параметр Л и, следовательно, вреш движения ИТ к многообразию ф(х.....,хи) = 0, можно добиться желаемой эффективности синтезируемой системы. В целом это означает, что сопровождающий функционал (1.22); используемый в методе АКАР, в синергетическом смысле представляет собой некоторую общую меру макроскопического действия или, точнее, суммарную работу, производимую синтезируемой системой управления. При этом весовые коэффициенты т и с в подынтегралм 62
1.6. ОСНОВНЫЕ ФУНКЦИОНАЛЬНЫЕ УРАВНЕНИЯ В ЗАДАЧЕ СИНЕРГЕТИЧЕСКОГО СИНТЕЗА АГРЕГИРОВАННЫХ РЕГУЛЯТОРОВ » , « . т до вь ражении функционала определяют управляющий параметр л = — и, следовательно, с Непосредственно связаны с эффективностью системы. ^Предложенная синергетическая интерпретация, помимо изложенных ранее физических Соображений, подтверждает целесообразность применения сопровождающих функционалов мда (1.22) для оптимизации нелинейных динамических систем. (О' ^Скалярное управление. Выбрав сопровождающий функционал в виде (1.22), (1.25), ве^ейдем к определению условий его минимизации и затем приступим к решению различных кяйссов задач АКАР. Для э^гого найдем основное функциональное уравнение. Используя Начала единственную функцию ip, поставим первую, простейшую задачу АКАР: требуется ййти закон управления u(ip) = u(xi,...,x„), который обеспечивает перевод изображающей йНки (ИТ) системы из произвольного начального состояния хб(хю,...,Хпо) (в некоторой допу- Сймой области) сначала в окрестность многообразия : ip(Xl,...,Xn) = о (1.26) ^пространстве координат xi ,...,х„, а затем дальнейшее движение ИТ вдоль этого многообразия рпачало координат (хи=...=хп*= 0) пространства состояний. При этом на траекториях движе- т к многообразию (1.26) достигается минимум сопровождающего функционала (1.22), (125). Используя согласно [65] уравнение Эйлера-Лагранжа подставляя функцию F(ip,ty) из (1.22), находим, что уравнение экстремалей, доставляющих ивдимум функционалу (1.25), имеет вид mV2(V0 = c2ip\f). Это соотношение включает в себя подсемейства устойчивых и неустойчивых экстремалей, ^чевидно, что подсемейство устойчивых экстремалей, необходимое нам по условиям задачи синтеза, можно записать в виде следующего дифференциального уравнения: h Tip(t)+ <p(ip) = 0, (1.27) = —. Условие асимптотической устойчивости в целом уравнения (1.27) относительно Многообразия ip=Q имеет простейший вид Г > 0. Это очевидное соотношение можно получить, используя функцию Ляпунова V = 0,5ip2 > 0. Тогда производная ; r(0 = -^W<o. дзятая в силу уравнения (1.27), будет всегда определенно-отрицательной для класса функций с определенными выше свойствами, что означает асимптотическую устойчивость в целом [5] уравнения (1.27) относительно многообразия у>=0 (1.26). Причем указанная устойчивость № зависит от вида нелинейных функций ft в правых частях исходных дифференциальных уравнений объекта (1.23). 4 Из уравнения (1.27) с учетом выражения (1.24) в силу исходных уравнений объекта (1.23) получаем следующее основное функциональное уравнение в методе АКАР: Т&- и+ т£ ^-ft+ = 0, олп £=1 ОХ/с Bktfk—функции в правых частях уравнений (1.23), * 0. Запишем (1.28) в виде выражения (1.28) 63
*?, dxkfk+ T (1-29) dfip и =------f— dxn которое определяет множество допустимых законов управления ы(х1,...,хя), обеспечивающих перевод ИТ из произвольного начального состояния в окрестность многообразия ^=0. Законы управления и (1.29) удерживают ИТ в этой окрестности при ее дальнейшем движении вдоль ip(x\,...,x„)=0 (1.26). Это движение будет уже описываться системой дифференциальных урав- нений размерности п -1: • —/}(х1^,...,хя—iy>), 1,2,...,/i—1. (1.30) Для получения уравнений (1.30) следует из конечного уравнения ^(хь...,хя)=0 (1.26) найти координату х„ = Дх1,...,хя-1) и подставить ее в первые (н-1) уравнений (1.23). Притягиваю- щие многообразия ^(х|,...,хя)=0 могут быть интерпретированы как задаваемые целевые мио жества, к которым неизбежно должна притягиваться ИТ из произвольного начального состо- яния, а затем в соответствии с уравнениями (1.30) двигаться вдоль них. Например, для объектов второго порядка многообразие ip=Q (1.26) представляет собой уравнение желаемой фазовой траектории ip(x\ ,хг) = 0, с которой ИТ должна сначала сблизиться, а затем двигаться вдоль нее к началу координат фазовой плоскости. ; В аналитической механике [81] многообразия ip=0 называют инвариантными. Напомним определение понятия инвариантного (интегрального) многообразия динамической системы. Гладкая поверхность в пространстве координат xi,...,xH называется инвариантным (интег- ральным ) многообразием системы (1.30), если произвольная траектория, имеющая хотя & одну общую точку с этой поверхностью, целиком ей принадлежит [167]. Очевидно, что особый интерес представляет построение инвариантных многообразий последовательно понижающей^ ся размерности (л-1, п-2, и т.д.), которые обладают свойством притяжения траектория, начинающихся вне этих многообразий. Отметим теперь, что функциональное уравнение (1.28) может быть записано в виде dip dip Д dip 1/м d-31) /1“ 1 у т.е. представлено как равенство между полной производной (1.24) и некоторой произвольной функцией <p(ip), обращающейся в нуль на заданных инвариантных многообразиях ^>(0) = 0. Наличие в правой части уравнения (1.31) функции <p(ip) вообще позволяет учесть дополни- тельные требования к динамическим свойствам синтезируемых систем в отношении быстро- действия, ограничения координат и т.д: Именно уравнение (1.31) и является тем условием, которому необходимо удовлетворить для того, чтобы соотношение (1.26) было заданный инвариантным многообразием синтезируемой системы. Подчеркнем, что наличие или отсутствие в пространстве состояний некоторых инвариан- тных многообразий ip=0 является весьма важным для поведения именно нелинейных систем, для которых, как известно, не сохраняет свою силу классический принцип суперпозиции. В этой связи свойства нелинейных систем кардинальным образом отличаются от линейных многовариантностью своего поведения. Наличие же в пространстве состояний притягивающих многообразий (аттракторов), к которым устремляются решения нелинейных дифференциаль- ных уравнений систем, позволяет определенным образом упорядочить их поведение и подчи- нить движение некоторым достаточно строгим законам. В соответствии с этими законами Ш системы, попав в область действия притягивающего многообразия, затем неизбежно попадая на него и дальнейшее поведение системы будет определяться уже свойствами этих многообра- зий. Разумеется, что в общем случае в исходном пространстве состояний нелинейных объект» могут быть такие инвариантные многообразия (“черные дыры”), свойства которых не соответ- ствуют или даже противоречат требуемым динамическим свойствам синтезируемых систем. Существенное отличие от задач механики [81] рассматриваемого метода применена инвариантных многообразий ip=0 (1.26) для задач управления состоит в том, что эти много- образия не отыскиваются, а заранее задаются. Здесь изучается проблема построения такю 64
нелинейных систем управления различной физической (химической, биологической и т.п.) природы, в которых протекают переходные процессы, удовлетворяющие поставленным зара- нее требованиям в виде конечных уравнений (1.26). В итоге, задача синтеза сводится к построению дифференциальных уравнений замкнутой системы (1.23), (1.29) по заданным частным интегралам (1.26)—инвариантным многообразиям, описывающим заданную про- грамму движения. В определении законов управления (1.29), обеспечивающих желаемое движение замкнутой системы (1.23), (1.29), и состоит основная задача АКАР, т.е. аналитиче- ского конструирования нелинейных регуляторов по заданным инвариантным многообразиям. . Функция ^(xi,...,x„), определяющая многообразие (1.26), выше была названа агрегирован- ной макропеременной. Под агрегированием обычно понимается [67, 73] получение из исход- ноймодели задачи так называемой агрегированной модели, которая содержит в себе меньшее количество переменных, чем исходная. Агрегированная модель должна быть проще исходной модели, являться ее следствием, при этом эквивалентом агрегирования является факторизация систем [73—75]. В. работах [67, 76, 77] предложены некоторые способы приближенного агрегирования линейных систем. ^Функции y>(xi,...,хл) и, следовательно, притягивающие многообразия V>=0 могут строиться различными способами. Для целого класса распространенных объектов, в частности имеющих треугольную функциональную матрицу, т.е. описываемых дифференциальными уравнениями ~ 1,2,...,n- 1, л Л(0 = А(хь~л«)+ и, функции у конструируются в результате регулярной процедуры, исходя из требований ко времени и характеру (апериодическому) затухания переходных процессов и асимптотической устойчивости движения в целой синтезируемой системы (см. третью главу). В общем же случае при выборе притягивающих многообразий у>(х1,...,хя)=0 полезно придерживаться следующего положения: оказывается, что целесообразно построенные и тех- нически рациональные нелинейные системы (“объект—регулятор”) имеют в пространстве состояний некоторое внутреннее “желаемое” состояние ^ж(х1,...,х„)=0, на котором обеспечи- вается асимптотически устойчивое динамическое равновесие системы и сохраняются основные характерные свойства объекта (технический гомеостазис). Перевод объекта на это состояние осуществляется в результате действия синтезируемых управлений м(х1,...,хя), которые, как правило, минимальны, что согласуется с известным в механике принципом наименьшего принуждения Гаусса [8]. Задача конструктора системы управления состоит в поиске желаемо- го для объекта притягивающего многообразия ^ж=0 в пространстве состояний. Наличие этого многообразия непосредственно связано с внутренними свойствами нелинейного объекта и свойствами решаемой системой (“объект—регулятор”) технологической задачи, характери- стики которой обычно являются внешними (требуемыми) по отношению к объекту. Очевидно, что вид закона управления (регулятора) существенным образом зависит от близости или различия динамических свойств объекта и требуемых свойств системы. При использовании желаемых притягивающих многообразий регулятор наилучшим образом согласует свойства велииейного объекта и требования технологической задачи, обеспечивая высокие динамиче- ские показатели синтезированной системы и гарантируя асимптотическую устойчивость дви- жения. г « Перейдем теперь к выявлению некоторых общих оценок таких фундаментальных свойств нелинейных систем, синтезируемых методом АКАР, как их асимптотическая устойчивость и время затухания переходных процессов. На замкнутую систему (1.23), (1.29) постоянно действуют некоторые, возможно и малые, возмущения, что приводит к уходу ИТ с желаемого многообразия 1р=0 (1.26). В этой связи возникает первая задача об устойчивости в АКАР, которая конкретно сводится к асимптотической устойчивости уравнения (1.27) относительно решения у»(Г) = 0. Выше было показано, что решение первой задачи зависит от выполнения простейшего условия Т > 0. При этом инвариантное многообразие ^>=0 будет притягивающим 65
для всей-области пространства состояний, в которой справедливы уравнения (1.23) объекта. К нему притягивается ИТ системы из любого начального состояния в указанной области. Ф В большинстве задач управления конечная цель может быть сведена к попаданию ИТ системы в начало координат (хи=О,...,х„*=О) пространства состояний, поэтому процесс ди£ жения можно условно разбить на два этапа—этап устойчивого движения ИТ к многообразию ^>=0 (1.26) и этап устойчивого движения ИТ вдоль этого многообразия к началу координат^ пространства состояний. Следовательно, возникает вторая задача об устойчивости в АКАР^- исследование асимптотической устойчивости движения ИТ вдоль ^=0 к началу координат: Приведенные дифференциальные уравнения второго этапа движения имеют вид (1.30). Поря- док этих уравнений равен п-1, что упрощает получение условий их асимптотической устой- чивости. Итак, решение задачи асимптотической устойчивости синтезируемых нелинейный систем сводится, по существу, к выявлению'условий устойчивости решений дифференциал^ ных уравнений (1.30), описывающих движение ИТ вдоль многообразия (1.26) к начал| координат пространства состояний системы. Ф Перейдем теперь к выявлению некоторых приближенных оценок времени затухания пере- ходных процессов в синтезируемых системах. В большинстве случаев оценка этого времени? нелинейных системах представляет самостоятельную задачу, которая обычно решается путем' моделирования на ЭВМ. В методе АКАР процесс изменения функции tp(t) в общем случай определяется решением дифференциального уравнения (1.27) и зависит от вида функцщ Выберем сначала линейную функцию <p(ip) = ip, тогда функционал (1.22) принимает квадратичную форму г • Г 22 2’2/ \"l j (1.32)*, /в = / m2y>2+ C2V>2(0 dt, 0 *- . J а соответствующее ему функциональное уравнение (1.27) имеет вид , 7^(0+ V' = 0- (1.33). Из его решения = ^о(*1о»-.Х||о)е ~'Т (1И| следует, что время затухания функции ^(0 от ее начального значения^оДОконечного^*можетj быть найдено по формуле = Tin Приняв = (0,01 -5- O,O2)t^o, получаем ' z ^«(4-s-5) Г. (1-35^ Оценка (1.35) приближенно определяет время попадания ИТ в окрестность многообразия^ У>о(хю,-,х><о) Время движения вдоль ^=0 к началу координат пространства состояний xi*= хгк—---—хпк=^ определяется решением уравнений (1.30). / Выберем теперь ограниченную функцию = th^, тогда функционал (1.22) принимает форму ? J = J [/n2th2V>+ cV2(0] Л» < о *- J- а функциональное уравнение (1.27) вид * < Т^(Г)+ thV» = 0. (1.37) Решение уравнения (1.37) будет следующим: shV>(0 = shV'oe ~t/T. (1.38f Из него получаем время затухания функции ip(t) от ее начального значения до конечного грк по формуле f _ т. sh^xio,...^) (1.39) ^-imshqk(xxk.....Хпку ; Приняв в (1.39) ipk — fV'o, £ = 0,01 -5- 0,02, находим 66
(1 40) j sh^o Оценка (1 40) приближенно определяет время попадания ИТ в окрестность ^=0 для уравнения (137) .Сравним полученные оценки (1 35) и (1 40) Из оценки (1 35) следует, что время Ц Остается неизменным для произвольных начальных условий ^о, а согласно (1 40) оно зависит at "начальных условий и в каждом конкретном случае определяет время сближения ИТ с ффягивающим многообразием Указанные отличия оценок (1 35) и (1 40) определяются тем, что дифференциальное уравнение (1 33) является линейным относительно агрегирован- ие^ макропеременной у, а уравнение (1 37)—нелинейным ’т Оценим теперь общее время затухания переходных процессов по координатам xi, ,хп замкнутой системы За время7 ty, (1 35) или (1 39) ИТ сближается с притягивающим много- образием =0 и попадает в его определенную окрестность Затем в соответствии с уравнениями (130) ИТ движется вдоль этого многообразия к началу координат хи=хг*= =x«*= 0 про- странства состояний и, следовательно, общее время затухания переходных процессов может бцть приближенно оценено суммой времени Ц и времени t (1 30), определяемого решением уравнений (1 30), т е . £ ty,+ t(i зо) (1 41) Верхняя оценка (141) позволяет указать максимально возможное время затухания переход- ных процессов в нелинейной системе , ’ Теперь сравним качественный характер процессов попадания ИТ в окрестность ^=0, описы- Мавк соответственно уравнениями (1 33) и (1 37) В обоих случаях переходные процессы имеют апвДОдический характер, однако для уравнения (1 37) после истечения времени Гу, (1 40) ИТ будет ваходиться в более близкой окрестности многообразия V*=0, что определяется нелинейной огра- аиеиной функцией th^ в этом уравнении Указанное утверждение следует из того, что в пределе функция thV' может быть представлена релейной функцией sign^, тогда уравнение (1 37) переходит В предельную форму у 7V(t)+ sign^ = 0 (1 42) Очевидно, что предельное функциональное уравнение (1 42) также асимптотически устойчиво вдююм, т к функция Ляпунова V = 0,5^2 имеет в силу этого уравнения первую производную F(t) = -у sign V', являющуюся определенно-отрицательной функцией для всего простран- ства состояний, кроме многообразия 0, на котором возможен скользящий режим движения [88]. В этом случае, в отличие от уравнений (1 33) и (1 37) с непрерывными функциями $$), ИТ сближается с мнргообразием ,х„)=0 не за теоретически бесконечное время, как это следует из решений (1 34) и (1 38), а за определенное конечное время <-«. = у 'V’ol, зависящее от начальных условий Лю) К другой особенности предельного уравнения (IM2) относится то, что траектория движения ИТ в момент Гу, не сближается асимптотически с^М), а “втыкается” в него, т е ИТ теоретически точно попадает на притягивающее многооб- разие. Разумеется, что и здесь в реальных условиях из-за действия неучтенных малых нели- нейностей, запаздываний в объекте и т п в окрестности многообразия ^=0 возникает некото- рый “пограничный слой” [88], в котором и будет двигаться ИТ к началу координат простран- ен состояний системы. - Итак, для предельного уравнения (1 42) с разрывной функцией <p(ip) = sign^ ИТ из про- извольного начального состояния V>o(*i о, . ,Хло) за конечное время (1.43) теоретически точно попадает на притягивающее многообразие V'Cxi, ,х,1)=0 в отличие от уравнений (1 33) и (1.37), для которых ИТ приближенно через время Ц, (1 35) или Гу, (1 40) попадает в окрестность Указанного многообразия Само собой очевидно, что для этих двух случаев при строго теоре- (1 43) 67
тическом рассмотрении ИТ может попасть на многообразие ^(Х1,...,хя)=0 лишь в начале координат пространства состояний хм=Х2*=—=Хп*= 0 в течение бесконечного времени. В реальных же условиях при рассмотрении прикладных задач ИТ уже через время ty> (1.35) или ty, (1.40) будет находиться в близкой окрестности многообразия V»(xi,...,xn)=0 и в дальнейшей будет осуществлять вдоль него движение, приближенно описываемое уравнениями (1.30). Свойства и устойчивость этих уравнений будут определять характер процесса движения f началу координат пространства состояний. • ~ Изложенное подтверждает ранее высказанное положение о том, что характер движения i многообразию ^(х1,...,хи)=0 для уравнения (1.37) действительно занимает некоторое проме- жуточное положение между свойствами движений для линейного (1.33) и предельного (1.42); функциональных уравнений. В режимах больших отклонений от хр—0 указанный характер движения будет близок к характеру движения, определяемому уравнением (1.42), а в режиме малых отклонений—уравнением (1.33), т.е. уравнение (1.37) обладает определенными уни- версальными свойствами. В дальнейшем в основном будут использоваться непрерывные фун- кции = th^ иу>(^>) = и соответствующие функциональные уравнения (1.33) или (1.37) для синтеза законов управления (1.29) при аналитическом конструировании нелинейный систем. Векторное управление. Аналогично изложенному выше скалярному случаю, можно по- лучить функциональные уравнения при векторном управлении объектом, который описывав ется системой нелинейных дифференциальных уравнений я Xi(t) = Л(*ь—,*«)+ bsits, i = 1,2,...,л, s = 1,2,...,р, р < п, (1.44) где xi(t)—координаты состояния; /—непрерывные дифференцируемые по своим аргумента» функции; Л(0,...,0) = 0; us—составляющие вектора управления u(ui,...,zzp). На координаты управления us могут быть наложены ограничения , 1х,1 < Х/max ИЛИ ^(xi,...,xf) = 0, I Us I < Us max- (1.45) Требуется синтезировать такой вектор управления u(zzi,...,zzw), который обеспечивает перевод изображающей точки (ИТ) объекта (1.44) из произвольного исходного состояния (в некоторой допустимой области) сначала на некоторое многообразие V>(xi,...,xn)=0, а затем в заданное состояние, в частности, начало координат (хю = ... = хио = 0) пространства состояний. При этом на траекториях движения замкнутой системы должен достигаться минимум некоторое оптимизирующего функционала или должны удовлетворяться требуемые первичные показа- тели качества, выполняться ограничения (1.45), а также гарантироваться асимптотическаз устойчивость движения в некоторой области или в целом. Будем считать, что движение ИТ должно удовлетворять следующей системе функциональ- ных уравнений: <ps(Vs) = 0, $=1,2,...,р. (1.4^ Функции (pstys) в (1.46) выбираются таким образом, чтобы, во-первых, обеспечить асим- птотическую устойчивость системе (1.46) в целом, т.е. <pstys)’<ps< 0, а во-вторых, достигнуть желаемых показателей качества движения ИТ к притягивающим многообразиям - ®— 7,2,...,р, (1.47) где V’s—некоторые агрегированные макропеременные. Очевидно, что ИТ не может в одно и то же время находиться на разных многообразия^ поэтому она сначала сближается с пересечением многообразий (1.47), а затем движется вдоль него к заданному состоянию (например, хн=Х2*=...=х„^= 0). Это означает, что задача синтеза векторного управления u(zii,...,zip) сводится к обеспечению условий проекции движения исход- ного объекта (1.44) на подпространство многообразий, описываемое системой уравнений (1.46). Синтезируемые управления М1(х1,...,хи),...,цр(х1,...,хл) должны сначала обеспечить пе- ревод ИТ в окрестность пересечения многообразий (1.47), а затем движение вдоль этой пересечения, описываемое дифференциальными уравнениями =/Лх1,-”,Х/), j = l,2',...,zz-p. (1.48) 68
(1.49) w' Итак, сначала используется параллельная совокупность многообразий (1 46), (1 47), в дезультате чего ИТ попадает на пересечение у»,=0 (1 47), а затем движение ИТ будет описы- ваться уравнениями (1.48). Для синтеза управлений ws(xi, ,хи) запишем функциональные уравнения (1.46) в силу исходных уравнений объекта (1 44) *=1 ОХк к=\ ОХк гае # 0 Обобщенные функциональные уравнения (1 49) позволяют, в зависимости от ®х* конкретных форм макропеременных tys(x\,. ,Хп) и функций получить различные регу- лятрры Для этого в результате совместного решения алгебраических уравнений <4 49) нахо- дятся управления м,(хь . ,хи), которые обеспечивают перевод ИТ в окрестность пересечения р многообразий (1.47), а затем движение ИТ вдоль указанного пересечения в соответствии с дифференциальными уравнениями (1 48) Если р = л, то соотношения (1 47) представляют Собой точку, совпадающую с началом координат пространства состояний, что и обеспечивает асимптотическую устойчивость движения замкнутой управлениями н$(хь ,х„) системы. На Практике более распространен случай, когда р < п, при этом возникает задача построения устойчивого движения вдоль пересечения многообразий (1 47), которое будет описываться системой дифференциальных уравнений (1 48) (л-р)-го порядка Предложенный здесь подход к синтезу систем имеет весьма общий характер и может быть ‘конкретизирован путем соответствующего выбора макропеременных V\(xi, ,х„) и функций Покажем, что этот подход может быть изложен в терминах теории оптимального управления Для этого предположим, что синтезируемые системы должны быть оптимальными последующему функционалу Г 2 Wsp>s(^>s)+ 2 Cj^s(^) dt, Ts = —7- s=l s=l it*. ms (1.50) * 0 Тогда, используя стандартные в вариационном исчислении [65] условия минимума функцио- нала (1.50), можно показать, что уравнения (1 46) являются уравнениями устойчивого подсе- мейства экстремалей Очевидно, что обобщенный функционал (1 50), записанный в силу уравнений объекта (1 44) в виде * 00 Р Р / Я ' ‘ А — S 2 ОТ«(Р«((М+ 2 cs|S (fk+bsusy р р. дфк г dt, (1.51) |s=l s-1 1^-1 $Хк /j отражает как свойства исходного объекта, так и его системы управления Путем соответству- рппрго выбора функций и >хп) на основе функционала (1 51) можно построить различные свертки распространенных инженерных критериев качества (квадратичного, быст- родействия, энергозатрат) для оптимизации режимов малых и больших отклонений Синтези- руемых систем Используя макропеременные вида V* = Хк+ A th F(xi, ,хи), можно обеспечить ограничения (1 45), наложенные на координаты и управления системы. г A7. ИНВАРИАНТНЫЕ МНОГООБРАЗИЯ В ЗАДАЧЕ СИНЕРГЕТИЧЕСКОГО , СИНТЕЗА НЕЛИНЕЙНЫХ АГРЕГИРОВАННЫХ РЕГУЛЯТОРОВ f ! ' ! Инвариантные С&йгношения в механике и метод АКАР. В предыдущем разделе исклю- чшельно на основе условий минимизации сопровождающих функционалов (1.22), (1 25) и "(1J0X, (1.51) были получены соответствующие функциональные уравнения, которые позво- ляют вайти множества законов управления (1.29) или (1.49). Эти законы неизбежно переводят изображающую точку (ИТ) синтезируемой системы в окрестность некоторого многообразия 00 (1.26) или на пересечение многообразий ips=0 (1.47) в фазовом пространстве 69
Оказывается (и это было несколько неожиданным для автора), что полу ченныерезультап имеют глубокую связь с теорией инвариантных соотношений в аналитической механике [HJ, поэтому возникает насущная необходимость изложить здесь элементы теории АКАР нес позиций минимизации некоторого выбранного оптимизирующегофункционала, а с испояае» ванием свойств инвариантных многообразий. Тем самым попытаемся проложить путь дя перехода от формально-математического рассмотрения теории АКАР, как это выполнеяг! разделах 1.5 и 1.6 в соответствии со стандартной теорией АКОР, к исследованию и включена в состав метода АКАР естественно-геометрического содержания задач управления и, следе» тельно, к изучению связи этих задач с фундаментальными принципами (законами) сохранеяи классического естествознания и базовыми понятиями современной синергетики—науки! самоорганизации в нелинейных динамических системах. Для этого сначала рассмотрим ска- лярный случай и предположим, что управление u(xi,...,x„) уже выбрано и тогда дифференци- альные уравнения замкнутой системы с объектом (1.24) примут вид Х/(?) = i — 1,2,...,и, (152) гдеЯ* =A(xi,...,xn), к= 1,2,...,/г-1; Rn =/я(хь...,хи)+ u(xi,...,x„). В аналитической механии [81] конечное соотношение между переменными £i,...,xn, т.е. ^(х1,...,хл)=0 называют инвари- антным по отношению к исходным дифференциальным уравнениям (1.52), если все их реше- ния удовлетворяют равенству гр=О при любом значешш переменной 1. Многообразие рМ' отражает некоторое свойство, характерное только для тех решений системы (1.52), начальна условия которых подчиняются соотношению V>=0. Инвариантное многообразие ^=0 называю! также частным интегралом. Оно описывает в фазовом пространстве некоторую гиперповер- хность размерности п— 1, образованную интегральными кривыми системы (1.52). Инвариантным соотношением является также всякий первый интеграл const, в котором произвольной постоянной задано некоторое частное значение, поэтому инвариантное соотно- шение гр=О называется также частным интегралом. Всякое инвариантное соотношеи V>=0, согласно самому определению, образует в пространстве координат системы (1.52) от- дельную гиперповерхность, в то же время первый интеграл const определяет множена таких гиперповерхностей, заполняющих пространство в том смысле, что одна и только одяви этих гиперповерхностей проходит через каждую точку. Это связано с тем, что постояннм! правой части гр—const для всякого отдельного решения системы (1.52) должна иметь подход» щее значение, а именно: если хю,...,хяо являются соответствующими начальными значенияв координат xi,...,x,(, то эта постоянная должна быть положена равной гр(хю,...,Хио). Другие словами, гиперповерхности гр—const таковы, что на каждой из них лежит целиком однозначм определенная траектория движения, проходящая, через какую-нибудь ее точку. В литератур» иногда интегралом системы (1.52) называют также и саму функцию V>(xi,...,хп), однако такув функцию точнее назвать инвариантом в том смысле, что в фазовом пространстве фунхвдв ^(хь...,хп) сохраняет постоянное значение вдоль всякой траектории движения [81]. Физиче- скими примерами цервых интегралов механической системы, описываемой уравнениями Лг- ранжа второго рода, являются обобщенный интеграл энергии и циклические интегралы. I частности, для скалярных консервативных систем обобщенный интеграл представляет собй обычный интеграл, отражающий закон сохранения общей механической энергии систем^. В случае же, когда некоторая обобщенная координата не входит явно в выражение для ф\ нкци» Лагранжа, но эта функция содержит явно соответствующую производную по времени от указанной координаты, тогда обобщенный интеграл будет отражать закон сохранения количе- ства движения механической системы [136]. ' Укажем теперь математические условия, характеризующие уравнение гр=О как январи» твое многообразие [81]: для того, чтобы это многообразие было инвариантным, необходим и достаточно, чтобы функция гр(х! ,...,х«) оставалась равной нулю при изменении t для всемл» уравнений (1.52), начальные условия которых обращают эту функцию в нуль. Это утвержде ние эквивалентно тому, чтобы для всех указанных решений полная производная от^> по t 70
«< ,= 1 dx‘ взкгая в силу уравнений (1 52) = S ^Xl'" /«XI. -X,), ° 53) < Ctt l’=j OX[ должна быть тождественно равна нулю Можно вообще доказать [81], что для этого необхо- дию и достаточно, чтобы функция ip(xi, ,хп) от п независимых переменных х\, ,хп удовлет- воряла линейному дифференциальному уравнению в частных производных следующего вида $(0 = W» (1 54) 1Д€$(0 определяется выражением (1 53), а ш есть некоторая гладкая функция от хь ,хп в рассматриваемой области Подставив ^(f) из (1.53) в (1 54), получаем -А dy>(xi,...,xn) п, ч ч * (155) 1 с 2 а— “ ^(^1, •iXnWtXl, . Л. *=‘ *' Уравнение (1 55) называется характеристическим и является тем условием, которому необхо- димая достаточно удовлетворить, чтобы соотношение (1 26) было инвариантным многообра- зием системы (1.52). Полученное характеристическое уравнение (1 55) можно обобщить путем введения более широких классов функций в его правой части [68,174] Уравнение (1 55) получено приравниванием полной производной по t заданного частного интеграла чр=О линей- до^функции аир В общем случае указанную производную можно приравнять некоторой (Произвольной функции Ф(^,хь ,хп), обращающейся в нуль на заданном интегральном мно- ^ро^разии, те Л = $ эу(х, ,х„) = ф(^хь (156) UI О Xi 1ДеФ(0,Х1, ,хи) = 0. Уравнение (1 56) является обобщенным необходимым и достаточным условием осуществимости движения системы (1 52) с заданным многообразием V'-O в ее фазрвом пространстве. /^Очевидно, что полученные уравнения (1 55) и (1 56) аналогичны уравнениям (1 28) и Д$1)»найденным в 1.6. Однако, функциональные уравнения (1 28) и (1 31) являются более .общими, т.к. в них входит варьируемая функция и(х\, ,хи), которую можно выбрать по нашему усмотрению, в частности, из условий минимизации сопровождающего функционала (1 22) и 4Ц5).Вэтом принципиальное отличие уравнений (1 28) и (1.31) отуравнений (1.55) и (1 56) Дсшф в том, что уравнения (1 55) и (1 56) позволяют только отыскать соответствующие инвариантные многообразия для уравнений динамики (1.52), в которых управление никак не выделено, в то время как уравнения (1.28) и (1 31) позволяют найти управление по заданному многообразию ^>=0. Другими словами, в случае (1 28) и (1 31) инвариантные многообразия веотыскиваются, а заранее задаются в зависимости от требуемых свойств синтезируемой Системы. ! ! Изложенная здесь процедура поиска инвариантного многообразия с помощью уравнений ХК^) или (1 56) допускает очевидное обобщение на несколько функций Теперь предяоло- адм» что объект имеет т каналов управления ? “ =/К*1,...,*«)+«Х*1,-..,*л), /=1,2». ,n, /=1,2,. ,т < п (157) «управления щ уже выбраны из каких-либо соображений, т.е. система (1 57) принимает вид ' < х<(/) = Л/(Х1, .,хп), (1.58) = «*, к = 1,2, ,m; Rm+i = fm+i, ,Rn = fn Предположим, что желаемые свойства ДЙЙкения системы управления (1 57), т е программа ее движения, заданы некоторой совокуп- МОЙЪю многообразий ? ,хп) = 0, s = 1,2, ,т < п. (1 59) Система (1.59) из т конечных соотношений между координатами хь ,хп называется инвариантной относительно системы обыкновенных дифференциальных уравнений (1 58), 71
если она будет удовлетворяться при произвольном значении t всяким решением х{(/) уравнений (1 58) при начальных условиях, принадлежащих многообразиям (1 59) Считаем, что уравне- ния (1 59) совместны и независимы, для чего необходимо и достаточно [81], чтобы рздг якобиевой матрицы от tps по х, был равен т, т е rang D - rang эу>1 dxi topi дХ2 dxi top2 dX2 dtym dxi topm dX2 = m 4ь topi дХщ top2 dxni topm d%m В этих условиях уравнения (1.59) определяют в фазовом пространстве координат хь а некоторое (п-т)-мерное многообразие пересечений, образованное интегральными кривым (фазовыми траекториями) системы (1 58), из которых только одна проходит через даннуй точку указанного многообразия В окрестности этого многообразия функции ips непрерывны вместе с производными tops tops tops dxi ’ дх2 ’ 'дхп ’ ’ ’ ’ Считая уравнения (1 59) независимыми, можно аналогично ранее изложенному сформули^ вать следующие условия инвариантности системы (1 59) для того, чтобы соотношения (1 59) были системой инвариантных многообразий относительно уравнений (1 58), необходимей достаточно, чтобы функции V\(*i, ,хп) удовлетворяли системе дифференциальных уравнений в частных производных [81] dips _ v tops(xi, ,хп) D( _ i о О W dt 2 дХ' -^/(^1, ,Хп) 2 ^s!?Psi •S 1.2» < It Система уравнений (1 60) получена путем подстановки в выражения для полных производи от ips(xi, ,х„) по t значений xi(t) из правых частей-уравнений (1 58) Знание т независим» инвариантных многообразий (1 59) равносильно знанию т независимых между собой интег- ралов системы дифференциальных уравнений (1 58), а это позволяет понизить порядок эЙ1 системы до п-т Способ такого понижения порядка состоит в том, что из соотношений < 1 ^9) находятся выражения для т неизвестных, например для хьхг, ,хш, в функциях от остальаш переменных хт+\, ,хп Подставляя координаты xi,. ,хт в остальные п—т уравнения (1 5$, получаем приведенную систему дифференциальных уравнений (п—/п)-го порядка * I ~ Rm+p(Xm+lf ,Хп)> ft ~ 1,2, ,П ТП, (1 где функции R*m+n находятся из исходных функций Rfcxi, ,xm) (1.58) в результате указанной подстановки и зависят только от переменных хт+1, ,хп. Интегрирование приведенной систем» (1 61) дает уже не общий интеграл исходной системы (1 58), а только некоторый класс решений Xm+tW, и именно тех решений, которые удовлетворяют инвариантным многообразиям (159); [81] Это важное в прикладном плане свойство решений приведенной системы (1.61) яо отношению к решениям исходной системы (1 58), т.к. в методе АКАР многообразия (1 59) ж отыскиваются, а задаются, “навязываются” синтезируемой системе Другими словами, указа® ное свойство определяет достаточные условия существования желаемых многообразий (1 59) в фазовом пространстве замкнутых систем Заметим также, что в приведенной системе (1 61) не осталось никакого следа от т коод-1 динат xi,. ,хт, т е при определении xm+tt (/<=1,2, ,п) можно не знать (игнорировать) осталь- ные координаты хь ,хт, входившие в исходную постановку задачи управления Имен») поэтому в аналитической механике [81] такой прием получил название метода игнорирование координат Эта особенность приведенной системы (1 61) будет использована при дальнейшей разработке метода АКАР для разных классов нелинейных динамических объектов 72
^.Уравнения (1.61) получены приравниванием полных производных по t заданных частных интегралов (1.59) линейным функциям o)s^Ps- В общем случае указанные производные можно также приравнять некоторым произвольным функциям обращающимися *1$ль на заданных интегральных многообразиях (1.59). Тогда обобщенные необходимые , уяювя осуществимости движений системы (1.58) с заданными свойствами (1.59) можно заикать в следующем виде: (tys _ ” tyf(Xl,...,X„) у\-фА/, V (1-62) гдеФ,—произвольные функции, обращающиеся в нуль на инвариантных многообразиях (1.59), т.е. 4>s(0,xi,...,x„) = 0. Уравнения (1.62), доставляющие необходимые и достаточные условия того, чтобы заданные соотношения (1.59) были инвариантными многообразиями Системы (1.58), получены на основе известных классических результатов динамики механи- чесйах (неуправляемых) систем. Метод инвариантных соотношений используется в механике каг математический прием понижения порядка исходных систем канонических уравнений, чтобы найти наибольшее число приведений, допускаемых частным видом таких систем по сравнению с системами общего вида, а также для выявления некоторого класса частных решеиий, имеющих прямое истолкование механической природы движения [81]. В1задаче же АКАР требуется найти управление и/ объектом (1.57), чтобы полученная при OToff замкнутая система (1.58) с функциями /?,(xi,...,xn) в правых частях уравнений имела заданяые интегральные многообразия (1.59). Это означает, что управления и} переводят ИТ системы из произвольной области фазового пространства координат xi,...,xn на многообразия (1.59), точнее на пересечение этих многообразий. В дальнейшем должно быть организовано движение вдоль указанного пересечения к началу координат фазового пространства. Получен- ные уравнения (1.62) не позволяют в явном виде найти управления ц. Однако, если вернуться ^исходной системе дифференциальных уравнений объекта (1.57) с несколькими управления- ми, го на основе (1.62) можно получить т уравнений, из которых и найти указанные управ- лении. Эта задача АКАР с векторным управлением кратко рассматривалась ранее в п. 1.6, далее омбудет подробно исследована в третьей главе на основе введения сопровождающих функ- ционалов. Остановимся теперь кратко на вопросе об устойчивости синтезируемых систем. Если в натальный момент времени ИТ системы находится на заданном пересечении интегральных многообразий (1.59), то она должна, вообще говоря, и далее двигаться вдоль указанного пересечения. Однако в реальных условиях на. систему действуют различные возмущения, которые “сталкивают” ИТ с желаемого многообразия. Это и приводит к уже упоминавшейся в 16 первой задаче об устойчивости программного движения, т.е. к задаче об устойчивости интегральных многообразий (1.59) при начальных отклонениях функций от нуля, т.е. • ‘ ^so(Xio,-‘,Xno) * 0, 5 = l,2,...,m < и. (1.63) Решение этой задачи устойчивости сводится к следующей процедуре. Программное движение, задаваемое, в частности, соотношениями (1.59), примем за невозмущенное движение. Тогда любые возможные движения системы (1.62), начавшиеся с состояния (1.63) со скоростями $,(/) = Ф„ отличными от программных, будут представлять собой возмущенные движения системы [68], т.е. уравнения (1.62) могут быть приняты за уравнения возмущенного движения. Очевидно, что для получения условий асимптотической устойчивости программного движения «едет функции в (1.62) выбирать так, чтобы нулевые решения ф*О,...дрт = 0 дифференциальных уравнений (1.62) были асимптотически устойчивыми. [Такие условия можно получить на основе соответствующих функций Ляпунова. Выявление условий устойчивости упрощается, если функции Ф1 выбираются зависимыми лишь от переменных При этом условия устойчивости будут зависеть лишь от функций Указанная устойчивость уравнений (1.62) относительно тривиальных решений означает, что инвариантные многообразия (1.59) будут представлять собой притягивающие 73
гиперповерхности, к которым притягивается ИТ замкнутой системы из произвольной области фазового пространства координат. Во многих задачах управления конечная цель управления состоит в попадании ИТ вначале координат x\k = 0,...,х>ц = 0. Следовательно, возникает вторая задача об асимптотически устойчивости движения вдоль пересечения многообразий (1.59) к началу координат фазового^ пространства. Очевидно, что определение условий устойчивости на этом этапе движения непосредственно связано с устойчивостью решений приведенных дифференциальных уравне- ний (1.61), описывающих движение ИТ вдоль пересечения многообразий (1.59). Порядок уравнений (1.61), в отличие от исходной системы (1.58), равен п—т, что упрощает получение искомых условий асимптотической устойчивости этих уравнений, а следовательно, и замкну- той нелинейной системы. Подведем некоторые итоги. Выше изложены математические особенности применения инвариантных многообразий для отражения требуемых свойств движения нелинейных систем, приведены необходимые и достаточные условия того, чтобы задаваемые соотношения (1.5?) были инвариантными многообразиями замкнутой системы. Эти многообразия и представляют собой некоторую заданную программу движения. Полученные необходимые и достаточные условия позволяют доказать, что выбранные соотношения (1.59) являются инвариантным! многообразиями. Затем могут быть синтезированы управления н?, которые гарантируют суще- ствование таких многообразий для замкнутой системы. Эту задачу АКАР можно, как показано в 1.6, эффективно решить с привлечением некоторых сопровождающих функционалов, отра- жающих соответствующие инженерные требования к переходным процессам. Изложенное здесь указывает на очевидное родство результатов, основанных на непосредственном приме- нении теории инвариантных многообразий в механике и теории АКАР с привлечением сопро- вождающих* функционалов. Однако имеются и существенные отличия—в задачах АКАР ука- занные многообразия не отыскиваются, а заранее задаются, исходя из требований к качествен- ным свойствам синтезируемых систем. Связи в механике и метод АКАР. Выявленное выше определенное родство между методом АКАР и теорией инвариантных соотношений в аналитической механике [81] указываете естественный характер базовых понятий, положенных в основу теории АКАР. Этим понятиям можно дать более конкретную механическую интерпретацию. Механическая система состоит из совокупности материальных точек, движение каждой из которых в отдельности зависит от движения и положения остальных точек, т.е. между точкам системы всегда существуют некоторые силы взаимодействия. Указанные взаимодействия точа могут быть обусловлены силами, влияющими на ускорение; связями, стесняющими положена и скорости точек, а также внешними силами от воздействия других объектов, не входящих i рассматриваемую систему [165]. Если материальные точки, составляющие систему, не могу занять в пространстве произвольного положения и иметь любую скорость, то это означает, что на систему наложены ограничения, называемые в механике связями. Эти связи, вводящи ограничения на изменения координат и скоростей точек, аналитически записываются в виде некоторых уравнений (ip=0) или неравенств [136]. Конкретно уравнения связей отражают,) частности, способ соединения отдельных элементов, образующих в своей совокупности меха- ническую систему. Так, например, для манипуляционного робота уравнения связей описываю! способ соединения между собой его звеньев, что и определяет структуру манипулятора. 1 результате такого наложения связей число степеней свободы робота будет меньшим по ср» нению с общим числом степеней свободы его базовых элементов. Аналогично можно дал конкретную интерпретацию связей для любого механического объекта. В аналитической механике [136, 151, 165] известен принцип освобождения от связей; I физическом плане этот принцип утверждает, что ограничения, вводимые связями на систему, представляют собой дополнительные силы, называемые реакциями связей, действие которш эквивалентно действию связей. Другими словами, реакция связи есть сила, которая, будучи приложенной к материальной точке вместо связи, сохраняет неизменным закон движени 74
. точки. При действии других (активных) сил на систему реакция связи должна быть такой, чтобы левая часть уравнения связи (^=0) была инвариантом (первым или частным интегра- лом) динамических уравнений механической системы, так как вдоль действительной траекто- рии движения указанная связь должна всегда тождественно удовлетворяться. Отсюда непос- редственно следует идентичность менаду понятиями “связь” и “инвариантные соотношения” в аналитической механике и инвариантными многообразиями в методе АКАР. В механике связь в виде уравнения V»(xi..хп, хь...,хм,0 = 0, содержащего координаты, их производные и время /, называют дифференциальной, или кине- матической, удерживающей связью. Если уравнение у>=0 явно содержит время t, то такая связь называется еще реономной, или нестационарной. Связь, накладывающая ограничения дашь на координаты точек системы, т.е. когда уравнение ^(xb...,x„,f) = 0 не содержит скоро- стей, в механике называется голономной, или геометрической. Если уравнение дифференци- альной (кинематической) связи, содержащей производные от координат xi(t),...,xn(f), нельзя путал интегрирования привести к виду ip(xi,...,xn,t) = 0, в котором отсутствуют производные, То эта связь называется неголономной, или неинтегрируемой. Голономная связь называется склерономной, или стационарной, в том случае, если ее уравнение не содержит явно времени 4 т-^. имеет вид = 0. В дальнейшем в методе АКАР, кроме задач терминального управления, будут использоваться в основном стационарные инвариантные многообразия, что В терминах аналитической механики означает введение голономных склерономных связей, накладываемых на дифференциальные уравнения (1.52), описывающие поведение замкнутой системы “объект—регулятор”. • Аналогичную интерпретацию можно дать и соотношениям (1.59), если предположить, что механическая система состоит из п материальных точек [ 151 ]. В общем случае эти точки могут перемещаться в пространстве координат без всяких ограничений и тогда для определения их мгновенного положения потребуется задать Зп координат (по три координаты на каждую Кгёу). Это означает, что механическая система обладает Зп степенями свободы. Однако в зависимости от назначения этой системы на перемещение ее точек могут накладываться различные конструктивные и технологические ограничения, например точки должны нахо- дится на некоторой заданной поверхности. В этом случае указанные s ограничения будут представлять собой дополнительные условия—связи, которым должно удовлетворять положе- ние материальных точек. Теперь уже для однозначного определения их положения достаточно зшь не Зп, а меньшее число (г) координат. Остальные s = Зп- г координат могут быть шпислены из уравнений связи ips=0. При этом вовсе не обязательно в качестве независимых брать исходные (декартовы) координаты. Для этого можно использовать любые г переменных задание которых однозначно определяет положение материальных точек. Такого рода переменные получили в механике название обобщенных координат. Важно то, что во всех случаях число независимых обобщенных координат г остается одним и тем же. Это число называется числом степеней свободы механической системы. " Понятие связи является базовым в аналитической механике. Связи оказывают на матери- альные точки механической системы пассивные воздействия, т.к. реакции связей—это пассив- ные силы. Они влияют как на положение равновесия в статике, запрещая точкам смещаться в одних направлениях и не. препятствуя смещению в других, так и на характер движения в давамике, заставляя его характеристики удовлетворять уравнениям связи в каждый момент времени. Основная задача статики, как известно [136,165], состоит в формулировке условий, обеспечивающих равновесие системы материальных.точек, а также в определении всех воз- можных положений равновесия. Эти условия следуют из уравнений виртуальных перемеще- на, которые* составляются на основе связей, наложенных на механическую систему. При этом существенным является понятие множества виртуальных перемещений точек, соответствую- щих наложенным связям. Положение равновесия системы означает отсутствие ускорений и скоростей всех ее материальных точек в каждый момент времени. Принцип виртуальных 75
перемещений относится к весьма общим методам решения задач статики, он позволяет наибо- лее просто и экономно сформулировать условия равновесия систем материальных точек на основе геометрических свойств связей и учета активных сил без введения неизвестных реакция связей. Связи, точнее реакции связей, также непосредственно входят и в уравнения динамики механических систем. Так, основополагающий принцип динамики—принцип Даламбера гла* сит: если к каждой точке системы в некотором ее положении приложить имеющиеся активные силы, реакцию связей и силу инерции, то это положение будет положением равновесия, системы. Итак, понятие связи непосредственно входит в основополагающие принципы анали- тической механики: принцип виртуальных перемещений в статике и принцип Даламбера в динамике. Это указывает на тот важный факт, что понятие связи и учение о связях игракц фундаментальную роль в аналитической механике. Изложенные здесь соображения выявили идентичность и родство между связями в меха- нике и инвариантными многообразиями s = 1,2,...,m) в методе АКАР. Однако между этими понятиями имеются и определенные различия. Дело в том, что в отличие от обычных двусторонних связей (геометрических и кинематических), инвариантные многообразия реализуются с помощью так называемых сервомоторных сил [81], которые совершают не равную нулю работу при любых виртуальных перемещениях, совместимых со связями меха: нической системы. Осуществляемые указанным образом связи в отличие от обычных связей механики названы в [81] динамическими. Сервомоторные силы, реализующие динамические связи, в задаче о движении механической системы представляют собой некоторые прямо приложенные силы. Тогда эту систему можно рассматривать как подчиненную только обычным связям (геометрическим и кинематическим, в том числе и неголономным) и движущуюся под действием всех активных и сервомоторных сил. Природа динамических связей в методе АКАР определяется задаваемыми многообразиями tps=O s = 1,2,...,/и), где 5—число независимы? соотношений между координатами х, системы. Очевидно, что если на механическую систему действуют только сервомоторные силы, то для полного определения ее движения достаточно к (/г—5)-лагранжевым уравнениям присоединить s уравнений V's—0 динамических связей. Реализация динамических связей в методе АКАР производится с помощью соответствующих законов управления. Итак, вводимые в методе АКАР инвариантные многообразия ij>s=0 ана- логичны обычным связям в механике, но в отличие от них имеют динамическую реализации и могут изменяться в зависимости от желаемых динамических свойств Синтезируемой система управления. В терминах синергетики обычные и динамические связи могут быть интерпретированы как способы введения соответственно “жестких” и “гибких” синергий. Существенное отличие эти синергий друг от друга состоит в том, что “гибкие синергии” образуют своеобразный “времен- ный творческий коллектив” [219], который формируется законом управления для решения требуемой целевой задачи. И после решения указанной задачи этот “коллектив” может быта распущен и сформирован новый для реализации другой программы движения. Указанное динамическое осуществление инвариантных многообразий Vs=O является важной и привлека- тельной особенностью метода АКАР с точки зрения основной задачи ТАУ—синтеза эффек- тивных систем. В распоряжении конструктора системы управления обычно имеется математи- ческая модель объекта, однако модель—это не воплощенная в реальность жесткая, например механическая, конструкция, а некоторое адекватное информационное отражение объекта, и которое можно нежестко “ввести” различные внутренние динамические связи. Эти связи реализуются не с помощью неизменных, например механических, звеньев (твердых тел, соединенных шарнирами, и т.д.), а в виде информационных сигналов управления. Тем самым, условно говоря, “конструируется” фактически новый механико-информационный объект в виде замкнутой системы “исходный объект—регулятор”. Новый объект обладает по сравнёнию с исходным* расширенными показателями и характеристиками. Синтезируя должным образом соответствующие регуляторы, т.е. вводя динамические связи, можно придать замкнутой сис- теме (новому объекту) желаемые свойства с точки зрения решаемой ею технологической 76
задачи управления. Следовательно, в механической интерпретации метод АКАР может быть представлен как своеобразный способ конструирования новых объектов с заданными динами- Чккими свойствами их движения. — С учетом того обстоятельства, что механические системы входят в состав большинства распространенных в технике и промышленности подвижных и технологических объектов, выявленное здесь родство между инвариантными многообразиями 1р$=0 в методе АКАР и такими базовыми понятиями механики, как “инвариантные соотношения” и “связи” [81,136, 151, 165], представляет собой весьма важную конкретную интерпретацию, отражающую механическую аналогию в теории АКАР. В последующих главах книги будут рассмотрены Мйбгие задачи синтеза управлений механическими системами применительно к подвижным объектам, летательным и космическим аппаратам, промышленным роботам и т.п. ь Динамическая парадигма механики сыграла и продолжает играть выдающуюся роль в развитии естествознания, на ее основе были построены классическая оптика, электромеханика ФЮюгие другие науки, т.е. в зависимости от конкретной природы управляемого объекта в методе АКАР можно также выявить оптическую, электромеханическую и т.п. аналогии. В этом смысле установленная здесь определенная аналогия между базовыми понятиями метода АКАР к методов аналитической механики дает основание подчеркнуть обобщающий характер и перспективность развиваемого в теории АКАР подхода к синтезу нелинейных систем управле- Разумеется, что указанная аналогия затрагивает лишь небольшую часть всего того воз- можного богатства других физических, химических и биологических иллюстраций, которое, Очевидно, содержится в конкретных применениях метода АКАР к задачам управления дина- ДОШЖими объектами различной природы. Инвариантные многообразия в естествознании и технике. В п.1.1 было показано, что йййфйанты присущи процессам и явлениям любой природы,—физической, химической, био- лсйической. Остановимся здесь в основном на выявлении инвариантных многообразий в более -уЭКйх областях науки—в теории нелинейных колебаний и теории управления, сравнивая их особенности со свойствами природных (экологических) систем. Многие задачи теории нелинейных колебаний сводятся к изучению нелинейных диффе- рййциальных уравнений, содержащих малый параметр [80]. Исследование таких уравнений значительно упрощается, если с помощью специальных замен эти уравнения могут быть усреднены. Оказывается, что во многих случаях усредненные уравнения обладают инвариан- тами многообразиями тороидального типа, .которые имеют определенные свойства и могут находиться в достаточно малой окрестности интегральных многообразий исходных точных уравнений. Применение метода интегральных многообразий позволяет значительно упростить Шественное исследование решений системы, если они лежат на многообразии мецыпей размерности, чем исходное фазовое пространство. Метод интегральных многообразий дает Ыже возможность строго обосновать так называемый одночастотный метод в нелинейной механике и значительно расширить область его применения. Основная идея в методе интег- рйльяых многообразий состоит в сведении процесса высокой размерности к последовательно- сти некоторых процессов болеенизкой размерности. - В настоящее время методы теории интегральных многообразий получили в нелинейной Механике широкое развитие и обобщение в задачах исследования разнообразных динамиче-: ских систем, описываемых нелинейными дифференциальными уравнениями, содержащими МЗяый параметр. Так, в работах [79,161] были получены новые результаты по устойчивости ибйфуркации инвариантных многообразий специального вида при исследовании стациоиар- ныждвижений механических (неуправляемых) систем с первыми интегралами, что позволило существенно продвинуться в изучении качественных свойств движений твердого тела. В работе [167] метод интегральных многообразий используется для исследования задачи о разделении быстрых и медленных движений гироскопических систем, Описываемых сингулярно возму- щенными дифференциальными уравнениями, и задачи о выделении медленной составляющей движения. Применительно к задачам динамики твердого тела в [78, 166] на основе теории 77
инвариантных соотношении предпринята попытка решения сложной задачи выявления усло- вий управляемости и наблюдаемости нелинейных систем. В целом ряде работ [82, 83, 85, 109, 110] в последнее время было показано, что для естественных (природных) динамических систем характерно наличие некоторых поверхностей притяжения—инвариантных многообразий в фазовом пространстве. Такие установившиеся режимы получили название аттракторов, т.к. они “притягивают” соседние режимы. Аттрактор т.е. притягиватель,—это притягивающее множество в фазовом пространстве, т.е. асимптоти- чески устойчивое множество. Аттракторы, отличные от состояний равновесия и строго перио- дических колебаний, получили название странных аттракторов. Внутри таких аттракторов траектории блуждают нерегулярным образом и являются весьма чувствительными к измене- нию начальных условий. Из последних работ по исследованию аттракторов нелинейных моделей систем следует, что для многих природных систем характерен режим движения по некоторым многообразиям в их пространстве состояний. Так, в природных системах, например водохранилищах [107], neper менные, характеризующие их состояние, стремятся к таким значениям, которые соответствуют некоторым соотношениям (уравнениям баланса), т.е. инвариантным многообразиям в их пространстве состояний. Существуют также аналогичные связи, накладываемые непосредст- венно не на переменные состояния, а на скорость их изменения. В этом плане природные системы во многом существенно отличаются от обычных систем управления, для которых значение каждой переменной определяется задающим воздействием, т.е. в их фазовом про? странстве имеется “установочная точка”. По своим задачам функционирования с природными системами, по-видимому, сходен один из особых типов систем управления—системам коордат пирующего управления, для которых характерно регулирование соотношений в течение пере- ходного процесса. В природных системах наличие инвариантных многообразий обусловлено необходимостью выполнения законов сохранения, например закона сохранения массы, а в технических системах существование задаваемых инвариантных многообразий должно обес- печиваться самой процедурой синтеза законов управления соответствующими динамическими объектами. Природные системы, в отличие от технических, обладают целым рядом свойств, весьма необычных с точки зрения современной теории управления, например для природных систем не существует известного “прокдятия размерности”, которое в настоящее время приводит ? существенным, а в случае нелинейных технических систем—к принципиальным затруднения* в отношении проблем обеспечения их асимптотической устойчивости и желаемого качества,* также синтеза и практической реализации регулятора. Оказывается также, что в природных системах качество функционирования может даже повышаться при расширении разнообразия входящих в них подсистем, (например, разброса их параметров) и, более того, указанно^ разнообразие, как правило, играет стабилизирующую роль [107]. В то же время известно,«что в сложных технических системах управления подобное свойство обычно ведет к ухудшению их качества. В связи с отмеченными замечательными свойствами природных систем представ^ ляется весьма полезным и перспективным для развития современной теории управления осуществить попытку переноса этих свойств на конструируемые системы управления техниче- скими, в первую очередь нелинейными, объектами. Ранее уже отмечалось, что для многих природных систем основная цель функционирования состоит в стабилизаций соотношений между их переменными состояния. Математическим следствием этого факта является вырож- денность их уравнений динамики и наличие интегральных инвариантов, т.е. некоторых инва- риантных многообразий в пространстве состояний. Именно это свойство целесообразно поло- жить в основу развиваемых в данной книге методов синергетического синтеза нелинейных систем управления. Рассмотрим теперь некоторые конкретные примеры явного или косвенного использования инвариантных многообразий в задачах управления техническими объектами. Первым приме- ром может служить синтез систем управления, оптимальных по быстродействию [22, 24], в которых задача синтеза, как известно, сводится к определению гиперповерхности переключе- 78
шд(Х|,...,Хп) = 0, которая разделяет фазовое пространство на подпространство с положитель- мйм(м(/) = +нщах) и подпространство с отрицательным (и(0 = -«ш) максимальным управ- шхпцим воздействием, т.е. на/4 = 0 происходит переключение знака управлений. Многообра- зие д(х1,...,х,г) = 0 и является инвариантным для замкнутой оптимальной по быстродействию системы. При оптимальном по быстродействию процессе изображающая точка сначала дви- Хегся по многообразию размерности п, затем /1-1 и т.д., вплоть до многообразия единичной размерности, т.е. одномерной линии в фазовом пространстве, двигаясь вдоль которой на последнем интервале управления она попадает в начало координат, т.е. на многообразие размерности нуль. Таким образом, при оптимальном по быстродействию управлении проис- ходит последовательное понижение размерности фазового пространства движений изобража- ющей точки системы. Именно эта особенность оптимальных по быстродействию процессов [24] натолкнула автора на идею синтеза систем управления с использованием притягивающих многообразий понижающейся размерности, которая положена в основу развиваемых в этой книге методов АКАР. J Другим примером применения инвариантных многообразий служит синтез систем с пере- менной структурой [86-88], отличающихся тем, что в их фазовом пространстве вводится некоторая гиперплоскость переключений, движение вдоль которой происходит в скользящем режиме. Эта гиперплоскость и является инвариантным многообразием в фазовом пространстве. 8 последние годы стали появляться работы [56, 89, 90, 107, 164], в которых инвариантные многообразия положены в основу решения задачи синтеза систем управления. Применение ^теории инвариантных многообразий непосредственно к техническим объектам связано, в частности, с задачами координирующего управления. К такого рода объектам, например, относятся станки с программным управлением, манипуляционные и транспортные роботы, >Лхнологические линии прокатки металлов и материалов, бумагоделательные машины и сис- темы транспортировки ленточного материала, крановые механизмы, летательные аппараты в тобщем строю, энергоблоки, работающие на общую нагрузку, и т.д. [128, 212]. Для этих объектов важнейшим функциональным назначением является заданное согласование между к» переменными состояния в процессе движения [100, 101]. Свойства этого согласованного движения определяются совокупностью желаемых многообразий, вдоль пересечения которых ^ движется изображающая точка системы. Для природных же систем многообразия в их пространстве состояний часто отражают соответствующие законы сохранения, присущие этим системам. Итак, применение инвариантных многообразий для решения задач управления различны- ми объектами основывается на глубокой аналогии между процессами в природных системах и втехнических управляемых системах. Указанная аналогия следует из фундаментальных прин- ципов сохранения в физике—закона сохранения энергии, закона сохранения количества дви- 'Хения (импульса), закона сохранения момента количества движения, закона сохранения • кассы и т.д. Инвариантные многообразия, присущие синтезируемым системам, представляют *собой некоторые функции, которые во время движения не изменяются в силу указанных законов сохранения. В механике, как это выше показано, величины, которые подчиняются Соответствующим законам сохранения, называют интегралами движения, являющимися неко- JЮрыми постоянными величинами. Любое механическое движение с необходимостью содержит В себе те или иные инвариантные величины. Изучение механического движения возможно ^именно в той мере, в какой удается найти эти величины и сформулировать на их основе некоторые количественные законы движения. Развитие физики, химии и биологии показывает фундаментальное значение принципов сохранения, действующих не только в области механи- ческого движения. Основополагающей идеей, присущей предмету и .методу науки, является цдёя сохранения или, иначе, принцип инвариантности. В той мере, в какой эта идея принимает конкретные и разнообразные формы, в той же мере совершается открытие подлинных законов природы [91]. 79
В процессе развития науки, в первую очередь физики, выявилось исключительное значе- ние принципа инвариантности законов науки, который относится к особому типу принципа сохранения. Каждый закон выражает собой некоторое постоянство природных процессов ил этой связи принцип инвариантности законов отражает специальные условия этого постоянен по отношению к определенному классу движений. В связи с тем, что природные явления изменчивы и многообразны, законы, лежащие в их основе, выражают определенную устойчи- вость изменений. При исследовании любого природного процесса поиск законов этого движе- ния невозможен без выявления некоторых динамических постоянных, свойственных рассмат- риваемому движущемуся объекту. Здесь уместно привести следующие слова В. Гейзенберга “Восприняв от античности идею о математическом истолковании порядка в природе, совре- менное естествознание осуществляет ее, однако, другим... способом... Наука нового времен показала, что в окружающем нас реальном мире неизменными являются не геометрические формы, а динамические законы...” Каждый закон действует в определенной, фиксирований системе. Для того, чтобы найти законы движения, действующие одинаковым образом в раз- личных системах, необходимо указать принцип, придающий законам природы общий характер [91]. Именно таким принципом и является принцип сохранения (инвариантности), который, содержится в структуре любой теории, описывающей то или иное природное явление. Выв»-! ление инвариантных свойств исследуемых систем позволяет сформулировать специфические закономерности функционирования разнообразных систем. Таким образом, применение ин- вариантных многообразий (tps— 0) для решения задач синтеза систем управления имеет глубо- кое естественно-научное обоснование как применение одного из принципов сохранения. В развиваемом здесь методе синтеза эта идея дополняется идеей придания движению синтезиру- емых систем некоторых общих желаемых свойств. Необходимо подчеркнуть, что в отличие от классического подхода механики [79—$1, 167], когда инвариантные многообразия (первые или частные интегралы) отыскиваются i развиваемых здесь теории и методе синтеза, они задаются как желаемые и часто имею непосредственный физический смысл, связанный с природой исходного динамического объек- та и требованиями (например, оптимальности) технологической задачи, для решения которой и синтезируется система управления объектом. Итак, в книге развивается новый синергетиче- ский подход к синтезу систем управления нелинейными многомерными динамическими объ- ектами различной природы, основанный на естественном гомеостазисе—сохранении внутрен- них желаемых свойств динамических систем. Предлагаемое в данной книге введение инвари- антов—синергий в прикладную теорию управления как ее базовых элементов позволяя придать этой теории естественно-математическое единство и концептуально-методологиче- скую целостность. Язык инвариантов здесь играет роль базового языка науки, определяющее системную сторону теории управления и устанавливающего непосредственную связь это! теории с фундаментальными принципами современного естествознания—принципами отбор! действительных движений из множества возможных на основе инвариантных соотношений, связанных с законами сохранения в соответствующей предметной области науки. Как извести,! управление—это всегда то или иное действие на .соответствующий объект. В этой свяэк возникает проблема создания прикладной теории управления, в возможно большей мек учитывающей естественные свойства объекта, при этом сами управления желательно сделф минимально возможными для достижения поставленной цели управления. Отсюда следует, чй синергетическая теория управления—это теория по-возможности несилового управления,^ противоречащего естественному движению динамического объекта. 1.8. ПРИНЦИП ДИНАМИЧЕСКОГО СЖАТИЯ-РАСШИРЕНИЯ ФАЗОВОГО ПОТОКА В АВТОМАТИЧЕСКОМ УПРАВЛЕНИИ Введение. Выше в п. 1.6 на основе стандартных математических процедур вариационная исчисления были получены функциональные уравнения (1.28) и ХТ.49) соответственно да' 80
скалярного (m = 1) и векторного т > 1 управлений. Законы управления, следующие из этих уравнений, обеспечивают обязательный перевод ИТ системы из произвольного начального состояния в окрестность заданного многообразия ^=0 (1.26) или пересечения многообразий (1.47). Размерность подпространства многообразий (1.26) или (1.47), куда попадет ИТ ^результате действия указанных законов управления, равна (л-1)—для скалярного или (***#i)—для векторного управлений соответственно. В п. 1.7 была установлена тесная связь ййдгообразий (1.26) и (1.47) с инвариантными соотношениями в механике, технике и вообще Мистествознании. Возникает важный вопрос о направлении и свойствах дальнейшего движения ИТ вдоль указанных многообразий под действием синтезируемых управлений. Другими словами, необ- квдимо разработать общий принцип такого деформирования фазового пространства динами- ческой системы под действием внутренних управлений, при котором ИТ могла бы пройти “вглубь” подпространства многообразий (1.26) или (1.47) с последующим попаданием в Шало координат или на заданное финишное многообразие согласно основной задаче управ- ления. В предыдущих разделах этой главы неоднократно формулировалась основная задача син- теза системы управления, которая в общем виде обычно ставится как определение такого закона управления в функции координат состояния, который переводит изображающую точку .(ИТ) объекта л-го порядка из произвольного начального состояния х,о (i = 1,...л) в заданное конечное состояние, например в начало координат фазового пространства. Подчеркнем тот очевидный факт, на который почему-то редко обращают внимание, что в Шальный момент t - О ИТ находится в пространстве размерности п, в конечный же момент, М. после завершения процесса управления, ИТ попадает в точку хк(0,...,0) с нулевой размер- ностью. Это означает, что под действием управления ИТ постепенно переходит из исходного Пространства размерности п в подпространство размерности п— 1, затем я—2, п—3 и т.д. вплоть до одномерного многообразия (dim ^=1), двигаясь вдоль которого на финишном участке ИТ я попадает в начало координат фазового пространства. Другими словами, под действием непрерывного управления происходит постепенное сжатие объема фазового потока, в котором движется ИТ объекта. Фазовый поток в диссипативных системах. Строгое определение понятия фазового пото- ка приведено в [215, 216]. Пусть для динамической системы М—фазовое пространство детер- минированного процесса, тогда точка этого пространства представляет определенное состоя- ние процесса. Если в момент t = 0 процесс был в состоянии х, то в другой момент состояние процесса будет уже £х (где g—однопараметрическая группа преобразований за время t), т.е. для каждого t определено отображение £: М-*М фазового пространства процесса в себя. Именно однопараметрическая группа преобразований множества М и называется фазовым потоком с фазовым пространством М. В физическом плане можно, например, представить себе фазовое пространство заполненным жидкостью, тогда частица х через время t переходит в точку g'x, а орбиты фазового потока являются фазовыми траекториями. Под действием фазо- вого потока ИТ движется так, что вектор скорости системы в каждый момент времени равен вектору фазовой скорости в той точке фазового пространства, где находится ИТ системы. Поэтому фазовым потоком векторного дифференциального уравнения х(0 = F(x) МЗывается однопараметрическая группа диффеоморфизмов (гладких преобразований), для которой F является векторным полем фазовой скорости. Для того, чтобы найти фазовый поток дифференциального уравнения, достаточно решить это уравнение [215, 216]. Напомнив эти фундаментальные понятия современной теории дифференциальных уравнений, вернемся к явлению сжатия объема фазового потока в системах управления. Предположим теперь, что синтезирован закон разрывного, например кусочно-непрерыв- йбго, управления объектом. В этом случае очевидно, что указанное сжатие фазового потока 81
будет происходить скачком в определенные моменты времени. В качестве примера, подтаем, ждающего это положение, рассмотрим задачу синтеза законов оптимального по быстродейст вию управления. Дело в том, что теория оптимального по критерию быстродействия управле* ния в концептуальном плане является вершиной в современной теории автоматического ynt равления по сравнению с любыми другими критериями качества. С одной стороны^ оптимальное по быстродействию управление непосредственно отражает динамическую пара{ дигму естествознания, основанную на пространственно-временном подходе, а с другой сторон ны, известно, что к задаче быстродействия может быть сведена задача оптимизации систему по любому другому критерию, отличному от критерия быстродействия. Указанная процедура сведения осуществляется путем расширения фазового пространства исходной системы на одну’ дополнительную координату, равйую соответствующему критерию качества. Предположим^' что объект является неосциллирующим и описывается дифференциальными уравнениями Х1(0 = Х2, *2(0 = W, 1«1 «шах- (1.64) Известно [22], что закон оптимального по быстродействию управления объектом (1.64) имеет, следующий вид: н(Х1 ,Х2) = - z/maxsign/z(xi ,Х2) = - MmaxSign I Х| + х21 Хг I I. (1 I **тах \ __ Закон (1.65) обеспечивает двухинтервальное управление (±zzmax) по переводу ИТ из произ*‘ вольного начального состояния (хю, х2о) в начало координат (0,0) фазовой плоскости (рис, 1.1). При этом на первом интервале ИТ движется по полутраектории, имеющей размерност»; dim х =2, однако в момент переключения (t = А) знака управления происходит сжатие площади фазового потока. Далее ИТ будет двигаться теоретически по линии переключения,х2)=^ имеющей размерность, равную уже dimц =1. Покажем, что это действительно так. Уравнение линии переключения согласно (1.65) имеет вид ‘ /4(хьх2) = Х1^-^^-Х21х21 = 0. (1.66) *чпах Тогда с учетом первого уравнения объекта (1.1) из (1.66) получим Xi(t) I Х1(01 + 2zZmxXi .= 0 (1-6TF или x2(r)+ zzmaxsignx2 = 0. (1.68) Дифференциальные уравнения (1.67) или (1.68), описывающие движение ИТ вдоль линии переключения (1.66) относительно хД/) или x2(f) соответственно, имеют уже размерность dim =1, хотя исходный объект имел dim х =2. Итак, на линии переключения (1.66) произошло сжатие фазового потока, а. ИТ, двигаясь вдоль этой линии, в момент t = /2 прибывает в начало; координат (dim 0 = 0) фазовой плоскости замкнутой системы (1.64), (1.65). Подчеркнем, что сжатие площади фазового потока происходит скачком в момент переключения управления попадания ИТ на линию переключения. 82
Аналогичная картина движения ИТ имеет место и при оптимальном по быстродействию трехинтервальном управлении (±wmax) неосциллирующими объектами третьего порядка (рис. й2). В этом случае ИТ движется на первом интервале по полутраектории No, Ni, стартуя, Стример, из точки No, находящейся в трехмерном пространстве (dim х=3). В момент первого . невключения (t = Л) управления ИТ попадает в точке М на двумерную (dim £г=2) поверх- ность переключения £г, при этом происходит первое сжатие объема фазового потока. Далее, двигаясь вдоль La, ИТ в момент второго переключения (t = t2) попадает в точке N2 на одно- мерную (dim £i=l) линию L\, являющуюся “краем” поверхности переключения L2, при этом происходит второе сжатие фазового потока. Затем, двигаясь по линии £i, ИТ в момент t = h обязательно попадает в начало координат, имеющее нулевую размерность. Итак, в рассмот- рвййом оптимальном по быстродействию процессе (рис. 1.2) происходит скачкообразное трехкратное сжатие объема фазового потока, в результате чего ИТ, начиная свое |ЗйЖение из точки, находящейся в исходном трехмерном пространстве, попадает в начало 'координат фазового пространства с нулевой размерностью. В связи с тем, что в течение ойимального процесса знаки управляющего воздействия (±Мщах) чередуются на соседних 4ййрвалах, то концы множества фазовых полутраекторйй предпоследнего интервала L2 (рис. Сбудут принадлежать полутраектории Lt и, следовательно, концы полутраектории £| будут принадлежать полутраектории L\. В своей совокупности полутраектории второго интервала образуют две двумерные поверхности, которые стыкуются по одномерной линии L\. поверхности, имеющие в качестве края линию L\, образуют в целом поверхность пере- Ькйения La, двигаясь вдоль которой ИТ попадает на линию £i и далее в начало координат. Это означает, что попав в момент t = t\ на двумерную поверхность La, ИТ будет находиться на течение двух последних интервалов вплоть до окончания в момент t = ?з оптимального '^быстродействию процесса [22]. ^. Аналогичным образом происходит процесс сжатия фазового потока при оптимальном по быстродействию управлении объектами более высокого (п > 3) порядка. В этом .случае (д£ 3), продолжая предыдущие рассуждения, нетрудно показать, что полутраектории L% и Хз^онцы которых соответственно располагаются на поверхностях La и Li, образуют в своей совокупности трехмерное многообразие £3. Далее, продолжая указанное построение, после- довательно получим многообразия £4, Ls,...,Ln-\, Ln. Отсюда непосредственно следует, что каждое многообразие £*, в свою очередь, принадлежит многообразию £*+i и разбивает его на дввгобласти Lt+i и £*+i, а все полутраектории из семейства Lt+\ заканчиваются на £* и, 83
следовательно, все полутраектории Lk+i заканчиваются на многообразии L^. Очевидно, что для неосциллирующих объектов задача синтеза в конечном итоге сводится к поиску непрони- цаемого многообразия Ln-1, разбивающего фазовое пространство L„ на две области, в одной® которых u(f) = +итях, а в другой u(f) = -итах. При этом многообразие Ln_\ включает в сей многообразия Ln-i, Ln-z,...,La и, наконец, одномерную линию L\, двигаясь по которой ИТ попадает на многообразие Lq, состоящее из единственной точки (начала координат) и имеющее нулевую размерность. Итак, начав движение в исходном фазовом пространстве Ln, ИТ в результате первого переключения знака управления сначала попадает на многообразие Ln-\ (dim £п-1=?г-1), например L«-i, двигаясь по которому она попадет на многообразие £4-2» затей на Ln-з, LJ_4 и т.д. В конечном итоге ИТ попадает на двумерную поверхность La и после последнего переключения знака управления t = tn_\ она по одномерной линии L\ приходит в начало координат фазового пространства [22]. Подчеркнем, что при оптимальном по быстродействию процессе ИТ последовательно переходит от одного многообразия Л-ой размерности (dim L*e£) к следующему многообразию (Л-1)-ой размерности (dim L*-i=£-l), при этом сжатие объема фазового потока происходит в точках переключения знака управляющего воздействия. Разумеется, что описанная выше картина движения ИТ в фазовом пространстве является в определенной мере математической идеализацией, т.к. в реальных условиях переключение управления с одного знака (+мШах) на другой (-//щах) происходит не мгновенно, а за определенное время, кроме того, могут сущест- вовать неучтенные малые запаздывания и т.д. В результате при реальном оптимальном по быстродействию управлении ИТ будет двигаться не абсолютно точно по соответствующей гиперповерхности переключения Ln, а в некоторой ее окрестности, т.е. в некотором “погра- ничном слое”, находящемся в сжимающемсяфазовом потоке. Однако описанная выше картина движения ИТ при идеальном оптимальном по быстродействию процессе позволяет четко и наглядно выявить такое фундаментальное свойство, как эффект сжатия объема фазового потока при переходе ИТ с одного многообразия на другое подмногообразие пониженной размерности вплоть до попадания в начало координат фазового пространства замкнутой' системы. В этом эффекте как раз и состоит, помимо прочих достоинств, одна из замечательных; концептуальных особенностей оптимальных по быстродействию систем. Очевидно, что выяв- ленный эффект сжатия объема фазового потока имеет весьма важное общетеоретическое значение для проблемы синтеза систем управления. Рассмотренный процесс сжатия фазового потока в оптимальных по быстродействию сис- темах, когда ИТ попадает и затем движется по многообразиям последовательно понижающейся размерности L„-i, L„-2,...,L\, Lq, может быть интерпретирован как процесс попадания и движе- ния ИТ вдоль желаемого оптимального многообразия, обладающего свойством минимальности времени движения. В этом случае желаемое многообразие не задается каким-либо произвольным образом, а находится в результате строгой процедуры синтеза гиперповерхно- сти переключения. Аналогичное положение имеет место и при оптимизации систем не во быстродействию, а по другим критериям качества. Это означает, что в оптимальных система? применение метода АКАР связано с выявлением оптимальных многообразий, входящих в соответствующие законы управления. При этом.определяющее значение для поиска многооб- разий имеет заданный критерий оптимальности синтезируемой системы. Далее в третьей главе (п.3.8) будет установлена тесная связь между методом АКАР и современной теорией оптималь- ного управления. Описанные выше и представленные на рис. 1.1 и 1.2 процессы сжатия фазового потока происходили в оптимальных по быстродействию системах, являющихся исходно нелинейными. Но оказывается, что сходные явления наблюдаются и в линейных системах, свойства которых, как известно, существенно зависят от корней характеристического уравнения. В этой связи рассмотрим линейную систему в трехмерном фазовом пространстве и воспользуемся замеча- тельными графическими иллюстрациями из работы [215, С. 159]. В этом случае характеря- 84
стическое уравнение представляет собой вещественное кубическое уравнение, которое может иметь три вещественных корня или один вещественный и два комплексных. Решение линейного дифференциального уравнения третьего порядка, как известно, имеет следующий вид: х(0 = + С2Л^2+ С3^3, < 1 -69) > где^—какой-нибудь собственный вектор с собственными значениями Л* (к = 1,2,3). Выберем собственные значения А* вещественными, тогда с учетом того, что (Re Л < 0) при /-*<» стремится к нулю тем быстрее, чем меньше ReA, получим согласно выражению х(Г) = Re(Ci?‘'M С2^2+ С3№) . соответствующие фазовые траектории.'На рис. 1.3—1.7 изображены фазовые потоки, которые имеют следующие отличия: на рис.. 1.3 изображено фазовое пространство в случае •1) <Л2 < Лз < 0, при этом фазовый поток сжимается по трем направлениям, т.е. по общиму направлению к нулевой точке; на рис. 1.4 представлен случай Ai < Л2 < Л3 < 0, при этом фазовый поток сжимается по двум направлениям £i, £2 и растягивается по третьему £3; на рис. 1Л показан случай ReAi,2 < Л3 < 0, при этом фазовый поток сжимается по направлению £3, а в пдоекости (£ь£2) наблюдается вращение с более быстрым сжатием; на рис. 1.6 изображен случайЛ3 < ReAi,2 < 0, при этом фазовый поток сжимается по направлению £3, а в плоскости наблюдается вращение с более медленным сжатием; и, наконец, на рис. 1.7 показан случай ReA 1>2 < 0 < Л3, при этом фазовый поток растягивается по направлению |3, а в плоскости (|14г) наблюдается вращение со сжатием фазового потока [215]. . Изображенные на рис. 1.3—1.7 процессы движения ИТ в трехмерном фазовом простран- ств» весьма наглядно показывают характер поведения фазовых траекторий в линейных устой- чивых (рис. 1.3, 1.5, 1.6) и неустойчивых (рис. 1.4, 1.7) динамических системах третьего первдка. В нелинейных же системах третьего порядка их фазовое пространство может быть как аналогичным рис. 1.3—1.7, так и иметь принципиально иное поведение фазовых траекторий. Вояеетого, в фазовом пространстве нелинейных динамических систем третьего порядка воз- появление некоторых множеств (“странных аттракторов”) с парадоксальными свойст- вам^ которые принципиально невозможны в линейных системах [83, 85, 109, 110, 144]. Наличие фундаментального свойства сжатия фазовых площадей и объемов у рассмотрен- ныайыше динамических систем указывает на принадлежность к классу диссипативных систем [Ш]. Это свойство противоположно свойству сохранения площадей и объемов в фазовом пространстве у консервативных (гамильтоновых) систем, которое, как известно, следует из свойства сохранения энергии у такого рода систем. В консервативных системах исходный элемент фазового потока переносится вдоль траектории без деформации либо экспоненциаль- но удлиняется со временем (как & при А > 0) в одном направлении и одновременно сжимается (ыке~я,приЛ > 0) в перпендикулярном ему направлении. Но так как е*' • е~и = 1, то площадь или объем во втором случае также сохраняются [110]. В динамическом отношении в первом случае траектории движения устойчивы, а во втором—неустойчивы. Для консервативных систем характерна инвариантность их свойств относительно обраще- ния времени, что свидетельствует о сохранении их энергии. В диссипативных же системах обращение времени приводит к кардинальному изменению их свойств, в частности, к эффекту сжатия их фазового потока, что указывает на рассеивание их энергии. Диссипативные системы могут обладать весьма многообразными режимами, в особенности когда их динамика включает всебя как Зффект затухания, так и механизмы, поддерживающие их движение, при этом их объем в фазовом пространстве всегда не сохраняется, а динамика необратима. Другими слова- ми, диссипативным системам обязательно присуще свойство сжатия площадей или объемов в > фазовом потоке. Однако это вовсе не означает, что в диссипативных системах невозможно расхождение, т.е. неустойчивость траекторий движения. В действительности в этих системах могут возникать режимы, когда сокращение площадей или объемов достигается не только за счет сокращения всех длин, а в результате существенного сокращения одних длин при менее быстром сокращении других. Иначе говоря, при общем сокращении площадей или объемов в 85
Рис. 1.7 86
фазовом пространстве диссипативных систем по некоторым направлениям их траектории могут разбегаться и движение по этому направлению будет неустойчивым. Свойство разбегания траекторий объясняется необратимостью процессов, при этом сжимающийся и растягиваю- эдйся слои фазового потока будут соответствовать двум реализациям динамики, каждая из ^даюрых отражает эффект нарушения временной симметрии и парное появление несимметрич- ннх режимов. В этом случае сжимающийся слой отвечает состоянию системы в будущем, а растягивающийся—в прошлом, т.е. налицо две реализации с противоположной ориентацией вовремени [235]. Ранее (см. п.1.1) уже отмечалось, что второе начало термодинамики, как принцип отбора, допускает только те начальные условия, в которых система эволюционирует к будущему равновесному состоянию. Эти качественные особенности диссипативных систем обязательно следует учитывать при разработке методов синтеза замкнутых нелинейных сис- тем. ч Аттракторы в нелинейных диссипативных системах. Нелинейные диссипативные дина- мические системы обладают свойством притяжения траекторий, проходящих через определен- ную область фазового пространства, к некоторому многообразию, называемому аттрактором, доопределению [ 110], аттрактором А называется некоторое компактное множество в фазовом пространстве, имеющее следующие основные свойства: во-первых, аттрактор А инвариантен отпосительно действия фазового потока, т.е. ФА = А; во-вторых, аттрактор имеет нулевой объем в n-мерном фазовом пространстве системы; в-третьих, аттрактор находится в некоторой области ненулевого объема, которая является областью притяжения данного аттрактора, т.е. в фазовом пространстве существует некоторое множество таких точек, что выходящие из них траектории (при (-»«) всегда устремляются к аттрактору. На рис. 1.8, взятом из [110, С. 128], схематически изображен аттрактор А и его область притяжения В. Траектории, выходящие из точек а, р, у и д, переносятся фазовым потоком Ф к аттрактору. В математическом плане аттрактор представляет собой асимптотический предел решений дифференциальных уравне- Нйй нелинейной диссипативной системы, причем начальные условия этих решений должны “Обя&тельно лежать в области притяжения. к Для того, чтобы нагляднее показать особенности, возникающие при сжатии фазового Котака, рассмотрим, следуя [110], фазовый портрет нелинейной диссипативной системы вто- рйОпорядка с аттрактором в виде предельного цикла. Для этого предположим, что множество начальных условий на фазовой плоскости, откуда стартует ИТ, занимает некоторую область Г (рис. 1.9). В результате диссипации фазовый поток приводит к сокращению площади Г по '1ю₽е движения ИТ до некоторого линейного отрезка на аттракторе С—предельном цикле, Рис. 1.8 87
умеющем размерность dim С=1. Это означает, что происходит потеря информации относите» но взаимного расположения исходных начальных условий в области Г фазовой плоском После достижения ИТ аттрактора С информация об исходных начальных условиях полносШ утрачивается, что является следствием эффекта сжатия площади фазового потока к иалМ аттрактора системы. Учитывая, что никаких особенностей у рассматриваемой системы, кр» наличия аттрактора, не предполагалось, то этот факт означает справедливость указаний свойства для любого другого типа аттрактора, а именно: свойства потери информаций начальных условиях старта ИТ системы. Аналогичные свойства будут присущи и нелинейж системам третьего порядка, имеющим аттрактор в виде некоторого двумерного тора в трехм^ ном фазовом пространстве (рис. 1.10). Изображенные на рис. 1.8—1.10 аттракторы лежвд некоторых многообразиях и сами образуют многообразия в фазовом пространстве систем! частности, предельный цикл является простым многообразием, что предполагает налвд касательной в каждой его точке. Изложенные свойства аттракторов позволяют сделать о&щ важный вывод: размерность (га) аттрактора всегда меньше размерности (п) фазового проста ства исходной динамической системы, т.е. т < п. В соответствии с [ПО] приведем, некогда количественные соотношения, являющиеся следствием описанного выше свойства ёокращда объемов (площадей) в фазовом пространстве нелинейных диссипативных систем. Для это определим относительную скорость изменения гиперобъема V в фазовом пространстве я действием фазового потока, найдя следующую производную Ли: Рис. 1.10 88
(1.70) _L^ = y^<0, V dt ft dxt ’ . гдех—z-я координата фазового пространства вектора замкнутой системы. Оказывается, что для диссипативных систем величина (1.70) всегда отрицательна и может служить некоторой мерой сжатия фазового потока. Из (1.70) непосредственно следует, что в " дх- случае отрицательности производной 2 'Н~2 < 0 ПРИ (“*°° после попадания ИТ на аттрактор ,= 1 ° Xt любое множество начальных условий объемом (площадью) V отображается в множество нулевого объема [110]. Это становится очевидным, если представить выражение (1.70) в виде »>о. Vdt Отсюда непосредственно следует, что при /-* <» объем У-»0, т.е. объем (площадь) самого «трактора всегда равен нулю. Это важный и нетривиальный вывод, следующий из свойства сжатия фазового потока в диссипативных системах. Напомним также, что для консервативных (гамильтоновых) систем объем фазового потока остается неизменным, т.е. -ж. у = о • frr, ftdXi~^ чт& является следствием закона сохранения энергии в этих системах. ^Таким образом, к важнейшим свойствам диссипативных нелинейных систем относятся, вечгервых, “потеря” ими памяти о начальных условиях, откуда начинает свое движение ИТ системы, и, во-вторых, обязательное снижение размерности аттрактора по сравнению с раз- мврйостью фазового пространства исходной системы. последнее время исследование динамики нелинейных диссипативных систем привело к открытию так называемых “странных аттракторов” с весьма своеобразными свойствами. Дело 'Том, что в обычных динамических системах вследствие детерминистского подхода к их изучению фазовые траектории принципиально не должны пересекаться в фазовом простран- ств. В противном случае одно начальное условие могло бы породить разные фазовые траек- т^рии, т.е. система после точки пересечения траекторий могла вести себя совершенно по-раз- нвиу. а ее поведение оказалось бы совершенно непредсказуемым. Именно эта базовая уста- новка лежит в основе известной детерминистской доктрины, согласно которой в детерминированных динамических системах невозможно хаотическое поведение. Однако в действительности оказалось, что в фазовом пространстве нелинейных детерминированных систем, имеющих размерность три и выше, при определенных видах нелинейностей и сочета- нии параметров принципиально могут существовать аттракторы, обладающие весьма необыч- нымй свойствами, а именно: близкие траектории, попавшие на такой аттрактор, начинают быстро расходиться. В результате на аттракторе возникает хаотический режим движения, (ЯИйтательным свойством которого является чрезвычайная чувствительность к заданию на- чйлЫшх условий, находящихся на аттракторе. Внешне же фазовые траектории, имеющие йРййьные условия вне аттрактора, стремятся к аттрактору и “оседают” на нем. Но самой удивительной особенностью этих аттракторов является их нецелая размерность (например, < 3), которая получила название фрактальной размерности. Аттракторы, обладающие указанными весьма необычными свойствами притягивающего хаоса, получили в литературе [83/85, 99, 109, ПО, 169] название “странных аттракторов”. На рис. 1.11 приведен пример ‘’Странного аттрактора” для достаточно простой по структуре нелинейной динамической сис- третьего порядка x(t) = - у- z; у(0 = х+ 2(f) = bx— cz+ xz, (1.71) имеющей лишь одну нелинейность xz. В окрестности начала координат фазового пространства оюгййа,(1.71) имеет следующие особенности [169]: фазовые траектории отталкиваются от нулевой точки вдоль некоторой двумерной поверхности, а сама нулевая точка схожа с неустой- чйвйм фокусом, и далее траектории притягиваются вдоль некоторой линии. Из рис. 1.11 89
следует, что конфигурация фазового пространства динамической системы со “странным аттрак- тором” обладает парадоксальными свойствами: с одной стороны, она приводит к неустойчивости движения, что служит основным источником хаотического движения; а с другой стороны, одновре- менно не исключается возврат неустойчивых траекторий в окрестность начала координат фазового пространства, что, вообще говоря, ведет к формированию устойчивого аттрактора. Такого род “странные аттракторы” подробно изучаются в обширной современной научной литературе [83, 109, 110, 144, 169 и др.]. Открытие этих аттракторов в динамике нелинейных систем явил<х> крупнейшей научной сенсацией нашего времени, способной привести к кардинальному изменению существующего взгляда на динамическую парадигму современного естествознания. Действитод но, представляется неординарной и удивительной возможность возникновения хаотических ревд мов движения в детерминированной нелинейной системе третьего и более высокого порядков fa какого-либо внешнего воздействия на эту систему. л Очевидно, что наличие такого рода “странного аттрактора” в синтезируемой системе является весьма нежелательным случаем, т.к. тогда система, построенная, например, в сода? ветствии с положениями классической линейной теории управления, в режимах больших отклонений может оказаться вовсе неработоспособной из-за влияния нелинейностей и дрейфе или “старения” ее параметров, приводящих к эффекту “странного аттрактора”. В этом случае система приобретает свойства своего рода “черной дыры” в ее фазовом пространстве. Это будя означать, что при попадании ИТ системы в область притяжения “черной дыры” она неизбежво устремится к указанной “дыре” и будет находиться там сколь угодно долго. И так как “чер|ш дыра” не совпадает с желаемым технологическим режимом работы объекта, то такая ситуаци приведет к разрушению объекта, взрывам и т.п. По-видимому, участившиеся в последнее врод катастрофы в сложных современных технических системах являются результатом не толю ошибок эксплуатационного персонала, но и, может быть, следствием той ущербной линеЗД идеологии классической теории управления, которая была положена конструкторами эщ систем в основу их проектирования. Учет нелинейных явлений в динамических объекэд становится обязательным при создании эффективных сложных систем. Совершенно ясцр, ли при проектировании таких систем необходимо синтезировать законы управления объектам таким образом, чтобы “странные аттракторы” не могли возникнуть при любых сочетай^ параметров объекта и системы управления. В настоящее время в литературе, к сожалею» практически отсутствуют пригодные критерии выявления “странных аттракторов” в фазова пространстве динамических систем, тем более для определения свойств и параметров указа» ных аттракторов. Очевидно, что достаточно надежной гарантией отсутствия “странных^» тракторов” в фазовом пространстве синтезируемой системы является ее свойство асимптод ческой устойчивости по Ляпунову в определенной области или в целом. Для обеспечения этот важного свойства необходимо осуществить структурное деформирование фазового прострй • 90
ства замкнутой системы путем конструирования соответствующих законов управления. Это означает, что синтезируемые законы управления должны содержать такие нелинейные функ- ции координат, которые позволили бы осуществить желаемую деформацию фазового про- странства системы. | Итак, изложенные выше важные и новые положения из динамики нелинейных систем показывают, что при управлении различными объектами происходит процесс сжатия фазового потока вплоть до попадания ИТ на конечное, желаемое многообразие—аттрактор соответст- вующей размерности. В качестве таких финишных многообразий в обычных задачах управле- ния нередко выступают точка, например, начало координат фазового пространства, имеющая нулевую размерность (dim 0 = 0), или предельный цикл с dim С = 1. В общем же случае в зависимости от технологической задачи управления указанные финишные многообразия могут иметь разнообразные формы. Так, например, в известной задаче управления космическим аппаратом осуществляется его перевод на желаемое многообразие—круговую или эллиптиче- скую орбиту в центральном поле сил с заданной скоростью вращения аппарата относительно центра. Для других подвижных или технологических объектов эти конечные многообразия имеют другую форму. Разумеется, что желаемые конечные многообразия не должны противо- речить естественной, природной сущности и динамическим свойствам исходного объекта. Рассмотренные выше положения касались процесса сжатия фазового потока в динамиче- ских системах. Аналогично можно пойти и в обратном направлении, т.е. путем расширения фазового пространства. Эта процедура необходима при синтезе систем управления, инвариан- тных относительно неизмеряемых возмущений заданного класса. В этом случае к исходной системе дифференциальных уравнений объекта добавляется некоторая дополнительная подси- стема z уравнений д-го порядка, решением которой и является возмущение как функция времени. Между введенной подсистемой и исходными уравнениями должна быть установлена некоторая связь в виде соответствующего уравнения. Таким образом, производится расшире- ние фазового пространства исходного объекта на/4 координат, т.е. новая, расширенная система будет иметь общую размерность dim(x + z) = п+ц. Осуществив далее процесс сжатия фазового потока в этой расширенной динамической системе до желаемого финишного многообразия, можно тем самым синтезировать соответствующий закон управления. В результате этого будет построен так называемый динамический регулятор, обеспечивающий селективную инвариан- тность замкнутой системы к определенному классу возмущающих воздействий. Итак, процесс управления—это по существу всегда процесс сжатия (или сначала расшире- ния с последующим сжатием) фазового потока, в котором движется ИТ замкнутой системы. Синтез же законов, управления, реализующих указанный процесс сжатия фазового потока, должен включать в себя регулярную процедуру перевода ИТ с одного заранее вводимого многообразия Л-й размерности на следующее многообразие (Л-1)-й размерности вплоть до финишного, желаемого многообразия. Основные положения синергетического подхода в теории управления. В общем плане можно утверждать, что синтезируемая система управления должна обладать достаточным числом степеней свободы для реализации поставленной технологической задачи управления. ЭтО означает, что в тех случаях, когда исходный объект обладает ограниченным числом степеней свободы п, то для реализации поставленной цели управления, заключающейся, например, в отслеживании или подавлении некоторой функции, представляемой решением дифференциального уравнения размерности dim z = г, необходимо предварительно осущест- вить операцию расширения фазового пространства исходного объекта, по меньшей мере до размерности dim (х + z) = п+r. Отсюда следует важный вывод о том, что для синтеза эффек- тивных систем управления следует предварительно произвести тем или иным способом добав- ление стольких степеней свободы, которые были бы достаточными для реализации цели управления. Это положение корреспондируется с известным в кибернетике законом Эшби [218] о необходимом разнообразии. Здесь только понятие “разнообразие” конкретизируется в понятии “степени свободы” системы, т.к. именно степени свободы служат источником воз- 91
можного разнообразия [217]. Изложенные выше соображения позволяют сделать следующие общие важные выводы о задачах управления при синтезе систем: •во-первых, управление объектом произвольной природы представляет собой организованный И целенаправленный процесс редукции избыточных степеней свободы исходной системы, т.е. все избыточные по отношению к заданной цели (финишному многообразию) степени свободы редуцируются и в конечном итоге остаются только те степени свободы, которые определяют цель управления; • во-вторых, применительно к развиваемому в этой книге синергетическому подходу процедура редукции степеней свободы означает формирование между коорди- натами системы некоторых связей—инвариантных многообразий (синергий), которые и реализуют указанную редукцию степеней свободы системы. При этом инвариантные многообразия ('‘редукторы степеней свободы”) вводятся в синте- зируемую систему с помощью соответствующего закона управления; • в-третьих, редуцируемые степени свободы замкнутой системы представляют собой элементы управления как некоторые системные категории [217], а инвариантные многообразия (синергии) ограничивают разнообразие системы и формируют связи, т.е. некоторые акции управления. Таким образом, управление—это преодоление избыточных степеней свободы системы, сами понятия “инвариантное многообразие” (синергия) и “избыточность” степеней свобод являются базовыми элементами синергетической теории управления. Именно избыточность инварианты приводят к организованному поведению замкнутой системы. Подчеркнем важно свойство этой постановки проблемы управления—сначала следует создать избыточные степе ни свободы, которые определяют дополнительные возможности в свойствах будущей система а затем преодолеть (редуцировать) эти степени свободы в процессе управления. В синергетике указанный процесс отражает свойство самоорганизации нелинейных дисси пативных систем [83, 85, 109, ПО, 144, 169, 214]. Именно описанные здесь новые понята: положены в основу развиваемого в данной книге синергетического подхода к синтезу систе управления нелинейными объектами различной природы. Перейдем теперь к определенной конкретизации и применению изложенного выше прин ципа динамического сжатия—расширения фазового потока. Итак, управление—это редукци степеней свободы исходной сформированной (расширенной) системы дифференциальны: уравнений. Отсюда следует, что исходная расширенная система в потенции обладает опреде ленными априорными возможностями, которые больше и структурно выше в смысле перепек тив возникновения новых свойств по сравнению со свойствами той или иной результирующй (замкнутой) системы, получаемой в итоге соответствующих процедур синтеза. Дело в том, чп результирующая система—это исходная система с наложенными связями, отражаемыми! структуре синтезируемого закона управления. Уменьшение числа степеней свободы происхо дит за счет сил взаимодействия наложенных связей в направлении от начального положена ИТ к промежуточным состояниям на некоторых многообразиях понижающейся размерносп (^1=0,...,^т=0) И далее к конечному многообразию. В результате такого взаимодействия! синтезированной системе генерируется энергия, необходимая для движения ИТ от исходной до конечного, желаемого многообразий. При этом в процессе движения ИТ от одного инвари- антного многообразия к другому меньшей размерности расходуется соответствующее количе- ство энергии, которое постепенно снижается и к моменту попадания ИТ на конечное многооб- разие становится минимальным или нулевым в зависимости от вида конечного многообразм системы. Движение вдоль каждого многообразия ^=0 реализуется за счет внутренних управу лений системы, т.е. в процессе самодвижения к соответствующему аттрактору—инвариантно- му многообразию в фазовом пространстве. Свойства и направление этого процесса зависят® столько от внешнего принудительного управления, а в большей мере от внутренней динамил: нелинейного объекта. Эта автономность движения будет проявляться тем больше, чем ближ! находится объект к сильно неравновесной области (см. п. 1.1) своего состояния. С точки зрени! 92
ощдметики движение синтезируемых систем на финишных многообразиях может быть интер- преэдрвано как движение на желаемых диссипативных структурах, представляющих собой некоторые динамические состояния систем и отражающие их взаимодействие с окружающей средой [235]. । ^ процессе описанного перехода ИТ от одного многообразия к другому происходит своего рода;.иигнорирование” части переменных системы. Число этих переменных равно числу мно- гообразий ^*=0, последовательно (или параллельно) вводимых в процессе синтеза замкнутой сийймы управления. Эти особенности как раз и отражают процесс сжатия фазового потока в системах, синтезируемых на основе синергетического подхода. В математическом плане ука- занный процесс сжатия реализуется путем последовательного вложения друг в друга s первых вггёгралов дифференциальных уравнений замкнутой системы. Так, при скалярном управле- m;(m = 1) осуществляется следующий последовательный переход от многообразия к много- образию: « Vi(xi...х„)=0 -* ^2(^ь*1»-»хя-1)=0 -* ...-* ...xn-s)=O, s < л-1. ©^Случае же векторного управления (т > 1) сначала осуществляется параллельное введе- ниесовокупности т первых интегралов, т.е. ' » V»i(xi,...,х„) = О ,..., ^т(хЬ...,Хи) = 0. Затем на пересечении этих многообразий осуществляется аналогично скалярному управлению последовательное вложение г первых интегралов друг в друга, т.е. ^^Лн+1(Х|,...,Хп-т) = 0 -* ^т+2(^'п+ьХ|,...,Хп-т-|) = 0 ~* ... • .^Ь(^т+1^т+2,-,^п-т-г,Х1,...,Хп-т-г) = О, Г < П~т~1. ’Другими словами, при последовательном (т = 1) введении 5 первых интегралов образуется один общий первый интеграл ^S=Q, а при параллельно-последовательном (т > 1) введении образуется т первых интегралов будущей замкнутой динамической системы. Для реализации изложенного процесса сжатия фазового потока необходимо соответствующим образом синте- зировать законы управления. Именно эти управления вводят в замкнутую систему соответст- вуюйрло энергию, в результате чего происходит изменение состояния системы, которое про- ' dt----4 * ® I в ее Фазовом пространстве и, как следст- вие, изменяется скорость движения ИТ системы. Синтезируемые управления служат причиной , динамического взаимодействия соответствующих компонентов (тел, полей и др.) системы, что и приводит к деформации ее фазового пространства. Указанные управления представляют собой некоторые физические процессы, которые взаимодействуют с объектом и определяют егоивнешние степени свободы”. Однако объекты обладают (т < п) и “внутренними степенями свободы”, т.е. их динамика может во многом определяться внутренними взаимодействиями. Иначе говоря, в любой системе управления можно выделить внешние, и внутренние связи, налагаемые на координаты ее состояния. Внешние связи определяются видом и числом (т) независимых каналов управления. Это позволяет сразу же осуществить динамическую деком- позицию системы до многообразия (п—т)-й размерности, которое является гиперповерхно- сть^, пересечений введенных (т) инвариантных многообразий. Внутренние же связи опреде- структурой исходной системы дифференциальных уравнений (и-/п)-й размерности, которая отражает физические (химические, биологические, экономические и т.д.) закономер- ности, определяющие назначение объекта и замкнутой (“объект—регулятор”) системы. Даль- нейшая декомпозиция образованных ранее (п—т) уравнений—это установление соответству- юще внутренних связей (синергий), т.е. навязывание желаемых соотношений (^$=0) между (координатами синтезируемой системы. Для описания движения декомпозированной системы на вводимых многообразиях ip^x^,... ,хи)=0 могут использоваться различные комбинации пе- ременных состояния, удобные для отражения естественных свойств объекта я синтеза систем управления. Предложенный общий подход с синтезу законов управления, основанный на идее сжатия фазового потока путем введения совокупности задаваемых первых интегралов, в определенной 93
мере подобен методу Н.Г. Четаева [4] в теории устойчивости. Согласно этому методу функци! Ляпунова формируются в виде связки заранее найденных первых интегралов возмущения! движения. Известно, что это один из редких и весьма эффективных способов построений функций Ляпунова в теории асимптотической устойчивости. Отсюда, между прочим, следует,! что в излагаемом подходе существенно упрощается проблема устойчивости, которая в коне?! ном итоге сводится к исследованию устойчивости движения вдоль финишного многообразш! описываемого дифференциальными уравнениями (и-т-$)-й размерности. Указанная аналм гия связывает принцип сжатия фазового потока с методом первых интегралов в теории усто»! чивости движения. | Необходимо особо подчеркнуть, что в отличие от обычного метода синергетики [83, Ш ПО] (см. п.1.1) и стандартного метода малого параметра нелинейной механики [79,167],в которых параметры порядка находятся путем приближенной разнотемповой декомпозиций исходной системы (разбиения на медленные и быстрые подсистемы), предложенный здаУ принцип сжатия фазового потока позволяет однозначно сформировать желаемые инвариант! ные многообразия ips= 0, т.е. управляемые параметры порядка, в результате ассимптотичесщ точной динамической декомпозиции. Такая декомпозиция осуществляется путем сжатия фа-1 зового потока под действием синтезируемых внешних и внутренних управлений. Именно описанный выше эффект сжатия фазового потока и следующая из него точная динамим ская декомпозиция являются теми базисными положениями, на которых построен синергети- ческий подход к синтезу многомерных и многосвязных систем управления нелинейным объектами различной природы. Таким образом, в основе развиваемого в этой книге синергетического подхода лежат да фундаментальных принципа естествознания—это, во-первых, принцип инвариантности (со- хранения) и, во-вторых, принцип сжатия-расширения фазового потока динамических систем. Принцип инвариантности, как известно, является базовым для всех наук, однако его исполь- зование в развиваемом синергетическом подходе имеет кардинальное отличие: если в естест- венно-научном подходе инварианты (синергии) отыскиваются “апостериори”, то в предлага- емом здесь подходе инварианты задаются “априори” с целью наделения синтезируемой дина- мической системы желаемыми синергетическими свойствами. О свойстве эквивалентности в системах управления. Описанное выше свойство сжатм фазового потока в динамических системах в большей мере опиралось на математические (геометрические) представления по сравнению с его физическим содержанием. Попытаема теперь, используя известные общенаучные концепции, выявить физические первопричины указанного свойства, которое относится к одному из базовых элементов развиваемой в этой книге синергетической теории управления. В современной науке известны многие взаимосвязи между природными явлениями, коп» рые называют эквивалентностями, или принципом компенсации [223, 224]. Суть этого принципа состоит в том, что изменение какой-либо физической величины непременно приво- дит к возникновению некоторой другой физической величины. Кроме того, наличие произвёл- ной от процесса изменения одного явления обязательно приводит к новому, более высокому этапу возникновения следующего физического явления. Другими словами, природе присуще фундаментальное свойство “компенсации” одного физического параметра путем появлеяш другого параметра со своими признаками. Принцип компенсации (эквивалентности) относите к всеобщим физическим принципам, которые определяют развитие различных природных процессов. В математическом плане принцип компенсации отражается в виде различных дифференциальных уравнений, описывающих соответствующие физические явления и взаи- мосвязи между ними. Итак, в природе всегда существует многомерная связь различных физи- ческих (химических, биологических) явлений, которая непрерывно проявляется в возникно- вении одних величин за счет изменения других. Движение материи и термодинамически процессы порождают новые формы, которые, в свою очередь, могут рождать другие формы! т.д. По существу, можно представить так, что через принцип компенсации природа сохраняет 94
' еаму себя, какие бы процессы в ней не происходили. Это общенаучная концепция, основанная на динамическом подходе к природным явлениям. В работе [223] описанные выше явления компенсации предложено назвать общим законом сохранения. । Наиболее очевидным проявлением принципа компенсации (эквивалентности) является третий закон Ньютона, т.е. равенство действия и противодействия. Другим примером принципа эквивалентности служит равенство инерционной и гравитационной масс, что позволило Нью- гЖ^создать классическую механику. Следующим важным примером является эквивалент- дюйь между гравитационным полем и “полем ускорения”, что дало основание Эйнштейну кпасфоить релятивистскую физику. Можно привести и другие примеры справедливости прин- эквивалентности в различных физических процессах. Следует, однако, отметить, что наличие равенства между некоторыми физическими характеристиками является только про- СТйнним проявлением принципа эквивалентности на некотором определенном уровне. Более сдакиые взаимосвязи возникают при переходе через указанный уровень, когда принцип эквивалентности продолжает сохранять свою силу, но приобретает уже более широкое свой- тйвфеоответствия, т.е. некоторой динамической пропорциональности, а не просто как опре- деденное равенство. f Итак, природные системы обладают общим фундаментальным свойством, а именно: изме- ,неиие любой физической сущности обязательно порождает новую физическую сущность, например в механике изменение скорости приводит к возникновению ускорения, в электро- нике изменение напряженности электрического поля порождает электромагнитное поле и т,д. Другими словами, в природных системах образуется цепь эволюции, приводящая к мно- гообразию физических явлений. .^казанные законы эквивалентности (компенсации) применяются во многих науках в шрм виде или косвенно для анализа процессов в звеньях всей цепи эволюции соответствую- щейприродной системы, когда в каждом звене (подсистеме) выполняется равенство действия Противодействия с обязательным подчинением соответствующему закону сохранения [223]. Данное равенство отражает свойство эквивалентности указанных характеристик, в то время как^каждая из них имеет свою физическую природу. И эти свойства, похоже, как раз и необходимы природе для сохранения самой своей сущности. С особой силой проявляется фундаментальное значение принципа эквивалентности в явлении самоорганизации нелиней- ныхдиссипативных систем, которое состоит в образовании коллективных связей—синергий. Именно свойства эквивалентности и самоорганизации используются в развиваемой здесь синергетической теории управления, которая базируется на концепции управляемого динами- ческвго взаимодействия вещества, энергии и информации в системах управления объектами различной природы. ,.. Докажем теперь конкретно справедливость свойства эквивалентности (сохранения) в задачах управления нелинейными объектами. Оказывается, что с этим свойством связано описанное ранее явление сжатия фазового потока в динамических системах. В качестве при- мерзрассмотрим задачу управления объектом, движение которого описывается следующими нелинейными дифференциальными уравнениями: *1(0 = /1(*1,*2) + «13*з + «14*4, *2(0 =/2<*1,*2)+ «23*з+ «24*4, (1.72) *з(0 = /з(*1,-,*4)+ ИЗ, *4(0 = /»(*!,...,*4) + Н4. Из (1.72) следует, что управления из ии4 непосредственно действуют на производные *з(0 и х<(0соответственно и, следовательно, на функции -*з(0 и x4(f), которые, в свою очередь, могут 1 быть выбраны в качестве внутренних управлений, определяющих характер изменения коор- динат Xi и Х2- Управления из и и4 количественно не исчезают, а превращаются во внутренние управления хз(0 и *4(/), в конечном итоге формирующие поведение координат лд и Х2 объекта. Внутренние управления, в свою очередь, действуют на подсистему пониженной размерности 95
(п-т = 2), определяемую первым и вторым уравнениями (1.72). Для этой подсистемы мою поставить свою, внутреннюю задачу управления. »i Выявленные здесь структурные особенности динамических систем позволяют сформи- ровать следующее своеобразное свойство эквивалентности (сохранения) управлении: i любом процессе управления движением, т.е. при переводе объекта из начального состояли! конечное, управления /9, действующие на соответствующие производные координат исчезают (не разрушаются), а превращаются во внутренние (промежуточные) управляй (Vj = х() подобъектами последовательно понижающейся размерности. Выделенное обад свойство эквивалентности включает в себя два важных взаимосвязанных свойства управляй динамическими объектами: во-первых, свойство сохранения, т.е. управления, подаваемые! соответствующие входы исходного объекта, в дальнейшем не исчезают и не разрушаются во-вторых, свойство превращения, когда управления, проходя соответствующие динамиче- ские звенья объекта, превращаются в некоторые внутренние управления V, подобъегми понижающейся размерности, что свидетельствует о процессе сжатия фазового потока айве* зируемой системы. При этом размерность вектора V} внутренних управлений всегда совпадай с размерностью вектора и, исходных (внешних) управлений, т.е. dim щ = dim Vj. Указам^ свойство эквивалентности (сохранения) управлений базируется на идее взаимопревращени управлений и координат, в результате чего происходит сжатие фазового потока в процессеет протекания через данное динамическое звено замкнутой системы. | В заключение следует упомянуть о том, что в теории управления понятиям “координатн1 и “управление” обычно придается заметно разный смысл. Считается, что управление предст» ляет собой что-то главное, доминирующее, а координаты—нечто второстепенное, т.е.-чи управление—суть причина, а изменение координат—ее следствие. Формально это дейсти тельно так, но, как показано выше, между управлениями и координатами существует вбещ внутренняя динамическая иерархия и дуальная взаимосвязь, позволяющая исходным, внен ним управлениям преобразовываться в соответствующие координаты—внутренние (промезга точные) управления замкнутой системы. Это обстоятельство целесообразно учитывать и синергетическом синтезе нелинейных систем, тем более, что реальные достаточно сложив технические объекты обычно состоят из последовательно-параллельного соединения локал! ных подобъектов, у каждого из которых трудно провести резкую грань между управлении и координатами. В частности, внутренние управления локальными подобъектами являйм координатами состояния общего объекта. j Изложенные в данном разделе соображения показывают, что в теории управления нега нейными динамическими объектами целесообразно выделить два важных свойства, а имени сжатия-расширения фазового потока и принцип эквивалентности (сохранения) управлеш Эти свойства положены в основу синергетического метода синтеза нелинейных систем упра ления. Итак, в первой главе книги развиты концептуальные и математические основы сииерген ческой теории управления и вытекающего из нее метода синергетического синтеза нелинейнн динамических систем. Перейдем к развернутому применению этого метода для решен! сложной проблемы аналитического конструирования систем управления нелинейными теки ческими объектами и технологическими процессами. 96
ftr ГЛАВАП АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ АГРЕГИРОВАННЫХ НЕЛИНЕЙНЫХ РЕГУЛЯТОРОВ НА ОСНОВЕ ЗАДАННОГО ИНВАРИАНТНОГО МНОГООБРАЗИЯ На свете есть вещи, поважнее самых прекрас- ных открытий,—это знание метода, которым они были сделаны Г Лейбниц Предел хитроумия—умение управлять не при- меняя силы Люк де Кланъе де Вовенарг 11. ПРОСТЕЙШАЯ ЗАДАЧА АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ АГРЕГИРОВАННЫХ РЕГУЛЯТОРОВ Двиервой главе были изложены основы синергетического подхода к аналитическому кон- ®ф59ф©ванию агрегированных регуляторов (АКАР) Перейдем теперь к егожонкретизации и р^дртрим первую простейшую задачу АКАР, которая состоит в синтезе такого закона удаления и(х\ , , х„), который сначала переводит объект xj (0 = fj{xi , , хп), / = 1,2, ,п-1 , Хп (0 = /л(Х1, , хп) + и (2 1) дзданзвольного начального состояния (хю, , Хпо) в окрестность задаваемого многообразия хп) = ”0, а затем обеспечивает дальнейшее его движение вдоль ip = 0 к началу коорди- ^ниространства состояний (хи = = хц = = х^ = 0) Эта задача относится к простейшей задаче АКАР потому, что, во-первых, используется только одно притягивающее многообразие, и^ва^торых, находится скалярное управление объектом вида (2 1) Решение указанной задачи синтеза, как показано в общем виде в первой главе, состоит из двух этапов—этапа обеспечения аар^гготически устойчивого движения изображающей точки к притягивающему многообра- ТО®-0 и этапа такого же движения вдоль этого многообразия к началу координат с задайым качеством переходных процессов Законы управления, решающие указанную задачу первого этапа, определяются, как показано в первой главе, обобщенным функциональным уравнением, которое позволяет в аналитическом виде найти структуру этих законов Решение I зада* синтеза на втором этапе, очевидно, сводится к поиску таких параметров найденных зайие®, которые обеспечивают асимптотически устойчивое движение изображающей точки цоЙ многообразия ip = 0 к началу координат пространства состояний, при этом должны удавйетворяться требования к качеству переходных процессов 97
Для выявления особенностей предлагаемого метода АКАР и его конкретизации перездз к элементарному изложению этого метода путем решения простых задач синтеза, формуляру их в терминах современной теории оптимального управления В дальнейшем на основе ад задач выявим некоторые общие характерные свойства метода Пример 2.1. Предположим, что объект описывается следующим дифференциалу» уравнением х (?) 4- ах = и, а критерий качества системы может быть построен на основе сопровождающего функциоф /1 = f [mfy2 + с2у2 (?) ] dt, о ' где V’(x)—некоторая функция переменной х Тогда производная этой функции по времени может быть записана в виде ® ~ to* ® (2 Л Определим производную макропеременной V* (?) на решениях объекта (2 2), для чего подй» вим в выражение (2 4) производную х (?) = и - ах из уравнения объекта (2 2), т е f V» (0 = $ Подставим теперь V» (?) (2 5) в функционал (2 3) J\ = т2хр2(х) + с2(а2х2 - 2ахи) + с2 и2 dt Для простоты положим 1р = X , тогда критерий качества (2 6) принимает следующий вид J о (т2 + а2с2)х2 — 2ас2хи + с2 и2 (ЭД (ЭД (ЭД dt В общем случае не играет роли каким способом был получен критерий (2 8), и поэтому дала его можно рассматривать совершенно независимо, как некоторый оптимизирующий функций нал синтезируемой системы Для поиска управления м(х), доставляющего минимум критери /1 (2 8) на траекториях движения объекта (2 2), применим один из стандартных метода оптимизации [17], например метод Эйлера—Лагранжа Используя подынтегральное выраже- ние (2 8) и уравнение связи (2 2), образуем функцию Li = (т2 + а2с2)х2 - 2ас2хи 4- с2 и2 4- Л(х + ах - и), (ЭД гдеЛ(?)—функция Лагранжа Далее запишем систему уравнений Эйлера—Лагранжа [17,65] ^--4 = 2(т2 4-а2с2) х - 2ас2м 4-Ла - А (?) = 0 , (2? Эх dt I Эх I 4 7 7 s* дЦ d (dL\ э 2 о 2 , п (211) "7— “л = 2с и — 2ас х — Л = 0 , « ди dt \du I * которые совместно с уравнением объекта (2 2) и позволяют решить поставленную оптимиза ционную задачу Подставим и = х + ах из (2 2) в уравнения (2 10) и (2 11), тогда получив 2(т2 4- а2с2)х - 2ас\х 4- ах) 4- Ла - А (?) - 0 * и с 2с2(х 4- ах) - 2ас2х - Л = 0 g Из этих уравнений окончательно получаем уравнение экстремали с2х (?) — т2х = 0 (2 Ц Находим решение дифференциального уравнения (2 12) г х (?) = Cie_'”'/c 4-C2e"“/c (213 98
Синтезируемая система должна быть устойчивой, поэтому из выражения (2 13) исключаем оставляющую C2emt/c Тогда получаем устойчивую экстремаль хэ (0 = Сге'^ (2 14) Используя (2 14) и уравнение (2 2), находим управление и = - ^-^с1е’я“4 (215) Исключая из (2 14) и (2 15) составляющую cie~m/e, находим закон управления , \ (т \ (2 16) ' ’’ = ~ Ге ~ а\х ’ обеспечивающий оптимальное по критерию J\ (2 8) движение объекта (2 2) Уравнение замк- нутой системы будет следующим • /л (т v и х (t) + ах = - — - а х , те, i х (t) + х = О (2 17) В соответствии с уравнением (2 17) можно записать следующую оценку для переходных процессов в замкнутой системе 1 Закон управления и (2 16) и уравнение замкнутой системы (2 17) были получены на основе критерия качества (2 8) Покажем, что эти выражения получаются и при использовании квадратичного критерия ;,= / Ы-ЛУ-Л’Тл, <219) о L -I образованного путем подстановки и из (2 2) во второй член критерия (2 8) Для этого согласно методу Эйлера—Лагранжа, образуем функцию , р Lq = (т2 - а2с2}х2 + с2и2 + Л(х + ах - и) и запишем систему уравнений .t - рг) =2(m2 -aV) х+Л“ -2 (/) =0 ш at \аи I которые совместно с уравнениями объекта (2 2) решают задачу оптимизации системы по критерию (2 19) Подставив и из (2 2) во второе уравнение системы (2 20), найдем функцию Лэтрдяжа Л = 2с\х + ах} <2 21) Подставив далее функцию Л (2 21) в первое уравнение системы (2 20), получим дифференци- альное уравнение г, <?х (/) — т2х = 0 , совпадающее с уравнением (2 21) Отсюда следует, что закон оптимального по критерию (2.19) управления объектом (2 2) будет совпадать с выражением (2 16) Это означает, что разливые на первый взгляд критерии качества J\ (2 8) и /2 (2 19) являются эквивалентными в-смькле свойств переходных процессов в замкнутой системе управления объектом (2 2) । ( ^.теперь снова вернемся к функционалу (2 3), в котором составляющая (/) определяется всидуисходных уравнений объекта Поставим задачу найти закон управления и(х) только на и* этого функционала и уравнения объекта (2 2) Используем для решения указанной задач* функциональное уравнение (1 27), которое при ip=xp принимает вид Ту (г) + у = 0 <2 22) 99
Воспользовавшись свойством инвариантности уравнения Эйлера—Лагранжа, а также выборои! функции V* = х, запишем уравнение (2.22) с учетом уравнения объекта (2.2) в следующем виде! Ти — аТх + х = 0 , откуда находим закон управления /1 и = — н? - а х, который, как и ожидалось, точно совпадает с законом (2.16), полученным в результат применения уравнениям Эйлера—Лагранжа к функционалам (2.8) или (2.19). Очевидно, что построение законов управления на основе уравнения (2.22) проще стандартных процедур оптимизации. Это связано с тем, что ранее, в первой главе, было получено обобщенна функциональное уравнение (1.27), которое затем конкретизируется путем подстановки в вето выбранной функции гр с учетом уравнений объекта. Такой подход позволяет в конечном итоп получить в аналитической форме закон управления, доставляющий минимум интегральному функционалу (2.3) на траекториях движения объекта. Кроме того, определенная свобода выбора функций гр позволяет наделить синтезируема системы дополнительными свойствами, особенно это касается нелинейных систем высокая порядка. Так, применительно к объекту (2.2) можно улучшить динамические свойства систем! по сравнению с системой, оптимальной по критериям (2.8) или (2.19). Выберем, напримёц функцию гр в виде V» = th x. (2.231 Подставив (2.23) в уравнение (2.22), получаем в силу уравнения объекта (2.2) закон упри- ления , и = — sh 2х + ах , который, согласно (2.6) и (2.23), является оптимальным по следующему критерию: /з = / [m2th 2х + с2(а2х2 — 2ахи) sch 4х + zz2sch 4х dt. о t J Уравнение замкнутой системы с законом управления (2.24) имеет вид Т'х (f) + 0,5sch 2х = 0 , (2.34 (2.2Я (2.26) где Т = — . m Проинтегрировав дифференциальное уравнение (2.26), находим время перевода объекта (2.2) управлением (2.24) из некоторого начального состояния xq в конечное х*: th х0 (2.27) tp = Tin th Хк Сравним время (2.27) со временем регулирования (2.18) в линейной системе (2.17). ПринЦ как и обычно, Хк = О,О5хо, получаем, согласно (2.27), при хо < 1,0 время регулирования^ нелинейной системе (2.26), примерно совпадющее с оценкой (2.18); при хо = 5 оно уменью ется более, чем вдвое, а при хо = 10 оно становится меньше tp (2.18) более, чем в четыре раза В дальнейшем с увеличением хо указанный эффект нарастает. Итак, введение нелинейно функции преобразования (2.23) позволяет синтезировать закон управления (2.24), обеспеч! вающий по сравнению с линейным законом (2.16) существенное повышение быстродейси» синтезируемой системы. Интересно отметить, что функция (2.23) является ограниченно! нечетной, монотонно изменяющейся функцией в диапазоне от -1 до +1 (уже при х = я функция V» = ±1). Эта особенность преобразования (2.23) может быть использована да придания замкнутой системе некоторых дополнительных свойств, в частности позволяет обь яснить ее повышенное быстродействие. Критерий Уз (2.25), на первый взгляд, предоставлю мало информации о свойствах системы, оптимальной по этому критерию, поэтому рассмотри режимы малых и больших отклонений. Для малых отклонений х функции, входящие в крйй 100
рий /з (2.25), можно представить в виде th 2х»х2 и sch 4х«=1. Тогда критерий /з принимает /3 inf «= J fan2 - a2t?)x2 + u2 dt, 0 L -I совпадающую с формой квадратичного критерия J) (2.19). Для больших же отклонений функции th2x== ± 1 и sch4x»0, а критерий /3 (2.25) вырождается в критерий /aw ~ т f dt, 1 ; . /о вдевшчный критерию быстродействия. Другими словами, критерий качества /3 (2.25), сфор- мированный на основе обобщенного функционала / (1.24) и нелинейной функции преобразо- ййй (2.23), позволяет осуществить последовательную оптимизацию системы, близкую к оптиотаации по квадратичному критерию J\ (2.19) в режиме малых отклонений и сходную с кр(П|0рШ№м быстродействия в режиме больших отклонений системы от заданного состояния. Таощрбразом, на простейшем примере объекта первого порядка (2.2} показана эффектив- иостьлроцедуры синтеза на основе обобщенного критерия (2.3) и функции преобразования При этом оказалось, что, во-первы^, можно осуществить аналитические процедуры оиш регулятора и, во-вторых, сформировать различные критерии качества и придать аигеяруемой системе желаемые динамические свойства. Перейдем далее к синтезу систем управления объектами второго порядка. ,^имер 2.2. Сначала рассмотрим синтез закона управления линейным объектом X] (0 = хг; Х2 (t) = aixi + агхг + и . (2.28) ЕНдвмв рассмотрение функцию преобразования в виде следующей линейной агрегированной мацхшбременной: tPfxi , х2) = р\Х\ + Хг. (2.29) Подставим в обобщенный функционал J\ (2.3) функцию (2 -29) и ее первую производную 3 V^(t) = Д1Х1 (t) + х2 (0 = ЩХ1 + (01 + аг)хг + и , полученную с учетом уравнений объекта (2.28), тогда критерий качества принимает вид + -^2 ) х% + 2(я]Х1 + а2Х2)и + и2 dt + (2.30) о [V / ' + 2 f [xiXi (/) +’х2Х2 (1) j dt. Второй интеграл в выражении'(2^0) может быть вычислен в силу уравнений (2.28) объекта у-: 2 f Fxiii (t) + Х2Х2 (01 dt = (х2 + x^) | * = — х2о - xlo = const, "о L J та^поусловиям устойчивости системы, xi(оо) = Х2(«°) = 0. Тогда критерий качества, получен- Шйжюнове обобщенного функционала Ji (2.3), агрегированной макропеременной # (2.29) еуравдений объекта (.2328), принимает следующую форму: . ч >.Ь’' — ' - 1 dt, (2.31) о Дияитеза закона управления н(хг, х2), обеспечивающего оптимальное по критерию (2.31) рфаметне объектом (2:28), используем метод динамического программирования. Для этого состав» функциональные у равнения БелМана [92]: .f’п . Р( vj, xz j zZ n dF d/2 3S n 1 -" “> x»fe=0; «?+мэ^ = 0’ (2.32) 101
где F—подынтегральная функция критерия (2.31); /ь /з—правые части дифференциальш уравнений (2.28) объекта. Подставив в (2.32) соответствующие выражения из (2.28) и (231 получаем i as dS dS + (aiXi + агХ2 + «) "т— = 0 ; 2(«iXi + 02X2) + 2« + -z— = 0 . 0X2 0X2 Найдем и из второго уравнения системы (2.33): as (23 и = и подставим его в первое уравнение; тогда получим 2 fix} + (&тг)х1 - 1аха2Т1'ххХ2 + Т2х2|у- - £ = 0 . 0X1 4 I 0X2 I Это нелинейное дифференциальное уравнение в частных производных, для решения котефб функцию 5 можно выбрать в виде определенно положительной квадратичной формы коорд нат [92] •г 2 2 S = АцХ1 + А12Х1Х2 + А22Х2 9 и, следовательно, . = 2АцХ1 + А|2х2; dS = 2А12Х1 + А22Х2 • dS Подставив -г— (2.36) в (2.35) и приравняв нулю коэффициенты при соответствующих стещи ОХ/ х\ и Х2, получаем следующую систему уравнений: fi - 0,25^12 = 0; /3?Т2 + 1 + Т2М,2-А12) =0; 2Ац — А12А22 ~ 2й]й2 = 0 , (231 откуда находим А12 = -jT ; А22 = ftl + у ; Ап = Й1Л2 + (/?! + у ) . dS Подставляя в (2.34) выражение (2.36) и величины А12 , А22 из (2.37), определяем^ управления: ‘ ' ! 1 М = - (Я, + «у X, - ^2 + Pl + Tpj Х2 , Подставляя второе уравнение (2.28) в (2.31), можно показать, что закон минимум не только критерию Jj (2.31), но также и критерию £ Дт2 1 + ~~2 ~ а2 ~ dt, ° Lv 7 7 ' J т.е. критерии /1 (2.31) и J2 (2.39) эквивалентны в смысле качества переходных проц< замкнутой системе. Применим теперь для поиска закона управления функциональное уравнение 7V (?) + = О, из которого с учетом ip (2.29) и уравнений объекта (2.28) получаем управление и = — [ а\ + Xi — | <22 + + уч Х2 , 102
ЮШВДовпадающее с ранее полученным законом (2 38) Закон (2 40) найден в аналитической форме в результате простейшей процедуры удовлетворения функциональному уравнению с узейм уравнений (2 28) исходного объекта р'йсследуем свойства объекта синтезированной системы Подставив закон управления и (2.40) в (2 28), получим уравнения замкнутой системы Г Г Й (0 = Х2 , _ (о . С (241) ^•*2 \ t) гр Xl Ipi ' р I «^2 ч условия устойчивости которой имеют простой вид Pi > О, Т > 0 Запишем уравнения (2 41) относительно координаты xi + + + =0 (242) Из (142) следует, что замкнутая система имеет декремент затухания . 1 + ЬТ , f. , о _ , £ = Ъ$1Т - 1 ’ = 1 ПРИ^1Г = 1 Это означает, что переходные процессы в системе имеют апериодический характер и при | > 1 описываются решениями *i = pif - 1 [(Х20 + “ (*10 + Тх2о)е~Р1* ] , Х2 ® = 1 -PiT [(Х20 + ^Х1°)е”^ ~ <Х1° + Tx^e~fiit ] ’ <2 43> п 1 „ • в которых для определенности положим pi < у Запишем теперь уравнения замкнутой систе- мы (2.41) в следующей симметричной форме [65] dx{ __________Tdx2 = , (2 44) *2 (/?1Х1 + Х2) +£1ГХ2 В [65] отмечается, что для системы дифференциальных уравнений, представленной в симметричной форме, облегчается нахождение первых или частных интегралов Учитывая фушщию (2 29), запишем соотношение (2 44) в виде dxi __________Tdx2 (2 45) У"" Х2 ty(xi , х2) + Р\Тх2 Полежим в (2 45) = Р1х\ + х2 = 0, тогда, интегрируя уравнение (2 45), находим выражение /V = - х2» которое точно совпадает с соотношением tp = 0 Это означает, что многообразие tp = fiixi + х2 = 0 (2 46) вдается частным интегралом (первым) системы дифференциальных уравнений (2 41) Ука- занной результат можно получить и на основе решения (2 43), вычислив следующее соотно- шевде Pixi + х2 = (jSixio + x2o)e~t/T (2 47> Предположим, что начальные условия хю и хго таковы, что удовлетворяется условие М + *20 = 0, тогда, согласно (2 47), tp = 0 Итак, если изображающая точка системы в начальный момент находится на многообразии tp = 0 (2 46), то это многообразие будет пред- йййвтъ собой некоторый частный интеграл системы дифференциальных уравнений (2 41), оживающих движение замкнутой системы управления Таким образом, показано, что син- тезированная замкнутая система (2 41) обладает следующим характерным свойством с изме- нением времени t координаты xi (?) и х2 (()» определяющее состояние системы, меняются, одндко остается неизменным соотношение tp(2 46) Такое многообразие, как известно, назы- вается инвариантным по отношению к системе дифференциальных уравнений (2 41), если решения (2 43) этой системы, удовлетворяющие софтношению (2 46) в начальный момент времени, будут ему удовлетворять также и при любом другом значении переменной t Заметим, 103
что, подставив из уравнения ip — 0(2.46) координату хг = - fiixi в первое уравнение обвей (2.28), можно найти дифференциальное уравнение *1? (О = - » (Ш- которое определяет движение изображающей точки вдоль многообразия ip = 0 к началу коор- динат. м Многообразие^ = 0 (2.46), очевидно, определяет некоторое свойство, принадлежащее» решениям (2.43), начальные условия которых подчиняются тому же многообразию. Рассмот-’ рим подробнее характер движения изображающей точки синтезированной системы на фазою плоскости, показанной на рис. 2.1,а. Фазовые траектории представляют собой некопфй семейство параболических кривых, параметрическими уравнениями которых являются pest- ния (2.43). Так как корни характеристического уравнения отрицательны (pi = Р2 = < -^), то в общем случае траектории стягиваются, в конечном итоге, к началу координат. Среди множества траекторий имеются особые траектории, описываемые многой .разием ip = 0, которое в данном случае задано уравнением прямой (2.46). Так кд lim — = ^ = - /31 прихго + fax^o * 0, то прямая (2.46) является касательной к любой фазошя t+сл Xi X) ! траектории [86], кроме прямой (рис. 2.1,а) Xi + Тх2 — 0 , расположенной ниже (fa < у) прямой (2.46). Это соотношение следует из уравнения (2.44), если его записать в форме dx\ _ _ Tdx2 Х2 ~ fa(x\ + Тлгз) + Х2 и аналогично предыдущему при условии Xi + Тхг = 0 проинтегрировать. Другими словам, 1 г.- прямая (2.46) имеет меньший угол наклона (fa < , поэтому именно к ней притягиваем любая траектория замкнутой системы. 104
j. rJo многих случаях рекомендуется [93] выбирать корни характеристического уравнения муипательными и кратными, тогда решения дифференциальных уравнений (2.41) имеют вид = 1): xi (0 = [хю + (хго + ]е ; х2 (t) = [х20 - 01(Х2О + PiXio)t ] . (2.49) £ак известно [93], в таких системах время регулирования ^р== будет наименьшим, а переходная функция монотонной, и кроме того она не будет иметь перерегулирования. Фазо- вцйпортрет системы (2.41), определяемый решениями (2.49), представлен на рис.2.1 ,б. В этом Рис. 2.1,6 цдучае = 1) среди множества фазовых траекторий существует только одна прямая, опи- шмемая уравнение^ (2.46), угловой коэффициент которой равен - fli. Аналогично предыду- щему случаю эта прямая - 0 является касательной для всех других фазовых траекторий даемы. V» Закон управления и (2.38) был получен на основе линейной функции гр (2.29). Используем шерь нелинейную функцию преобразования ip = fiix\ - Р2Х1 + х2 . (2.50) Поставив гр (2.50) в функционал Ji (2.3), с учетом уравнений объекта (2.28) находим йруктуру сопровождающего критерия качества Л = / + а? х? + (X + + ^ + 6pip2xi + 6^2й2Х?) xi + ‘+ (^?i/?2 + 9ftlxi + /Ях?) xf + 2(aiX] + а2х2 + ЗД2х?х2)н + и2] dt. Подставив второе уравнение (2.28) в этот критерий, получим гЛ = / х? + + а\ - с& + 60цб2х? + #?xix2j лЗ + ч,+ (Т$$2 + W + М} 4 + и2 ] dt. 5л ✓ 1 /Критерии /3 и J4, по которым оптимизируется синтезируемая система, содержат, помимо квадратичных форм координат, как в обычных методах АКОР, также составляющие, пропор- циойальные четвертой и шестой степеням. Известно [66], что использование таких и анало- ’пгшых им критериев с высокими степенями координат позволяют улучшить важные показа- тели качества синтезируемых систем управления в отношении их быстродействия, перерегу- 105
лирования, демпфирования колебаний и др. Особенно проявляются достоинства применеия такого рода критериев качества в режимах больших отклонений изображающей точки систем! от заданного состояния. Критерии /3, J4 по сравнению с квадратичными критериями более полно отражают важное требование минимизации больших отклонений в течение переходного процесса, т.к. оптимальный по критериям J3, /4 регулятор будет более чувствителен к большим, отклонениям координат [66]. Кроме того, присутствие в критериях /3, /4 квадратичных членов х?, xi позволяет наделить синтезируемый регулятор необходимой чувствительностью малым отклонениям координат. Итак, оптимальный по критериям /3, J4 регулятор эффектом реагирует как на малые, так и на большие отклонения координат. d Более того, такого рода критерии могут также использоваться для аппроксимации друпи критериев, имеющих важное практическое значение, но для которых отсутствуют эффектив- ные аналитические или численные методы решения оптимизационных задач. Однако для рассматриваемых неквадратичных функционалов в обычных методах АКОР существенно воз- растают вычислительные трудности определения формы и параметров законов управления.В; развиваемом методе АКАР, как это будет далее показано, указанные законы определяются в результате достаточно простых аналитических процедур с учетом условий асимптотически, устойчивости движения вдоль соответствующего многообразия. • Используя уравнение Tty (?) + ^ = 0 , с учетом (2.50) определим оптимальный по критериям /3, J4 нелинейный закон управления и = — Xi — (jSi + аг + у) хг — х? — 302X1X2 , который переводит изображающую точку в окрестность многообразия V» = 01X1 + 02x1 + Х2 = 0 . (2.51) Найдя из (2.51) координату Х2 = - 01X1 - 02Х31 и подставив ее в первое уравнение системы (2.28), получим дифференциальное уравнение xiy (О = - - ^2X1^,, (2-ЭД которое описывает движение изображающей точки вдоль многообразия = 0 к началу коор- динат фазовой плоскости. Очевидно, что при 01 > 0 и 02 > 0 это движение асимптотичеоя устойчиво в целом [5]. Иначе, закон управления, полученный на основе функции (250), гарантирует асимптотическую устойчивость движения в целом синтезированной нелинейна системы. Однако этот закон обеспечивает также повышенное быстродействие синтезировании нелинейной системы по сравнению с линейной (2.41). Это свойство следует из решецц дифференциального уравнения (2.52), характеризующего динамику замкнутой системна заключительном этапе движения. Аналогично могут быть синтезированы и другие форм оптимальных регуляторов с использованием различных нелинейных агрегированных макро- переменных на основе развиваемого здесь метода инвариантных многообразий. 2.2. ПРИМЕРЫ АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ АГРЕГИРОВАННЫХ РЕГУЛЯТОРОВ ДЛЯ НЕЛИНЕЙНЫХ ОБЪЕКТОВ ВТОРОГО ПОРЯДКА г ► 1 Рассмотрим теперь особенности предлагаемого метода АКАР при решении задач синтея систем управления объектами второго порядка с различными нелинейностями. Пример 2.3. Предположим, что объект описывается дифференциальными уравнения*» Х1 (?) = 0X1 + Х2 ; Х2 (?) = и . (2-Я1 Особенностью объекта (2.53) при а > 0 является его существенная неустойчивость, т.к. пр? хг (?) 0 координата xi (?) ~> », что накладывает дополнительные требования к синтезируе- мым законам управления u(xi , хг), которые должны обеспечивать стабилизацию (xi -»Д 106
(2.54) (2.55) (2.57) (2.58) T\dx2 системы при произвольных начальных условиях. Применим метод АКАР для синтеза жих законов управления. Для этого выберем функцию сначала в виде V'l = х2 + ах1 + Ьхз . Подставляя (2.54) в уравнение T1V4 (Г) + = 0 , подучаем следующее общее выражение: «i(xi , х2) = - (ЗЛх? + a) (axi + Х2) - jr ^(V'i) , Л > 0 , которое в зависимости от выбранной функций у>(^1) позволяет получить различные законы управления. Эти законы обеспечивают асимптотически устойчивое движение изображающей точки в окрестность многообразия ^1=0 (2.54), т.к. функция <p(tpi) выбирается такой, чтобы 0. Дифференциальное уравнение, описывающее движение вдоль ipi = 0, имеет вид х^ (0 = “ а) х^ . (2.56) / Для оценки устойчивости уравнения (2.56) используем функцию Ляпунова v = 0,5х?^, тогда ее производная по времени, взятая в силу уравнения (2.56), будет равна g v(t) = - axi^ - (b - a)xi^ < 0 . Отсюда следует, что неравенства а > 0, а, Т\ >0 являются условиями асимптотической устойчивости в целом синтезированной замкнутой системы (2.53), (2.55): xt (t) = axi + x2; x2 (t) = - (3bxi + a) (axi + x2) - jr <p(V>i) • Определим первые интегралы системы (2.57), для чего представим ее в следующей симметрич- ной форме [130]: dxi з_ ________________Tjdx2______________д ; «х? 4- X2 1 ТДЗдхг 4- a) (axi 4- хг) + ^(V’i) Положив в (2.58) функцию = 0 и, следовательно, <p(Q) = 0, после интегрирования находим первый интеграл axi + Z>x? = - хг, который совпадает с выражением ipi = 0 (2.54). Фатами словами, мы Убедились в том, что заданное инвариантное многообразие ^1=0 (2.54) действительно является претендентом на желаемое притягивающее многообразие синтезиро- ванной нелинейной системы. Для того чтобы окончательно выяснить этот вопрос, целесооб- разно найти угловой коэффициент направления, в котором траектория изображающей точки системы может стремиться к устойчивому положению равновесия [185. С.77]. Для этого с целью упрощения преобразований выберем линейную функцию <p(ij>\) = и запишем урав- нения замкнутой Системы (2.57) в следующем виде: Х1 (0 = «11*1 + П12Х2 + F,(X1 , х2); & Х2 (0 = «21X1 + Й22Х2 + /2(^1 I х1) , (2.59) > хг) = ахЪ ^2(*1 , *2) = ~ I ЗаЬх* + аа + х? - Здх?Х2—ряды, начинающиеся со Ясеней xi и х2 не ниже второй; йц =0; а\г = Г, «21 = - хгг = - |« + 4-|. При этом /1 ( 111 • должно соблюдаться условие (АГ А = «и «1? =^-#0. «21 <*22 Т1 ' Согласно методу АКАР, для системы (2.59) всегда существует полутраектория xi = xi (t), xi (f), стремящаяся при t -» » к состоянию устойчивого равновесия (0,0). Тогда соотно- dx2 л нение оудет иметь предел при t -* » в тдм и только в том случае, когда имеет ппедел -“ш 107
Х2 (<) r<o, выражение —hx, причем в случае существования этих пределов они равны друг другу [185. С.77], т.е. к ,. dX2 .. Х2 . Inn -j— = hm — = к. i f-»oe d.X\ Jfj -J Угловой коэффициент к должен удовлетворять следующему квадратному уравнению: \ + (Ли Л22)к — О.2\ = 0 . (2.Л)) Очевидно, что дискриминант уравнения <2.60) совпадает с дискриминантом характеристиче- ского уравнения линеаризованной замкнутой системы. Корни уравнения (2.60) связаны^ корнями Л1 и Л 2 характеристического уравнения соотношениями Л1Я12 = Л1 — ац , к2Л12 ~ кг — ац • В рассматриваемом случае к\ = Л1 = - а; кг - кг = - т.е. корни Ль кг действительны! отрицательны, т.к. а > О, Т\ > 0 по условиям устойчивости замкнутой системы. Это означает, что все траектории системы (2.57) стремятся к состоянию равновесия—устойчивому узлу в направлениях, определяемых асимптотами хг — к\Х\ихг = кгх\. Очевидно, что действительйЙ асимптотой, к которой неизбежно будет стремиться фазовая траектория, будет та, у которой меньше коэффициент наклона I Лт,п I • В данном случае это определяется выбираемыми значе- ниями параметров а и Т\. Изложенное исследование уравнения (2.59) по определению коэффициента направления, в которому стремится траектория синтезированной системы в процессе движения изображающей точки к устойчивому положению равновесия, позволяет сделать следующие важные выводи во-первых, задаваемое инвариантное многообразие = 0 (2.54) по своей форме определяет структуру притягивающего многообразия, к которому стремится любая траектория замкнутой систем. Однако окончательное параметрически точно определенное притягивающее многообразие находится в результате выбора соответствующих параметров (а , Ti), определяющих коэффици- ент направления Л (2.60) при линейном разложении правых частей дифференциальных уравнений (2.59) замкнутой системы. Иначе, задаваемое инвариантное многообразие V’i = 0 (2.54) обяза- тельно определяет в пространстве состояний некоторый конус, своего рода фазовые “миноранту" и “мажоранту”, между которыми всегда будет находиться любая фазовая полутраектория движе- ния изображающей точки к устойчивому узлу—положению равновесия системы; во-вторых, дм однозначного определения инвариантного многообразия^] = 0 (2.54) в качестве притягивающего следует выбирать его параметры (в данном случае а) такими, чтобы они обеспечивали минималь- ный коэффициент I &min I (2.60) направления, в котором траектория стремится к состоянию равно- весия системы. В рассматриваемом здесь случае это означает, что параметр а в ipi (2.54) должея быть выбран таким, чтобы аТ\ < 1; в-третьих, по-видимому, наиболее подходящим и однознач- ным является такой выбор параметров (а1\ = 1) задаваемого инвариантного многообразда ipi = 0 (2.54), когда обеспечиваются кратные корни Л1 = кг = ... = Лп характеристического урав- нения линеаризованной замкнутой системы, тогда коэффициент наклона к (2.60) будет имев единственное значение, однозначно определяющее параметры притягивающего многообразм ^1=0 замкнутой системы. В этой связи следует снова отметить, что именно такое распределен» корней нередко рекомендуется [93] при синтезе линейных систем управления. Таким образом, чтобы сформировать инвариантное многообразие ^1=0 (2.54) как при- тягивающее, необходимо наложить на его параметры такие условия, при которых обеспечива- ется минимальный коэффициент направления I £min I, в котором траектория движения изобра- жающей точки стремится к устойчивому узлу—положению равновесия синтезируемой систе- мы. Именно эти условия (I £min I) устанавливают связь между параметрами (а) притягивающего многообразия (2.54) и параметром Т\ функционального уравнения. & Покажем, что при нарушении указанных условий замкнутая система действительно может иметь притягивающее многообразие Si = 0, структурно совпадающее с заданным инвариаит- 108
ным многообразием Vh = 0 (2.54), но отличающееся от него значением параметра. Предполо- жим, что уравнение Si = Х2 + 61X1 + /3xi = О «шлется претендентом на притягивающее многообразие синтезируемой системы. Найдем условия, которые необходимо наложить на параметры 61, /?, чтобы 5 = 0 действительно стало притягивающим многообразием. Пусть b\ = d] + а, р # а, тогда из Si =0 имеем выражение xj + axi = - j8xi - dix?, подставив которое в (2.58) при ^(V*i) = V'n получим соотношение dxi _ T\dx2 _ , (2.61) —fix\ — <5]Xi Ti(36xi + a) (fix\ + dix?) — (а — fl)x\ При а = fl из (2.61) следует, что V>i = хг + 6х? + ах\ = 0 является первым интегралом замк- нутой системы, т.е. подтверждается полученный ранее результат. В случае же а * fl и di = 0 из (2.61) имеем уравнение j9Ti(6xi + axi) + (fl - a)xi = - flT\X2 , которое при условии fl1\ = 1 будет совпадать с Si =0. Итак, для того чтобы многообразие Siхг + 61 х? + /?Х1 = 0 стало еще одним, помимо V'i = 0, первым интегралом замкнутой системы, необходимо выполнить следующие условия: Z>i = a; dj = 0; fl = При этих услови- ««системе возможно наличие второго частного интеграла, который может быть притягива- юарщ многообразием. выполненные выше исследования показывают, что в синтезированной системе (2.57) возможны следующие два притягивающих многообразия: з 1 Vi = х2 + bxi + axi - 0 при b > а, а < •=- ; □ 1 1 S] = хг + Ьх\ + х\ =0 при b = а , а > -=г . 11 i \ При Г] > 0 многообразия^! = 0 или Si = 0 будут притягивающими, т.е. множества траекторий движения изображающей точки синтезированной системы (2.57) имеются особые траектории, описываемые уравнениями ipi = 0 или Si = 0, к которым устремляются все другие траектории системы. В зависимости от вида функции ^’(V’i) процесс сближения траекторий с многообрази- ями y»i = 0 или S] = 0 осуществляется по-разному, а затем изображающая точка будет дви- гаться вдоль многообразий V’i = 0 или Si = 0 до попадания в начало координат пространства состояний. 1 При^ = ^i = хг + axi + ах? закон управления (2.55) принимает вид г,,; {. ~ ~ ~~ Хт. ~~ xt - (3axi + a)(xi + Х2) • Йа'рис. 2.2,а для этого закона и параметров « = 1, а=1, Л = 1 изображены траектории 'движения замкнутой системы. Как видно из рис. 2.2,а фазовые траектории “наматываются” на многообразие ^1=0 (2.54), стягиваясь к нему в начале координат. При этом система является ОДкптотически устойчивой с апериодическим характером затухания переходных процессов. Пр! b = а уравнения замкнутой системы (2.53), (2.55) становятся линейными относительно расходной координаты и могут быть представлены следующим операторным уравнением: Ю3?’ ГТ u. 1и. Л ( \ A d (2.62) (ЛР+ 1) -Р+ 1|Х1(р) =0, р = Выбором соответствующих параметров Т\ и а в уравнении (2.62) можно обеспечить желаемое время затухания переходных процессов в синтезированной системе. На рис. 2.2,6 представлены 'фактории движения на плоскости xj, xi (/), при выборе Ti = 1, а = 1. В этом случае, как известно, среди множества фазовых траекторий существует единственная прямая Х| (() = 0, которая является касательной ко всем другим фазовым траекториям системы. 109
Как следует из рис.2.2,б, который аналогичен рис. 2.1,6, фазовые траектории действителен) расположены симметрично относительно указанной прямой на фазовой плоскости. Выбра b > а, можно повысить быстродействие замкнутой системы. Теперь сравним характер траекторий движения в замкнутой системе (2.57) для разных функций <p(ipi). На рис 2.2в изображены траектории движения соответственно: 1—для у? - 2—для ip = th ipi, 3—для ф = signer, из начальных условий хю = 0,75; хзо = 0 и хю = (д хао = 0. Из рис. 2.2,в видно, что в случаях <р = tpi и ф = th^i траектории асимптотичесн ‘ сближаются с многообразием = О (2.54) в начале координат, а для разрывной функщи <р = signal изображающая точка попадает на многообразие = 0 за конечное время и дще в скользящем режиме движется по = О к началу координат. - Предположим теперь, что на координату хг наложено ограничение I хг I < А. Тогда, вида функцию ^2 = хг + A th (jSxi + axf) , (2^8) 110
получаем выражение для закона управления А(в + Зах?) fxi + *2^) 1 z. ч гг . Л (2.64) U2------h2zz> V Т2 > О, ch (pxi + axi ) который переводит изображающую точку в окрестность многообразия ^2 = 0 (2.63) и обеспе- чивает в зависимости от выбранной функции у>(^2) и параметров fl и а соответствующее качество переходных процессов. Уравнение движения вдоль многообразия ^2 = 0 имеет вид xi^2 (?) = xu/,2 - A th (flxly>2 + ахц,2) . (2.65) Из уравнения движения (2.65) следует, что условия/? > 0,а > 1 обеспечивают его асимптоти- ческую устойчивость только в определенной области. Это означает, что введение ограничения 1^| < А и, следовательно, функции 1р2 (2.63) сужает область асимптотической устойчивости замкнутой системы (2.53), (2.64). На рис. 2.2,г,д,е соответственно для функций у? = ^2, p«th V»2 и <р = sign 1р2 и параметров а = 1,. Т = 1, А = 1 изображены графики переходных процессов в замкнутой системе, которые подтверждают наличие области асимптотической устойчивости с апериодическими переходными процессами в синтезированной системе. ; В режиме малых отклонений, когда iptinf — х2 + Aflxi, законы управления и2 (2.64) и и\ (255) (А = 1) будут оптимальными по квадратичному критерию Jinf = f Гm2fl2A2x2 + ( т2 + fl2A2C2) х2 + С2 и о L Выбор весовых коэффициентов в критерии (2.66) зависит от желаемых показателей качества переходных процессов. Итак, синтезированные методом АКАР законы управления их (2.55) и «2 (2.64) гарантируют асимптотическую устойчивость соответственно в целом или в области 1х2Т и обеспечивают требуемые свойства замкнутой системе. пример 2.4. Синтезируем закон управления объектом XI (?) = X2 + Х2 , Х2 (?) = U , имеющим экстремальную нелинейность. Введя функцию tp = х2 + flxi + axj I xi I , и подставив ее в функциональное уравнение •? ТХЦ (?) + tp = 0 , в силу уравнений объекта (2.67) найдем следующий закон управления (у? = гр): u = - ^ xi - у xi IX! I - у х2 - (2alxi I + /?) (х2 + х2) . Заия (2.69) переводит изображающую точку в окрестность многообразия = 0 (2.68), движение вдоль которого описывается дифференциальным уравнением Х|^> (?) —“ flx\y • V 1 dt. (2.66) (2.67) • (2.68) (2.69) . (2.70) 111
е Рис. 2.2 При /3 > 0 уравнение (2.70) и, следовательно, синтезируемая система обладают свойстве» асимптотической устойчивости движения. На рис. 2.3 приведены траектории движения заюс- лГ нутОй системы при /3 = 1; Т = 1, а = 2. Заметное отличие рис. 2.3 от аналогичных фазовнх портретов систем второго порядка состоит в поведении траекторий в третьем квадран». Обычно законы управления представляют собой некоторое многообразие, проходящее черв второй и четвертый квадранты фазовой плоскости. В рассматриваемом примере многообразие V» = 0 (2.68) выбрано таким, чтобы подчеркнуть указанное отличие. Из рис. 2.3 следует, что 112
фаОые траектории притягиваются к выбранному многообразию ip = 0, при этом обеспечива- юШапериодические переходные процессы. >Йример 225. Синтезируем закон управления электроприводом постоянного тока: 1 it (t) = ai*2 _ Й2Х1Х?; хг (0 = - аз*2 + и; а* >0, £-1,2,3, (2.71) (де*#—скорость, отклонение и вращение; хг—ток; и—напряжение обмотки возбуждения. Объект (2.71) в пространстве состояний имеет особую линию ,< Л 5 = 2a&ciX2 - а\ = 0 , на «второй не выполняются условия общности положения [23].* В соответствии с методом АКАР введем агрегированную переменную -ГД’* 1р\= х2+рх\ (2.72) яд№м получим закон управления /3 /д г 1 ч 2 (2.73) ui = - xi - (pai + yr - аз ) х2 + pa2xix2 . (2.73) переводит изображающую точку в окрестность многообразия ^1=0 (2.72), движение вдоль которого описывается дифференциальным уравнением ; хц,1 (t) = - faixi - aifi2xiyi . (2.74) Уравнение (2.74) по своему виду совпадает с уравнением (2.56), и, следовательно, при (5 > 0 обеспечивается асимптотическая устойчивость движения в целом синтезированной системы. Досмотрим уравнения движения замкнутой системы (2.71), (2.73) на особой линии Уа0. Подставив S = 2a2Xi%2 — <?i = 0 в закон управления и\ (2.73) и уравнения объекта (1УЬ, получим соотношение 7*1X2 (0 + Tifixi (t) + Х2 + ftxi = 0 , которое представляет собой функциональное уравнение " 7*1^, (/) + ipi = 0 , 1Де^1 определяется выражением (1.7^2). Это означает, что линия 5 = 0 является одной из траекторий движения изображающей точки замкнутой системы. На рис. 2.4,а представлены траектории замкнутой системы (а* = 1,/3 = 1,Т = 1). Как видно изрйС. 2.4,а, на плоскости х'/, х? имеется притягивающее многообразие ipi = 0 и особая линия S = 0, что подтверждает теоретические результаты синтеза методом АКАР. Замкнутая система асимптотически устойчива и имеет апериодический характер переходных процессов. Рис. 2.4,а ИЗ
При ограничении на ток, т е на координату I х2 I Д следует ввести в рассмотрение функцию .ь = *2 + A thjSxi (2 75) Тогда, согласно методу АКАР, получим закон управления 4s / 2\ /1 \ A а (276), ch jSxi \ / \ 2 ) Т2 & Закон (2 76) переводит изображающую точку в окрестность многообразия ^>2 = О (2 75), движение вдоль которого описывается уравнением . *1^2 (0 = ~ «1А th fixup - a2A2xiV2th2fbciy2 ТШ При /3 > 0 гарантируется асимптотическая устойчивость нулевого решения уравнения (2 77). Это означает асимптотическую устойчивость движения замкнутой системы (2 71), (2 76)1 целом по координате xi и в области I х21 < А по координате х2 На рис 2 4,6 изображена траектории движения замкнутой системы (а* = 1,/? = 1, А = 1) Как видно из рис 2 4,6, на плоскости xi, х2 имеется притягивающее многообразие ^2 = 0 (2 75), а также особая линй Рис 2 4,6 S = 0, к которой устремляется часть траекторий движения Синтезированная система асимп- тотически устойчива и имеет апериодический характер переходных процессов * Рассмотрев на примерах нелинейных объектов методику применения инвариантных (ив- тегральных) многообразий ip = 0 для синтеза нелинейных регуляторов, подведем некоторые первоначальные итоги Во-первых, как и в любом другом методе, здесь также возникает важный вопрос об устойчивости синтезируемой системы, решение которого разбивается на два этапа Если i начальный момент времени изображающая точка находится в окрестности соответствующего многообразия^ = 0, например вида (2 46), (2 51), то она должна в дальнейшем двигаться вдоль ip = 0 к началу координат (*i = . = хп = 0) Устойчивость этого движения определяете! устойчивостью тривиальных (xi = 0) решений уравнений (2 48) или (2 52) и зависит от выбора коэффициентов/?, и вида функций ip (2 29) или (2 50) Однако любые, даже малые возмущений, в реальных условиях непрерывно действующие на системы, будут выталкивать изображающую точку с многообразия ip — 0 и тогда будет возникать возмущенное движение, которое, разуме- ется, также должно быть устойчивым Таким образом, при синтезе законов управления i определении структуры обобщенного интегрального функционала должны быть также удов- 114
легворены условия устойчивости задаваемого инвариантного многообразия tp = 0. Это много- образие, как известно, представляет собой заданную программу движения, под которой здесь Понимаются выражения xi (t),..., хп ((), удовлетворяющие равенству tp = 0 для любых значе- вий 1. Условия асимптотической устойчивости в целом синтезируемых систем относительно многообразия tp = 0 имеют простой вид: V > 0; Т > 0. Это означает, что областью притяжения программного движения tp = 0 является вся область пространства состояний, для которой справедлива исходная математическая модель объекта. Иначе, многообразие tp = 0 Ищется притягивающим для всех траекторий замкнутой системы. Так как в рассматриваемом методе синтеза всегда гарантируется асимптотическая устойчивость систем относительно мно- юобразия tp = 0, то в конечном итоге асимптотическая устойчивость замкнутых систем по переменным xi ,..., хп будет определяться лишь условиями устойчивости тривиальных решений дифференциальных уравнений вида (2.48), (2.52) и др., описывающих движение изображаю- щей точки вдоль многообразия tp = 0 к началу координат (%i = ... = хп = 0) фазового про- страйства. *чгКроме задач устойчивости, при использовании рассматриваемого метода возникает вопрос об-условиях существования в пространстве состояний синтезируемых систем инвариантных (дотягивающих) многообразий tp = 0. В этой связи напомним постановку задачи синтеза: найти такое управление и(х\ ,..., хп), чтобы Задаваемое многообразие tp = 0 являлось интег- ральным для дифференциальных уравнений замкнутой системы, а программное движение ф » 0было устойчивым относительно агрегированной переменной tp(x\.,..., хи). Для того чтобы многообразие tp = 0 было инвариантным (интегральным), необходимо и достаточно, чтобы макропеременная tp(xi ,..., хп) от п переменных xi,..., хп удовлетворяла соответствующему функциональному уравнению, например, вида (2.22). Это уравнение после подстановки в него выражений для) полной производной ip (() может быть записано в виде соотношения, которому необходимо и достаточно удовлетворить для того, чтобы равенство tp = 0 было инвариантным многообразием замкнутой системы. Во-вторых, процедура синтеза законов управления состоит из двух этапов: сначала гаран- тируется сближение изображающей точки с притягивающим многообразием tp = 0, а затем движение вдоль этого многообразия к началу координат фазового пространства Цг... = хп = 0), при этом необходимо обеспечить желаемый, например, апериодический, хйрйгор затухания переходных процессов. Синтез закона управления осуществляется путем подстановки в функциональное уравнение уравнений исходного объекта. Такое управление и переводит изображающую точку в окрестность многообразия tp(xt ,..., хп) = 0, движение вдоль которого описывается системой из (л -1) дифференциальных уравнений, которые получаются путем подстановки в первые (л— 1) уравнений объекта координаты ( (() /*п(Х1у> Хп-\'Ц) , ,..., fin) , определяемой из равенства tp = 0. На приведенных выше примерах показана двухэтапная процедура аналитического конструирования регуляторов. В-третьих, в предлагаемом методе синтеза конкретные критерии качества не постулиру- к^заранее, а строятся на основе обобщенного интегрального функционала путем выбора соответствующих функций tp(x\ ,..., х^) с учетом уравнений (2.1) исходного объекта. t Наложенные выше некоторые первоначальные выводы свидетельствуют об определенных возможностях предлагаемого метода аналитического конструирования нелинейных регулято- ров(ДКАР), основанного на применении инвариантных многообразий, задаваемых в фазовом пространстве синтезируемых систем управления. ’J<w 115
2.3. АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ АГРЕГИРОВАННЫХ РЕГУЛЯТОРОВ ДЛЯ ОБЪЕКТОВ ВЫСОКОГО ПОРЯДКА ПО ЗАДАННОМУ ИНВАРИАНТНОМУ МНОГООБРАЗИЮ В разд. 2.1 и 2.2 на основе примеров решения задачи АКАР для объектов первого и вторби порядков было показано достаточно эффективное применение метода конструирования инва- риантного многообразия в фазовом пространстве систем. Конкретные примеры синтеза пбд твердили ранее высказанные положения о двухэтапности процедур решения задач устойчив сти синтезируемых систем, о необходимых и достаточных условиях существования в простри- стве состояний инвариантного многообразия, о двухэтапности процедур синтеза структура выбора параметров закона управления и, наконец, о форме оптимизирующих функционалу которые имеют сопровождающий характер и не постулируются заранее, а конструируются учетом свойств объекта управления. Все эти выводы имеют общий характер и справедливы $ всего рассматриваемого класса нелинейных систем. В этом разделе изложенные идеи приме- няются для решения задачи АКАР для объектов третьего и высокого порядков. Рассмотрю сначала метод АКАР с использованием линейных макропеременных. Задача синтеза состоит) построении закона управления и(х\,..., хп), обеспечивающего перевод объекта (2.1) из про© вольного начального состояния в окрестность гиперплоскости " о л (2.78) = 2 РкХк = 0 . Л=1 При этом на траекториях движения объекта должен обеспечиваться минимум функционал# J = / [mV + CV (О I dt, I о L J который с учетом (2.78) принимает вид f ® ~ Н - п , (2 79) J = / рп ( Ё РкХк) + С ( Ё РкХк) 1 dt. О L *®1 к=\ -1 В этом случае уравнение экстремали (Г) + У» = 0 , доставляющей минимум функционалу (2.79), имеет форму ? п п (2801 Т Ё РкХк (0 + Ё РкХк = 0 . к=\ к=\ -» Используя уравнения объекта (2.1), найдем оптимальный по критерию (2.79) закон управле- ния: п' 1 л (2.81) « = ~ Ё №к(*\ ,..., Х„) “ у Ё fikXk - *=1 1 Л=1 Закон (2.81) обеспечивает перевод изображающей.точки в окрестность гиперплоскости- (2.78). Дифференциальное уравнение экстремали (2.80) является желаемым уравнением движещй синтезируемой системы. Тогда, оптимизируя систему по критерию (2.79), следует должный образом выбрать параметры (flк. ,Т) закона управления (2.81) и, следовательно, коэффициента уравнения (2.56), исходя из условий устойчивости движения изображающей точки как$ гиперплоскости (2.78), так и вдоль нее к началу координат, а также требований-к качеству переходных процессов. Ранее в первой главе отмечалась сложность решения этой задачи выбора на основе методй АКОР^тем более для нелинейных объектов. В методе же АКАР эту задачу в целом ряде важнш случаев удается разрешить применительно и к нелинейным объектам определенного класса. Рассмотрим, например, выбор параметров закона управления при синтезе систем управления нелинейными объектами, уравнения которых могут быть представлены в канонической форме ’ У1 (0 = У2 , У2 (0 = Уз.Ун-1 (0 = Уп, Ун (0 = Fn(yi Ун) + Ъи , (2.82) 116
дел = fX*i ’•••’ *«)» 1 * i,2,...,n. <, Переход от описания объекта в виде уравнений (2.1) к канонической форме (2.82) может ^осуществлен одним из методов приведения, например следующим способом [65] Выби- рая одна из переменных^ (г), относительно которой желательно записать уравнения (2 82) Qgpno это выходная координата объекта xi (/)* Предполагается, что функции f^x\,., х„) входной системы дифференциальных уравнений объекта (2.1) имеют непрерывные частные взводные по своим аргументам до (zi-’l)-ro порядка включительно. Сделаем замену пере- ^ых yj = X] и затем последовательным дифференцированием по времени найдем производ- ил dxi .. ч, ~ dt ~ ’ *») ’ (2 83) uiifyi _ <Рх1 _ д У1 </х/ = д ад. _ . им Л2 dt1 £ dXi dt £ dx/'“'2’ «Ф’д эх/'-ъ........... ^jf-'y, A HF„-2 _ ^определитель Мн Д(/», ^2,7^3 Fn-\) # 0 (чд, D^Xi , X3 ,..., Xn) систему (2 83) можно разрешить относительно xi, х3 ,..., хп, выразив их через переменные dn~lyi fe 'JT ~ У2’ ’ п~\ = у"’^огда’ п°Дставив найденные переменные yi,...,y« в уравнение Уя, можно получить систему вида (2.82). В [65] доказывается, что если взять решение подставить его в систему (2 59) и определить из этой системы хг (0 ,., хп (f),то система ^кций xi (/), , хп (t) будет решением исходной системы уравнений (2.1). -^Изложенную общую методику представления уравнений (2 1) в форме (2.82) можно к^вкретизировать для определенных классов объектов (2.1). В этом отношении удобным для указанных преобразований является следующий класс нелинейных объектов с треугольной й* хп (0 = Л(*1, ., хп) + и. этом случае можно записать систему соотношений: Л = xi = Fi(xi) , (2.84) (2.85) Л = ^-1/1(Х1,Х2)+...+ ^^/*(Х1,. ,Хк) = /л(Х1,.. ,х*), Л=2,.. ,л 0*1 **-1 Ы^огично обозначим У«+> = . ^2) +•••+ Мх, ......х„) + «] . Ф&идно, что при i = 2 , , и справедливо выражение dl~2 ^Х*1 »•••• *») я ^-г/|(*1 ♦ *2) • дГп замену переменных (2.85)—(2.87), можно показать, что при -г—= b уравнения (Ш) принимают вид (2.86) (2.87) У/ (О У/+1, I ~ 1,2,...,л, (2.88) 117
i да dF( Л , > а > 0 обладают свойством полной управляемо- где у,|+1 = , х2) + . + ,. , х„-1) + bfn(x\ , , хи) + Ьи 0X1 Если из выражений (2 85), (2 86) выразить координаты х2, , хп через переменяй?' У1, ,у„ и затем подставить их в^+ь то тогда система уравнений (2 84) будет соответствен^ канонической форме (2 82) Наиболее просто это выполнить для уравнений (2 84), имеюп^1 функции вида f^x\ » •» Xy+i) ~ $(xi » **’ xi) + , j ~ 1,2, ,n 1 (2 89|'‘ Дифференциальные уравнения (2 84) с правыми частями вида (2 89) описывают достаток распространенный в разных областях техники класс нелинейных объектов В работе [9$р показано, что объекты вида (2 84) при сти Кроме того, из теории АКАР следует, что эти объекты могут быть стабилизирован» соответствующим выбором такого управления zz(xj , , хп), чтобы нулевое решение системы (2 84) было асимптотически устойчивым Указанные здесь свойства управляемости и стабили- зируемое™ объектов (2 84) очевидно следуют из возможности приведения уравнений (2.84) к форме (2 88) с учетом указанного выше свойства монотонности функций F£x\ , , х,) по Хь В дальнейшем отмеченные свойства объектов (2 84), (2 89) будут использованы для решети задачи АКАР с учетом дополнительных требований к первичным показателям качества nejx; ходных процессов Запись уравнений объекта в форме (2 82) позволяет существенно ynpociW процедуры синтеза и исследования устойчивости нелинейных систем Так, закон управления объектом (2 82), доставляющий минимум сопровождающему функционалу ч 2 ... .2 (2«W согласно (2 81) имеет вид Ъи = - 5 (fik + ^Г’)Ул+1 - у\ - Fn(yi , , ylt) (2«П Подставив zz (2 91) в (2 82), представим уравнение замкнутой системы, т е уравнение ^кст^е2 мали (2 80), в форме [93] (0 + (0 + а/|-2й>оу£,-2) (/) + + а>бУэ (?) = 0 (292) Связь между коэффициентами /3*, /пь С| критерия (2 90) и параметрами ah ш0 уравнения экстремали (2 92) выражается формулой пЧ+к (- Пи-'' . _ . ОЙ а,+*й>о i”-'' 7-, z=l,2, ,/z-l, А» л=о / Л \ где wq I л у. | , Т \Рп'j Параметры а„ zw0 могут быть выбраны, например, по известному методу стандартных коэффи циентов [93], исходя из желаемого времени регулирования, допустимого перерегулировано и т д Так, при выборе этих параметров из условия минимальной длительности переходных процессов без перерегулирования, т.е для кратных корней характеристического уравнено экстремали имеем (2J6 Pi (n - 1)» » . , o , 1 a ~ ~7T~i—i------~, 1 = 1,2, ,П - 1 , tt)0 = _ !) » (n - z) ’ T Аналогично выражениям (2 93) и (2 94) можно получить другие соотношения на основ, например, методов модального управления [29, 94] В рассматриваемом случае приведем уравнений объекта (2.1) к каноническому виду (2 82) существенно упрощается также п(йй условия асимптотической устойчивости синтезируемых систем с законом управления (2$) Это связано с тем, что в этом случае уравнения движения изображающей точки вдоль много- образия 4l8
п V = 2 РкУк = О *=1 ИЙЙОТВИД ". . .1 И-1 У1у> (О = №,у> , » Уп-2,у> (О = Уп-1,у » Уп-1,у> (О = ~ ~О~ 5 Рп *-! Для уравнений (2 95), как известно [5], можно записать условия устойчивости А* > 0, к = 1,2, ,п - 1 , (2 95) (2 96) fin-1 д _ нд »• fin-1 fin fin-3 fin 1 fin-3 fin А„-1 =^А„-2 В^Ийенства (2 96) являются условиями асимптотической устойчивости в целом синтезируе- мы^. нелинейных систем управления объектами (2 1), приводимыми к канонической форме После выбора параметров^ промежуточного закона управления (2 91) в соответствии ^отношениями (2 93), (2.94) и (2.96) можно путем обратного преобразования снова вер- нул^ от у, к исходным физически измеримым координатам х( системы, удобным для техни- че&ойреализации регулятора ^Рассмотрев возможности решения задачи АКАР для определенного класса нелинейных ошя^ов вида (2 82), снова вернемся к исходной задаче АКАР и попытаемся выявить некото- рйЖиие свойства синтезируемых систем для объектов более общего класса (2.1) Первым и (Щотельным из’такого рода свойств является асимптотическая устойчивость движения син- тезируемых нелинейных систем Перейдем к определению условий устойчивости нелинейных систем управления объектами (2 1), оптимальных относительно линейных агрегированных мафрпеременных Рассматриваемые системы оптимальны по критерию (2.79), подынтеграль- иофЩражение которого представляет собой неотрицательные функции координат х\хп и и? производных В этом случае, как известно, необходимо исследовать устойчивость синтези- систем Исследуем устойчивость рассматриваемого класса нелинейных систем путем построения функции Ляпунова на основе метода градиента [5] Введем согласно этому методу фадиент функции и в виде ЕЙН’ dv A j„ ~ 2 bqxt» i ~ 1»2,. ,n. UXJ 1=1 1ициенты Ьц в этом выражении следует выбирать таким образом, чтобы выполнялись потенциальности поля = /у=12 (jj£) dxjdx( dxtdXj' '} Производная v (f) в силу уравнений объекта (2.1) Ь\ = ... = bn-i = 0, bn= 1 при управлении (281) определяется выражением (2 97) ,п. n / n > v (0 = 2 2 M xi (0 7=1 V-l ) «-1 п-1 fifink (2.98) 1 п о 'г V* jS Ьпкхк Рп1 ВШйсимости от выбора коэффициентов bjk в (2 98) можно получить различные формы функций и и и (f). Полагая, например, Ь„к = ImiCifitfi^ (к = 1,2,.. ,п), с учетом выражения J fikXk получаем 1=1 119
*(0 = л-1 2 /=i л-1 х (bjk - 2mic$flk)xk Л=1 fj - 2m2ip2. Имея v (f) (2.99), можно найти функцию v с помощью криволинейного интеграла: v = / ’° °) dx + j > dx +...+ f £(*? »-> Хп) dx . О ЭХ1 о дх2 ‘ 0 дх„ Выражение (2.99) может быть представлено в виде двух составляющих v (Г) = Vi (Г) + i>2 (Г), где (2.99) •ж (2.100) (2.101) # П (?) = - 2mfy2, «-» Н 1 (2.102) *2 (?) = X Е (bjk - 2тхсфРк)хк //xi ,..., х„) . у=1 И=1 I а Первая составляющая й\ (?) (2.101) может быть использована для оценки устойчивости дви- жения изображающей точки к многообразию у = О. Для этого, положив в (2.101) коэффи$ енты bjk = 2miCi0j0k, согласно (2.100) находим в Vi = micrf>2. (2.1$ Функция Ляпунова vt (2.103) и ее полная производная Vi (?) (2.98) в этом случае не зависят от нелинейных функций /{xi х„) объекта (2.1) и являются знакоопределенными по пере менной Согласно [5], в этом случае синтезируемые системы асимптотически устойчивый целом относительно многообразия гр = 0 (2.78), что совпадает с полученными ранее резуль- татами. Для определения условий устойчивости движения изображающей точки вдоль много- образия гр = 0 (2.78) используем вторую составляющую i>2 (?) (2.102). Подставив в v2 (?)jb 1 ”-1 уравнения = 0 координату хп (?) = - -я- У /?*х*, получаем условие устойчивости движейм Рч *=1 гж вдоль многообразия гр = 0: я-i p-i 1 . (2.10Й S X (bjk - 2тхсф^к)хк fj(xi ,..., xn-i ,0i ,...,0п) < 0 . ( j=l |л=1 J Условие (2.104) зависит от (л-1) координат xi,..., xn-i и (л-1) нелинейных функй //xi ,..., хи-1) и является условием асимптотической устойчивости в целом синтезируемы! систем. Движение изображающей точки вдоль многообразия = 0 определяется уравнениям» (0 — f\(X\y> ,•••» Xfi—, 0\ ,..., 0п) । ............................................................................... (2.105) Хц—1у> (?) = fn—l(xig> ,»••, Хц— , 01 ,..., 0п) Система уравнений (2.105) получается в результате подстановки приведенного выше выражё ния для переменной xn(f) в первые ,(л-1) уравнений объекта (2.1) (при Ь\ =...= dn-i =0 bn = 1). На многообразии гр = 0 при управлении (2.81) последнее уравнение системы (2.1) вырождается в производную координаты f: 1 «-1 , & Хп (() = 7Г 2 0кХк (0 Р« и поэтому из рассмотрения исключается. Использование уравнений (2.105) пониженной порядка позволяет несколько упростить процедуры поиска условий устойчивости синтезиру емых нелинейных систем. Условие устойчивости (2.104), полученное градиентным методом представляет определенные возможности для получения достаточных условий асимптотик ской устойчивости конкретных систем. Из него, в частности, следуют условия устойчивости при которых функция Ляпунова выбирается в виде квадратичных форм: f9, 1 я-1 _ п-1 = 2 ®jXj > 0, (?) ~ 2} fyxjt <0 Z S«=l S=1 120
ityi b„ - ImiCifi] = ap, bjk = 2micPPk; j = l,2,...,n-l; j * k. В общем случае коэффициенты в (2.104) при выполнении условий (2.97) могут выбираться в виде некоторых функций от координат xi хп-\ системы. Таким образом, метод градиента позволяет выявить некоторые общие закономерности, связанные с выявлением условий асимптотической устойчивости дви- жения в целом рассматриваемого здесь класса оптимальных по критерию (2.79) нелинейных сийем. ^Свойство асимптотической устойчивости в целом синтезируемых систем относительно нвогообразия tp = 0 в ряде случаев делает оправданным использование оценок их устойчиво- сжпо уравнениям первого приближения: 1 • . «-> (2.106) xh!> (0 = 2 аисХку, i = 1,2,...,л—1 , *=i Уравнения (2.106) получаются из уравнений (2.105) путем удержания линейных членов рмложений функций fj(xi ,..., хп). Это связано с тем, что изображающая точка системы неиз- бежно попадает в окрестность многообразия tp = 0, движение вдоль которого описывается уравнениями (л-1) -го порядка (2.105). Известно [5], что при оценке устойчивости системы ^уравнениям первого приближения желательно определить область притяжения ее положе- ния равновесия. В нашем случае многообразие tp = 0 имеет областью притяжения все фазовое пространство относительно фазовых координат х\ ,..., хп системы. ^Перейдем, далее, к рассмотрению примеров, иллюстрирующих возможности изложенного вшпе метода синтеза агрегированных систем. В процессе синтеза будет проводиться сравнение процедур определения законов управления, синтезированных на основе существующих мето- дов аналитического конструирования и предложенного здесь метода, по простоте выполняе- мое операций, достижению заданных динамических свойств замкнутых систем и т.п. Следует, однако, заранее подчеркнуть одно важное отличие излагаемого здесь метода синтеза, а именно фактическую возможность определения законов управления нелинейными объектами в ре- зультате достаточно простых аналитических процедур. Между тем, обзор существующей ли- Й]итуры по методам аналитического конструирования систем показывает, что в настоящее время известны примеры практического синтеза систем в подавляющем большинстве случаев ТЬЯько лишь для линейных объектов невысоких порядков, за весьма редким исключением [14, ВЯ отсутствуют какие-либо примеры прикладного синтеза систем управления нелинейными объектами. 'Пример 2.6. В работе [12, с.239] рассмотрена задача оптимизации системы управления объектом -»• X\(f) = X2, Хг(/) = Хз, Хз (/) = «((). (2.107) Уравнениями (2.107) приближенно описывается ряд объектов, в частности, процесс аэродина- ийеского торможения при баллистическом входе в атмосферу искусственного'спутника. Ставится задача синтеза автопилота, оптимального по критерию г 7 z 2 2 2 2х , (2.108) ,й /1 = J («1X1 + «2X2 + «3X3 + II ) dt . о Уравнение автопилота имеет вид и - - Р\Х\ - р2Х2 - РзХз . (2.109) работе [12, с.241] приведены различные коэффициенты р, закона (2.109), рассчитанные Численным методом для различных значений весовых коэффициентов «*, и построены соот- ветствующие им переходные процессы. Синтезируем закон управления при выборе критерия качества в соответствии с разработанным здесь методом, вида (2.79): « г/з \2 /3 \21 (2.110) /2= / s 0iXi\ + 2 0i*i dt, Mt. о H=i ) (i=i у т.е. при mi = с\ = 1. Коэффициенты закона (2.109) связаны с весовыми коэффициентами критерия (2.110) следующими выражениями: 121
n -0l П - + ^2 • л - 4- I р3 .Рз-^+1. (2.111) Коэффициенты/?, могут быть выражены с помощью формул (2.93) через параметры желаемого дифференциального уравнения (2.92) замкнутой системы (табл.2.1): Таблица Zi Тип стандартных коэффициентов Pi Р2 Рз to а, % Кратные корни 1,00 3,00 3,00 6,00 0 Минимум времени 0,66 2,05 2,39 4,20 5 1 Критическое затухание 1,00 2,50 2,50 4,50 7 Арифметическая прогрессия 2,25 5,10 6,35 6,90 15 * Геометрическая прогрессия' L00 6,70 6,20 2,00 21 В табл.2.1 приведены рассчитанные по формуле (2.69) коэффициенты закона управления (2.105) и соответствующие им время регулирования и перерегулирование а для различию типов стандартных коэффициентов [93]. В зависимости от требований, предъявляемых к характеру переходных процессов, из табл. 2.1 может быть выбрано соответствующее сочетание коэффициентов закона управления. Установим связь между критериями J\ (2.108) и /г (2.110); Вычислив интеграл (2.101),с учетом уравнений объекта (2.107) и условий устойчивости xi(«>) = хг(«>) = хз(°°) = 0, пол- учим Л = I [#х? + (tf + fll) xl + + ft2) xl Ч- ftV ] Л . <2Л1а Положив в (2.112) коэффициенты р,- равными _ _ /?1 + Р\Рг + Рз . _ Рг + Р\Рз + Рз (2.113) ' Рз' 2 р2з ’ 3 Рз ’ \ получим, что оптимизация системы по критерию Ji (2.110) эквивалентна оптимизации по критерию J\. Следует, однако, подчеркнуть, что расчет коэффициентов р( закона управления (2.109) при оптимизации по критерию Л (2.108) требует численного решения нелинейного уравнения типа Риккати [12], а при оптимизации по критерию /2 (2.110) используются простые аналитические соотношения (2.111). Еще более возрастают преимущества синтеза законов управления по развитому здесь методу с повышением размерности объектов. Таким образом, соответственно выбирая весовые коэффициенты критериев качества, можно добиться практической эквивалентности функционалов, используемых в теории АКОР и в предложен- ном методе АКАР, основанном на применении агрегированных переменных. < Пример 2.7. Рассмотрим далее пример синтеза оптимальной системы управления нелиней- ным объектом, уравнения возмущенного движения которого имеют вид X} (f) = Х2 , Х2 (t) = sinxi + Хз , Х3 (0 = и . (2.114) Уравнениями (2.114) описывается движение математического маятника в верхнем неустойчи- вом положении, при этом xi—угол отклонения маятника от вертикали; х2—скорость отклоне- ния; хз—момент, приложенный к маятнику [1]. Заметим, что уравнениями математического маятника описываются многие электромеханические объекты, в частности разного рода фазо- вые системы, синхронные генераторы и двигатели с асинхронным запуском и др. Такие объекта имеют цилиндрическое фазовое пространство [96]. Ставится задача стабилизации маятника моментом, приложенным к нему на оси подвеса. Указанный момент развивается исполнитель- ным механизмом, который представлен интегрирующим звеном. Требуется найти управление. /4(xi , хг, хз) на входе исполнительного механизма, которое стабилизирует маятник в верхнем положении равновесия, т.е. обеспечивает асимптотическую устойчивость системы. Выберем следующий критерий оптимальной стабилизации: 122
(2 115) (2 116) хз - sinxi (2 117) /1 = / рП1(/?1Х1 + faX2 + РзХз)2 + С20?1Х1 + faX2 + faxf)2 j dt Применяя изложенный выше метод синтеза, находим закон управления (2 81) fami fa (fa , famA . fa , Wk = ~7^х'-д '" Ift + ftq*2“( ft *” доставляющий минимум критерию качества (2 115). Исследуем устойчивость движения син- тезированной системы, уравнения движения которой с учетом уравнений объекта (2 114) и ' зайбна управления (2 116) принимают следующий вид* :-fXl (/) = Х2 , Х2 (/) = sinxi + Хз , ' ,• /л (fa .famA (fa mA •''”w = 'ft^x‘_ (ft ft^r (ft Подставив первые два уравнения системы (2 117) в третье, получим хР>(() + + xi - — sinxi = О faci Ci (^ййнение (2 118) относится к уравнениям вида «Ш хР> (Г) + ^Р(Х1 , xi)xi2) (0 + ДХ1 , X]) = 0 , “ -х fa , mi ВД8р(Х1, xi) = + —, J ' « . х (fa , fami , fanti mi . ^Xl ’+ faci C0SX|) Y| faci Xi Cl SmX1 Доопределения условий устойчивости систем (2 117) или (2 118) сначала используем стан- •дарвные способы, опубликованные в литературе, а затем найдем эти условия, исходя из особенностей, присущих нелинейным агрегированным системам В[5С 113-121] установлены условия асимптотической устойчивости в целом нелинейных шем вида (2118), которые имеют следующий вид* Xl df(x х ) 1Дх1,Х1)- Дх1,0)]Х1> xj —х' dxi при xi* 0, а = const, »o)*i> о при l'( • КФ(Х1, xi) = J 1ДХ1 , xi) - Дх1,0)] dxi > 0 при xi # 0 ; 0 и fa + у1] х12) (0 + (ф- + - COSX1] Х1 (Г) + \РЗ Cl j v \рз рзС\ } ______0 Cl (2 118) (2 119) (2 120) (2 121) (2 122) (2 123) (2 124) я 1 4e / Дх1,0) dxi Ф(Х1 , xi) - xi/2(xi , 0) > 0 при xi , xi # 0, Г о л (2 125) (2 126) д-j Q ПрИ Xj # 0; dX\ № Xj *1 3thn[ af f(xi , 0) dxi + J /(xi , xj) dxi ] = «о при Ixj I-* <» и фиксированном xi Условия (2 122)—(2 127) получены на основе функций Ляпунова 4 Х* *1 у = aj ДхьО) dxi+ f ДхьХ1) dxi+ 0,5(xi + axi)2+ af fy>(xi,xi) dxi- a]xi dx\ И* о о о X1 df v(t) = axt р(хьО) - Лхьх1) ] + xif dxi + [a - <p(xi , xi)]x?+ X1 dtp + axi f -&xi dxi о aXl Исследование условий асимптотической устойчивости синтезированной системы (2 117) или (1Н8) на основе соотношений (2 122)—(2 127) является громоздким и здесь не приводится (2 127) (2 128) 123
В результате выполненного в работе [69] исследования при помощи выражений (2 122)- (2 127) были получены следующие соотношения между параметрами f1 >i, А>о, /= 1,2,3, >0 (ад Эти соотношения являются условиями асимптотической устойчивости в целом синтезирован ной системы (2 117), т е закон управления (2 116) является законом оптимальной стабилодл ции << Выше было показано, что достаточным условием асимптотической устойчивости в цедо> рассматриваемого класса систем является выполнение неравенства (2 104), которое по суще- ству определяет асимптотическую устойчивость движения вдоль многообразия ^=2 £***4* *=i j Для системы (2 117) условие (2 104) принимает следующий вид ч! || (2ш1С1^1Д2 - *2i)x? + [£12 - 2miCi£i£2 - (bn - 2т\сф$^ ] xi + + Г^н~ 2miCi£?\ — (b22~ — (b2\ — 2miCiflift2\^ 1 х\Х2 + (21$ Так как выбор коэффициентов произволен, то путем разложения функции sinxi в ряд Тейлор можно показать, что условие (2 130) удовлетворяется при выполнении соотношений Ф- > 1 , £, > 0, i = 1,2,3 , £з которые совпадают с условиями (2 129), полученными на основе выражений (2 122) — (2 127) Следует подчеркнуть, что первый способ определения условий устойчивости на основе исход ных уравнений системы (2 94) потребовал трудоемкого и кропотливого исследования неде венств (2 122) — (2 127), второй же способ, основанный на исследовании устойчивости двюод ния вдоль многообразия V'i = 0, привел к искомому результату достаточно просто после ток как были выявлены соотношения между параметрами, удовлетворяющими общему условию (2 104), и было получено условие (2 130) Указанные преимущества исследования устойчиво-! сти движения вдоль многообразия ^1=0 связаны в основном с тем, что на этом многообразй снижается на единицу порядок исследуемой системы Условия же устойчивости (2 122>— (2 127) целесообразно использовать при исследовании нелинейных систем четвертого пород- ка, у которых дифференциальное уравнение движения вдоль ^1=0 мбжет быть приведена i виду (2 119) В литературе [5,11] имеются результаты, позволяющие исследовать устойчивость движе ния и для некоторых классов нелинейных систем более высоких порядков Однако такое исследование может натолкнуться на существенные трудности В этой связи на практике мода оказаться рациональным подход, основанный на исследовании устойчивости движения вдоль многообразия = 0 при помощи уравнений первого приближения (2 106) Выше указывалось на применимость такого способа в ряде случаев, т к синтезируемые нелинейные системы обладают свойством асимптотической устойчивости в целом относительно многообразй ^1=0 Так, для системы (2 117) линеаризованные уравнения движения вдоль ^1=0 прий- мают вид ,л_ • -Г1 £1 (2131) X1V (0 Х2ц> , Х2у> ( 1 ) Xty Х2ф , Из уравнений (2 131) непосредственно следуют условия устойчивости > 1 , £ >0, i = 1,2,3 , , совпадающие с уже известными условиями (2 129) асимптотической устойчивости в целбы синтезированной нелинейной системы 124
.-Ранее подчеркивалось, что если дифференциальные уравнения объекта удается преобра- зишь к виду (2,82), то при этом упрощаются как процедуры исследования устойчивости жгезируемой системы, так и придания ей соответствующих качественных свойств на основе, щпример, метода стандартных коэффициентов. После определения закона управления для скгемы вида (2.82) можно перейти к физически измеримым координатам объекта. Использу- ежэтот подход для рассматриваемого здесь примера синтеза системы управления объектом (24)14). Используя выражения (2.85), (2.86), запишем дифференциальные уравнения объекта ввиде У1(0 = У2, У2 (0 = Уз, Уз (0 = У2СО8У1 + и . (2.132) Переменные х, и у, систем (2.114) и (2.132) связаны между собой соотношениями: У1 ;= хГ, У2 = х(Г) = Х2, уз = sinxi 4? х3. . (2.133) Синтезируем для объекта (2,132) .оптимальный по критерию °° г , 3 э „ з _, п 134) J2= J [mi( Zw) +cl( 2]dt ? 0 L /=i (=i J закон управления aim.2 1 , . («2 , m2 \ (2.135) •L S’ 4 7 3 Из условий устойчивости движения вдоль многообразия 1р2— X ^кУк — 0 сразу же следуют , Л=1 условия асимптотической устойчивости в целом системы (2.132) с законом управления 112 (2135), которые имеют вид л п- «, > 0, 1 = 1,2,3. (2.136) Запишем закон управления иг (2.135) с помощью соотношений (2.133) в исходных координа- ций? а\т,2 (а\ «2^2 ) (а2. тг) . /аг тг) (2.137) 1 а3С2 ^а3 а3С2 у (аз с2 j (а3 С2) Полученный закон ^правления (2.137) отличается от закона Hi (2.116) наличием дополни- тельйдго чле'йа xicosxi. Указанное отличие связано с различием используемых критериев качества J, (2.115) и /г (2.134). Подставив Н2 (2.137) в исходные уравнения (2.114), получим уравнение замкнутой системы относительно выходной координаты xf w + + w + fe. + (() + _о. (2.138) I «з С2 j v 7 (а3 а3с2) азС2 Величие от уравнения (2.118) при управлении и\ (2.216) уравнение (2.138) является линей- ййЬщфференциальным уравнением замкнутой системы. Это позволяет упростить процедуры определения условий асимптотической устойчивости и выбора весовых коэффициентов а„ вгйсг, исходя из требований к динамическим свойствам системы. Так, на основе условий - А?! I 3 устойчивости движения вдоль 1р2 = 2 акУк - 0, описываемого линейным дифференциальным A=l • . уравнением, были просто получены условия (2.136) асимптотической устойчивости в целом замкнутой нелинейной системы. Требования же к ее качеству могут быть также достаточно просто удовлетворены путем выбора коэффициентов а,- на основе выражения (2.93) с исполь- зованием методов стандартных коэффициентов или модального управления [29]. Однако определенной “платой” за отмеченные преимущества оптимизации по критерию (2.134) явля- ется указанное выше некоторое усложнение закона управления иг (2.137) по сравнению с Законом щ (2.116) для случая оптимизации системы по критерию /1 (2.115). В целом, оба йпйиа управления и\ (2.116) и иг (2.137) обеспечивают первое, основное свойство синтези- pyeitfoii нелинейной системы—асимптотическую устойчивость в целом. Таким образом, при- ведеинем уравнений объекта (2.114) к виду (2.82) можно добиться упрощения процедуры ййКЗа нелинейных систем управления. 125
Рассмотренные выше примеры синтеза различных систем показывают новые возможйоа разработанного метода АКАР, который позволяет гибко подойти к процедурам определи! структуры и параметров нелинейных законов управления. При этом выбор параметров^» занных законов осуществляется путем назначения соответствующих весовых коэффициент оптимизирующих функционалов, исходя, например, из условий оптимизации линеаризав» ной системы по некоторому квадратичному критерию качества или с использованием мац* стандартных коэффициентов и модального управления, а различные формы законов упрй» ния находятся в результате аналитических процедур с учетом условий асимптотической чивости движения. ;а... 2.4. ПРИМЕРЫ АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ АГРЕГИРОВАННЫХ РЕГУЛЯТОРОВ ВЫСОКОГО ПОРЯДКА НА ОСНОВЕ НЕЛИНЕЙНОЙ МАКРОПЕРЕМЕННОЙ В предыдущем п.2.3 рассмотрен метод АКАР для нелинейных объектов третьего и высвйм порядков, когда в качестве агрегированной переменной выбиралась простейшая форма обоб- « . с? щенной функции р = 2 Р&ь в виде некоторой линейной комбинации фазовых коордим состояния. Разумеется, что в общем случае агрегированная переменная ip может представляв собой некоторую совокупность нелинейных функций от всех или только части координатора позволяет часто существенно расширить области применения рассматриваемого метода Ли- тического конструирования и весьма эффективно решить задачу синтеза нелинейных сшйец наделяя их желаемыми динамическими свойствами. Ранее уже отмечалось, что многообразие ip(x\,..., х„) = 0 может интерпретироваться^ целевое множество, куда неизбежно попадает изображающая точка из произвольной обжв пространства состояний в результате действия синтезируемых законов управления. Тощ задача синтеза может быть сформулирована следующим образом: для системы дифференци- альных уравнений (2.1), описывающих движение управляемого объекта, пострб^ть замываю- щее управление И = p(Xj ,..., хв) = 0 , (ЭД являющееся уравнением регулятора, чтобы полученная в результате синтеза замкнутая сей- ма имела заданное в пространстве состояний многообразие ° i P(*i...*п) = 0. (ЭД Многообразие (2.140) представляет собой некоторую программу движения системных можс । отражать некоторый желаемый режим движения. Движение изображающей точкиЖ исходш по программе (2.140), если заданное многообразие ip = 0 является инварианта (интегральным) для дифференциальных уравнений (2.1). Уравнение 1р = 0 в фазовом про- странстве координат xi,..., хп образует многообразие размерности п-1. Управляя и{х\,..., хп) (2.139) обеспечивает движение по заданной программер = 0 и на этих движения критерии качества вида / = / (mV + с2р2) dt o' ' достигают наименьшего значения. При этом уравнения экстремалей Гр (0 + ip = 0 будут являться необходимыми условиями осуществимости заданной программы движда р = 0 синтезируемой системы. Эти уравнения определяют всю совокупность дифференту ных уравнений замкнутой системы, имеющих заданное многообразие ip = 0. Такая постанова задачи и определяет уравнение ip — 0 как некоторое целевое множество в пространстве соде- яний. Выбор той или иной формы агрегированной макропеременной, по существу, уставая» вает требования к динамическим и установившимся режимам синтезируемых систем. В част- 126
яоета, предположйм, что в пространстве состояний замкнутой системы желательно соблюдение которого соотношения между координатами, например, вида Хп + F(xi ,..., хи-1) = 0 . Товд, обозначив и = (2.145) = Хп + F(Xi ,..., Хд—i), ! найдем, в соответствии с изложенным ранее методом, управление u(xiх„), которое и обеспечит указанное желаемое соотношение между координатами системы. Эти соотношения жнут отражать требования к заданному стационарному режиму движения, ограничения на Юррданаты, представленные в виде некоторых функций, и многие другие условия. Рассмотрим примеры аналитического конструирования систем с использованием нелиней- юй-агрегированной макропеременной для объектов третьего порядка. рДример 2.8. Вернемся снова к задаче синтеза стабилизирующего управления объектом (2.114) теперь уже на основе нелинейной агрегированной макропеременной, например, вида = fiixi + Р2Х2 + 0зхз + asinxi. (2.141) Используя функцию (2.141), запишем закон управления tel а \ . ^1 Дг . « \ 1 \ (2.142) 5зТ Xl + |/*з + 0зТ) SUlX1 (Дз + 03? + 0з COSX|Х2 (ft + Т J Хз * Интересно отметить, что закон (2.142) совпадает по структуре с законом управления (2.137), полученным путем приведения объекта (2.114) к каноническому виду (2.132). Положим a•fit, тогда уравнения, описывающие движение вдоль многообразия = 0, будут иметь вид . ‘ГА- • ЛА — £1 (2.143) xiy(f) Xty , Xtyff) 0^X1^ 03 Условия устойчивости системы (2.143), а следовательно, и условия асимптотической устойчи- вой в целом синтезированной нелинейной системы весьма просты: ,Тс &>0, (=1,2,3. (2.144) Неравенства (2.144) всегда могут быть выполнены. Таким образом, использование нелинейной агрегированной макропеременной позволило эффективно решить поставленную задачу син- теза стабилизирующего закона управления. ЦЦример 2.9. Рассмотрим задачу синтеза регулятора одноосного силового гиростабилиза- тора (гирорамы). Такие устройства применяются в авиации и ракетной технике и являются сангиной частью двух- и трехосных гироскопических стабилизаторов [97, 98]. Уравнения движения гиростабилизаторов имеют вид [98] ~ х2 , Г 7*2 (0 = Р22 Х2 + Р23 Х3 COSX1 + Я2 *2 SinXiCOSXj Хз (0 = Р32 Х2 COSXi + Рзз Хз + R-3 Х1Х3 SinXiCOSX] + Ьзи , 1ДСЛ1 (0 = 0 (0; х2 (0 = 02 (0; хз (0 = а (0; а, /3—эйлеровы углы. '^Йз этих уравнений получим уравнения первого приближения • L Х1(0 = х2; Х2 (0 = Р12Х1 + Р23Х3 ; Хз (t) = 032X2 + РззХз + Ьзи, (2.146) описывающие движение гиростабилизатора в режиме малых отклонений. Синтезированный в работе [98] регулятор обеспечивает оптимизацию по квадратичному критерию качества и устойчивость движения гиростабилизатора в некоторой области малых отклонений, для кото- рой можно использовать линейную математическую модель (2.146). Однако при больших отклонениях, возникающих в результате действия значительных возмущений, линейный ре- тулятор не только не будет оптимальным, но он также может не обеспечить асимптотическую Устойчивость движения в желаемой области притяжения. В настоящее время в связи с ростом требований к динамическим свойствам силовых гиростабилизаторов в разных режимах их работы возникает необходимость дальнейшего усовершенствования методов синтеза опти- мальных регуляторов этих систем [97,98]. этой связи синтезируем регулятор zz(xi, х2, хз) с использованием исходной нелинейной модели (2.145), при этом должна гарантироваться асимптотическая устойчивость движения 127
гиростабилизатора в достаточно большой области фазового пространства. Введем в рассый^ рение усеченную нелинейную агрегированную переменную Ж V» = 0ixicosxi + 0зхз, (214$ отличающуюся тем, что в ней отсутствует координата хг. Синтезируем закон управляй# объектом (2 145): b-ьи = - xi c&sxi - Р32Х2 ~ (cosxi - xisinxi)x2 - (рзз + у) *з - - Яз xj хз sinxicosxi. (214® Закон (2 148) обеспечивает асимптотическое притяжение изображающей точки из произвол ной области пространства состояний к многообразию * = 0ixicosxi + 0зхз = 0, (2.149) представляющему собой некоторую кривую на фазовой плоскости xi, хз Подставив из (2119) координату 01 Хз = - ^ X1COSX1 во второе уравнение системы (2.145), получим дифференциальные уравнения хц, (0 = х-ц,; • /л 01Р23 2 Яд0? 2*2 ® Xty (0 = P22X2V - Xxv COS2X1V + -jg- xfy Sinxiy COSX1/ , w где P22 < 0 , Ргз < 0. Уравнения (2.150) описывают движение вдоль многообразия у» Ml (2.149). Выберем параметр Ф- из условий асимптотической устойчивости системы (2150). Рз Согласно [5], для обеспечения асимптотической устойчивости системы (2 150) необходимо удовлетворить следующим условиям* 01Р23 Дз01 . 2 п -------XiSlflXiCOSXi COS Х1 > О РЗ 2 «(*i) = и О <21е ф к (2152) Ф 2 Я^01 2 . j д— XjCOS xi —xisinxicosxi ах\ * » 03 J при I xi I -* оо С учетом того, что, согласно [97], коэффициент ргз < 0» условие (2 Ш) выполняется при * а <0 . 81дяз1 ь = 012 (21^) Р* 0 ’ 1031 31(1 + 8*)Я2 ’ к 0’1,2’' ’ После интегрирования условие (2.152) принимает вид ^41031 + 8l)Cl (cos2xi “ !) + 320^ (cos4xi - 1) х? + 01 (, . RtBx \ . ‘ ЩГГ [1Ргз1 2 Ij831 j x,sin2x,+ + leifer р₽23' - ffi)(cos2x' -1} - ^iXiSin4xi - (cos4xi - " * и выполняется при 0з < 0, Это условие является частным случаем условй (2.153) и удовлетворяется Всегда, если в (2.153) положить к = 1,2,...,. Следовательно, усл<^ (2.153) является достаточным условием асимптотической устойчивости системы (2 150Ц1{ поэтому И замкнутой системы (2 145), (2.148). При этом допустимая область изменена координаты *1 определяется неравенством I xi доп I < ~т "1" 2Аэг, к = 1,2,.... Выбрав соответствующее число к, можно определить требуемый параметр (2.153), а также >рз1 4 выделить область притяжения системы (2 150). х 128
(2 154) цпгВернемся вновь к условию (2 151) В него в качестве сомножителя входит функция Дф) = cos2xi и поэтому для выполнения неравенства (2 151) необходимо потребовать, чтобы ( F(xt) = cos2xi > О Эи»неравенство нарушается в точках, где *Л’ Х1=у + 2Ъг, к = 0,1,2, ^ч{для первой точки (к = 0) допустимая область изменения координаты xi определяется неравенством IXi font <%. ^остановиться на данной точке, то при этом будет обеспечена весьма значительная область притяжения системы (2 150), вполне достаточная для большинства практических случаев Межмо, однако, показать, что для синтезированной системы обеспечивается асимптотическая устойчивость в целом относительно переменных хг и хз, в том числе и в точках (2 154) Выиолненный в работе [56] теоретический анализ синтезированной системы (2 145), (2 148) ^кипении ее асимптотической устойчивости, времени и характера затухания переходных процессов подтверждается результатами моделирования на ЭВМ Исследование задачи анали- шфского конструирования нелинейного регулятора гиростабилизатора показало, что приме- нение разработанного метода АКАР с использованием нелинейной агрегированной макропе- ремвнной позволяет не только обеспечить достаточно близкие к желаемым переходные про- цессы в режиме малых отклонений, но и гарантировать асимптотическую устойчивость движения в целом по координатам хг, хз и в весьма большой области—по координате xj Это ^возможность существенно улучшить динамические свойства гиростабилизаторов в усло- виях действия значительных возмущений жПрим^р 2.10. Рассмотрим задачу аналитического конструирования системы управления движение^ центра масс подвижного объекта, поведение которого описывается системой диф- ф^ейциальных уравнений [15 С 162] mAA(0 = ai<5+ М3, Td(O + d = q/z, (2 155) цеЛА—координата центра масс, д—отклонение управляющего органа, /п, bi, сь Т—посто- ЯНЙые коэффициенты Запишем уравнения (2 155) в форме J (0 = Х2 , Х2 (0 = ЛХз + Ьх$ , х3 (t) = ~ <охз + си , (2 156) адех] = Д А, хг = АЛ (/), хз = д, а = —, b = —, со = 4;, с = Требуется найти закон управле- AW fit 1 1 ния и(х1,Х2,хз), обеспечивающий перевод объекта (2 156) из произвольной точки пространства состояний в точку равновесия х*(0,0,0), при этом должны обеспечиваться определенные тре- бования к динамическим свойствам системы, выражаемые в форме минимизации некоторого квадратичного критерия качества В работе [15] решается поставленная здесь задача синтеза (Помощью алгоритма с прогнозирующей моделью, при этом критерием качества является следующий полуопределенныи функционал ! W t+x 3 ле t+r Jx = 0,5 f % fid (S) J > > t i=x k t А—заданные коэффициенты, t, t + т—скользящий интервал оптимизации. Свойство «^определенности функционала (2 157) связано с заранее неизвестным членом и^, который определяется в результате процедуры синтеза управления uopt в соответствии с методом опти- мизации систем с использованием функционалов обобщенной работы [14, 15] *1 Полученный в [15] методом прогнозирующей модели закон управления uopt(x\, хг, хз) представляет собой весьма громоздкое выражение В случае допущения, что г « Т, т.е предпо- Шеяия малой инерционности исполнительного органа, можно положить ехр( - ^) = 0 и (2 157) 129
пренебречь членами, в которые входят Т2, Т3 при их суммировании с т. Тогда с уШя указанного упрощающего предположения оптимальный закон управления будет иметь ви£ Uopt — — Л2с|[ Q,5Pii*Txi+ Тт ^-^-+ 302j хг+ Т2* ^j0it2+ /foj ( а+ j хз) ] X х (а + Ы) + О,5037х3 } . . (2.158). В работе [173] поставленная выше задача синтеза закона оптимального управления ряа* ется не путем поиска весовых коэффициентов 0/ критерия обобщенной работы в резулый итерационной процедуры [14], а путем формирования желаемой экстремали. Тогда ,йй» управления и весовые коэффициенты критерия находятся из условий воспроизведения задан- ной экстремали. При этом считается, что исходные уравнения объекта должны быть приводимы к канонической форме. (2.82). В рассматриваемом случае эти уравнения имеют следукйй вид: Ж'- У1 (0 = У2, Уг (0 = Уз , Уз (0 « «о, (2.М где yi = xi, уг = Х2 = Х1 (Г)» Уз = *2 (О = ахз + 5х3, «о = (а + З5х3)(- шх3 + + си). Тогда оптимальный по критерию ш (2Й 0Л=1 к о при условии “ /3 \2 к J 2 dt = const 0 \w- ',Т закон управления имеет следующую форму [173]: Ио = — Л2(А13У1 + АгзУг + А33у3) . (2.НЙ) Коэффициенты закона (2.161) определяются через параметры желаемого уравнения эй* тремали замкнутой системы йэ (0 + узуь (0 + У2У1Э (0 + (0 = 0- (2*W Коэффициенты А,* и параметры у/ уравнения (2.162) связаны между собой следующие соотношениями: «г- VAi3 = yi, Л2Аг3 = Уг , &2А33 = у3 , (2.1$) тогда весовые коэффициенты q^ критерия (2.160) могут быть определены в соответствие выражениями q\ = Л2А23 ; qt = к2А%з - 2Ап; <?3 = £2А33 — 24^ , гдеАп = Л2А1зА33. После перехода к исходным координатам объекта (2.156) закон управлеим с учетом (2.161) принимает вид 1 г z , 2ч 1 (о (2.165) «2 =----т ViXi + Y2X2 + Уз( а + bxl) х3 + - х3. I с (и + Зохз) L J с Полученный в [173] закон управления (2.165) обеспечивает в замкнутой системе (2.156) (2.165) переходные процессы, определяемые желаемым уравнением экстремали (2.162) отно- сительно выходной координаты xi = уг, при этом обеспечивается оптимизация системы » критерию обобщенной работы (2.160), весовые коэффициенты qt которого определяются чер« параметры у/уравнения (2.162) с помощью соотношений (2.163), (2.164). Замкнутой системе (2.156), (2.165) соответствует функция Ляпунова V = Ацх? + 2А12Х1Х2 + 2А13( а + bx^) xix3 + A22XI + < + 2Аг3( а + 6x3) *2*з + А33( а + 5x3) 2 хЗ , (2.Ш) с помощью которой может быть показана асимптотическая устойчивость движения синтезиро- ванной системы управления. Иначе говоря, в работе [173] по существу решена задача модального управления объект (2.156) с заданным дифференциальным уравнением (2.162) замкнутой системы, коэффишда- 130
од, которого могут быть определены через спектр Ль Лг, Лз с помощью известных формул Виета. Оптимизация же системы по критерию (2.160) носит вспомогательный характер и может Йгь осуществлена в указанном здесь смысле в случае приведения дифференциальных урав- няй объекта к канонической форме. Другими словами, в [173] осуществлена процедура регуляризации выбора весовых коэффициентов критерия обобщенной работы путем постули- рования, а не поиска уравнения желаемой экстремали движения замкнутой системы. В самой '^процедуре метода аналитического конструирования системы управления по критерию обобщенной работы, как известно [14, 15], поиск весовых коэффициентов является итераци- Шйм,т.к . после первого выбора этих коэффициентов, как правило, возникает необходимость 1п0следующей корректировке значений весовых коэффициентов указанного критерия. Изве- сЙЙв, что сам критерий обобщенной работы по отношению к желаемым динамическим свойст- вам синтезируемых систем носит косвенный характер, т.е. этот критерий является сопровож- $йицим и представляет собой некоторое инструментальное средство, помогающее формали- ‘ШйТь процедуру синтеза закона управления. К88Рйссмотрим решение поставленной задачи синтеза закона управления объектом (2.156) методом АКАР. Это тем более целесообразно потому, что метод АКАР, помимо непосредст- в&Ьюго использования притягивающих инвариантных многообразий, базируется также на идее применения сопровождающих оптимизирующих функционалов [56], если, разумеется, ^Ьр&улировать задачу синтеза регулятора в терминах теории оптимального управления. При- И№м сначала метод АКАР для объекта (2.156), представленного дифференциальными урав- (йдеями в канонической форме (2.159). П Выберем следующую линейную макропеременную: (Ш. ^1 = Р\У\ + Р2У2 + Уз • ^ида, подставляя (2.167) в функциональное уравнение T\tyi (0 + = 0 » g^py уравнений объекта (2.158) получаем закон управления it z/°*' = ~т\ ~ + ) Уз _ (Р2 + yj-) Уз • ($&р<ходя к исходным координатам, имеем <qTdr< При выполнении условий У1=77’ ?2=Р1+^, Уз=р2 + ^- управления uq4, (2.169) точно совпадает с «о (2.161), а закон из (2.170), соответственно, с йг (2.165). Рассмотрим свойства синтезированной системы с позиций метода АКАР. Закон (умрдаления и^, (2.169) переводит изображающую точку объекта из произвольного начального нйжюяния в окрестность многообразия V’i = Р1У1 + Р2У2 + Уз = 0 , (2.172) (|0доние вдоль которого описывается следующей системой дифференциальных уравнений: У1у1 (г) = У2ч>1 , У2у1 (0 = -р1У1^1 -Р2У2Ч>1 • (2.173) Условия асимптотической устойчивости в целом уравнений (2.173) имеют весьма простой вид: Я > 0,^2 > 0. Тогда с учетом (2.171) условия асимптотической устойчивости в целом синте- (Цроранной замкнутой системы (2.156), (2.170) будут иметь форму следующих простых неравенств: (2.167) (2.168) (2.169) и3 = - L ~р\_ с(а+ ЗЬхз) Тх (2.170) (2.171) Pi = У1Л > 0; рг = Т1(у2 - пТО > 0; Т, = > 0 . (2Л74) ЩйЫнение условий (2.174) проще по сравнению с использованием функции Ляпунова ШЙ)- Закон управления (2.169) является оптимальным по критерию качества 1 131
/з = J + cfV'i (01 dt, о L J который с учетом выражения (2.167) и уравнений объекта (2.159) принимает вид (2Л75) (2.Й4) пг При выполнении условий (2.171) критерий (2.176) эквивалентен критерию (2.160) в отноше- нии качества переходных процессов в синтезированной замкнутой системе. у. Таким образом, показано, что на основе метода АКАР можно в результате пропев аналитических процедур синтезировать законы управления и^, (2.169) и из (2.170), обеспечь- вающие оптимальность замкнутой системы по критерию (2.175), эквивалентному критефи обобщенной работы. м Перейдем далее к рассмотрению возможностей синтеза других законов управления оде- том (2.156) с использованием метода АКАР. Структура этих законов зависит от форм выбираемого инвариантного многообразия и вида функционального уравнения. В этой сия введем в рассмотрение следующую макропеременную: V>2 = *з + <p(xi , х2) (2,Ш и функциональное уравнение T2V2 (0 + Л^2) = о , (2$1 где > 0. -ж Синтезируем на основе выражений (2.177), (2.178) и исходных уравнений объекта (2’154) различные законы управления w4(xi , х2 , хз), оптимальные по критерию /4=/ fmiAvb) + с$2 (01 dt. (2’!< 0 >- J В соответствии с методом АКАР синтезируемые законы управления u4(xi , х2 , %з) обеспе- чивают перевод изображающей точки объекта в окрестность многообразия ^2 = 0 (2.177), движение вдоль которого описывается согласно (2.156) следующей системой дифференциаль- ных уравнений: Xlv-2 (Г) = X2v,2 i Х2ч>2 (t) = ~ Яр(Х1у2 , Х2ч>2) ~ , Х2у,2) • Соответствующим синтезом промежуточного управления <p(xi , х2) можно обеспечитьтре- буемые динамические свойства при движении вдоль многообразия ^>2 = 0 (2.177). Подставив ф1 (2.178), в силу уравнений объекта (2.156) найдем выражение д<р д<р . . 2Ч 1 ™, ч , (2.181) CU4 Х2 -j (О 4* Ьхз^Хз гр F{tp2) + (ОХ3 •, охватывающее определенную совокупность допустимых законов управления. Выберем снача- ла простую линейную функцию v < <p(xi , x2) = 0iXi + 02x2 . (2481) Тогда, подставив выражение (2.182) в (2.181), с учетом <2Л1Ъ получим следующий зжи управления при Ftyi) = ’• С1Ц = — Х\ - (01 + ^г) х2 - (02« + /М*з + у— о>) хз , а уравнения (2.180) будут иметь вид Х1у>2 (0 ” Х2ц>2 » ' хг?! (0 = - £10*1^2 - - 6(0ixiv,2 + £2X2^2)3 • (2^’ Условия асимптотической устойчивости в целом для уравнений (2.184) и, следователь», для замкнутой системы (2.156), (2.183) принимает форму простых неравенств: * , > 0 ; 02 > 0 ; Т2 > 0 . (2,185) Закон управления н4 (2.183) при выполнении неравенств (2.185) обеспечивает асимптотичесп устойчивое движение изображающей точки вдоль многообразия ^2 = 0 (2.177), он прй законов из (2.170), и2 (2.165) и тем более закона uopt (2.158). Это объясняется тем, чтозд» 132
пользовались не канонические уравнения (2 159), когда синтез законов иг (2 165) и из Д170) основывался на “компенсационном” принципе, а исходные уравнения объекта (2 156), (К^гда синтез закона и4 (2 183) основывался на выборе соответствующего промежуточного правления <р(хх , хг) (2 182) для обеспечения желаемых свойств движения вдоль многообра- зий = 0 (2 177), определяемого дифференциальными уравнениями (2 184) Параметры /31, Д(Л Тг закона и4 (2.183) должны удовлетворять условиям (2 185) и могут быть, в частности, йфеделены исходя из желаемых динамических свойств замкнутой системы в режиме малых жлонений от заданного состояния si’.- Для повышения быстродействия при движении изображающей точки вдоль многообразия = 0 (2 177) можно ввести нелинейную функцию g <p(Xi , Х2) = filXi + 02X2 + 03X3 (2 186) “Г^да с учетом (2 186) закон (2 181) при F(^2) = Уг принимает вид si си4 = — 0\Хг — (/32 + 20з$) (а + Ьх}) хз — ^2 + <охз 187) выбирая другие функции <р(х\ , х2) и F(^2), можно аналогично (2 183), (2 187) получить (2 188) соответствующие законы управления а и/ Предположим далее, что расход рабочего тела на управление ограничен, т е на скорость вменения центра масс наложено некоторое ограничение I х21 < Тогда для его учета можно кпЬльзовать следующую макропеременную = 0гХ2 + Л th (хз+jSiXi) Поставляя ^з (2 188) в функциональное уравнение тэд, тзУз (0 + ^з = 0, В;®ду уравнений объекта (2 156) получаем закон управления си4 = (охз - 0\Хг - ch2 (хз + 0\Xi ) (0гахз + 0гЪхз + jr ^з) закон обеспечивает ограничение I х21 < Л и переводит изображающую точку из произ- миьного начального состояния объекта по координатам xi и хз в окрестность многообразия 0 (2 188), движение вдоль которого описывается системой дифференциальных уравнений (0 = х2?з , 3 (0 = - 0iXiV2- a Arttfj Х2ч>з~ b {0\хх^+ Arth^- x2v,3) (2 189) (2 190) Условия устойчивости уравнений (2 190) сводятся к неравенствам 0\ > 0, 02 > 0, которые Определяют для синтезированной системы (2 156), (2 189) асимптотическую устойчивость двйкения по координате х2 в области I х21 < 4£2, а по координатам xsubl, хз—в целом ^Изложенные выше разные подходы к задаче синтеза системы управления движением цевгра масс подвижного объекта (2 156) и их сравнение между собой показывают преимуще- ств метода АКАР, позволяющего в результате простых аналитических процедур получить как известные решения указанной задачи синтеза, так и найти новую совокупность законов управления, обеспечивающих дополнительные требования к динамическим свойствам замк- йутой системы 51!^ 2.5. АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ АГРЕГИРОВАННЫХ РЕГУЛЯТОРОВ И ОБРАТНЫЕ ЗАДАЧИ ДИНАМИКИ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ В последнее время во многих работах [103,104 и др ] развивается так называемая концеп- дообратных задач (КОЗ) динамики, основанная на задании желаемых траекторий движения филируемых систем При. этом было показано [104], что структурные свойства законов удаления, синтезированных для линейных объектов, оказываются идентичными структур- U 1 133
ным свойствам законов, полученных стандартными методами аналитического конструирова- ния оптимальных регуляторов (АКОР) Практически это означает, что оба метода в линейном случае могут привести к одному и тому же результату В работе [116] на основе КОЗ рассматриваются задачи построения алгоритмов управления движением нелинейных объекта второго порядка При этом процедура синтеза осуществляется в два этапа сначала определя- ется ускорение, при котором реализуется назначенная траектория, а затем находится управ- ление, с помощью которого создается требуемое ускорение при движении в начало коорди^, В литературе пока отсутствуют примеры применения КОЗ для синтеза систем управлеим нелинейными объектами более высокого порядка В настоящее время в должной мере еще не разработаны методические основы применения КОЗ для нелинейных объектов Необходимо подчеркнуть, что успех метода КОЗ в задачах синтеза полностью зависит от решения проблемы приводимости исходной системы дифференциальных уравнений объекте форме Коши к форме “вход-выход” или к некоторой канонической форме [183, 233] По существу, как решение задачи синтеза законов управления, так и ответ на вопрос об управля- емости нелинейного объекта и выявления других его важных свойств определяется возможно^ стью приведения исходных уравнений к форме “вход-выход” При этом между координатам! xi , , хп исходной системы дифференциальных уравнений объекта и координатами yi, , уя> форме “вход-выход” должно быть взаимно однозначное соответствие Это свойство определя- ется невырожденностью матрицы управляемости объекта Для случаев, когда указанные здесь условия приводимости систем выполняются, сама процедура синтеза законов управлеим сводится к элементарному “компенсационному” принципу, когда синтезируемый закон состо- ит из двух составляющих первая составляющая полностью компенсирует (вычитает) нели- нейности, а вторая, в частности линейная составляющая закона управления, обеспечивает желаемое качество переходных процессов в замкнутой системе Следует, однако, указать, что требование полной приводимости исходной системы дифференциальных уравнений объектах форме “вход-выход” по всем координатам с целью последующего применения компенсациои- ного принципа для синтеза законов управления во многих прикладных задачах являетсх чрезмерным и ведет к существенному усложнению синтезируемого закона и возникновению проблемы взаимной однозначности исходной и приведенной систем [183] Это было показав на примерах решения задач синтеза для объектов (2 114) и (2 156) Метод АКАР, в отличие от КОЗ, позволяет гибко подойти к процедуре синтеза закона управления, осуществляя липа частичную приводимость по некоторой группе координат исходной системы дифференциаль- ных уравнений ; Покажем, что на основе развитого выше метода АКАР можно получить аналогичные КОЗ результаты [105], но для нелинейных объектов вида (2 84), имеющих треугольную форму функциональной матрицы, т.е описываемых следующей системой нелинейных дифференци альных уравнений *1 (0 = Л(Х1 , хг), хг (0 = /г(х1 , х2 , х3) ,.. , х„ (() = /«(xi , , хп) + и , (2 Ц1) где fi—непрерывные дифференцируемые функции, ограничены по модулю; ДО , , 0) = 0, и—скалярное управление Требуется синтезировать управление u(xi , , х,), гарантирующее асимптотическую устойчивость системы (2 191) и обеспечивающее желаемый характер и время затухания переходных процессов Построим систему функций У/ Ffa , х2, , хя) , i 1,2, ,л , (2 192) удовлетворяющую следующим требованиям а) система (2 192) должна быть функционально независимой, т е aF(xi, , хя) 5(Х1 , , хя) (2 193) *0, где F = (Л , , F„); б) вектор У(у) , , уп) должен являться решением системы дифференциальных уравнении У(0 = АУ, (2194) 134
0 10.0 0 0 1.0 0 0 0.1 «1 аг a3 . an $1б8адно, что система (2.194) является асимптотически устойчивой, т е ори t -» « yt (/) -* о (Ццду условия взаимооднозначности (2 193) преобразования F имеем при /-»оо , хп) -* 0, что и означает асимптотическую устойчивость системы (2 191) Получим аккму уравнений относительно Л, учитывая, что в левой части выражения (2 194) стоит ползая производная У (/) Имеем Ф = Ф/* = AFm, ‘ал ал dxi дхп • • • • • dFn dFn dxi ’ dxn Тода основное функциональное соотношение для нахождения F, определится как A~l<Pf = F, цеЛ — матрица, обратная к Л, имеет структуру Г У) У2 Ул-1 Ул' 10 0 0 о 1 о о (2 195) 0 0 10 В (ввернутой форме выражение (2 195) можно записать в виде м-1 2 /=1 к 2 /=1 п-1 2 /=1 dF, II dFkf' dxj dFn-i , dxt 1 (2 196) fv dFi z y'a7 V=u oxi Потребуем, чтобы F\ = Fi(xi) Разрешим систему (2 196) относительно Ft,.., Fn Математи- структура системы (2 196) позволяет рекуррентно определить эти функции из второго уравнения находим Ft, из третьего—F3 и тд Подставляя найденные выражения для Fj (i=2, ,п) в первое уравнение системы (2 196), получим искомый закон управления dFn _ „ "v ($ uFi\. dFn. (2 197) YndxnU F'Xi [2 Kfix^ Yndxnfn ^^3 выражения (2 197) показывает, что рассматриваемый класс систем управления вида должен быть ограничен еще одним дополнительным условием # 0 Из структуры t’or.4' °Хп окгемы (2 196) видно, что это неравенство эквивалентно требованию 135
dFn__ d f dFn-i \ _ dFn-i dfn-i _ _ df\ dfn-2 dfn-\ (2.19Ц дхп~ дхп I dxn-i1 I dxn-idxn-i dx2'"dxn-i dxn Изложенная выше процедура, по существу, сводится к представлению исходного нелий ного объекта (2.191) в канонической форме (2.194) относительно новых переменных j (2.192). Затем можно осуществить процедуры АКАР относительно у,- и, используя преобра» вание (2.192), построить закон управления и(х\,..., хп) относительно исходных фазовых од динат xt системы. К аналогичным результатам приводит и процедура, изложенная в ir.23i охватываемая формулами (2.82)—(2.96). Здесь эта процедура представлена в более обща виде. Разумеется, что при этом справедливы все изложенные в п.2.3 выводы. В частности, пр yi = Fi = xi канонические уравнения (2.194) можно записать в форме jTr (0 + fln-ixi” (t) + ... + aoxi = 0 , -дат коэффициенты а, которой можно найти по методу стандартных коэффициентов или исходен условий минимизации квадратичного критерия качества (2.90) в методе АКАР по формула) (2.93), (2.94), а также с использованием метода АКОР относительно переменных у, [ 12]. Итак, показано, что структуры законов управления нелинейными объектами вида (2.191), Полуни- ных методом АКАР и на основе КОЗ, идентичны. Это позволяет расширить и углуби» математическую сущность и физическую интерпретацию указанных методов синтеза нелини- ных систем управления. Пример 2.11. Пусть уравнения возмущенного движения нелинейного объекта имеют ц (2.114). Зададим матрицу системы (2.194) как ГО 1 О' А= 0 0 1 -6-11 -6 Тогда [Я _i _1 6 1 6 А-1 = 10 0 0 1 0 а система (2.196) примет вид с — Л д/ч / (^£1 t _l _ X (, dF3 f , dF3 1 6 d*i 1 [dxi 1 dX2^2J 6 ^dxi 1 дх2^2 дхз p d-Fi f • p f u- d^2 f F2=d^f>’ F3-~d^f' + ~Sr2h (2.199) Из соотношений (2.199), задаваясь Fi= y\ = xi, имеем F2 = Уг = хг ; F3 = уз = sinxi + хз . Подставляя эти функции в первое уравнение системы, получим и = - 6xi ~ (П + cosxi)x2 - 6(sinxi + хз) . (2.200) Разумеется, что структура закона управления (2.200) совпадает со структурой закона (2.137), полученного выше в п.2.3. Эти законы доставляют минимум критерию (2.134), по которому является оптимальной синтезированная система. 2.6. АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ АГРЕГИРОВАННЫХ РЕГУЛЯТОРОВ, ОПТИМАЛЬНЫХ ОТНОСИТЕЛЬНО МАКРОПЕРЕМЕННОЙ И УПРАВЛЕНИЯ В предыдущих разделах этой книги рассматривались методы решения задач аналитическо- го конструирования нелинейных систем, когда в подынтегральное выражение оптимизирую- щего функционала входили обобщенная функция и ее производная ((). Это позволило^ 136
осиове соответствующих функциональных уравнений развить достаточно эффективные про- цедуры аналитического синтеза законов управления. Рассмотрим теперь другой способ исполь- зования одного частного вида оптимизирующих функционалов. •Й Предположим, что объект управления может быть представлен следующим обобщенным щинейным дифференциальным уравнением: tfl. (t) + XVO ~ <fl?P)u» (2.201) ,..., xn)—некоторая функция координат xi ,..., x,t; и (t)—управляющее воздействие. 33 Требуется определить закон управления и -.u(ip), обеспечивающий оптимальное в смысле йийимума функционала * 1 (2.202) vs / = J [Fty) + «1 dt 0 ЙЫйкение объекта (2.201). Подставив и из (2.201) в (2.202) и используя процедуру метода ЦАР, найдем закон управления №.. « = - + Лй - . <2-203> (2<203) получен для устойчивого подсемейства экстремалей движения. В зависимости о^дида функций M>(xi ,..., х„), a(V0 и F(VO из выражения (2.203) можно найти различные частные формы законов управления. Рассмотрим сначала некоторые классы объектов, описы- ваемых обобщенным дифференциальным уравнением к (Г) + fap = и, • (2.204) Шлрио(у>) = 1 и flip) = fap. Уравнению (2.204) соответствует, например, следующее нели- нейное дифференциальное уравнение, записанное относительно исходных координат: .... а п п 2 (0 + Ё (t)x№~v> (t) + 2 (f)xtf> (() + ...+ l«l (,<7=1 /,в=1 к J ар^"’) (() + к 2 Л/«х^Н1) (0 х<9-,) (/) + ...= и. ff!3i 1=1 • М=1 Вр оптимизации системы (2.205) по критерию __ Г » п . J т22 щх{ _ 0 /=1 я . ? ° (0 + т22 aiqx(i ° (0 х(<? ° (0 + и2 dt (2.205) (2.206) Жон управления принимает вид 5H1 • и = - (Vm2+Az- к\ 2 а^-,)(0+2 а/«х(/-1)(0 + ••• • (2-207) Оптимальный по критерию (2.206) закон (2.207) позволяет получить ряд частных форм з^рнов управления. Так, для линейного объекта S afP (1)+к% (() = и °’2°8) оптимальный по критерию -ж.1 г.,е *<•••. О закон управления будет иметь вид 2 т2 2 (()] + и2 V=i ) dt (2.209) (2.210) .ад w = - ( VOT2 + к2 - к) 2 ° (0 • /-1 Интересно отметить, что к классу (2.208) приводятся распространенные на практике матема- тические модели объектов, состоящих из последовательно включенных п инерционных звень- ев# этом случае для определения коэффициентов а, следует положить, например, -^“>1= тогда остальные коэффициенты а* могут быть достаточно просто выражены через 137
другие постоянные времени Г* объекта.. Используя оптимальный по критерию (2.209) завов управления (2.210), можно перейти к физически измеримым координатам и построить теяю чески реализуемый регулятор. Ж ' Рассмотрим, далее, некоторые классы объектов, описываемых обобщенным дифференци- альным уравнением V» (Г) = и, (2.2Ц) т.е. при ~ ; a(V0 - !• Уравнению (2.211), в частности, соответствует нелинейное Д1ф ференциальное уравнение 2 (Г) + 2 (0 х(9-1) (Г) + aiqx^~l) (?) х(<?) (Г) + ... = и . /=1 /,</=1 Для объекта (2.212) оптимальный по критерию (2.206) закон управления принимает вид и = - т 2 а1Х(1~Х) (0 + 2 (0 х(в-1) (0 + ... . <2'^ i= 1 м= 1 (2.2112) Из закона управления (2.213) можно получить различные формы частных законов. Так; » случае линейного объекта (2.21® п U находим оптимальный по критерию 2 , ..2 закон управления т2|2 аре' 1 V=1 / dt и = - т ° (0 (2.216) о Можно показать, что уравнением (2.214) описывается распространенный класс нейтральных объектов, структурная схема которых состоит из (п -1) инерционных и одного интегрирующею звеньев. Известно, что такими структурными схемами может быть представлена неизменяем^ часть промышленных систем автоматического регулирования, состоящая из исполнительного механизма, описываемого интегрирующим звеном, и собственно объекта, описываемого мате* матической моделью из (/i-1) инерционных звеньев. Уравнением (2.214) описывается такде неизменяемая часть следящих систем, состоящая из (п-1) инерционных и интегрирующею звеньев. Это означает, что на основе закона управления (2.216) можно построить оптимальные по критерию (2.215) различные системы автоматического регулирования, следящие систему и т,д- Рассмотрим далее класс нелинейных объектов, описываемых нелинейным дифференциала ным уравнением п-2 anxw (0 + 2 (0 = и , /==0 которое также представляет собой частный случай уравнения (2.211). Оптимальный по крите- рию ш закон управления принимает вид Г л-2 .1 и = - т апх^п (?) + dx® • /«=о с Используя приведенные выше выражения, можно синтезировать оптимальное управленяе и для других классов нелинейных объектов. Отметим некоторые общие закономерности, присущие, нелинейным системам, оптимал^1 ным по критериям вида (2.202). Синтезированное оптимальное управление (2.203) обеспечи- 138
!^ает асимптотическую устойчивость в целом этих систем относительно многообразия ip = 0. ^шжение изображающей точки к многообразию ip - 0 описывается уравнением экстремали 3 V» (?) + VF(v,)c/(V>) + f(^)o(ip) = 0 . . (2.217) В зависимости от выбора подынтегральной функции F(ip), можно обеспечить различные свой- Йва уравнения (2.217) и, следовательно, динамические характеристики синтезируемых сис- тем. Законы управления (2.203), полученные с использованием простейших аналитйческих Процедур, несмотря на кажущийся частный характер, охватывают многие известные типовые законы, достаточно распространенные в теории и практике построения различных систем. В (Штности, оказывается, что к системам, оптимальным по критериям вида (2.202), относятся: дегемы подчиненного регулирования электроприводов [111, 112]; следящие системы, опти- мальные по критерию обобщенной работы [ИЗ]; оптимальные по квадратичным критериям .системы управления объектами с внутригрупповой симметрией [114], примерами которых жгут служить сложные энергосистемы и др. Указанный перечень разных классов систем Давления, охватываемых более общим классом систем (2.201), оптимальных по критериям ища (2.202), позволяет сделать вывод о практической полезности полученных выше законов давления. { " Перейдем к рассмотрению некоторых примеров, иллюстрирующих метод аналитического конструирования систем, оптимальных относительно агрегированных макропеременных и Правления. 0) Пример 2.12. Синтезируем оптимальную следящую систему, неизменяемая часть которой Щтоит из (л - 1) инерционных звеньев и интегратора, т.е. описывается системой дифферен- ЭДйльных уравнений Х1 (Г) = кпх2 - ai2X2 ; j * %i (0 ~ Qii+iXj+i "h йцХ/, i — 2,3,...,/i 1 , (2.218) хп (/) = а,шхп + kilt; мл — 1 1Д® di i+1 —~ тр • Г и-i+l 1 n-i+i Сначала синтезируем следящую систему, оптимальную по критерию вида (2.215). Выбе- ^агрегированную макропеременную л-i ^1 = П (ТкР + 1)п(/>) • *=1 Щ^ца критерий оптимальности (2.215) с учетом (2.219) принимает вид 00 , •» .. . f I . . «.V ZA. (2.219) (2.220) (2.222) ^Соответствии с (2.216) находим оптимальный по критерию (2.220) закон управления кщ = - mx \TiT2...Tnx^ (/) +...+ (Ti +...+ T„)xi(0 +xil > (2'221) который на основе уравнений объекта (2.218) может быть записан в форме > ц1 = -^/х,+ siif; * «=2 = Л]Л2—кп , Xj (/)—выходные координаты инерционных звеньев. Реализация закона (2.222) проще реализации закона управления (2.221), т.к. в выражение (2.221) входятфизи- измеримые промежуточные координаты объекта. Закон управления (2.222) обеспечи- мет перевод изображающей точки системы из произвольного начального состояния в окрест- ить многообразия ipi = 0 (2.219), движение вдоль которого описывается дифференциальным радением «-1 . п (Ткр + 1 ).Х| (р) = 0 , где р = -Г., /Ь=1 ат (2.223) 139
корни характеристического уравнения которого действительны, отрицательны и р&ва а* = - Это означает, что синтезированная система с законом управления (2.222) обладая 1 к свойством асимптотической устойчивости в целом. i В рассматриваемом случае можно также указать оценки качества и времени регулировки. Движение замкнутой системы будет описываться уравнением экстремали 1 V»! (О + mi^i = 0. (2.224) Из уравнения (2.224) можно получить решение V4 (0 = Тогда, как обычно, предполагая, что ^и“(О»О1 - О,О2)^Чо, находим, что время движений многообразию уч = О будет приближенно равно № . ~ (2» tP\ ~ (4 • 5)^ . zife Время же движения вдоль = 0 определяется решением дифференциального уравнСям (2.223), т.е. (2.227) -V1V-1 (0 = 5 Ctfi ,/Гк *=1 ш. Приближенную оценку времени затухания переходных процессов в синтезируемой CHCjew можно представить как сумму времени tp\ (2.226) и времени, определяемом решением ^j(t) (2.227). Из выражений (2.225) и (2.227) следует, что в системе протекают апериодичен» переходные процессы. Таким образом, на основе очевидных соображений установлены таив важные динамические характеристики синтезированной следящей системы п-го порядка, ив устойчивость, время регулирования и характер переходных процессов. Синтезируем теперь следящую систему (2.218) с использованием оптимизирующего функционала J 2 - I (f»2^2 + dV’i) dt. o' ' Выберем в этом критерии агрегированную переменную ^2 = 2 fikXk • *=1 (2.228) Тогда критерий Jt принимает вид J? — J //?2 О II + <‘2| 2 РкХк *=’ ) (2.2И) 2 dt. Оптимальный по критерию (2.229) закон управления рпкпТ _ т 'v & Г л. ( -л U2 — Xi Т V a Uij+\Xj+\ + I Ojj (2.230) 1 Xn '5Q; обеспечивает попадание изображающей точки из произвольного начального состояния в ок- рестность многообразия ^2 = 0 (2.228). Выбором в (2.230) соответствующих коэффициент pi можно добиться требуемых характеристик движения вдоль указанного многообразия^ частности, если положить = кп~ь+2 ... кп7h-j+i , № 2,3 ,..., и , то закон управления (2.230) примет форму / п иг —---------------5--- к2кз...кп-'к*Т\Т \ (2.231) / 'hi <2.23? Закон (2.232) точно совпадает с законом управления (2.222) при Т = — = kl m2 m\knT\ ‘ / (2.233) 140
иСинм образом, при выполнении условий (2.231) и (2.233) оптимизация следящей системы гХ&218) по критериям Ji (2.220) и /г (2.229) приводит к совпадающим законам управления. Это означает, что в этом случае критерии качества Ji (2.220) и /г (2.229) эквивалентны в отношении свойств оптимизируемой системы. (2.234) -,, В работе А. А. Красовского [113] приведен пример синтеза следящей системы (2.218), оптимальной по критерию обобщенной работы J3 = M f x2dt о {^.ограничивающем условии — М Q f и2 dt о • + дМ dt = const, (2.235) где Af—математическое ожидание; д—весовой коэффициент; у,-—коэффициенты обратных Сйзей. Оптимальный по критерию J3 (2.234). закон управления имеет вид / и3 = ~ ки xi + n t > 2 ^п—i+2 ••• 7+1 » (2.236) . дк2к3 ...кп ки~ k^Tl^.T2-,' (2-237) Овгимизация системы по критерию обобщенной работы J3 (2.234) означает, что при случай- (Ййгначальных условиях осуществляется минимизация интегральных оценок вторых моментов щррдинат [113]. Такая система оптимальна в отношении точности в установившемся режиме -1|фювиях действия на объект стационарных шумов. Кроме того, как показано в [ИЗ], синтезированная система устойчива при сколь угодно большом коэффициенте усиления ки (1237) и малочувствительна к изменениям начальных условий и параметров объекта. , Если в выражениях (2.222) и (2.232) положить соответственно _ (2.238) т* “ ^гтат2 т2 12^3 ... 1 п-1 _ <2.239) gklkl-.k^k3,' ^аконы управления г/1 (2.222) и иг (2.232) точно совпадут. Это означает, что при выполнении условий (2.238), (2.239) различные, на первый взгляд, критерии качества J\ (2.220), /2 (2.229) аи^(2.234), (2.235) в действительности являются эквивалентными в смысле динамических свойств синтезированной системы. Выполнение условий (2.238) и (2.239) не представляет ^двести, т.к. сводится к соответствующему выбору весовых коэффициентов mi, m2, сг и д в Плавных критериях качества. Отметим также, что оптимизация системы по критерию /3 (2.234) является частным случаем оптимизации по критерию (2.229), т.к. требует выполне- тйй'условия (2.231). В общем случае соответствующим выбором весовых коэффициентов 1фй1ерия (2.229) можно добиться различных свойств системы. Изложенный пример синтеза оптимальной по разным критериям качества следящей сис- ями еще раз свидетельствует о том, что квадратичные функционалы относятся к косвенным цйггериям, соответствующим выбором весовых коэффициентов и структуры которых можно до&ться точной или приближенной их эквивалентности в отношении динамических свойств ойтезируемых систем. и. Пример 2.13. Рассмотрим задачу оптимизации отдельных контуров систем подчиненного радирования электроприводов [115]. Сначала покажем, что выбор параметров настроек регуляторов отдельных контуров систем по стандартным показателям подчиненного регули- рования (технический оптимум) представляет собой частную задачу оптимизации по квадра- 141
тичным критериям вида (2.215). В общем случае структурная схема отдельного контурасйй подчиненного регулирования обычно включает в себя интегрирующий регулятор и об^я контура, передаточные функции которых соответственно имеют вид [111,112] ^,<p) = -^, hwp) = . П (Tv + О /ж* 44 Запишем уравнение движения разомкнутого контура в операторной форме, отнеся интегрвд* ющее звено к объекту регулирования - (ТЛ иэд ” МА т.е. рф&р) = и^р) или V*i (/) = щ (Г). Оптимизирующий функционал контура выберем в /1 = J (m/M + ) dt. С учетом выражений V'/Cp) - W^p) находим оптимальный по критерию (2.241) закон уп|»ь ления М Л/ИЭД • Тогда передаточная функция регулятора в замкнутом контуре будет определяться следую©» выражением: ® (24Й) mi Wpeii~ ktpwM' а С учетом (2.242) получим передаточную функцию замкнутого оптимизированного по кр№ рию (2.241) контура •'В $ т.е. в результате оптимизации контура осуществлена “компенсация” оператора исхода® объекта. На практике объекты регулирования обычно содержат как большие, так и мада постоянные времени [111, 112],т.е. ИЗД = И^0,ч(р)—----*----- П (ЬР + 1) 5=1 где ИШр)—часть передаточной функции объекта со звеньями, “компенсируемыми” дёйстй- г • ем оптимального регулятора, a WHK(p) - 1/fj (Т»Р + 1)—часть передаточной функции объ&я 4-1 ЙЙ* в виде эквивалентных инерционных звеньев, действие которых нецелесообразно или приеду пиально невозможно “компенсировать” действием регулятора. Величины т, и У т, обыШ 4“‘ 5 малы по сравнению с постоянными времени, входящими в Wm (р), и по сравнению с постав- ной времени То/ замкнутого оптимизированного контура. Тогда передаточная функция реуг лятора принимает вид ” А<р»«р) Л- г Обычно при Tqi = — 2 2 2 Ts без большой погрешности [111,112] можно принять т> 1 Г г П (*«р + О * р S ь+1 = <tp + 1, 142
тдео= итогда 5=1 1 (2 244) -W)i да, передаточная функция замкнутого оптимизированного контура с учетом “некомпенсцру- емых”, малых постоянных времени приведена к стандартному звену второго порядка В Зйисимости от выбора коэффициентов mi и А/, входящих в критерий оптимальности (2 241), можно получить различные свойства оптимизирующего контура В системах подчиненного Л/ р^улирования нередко выбирают Тщ = — = 2о и тогда передаточная функция регулятора Й43) принимает вид Жз ~ TOlp(ap + 1) + 1 ’ (2 245) ^/(Р) 2орЛч(р) Формула (2 245) широко используется в теории и практике систем подчиненного регулирова- Й£я [111,112] ЗУ Таким образом, в системах подчиненного регулирования каждый отдельный контур опти- мизируется по квадратичным критериям вида (2 241), т е задача выбора параметров настро- ек регуляторов контуров подчиненного регулирования сведена к более общей задаче оптими- заЦии по квадратичным критериям качества [115] '* Перейдем к синтезу систем подчиненного регулирования, когда оптимизация контуров в рЙйме малых отклонений производится по квадратичному критерию качества (2 241) Для иллюстрации развиваемых здесь принципов рассмотрим синтез системы регулирования часто- тывращения (скорости) Контур регулирования тока обычно оптимизируют [111,112] путем введения ПИ-регуляторов тока 1 (2 246) Ж" ^регт{Р) , ’йфйметры которого в соответствии с (2 245) будут равны к к ггу гг> гр лгр KrnnKm 1 т “ 1 э , 1 нт — 7?7~ Ъйляются параметрами настройки на “технический оптимум” [111,112] единичного контура регулирования При синтезе систем подчиненного регулирования частоты вращения обратную сИЗь по э д с двигателя обычно не учитывают, а тиристорный преобразователь считают звеном t Малыми “некомпенсируемыми” постоянными времени. Тогда передаточная функция замк- B^fijro контура тока будет иметь вид “ кт[2Т„р(Тнр-к 1) + 1] йёемотрим синтез однократно интегрируемых систем регулирования частоты вращения Обычно при построении этих систем в результате формального применения выражения (2 245) получают П-регулятор скорости [111,112] Ъ’ w _ Тмк„с„Ф - К. - 4т^Яа При этом замкнутая система регулирования скорости описывается передаточной функцией w (Dx____________________________________I_________ <2 247) у1[4ЗД2Тяр+ 1)+ 1] ’ ^.етШриближенно представляется в виде стандартного оператора (2.247) второго порядка Цыртжение (2 245) справедливо для интегрирующих регуляторов, устанавливаемых на входах обетов, состоящих из инерционных звеньев. Однако при синтезе регулятора частоты враще- н»г£2246) на основе (2.245) обратная связь по э.д с. не учитывается, что приводит к переда- точной функции объекта контура л 143
(2.348) R3 ктсеФТмр(2Т^р + 1) ’ содержащей интегрирующее звено Это ведет к тому, что регулятор частоты вращения, пож- ученный в результате формального применения выражения (2 245), уже не будет оптимальным по критерию (2 241) В этой связи применительно к объекту (2 248) возникает необходимой получения оптимального по критерию (2 241) закона регулирования , х2) = Ди(е - V2X2), (2 249) , , - „ где е (f) = хи - У1Х1 (t), yi = 1, у2 = ~фу—коэффициенты обратных связей соответственно по скорости и току, -------коэффициент усиления регулятора скорости Коэфф? циент ки можно выбрать в соответствии с выражением (2 248), тогда получаем о _ 4т2Тр _ . §,5кт " Л2 ’ 71 1 ’ 72 ки Передаточная функция замкнутой системы регулирования скорости будет иметь вид 7 2Т2Т,,р2 + (Т2 + V^T^p + 1 т2 При Т2 = * /г = О, /3 = 1 передаточные функции (2 247) и (2 250) совпадают Из (2 249) 1 следует, что при оптимальной системе регулятор частоты вращения имеет передаточную функцию вида С V J4 (2 250) U7 (п\ — М, — с(р) — рки T2Ra с введением дополнительной обратной связи (у2х2) по току электродвигателя Рассмотрим свойства оптимальной по критерию (2 241) системы регулирования частом вращения Одним из важных ее свойств является устойчивость при сколь угодно большом коэффициенте усиления (ftku -» «>) регулятора При этом оказывается, что в отличие от общ ных систем подчиненного регулирования частоты вращения, с увеличением коэффициент усиления (iku растет коэффициент демпфирования и при ftku -♦ <» система вырождаетср систему, свойства которой определяются в основном свойствами контура тока (Ур»6) Разуме- ется, что в реальных системах при неограниченном увеличении коэффициента усиления мо$я возрастать роль неучтенных при синтезе малых параметров и растет порядок уравнений, однако разработанный здесь подход указывает путь улучшения свойств систем подчиненного регулирования Так, при выборе коэффициента усиления fiku регулятора таким, чтобы дина- мические характеристики (время регулирования, перерегулирование и др ) оптимальной!» критерию (2 241) и обычной систем совпадали, оказывается, что статизм оптимальной системе по нагрузке будет в 1,5 раза меньше В пределе статизм оптимальной системы может бал уменьшен вдвое по сравнению с обычной системой регулирования частоты вращения < Следует отметить, что эта система оказывается также оптимальной и по критерию обоб- щенной работы (2 234) с ограничивающим условием (2 235), в котором весовой коэффицшш q следует положить равным q R^2 Выбор коэффициентов mi, Л2 критерия (2 241) определяет выбор весового коэффициент! $ при оптимизации системы по критерию (2 234) Таким образом, оптимальная по критерию (2 241) система регулирования частоты вращения является также оптимальной и по критерию (2 234) минимума математического ожидания интеграла квадратичной формы координат а' 144
2.7. АНАЛИТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА УПРАВЛЯЕМОСТИ И ОПРЕДЕЛЕНИЯ ОСОБЫХ МНОГООБРАЗИЙ НЕЛИНЕЙНЫХ СИСТЕМ НА ЭВМ Введение и постановка задачи (2.251) (2.252) В современной теории автоматического управления основными и в должной мере еще нерешенными являются такие фундаментальные проблемы, как анализ свойств управляемости 11 наблюдаемости нелинейных динамических объектов, а также качественных свойств управ- лений, обеспечивающих оптимальность систем по соответствующим критериям качества. К настоящему времени в литературе имеются различные методы, позволяющие для частных ^даосов нелинейных объектов, как правило малой размерности, в определенной мере решить указанные задачи качественного анализа оптимальных систем управления Распространенная постановка современной задачи оптимального управления формулиру- ется в следующем виде Предположим, что движение объекта описывается векторной системой лнршнейных дифференциальных уравнений = * (!) = А(х) + В(х)и , де Л(х)—функциональная матрица-столбец размерности п с элементами /i(xi , ,х„},..., /4*1» »•*«), xi ’ > хп—координаты вектора состояний, и—вектор управлений размерности лцдинейно входящий в систему уравнений (2 251), В(х)— функциональная матрица на п строк ит&столбцов с элементами , , хй) Требуется на множестве кусочно-непрерывных допу- сгимых управлений и (()€ /<тах найти такие ilopt ((), которые на траекториях движения объекта (2,251) минимизируют некоторый критерий качества ,зн J = f F(x,u)dt, to гдемоменты to и считаются фиксированными Поставленная задача относится к классу задач оптимального разомкнутого управления, когда управление и (() является функцией времени, а начальное х (to) = Хо и конечноех (4) = Хк значения вектора состояния х (Г) заранее заданы. Пой действием управления и (t) объект (2 251) будет двигаться по оптимальной траектории )$(/), которая должна удовлетворять заданным граничным условиям xopl ((о) = х0 и «^(4) = * В этой связи необходимо проверить, существует ли для заданных х0, Хк такое допустимое управление и (f), при котором соответствующая траектория х (t) движения объекта (2 251), начинаясь из начальной точки х (to) = хо, попадала в желаемую конечную точку х ((*) = Хк, при этом необходимо найти множество тех х0 и хк, для которых оптимальное по критерию (2.252) управление uopt (t) всегда существует Эта задача и является известной задачей управ- ляемости динамических объектов ^^Управляемость относится к одному из фундаментальных свойств любой динамической сждемы Исследованию управляемости систем уделяется значительное внимание в литературе [157—160,163,199—207], наиболее разработана теория управляемости линейных объектов, базирующаяся на ранговых критериях при отсутствии ограничений на управление и коорди- наты При наличии же указанных ограничений исследование свойств управляемости сущест- во затрудняется [201], поэтому в литературе даже в случае линейных объектов имеются |ишь отдельные результаты 'Что же касается исходно нелинейных объектов, то в этом случае проблема управляемости принимает нетривиальный характер, требующий применения математических методов, обыч- но редко используемых в теории управления Анализ литературы показывает, что можно выделить следующие основные подходы к исследованию управляемости нелинейных систем: 145
•дифференциально-геометрические и теоретико-групповые подходы, основанный- на применении групп и алгебр Ли и методов дифференциальной геометрии [201,204,205]; •подход, связанный с выявлением инвариантных многообразий в пространствен состояний нелинейных объектов [78]; • с- •подход, в котором используется приведение дифференциальных уравнений объекта к канонической форме Коши—Бруновского [158—160, 202, 203, 206] или к блочно-канонической форме Фробениуса [94, 95, 183, 184]. ж Рассмотрение результатов, полученных на основе указанных подходов, показало,“Ъ матрицы управляемости для нелинейных объектов вида (2.251) оказываются полностью Тож- дественными матрице общности положения [23] принципа максимума. Итак, полученные! настоящее время различными методами результаты по управляемости нелинейных объекта вида (2.251) являются частными случаями, непосредственно вытекающими из условий общю- сти положения (УОП) принципа максимума. Однако известно, что УОП представляет собой важнейшую конструкцию, связанную, в первую очередь, с проблемой поиска необходима условий оптимальности системы по соответствующему критерию качества (2.252), УОП| принципе максимума предназначались в основном для исследования качественных, общи свойств оптимальных управлений uopt (/). Условия же управляемости вытекают из УОП ках своего рода побочный и весьма полезный результат. В задачах оптимального по различным критериям управления УОП позволяют выявить в пространстве состояний нелинейных обка- тов некоторые особые многообразия, на которых не выполняются обычные условия принцип максимума, а требуются особые (вырожденные) управления [23]. Таким образом, УОП позволяют, помимо исследования общих качественных свойств оптимальных управлей, выявить также и свойство управляемости нелинейных объектов. '**' Изложенные обстоятельства указывают на принципиальную важность УОП для нелиней- ных задач управления. В этой связи УОП, развитые в работах В.А.Олейникова [23] примени- тельно к задачам оптимального по быстродействию управления различными классами нели- нейных динамических объектов, приобретают несомненную прикладную значимость кауи качественного анализа оптимальных управлений, так и для исследования свойств управляем- сти нелинейных объектов. Эта значимость определяется, во-первых, известным в принципе максимума положением, согласно которому к задаче оптимального по быстродействию управ- ления может быть сведена задача оптимизации по любому критерию качества при налили ограничений на управление, а именно: путем расширения исходной системы (2.251) на одну координату х,|+1 (/) = J (2.252), т.е. добавлением к (2.251) дифференциального уравнения и затем реализацией обычной процедуры УОП уже для системы п +1 -го порядка, и, во-вторых, тем, что УОП позволяют определить управляемость нелинейного объекта (2.251) при учете естественных ограничений на управления, а это, как отмечалось выше, относится к одной® трудных проблем теории управляемости. Отмеченные здесь достоинства УОП, развитый работах В.А.Олейникова [23], выделяют их среди других известных подходов в задачах управляемости, а также исследования качественных свойств оптимальных управлений нейными объектами. Изложенные выше, важные современные проблемы анализа и, как следствие, сийй систем автоматического управления нелинейными объектами часто требуют громоздких ана- литических преобразований для получения конечных результатов в общем виде и не мейее громоздких преобразований при получении выражений для конкретных операторов или нели- нейных функций. Это приводит к тому, что исследование или синтез управляющих устройся превращается в неразрешимую технически задачу уже для систем 4—5-го порядка, хон теоретический алгоритм известен и проверен на-системах малого порядка. В этих случаях значительную помощь могут оказать системы аналитических вычисляй (САВ), созданные с использованием языков логического программирования. В качестве при- он 146
деде ниже будет показано применение такой системы REDUCE версии 3.3, написанной на дз^е LISP, для решения задачи анализа качественных свойств нелинейных объектов. Будем предполагать знакомство пользователя с основными правилами, синтаксисом, опе- раторами, декларациями, флагами и т д хотя бы в объеме приложения в книге [210]. Для полноты изложения ниже будут поясняться основные синтаксические правила для встречаю- дро операторов и выражений л । Задача вычисления матрицы условий общности положения для нелинейных систем В случае линейных динамических систем условие общности положения (УОП) приводит к дадице управляемости, полученной Р Калманом [23 С 41] Вычисление ранга матрицы управляемости для анализа системы, числовые значения всех параметров которой известны, не представляет большой проблемы для практически любой размерности. Однако если часть элементов матрицы управляемости задана в виде символьных выражений, представляющих комбинации неизвестных параметров системы, то аналитический вывод условий управляемо- сти “вручную” становится весьма громоздкой задачей, как правило, уже при размерности системы и числе неизвестных параметров выше 2-х ^ля нелинейных систем В А Олейников предложил [23 С 64] вычислять функциональ- ную матрицу в качестве УОП Ход его рассуждений заключается в следующем. •‘б'Дяя нелинейного объекта (2 251) при заданном ограничении I и I < пшах оптимальное по быстродействию управление с использованием принципа максимума можно найти, записав гамильтониан в виде суммы скалярных произведений Н = (^ , А(х)) + (V», В(х) и) (2.253) ащже вспомогательную систему дифференциальных уравнений для вектора ГК •, /Э4(х) , йВ(х) \г, <2.254) % ' * = -v Зд^ь символом^(0 обозначен сопряженный вектор, что не следует путать с макропеременной в методе АКАР В уравнении (2 254) выражение ЭА(х)/дх представляет собой производную векторной функции по векторному аргументу dfi a/i dxi дхп 8А(х) _ дХ dfn dfn дх] дхп Ц <4 я •V* «произведение (ЭВ(х)/дх)и понимается как матрица „4. 4. ЭД” „ 1 + Эх, Н| + + Эх, Эх„“,+ X / X и Эх w dfnl . , . dfnm (dfnl 1 a U\ + + a Um . . U\ + 13xi 3xi 1 13x„ dfnm дхп (2.255) (2.256) Для оптимального управления вектор (2 254) должен быть нетривиальным, а гамильтониан 1Щ.253) максимальным Если максимум И по и достигается в вершинах многогранника ограничений на и, то оптимальное управление однозначно определяется через векторы х и ip. В случае, когда этот максимум достигается на гранях или ребрах многогранника, то и нельзя однозначно определить через х и ip 147
Для линейных систем факт однозначности определения и из условий принципа максиму» устанавливается УОП [23]. По аналогии с линейным случаем можно провести следуЩй рассуждения. Пусть максимум функции Н достигается на грани или на ребре многогранника, топйрш и для линейной системы дифференциальных уравнений, получим ж (V», В(х) со) = 0, (2М где (о—вектор, параллельный некоторой грани или ребру многогранника. Дифференциру! скалярное произведение (2.257) по времени и учитывая, что du>/dt = 0, получаем rf(y>, В(х) ш) . ч х , z , ЭВ(х) . . л (2.2» V -ft х » (¥> » Д(х) а>) + (хю ) = 0. v Заменив в (2.258) ip и х на правые части исходной и вспомогательной систем дифференциаль- ных уравнений, получим на траекториях системы ’Hi) эв(х) \т, „ "I „ *|£1(Л(х)+В(х)||))- (2.ЭД S3 Преобразуем выражение (2.259) по известному для скалярных произведений правилу где и и определятся матрицами (2.255) и (2.256). дХ оХ (л(х) + в(х)и) * Рй? + ^Га Обозначив в (2.260) . ЭВ(х) . ч , ч . (дА(х) , дВ(х) \ . В2(х , и) = -±-*- (Л(х) + В(х) u) - l-^-2 + и I В(х) , тогда получаем = 0. GP- (24» (2.261) (2.262) Hi- (V>< (ip , В2(х ,и) а)) = 0 . Дифференцируя последовательно скалярное произведение (2.261), находим 5Хх » u) = (Л(х) + В(х) и) - + u В/_1(х , и). j = 2,3..я; В,(х) = В(х). Матрица Dn = [ВДх): В2(х , и):...: Ви(х , и)], где В/х , и) определяется по (2.262), полуУ ла название УОП для нелинейных систем. Точнее, условием общности положения является rankDn = п для любого момента времени. Если rankZ>K < л, то возникает особый случай. । Исследование этих случаев позволяет определить особые траектории системы и в некого- рых случая?: найти особые управления, которые могут оказаться решениями задачи оптималь- ного управления. В этой последовательности действий одним из наиболее трудоемких! рутинных является вычисление матрицы Dn и условий полноты ее ранга. Так как в общем случае матрица Dn имеет л строк и л • т столбцов, то по одному из способе» определения неполноты ранга матрицы Dn требуется вычислить все определители квадратных матриц размерности п х л, составленных из всех возможных сочетаний столбцов матрицы Dn. Все эти вычисления весьма трудоемки для ручных выкладок уже при размерности систем выше 2-й и числе управлений выше 2-х. Покажем процесс составления и запуска программы на языке Reduce для решения данщм задачи. t Программу на языке Reduce начнем с конкретизации размерности задачи, так как язык ве позволяет декларировать и оперировать с матрицами неопределенной размерности. , Первые выражения программы запишем в виде операторов присвоения числовых значевй размерности системы N и размерности вектора управлений М: N:=3$ М:« 2 $ NM := N*M $ 148 )
Последнее выражение вычисляет значение вспомогательной переменной NM для удобства записи последующих операторов программы. Знак $ в конце оператора запрещает вывод на кун и в протокол результата выполнения соответствующего оператора при исполнении программы, в противном случае вместо $ используется; (точка с запятой). ж Далее декларируем все матрицы, фигурирующие в формулировке задачи, задавая векторы сак матрицы с одним столбцом: MATRIX X(N,1), A(N,1), B(N,M), U(M,1); MATRIX D(N, NM); -MATRIX B2(N,M), B3(N,M); Количество матриц в последней строке должно соответствовать порядку системы, т.е. при N=4 надо добавить B4(N,M) и т.д. -нДалее заполним исходные матрицы требуемыми выражениями: ^:=МАТ ((XI), (Х2), (ХЗ) ) $ -$L-MAT ( (Fl), (F2), (F3) ) $ В :=МАТ ((Fll, F12),(F21, F22), (F31, F32) ) $ иР.-МАТ ( (Ul), (U2) ) $ Сщаксис этих выражений простой: слева от оператора присваивания указывается одно из зарезервированных (в MATRIX) для матриц имен, а справа помещается ключевое слово МАТ пдаем в круглых скобках строки матриц, разделяемые запятыми; при этом каждая строка за^чается в круглые скобки и элементы строк также разделяются запятыми. . Количество указываемых элементов в этих выражениях должно строго соответствовать обделенной в MATRIX размерности. Если необходимо решать менее общую задачу, напри- мер« с F12=F21=O, то матрицу В надо записать как B:=MAT((Fll,0),(0,F22),(F31,F32))$, аддотря на то, что при резервировании матриц (по декларации MATRIX) их элементы автоматически заполняются нулями. Однако это последнее обстоятельство можно использо- в^, когда заполняемая матрица имеет больше нулей в качестве элементов, чем определяемых элементов. Например, если F11=F22=F31=F32=O, тогда проще заполнить матрицу В двумя операторами присваивания: B(l,2):«=F12$ B(2,1):=F21$. .-уДолезно объявить переменные XI, Х2, ХЗ в качестве сомножителей в выводимых выраже- ниях: FACTOR XI, Х2, ХЗ; Объявим далее функции Fi и Fij в качестве операторов OPERATOR Fl, F2, F3; OPERATOR Fl 1, Fl 2, F21, F22, F31, F32; шикем их аргументы в явном виде: Fl :=F1(X1, Х2, ХЗ) $ f2:=F2(Xl,X2, ХЗ) $ F3:=F3(X1,X2, ХЗ) $ ;;F11:-F11(X1,X2,X3) $ F12~F12(X1, Х2, ХЗ) $ F21:=F21(X1,X2,X3) $ < F22:=F22(X1,X2,X3) $ F31 :=F31(X1,X2, ХЗ) $ W:» F32(X1,X2, ХЗ) $ Есди решение (например, матрица D) при такой общей постановке задачи окажется слишком иииым, необозримым (а стало быть и практически бесполезным) или это приведет к нехватке одедвтивной памяти, то лучше вместо последних операторов записать операторы присваивания . конкретных выражений для функций, например Fl:eXl+X2*X3**2$, или вообще отказаться от 1 использования операторов Fi, Fij, а заполнять исходные матрицы конкретными выражениями (ок примеры ниже). Тетерь можно приступить к поэтапному вычислению матрицы УОП. Зарезервируем вспомогательный вектор DX и присвоим ему результат вычисления вектор- нойвыражения А(х) 4- В(х) и из (2.262): 149
MATRIX DX(N,1); DX:=A + B*U$ Декларируем также вспомогательную квадратную матрицу DA и поместим туда выражеме MATRIX DA(N,N); FORL:=1:M DO FOR I := 1:N DO FOR J := 1:N DO DA (I,J) :=DA(I,J) +DF(B(I,L),X(J,1)) * U(L,1); FORI:=1:NDO FORJ:=1:N DO DA(I,J) :» DA(I,J) + DF(A(I,1) ,X (J, 1)); В этой части программы появляется необходимость использования оператора дифферен- цирования DF с двумя аргументами, первый из которых есть дифференцируемый оператор а второй переменная, по которой необходимо выполнить дифференцирование. В оператореФР возможно и большее число аргументов, например после переменной через запятую мой указать порядок производной по данной переменной (если этот порядок, как в нашем слуш равен 1, то его обычно опускают), затем можно указать еще ряд переменных со свойМя порядками и т.д. Если дифференцируемому оператору в программе не присвоено конкретной значения, то Reduce поместит в результат сам оператор дифференцирования (см. ниже обсу& дение решения). Оператор цикла FOR...DO..., встречающийся во многих широко известных алгоритм^ ских языках, ясен из текста и не требует подробных пояснений, кроме, может быть, одной. Запись 1:N является сокращенной записью при изменении переменной счетчика циклов#! до N с шагом 1. Полная форма записи I:=1:N будет I:=l STEP 1 UNTIL N. Применение вложенных циклов в последнем отрезке программы обусловлено тем, лго оператор дифференцирования DF применяется только к скалярным аргументам. ‘ > Продолжим решение нашей задачи путем вычисления промежуточного выражеш (dB,_i(x , и)/дх) • (А(х) + В(х) и), представляющего собой произведение векторной производ- ной ЭВ,-1(х , и)/Эх на вектор DX : ы FORL:=1:MDO 4 FORI:-UNDO B2(I,L) := FOR J := 1:N SUM DF(B(I,L),X(J,I)) * DX(J,1); В последней строке в операторе присваивания справа применяется очень удобный в Remice оператор суммирования SUM с изменением посредством FOR индекса суммирования J от N с шагом!. Наконец, можно вычислить в программе матрицу В^х , «) для j = 2: 1 B2:=B2-DA*B$ ’ Матрицу ВЗ получим теперь, повторив просто предыдущие 4 строки программы и замам в них матрицу В на В2: FORL:=1:MDO ’’ | FOR I := 1 :N DO I B3(I,L) :=FOR J := 1:N SUM DF(B2(I,L),X(J,1)) * DX(J,1); r ВЗ := B3 - DA ♦ B2 f Если в задаче будет определена, например, размерность системы N=4, то в программе над повторить еще раз эти 4 строки, заменив В2 на ВЗ и ВЗ на В4 и т.д. + к Поскольку мы рассматриваем пример с N=3, то следующим этапом в программе должно быть составление матрицы УОП D из матриц В, В2 и ВЗ : : FORI:=1:N DO FOR L := 1:M DO D(I,L) :=B (I,L); 150
tfii№D(I,L+M) :=B2(I,L); D(I,L+2*M) :=B3(I,L); Скобки в виде < > позволяют записывать так называемый групповой оператор и тем самым изюлнять в FOR...DO... более одного оператора языка Reduce. ' При увеличении размерности системы в групповой оператор надо добавить соответствую- щее число строк. Например, при N=4 надо добавить строку D(I,L+3*M):=B4(I,L); и т.д. /Если, как правило, пользователя интересует содержание матрицы D, то следующий опера- тор программы должен быть запросом на вывод этой матрицы (хотя этот запрос может быть и злюбой из последующих строк). Запрос на языке Reduce записывается просто в виде имени идентификатора с точкой с запятой: »i'D; Завершим составление программы вычислением всех определителей размера N*N, которые можно составить из столбцов матрицы D и которые необходимы для решения дальнейшей задачи о возможном ранге матрицы D. "S?=0$ FOR II := 1 : NM - N + 1 DO FOR 12 ~ Il + 1 : NM - N + 2.DO FORI3 :=I2+1 : NM - N + 3 DO < FORI~1 :NDO < DA(I,1) :=D(I,I1); DA(I,2) :=D(I,I2); DA(I,3) :=D(I,I3); >; S:=S+1; WRITE “Определитель ”,S," из колонок “,11,12,13,” равен"; WRITE DET(DA);>; END; Прк N=3 последний фрагмент необходимо дополнять. Например, при N=4 добавим еще один вложенный цикл FOR I4:eI3+l:NM-N+4 DO, затем введем во внутренний групповой оператор проку DA(I,4):=D(I,I4), а в первый из операторов вывода WRITE также добавим в список . идентификатор 14 для вывода текущего значения счетчика дополненного цикла FOR и т.д. Подобные программы обычно заканчиваются оператором END, который и помещен в последней строке фрагмента. Для получения результатов посредством описанной программы надо с помощью любого текстового редактора поместить все приведенные выше операторы в текстовый файл с именем, например problem 1, и записать его в директорию, где находятся все файлы системы Reduce и, в том числе, файл reduce33.exe. Затем следует загрузить Reduce, запустив программу reduce33.exe из командной строки DQS, указав ключ -log для того, чтобы Reduce формировал на диске файл протокола сеанса, и добавить в качестве параметра имя файла протокола с соблюдением всех правил записи имен файлов в DOS. Командная строка, например, может иметь вид: “ REDUCE33.EXE -LOG PROTOCOL Reduce будет готов к работе при появлении на экране символов 1:, где цифра означает номер ппо* сеанса, а двоеточие — готовность системы к вводу очередной команды пользователя. Набрав в текущей строке команду ввода входного файла в виде I: IN PROBLEM 1 $ и нажав клавишу Enter, получим вывод результатов на экран и в протокол сеанса. При появлении запроса системы в виде 2: можно ввести команду окончания сеанса 2: BYE; побрататься к изучению результатов, открыв файл протокола в среде DOS. 151
В качестве примера приведем входной файл и выписку из протокола результатов решея задачи при пв2 и т=1 (два уравнения и одно управление). i £. Входной файл: N :-2 $ М 1 $ NM :-N*M $ MATRIX X(N,1), A(N,1), B(N,M), U(M,1); MATRIX D(N, NM), B2(N,M); X := MAT ((X1), (X2) ) $ A:=MAT ( (Fl), (F2) ) $ B:-MAT ((FU),(F21)) $ U :=MAT ( (UD) $ FACTOR XI, X2; OPERATOR Fl, F2, Fl 1, F21; Fl Fl (XI, X2) $ F2F2(X1, X2) $ Fl 1Fl 1 (XI, X2) $ F21 := F21 (XI, X2) $ MATRIX DX(N,1), DA(N,N); DX:-A + B*U$ FORL:=1:MDO FOR I := 1:N DO FORJ:»1:N DO DA(IJ) DA (I,J) + DF(B(I,L),X(J,D) ♦ U(L,1); FORI:-1:N DO FORJ:=1:N DO DA (I,J) :-DA(I,J) +DF(A(I,1),X(J,1)); FORL:-1:M DO FOR I := 1:N DO B2(I,L) :=FORJ :» 1:N SUM DF(B(I,L),X(J,1)) ♦ DX(J,1); B2 B2 - DA * В $ FOR I:» UNDO FORL:-1:MDO < D(I,L) := В (I,L); D(I,L+ M) := B2(I,L) >; D; S:=0 $ FOR II := 1 : NM-N+1 DO FOR 12 := 11+1 : NM-N+2 DO < FOR I := 1 : N DO <DA(I,1) :-D(I,Il); DA(I,2) :»D(I,I2) >; S:-S+l; WRITE 'Определитель ”,S," из колонок “,11,12,” равен"; WRITE DET (DA) >; END; Результаты решения из протокола: 1: IN PROBLEM 1 $ MAT(1,1) :-Fll(Xl,X2) MAT(1,2) :-DF(Fll(Xl,X2),Xl)*Fl(Xl,^2) +DF(F11(X1,X2),X2)* F2(X1,X2) - DF(F1(X1,X2),X1)*F11(X1,X2) - DF(F1 (X1,X2),X2)*F21 (XI,X2) MAT(2,1) :=F21(X1,X2) MAT(2,2) ?“DF(F21(X1,X2),X1)*F1(X1,X2) +DF(F21(X1,X2),X2)* F2(X1,X2) -DF(F2(X1,X2),X1)*F11(X1,X2) - . DF(F2(X1,X2),X2)*F21(X1,X2) Определитель 1 из колонок 12 равен - (DF(F11(X1,X2),X1)*F1(X1,X2)*F21(X1,X2) + DF(F11 (XI ,X2) ,X2)*F21 (XI ,X2)*F2(X1 ,X2) - DF(F1 (XI,X2) ,X1) *F11 (XI ,X2) *F21 (XI,X2) - DF(F1(X1,X2),X2)*F21(X1,X2)**2 - 152
DF(F21 (X1,X2),X1)*F11 (X1,X2)*F1 (XI,X2) - DF(F21 (XI ,X2) ,X2) *F11 (XI ,X2) *F2 (XI ,X2) + DF(F2(X1,X2),X1)*F11 (X1,X2)**2 + DF (F2 (X1 ,X2) ,X2) »F 11 (X1 ,X2) *F21 (X1 ,X2)) 2: BYE; Эти результаты легко могут быть переписаны в привычной “естественной” форме с заменой машинной записи DF(F,X) на Заметим, что при постоянном общении с системой Reduce более привычной и более “естественной” может представлятся именно машинная запись операции дифференцирования DF (F,X). ' Если запустить на выполнение программу, описанную выше с N=3 и М=2, то одна только матрица D потребует около 130 Кбайт памяти (около 40 страниц печатного текста стандартного формата). Вывод всех определителей потребует много больше памяти. Таким образом, реше- ине подобных задач в общем виде не имеет, повидимому, большого практического смысла, однако наличие универсальной и легко адаптируемой программы позволит с успехом решать Практически все частные задачи. Ряд таких примеров рассмотрен в следующем разделе. Примеры вычисления УОП Пример 2.14.Возьмем для первого примера задачу вычисления УОП для последовательно- го соединения 3-х нелинейных звеньев 1-го порядка, сформулированную В.А.Олейниковым в (23. С.67]. Уравнения системы имеют следующий вид xi =/i(xi) «]-/ii(xi); хг = /21 (xi , х2) - /22(^2); (2.263) Хз = /32(Х2 , Хз) - /зз(хз) • Адаптированный к задаче (2.263) входной файл для Reduce будет иметь вид: N :=3 $ М := 1 $ NM :=N*M $ MATRIX X(N,1), A(N,1), B(N,M), U(M,1); MATRIX D(N, NM), B2(N,M), B3(N,M); OPERATOR Fll, F21, F22, F32, F33, Fl; X :=MAT ( (XI), (X2), (X3) ) $ A:=MAT ( (-Fll(Xl)), (F21(X1,X2)-F22(X2)), (F32(X2,X3)-F33(X3)) ) $ B:=MAT ( (Fl(XD), (0), (0)) $ U := MAT ( (U1)) $ FACTOR XI, X2, X3; MATRIX DX(N,1), DA(N,N); DX := A + B*U $ FORL:=1:M DO FORI:-1:N DO FORJ:=1:N DO DA(I,J) :=DA(I,J) +DF(B(I,L),X(J,1)) ♦ U(L,1); FORI:=1:N DO FORJ:=1:N DO DA(I,J) .-DA (I, J) +DF(A(I,1),X(J,D); FORL:=1:M DO FORI:«1:N DO B2(I,L) :=FORJ:=1:N SUM DF(B(I,L),X(J,1)) * DX(J,1); B2 := B2 - DA * В $ FORL:=1:M DO FORI:=1:N DO B3(I,L) :=FOR J := 1:N SUM DF(B2(I,L),X(J,1)) ♦ DX(J,1); B3 :=B3 - DA * B2 $ FORI:=1:NDO FORL:=1:MDO 153
<D(I,L) :=B(I,L); D(I,L+M):= B2(I,L); D(I,L+2*M) :=B3(I,L) >; D; S:=0 $ FOR II := 1 : NM-N+1 DO FOR 12 := 11+1 : NM-N+2 DO FOR 13 := 12 + 1 : NM - N + 3 DO <FORI:=1 :NDO<DA(I,1) :»D(I,I1); DA(I,2) := D (1,12); DA (1,3) :=D(I,I3) >; S:=S+1; WRITE “Определитель ”,S," из колонок “,11,12,13,” равен"; WRITE DET(DA) >; END; Машинный результат вычисления матрицы УОП D: D(l,l) :-Fl<Xl) D(l,2) :“DF(F11(X1),X1)*F1(X1) - DF(F1(X1),X1)*F11(X1) D(l,3) :=- (DF(F11(X1),X1,2)*F11(X1)*F1(X1) - DF(Fl 1 (X1) ,X1,2) *F1 (XI) **2 *U 1 - DF(F11 (X1),X1)**2 *F1 (XI) + DF(F11 (X1),X1)*DF(F1 (X1),X1)*F11 (XI) H- DF(F11 (X1),X1)*DF(F1 (X1),X1)*F1 (X1)*U1 - DF(F1 (X1),X1,2)*F11 (Xl)**2 + DF(F1 (X1),X1,2)*F11 (X1)*F1 (X1)*U1 - DF(F1(X1),X1)**2 *F11(X1)*U1) D(2,l) :=0 D(2,2) := - DF(F21 (X1,X2),X1)*F1 (XI) D(2,3) :=- (DF(F11(X1),X1)*DF(F21(X1,X2),X1)*F1(X1) - 2*DF(F1(X1),X1)*DF(F21(X1,X2),X1)*F11(X1) + DF(F1(X1),X1)*DF(F21(X1,X2),X1)*F1(X1)*U1 + DF(F21 (X1,X2),X1,X2)*F1 (X1)*F21 (XI,X2) - DF(F21 (X1,X2),X1,X2)*F1 (X1)*F22(X2) - DF(F21 (X1,X2),X1,2)*F11 (X1)*F1 (XI) + DF (F21 (X1 ,X2) ,X 1,2) *F1 (X1) **2 *U 1 - DF(F21 (X1 ,X2) ,X 1) *DF(F21 (X1 ,X2) ,X2) *F1 (X1) + DF (F21 (X1 ,X2) ,X 1) *DF (F22 (X2) ,X2) *F1 (X1)) D(3,l) :=0 D(3,2) :=0 D (3,3) := DF(F21 (X1 ,X2) ,X 1) *DF(F32(X2,X3) ,X2)*F1 (XI) Определитель 1 из колонок 123 равен - DF(F21 (X1 ,Х2) ,Х 1) **2 *DF(F32 (Х2,ХЗ) ,Х2) *F1 (X1) **3 Эти результаты полностью совпадают с результатами, приведенными в [23. С.68]. Пример 2.15. Рассмотрим пример системы также из [23. С. 120] Xi (?) = bl и ; Х2 (0 = Л21<*1 ~ й22Х\Х2 — г (2.261) В [23] для объекта (2.264) с целью упрощения матрица УОП и ее определитель вычислен для частного случая b - а - а = 1. Машинные вычисления легко можно провести и для общего случая, присвоив лишь после этого коэффициентам какие-либо числовые значения. Откорректированный для данной задачи входной файл имеет следующий вид: N := 2 $ М := 1 $ NM := N*M $ MATRIX X(N,1), A(N,1), B(N,M), U(M,1); MATRIX D (N, NM), B2 (N,M); X :=MAT ( (XI), (X2) ) $ A := MAT ( (0), (A21*X1 - A22*X1**2*X2 - R) ) $ В .-MAT ( (Bl), (0) ) $ 154
U:-MAT ( (Ul)) $ FACTOR XI, X2; Г MATRIX DX(N,1), DA(N,N); DX := A + B*U $ FORL:-1:MDO FOR I1:N DO FORJ:-1:N DO ~DA(U) :-DA(I,J) + DF(B(I,L),X(J,D) • U(L,1); FORI : 1:N DO FORJ:«1:N DO U DA(I,J) :-DA(I,J) +DF(A(I,1),X(J,1)); FORL:-1:M DO FORI:-1:N DO B2(I,L) :-FOR J 1:N SUM DF(B(I,L),X(J,1)) • DX(J,1); B2:-B2-DA»B$ FORI:-1:N DO FORL:-1:M DO <D(I,L) :-B(I,L); D(I,L+M) :-B2(I,L) >; ТУ Ч-шО < FOR II :-l: NM-N+1 DO FOR 1211+1 : NM-N+2 DO <FORI:-1 :NDO<DA(I,1) :-D(I,I1); DA(I,2).-D(I,I2>>; S^S+1; WRITE “Определитель ”,8,” из колонок “,11,12,” равен"; ... WRITE DET(DA> >; END; Шюлнив этот входной файл в среде Reduce, получим матрицу УОП в виде О=Р‘ 0 ' О 2X1X2^22^1 “ Й21д1 Йе определитель det D = Ixxxian^ - aaift?. Если до выхода из Reduce (до подачи команды bye;) мы введем и исполним последовательность из двух комавд пС,,В1 :=А21 :«=А22 :« 1 $ их О; £ряогда получим на экране и в протоколе матрицу kt D _ Г1 О Ж [О 2X1X2 - 1 мторая и приведена в [ 17] на стр. 120. Пример 2.16; Рассмотрим задачу, поставленную в [23. С.70], анализа УОП для 2-х последовательно включенных нелинейных звеньев 1-го порядка с двумя управлениями: *1 = /1(*0 «1 + Ж*») «2 - /11(^1); xi = /2i(xi , х2) - /згОг)- (2.265) Входной файл для этой задачи: wC;N:-2$M:~2$NM :-N*M$ “’“MATRIX X(N,1), A(N,1), B(N,M), U(M,1); ^MATRIX D(N,NM), B2(N,M); ^OPERATOR Fl 1,F21,F22,F1,F2; ,Й'Х:-МАТ ( (XI), (X2) ) $ ж2А:>=МАТ ((-Fll(Xl)), (F21(X1,X2) - F22(X2))) $ Rs~MAT ( ((Fl(XI)), (F2(X1))), ((0), (0)) ) $ ^^MAT ( (Ul), (U2) ) $ ^'FACTOR XI, X2; «^MATRIX DX(N,1), DA(N,N); WtDX:=A + B*U$ ya 155
FORL:=1:MDO FORI:»1:NDO FORJ:-1:NDO DA(I,J) :« DA(I,J) + DF(B(I,L),X(J,1)) * U(L,1); FORI:-1:NDO FORJ:=1:NDO DA (I,J) :=DA(I,J) + DF(A(I,1),X(J,1)); FORL:-1:MDO FORI:=1:NDO ; B2(I,L) := FORJ := 1:N SUM DF(B(I,L),X(J,D) * DX(J,1); B2:=B2-DA*B$ FOR I1:N DO . FORL:«1:MDO < D(I,L) В (I,L); D(I,L+ M) :» B2(I,L) >; D; S:=0 $ FORI1 := 1: NM‘N+1 DO FOR 12 := 11+1 : NM-N+2 DO <FORI^-UNDO < DA(I,1) :* D(I,I1); DA(I,2) :» D(I,I2) >; S:=S+1; WRITE “Определитель ”,S," из колонок “,I1,12,” равен"; WRITE DET (DA) >; END; В результате выполнения этого файла Reduce выводит матрицу УОП и 6 ее определителей» виде Г/, Л 1 °* D= ° ° -4» ' I 0Х] I I 0X1 I > s (d/п (dfi у, (д/г\ . где'/13 = /,(а1Г’/'Дл1г] +/2“2(д^)"/1Иг(д^)’ _/2И1^7|- Определитель 1 из колонок 1, 2: deti2=0. Определитель 2 из колонок 1, 3: det>3 = — . Определитель 3 из колонок 1, 4: det 14 = - (Vj/axj/i/? • Определитель 4 из колонок 2, 3: det23 = - (д^/э.п)А/2 • Определитель 5 из колонок 2, 4: det24 = - (9^Xl) А • Определитель 6 из колонок 3, 4: de'34 = W(^/,l/2 + + Й/Л“2) Приравнивая нулю ненулевые определители матрицы УОП (2.267), легко получим услоив невыполнения УОП для объекта (2.265) в виде я? Л=0;/2 = 0; > = 0. 0X1 Этот результат полностью .совпадает с выводами в [23. С.70]. При числе управлешй больше одного анализ матрицы УОП посредством вычисления всех определителей, как зп делается в приведенных выше примерах, наталкивается с ростом пит очень скорой проблемы, связанные с быстрым ростом числа этих определителей, равного числу сочетаия из п'т элементов по п. Приведем для иллюстрации табл.2.2 числа определителей для ni т < 5:
.______________________Таблица 2.2 " п >50 т 1 2 3 4 5 фи | 1 2 1 6 ..... 3 1 20 84 'С;' 4 1 70 495 1820 5 1 252 3003 15504 53130 Т1 зЕДля некоторых частных видов систем, когда большое число определителей оказывается рйяым нулю, удается получить конечные результаты анализа для п = 3 и даже 4, но все же большое число систем оказывается трудным для анализа. $‘В этом случае можно неполноту ранга матрицы УОП установить, умножив матрицу УОП м ее же транспонированную и вычислив определитель этого произведения. Приравнивание Вулю этого определителя будет представлять единственное условие неполноты ранга матрицы УОП. Приведем пример такого вычисления. ^Пример 2.17. Возьмем систему из примера 2.16 и модифицируем входной файл, удалив 8 последних строк, связанных с вычислением всех определителей, и добавим следующие опера- Й^для вычисления определителя матрицы D*D’ (D’—транспонированная матрица D): •rjF М1 THEN DA := D ♦ TP (D) ELSE DA := D; DET (DA); END; Шь TP(D) означает операцию транспонирования матрицы D. Исполнение модифицированной программы даст результат, который легко можно приве- сгиквиду ".И , ’ 2 Л А2 (2-268) det(D-D ')= (/ii(/n-2/itti-2/2M2)+(/iH1+/2«2)2+C/?+/2)2)= 0. Полученное условие (2.268) будет всегда выполняться, если выполняются условия (2.267). В этом смысле они эквивалентны. ^Изложенные выше аналитические процедуры вычисления на ЭВМ условий общности положения существенным образом расширияют арсенал средств для автоматизированного ^следования свойств управляемости нелинейных объектов, выявления особых многообразий 11 пространстве состояний, поиска особых управлений и т.д. Это позволяет значительно про- даануться в проблеме качественного анализа, необходимого для последующего синтеза систем управления нелинейными объектами. 2.8 АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ НЕЛИНЕЙНЫХ ДИСКРЕТНО-НЕПРЕРЫВНЫХ СИСТЕМ УПРАВЛЕНИЯ. ' Постановка задачи. В предыдущих разделах этой главы рассматривалось применение мётеда аналитического конструирования агрегированных регуляторов (АКАР) для объектов, описываемых непрерывными нелинейными дифференциальными уравнениями. Однако мно- ие динамические объекты имеют дискретно-непрерывное описание, более адекватное их реальному поведению. К ним, в частности относятся экологические, биотехнические объекты .од. Кроме того, повсеместное применение микро-ЭВМ, микропроцессоров и различных цифровых вычислительных устройств для получения и обработки информации, а также для дискретного управления подвижными и технологическими объектами превращает системы {правления ими в дискретно-непрерывные. Следует отметить, что к настоящему времени в научно-технической литературе имеются методы анализа и синтеза линейных дискретно-не- ррерывных систем управления. Что же касается нелинейных дискретно-непрерывных систем, то в отечественной и зарубежной литературе существуют результаты в основном по анализу устойчивости и практически отсутствуют регулярные методы их синтеза, особенно это касается 157
нелинейных объектов. В этой связи представляется целесообразным распространить общ1 метод АКАР на задачи синтеза дискретно-непрерывных нелинейных систем управления. ** Сформулируем задачу аналитического конструирования нелинейных дискретно-недо рывных систем управления. Пусть задана система уравнений, описывающая движение надо рывного нелинейного объекта: *1(0 = ........................................................................ (2.2«jj х«(0 = fn(xu...,х„)+ du [Л]. Необходимо определить дискретный закон управления и [Л] = u(xi,...,xn) обеспечивающй перевод изображающей точки системы из произвольного начального состояния Х(хю,...^й)г начало координат (xi - ... = хп = 0) пространства состояний. При этом обеспечивается мМ№ мум функционала < “ (2270) J = f F^dt, •* 0 V где ОДчф)—непрерывно дифференцируемая по своим аргументам определенно-положитедШ^ функция; ^(х1,...,хп)—агрегированная макропеременная, представляющая собой некоторую^ извольную дифференцируемую или кусочно-непрерывную функцию фазовых координат. Аналитическое конструирование дискретных агрегированных регуляторов. Примени^ системе (2.269) процедуру разностной аппроксимации [240], тогда получим следующие до костные уравнения: А'Х1[Л] =/1(х1[Л],...,хп[А:]); .............................................................................. (2ДП) Дх„ [Л] = /„(X! [Л] ,...,х„ [Л])+ Ьи И, описывающие исходную дискретно-непрерывную систему. Раскрывая разностные произдо ные Лл,Ш = *Л*+11Г X| W , (2'^' и подставляя (2.272) в (2.271), получим разностную модель объекта: <7Й xi[^+l] =/l(xi И,...,Хи W); • «и хи[*+1] = Д(х1И],...,х„И)+5,М[Л], (2.Ц тде [Л] ) = Xi+ T//(xiH]v..,xw[^]), b{ = Ь7\ Т—шаг дискретизации по времен. Функционал (2.270) для системы (2.273) запишется в виде: 00 (2 274). Z’SWWW)- *-0 Выберем подынтегральную функцию F(xp\k\ ,Длр [£]) в виде следующей квадратичной форме Fty [Л], [*]) = mV [Л] + с2(Д^ [Л1 )2, тогда функционал (2.274) примет вид J = 5 (mV2 [^] + И )2) • (2.2$ <2.^б) Ж В соответствии с [241] запишем уравнение Эйлера—Лагранжа \ * ат%хя*],ая*])- ед^+1]Ж*+1]) = о, (2.Ш тде />(y>U+'l] ,А^[£+1])—производная от F(ip [£+1] ,Ау> [Л+1]) по хр. Подставляя в (2.277) функцию F(V> [Л] ,Ду> [Л]) из (2.275), находим уравнение экстремалей, доставляющих миний^ функционалу (2.276): ® V» [Л+2] - (2+ ЛТ2)^ R+1] + [Л] = 0, (2.Ж 2 где Л = —г, которые определяют подсемейства устойчивых и неустойчивых экстрем&М с 158
Изуравнения (2.278) можно выделить подсемейство устойчивых экстремалей, описываемых следующим разностным уравнением: . У>[А+1] + алр[к] = 0 (2.279) 1деа = 1+ УгХТ2- (АТ2+ У* А2/12) и. Условие асимптотической устойчивости в целом уравне- ш (2.279) имеет следующий простейший вид [240]: а < 1. (2.280) Из уравнения (2.279) при учете разностной модели объекта (2.273) можно определить множество допустимых законов управления и(х\ [А] ,...,хй[А]), обеспечивающих перевод изо- бражающей точки из произвольных начальных условий в окрестность многообразия у [А] =0, к удержание ее в этой окрестности при дальнейшем движении вдоль ij>(xi [А],... ,хй[А])=О к положению равновесия (х1ДА7,]=...=хйл[АТ]=0). Движение вдоль многообразия ^[А]=0 будет описываться системой разностных уравнений размерности п— 1: х^ [А+ 1] =Zh(xlv,[A],...,x„-iv,[A]), i = 1,2,...,«-1. (2.281) Для получения уравнений (2.281) необходимо из уравнения ij>(x\ [А] ,...,хй [А] )=0 выразить координату х„[А] = y>(xi[A],...,xn-i[A]) и подставить ее в первые л-1 уравнений системы (1273). Замкнутая дискретная система (2.281) устойчива, если, согласно критерию Калмана—Бер- тмана [242], /У в (2.281) является ограниченной по норме для всех х[А]. Условие ограничен- ности ft можно записать в следующем виде: Г п с. -1 У — I hij(x) I L < 1 для любого х, /=1 ci (2.282) max или (2.283) max i 11 с- 2 — I hij(x) Q < 1 для любого х, i=i С1 , ur rm д/Г(х[А]) .. дей;/—элементы матрицы Н [х [к] ] = - ~ci,... ,сй—положительные константы. Условия ограниченности по норме (2.282), (2.283) вместе с условием (2.280) обеспечивают асимп- тотическую устойчивость движения синтезируемых методом АКАР дискретно-непрерывных систем управления. Примеры аналитического конструирования нелинейных дискретных регуляторов. Пе- рейдем к рассмотрению примеров аналитического конструирования нелинейных дискретно- непрерывных систем управления. г Пример 2.18. Определим закон управления объектом, описываемым следующей нелиней- ной системой дифференциальных уравнений: (Ш Х](0 = х2+ х2; 5НЯЭ. X2(t) = u[k}. Задишем уравнения (2.284) в разностной форме f [А+1] = X! [А] + 7х?[А] + Тх2[А] ; х2 [А+1] = х2 [А] + Ти [А]. (2.285) В соответствии с методом инвариантных многообразий введем агрегированную перемен- (2.284) [А] = хг [Л] + /U [Л] + fax\ [Л], ЙШ основе (2.279) получим х2[А+1] + Ргх\ [А+1] + Р\х2 [А+1] + aix2[A] + a$2x\ [Л] + аф\х2 [А] = 0. Подставляя в полученное выражение уравнения объекта (2.285) , имеем: ' ^г(«1+ l)xi [Л] + (1+ «]+ тРгуХг[к] + (аф\ + 7)82)Xi[A] + НК + A(*i [Л] + Тх2[к] + Тх2[А])2+ Ти[к] = О, откуда находим закон управления и [Л] (2.286) 159
=- (оц + [*]/Т- (1+ а,+ 7)82)х2[*]/Т- (афх + р2Т)х2Лк\/Т- - 0i(xi Ю + Тх1\к\ + Тх2 [Л] )2/Т. (2.Ж В процессе движения изображающей точки вдоль многообразия ip [Л] =0 (2.286) уравнение замкнутой системы можно получить, выразив из (2.286) координату х2 [Л] и подставив ей первое уравнение системы (2.285): xi*[^+l]- (!>- 7^2+ T(1-^1)xiv[X:])xiv[^] = 0. (2.288) Условие устойшвюетжразноЕЯйово нелинейного уравнения первого порядка х[*+1]-Л*,х[Л])х[Л] =0, (2.Ж согласно критерию Венгжина—Видаля [242] имеет вид v< 1- 1Д*,х[*])1. (2.290) Уравнение (2.288) относится к классу (2.289), поэтому, применив условие (2.290) при г =0 к уравнению (2.288), получим 11-7£2+7’(1-Д1)х1Л*]1 < 1, ИЛИ . О < рг- (1 - ft)*.,#] < Ут. (2 291) 160
ЙрЙ/h = 1 условие (2.291) запишется следующим образом: О <02 < fy, цОриняв Т = 0,01, получим неравенство 0 < < 200. Результаты моделирования дискретно-непрерывной системы (2.285), (2.287) прись = -0,9, рг = 1 приведены на рис.2.5 и при сь = —0,9, Д1 = 1, /?2 == Ю—на рис.2.6. Из этих (Ящиков видно, что при увеличении коэффициента 02 сокращается время переходного про- ;жс^,до для перевода изображающей точки из начального состояния в положение равновесия «Йемы необходимы большие затраты энергии. ' с^ли в условии (2.291) принять0\ = 10, то: 0 < 9x1$ [^] < 200, |Д1Й^2 = 1 система будет устойчива на многообразии у>[Л] =0, если для координаты хи [Л] од^уйяется условие < %1$[Л] < 19%, а при0г = 10 система устойчива, если выполняется условие -*% < xi$[£] < 19%. Результаты моделирования системы (2.285), (2.287) при (fe^rOA/fi = 10,/Ь = 1 и^г = 10 приведены на рис.2.7 и рис.2.8 соответственно. 161
Рис. 2.9 Для обеспечения чувствительности закона управления к знаку квадратичных функци введем следующую макропеременную: V»2 [Л] = *2 [Л] + Yixi (Л] I xi [Л] I + y2xi [Л]. (2.292) Тогда в соответствии с (2.279) и (2.285) получим: Уг(Г+ а2)х! И + (1+ У2Т+ а2)х2[к] + (у27+ assign х} [Л])х2[Л] + + yisign xi [Л] (xi [Л] + 7х2 [Л] + Тх2 [Л] )2+ Ти [Л], откуда определим закон управления м[Л] = - у2(1 + a2)xi[*]/7- (1+ у2Т+ а2)х2[к]/Т— (у2Т+ + assign X! [Л] )х? [Л] /Т- yisign xi [£] (xi [Л] + 7х? [Л] + Тх2 [Л] )2/7. (2-Ж Уравнение движения изображающей точки вдоль многообразия гр [£] =0 (2.292) имеет вед xi ДЛ+1] - (1- Ту2+ 7(1- yisign xi *[Л])х1Д£] = 0. (2.294) Условие устойчивости уравнения (2.294) при v = 0 записывается следующим образом: 11 - 7у2+ 7(1 - yisign xiy, [Л]) I < 1, ,Г1 откуда при 7 — 0,01 имеем •?» 0 < у2- (1- yi sign х^Ш ) < 200. (2.295) Соотношение (2.295) вместе с (2.280) обеспечивает асимптотическую устойчивость^- кнутой системы управления. Фазовые портреты замкнутых дискретно-непрерывных систем (2.285), (2.287) и (2.285), (2.293) при at = - 0,9,0! = 1,02 = 1 и а2 = - 0,9, yt = 1,^1 приведены на рис.2.9 и рис.2.10, соответственно. Из результатов моделирования видного поведение систем (2.285), (2.287) и (2.285), (2.293) в первом и четвертом квадрантах одИЙ- ковы, а во втором и третьем квадрантах, когда xis[A:] < 0, для системы (2.285), <2.293) характерно более стремительное вхождение траекторий в окрестность многообразм гр2 [Л] =0 в ее фазовом пространстве. 7* з ‘ Пример 2.19. Синтезируем закон управления электроприводом постоянного тока: !W xi(r) = - Х|Х2+ х2; . x2(f) = - х2+ и [Л], (2.196) 162
х2 (2.297) (2.298) Рис. 2.10 дел—отклонение скорости, хг—ток, и—напряжение обмотки возбуждения. Запишем систе- му (2.296) в разностной форме: ’ xi [*+1 ] = xi Ш - Тх! [Л] х% [Л] + Тх2 [£]; х2[к+1] = (1 - Т)х2[Л] + Ти[Л]. Въедем агрегированную переменную г' 1р[к] =х2Ш + 0Х1Ш. Подставляя (2.298) в (2.279), получим выражение ... х2[Л+11 + 0X1 [Л+1 ] + ахг[Л] + а0х\ [Л] = 0, или с учетом уравнений (2.297) имеем ' J (1 - Т+ 0Т+ a)x2 [£] + (1 + a)0xi [Л] - 0Тхх [А] х2 [Л] + Ти [Л] = 0. Жатого уравнения найдем следующий закон управления: ь «И = - (1+ a)0xi [к]/Т- (а+ 0Т+ Т- l)x2[k]/T+ 0Xi [Л]х2И. ( ^ Коэффициент 0 определим, исходя из условия устойчивости замкнутой системы (2.297), (2*299) на многообразии ip [А] =0. Уравнение движения вдоль многообразия ip [Л] =0 получим, йфйзив из (2.298) хг[^] и подставив его в первое уравнение системы (2.297): т xiv [*+1 ] - (1 - 0Т- Трх^ [Л] )xlv, [Л] = 0. (2.300) Тйда, используя (2.290), получим условие устойчивости уравнения (2.300) в виде неравенства \l-0T-T02x2^[k}\ < 1, (2.299) 4 О<0+02хЪ,\к} <УТ. ,т /Эти соотношения вместе с (2.280) определяют условия асимптотической устойчивости .синтезируемой системы управления. Приняв, например, максимально возможное значение ха^динаты Ixiyl < 5, получим: 4 • ' 0 < j8+ 2502 < VT, О < 0 < 0,16+ о.Уг- 0,4. 163
*2 Рис. 2.11 •I При Т = 0,01 с. условие устойчивости принимает вид: 0 < $ < 8,55. На рис.2.11 изобразим траектории замкнутой системы при а = - 0,9, fl = 1. Из рисунка видно, что на плоскости^, хг существует притягивающее многообразие у [Л] =0. Замкнутая дискретно-непрерывнаясйс- тема (2.297), (2.299) асимптотически устойчива и имеет апериодический характер переходив процессов. $ 1 Пример 2.20. Рассмотрим задачу синтеза закона управления объектом, движение которого описывается следующими нелинейными дифференциальными уравнениями: xi(f) = axj— 6x1X2+ и, u i хг(() = - схг+ тх\хг- (2.^1) Эти уравнения называются моделью Вольтерры—Лотки [244] и описывают динамику числен- ности популяций в экологической системе “хищник—жертва”. Такого рода моделями могут (дев представлены две биологические популяции, борющиеся за свое выживание; процессы вырапй- ния сельскохозяйственных культур; экономические процессы типа “ресурс—потребитель” и тд [244—246]. В биологической интерпретации переменные и параметры уравнений (2.301) имеют следующее содержание: xi(()—плотность популяции жертв, х2(0—плотность популяции хищйи- ков в определенный момент времени; u(t)—управление, действующее на популяцию жертв; т—положительные числа, характеризующие межвидовые взаимодействия. Уравнения (2.301) описывают экологическую эволюцию при взаимодействии двух ляций, каждая из которых стремится повысить свою выживаемость в окружающей среде. Есл предположить, что в среде отсутствуют хищники и имеются ресурсы для обитания, то тргда эволюцию соответствующей популяции можно представить в виде логистического уравнена х$(0 = rs(ks- Xj)x$, (2.302) где ks—несущая способность окружающей среды. В соответствии с уравнением (2.302) любом начальном состоянии х& популяция со временем выходит на стационарное состой» Xsycm = ks, зависящее от несущей способности окружающей среды. В процессе эволюцм природных систем значения экологических параметров rs и ks изменяются, а каждое экологи- ческое равновесие х5уст = ks, носит лишь временный характер. В результате такого изменШй 164
параметров экологическая ниша последовательно заполняется теми видами популяций, у юторых величина ks становится больше, чем у других видов. Происходит последовательное штеснение предшествующих видов, имеющих более низкую несущую способность. При вза- имодействии между популяциями в форме “хищник—жертва” экологическая эволюция будет описываться уравнениями вида (2.301) и носит наиболее сложный характер. Отсюда следует весьма важный вывод: при управлении экологическими системами, опи- оиаемыми уравнениями типа “хищник—жертва”, целесообразно выбирать такие инвариант- ные многообразия ^s(xi,...,xn)=0 в методе АКАР, движение вдоль которых описывается соот- кгствующими логическими уравнениями вида (2.302). Выбор таких инвариантных многооб- разий ^s=0 обеспечивает естественный характер эволюции каждой популяции и соответствует принципу самоподобного, самосогласованного поведения, характерного для биологических процессов самоорганизации [83, 144, 235]. Другой отличительной особенностью экологических уравнений вида (2.301), помимо естественного характера выбора инвариантных притягивающих многообразий, является оче- вадная необходимость перехода от непрерывного к дискретному описанию. Дело в том, что состояние тех или иных популяций сравнивается обычно через заданные интервалы времени (еинтервалами, например; месяц, полгода, год и т.д.). Кроме того, само количество xs каждой ишуляции всегда дискретно по своему существу. В этой связи необходимо перейти от непре- рывной модели (2.301) к дискретной в виде следующих разностных уравнений: *1 [А+ И = (1+ аТ)хх [Л] - ЬТхх [А]х2[А] + Ти[к], хг [А+1] = (1 - сТ)х2 [А] + тТхх [Л] х2 [Л]. (2.303) Выберем следующую макропеременную: [*] = - Л)+ 02(х2 [Л] - В). (2.304) Тогда, подставляя (2.304) в (2.279), получим выражение •я. faxi [А+1] + /?2х2[А+1] - faA- faB+ afi\X\ [Л] - /ЗцахгЩ - = 0, дажуда при учете уравнений (2.303) находим закон управления ,,г _ 1+аТ+а jg2(l- сТ+ a) fam- fab и [А] у, xi [А] у, х2 [А] Х\ [А] х2 [А] + 1+« /?2(1+«) » (2.305) + т а+ в. Этот закон управления переводит изображающую точку в окрестность многообразия =0 (2.304), движение вдоль которого описывается следующим логистическим уравнени- ем: (2.306) х2ДА+1] = ^1-сТ+ тТ^А+^)--^^х2ДА])х2ДА]. Условие устойчивости решений уравнения (2.306) имеет вид 1- сТ+ тт(л+ хър[А] < 1. у , fa ) fa Эго условие совместно с (2.280) обеспечивает асимптотическую устойчивость замкнутой системы (2.203), (2.305). В установившемся режиме значения переменных равны _ с _ т(А+ ДгВ)- fac ’’ Ххуст- т, Х2уст~ р2т Hi рис. 2.12 для параметров а = 4, b = 2,5; с = 2; т = 1; А = 1; В = 1; fa = 1; fa = 5; а=-0,5; Т = 0,01 приведены результаты моделирования синтезированной системы. Из этого рисунка видно, что управление (2.305) асимптотически устойчиво поддерживает заданный установившийся режим xi уст = 2; х2 уст = 0,8 при значительном диапазоне изменения дачаль- пк условий замкнутой системы. Разумеется, что рассмотренная простая задача управления экологической системой “хищ- кик.—жертва” не охватывает огромного разнообразия явлений, происходящих в таких систе- мюси возникающих при этом специфических задач управления [246]. Проблема управления жнюгическими системами—это самостоятельная и чрезвычайно важная современная пробле- 165
Рис. 2.12 ма не только с точки зрения теории управления, но и в глобальном смысле. РешениеЗгой проблемы требует развития новых подходов в теории управления с обязательным учел» естественных свойств экологических систем. На примере задачи управления системой “ййц- ник—жертва” (2.301) здесь показан эффективный способ учета естественных особенное^, основанный на введении логических уравнений вида (2.302) в качестве желаемых инвариант- ных многообразий, к которым устремляются все траектории движения. Выбор такого ив притягивающих инвариантных многообразий и следует, на наш взгляд, положить в основу синергетической теории управления экологическими системами. 166
ГЛАВА] П АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ АГРЕГИРОВАННЫХ НЕЛИНЕЙНЫХ РЕГУЛЯТОРОВ ПО ЗАДАННОЙ СОВОКУПНОСТИ ИНВАРИАНТНЫХ МНОГООБРАЗИЙ Знание некоторых принципов нередко возме- щает незнание некоторых фактов. Гельвеций При изучении наук примеры не менее поучи- тельны, чем правила. И. Ньютон х , Во второй главе на основе синергетического подхода был разработан метод аналитического ддецтеза нелинейных систем, базирующийся на введении агрегированной' макропеременной, угорая представляет собой некоторую обобщенную функцию (в простейшем случае—линей- ную) исходных фазовых координат. Затем относительно этой функции осуществлялись про- Н^ры оптимизации с использованием квадратичных и неквадратичных оптимизирующих функционалов. Законы управления находились на основе функционального уравнения в ре- зультате простых аналитических процедур. Указанный подход можно интерпретировать как достроение такого управления, которое сначала переводит изображенную точку из произволь- ного начального состояния на некоторое, заранее выбранное, единственное многообразие ^=0, являющееся притягивающим, а затем обеспечивает устойчивое с соответствующим шеством движение вдоль этого многообразия к началу координат фазового пространства. Йяаче говоря, осуществлялась двухэтапная процедура движения изображающей точки сначала ^выбранному многообразию, а затем к началу координат фазового пространства. Эта задача выла названа простейшей задачей аналитического конструирования агрегированных регуля- пфов—АКАР. •7‘ Указанный подход можно обобщить путем введения “последовательной” или “параллель- Ябй”совокупности притягивающих многообразий0(5= 1,2,..,7<п) в фазовом простран- стве синтезируемых систем. Эти многообразия представляют собой некоторые целевые мно- хества, которые связаны с программой движения. Выбор этой программы достаточно произ- ДОден и может производиться, исходя из самых различных требований к конкретной системе. Программа и, следовательно , цель движения могут быть записаны в виде одного, как это доказано во второй главе, или нескольких уравнений, связывающих фазовые координаты в&екта управления. Общее число этих уравнений в принципе ничем не ограничено, оно только Должно быть лишь меньше (или равно) размерности фазового пространства объекта. Задава- ема программа отражает желание проектировщика в отношении динамических свойств син- «аируемой системы при достижении поставленной цели управления. Свобода выбора програм- 167
мы движения в развиваемом здесь методе АКАР выгодно его отличает от известных чрезмерно формализованных методов, например, основанных на строгом постулировании тех или иных функционалов. Указанное обстоятельство предоставляет широкие возможности проектирвв- щику системы управления, который может изменить или дополнить первоначальную програм- му, т.к. обычно поставленной задаче управления соответствует более чем одна программа, важно только, чтобы эта программа обеспечивала достижение поставленной цели движения. Иначе, развиваемые в этой книге методы АКАР обладают немалой эвристической силой, позволяющей проектировщику в зависимости от возможностей физической реализации, удоб- ства анализа и синтеза систем осуществить выбор той или иной программы движения. Указав ная возможность варьирования программ движения путем выбора соответствующих агрегиро- ванных макропеременных позволяет проектировщику разнообразить и расширить свои воз- можности на этапе синтеза системы управления, т.е. выбора ее структуры, параметров и законов управления, удовлетворяющих заданным требованиям к качеству переходных и уста- новившихся режимов движения. В этой и последующих главах получили дальнейшее развитие методы АКАР, на основе которых находятся соответствующие законы управления, позволяю- щие таким образом изменить дифференциальные уравнения исходного объекта, чтобы пол- ученные в результате этого уравнения замкнутой системы были, во-первых, совместные выбранной программой движения и, во-вторых, не противоречили законам природы, которым подчиняются все движения рассматриваемого нелинейного объекта. 3.1. АНАЛИТИЧЕСКИЙ СИНТЕЗ АГРЕГИРОВАННЫХ РЕГУЛЯТОРОВ НА ОСНОВЕ КОНСТРУИРОВАНИЯ ПОСЛЕДОВАТЕЛЬНОЙ СОВОКУПНОСТИ ИНВАРИАНТНЫХ МНОГООБРАЗИЙ В предыдущих разделах книги было показано, что в фазовом пространстве динамических систем могут существовать многообразия, к которым притягиваются фазовые траектории. В общем случае можно построить несколько таких многообразий, которые, очевидно, включай в себя некоторые поверхности притяжения. Тогда возникает идея конструирования такой совокупности поверхностей притяжения, чтобы изображающая точка, начав двигаться из произвольного начального состояния, последовательно перемещалась от одной поверхности притяжения к другой, пока не попадет на последнюю поверхность, совпадающую или ведущую к началу координат фазового пространства [69]. Такой подход позволит обобщить развитый во второй главе метод аналитического синтеза нелинейных систем управления, оптимальных относительно агрегированных макропеременных, который основан на двухэтапной процедур синтеза, когда изображающая точка сначала сближается с некоторым притягивающим много- п ‘ образием, например вида V7 = 2 РкХк = 0, а затем за счет должного выбора коэффициент# организуется устойчивое движение вдоль ip = 0 к началу координат (xi = хг = ... = хп = $ фазового пространства. Представляется естественным расширить и обобщить указанный под; ход путем введения нескольких притягивающих многообразий ipi = 0,..., 1рт= 0 (т<п-1) по- нижающейся размерности. В этом случае изображающая точка сначала сближается с многооб- разием ipi= 0, затем с ip2= 0 и т.д. После сближения с последним многообразием ipm=Q организуется процесс устойчивого движения к началу координат. Ранее отмечалось, что размерность первого многообразия тр\ = О равна п—1 и, следователе но, уравнения движения (2.105) вдоль ^1=0 будет также иметь размерность п-1. Размерность второго притягивающего многообразия ip2= 0 будет на единицу меньше, т.е. равна п-2. Аналогично в общем случае при