Text
                    инергетика
От прошлого
к будущему
Г. Г. Малинецкий
МАТЕМАТИЧЕСКИЕ
ОСНОВЫ
СИНЕРГЕТИКИ
*	Нелинейные явления
•	Аттракторы
Теория бифуркаций
•	Теория катастроф
. Системы с дискретным
временем

Синергетика: от прошлого к будущему Г. Г. Малинецкий МАТЕМАТИЧЕСКИЕ ОСНОВЫ СИНЕРГЕТИКИ Хаос, структуры, вычислительный эксперимент Издание шестое URSS МОСКВА
ББК 22.161.7 22.18 22.318 22.333 24.5 28.071 65.050 Малинецкий Георгий Геннадьевич Математические основы синергетики: Хаос, структуры, вычислитель- ный эксперимент. Изд. 6-е. — М.: Книжный дом «ЛИБРОКОМ», 2009. — 312 с. (Синергетика: от прошлого к будущему.) Настоящая книга представляет собой введение в нелинейную динамику, си- нергетику и другие области «нелинейной науки». В ней наводятся мосты между традиционными естественно-научными дисциплинами, математическими курсами и фундаментальными проблемами, над которыми сейчас работают ученые. Книгу отличает ясное и наглядное изложение материала, большое количест- во иллюстраций. Она содержит около сотни задач различных уровней сложности. В основу книги легли вводные курсы нелинейной динамики и математического моделирования, читавшиеся в течение ряда лет в МГУ и МФТИ, а также опыт работы группы ученых Института прикладной математики им. М. В. Келдыша РАН. Издание рассчитано на студентов, аспирантов, специалистов в смежных об- ластях, на всех, кого интересуют идеи, перспективы, методы и проблемы синерге- тики. На 1 -й странице обложки фрагмент картины М. К. Эшера «Рябь на поверхности» (М. С. Escher. Rippled surface. 1950) Издательство «Книжный дом “ЛИБРОКОМ”». 117312, Москва, пр-т Шестидесятилетия Октября, 9 Формат 60*90/16. Печ л 19,5. Зак № 2333 Отпечатано в ООО «Л ЕН АНД» 117312, Москва, пр-т Шестидесятилетия Октября, 11 А, стр 11 ISBN 978-5-397-00663-7 © Г. Г. Малинецкий, 1997, 2009 © Книжный дом «ЛИБРОКОМ», 2009 НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА ”]Г| E-mail URSS@URSSru Хк Каталог изданий в Интернете http://URSS.ru J Тел/факс 7(499)135-42416 URSS Тел/факс 7(499)135-42-46 7077 ID 95707 785377 006637 Все права защищены. Никакая часть настоящей книги не может быть воспроизведена или передана в какой бы то ни было форме и какими бы то ни было средствами, будь то элек- тронные или механические, включая фотокопирование и запись на магнитный носитель, а также размещение в Интернете, если на то нет письменного разрешения владельцев.
Оглавление От редакции................................................. 5 Предисловие к четвертому изданию............................ 7 Предисловие................................................. 9 Глава 1 Математическое моделирование в современном мире и нелинейные явления....................................... 13 Вычислительный эксперимент. Триада: модель — алгоритм — программа.................. 16 Иерархия упрощенных моделей ........................... 18 Моделирование динамики популяций....................... 19 Рекомендуемая литература............................... 24 Глава 2 Линейные математические модели............................. 27 Вопросы и задачи....................................... 45 Рекомендуемая литература............................... 47 Глава 3 Простейшие нелинейные модели............................... 49 Математический маятник................................. 49 Исследовательская программа А. Пуанкаре................ 67 Вопросы и задачи....................................... 73 Рекомендуемая литература............................... 75 Глава 4 Аттракторы уравнения х = v(x)............................... П Качественная теория уравнения х — v(x) ................ 77 Теоремы сравнения...................................... 80 Корректность и модели нелинейных явлений............... 91 Вопросы и задачи........................................102 Рекомендуемая литература................................103 Глава 5 Элементы теории бифуркаций.................................105 Развитие теории бифуркаций...............................ИЗ Вопросы и задачи........................................126 Рекомендуемая литература................................127
4 Оглавление Глава 6 Математические модели теории катастроф.....................129 Структурная устойчивость и идеи теории катастроф.......144 Вопросы и задачи.......................................171 Рекомендуемая литература...............................173 Глава 7 Простейшие системы с дискретным временем...................175 Сценарий Фейгенбаума...................................179 Элементы теории универсальности........................186 Переход к хаосу........................................188 Шумящие циклы, окна периодичности, перемежаемость......191 Вопросы и задачи.......................................198 Рекомендуемая литература...............................200 Глава 8 Автоколебания и предельные циклы...........................203 Сингулярные возмущения, «утки», жесткие системы........230 Вопросы и задачи.......................................241 Рекомендуемая литература...............................242 Глава 9 Топологические методы в исследовании нелинейных систем.....245 Вычислительный эксперимент, молекулярный дизайн и топологические методы................................263 Вопросы и задачи.......................................267 Рекомендуемая литература...............................270 Глава 10 Нейронные сети.............................................273 Нейронаука.............................................273 Элементарные представления о работе мозга..............276 Модель Хопфилда........................................278 Смысл хаоса............................................287 Многослойные нейронные сети ...........................293 Алгоритм обратного распространения ошибки .............303 Вопросы и задачи.......................................306 Рекомендуемая литература...............................307
От редакции Издательство URSS продолжает серию книг «Синергетика: от про- шлого к будущему». Синергетика, или теория самоорганизации, сегодня представляется одним из наиболее популярных и перспективных междисциплинарных подходов. Термин синергетика в переводе с греческого означает «совмест- ное действие». Вводя его, Герман Хакен вкладывал в него два смысла. Первый — теория возникновения новых свойств у целого, состоящего из взаимодействующих объектов. Второй — подход, требующий для своей разработки сотрудничества специалистов из разных областей. Но это привело и к замечательному обратному эффекту — синергети- ка начала оказывать все большее влияние на разные сферы деятельности и вызывать все больший интерес. Сейчас этим подходом интересуются очень многие — от студентов до политиков, от менеджеров до активно работающих исследователей. Синергетика прошла большой путь. Тридцать лет назад на нее смот- рели как на забаву физиков-теоретиков, увидевших сходство в описании многих нелинейных явлений. Двадцать лет назад, благодаря ее концепци- ям, методам, представлениям, были экспериментально обнаружены мно- гие замечательные явления в физике, химии, биологии, гидродинамике. Сейчас этот междисциплинарный подход все шире используется в страте- гическом планировании, при анализе исторических альтернатив, в поиске путей решений глобальных проблем, вставших перед человечеством. Название серии «Синергетика: от прошлого к будущему» тоже со- держательно. Как говорил один из создателей квантовой механики, при рождении каждая область обычно богаче идеями, чем в период зрелости. Видимо, не является исключением и синергетика. Поэтому мы предпола- гаем переиздать часть «синергетической классики», сделав акцент на тех возможностях и подходах, которые пока используются не в полной мере. При этом мы надеемся познакомить читателя и с рядом интересных работ, ранее не издававшихся на русском языке. «Настоящее» — как важнейший элемент серии — тоже понятно. В эпоху информационного шума и перманентного написания то заявок на гранты, то отчетов по ним, даже классики синергетики очень немного знают о последних работах коллег и новых приложениях. Мы постара- емся восполнить этот пробел, представив в серии исследования, которые проводятся в ведущих научных центрах страны. «Будущее...» — это самое важное. От того, насколько ясно мы его представляем, зависят наши сегодняшние усилия и научная стратегия. Прогнозы — дело неблагодарное, — хотя и совершенно необходимое. Поэтому ряд книг серии мы надеемся посвятить и им.
6 От редакции В редакционную коллегию нашей серии любезно согласились войти многие ведущие специалисты в области синергетики и нелинейной ди- намики. В них не следует видеть «свадебных генералов». В их задачу входит анализ развития нелинейной динамики в целом и ее отдельных областей, определение приоритетов нашей серии и подготовка предло- жений по изданию конкретных работ. Поэтому мы указываем в книгах серии не только организации, в которых работают эти исследователи, но и важнейшие области их научных интересов. И, конечно, мы надеемся на диалог с читателями. При создании меж- дисциплинарных подходов он особенно важен. Итак, вперед — в будущее. В нашей серии уже вышло более сорока книг общим тиражом около ста тысяч экземпляров. Серия начала издаваться на испанском языке. Однако мы уверены, что и самые глубокие проблемы синергетики, и самые интересные книги серии впереди. Редакционная коллегия серии «Синергетика: от прошлого к будущему» Председатель редколлегии: Г. Г. Малинецкий, Институт прикладной математики им. М. В. Келдыша РАН (слож- ность, хаос, прогноз). Члены редколлегии: Р. Г. Баранцев, Санкт-Петербургский государственный университет (асимптотоло- гия, семиодинамика, философия естествознания). А. В. Гусев, Институт прикладной математики им. М. В. Келдыша РАН (вычисли- тельная гидродинамика, технологии, медицина). А. С. Дмитриев, Институт радиоэлектроники РАН (динамический хаос, защита информации, телекоммуникации). В. П. Дымников, Институт вычислительной математики РАН (физика атмосферы и океана, аттракторы большой размерности). С. А. Кащенко, Ярославский государственный университет им. П. Г. Демидова (асимп- тотический анализ нелинейных систем, образование, инновации). И. В. Кузнецов, Международный институт теории прогноза землетрясений и ма- тематической геофизики РАН (анализ временных рядов, вычислительная сейсмология, клеточные автоматы). А. Ю. Лоскутов, Московский государственный университет им. М. В. Ломоносова (эргодическая теория, биллиарды, фракталы). И. Г. Поспелов, Вычислительный центр им. А. А. Дородницина РАН (развивающи- еся системы, математическая экономика). Ю.Д. Третьяков, Московский государственный университет им. М. В. Ломоносова (наука о материалах и наноструктуры). Д. И. Трубецков, Саратовский государственный университет им. Н. Г. Чернышев- ского (теория колебаний и волн, электроника, преподавание синергетики). Д. С. Чернавский, Физический институт им. П. Н. Лебедева РАН (биофизика, эко- номика, информация). Наш электронный адрес — synergy@keldysh.ru
Предисловие к четвертому изданию Эта книга представляет собой вводный курс математического моделирования нелинейных процессов. Этот курс мне довелось читать на факультете вычисли- тельной математики и кибернетики МГУ им. М. В. Ломоносова и последний де- сяток лет на кафедре прикладной математики Московского физико-технического института. Лекции рассчитаны на студентов, представляющих общий курс математики в пределах естественно-научных или математических факультетов университетов. Вместе с тем книга успешно используется и третьекурсниками технических ВУЗов, интересующимися научной работой. В МФТИ, чтобы сдать этот курс, обычно до- статочно в течение одного дня решить три задачи по выбору преподавателя из числа приведенных в книге. Практика показывает, что для физтехов, осознав- ших серьезность задачи получения допуска к сессии, это вполне посильная задача. Выпуск этой книги в серии «Синергетика — от прошлого к будущему» мне представляется сейчас очень важным. Дело в том, что растущая популярность идей и концепций синергетики, стремительный рост числа неофитов этого междисци- плинарного направления, поставили ряд проблем. Во-первых, это «размывание» и упрощение нескольких важных и плодотворных идей, лежащих в основе си- нергетики. Во-вторых, это широкое использование «синергетических терминов» в ситуациях, статьях, книгах, совершенно для этого не подходящих. В-третьих, «гуманитаризация» синергетики — стремление видеть в этом направлении только философскую или методологическую ипостась, напрочь отбрасывая естественно- научную основу. В-четвертых, появление множества синергетических объедине- ний, возникающих как дань моде и сулящих в недалеком будущем появление «проблемы детей лейтенанта Шмидта» из небезызвестного «Золотого теленка»... Поэтому крайне важно дать представление студентам о «твердом ядре», ключевых идеях синергетики, о ее математических основах. Собственно эту задачу и решает представленный курс лекций. Это подчеркивает и новое название книги (старое осталось в подзаголовке). Другими словами, в книге представлен своеобразный «синергетический минимум» для тех, кто собирается использовать или развивать этот подход в естественных науках. Еще несколько слов о книге. Опыт преподавания показывает, что наибольшие трудности и у «физтехов», и у «нефизтехов» вызывает глава, в которой напоминаются основные сведения о линейных математических моделях. И даже не сама глава, а ее часть, связанная с обобщенными функциями, с их использованием для решения уравнений матема- тической физики. Тем не менее этот раздел оставлен в первозданном виде по одной причине. Он следует физтеховской традиции построения курса математической физики. Эта традиция была заложена академиком Василием Сергеевичем Влади- мировым и в соответствии с ней и поныне строится преподавание этого курса 1). Этот подход позволяет излагать многие вопросы кратко, ясно и единообразно. Тем не менее, если читателю ближе другие подходы, если он учился по другим учебникам, то вспоминать основы математической физики естественно, пользуясь Владимиров В. С. Уравнения математической физики. М.: Наука, 1967.
8 Предисловие к четвертому изданию ими. Могу обратить внимание на курсы, написанные в свое время сотрудниками Института прикладной математики АН СССР. Это «Элементы прикладной мате- матики» академика Якова Борисовича Зельдовича, где представлен взгляд физика на те же проблемы. Или фундаментальный курс «Уравнения математической физики» академиков Андрея Николаевича Тихонова и Александра Андреевича Самарского, подробно рассматривающий множество задач линейной математиче- ской физики. Замечу, что все три упомянутые книги были недавно переизданы. В любом случае обсуждаемая глава носит вспомогательный характер и не должна служить камнем преткновения для студентов, осваивающих предмет. В конце курса студенты часто высказывают пожелание услышать о приложе- ниях методов нелинейной динамики, отличных от тех, которые рассматривались по ходу курса (методы защиты информации, диагностика сердечных заболеваний по изменению фрактальной размерности реконструированного аттрактора и т.д.). Исходя из этого пожелания, в настоящее издание добавлена последняя глава, в которой рассматривается концепция нейронауки, опирающаяся на представле- ния о самоорганизации и динамических системах. Кроме того, и в нашей серии, и в других издательствах вышло много отличных книг дополняющих этот курс. Многое появилось в Интернете. Это позволило су- щественно расширить список рекомендованной литературы с тем, чтобы читатель мог найти в нем то, что ближе ему и по духу, и по области научных интересов. Если после чтения представленных «Основ» у читателя возникнет (или не пропадет) желание двинуться дальше в область синергетики, я буду считать свою задачу выполненной.
Предисловие Основным препятствием для широкого использования математического мо- делирования и вычислительного эксперимента в науке, технике, управлении является недостаток квалифицированных специалистов. Решение ряда крупных проблем сдерживается не отсутствием компьютеров, а недостатком коллективов, работающих на современном уровне. Требования, предъявляемые к специалисту в области математического моде- лирования, весьма высоки и вместе с тем противоречивы. С одной стороны, он должен быть профессионалом, глубоко понимающим достаточно узкую конкрет- ную область исследований. С другой стороны, обычно ему приходится выступать не как исполнителю, а как ученому, который видит проблему в целом и способен уточнить, а иногда и радикально изменить постановку задачи, предложенную физиками, химиками или биологами. Работа в области математического мо- делирования предполагает своеобразный стиль мышления, в котором глубина и конкретность сочетаются с широтой и пониманием общих идей. Кроме того, успех в математическом моделировании при решении боль- шинства серьезных задач опирается, как на трех китов, на триаду: модель — алгоритм — программа. Поэтому, чтобы верно наметить стратегию исследований, нужно хорошо представлять имеющийся инструментарий и основные достижения в каждой из областей. Это очень важно, поскольку, например, вычислительная математика сегодня все чаще выступает не только как инструмент, но и как источник новых идей в моделировании, физике, естествознании. На эту связь неоднократно обращается внимание в книге. Центральным моментом при решении многих крупных проблем, начиная с совершенствования химической технологии и проблемы управляемого термо- ядерного синтеза и кончая актуальными задачами квантовой теории поля и со- зданием нового поколения компьютеров, является анализ нелинейных явлений. В обширной области, часто называемой сейчас нелинейной наукой, или нели- нейной динамикой, возникли свои оригинальные подходы, новые идеи и методы. Цель настоящей книги — познакомить студентов старших курсов, аспирантов и заинтересованных специалистов с этой дисциплиной. В 70-х гг. началась и продолжается до настоящего времени научная револю- ция, связанная с появлением новой технологии научных исследований — вычис- лительного эксперимента. Ее следует рассматривать как новую ступень в развитии математического моделирования, пронизывающего большинство областей науки. Главное из того, что дал вычислительный эксперимент, — возможность анализировать нелинейные явления в физике, химии, биологии, социологии — привело к рождению новых идей, теорий, методов, к развитию междисципли- нарных подходов. Это, в свою очередь, помогло сформулировать новые понятия и открыть замечательные явления природы. По-видимому, наиболее удивительное в области моделирования состоит в том, что небольшое число сравнительно про- стых математических моделей дает ключ к пониманию и исследованию огромного количества различных явлений. Таким моделям — их часто называют базовыми — а также концепциям, родившимся при их анализе, и посвящена эта книга.
10 Предисловие В ее основу положен материал лекций и семинаров, которые в течение ряда лет проводились на кафедре численных методов факультета вычислительной математики и кибернетики МГУ, а также в МФТИ. Опыт работы с аспирантами и старшекурсниками показал, что у многих из них есть существенный пробел в образовании. Разобравшись в каких-то частных вопросах, сдав множество общих и специальных курсов, они слабо представляют область, в которой им предстоит работать, взаимосвязи между моделями, алгоритмами и современными проблемами. За формализмом и конкретными задачами они иногда не видят идей и контекста, в котором такие задачи имеют смысл. Это затрудняет чтение оригинальной научной литературы и порой довольно долго не позволяет начать самостоятельные исследования. Я буду считать свою задачу решенной, если работа студентов и аспирантов над книгой позволит отчасти восполнить этот пробел или хотя бы осознать его наличие. Стиль книги во многом определяется опытом преподавания. Отдельные во- просы, обычно легко воспринимаемые студентами, излагаются конспективно. Ряд фундаментальных результатов математической физики, вычислительной матема- тики, теории динамических систем, обсуждавшихся в предшествующих курсах, без которых невозможен анализ нелинейных явлений, приходится напоминать. И од- новременно с этим некоторые важные проблемы, недостаточно освещенные или совсем не затронутые в учебной литературе, рассматриваются весьма подробно. В книге приведено большое количество примеров и иллюстраций. Там, где это возможно, основное внимание уделено ключевым идеям и конкретным моделям, ради которых и создавались те или иные инструменты. В ряде случаев пришлось пожертвовать общностью, строгостью и рядом технических деталей ради наглядности. Книга рассчитана на активного заинтересованного читателя. Поэтому в каж- дой главе приводятся ссылки на различную литературу, начиная от стандартных учебников и кончая монографиями, обзорами и оригинальными статьями, ко- торые помогут более глубоко ознакомиться с обсуждаемой проблемой. Список литературы не претендует на полноту. В нем обращается внимание на наиболее простые и доступные источники. Для удобства читателей он снабжен коммента- риями, показывающими, что и где можно найти. Важно, чтобы читатель не только многое знал, но и умел решать элемен- тарные задачи, связанные с анализом нелинейных явлений. Поэтому в книге приводится около сотни задач, использовавшихся при проведении семинаров. Объем книги примерно соответствует полугодовому вводному курсу, сопро- вождаемому семинарами, который читается студентам — математикам, физикам, вычислителям — на четвертом-пятом курсах. У этих студентов за плечами курсы математического анализа, линейной алгебры, математической физики, численных методов, теоретической физики. Однако большой интерес к курсу моделирования нелинейных явлений проявляли химики, биологи, инженеры, не обладающие столь солидной подготовкой. Их интересы также в определенной мере учте- ны. В книге обращается внимание на некоторые принципиальные результаты основных математических курсов, на которые опирается изложение. Осталось сказать, что предлагаемый материал отражает лишь небольшую часть нелинейной науки, тесно связанную с вычислительным экспериментом, и представляет только фрагмент огромной области исследований. Выбор мате- риала отчасти диктовался субъективными пристрастиями автора. Представления нелинейной науки оказались созвучны творчеству Морица Эшера. В каждой главе помещена одна из работ этого художника.
Предисловие 11 Развитие науки XX в. показало необходимость построения множества различ- ных моделей для описания одного явления или объекта, создания альтернативных картин реальности. Мы вынуждены жить не в мире абсолютных законов, ис- тин в последней инстанции, всеобъемлющих концепций, поэтому исследователям приходится иметь дело с моделями, взглядами, фиксирующими одно и игнориру- ющими многое другое. Мы должны играть, создавая миры, в которых от нашего «настоящего», слишком сложного и запутанного, взято совсем немного. Пожалуй, именно в этой подчеркнутой условности, умении выделить немногое, парадок- сальности создаваемых миров, в кажущейся легкости и произвольности и состоит очарование работ Эшера. Лавина информации, порожденная компьютерами, заставила задуматься над тем, как ее понять, осмыслить, упорядочить, как воспользоваться тем богатством, которое нам досталось. Как разумно распорядиться открывшимися возможно- стями, отделить самое интересное от просто интересного? Решение оказалось по-эшеровски парадоксальным. Выход состоит в разработке междисциплинарных подходов, в создании новых миров. Становление и развитие кибернетики, синер- гетики, нелинейной динамики показали, что это не только возможно, но и за- хватывающе интересно. Не удивительно ли, что в журналах по нелинейной науке (“nonlinear science” — в англоязычных странах) можно увидеть статьи математиков и географов, психологов и физиков? Они осваивают новый нелинейный язык, ко- торый прячется за отдельными задачами, уравнениями, областями исследований. Возникает своеобразная натурфилософия компьютерной эры. Это игра с очень высокими ставками. В ходе ее может выясниться, какой смысл исследователи будут вкладывать в слово «понимать». Считаю приятным долгом выразить признательность своим учителям — С. П. Курдюмову, А. А. Самарскому, а также коллегам и ученикам, во многом опре- делившим подбор материала и стиль изложения. Я очень благодарен В. Г. Комаро- вой за огромную помощь в подготовке рукописи, а также П. В. Куракину и С. А. На- уменко, обратившим внимание на ряд неточностей в предыдущем издании.
Escher M. C. Reptiles. 1943 Эшер М. К. Рептилии
Плава 1 Математическое моделирование в современном мире и нелинейные явления Грядущая великая эра пробуждения челове- ческого разума принесет с собой метод по- нимания качественного содержания урав- нений. Сегодня еще мы не способны на это. Р. Фейнман Результаты математического моделирования (ММ) сейчас влияют, без преувеличения, на жизнь каждого человека. От политики государств, опирающейся на математические модели экономики и стратегической стабильности, до новых лекарств, проектируемых с помощью компью- теров. От поколения новых товаров, использующих ряд оригинальных технологий, до гигантских компьютерных систем, продающих авиабиле- ты, обеспечивающих телекоммуникации или издание газет. В сфере деятельности, связанной с ММ, все более важную роль иг- рают построение и анализ математических моделей нелинейных явлений. Остановимся на причинах этого. В 50-е гг. началась* научная революция, коренным образом изменив- шая роль математики в целом и вычислительной математики в частности в науке и технологии. Это было связано с реализацией двух крупных проектов — созданием ядерного оружия и освоением космического про- странства. Оба проекта потребовали огромных затрат ресурсов, тщатель- ного выбора наилучших вариантов. Сложность возникших задач делала их недоступными для стандартных приемов теоретической физики. Решение этих проблем стимулировало создание компьютеров и новых областей математики. В обоих случаях были сформированы научные коллективы, опыт которых позволил получить выдающиеся результаты в ряде областей науки. В нашей стране примером может служить Институт прикладной математики им. М. В. Келдыша, в США — исследовательские центры в Лос-Аламосе и Ливерморе. Возникла новая технология научных исследований — вычислительный эксперимент. Он включает в себя построение и исследование математи-
14 Глава 1 ческих моделей, связанное с использованием больших серий расчетов на ЭВМ. Он опирается также на использование классических методов математики и теоретической физики, теории алгоритмов, на разработку новых подходов, на создание и применение адекватных программных средств. В настоящее время ММ играет ключевую роль в анализе нескольких жизненно важных проблем, стоящих перед человечеством. Приведем пример. Энергетическая проблема и управляемый термоядерный синтез Благополучие человечества самым тесным образом связано с его энерговооруженностью. Например, за последние 50 лет затраты энергии на производство условной единицы сельскохозяйственной продукции в развитых странах возросли более чем в 100 раз. При этом урожайность зерновых возросла за этот период только в 3 раза. В мире сейчас проживает около 6 млрд человек, и средняя потребляе- мая на душу населения мощность составляет чуть более 2 кВт. Демографи- ческий прогноз ООН предсказывает быстрый рост численности населения земного шара в ближайшие 60-70 лет и к 2100 г. стабилизацию на уров- не 12 млрд человек. Утилизация отходов, обогащение руд, опреснение воды, возрастающие масштабы природоохранной деятельности потребу- ют довести потребляемую мощность на душу населения до величины, находящейся в диапазоне от 10 до 20 кВт. Истощение запасов энергоносителей, большие проблемы, связан- ные с атомной энергетикой, требуют поиска альтернативных источников энергии. Одна из возможностей связана с использованием энергии термоядер- ных реакций. Существуют три изотопа водорода, отличающихся числом нейтронов, — обычный водород Н], дейтерий D, и тритий Т3. Возможна следующая реакция: D + Т = Не4 + п + 17,6 Мэв, в результате которой возникает атом гелия Не4, нейтрон п и выделяется энергия, равная 17,6 Мэв. Напомним, что под электронвольтом понима- ется энергия, которую приобретает электрон при перемещении в элек- трическом поле в вакууме между двумя точками с разностью потенциалов в 1 вольт. 1 эв равен 1,60207 • 10“19 Дж. Для сравнения можно сказать, что 1 грамм дейтерий-тритиевой смеси может дать энергии больше, чем тонна условного топлива. Однако, чтобы такая реакция шла, нужно сблизить ядра до расстоя- ния 10“13 см, где начинают действовать ядерные силы. Для этого требуется преодолеть силы электростатического отталкива- ния, что требует гигантских температур, превышающих 100 млн градусов. Американский физик Дж. Лоусон вывел критерий, указывающий, в какой области параметров энергетические затраты на создание условий
Математическое моделирование в современном мире 15 термоядерной реакции меньше энергии, получаемой от самой реакции: пт > 1014 с • см-3, где п — концентрация реагирующей смеси, т — время реакции. Наиболее популярны оказались два подхода. Первый, предложенный А. Д. Сахаровым и И. Е. Таммом, связан с использованием магнитных полей для удержания ионизованного газа — плазмы. При этом обычно создают сложные системы катушек, излучателей, магнитов, окружающих тороидальную полость, в которой удерживается плазма. Такие установки получили название токамаков. Проектирование и создание токамаков оказалось чрезвычайно слож- ной научной и технической задачей и потребовало проведения огромного комплекса работ, связанных с математическим моделированием. В част- ности, пришлось развить новую науку — магнитную гидродинамику, изучающую свойства проводящей жидкости. В ходе поставленных вычис- лительных экспериментов были обнаружены новые физические явления. Например, группой исследователей из Института прикладной математики им. М. В. Келдыша был открыт эффект Т-слоя, внесенный в Государ- ственный реестр открытий. В натурном, физическом эксперименте этот эффект был обнаружен только через несколько лет. Одна из проблем, возникающих при магнитном удержании плазмы, связана с тем, что доступные магнитные поля сравнительно невелики. Они даже не позво- ляют удерживать плазму такой концентрации, как концентрация молекул в воздухе ~1019 см-3. Пока удается в течение секунд удерживать плазму с n ~ 1013 см-3. Поэтому конфигурацию магнитных полей приходит- ся выбирать очень тщательно, используя огромный арсенал созданных к настоящему времени моделей и самые современные компьютеры. Другой подход, предложенный нашими соотечественниками Н. Г. Ба- совым, О. Н. Крохиным и американцами Дж. Наккольсом, Э. Теллером, состоит в создании серии управляемых термоядерных микровзрывов. Для обычной водородной бомбы критерий Лоусона оказывается выполнен- ным, поскольку, благодаря взрыву атомной бомбы, удается создать очень высокие значения концентрации на время, пока продукты взрыва не успе- ли разлететься. Роль атомного боезаряда, сжимающего и нагревающего термоядерное горючее, в этом случае предстоит сыграть лазерам большой мощности. Анализ и реализация этого проекта уже потребовали многолетних сов- местных усилий физиков и специалистов в области математического моделирования. Вычислительный эксперимент играет ключевую роль в решении не только многих прикладных, но и фундаментальных проблем. Ряд таких задач есть в современной астрофизике. Большой взрыв и образование Вселенной В 60-70-е гг. огромные усилия ученых направлялись на исследо- вание структуры материи, изучение элементарных частиц. Были созда-
16 Глава 1 ны гигантские ускорители и вычислительно-измерительные комплексы, а также соответствующие математические модели. Последние позволили предсказать открытие новых элементарных частиц. С помощью компью- теров, анализирующих огромное количество фотоснимков, фиксирующих столкновения элементарных частиц, удалось обнаружить именно те редкие события, ради которых и ставились эксперименты. Однако в этой области вычислительному эксперименту предсто- ит стать не вспомогательным, а основным инструментом исследования. В самом деле — чем меньше пространственные масштабы, процессы на которых изучаются, чем больше масса открываемых частиц, тем боль- шими энергиями должны обладать ускоряемые частицы. Это, в свою очередь, требует увеличения размеров установок. В частности, создавав- шийся в США ускоритель, использующий сверхпроводящие магнитные системы SSC (сверхпроводящий суперколлайдер), должен был иметь диа- метр 84 км. Вероятно, и в отдаленном будущем не удастся увеличить размеры таких установок более чем на 2-3 порядка. Означает ли это, что процессы, происходящие на меньших масштабах, в принципе недоступны исследованию? По-видимому, нет. Уникальные условия были созданы в первые доли первой секун- ды Большого взрыва — акта творения нашего мира. О происшедшем в эти мгновения можно судить по косвенным данным, по излучениям, приходящим из далекого космоса, по частицам, прилетающим оттуда, по структуре Вселенной, доступной нашим наблюдениям. Судьба мира определяется фундаментальными свойствами элементарных частиц и на- оборот — свойства частиц могут быть определены, исходя из эволюции огромных космических объектов. Недавно возникшее направление нау- ки, рассматривающее Вселенную как гигантский ускоритель, получило название космомикрофизики. Один из главных результатов космомикро- физики — построение фундаментальных теорий, описывающих структуру вещества на микроуровне. В основе этих теорий лежат математические мо- дели, представляющие собой нелинейные дифференциальные уравнения. Обычно задачи математической физики относятся к прямым', извест- ны уравнения, краевые условия, начальные данные, и требуется опре- делить решение. Но в космомикрофизике, медицинской томографии, физике плазмы, геологии все чаще приходится иметь дело с так назы- ваемыми обратными задачами: известны некоторые параметры решения, те или иные особенности системы (априорная информация), и требуется восстановить характеристики изучаемой системы (например, уравнения, описывающие объект). Анализ и решение обратных задач сейчас стали важным направлением математического моделирования. Вычислительный эксперимент. Триада: модель - алгоритм - программа Новую технологию научных исследований — вычислительный экс- перимент — наглядно можно представить в виде схемы, приведенной
Математическое моделирование в современном мире 17 в заголовке. Учитывая требования к точности предсказаний и постановку проблемы, строят математическую модель. Исходя из наиболее важных особенностей изучаемой задачи, в данном конкретном классе систем разрабатывают алгоритмы. После оценки того, насколько широк будет круг исследователей, изучающих проблему, и какие ЭВМ доступны, создаются программные продукты. Это могут быть уникальные программные продукты или не- сложные программы для персональных компьютеров. Это могут быть пакеты прикладных программ, если речь идет о массовых расчетах, либо системы, включающие создание специализированных алгоритмических языков. После этого проводятся расчеты. Их результаты сравнивают с данными наблюдений или натурных исследований. И далее обычно происходит возврат к первому шагу, к построению моделей. В зависимо- сти от результатов сравнения предсказаний теории и реальности, модель модифицируют, уточняют, либо строят заново. В настоящее время ключевым звеном, определяющим эффективность использования вычислительной техники в науке и технологии, являются математические модели. Это стало особенно очевидно после появле- ния огромного множества персональных компьютеров и при создании проектов суперкомпьютеров. В первом случае количество персональных компьютеров, используемых для решения научных задач, а не для редак- тирования текстов, компьютерных игр, хранения деловой информации, оказалось ничтожно, а их влияние на развитие науки намного меньше, чем представлялось вначале. Во втором случае создание суперкомпьютеров во многом сдерживается отсутствием постановок задач, математических моделей, изучение которых принесло бы крупный экономический эффект, но которые не могут быть решены на существующих ЭВМ. Поскольку в дальнейшем речь в основном будет идти о математи- ческих моделях, приведем пример, иллюстрирующий взаимосвязь всех компонентов триады. Традиционными объектами моделирования являются системы, обес- печивающие процессы теплопередачи. «Докомпьютерная эра». Математические модели процесса теплопровод- ности линейны. Для решения используются метод разделения перемен- ных, а также асимптотические методы. Известно несколько автомодель- ных решений нелинейного уравнения теплопроводности. «Начало компьютерной эры». Простейшие нелинейные модели. Обычно используются простые разностные схемы, как наиболее быстрые и про- стые алгоритмически. Расчеты на ЭВМ ведутся небольшими группами исследователей. Производительность ЭВМ — десятки тысяч операций в секунду. Скромная компьютерная графика. У большинства исследова- телей свои собственные программы объема 102-103 команд на языках высокого уровня. Обычно решаются простейшие двумерные задачи, ко- торые сводятся к последовательности одномерных.
18 Глава 1 «Героический период». Огромное расширение круга задач, решаемых с помощью вычислительного эксперимента. Появление множества но- вых моделей теплопроводности, например, учитывающих ограничение теплового потока, изменение типа уравнения при определенных усло- виях. Необходимость решать отдельные трехмерные задачи. Развитие теории разностных схем, позволившее сформулировать фундаментальные принципы их построения, например, консервативность — выполнение разностных аналогов законов сохранения. Обычно используются неяв- ные разностные схемы и итерационные методы решения возникающих линейных уравнений. Появление ЭВМ с производительностью 106-107 операций в секунду. Появление пакетов прикладных программ объемом 104-105 операторов, привлечение к их созданию специалистов по си- стемному программированию. Возможность вести расчеты в диалоговом режиме. Черно-белая компьютерная графика, позволяющая строить ви- довые проекции и линии уровня распределений температуры. Современный этап. Необходимость в решении задач технологии рас- чета огромного количества сложных трехмерных конструкций. Появле- ние в распоряжении ученых и инженеров ЭВМ с производительностью 10п —1014 операций в секунду. Разностные схемы, адаптирующиеся к ре- шению. Возрождение прямых методов решения линейных уравнений с разреженными матрицами. Появление нового поколения алгоритмов, рассчитанных на проведение параллельных вычислений с помощью мно- гопроцессорных систем, транспьютеров. Создание пакетов прикладных программ, доступных с помощью компьютерных сетей широкому кругу инженеров. Возможность проводить расчеты уникальных конструкций с учетом множества физических процессов (вход «Шаттла» в атмосферу, тепловой расчет ракетных двигателей с целью оптимизации и т. д.). Цвет- ная графика, создание компьютерных фильмов, позволяющих проследить динамику процесса. Ближайшее будущее. Возможность построения «интеллектуальных» ком- пьютерных систем проведения тепловых расчетов, выбирающих, исходя из поставленной задачи и результатов ранее проведенных расчетов, мате- матическую модель и численный алгоритм. Использование компьютерных систем с высокой степенью параллельности, например, клеточных автома- тов, имитирующих тепловые процессы, а также нейросистем, способных делать выводы из накопленного опыта. Возможность поручить ЭВМ про- блему адекватного представления результатов расчетов. В ряде случаев — проведение тепловых расчетов в реальном масштабе времени с целью оп- тимизации технологических процессов. Огромные возможности решения обратных задач, позволяющие синтезировать тепловые поля желаемой конфигурации. Иерархия упрощенных моделей Работа над крупными проектами в таких областях как вычислитель- ная физика плазмы, гидродинамика, расчет атомных электростанций,
Математическое моделирование в современном мире 19 широкомасштабный анализ экологических процессов позволила сформу- лировать концепцию иерархии упрощенных моделей. В эпоху становления вычислительного эксперимента казалось, что изучение сложной системы аналогично складыванию мозаичной карти- ны. Например, при изучении биосферы, одной группе исследователей можно поручить строить модели атмосферы, другой — океана, третьей — биоценозов тундры. Затем эти куски-блоки сшиваются в единое целое и получается, по замыслу, прекрасная модель. Провал нескольких круп- ных проектов такого рода показал, что так поступать нельзя. Обычно получаются результаты, интерпретация которых не ясна. Поэтому приходится действовать иначе. Вначале выделяются основ- ные, ключевые процессы, играющие главную роль в изучаемом явлении на данных пространственных и временных масштабах. Затем строится еще более простая модель явления с меньшей областью применимости и учитывающая еще меньшее количество факторов. И так происходит до тех пор, пока не возникает простейшая модель, поведение которой уже понятно. Только после того как модель нижнего уровня изучена и понята, удается перейти на следующий, более высокий уровень. Можно сказать, что основным достижением и основной целью ис- следований при решении сложных задач является построение иерархии упрощенных моделей. При этом должно быть установлено, какой уровень модели разумно использовать в тех или иных случаях. Пока почти все построенные иерархии относятся к физическим системам. Идет строи- тельство иерархий в ряде областей химии и математической экономике. Эта проблема ставится в биологии. Замечательной чертой иерархии упрощенных моделей является нали- чие базовых математических моделей, т. е. таких математических объектов, исследование которых позволяет эффективно строить и изучать большие классы моделей различных явлений. Можно сказать, что базовые моде- ли часто выступают как кубики, с их помощью конструируют описание конкретного явления. Важно подчеркнуть два принципиальных факта, выяснившихся в последние двадцать лет. Во-первых, базовых математи- ческих моделей немного. Можно строить предельно простые нелинейные математические модели, которые являются глубокими и содержатель- ными. Во-вторых, с их помощью, не проходя все ступени иерархии, связанные с детализацией и усложнением математического описания, оказалось возможным предсказывать неизвестные явления природы. Глубина и универсальность простейших нелинейных математических моделей стали основой для создания междисциплинарных подходов. Моделирование динамики популяций Сказанное выше относится к крупным научным проектам, работу над которыми ведут большие исследовательские группы. Однако, это справедливо и на «микроуровне», при решении небольших задач.
20 Глава 1 Основная часть специалистов, занимающаяся моделированием нели- нейных процессов, сталкивается именно с этой ситуаций. Перед ними встает проблема анализа конкретной физической, химической, техниче- ской или какой-то иной системы. Требуется выделить наиболее важные черты в изучаемом явлении, найти количественные характеристики мо- делируемых процессов. Дать математическое описание системы. И затем использовать его для решения задачи прогноза, оптимизации, либо какой- то другой. Перед исследователем обычно стоит персональный компьютер, как правило, более мощный, чем ЭВМ, которыми располагали участники пер- вых ядерных или космических проектов. Ему самому приходится строить модели, выбирать алгоритмы, создавать или использовать имеющиеся программы. К сожалению, довольно часто применяемая стратегия состоит в том, чтобы взять модель, свойства которой непонятны и, не задумываясь об алгоритмах, воспользоваться каким-либо стандартным пакетом ком- пьютерных программ. Такие действия очень редко приводят к успеху и почти никогда не дают понимания изучаемых процессов. Последнее, в то же время, является одной из главных целей исследования. Создаваемая модель должна быть согласована с теми данными, ко- торые доступны, и с теми вопросами, ответы на которые предполагается получить с ее помощью. Для того чтобы сделать ясными эти общие утверждения, можно привести конкретный пример, связанный с моделированием динамики популяций. Это весьма известный объект, который очень часто моделируют и обсуждают в связи с изучением экологических проблем. Представим себе начинающего исследователя, которому экологи предлагают построить математическое описание «их» экосистемы и дать прогноз ее развития. Как правило, после работы с литературой, изучения предшествующих исследований, бесед с экспертами возникает соблазн построить серьезную, достаточно полную модель. Например, она может иметь вид ttu = Pi Aui + /1 (tii(0, tii(J - Ti),..., um(t - тт)), timi = DmAum + fm (tii (0, tii(i“Ti),..., tim(0, um(t — rm)}, 0*0 Mr,0) = ft*(r), feG, uk(f,t)=vk(t), fer, k=\,...,m. Здесь tii,...,tim могут соответствовать численности или биомассе различных видов. Члены DiAuk (где Д — оператор Лапласа описывают их подвижность или способность к миграции. Нелинейные функции fk характеризуют взаимодействие видов. Величина запаздыва- ний тк показывает, насколько система инертна. Она может, например, определяться периодом беременности у какого-то вида и таким образом
Математическое моделирование в современном мире 21 отражать возрастную структуру популяции. Она может описывать ситуа- цию, в которой основную часть ресурсов потребляют не все особи, а те, которые имеют возраст тт и «вошли в силу». Система уравнений должна решаться в области G, соответствующей рассматриваемому ареалу с гра- ницей Г. Задачу (1.1) следует дополнить начальными данными hk(f), со- ответствующими некоторому известному состоянию системы, и краевыми условиями Vk(t), показывающими, как изучаемый объект взаимодействует с окружением. Такая модель является весьма общей. Она, в принципе, может опи- сывать огромный класс явлений, от нашествий саранчи до динамики популяций рыб в водоемах. Такая модель согласуется с представлениями о трофических цепях, играющих важную роль в экологии. В свое время Ч. Дарвин обратил внимание на связь между урожаем клевера в англий- ских деревнях и числом кошек у поселян. Нетрудно сконструировать модель (1.1) так, чтобы она отражала эту взаимосвязь. Составление моделей вида (1.1) обычно вызывает глубокое уважение у специалистов, не занимающихся математическим моделированием. Де- ло в том, что нужно иметь очень глубокие основания для использования такого математического описания. Во-первых, если мы хотим иметь дело с пространственным распределением популяций, то нам нужна инфор- мация о том, какова численность изучаемых видов в разных участках региона (которая обычно недоступна). Во-вторых, следует подумать, как по экспериментальным данным будут определяться функции /1,..., fm и коэффициенты Pj,..., Dm, т\,... ,тт. Во многих случаях это представ- ляет весьма сложную самостоятельную задачу. В-третьих, о качественном поведении решений систем уравнений вида (1.1) известно весьма немного. Опыт накоплен в основном для случаев, когда есть всего два вида т = 2 и нет запаздывания. Сами нелинейные уравнения с запаздыванием — одни из наиболее сложных объектов в современном моделировании. Например, весьма непростым является анализ элементарной на вид модели — уравнения Хатчинсона х = ax(t)(l - x(t - т)). (1.2) Очевидно, оно также входит в большой класс моделей вида (1.1). Его достаточно трудно анализировать как с помощью численных, так и с помощью асимптотических методов при больших значениях параметра а. Поэтому, имея дело с моделью (1.1), мы можем столкнуться с необыч- ным поведением решений и математическими трудностями. Следует ли их преодолевать, чтобы проанализировать конкретную экологическую систему? Ответ на этот вопрос является часто наиболее важной и трудной частью работы. При ответе на него — в контакте с экспертами — следует выяснить, чем можно пренебречь и что является ключевым. Например, если мы представляем численность популяций в целом, но не имеем данных ни о ее пространственном распределении, ни о воз- растной структуре, то разумно перейти к системе обыкновенных диффе-
22 Глава 1 ренциальных уравнений «1 = ,«т), ................................... (1.3) Если наиболее важны взаимодействия между двумя видами, например, хищниками и жертвами, то систему можно еще более упростить: u = f(u,v), v = g(u,v). (1.4) Этот объект прекрасно исследован. Некоторые из свойств таких моделей будут обсуждаться в 8-й главе. Эти уравнения могут описывать периодиче- ские колебания численности видов, что допускает ясную интерпретацию, либо выход на такой режим. С другой стороны, если вида хотя бы три, то могут возникнуть непе- риодические, хаотические колебания. В этом случае мы имеем отдельные примеры такого поведения в конкретных системах, а не ясную и закон- ченную теорию. Разумеется, эти модели оправданы, если мы знаем или можем узнать численность видов, которые фигурируют в уравнении для реальной моделируемой системы. Наконец, может оказаться, что мы знаем численность только одного вида. Но именно этот вид и является определяющим. Если к тому же принципиальным для него является не взаимодействие с другими видами, а внутривидовой отбор, то будут, например, возникать уравнения типа й = аи( 1 - и). (1.5) Эта модель и многие другие объекты такого сорта допускают подробное аналитическое исследование. Они обсуждаются в главах 4, 5 и 6. Но уравнение вида (1.5) не может, к примеру, описывать периодиче- ские колебания численности. Если такие колебания есть и существенны, надо возвращаться назад и усложнять модель. Уравнение (1.5) может описывать выход численности популяции с течением времени на посто- янное значение, определяемое ресурсами региона. Однако, может быть, нас интересует, как будет расти численность вида, осваивающего новую экологическую нишу, а не долговременные процессы. Тогда описание дает элементарная линейная модель — уравнение Малътуса\ й = аи. (1.6) Но есть и другой путь упрощения. Если численность вида, к примеру, считается раз в году, то разумно перейти от непрерывного времени t к дискретному — п и от дифференциальных уравнений к отображениям. Например, при анализе конкретной биологической ситуации биологом Р. Мэем было использовано отображение, называемое логистическим ип+[ = аип(\ - ип). (1.7) Оно оказалось поразительно интересным математическим объектом. Его изучение позволило ответить на ряд фундаментальных вопросов совре- менного естествознания и потребовало больших усилий. О таких объектах,
Математическое моделирование в современном мире 23 называемых одномерными отображениями, речь идет в 7-й главе. Для них построена глубокая и обширная теория. Однако небольшая модификация уравнения (1.7) (переход к простей- шему дискретному аналогу уравнения Хатчинсона) ttn+i =<шп(1 - ип-\) (1.8) приводит нас к двумерным отображениям. О таких отображениях известно гораздо меньше. Они интенсивно исследуются в настоящее время. Итак, даже на «микроуровне» перед исследователем открывается множество различных возможностей. Ему приходится выбирать уровень, на котором он будет описывать систему, и математический «язык», кото- рым он будет пользоваться. Представление об этих возможностях и дают курсы математического моделирования и нелинейной динамики. Мягкое моделирование и нелинейные явления В последнее время все большее внимание уделяется направлению ис- следований, часто называемому мягким моделированием. В гидродинамике, квантовой механике, теории упругости известны законы, определяющие ход изучаемых процессов. И задача часто сводится к получению конкрет- ных частных следствий из общих законов. В психологии, социологии, истории, многих других областях попытки поиска эффективного мате- матического описания только начаты. Здесь часто важно проверить те или иные гипотезы. Поэтому обычно основное внимание обращается на качественные эффекты. Модели нелинейной динамики могут выступать как простейшие объекты, демонстрирующие желаемое качественное поведение. С этим, например, связано широкое использование моделей теории катастроф, динамических систем на плоскости, одномерных отображений, рассмат- риваемых в этой книге, при описании различных явлений в экономике, медицине, при анализе природных и техногенных катастроф. Кроме того, известные нелинейные модели, появившиеся в одной области, иногда могут использоваться в качестве своеобразных блоков, «кубиков» в других дисциплинах. Приведем характерный пример. Одним из важнейших эксперимен- тальных достижений в науке XX в. стало открытие Б. П. Белоусовым колебательных химических реакций. Это привело к построению соответ- ствующих математических моделей. Анализ последних привел к гипотезе о «химическом хаосе», — колебательных химических реакциях с ха- отическим поведением. Профессором О. Ресслером были предложены гипотетические модели реакций, в которых возможен хаос. Позже было показано, что эти модели при небольшой модификации позволяют описывать эпидемии ряда заболеваний. Недавно А. Ю. Андреев и М. И. Левандовский предложили использо- вать близкую систему для описания забастовочного движения. Их модель
24 Глава 1 имеет вид: X = m(N - X) - bXZ, Y = bXZ -(m + a)Y, Z = aY - (m + g)Z, W =gZ- mW, где N — общее число рабочих, X — число рабочих, еще не восприняв- ших информацию о забастовке, Y — рабочие, согласившиеся бастовать, но не ведущие активной агитации, Z — рабочие, ставшие агитаторами, W — рабочие, отказавшиеся от стачечной борьбы после одной из заба- стовок. Оказалось, что эта модель дает удовлетворительное описание стачеч- ного движения во Владимирской губернии в период с 1895 по 1905 гг. Модель, родившаяся в одной области, оказалась достаточно универсаль- ной. Такая ситуация — не редкость в мягком моделировании. Рекомендуемая литература Принципиальную роль в становлении нелинейной динамики сыграли книги: Николае Г., Пригожин И. Самоорганизация в неравновесных системах. М.: Мир, 1979; Хакен Г. Синергетика. М.: Мир, 1980. Различные подходы к построению математических моделей сложных систем об- суждаются в книгах: Самарский А. А., Михайлов А. П. Математическое моделирование: Идеи. Ме- тоды. Примеры. М.: Физматлит, 2001; Моисеев Н.П. Математические задачи системного анализа. М.: Наука, 1981; Краснощеков П. С., Петров А. А. Введение в математическое моделирова- ние. М.: Наука, 1984; Компьютеры, модели, вычислительный эксперимент. М.: Наука, 1988. Представление о разнообразии нелинейных процессов и их математических мо- делях дают сайты: http://www.keldysh.ru и http://spkurdyumov.narod.ru. К простейшим математическим моделям нелинейной динамики можно отнести модели, описывающие диссипативные системы с помощью обыкновенных диффе- ренциальных уравнений. Их можно рассматривать как развитие на новом уровне теории колебаний. Такие исследования во многих случаях связаны с динамическим хаосом. Этот круг проблем обсуждается в книгах: Шустер Г. Детерминированный хаос. Введение. М.: Мир, 1988; Неймарк Ю. И., Ланда П. С. Стохастические и хаотические колебания. М.: На- ука, 1987; Рабинович М. И., Трубецков Д. И. Введение в теорию колебаний и волн. М.: Наука, 1984; Анищенко В. С. Сложные колебания в простых системах. М.: Наука, 1990; Дмитриев А. С., Кислов В. Я. Стохастические колебания в радиофизике и элек- тронике. М.: Наука, 1989;
Математическое моделирование в современном мире 25 Лоскутов А. Ю., Михайлов А. С. Введение в синергетику. М.: Наука, 1990. Более простое обсуждение этих проблем предлагается в книгах: Мун Ф. Хаотические колебания. М.: Мир, 1990; Берже П., Помо И., Видаль К. Порядок в хаосе. М.: Мир, 1991. Нелинейная динамика играет важную роль в анализе химических и биологических систем. Представление об этом направлении работ дают книги: Романовский Ю. М., Степанова Н. В., Чернавский Д. С. Математическая био- физика. М.: Наука, 1984; Марри Дж. Нелинейные дифференциальные уравнения в биологии: Лекции о моделях. М.: Мир, 1983; Гарел Д., Гарел О. Колебательные химические реакции. М.: Мир, 1986. Об энергетической проблеме, космомикрофизике и других «сверхзадачах», в реше- нии которых принципиальную роль играет моделирование нелинейных явлений, более подробно рассказывают книги: Басов Н. Г, Лебо И. Г, Розанов В. Б. Физика лазерного термоядерного синтеза. М.: Знание, 1988; Хлопов М. Ю. Космомикрофизика. М.: Знание, 1989; Моисеев Н. Н. Математика ставит эксперимент. М.: Наука, 1979. Материал этой книги примерно соответствует полугодовому курсу, сопровождае- мому семинарскими занятиями. Возможная программа годового курса предлага- ется в брошюре: Малинецкий Г. Г. Базовые модели и ключевые идеи синергетики. М., 1994. (Препр. ИПМ им. М. В. Келдыша РАН; № 70); http://www.keldysh.ru/departments/dpt_17/gmalin.html. Небольшой задачник с решениями по нелинейной динамике помещен в сборнике: Новое в синергетике. М.: Наука, 1996. Его английская версия есть в журнале: International Journal of Fluid Mechanics Research. 1995. V. 22. №586. Представление о философских проблемах, возникающих в связи с широким использованием компьютеров в научных исследованиях и изучением нелинейных явлений, дают книги: Пригожин И., Стенгере И. Время. Хаос. Квант. К решению парадокса време- ни / 7-е изд. Сер.: «Синергетика: от прошлого к будущему». М.: Книжный дом «J1I4BPOKOM»/URSS, 2009. - 232 с.; Князева Е. И, Курдюмов С. П. Основания синергетики. Синергетическое мировидение. М.: Книжный дом «J114BPOKOM»/URSS, 2009. — 240 с.; Пенроуз Р. Новый ум короля. О компьютерах, мышлении и законах физики / 2-е изд. Сер. «Синергетика: от прошлого к будущему» М.: Издательство ЛКИ/URSS, 2008. - 400 с. О сверхзадачах современной науки и роли нелинейной динамики в их решении речь идет в книгах: Капица С. П., Курдюмов С. П., Малинецкий Г. Г. Синергетика и прогнозы буду- щего / 3-е изд. М.: URSS, 2003. — 288 с. (www.iph.ras.ru/mifs/kkm/Vved.htm); Новое в синергетике: Взгляд в третье тысячелетие / Сер.: «Информатика: неограниченные возможности и возможные ограничения»; Под ред. Г. Г. Ма- линецкого, С. П. Курдюмова. М.: Наука, 2002. — 480 с. (www.keldysh.ru/book/ns.html).
Escher M. C. Drawing Hands. 1948 Эшер M. К. Рисующие руки
Глава 2 Линейные математические модели Линейные уравнения очень важны. Они настолько важны, что физики и инже- неры, пожалуй, половину всего времени тратят на решение линейных уравнений. Р. Фейнман Прежде чем заниматься нелинейными явлениями и их моделирова- нием, обсудим примеры линейных моделей и методы их анализа. Это позволит осознать, от чего придется отказаться, переходя к построению и изучению нелинейных математических моделей. До недавнего времени линейные уравнения (алгебраические, диф- ференциальные, интегральные) были основным инструментом теоретиче- ской физики. Однородное линейное уравнение можно представить в символиче- ском виде Lu = 0, где L — линейный оператор, а и — искомая функция. Свойство линейности означает, что L(u 4- v) = Lu 4- Lv, L(au) = otLu, где a — постоянная. Для таких уравнений справедлив принцип супер- позиции'. если «1 и U2 — решения уравнения Lu = 0, то их линейная комбинация aui 4- Дт*2, где а и Д — постоянные, тоже будут решением. В самом деле £wi=0, £«2=0 =4* L(aui+flu2)=L(aui)+L(flu2)==aLui+0Lu2=Q. Принцип суперпозиции позволяет эффективно решать линейные неод- нородные уравнения Lu = f, где функция f не зависит от и. При решении множества различных задач достаточно решать только линейные уравнения. Роль последних действительно очень велика. В связи с этим возникает несколько вопросов. Почему линейных математических моделей так много в самых разных областях науки, от астрофизики и биологии до физики плазмы и теории упругости? Почему линейные модели квантовой механики, гидродинамики, электродинамики, оптики, сыграли ключевую роль в становлении современного естествознания? В чем причина поразительной эффективности линейных моделей?
28 Глава 2 Мы дадим два ответа на эти связанные между собой вопросы и при- ведем ряд примеров, подтверждающих их и демонстрирующих основные способы исследования линейных уравнений. Суть первого ответа сводится к тому, что линейные уравнения адекватно отражают многие явления при- роды. Суть второго, более формального, состоит в том, что популярность линейных уравнений связана с наличием эффективного математического аппарата, активно развивающегося в течение последних двухсот лет. Наши аргументы удобно сформулировать в виде нескольких тезисов. В подтвер- ждение каждого из них мы приведем несколько простых примеров. Многие зависимости между различными величинами, характеризую- щими ряд явлений природы, линейны. В самом деле, посмотрим глазами математика на закон Ома, связы- вающий напряжение, приложенное к проводнику V, ток, текущий через него I, и сопротивление R. Естественно предположить, что существует некоторая зависимость I = f(V), /(0) = 0. Последнее равенство очевид- но: когда напряжение не приложено, тока нет. Разложив эту функцию в ряд Тейлора в точке V = 0, получим dl(ty . 1 d2Z(0) 2 д/ = 0 + _12дг + _-±2дг Ч.... При ДУ -> 0 можно оставить первый член, (dZ(0)/dV)A(7 и назвать число dI(Q)/dV — проводимостью 1/7?, а коэффициент R — сопротивлением. В чем же тогда суть закона Ома? Ведь то, что мы сделали, справедливо для любой дифференцируемой функции f(V). Суть закона состоит в том, что в очень большом интервале ДУ, представляющем интерес, для очень многих проводников член dI(0)/dV AV гораздо больше остальных членов ряда. Другой пример — уравнение Шредингера, определяющее изменение плотности вероятности нахождения частицы во времени и пространстве. В мире атомных процессов в одних случаях свет удобно рассматривать как поток частиц — квантов, в других — как электромагнитную волну. Как говорят физики, имеет место дуализм «волна — частица». В 1924 г. Луи де Бройль высказал гипотезу, позволяющую в рамках единого подхо- да рассматривать как волновые, так и корпускулярные свойства объектов микромира. В конце XIX в. Гамильтон обратил внимание на аналогию между гео- метрической оптикой и классической механикой. Оказывается, что основ- ные законы этих теорий можно представить в тождественной математиче- ской форме. При этом движению материальной частицы в поле V(x, у, z) соответствует распространение светового луча в оптически неоднородной среде с некоторым показателем преломления р(х, у, z). Однако, когда длиной световой волны нельзя пренебрегать, как в случае интерференции или дифракции, необходимо переходить от геометрической к волновой
Линейные математические модели 29 оптике. Луи де Бройль предположил, что необходимо расширить аналогию и создать волновую механику, описывающую явления микромира. Простейшая плоская волна, описывающая колебания в пространстве с частотой ш и волновым вектором к («периодом по пространству»), определяется формулой t) = exp {ikx - iwt}. В соответствии с гипотезой Луи де Бройля, чтобы объяснить дифрак- цию электронов, интерференцию микрочастиц и многие другие явления, этой волне следует сопоставить движение частицы с энергией Е = huj и импульсом р = hk, где h = 1,054 • 10-27 эрг • с — приведенная посто- янная Планка, характеризующая свойства нашей Вселенной. Подставив выражения для Е и р в формулу для бегущей волны, получим волновую функцию для частицы с энергией Е и импульсом р ip(x, t) = exp < .Р . , г-х - г—t ft ft Следовательно, в этом частном случае h dip л f т — = Eip и г dt h dip Собственным значением линейного оператора ihd/dt здесь является энер- гия Е, а собственным значением оператора (h/i)d/dx — импульс р. В ка- честве собственной функции в обоих случаях выступает волновая функ- ция ip(x,t). Создатели квантовой механики предположили, что так же можно действовать и в общем случае — сопоставлять наблюдаемым фи- зическим величинам собственные значения линейных операторов. Пусть материальная частица массы т с энергией Е и импульсом р движется в поле с потенциалом V(x, у, z), зависящим от пространствен- ных координат х, у и z. Потенциальная энергия такой частицы равна V(x, у, z), кинетическая — р2/(2т). В силу закона сохранения энергии 2 Е= — +V(x,y,z). 2т Чтобы получить волновой аналог этого соотношения, подставим вместо энергии оператор ihd/dt, вместо р2 = р2х + р2 — оператор 2р2 д2 д2\_ 2 \дх2 ду2 дг2) ~ ' где Д — оператор Лапласа, вместо V(x,y,z) — оператор умножения на V(x,y,z). Это даст фундаментальное уравнение волновой или квантовой меха- ники, называемое уравнением Шредингера dip h2 гй—=-—Д^ +(2.1) ot 2т
30 Глава 2 Оно описывает движение одной частицы в заданном поле. Это уравнение определяет эволюцию комплексной волновой функции ф. Вероятность P(G, t) того, что частица находится в момент времени t в некоторой области G, определяется квадратом амплитуды волновой функции P(G,t) = J ф(?,1)ф*(?,1) dxdydz, G где звездочка (*) соответствует комплексному сопряжению. Поскольку в каждый момент времени частица где-либо находится в пространстве, полная вероятность где-нибудь обнаружить частицу P(t) должна быть равна единице. Поэтому надо потребовать, чтобы Р(0 — / фф* dx dy dz = (2.2) -00 Задача (2.1), (2.2) вместе с начальными условиями V>(f, о) = ya(f) (2.3) определяет эволюцию волновой функции ф(г,£), если известна волновая функция фо(г) в начальный момент. Предположим, что начальные данные выбраны таким образом, что любое измерение может дать только одно значение энергии частицы. Тогда lhTt = Решение этого линейного уравнения, естественно, является экспонентой f Et} ф(х, t) = exp < — >у>(ж). [ ih ) Подставим этот вид в уравнение (2.1), получим задачу на собственные значения (2-4) Собственные значения Еп определяют, какие значения энергии может иметь частица, двигающаяся в этом потенциале. Собственные функ- ции <рп, соответствующие им, показывают, с какой вероятностью частицу можно обнаружить в разных точках пространства. Поскольку фп(х, t) = exp ><рп(х) и фпф*п <рп<рп, эта вероятность не зависит от времени. Подчеркнем, что это уравнение не было выведено из каких-либо других математических моделей, а было открыто.
Линейные математические модели 31 Решив уравнение Шредингера для кулоновского потенциала V ~ 1, можно найти энергетические уровни атома водорода. При этом получа- ются результаты с огромной точностью согласующиеся с эксперименталь- ными наблюдениями. Таким образом, в основе одной из самых глубоких и эффективных физических теорий — квантовой механики — лежит линейная математическая модель — уравнение Шредингера. Для ряда задач, в которых можно удовлетвориться невысокой точно- стью, либо в которых воздействия на изучаемую систему малы, можно ограничиться линейными уравнениями. Пример 1. Уравнение теплопроводности. Классической моделью математиче- ской физики является уравнение теплопроводности Tt = аТхх, -оо < х < оо. Оно выводится, исходя из закона сохранения энергии и закона Фурье, в соответствии с которым тепловой поток W ~ дТ/дх. Представим себе, что начальное возмущение задано в ограниченной области простран- ства Т(ж, 0) = То (ж), тогда в первый же момент, как можно убедиться, температура станет ненулевой во всем пространстве, т. е. скорость рас- пространения сигнала оказывается неограниченной, что противоречит фундаментальным физическим представлениям. Но при больших значениях х функция Т(х, t) мала. Если точность, с которой нас интересует ответ, такова, что с этими «нефизическими» значениями можно примириться, то модель нам подходит. В противном случае ее следует модифицировать, исходя из особенностей изучаемой задачи. В ряде моделей физики плазмы и газовой динамики иногда считают, что сам коэффициент теплопроводности является функцией температуры к = к(Т), что делает модель нелинейной. Например, если к(Т) — коТа, (т > 1, то температура Т(х, t) может быть отлична от нуля в каждый момент только в ограниченной области пространства. Скорость распространения возмущений будет конечна. Пример 2. Волновое уравнение. Одно из фундаментальных уравнений класси- ческой математической физики — волновое уравнение, которое описывает колебания струны ц«-с2«жж = 0, u(x,Q) = uq(x), ut(xiO) = Vo(x)i -оо < х <оо. (2.5) Оно моделирует не только волны, которые распространяются по стру- не, но также и распространение звука в среде (акустическое приближение). В частности, из этого уравнения следует, что, как бы ни было вели- ко возмущение, оно будет распространяться с постоянной скоростью с. Разумеется, это так, лишь когда возмущения малы. Чтобы анализиро- вать возмущения достаточно большой амплитуды, в первом случае надо учитывать растяжение струны и изменение ее натяжения. Это приводит к появлению членов вида (их)2- Для звуковых волн большой амплитуды
32 Пюва 2 известен такой физический эффект, как возникновение ударных волн. Их скорость уже зависит от интенсивности возмущения. Когда воздействие на среду велико, приходится отказываться от ли- нейной модели — уравнений акустики — и иметь дело с более сложным объектом — уравнениями газовой динамики. Для линейных уравнений справедлив принцип суперпозиции, что поз- воляет «сшивать» решение данной линейной задачи из решений более простых линейных задач. Пример 1. Линейная алгебра. Простейшим объектом в этой области является одно линейное уравнение ах = Ь, которое при а 0 имеет единственное решение, при а = О, Ь = 0 — бесконечно много решений. При а = 0 и b / 0 уравнение не имеет решений. Рассмотрим систему линейных уравнений Ах = Ъ, где А уже матрица, х и b — векторы. Выберем новый базис е,, в котором х = Sy, b = Sc. В этом базисе ASy — Sc => = Dy — с. В соответствии с основным результатом линейной алгебры, в случае действительных различных собственных значений матрицы А базис ei можно выбрать так, что матрица D будет диагональной, т. е. Но в этом базисе мы получаем уравнения вида ^кУк — Ск, k 1, ... , П, совпадающие по виду с уравнением ах = Ь, которое мы решать умеем. Сложная задача «распалась» на набор простых. Пример 2. Обыкновенные дифференциальные уравнения. Обратим внимание на две простые, но очень полезные модели, связанные с линейными диффе- ренциальными уравнениями. Математическая модель радиоактивного распада. Множество экспери- ментов, связанных с изучением радиоактивного распада, позволили уста- новить следующее. Отношение числа распавшихся за единицу времени
Линейные математические модели 33 атомов к общему числу атомов является постоянной величиной, завися- щей только от вида атомов. Это отношение 7 называется вероятностью распада. При этом считается, что общее число атомов весьма велико. Обозначим число атомов, не распавшихся к моменту времени t, через N(t). В момент времени t + dt это количество будет равно N(t + dt). Следовательно, за время dt распадется N(t) - N(t -I- dt) атомов N(t) — N(t + dt) dN ------=1 => — = (2.6) Это уравнение вместе с начальным условием N(Q) = Nq позволяет найти число атомов в последующие моменты времени: dN ~N~ N = Nqc^. Несложные выкладки позволяют установить, что время полураспада (т. е. время, за которое распадется половина начального количества ато- мов) будет равно Т = In 2/7. Кроме того, можно убедиться, что 1/7 — среднее время жизни атома. Как и следовало ожидать, N(t) —> 0 при t —> 00. Простейшая модель роста народонаселения. Рассматривая проблемы, связанные с ростом народонаселения, Мальтус предположил, что скорость роста населения dN/dt в отсутствие сдерживающих факторов пропорци- ональна численности населения N. Коэффициент пропорциональности получил название мальтузианского коэффициента а. Это предположение приводит к следующей модели dN — = aN, N(0) = Nq, a = const > 0. (2.7) at Решение этого уравнения: N(t) = Nqc0*. В соответствии с ним население удваивается через время In 2/a. Решение таково, что N(t) —> 00 при t —> 00. Это говорит о том, что область применимости модели ограничена: при больших значениях N надо учитывать стабилизирующие факторы. Системы линейных дифференциальных уравнений. Рассмотрим теперь систему х = Ах, где А — матрица, х — вектор. Вновь выберем новый базис €j, х = Sy. Тогда . Sij=ASy => $ = S~x ASy => $ = Dy. Точно так же, как в предыдущем примере, выберем преобразование S так, чтобы матрица D была диагональна. Пусть вновь ее собственные значения будут действительны и различны. Здесь мы вновь имеем Ук = *кУк,
34 Глава 2 Следовательно, здесь также сложная исходная задача в принципе сводит- ся к набору простейших. Для А* > 0 мы получаем уравнения вида (2.7), совпадающие с моделью роста народонаселения. Для А* < 0 получа- ющиеся уравнения будут аналогичны уравнению (2.6), описывающему радиоактивный распад. Мы обсудили случай, когда собственные значения А* действительны и различны. Напомним традиционный способ решения системы диффе- ренциальных уравнений в этом случае. Вначале решается характеристи- ческое уравнение det |Л - А2?| = 0, находятся его корни А],..., Ап. Затем из системы линейных алгебраических уравнений находятся собственные векторы , соответствующие собственным значениям А* А£к = Afc&. Далее начальное ж(0) условие разлагается по собственным векторам &, что вновь требует решения системы линейных алгебраических уравне- п ний для Ск xq = 52 Ск£к- Затем, пользуясь принципом суперпозиции, к=\ решение можно записать в виде п x(t) = Скем(к. fc=l Другими словами, и в общем случае действует тот же подход — «разделяй и властвуй». Анализ устойчивости решений нелинейных задач часто сводится к ис- следованию линейных уравнений. Пример 1. Устойчивость особых точек динамических систем. Пусть нас интересует устойчивость стационарного решения ж* системы нелинейных диффе- ренциальных уравнений f = f(x). (2.8) Вектор х* называют точкой равновесия, или особой точкой, если /(ж*) = 0. Рассмотрим малое отклонение от особой точки x(t) = ж* + Дж(0. После такой замены переменных и разложения в ряд Тейлора получим df(x*} х* + Дж — /(ж* + Дж) — /(ж*) Н----—+ G(Ax) = дх = /(ж*) + ЛДж + £(Дж). (2.9) Здесь матрица А = df /дх с элементом = dfi/dxj называется мат- рицей Якоби или якобианом. В G входят нелинейные по Дж члены. В соответствии с первым методом теории устойчивости Ляпунова, если матрица А не имеет собственных значений с нулевыми действительными частями и кратных собственных значений, то при исследовании устой-
Линейные математические модели 35 чивости решения х* остаток ряда С(Дж) может быть отброшен. Вновь выберем новый базис ё}, Дж = Sy. Тогда Sy = ASfj => $=S~xASy => fj=Dy. Так же как в предыдущем примере, выберем S так, чтобы матрица D была диагональна. Это приводит к уравнению Ук = *кУк, к= для каждой компоненты вектора у = (j/i,..., уп), которое мы уже об- судили. Для наглядности мы ограничились здесь случаем вещественных различных собственных значений А*. Однако и в случае комплексных соб- ственных значений (если у матрицы нет нулевых и кратных собственных значений) мы вновь сталкиваемся с объектом из предыдущего примера — системой линейных дифференциальных уравнений Дж = ЛДж. То есть и в этом случае наша задача свелась к более простой. Понятно, что ес- ли действительная часть хотя бы одного собственного значения А, будет больше нуля, то yi(t) —> оо, если уДО) ^0 и поэтому решение ж* неустой- чиво. Если же Re А* <0 для к = 1,..., п, то ук -> 0 при к = 1,..., п, и состояние равновесия будет устойчивым. 5. Ряд важных нелинейных уравнений может быть сведен к линейным. Пример 1. Уравнение Бюргерса. В некоторых математических моделях плот- ность потока транспорта ц(ж, t), а также ряд процессов в гидродинамике описывается уравнением Бюргерса щ + иих — иихх, и(х, 0) = uq(x), -оо < ж < оо. Член иих описывает образование «пробок» — быстрые машины догоняют медленные и возникает скачок плотности и(х, t). Член иихх обеспечивает конечную ширину скачка, которая обусловлена тем, что автомобили не сталкиваются друг с другом. Коэффциент и показывает, насколько велика «вязкость» в такой системе. Хопфом и Коулом было показано, что это уравнение некоторой заменой переменной и = -1и<рх[ч> сводится к линейному уравнению теплопроводности = vy>xx. Пример 2. Уравнение Кортевега-де Вриза. В теории мелкой воды движение большого класса волн описывается уравнением Кортевега—де Вриза ut + иих 4- иххх = 0, -оо < ж < оо, «(ж, 0) = uQ(x). Вначале это уравнение анализировали численно. Позже было показано, что оно обладает бесконечным числом законов сохранения. И наконец, М. Крускал, Дж. Грин, К. Гарднер и К. Миура создали технику, называемую методом обратной задачи теории рассеяния. Эта техника позволяет свести уравнение Кортевега—де Вриза к некоторому линейному интегральному
36 Глава 2 уравнению. По образному выражению одного из математиков, грани- ца между линейными и нелинейными уравнениями в свое время была проведена неверно. Многие уравнения, нелинейные по форме, являются линейными по существу. Известный вид решений линейных задач позволяет сводить задачи более сложного типа к задачам более простого типа. Мы уже видели, как исследование линейных дифференциальных уравнений сводится к анализу алгебраических уравнений. Зная вид ре- шения, мы можем достичь успеха и во многих других случаях. В полной мере это относится и к линейным уравнениям математической физики. Пример 1. Решение краевой задачи для уравнения теплопроводности. Найдем част- ные решения, удовлетворяющие уравнению теплопроводности и краевым условиям Tr(0, t) — Tx(l, t) = О Tt=Txx. (2.10) Простейшими решениями уравнений в частных производных являются решения, сохраняющие свою форму, или, как их называют, автомодельные решения Т — Функция f(x) здесь определяет форму, g(t) — амплитуду решения. Обычно, подставив этот вид в уравнение, пользуются методом разделения переменных 9if=9fxx => - = ^=Л => 9(-Л9=0; /„-А/=0, 9 f Л(<М) = А(М) = ° => /т = COS f —-у— j , 771=0,1,... => \ * Z _2~„2 ( _<7Г2™2/ 1 7Г 771 I 7Г 771 С I __ . . > ✓ \ z.\ ^тп~ р 9т~ ехр\ —Tm{Xft) = fm(%)9m(t)' Таким образом, здесь предположение об автомодельности сразу да- ет возможность построить бесконечно много частных решений. Однако, зная, что решениями линейных обыкновенных дифференциальных урав- нений бывают экспоненты с вещественными или комплексными показа- телями, можно сразу искать решение в виде что даст тот же ответ {-ir2m2t) (irmxX Л „ —р— Icos \ ~~i~ / ’ т=°’ 2’ ’ ’ ’ ’ т. е. действовать можно было еще проще. Принцип суперпозиции позволяет здесь действовать в точности так же, как при решении системы линейных обыкновенных дифференциаль-
Линейные математические модели 37 ных уравнений, — искать общее решение в виде суммы частных 00 т=0 00 00 Т0(х) = 52 CmTm(x, 0) = 52 Cm cos т=0 m=0 (2.12) В последнем равенстве учтено, что Тт(х, 0) при t = 0 совпадает с cos (тгтх/l). Однако последнее равенство представляет собой разложение функции Tq(x) по системе функций {cos (irmx/l)}. Cm здесь выступают как коэффициенты Фурье. Чтобы найти их, будем домножать равен- ство (2.12) на cos (irnx/l) и интегрировать по х от 0 до I. Учтем, что dx = О, при m / п; 1 4- cos (2^) I -----г—‘— dx = -. 2 2 Следовательно, Это позволяет записать общее решение в виде п = 1,2,... . (2.13) 00 Т(х, t)^XCm ехР т—0 7Г ТП t | __—jcos тгтх (2.14) Учитывая формулу (2.13), последнее выражение можно переписать в виде Т(х, t) = У G(x, е, 0То(€) о (2.15) где 00 в(х, с, о = $2 cos m=0 ir2m2t Здесь а(0) = 1/1, а(т) = 2/1 при т 0. Функцию G(x,£,t) часто называют функцией Грина или функцией влияния. Структура решения,
38 Глава 2 аналогичная (2.15), характерна для большинства линейных задач мате- матической физики. Их анализ связан с нахождением функции Грина и последующим интегрированием. Существование множества методов, ориентированных на линейные уравнения. Пример 1. Обобщенные функции. Чтобы проиллюстрировать это обстоятель- ство, рассмотрим одну из наиболее изящных конструкций математической физики, связанную с построением так называемых обобщенных функций. Рассмотрим обсуждавшееся выше решение уравнения теплопровод- ности с начальными данными Tq(x) вида Т£(х) = \/е при xq < х < Т£(х) = 0 в остальных точках. Начальная энергия Е, которую при этом сообщают стержню, будет одной и той же независимо от е I Хо+€ /Г dx Т£(х) dx - / — = 1. J £ О х0 Предельная функция Т£(х) при е ч 0 не принадлежит к классу непрерывных функций. Эта функция должна была бы быть равной бес- конечности в точке ж, нулю в остальных точках отрезка, а интеграл от нее должен был бы быть равен единице. Для непрерывных функций это невозможно. Вместе с тем эта предельная функция описывает вполне реальную физическую ситуацию, когда был нагрет очень малый участок стержня в окрестности точки х. При этом стержню была сообщена единичная энергия. Естественно предположить, что формула (2.15) должна давать разум- ный результат и в этом предельном случае. Убедимся в этом и покажем, что / lim [ G(x,U)T£(£)d£ = G(x,xQ,t). f->0 j о В самом деле, G(x, £, t) — непрерывная функция своих аргументов. По- этому для сколь угодно малого числа Д найдется г, такое, что 0 - G(x, x0,t)| < Д, если |жо - £| < е, для всех значений х и t. Следовательно, i I G(x,Ct)T£^)d(-G(x,xQ>t) = о i = f [G(x,(,t)-G(x,Xo,t)]Te^)<^ = О
Линейные математические модели 39 Zo+£ lo+f Хо Xq i i Здесь мы учли, что / G(x, xq, t)T£(g) d£ = G(x, xq, t), так как f T£(g) = 1, о 0 а также то, что функция Tq(c) отлична от нуля только на интервале Это показывает, что саму функцию Грина G(x, t) можно интерпре- тировать как распределение температур, когда начальные данные опреде- лялись пределом Т£($) при е -> 0. Этот предел называют дельта-функцией Дирака б(х - £). По определению для любой непрерывной функции <р(х) Здесь символ (<5, <р) обозначает число у?(0) — значение функционала б на функции <р. Для того, чтобы можно было определить операцию дифференци- рования обобщенных функций, функции <р(х) должны быть гладкими и определенными в ограниченной части пространства. В самом деле, если бы д(х) была гладкой функцией, равной нулю вне ограниченной области G с границей Г, то J г J G G Но р(ж)^(ж)|г = 0. Поэтому естественно определить Таким образом, б'(х) — функционал, который сопоставляет непрерывно дифференцируемой функции ее производную в точке 0 — «Хорошие» функции <р(х} считают принадлежащими пространству основных функций D. Пространству D принадлежат бесконечно диффе- ренцируемые функции, которые отличны от нуля только в конечной области. Существование таких функций само по себе совершенно не оче- видно. Примером ненулевой основной функции является «шапочка» е2 ] , , 2 2 1’ €2 - X2 J exp w£(x) = О, Читатель может проверить, что она действительно принадлежит к беско- нечно дифференцируемым функциям. С ее помощью можно построить
40 Глава 2 множество других функций из D. Это позволяет ввести следующее опре- деление обобщенной функции f. Обобщенная функция f — это линейный непрерывный функционал на D, т. е. каждой функции р € D функция / сопоставляет некоторое число (/, р). Этот функционал линеен (/, + И) = А(/, <р) + д(/, V"). (где Л и /х — числа; р, ф € D) и непрерывен -> fc-юо, если fc -> оо в D. Здесь р Е D. Считается, что функции рк стремятся к р, если не только - у>(я)| -> 0 при к -> оо, но и все их производные для тех точек, где функции Рк(х) отличны от нуля, стремятся к пределу, равному соответствующей производной функции р(х). Основы теории обобщенных функций были заложены С. Л. Собо- левым и Л. Шварцем. Этот подход позволил обобщить само понятие решения. Пусть Lu = f(x). Обобщенным решением этого уравнения в области G называется обобщен- ная функция и, удовлетворяющая равенству (Ь«.Р) = (/,¥>), (2.16) для любой основной функции р из D, отличной от нуля в области G. Общая схема здесь остается в точности такой же, как в рассмотренном ранее примере с уравнением теплопроводности. Вначале ищется G(x) — решение уравнения LG = д(х). Затем функцию f представляют в виде «суммы дельта-функций»: /(*) = f /(W - 4) Ц. И далее, исходя из принципа суперпозиции, выписывают решение «= / fd)G(x - о ц. Приведем несколько примеров. Пример 1. Задача Коши для уравнения теплопроводности. Tt = а2Тхх 4- /(ж, 0, -оо < х < оо, Т(ж, 0) = О Gt = a2Gxx 4- <5(ж, t), G(x, t) = -—= exp
Линейные математические модели 41 где 0(0 = 0 при t < О, ©(0 = 1 при £ > О. Здесь t) = б(х) • <5(0. 00 t Т(х, t)= f [ f(£, r)G(x dr. -оо 0 Пример 2. Задача Коши для волнового уравнения. ии ~ а2ихх = f(x, 0, -оо < х < оо, и(х, 0) = 0, ut(x, 0) = 0. Здесь г -пгг - Мт /V г - е<а< ~ 1*1) Gff G (jxx — — о ’ 2а 00 t u(x,t) = У У G(x - £,t - d£dr. -оо О Пример 3. Уравнение Пуассона в трехмерном пространстве. Ди = /(f), 0 |г| < оо, Д« = <5(г~), G(r) = --J-, и = [ (219) 47ГГ J Таким образом, введение дельта-функции позволяет находить функ- цию Грина для линейных задач математической физики. Если эта функция известна, то решение неоднородных уравнений в частных производных сводится к обычному интегрированию. Кроме этого во многих случаях в отдельных областях решение как линейных, так и нелинейных урав- нений может не иметь достаточного количества производных. В этом случае появляется возможность рассматривать обобщенные решения, для которых выполнено равенство (2.16). Вычисление функций Грина ° Обсудим вопрос, как найти функции Грина для выписанных задач математической физики. Основная идея здесь состоит в использовании прямого, а затем обратного преобразования Фурье. Покажем, как это можно сделать, используя обобщенные функции. Преобразование Фурье основной функции определяется соотноше- нием 00 •F(V’) = <?«) = f <p(x)e‘(z dx. -00 При первом знакомстве с курсом этот материал может быть опущен. Студентам физи- кам и математикам, приступающим к изучению нелинейной науки, он поможет вспомнить традиционные подходы «линейной» математической физики.
42 Глава 2 Поскольку функция (р и ее производные обращаются в нуль при не- котором х > Ъ и х < а, интегрирование по частям позволяет найти фурье-образ производной да<р(х)/дха Jd°v\ 7 да<р(х) д°~1 <р(х) 00 F\w)=J ^^e dx=~a^e _х- -00 00 -1 00 -«4/ dx = ... = Her У V(x)e^dx = (-!«)“?(«) (2.20) -00 -00 В последних равенствах мы а раз проинтегрировали по частям и восполь- зовались обращением в нуль подстановок в бесконечных пределах. Из теории преобразования Фурье следует, что обратное преобразова- ние F~l(jp) определяется формулой 00 <р(х) = р-'Ш) = ~- [ ?№~ixi d£. 27Г J -оо Пользуясь последним соотношением, нетрудно проверить равенства <р(х) = = F(F-'(V)), 00 -оо ^'(?(4)) = i [ ?(4)e’ilCd4 = -i [ d£ = Z1T J 27Г J “00 00 00 = i / ?(-4)^d4 = ^(v(-4)). 27Г J 27Г “00 (2.21) В последней цепочке равенств мы сделали замену переменных в ин- теграле £—>—£• Введем теперь фурье-преобразование обобщенной функции /. Рас- смотрим функционал W)>¥>) = у где F(f) — преобразование Фурье функции /, а — одна из основных функций. Если бы функция / была «хорошей» и были бы выполне- ны условия теоремы об изменении порядка интегрирования в кратном интеграле, то была бы справедлива цепочка равенств dx d£ = dx = I f(x)F(<p(x)) dx.
Линейные математические модели 43 Таким образом, (F(f),V) = (f,F(V)). (2.22) Последнее равенство мы и будем считать определением преобразования Фурье F(f) обобщенной функции /. Обратное преобразование Фурье введем, исходя из равенства (2.21), *”'(7(®)) = ±-F(f(-x)). (2.23) Найдем, к примеру, преобразование дельта-функции (F(<5(® - го)), V) = (<K® - ®о), F(<p)) = F(v>(zo)) = J 4>(£)e'x,l( = = (eilof, ч>) => F(f(x - г0)) = eill>£. Положив жо = 0, убедимся, что F(d(x)) = 1. Следовательно, д(х) = F^l). Учитывая формулу (2.23), получим д(г) = Г-'(1) = ^-Г(1). Z7T Поэтому Г(1) = 2кд(х). (2.24) Проинтегрируем функцию d(t) по времени: ОО Г 6(т) dr = e(t), -оо где 0(0 = 0 при -оо < t < 0, и 0(0 = 1 при t > 0. Следовательно, зави- симость 0(0 представляет собой функцию Хевисайда. Другими словами, 0(0 является решением обыкновенного дифференциального уравнения — = <5(0, и(-оо) = О или функцией Грина для уравнения t = /(О => »(0 = [ ©(« — r)f(r) dr. at J -oo Точно так же можно убедиться, что функция 1Г(0 = 0(0е является функцией Грина для уравнения 6^2/ у V djV WWW * / . \ — + аг = /(«). ~ir+aW = <5(0- at at (2.25)
44 Глава 2 Полученные соотношения позволяют получить функцию Грина для уравнения теплопроводности. Возьмем фурье-образ F от обеих частей равенства Gt = a2GXx + <5(®, О» имея в виду пространственную координату х. В соответствии с формулой (2.20) F (a2Gxx) = -a2£2G(t), F[i(x, t)] = F|<5(x) • <5(01 = 1 • <5(0- Итак, для фурье-образа функции G — функции G(£, t) — мы имеем обыкновенное дифференциальное уравнение + a2(2G = d(t). ot Однако последнее уравнение по виду совпадает с (2.25), поэтому его решение определяется формулой G(i,t) = • Сделаем обратное преобразование Фурье = °f е_х, dz = е(0е-11/(4“;|> 2iraVt J 2a\/nt -00 00 _ 2 В последнем равенстве мы воспользовались тем, что I = / е 2 dz = x/ir. В самом деле, Переходя в полярную систему координат: z = г cos <р, у = г sin у?, z2 + у2 = г2, dzdy => г dr dip, получим оо 2я J е~т г dr dip = 2тг о о _г2 dr2 е —— Аналогичным образом находятся функции Грина и для остальных задач.
Линейные математические модели 45 Было бы заманчиво пойти дальше и определить произведение обоб- щенных функций. (Естественно, так, чтобы оно было ассоциативно и ком- мутативно.) Именно это было бы очень важно для решения нелинейных задач. Л. Шварцем было показано, что, к сожалению, по этому пу- ти продвинуться не удается; это можно проиллюстрировать следующим примером. Введем обобщенную функцию, называемую главным значением инте- грала от | — Р|: 00 -00 Е хР± = 1, поскольку Кроме того, а(х)д(х) = а(О)д(х). Действительно, (ад, р) = (д, ар) = о(0)у?(0) = (а(0)<5, р). Если бы можно было определить умножение обобщенных функций, то имели бы место равенства О = 0Р- = (хд(х))Р— = ((5(я)а?)Р- = д(х)[ хР- х х х \ х = <5(г), которые и приводят к противоречию. Именно это обстоятельство сужает сферу приложений теории обобщенных функций. Этот замечательный подход оказывается ориентированным в основном на линейные задачи. Такая ситуация является общей и для многих других аналитических подходов. Вопросы и задачи 1. Построить математическую модель, позволяющую предсказывать интенсив- ность излучения, испускаемого радиоактивными веществами, находящимися в некотором хранилище. Считать, что начальные количества всех веществ, периоды их полураспада и закон, по которому они с течением времени поступают на склад, известны. 2. Маятник совершает малые колебания. Найти закон движения маятника, считая, что на него действует внешняя сила по закону A sin (Л. Как изме- нится этот результат, если учесть малое трение, пропорциональное скорости маятника? 3. Каков закон движения маятника, на который действует периодическая вы- нуждающая сила?
46 Глава 2 4. Каков закон движения маятника, на который действует сила, меняющаяся со временем по заданному закону? 5. Как меняется со временем температура теплоизолированного на концах стержня, холодного вначале? Считать известным закон, по которому этот стержень нагревают, f(x, t). 6. На концах первоначально холодного стержня температура меняется по закону L(t) и R(t). Как меняется распределение температуры стержня со временем? 7. Момент импульса произвольного твердого тела L = (Lx, Ly, Lz) и его угловая скорость ш = (шх,шу,шг) связаны соотношением Ь = 1ш, где I — тензор инерции . Матрица I симметрична, Сколько существует осей, при вращении вокруг которых L и ш направлены в одну сторону? Что можно сказать о взаимном расположении этих осей? 8. Рассмотрим сферу единичного радиуса с центром в начале координат в п- мерном евклидовом пространстве. На векторы, идущие из начала координат в точки сферы, подействуем линейным оператором А. Во что перейдет сфера? Что произойдет после многократного применения оператора Л? Как можно использовать такие многократные итерации для численного решения задачи на собственные значения для оператора Л? 9. Показать, что с помощью поворота систем координат и сдвига кривую второго порядка ах2 + Ъху + су14- dx 4- еу + f = 0 можно привести к каноническому виду „,2 -.2 _2 .,2 X у X у 2 — + — = 1 (эллипс), — - — = 1 (гипербола), у = Сх (парабола). а1 tr а1 Ь1 Можно ли линейное уравнение второго порядка с постоянными коэффици- ентами аихх + Ьиху 4- сиуу 4- dux 4- еиу 4- f = 0 с помощью замен независимых переменных привести к каноническому виду ихх +иуу = 0 (уравнение Ла- пласа), их = иуу (уравнение теплопроводности), ихх - иуу = 0 (уравнение колебаний струны)? 10. Процессы в некоторой среде описываются уравнением ^+(С1 + С2)а^ + С1С!^ = 0- Каковы решения этого уравнения? Какие физические явления, на ваш взгляд, можно было бы моделировать с его помощью? 11. Найдите общее решение линейного разностного уравнения я-п+к 4" ®i®n+k-i 4~ • • • 4~ — 0, п — 1, 2, 3,... Как вы бы поставили для этого уравнения задачу Коши?
Линейные математические модели 47 Рекомендуемая литература Методы исследования линейных математических моделей подробно обсуждаются в основных курсах линейной алгебры, обыкновенных дифференциальных уравне- ний, математической физики. Например, в следующих: Гантмахер Ф. Р. Теория матриц. М.: Наука, 1988; Тихонов А. Н., Васильева А. Б., Свешников А. Г. Дифференциальные уравнения. М.: Наука, 1980; Арнольд В. И. Обыкновенные дифференциальные уравнения. М.: Наука, 1971; Понтрягин Л. С. Обыкновенные дифференциальные уравнения. М.: Наука, 1974; Тихонов А. Н., Самарский А. А. Уравнения математической физики. М.: Наука, 1972; Свешников А. Г., Боголюбов А. Н., Кравцов В. В. Лекции по математической физике. М.: Изд-во МГУ, 1993; Курант Р. Уравнения с частными производными. М.: Мир, 1964. Обобщенные функции подробно рассматриваются в книгах: Владимиров В. С. Уравнения математической физики. М.: Наука, 1976; Он же. Обобщенные функции. М.: Наука, 1985. О принципиальной роли линейных математических моделей можно судить, про- смотрев тома курса теоретической физики Л. Д. Ландау, Е. М. Лифшица «Теория поля», «Квантовая механика. Нерелятивистская теория», «Теория упругости». Линейные математические модели позволяют во многих случаях выработать цен- ные интуитивные представления о волнах, колебаниях и других физических процессах, которые затем окажутся востребованы и в нелинейном мире. Об этом прекрасно рассказано в книге: Трубецков Д. И. Введение в синергетику. Колебания и волны / 2-е изд. Сер.: «Синергетика: от прошлого к будущему». М.: URSS, 2003.
Escher M. C. Double Planetoid. 1949 Эшер M. К. Двойной планетоид
Глава 3 Простейшие нелинейные модели Всякое человеческое познание начина- ет с созерцания, переходит от него к понятиям и заканчивает идеями. И. Кант Математическим моделированием нелинейных явлений с помощью дифференциальных уравнений ученые занимаются уже более трехсот лет, поэтому было предложено несколько альтернативных подходов. Их удобно проиллюстрировать на примере простейших моделей. Мы обсудим несколько упрощенных, стилизованных схем анализа, которые позволят лучше представить возможности каждого подхода. Математический маятник Рассмотрим задачу о математическом маятнике. Пусть нам дана система, представленная на рис. 3.1. При моделировании приходится не- избежно делать различные допущения. Предположим, что размеры груза пренебрежимо малы, и можно считать его материальной точкой массы т. Нить будем полагать невесомой и нерастяжимой. Кроме того, предполо- жим, что маятник при движении не испытывает сопротивления воздуха. Подход физика-теоретика Воспользуемся вторым законом Ньютона mr = F. Спроектируем векторы, стоящие в правой и левой части равенства, на на- правление, перпендикулярное нити (см. рис. 3.1). Получим mlip -I- mg sin <р = 0. (3.1) Это равенство можно записать и по-другому, учитывая, что эта система консервативна и полная энергия Е в ней сохраняется. Кинетическая энер- гия при этом равна т(1<р)2/2, потенциальная — mgh, где h = Z(l-cos —
50 Глава 3 Рис. 3.1 высота, на которой находится материаль- ная точка. Следовательно, тРф1 —------h mgl(\ - cos <р) = Е. (3.2) Продифференцировав это равенство по времени и сократив на ф, вновь полу- чим уравнение движения (3.1). Естествен- но оценить амплитуду малых колебаний, когда начальный угол у>о, а следователь- но и размах колебаний, малы. При этом можно считать, что sin у? ~ Тогда мы приходим к линейному уравнению Ф + jv> = 0. (3.3) Следовательно, частота малых колебаний шц = y/g/l, их период Т = 2iry/ljg, а колебания являются гармоническими ^(0 = У’о cos (о>о0- Это очень распространенный подход. Область явлений в физике, которую удалось описать с помощью линейных уравнений, и в частности уравнения (3.3), огромна. Подход физика Представим специалиста, знакомого с арсеналом современной фи- зики, однако по странной случайности не успевшего овладеть дифферен- циальными уравнениями и не слышавшего о математическом маятнике. Как он подойдет к этой проблеме? Изучаемая физическая система зависит от трех величин: массы ма- ятника, характерного линейного размера и ускорения силы тяжести. Размерность первой величины — килограммы [М], второй — метры [Ь], третьей — м/сек2 [LT-2]. Символы в квадратных скобках показывают, как соотносятся данные величины с единицами массы, длины, времени. Эти обозначения являются общепринятыми в теории подобия и размер- ности. Период колебаний маятника в этом пункте обозначим через г. Предположим, что период колебаний т, измеряемый в сек [Г], является степенной функцией от всех параметров задачи т ~ Cmal^g1. Будем счи- тать, что С — безразмерный коэффициент, и приравняем размерности правой и левой части [Т] = Это эквивалентно системе уравнений 1 = -27; о = 0; /3 + 7 = 0, откуда fl = 1/2, 7 = -1/2 ит~ уДП- Таким образом, пользуясь самыми общими представлениями, мы получили верную зависимость.
Простейшие нелинейные модели 51 Комментарий. Описанная схема, отражающая основную идею метода подобия и раз- мерности, обычно очень широко используется на начальном этапе анализа многих нелинейных явлений. Предположение о степенном характере зависимостей ока- зывается оправданным для очень многих задач нелинейной механики. Одной из наиболее красивых и важных задач, решенных с помощью этого метода, является задача о сильном взрыве. Предположим, что на поверхности происходит взрыв, в результате которого выделяется энергия Е. Будем считать, что взрыв производится в атмосфере с плотностью р. Известно, что при этом возникает ударная волна. Выясним, как зависит скорость ударной волны от времени. Пусть координата волны равна r(i), [e] = mlЕ 2t~2, № = ml~3, H=L, [tl = T. Приравняв соответствующие показатели степеней, получим г = С 1/5 <2/5, 1/5 гЗ/5 Эта задача была детально проанализирована академиком Л. И. Седовым в 1945 г. Полученная зависимость прекрасно подтвердилась опытными дан- ными, полученными при ядерных испытаниях в Нью-Мексико в том же году. Судя по воспоминаниям очевидцев, Энрико Ферми во время первого ядерного испытания, чтобы определить силу взрыва, бросал бумажки и смотрел, на ка- кие расстояния их относит. По-видимому, он также пользовался соображениями подобия и размерности. Полученная таким образом оценка Е оказалась очень близка к истинной величине энергии взрыва. Подход экспериментатора Даже небольшая серия опытов позволит обнаружить, что период колебаний Т не зависит от массы тп, и пропорционален 1^2 и g~^2. Кроме того, можно будет установить коэффициент пропорциональности. Однако эксперимент дает возможность обнаружить еще одну важ- ную особенность. С его помощью можно выяснить, как зависит период колебаний от энергии. Зависимость будет следующей. Существует такое значение энергии Eq, что при Е -> Eq, Т -> оо. Когда Е < Eq, то энергию можно выразить через начальное отклонение от положения равновесия Е = mgl(\ - cos <ро) = 2mgl sin2 • Для графика Т = Т(Е) характерен очень пологий начальный участок (см. рис. 3.2, верхняя кривая). Поэтому Галилей считал, что математиче- ский маятник обладает свойством изохронности, — его период колебаний не зависит от начального отклонения. Гюйгенс, экспериментально изучав- ший эту систему, в книге, изданной в 1673 г. отметил, что изохронность заметно нарушается при <pq = 60°, а для <р>о = 90° отношение периода к периоду малых колебаний уже равно 34/29. Особенность при Е = Eq связана с тем, что маятник при этой энергии либо находится в верхнем положении равновесия, либо в течение
52 Глава 3 Рис. 3.2. Зависимость периода колебаний математического ма* ятника от угла начального от- клонения <pQ. Прямая 1 соот- ветствует предсказаниям линей- ной теории, кривая 2 — ангар- моническому осциллятору (3.6) и закону (3.9), кривая 3 соот- ветствует выражению (3.11), за- висимость 4 описывает экспе- риментальные данные и точное решение уравнения (3.1) бесконечного времени стремится к этому положению. Когда Е > Eq, маятник начинает вращаться вокруг точки подвеса. Поэтому, с точки зрения экспериментатора, успех в математическом моделировании маятника определяется тем, насколько точно удается предсказать зависимость Т = Т(Е), или, что то же самое, Т(у>о)- Подход математика XVII века Проинтегрируем уравнение (3.2). Его можно переписать в виде •2 л 2 . 2 & 22? 2g У =2o>0cos^ + C, w0 = j, С=^-—. (3.4) Следовательно, период колебаний маятника равен d 4 d f (2о>02 cos <р + С)1/2 (2o>02)1/2 f (cos <р - cos <ро)^2 о о Здесь мы учли следствие уравнения (3.4). При ф = 0, <р = <pQ и поэтому cosy?o = Интеграл (3.5) и является решением. Дифференциаль- ное уравнение интегрируется в квадратурах. Однако вычислить интеграл с помощью элементарных функций не удается. Формально ответ полу- чен, однако извлечь из него конкретную информацию и, в частности, зависимость, представленную на рис. 3.2, оказывается не просто. Подход математика XVIII века Рассмотрим начальный участок зависимости Т = Т(Е). Будем счи- тать, что амплитуда колебаний маятника настолько велика, что приближе- ние sin (р « <р уже неудовлетворительно. Учтем второй член в разложении
Простейшие нелинейные модели 53 этой функции в ряд Тейлора . 1 3 sin р = р - -р 4-... . Это даст уравнение движения d2 (3.6) 2 * + ufo _ = 0. dt2 6 Уравнение (3.6) уже не будет описывать гармонические колебания, поэтому систему, которую оно описывает, в литературе часто называют ангармоническим осциллятором. Будем искать приближенное решение уравнения (3.6) в виде р = Ро sin wt 4- €<ро sin 3ut. (3.7) Появление второго члена связано с тем, что при возведении первого в куб з 3 1 sin wt = - sin wt — sin 3wt 4 4 возникнет член, описывающий колебания с утроенной частотой, или, как иногда говорят, третью гармонику. Естественно, при возведении в куб выражения (3.7) появится девятая гармоника е3 sin 9wt. Однако считая, что е мало, и существенны только первые члены ряда, этими членами будем пренебрегать. После подстановки вида (3.7) в уравнение (3.6) получим р = -ш2<ро sin wt - 9ш2€ро sin 3wt, w^p — oJqPq sin wt 4- ш^еръ sin 3wt, Сумма левых частей, исходя из уравнения (3.6), должна быть равна нулю. Правая часть также должна быть, насколько это возможно, близка к нулю. Идеально было бы потребовать, чтобы сумма коэффициентов при sin ut, как и при sin 3wt, sin 5ut и sin7o;£, была равна нулю. Однако это не- возможно (иначе возникла бы переопределенная система алгебраических уравнений). Обусловлено это тем, что в формуле (3.7) мы ограничились только двумя членами. Поэтому воспользуемся стандартным приемом, часто применяемым при построении асимптотических решений, — учтем только наиболее важные члены, в которые малый параметр е входит в минимальной степени, а также будем пренебрегать более высокими гармониками. Исходя из последнего требования, отбросим все члены, в которые входят sin5o;f и sin7otf. В скобке перед sinwf и перед sin ЗсЛ учтем только члены, в которые не входит е. Таким образом, остаются только два члена, подчеркнутые в формуле (3.8).
54 Глава 3 Собирая члены при sin ut, получим 2 2 J 2 2 —ш + — — Wq<Pq = 0. Следовательно, 2 2 Ш = 8 “Ч'-Тб/ Здесь мы использовали формулу -^/1 + д » 1 + д/2, где /л <£ 1. Прирав- нивая члены при sin 3ut, получим -9оЛ + Ц^ + ^ = 0. Положив ш = шо, из последнего равенства получим с- _d_ 192' Таким образом, учет первого нелинейного члена в sin дает ^osin3o?f / 0+и!) ЛЧ у myosin + I, T я 2тг —---—. (3.9) 1У2 \ 10/ й?0 Из формулы (3.9) ясно, почему колебания даже при довольно больших углах оказываются близки к гармоническим. Это обусловлено тем, что параметр 192 мал. Конечно, формула (3.9) дает представление о части кривой Т = Т(Е), однако она не дает возможности проанализировать, что будет при энергиях, близких к Eq. Зависимость (3.9) показана на рис. 3.2. На нем нижняя горизонталь- ная прямая соответствует линейной задаче, второй график — зависимо- сти (3.9). Комментарий. В конце XVIII в. после работ П. С. Лапласа асимптотические методы стали основным инструментом анализа многих математических моделей и, в част- ности, моделей небесной механики. Поскольку было известно решение задачи двух тел, а массы всех остальных небесных тел в Солнечной системе несравненно меньше массы Солнца, их влияние на движение данной планеты можно считать малым возмущением и пользоваться асимптотическими методами. Уверенность в том, что поняты основные законы природы и построен эффективный матема- тический аппарат, была очень велика. В частности, Лаплас отвечал Наполеону, интересовавшемуся математикой и прочитавшему его книгу по небесной механи- ке, что не нуждается в гипотезе о творце-вседержителе. И действительно, на этом пути были достигнуты выдающиеся успехи в моделировании нелинейных явле- ний, — были предсказаны новые планеты Уран и Плутон. В XX в. возможности использовать асимптотические методы для анализа нелинейных математических моделей стали неизмеримо больше. Однако вместе с этим пришло понимание того, насколько ограниченной является область применения этих методов, среди множества всех нелинейных моделей, которые необходимо исследовать.
Простейшие нелинейные модели 55 Подход математика XIX века Успех в исследовании множества математических моделей связан с тем, что у нас есть такие специальные функции, как sin х, cos ж, ехр х. Эти функции можно рассматривать как решения некоторых дифференци- альных уравнений. Кроме того, можно считать, что эти функции возника- ют при интегрировании определенных выражений. Расширим множество уравнений и интегралов и попробуем ввести на этой основе новые спе- циальные функции. « По этому пути шли Эрмит, Бессель, Якоби, Лагер, Матье и другие выдающиеся математики. На этом пути были введены эллиптические функции и, в частности, эллиптический интеграл первого рода я/2 /* dib ‘(КН р о Читатель может проверить, что замена переменных приводит интеграл (3.5) к виду (3.10). Из теории эллиптических функций известно разложение этого интеграла в ряд по степеням К ’1 • 3 • 5 •• (2п - 1)' 2 • 4 • 6 •... • (2п) Учитывая несколько первых членов, получим Т = 2тга/- 1 Н- — sin2 V 8 L Эта формула позволяет предсказать несколько больший участок зави- симости Т = Т((ро) (см. рис. 3.2, кривая 3). Кроме того, существуют таблицы эллиптических функций и, пользуясь ими, можно получить всю зависимость Т = Т(Е). Комментарий. В XIX в. и в первой трети XX в. теория специальных функций рассматривалась как один из важнейших разделов прикладной математики. К со- жалению, многие надежды, возлагавшиеся на этот математический аппарат, ока- зались в большой степени неоправданными. Дело в том, что во многих случаях составление таблиц специальных функций требует большого объема вычислений и применения численных методов, а оперирование с ними не является простым и наглядным. Кроме того, в отличие от экспоненты и тригонометрических функ- ций, область применимости каждой из более сложных специальных функций значительно меньше. Из этого обсуждения ясно, что даже при изучении этой простейшей модели естественно воспользоваться численными методами, которые стали очень широко применяться к исследованию нелинейных явлений в XX в.
56 Глава 3 Движение планеты вокруг массивной звезды В качестве второго примера рассмотрим одну из первых и наиболее важных математических моделей, возникшую в небесной механике. Книга И. Ньютона «Математические начала натуральной филосо- фии» сделала обыкновенные дифференциальные уравнения на несколько веков основным классом математических моделей естествознания. Сам И. Ньютон в полной мере осознавал эффективность созданного им ин- струмента. Единственным утверждением, которое он счел необходимым зашифровать в виде анаграммы, была фраза о том, что полезно изучать дифференциальные уравнения. С помощью этого математического аппа- рата была решена задача о движении планеты вокруг звезды. Решение этой задачи произвело огромное впечатление на современников. Остается только удивляться, насколько простым оказывается решение ключевой за- дачи небесной механики после формулировки фундаментальных понятий и законов природы и построения математической модели. И. Ньютон, обобщая опытные данные, сформулировал закон движе- ния тела, размеры которого пренебрежимо малы (материальной точки) d2x mlp=F' ж(0) = Xq, ж(0) = Vq. (3.12) Этот закон имеет парадоксальное следствие: в отсутствие силы F = 0 диф- ференциальное уравнение (3.12) имеет решение x(t) = xo + vot. Тело дви- жется равномерно и прямолинейно неограничен© долго. Это, на первый взгляд, противоречит обыденному опыту. Такое следствие не согласуется с предшествующими взглядами Аристотеля. В соответствии с ними тело движется, только если прикладывать силу. В современных обозначениях закон движения в физике Аристотеля имеет вид dx ти = f(0) = при F(0) = 0, x(t) = £q = const. Обратим внимание на глубину и содержательность понятий мас- сы, силы и ускорения. Для того, чтобы относиться к закону Ньютона как к содержательному утверждению (а не как к определению силы), необходимо иметь принципиальную возможность независимо измерять ускорение, силу и массу. Это и умеют делать физики. По гипотезе И. Ньютона, форма орбиты определяется притяжением планеты к Солнцу. Сила такого притяжения в соответствии с законом всемирного тяготения равна Мет _ 3 г3 (3.13) где Мс — масса Солнца, т — планеты, G — гравитационная постоянная (коэффициент, устанавливаемый экспериментально), г — радиус-вектор,
Простейшие нелинейные модели 57 М = [Fх V] r(t) Рис. 3.3 соединяющий Солнце и планету (см. рис. 3.3), г — длина этого вектора. Знак минус говорит о том, что тела притягиваются друг к другу. Будем считать, что Me т, и что движение планеты никак не влияет на звезду. Поэтому последнюю можно счи- тать неподвижной. Соотношения (3.12) и (3.13) вместе с определением скорости и начальными условиями и дают матема- тическую модель dv аг dt г3 ’ где a = GMc, ~z=v, х(О) = хо, v(0) = v0- (3.14) dt Спроектировав вектора на оси декартовой системы координат (см. рис. 3.3) г = (я, 2/, z), v = (vXt vy, vz), можно записать уравнение (3.14) в скалярном виде dvx ах dvy ay dvz _ az dt r3 ’ dt r3 ’ dt r3 ’ dx dy dz - =Vt, - = Vti, - = VZ, dt x’ dt v dt z (3.15) ж(0) = я?о, 2/(0) = 3/o, *(O)=zo, Vx(0) = v2, vy(0) = Vy, vz(0) = v®. Эту автономную систему шести обыкновенных дифференциальных урав- нений можно анализировать по-разному. Можно воспользоваться числен- ными методами. Можно непосредственно решить эти уравнения, как это делают в теоретической механике. Ситуация, в которой есть несколько способов анализировать модель, является общей. Поэтому мы наметим оба подхода, а затем сравним их достоинства и недостатки. Уточним постановку задачи. Пусть нам нужно узнать положение планеты в момент времени t, если известна ее начальная скорость, положение и коэффициент а. Основная идея состоит в замене производных конечными разностями. Например, будем приближать производную dx(t)/dt соотношением x(t + r)-x(t) x(t) -I- + у d - x(t) dx т d2x(t*) т = т = М + 2 ~di^~' (3.16) sU + r. Здесь мы воспользовались разложением функции x(t 4- т) в ряд Тейлора с остаточным членом в форме Лагранжа. Представив (x(t), y(t), z(t), vx(t), vy(t), vz(t)), в виде вектор-столбца, а соответствующие правые части в виде вектор-функции, получим Х(О) = Хо. (3.17)
58 Глава 3 Эту систему дифференциальных уравнений будем аппроксимировать отоб- ражением Х((п+1)т)- Х(пт) — -----—-----—- = F(X(nr)), (3.18) т переводящим вектор Х(пт) в вектор Х((п 4- 1)т). В самом деле, Х((п + 1)т) = Х(пт) + тР(Х(пт)). (3.18') Подход, позволяющий перейти от дифференциального уравнения (3.17) к отображению (3.18), получил название метода Эйлера. Представление об этом методе дает рис. 3.4 а. Непрерывная кри- вая x(t) заменяется набором ломаных. Погрешность такой аппроксима- ции связана с тем, что мы заменяем кривую О А прямой ОВ, а также тем, что на следующем шаге мы вычисляем правую часть не в точке Л(Г(Х(т))), а в точке B(F(X(0)) +тВ(Х(0))). Рис. 3.4. Численное решение задачи о движении планеты вокруг массивной звезды: а) погрешность, вносимая при использовании метода Эйлера, связана с тем, что кривая заменяется набором ломаных и производная считается не в той точке; б) пример численного решения задачи (3.15) с помощью метода Эйлера. Видно, что эта зависимость близка к части эллипса. Эллипс соответствует и точному решению дифференциального уравнения Разность, стоящая слева в выражении (3.16), стремится к производ- ной dx/dt, если т -> 0 и производная d2x/dt2 остается конечной. Дальнейшая стратегия ясна. Отрезок [О, Т] разбивается на N интер- валов т = T/N. Далее вычисляются итерации отображения (3.18). Можно ожидать, что если шаг по времени т достаточно мал, то итерации отобра- жения и значения функции Х(пт) для исходного уравнения будут близки. Типичный результат соответствующего расчета для обсуждаемой задачи показан на рис. 3.4 б. Видно, что представленная последовательность
Простейшие нелинейные модели 59 ломаных неплохо аппроксимирует точное решение дифференциального уравнения, являющееся эллипсом. Отображение (3.18), также как исходное уравнение, описывает детер- минированную систему (т. е. систему, будущее поведение которой од- нозначно определяется ее нынешним состоянием) с конечномерным фазовым пространством (иначе говоря, состояние объекта однозначно определяется конечным набором чисел). Размерность этого пространства совпадает с числом компонент вектора Я. Однако временная координата здесь уже является дискретной величиной. Она может принимать только значения (0, т, 2т,...). К. этому важному и интересному классу объектов мы еще не раз будем возвращаться. И системы обыкновенных дифферен- циальных уравнений (3.17), в которых время непрерывно, и отображения вида (3.18), в которых время дискретно, сейчас называют динамическими системами. В методе Эйлера отличие разностной производной от dx(nr)/dt имеет порядок О(т). Такие методы называют методами первого порядка. Традиционный путь совершенствования численных ме- тодов состоит в том, чтобы аппроксимировать эту производную с более высокой точностью, например O(rN). Такие методы называют методами N -го порядка. Это может быть сделано, например, так. Пусть x(t) — одна из компонент вектора X х((п 4-1 )т) - х(пт) т d2x(nr) dx(nr) т2 d3x(t*) т 2 dt2 = ~dt~+ 7 (3'l9) Допустим, что производную d2x(nr)/dt2 (второй член в левой ча- сти) нам удалось аппроксимировать каким-либо разностным оператором с точностью не ниже О(т). Тогда производная dx(nr)/dt, которая нас интересует, будет определяться вторым членом в правой части последнего равенства. Приблизить d^x{nr)/dt2 довольно просто. Пользуясь рядом Тейлора и рассуждая так же, как при анализе равенства (3.16), получим d2x(nr) df(x(nr)) /(z((n+ 1)т)) - /(ж(пт)) т2 d2f(x(t**)) dfi = di = т + ~в st2 ' nr <** < (п 4- 1 )т. Возвращаясь к равенству (3.19), получим ж((п-|-1)т)=а:(пт)-|-т/(ж(пт))4-^(/(а:(п4-1)т)-/(а:(пт)))-|-О(т3). (3.20) Последнюю формулу нельзя рассматривать как алгоритм решения, потому что в правую часть входит член jf(x(n 4- 1)т), значение которого неизвестно. Однако его можно найти с помощью более простого и грубого метода Эйлера. Тогда вместо jf(x(n 4- 1)-г) в формуле (3.20) должен появиться член ^f(x(nr) 4-т/(®(пт))). Итак, вместо соотношения (3.20)
60 Глава 3 мы получаем приближенное равенство х((п 4- 1)т) = х(пт) 4- т/(х(пт)) + [/(ж(пт) + rf(x(nr))) - f(x(nr))]. (3-21) Оно позволяет находить приближенное решение исходного дифференци- ального уравнения. Из формулы (3.19) следует, что на отрезке (пт, (п-Ь 1)т) решение будет известно с точностью О(т3). Но для того, чтобы посчи- тать решение на отрезке [0,Г], потребуется Т/т шагов. Читатель может убедиться, что при этом ошибка будет иметь порядок О(т2). Формула (3.21) становится особенно наглядной, если записать ее в виде двух равенств у((п 4- 1)т) = х(пт) 4- т/(ж(пт)), х((п 4- 1)т) = х(пт) 4- т/(ж(пт)) 4-1 [f{y((n 4- 1)т)) - /(ж(пт))]. Первый шаг — получение у((п 4- 1)т) можно рассматривать как полу- чение грубого прогноза значения х((п 4- 1)т). Второй шаг — уточнение или коррекция этого прогноза. Именно поэтому такие методы называют методами типа «предиктор — корректор» (от английского to predict — предсказывать и to correct — исправлять). Обобщение на случай векто- ра X и вектор-функции F(X) очевидно. С помощью таких методов был исследован на компьютере ряд важных моделей нелинейной науки. Обратим внимание еще на одну возможность. Дифференциальные уравнения (3.17) можно записать в виде интегрального уравнения t X(t) = Х(0) + У* F{X(t)) dt. о Для его решения можно воспользоваться методом последовательных при- ближений, т. е. построить последовательность функций {Xs}, которая при s —> оо сходится к решению уравнения (3.17). Эту последовательность можно, например, построить так t Х’+1(«) = Х(0) + У" F(X’(t))dt. О Условия сходимости этой последовательности будут обсуждаться далее. Для простоты здесь мы предположили, что располагаем методом доста- точно точного вычисления интеграла. Комментарий. Последняя формула дает не только способ итерационного построе- ния численного решения, но и ключ к доказательству центрального результата теории обыкновенных дифференциальных уравнений — теорем существования и единственности. В самом деле, эта формула может быть записана в символическом виде Xs+' = AXS.
Простейшие нелинейные модели 61 Точному решению системы дифференциальных уравнений соответствует не- подвижная точка отображения А: X* = АХ*, т.е. такой вектор X*, который отображение А переводит в себя. Иначе говоря, соотношение, выражающее Xs+i через Xs, определяет итерационный процесс для решения уравнения X* = АХ* методом последовательных приближений. Встает вопрос, когда этот процесс сходится. Оказывается, сходимость можно весьма просто доказать для так называемых сжатых отображений. Для последних существует постоянная А, 0 А < 1, такая что р(Ах, Ау) Хр(х, у), где р — метрика в рассматриваемом полном метрическом пространстве. Сжатые отображения имеют единственную неподвижную точку, к которой сходится последовательность х, Ах, А2х,... для любой начальной точки х. В самом деле, р(Апх, An+ix) Хр(Ап~1х, Апх) < ... Хпр(х, Ах). 00 Ряд 52 АПх сходится. Очевидно, для любого числа е можно указать такой п=0 номер N, что р(Апх, Атх) < е, если m>Nnn>N.B математическом анализе доказывается, что такие последовательности, называемые последовательностями Коши, сходятся. В силу полноты рассматриваемого пространства, они сходятся к элементу X, принадлежащему этому пространству X = Игл Апх. п-юо Точка X является неподвижной, так как АХ = A lim Апх = lim Ап+'х = X. Я->00 Я“>00 Эта точка единственна, поскольку, если допустить существование второй неподвижной точки Y, то возникнет противоречие р(Х, У) = р(АХ, AY) Хр(Х, У). Поскольку А < 1, р(Х, Y) = 0. Очевидно, рассматриваемый итерационный процесс таков, что t /=о Здесь прямыми скобками || обозначена метрика p(X,Y) = max(|Xj — yj,..., |ХЛГ-УЛГ|),гдеХ = (Х1,...,ХЛГ), У = (Уь...,Глг). Допустим, что существует величина L, называемая постоянной Липшица, такая, что ||Л») -f(n|| < Если для множества векторов f(xs), фигурирующих в итерационном про- цессе, можно найти постоянную Липшица, то оператор, определяющий решение
62 Глава 3 дифференциального уравнения, можно превратить в сжатый ь ||XS+I(T)-XS(T)|| У Z||XS - Xs-‘|| dr LTjm ||X5(r) - Xs-‘(t)||. t=0 Для этого достаточно выбрать рассматриваемый промежуток таким, что LT < 1. Уточняя детали, связанные с полнотой пространства непрерывных функций и с выбором множества, для которого существует постоянная Липшица, можно получить теорему Пикара—Линделефа. Пусть X,F(- Rn , функция F(t, X) непрерывна в параллелепипеде R: O^t^a, |Х — Хо| Ъ и удовлетворяет условию Липшица по X. Пусть М является верхней границей для |F(f, Х)| на R и Т = min(a, Ь/М). Тогда задана Коши X = F(t,X), X(Q) = X0 имеет на отрезке [О, Т] единственное решение X = X(t). Перейдем к аналитическому решению системы уравнений (3.15). Эти уравнения справедливы в любой неподвижной декартовой системе координат. Дабы упростить дальнейший анализ, выберем эту систему так, чтобы z(0) = 0, vz(0) — 0. Но тогда из третьего уравнения следует, что и dVz/dt = 0, поэтому движение будет происходить в плоскости (х, у). Это движение будет описываться четырьмя уравнениями первого порядка, которые можно привести к виду ах ау = У = ~^- Перейдем в полярную систему координат, сделав замену переменных х = г cos р, у = г sin р, и учтем, что х = г cos р - гф sin р, у — г sin р + гф cos р, х — т cos р — 2гф sin р — гф2 cos р — тф sin р, у = г sin р + 2гф cos р - гф2 sin р + гр cos р. Это позволит переписать изучаемые уравнения в виде 2 а f cos р — 2гф sin р - гр sin р — гф cos р = —- cos р, г2 2 а f sin р + 2тф cos р + гф cos р - гф sin р = —- sin р. TL Домножив первое уравнение на - sin р, второе — на cos р и сложив, получим 2тф + гр = 0. После домножения на г это выражение можно проинтегрировать 2тгф + г2р — 0 => -т:(г2ф) = 0 => г2ф = const. (3.22) dt
Простейшие нелинейные модели 63 Смысл этого равенства понятен из рис. 3.3, на нем показаны радиус- векторы планеты в момент времени t и t 4- dt. Площадь, описываемая радиус-вектором за время dt, равна с точностью до бесконечно малых более высокого порядка г2Др/2. Из полученного равенства следует вто- рой закон Кеплера: радиус-вектор планеты описывает равные площади за равные промежутки времени. Эта же величина пропорциональна век- торному произведению [г х v ] или М — [г х р ], где р = mv — импульс. Величина М называется моментом импульса. Из сделанных выкладок следует, что он сохраняется при действии любой центральной силы. Домножив первое уравнение на cosy?, второе на sin у? и сложив, имеем 2 « Г -Г(р =----г. Г2 Выражая ф через момент ф = М/(тг2), и подставляя в последнюю формулу, получим где функция U = -ат/г (F = -dU/dr) называется потенциалом. До- множим последнее выражение на г и учтем, что mrf = ^(mr2/2) и ^д(г) = %г, где д — любая функция г. Отсюда получим d /1 2 1 М2 — I -тг + -—у dt \ 2 2 тг2 = 0. (3.23) Следовательно, величина в скобках, называемая полной энергией систе- мы Е, будет постоянна. Последнее равенство можно было записать в самом начале, если воспользоваться законом сохранения энергии и учесть, что потенциаль- ная энергия равна U(г), а кинетическая — т(г2 + г2ф2)/2. Выражение в скобках представляет собой полную скорость планеты. Величина г — составляющая вдоль радиус-вектора, гф — ортогональная составляющая (см. рис. 3.3). Выражение для квадрата этой скорости следует из теоремы Пифагора. Из равенства (3.23) следует, что Цв - <7(г)] - т М2 т2г2‘ После разделения переменных это выражение можно проинтегри- ровать dr (3.24)
64 Глава 3 Форму орбиты можно найти, используя равенство (3.22), в виде М dip = —г dt. тгг Следовательно, $dr y/2m[E-U(r)]-^ Учитывая, что U = -ат/г, получим где 4- const, 2 2 та с = 2тЕ + В итоге, <р = arccos М _ т^а г М 4- const. Выбрав начало отсчета так, чтобы константа была равной нулю, получим уравнение орбиты Р . М2 - = 1 + е cos где р=---, г та 2ЕМ2 та2 Из аналитической геометрии известно, что при е < 1 (Е < 0) это уравнение эллипса с полуосями а = р/(\ - е2) и Ъ = р/(1 - е2)’^2. Зависимость координаты от времени дается интегралом (3.24), либо более изящным, но тем не менее неявным выражением. Сопоставим оба обсуждавшихся подхода, имея в виду приведенные примеры. Достоинством стратегии, связанной с применением численных ме- тодов, является ее простота. Несложный алгоритм, который нетрудно запрограммировать, в принципе дает решение поставленной задачи. Ее другое преимущество — универсальность. Немного усложним за- дачу, предположив, что у нас не два, а три тела. Например, звезда, планета и астероид. Эта задача, которая ставилась еще И. Ньютоном и А. Пуан- каре, даже в простейшем случае, когда планета движется по окружности, представляет большие сложности, если действовать в рамках чисто ана- литических подходов.
Простейшие нелинейные модели 65 Вместе с тем, численное решение системы X А ^тк . . ткгк = 2j~G—г"г»*’ * = Ь-- - i=l, Tik i^k описывающей гравитационное взаимодействие j тел (тк — их масса, гк — радиус-вектор, 1\к — расстояния между ними fik =fi - fk), по существу, так же просто, как и численный анализ задачи двух тел. Однако при таком подходе обычно возникают и серьезные проблемы. Во-первых, получив результаты расчета для данных значений кон- стант, мы ничего не узнали о других возможностях, о зависимости решения от параметров. На этой основе трудно сделать какие-либо общие выводы. Законы природы в обсуждаемых случаях были сформулированы в виде дифференциальных уравнений. При численном анализе изучался совер- шенно другой объект — конечномерные отображения. Возникает проблема соответствия между дискретной и непрерывной моделями изучаемого яв- ления. (Построенное отображение тоже можно рассматривать как модель исследуемого процесса.) Чтобы подчеркнуть серьезность возникающей здесь проблемы, обра- тим внимание на следующее. При построении дискретной модели обычно есть возможность сохранить немногие наиболее важные черты непрерыв- ной модели (в разных задачах они, разумеется, будут различны). Ключевое значение во многих математических моделях физики име- ют законы сохранения. В непрерывной модели взаимодействия звезды и планеты сохранялись момент и энергия. Нет никаких оснований ду- мать, что в простейшей дискретной модели, построенной на основе метода Эйлера, эти величины также будут сохраняться. Их несохранение может существенно исказить траекторию на больших характерных временах. Преимущество аналитического подхода состоит в том, что, пользу- ясь элементарными приемами математического анализа и аналитической геометрии, удалось найти общую формулу для решения. Из нее видно, как зависит решение от начальных данных и параметров задачи. Кроме того, можно найти внутренние симметрии задачи, связанные с законами сохранения. Приведенное решение оставляет ощущение больших возможностей для дальнейшего развития теории. В значительной степени это спра- ведливо. В частности, можно показать, что при Е > 0 движение будет происходить по гиперболе, что в этой задаче существует еще один инте- грал движения [v х М\ + аг/г = const. Рассматривая значения а другого знака (взаимное отталкивание), можно получить формулу Резерфорда для рассеяния заряженных частиц, сыгравшую важную роль в атомной физике. Кроме того, пользуясь асимптотическими методами, можно по- пытаться учесть влияние других планет на данную. Двигаясь по этому пути, Адамс и Леверье, анализируя нерегулярности в движении планеты Уран, в 1846 г. предсказали существование планеты Нептун. Можно ска-
66 Глава 3 зать, что эта исследовательская программа во многом определяла развитие всей прикладной математики до начала XX в. К недостаткам приведенных аналитических решений можно отнести следующие. Получено одно решение одной динамической системы. Число уравнений, в которых разделяются переменные и удается перейти от си- стемы шести уравнений к одному уравнению, очень невелико. Достаточно ограничена и область применимости асимптотических методов. Кроме того, не должно создаваться впечатление, что приведенное аналитическое решение позволяет совершенно избежать применения чис- ленных методов. В самом деле, формула (3.24) выражает зависимость г от t неявно. Это предполагает при проведении конкретных расчетов численное интегрирование, либо, по крайней мере, численное решение трансцендентных уравнений. Концепция вычислительного эксперимента во многом связана с по- пыткой объединить оба подхода. Вернемся к задаче о движении планеты вокруг звезды. В самом деле, гораздо разумнее было бы вначале выделить законы сохранения, существующие в этой задаче, затем перейти к уравне- ниям для г и ф и уже потом анализировать их численно. Это привело бы к автоматическому сохранению в дискретной модели аналогов энергии и момента. Кроме того, переход к численным методам более высокого порядка (например, методу Рунге—Кутта четвертого порядка), помог бы значительно увеличить точность расчета. Наличие простого аналитическо- го решения (например, при е = 0, когда движение происходит по окруж- ности) также очень полезно. Его можно использовать в качестве теста: вычислив это решение с помощью компьютера, можно было бы сравни- вать его с точным. Это помогло бы оценить точность расчета и наилучшим образом выбрать шаг по времени т. Создание соответствующих программ во многом связано с тем, насколько велик класс задач того типа, который мы собираемся анализировать. Чем больше этот класс, тем более эффек- тивное и универсальное программное обеспечение приходится создавать. Мы перечислили лишь небольшую часть вопросов, встающих при по- становке вычислительного эксперимента. Их анализ обычно требует боль- ших усилий от специалистов по математическому моделированию. Однако во многих случаях альтернативы вычислительному эксперименту нет. Несмотря на хрестоматийность обсуждаемого класса задач, они по- прежнему активно изучаются специалистами по нелинейной науке. Слож- ность задачи трех тел была осознана еще А. Пуанкаре. Возможность по- явления сложных хаотических траекторий в этой задаче, неустойчивость по отношению к параметрам потребовали многочисленных компьютерных экспериментов и разработки глубоких математических подходов. Кроме того, в последние десятилетия были обнаружены новые парадоксальные решения для системы тел, взаимодействующих в соответствии с законом всемирного тяготения. Оказалось, что возможно таким образом разме- стить в пространстве пять тел (не говоря уже о большем числе объектов), что все они уходят на бесконечность за конечное время. Здесь также строгим результатам предшествовали компьютерные расчеты.
Простейшие нелинейные модели 67 Исследовательская программа А. Пуанкаре Расширение арсенала математических моделей в конце прошлого века, в частности, необходимость анализа моделей, связанных с управ- лением механическими системами, привело к появлению новых идей. Многие из этих идей, определивших развитие математического модели- рования и создание нескольких разделов математики, были выдвинуты А. Пуанкаре. Обратимся к некоторым из них, которые в дальнейшем бу- дут обсуждаться более подробно и использоваться при анализе различных нелинейных явлений. Аттракторы и качественный анализ динамических систем В XIX в. основные усилия исследователей были направлены на ана- лиз математических моделей замкнутых систем, которые не способны к обмену энергией с другими системами, и собственная энергия кото- рых сохраняется. Их примером может служить математический маятник и движение планеты в поле звезды. Такие системы будем называть кон- сервативными. (Позже мы обсудим более строгие формулировки.) В консервативных системах начальные данные не могут быть «за- быты». Обратим внимание на фазовые траектории для гармонического осциллятора тх + кх — 0, показывающие, как с течением времени может меняться состояние системы на плоскости (х, х). Можно считать, что т — масса грузика на пружинке с жесткостью к (см. рис. 3.5 а). Точка, изоб- ражающая состояние динамической системы, будет двигаться по эллипсу, соответствующему данной энергии. Она не может перейти на другую за- мкнутую кривую. Потенциальная энергия в этой системе задается квадра- тичной параболой U = кх2/2 (см. рис. 3.5 б). Точки пересечения этой кри- вой с линией Е = const определяют амплитуду колебаний осциллятора. о) б) Рис. 3.5. Пример консервативной системы — гармонический осциллятор: а) фа- зовые траектории, которые в этом случае являются эллипсами; б) потенциал для этой системы
68 Глава 3 Однако, если мы учтем сколь угодно слабые диссипативные процессы, например, вязкое трение, которое описывается членом F = -ух, тх + ух + kx = О, (3.27) Рис. 3.6. Пример диссипативной системы — гармонический ос- циллятор с вязким трением. Фа- зовые траектории в этом случае являются спиралями то картина существенно изменится. Разыскивая решение в виде экспонен- ты х ~ ext, получим Л1.2 = ± ^7-m2 ~4*^ . Следовательно, x(t) -> О независимо от начальных данных. Фазовые траектории в этом случае представлены на рис. 3.6. Видно, что они «наматываются» по спирали на начало координат. Эта система, как и математические модели дру- гих систем, называемых диссипативными, не имеет интегралов движения или сохраняющихся величин. В них независимо от начальных данных возникает с течением времени один и тот же установившийся режим. А. Пуанкаре предложил сосредоточить внимание не на переходных процессах, а на установившихся режимах, т. е. на асимп- тотическом поведении решений при t -> оо. Математическим образом установившихся режимов является притягивающее множе- ство в фазовом пространстве или аттрак- тор (от английского to attract — притяги- вать). При этом наиболее важными, по мне- нию А. Пуанкаре, являются качественные особенности аттракторов. В частности, важ- но, описывает ли аттрактор переменные, не меняющиеся во времени, периодические или более сложные режимы. Существенным является число и тип аттракторов, а также множество начальных данных, с которых происходит выход на данный аттрактор. Эти множества назы- вают областями притяжения аттрактора. Эти проблемы и рассматривает качественная теория дифференциальных уравнений. Результаты качествен- ной теории обыкновенных дифференциальных уравнений являются очень общими. Они показывают, что огромное количество нелинейных дисси- пативных систем ведут себя одинаково. Пусть дано уравнение dx -77 = 7 х) (3.28) аг и известно, что решение x(t) существует и ограничено при 0 < t < оо. Тогда, какую бы функцию f мы ни взяли, всегда будет возникать ин- тегральная кривая одного и того же вида. Функция x(t) монотонно стремится к состоянию равновесия ж*. В случае системы двух автономных обыкновенных дифференциаль- ных уравнений = 9(х, у), = h(x, у) (3.29)
Простейшие нелинейные модели 69 Рис. 3.7. Типы аттракторов в автономной системе двух обыкновенных дифферен- циальных уравнений. Слева — интегральные кривые, справа — характерный вид фазовых траекторий: а) устойчивая особая точка; б) предельный цикл аттрактором также может быть устойчивая особая точка (см. рис. 3.7 а). Однако существует и вторая возможность. Аттрактор в диссипативной системе двух нелинейных обыкновенных дифференциальных уравнений может описывать установившееся периодическое движение: lim x(t) = X(t), lim y(t) = Y(t), /->oo t-HX / 3 30) X(t + T) = X(t), Y(t + T) = Y(t). Величина T в этих формулах называется периодом решения. Аттрактор в этом случае называют устойчивым предельным циклом. В фазовом про- странстве ему соответствует замкнутая кривая (см. рис. 3.7 б). Других вариантов нет, какие бы функции g и h мы не использовали. Отсюда понятно, насколько важным является качественный анализ для моделирования нелинейных явлений. Например, если мы наблюдаем установившийся колебательный процесс в диссипативной системе и пе- риодическое внешнее воздействие отсутствует, то для ее моделирования понадобятся, как минимум, два автономных обыкновенных дифференци- альных уравнения. Если наблюдается двухчастотный (при котором, напри- мер, одна из переменных может меняться по закону x(t) = sin u\t sino^t) или хаотический режим, то система должна включать не меньше трех уравнений. Значение качественного анализа для прикладных проблем стало осо- знаваться в 30-е гг. в связи с конструированием и исследованием радиотех- нических систем. В эти годы физики обнаружили, что работа генераторов и ряда других электронных приборов тесно связана с реализацией режи-
70 Глава 3 мов, описываемых устойчивыми предельными циклами. Возникла теория колебаний. Некоторые из ее базовых моделей мы проанализируем ниже. Локальный анализ динамических систем При решении алгебраических уравнений принципиальную роль часто играет удачная замена переменных. Поэтому было бы естественно найти такие замены переменных в дифференциальных уравнениях, которые позволяют представить их в наиболее простом виде. Можно ожидать, что найти одну такую замену во всем фазовом пространстве (глобально) не удастся. Однако, если рассмотреть эту задачу локально, в небольшой окрестности фазового пространства, то можно рассчитывать на успех. В самом деле, обратим внимание на фазовые траектории, фигуриро- вавшие в этой книге. Их типичный вид вдали от особых точек примерно таков, как показано на рис. 3.8 а. Можно предположить, что есть заме- на переменных (ж, у) -> «выпрямляющая» фазовые траектории и приводящая их к виду, показанному на рис. 3.86. Рис. 3.8. Вдали от особых точек с помощью замены переменных локально вектор- ное поле может быть «выпрямлено»: а) исходное векторное поле; б) «выпрям- ленное» поле Последнее векторное поле, т. е. набор векторов х в фазовом про- странстве, соответствует простейшему дифференциальному уравнению х = с, у =0. И действительно, справедлива теорема о выпрямлении векторного поля. Она утверждает, что есть отображение h, осуществляющее отобра- жение некоторой окрестности G точки X в N-мерном фазовом простран- стве V' системы (3.17), переводящее ее в окрестность точки Y = h(X) в фазовом пространстве V системы 3/1 = с, у2 = ... = Vn = 0. При этом отображение h и обратное отображение Л-1 осуществляют- ся дифференцируемыми функциями и являются взаимно однозначными. Такие отображения называются диффеоморфизмами. При этом предпола- гается, что точка X не является особой. Таким образом, вдали от особых точек все динамические системы локально эквивалентны простейшему уравнению.
Простейшие нелинейные модели Мы видели, что устойчивость особых точек уравнения х = f(x) опре- деляется линейным членом, когда соответствующая производная не равна нулю. Это позволяет надеяться на возможность приведения к канониче- скому виду и в этом случае, что означает возможность классификации. В самом деле, естественно отнести к одному классу все динамические системы, которые локально можно привести к одному и тому же канони- ческому виду. Кроме того, представляет большой интерес анализировать не одно уравнение, а целое семейство динамических систем х = f(x, А) и привести это семейство к каноническому виду в некоторой окрестности фазового пространства и пространства параметров. При этом очень важной оказывается идея типичности, грубости, или структурной устойчивости. Эта идея родилась в связи с анали- зом математических моделей радиотехнических систем А. А. Андроно- вым и Л. С. Понтрягиным и получила большое развитие в последующие годы. Смысл этой идеи очень прост. При математическом моделиро- вании различных явлений мы знаем параметры уравнений с конечной точностью, а сами уравнения являются приближенными. Поэтому естествен- но потребовать, чтобы математические модели описывались уравнениями, ка- чественные свойства которых не ме- няются при небольших возмущениях («шевелении») параметров. Например, если некоторый про- цесс описывается уравнением х = А -I- х2, то естественно считать, что каждая от- дельная система, взятая наугад, будет относиться к случаю, когда А > 0 и нет ни одного состояния равновесия, либо Рис. 3.9 к случаю, когда А < 0 и есть два состояния равновесия (см. рис. 3.9). Систему с А = 0 естественно считать нетипичной или негрубой. Если она возникла в ходе моделирования, то можно предположить, что либо существенные факторы оказались неучтенными, либо система обладает какими-то специальными свойствами (например, симметрией), делаю- щими ее нетипичной. Реализация идеи локального анализа привела к возникновению и раз- витию таких разделов математики как теория нормальных форм, теория бифуркаций, теория катастроф, играющих важную роль в моделировании нелинейных явлений. Область приложения этих идей в моделировании и ряд конкретных моделей, изучаемых с помощью этих методов, мы неоднократно будем обсуждать далее.
72 Глава 3 Глобальный анализ Во многих случаях важно представлять решение не только локаль- но, в малой окрестности точки фазового пространства, но и глобально. Например, важно знать, сколько и каких аттракторов имеет изучаемая О) А —о В х система, как может измениться число и тип аттракторов при изменении параметров. Приведем пример, иллюстрирующий идею глобального анализа. В физике известны законы сохранения непрерывных величин, таких как энергия, импульс, момент импульса. Однако наряду с ними известны законы сохранения другого типа. Мо- гут сохраняться дискретные величины, например, такие, как барионный или электрический заряды. Они означают, что, приписав каждой частице некото- рый заряд qi и просуммировав по всем частицам, входящим в некоторую за- мкнутую систему N »=1 мы обнаружим, что величина суммар- ного заряда Q будет сохраняться. Это накладывает серьезные ограничения на возможные в природе процессы. Если в системе рождается барион с зарядом -1-1, то должен родиться и антибарион с зарядом -1, электрон может рождать- ся только в паре с позитроном. Мы покажем, что похожая ситуа- ция имеет место в уравнении х = v(x). Пусть 0 < х 2ir и v(0) = г(2тг). В этом случае правые части пе- риодичны и фазовым пространством является окружность. Мы покажем, что здесь также можно ввести аналог такого заряда. Будем говорить, что состояние равновесия ж, (/(г,) = 0) обладает топологическим зарядом qi, равным -1, если dv(xi)/dx < 0, и +1, если dv(xi)/dx > 0 и 0, если dv(xi)/dx = 0. Сумму по всем состояниям равновесия в таких системах назовем топологическим зарядом системы Q = Qi- Покажем, что для всех ди- i намических систем с непрерывной функцией v(x) топологический заряд равен нулю. В простейшем случае, когда v(x) — постоянная величина, Q = 0 (см. рис. 3.10 а). Покажем, что эта величина не меняется при непре- рывной деформации функции v(x). Можно рассуждать следующим об- разом. Будем считать, что v(x) — нитка, закрепленная в точках А и В Рис. 3.10. При «натягивании нити» топологический заряд системы не меняется
Простейшие нелинейные модели 73 (см. рис. 3.10d). Будем натягивать эту нитку. До тех пор пока не меняется число состояний равновесия, величина Q не меняется. При некоторой длине «нити» возникает ситуация, показанная на рис. 3.10 в, (кривая 2) одновременно исчезают два состояния равновесия. В момент исчезнове- ния топологический заряд состояния равновесия х* равен нулю. Когда исчезнут два состояния, одно с зарядом -I-1, другое -1, величина Q также останется такой же, как до деформации. Действуя в точности так же в общем случае, когда есть любое конечное число состояний равновесия, приходим к выводу о том, что величина Q не меняется при непрерывной деформации. Поскольку для случая, показанного на рис. 3.10а, Q = 0, то такой она будет и в других случаях. Топологический заряд для таких систем сохраняется. Более глубокие и содержательные рассуждения, опирающиеся на по- нятие непрерывности, на возможность анализировать свойства геомет- рических объектов, сохраняющиеся при непрерывных преобразованиях, и легли в основу топологии. А. Пуанкаре считал топологию, или «гео- метрию положения», одним из самых сложных и абстрактных разделов анализа. Топологические методы позволили получить ряд важных общих результатов, касающихся больших классов нелинейных математических моделей, а также предсказать ряд новых физических явлений. Значение исследовательской программы А. Пуанкаре в развитии есте- ствознания и исследовании нелинейных явлений оказалось очень велико. На многие вопросы, поставленные в начале века, удалось получить глу- бокие содержательные ответы только с появлением компьютеров. Это привело к появлению нового поколения нелинейных математических мо- делей, к новому уровню понимания многих явлений природы, к рождению нелинейной науки. Вопросы и задачи 1. Объем газового пузыря, образовавшегося в результате глубинного подводного взрыва, колеблется с периодом, пропорциональным рарьЕс. Здесь р — давление, р — плотность воды, Е — полная энергия взрыва. Найти а, Ь, с. 2. Как сила, действующая на сферу, движущуюся в жидкости, зависит от радиуса сферы г, скорости движения v и вязкости ту? Размерность вязкости — кг-м-1сек-1. 3. Грузик массы т на пружинке с жесткостью к совершает колебания в жид- кости. Насколько велик должен быть коэффициент вязкого трения 7, чтобы грузик без колебаний двигался к положению равновесия? 4. Допустим, что все пространственные масштабы в Солнечной системе изме- нились в 0 раз. Насколько при этом изменятся временные масштабы? 5. Можно ли покинуть пределы Солнечной системы, если межпланетный ко- рабль движется со скоростью реактивного самолета? 6. Простейшим уравнением, описывающим нелинейные колебания является уравнение Дюффинга х -I- -I- дж3 = 0.
74 Глава 3 Считая, что д < О, выяснить каков период малых колебаний. При каком значении энергии период стремится к бесконечности? 7. Исследуйте колебания в системе, где возврашаюшая сила убывает со вре- менем ж х+ё=°- 8. Исследуйте колебания в системе, где и возвращающая сила, и коэффициент вязкого трения убывают со временем 9. Какой должна быть сила, действующая на материальную точку, чтобы числен- ное решение дифференциальных уравнений, полученное с помощью метода Эйлера, совпало с точным? 10. Считая, что д — малый параметр в уравнении Дюффинга, выяснить, как зависят малые колебания от этого параметра. 11. Представим, что Земной шар — твердое тело с постоянной плотностью р. Допустим, что в нем сделано отверстие, проходящее через центр. В это отверстие брошен камень. Что будет происходить далее? 12. Рассмотрим движение частицы в центральном поле с потенциалом U(г)=Агп. В каком случае частица, двигающаяся в таком поле, может упасть на центр? 13. Доказать, что при движении в центральном поле с потенциалом U = а/г величина [v х М} + у сохраняется. (Напомним, что М = m[ftF|.) 14. Исследовать движение материальной точки в центральном поле с потенциа- лом U = аг2. 15. Задачу об определении периода колебаний Т(Е) в зависимости от энергии Е в заданном потенциале U(x) можно рассматривать как прямую задачу. Одназначно ли разрешима обратная задача — определение потенциала U(x) по заданной зависимости Т(Е)? 16. Существует ли потенциал, в котором колебания обладают свойством изо- хронности, т. е. их период не зависит от амплитуды колебаний? 17. Можно ожидать, что поведение классической частицы (движение которой определяется вторым законом Ньютона) и квантового объекта (который описывается уравнением Шредингера) в некоторых потенциалах будут суще- ственно отличаться. Не могли бы вы привести примеры таких потенциалов? 18. Математический маятник отклонили от верхнего положения на малый угол е. Как будет зависеть период колебаний от параметра е? 19. Представим, что в некоторый момент времени показатель степени в законе всемирного тяготения изменился. Постоянная G стала такой, что ускорение свободного падения на поверхности Земли осталось прежним. Как при этом изменится окружающий нас мир? 20. Специалисты по теории эволюции утверждают, что самым большим на- секомым была гигантская стрекоза с размахом крыльев в 70 см, жившая в каменно-угольном периоде палеозойской эры. Почему, на ваш взгляд, не было насекомых более крупного размера? 21. Какие безразмерные выражения можно составить из таких мировых констант, как заряд электрона е, постоянная Планка Л, гравитационная постоянная G, скорость света с, масса электрона т? Каковы значения этих постоянных? Каков, на ваш взгляд, их смысл?
Простейшие нелинейные модели 75 Рекомендуемая литература Методы подобия и размерности при исследовании различных нелинейных явлений рассматриваются в книге: Седов Л. И. Методы подобия и размерности в механике. М.: Наука, 1974. Асимптотические методы решения различных физических задач обсуждаются в книгах: Найфэ А. Введение в методы возмущений. М.: Мир, 1984; Мигдал А. Б. Качественные методы в квантовой теории. М.: Наука, 1975; Андрианов И. В., Баранцев Р. Г., Маневич Л. И. Асимптотическая математика и синергетика: путь к целостной простоте / Сер.: «Синергетика: от прошлого к будущему». М.: Книжный дом «JIHBPOKOM»/URSS, 2009. Рассмотренная модель математического маятника играет принципиальную роль в теории нелинейного резонанса: Заславский Г. М. Стохастичность динамических систем. М.: Наука, 1984. Множество задач, связанных с движением в центральном поле, обсуждаются в курсах теоретической механики: Ландау Л. Д. Механика. М.: Наука, 1973; Галдстейн Г. Классическая механика. М.: Наука, 1975. Обе рассмотренные модели относятся к гамильтоновым системам. В отличие от диссипативных систем, которые обсуждаются в этой книге, здесь возникают своеобразные задачи и методы их исследования. О них рассказывается в книгах: Лихтенберг А., Либерман М. Регулярная и стохастическая динамика. М.: Мир, 1984; Заславский Г. М., Сагдеев Р. 3. Введение в нелинейную физику: От маятника до турбулентности и хаоса. М.: Наука, 1988. Численные методы интегрирования обыкновенных дифференциальных уравнений описаны в учебниках: Самарский А. А. Введение в численные методы. М.: Наука, 1982; Калиткин Н.Н. Численные методы. М.: Наука, 1978; Бахвалов Н.С. Численные методы. М.: Наука, 1975. Доказательство теоремы о выпрямлении векторного поля изложено в курсе: Арнольд В. И. Обыкновенные дифференциальные уравнения. М.: Наука, 1971. Представление о программе Пуанкаре, в реализации которой принципиальную роль играет вычислительный эксперимент, дают книги: Гукенхеймер Дж., Холмс П. Нелинейные колебания, динамические системы и бифуркации векторных полей / Пер. с англ. Ижевск: РХД, 2002; Компью- теры и нелинейные явления. М.: Наука, 1988; Ахромеева Т. С., Курдюмов С. П., Малинецкий Г. Г., Самарский А. А. Нестацио- нарные структуры и диффузионный хаос. М.: Наука, 1992. О языке, который используется при описании и построении нелинейных матема- тических моделей, рассказывается также в книгах: Трубецков Д. И. Введение в синергетику. Хаос и структуры / 2-е изд. Сер.: «Синергетика: от прошлого к будущему». М.: URSS, 2004; Малинецкий Г. Г., Потапов А. Б. Современные проблемы нелинейной дина- мики / 2-е изд., исправл. и доп. М.: URSS, 2002.
Escher M. C. Swans. 1956 Эшер М. К. Лебеди
Глава 4 Аттракторы уравнения х — v(x) Добивайтесь того, чтобы играть легкие вещи правильно и хорошо: это лучше, чем посредственно исполнять трудные. Р. Шуман Качественная теория уравнения х = v(x) Уравнение х = v(x) с начальным условием ж(0) = xq является за- мечательным объектом потому, что для него удается провести детальное качественное исследование, — определить все аттракторы, доказать, что именно к ним траектории сходятся при t оо и указать, при каких имен- но начальных данных на какой аттрактор происходит выход. Прежде чем заняться изучением этих вопросов, напомним основные понятия теории обыкновенных дифференциальных уравнений и рассмотрим несколько моделей, приводящих к уравнению обсуждаемого типа. Дифференциальные уравнения как математические модели Допустим, мы хотим построить математическую модель объекта, который обладает следующими свойствами. 1. Объект может быть однозначно охарактеризован конечным набо- ром чисел Xi,...,Xn. Эти числа называют фазовыми переменными. Пространство, которому они принадлежат, называют фазовым про- странством, а величину N — числом степеней свободы. 2. Состояние объекта может меняться со временем t, т. е. все чис- ла x\,...,Xn зависят только от одной независимой переменной. Поведение объекта является детерминированным: состояние изуча- емой системы зависит только от ее предыстории, т. е. от значений Х\,... ,xjf в предыдущие моменты времени. 3. Все зависимости xi(t),... ,xjf(t) являются гладкими (дифференци- руемыми) функциями независимой переменной t.
78 Глава 4 4. Фазовая скорость изучаемого объекта ..., может зави- сеть только от фазовых переменных ., xn(1) и времени t h (а не от Xi(t - т), f Xi(z) dz и т.д.). ti Числа ®i,..., xn можно интерпретировать как координаты точки, движу- щейся в фазовом пространстве. Величину dx/dt = v при этом называют скоростью или фазовой скоростью. В теории обыкновенных дифференциальных уравнений считаются известными векторы скорости в точках фазового пространства. Множество таких векторов называют векторным полем. Задача теории обыкновенных дифференциальных уравнений состоит в том, чтобы по векторному полю v и начальному положению ж(0) найти траекторию точки в фазовом пространстве x(t) или зависимость координат вектора х от времени t, называемую интегральной кривой. Другими словами, надо найти траекторию x(t), удовлетворяющую дифференциальному уравнению dx — = v dt и начальному условию ж(0) = xq. Эти понятия мы проиллюстрируем ниже с помощью нескольких примеров. Однако вначале сделаем замечание, касающееся терминологии. Замечание. Если векторное поле v = зависит только от вектора х и не зависит явно от времени, систему дифференциальных уравнений называют автономной. Размерность фазового пространства при этом совпадает с числом компонент вектора х — N. В противном случае v = v(x, t) систему уравнений называют неавтономной. Фазовое пространство Х\,... ,xN,t имеет размерность N + 1. В самом деле, этот случай сводится к предыдущему. В этом можно убедиться, добавив к ис- ходной системе уравнение dx^+i/dt = 1. Это позволит записать векторное поле в виде («1 (a?i,..., xN, 2?лг+1),..., vN(x\,..., xN, xN+i), 1), и сделает изучаемую систему автономной. В некоторых книгах при обсуждении неавтономных систем множество точек {ij, ..., х^} называют фазовым пространством. Множество {zi,..., Xn, t} — расширенным фазовым пространством. Пример. Простейшая автокаталитическая реакция. Из школьного курса химии известен закон действующих масс, справедливый для многих химических реакций, идущих в газообразной или жидкой фазе. В реакции, где два ве- щества X и Y, реагируя, дают вещество Z (X+Y -> Z), скорость изменения концентрации вещества Z пропорциональна произведению концентраций веществ X и Y. Коэффициент пропорциональности называется постоян- ной реакции к. Обозначая через X, Y, Z концентрации соответствующих веществ (число молекул в единице объема), можно записать dX — z ч ^- = *XY. (4.1) di
Аттракторы уравнения х = v(x) 79 В самом деле, для того, чтобы реакция шла, молекулы вещества X должны сталкиваться с молекулами вещества Y. Очевидно, вероятность этого пропорциональна числу молекул X в единице объема (т. е. кон- центрации X). Точно так же она должна быть пропорциональна кон- центрации Y. Коэффициент пропорциональности к зависит от размеров молекул, их скоростей и т.д. Это и отражает формула (4.1). Если в реак- ции п молекул X взаимодействуют с одной молекулой Y, то изменение концентрации вещества Z пропорционально XnY. Рассмотрим схему более сложной реакции ki кз А + 2Х ЗХ, X ^==± В. (4.2) кг кд Полная реакция имеет вид A В. В ходе этой реакции вещество А превращается в вещество В через промежуточный продукт X. Молекулы вещества X производятся при участии молекул того же сорта X в ка- честве катализатора. Такие реакции называются автокаталитическими. Эти реакции описываются нелинейными по некоторым концентрациям зависимостями. В схеме реакции учтены не только прямые реакции, скорости которых определяются постоянными к\ и к3, но и обратные, константы которых равны соответственно кг и Л4. В качестве идеализации будем рассматри- вать открытую систему. Предположим, что она может взаимодействовать с неограниченными резервуарами веществ А и В. В результате этого концентрации веществ А и В можно считать постоянными. Исходя из закона действующих масс, можно записать кинетическое уравнение, определяющее изменение концентрации вещества X со вре- менем _ dX —3 —-9 — — — = -fc2X3 + fciAX2 - к3Х + fc4B. (4.3) dt Пусть начальное значение концентрации известно Х(0) = Xq. Возника- ют вопросы об аттракторах системы, их областях притяжения, а также о зависимости установившихся режимов от параметров А и В. Комментарий. Автокаталитические реакции, которые описываются нелинейными уравнениями с кубической нелинейностью, известны в химической кинетике. В частности, в реакции, протекающей в верхних слоях атмосферы, образование озона происходит при столкновении атома и молекулы кислорода: О -f- О2 4- М { i О3 4“ М, где М некоторая частица, роль которой состоит в отведении энергии, выделяю- щейся в этой реакции. Кроме того, выражения для скоростей ряда биохимических реакций в некоторых предельных случаях можно свести к кубическому виду. Однако значение автокаталитических реакций выходит далеко за пределы анализа отдельных химических систем. Согласно концепции немецкого исследо- вателя, лауреата Нобелевской премии М. Эйгена, такие реакции сыграли ключевую роль на добиологической стадии эволюции. М. Эйген предположил, что после то- го, как на Земле появились биополимеры, спотанно возникли последовательности
80 Глава 4 циклических реакций, называемые гиперциклами. В гиперцикле конечный продукт, получающийся в последней реакции цикла, может служить исходным веществом, вступающим в первую реакцию этого цикла, либо выступать в качестве катали- затора. При этом у системы появляется возможность к самовоспроизведению, к копированию. Конкуренция гиперциклов приводит к состоянию с наиболь- шей устойчивостью по отношению к флуктуациям или ошибкам копирования. Исследователи полагают, что в ходе такой селекции, при которой реализуется дар- виновский принцип «выживания наиболее приспособленных», у системы должна появиться способность накапливать опыт с помощью некоторого первичного «ге- нетического кода». Ряд моделей математической генетики играют ключевую роль в теории гиперциклов Эйгена. Вернемся к исходной задаче качественного исследования уравнения х = v(x), ж(0) = 2?о. (4.4) Рассмотренные выше примеры показали, что решения этого уравнения могут монотонно стремиться к постоянному значению x(t) -> х* при t -> оо, v(x*) = 0 (4.5) (например, как в логистическом уравнении х = дж(1 - ж)), могут неогра- ниченно возрастать за бесконечное время x(t) —> оо при t —> оо (4.6) (как в уравнении Мальтуса), или за конечное время tj x(t) —> оо при t -> tf (4.7) (как в простейшей модели цепной реакции х = х&, fl > 1). Теоремы сравнения Традиционные подходы классической математики, связанные с по- лучением решений в квадратурах, с асимптотическими разложениями, с введением специальных функций, в конце XIX в. начали встречаться с нарастающими трудностями. Это потребовало новых идей. Один из методов анализа, примене- ние которого не связано с линейностью, с той или иной симметрией уравнения, — теоремы сравнения. Простейшие из них можно проиллю- стрировать на примере двух элементарных математических моделей. Движение автомобиля во время ралли Будем считать, что водителю выдан график движения, показываю- щий, в какой момент времени какую скорость v(t) он должен иметь. Тогда его путь х определяется уравнением Зная график движения, можно выяснить, какой автомобиль первым придет к финишу. В ряде случаев это удается сделать, не решая уравнения, а воспользовавшись следующей теоремой сравнения.
Аттракторы уравнения х = v(x) 81 Теорема 1. Пусть даны решения двух диф- ференциалных уравнений с одинаковыми начальными данными X\(t) и dx\(t) dt = Vi(0, dxi(t) dt £i (0) = ж2(0). = vi(t)> Пусть кроме того Vi(t) > V\(t). Тогда Смысл теоремы прост: если в каждый момент времени ехать быстрее соперника, то к финишу придешь первым. Рис. 4.1. Примеры интеграль- ных кривых дифференциаль- ных уравнений, описывающих движение автомобилей Геометрическую интерпретацию теоремы дает рис. 4.1. Угол а на- клона касательной к кривой X\(t) (тангенс которого совпадает со скоро- стью меньше, чем угол наклона /3 к кривой xi(t), если брать их в один момент времени Г. Доказательство очевидно. Вычитаем второе уравнение из первого и интегрируем. х2(0 - Я|(0 = / (v2(0 - vi(f)) dt. о Справа стоит интеграл от положительной функции. Поэтому х2(0 > X[(t). Лыжник на трассе Допустим, по трассе бегут два лыжника. Их скорость зависит от участ- ка маршрута, который проходится, v = v(x). Одному лыжнику сообщают график движения другого, и он старается пройти каждый участок маршру- та быстрее V\(x) > v2(z). Можно ли утверждать, что он придет к финишу первым? Теорема 2. Пусть даны решения двух автономных обыкновенных диффе- ренциальных уравнений с одинаковыми начальными данными dx2(t) —= »i(®i, —~- = v2(x2), dt dt £i(0) = я2(0) = 0. Пусть также V\(z) > v2(z) для всех значений z. Тогда X\(t) ж2(<). Эту теорему иллюстрирует рис. 4.2. Здесь tga(z*) = V|(z*) > tg /5(ж*) = v2(z*). В этом случае угол наклона к кривой x\(t) должен быть больше, чем угол наклона к кривой ж2(0 при одном значении координаты х*. Однако в определенные моменты времени (например, в момент t', см. рис. 4.2) скорость второго лыжника может быть больше, чем скорость первого.
82 Глава 4 Для доказательства предположим противное. Пусть до некото- рого момента t* утверждение было выполнено. Однако в этот мо- Рис. 4.2. Примеры интегральных кривых дифференциальных уравнений, описыва- ющих движение лыжников мент второй лыжник догнал пер- вого, = x2(t*). Напомним известную из математического ана- лиза теорему Лагранжа: если функ- ция f(x) непрерывна на отрезке [а, Ь] и дифференцируема в каж- дой внутренней точке отрезка, то внутри отрезка найдется точка с, такая, что будет справедливо ра- венство: /(») - /(а) b-a f Итак, X\(t* - Д0 > x2(t* - Д0, Ж|(Г) = х2(Г). Следовательно, xi(f) - a?i(f - Д0 х2(Г) - х2(Г - At) Ki < Ki ’ Воспользовавшись теоремой Лагранжа, приходим к неравенству vi(f -е,до < v2(t* -е2ы). Переходя к пределу при Д£ -> 0 и учитывая, что xi(t*) = x2(t*), получим «.(Г) $ »2(f). Однако последнее неравенство противоречит условиям теоремы. Слу- чай, когда t* = 0, предоставляем рассмотреть читателям самостоятельно. Теоремы сравнения сейчас являются очень эффективным инстру- ментом анализа математических моделей. Допустим, что нас интересует поведение некоторого процесса, который описывается динамической си- стемой dx — =v(x), я(О) = жо. (4.8) at Пусть у нас есть два уравнения, решения которых известны. dz\ dz-> -ir = v2(z2), Z|(0) = z2(0) = x0. dt dt Кроме того, V\(y) < v(y) < v2(y) для 0 < у < оо. В этом случае мы сможем «зажать» решение в коридор между функциями z\(t) x(t) z2(t), что может дать важную информацию о поведении изучаемого объекта. Проиллюстрируем это на примере первого метода устойчивости Ля- пунова для состояний равновесия простейшего уравнения dx л = dt
Аттракторы уравнения х = v(x) 83 Для того, чтобы проанализировать устойчивость состояния равновесия ж* (v(z*) = 0), достаточно было выяснить знак dv(x*)/dx = а (когда а 0), т. е. для того, чтобы исследовать устойчивость особой точки, достаточно взять линейные члены, отбрасывая квадратичные. Воспользуемся дока- занной теоремой сравнения, чтобы показать это. Для этого нам понадобится найти в явном виде решение логистиче- ского уравнения у = ау-Ду2, (4.9) с которым мы и будем сравнивать решение интересующей нас задачи. Логистическое уравнение Обсудим несколько подробнее это уравнение, при а > 0, Д > 0 являющееся одной из базовых математических моделей нелинейной ди- намики. При выводе уравнения Мальтуса предполагалось, что доступные ресурсы неисчерпаемы и скорость роста популяции никак не зависит от ее численности. Однако очевидно, что это приближение может быть оправдано, только если потребляемые ресурсы малы в сравнении со всем объемом ресурсов, имеющихся в месте обитания сообщества. Если это не так, то надо учитывать различные ограничивающие факторы. Например, ухудшение питания может привести к уменьшению среднего времени жизни членов сообщества, а значит, и к стабилизации его численности. Усиление внутривидовой конкуренции, ухудшение усло- вий жизни может сказываться на численности вида. Все это грубо можно учесть с помощью ограничивающего члена -fly1 (Д > 0). Функция f(y) = ay - fly1 имеет вид квадратичной параболы (см. рис. 4.3 а). Эта парабола пересекает ось абсцисс в точках у = 0 и у = а/fl, т. е. проходит через положения равновесия. Нетрудно убе- диться, что df(0)/dy > 0, df(a/fl)/dy < 0, поэтому второе положение равновесия устойчиво, первое — нет. Показанная функция f(y) описывает следующие процессы. Когда популяция мала, численность увеличивается. Однако в системе есть от- рицательная обратная связь: чем больше сообщество, тем медленнее оно растет и наконец, при у = а/fl рост прекращается (см. рис. 4.3 б, кри- вая 1). С другой стороны, если численность вначале у(0) превышала этот предел, то величина y(t) начинает уменьшаться (см. рис. 4.3d, кривая 2). Смысл постоянных а и fl очень прост. Коэффициент а показывает, насколько быстро растет популяция, пока она мала. Коэффициент fl показывает, насколько велика может быть предельная численность у. Фазовым пространством системы является полупрямая у 0. По смыслу задачи функция y(t) неотрицательна. Движение точки, определя- ющей состояние динамической системы у = f(y), по этой прямой, можно очень просто предсказать с помощью графика f(y). Если f(y) > 0, то точка будет двигаться вправо со скоростью, пропорциональной f(y), если f(y) < 0 — влево.
84 Глава 4 Рис. 4.3. Решения уравнения вида у = ау - 0у2: а) вид правой части, соответству- ющей логистическому уравнению; б) вид нескольких интегральных кривых, соответ- ствующих этому уравнению; в) вид правой части, соответствующей модели цепной реакции; г) вид нескольких интегральных кривых в этом случае Простейшая модель цепной реакции Дифференциальное уравнение (4.9) представляет собой полезную модель и в том случае, когда коэффициенты а и /3 отрицательны. Мы уже рассматривали автокаталитические реакции и обсуждали возможные причины появления нелинейных источников. Простейший источник та- кого типа — квадратичный — -/3у2(/3 < 0). Линейный сток (член ау при а < 0) может описывать распад вещества (как, например, в модели радиоактивного распада), диффузию или другие процессы. Эта модель переходит в предыдущую, если обратить знак времени. Другими словами, модель (4.9) инвариантна относительно преобразования t —> -t, а —> -а, /3 —> —/3, f(y) Отсюда ясно, что особая точка у = 0 будет устойчива, а точка у = +а//3 — неустойчива. Динамика системы также очевидна. Когда начальные данные y(Q) ниже порога у(0) < у, то потери превышают прирост концентрации, возникающий в ходе реакции и y(t) 0. Однако если порог у превышен, реакция идет с нарастающей скоростью (см. рис. 4.3 в, 4.3г). Здесь мы сталкиваемся с одним важным свойством, характерным для многих нелинейных явлений — с пороговым характером процессов. Превышение некоторого критического значения одним из параметров
Аттракторы уравнения х = v(x) 85 (в нашем случае — начальными данными 2/(0)) приводит к тому, что ход процесса качественно меняется. Можно сказать, что здесь количество переходит в качество. Сделав замену переменных у = zeat => з/(0) = z(0), получим zeat + azeot = azeat - (3z2e2ot U z = ~/3z2eot U- dz nt , -7 = -/Зе01 dt zL •O' 1 — = —e + c. z a Или, учитывая начальные условия, имеем 1 eot Z = с + е°‘^ * У= .!._£ +t>eai' <4Л0) а у о а ' а Это решение вполне согласуется с интуитивными представлениями о логистической модели, обсуждавшимися ранее. В самом деле, при а > 0 (как показано на рис. 4.3) eat оо при t -¥ оо, поэтому y(t) -> а//3. При а < 0 и j/о < а//3, y(t) -> 0 при t -> оо. Отметим, что система в обоих случаях «забывает» начальные данные при t —> оо. Как мы увидим далее, это свойство является общим для многих математических моделей. Почему можно отбросить нелинейные члены? Вернемся к уравнению (4.1). Сделаем замену переменных х = х* + d(x* + Az) dt =/(я* + Az) = /(**) + df(x’) \d2f(x’ + ebx) , ^Д1+2-------------dP------(Д1)’ i. Здесь мы предположили, что функция f(x) является достаточно гладкой и имеет первую и вторую производную на отрезке [ж*, х* + Дж], и вос- пользовались формулой Тейлора с остаточным членом в форме Лагранжа. Таким образом, dAa?(f) _ = д(Ах). dt Пусть вторая производная на этом интервале ограничена
86 Глава 4 IF Рис. 4.4. Теоремы сравнения позволяют «зажать» исследуемое решение Дж(0 между двумя известными z}(t) и z2(0 где (3 и (3 — постоянные (см. рис. 4.4g). Следовательно, можно восполь- зоваться теоремой сравнения и решением уравнений (4.2) il = 021 Z1 = az2 +^2з, 3/(0) = 21(0) = 22(0) = 6, где 6 — достаточно малое число, а а = df(x*)/dx. Вид интегральных кривых До:(0, z\(t) и 22(0 представлен на рис. 4.46. Пользуясь теоремами сравнения, можно «зажать» исследуемое решение между двумя известны- ми 21(0 и 22(0. Тогда 22(0 Дж(0 Выберем значение е. Тогда, если д = е < | |, то Дж(0 е. Приведенное рассуждение показывает, что квадратичные члены действительно можно отбросить, когда а /= 0. В самом деле, когда а < 0, то z\(t) -> О, 22(0 —> 0, а значит, и Дж(0 -> 0. Когда а > 0, то 2](0 и 22(0 возрастают. Следовательно, будет возрастать и Az(0. Первый метод Ляпунова относится к задачам локального анализа, когда траектория находится в окрестности состояния равновесия. Для качественного анализа уравнения х = v(x) было бы важно понимать, что происходит вне этой окрестности. В обсуждаемой задаче это можно сде- лать, используя функцию Ляпунова. Напомним в основных чертах такой подход, подробно обсуждаемый в курсах обыкновенных дифференциаль- ных уравнений. Функция Ляпунова Рассмотрим более общую модель dx — х(О) = хо. (4.11) dt Будем считать, что х = 0 является положением равновесия, а также, что в некоторой окрестности начала координат G задана непрерывная и диф- ференцируемая положительно определенная функция V(x). В качестве G удобно выбрать шар радиуса R.
Аттракторы уравнения х = и (ж) 87 Рис. 4.5. Построение функции Ляпунова в окрестности состояния равновесия поз- воляет исследовать его устойчивость: а) положительно определенные функции; б) рисунок, поясняющий выбор величины 6 Под положительной определенностью в G понимается следующее свойство: V(x) 0 в G, причем V(x) = 0 только при х = 0. Положи- тельно определенные функции обладают следующим свойством: для всех ||ж|| > 6 > 0 существует е > 0 такое, что V(x) е. Верно и обратное. Из неравенства V(x) > д > 0 следует существование постоянной и > 0 ||f|| > v (см. рис. 4.5 о). В самом деле, допустим противное. Пусть при выполнении неравен- ства ||ж|| > 6 неравенство V(x) е не выполнено ни при каком положи- тельном значении е. Это означает, что можно выбрать последовательность ten}, £п -> 0 при п оо, такую, что ||fn|| > <5, a V(xn) < еп -> 0. Пусть все числа £п ограничены сверху некоторой постоянной С. Следователь- но, е ||fn|| С. Поэтому из последовательности {жп} можно выде- лить сходящуюся подпоследовательность {уп} с пределом у. Очевидно, € ||у|| < С. Однако в силу непрерывности функции V(x), Hm V(yn) = V(y). n->00 Поскольку lim V(yn) = 0, V(y) = 0. Функция V(x) является поло- n->00 _ жительно определенной, следовательно, у = 0. Но это противоречит неравенству г lljzll. Действуя аналогичным образом, читатель может доказать обратное утверждение. Справедлива следующая теорема. Теорема. Пусть в области G существует непрерывная вместе с част- ными производными первого порядка положительно определенная функ- ция L(x), называемая функцией Ляпунова. Пусть скалярное произведение W(x, t) = (grad L, f(t, x)) удовлетворяет неравенству W(x, 0^0, t > 0, x € G. Пусть f(t, 0) = 0. Тогда состояние равновесия x — 0 устойчиво.
88 Глава 4 Если дополнительно к этим условиям выполнено неравенство W(x, t) < -W(x), где — положительно определенная в G функция, то эта особая точка асимптотически устойчива: lim x(t) = 0. i-»oo В самом деле, зададим постоянную € > 0. В силу свойств непрерыв- ных положительно определенных функций существует значение ц, при котором L(x) д > 0, если ||ж|| > е. Поскольку L(x) — непрерывная функция, можно выбрать такое <5, что при ||ж|| < <5 выполнено неравенство Цх) < д/2 (см. рис. 4.5б). Выберем начальные данные в сфере радиуса <5: ||ж(0)|| < 6. Покажем, что при этом траектория будет лежать в сфере радиуса е: ||z(£)|| < £ (см. рис. 4.3 d). Если это не так, то при некотором значении t\ £(f(t|)) > д. Но тогда L(f(t,)) - L(f(0)) > д - ^ > 0. Однако в сиду теоремы Лагранжа L(x(tt)) - L(x(0)) = - - — t, = at \ox at / = (grad L, f(x, e))ti = W(x(f), f)fi 0 (0 Г < f|). Поскольку неравенство выполнено во всей области G, в том числе и на траектории, то возникает противоречие, которое и доказывает тео- рему. Чтобы доказать асимптотическую устойчивость, можно действовать следующим образом. Поскольку at то функция L(x(T)) монотонно не возрастает, поэтому lim L(x, t) = а 0. f-ЮО Если постоянная а = 0, то x(t) —> 0. В самом деле, иначе существо- вало бы значение с и последовательность {f(£n)}, tn -> оо при п -> оо, у которой ||ж(^п)|| > е > 0. Но тогда L(x(tn)) Д (см. рис. 4.5), что противоречит равенству а = 0. Докажем, что а = 0. Пусть а > 0. Положим д = а. Тогда в силу поло- жительной определенности функции Ляпунова для некоторого значения с будет выполнено неравенство ||ж(МН > и > 0. Но поскольку -1Г(ж) —
Аттракторы уравнения х = v(x) 89 тоже положительно определенная функция, то W(x(t)) 0 > 0. Поэтому -0 < 0. Следовательно, - Z(£(0)) = — at t -W(x, (t))t —0t, 0<t<t. t=t Таким образом, L(x,t) -оо. Но это противоречит положительной определенности функции L. Следовательно, а = 0. Таким образом, точка х = 0 действительно является аттрактором системы (4.8). Комментарий. В приведенной теореме Ляпунова не делается каких-либо предполо- жений о линейности системы и о конкретном виде функции L. Это открывает простор для ее широкого использования и множества обобщений. Однако класс интересных систем в нелинейной динамике, для которых существует функция Ляпунова, сравнительно невелик. Грубо говоря, эти системы устроены слишком просто. Можно сказать, что их «цель», которую удается достичь только в особых точках, состоит в минимизации функции L. Вместе с тем в ряде математических моделей, появившихся в последние годы в теории нейронных сетей и связанных с распознаванием образов и построением ассоциативной памяти, построение и анализ функций Ляпунова оказались очень важными и полезными. Обратимся к исходной задаче — качественному исследованию одного автономного обыкновенного дифференциального уравнения. Запишем его в виде . ,, . ди x=f(x}=~te' где X U = - J f(z) dz, ж(0) = х0. Хо (4.12) Функцию U назовем потенциальной энергией или потенциалом. От- метим, что максимумы и минимумы потенциала соответствуют особым точкам системы (4.8): «.о » дх ’ Кроме того, максимум потенциала соответствует неустойчивым, а мини- мум — устойчивым точкам. В самом деле, условие минимума в точке А записывается в виде а2Ща) дх2 df(a) дх = а < 0, < о последнее равенство, как мы ранее убедились, означает устойчивость точки А. Покажем, что именно потенциал и является функцией Ляпунова dU(x(t)) _ dU^ dt дх dx dU . -у. ~ai = я? = ~f °- at ох
90 Глава 4 Рис. 4.6. Правая часть уравнения f(x) и потенциалы U(x): а) характерный вид правой части уравнения f(x) и потенциала, когда решение ограничено; б) случай, когда решение неограниченно возрастает, 1 — решение существует неограниченное время, 2 — время существования решения конечно Если нас интересует, например, устойчивость состояния равновесия А, то, добавив постоянную С(Л1) (см. рис. 4.6 о), мы получим положительно определенную функцию в окрестности А}, для которой выполнены все условия теоремы Ляпунова. Следовательно, точка А\ (равно как Ау и Ау на рис. 4.6 о) является асимптотически устойчивой, т. е. аттрактором. Из убывания функции Ляпунова следует, что точка в фазовом про- странстве движется в направлении, противоположном градиенту dU/дх, до ближайшего минимума потенциала. Отсюда ясно, например, что обла- стью притяжения особой точки Ау будет интервал (В\,Ву). Скорость движения вдоль фазовой прямой определяется производной -dU/dx. Поэтому, чтобы получить представление о решении, достаточно представить себе лыжника, съезжающего по потенциальной функции, на дне которой он останавливается. Осталась рассмотреть случаи, когда функция U(х) не является огра- ниченной снизу. Мы сталкивались с двумя такими случаями. Первый относится к мальтузианскому уравнению, где U = -ах2/2 и x(t) -> 00 за бесконечное время. Второй — к уравнению с f(x) = х@, 0 > \ и U = -х0+1 /(0 -|-1), где x(t) -> 00 при t tf < 00. Способ отличить неограниченно растущие за бесконечное время решения от решений, растущих в режиме с обострением, дает утверждение, называемое критерием Осгуда. Чтобы решение задачи (4.8) существовало в течение конечного време- ни tf, необходимо и достаточно, чтобы интеграл ОО Хо сходился. Значение этого интеграла совпадает с tf.
Аттракторы уравнения х = v(x) 91 В самом деле, /ф)=Л^=о- Хо Если проинтегрировать удается и существует предел интеграла при х -> оо, то Т — tf. Можно вернуться к аналогии с лыжником. Если гора бесконеч- ная и не очень крутая, то он будет двигаться к бесконечности бесконечно долго, но если гора достаточно крутая, то он успеет сделать это за конечное время (см. рис. 4.6 б). Замечание. Читатели, знакомые с механикой, наверно, заметили противоречие между двумя разными значениями термина «потенциал» в модели математиче- ского маятника и в системе (4.8). В первом случае движение определяется диф- ференциальным уравнением второго порядка, во втором — первого. Один физик остроумно сравнил это противоречие с разницей между механиками Ньютона и Аристотеля. В самом деле, представим себе движение материальной точки в очень вязкой среде под действием силы F(x) = -dU/dx. Сила вязкости пропорциональна скорости, поэтому уравнение движения имеет вид dU тх + ух= - —. ох В предельном случае исчезающе малой вязкости это выражение переходит во вто- рой закон Ньютона, определяющий движение частицы в поле с потенциалом U(x). В другом предельном случае оно отражает представление Аристотеля — чтобы тело двигалось, надо прикладывать силу. Термин «потенциал» в литературе, посвя- щенной математическому моделированию нелинейных явлений, действительно употребляется в двух смыслах. Далее мы будем уточнять, какой из них имеется в виду, если это не будет очевидно. Корректность и модели нелинейных явлений В начале XX в. Ж. Адамар, исследуя уравнения в частных произ- водных, сформулировал условия корректности задачи математической физики. Он назвал задачу корректной, если ее решение: • существует, • единственно, • устойчиво. Устойчивость может пониматься по отношению к малым изменениям начальных данных, краевых условий, параметров уравнения. Теоремы о существовании и единственности для системы обыкновен- ных дифференциальных уравнений показывают, что задача с начальными условиями (или, как ее называют, задача Коши) является корректной на некотором интервале времени 0 < t < Т. Этот интервал может быть конечным, зависеть от правых частей уравнений и от начальных данных. На первый взгляд, кажется, что только математические модели, обла- дающие свойством корректности, могут претендовать на описание каких-
92 Глава 4 либо явлений природы. Однако анализ ряда нелинейных математических моделей заставил по-новому взглянуть на корректность. Это привело к более глубокому пониманию различных процессов, помогло сформу- лировать несколько оригинальных гипотез, глубже осознать ограничения концепции корректности. Обсудим несколько проблем, возникших в этой области. Приведем вначале пример некорректной линейной задачи. Уравнение теплопроводности с отрицательным коэффициентом Пусть некоторое явление описывается следующей моделью щ = -ихх, 0 2? 7Г, 0 < t < оо (4.14) и(х, 0) = и0(х), их(0, t) - их(к, t) - 0. Уравнение (4.14) не является экзотикой, как может показаться. В са- мом деле, представим, что в результате термической обработки в печи был нагрет некоторый образец. Его распределение температур задавалось функцией и(х). Далее он был вынут из печи. И через время Т, когда удалось измерить его распределение температур, оказалось, что послед- нее определяется функцией uq(x). Можно ли по этим данным выяснить, каким был начальный профиль и(х)? Здесь мы сталкиваемся еще с одним примером обратной задачи. По результатам наблюдений Uq(x) надо восстановить исходную темпера- туру разных точек образца. Очевидно, функция Uq(x) является решением уравнения теплопроводности и(х, Т) с начальными данными и(х). Чтобы найти uq(x) — и(х,Т) по функции и(х), надо найти реше- ние обычного уравнения теплопроводности с начальными данными и(х). Чтобы найти и(х) по и(х, Т), надо решить уравнение теплопроводности, в котором t заменено на -t на отрезке [О,Г], т. е. в точности уравне- ние (4.14). Задачи такого типа часто возникают при решении проблем технологии. Другой пример из геофизики. Можно ли по результатам бурения, на- пример, в районах вечной мерзлоты, судить о климате за последние тысячи лет? В самом деле, допустим, что на поверхности Земли задан определен- ный температурный режим Т(0, -оо < t < to, а мы знаем распределение температуры в зависимости от глубины в данный момент to - Т(х, to). Можно ли по таким данным судить о зависимости T(t)2 В этом случае также приходится иметь дело с аналогом уравнения (4.14). Эти и другие задачи привели академика А. Н. Тихонова и его учени- ков к обобщению понятия корректности задачи математической физики и к разработке методов решения некорректных задач. Кроме того, уравнения типа (4.14) возникают в физике плазмы, как математическая модель так называемой взрывной неустойчивости. Тече- ния газа с отрицательной вязкостью, описание которых требует решения похожих задач, иногда рассматриваются в физике атмосферы.
Аттракторы уравнения х — v(x) 93 Будем действовать так же, как в случае обычного линейного уравне- ния теплопроводности, и искать решение в виде разложения по собствен- ным функциям = cos (кх)} 00 u(a?, t) = УЗ C^(t) COS (кх). к=0 В результате мы получим бесконечную систему не зависящих друг от друга обыкновенных дифференциальных уравнений Ск = к2Ск (* = 0,1,2,...). Каждое из этих уравнений совпадает с уравнением Мальтуса и имеет решение, как мы видели, существующее при 0 t < оо: Ск(1) = С»(0)е‘!‘. Покажем, тем не менее, что есть начальные данные Vq(x), при которых решение задачи (4.14) существует время, не превышающее конечной величины tf. Пусть vq(x) = УЗ Ck(O) cos (кх) = УЗ е~к l/ cos (кх). (4.15) fc=0 fc=0 Напомним, что чем быстрее убывают коэффициенты Фурье, тем более гладкой является функция. (Если при больших к Ск Ак~п, п — const, то функция v(x) — ^2 Ск cos (кх) имеет непрерывную n-ю производную.) Функция vq(x) является очень гладкой, а именно, дифференцируемой бесконечное число раз. Функция С* ~ е~к убывает быстрее любой степени к. Решение уравнения (4.14) естественно искать в классе ограниченных функций max |w(a:, t)| < С, у которых также существуют производные X ut(x,t) и ихх(х,t). Покажем, что решение уравнения (4.14) не будет принадлежать этому классу при некотором t — tf. В случае начальных данных вида (4.15) v(x, t) — УЗ ек *е~к t} cos (кх). к=0 При t < tf ряд сходится и решение существует. При t tf и х — 0 он стремится к бесконечной сумме положительных слагаемых, т. е. к беско- нечности max v(x, t) оо при t-+tf. X Таким образом, рассмотренное решение, для которого ряд по собственным функциям сходится, существует при 0 t tf, но оно не может быть представлено в виде сходящегося ряда на всем бесконечном интервале О t < оо.
94 Diasa 4 Кроме того, если есть начальные данные uq(x), приводящие к реше- нию, ограниченному при 0 < t < оо, то в силу принципа суперпозиции решение с начальными данными Uq(x) — щ(х) -I- €Vq(x) вновь будет существовать только до момента tf, каким бы малым мы ни выбрали зна- чение £, если этим свойством обладает функция Vq(x). При этом время tf также можно выбрать сколь угодно малым. Таким образом, даже если мы потребуем, чтобы начальные данные в модели принадлежали к клас- су бесконечно дифференцируемых функций и ограничимся конечным интервалом времени Т (0 t Т), то задача (4.14) не будет корректной. Физический смысл этих рассуждений очень прост. Обычное уравне- ние теплопроводности «делает» за время t из <5-функции Дирака очень гладкую функцию. Уравнение теплопроводности с отрицательным ко- эффициентом «прокручивает пленку», на которой снято это решение, Рис. 4.7. Характерный вид решения уравнения теп- лопроводности с отрицательным коэффициентом в обратном направлении: из гладкого профиля через время tf получается дель- та-функция. Этот гладкий профиль можно и взять в качестве функции Vq(x). Типичная картина такого процесса представлена на рис. 4.7. Еще двадцать лет на- зад считалось, что урав- нения, решения которых не существуют в целом, не имеют физического смыс- аргументы в пользу анализа ла. Однако с тех пор появились сильные некорректных задач. Рассмотрим одну из базовых математических моде- лей, возникающую при исследовании многих нелинейных явлений. Системы с сильной положительной обратной связью Можно представить, что в ходе цепной реакции, либо при демогра- фическом взрыве скорость изменения изучаемой величины п пропорци- ональна не самой п, а ее степени: dn а — п(О) = по, д>1. (4.16) dt Тогда + с => n(t) = A(tf где А = (/3 - tf = (по(0- (4.17) Непосредственно проинтегрировав уравнение, убедимся, что его решение существует только до момента tf, называемого временем обострения.
Аттракторы уравнения х — v(x) 95 Причем, сам момент обострения зависит от начального значения пе- ременной п. Чем больше п(0), тем меньшее время существует решение. Поведение решения, при котором одна или несколько изучаемых величин за конечное время возрастают до бесконечно- сти, получило название режима с обострением (английский эквивалент — with blow up). Отметим, что вплоть до момента tf выполнены условия теоремы существования и единственности. Однако существование ре- шения в небольшой области фазового про- странства совсем не означает его глобального существования (или, как часто говорят, суще- ствования в целом). Типичный вид функции n(t) при раз- личных начальных данных представлен на рис. 4.8. В течение длительного времени в си- стеме как будто бы «ничего не происходит». Однако затем, вблизи момента обострения, происходит сверхбыстрый, взрывной рост ре- шения. Пусть некий реальный процесс в тече- ние некоторого времени может быть опи- Рис.4.8. Характерный вид ре- шения уравнения (4.16) при разных начальных данных сан уравнениями, которые имеют решения, растущие в режиме с обострением. Тогда попытка прогнозировать ход процесса на основе линейной или более сложной интерполяции обычно оказывается обречена на провал. Решения близкого типа были обнаруже- ны в математических моделях экологии и экономики. При этом подход «планирования от достигнутого» и логика «завтра будет примерно так же, как сегодня» оказываются неприменимы. Режимы с обострением характерны для ряда моделей физики плазмы (коллапс ленгмюровых волн, явление самофокусировки, пробой в элек- тромагнитных СВЧ-полях и т.д.) и газовой динамики (схождение сфери- ческих ударных волн к центру, класс явлений с отрицательной сжимае- мостью). Размышления над простейшими моделями нелинейных явлений, в которых соответствующие уравнения описывают режимы с обострени- ем, привели исследователей к нескольким оригинальным идеям. Обратим внимание лишь на две. Одной из нерешенных проблем, стоящих перед естествознанием уже сотни лет, является задача описания турбулентности, — неупорядоченных хаотических движений жидкости. Практика убеждает, что в огромном количестве конкретных случаев движение жидкости описываются урав- нениями Навье—Стокса. Их можно представить в виде ut = Lu, (4.18)
96 Глава 4 где й(х, t) — поле скоростей, характеризующее состояние жидкости, L — нелинейный оператор, зависящий от функции й и ее производных. Принципиальный вопрос, на который до сих пор нет удовлетво- рительного ответа, состоит в следующем: позволяет ли математическая модель вида (4.18) описывать турбулентные течения? Вычислительный и натурный эксперименты показали, что трехмер- ные течения и количественно, и качественно существенно отличаются от двумерных. Многочисленные попытки доказать корректность ряда задач для уравнения Навье—Стокса, и, в частности, теоремы существова- ния и единственности в трехмерном случае, предпринимались ведущими математиками в течение десятков лет. Они оказались безрезультатными. Это привело Ж. Лере и ряд исследователей к мысли, что причина возникших трудностей кроется не в недостатках существующего мате- матического аппарата, а в фундаментальных свойствах самих уравнений Навье—Стокса. При этом совсем не обязательно, чтобы скорость в ка- кой-то точке обратилась в бесконечность. Достаточно, чтобы существо- вали начальные данные, при которых хотя бы одна из пространственных производных, входящих в уравнение, перестала существовать. До тех пор, пока не представлены доказательства теорем существования и единствен- ности для трехмерных задач, ученым, вероятно, не удастся отвергнуть эту остроумную гипотезу. Другая идея связана с энергетической программой и реализацией инерциального термоядерного синтеза. В этом случае следует сверхсиль- ными лазерными импульсами, направленными на «мишень» — таблетку «дейтерий-тритиевого льда», сжать ее до такой плотности, при которой возможна реакция синтеза. Последовательность таких ядерных микро- взрывов и должна служить источником энергии. Физические оценки и компьютерные расчеты, проведенные для до- вольно простых моделей, показали, что величина энергии, которую сле- дует «вложить» в мишень, может быть снижена в сотни или даже в тысячи раз. Однако зависимость интенсивности излучения I(t) должна соот- ветствовать не простейшему прямоугольному импульсу (I(t) — Iq при t\ t < <2, и I(t) — 0 вне этого интервала), а изменяться в течение некоторого времени в режиме с обострением а > О, т. е. так, как показано на рис. 4.8. Эта идея в течение ряда лет активно прорабатывалась в крупнейших мировых центрах в области термоядерного синтеза. И, в частности, в Фи- зическом институте и в Институте прикладной математики им. М. В. Кел- дыша Академии наук. Анализ ряда осложняющих факторов, построение более глубоких и детальных моделей заставили физиков отказаться от нее. Предпочтение отдано сериям из нескольких импульсов, отличающихся по длительности и длине волны друг от друга, а также сложным много- слойным мишеням. Тем не менее, простая и яркая идея, опирающаяся на представление о режимах с обострением, сыграла важную роль в раз- витии термоядерных проектов.
Аттракторы уравнения х = v(x) 97 Разумеется, ни интенсивность лазера, ни численность населения, ни количество делящихся атомов не могут достигать бесконечных зна- чений. Однако если I(t) или n(t) могут стать достаточно большими, то уравнения, имеющие неограниченные решения, могут служить полезной идеализацией процессов. Те уравнения, которые в начале века могли бы быть отброшены из-за некорректности, из-за несуществования решения в целом, сейчас активно используются в математическом моделировании нелинейных явлений. Рис. 4.9. Интегральные кривые урав- нения, решения которого неединст- венны Мы обсудили примеры несуществования решений в математиче- ских моделях. Другой причиной некорректности задачи может быть неединственность решения. Альтернативная гипотеза, связанная с гид- родинамической турбулентностью, состоит в том, что решение уравне- ний Навье—Стокса существует, однако оно неединственно. Другими словами, одни и те же начальные данные мо- гут определять несколько решений. Эту возможность иллюстрирует следующий элементарный пример. Рассмотрим задачу 5=хЛ г(0) = 0. Непосредственно проинтегрировав ее, можно убедиться, что она имеет два решения (см. рис. 4.9) /2\3/2 ж(<) — ( - ) Р^2 и x(t) = 0. Отметим, что теорема о единственности в точке фазового простран- ства х = 0, t = 0 неприменима. Здесь df/dx\Q = оо и не удается подобрать постоянную Липшица L. Можно построить пример уравнения, в котором решение неедин- ственно в каждой точке фазового пространства. Если такие точки в фа- зовом пространстве существуют и в уравнении Навье—Стокса, то для описания турбулентности нужно переходить к другим моделям, где реше- ние при любых начальных данных определялось бы однозначно. Другая возможность состоит в принципиальном отказе от детерминированно- го описания, учете малого шума и случайных процессов в уравнениях гидродинамики. При этом математическая модель может иметь вид щ — Lu + 6(t), где 6(t) — случайная функция. В этом случае нам придется отказаться от детерминированного динамического описания, и говорить о турбулент- ных течениях только на статистическом, вероятностном языке. В понятие корректности входят не только требования существования и единственности, но и устойчивости. Исследование нелинейных явлений
98 Глава 4 потребовало существенно изменить взгляд на устойчивость нелинейных систем. Напомним классическое определение. Определение. Решение у — у (t,yo) задачи $ — Р(у)> У^) = Уо (4.19) называется устойчивым по Ляпунову, если для любого е > 0 существует значение 6(e) такое, что при ||ДуЬ|| < 6(e) для всех t > О справедливо неравенство ||y(t, Уо + Ауо) ~ y(t, Уо)|| < £ (4.20) Аттракторы, изучение которых имеет первостепенное значение в рам- ках исследовательской программы А. Пуанкаре, являются математически- ми образами установившихся режимов. Кроме того, близкие к притягива- ющему множеству траектории y(t) из его области притяжения стремятся к аттрактору. Поэтому естественно считать, что траектория y(t), при- надлежащая аттрактору, будет устойчивой. Уже упоминавшиеся особые точки и предельные циклы, будучи аттракторами динамических систем, действительно являются устойчивыми траекториями. Именно это свойство и позволяет предсказывать поведение таких систем, даже если начальные данные уо были известны с некоторой погрешностью. Однако в 70-х гг. при исследовании упрощенных математических моделей физики атмосферы с помощью вычислительного эксперимента были открыты так называемые странные аттракторы. Они описывают не- периодические, хаотические режимы в динамических системах вида (4.19). Странные аттракторы не обладают свойством устойчивости. Более то- го, какое бы малое начальное отклонение Ду мы ни выбрали (см. формулу (4.20)), расстояние между близкими вначале траекториями экспоненци- ально растет со временем. \\у(1, Уо) ~ У(^ Уо + Дуо)|| ~ е^НДуоН, (4.21) где А > 0. Это лишает нас возможности предсказывать динамику системы, на временах Т ~ 1/А (см. рис. 4.10). Сколь угодно малая погрешность в начальных условиях приведет к тому, что при t > Т мы потеряем какую- либо информацию о положении нашей системы в фазовом пространстве. Следовательно, в классическом смысле задачи, связанные с изучением странных аттракторов, не являются корректными. Открытие странных аттракторов позволило предсказать и обнаружить ряд интересных явлений, и некоторые из них мы далее рассмотрим. Обсудим более подробно проблему, связанную с устойчивостью дина- мических систем. Для изучаемых объектов обычно выполняются теоремы существования и единственности на конечном интервале 0 t Т. (Ситуация здесь такая же, как с уравнением Мальтуса х = ах. Таким образом, |я:'(Г) - ж,,(Т)| < е, если |z(0) - 2?,z(0)| < <5 = ее~аТ.) И в этом смысле задача корректна. Однако в рамках исследовательской программы
Аттракторы уравнения х = v(x) 99 Пуанкаре изучаются аттракторы, т. е. поведение решений при t -> оо. И здесь такого значения <5, которое бы гарантировало близость траек- торий при 0 t оо и которое фигурирует в классическом определении устойчивости ре- шения по Ляпунову, указать не удается (хотя, в отличие от уравнения х = ах, решения могут оставаться ограниченными). Это связано не с недостатками определений или ограниченностью используемого формализ- ма, а с интересным физическим явлением, на- званным динамическим хаосом. Математическим Рис. 4.10. Чувствительность к начальным данным связа- на с «разбеганием» беско- нечно близких траекторий образом установившегося хаотического поведения в динамических систе- мах являются странные аттракторы. Открытие странных аттракторов оказалось связано с использованием вычислительного эксперимента, а их история насчитывает чуть больше трех десятилетий. Эти объекты были обнаружены американским метеорологом Э. Лоренцем в 1963 г. Оказа- лось, что они существуют даже в сравнительно простой системе трех обыкновенных дифференциальных уравнений, в правые части которых входят только линейные и квадратичные члены. Пример странного аттрактора представлен на рис. 4.11. Если пре- дельный цикл внешне похож на петлю, которая может быть сложным образом изогнута в фазовом пространстве, то странный аттрактор похож на клубок траекторий. Представленный аттрактор описывает установив- шийся режим, возникающий в одной системе типа реакция—диффузия. На рис. 4.11а представлена его проекция на одну из плоскостей в фазовом пространстве, на рис. 4.11 б — видовая проекция. Она напоминает две ленты, склеенные друг с другом. Если мы будем следить на экране дисплея за тем, как точка, харак- теризующая состояние системы, «бегает» по аттрактору, то увидим, что она случайным образом попадает то на левую, то на правую ленту. Это наводит на мысль дать символическое описание такой траектории в виде бесконечного набора нулей и единиц. Если на k-м витке точка двигается полевой ленте, на к-м месте последовательности будем писать нуль, если по правой — единицу. Оказалось, что такое описание иногда очень полез- но. О многих странных аттракторах непрерывных систем гораздо проще говорить на этом предельно простом дискретном языке. Такой подход по- лучил название символической динамики и активно развивается в настоящее время. Допустим, что мы бросаем бесконечное число раз монету. Если в k-и раз выпал «орел», будем писать на к-м месте последовательности, описывающей эту серию, единицу, в противном случае — ноль. Замеча- тельный факт, доказанный для ряда странных аттракторов, состоит в том, что по этой последовательности нельзя отличить динамическую систему от классичекого объекта теории вероятностей — серии бросаний монеты. «Странность» странных аттракторов связана с их замечательным свой- ством, называемым чувствительностью к начальным данным. Выберем две
100 Глава 4 0,4 0,3 0,2 0,1 0,0 Рис. 4.11. Вид странного аттрактора, описывающего динамический хаос в од- ной модели химической кинетики: а) проекция аттрактора на плоскость (£, у)\ б) видовая проекция аттрактора. Этот аттрактор порождается динамической системой < = 2£ - 2£(£ + у) - £i/(cos 8 + с2 sin 8), у = 2у - 2у( 2f + 3 — J - 2£i/(cos 8 - с2 sin 8) - 2 ( I \ 4/ \*/ 8 = с2 ^2£ - + sin 8 • (2£ +1/) + с2 cos 8 • (2£ - у) + 2С| при значениях параметров q = 7, с2 = —6, I = тг близкие точки ж'(0) и х"(0), лежащие на аттракторе, и посмотрим как ме- няется расстояние d(t) = \x'(t) - a:"(f)| с течением времени. x'(t) и x"(t) — это решения исследуемых уравнений, соответственно, с начальными дан- ными ж'(0) и ж"(0) (см. рис. 4.10). Геометрически d(t) соответствует длине отрезка с концами x'(t) и x"(t). Если аттрактор — особая точка, то d(t) = O. Если аттрактор — предельный цикл, то d(t) будет периодической функцией времени. У странного аттрактора d(t)~ext, А>0. Для того, чтобы величина А характеризовала аттрактор, естественно рассматривать бесконечно близкие траектории и среднюю скорость разбегания по боль- шому интервалу времени. Формально ее вводят следующим образом: Х(х'(О), ш) = lim lim t-юо d(0H0 1 <Ф)1 — In —— t d(O)J (4.22) где w — вектор от точки х'(0) к точке х"(0) (см. рис.4.10). Понятно, что, выбирая различные точки ж"(0) и ж'(0), мы, вообще говоря, будем получать различные числа. Однако в 1968 г. В. Оселе- дец показал, что при весьма общих условиях почти все точки ж'(0) и х"(0) в окрестности странного аттрактора в N-мерной динамической системе будут давать один и тот же набор N ляпуновских показателей Ai,..., Адг. Смысл их очень прост. Показатель А характеризует изменение длины отрезка |х'(0 - x"(t)\, изменение площади треугольника с вер- шинами ж'(О’ #"(0» ®w(0» пропорционально ехр {(А( 4- Аг)£} - Изменение
Аттракторы уравнения х = v(x) 101 fc-мерного объема — exp{(Ai + ... + А*)£}. Поскольку мы рассматрива- ем аттракторы N-мерных диссипативных систем, у которых N-мерный объем малого элемента в фазовом пространстве уменьшается с течением времени, А] + Аз + ... + Xn <0. Чувствительность к начальным данным, положительные ляпуновские показатели (чтобы аттрактор был странным, достаточно, чтобы старший ляпуновский показатель А) был положителен) заставляют совершенно иначе взглянуть на саму возможность предсказания явлений природы. В самом деле, когда аттрактор — цикл или точка, то, наблюдая за системой достаточно долго, можно дать достоверный прогноз, даже если x'(t) мы знаем с небольшой ошибкой (ведь |£'(0 “ f "(Ol не будет расти). Однако у странного аттрактора через время т ~ 1 /А две близкие вначале траектории перестанут быть близкими. Существуют фундаментальные ограничения на возможность прогноза в нелинейных системах. Другая «странность» хаотических аттракторов связана с их геомет- рическими свойствами. Часто эти объекты имеют сложную структуру, обладающую масштабной инвариантностью. В мелком масштабе они вы- глядят примерно так же как в крупном. Вычисление ляпуновских показателей в тех случаях, когда известна функция f(x), с помощью компьютера достаточно просто. Однако для этого следует использовать не определение, а рассматривать так называ- емую систему в вариациях. Пусть известна траектория x(t). Рассмотрим близкую траекторию x'(t) = x(t) -I- y(t). Тогда f = /(f), Л/ X = f(x) =$> $ + &= f(x + y)& f\x) + ^y, ox f(0) = f0, x(ty = Xq => 2/(0) = Xq - Xq. Здесь df(x)/dx = A(x(t)) — матрица системы, линеаризованной в окрестности траектории x(t). Если траектории x(t) и x'(t) бесконечно близки, то членами, квадратичными по у, можно пренебречь. Тогда при || 2/(0) || -> 0 отклонение траектории f'(0 от ®(0 определяется системой в вариациях для y(t) А = lim t-*OO •Iimr .t llftll . y(o) = »o- (4.23) Ясно, что определенный таким образом ляпуновский показатель эк- вивалентен исходному, заданному соотношением (4.22). Однако использо- вание формулы (4.23) в расчетах представляется более простым и точным. Другими словами, чтобы определить старший ляпуновский показа- тель, наряду с исходным уравнением считают систему в вариациях (4.23). Чтобы решение y(t) не было слишком большим, через определенный ин- тервал времени его перенормируют (делят на достаточно большое число). В соответствии с этим модифицируется и формула (4.23). Перенорми- ровка нужна, чтобы повысить точность определения показателей. Взяв наугад уо, мы обычно получаем первый ляпуновский показатель.
102 Глава 4 Чтобы оценить р ляпуновских показателей Аь Аг,..., Хр считают р систем в вариациях. Вычисляют р-мерный объем и пользуются соотно- шениями, аналогичными формуле (4.23). Здесь через определенное время приходится проводить не только перенормировку у\,... ,ур, но и ор- тогонализацию. Последнее связано с тем, что все векторы уг,...,ур с течением времени стремятся повернуться вдоль у\, соответствующего наибольшему ляпуновскому показателю. В настоящее время ляпуновские показатели являются одними из наи- более эффективных и просто вычисляемых характеристик динамического хаоса. Приведенные примеры иллюстрируют общие черты, связанные с изу- чением нелинейных явлений. С одной стороны, исследование простейших нелинейных явлений заставляет по-новому взглянуть на фундаментальные понятия, связанные с моделированием. С другой стороны, изучение про- стейших объектов в этой области дает возможность строить оригинальные содержательные гипотезы. Вопросы и задачи 1. В реакторе происходит цепная реакция, в ходе которой скорость изменения концентрации вещества п изменяется по закону /7п7, (/? > 0, 7 > 1). В начальный момент этого вещества в реакторе нет. С течением времени вещество вводится в реактор по закону at2. Оценить время, через которое реакция закончится, либо простейшая модель, описывающая изменение концентрации только одного вещества, станет неприемлемой. 2. Экологи построили модель, определяющую изменение численности популя- ции, которая описывается уравнением х = F(x). Равновесная численность популяции определяется особой точкой этого уравнения х*. В силу специаль- ных причин оказывается, что dF(x*)/dx = 0. Устойчиво ли это положение равновесия? Что будет происходить, когда численность популяции х будет близка к х* 2 3. Упрощенной математической моделью некоторой химической реакции яв- ляется уравнение х = (х - а)(х - b)(x - с)(х - d)(x - е), ж(0) = х, 0<a<b<c<d<e. Как будет вести себя концентрация x(t) на больших характерных временах при различных значениях х? 4. Допустим, мы решаем задачу h = п&, fl > 1, п(0) = п с помощью метода Эйлера с шагом по времени т. Будет ли полученное численное решение согласовываться с решением исходного дифференциального уравнения? Бу- дут ли совпадать их качественные особенности? 5. Скорость таяния снежка, внесенного в помещение, пропорциональна пло- щади его поверхности S. Пусть один снежок, имеющий форму шара, в два раза больше по объему, чем второй, также имеющий форму шара. Какая часть первого снежка останется, когда второй растает полностью? Рассмот- рите также более общую модель, в которой скорость таяния предполагается
Аттракторы уравнения х = v(x) 103 пропорциональной Sa. При каких показателях а процесс таяния снежка занимает конечное время? 6. Многие демографы считают, что уравнение Мальтуса х = ах (а) следует заменить другой моделью, лучше согласующейся с кривой роста народонаселения за последние 100 тысяч лет х = ах{+£, е > 0. (Ь) Каково ваше мнение об этой модели? Какова ее область применения? В чем качественное отличие моделей (а) и (&)? Рекомендуемая литература Представления о дальнейшем развитии качественной теории обыкновенных диф- ференциальных уравнений дают книги: Баутин Н. Н., Леонтович Е.А. Методы и приемы качественного исследования динамических систем на плоскости. М.: Наука, 1976; Хартман Ф. Обыкновенные дифференциальные уравнения. М.: Мир, 1970; Полис Ж., Мелу В. ди. Геометрическая теория динамических систем: Введение. М.: Мир, 1986; Арнольд В. И. Дополнительные главы теории обыкновенных дифференциаль- ных уравнений. М.: Наука, 1978; Рейссиг Р., Сансоне Г., Конти Р. Качественная теория нелинейных дифферен- циальных уравнений. М.: Наука, 1974; Еругин Н. П. Книга для чтения по общему курсу дифференциальных уравне- ний. Минск: Наука и техника, 1979. Введение в теорию некорректных задач дает книга: Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач. М.: Наука, 1974. О динамическом хаосе в сосредоточенных и распределенных системах и о ма- тематических моделях, в которых решения, не существующие в целом, играют ключевую роль, рассказывают книги: Странные аттракторы. М.: Мир, 1981; Ахромеева Т.С., Курдюмов С. П., Малинецкий Г. Г., Самарский А. А. Нестацио- нарные структуры и диффузионный хаос. М.: Наука, 1992; Самарский А. А., Галактионов В. А., Курдюмов С. П., Михайлов А. П. Режимы с обострением в задачах для квазилинейных параболических уравнений. М.: Наука, 1987. Само представление о динамическом хаосе, о странных аттракторах заставляет совершенно по-другому подойти к задачам прогноза. Оно меняет и наш взгляд на законы природы, и нашу стратегию в области управления риском: Малинецкий Г. Г, Курдюмов С. П. Нелинейная динамика и проблемы прогно- за И Вестник РАН. 2001. Т. 71. № 3. — С. 210-232 (www.keldysh.ru/departments/ dpt_ 17/neldim.htm); Владимиров В. А., Воробьев Ю.Л., Капустин М.А., Малинецкий ЕЕ, Подла- зов А. В., Посашков С. А. и др. Управление риском. Риск, устойчивое развитие, синергетика. М.: Наука, 2000. — 432 с. (www.keldysh.ru/papers/2003/source/ book/gmalin/risk.htm).
Escher M.C. Metamorphosis II. 1939-1940 Эшер M. К. Метаморфозы II
Глава 5 Элементы теории бифуркаций Что ожидает нас в более сложных уравне- ниях, если даже в таком простом уравнении, с одним единственным параметром, мы ви- дим такое разнообразие возможностей? Р. Фейнман Вернемся к задаче о моделировании обсуждавшейся автокаталитиче- ской реакции. Будем рассматривать установившиеся режимы. При этом состояния равновесия будут определяться корнями кубического уравнения -kzx3 + - кзВх -I- ktC = 0. Особый интерес представляют те значения параметров А, В, С, при ко- торых меняется число или устойчивость состояний равновесия. Раздел математики, позволяющий находить такие значения параметров и анали- зировать решения в их окрестности, получил название теории ветвления или теории бифуркаций. Эта теория стала одним из наиболее эффективных методов анализа нелинейных явлений. Классической задачей этой теории, поставленной еще в прошлом веке, является задача об изгибе колонны. Представим себе колонну прямоугольного сечения, на которую свер- ху действует нагрузка Р (рис. 5.1). При увеличении нагрузки колонна будет укорачиваться и утол- щаться, но ее ось будет оста- ваться прямой. Однако при некотором критическом зна- чении Рс картина качествен- но изменится — колонна по- теряет прямолинейную фор- му и прогнется вправо или влево. При Р < Рс у колон- ны есть единственная равно- весная форма. При Р < Рс IW/MtyWSM'. их три: прямолинейная фор- ма, которая стала неустойчивой, и две устойчивые (одна соответствует прогибу вправо, другая — влево). Если мы нарисуем зависимость откло- нения А оси колонны от величины нагрузки Р, то картина будет такой,
106 Глава 5 Рис. 5.2. Зависимость отклоне- ния оси колонны от величины нагрузки. Сплошная линия со- ответствует устойчивым состо- яниям равновесия, пунктир — неустойчивым как показано на рис. 5.2. На этом и других рисунках в этой главе устойчи- вые состояния равновесия лежат на сплошной кривой, неустойчивые — на пунктирной. При Р = Рс изменяется число состояний равновесия и их устойчивость. Изменение числа и устойчивости решений уравнения называется ветвлением или бифуркацией решений. Это типично нелиней- ное явление. Классическая линейная теория упругости дает в этом случае только одно прямолинейное состояние равновесия. Задачей о потере устойчивости колон- ны занимались Эйлер, Бернулли, Лагранж. Одним из первых термин «бифуркация» ввел К. Якоби в 1834 г. Однако в полной мере значение теории бифуркаций было осознано А. Пуанкаре в конце XIX в. Пусть нам известно решение некото- рой нелинейной задачи при значении па- раметра А = Ао, тогда можно попробовать найти решение и при Ао + ДА, где ДА — малое число. При этом наш анализ стано- вится локальным — вместо поиска общего решения мы ограничиваемся изучением то- го, что происходит с конкретным решением в окрестности одного значения параметра. Естественно в первую очередь выбрать наиболее важные значения пара- метра, где поведение системы качественно меняется, т. е. точки бифурка- ции. При этом важнейшей целью становится выяснение всех основных типов бифуркаций в различных задачах. А. Пуанкаре полагал, что реше- ние этой большой и сложной проблемы поможет в исследовании многих конкретных нелинейных явлений. Простейшие типы бифуркаций, характерных для систем реакция- диффузия, рассмотрим на следующем примере. Пусть у нас есть химическая реакция, в которой изменение концен- трации интересующего нас продукта dx/dt зависит от самой концентра- ции х и внешних воздействий, которые могут описываться параметром А. Это дает обыкновенное дифференциальное уравнение ^ = F(I,A). (5.1) dt Решения этого уравнения ведут себя очень просто. При t -> оо функция x(t) стремится к постоянному значению х. Будем считать, что неограниченных решений это уравнение не имеет. Таких значений х может быть несколько: a?i, х^ и т.д. Понятно, что при этом У(ж, А) = 0. (5.2) В зависимости от начальных данных z(0) решение стремится к одно- му из хп. Поэтому осталось решить уравнение (5.2) и найти зависимость всех его корней от параметра А.
Элементы теории бифуркаций 107 Допустим, что нам известно какое-либо одно решение уравне- ния (5.2) (жо, Ло). Для того, чтобы найти решение при близком значении А = Ао + ДА, ДА <С 1, можно воспользоваться формулой Тейлора Р(хо+Дх.Ао+ДА)=Р(хоЛ)+^^ДА+^>Дх+ ол ох 1 Гд2Р(х0Л), 2 92F(xo,Ao) 92F(xo,Ao) ,лпг1 ,r ,, +2 ax2 (Дх) +2 ахал ДдАА+ ал2 (дл) ]+G' (53) где G — остаток ряда, в который входят члены, пропорциональные (Дж)3, (Дж)2ДА, Дж(ДА)2, (ДА)3 и т. д., его конкретный вид для нас не важен. Поскольку нас интересует состояние равновесия, то положим Г(ж0 + Дж, Ао + ДА) = 0. Но тогда получаем при Дж 0, ДА -> 0 Wo, Ао) ч [aF(xo,Ao)]~' ах 1 А) [ ах Из этой формулы следует, что если зна- чение dF(x0, Хо)/дх отлично от нуля, то мы можем приближенно определить новое состо- яние равновесия (рис. 5.3). Такое состояние, судя по формуле (5.4), будет одно, а значит, в точке Ао, Жо не происходит бифуркации. В соотношении (5.4) мы учли только два ненулевых члена в ряде Тейлора (5.3). Встает вопрос, насколько это правомерно и какое отношение это имеет к интересующей нас нелинейной задаче (5.2). Ответ на него дает известная из курса математического анализа теорема о неявной функции, играющая ключе- вую роль в теории бифуркаций. Напомним ее: Рис. 5.3. Ситуация, в которой можно воспользоваться теоре- мой о неявной функции Теорема. Пусть F(xq, Ао) = 0, и пусть функция F является непрерывно дифференцируемой в некоторой области плоскости (ж, А). Тогда если 9F(xq, Ао)/0ж 0, то существуют постоянные а и (3, такие, что: 1. Уравнение (5.2) имеет единственное решение х = ж(е), когда Ао - а < А < Ао + а, такое, что жо - (3 < ж < жо + /3. 2. Функция ж=ж(А) непрерывно дифференцируема при Ао-а<А< Ао+а. dx(A) = dX SFliXl ' дх Замечание. Уравнение (5.2) можно разрешить относительно А = А(ж), если dF(x0, Ао)/0А 0. Точки, в которых выполняются условия теоремы о неявной функции будем называть регулярными точками уравнения (5.2). В ходе вычислитель- ного или натурного эксперимента часто получают зависимости ж = ж(А),
Элементы теории бифуркаций 109 или, как их называют, бифуркационные диаграммы. Поэтому важно пред- ставлять типичный вид таких диаграмм, изменение правой части, а так- же простейшую модельную систему, где такие бифуркации возможны, х = h(x,X). Набор таких диаграмм, включающий, кроме обсуждаемых, еще несколько возможностей, представлен в табл. 5.1. Может оказаться, что 9F(xq, Хо)/дх = 0, и тогда нужно учитывать следующие слагаемые. Если d2F(x, Хо)/дх2 0, то вместо (5.4) получится следующая формула: 0F(jq,Aq) 2 А \ ЗА Л d^FjxM дз? (5-5) Здесь картина другая (рис. 5.4) — при Л > Ао появились два решения, а при А < Ао их нет совсем (если считать, что ci положительно). Точки (жо, Ао), в которых производная дх/дХ меняет знак и дР(х^, Хо)/дХ 0, будем называть регулярными экстремальными точками. Рис. 5.4. Пример регулярной экс- тремальной точки. В этой точке «ниоткуда» возникают два состоя- ния равновесия Рис. 5.5. Бифуркационная диа- грамма, соответствующая де- формации неидеальной балки либо эффекту «хлопка» Пример такого поведения дает все та же задача о нагрузке колонны. Пусть в начальном состоянии колонна не идеально прямая, а немного изогнута в одну сторону. Тогда зависимость максимального изгиба от на- грузки, изображенная на рис. 5.2, изменится и станет такой, как показано на рис. 5.5. Если колонна находится в устойчивом состоянии, соответствующем точке на нижней ветви бифуркационной диаграммы (см. рис. 5.5), и на- грузка медленно уменьшается, то при некотором значении Р произойдет скачкообразный переход в другое равновесное состояние на верхней вет- ви. Это явление, получившее название «хлопка», используется в технике. Изменение типа бифуркационной диаграммы, например, при малом на- рушении симметрии изучаемой системы, исследуется одним из разделов теории бифуркаций — теорией несовершенств.
Таблица 5.1 Типы простейших особых точек кривой F(x,X) = О Название Условие х' = х(А) f(x,A) U(x,X) Простейшая система Регулярная точка Fx#0 X 1 *0/ Ао \ Fi k \ \ / \/ / x = A — x 'x X Регулярная экстремальная точка Fx*0,Fx*0 Xi \ Fi t u< 1 Z**>4*L/У 2^->3X x = A — x1 . XL Особые точки Fx — О, Fx = О Двойные точки Особая экстремальная точка Сопряженная точка Глава 5 Обозначение: 1)A<Aq; 2)А = Ао; 3)A>Aq;
110 Глава 5 На бифуркационной диаграмме кривые, на которых лежат устойчи- вые состояния равновесия, отмечены сплошной линией. Линии, соответ- ствующие неустойчивым состояниям равновесия, показаны пунктиром. Из таблицы видно, что в регулярной экстремальной точке рождаются устойчивое и неустойчивое состояния равновесия. Отметим, что если бы мы рассматривали х как независимую, а Л как зависимую переменную, то в случае регулярной экстремальной точки была бы применима теорема о неявной функции. Однако в исходных пере- менных в точке (sp, Ао) происходит бифуркация — «ниоткуда» рождаются два состояния равновесия. Можно показать, что заключения, связанные с анализом несколь- ких первых членов ряда Тейлора, относятся и к решению нелинейной задачи (5.1). А именно: в окрестности регулярной экстремальной точки бифуркационная диаграмма определяется соотношением А - Ао = v(x)(x - so)2, v(s0, Ар) = v0 0, Дж = х - so, FA(s0, Ао) 0. В самом деле, перейдем к новым переменным и рассмотрим кривую G(v, s) = = 2v(s)Fa(s0, Ao) + Fxx(xq, Ao) + О(|Дж|) (As) (см. ряд Тейлора (5.3). В него подставлено вместо ДА выражение v(s)|As|2). Определим v(s) так, чтобы v(s0, Ao)Fa(so, Ао) + Fxx(x0, Ао) = 0. Для этого достаточно, чтобы vp = v(sp) = \/с\ (см. формулу (5.5)). Кроме того, dG(vo, x0)/dv = F\(xq,Xq) / 0 (по предположению). Следователь- но, для функции G(y, х) в точке (vq, xq) выполнены условия теоремы о неявной функции. Это гарантирует существование функции v(s) и, сле- довательно, существование решения вида (5.6) в окрестности регулярной экстремальной точки. Покажем, что это действительно так. Как было показано ранее, устой- чивость состояния равновесия (ж*, А*) в системе х = F(x,X) определя- ется величиной а = dF(x*, Х*)/дх. Продифференцируем по s формулу F(s, А) = 0, считая, что А = A(s) (это соответствует тому, что мы рас- сматриваем некоторую кривую, например, бифуркационную диаграмму), dFjxp, Ар) #F(sp, Ар) dA(sp) = дх дХ dx Или _9F(xo,Ao)_ , <Wo,Ao) а~ дх ~ Хг дХ ' По предположению, в регулярной экстремальной точке dF(sp, Ар)/0А/=О, и существует кривая А = A(s), у которой производная dX/dx в точке sp
Элементы теории бифуркаций 111 меняет знак. Следовательно, на одной ветви, выходящей из точки (xq, Ао), состояния равновесия будут устойчивы (а < 0), на другой (а > 0) — нет. Обратим внимание на изменение потенциала в регулярной экстре- мальной точке. При А < Ао функция К(ж) представляет собой монотонно возрастающую кривую, при А = Ао у нее появляется точка перегиба. При А > Ао возникают максимум и минимум. Особыми точками кривой F(x, А) = 0 будем называть точки, в которых Ао) = Fa(t0, Ао) = 0. (5.7) Двойная точка кривой F(x, А) = 0 — это особая точка, через которую проходят две и только две ветви F(x, А) = 0, имеющие разные касатель- ные. В такой точке не все вторые производные одновременно обращаются в нуль. Особая экстремальная точка кривой F(x, А) = 0 — это двойная точка, в которой х\ изменяет знак на одной ветви (см. рис. 5.6). Сопряженная точка — это изолированное особое точечное решение Г(ж,А) = 0. Итак, мы рассматриваем ситуацию, когда равны нулю все первые производные и отлична от нуля хотя бы одна вторая. Выясним, при каких условиях на производные мы будем иметь дело с двойной особой точкой, особой экстремальной или сопряженной точкой. В двойной точке функцию F(x, А) можно представить в виде 2F(x, Л) = Fxx(x0, А0)(Дж)2 + 2FxX(х0, А0)ДяДА + + Мяо, Ао)(ДА)2 + О[(| Дх| + |ДА|)2]. (5.8) Поскольку далее все производные будут относиться к точке (жо,Ао), аргументы у этих функций мы будем опускать. Обозначим через к = Дж/ДА тангенсы углов наклона касательных к кривым, выходящим из точки (хо,Хо). Перейдем к пределу Дж —> 0 и ДА —> 0. Это позволит учесть только первые три члена в формуле (5.8). Рис. 5.6. Бифуркации, возникающие в тех случаях, когда их тип определяется квад- ратичными членами: а) особая экстремальная точка, «вилка»; б) транскритическая бифуркация «обмен устойчивостью»; в) изменение направления параметра А и зна- ка правой части переводит картину, показанную на рисунке а), в подкритическую бифуркацию, представленную на рисунке в)
112 Глава 5 Разделив на (ДА)2, получим квадратное уравнение для коэффициента к: Fxxk2 + 2FxXk + Лл = 0. (5.9) Следовательно, где В = Fx\ ~ FxxF\X' Если D < 0, то не существует касательных, проходящих через (жо,Ао), и мы имеем дело с сопряженной точкой. Если D > 0, то из точки (а?о,Ао), как видно из формулы (5.10), выходят две ветви с различными касательными. И следовательно, это двойная точка (см. рис. 5.6б). Пусть D > 0 и Fxx = 0, тогда Fx\ ^0 и исходное уравнение можно представить в виде ДЛ[2*Лл + *лл] = 0. Это соотношение определяет две касательных с тангенсами наклона АДхо, Ао) = Ои* = -^$ В случае D = 0 кривые имеют касание более высокого порядка и не могут быть отнесены к одному из перечисленных классов. Вновь, пользуясь теоремой о неявной функции, можно показать, что наличие соответствующих касательных при D > 0 гарантирует также существование двух ветвей решений нелинейного уравнения F(x, А) = 0, выходящих из точки (zo,Ao). В самом деле, положим Дж = г>(ж)ДА и v(xq) = xx(xq), где жд(жо) = к\ или жА(ж0) = к2 (см. формулу (5.9)). Перейдем к новым переменным и введем функцию G(v, х) = 2F(x, А)(ДА)“2 = Лд + 2Лг« + Fxxv2 + + т{Лгг^3 4- 3FxxXv2 + ЗЛла^ + Ллл}(ДА) + о(ДА). Однако G(vq, xq) = 0 для каждого из двух значений vq, которые получа- ются из уравнения (5.10). Кроме того, |G„(v0, ®о)| = |2(о(го)2?и + Лх)| = |2(®л(®о)Лх + Лх)| = = |2(-Лх ± -УР + Л»)| = |2\/Р| 0. Здесь мы воспользовались соотношением для к и предположением, что D 0. Таким образом, выполнены условия теоремы о неявной функции, поэтому можно утверждать существование двух ветвей решений уравнения F(x, А), имеющих вид ДА = v(x)Ax и выходящих из точки (xq, Xq). Проводя несложный анализ устойчивости и нарисовав графики потенциала и бифуркационные диаграммы, заполним еще три строки в табл. 5.1.
Элементы теории бифуркаций 113 Обратим внимание на то, что в особой экстремальной точке (в кото- рой пересекаются две ветви бифуркационной диаграммы, у одной из ко- торых хх меняет знак) при А < Ао может существовать одна устойчивая ветвь. При А > Ао возникает своеобразная «вилка», — эта ветвь потеряет устойчивость и появятся две новые устойчивые ветви (см. также рис. 5.6). Особенно наглядна перестройка потенциала, у которого вместо одной потенциальной ямы рождаются две и появляется новый «холм». Развитие теории бифуркаций С теорией бифуркаций связано два крупных принципиально важных направления в нелинейной динамике. Каждому из них посвящено множе- ство книг. С математическим аппаратом этой теории и даже основными приложениями нельзя познакомить во вводном курсе нелинейной дина- мики. Тем не менее, даже если не удается рассмотреть отдельные «деревья», полезно взглянуть на контуры «леса» — основные идеи и проблемы теории. Первое направление связано с обобщениями на более сложные, в частности, пространственно-распределенные системы. Очень важным оказалось обнаружение обсуждавшихся выше простейших бифуркаций и тех бифуркаций, о которых речь пойдет в главе 7, в математических моделях, описывающих процессы в нелинейных средах. Это позволило по-новому взглянуть на способ «понимания» процес- сов в сложных системах. Оказалось, что здесь часто удобно пользоваться аналогом «исторического подхода» — выяснять, что было при предшеству- ющих и последующих значениях параметров, смотреть качественные осо- бенности «соседей» по параметрическому пространству. «Понять» возник- новение того или иного режима — сейчас означает проследить последова- тельность бифуркаций, приводящую к его появлению. Выяснилось суще- ствование нескольких универсальных сценариев перехода от простейших упорядоченных режимов (которым могут соответствовать особые точки или предельные циклы) к хаотическому, турбулентному поведению в дис- сипативных системах (которому могут отвечать странные аттракторы). Многочисленные компьютерные эксперименты, которые проводи- лись в последние двадцать лет, показали, что мы имеем дело с новым уровнем единства. В начале века единство природы, проявляющееся в уни- версальности математических моделей, исследователи видели в том, что множество самых разных явлений описываются линейными уравнениями в частных производных второго порядка. Сейчас во множестве случаев пишутся различные уравнения, однако способ усложнения аттрактора, последовательность бифуркаций или, как его называют, сценарий перехо- да к хаосу, оказывается одним и тем же. Единство оказывается связано не с появлением аналогичных уравнений, а с универсальным качествен- ным поведением. Сверхзадача в этом направлении связана с анализом возникнове- ния гидродинамической турбулентности, и, в частности, с исследованием
114 Глава 5 уравнения Навье—Стокса. Последнее описывает движение вязкой несжи- маемой жидкости vt + v • grad v = - grad р + f(x) + — ДЯ, div v = 0, х € Q, х е П; (5.U) v = д(х), х € 9Q. Здесь v — поле скоростей жидкости, р — давление, член f(x) характери- зует заданную внешнюю силу. Уравнение должно решаться в трехмерной области Q с границей dQ. Компоненты вектора v • grad v имеют вид dvi dvi dvi +V2T— + ^3^—, * = 1,2,3. OX\ 0X2 OX$ В уравнение (а точнее, в систему трех параболических уравнений) вхо- дят четыре неизвестные функции (х, t), V2(x, t), 1>з(я, t), р(х, t). Условие div v = 0 позволяет исключить одну. Число Рейнольдса играет роль бифур- кационного параметра. Член ДгГ/Я описывает вязкость. Часто физически интересные значения параметра R лежат в интервале от 103 до 106. Следовательно, мы имеем типичный пример задачи с малым параметром при старшей производной, сложной как для численного анализа, так и для аналитического исследования. Основные трудности связаны с чле- ном v • grad v. Читатель может проанализировать уравнение Vt 4- vvx = О и убедиться, что его решение не обязательно существует в целом, поэтому просто «выбросить» стабилизирующий «вязкий» член &v/R нельзя. В исследование этой математической модели были вложены огром- ные усилия. При изучении конкретных течений были достигнуты впечат- ляющие успехи. Теория бифуркаций помогла детально проанализировать потерю устойчивости простейших течений. В последние годы исполь- зование суперкомпьютеров позволило получить большую информацию о статистических свойствах турбулентных течений, о поведении жидкости вблизи стенок труб или каналов. Тем не менее, невыясненными остаются многие принципиальные детали, и мы до сих пор не можем убедительно ответить на вопрос, «играет ли Бог в кости» в этих явлениях или нет. Достаточно ли выписан- ной модели или других гидродинамических уравнений, представляющих собой детерминированные уравнения в частных производных, решения которых единственны и существуют при 0 < t < оо для моделирования наблюдаемого хаотического поведения? Либо нужны малые случайные си- лы и радикальный отказ от детерминистического описания турбулентных течений? Другой классической областью приложений теории бифуркаций яв- ляется теория упругих оболочек. Нелинейные задачи теории упругости, которые обобщают упоминавшуюся задачу о прогибе балки, оказались очень важны для многих задач строительной механики.
Элементы теории бифуркаций 115 Гораздо более простым объектом для бифуркационного анализа стали модели типа «реакция—диффузия» Xt = DiXrr + f(X,Y, А), Yt = D2Yrr+g(X,Y,X), Q<t<co, (5.12) X(r, 0) = X0(r), Y(r, 0) = r0(r), Xr(0,0 = Xr(l, t) = Yr(0, t) = Yr(l, t) = 0. Здесь члены D\XTT и D2YrT описывают диффузионные процессы, нели- нейные функции f(X,Y,X) и g(X,Y,X), зависящие от параметра, — кинетику химических реакций. Первая модель такого типа была предложена А. Тьюрингом в 1952 г. для математического описания клеточной дифференцировки, или мор- фогенеза. Этот класс задач связан с появлением различий, возникающих в ходе развития у разных клеток, которые обладают одинаковой генетиче- ской информацией. В соответствии с подходом А. Тьюринга, этот процесс связан с химическими реакциями, которые в простейшем случае описы- ваются моделью (5.12). При изменении параметра при А < Ао аттрактором является пространственно-однородное стационарное распределение кон- центраций X и Y. При А > Ао происходят бифуркации, приводящие к тому, что аттрактором становятся пространственно-неоднородные ста- ционарные распределения. Выход на них происходит с целого класса начальных данных Хо(г),Уо(г). Эти распределения были названы ста- ционарными диссипативными структурами, для того, чтобы подчеркнуть принципиальную роль диссипативных процессов в формировании этого типа упорядоченности. Диссипативные структуры возникают во многих нелинейных откры- тых системах, т. е. системах, способных к обмену энергией или веществом с окружающей средой. На рис. 5.7 а представлен характерный вид стационарных диссипа- тивных структур в одной из наиболее известных систем вида (5.12) — модели брюсселятора. Название связано с тем, что она была предложена в брюссельской научной школе, возглавляемой И. Пригожиным. Эта мо- дель описывает распределения реагентов в некоторой автокаталитической реакции. В ней / = А-(В+1)Х + Х2У, j = BX-X2F, где А и В считаются постоянными. В качестве бифуркационного пара- метра в этой модели часто выступает величина В или длина области I. Типичный вид бифуркационной диаграммы для модели брюсселятора показан на рис. 5.7 б. Видно, что все бифуркации за исключением одной здесь в точности такие, как в рассмотренной модели х = f(x, А). Причину этого можно пояснить следующим образом. Грубо говоря, модели, пред- ставляющие собой уравнения в частных производных, можно представить
116 Глава 5 Рис. 5.7. Стационарные диссипативные структуры: а) типичный пример стационарного пространственного распределения веществ в модели брюсселятора; б) пример бифуркационной диаграммы. Переменная М может быть максимумом, нормой либо другой величиной, характеризующей возникающую структуру. Вертикальные линии здесь не относятся к бифуркационной диаграмме. Они приведены для удобства, чтобы показать, каким значениям параметра соответствуют точки бифуркации как бесконечные системы обыкновенных дифференциальных уравнений. Переменными в этих уравнениях могут, например, быть фурье-компо- ненты функций X и Y. Аттракторами этих уравнений также могут быть особые точки в бесконечномерном фазовом пространстве. Именно эти точки и соответствуют стационарным диссипативным структурам. Поэто- му вполне естественно здесь должны возникать бифуркации, типичные для особых точек. «Необычная» с точки зрения простейшей динамической системы х = v(x), показанная на рис. 5.76, — рождение трех неустойчивых ветвей из одной неустойчивой — точка 3. Она связана с тем, что в отличие от модели (5.1), где зависимость аттрактора от параметра ж(А) полностью характеризует решение, в модели (5.12) бифуркационная диаграмма пред- ставляет собой только проекцию на некоторую ось вектора х из беско- нечномерного пространства. Поэтому решение может терять устойчивость по другому направлению, связанному с пространственной неоднородно- стью решения. Возникновение одних и тех же бифуркаций в сложных и простых системах привело к рождению направления мягкого моделирования, кото- рое иногда называют «стратегической фантастикой». В теории эволюции, при моделировании социальных процессов, в исследовании необратимо развивающихся объектов эксперты часто выделяют поворотные пункты, ситуации, в которых была выбрана одна из альтернатив. Естественно та- кие точки отождествить с точками бифуркации в некоторой динамической системе. Разумеется, это правомерно, если речь идет о процессах, разви- вающихся по своим внутренним законам, а не зависящим кардинально от внешнего управления. Сказанное можно проиллюстрировать примером, в котором дела- лась попытка сопоставить различным сценариям исторического развития,
Элементы теории бифуркаций 117 выделенным выдающимся историком XX века А. Дж. Тойнби, различные бифуркационные диаграммы. Будем предполагать, что в качестве парамет- ра А, отложенного по оси ординат, выступают реальные доходы на душу населения, в качестве бифуркационного параметра Л, отложенного по оси абсцисс — время. Пусть с течением времени климат меняется и урожайность зерновых культур в некотором государстве падает. Выращиваемого на доступных по- севных площадях становится недостаточно. Возрастает социальная неста- бильность, сообщество подходит к точке бифуркации. По терминологии А. Дж. Тойнби, обществу «брошен исторический вызов». На него можно отреагировать разными способами. Например, уменьшить потребности, перенести внутренние проблемы вовне и начать проводить жесткий курс по отношению к соседям (Путь Ликурга). Этому ответу соответствует ниж- няя ветвь на рис. 5.8 g (точка А|). Второй ответ, например, колонизация заморских территорий, в которых государства находятся на более низкой стадии развития и не могут оказать серьезного сопротивления. Следую- щий выбор (точка Аг), например, может быть связан с тем, направить ли силы на то, чтобы стать торговой державой, либо обосноваться за морем «всерьез и надолго». Труды А. Дж. Тойнби и Л. Н. Гумилева дают много эпизодов, где развитие шло в соответствии со сценарием, представленным на диаграмме 5.8 а. Диаграмма, представленная на рис. 5.86, может соот- ветствовать кризису «общества потребления», имеющего весьма высокие жизненные стандарты. Но, пожалуй, гораздо интереснее и важнее анализировать и предска- зывать ситуации, представленные на рис. 5.8 в. Эта картина соответствует, например, разрушению окружающей среды при использовании традици- А* А, А2 A3 А4 t Рис. 5.8. Характерные примеры бифуркаций, возникающие в задачах, связанных с историческим анализом. Точка бифуркации соответствует здесь ситуации, в которой у системы появляется несколько путей развития либо происходят катастрофические изменения
118 Глава 5 онных технологий природопользования, резкому понижению жизненных стандартов и выходу с течением времени на уровень возобновляемых ресурсов. Две верхние изолированные ветви (устойчивая и неустойчи- вая) соответствуют, например, новой технологии природопользования. И здесь становится ясна большая польза диаграмм, подобных нарисо- ванным. Допустим, что мы никоим образом не представляем кривой своего исторического развития. Тогда нас ожидают катастрофы, бедствия и серьезные неприятности в точках Аз и Ад (см. рис. 5.8 в). Однако, если мы имеем развитый и эффективный аппарат прогноза, то ситуация существенно меняется. Допустим, что управление и моби- лизация ресурсов общества позволяет в течение некоторого интервала времени (А, А + ДА) несколько изменить ход развития, сместив бифур- кационную диаграмму на этом промежутке. Тогда становится применима к этой ситуации пословица «предупрежден, следовательно вооружен». Здесь может оказаться «поворотный пункт» А*, где мобилизация ресурсов и усилий с целью перейти на верхнюю ветвь разумна и оправдана. Именно на этом участке исторического развития могут быть осуществлены такие программы. Позже для этого попросту может не оказаться возможностей. Ситуация очень похожа на ту, которая сложилась у геофизиков, зани- мающихся прогнозом землетрясений: чем более обоснован и достоверен прогноз, тем более масштабные и энергичные меры можно предпринять, чтобы уменьшить ущерб от стихийного бедствия. Разумеется, интерпре- тация исторических событий, использующая представления теории би- фуркаций, либо получение прогнозов, немыслима без активного участия профессионалов- историков. Основы классического подхода к анализу бифуркаций были заложены на рубеже XX в. А. Ляпуновым и Е. Шмидтом. Эти методы были развиты в тесной связи с решением прикладных задач о фигурах равновесия вращающейся тяжелой жидкости и о решении нелинейных интегральных уравнений. Идею этого подхода можно пояснить на следующем примере, свя- занном с уравнением (5.1). Обратим внимание на важную зависимость между бифуркациями и устойчивостью исследуемых решений. В самом деле, устойчивость особой точки (ж*, А*) уравнения (5.1) определяется решением линеаризованной задачи dF(x*,A*) У = —д~х------у- Представим решение этого линейного уравнения в виде у = • р. Тогда мы получим, что устойчивость состояния равновесия определяется задачей на собственные значения для некоторого линейного оператора А ИР = Ар, 0F(g*,A) Здесь д является собственным значением, р — некоторой собственной функцией, а оператор сводится к умножению на число. Мы видели, что
Элементы теории бифуркаций 119 бифуркации происходили в тех точках, где 9F(x*, Х*)/9х = 0 (в против- ном случае можно было применять теорему о неявной функции). Но это именно те точки, в которых состояние равновесия теряет устойчивость. Ситуация в общем случае оказывается близкой. В качестве х, у и ip здесь выступают векторы в гильбертовом пространстве Н (полном линейном пространстве, в котором определено скалярное произведение). Линеаризованная задача имеет вид где L\ и — ограниченные линейные операторы в Н. Бифуркационная задача может быть дописана в виде L\u 4- N[U = n(Lzu + Niu). Здесь TVi и N2 — строго нелинейные операторы, т. е. W) = o, ||^и||О1ЫГ +о(|ЫП, :=1,2. Отсюда ясно, что бифуркационная задача имеет нулевое решение при всех значениях параметра д. Справедлива следующая теорема. Теорема. Точки бифуркации нелинейного уравнения L\u + N\u = д(Ь2« + Niu) могут встретиться только среди точек спектра линеаризованного урав- нения L\U = pL2u. Эта теорема оправдывает прием, широко используемый в теоретиче- ской физике и математическом моделировании. Вначале ищут простран- ственно-однородное решение исследуемых уравнений. Затем линеаризуют изучаемую модель в его окрестности и ищут решение этих линейных урав- нений в виде с • exp {ikx 4- iwt}, где с — постоянный вектор. Условие разрешимости этого уравнения дает зависимость ш = ш(к), иногда назы- ваемую дисперсионным уравнением. Если при некоторых параметрах у ш появляется мнимая часть, «возмущения нарастают», то это свидетельствует в пользу неустойчивости. Итак, пусть собственное значение линеаризованной задачи имеет кратность р (отсюда совсем не следует, что в нелинейной задаче будет происходить бифуркация, см. задачи). В теории Ляпунова—Шмидта ис- следуемое уравнение представляется как два уравнения. Одно уравнение в конечномерном подпространстве размерности р, и другое — в его бес- конечномерном ортогональном дополнении. Предложена техника, позво- ляющая находить коэффициенты конечномерной системы р уравнений с р неизвестными, которые также называют уравнениями разветвления. Аналитические методы теории бифуркаций, как правило, дают асимп- тотические разложения в окрестности определенных точек в фазовом пространстве и пространстве параметров. При моделировании конкрет- ных нелинейных явлений этого часто бывает недостаточно. Обычно важно представлять разбиение пространства на области с одинаковым качествен- ным поведением динамической системы. Для этого приходится строить линии, на которых происходят бифуркации. Кроме того, во многих случаях
120 Глава 5 Рис. 5.9. Слева — графическое представление простейшего вычислительного алго- ритма построения .бифуркационной диаграммы. Справа — пример изолированной ветви диаграммы нужно знать всю бифуркационную диаграмму для решений определенного типа, а не только поведение в окрестности точек бифуркации, которые определяют асимптотические разложения. Все это привело к развитию большого класса вычислительных методов теории бифуркаций. В лите- ратуре их часто называют методами продолжения по параметру. Их идею можно проиллюстрировать следующими примерами. Допустим, нас интересует численное построение бифуркационной диаграммы. Пусть для простоты эта диаграмма определяет зависимость особых точек х динамической системы х = F(x, А) от параметра А. Эти точки определяются корнями нелинейного алгебраического уравнения F(x, А) = 0. Типичная стратегия действий такова. Вначале находят с помощью аналитических или численных методов какую-либо точку (ж*, А*), при- надлежащую диаграмме (см. рис. 5.9). Затем делается прогноз «по касательной», чтобы приближенно найти положение следующей точки на диаграмме: zpred(A* + ДА) = Z(А*) + \ 7 ДА. ДА Геометрический образ этой процедуры показан на рис. 5.9. Величина dx*(A*)/dA — «производная особой точки по параметру» — может быть определена с помощью дифференцирования неявной функции 9F 9F dx „ 9х(Х’) 9X + 9x'dX~° 9Х “ дх Затем уравнение F(z*,A* + ДА) = 0 решается с помощью метода Ньютона, где значение ®pred(A* + ДА) ис- пользуется в качестве начального приближения. (Представление о методе
Элементы теории бифуркаций 121 Ньютона дается в 7-й главе этой книги и в большинстве курсов вы- числительной математики.) Если производная \dF(X*)/dx\ оказывается намного меньше, чем |&F(A*)/0A|, то разумно «идти по параметру х», а не по параметру А (см. рис. 5.9). Из рис. 5.9 ясно, что, действуя таким образом, можно численно построить бифуркационную диаграмму в окрестности регулярной экстре- мальной точки. В более сложных случаях можно строить «дискретные аналоги» формул, фигурировавших в начале этой главы. Они включают производные более высоких порядков. Вместе с тем описанный подход имеет принципиальные ограничения даже в простейшем случае особых точек. Причина этого понятна из правой части рис. 5.9. На нем показана ветвь решений уравнения F(x, А) = О, изолированная от основной бифуркационной диаграммы (в литературе такие ветви иногда называют изолятами). Как бы ни были совершенны алгоритмы движения по параметру, мы не можем «перескочить» с исходной кривой на эту изолированную ветвь. Нужны возмущения конечной амплитуды, либо случайные алгоритмы поиска решений вне основной бифуркационной диаграммы. В ряде задач именно такие изолированные решения играют боль- шую роль. К примеру, такая ситуация часто имеет место в теории гид- родинамической устойчивости. В частности, при движении жидкости по круглой трубе простейшее течение с параболическим профилем ско- рости устойчиво при любых числах Рейнольдса. Однако эксперименты показывают, что при превышении числом Рейнольдса некоторого порога движение жидкости становится турбулентным. Следовательно, «особая точка», соответствующая простейшему течению и устойчивая в линей- ном приближении, не лежит на бифуркационной диаграмме, по которой можно пройти от простейшего ламинарного к турбулентному течению. Приходится искать другие ветви. Очень важным оказывается поиск изолированных ветвей в задачах химической технологии, связанных с проектированием химических ре- акторов. Здесь новая ветвь «особых точек» может означать возможность создания новых, более эффективных технологий. Численное построение линий бифуркаций в пространстве параметров очень похоже на расчет бифуркационных диаграмм. В главе 6, например, рассмотрена задача о качалке, в которой состояние исследуемой системы х определяется двумя параметрами а и Ь: F(x,a,b) = 0. (5.13) Это уравнение в данной задаче имеет решение х при любых значениях а и Ь. Однако число решений может измениться при условии dF -—(х,а,Ь) = 0. (5.14) ох Эту линию в пространстве параметров часто называют линией кратных корней. Для поиска этой линии в пространстве параметров а и b приходит- ся решать систему нелинейных алгебраических уравнений (5.13), (5.14).
122 Глава 5 Здесь также вначале находится точка на изучаемой линии, затем делается прогноз по касательной, потом решение уточняется с помощью метода Ньютона и т.д. Большой интерес к теории бифуркаций, проявляемый в настоящее время, связан с несколькими крупными успехами. Это прежде всего открытие нескольких универсальных сценариев возникновения динами- ческого хаоса. Два из них — сценарий Фейгенбаума и перемежаемость — рассмотрены в 7-й главе. Исследование ряда простейших динамических систем позволило при- дать новый смысл слову «понять» при анализе моделей со сложным поведением. «Понимание» в нелинейной динамике обычно оказывается связано с анализом последовательности бифуркаций, приводящей к по- явлению изучаемого аттрактора. Для этого часто конструируются упро- щенные модельные системы, демонстрирующие части такой последова- тельности или всю ее целиком (это могут быть различные отображения или системы обыкновенных дифференциальных уравнений более низкого порядка). Типичный пример такого подхода дает анализ модели Рикитаки, описывающей так называемое земное магнитное динамо. Палеомагнит- ные данные свидетельствуют, что последние 600 млн лет расположение магнитных полюсов Земли менялось сложным нерегулярным образом. Для объяснения этого феномена Рикитаки предложил оригинальную электро- механическую модель. Модель представляет собой два диска, соединенных так, что ток от каждого диска проходит через катушку другого (см. рис. 5.10). Диски в этой модели имитируют два большие вихря в ядре Земли. Эта система описывается следующими уравнениями Х\ = -ЦХх -I- Ж2Ж3, ±2 = -Д^2 + Ж|®4, ±3 = 1- Х\Х1 - 1/\Хз, ±4 = 1- a?ja?2 - ^2^4, где Xi и Х2 — токи, д — сопротивление проводника, х$ и жд — угловые скорости дисков, i/i и 1/2 — коэффициенты трения. Одна из проекций аттрактора в этой системе представлена на рис. 5.10. Видно, что несколько раз в этой последовательности вид аттракто- ра качественно меняется. Это естественно связывать с бифуркациями. Близкая картина детально исследовалась при изучении модели Лоренца, дающей приближенное описание динамики подогреваемого снизу слоя жидкости. Принципиальные трудности возникают уже при анализе достаточно простых хаотических аттракторов в системе трех или четырех обыкновен- ных дифференциальных уравнений. Из рисунка видно, что при изменении аттрактора существенно меняется тип хаотического аттрактора. Было бы очень желательно рассматривать не только бифуркации, связанные с пре-
Элементы теории бифуркаций 123 Рис. 5.10. Схема двухдискового динамо и изменение аттрактора в обобщенной модели Рикитики при изменении параметра д: р, = 0,004, = 0,002 дельными циклами или особыми точками, но и те, при которых один странный аттрактор переходит в другой. Однако сделать это оказывается очень трудно. При бифуркации особых точек можно было следить за изменени- ем их числа и устойчивости. В случае хаотических аттракторов обычно не удается корректно определить небольшой набор чисел, изменение ко- торых приводит к появлению качественных особенностей в наблюдаемом
124 Глава 5 динамическом хаосе. По-видимому, здесь потребуются принципиально новые идеи. Другое важное направление теории бифуркаций — вывод и анализ модельных уравнений, которые описывают поведение системы в окрест- ности точки бифуркации. В самом деле, в силу теоремы о выпрямлении векторного поля в окрестности точки, которая не является особой, с помощью замены пе- ременных, локально динамическую систему можно привести к виду х = с. В окрестности невырожденной особой точки х* (у которой матрица Яко- би А не имеет нулевых собственных значений) поведение динамической системы локально определяется собственными значениями матрицы А, т. е. она оказывается эквивалентна линейной системе Y = AY. Можно ожидать, что в окрестности точек бифуркации также будут возникать мо- дельные системы, локально определяющие динамику исходной системы. Коэффициенты этих модельных уравнений, естественно, будут опреде- ляться не только линейными членами, возникающими при разложении правых частей в окрестности особой точки. Это направление, связанное с получением таких модельных уравне- ний, носит название теории нормальных форм. Здесь получен ряд фунда- ментальных результатов, связанных с локальным анализом нелинейных моделей. Вместе с тем, техника перехода от конкретной системы к нор- мальной форме (т. е. определение коэффициентов, входящих в послед- нюю) может быть достаточно сложной даже для простых бифуркаций. Например, этой технике в случае бифуркации рождения предельного цикла, о которой речь пойдет в 8-й главе, посвящено несколько книг. Реализация подхода, связанного с получением локальных модельных урав- нений для динамических систем специального вида, привела к развитию теории катастроф, обсуждаемой в следующей главе. Вместе с тем, эти результаты имеют принципиальное значение. Они показывают, в каких случаях можно рассчитывать на универсальное описа- ние различных нелинейных систем с помощью одних и тех же модельных уравнений. Кроме того, в 70-е гг. в связи с изучением распределенных систем активно начала развиваться теория центральных многообразий. В этой теории также рассматриваются отображения ф, порождаемые динамиче- ской системой (например x(t) -> x(t + 1)). Особым точкам непрерыв- ной динамической системы соответствуют неподвижные точки отобра- жения ф: ф(х*) = х*. Если спектр линеаризованного оператора dt/?(x*) в этой точке лежит внутри единичной окружности, то точка устойчи- ва. В точке бифуркации спектр разбивается на две части. Одна лежит на ненулевом расстоянии от единичной окружности, другая лежит на ней. Последней части соответствует обобщенное собственное подпространство Y размерности d. (В простейшем случае d совпадает с суммой кратностей собственных значений, равных по модулю единице.) При этом во многих случаях удается доказать, что в рассматриваемом фазовом пространстве Р существует окрестность V точки х* и много-
Элементы теории бифуркаций 125 образие М размерности d, проходящее через точку х* и лежащее в V, которое: 1) обладает свойством локальной инвариантности', если х € М и ф(х) 6 V, то ф(х) € М; 2) обладает локальной устойчивостью: если фп(х) 6 V для п = 0,1, 2,..., то фп(х) -> М при п -> оо. Множество М при этом называют центральным многообразием точ- ки х*. Другими словами, в окрестности точки бифуркации локально вблизи точки х* динамика определяется поведением переменных в некотором d- мерном пространстве. Переменные, лежащие в этом пространстве, и опре- деляют поведение остальных степеней свободы, т. е. служат параметрами порядка. В ряде случаев удается явно найти уравнения, связывающие переменные на центральном многообразии. Принципиальным шагом, имеющим большое значение для нели- нейной динамики, стало обобщение этого подхода и построение теории инерциальных многообразий. Это множества М в фазовом пространстве Р: — компактны и инвариантны, т. е. траектория, начинающаяся в одной из точек М не покидает этого множества; — таковы, что все решения исходной задачи экспоненциально стремятся к М; — обладают асимптотической полнотой: т. е. для любых начальных дан- ных в исходном уравнении существует точка х в М, такая, что расстояние между траекторией исходной задачи и траекторией на М, начинающейся в х, экспоненциально стремится к нулю. Представим себе, что Р — бесконечномерное фазовое пространство некоторого уравнения в частных производных, решения которого ведут себя хаотическим образом. Тогда асимптотическая полнота, по существу, означает эквивалентность уравнения в частных производных при t -> оо некоторой конечномерной динамической системе. Последнюю обычно называют инерциальной формой. Таким образом, например, дело обстоит для одной из базовых моделей нелинейной динамики Wt = W + (1 + ic,)Wxx - (1 + ic2)\W\2W, W(x,O) = Wo(x), O^x^l, 0 sit <<x>, (5.15) ^(0, t) = Wx(l, t) = 0, называемой уравнением Курамото— Цузуки, или обобщенным зависящим от времени уравнением Гинзбурга—Ландау. К сожалению, построить инерциальную форму в интересных случаях явным образом не удается. Однако само ее существование открывает новые возможности в создании новых подходов к проблемам нелинейной динамики и конструированию вычислительных алгоритмов.
126 Глава 5 Во многих важных случаях коэффициенты уравнений в частных производных являются малыми параметрами. Особенно сложны случаи, когда малые параметры входят множителями при старших производных. Например, таковы системы уравнений реакция—диффузия при малых коэффициентах диффузии. Оказалось, что и в этом случае с помощью многомасштабных раз- ложений можно получать модельные уравнения, дающие универсальное описание при определенных бифуркациях. В частности, таковым оказыва- ется уравнение (5.15). Можно ожидать, что модельные системы, которые возникают при использовании теории бифуркаций, будут играть роль ориентиров при изучении различных нелинейных явлений. Вопросы и задачи 1. Построить бифуркационную диаграмму для динамической системы х = х • (6 - Аж) • (А 4- 2х - х2) • ((А - 10)2 + (х - 5)2 - 1) • (А2 - х). 2. В теории бифуркаций широко используется предположение Хопфа о «строгом пересечении», в соответствии с ним следует ограничить бифуркационный анализ двойными точками и не рассматривать точки возврата (где D = 0) и особые точки высокого порядка. Почему? 3. Как выглядит бифуркационная диаграмма вблизи точки возврата второго порядка? В этой точке ветви диаграммы имеют точку касания второго порядка. Найти асимптотические выражения для соответствующих кривых в окрестности этой точки. 4. Дифференциальное уравнение ф = Q - A sin <р, А > 0, Q > 0, где <р берется по модулю 2тг, использовалось для моделирования двух свя- занных, спонтанно колеблющихся нервных клеток-нейронов. В этом случае переменная представляет собой разность фаз между активностями двух нейронов. Исследовать качественное поведение решений и бифуркации в за- висимости от параметров Q и А. 5. Вокруг вертикальной оси, проходящей через центр, вращается обруч ра- диуса R с частотой ш. По обручу может двигаться шарик. Когда частота вращения обруча превышает некоторое критическое шс, шарик покидает нижнее положение равновесия и перекатывается в новое. Постройте ма- тематическую модель этого явления. Оцените величину шс, найдите новое положение равновесия. 6. При описании конвекции в подогреваемом снизу слое жидкости или газа, явлении, оказывающем большое влияние на динамику атмосферы, американ- ским метеорологом Э. Лоренцем была предложена и исследована следующая модель х = -а(х - у), у = -xz + гх-у, z = ху - bz. Здесь х характеризует одну из фурье-компонент поля скоростей, у и z — компоненты поля температуры. Параметр г — число Рэлея, а — чис- ло Прандтля, величина b отражает геометрию области. Будем считать, что
Элементы теории бифуркаций 127 вначале параметр г мал. Каковы простейшие бифуркации, которые будут происходить при увеличении г? Как будут вести себя фазовые траектории вблизи соответствующих состояний равновесия? 7. Будем считать, что функции f и д в системе реакция—диффузия линейны, а состояние равновесия X = 0, Y = 0 устойчиво. Будем рассматривать в качестве бифуркационного параметра один из коэффициентов диффузии. Может ли при увеличении этого параметра возникнуть неустойчивость? Рекомендуемая литература К наиболее доступным и простым учебникам по теории бифуркаций можно отнести книги: Йосс Ж., Джозеф Д. Элементарная теория устойчивости и бифуркаций. М.: Мир, 1983; Баутин Н. Н., Леонтович Е.А. Методы и приемы качественного исследования динамических систем на плоскости. М.: Наука, 1976. На более подготовленных читателей рассчитаны книги: Гукенхеймер Дж., Холмс П. Нелинейные колебания, динамические системы и бифуркации векторных полей / Пер. с англ. Ижевск: РХД, 2002; Арнольд В. И. Дополнительные главы теории обыкновенных дифференциаль- ных уравнений. М.: Наука, 1978; Марсден Дж., Мак-Кракен М. Бифуркация рождения цикла и ее применения. М.: Мир, 1980; Теория ветвления и нелинейные задачи на собственные значения / Под ред. Дж. Б. Келлера и С. Антмана. М.: Мир, 1974. Применение методов теории бифуркаций к анализу распределенных систем, которые описываются уравнениями в частных производных, рассмотрено в двух последних книгах, а также в книгах: Хакен Г. Синергетика. М.: Мир, 1980; Николис Г., Пригожин И. Самоорганизация в неравновесных системах. М.: Мир, 1979. Применение методов теории бифуркаций в сочетании с численным анализом на примере конкретной системы обыкновенных дифференциальных уравнений — системы Лоренца — рассмотрено в книге: Sparrow С. The Lorenz equations: bifurcations, chaos and strange attractors. New-York; Heidelberg; Berlin: Springer-Verlag, 1982.
Escher M. C. Rippled Surface. 1950 Эшер M. К. Рябь на поверхности
Глава 6 Математические модели теории катастроф Теория катастроф — математический ин- струментарий. Как и всякий другой инстру- ментарий, его можно употреблять и не- правильно. Прошедшее десятилетие свиде- тельствует, что он является мощным сред- ством, способным пролить свет на решение самых разнообразных проблем, но требует осторожного и умелого обращения. Т Постон, И. Стюарт В математическом моделировании нелинейных явлений теория ката- строф занимает особое место. Ее развитие показывает, насколько важным может быть введение новых понятий и изменение точки зрения на пред- мет. Ее приложения являются примером того, как много интересных явлений в различных областях может быть объяснено или предсказано с помощью простых и наглядных моделей. Важную роль в создании теории катастроф сыграли работы Р. Тома и его книга «Структурная устойчивость и морфогенез». Проблема морфо- генеза является принципиальной задачей в прикладной математике. Она сводится к выделению наиболее существенных особенностей в начальных стадиях развития организма и их математическому описанию. По мнению Р. Тома, наиболее важным в морфогенезе является появле- ние новых качеств, например, изменения типа симметрии, наблюдаемые в ходе развития организма. Кроме того, характерной чертой биологиче- ских и многих других систем являются скачки — резкие переходы в новое состояние, происходящие при непрерывной эволюции параметров. Эти внезапные изменения были названы Р. Томом катастрофами, чтобы под- черкнуть быструю, кардинальную перестройку изучаемого объекта. Идея описания катастроф сводится к следующему. Пусть состояние объекта описывается некоторой динамической системой вида х=—(61)
130 Глава 6 Тогда, как мы видели, ограниченные решения стремятся к аттракторам х*, которые определяются равенством - » (6.2) дх v ' Функцию U будем называть потенциалом, а точку, в которой производная по х равна нулю (а в общем случае все частные производные равны нулю), будем называть критической точкой. Из алгебраического уравнения (6.2) можно найти координаты всех критических точек я?; (А),..., х*р(Х). Они зависят от параметра (или целого набора параметров) А. Предположим, что параметры меняются очень медленно. Настолько медленно, что траектория x(t, А) оказывается очень близка к одному из своих аттракторов х*(А). Можно представить себе ситуации, в которых при плавном измене- нии параметра А и потенциала U(х, А) критическая точка испытывает скачок. Пример такого поведения мы видели, обсуждая теорию бифур- каций, когда при прохождении регулярной экстремальной точки скачком появляется или исчезает пара состояний равновесия. В модели морфоге- неза, например, А может интерпретироваться как медленно меняющаяся в ходе развития концентрация каких-либо веществ, а х — как точка в фазовом пространстве, характеризующая состояние организма. В упо- мянутой книге Р. Том предложил такие модели в качестве основы для построения математической биологии. Поскольку речь идет о мягком моделировании, где неизвестны за- коны, определяющие процесс, где могут быть сделаны самые общие предположения о виде потенциала, естественно сосредоточить внимание на типичных ситуациях. Под последними понимаются свойства, кото- рые сохраняются при малых вариациях, «малых шевелениях» потенциала. Теория катастроф позволила провести классификацию «типичных» крити- ческих точек и выяснить, каковы «типичные катастрофы» при различном числе параметров А, определяющих состояние системы. Теория катастроф стала синтезом определенных областей классиче- ского математического анализа и топологии. Наглядность и простота ее подхода ко многим задачам вызвала огромный поток работ, связанных с ее использованием при анализе различных математических моделей. Обрат- ной стороной этого стало некритическое использование результатов тео- рии во многих областях, связанных с мягким моделированием, неоправ- данная экстраполяция ее выводов и широкие дискуссии по этому поводу. Однако ее успешное использование в прикладных задачах, связанных с «жестким» моделированием, применение ее методов как эвристического подхода на ранней стадии построения математических моделей пока- зывает важность и эффективность этого математического инструмента в моделировании. Эта глава не может заменить подробных руководств различного уров- ня сложности по теории катастроф. В ней мы постараемся решить гораздо более скромную задачу. Вначале мы попытаемся максимально просто
Математические модели теории катастроф 131 обрисовать несколько характерных проблем и показать, на каком этапе возникает потребность в математических результатах теории катастроф. Далее будет доказано несколько утверждений, которые не требуют ап- парата, выходящего за рамки элементарного математического анализа и линейной алгебры, но дают представление о самом подходе теории. При этом неоднократно будет подчеркиваться глубокая связь этих ме- тодов с исследовательской программой Пуанкаре. Затем мы вернемся к прикладным задачам, где уравнение (6.1) дает удовлетворительное опи- сание ситуации, либо служит эффективной упрощенной моделью. Простейшие математические модели теории катастроф В теории катастроф существует несколько элементарных матема- тических моделей, позволяющих проиллюстрировать характерные черты простейших катастроф. Обсудим одну из них. Представим себе сегмент параболы, у = х2, отсекаемый прямой у = Уо. Допустим, что это тонкая пластинка, которая все время остается в вертикальной плоскости и может перекатываться по горизонтальной прямой АВ (см. рис. 6.1). Будем считать также, что вся масса пластинки сосредоточена в одной точке. Обозначим координаты этой точки в системе координат, связанной с параболическим сегментом через (а, Ь). Рис. 6.1. Когда центр тяжести пересекает линию «клюва», качалка может перевалиться с одного бока на другой Нетрудно изготовить механическую модель такого типа, вырезав два одинаковых тонких параболических сегмента и установив между ними распорки. Это позволит с помощью небольшого кусочка магнита между параболическими сегментами и кусочка железа с другой стороны имитировать «сосредоточенную массу» в точке (а, ft). Изучим динамику системы, плавно перемещая точку (a, ft). Есте- ственно, при таком перемещении состояние равновесия, в которое при- ходит этот сегмент, или, как его часто называют, качалка, меняется. Но в одних случаях это происходит плавно: малое изменение координат (a, ft) мало меняет состояние равновесия (см. рис. 6.1). В других случаях происходит резкий скачок — качалка внезапно «переваливается на другой бок» (см. рис. 6.1). Немного поэксперименти- ровав, можно убедиться, что такие катастрофы происходят, когда точка (а, Ь) пересекает некоторую кривую, имеющую характерный вид «клюва». Любопытно, что в одних случаях скачки при пересечении этой кривой происходят, а в других нет.
132 Глава 6 Чтобы понять такое поведение, а также получить аналитическое выражение для кривой, описывающей «клюв», построим математическую модель описанного явления. Состояние обсуждаемой системы, очевидно, характеризуется одним параметром, — координатой точки t, в которой качалка касается плоско- сти. В теории катастроф переменная, определяющая положение системы, называется переменной состояния. Множество возможных значений пере- менных состояния будем называть пространством переменных состояния. В нашем случае это пространство состоит из отрезка y/уо ]. Пара- метры, с помощью которых можно менять состояние системы, называют переменными управления. У нас этих переменных две — а ид. Множество значений этих переменных — пространство управления. В обсуждаемой модели это множество совпадает с множеством внутренних точек сегмента. В соответствии с законами механики, состоянию равновесия отвечает минимум потенциальной энергии пластинки U = mgh, где т — масса, g — ускорение свободного падения, h — высота точки с координатами (а, д) над горизонтальной плоскостью. Найдем явное выражение для потенциала. В системе координат (х,у) горизонтальная плоскость — это каса- тельная к параболе в точке (t, t2). Тангенс угла ее наклона равен у' = 2t. Учитывая, что она проходит через точку (f, t2), получим уравнение гори- зонтали у = 2tx - t2. Воспользуемся известным из аналитической геометрии соотношени- ем, определяющим расстояние S от точки с координатами (а, д) до пря- мой, заданной уравнением у = рх + q 2 d2 + q2 + а2р2 - 2bq + 2apq - 2abp 1 + р2 В нашем случае р — 2t, q = -t2 и 2 _ Ь2 + 2Ы2 -И4 + 4a2i2 - 4af - 4aW S ~ T+4f2 ' Заметив, что выражение в числителе равно (д - 2at +12)2, получим b-2at +12 = (l+4f)'/2m*- Продифференцировав это выражение и приравняв производную к нулю, получим условие экстремума потенциала 2mg(2t3 + (1 - 2b)t - а) Следовательно, состояния равновесия качалки определяются корнями многочлена Г(О = 2<3 + (1 -2b)t-a, (6.3)
Математические модели теории катастроф 133 зависящего от параметров а и Ъ. Формула (6.3) имеет простой физический смысл: в состоянии равновесия центр тяжести должен располагаться над точкой касания с горизонталью. В противном случае возникает момент двух сил, — силы тяжести, приложенной в центре масс, и силы реак- ции опоры, приложенной в точке касания с плоскостью. Этот момент и вращает качалку. Нормаль к параболе в точке касания (М2) имеет уравнение —х -> 1 э 1 У — + С =-~+С => C = t + - => => 2ty + z = 2f3 + f => 2t3 + (1 - 2y)t - x = 0. Подстановка x = a, у = b в последнюю формулу приводит к соотно- шению (6.3). Следовательно, центр тяжести, находящийся в точке (а, Ь), действительно лежит на нормали к параболе в точке касания. Итак, все возможные состояния равновесия пластинки определяются корнями кубического многочлена U(t). Как любой многочлен нечетной степени, U(t) имеет по крайней мере один действительный корень. В самом деле, U(t) — непрерывная функция U(t) -> оо при t -> оо, U(t) -> -оо при t -> -оо и, значит, должно быть хотя бы одно значение t, при котором U(t) обращается в нуль (см. рис. 6.2 а). Можно предположить, что в плоскости управляющих параметров (а, Ь) найдется область, где действительных корней три (см. рис. 6.2 б). На границе этой области U(t) имеет два корня (см. рис. 6.2 в). Это возможно только если один из корней многочлена — кратный (см. рис. 6.2 в). Из рис. 6.2 в видно, что в точке t, где многочлен U(f) имеет кратный корень, график касается оси абсцисс и, следовательно, U'(t) = 0. Это простое соображение позволяет найти значения управляющих параметров, при которых уравнение 17(f) = 0 имеет два решения. Такое множество часто называют линией кратных корней l/(t) = 0 => 2«3+ «(1-26) + а = О, U'(t) = O => 6«2 + (1 - 26) = 0. Исключив переменную t, получим 27а2 = 2(26-I)3. (6.4)
134 Глава 6 Рис. 6.3. Потенциал V(t) в различных точках пространства управления (а, Ь): а) число решений уравнения U(t) = 0; б) характерный вид потенциала Отметим, что при a = 0, b = 1/2, U(t) = 2t3 уравнение U(t) = 0 имеет трехкратный корень t = 0. Множество В, которое задается урав- нением (6.4), называют бифуркационным множеством функции V или дискриминантным множеством функции U. Изобразим это множество в плоскости (а, Ь) и представим характерный вид потенциала в различных точках этой плоскости. На рис. 6.3 а показано число решений уравнения U(t) = 0 в раз- личных участках плоскости параметров. На рис. 6.3 б — примерный вид потенциала. Рисунок 6.3 б позволяет понять, что происходит с пластинкой при перемещении центра тяжести. Например, зафиксируем параметр b и будем менять а. До значения ai потенциал V(t) имеет единственный минимум, а система, соответственно, единственное положение равнове- сия. В точке ai на линии кратных корней возникает еще одно устойчивое и неустойчивое состояние равновесия. Это особенно ясно видно на рис. 6.4, где в плоскости (a, t) пока- заны все значения f, отвечающие равновесным положениям пластинки при b = Ь, а также характерный вид потенциала при различных значе- ниях а. Напомним, что устойчивому состоянию соответствует минимум потенциальной энергии, неустойчивому — максимум. Для наглядности можно считать, что V(t, а) — это яма, в кото- рой находится шарик с большим коэффициентом трения. Естественно он попадает на дно ямы и находится в локальном минимуме до тех пор, пока этот локальный минимум существует. Такое поведение в тео- рии катастроф называется принципом максимального промедления. Шарик на рис. 6.4 б показан жирной черной точкой. Когда данный локальный минимум исчезает (а = 02), шарик скатывается в другой локальный минимум, а система делает катастрофический прыжок или скачок. В об-
Математические модели теории катастроф 135 f 11ТТ—а) а а Рис. 6.4. Изменения состояния системы при изменении параметра а суждаемой модели это соответствует тому, что качалка переваливается на другой бок. Итак, мы столкнулись с замечательным явлением, характерным для многих нелинейных систем. При малом изменении управляющей пере- менной Л переменная состояния скачком меняет свое значение! На рис. 6.4 величина скачка обозначена через Д^. Скачки могут происходить в точках, где меняется число возможных откликов системы на внешние воздействия (число экстремумов потен- циальной энергии). В общем случае множество значений в пространстве управления, при которых меняется число возможных откликов, также называют бифуркационным множеством. Другое важное явление, которое наблюдается в этой модели — ги- стерезис. Это название употребляется по аналогии с магнетизмом. Под гистерезисом понимается следующее. Если мы обратим путь в простран- стве управления, то это не всегда будет приводить к обращению пути в пространстве состояний. Такое поведение удобно проследить с помощью рис. 6.4. Будем менять параметр а от ai до в2 (что соответствует перемещению центра тяжести вдоль оси х), здесь t(a) является неоднозначной функцией переменной а. При изменении параметра а со стороны малых а точка, описываю- щая состояние системы, двигается по верхнему листу и перескакивает на нижний в точке а?. Обратим путь в пространстве управления — будем двигаться от аг к Точка при этом будет находиться на нижней части листа, а не на верхней, и скачок произойдет в точке ai, а не в точке 02- Это и объясняет тот факт, с которым мы столкнулись, эксперимен- тируя с моделью качалки, — скачки могут происходить не каждый раз при пересечении бифуркационного множества в пространстве парамет- ров. Можно сказать, что они происходят только тогда, когда точка далее не может двигаться по тому листу, на котором находится. Множество всех возможных равновесных положений в пространстве состояний, соответствующих различным значениям переменных управле- ния, часто называют поверхностью отклика. Кривая на рис. 6.4 а — это сечение поверхности отклика плоскостью Ь = const. Существование нескольких листов у поверхности отклика приводит еще к одному любопытному явлению — расхождению', небольшие различия в пути могут привести к большим различиям в состоянии. Это может
136 Глава 6 происходить, даже если пути начинаются и заканчиваются в одних и тех же точках пространства управления и при движении не возникает скачков. Пример таких путей показан на рис. 6.3 а. При движении по пути АС В точка оказывается на верхнем листе поверхности. При движении по пути ADB — на нижнем. Читатель может самостоятельно найти пути, двигаясь по которым, мы можем прийти в конечное состояние со скачком, либо без него. Рассмотрим геометрические свойства поверхности отклика М в про- странстве (t, а, Ь). Уравнение этой поверхности V(t) = 2t3+ t(l-2b)-a = 0. Отметим, что нормаль к параболе в точке (t, t2) задается уравнением 2t3+ t(\-2y)-x = 0. Направим ось t вертикально (см. рис. 6.5). При фиксированном значении to уравнение V(to, a,b) = 0 определяет горизонтальную прямую 2t30 + «о(1 - 26) - а = 0. С другой стороны, последнее равенство определяет нормаль к пара- боле b = а2, лежащей в плоскости t = to. Эта нормаль берется в точке с координатами t = to, а — to, b = t% (см. рис. 6.5). Следовательно, поверхность М можно построить из нормалей к параболе b = а2 в плос- кости (а, Ь), если нормаль, взятую в точке (to, ф, сдвинуть по вертикали на высоту to (см. рис. 6.6). Вертикальная плоскость b — Ьо пересекает Рис. 6.5. Поверхность отклика мож- но построить, рассматривая семей- ство нормалей к параболе Рис. 6.6. Поверхность отклика М, воз- никающая в задаче о качалке. Такие же поверхности появляются в других систе- мах, где имеет место катастрофа сборки
Математические модели теории катастроф 137 поверхность М по кубической параболе 2t3 + «(1 - 2Ь0) - а = 0. эти нормали на горизонталь- Рис.6.7. Семейство нормалей к па- раболе. Огибающая этого семей- ства определяет каустику Когда Ьо > 1/2, эта парабола имеет максимум и минимум. Поэтому поверхность М имеет складку, такую, как показано на рис. 6.6. Проек- ция этой складки на плоскость управляющих параметров (а, 6) определяет бифуркационное множество, при пересечении которого и возможны ката- строфические скачки. Поверхность М делит пространство (t, а, Ь) на две части. Сверху V(t) > 0, снизу V(t) < 0. Возможна и другая интерпретация. Уравнение V(t, a,b) = 0 представляет собой уравнение нормали к па- раболе b = а2 в точке Когда параметр меняется, возникает целое семейство нормалей. Спроектируем все ную плоскость. Мы увидим примерно такую картину как на рис. 6.7. Огиба- ющая этого семейства имеет характер- ный вид «клюва». Найдем уравнение огибающей. Выясним, в какой точке плоскости (а, Ь) пересекаются две бес- конечно близкие нормали. Пусть одна из них соответствует значению пара- метра t, другая — t 4- AL Эти прямые пересекаются в точке V(a, b, t) = V(a, b, t + Д0. Чтобы найти эту линию, представляю- щую собой огибающую семейства нор- малей, которая касается каждой линии семейства, достаточно исключить параметр t из двух последних равенств. Но именно это мы и делали, когда искали бифуркационное множество для нашего потенциала. Огибающая нормалей к кривой называется эволютой этой кривой. Следовательно, бифуркационное множество 27а2 = 2(26- I)3 и определяет эволюту. Здесь можно вспомнить геометрическую оптику. Допустим, у нас есть пучок света, лучи в котором совпадают с семейством нормалей к параболе. Очевидно, огибающая этих лучей будет представлять яркую светящуюся линию. В оптике такие линии называют каустиками (от латинского слова «жгущая»). Каустики можно наблюдать, глядя на то, как меняется освещенность какой-нибудь плоскости после прохождения света от лампы через стакан со сладким, но плохо размешанным чаем (что- бы оптические свойства существенно отличались в разных частях стакана). Возникновение каустик происходит и при прохождении лучей света через толстое стекло с поверхностью сложной формы. Это часто исполь- зуется в современном дизайне. Обратим внимание на то, что эволюта гладкой кривой — параболы имела особенность на оси симметрии. Это типично для задач опти- ки. Особенно наглядно возникновение особенностей можно проследить
138 Глава 6 Рис. 6.8. Принцип Гюйгенса позво- ляет находить положения волно- вого фронта в последовательные моменты времени Рис. 6.9. Положение волнового фрон та в различные моменты времени С течением времени у фронта появ- ляются особенности на примере распространения волнового фронта. Вспомним принцип Гюй- генса: чтобы найти положение S(t + Af) фронта в момент t + Af, надо взять его положение в момент t, провести семейства нормалей и сместить точку фронта вдоль нормали на расстояние с At, где с — скорость распро- странения возмущений (см. рис. 6.8). Пусть волновой фронт представляет собой эллипс и лучи света распространяются вовнутрь. Характерная кар- тина, которую мы увидим, представлена на рис. 6.9. Здесь возникают замечательные особенности. Классификация типичных каустик, особенностей волновых фронтов, представляют собой одно из наиболее важных и интересных приложе- ний теории катастроф. Любопытно, что математический аппарат, созда- вавшийся для анализа типичных нелинейных явлений — бифуркаций и катастроф, оказывается очень полезным в классических «линейных теориях» — геометрической и волновой оптике. В 70-е гг. внимание астрофизиков привлекла проблема крупномас- штабного распределения вещества во Вселенной. Оказалось, что это рас- пределение имеет характерные геометрические особенности. Скопление галактик часто имело вид блинов или блюдец. Группа сотрудников Института прикладной математики им. М. В. Кел- дыша АН СССР под руководством академика Я. Б. Зельдовича провела теоретическое исследование процессов, которые могут привести к таким распределениям. В первом приближении удалось описать их с помо- щью очень простой модели — системы невзаимодействующих частиц с заданными начальными скоростями. Они движутся так же, как лучи в геометрической оптике. И там, где возникают каустики, плотность ве- щества резко возрастает. Чтобы проиллюстрировать типичное поведение такой модели, С. Ф. Шандариным был предложен оригинальный вариант «натурного эксперимента». Брался бугристый лист стекла, через него про- пускался свет. Неровности нужны были, чтобы имитировать неоднородное
Математические модели теории катастроф 139 Рис. 6.10. Машина Зимана, одна из простейших математических моделей теории катастроф. Она, как и качалка, демонстрирует ка- тастрофу сборки начальное распределение скоростей. И далее на экране можно было видеть характерный вид каустик. Качественно они были очень похожи на резуль- таты астрофизических наблюдений. Позже был построен более строгий теоретический подход, опирающийся на результаты теории катастроф. Машина Зимана Рассмотрим еще одну математическую модель, широко используемую в теории катастроф — машину Зимана. Эта машина представляет собой колесико, которое может свободно вращаться вокруг своей оси (точка О). К точке С на краю колеси- ка прикреплены две резинки. Конец одной из них жестко закреплен в точке А. Конец второй резинки привязан к указке, которая может ока- зываться в различных точках плоскости (см. рис. 6.10 а). Поэкспериментировав с этой маши- ной, можно убедиться в существовании четырехугольной области G, состоящей из четырех характерных «клювов» (см. рис. 6.10). Один из таких «клювов» мы видели раньше в задаче о качалке. Пока указка находится вне области G, колесико под действием пружинок устанавливается лишь в одном положении равновесия. Ес- ли рукой повернуть его на некоторый угол и затем отпустить, оно окажется в том же положении. Внутри области G положе- ний равновесия два, и когда указка пере- секает границу области G, то возможен катастрофический скачок. Точно так же, как в модели качалки, скачок происходит не при всяком пересечении границы. Наша цель вновь состоит в том, что- бы определить форму области G и разо- браться, в каких случаях скачок будет про- исходить, а в каких нет. Для этого построим математическую модель. Внутренним параметром естественно считать угол О, на который повернут диск (см. рис. 6.10). Управляющими параметрами — координаты точки В. Для простоты выберем конкретные значения параметров для машины, считая ОС = 1/2, О А = 2, а длины резинок в нерастянутом положении единичными. Определим положение острия нижнего клюва (точка Р на рис. 6.10). В силу симметрии задачи этой точке соответствует угол 0 = 0. Есте- ственно, скачок происходит при значении, где устойчивое положение равновесия (локальный минимум энергии) становится неустойчивым (ло- кальный максимум).
140 Глава 6 Будем считать, что угол 0 близок к нулю. Обозначим длины резинок АС и СВ через е и е' соответственно. Тогда по закону Гука потенциальная энергия системы будет равна уде) = ^(е - I)2 + ±(е' - I)2. (6.5) В этом выражении коэффициент А характеризует упругость резины. По теореме Пифагора (см. рис. 6.10) 2/1 V /I V е = 2 - - cos 0 + ( - sin 0 ) . \ 2 J \2 J Считая угол 0 малым и разлагая sin 0 и cos 0 в ряд Тейлора, получим Воспользовавшись тем, что \/1 + а « 1 + а/2 (что следует из разложения радикала в ряд Тейлора), получим Следовательно, в соответствии с формулой (6.5), имеем s(2s — 1)\ 2(2s+ I)/ + О(04). (6.6) /ЛЧ А Г1 W) = - [- + В теории устойчивости решений обыкновенных дифференциальных урав- нений, по теореме Ляпунова, в ряде случаев можно было пренебречь квад- ратичными членами и всеми членами более высоких порядков. Например, так можно было поступать, если при изучении устойчивости особой точ- ки оказывалось, что матрица системы, линеаризованной в окрестности этой точки, невырождена, т. е. не имеет нулевых собственных значений. Представляется естественным существование аналогичного утверждения,
Математические модели теории катастроф 141 позволяющего в выражении (6.6) пренебрегать членами порядка О(04), когда коэффициент при квадратичном члене отличен от нуля. Это утверждение, получившее название леммы Морса, является од- ним из важных результатов теории катастроф. В следующем разделе мы обсудим его доказательство и геометрическую интерпретацию. Будем считать, что это утверждение справедливо, и отбросим члены О(04). Коэффициент при 02 положителен, если В этом случае потенциальная энергия имеет минимум, и состояние равно- весия будет устойчиво. При выполнении противоположного неравенства устойчивость теряется. Изменение типа состояния равновесия, которое происходит на границе G в точке Р, происходит при значении з, которое определяется равенством 3 2(25+1) 2s2 - 7s + 2 = О з ~ 1,40. Действуя аналогичным образом и разлагая вблизи 0 = тг, можно опреде- лить положение вершины верхнего клюва, точки Q. Выясним теперь, какова форма клюва, и действительно ли она такая же, как в задаче о качалке. Будем считать, что точка В движется не только вдоль оси симметрии, как раньше (для описания чего было достаточно одного параметра з), но и в других направлениях. В этом случае возникают два управляющих параметра а и Д (см. рис. 6.10 б). При этом длина резинки ВС определяется формулой / 1 \2 /1 \2 е2 — I 8 + - cos0 - a ) + I - sin0 + Д) . Разложение потенциальной функции с точностью до членов пятого по- рядка имеет вид VQ^(0) = ^0 Н" А1Д0 + 02^0^ “Ь ЛзДО^ + Од04 + Не останавливаясь на вычислении постоянных оо, аз, ад, отметим, что в точке Р а — /3 = 0 и Va/J(e) = ao + a4e4 + 0(e5), a4>0. И здесь вновь возникает вопрос, можно ли при получении качествен- ных результатов для состояния равновесия Р отбросить члены пятого и всех более высоких порядков. В теории катастроф доказывается, что это можно сделать, причем не только в точке Р, но и в ее окрестности. Отбросим эти члены. Оставшееся выражение также можно упростить. Замена переменных х = 0 + позволяет избавиться от кубического члена. (При этом члены азД03+ад04 войдут в член ж4.) Изменив масштаб
142 Глава 6 параметров управления а -> Са, /3 -> Dp, выражение для потенциала можно привести к виду 1 4 1 2 Уаь(х) = —х + -ах + Ьх + с. Поскольку в обсуждаемой задаче интерес представляют только критиче- ские точки, можно перенести начало отсчета функции V и считать с = 0. Это приводит к выражению 1 4 1 , Vab(x) = -х + -ах -I- Ьх. (6.7) Эта формула определяет поверхность отклика, которая в теории катастроф называется катастрофой сборки. Но это в точности та же формула, которая возникла в задаче о качалке. В самом деле, в этой задаче I7(t) = 2t’ + (1 -26)4 + а. Но эта функция соответствует, в частности, потенциалу „г/ ч 2f4 (1 - 2b)t2 IT(f) - — Ч-------------I- at. Однако замена переменных х = \/2t, а' — (1 - 26)\/2, Ь' = а\/2, приво- дит этот потенциал к виду = х4/4 + а'х2/2 + Ъ'х, что совпадает с формулой (6.7). Возникновение одних и тех же катастроф в самых разных задачах представляется поразительным. В качестве примера можно привести один из экспериментов в психологии восприятия. В основе этого эксперимента лежат следующие соображения. В тео- рии управления для слежения за сигналом используют некоторые ди- намические системы. Они могут описываться, например, уравнениями вида (6.1) или более сложными соотношениями, где параметры At опре- деляют некоторые характеристики воспринимаемого объекта, а перемен- ная (или набор переменных) х — свойства возникающего образа. Можно предположить, что аналогичным способом действует и мозг, формируя не- которую динамическую систему, позволяющую следить за объектом. Чем проще решаемая задача, тем более простой должна быть возникающая система. Здесь также имеет место аналог самоорганизации — из огромного числа степеней свободы, которыми располагает мозг, выбирается лишь небольшое число. Но тогда мы должны наблюдать качественные эффек- ты в восприятии, которые представляются теорией динамических систем и, в частности, теорией катастроф. В пользу этого говорит оптическая иллюзия, показанная на рис. 6.11. Среди представленных фигур четвертая слева в верхнем ряду вос- принимается с равной вероятностью как мужское лицо и как фигура девушки. Если эта фигура включена в последовательность (верхний ряд на этом рисунке), то восприятие средних фигур сдвигается в зависимости
Математические модели теории катастроф 143 Й з йй Й Й S ЙЗ й'й й Й ззааббзд Мужчина Рис. 6.11. Оптическая иллюзия, демонстрирующая бистабильность восприятия от порядка, в котором рассматривается этот ряд — слева направо или справа налево. Наблюдается бистабильность, — два возможных отклика при одних и тех же значениях управляющих параметров, и гистерезис. Оба этих явления мы подробно рассматривали, обсуждая задачу о качалке. Введем еще один параметр, определяющий степень детальности изоб- ражения. Он меняется вдоль оси ординат. Поэкспериментировав с этим рисунком, читатель может сам убедиться, что область бистабильности, где фигура интерпретируется и как лицо мужчины, и как девушка, в за- висимости от порядка просмотра, лежит внутри «клюва». Это позволяет предположить, что и здесь мы имеем дело с катастрофой сборки, такой же, как в случае качалки и машины Зимана. Естественно считать, что изменение восприятия, обычно происходящее на границе клюва, связано с катастрофическими скачками в некоторой динамической системе. Однако решение вопроса о том, как происходит процесс самоорга- низации, какие механизмы обеспечивают появление и отбор параметров порядка, требует совместных усилий психологов и математиков. Теория катастроф позволяет на определенном уровне понять, почему в самых разных задачах возникают одни и те же катастрофы. Оказывает- ся, типичные катастрофы определяются числом управляющих параметров в изучаемой системе. Когда есть единственный управляющий параметр — а, то единственная возможная катастрофа — складка, которая определя- ется потенциалом Ua{x) = — + ах, (6.8) когда параметра два, то возможны складка (6.8) и сборка (6.7). По мере увеличения числа параметров, а значит, усложнения системы, число воз- можных катастроф увеличивается, и поверхность отклика становится все более причудливой.
144 Глава 6 Один из создателей теории катастроф Р. Том показал, что если число управляющих параметров не превышает четырех, то в типичных ситуаци- ях возможны только семь элементарных катастроф. Этот результат можно рассматривать как реализацию исследовательской программы А. Пуанкаре для градиентных систем (6.1). При этом ограничивая тип математических моделей небольшим классом динамических систем вида (6.1), а их ана- лиз — изучением окрестностей особых точек, исследователи получили возможность провести классификацию катастроф. Рассматривая машину Зимана, мы несколько раз столкнулись с не- обходимостью отбрасывать высшие члены в различных разложениях. Ин- туитивно понятно, что именно так и следовало делать, однако теория катастроф позволяет такую процедуру строго обосновать. Это особенно важно, если задача является многомерной и многие «очевидные» сообра- жения оказываются неверны. Структурная устойчивость и идеи теории катастроф Приведение к каноническому виду Одним из приемов, облегчающих исследование нелинейных мате- матических моделей, является приведение изучаемых уравнений к ка- ноническому виду. При этом обычно удается выяснить, какие члены сохраняются, а от каких можно избавиться с помощью различных замен переменных. Замечательная возможность привести многие различные си- стемы вида (6.1) к некоторому каноническому виду лежит в основе теории катастроф. С простейшим примером такого подхода мы сталкиваемся в анали- тической геометрии. Пусть некоторая кривая на плоскости (ж, у) задается многочленом ах2 4- Ъху + су2 + dx + еу + f = 0. (6.9) Какие типы кривых определяет это соотношение? Какие коэффици- енты здесь существенны, а от каких можно избавиться с помощью замен переменных? Чтобы избавиться от линейных членов, сделаем замену пе- ременных и = х - р, v = у - q. Геометрический смысл этой замены — параллельный перенос осей координат (см. рис. 6.12). Произведем эту замену и приведем подобные члены а(и2 -I- 2ри -I- р2) -I- b(uv -I- uq -I- vp -I- pq) -I- c(v2 -I- 2qv 4- q2) + 4- d(u 4- p) 4- e(v + q) + f = au2 + buv 4- cv2 4- u[2ap 4- bg 4- d] 4- 4- v[2cq 4- bcp 4- c] 4- {/ 4- ap2 4- bpq 4- cq2 4- dp + eg}. (6.10) Коэффициенты при линейных членах обращаются в нуль, если равны нулю оба выражения в квадратных скобках. Это дает систему линейных уравнений относительно р и д: 2ар + bq = -d, bp 4- 2aq = -e.
Математические модели теории катастроф 145 Рис. 6.12. Приведение кривой второго порядка к каноническому виду Эта система имеет единственное решение, если det b2 - 4ас £ 0. (6.11) Пусть условие (6.11) выполнено, система двух линейных уравнений решена, а значения р и q подставлены в формулу (6.9). Это дает равенство аи2 + buv + cv2 +р = 0. (6.12) Коэффициент д здесь равен фигурной скобке в выражении (6.10). Гео- метрически произведенное преобразование означает, что мы поместили начало координат в центр исследуемой фигуры (см. рис. 6.12). Соотноше- ние (6.12) инвариантно относительно преобразования (и -> -и, v -v). Приведем квадратичную форму аи2 + buv + cv2 к еще более симметрич- ному виду. Выберем новые координаты так, чтобы она была симметрична относительно новых координатных осей. Для этого есть два способа. Один обычно используют в теории катастроф, другой применяют в аналитической геометрии. Обсудим оба подхода. Поскольку детерминант не равен нулю (см. (6.11)), то, по крайней мере, одно из чисел а, Ь или с отлично от нуля. Пусть это будет коэффи- циент при квадратичном члене, например а. Выделим полный квадрат 2 ? аи2 + bw + cv2 = а( и2-I--uv-I-rv2 ) + ct>2-v2 = Ar2 + Bv2, (6.13) \ a 4a2 / 4a где r = u+^, A = a, B = c- Таким образом, переход к переменным г, v позволяет привести квад- ратичную форму к виду, не содержащему перекрестных членов. Когда а = 0, с = 0, b / 0, то замена переменных и = r + s, v = г- з позволяет привести квадратичную форму к виду (6.13) buv = b(r -I- s)(r - s) = br2 - bs2.
146 Глава 6 Если детерминант равен нулю, то b = 2у/ас. Следовательно, квадратичные члены уже образуют полный квадрат ах2 + 2\/асху + су2 + dx + еу + f = О, (\/ах + J~cy)2 + еу + ^^-х + (d - + f = О, V с \ V с / 9 е 4 т Ч—-=.т Ч- Ах + f = О, где г = (у/dx + y/су), A = d-^, у е е . . е г + —г + — + Ах Ч- f - -— = О, Jc 4с 4ас 2 Ч- Ах Ч- д = О з2 + Ах Ч- д = О, (6.14) где s = r+=/ + ^с. Поскольку Ь2 = 4ас, то а и с должны иметь один знак. Мы предпо- дожили выше, что а > 0, с > 0. В противном случае можно разделить все члены на а (если а / 0). Это сведет задачу к предыдущему случаю. Если а = 0, то и Ь = 0 и преобразование упрощается су2 + dx Ч- еу Ч- f = 0 => ( 2 е е \ , е . 2 . => Cl у +-y + —z]+dx-—z + f = cr +dx + g. \ с 4с1 j 4<~ Здесь r = y+Yc,g = f- fa. Итак, описанные замены переменных, связанные с выделением пол- ного квадрата, позволяют привести равенство (6.9) к каноническому виду Ar2 -I- Bs2 = G. Если А, В и С имеют один знак, то это эллипс. Если знак G не совпадает со знаками А и В, то это уравнение не определяет какой-либо кривой на плоскости (г, з). Если А и В имеют разные знаки, то это уравнение гиперболы. При Ь2 = 4ас уравнение (6.9) определяет параболу. Можно изменить масштабы и привести формулу (6.9) к виду p24-g2 = l, p2-g2 = l, р-д2=0. При этом часть информации теряется. Например, все эллипсы, не- зависимо от величины их полуосей и расположения на плоскости, пе- рейдут в окружность единичного радиуса с центром в начале координат (см. рис. 6.12). Проведенные преобразования меняли масштабы вдоль координат- ных осей, сдвигали начало координат. Они меняли углы, переводя пря- моугольную систему координат в косоугольную. Читатель может в этом
Математические модели теории катастроф 147 убедиться, проследив, как действует отображение (ж, у) -> (тх + пу, у), которое мы использовали (см. формулу 6.14). Вместе с тем, величина Ь2 - 4ас являлась инвариантом и определяла, к какому каноническому виду может быть приведено уравнение (6.9). Кроме того, инвариантом яв- ляется соотношение знака а (если а / 0) и свободного члена (например, д в формуле 6.12). При одном соотношении знаков может, к примеру, возникнуть равенство р2 + q2 = 1, определяющее окружность, при дру- гом — р2 -q2 = 1, не определяющее какой-либо кривой. Произведенные замены переменных не могут изменить этого. Можно сказать, что выбранный набор преобразований сохранял ка- чественную информацию, определяющую тип кривой. Эта информация может быть использована для классификации. Например, к эллипсам можно отнести все кривые вида (6.9), которые с помощью описанных преобразований могут быть приведены к виду р2 + q2 = 1. Вместе с тем в ряде задач такой набор преобразований, который не сохраняет ни длин, ни углов, является слишком широким. Поэтому в аналитической геометрии обычно поступают иначе. Там при приве- дении к каноническому виду обычно считают допустимыми переносы и повороты ортогональной системы координат. Известно, что координаты точки при повороте системы координат на угол а определяются соотношениями (см. рис. 6.12) v! = и cos а + v sin a, v = vcosa - usina, (6.15) или эквивалентными равенствами и = и' cos а - v' sin a, v = v cos a + u sin a. Вернемся к формуле (6.12) и выясним, на какой угол а следует повернуть систему координат, чтобы уничтожить перекрестные члены аи2 -I- buv + cv2 = а(и cos а - v sin а)2 + Ь(и cos а - v sin а) х х (t/cosa + i/sina) + c(t/cosa + tZsina)2 = = tZ2(acos2 а + bsina cosa + csin2 а) + -I- i/t/[-2asinacosa - b(cos2 a - sin2 a) -I- 2csinacosa] + -I- t/2(sin2 a - bsinacosa -I- ccos2 a). Воспользовавшись соотношениями sin 2a = 2 sin a cos a, cos 2a = cos2 a-sin2 а, преобразуем выражение в квадратной скобке и приравняем его к нулю (с - a) sin 2a - b cos 2a = 0. Именно это уравнение и определяет угол поворота системы. Читатель может более подробно проанализировать свойства уравнения (6.15). Первый из описанных выше подходов в линейной алгебре есте- ственно обобщается на случай многих переменных. Напомним основные определения и ход рассуждений.
148 Глава 6 Квадратичной формой или квадрикой от п переменных х\,...,хп будем называть выражение вида = 52 Xijxixj’ ij Набор чисел AtJ образует квадратную матрицу Л размера п х п, называ- емую матрицей квадратичной формы. Преобразование А'; = |(Ау + А;»), A't = + \»)» как нетРУДно убедиться, не меняет квадратичной фор- мы q(x), однако делает матрицу этой формы симметричной А^ = А'{. Будем далее считать, что такое преобразование уже проведено, и матрица квадратичной формы симметрична. Каждая квадратичная форма от п переменных может быть приведена к диагональному виду Я(У) = diy* + ... + dny2n. Это может быть сделано с помощью невырожденного линейного преоб- разования, т. е. такого, у которого детерминант соответствующей матрицы отличен от нуля. В самом деле, пусть Ац 0. Если это не так, то найдем диаго- нальный элемент матрицы Л = {Ay}, 1 < i, j < п, отличный от нуля. Перенумеруем переменные х\,... ,хп так, чтобы этот элемент стал эле- ментом Ац. Этого нельзя сделать, если А« = 0, 1 iС п. В этом случае найдем ненулевой элемент Ау. В силу симметрии Xji 0. Следовательно, в квадратичную форму входит член 2XijX(Xj. После замены переменных, эквивалентной повороту системы координат на тг/4, (а?» И- a?j) (а?» , z . , z . Уг = --У3 = -------------Ук=Хк ПРИ вместо 2XijX{Xj возникнут члены Х^у2 - Х^у2. Поскольку коэффици- ент при одном из квадратичных членов стал отличен от нуля, можно переобозначить переменные и считать, что Ац /0. Пусть pij = XijI'Ац. Вернемся к старым обозначениям, считая что все предварительные преобразования уже проделаны 9(®) = Ац^2д0^Ж; = и п х2 + 2^2pijxixj+члены, не содержащие xj j=2 п (п х 2 п х\ + 52до'ж> ) -52члены, не содержащие Xi j=2 ' j=2
Математические модели теории катастроф 149 Сделаем замену переменных 2П = HxjXj, = Xi (t > 1), >=2 эквивалентную невырожденному линейному преобразованию (детерми- нант соответствующей матрицы не равен нулю). После этой замены квадратичная форма будет приведена к виду 9(у) = ^пу21+д(у2,---,уп), где q — квадратичная форма от переменных у2,..., уп- Поэтому далее можно проводить несколько раз описанную выше процедуру, вначале применив ее к квадратичной форме q, затем к форме от переменных Уз, • • •, Уп и т. д. После этого форма будет приведена к диагональному виду: 9(У) = <iiy, + + d„y2. Изменим масштаб, сделав замену переменных z* = 2/*/\/W, dt £ 0. После этого в квадратичной форме q(z) останутся только квадраты, ко- эффициенты при которых равны 1,-1 или 0. Перенумеровав переменные так, чтобы сначала шли единицы, затем минус единицы и потом нули, убедимся, что любую квадратичную форму от п переменных с помощью невырожденной замены переменных можно привести к виду q{z) = zi 4- ... + z} - z,2+1 - ...- z2, r n. Число г называют рангом квадратичной формы. В курсе линейной ал- гебры доказывается, что оно совпадает с рангом матрицы Л и не за- висит от выбора линейного преобразования. Кроме этого инвариантом является разность з = I - (г - I) = 21 - г, называемая сигнатурой. Лю- бая квадратичная форма единственным образом определяется рангом и сигнатурой с точностью до линейного невырожденного преобразова- ния. Мы здесь имеем в точности такое же преобразование, с помощью которого квадратичная форма (6.9) приводилась к каноническому ви- ду так, что все эллипсы переводились в одну окружность единичного радиуса. К примеру, квадратичная форма, которую мы обсуждали q(x, у) = ах2 -|- Ьху + су2, в зависимости от ранга г и сигнатуры з, может быть приведена к виду 1) и2 + V2 (г = 2, $ = 2); 2) и2 - v2 (г = 2, з = 0); 3) - и2 - V2 (г = 2, з = -2); 4) и2 (г = 1, 5=1); 5) - и2 (г = 1, з = -1); 6) 0 (г = 0, з = 0).
150 Глава 6 Очень полезно рассмотреть пространство коэффициентов (а, Ь, с) и выяснить, к какому виду может быть приведена квадратичная форма Рис. 6.13. Разбиение пространства (а, Ь, с) по типам квадратичных форм в различных частях этого пространства. Читатель может самостоятельно убедить- ся, что разбиение пространства будет именно таким, как показано на рис. 6.13. Уравнение Ъ2 - 4ас задает двойной конус. Из рис. 6.13 следует важный факт. Зададим наугад тройку чисел — (а, Ь, с). Почти всегда мы будем иметь квадра- тичную форму, которую можно привести к виду и2 4- v2, и2 - v2 или -и2 - v2. Только в исключительных случаях, когда точка оказывается на поверхности кону- са, возможны иные ситуации. Кубические формы и квартики При увеличении числа управляющих параметров проводить класси- фикацию, связанную с выделением «типичных» катастроф, становится все сложнее. Это связано не с увеличением числа катастроф, что было бы вполне естественно, а с возникновением новых явлений, которых не было в пространствах меньшего числа измерений. Возникающие трудности удобно проиллюстрировать на примере про- стейшей задачи о классификации кубических форм (кубик) от двух пере- менных с(х, у) = ах3 4- /Зх2у -I- уху2 + бу3 и однородных многочленов четвертой степени (квартик) d(x, у) = ах4 + 0х3у 4- ух2у2 4- ду3х 4- еу4. Мы покажем, как решается эта задача для кубик, и обсудим принци- пиальные трудности, которые возникают уже в случае квартик. Рассмотрим множества, вдоль которых многочлены с(х, у) и d(x, у) обращаются в нуль. Эти множества представляют собой набор прямых, проходящих через начало координат. В самом деле, обе формы таковы, что с(ах, ау) = а3с(х, у), d(ax, ay) — a4d(x, у), где а — любая постоянная. Поэтому если с(а, Ь) = 0, то с(аа, ab) = 0 и, следовательно, форма с(х, у) будет принимать нулевое значение вдоль всей прямой у = Ьх/а. То же относится к форме d(x, у). Эти прямые называют корневыми прямыми. Заметим, что никакие линейные невырожденные преобразования не могут изменить число корневых прямых (см. рис. 6.14). Чтобы выяснить их расположение, рассмотрим их пересечение с вер- тикальной прямой х = 1 (см. рис. 6.14). Точки пересечения с этой прямой определяются кубическим уравнением F(y) = а 4- /Зу 4- уу2 4- бу3 = 0.
Математические модели теории катастроф 151 Рис. 6.14. Возможные расположения корневых прямых для кубической формы Это уравнение имеет не более трех решений у\, уг, у$. Возможна ситуация, когда одной из таких прямых является ось ординат х = 0. Из выражения для с(х, у) видно, что это может произойти при 6 = 0. Возможны несколько ситуаций: 1. Существуют три различные прямые О А, ОВ, ОС (рис. 6.14 о). 2. Существуют две прямые О А, ОС (случай кратного корня (см. рис. 6.146)). 3. Существует единственная прямая О А, соответствующая простому корню ОА (см. рис.6.14в). 4. Существует прямая, соответствующая трехкратному корню (см. рис. 6.14г). Рассмотрим первый случай. Выберем новую систему координат, в ко- торой ось абсцисс идет вдоль прямой О А (см. рис. 6.14 а), а ось ординат — вдоль прямой ОС. В новых координатах (и, v) ось О А будет задаваться уравнением v = 0, ось ОС — и = 0. Выберем единицы измерения таким образом, что прямая О В задается равенством и = v. Следовательно, в но- вых переменных корневые прямые задаются уравнениями и = 0, v = 0, v = и, и кубическая форма поэтому может быть записана в виде c(u, v) = uv(u - v).
152 Глава 6 Сделаем далее замену переменных и 4- v и-v P=~Y~' q = ~~2~i приводящую форму с к виду с(р, q) = 2q(p - q)(p + q) (множитель перед этим выражением несущественен). Таким образом, в случае трех различных корневых прямых кубическая форма может быть приведена к виду с(р, q) = p2q - q3. Рассмотрим остальные случаи. В каждом из них, кроме тривиального случая а = /3 = у = б = 0, существует корневая прямая. Пусть ее уравнение имеет вид 1х 4- ту = 0. Следовательно, выражение 1х 4- ту должно быть делителем с(ж, у). Поэтому с(х, у) = (1х 4- ту) (ах2 4- bxy 4- q/2). Воспользуемся результатами, касающимися квадратичных форм, и сдела- ем преобразование, приводящее квадратичную форму к каноническому виду. При этом член lx + ту перейдет в Lu + Mv. Кубическую форму при этом можно будет записать в виде: a) (Lu + Mv)(u2 - v2), б) (Lu + Мv)u2, в) (Lu+Mv)(u2+v2). (Знак, который имела приведенная форма, например -и2 - V2, перенесем в член Lu + Mv.) В случае а) (Lu -I- Mv)(u2 - v2) = (Lu 4- Mv)(u + v)(u - v). Поэтому, если L M или L = M, то мы имеем уже рассмотренный случай трех различных корневых прямых. Если L = М, то замена и + v = р, v = q приводит форму к виду р2(р - 2g), т. е. к случаю б). (Мы будем опускать несущественные множители.) Точно так же при L = -М мы приходим к случаю б). В случае б) новые координаты t = Lu + Mv, s = и приводят форму к виду ts2. Если М = 0, то замена t = Lx^u приводит форму к виду t3. В случае в) при L = 0 или М = 0 возникает кубическая форма вида (t2 4- s2)s. Когда Z/ОиЛГ/О, то повернем систему координат: Lu — Mv Lv + Mu / — С = W 4- M2 ’ x/Z2 4- Af2' Тогда t2 4- s2 = u2 + v2, и c(t, s) = M2s(s2 -I-12). Изменив масштаб, вновь получим форму s(t2 4-s2). Собирая все полу- ченные выражения, приходим к выводу, что с помощью невырожденной линейной замены координат любую ненулевую кубическую форму можно привести к виду: 1) х2у- у3, 2) х2у + у3, 3) х2у, 4) х3. Так же, как в случае
Математические модели теории катастроф 153 Рис. 6.15. Возможные рас- положения корневых пря- мых для квартики Когда возникают мо- множество, элементы квадратичных форм, здесь удалось получить список стандартных кубик, на основе которого можно проводить классификацию. К сожалению, это не удается сделать уже в случае однородных много- членов четвертой степени. Для формы d(x, у) также существуют корневые прямые (см. рис. 6.15). Будем действовать так же, как в случае кубических форм. Одну координат- ную ось и направим вдоль прямой О А, другую v — вдоль прямой ОС. Выберем масштаб так, чтобы уравнение прямой ОС можно было запи- сать как v = и. Тогда в случае четырех различных корневых прямых квартику можно будет записать в виде d = uv(v - u)(v - аи). Здесь v = аи — уравнение прямой OD. С по- мощью линейных преобразований не удается из- бавиться от непрерывно меняющегося углового ко- эффициента а. Непрерывно меняющийся инва- риант, сохраняющийся при выбранном наборе преобразований, называют модулем. Наличие мо- дулей намного снижает ценность классификации, дули, появляется несчетное множество (т. е. такое которого нельзя сопоставить натуральному ряду чисел 1,2,...) различных канонических форм. В отличие от ненулевых квадратичных форм, кото- рые могут быть приведены к одной из пяти канонических форм, от кубик, для которых существует четыре формы, для квартик канонических форм становится бесконечно много. Однако, может быть, выбранный подход неудачен и другие наборы линейных преобразований позволяют избавиться от коэффициента а? В проективной геометрии доказывается, что это не так. Существует инвариант с, который называется двойным отношением четырех прямых. Он определяется равенством с= (У1 - Уз)(У2 - Vt) (У1 - Уз)(У\ - yt) ’ где у\, уг, уз, 2/4 — ординаты точек пересечения с прямой х = 1. Если одна из прямых совпадает с осью у, (2/4 —> оо), то с = В проектив- ной геометрии доказывается, что в качестве двойного отношения может получиться любое вещественное число, кроме нуля. Двойное отношение не меняется при линейных заменах координат, когда сохраняется нумера- ция прямых. С наличием инварианта с и связано то обстоятельство, что не удается в случае квартик избавиться от коэффициента а. Возникновение модулей — одна из принципиальных проблем, с кото- рой столкнулись математики и специалисты по математическому модели- рованию, изучая нелинейные явления. Там, где размерность пространства
154 Глава 6 параметров достаточно велика (как в теории катастроф), либо большой яв- ляется размерность исследуемой динамической системы (как в системах, содержащих более двух обыкновенных дифференциальных уравнений) модули естественно возникают. В теории катастроф при большом числе управляющих параметров «не хватает» преобразований, чтобы «уничто- жить» все непрерывные параметры, превратив их в +1 или в -1, как при приведении квадратичной формы к каноническому виду. С аналогичной ситуацией мы встречались, обсуждая классификацию квартик. При анализе обыкновенных дифференциальных уравнений отсут- ствие модулей тесно связано с грубостью или структурной устойчивостью, т. е. с возможностью привести близкие динамические системы с помо- щью некоторого класса топологических преобразований, о которых речь пойдет дальше, к стандартному виду. Так, например, дело обстоит в си- стемах двух обыкновенных дифференциальных уравнений. Если бы это было так в общем случае, то можно было бы провести классификацию динамических систем, приводя их к счетному числу канонических ти- пов. В 60-х гг. нашего века американским математиком С. Смейлом была доказана неразрешимость этой проблемы. «Физический смысл» этого результата был выяснен в ходе интен- сивного исследования динамического хаоса и странных аттракторов. Эти объекты оказались слишком сложными, чтобы характеризовать их с по- мощью какого-либо набора целых чисел. Странные аттракторы внешне напоминают запутанный клубок траекторий. Если бы задача классифи- кации была разрешима, то было бы ясно, чем один клубок качественно отличается от другого и какие бифуркации могут превратить один хаоти- ческий аттрактор в другой. К сожалению, это не так. Одним из следствий этих математических проблем является отсутствие классификации и набора базовых матема- тических моделей для большого класса динамических систем. Неясно, какое поведение является типичным и какие математические модели следует изучать в первую очередь. Приходится часто опираться на инту- итивные соображения, а это не дает уверенности, что принципиальные качественные эффекты не упущены. Правоэквивалентность. Классификация функций одной переменной Рассматривая задачу о качалке и машину Зимана, мы видели, на- сколько важным является тип состояния равновесия. Изменение типа при изменении параметра может приводить к катастрофическим скачкам. Тип состояния равновесия определяется локальным поведением потенциала, т. е. поведением в окрестности состояния равновесия. При этом важ- но было бы провести классификацию всех возможных типов поведения U(x) в окрестности данной точки х. Будем считать, что все изучаемые функции являются достаточно гладкими, т.е. имеют необходимое число непрерывных производных. Естественно считать, что гладкие обратимые замены координат не меняют качественного поведения потенциальной
Математические модели теории катастроф 155 Рис. 6.16. Действие диффеоморфизма можно представить как гладкое изгибание координатных осей Рис. 6.17. Линенейный оператор, действующий в двумерном пространстве. Если опре- делитель не равен нулю, то он переводит квадрат в некоторый параллелограмм (а); если одно собственное значение равно нулю, то в прямую (б); если оба — в точку (а) функции. Такие замены переменных осуществляются диффеоморфизмами. Напомним определение диффеоморфизма. Пусть U и V открытые множества в евклидовом пространстве Rn, причем f(U) = V. Будем называть функцию f диффеоморфизмом, если: 1) она является гладкой, т. е. имеет непрерывные производные любого порядка', 2) она имеет обратную функцию g: V —>R, f(g(x)) = \y, 9(f(x)) = ^u (индекс снизу показывает, какому множеству принадлежит единич- ный элемент); 3) обратная функция g является гладкой. Локальный диффеоморфизм в точке х — это диффеоморфизм, опре- деленный в некоторой окрестности точки х. Геометрически действие диффеоморфизма можно представить как гладкое изгибание координатных осей (см. рис. 6.16). В линейной алгебре доказывается, что линейное отображение А не вырождено, т. е. переводит элементы пространства Rn в Rn (а не в пря- мую или точку), если его ранг равен п. Ддя этого достаточно, чтобы определитель матрицы А не равнялся нулю (см. рис. 6.17). Отображения, осуществляемые гладкими функциями y=f(x), х GRn, у € R” локально, в окрестности данной точки х, действуют как линейные отображения. Отображению f можно сопоставить в окрестности данной
156 Глава 6 точки х линейное отображение, матрица которого называется якобианом У\ = ,хп), Уп = ,жп); /ОЩ 0_№)\ ^i\ dxi дхп {zj dfn(x) Ofn(x) \ дх\ * 9хп / или в более короткой записи z = Df(x)t. Линейное отображение невы- рождено, если и только если det Df(x) 0. В простейшем случае, когда х и у скаляры, это условие эквивалентно тому, что df(x)/dx 0. В этих терминах один из фундаментальных результатов математиче- ского анализа, теорема об обратной функции, формулируется следующим образом. Пусть f: U -> — гладкое отображение и х € U. Если линейное отображение Df(x) невырождено, то f — локальный диффеоморфизм в точке х. Грубо говоря, если ли- неаризованное в окрестности данной точки отображение является невырожденным, а значит обратимым, то и для исходного нелинейного отоб- ражения существует обратная функция. Принципиальную роль играет в теории катастоф и другой результат математиче- ского анализа — теорема о неявной функции. Она отвечает на вопрос, когда множество решений уравнения f(x, у) = 0 является графиком функции у = у(х). Так же, как в теореме об обратной функции, локально это определяется линейным отображением Df(x,y). Теорема. Рассмотрим функцию f(x,y) двух переменных. Пусть х — т-мерный вектор, у — п-мерный вектор, а сама функция — р-мерный вектор. Пусть для некоторой точки (х,у) € Rm х R” множество (где Df\(x,y) — линейное отображение (6.16), определяемое якобианом, взятым в точке (х,у)), является графиком функции у = у(х). Тогда
Математические модели теории катастроф 157 и для исходной нелинейной функции равенство у) = /(ж, у) определяет график некоторой гладкой фунции у = у(х) (см. рис. 6.18). Вернемся к классификации гладких функций в окрестности данной точки х. Сдвигом системы координат можно добиться, чтобы х = 0. Естественно считать две функции fug эквивалентными, если одна пере- водится в другую с помощью гладкой невырожденной замены переменных у = у(х). Исходя из этого интуитивно очевидного представления, введем следующее определение. Определение. Две гладкие функции fug, отображающие Rn в R”, будем называть правоэквивалентными вблизи нуля, если существует такой локальный диффеоморфизм у. Rn -> Rn в окрестности нуля и такая постоянная С, что вблизи нуля Р(ж) = f(y(x)) + C. (6.17) Постоянная С необходима, чтобы вернуть значение функции к нулю и учесть возможные переносы начала координат. Название «правая эк- вивалентность» связано с тем, что функция у стоит только справа от /. Чтобы яснее представить, какие функции эквивалентны в соответствии с этим определением, а какие нет, приведем несколько примеров. Пример 1. Функции f = у2 м g = -х2 при х = 0, у = 0 не являются правоэквивалентными. (Будем полагать, что у(0) = 0.) В самом деле, допустим противное. Тогда -X2 = (у(х))2 + С. В точке х = 0 левая часть равенства равна нулю, у(0) = 0 по условию. Следовательно, С = 0. Но тогда в сколь угодно малой окрестности точки х = 0 в равенстве (6.17) слева будет стоять отрицательная функция, справа — положительная. Это противоречие доказывает, что отображения у(х) не существует. Пример 2. Функции хк и хт не являются правоэквивалентными при к / т. Вновь положим, что у(0) = 0. Будем для определенности счи- тать, что к < т. Если эти функции эквивалентны, то должно быть выполнено равенство х‘ = (»(*))" + с. Рассматривая точку х = 0 так же, как в предыдущем примере, приходим к выводу, что С = 0. Будем дифференцировать правую и левую части последнего равенства: кхк~' = ту(х)т~1у'(х), к(к - 1)хк~2 = т(т - 1)(у (х))2у(х)т~2 + ту(х)т~1у"(х),
158 Глава 6 Продифференцировав т раз, получим О = ml(y(x))m + у(х)[...]. В точке х = 0, у(х) = 0, следовательно у'(х) = 0. Однако это противоре- чит тому, что у(х) — невырожденное преобразование. С помощью представления о правоэквивалентности можно провести локальную классификацию гладких функций. То есть показать, что неко- торой заменой переменной в окрестности данной точки кривую можно привести к каноническому виду. С точки зрения классификации и иссле- довательской программы А. Пуанкаре, этот результат идеален. Обсудим его подробнее. Имеет место замечательное утверждение о правоэквивалентности любой гладкой степенной функции хк при нечетном к, или одной из функций ±хк при четном к, если к-я производная в этой точке отлична от нуля, в то время как первые к - 1 производных равны нулю. Докажем его. Сначала рассмотрим следующие две леммы. Лемма 1. Пусть гладкая функция f: Rn —> R такова, что /(0) = 0, тогда в некоторой окрестности начала координат 1=1 где Qi(x\,..., хп) — гладкие функции и gt(Q) = df(Q)/dxi. Доказательство. Представим функцию f в виде .. ,%п)— I \f\tX\,£з?2,’ • ♦ дх~ Xjdt. 0 О *=1 * Выбрав функции в виде 1 J dxj о п А _ Ь dXi получим f = 2 xi9i- Продифференцировав последнее равенство по ж,, имеем 1=1 9f < d^=9dxl'- Поскольку в начале координат Xi = 0 при 1 i < п, то 0/(0) dii = 9i(0).
Математические модели теории катастроф 159 Лемма 2. Пусть гладкая функция q(x) такова, что ?(0) = Dq(0) = ... = Dkq(0) = О, где символ Dn соответствует п-й производной, тогда в некоторой окрестности нуля существует гладкая функция 1(х), такая, что q(x) = xk+ll(x). Доказательство. Воспользуемся методом математической индукции. При к = 0 применима предыдущая лемма и функцию q(x) можно представить в виде q(x) = xl\(x), где 1\(х) — гладкая функция. Про- дифференцировав последнее равенство т раз, получим Dmq(x) = xDml\(x) + mDm~'l\(x). (6.18) Будем считать, что лемма верна вплоть до к - 1, т. е. если д(0) = ... = Р*-1д(0) = 0, то q(x) = хк1(х). Докажем, что это так и для значения к. Положив х = 0 в формуле (6.18) и учитывая равенства д(0) = ... = Dkq(x) = 0, приходим к выводу, что и /1(0) = ... = Dk~lli(fi) = 0. Следо- вательно, по предположению индукции Ц(х) = хк1(х), где 1(х) — гладкая функция в окрестности начала координат. Следовательно, q(x) = xk+ll(x), что и доказывает лемму. □ Это утверждение также носит название леммы Адамара. Оно позволяет доказать сформулированную теорему. Теорема. Пусть f: R —> R — гладкая функция, для которой /(0) = Р/(0) = ... = Р‘-7(0) = 0, но Dkf(Q) / 0. Тогда с помощью некоторой гладкой локальной замены координат ее можно привести к виду хк при нечетном к и ±хк при четном к. Доказательство. Разложим функцию f(x) в окрестности начала коор- динат, выделив первые к членов ряда Тейлора /(®) = ^Dkf(0)xk + q(x), где q(x) имеет порядок к 4-1. Пусть Dkf(0)/kl = а 0. По предыдущей лемме в некоторой окрестности начала координат q(x) = xk+ll(x), где I — гладкая функция. Следовательно, f(x) = хк(а + xl(x)) = ±ж*|а 4- xl(x) |, где знак совпадает со знаком а в достаточно малой окрестности нуля, потому что xl(x) = 0 при х = 0. Пусть д(х) = ж|а 4- xl(x)\^k, где в ка- честве корня взят единственный положительный корень. Покажем, что
160 Глава 6 функция д: R —> R является локальным диффеоморфизмом. Воспользу- емся теоремой об обратной функции. Производная функция д(х) отлична от нуля: Dg(x) = ' (/(x)+xDZ(x)) + |a+x/(x)|1^ Л = |a|'/‘^0, поэтому по теореме существует обратная функция х = д [(у) и замена координат у = д(х) является гладкой и обратимой. Однако f(x) = ±д(х)к = ±ук. Когда к нечетно, можно заменить у на —у и сделать знак положительным. В случае четного к знак произ- водной Dkf(Q) является существенным, поскольку при определении д(х) приходится извлекать корень четной степени. И, как мы убедились ранее, функции х2т и -ж2т не правоэквивалентны. Следовательно, функции f(x) и ±хк при четном кихк при нечетном к действительно локально являются правоэквивалентными. □ Подчеркнем важное отличие этого результата от стандартного раз- ложения в ряд Тейлора. Функция f(x) может быть переведена в степен- ную хк в малой окрестности данной точки с точностью до постоянной без какого-либо остаточного члена. Кроме того, важно подчеркнуть, что получен! ли результат не зависит от того, сходится ли ряд Тейлора функ- ции f(x) в точке х = 0. Отметим, что для гладких функций, имеющих бесконечное количество производных, ряд Тейлора может не сходиться или сходиться к другой функции. Пример такого поведения дает функ- ция f(x) — 0 при х — 0 и f(x) — exp {-1/я2} при х / 0. Эта функция представлена на рис. 6.19. Такие функции иногда называют очень плоскими. Рис. 6.19. Пример очень плоской функции Можно проверить, что все произ- водные этой функции при х = 0 равны нулю. Следовательно, ряд Тейлора 0 + 0«2:-|-0-2:2-|-0-2:3 + ... сходится, но не к функции f(x). Следует подчеркнуть, что здесь мы сталкиваемся с важ- ным изменением точки зрения на проблему анализа нелинейных систем, также связанную с иссле- довательской программой А. Пу- анкаре. До начала XX в. большое внимание уделялось сходимости рядов, соответствующих изучаемым объектам. Было построено несколько убеди- тельных примеров, показывающих, что многие действия с расходящимися рядами некорректны. А. Пуанкаре обосновал использование асимптоти- ческих рядов, которые не сходятся к изучаемой функции при неограни- ченном увеличении числа членов при фиксированном малом параметре, однако у которых первые к членов дают описание изучаемого объекта при стремлении малого параметра к 0.
Математические модели теории катастроф 161 Возник вопрос, в какой мере и когда первые к членов ряда Тей- лора, или, как их часто называют, к-струи, характеризуют исследуемые функции. Рассмотренная теория в простейшем случае дает ответ на не- го. Простота и упорядоченность, которую в ряде случаев вносит в мир нелинейных явлений теория катастроф, связана с тем, что разные объ- екты локально характеризуются одними и теми же Л-струями, либо их аналогами, зависящими от параметров. Доказанная теорема дает классификацию гладких функций /(ж) в окрестности любой данной точки. С другой стороны, она кажется очевидной, — качественное поведение функции определяется первым неисчезающим членом ряда Тейлора. Кажется, что так же дело обстоит и в случае функций нескольких пе- ременных. Но это не так. Это можно продемонстрировать на следующем примере. Рассмотрим функцию f(x, у) = х2у. Эта функция принимает нулевое значение вдоль двух прямых х = 0 и у = 0. А теперь рассмот- рим функцию д(х, у) = х2у 4- ej/2*+1, где значение е может быть сколь угодно мало, а к сколь угодно велико. Функция д(х, у) ведет себя со- вершенно иначе. Она обращается в ноль только вдоль прямой у = 0. Вопрос о том, сколько членов ряда Тейлора необходимо взять, чтобы получить информацию о качественном поведении функции нескольких переменных, является достаточно сложным. Он решается в теории ка- тастроф и требует развития оригинального математического аппарата. Однако в некоторых важных частных случаях ответ оказывается достаточ- но простым. Рассмотрим функцию нат. Если 22/(0) / 0, т. е. хотя d/(0)/dzi, • • •, df(ty/dxn отлична локально представляет собой уча- сток плоскости и после заме- ны переменных может быть приведена к виду / = щ + С (см. рис. 6.18). Точки гладкой функции /: Rn -> R, в которых 2)/(0) = О, или в координатной записи g/(0)_______9/(0) дх\ дхп .. ,хп) в окрестности начала коорди- бы одна из частных производных от нуля, то функция f(x\, ..., хп) Рис. 6.20. Примеры критических точек функции одной переменной будем называть критическими. Значение функции в критической точке будем называть критическим значением. Геометрически сформулированное условие означает, что в критиче- ской точке касательная плоскость (или прямая при n = 1) горизонтальна. В одномерном случае критические точки могут быть минимумами (до- статочное условие df /дх — 0, д2 f /дх2 > 0), максимумами (df /дх = 0, д2 f /дх2 < 0) и точками перегиба — соответственно, точки А, В, С
162 Глава 6 Рис. 6.21. Простейшие критические точки функции двух переменных на рис. 6.20. В двумерном случае наиболее распространенными кри- тическими точками являются максимумы, минимумы, седла. Примеры таких критических точек дают, соответственно, функции / = -х2 - у2, Рис. 6.22. Функция, называе- мая желобом. Критические точки составляют здесь це- f = х2 + у2, f = х2 - у2 (см. рис. 6.21 а, б, в). Однако могут существовать и более сложные критические точки. Пример таких точек да- ет функция f = х2, которую часто называют желоб. Название ясно из рис. 6.22. Все пере- численные критические точки, кроме желоба, были изолированы, — в их окрестности не бы- ло других критических точек. В случае желоба критические точки составляют целую прямую. Если потенциал определяется желобом, то точ- ка в фазовом пространстве, определяющая со- стояние системы, находится в безразличном лую прямую равновесии. Возможны и другие, более слож- ные типы особых точек. Кажется естественным, что в типичных случаях, возникающих при моделировании различных систем, должны возникать простейшие кри- тические точки, — максимумы, минимумы и седла. Утверждение, на- зываемое леммой Морса, формулирует достаточные условия, при которых возникают такие критические точки. По существу, она обобщает достаточ- ные условия максимума и минимума гладкой функции у = у(х) на случай нескольких переменных. Кроме того, она позволяет приводить опреде- ленный класс функций вблизи критических точек к каноническому виду. Введем следующее определение. Определение. Функция f имеет в точке и невырожденную критическую точку, если Df(u) = 0, и квадратичная форма D2f(u), которую определяют вторые производные функции f : п 02f(u) XiXj dxtdxj ’ невырождена.
Математические модели теории катастроф 163 Другими словами, ранг этой квадратичной формы равен п или матрица 02/(u) dx] dxidxn Я/(и) = дхпдх\ дх3 невырождена, и, в частности, имеет ненулевой детерминант detHf (и) 7^0. Последнюю матрицу называют также матрицей Гессе. Отметим, что этим условиям удовлетворяют максимумы, минимумы и седла, формулы кото- рых были приведены выше, и не удовлетворяет желоб. Лемма Морса. Пусть и — невырожденная критическая точка гладкой функции f: R” —> R. Тогда в некоторой окрестности точки и можно указать систему координат у\,... ,уп, yi(u) = 0, 1 i п такую, что f = f(u) ~ У\ ~ ~ У1 + У1+1 + • • • + Уп- Можно перенести начало координат в и и считать, что и = 0. Не ограничивая общности, будем полагать, что /(«) = /(0) = 0. Тогда в некоторой окрестности нуля, в соответствии с леммой 1, функцию / можно представить в виде п f(x) = 52 ;=1 Поскольку точка критическая, D/(0) = 0, следовательно, pj(O) = df(0)/dXj = 0. Тогда, в соответствии с той же леммой, существуют гладкие функции : п 9j(x) = xihij (®)« 1=1 Следовательно, п /(я) = xixjhij(x)‘ (6.19) Дифференцируя два раза равенство (6.19) по Xi и по Xj, убедимся, что в начале координат д2 л = dxidxj 3 По условию леммы, матрица Hij является невырожденной. Сделаем преобразование, не меняющее квадратичную форму, но де- лающее соответствующую матрицу симметричной:
164 Глава 6 Будем действовать в точности так же, как при приведении квадратичной формы к каноническому виду. Перенумеровав координаты или повернув систему координат, если необходимо, добьемся, чтобы верхний диаго- нальный элемент был отличен от нуля, Яц j=_ 0._____ Возьмем функцию д(щ,..., ип) = ^/|Яц(«1,...,un)| и сделаем за- мену переменных \ ^Ян(ц1,... ,цп)\ Нп(щ,...,ип) /’ Vi = Ui при г > 2. Матрица Якоби этого преобразования в точке щ =... = ип = 0 имеет вид z \ / х ... , Un) P1(U1,... ,ип) .... 9\(щ,...,ип)——------------- Яц(иь ..., ип) 0 1 о ...... 1 th =Pl(Ul,..-,«n)( Ui + Видно, что детерминант этого преобразования отличен от нуля, поэтому замена переменных является гладкой и невырожденной. Это гарантирует теорема оо обратной функции. После этой замены переменных функция f будет приведена к виду / = + 52 ViVjH'i^Vi, ..., vn). i,j^2 Знак при vj будет таким же, как у Нц(щ,..., ип). Можно непосредственно проверить, что матрица H-j является также невырожденной. Вновь делаем такие же замены переменных, как при приведении обычной квадратичной формы к каноническому виду u'i =vit v'j = Vj (j > 2). Действуя таким же образом вплоть до г = п и перенумеровывая перемен- ные, приводим функцию f к виду / ~ Z\ + • • • + Zn-l ~ zn-i+i ~ — zn- (6.20) Это равенство справедливо в окрестности начала координат, где локальное существование обратной функции гарантирует теорема об об- ратной функции. Функция (6.20) называется морсовским 1-седлом. Если I = п, то это седло определяет максимум, если 1 = 0 — минимум.
Математические модели теории катастроф 165 Итак, любую функцию вблизи критической точки, в окрестности которой невырождена матрица вторых производных, можно привести к виду морсовского седла. При этом она будет правоэквивалентна исход- ной функции. Если матрица вырождена, то все зависит от ранга этой матрицы. Вид функции в этом случае определяется утверждением, называемым леммой расщепления. Лемма. Пусть гладкая функция f: R” -> R имеет критическую точку в начале координат, в которой матрица Гессе имеет ранг г. Тогда вблизи начала координат функция f правоэквивалентна функции ±x2t ±... ± х2 + f(xr+i,, хп), где f: Rn-r -> R, некоторая гладкая функция. Доказательство этого утверждения в основных чертах аналогично доказательству леммы Морса. Введенное понятие правоэквивалентности позволяет ввести, опира- ясь на приведенный пример, важное понятие структурной устойчивости. Часто соображения структурной устойчивости позволяют делать заключе- ния о том, чего «не может быть» в изучаемой системе. Основой современного естествознания является требование повто- ряемости эксперимента. В тех областях знания, где постановка экспери- мента затруднена или принципиально невозможна, таких как история, экономика, социология, психология, ряд задач экологии, часто возникают серьезные проблемы. В них намного сложнее предложить содержательные математические модели, чем в традиционных областях. Вместе с тем, обес- печить в точности те же условия эксперимента не удается даже в самом благоприятном случае. Поэтому требование повторяемости подразумева- ет нечувствительность к малым возмущениям, которые могут меняться от эксперимента к эксперименту. Естественно, такой нечувствительно- стью должна обладать и математическая модель. При этом устойчивые свойства, которые могут быть наблюдаемы при повторных экспериментах в математических теориях называют грубыми или структурно устойчивыми. При построении математической модели конкретного явления надо решить, какие возмущения допустимы и какие изменения в поведении системы мы будем игнорировать. В теории катастроф обычно допускаются малые гладкие возмущения потенциала и требуется, чтобы получившаяся система была правоэквива- лентна исходной. (Далее мы познакомимся с другим типом эквивалентно- сти, охватывающим семейства функций.) Обратим внимание на то, что здесь уже на этапе выбора типа модели мы используем идеализацию, — считаем, что и сами функции, и их возмущения должны быть гладкими. И в каждом конкретном случае надо решать, насколько приемлема эта идеализация. Отметим, что взятая наугад функция, вообще говоря, не должна быть гладкой. Существует большой класс непрерывных функций, нигде не име-
166 Глава 6 ющих производной, которые сейчас широко используются в различных областях естествознания. Приведем примеры структурной устойчивости и структурной не- устойчивости. Будем вновь рассматривать малую окрестность начала ко- ординат. Естественно считать, что функция р мала, если она мала вместе со всеми ее производными. Для простоты вначале положим Рр(0) = 0. Рассмотрим, как дей- ствует такое возмущение на морсовскую функцию /. В морсовской особой точке detНf (0) 0 (Я, как и раньше — матрица вторых про- изводных, или матрица Гессе). Если возмущение р достаточно мало, то det Я(/(0) 4-р(0)) 0, поскольку определитель является непрерывной функцией. Следовательно, f 4- р также является морсовским седлом. Имея в виду малость функции р и процедуру приведения к каноническо- му виду, читатель может проверить, что это не меняет тип седла (число I в формуле (6.20)). Если отбросить условие Dp(Q) = 0, то морсовская точка в начале координат перестанет быть критической, но вблизи возникнет другая критическая точка того же типа. Не доказывая это, приведем примеры. Пусть / = х2, /'(0) = 0, /"(0) 0, р = 2ех, € < 1 f 4- р = х2 4- 2ех = (х 4- е)2 - е2. Функция f +р имеет минимум в точке [(ж 4-е)2 -г2]' = 2(х + е); х = -е. Смещение гладко зависит от е, но точка не меняет своего типа. Совершенно другую картину мы видим, если точка неморсовская. Пусть f = х\ /(0) = 0, /"(0) = 0 f 4- р = х3 4- Зех, (f 4- р)' = Зх2 4- Зе = 3(ж2 4- е). При е < 0, х = ±\/Й, (/ 4-р)" = /"(+ УЙ) + р"(УЙ) = бУЙ > о, /"(- УМ) +₽"( - УЙ) = -бУЙ < о. Таким образом, критическая точка х3 при возмущении р = Зех распалась при е < 0 на две морсовские точки — максимум и минимум. Следовательно, она структурно неустойчива. В теории катастроф доказывается, что критическая точка структурно устойчива тогда и только тогда, когда она невырождена. Таким образом, каждая вырожденная точка структурно неустойчива. Поэтому, казалось бы, такое экзотическое неустойчивое явление, как вырожденные критиче- ские точки, не заслуживает подробного изучения и не должно возникать при моделировании конкретных явлений. И действительно, это так — в случае отдельных гладких функций вырожденных критических точек быть не должно. Однако в случае семейств функций дело может обстоять совершенно иначе. Одним из наиболее эффективных методов анализа нелинейных си- стем является бифуркационный анализ — выяснение того, как меняется
Математические модели теории катастроф 167 поведение системы при изменении ее параметров. Центральный момент в теории катастроф — изучение не отдельных функций, а семейств гладких функций, зависящих от параметра. Определение эквивалентности семейств получается как естественное обобщение понятия правоэквивалентности. Напомним, что две функ- ции fug: Rn -> R правоэквивалентны вблизи начала координат, если существует локальный диффеоморфизм у(х): Rn -> Rn и «сдвигающий» член 7, такой, что д(х) = f(l/(x))+7- (6.21) Будем рассматривать семейства функций f(x, А) и д(х, A): Rn х Rr —> R, в которых переменная х принадлежит пространству R”, параметр А — пространству Rr. Вместо отдельного диффеоморфизма у, фигурирующего в формуле (6.21), вводится семейство диффеоморфизмов ух(х), гладко зависящих от параметра А. Кроме того, вместо одной постоянной 7 необходимо ввести семейство функций 7(A) (Rr -> R). Введем также диффеоморфизм д = д(А) (Rr —> Rr), отражающий возможность замены переменных в пространстве параметров. Определение. Назовем два семейства функций f(x, А) и д(х, А) эквива- лентными , если существуют функции р,у,^, определенные в некоторой окрестности нуля, такие, что д(х, А) = /(ул(г),д(А)) +1(А). f(x, А) = const 9 (2/, д) = f (Ух(х), /х(А)) + 7(A) = const Рис.6.23. Пример двух эквивалентных семейств функций Рисунок 6.23 иллюстрирует геометрический смысл введенного опре- деления. Здесь пространства переменных у: Rn и параметров Rr одномер- ны. На рис. 6.23 слева представлены линии уровня семейства функции /: f(x, А) = const и справа — семейства функций д: д(у,р) = const. Эти функции эквивалентны. Отображение р(Х) сжимает или растягивает представленный набор линий уровня вдоль оси абсцисс. Это преобразование переводит вер- тикальные линии А = const (см. левую часть рис. 6.23) в вертикальные
168 Глава 6 линии д(А) = const (правая часть того же рисунка). Отображение ух(х) определяет деформацию этой картины вдоль оси ординат. Можно представить себе часть пространства х Rr как резиновый куб, в котором существуют поверхности уровня f(x, А) = const. Функции /х(А) и ух(х) определяют деформацию этого куба. При этом не проис- ходит разрывов, и близкие вначале точки остаются близкими и после деформации. Итак, взятая наугад критическая точка будет невырожденной. Свой- ства, которыми обладает взятая наугад функция из данного класса, назы- вают типичными. Введенные определения позволяют сформулировать фундаменталь- ный результат теории катастроф — классификационную теорему Тома. Теорема Тома. В типичном случае г-параметрическое семейство гладких функций Rn -> Rn для всякого п и всех г 5 структурно устой- чиво и эквивалентно (в смысле введенного выше определения) вблизи некоторой точки одной из следующих форм'. некритическая щ, невырожденная критическая или морсовская и । 4~ ... “И tig tig-_|_| ... ttgj (0 i ti), касн .дные катастрофы: Ai складка и\ -I- Ajtii 4- (Af), A3 сборка ±(tij 4- Аги^ 4- Aitti) 4- (Af), A4 ласточкин хвост и\ 4- AjttJ 4- A2U? 4- Ajtii 4- (Af), Л 5 бабочка ±(U] 4- Адц? 4- Аз«{ 4- Хги\ 4- Aitij) 4- (Af), Ав вигвам u\ 4- Asti, 4- Ади} 4- Хзи\ 4- Хги\ 4- Aitii 4- (Af), омбилические катастрофы: эллиптическая омбилика u\ui - и* 4- Ajti? 4- А2Ц2 4- Aittj 4- (АГ), Df гиперболическая омбилика и\иг 4- 4- Аз«? 4- А2Ц2 4- Aitij 4- (2V), Z>5 параболическая омбилика ±(и?Ц2 4-«2 4-АдЦ2 4-Ази?4-А2М2 4-А1Ц1)4- (АГ), Р6 вторая эллиптическая омбилика и\иг - и\ 4- A5U2 4- Адц^ + Аз^} 4- A2U2 4~ Ajи 1 4- (АГ), вторая гиперболическая омбилика и\и2 4- и\ 4- А5И2 4- Адг^ 4- Аз«} 4- A2W2 4" Ajiti 4- (АГ), символическая омбилика ±(u] + U2 + X5UiU2 + X4U2 + X3U\U2+X2U2 + А1Щ)4-(АГ), где (tti,..., ип) € Rn, (Ai,..., Аг) € Rr, символ М обозначает морсов- скую функцию вида и] 4-... 4- и] - ti,?+1 - ... - и„, (1 г n), N — функцию вида и] 4-... 4- и] - tij+1 - ... - и^, (2 г п). Первые семь катастроф из этого списка, в которые не входит пара- метр А5, носят название элементарных катастроф.
Математические модели теории катастроф 169 В списке катастроф фигурирует некоторый потенциал, не завися- щий от параметров, который принято называть ростком катастрофы, и функция, зависящая от параметров и называемая возмущением. Каждая из элементарных катастроф детально исследовалась. Хотя нельзя построить такие же простые наглядные картинки, как при анализе складки и сборки, если число параметров более двух, качественная картина и в этом случае подробно описана. Наличие такого принципиального обобщающего результата позволяет использовать теорию катастроф при математическом моделировании на нескольких уровнях. На первом уровне, в тех случаях, когда модель имеет вид (6.1) и число управляющих параметров невелико, можно воспользоваться стандартны- ми результатами теории. Типичный пример такого плана — классическое описание фазовых переходов. При термодинамическом описании уравнение состояния веще- ства задает некоторое n-мерное многообразие в 2п-мерном пространстве. Первые п переменных ж,, 1 i п, в этом пространстве характеризуют интенсивные, вторые — At, 1 < i п — экстенсивные термодинами- ческие параметры. Экстенсивные переменные определяют управляющие параметры, интенсивные — переменные состояния. Для описания физи- ческой системы вводится семейство потенциальных функций, зависящих от параметров V(x, А). Предполагается, что состояние функции описы- вается критическим значением переменной х, минимизирующим этот потенциал. То есть при описании изучаемого объекта следует изучать те критические точки 3V Л — = 0, 1 < I п, dxi которые являются локально устойчивыми, матрица Гессе в них д^у_ dxidxj должна быть положительно определенной. При этом фазовым переходам соответствует переход с одной ветви, характеризующей состояния равновесия, на другую при изменении неко- торого параметра А. Если следовать принципу максимального промедле- ния, то фазовые переходы будут происходить, когда кривая, описывающая изменение состояния системы при варьировании параметров, будет пере- секать компоненту бифуркационного множества, на которой рождаются или исчезают локальные минимумы (как в задаче о качалке). Можно сказать, что при этом система «локально минимизирует» потенциальную функцию. Такое поведение иллюстрирует рис. 6.24 о. Однако, если в исследуемой системе уровень шума достаточно вы- сок (детальное описание флуктуаций требует более сложной модели, чем уравнение (6.1)), то система имеет возможность «оценивать» не только локальный минимум, в котором находится, но и близкие значения по- тенциала, где могут быть свои минимумы. При этом может происходить
170 Глава 6 v vviyj м Рис. 6.24. Во многих физических задачах параметры, при которых происходят ката- строфические скачки, определяются не принципом максимального промедления (а), а принципом Максвелла (б) не локальная, а глобальная минимизация. Состояние системы при этом будет определяться глобальным минимумом потенциальной функции. Ти- пичное поведение системы в этом случае представлено на рис. 6.24 б. Это приближение, часто используемое в теории фазовых переходов, называ- ется принципом Максвелла. При описании фазовых переходов второго рода широко используется модель Гинзбурга—Ландау. Она определяется потенциалом V(x, а) = ^х4 4- ^ах2, (6.22) где х — некоторый параметр порядка, описывающий состояние системы, а — бифуркационный параметр, имеющий смысл отклонения темпера- туры Т от критического значения Тс. Бифуркационная диаграмма в этом случае фигурирует в табл. 5.1 (см. гл. 5). Этот «трезубец» с точностью до изменения направления оси абсцисс является таким же, как в задаче о прогибе колонны. Потенциал (6.22) описывает систему, инвариант- ную относительно изменения знака х. Однако существуют физические процессы, нарушающие эту симметрию. Тогда приходится иметь дело с потенциалом х4 х2 V(x,a,b) = — + а—+ Ъх. (6.23) Этот потенциал совпадает с катастрофой сборки и нелинейные эф- фекты в такой системе будут такими же, как в задаче о качалке или о машине Зимана. Другими словами, задача свелась к ранее изучен- ной. Некоторые отличия могут возникнуть, если, исходя из физических особенностей задачи, придется исходить не из принципа максимального промедления, как обычно, а из принципа Максвелла.
Математические модели теории катастроф 171 Однако при описании фазовых переходов первого рода приходится иметь дело с еще более общим потенциалом ж6 ж4 х3 х2 V(x, a, b,c,d) = — + а— 4- Ъ— 4- с— 4- dx. Однако этот потенциал определяет не что иное, как катастрофу «ба- бочка» А5, подробное описание которой имеется в учебниках теории катастроф. Итак, на первом уровне математические модели различных нели- нейных систем удается сопоставлять с уже изученными моделями теории катастроф. В ряде случаев это позволяет в ряде областей обнаруживать новые эффекты. Однако во многих дисциплинах, в частности, в термодинамике, тео- рии упругости, физике лазеров, теории устойчивости кораблей принци- пиальные проблемы были решены без привлечения представлений теории катастроф. Однако общая теория позволяет сформулировать обнаруженные за- кономерности в наиболее простом и ясном виде. Кроме того, появляется возможность выделить общие качественные черты различных нелинейных систем. Можно отнести такие работы ко второму уровню. Третий, наиболее глубокий и интересный уровень связан с анали- зом более сложных объектов, требующих выхода за рамки элементарной теории катастроф. Это часто требует как создания новых моделей, так и развития математического аппарата. Вопросы и задачи 1. Рассмотреть бифуркационное множество для катастрофы ласточкиного хвоста х5 х3 х2 V(x, а,Ъ,с) = —+ а— 4- Ь— 4- сх. Где в окрестности точки х = 0 имеют место складки и сборки? Как вы представляете бифуркационное множество в пространстве параметров а, Ь, с? В каких физических задачах, по вашему мнению, могла бы возникнуть такая катастрофа? 2. Для описания фазовых переходов Ван дер Ваальсом было предложено фено- менологическое уравнение состояния (р+£)(Г-0) = ЯТ. Здесь Р, V и Т — давление, объем и температура среды, R — постоянная. Иногда вместо объема рассматривают плотность р = 1/V. Эксперименты показывают, что если температура меньше некоторой крити- ческой Тс, то имеются давления, при которых возможны несколько значений плотности. В таких системах возможны скачки — трудносжимаемая жидкость внезапно становится легкосжимаемым газом. Описывает ли такое поведе- ние модель Ван дер Ваальса? Будем рассматривать температуру и давление
172 Глава 6 в качестве переменных управления, а плотность — переменной состояния. Имеет ли здесь место катастрофа? Каково критическое значение Тс? Мож- но ли эту модель локально привести к некоторому каноническому виду? 3. Поставим пустую кастрюлю на солнце. Попадающий в нее свет отражается от ее цилиндрических стенок и дает каустику. Каков вид этой каустики? Каково ее уравнение? 4. Почему мы видим радугу? Почему при наблюдении с самолета мы видим ее как круговую полосу, а не как дугу? Можем ли рассматривать ее как каустику? Исследовать геометрию параллельных лучей с одинаковой длиной волны, падающих на капельку. 5. Во многих задачах акустики, волновой оптики, квантовой механики возни- кают аналогичные дифракционные картины. Это связано с тем, что решения этих уравнений часто представляют собой быстро осциллирующие интегралы и(х,т) — J е,т^х’а^а(х, а, т) da, G где т — большой параметр, а интегрирование ведется по некоторой обла- сти G. В ряде случаев интеграл аппроксимируют суммой Г 52 ехР {*ту>(а:, aj(®))}a(«, afa), т), >=i где Q),..., аг(х) при данном х являются решениями уравнения д t ч Л Почему такая аппроксимация часто оказывается применима? Какова типич- ная картина, если аь ..., ат(х) — морсовские особенности? 6. Доказать, что при центральном проектировании двойное отношение остается инвариантом. 7. В некоторых случаях дикие пчелы не образуют колоний. В других — об- разуют колонии, в которых живут десятки тысяч особей. Промежуточных вариантов практически нет. Объяснить это явление, считая, что плотность пчел должна поддерживаться на уровне В пчел/км2. Считать, что колония живет в области, имеющей форму круга радиуса R. Число пчел N ~ тгЯ2В. Время, затрачиваемое на полет «из центра» и обратно Продуктивность отдельной пчелы принять равной P(R) = с — AR/В. Считать, что выигрыш от кооперации S(R) определяют функцией, для которой dS/dR > 0 при R = Rmin и limdS/d# = 0 при R -> оо. Рассмотрите функцию полезности F(R) = P(R) + S(R) и выясните, с какой катастрофой мы имеем дело в этом случае. 8. Энергия системы, представляющей собой жесткий стержень, опирающийся на шарнир без трения с пружинками в плоскостях ху и xz, определяется потенциалом (модель Аугусти) и = а(х2 + у2) -I- Ь(х4 + у4) + сх2 у2, где х и у — перемещения конца стержня. Возможны ли в такой системе катастрофические скачки («катастрофическое прощелкивание»)?
Математические модели теории катастроф 173 Рекомендуемая литература Элементарное введение в теорию катастроф и ее приложения со множеством примеров и иллюстраций дает книга: Постон Т., Стюарт И. Теория катастроф и ее приложения. М.: Мир, 1980. Изложение в этой книге начинается с базовых представлений линейной алгебры, аналитической геометрии, математического анализа. Рассмотрены приложения к теории устойчивости судов, двумерные течения жидкости, гео- метрическая и волновая оптика, теория упругости, физика лазеров и большой круг задач, связанных с мягким моделированием. Более сложный учебник, раскрывающий математические особенности теории и важные приложения к задачам аэродинамики, климатологии, квантовой меха- ники, см.: Гилмор Р. Прикладная теория катастроф. М.: Мир, 1984. Т. 1, 2. Особенность этой книги состоит в том, что в ней рассматривается переход от теории катастроф к теории бифуркаций, которая позволяет исследовать более сложные математические модели, которые не описываются некоторой потенциальной функцией. Следующая книга рассматривает приложения теории катастроф к задаче анализа крупномасштабного распределения вещества во Вселенной, проблемам оптими- зации, задаче об обходе препятствия: Арнольд В. И. Теория катастроф / 5-е изд. Сер.: «Синергетика: от прошлого к будущему». М.: URSS, 2009. В ней также обсуждаются глубокие связи теории с другими разделами современной математики. Более строгие математические подходы предлагают книги: Брус Дж., Джиблин П. Кривые и особенности. М.: Мир, 1988; Брекер Т., Ландер Л. Дифференцируемые ростки и катастрофы. М.: Мир, 1977. Изложение строгих результатов теории дает книга: Арнольд В. И., Варченко А. Н., Гусейн-Заде С. М. Особенности дифференциру- емых отображений. М.: Наука, 1981.
Escher M.C. Waterfall. 1961 Эшер M. К. Водопад
Плава 7 Простейшие системы с дискретным временем Каждой эпохе воздадим по заслугам! Новое время также имеет блестя- щие достижения. Р. Шуман Еще не так давно казалось, что более глубокое понимание нелиней- ных явлений будет связано с анализом все более сложных математических моделей. И тем более поразительно, что крупные успехи в изучении нели- нейных систем, в предсказании новых эффектов, были достигнуты в ходе исследования вызывающе простых математических моделей — одномерных отображений, зависящих от параметров: яп+1 = f(xn, Л) = х, п = 1,2, 3,... (7.1) Явная формула (7.1), задающая одномерное отображение, позволяет по числу хп определить следующее число zn+i и таким образом определяет всю последовательность {а:п}. Можно сказать, что соотношение (7.1) соответствует некоторому итерационному процессу. Поэтому последовательность чисел {а:п} часто называют итерациями начальной точки х'. Простейшие отображения вида (7.1) были известны еще Евклиду и Архимеду. При f(xn,X) = Ххп соотношение (7.1) определяет геомет- рическую прогрессию со знаменателем А. При f(xn, А) = А 4- хп — арифметическую прогрессию. Однако если f(x, А) — простейшая нелинейная функция аргумента х, например, квадратичная парабола, то свойства последовательности {жп} могут оказаться совершенно необычными. Принципиальный шаг в их понимании был сделан в 70-х гг. и оказался возможным благодаря ис- пользованию компьютеров. В настоящее время одномерные отображения выступают, с одной сто- роны, как упрощенные модели множества различных процессов, с другой
176 Глава 7 стороны — как язык, на котором можно говорить о многих сложных явлениях. Исследование одномерных отображений позволило ввести новые понятия, применимые к большому классу диссипативных систем, об- наружить ряд новых явлений, ответить на несколько принципиальных вопросов. Как происходит переход от простейших упорядоченных к ха- отическим режимам при изменении параметров? Как чередуются в про- странстве параметров области, в которых наблюдаются порядок и хаос? Как происходит усложнение упорядоченности при изменении парамет- ра? Каковы простейшие типы хаоса в открытых нелинейных системах и способы их описания? Приведем несколько типичных ситуаций, в которых одномерные отображения выступают как математические модели либо возникают при численном решении уравнений. Отображения как модели процессов с дискретным временем Выше мы обсуждали свойства нелинейного дифференциального урав- нения, называемого логистическим уравнением. В этой модели время t считается непрерывным. Эта переменная может быть любым действи- тельным числом в интервале 0 t < оо. Численность популяции x(t) предполагается непрерывной и дифференцируемой функцией этого аргу- мента. Пи существу, мы неявно подразумеваем, что у нас есть возможность в любой момент времени измерить величину x(t) и сравнить ее с пред- сказаниями модели. Но возможна совершенно иная ситуация. Допустим, что существует возможность оценить численность популяции только раз в год. Тогда есте- ственно временную переменную считать не непрерывной, а дискретной. Например, такой, которая может принимать только целые действитель- ные значения п = 1,2,... Численность популяции тогда будет выражаться функцией дискретного аргумента х(п) или, как ее часто обозначают, хп. Последовательность Xi, Х2,... для краткости будем обозначать {жп}. Можно считать, что хп — численность популяции в год с номером п. По-видимому, среди чисел хп есть какая-то закономерность. Естественно ожидать, что численность популяции в данный год хп+\ зависит от того, сколько животных было год назад, т. е. от величины хп. Таким образом, в простейшем случае (когда величина zn+i зависит только от численности в предыдущий год, а не от жп-1,жп-2, и т.д.) мы приходим к математи- ческой модели вида (7.1). В этой модели f — непрерывная однозначная функция своих аргументов, Л — параметр, который зависит от того, ка- кую конкретную задачу мы рассматриваем, х' — начальное значение, — первый член в последовательности {жп}. Часто используется функция f вида Xx(N - х): ®п+1 — Xxn(N 0 Хп N. (7.2) Эта зависимость выбирается из тех же соображений, что и правая часть в логистическом уравнении. Формула (7.2) показывает, что если XN > 1,
Простейшие системы с дискретным временем 177 то численность вида растет, пока она мала хп N. В силу ограниченно- сти ресурсов численность животных начинает убывать, когда животных становится слишком много. Так же, как в логистическом уравнении, это учитывается с помощью ограничивающего квадратичного члена. Удобно сделать замену переменных хп = x’nN, Л = A'/N. При этом формула (7.2) приобретает вид 4+1 = А'4(' -х'п), 0^хпЩ. (7.3) В дальнейшем штрихи у новых переменных будем опускать. Отобра- жения (7.2) и (7.3) часто называют логистическим отображением. Нас интересует вопрос о том, что произойдет с различными вида- ми по прошествии достаточно долгого времени, т. е. каковы аттракторы изучаемого отображения. Для ответа на него в этой простейшей моде- ли достаточно выяснить, какой будет последовательность {жп}, п —> оо при различных значениях А. Отображения вида (7.1) в настоящее время используют при феноменологическом описании ряда процессов в эконо- мике, гидродинамике, электронике, в других областях. Отображения, возникающие в результате применения метода Эйлера к дифференциальным уравнениям Обсуждая линейные дифференциальные уравнения, мы рассмотре- ли модель Мальтуса, в соответствии с которой численность популяции должна неограниченно расти. Для того чтобы учесть ограниченность ре- сурсов, доступных популяции, и внутривидовой отбор, естественно ввести нелинейный ограничивающий член. Это приводит к уравнению =аЛГ(1 - N). dt Мы выбрали единицы измерения так, чтобы за единицу была взята предельная численность популяции. При 0 < N(Q) < 1, N(t) -> 1 при t оо. В этом нетрудно убедиться, проводя качественное исследование этой модели. Неподвижная точка N = 0 является неустойчивой, точка N = 1 — устойчивой. Применим к этому уравнению метод Эйлера "(№+'>г|-№^мо-№>) Т и введем обозначения N(kr) = Nk, Nk+i = yNk - 8N^, у = ат+\, 8 = ат. Следовательно, мы вновь получаем одномерное отображение (7.3). Как мы убедимся далее, его свойства похожи на свойства дифференци- ального уравнения только при небольших т. Когда шаг по времени т превышает некоторое критическое значение, поведение этих двух объек- тов начинает качественно отличаться.
178 Глава 7 Отображения, возникающие при численном решении нелинейных алгебраических уравнений Стандартным методом численного решения нелинейных алгебраиче- ских уравнений вида х = F(x) является построение последовательности {жп}, сходящейся к его кор- ню х*. Это можно сделать с помощью метода простой итерации (рис. 7.1 а) 3?п+1 — F(Xn), либо метода Ньютона (рис. 7.10 F(xn) Как мы видим, в обоих случаях возникают одномерные отображения. Рис. 7.1. Графическое изображение итерационного процесса, применяемого для решения нелинейных алгебраических уравнений: а) метод простой итерации; б) метод Ньютона Построение отображения как способ обработки экспериментальных данных Пусть мы наблюдаем за каким-либо сложным процессом, развива- ющимся во времени и характеризующимся функцией x(t). Поступим следующим образом. Выделим локальные максимумы функции x(t). Пер- вый максимум обозначим через М\, второй через М2, Л-й через Мк (см. рис. 7.2 а). Первый максимум достигается в момент t\, второй в мо- мент <2 и т.д. На плоскости {Мк, Mt+i} будем откладывать точки с ко- ординатами (Мк, Mk+i), т. е. первая точка будет (Mi,Mi), вторая — (М2,М3) и т.д. (см. рис. 7.2 0. Оказывается, для некоторых колеба- тельных химических реакций, математических моделей гидродинамики
Простейшие системы с дискретным временем 179 Рис. 7.2. Одномерное отображение может возникнуть при анализе экспериментальных данных: а) выделение локальных максимумов в зависимости x(t)\ б) характерный вид отображения, возникавшего при анализе колебательных химических реакций с хаотическим поведением и ряда других систем точки {М^, Мк+\} с высокой точностью ложатся на однозначные непрерывные кривые Мп+\ = Типичный вид отображения, возникающего в натурном эксперименте по исследованию колебательных химических реакций с хаотическим поведением, представ- лен на рис. 7.2 б. Наличие такой функции f позволяет в ряде случаев строить простые феноменологические модели изучаемых явлений. Такие модели, в частно- сти, дают возможность по предыдущим значениям локальных максимумов предсказывать следующие, т. е. прогнозировать дальнейший ход процесса, исходя из его предыстории. Существование кривой f показывает, что в системе происходит самоорганизация: ее динамика эффективно описывается дискретной ди- намической системой всего лишь с одной степенью свободы. В обсуждаемом случае мы можем предсказать величину Мп+\, если известен максимум Мп и отображение /, однако одномерное отображе- ние не позволяет узнать момент tn+i. В некоторых системах, напротив, интервалы времени Д£п = in+i — tn, через которые функция x(t) достигает локальных максимумов, с высокой точностью определяются некоторым отображением Д£п+1 = ^(Д/П)« Естественно, в общем случае при анализе экспериментальных данных точки (Мп,Мп+\) заполняют целые области на плоскости {Мп, Mn+i}. Поэтому если какие-то экспериментальные данные определяют одномер- ное отображение, то это следует рассматривать как большую удачу. Сценарий Фейгенбаума Анализ логистического отображения позволил выяснить многие об- щие свойства одномерных отображений. Рассмотрим более подробно эту математическую модель.
180 Глава 7 При небольших значениях Л (0<А< 1) хп -> 0 при п -> оо независимо от выбора аи. Поведение последовательности в этом и в других случаях удобно представлять графически. Нарисуем кривую у = f(x) при выбранном значении Л и пря- мую у = х (рис. 7.3). Отложим zi по оси абсцисс, проведем вертикаль до пересечения с кривой у = f(x) (точка А), затем из нее — горизон- Рис. 7.3. Графическое представление по- следовательности {хп} для логистическо- го отображения в том случае, когда хп -> 0 при п -> оо таль до пересечения с линией у = х (точка В). Теперь вновь проведем вертикаль до пересече- ния с осью х. Полученную точ- ку пересечения обозначим че- рез Х2. Легко проверить, что Х2 = /(®i). Взяв точку Х2 за на- чальную и повторив все те же операции, получим хз, затем яд и т. д. Эта процедура называет- ся построением лестницы Ламе- рея. Она позволяет графически находить члены последователь- ности {жп}. Из рис. 7.3 видно, что хп -» 0 при п —> оо. Из формулы (7.3) следует, что функция f(x) переводи отрезок [0,1] в отрезок [О, А/4]. Если А 4, то все значения хп лежат на отрезке [0,1] при условии, что 0 < х\ < 1. Именно поэтому говорят, что формула (7.3) задает отображение отрезка в себя. Пусть теперь А немного больше единицы. При этом последователь- ность {жп} ведет себя по-другому (рис. 7.4): {а?п} стремится к постоянному значению х* > 0. В применении к исходной биологической задаче это означает, что численность такого вида по прошествии нескольких лет стабилизируется и перестанет меняться со временем. Значение х* может быть най- дено из уравнения х* = /(ж*,А). (7.4) Все точки, удовлетворяющие этому уравнению, называются не- подвижными точками отображе- ния, так как хп = х* при лю- бом п, если a?i = х*. Рис. 7.4. Функция f(x) и первые элемен- ты последовательности {жп}, -> при п -> оо Типичная картина итераций одномерного отображения в окрестности неподвижной точки х* представлена на рис. 7.4. В окрестности этой точки величины хп - х* при больших п стремятся к геометрической прогрессии: .. ®п+1 Хп ) lim -----------= 7 = —х— п->00 хп — Хп-\ дх
Простейшие системы с дискретным временем 181 Отметим, что все неподвижные точки отображения лежат на пересечении графика функции zn+i = f(xn, Л) с биссектрисой первого координатного угла zn+i = хп. В самом деле, точка пересечения этих линий жп+1 = f(xn, А) = хп удовлетворяет определению неподвижной точки. Поэкспериментировав с лестницей Ламерея, либо рассмотрев про- стейшее отображение zn+i = ухп, у которого ноль — неподвижная точка ж* и df(x*)/dx = 7, можно установить следующие факты. Когда Л(Ж*>А) > 0, элементы последовательности {zn} монотонно сходятся к х* при 1 > /х(ж*,А) > 0 или расходятся от нее при fx(x*,X) > 1. Когда Д(ж*,А) < 0, то элементы последовательности {жп} оказываются поочередно то справа, то слева от неподвижной точки (см. рис. 7.1 а). Они сходятся, если 0 > /(ж*, А) > -1, и расходятся, когда /Ж(ж*, А) < -1. При А < 1 квадратное уравнение z* = Az*(l - х*) имеет один неотрицательный корень х* = 0. При А > 1 неотрицательных корней два: х* = 0 и х* = (А - 1)/А. При А = 1 неподвижная точка ж* = 0 теряет устойчивость, а вновь появившаяся точка становится устойчивой. В самом деле, нетрудно определить, будет ли устойчивой неподвижная точка х* отображения /(ж, А). Пусть хп = х* 4- Джп, где Дхп — малое число. Если точка устойчива, то с ростом п величина |Джп| должна уменьшаться. Перепишем формулу (7.1) в виде х* -I- Джп+1 = f(x 4- Джп, А) « /(ж*) -I- —&вп. При анализе устойчивости особых точек обыкновенных дифференци- альных уравнений в невырожденном случае все определяется линейными членами (первый метод теории устойчивости Ляпунова). Проводя здесь аналогичные рассуждения, можно убедиться, что устойчивость точки х* определяется поведением линейного отображения р.5) ОХ Но это не что иное, как обычная геометрическая прогрессия. Следо- вательно, |Дхл| 0, когда выполнено неравенство Д/(г*,А) дх (7.6) Это и есть достаточное условие устойчивости неподвижной точки х*. Оно, естественно, совпадает с достаточным условием сходимости метода простой итерации. Если выполнено противоположное неравенство, то можно утверждать, что точка х* будет неустойчивой. Если производная равна единице, то нужно рассматривать следующие члены ряда Тейлора. Будем дальше увеличивать параметр А. Поведение системы снова изменится: в последовательности {zn}, начиная с достаточно больших п, будут чередоваться два числа: Oi и (Точнее говоря, последователь- ность {жп} устроена так, что Ж2п+1 02 при п -> оо.) Эти числа связаны соотношениями ai = /(«:), «2 = /(^i). Будем говорить,
182 Глава? Рис. 7.5. Цикл S2 в логистическом отоб- ражении. Точка максимума х = 1/2 яв- ляется элементом цикла. Такие циклы принято называть сверхустойчивыми Рис. 7.6. Функция /(ж) и устойчивый цикл S4 что в этом случае отображение (7.3) имеет устойчивый цикл с периодом 2, и обозначать его S2 и также называть числа oi и oi элементами цикла. Рисунок 7.5 показывает, как выглядит цикл S2 на графике. Переход от неподвижной точки (ее можно считать циклом 51) к цик- лу S2 произошел в результате бифуркации, которая получила название бифуркации удвоения периода. Точка ж* при этом не исчезла, однако вели- чина Of(x\ Х)/дх стала меньше -1. При дальнейшем увеличении Л последовательность {zn} опять из- меняется. Возникает цикл 54: ®4т ~* а1, ®4т+1 ~> Й2, ®4т+2 ~Л3, ж4т+3 ~> <14 При 771 —> ОО, причем fl2 = /(fli), а3 = /(а2), 04 =/(аз), aj =/(а4) (рис. 7.6). Увеличивая далее значение параметра А, мы увидим циклы 5'8,516,5'32 и т. д. При этом каждый раз цикл S2P теряет устойчивость, происходит бифуркация удвоения периода, и устойчивым становится цикл S2P+'. Наконец, при некотором значении А (его иногда обозначают Аоо) форму- ла (7.3) дает уже непериодическую последовательность {жп}. Наблюдаемая картина оказывается очень интересной. Во-первых, в поразительно простой модели (7.1) заложено очень сложное поведение. Во-вторых, в ней удается проследить большое количество бифуркаций, приводящих к усложнению решения. Сделать это в более сложных моделях гораздо труднее. В-третьих, при 0 < А < Аоо устойчивы только циклы, период которых равен 2Р. Хотелось бы понять, чем это вызвано, и изучить поведение модели более подробно. Наряду с отображением (7.1), удобно рассмотреть отображение Хп+2 = f (f(x„, А)) = f2(xn, А). (7.7)
Простейшие системы с дискретным временем 183 В этой главе fn(x, А) всегда будет соответствовать n-й итерации функции /. В нашем случае вид функции f2(x, А) показан на рис. 7.7 и 7.8. Первый рисунок соответствует устойчивой неподвижной точке, второй — устойчивому циклу S2. График f2(x, А) пересекается с прямой у = х во всех неподвижных точках отображения, а также в точках, принадле- жащих циклам S2. Действительно, если ж* = f(x*), то /(/(Z)) = f(x*) = х\ Кроме того, если oi и в] - эле- менты цикла 52, то а2 = /(аь А) = /(/(а2, А)), ai = /(а2, А) = /(/(оь А)). Увеличивая параметр А, мы рас- тягиваем функцию /2(х, А) вдоль оси у. И если при некотором значе- нии А линии у = х и у = f2(x, А) пересекаются в одной точке (см. рис. 7.7), то с увеличением А мо- гут появиться еще две точки пе- ресечения (см. рис. 7.8). Они-то и Рис. 7.7. Зависимость у = f2(x). Отобра- жение f(x) при этом значении парамет- ра имеет устойчивую неподвижную точку будут определять цикл S2. Пере- ход S2 -> S4 в отображении f(x, А) обусловлен тем, что в отображении f2(x, А) одна из неподвижных точек теряет устойчивость, и в ее окрестно- сти появляются две новые устойчивые неподвижные точки. Рассматривая функции /4(ж, А), /8(ж, А) и т. д., можно увидеть, как происходят следую- щие удвоения. В каждом из этих случаев одна точка теряет устойчивость У 1 0,8 0,6 0,4 0,2 0 Рис. 7.8. Такой вид имеет функция f2(x) для логистического отображения, когда f(x) определяет сверхустойчивые циклы: а) цикл S2; б) цикл S4
184 Глава 7 и появляются две другие устойчивые точки, поэтому период цикла удва- ивается. При этом возникновение устойчивого цикла S4 у отображения жп+1 = f(xn, А) связано с появлением двух устойчивых циклов у отобра- жения /2 и четырех неподвижных точек у /4. Действуя так же, как в случае неподвижной точки, можно показать, что устойчивость цикла Sp с элементами х\,...,хр будет определяться величиной \dfp(xk, Х)/дх\, к = 1,... ,р. В самом деле — точки х\,..., хр будут неподвижными точками отображения G(x, А) = fp(x, А): = f(xpt А) = /(/(жр_1,А)) = ... = /(/^i)) = G(si,A) и т.д. р раз Следовательно, достаточное условие устойчивости неподвижной точки х\ (либо любой из точек Х2,...,хр) можно использовать для функции G: |dG(xi, А)/дж| < 1. Продифференцировав эту функцию в соответ- ствии с правилом дифференцирования сложной функции и опустив зави- симость от параметра А, легко убедиться, что это условие эквивалентно неравенству дх ’ ” дх < 1. (7-8) Из этой формулы следует также, что величина \dfp/dx\ будет одной и той же во всех точках цикла Sp. Оказалось, что на примере модели (7.3) удается понять не только качественные, но и количественные закономерности возникновения ха- оса. Чтобы проследить за ними, построим график ж(А). По оси х будем откладывать ... ,жр, лежащие на устойчивом цикле либо другом аттракторе, по оси А — значения параметра. Такую бифуркационную диаграмму довольно просто построить на компьютере: надо рассчитать несколько тысяч итераций отображения /, первые 300-500 значений от- бросить, а остальные отложить на плоскости (ж, А) (см. рис. 7.9). Первые члены следует отбросить, чтобы исключить переходный процесс. Цик- лу S2 будут соответствовать две точки на одной вертикали, циклу S'4 — четыре, и т.д. Обозначим через Л1,Лг,Лз,... те значения параметра А, при которых происходили удвоения, а через Аь Аг, Аз,... — значения па- раметра, при которых х = 1/2 является элементом цикла S2,54, 58, и т.д. (такие циклы называются сверхустойчивыми). Название ясно из неравен- ства (7.8). Введем также величины d\, di,..., dn,..., равные расстоянию между х = 1/2 и ближайшим к нему элементом цикла S2 при А = А2 . Все эти обозначения пояснены на рис. 7.9. Из этого рисунка видно, что Расчеты, проведенные на ЭВМ, показали, что числа Лп и Ап при больших п ведут себя как геометрическая прогрессия. Ее знаменатель
Простейшие системы с дискретным временем 185 1 0,2 --1——I-----1---1——I----1----d--Ш_1—I— 2,88 2,96 3,04 3,12 3,20 3,28 3,36 3,44 3,52 3,60 Л Рис. 7.9. Усложнение устойчивых циклов в отображении zn+1 = Azn(l - хп), происходящее в результате бифуркаций удвоения периода определяется постоянной д = 4,6692016... Другими словами, Лп+1 — Лп П—>00 _ . к Л„+2 - Л„+1 (7'9) Отношение dn/dn+i также имеет предел, равный а, где а = -2,5029078... Можно вместо (7.3) рассмотреть другое семейство симметричных функций, имеющих на отрезке [0, 1] один максимум и близких около вер- шины к квадратичной параболе, в котором также происходит бесконечный каскад бифуркаций удвоения периода при изменении параметра А. Ока- залось, что в любой такой модели числа а и 6 будут одними и теми же. Более того, независимо от вида /(х), предел / чп -г - 0,5 ч \ lim (-a) f I А„ ) п->оо у (—а)п ) существует и будет одним и тем же. Его называют универсальной функ- цией gQ(x). Эти удивительные закономерности были обнаружены и поняты аме- риканским математиком М. Фейгенбаумом в 1978 г. М.Фейгенбаум пред- ложил функциональные уравнения, определяющие а, 6,до(х). В силу универсальности чисел а, <5, </о(х) и других функций такого типа, эту тео- рию называют теорией универсальности. То, что переход к хаосу во многих одномерных отображениях происходит в результате бесконечного каскада бифуркаций удвоения периода, было установлено в ряде предшествующих работ. Однако свойство (7.9) и существование универсальных функций получили объяснение именно в теории универсальности. В этой теории применяется метод ренорм-группы, широко исполь- зуемый в квантовой теории поля и статистической физике. При таком подходе задачу обычно сводят к решению некоторого функционально- го уравнения, инвариантного относительно перенормировки, связанной
186 Глава 7 с изменением параметров изучаемого объекта. В теории универсально- сти постоянная а может быть определена из уравнения, которое имеет наглядный геометрический смысл. Сравним рис. 7.5 а и 7.8 0. Элемент кривой f2(x), попавший внутрь меньшего квадрата, очень похож на дугу функции /’(ж), содержащую- ся внутри квадрата на рис. 7.5 а. Практически, они отличаются только масштабом и ориентацией осей. Расчеты показывают, что для функ- ций /2 , n > 1, при А = Ап такое подобие также имеет место. Оно выпол- няется тем точнее, чем больше п. Перейдем к переменной zH0B = жст-0,5. Пусть для некой функции д(х) такое подобие выполняется точно. Если считать, что коэффициент растяжения вдоль обеих осей равен а, то для функции д(х) можно получить функциональное уравнение = (т9)(х). (7.10) Оно позволяет определить как функцию д(х), так и значение а. Функ- ция д определена на отрезке [-1,1]; считается, что она имеет един- ственный максимум при х = 0 и симметрична: д(х) = д(-х). Вблизи максимума д(х) должна быть близка к квадратичной параболе, причем р(0) = 1. Оператор Т называется преобразованием удвоения. В теории универсальности рассматривается пространство отображе- ний отрезка [-1,1] в себя, таких, что f(x) 6 С2([-1,1]), х = 0 является точкой максимума /(0) = 1. Это пространство инвариантно относительно преобразования Т. Можно показать, что функция д(х) определяется некоторым рядом д(х) = 1 - 1,52763/ + 0,104815/ - 0,0267057/ + ... . Существует наглядная аналогия между неподвижными точками одномер- ных отображений и объектами теории универсальности. Элементы теории универсальности » Чтобы убедиться в этом, введем по аналогии с до(х) целое семейство универсальных функций 9i(x) lim (-а)” п->оо г = 0,1,2,... . Можно убедиться, что gi(x) и gi-\(x) связаны между собой преобразова- нием удвоения Т: gi-\(x) = (~a)gi gt — Tgi(x). При первом знакомстве с книгой этот пункт можно опустить.
Простейшие системы с дискретным временем 187 В самом деле, = lim (-«)”/£ — п->оо "+* 1 Ц—Л) 1 X а (—а)п~1 = lim(-a)(-a)m/2”/—~^(-а)'7л2 т-юо + (—а) = -agi Следовательно, переходя к пределу при i д(х) = lim gi(x), t-»oo получаем уравнение для неподвижной точки оператора удвоения д(х) = Тд(х) = -ад Чтобы убедиться в том, что существует универсальная постоянная <5 и том, что значения Ап образуют геометрическую прогрессию, можно рассуждать следующим образом. Пусть после сдвига координаты х на 1/2 координата вершины совпа- дает с х = 0. Следовательно, значения Лп, при которых есть сверхустой- чивые циклы, удовлетворяют уравнению /2”(0, А„) = 0 (см. рис. 7.5, 7.6). Разложим функцию /(А, х) в точке А», /(ж, А) = /(ж, Аоо) + (А - Аоо)5/(х), где 6f(x) = df(x, Xoo)/dX. Применение к этому равенству оператора удвоения дает Tf(x, А) = Tf(x, Аоо) + (А - Аоо)Ь(/(г, Xx))Sf + О [(<5/)2]. Добавив малое приращение 6f(x) к функции /(ж), нетрудно убедиться, что Т(/ + <5/) - Tf = L(f)Sf = I L \ а/J J n-кратное применение оператора удвоения дает следующий результат T"f(x, А) = T"f(x, А») + (А - Лоо)ЬТ"-7(х, A«>)...+ + £/(г,Аоо)<5/ + 0[(<5/)2].
188 Глава 7 Однако поскольку д(х) = lim gi(x) = lim lim (-a)”/2” ( Xn+i ) ~ woo woo n->oo Ct) / « (-a)”/2" (Aoo) = Tnf(x, Аоо) при n > 1, то имеет место приближенное равенство Tnf(x, А) » д(х) 4- (А - X00)Ln(g(x))df(x) при п > 1. Естественно предположить, что линейный оператор L имеет собственные значения д* и собственные функции <рк- Разложим по этим функци- ям 6f(x) L(g(x))<Pk = <*№) = скЧ>к(х)\ к = 1,2,... к Ln(g(x))t>f = к В теории универсальности показывается, что Д| > 1; |д&| < 1 при к £ 1. Следовательно, Ln(g(x))6f = при п » 1. Поэтому Tnf(x, Ап) = д(х) + (А - Аоо)д?у>|(®)сь Напомним, что р(0) = 1, а при значениях А„, соответствующих свер- хустойчивому циклу S2 , Т7(0,А„) = (-а)72"(0,Л„)=0. Следовательно, lim (Ап - Аоо)д7 = - ‘ = const. п-мх> С\ • ^1(0) Таким образом, числа Хп образуют геометрическую прогрессию с одним и тем же знаменателем д~1, назависимо от функции /. Отсюда ясно, что собственное значение Д1 совпадает с универсальной постоянной Фейгенбаума <5. Переход к хаосу Сценарий возникновения непериодического движения, хаотического аттрактора, в результате каскада бифуркаций удвоения периода первона- чально был подробно исследован для логистического отображения. Позже были получены строгие результаты, позволяющие выделить классы одно- мерных отображений, для которых переход к хаосу происходит в соответ- ствии со сценарием Фейгенбаума. Однако экспериментальное изучение
Простейшие системы с дискретным временем 189 и компьютерное моделирование множества нелинейных систем показа- ли, что для них характерна последовательность бифуркаций удвоения периода, а значения бифуркационных параметров и амплитуды циклов характеризуются теми же универсальными постоянными а и 6. При этом изучаемые объекты могут описываться многомерными отображениями, автономными или неавтономными системами обыкновенных дифферен- циальных уравнений, либо уравнениями в частных производных. Это замечательный факт. Большой класс нелинейных явлений демонстриру- ет не только одинаковое качественное поведение, но и универсальные количественные закономерности. Приведем несколько примеров. Логистическое отображение, как и остальные одномерные отобра- жения с достаточно сложным поведением, необратимы; в них одному и тому же образу xn+i может соответствовать два прообраза х'п и х„. (Например, для логистического отображения хп = ±^1~4а;,>+—.) С другой стороны, эта ситуация нетипична для дифференциальных уравнений. Отображения, которые они порождают, x(t) —> x(t + T), обыч- но являются взаимно однозначными для конечных промежутков времени Т — одному образу x(t + Т) соответствует единственный прообраз x(t). Отображения часто используются как упрощенные модели дифференци- альных уравнений, и во многих случаях важно, чтобы они отражали эту однозначность. Этим свойством обладает одно из наиболее известных двумерных отображений — отображение Хенона = 1 — ~ ЪУп> (7 11) Уп+l = З'П- Это отображение было предложено как упрощенная модель динами- ческой системы с непрерывным временем — модели Лоренца. Последнее, в свою очередь, возникло как модель, описывающая движение жидко- сти. С другой стороны, замена переменных Яп+i = zn + С позволяет избавиться от постоянного члена и привести отображение (7.11) к виду zn+t = g(zn,zn-\), напоминающему логистическое отображение. Такие отображения можно интерпретировать как модель динамики популяции, в которой ресурс расходуется не только одним поколением с численно- стью zn, но и предыдущим с численностью zn_\. Модель (7.11) демонстрирует хаотическое поведение. При этом пере- ход к хаосу может происходить в результате каскада бифуркаций удвоения периода, например, в интервале параметров Ъ = 0,3; 1,2 < Л < 1,96. Двумерные отображения используются в качестве математических моделей в нелинейной оптике. В работах японского исследователя К. Ике- ды был рассмотрен резонатор, частично заполненный средой с так назы- ваемой фазовой нелинейностью. Эта среда меняет фазу электромагнитной волны Е в зависимости от ее амплитуды |Б|. Резонатор возбуждается лучом лазера; с помощью системы зеркал выходящий луч вновь заводится
190 Глава 7 в резонатор. В простейшем случае эта физическая система описывается отображением En+i = А + ВЕп exp {i\En|2}. Здесь А — параметр, характеризующий интенсивность излучения лазера, В — величина, определяемая оптическими свойствами резонатора, Еп — комплексная амплитуда электромагнитной волны после п-кратного про- хождения света через резонатор. Каскад бифуркаций удвоения периода наблюдается, например, при В « 0,154 и 100,8 > А > 99,5. Многочислен- ные натурные эксперименты с нелинейными резонаторами подтвердили существование «оптического хаоса» и позволили детально исследовать его свойства. Представим себе обсуждавшуюся модель математического маятника. Допустим, что его длина I меняется периодически с частотой Q. Это может соответствовать тому, что вы периодически приседаете и выпрямляетесь, качаясь на качелях. Кажется естественным, что, подобрав частоту П, можно попасть в резонанс (в этом случае он называется параметрическим резонансом) и многократно увеличить энергию колебаний. При больших скоростях становятся существенны диссипативные процессы, например, вязкое трение. Это приводит к неавтономному обыкновенному диффе- ренциальному уравнению второго порядка: х + ух + (1 + A cos Qf) sin х = 0. При 7 = 0,15; Q = 1,56 и изменении амплитуды А в интервале 0,51 < А < 0,92 здесь также происходит переход к хаосу в соответствии со сценарием Фейгенбаума. Одной из наиболее известных моделей нелинейной динамики, в ко- торой впервые было убедительно продемонстрировано существование странного аттрактора, является система Лоренца. Американский метео- ролог Э. Лоренц, анализируя результаты наблюдений сети метеостанций, столкнулся с явлением, которое позже получило название чувствитель- ности к начальным данным. Оно связано с расходимостью близких тра- екторий. Именно с этим свойством динамики атмосферы Э. Лоренц связал принципиальные трудности в получении среднесрочного (на вре- мя 2-3 недели) прогноза погоды. Эти трудности не удалось преодолеть, используя более эффективные компьютеры и вычислительные алгорит- мы, они обусловлены внутренними свойствами нелинейных процессов, влияющих на состояние атмосферы. В качестве такого процесса Э. Лоренц рассматривал конвекцию в подогреваемом снизу слое жидкости или газа. Такая модель отражает тот факт, что поверхность Земли, прогреваемая Солнцем, гораздо теплее верхних слоев воздуха. Простейшая модель этого явления — система Лоренца: х = —рх -I- ру, у = -xz + гх-у, z = ху - bz,
Простейшие системы с дискретным временем 191 где г — число Релея, р — число Прандтля, пропорциональное отношению кинематической вязкости и теплопроводности, коэффициент Ь отражает геометрию задачи. Переменные у и z соответствуют фурье-гармоникам поля температур, х — поля скоростей. При исследовании этой математической модели были обнаружены многие интересные явления, апробированы различные асимптотические и вычислительные алгоритмы. При больших значениях числа Рэлея в этой системе возникают «окна периодичности», в которых аттракторами яв- ляются предельные циклы. Уменьшая величину г внутри этих полос, можно наблюдать каскад бифуркаций удвоения периода. В частности, такой каскад наблюдается при р = 10; b = 8/3; 100,8 < г < 99,52. Эти и многие другие задачи, активно изучавшиеся в 80-е гг., показы- вают, что мы имеем дело с универсальным поведением, характерным для огромного множества различных систем. Шумящие циклы, окна периодичности, перемежаемость До сих пор мы рассматривали итерации логистического отображения до того значения параметра Лоо, при котором последовательность {хп} не стремится к циклу. В этом случае аттрактор определяется непериодиче- ской траекторией. Рассмотрим бифуркационную диаграмму при больших значениях параметра Л. В крупном масштабе она выглядит так, как по- казано на рис. 7.10. Полосы, в которых точки {жп} заполняют целые отрезки, естественно связать с динамическим хаосом. Они чередуются с «окнами периодичности», в которых наблюдаются циклы различных периодов. На рисунке видно, что самое большое «окно» здесь связано с цик- лом S3. При увеличении параметра Л в этом окне происходят бифуркации S3 -> S6 -> S12 -> S24 ->..., т. е. мы вновь имеем дело с каскадом бифур- каций удвоения периода. Если рассмотреть эволюцию исходного отобра- жения и устойчивых циклов отображения /3(х), то она окажется анало- гичной той, которая обсуждалась для каскада S —> S2 —> S4 -> S8 -> .... Этот каскад характеризуют те же постоянные а и 8. Аналогичная кар- тина наблюдается и в других окнах периодичности — переход к хаосу происходит в них в соответствии со сценарием Фейгенбаума. Интересно выяснить, как же возникает «из хаотического аттрактора» при увеличении параметра Л устойчивый цикл S'3? Подобные проблемы появляются и при исследовании других динамических систем. Обычно они встают после компьютерного построения бифуркационной диаграммы, аналогичной той, которая показана на рис. 7.10. Одна из гипотез, которую часто высказывают и которую следует иметь в виду при изменении типа аттрактора, такова. Если мы фиксировали на- чальные данные X] (либо даже если брали их с аттрактора при предшеству- ющем значении параметра), то может оказаться, что в системе несколько
192 Глава 7 Рис. 7.10. Вид бифуркационной диаграммы для логистического отображения. На рисунке видны окна периодичности аттракторов и изменение параметра Л переводит точку 2?i из области при- тяжения одного в область притяжения другого. Чтобы принять или отверг- нуть эту гипотезу, нужно представлять, сколько аттракторов может иметь исследуемая система и каковы их области притяжения. Даже для двумер- ных отображений ответы на эти вопросы оказываются весьма сложными. К счастью, для логистического отображения ситуация оказывается достаточ о простой. Вопрос о числе аттракторов был решен Д. Сингером для так называемых S-унимодальных отображений. К таким отображениям может быть приведена и модель (7.3) после замены переменных. Функцию называют S -унимодальной, если она: 1) непрерывна; 2) /(0)= 1; 3) f строго убывает на [0,1] и строго возрастает на [-1,0]; 4) 7'(о) = о» f" < о; 5) f отображает отрезок [/(1), 1] на себя; 6) величина, называемая производной Шварца Sf(x) — Sf (X) Г(х) f'(x) ЗГГ(*)12 2 L Г(х) такова, что Sf(x) < 0 для всех х G [-1, 1], а в точке х = 0 она может быть равна — оо. Было доказано, что если отображение f S-унимодально, то оно имеет не более одного устойчивого цикла и, возможно, устойчивую непо- движную точку на отрезке [-!,/(!)]. Если устойчивый цикл существует, то итерации почти всех начальных точек из отрезка (/(1), 1) сходятся к нему. В частности, к нему сходятся итерации точки х = 0. Последнее утверждение дает способ строить отображения, не име- ющие устойчивых циклов. Для этого нужно проследить, чтобы одна из итераций нуля попала в неустойчивую точку или неустойчивый цикл.
Простейшие системы с дискретным временем 193 N= 36 Рис. 7.11. Представление о хаоти- ческом аттракторе можно полу- чить, построив гистограмму для последовательности {яп} по N элементам последовательности. Переходя к пределу при N -> оо и е -> 0, можно получить инвари- антную меру При анализе бифуркационной диаграммы естественно уточнить, ка- кие аттракторы можно отнести к хаотическим. Первый подход к этой проблеме непосредственно опирается на аналогию с теорией вероятно- стей. В этой теории сначала выясняется, какие события могут произойти, а затем — как часто они случаются, что позволяет сопоставить таким событиям вероятности. Если х — некоторая случайная величина, значения которой принад- лежат некоторому интервалу, то можно поступить следующим образом. Разбить весь отрезок на М интервалов длины в. Затем построить функ- цию ni(N), показывающую, как часто величина х попадает в г-й интер- вал. Для этого достаточно в компьютерной программе положить величину nt(7V) вна- чале нулевой, ni(N) = 0 при 1 ii М, и увеличивать n*(JV) на единицу, как толь- ко величина х приняла значение, принад- лежащее к-му интервалу. Сказанное ил- люстрирует рис. 7.11. Если длина исследу- емой выборки 7V, то затем надо отнорми- ровать значения - п* = nk(N)/N. Эта процедура называется построением ги- стограммы. Для наглядности можно счи- тать, что мы бросаем кубик N раз и счита- ем, сколько выпало единиц — щ, двоек — П2 и т. д. Если N достаточно велико, то вели- чины пк будут стремиться к соответству- ющим вероятностям lim nk(N)=Pk- N-юо В нашем примере рк = 1/6, к = 1,..., 6. Аналогичным образом дело обстоит и для непрерывной величины Пк: lim nk(N) =Pk(t), N-мх) где Pk(e) — вероятность того, что случайная величина х попадет в Л-й интервал длины е. Пусть у = (к - \)е + е/2 — середина этого интервала. Зафиксируем точку у и будем уменьшать величину е. Мы будем получать вероятности Рк(у, в). Рассмотрим предел lim £—>0 р*(£) € = р(у), который будем называть плотностью вероятности. Другими словами, вероятность того, что величина х принадлежит интервалу длины е с се- рединой в точке у, равна р(у) • е. Более строгие рассуждения и условия существования пределов при- водятся в курсах теории вероятностей и случайных процессов.
194 Глава 7 Рис. 7.12. Примеры инвариантных мер одномерных отображений: а) мера имеет особенности при х = -1 и х = 1; б) мера является непрерывной ограниченной функцией, отличной от нуля внутри всего интервала; в) мера сосредоточена на двух «островах», что соответствует шумящему циклу Вернемся к одномерным отображениям. В случае неподвижной точ- ки х* плотность вероятности определяется дельта-функцией Дирака р(х) = 6(х - х*), поскольку элементы последовательности {жп} с ростом п будут все точнее «попадать» в точку х*. В случае устойчивого цикла Sp 1 р р(х) = - 52 - ®<). где Xi, 1 I р — элементы цикла. Однако элементы последовательности {жп} могут заполнять весь отрезок или несколько «островов» на нем. Примеры таких аттракторов представлены на рис. 7.12. Аттракторы последнего типа получили на- звание «шумящих циклов» или «полупериодических траекторий». Пусть плотность отлична от нуля в пределах р островов. Такие аттракторы обозначают хр. Порядок обхода островов оказывается строго фиксиро- ванным, поэтому можно точно предсказать, в пределах какого из островов окажется элемент хп при любом п (это сближает их с циклами). Одна- ко положение точки при больших п меняется нерегулярным образом, и в этом смысле они близки к стохастическим режимам. На гистограммы и плотности распределения можно взглянуть с дру- гой точки зрения. Представим себе, что мы рассматриваем не одну, а бесконечное множество одинаковых динамических систем, начальные данные xq, в которых распределены с плотностью ро(х). Первая итерация, вообще говоря, изменит это распределение и пере- ведет его в распределение pi(x). Однако возможна ситуация, когда плот- ность р(х) после применения отображения f не изменится. В этом случае говорят, что отображение f имеет инвариантную меру с плотностью р(х). Инвариантные меры характеризуют «предельное» распределение вероят- ностей, аттрактор исследуемого отображения.
Простейшие системы с дискретным временем 195 Как мы видим, такими мерами могут быть наборы дельта-функций. Возможны распределения, у которых плотность р(х) отлична от нуля на одном или нескольких островах. В ряде случаев у них есть интегриру- емые особенности (см. рис. 7.12 а). Наконец, мера может быть подобной себе на меньших масштабах, т. е. обладать масштабной инвариантностью. Таков, например, аттрактор Фейгенбаума, возникающий после бесконеч- ного каскада бифуркаций удвоения периода. Таким образом, выяснить, насколько хаотичен аттрактор одномерно- го отображения, можно, построив гистограмму, дающую представление об инвариантной мере. Чем более гладкой и регулярной является плот- ность распределения р(х), тем более сильными стохастическими свой- ствами обладает аттрактор. Другой часто используемый «тест на хаотичность» связан с выяснени- ем вопроса, обладает ли система чувствительностью к начальным данным. Для этого нужно оценить ляпуновский показатель для траектории на ис- следуемом аттракторе. Здесь так же, как в непрерывных системах, удобно рассматривать не итерации двух бесконечно близких точек xq и жо а отображения в вариациях Понятно, что ®п+1 — Л*п) / // . Xq = a, Xq=CL + € п Уп+1 = П i=0 _ Of(xn) Уп+1 — Уп, Уо=£. df(xn) дх €. Если lim ? А о/Ы 11 дх 1=0 то система обладает чувствительностью к начальным данным, расстояние между итерациями двух бесконечно близких вначале точек в среднем растет. Это говорит в пользу того, что мы имеем дело с хаотическим аттрактором. (В соответствующих компьютерных программах обычно вы- п числяется не произведение, а сумма логарифмов ln W(xi)/dx\-) »=0 Вернемся к вопросу, как из хаотического аттрактора, обладающего чувствительностью к начальным данным, возникает окно периодичности. Ответ на него был получен в 1980 г. П. Манневилем и И. Помо. Итак, при некотором значении параметра А (А ~ 3,83) из хао- са скачком появляется устойчивый цикл S3. Рассмотрим отображение f3(x) = А))) до того, как цикл появился А < А (см. рис. 7.13а), и после этого А > А (см. рис. 7.13 d). При увеличении параметра А кривая f\x) становится круче и у нее появляются новые точки пересечения
196 Глава 7 Рис. 7.13. Вид функции /3 до появле- ния устойчивого цикла S3 и после этого d) А < Ас; б) А > Хс с прямой у = х. Они обозначены буквами ЛГ1ДЗ и Н\,2,з на рис. 7.13 d. Все они являются неподвижными точ- ками отображения f\x). Производ- ная f\x) в точках Mi,2,3 одинако- ва и по модулю не превосходит еди- ницы (см. условие устойчивости цик- ла). Именно эти точки и определяют устойчивый цикл S3. Наклон графика в точках М,2,з также одинаков, но там выполняется противоположное нера- венство. В отображении f им соответ- ствует неустойчивый цикл S3, который появился одновременно с устойчивым. Одновременное появление устой- чивой и неустойчивой особых точек получило название касательной или тангенциальной бифуркации. Название связано с тем, что в точке бифуркации кривая f(x) касается диагонали у = х. Соответственно, производная df/dx в этой точке равна единице. Обратим внимание на аналогию этой бифурка- ции с регулярной экстремальной точкой, рассмотренной в главе 5, где «ниоткуда» одновременно появлялись устойчивое и неустойчивое состоя- ния равновесия. Зададим какое-нибудь начальное значение и посмотрим, как дей- ствует отображение /3(ж), когда А > А и А < А. Другими словами, мы будем следить за каждым третьим элементом последовательности {жп}. Расчеты показывают, что в первом случае после длительного пе- реходного процесса точки притягиваются к циклу S3 (см. рис. 7.14 а). Во втором случае вначале происходит медленное движение к точке М (см. рис. 7.14 б). Однако потом элементы последовательности быстро от- ходят от этой точки. В дальнейшем они вновь начинают приближаться к ней. Такое поведение для одного из отображений с острой вершиной иллюстрирует рис. 7.15 а. Видно, что интервалы движения к точке М, когда решение похоже на регулярное, чередуются в последовательности {жп} с быстрыми хаотическими выбросами. В зависимости хп от п ко- роткие турбулентные всплески чередуются с длительными промежутками «ламинарной фазы» (см. рис. 7.15 б). В этой простейшей модели есть перемежаемость. Анализ реальных систем с перемежаемостью вблизи точки тангенци- альной бифуркации представляет значительные трудности, так как в те- чение длительного времени может наблюдаться только ламинарная фаза. Оценим, как зависит продолжительность Т ламинарной фазы от па-
Простейшие системы с дискретным временем 197 Рис. 7.14. Так выглядит функция /3 в более крупном масштабе; а) А = 3,830, точка М2 соответствует устойчивому циклу S3, точка N2 — неустойчивому; б) А = 3,825, цикл S3 еще не появился Рис. 7.15. Типичная картина перемежаемости: а) несколько итераций отображения яп+1 = 1 - |«п - А|1/2[1 + (яп ~ А)2]-1, А = 0,769; б) зависимость последовательности от номера итерации. Для наглядности точки хп и xn+i соединены раметра А. Пусть при А = 0 происходит тангенциальная бифуркация. Из рис. 7.146 ясно, что на интересующем участке изучаемое отображение может быть приближено следующим образом ^n+i = — А. (7.12) Поскольку zn+i - хп 1, при А —> 0 последнюю формулу можно аппроксимировать дифференциальным уравнением dx > , — =ах2-Л. (7.13) dr Ясно, что отображение (7.12) представляет собой разностную аппрокси- мацию уравнения (7.13), полученную с помощью метода Эйлера, с т = 1. Интегрируя уравнение (7.13), можно убедиться, что время Т (а зна- чит и количество итераций), которое траектория х(т) проводит вблизи
198 Глава 7 нуля, пропорционально А-1/2. Именно такая зависимость и наблюдается в расчетах. Переход к хаосу, связанный с перемежаемостью, встречается во мно- гих нелинейных системах. При определенных параметрах он имеет место и в системе Лоренца. Его связывают также с явлением перемежаемости в гидродинамических системах. В некоторых течениях можно видеть, как в упорядоченном ламинарном потоке вдруг появляются вихри, поведение которых кажется случайным. Затем картина течения вновь становит- ся простой, регулярной и упорядоченной. Упорядоченный режим здесь перемежается с «островами» хаоса. Вопросы и задачи 1. Пусть известно одномерное отображение zn+1 = f(xn) и fc-й член последо- вательности {яп}. Можно ли определить по этим данным Хь-\,Хк-2 и т.д. Всегда ли это возможно? Нужна ли для этого какая-либо дополнительная информация? 2. Какие математические модели с дискретным временем могут быть предло- жены для систем типа «хищник—жертва», «паразит—хозяин», для описания динамики двух видов, конкурирующих за общие ресурсы? 3. Найти приближенное решение уравнения Фейгенбаума считая, что в д(х) входит только постоянная и квадратичный член. Считать, что функция д(х) четная и </(0) = 1. 4. Квадратный трехчлен f(x) = ах2 + Ьх + с таков, что уравнение f(x) = х не имеет вещественных корней. Доказать, что уравнение = х также не имеет вещественных корней. 5. Решить систему уравнений COS Xi — Xj, cos x2 = Хз, COS Хд-i — xni COS • 6. Человек держит за конец резиновый жгут длиной 1 м, привязанный к дереву. У другого конца жгута сидит жук. Каждую секунду жук проползает 1 см по жгуту. Каждую секунду человек, держа конец жгута, удаляется от дерева на 1 м. Доползет ли жук до человека? Если нет, то почему? Если да, то за какое время? 7. Бесконечная наклонная плоскость расположена под углом а к горизон- ту. Угол падения абсолютно упругого мяча на плоскость равен тг/2 - /3, скорость падения v. Отскакивая от плоскости и падая вновь, мяч начинает «подниматься» по плоскости. Найти координату n-го отскока и оценить мак- симальное расстояние вдоль плоскости, на котором окажется мяч от точки первоначального падения.
Простейшие системы с дискретным временем 199 8. Рассмотрим треугольник АВС. Проведем в нем высоты. Обозначим их основания (т. е. точки, где они пересекаются с соответствующими сторона- ми) через Л1,ВЬС1. Рассмотрим треугольник AiB\C\ и обозначим осно- вания высот в нем через А2,В2,С2. И т.д. Обозначим углы треугольника ,7i, треугольника АпВпСп через ап,рп,уп. Постройте отображение: ®п+1 = /(^П,7п)> Рп+l Р(®П>^П»7«)’ 7п+1 ^(®п> Рп> 7п)» п = 0,1,2,..., а0 = <*, А) ~ А» 7 — 7о- Чему равны ляпуновские показатели этого отображения? Имеет ли оно нетривиальные неподвижные точки или циклы (отличные от а* = fl* = 7* = тг/3)? 9. Какой должна быть сила, действующая на материальную точку, чтобы числен- ное решение дифференциальных уравнений, полученное с помощью метода Эйлера, совпало с точным? 10. Что происходит с итерациями отображения xn+i = Azn(l - хп) при А > 4? Существуют ли такие начальные точки я, при которых 0 хп 1 при всех п? 11. Решить уравнение 12. Одна из первых математических моделей, представляющая собой динамиче- скую систему, возникла в задаче Леонардо из Пизы, предложенной в нача- ле XIII в. Леонардо сформулировал свою задачу так: «Некто поместил пару кроликов в загоне, огороженном со всех сторон, дабы знать, сколько пар кро- ликов родится в течение года. Природа кроликов такова, что через месяц пара кроликов производит на свет другую пару, а потомство дают они со второго месяца после своего рождения. Поскольку первая пара в первом месяце дает потомство, то удвой число кроликов, и в первом месяце окажутся две пары. Из них одна, а именно первая, пара дает потомство и в следующем месяце, так что во втором месяце окажутся три пары... Сколько пар произвела первая пара в загоне к концу одного года?» Найти формулу, показывающую сколько кроликов Fn будет через п месяцев. Каково будет отношение Fn+i/Fn при больших п? 13. В трапеции АВ CD с основанием АВ = а и CD = b проведен отрезок А1В1, соединяющий середины диагоналей. В трапеции A^BiCD проведен отрезок, соединяющий середины диагоналей и т. д. Что вы можете сказать о последо- вательности длин отрезков {АпВп}? 14. Предположим, что универсальная функция д(х), которая является решением уравнения имеет неподвижную точку х*. Показать, что она имеет и цикл S2. 15. Как ведут себя итерации отображения zn+i = Ах®"?
200 Глава 7 16. Почему у «растягивающих» одномерных отображений /, у которых \df/dx\ > 1 на всем отрезке, не бывает устойчивых циклов? 17. Каковы достаточные условия устойчивости неподвижной точки (ж*, у*) дву- мерного отображения ®n+l = /(%П>Уп)> Уп+i ~ УпУ? 18. Пусть «j — 1, х2 — а > 0 и / ^n+l ®п+1 — п V 2жп_1 п > 1. Докажите, что последовательность {жп} сходится и определите ее предел. 19. Пусть Со > 0, С1 > 0 и Сп+1 = + v/Cn-l При п 1. Доказать, что последовательность сходится и найти ее предел. 20. С какого дня чаще всего начинается новый год: с субботы или с воскресенья? Напомним, что обычно в високосном году 366 дней, однако годы, номера которых делятся на 100, но не делятся на 400, имеют 365 дней. 21. Последовательность {жп} задана следующим образом: Zi = а, т - 2х" "+1 _ Зх> - 1 при п 1. Найти все а, при которых последовательность {хп} определена и имеет конечный предел. Рекомендуемая литература Общий взгляд на теорию одномерных отображений и обсуждение основополага- ющих результатов дают книги: Collet Р, Eckmann J. Р. Iterated maps on the interval as dynamical systems. Basel; Stuttgart: Birkhauser, 1980; Шустер Г. Детерминированный хаос: Введение. М.: Мир, 1988; Гукенхеймер Дж., Холмс П. Нелинейные колебания, динамические системы и бифуркации векторных полей / Пер. с англ. Ижевск: РХД, 2002. Теория универсальности обсуждается как в этих книгах, так и в статьях: Фейгенбаум М. Универсальность в поведении нелинейных систем // Успехи физ. наук. 1983. Т. 141. №2. - С. 343; Кузнецов Л. IT., Кузнецов С. П. Критическая динамика одномерных отоб- ражений. 4.1. Сценарий Фейгенбаума // Изв. вузов. Прикл. нелинейная динамика. 1993. Т. 1. № 1/2. - С. 15-33. Более серьезной математической подготовки требует чтение оригинальных статей: Feigenbaum М. J. Quantitative universality for a class of nonlinear transformations // J. Statist. Phys. 1978. Vol. 19. № 1. - P. 25-52;
Простейшие системы с дискретным временем 201 Feigenbaum М. J. The universal metric properties of nolinear transformations // J. Statist. Phys. 1979. Vol. 21. №6. - P. 669-706; Вул E. Б., Синай Я. Г., Ханин К. М. Универсальность Фейгенбаума и термоди- намический формализм И Успехи мат. наук. 1984. Т. 39. № 3. — С. 3-37. Обзор ряда ключевых результатов в этой области, ориентированный на математи- ков, дают книги: Шарковский А. Н., Майстренко Ю.Л., Романенко Е. Ю. Разностные уравнения и их применения. Киев: Наук, думка, 1986; Итоги науки и техники. Современные проблемы математики. Фундаменталь- ные направления. Динамические системы. М.: ВИНИТИ, 1985. Т. 2.
Escher M.C. Witch. 1931 Эшер M. К. Ведьма
Глава 8 Автоколебания и предельные циклы Не кто иной, как Ньютон, показал нам, что закон есть лишь необходимое соотношение между настоящим состоянием и состояни- ем, непосредственно следующим. Все другие законы, открытые позднее, дают то же са- мое: это — в итоге — дифференциальные уравнения. К. Пуанкаре Фундаментальный закон динамики — второй закон Ньютона — определяется системой дифференциальных уравнений. Когда движение происходит вдоль прямой и сила, действующая на материальную точку, зависит только от координат и скорости точки F = F(x, х), эту модель можно представить в виде системы двух автономных дифференциальных уравнений X = f(x,y), У=9(х,у), (8.1) х(0) = х0, У(О) = Уо. (В законе Ньютона f(x, у) = у, д(х, у) = F(x, у)/т.) Модели такого типа, появившиеся вначале в динамике (отсюда и об- щее название — динамические системы), сейчас широко используются в электронике, химической кинетике, экологии и во многих других об- ластях. Системы вида (8.1) составляют основу теории колебаний. Одним из их наиболее интересных свойств является то, что эти системы могут описывать автоколебания. Под автоколебаниями понимают незатухаю- щие колебания в неконсервативных нелинейных системах, при которых основные характеристики колебаний (амплитуда, частота, форма колеба- ний и т. д.) определяются параметрами системы и в некоторых пределах не зависят от выбора исходного начального состояния (жо, уо). Фазовым пространством этого уравнения является плоскость либо другая двумерная поверхность, что делает наглядным поведение семейства фазовых траекторий и позволяет получить ясное представление о каче- ственном поведении модели.
204 Глава 8 Несколько таких систем, связанных с движением маятника и движе- нием планеты вокруг Солнца, мы рассмотрели в первых главах. В этой главе мы обсудим некоторые другие базовые модели вида (8.1), обращая основное внимание на способы их качественного исследования. Иными словами, нас будут интересовать приемы, позволяющие ответить на вопро- сы: каково число состояний равновесия у данной динамической системы, устойчивы они или нет, существуют ли замкнутые траектории, сколько их, как они расположены, каковы их области притяжения. Исследование систем вида (8.1) обычно начинают с анализа следую- щих вопросов. Диссипативна ли изучаемая система? Важно выяснить, имеет ли система аттракторы, стремятся ли в ней друг к другу близкие траектории. Чтобы научиться отвечать на этот вопрос, уточним понятие диссипативной системы. Для этого нам придется изменить точку зрения на все модели, которые мы рассматривали раньше. До сих пор в каждом случае речь шла об одной конкретной динамической системе, поведение которой задавалось одними начальными данными. Теперь мы на время откажемся от этого подхода и будем иметь дело с ансамблем динамических систем, начальные данные которых (жо,!/о) принадлежат некоторой области фазового пространства (7(0). Далее мы представим, что каждая из этого бесконечного множества систем эволюционирует в соответствии с уравнением (8.1). Выясним, как при этом меняется образ области фазового пространства (7(0) — G(t) (см. рис. 8.1). Области G(t) принадлежат точки в фазовом про- странстве (x(t),y(t)) системы с начальными данными (®о,2/о), принад- лежащими (7(0). Область G(t) с течением времени не может разбиться на несколько несвязных кусков. Кроме того, точка не мо- жет оказаться образом двух различных точек (ж'(0), у'(0)), (ж"(0), у"(0)). Рис. 8.1. Типичная картина изменения фазового объема малого элемента: а) в консервативной; б) в диссипативной системе
Автоколебания и предельные циклы 205 *1 ++ ^1+«2 Х{+ М* f(xltyi) Рис. 8.2. Изменение фазового объема малого элемента Иное поведение противоречило бы теореме о непрерывной зависимости решений от начальных данных, а также теореме единственности. Выясним, как будет меняться фазовый объем области G(t) (в случае двух переменных он просто совпадает с площадью). Выберем вначале некоторый малый треугольник АВС. Посчитав площадь соответствующих треугольников (см. рис. 8.2) и трапеции, либо воспользовавшись известной из аналитической геометрии формулой для векторного произведения, убедимся, что ai bi _ 1 0,2 62 = t(oj62 - 02&i)- Возьмем малое конечное приращение At. Пусть в момент ti дина- мическая система находилась в точке фазового пространства (x(ti), Тогда в момент t\ -I- At она окажется в точке x(t} + At) = x(ti) + At/(®i, з/i), y(ti + At) = j/(ti) + Atp(®i, j/i), (8.2) как это следует из уравнения (8.1). Бесконечно малыми величинами более высокого порядка (At)2, (At)3 и т.д. будем пренебрегать. Тогда точки Л, В, С (см. рис. 8.2) через интервал At окажутся в точках Л', В', С' фазового пространства Л = (з?1,з/1) -+ (xi + At/(жi,3/i), з/1 +At^(®i,3/i)) = Л', В = (zi +ai,3/i +61) -+ (®i +01 + At/(xi +oi,t>i +з/1), 3/1 + bi + Atp(xi + oi, 6i + з/i)) = В', С = (xi + 02, з/i + 62) -+ («1 + о2 + At/(a?i + 02,3/1 + 62), 3/1 + 62 + Atp(®i + o2,3/1 + 62)) = С'. В этих равенствах мы для краткости обозначили x(t\) и y(t\) соответствен- но через х\ и 3/1. Считая, что треугольник АВС имеет малые размеры,
206 Глава 8 воспользуемся разложением в ряд Тейлора /(Ж1 + ai, bi +2/1) = / + fxai + fybi + ... . Здесь мы опустили аргументы у функции /, поскольку далее все будет относиться к точке («|, yi). Это дает возможность найти координаты векторов А'В1 — (a2tb'2), А!С - (а\,Ь\) Oj ~ G1 + А£(в1/Х + b\fy), b\ ~ + Ы(а,\дх + Ь\ду)у ^2 ~ + Ь2/у), Ь'2 « Ь2 + Д£(о2£е + Ь2ду). Последние соотношения позволяют найти площадь треугольника А'В'С’ (малыми искажениями ребер можно пренебречь) Sa'B'C' = 2 det ai + &t(a}fx + bify) bi + + bigy) a2 + At(a2fx + b2fy) b2 + At(a2gx + b2gy) 1 - det 2 ai bi a2 b2 ai e2 bi b2 2 SАве = F($i), S^B'C1 = V(ti + AO- В этих равенствах мы пренебрегаем членами порядка (ДО2- Из форму- лы (8.3) видно, что 1 + ДО - v(ti) _ — (Л +9y)V(ti)' Таким образом, изменение малого элемента фазового объема опреде- ляется соотношением V = QV, где П = Л+ру. (8.4) Это важное соотношение обобщается на автономные системы любого порядка N Ъ = fi(xi,... ,xN); i = N V = SIV, где + (85) w dXi Формула (8.5) позволяет уточнить понятие диссипативной системы. Диссипативными мы будем называть динамические системы, у которых Q < 0, хотя бы в некоторых областях фазового пространства. Консерва- тивными системами мы будем называть динамические системы с Q = 0.
Автоколебания и предельные циклы 207 Можно проверить, что рассмотренные выше модели маятника и дви- жения планеты таковы, что 0 = 0. Таковыми являются все гамильтоновы системы, к которым относится большинство математических моделей классической механики . _ <Wf(p, q) . _ дН(р, q) gi др, ’ Pi dq, ’ _ЛргЯ(р.9~) \dqi dpi) “\ dqidpi dpidqi J • — 1 Существует принципиальное отличие между нелинейными явлени- ями, которые описываются диссипативными и консервативными систе- мами. Для того чтобы моделировать то или иное явление с помощью консервативной системы, нужно иметь ясное представление, что в изу- чаемом случае сохраняется и по каким причинам. Именно поэтому при мягком моделировании в экономике, экологии, социологии, психологии обычно обращаются к диссипативным системам. Кроме того, во многих задачах гидродинамики, радиофизики, химической кинетики, биологии, физики плазмы существенную роль играют диссипативные процессы, связанные с рассеянием энергии, вещества, с необратимыми явлениями, поэтому и там обычно появляются диссипативные динамические системы. Консервативные системы возникают в задачах классической механики, особенно небесной механики, физики плазмы, теории волн, а также в ря- де фундаментальных теорий, в которых ключевую роль играют различные симметрии и связанные с ними законы сохранения. Кардинальное отличие диссипативных систем от консервативных состоит в том, что в первых системах может происходить выход на ат- тракторы и «забывание начальных данных», в то время как во вторых начальные данные не забываются, а поэтому играют гораздо более важ- ную роль. Кроме того, диссипативные ситемы часто обладают свойством грубости или структурной устойчивости. Под этим понимается часто со- хранение качественных свойств (в частности, числа и типов аттракторов) при малых изменениях правых частей. Вместе с тем, достаточно внести сколь угодно малое «диссипативное» возмущение в консервативную систему, и ее поведение при t оо станет совершенно иным. Естественно, отличается и математический аппарат, разработанный для анализа этих двух классов систем. В дальнейшем мы сосредоточим внимание на диссипативных системах. При изучении некоторых систем трех и большего числа дифферен- циальных уравнений часто возникают ситуации, когда величина Q < 0 во всем фазовом пространстве. Однако, обратившись к рассмотренному логистическому уравнению, мы увидим, что величина Q положительна при 0 < х < 1/2 и отрицательна при 1/2 < х < оо. Так же устроено большинство систем двух автономных обыкновенных дифференциальных
208 Глава 8 уравнений. В таких системах области с Q > 0 иногда называют областями недиссипативности. Выделение областей недиссипативности при анализе конкретных систем часто бывает очень полезным, поскольку аттрактор динамической системы (8.5) не может целиком лежать в области недиссипативности. Предположим, что это не так, и аттрактор системы А (на рис. 8.1 б это предельный цикл) вместе с областью притяжения В принадлежит области недиссипативности Н (Q > 0, если х G Я). Выделим узкую трубку Sa вокруг аттрактора, которая принадлежит В. Рассмотрим, что произойдет с фазовым объемом V(t) тех систем, у кото- рых ж(0) G Sa- Поскольку А — аттрактор, и Sa принадлежит его области притяжения x(t) -> х G А. Поэтому V(t) У(Л), при t оо. Будем считать, что фазовый объем аттрактора А равен нулю (очевидно, это так для особых точек и предельных циклов, которые мы уже рассматривали). Поэтому V(t) —> 0 при t оо. Но это противоречит соотношению (8.5), в силу которого величина V(t) должна возрастать! Для системы дифференциальных уравнений (8.1) имеет место дру- гой замечательный результат, связывающий существование предельных циклов и величину Q. Теорема. Если в некоторой односвязной области D величина Q нигде не меняет знак и не равняется тождественно нулю, то в области D нет предельных циклов. Сформулированную теорему часто называют критерием Бендиксона. Это утверждение можно доказать от противного. Действительно, допу- стим, что в области D существует предельный цикл Г с внутренней областью G. По теореме Стокса A dr = УУ (rot A )n dG. Г G Положим, что А = (-g,f\, dr = (dx,dy) = (fdt,gdt). Именно в последнем равенстве учитывается то, что мы имеем дело с векторным полем, соответствующим динамической системе (8.1). Очевидно, интеграл по предельному циклу от вектора А равен нулю. Из формулы для ротора векторного поля i j k Т д д д rot А = det — — — , дх ду dz Ах Ay Az в которой i,j,k — единичные векторы в направлении осей х, у, z; Ax,Ay,Az — компоненты вектора А, получим, что (rot А )х = (rot А )у = о, / л \ г (дАх \ (rot A)z = fc( -ST - -ST = fc(A +9y • \ UX oy /
Автоколебания и предельные циклы 209 Следовательно, учитывая, что Г — предельный цикл динамической си- стемы, получим 0 = Ц\fx + 9у) dx dy = II Q(x,y) dx dy. G G Это противоречит условиям теоремы, поскольку интеграл по области G должен быть либо положительным, либо отрицательным. Это доказывает сформулированное утверждение. Рассмотрим в качестве примера одну из наиболее известных моделей вида (8.1). Пример 1. Модель Лотка-Вольтерра. Одной из первых математических моде- лей, в которой система двух обыкновенных дифференциальных уравнений использовалась для мягкого моделирования, стала модель, описывающая изменение численности двух взаимодействующих биологических видов. В. Вольтерра в начале века обратил внимание на периодические колебания численности крупных рыб-хищников и мелких рыб. Модель Лотка—Вольтерра, названная впоследствии моделью типа хищник—жертва, была предложена для объяснения именно этого явления. В. Вольтерра обосновывает эту модель следующим образом: «Если бы в среде, где обитают эти виды, находился только один из них, а именно, жертва, то у него был бы некоторый коэффициент прироста €\, который мы будем предполагать постоянным и положительным. Другой вид (хищ- ник), питающийся только (или в основном) жертвой, в предположении, что он существует изолированно, имеет некоторый коэффициент при- роста -е2, который будем считать постоянным и отрицательным. Когда такие два вида сосуществуют в ограниченной среде, первый будет раз- виваться тем медленнее, чем больше существует индивидуумов второго вида, а второй — тем быстрее, чем многочисленнее будет первый вид. Гипотеза, довольно простая, состоит в том, что коэффициенты прироста равны соответственно £1 - 717^2 И -£2+72-^1, (71,72 ~ положительные постоянные). Это приводит к системе диффе- ренциальных уравнений для описания численности видов: dNi -7i^2), Д , , <8-7> dt (^i,^2,71»72 > 0)». Характерной особенностью этой системы является наличие неко- торой сохраняющейся величины. Непосредственно из уравнений (8.7) следует, что dN' , dN> 72—^“ + 71 ~7Г = <472^1 - ^271-^2» dt dt 1 dN} 1 dN2 = -71^2 + ^172^1- N\ dt N2 dt
210 Глава 8 Поэтому 72^1 - +71^2 - ^2 = о, 72N\ - €2 log Wi + 71^2 - е 1 log N2 = С = const, (8.8) е^лг'дг-^ = Се“71"2^'. В фазовой плоскости (N\,N2) каждому значению С соответствует замкнутая кривая (см. рис. 8.3). Внутри этих кривых находится особая точка (£2 /72, £1/71), в которой Ж,^2)=р(ЛГьЛГ2) = 0. Если считать, что в начальный момент времени точка (iVi(O), ^г(О)) близка к этой особой точке, то можно линеаризовать динамическую систему (8.8) в окрестности этого состояния равновесия Рис. 8.3. Типичные фазовые траек- тории в модели Лотка—Вольтерра N2 = — + ДЖ 7i После стандартной процедуры, свя- занной с линеаризацией членов вто- рого порядка малости, получим ДАТ, = 72 ддг2 = З^ддг, => 71 => + <4лг, = 0, ш = у/ёТё!, V ДЛГ| = ДЛГ|(0)со5(ы«), A.N2 = sin (oi«). ^271 Другими словами, в этом приближении уравнение сводится к линей- ной динамической системе, описывающей малые колебания математиче- ского маятника, с частотой y/eiEj. В окрестности особой точки колебания близки к гармоническим. Вдали от этой точки колебания имеют более сложную форму. Эти колебания можно интерпретировать следующим об- разом. До тех пор пока численность популяции жертв достаточно велика, численность хищников тоже растет (участок АВ на рис. 8.4). Однако имеет место отрицательная обратная связь: увеличение числа хищников приво- дит к уменьшению популяции жертв. Это приводит к тому, что начинает уменьшаться число хищников (участок ВС на рис. 8.4). Но когда Niti)
Автоколебания и предельные циклы 211 Рис. 8.4. Характерный вид интегральной кривой в модели (8.7) становится достаточно мало, то начинает вновь расти числен- ность жертв. Это снова приводит к росту численности хищников и т.д. Комментируя биологичес- кие следствия построенной ма- тематической модели, В. Воль- терра отмечает: «Тем, кто зай- мется экспериментальной про- веркой полученных результатов, т. е. приложением теории, выпа- дет на долю детальный анализ начальных предположений и биологической законности выводов на основе экспериментов, наблюдений и их статисти- ческой обработки». Следует отметить, что во многих задачах, связанных с математическим моделированием, эта часть работы является наибо- лее сложной и трудоемкой. Именно поэтому на стадии математического исследования модели следует выявить ее возможные недостатки. Для динамической системы (8.7) к таким недостаткам, по-видимому, следует отнести существование интеграла (8.8). В самом деле, естественно предположить, что если в определенном ареале обитания животных имеют место колебания численности популяций, то их амплитуда и период зависят от свойств ареала и проживающих в нем видов. В то же время можно полагать, что от малого изменения начальных данных 7Vi(0) и амплитуда и период не зависят. Другими словами, в системе должны наблюдаться автоколебания. Этим свойством модель (8.7) и не обладает. В самом деле, величи- ны JVi(O) и #г(0) однозначно определяют постоянную С в соответствии с формулой (8.8). В то же время различным значениям этой постоянной отвечают различные замкнутые кривые на фазовой плоскости и, следова- тельно, колебания различной амплитуды, т. е. начальные данные в такой системе никогда не будут забыты. Обратим внимание на то, что это происходит, хотя в этой системе П / 0. Вернемся к тем традиционным вопросам, которые обычно выяс- няют при исследовании систем двух обыкновенных дифференциальных уравнений. Каковы состояния равновесия в изучаемой модели? Чтобы выяснить это, нужно решить систему двух алгебраических уравнений f(x, у) = 0, д(х, у) = 0. (8.9) Пусть (х*,у*) одно из решений этой системы. Пара чисел (ж*, у*) опре- деляет координаты особой точки в фазовом пространстве. Чтобы опре- делить, каков тип этой точки, т. е. каково поведение траекторий в ее
212 Глава 8 окрестности, рассматривают уравнение (8.1), линеаризованное в окрест- ности этой точки: x(t) = Дж(0 + ж*, y(t) = Ду(0 + у*, Дж = f(x -I- Дж, у* + Ду) « /(ж*, у*) 4- ап Дж 4- а^Ду, Ду = у(ж* 4- Дж, у* 4- Ду) « у(ж*, у*) + 021 Д« 4- в22Ду, где Он = А(ж*,у*), 012 = Л(ж*,у*), 021 = уг(ж*,у*), о22 =у„(ж*,у*),т.е. правые части содержат первые три члена в соответствующих рядах Тейло- ра. Учитывая, что (ж*, у*) — точка равновесия и пренебрегая бесконечно малыми второго порядка, получим линейное уравнение Дж = оц Дж 4- о^Ду, Ду = 021 Дж 4- 022 Ду. (8.10) Предположив, что Дж = exp {pt}, Ду = exp {pt} (ci и C2 — посто- янные), получим однородное линейное уравнение (оц -р)С1 4-ОцСг = 0, «21С1 4-(022 -р)С2 =0. (8.11) Чтобы уравнение (8.11) имело нетривиальное решение, величина р должна удовлетворять характеристическому (вековому) уравнению det Оц - р 012 021 <122 - Р V р2 - («11 4- «22 )? 4- (ОцО22 - О12«21) = О, (8.12) р2 4-oip4-ao = 0, где Oi = -Sp4, ao = det4, А = Оц <121 <112 <122 Здесь через Sp А и det А обозначены соответственно след и детерминант матрицы А. Тип особой точки (ж*, у*) определяется корнями р\ и р2 уравне- ния (8.12). Разным типам равновесных состояний соответствуют различные ти- пы движения в окрестности равновесия, которые часто также называют режимами. Обратимся к рис. 8.5: о) pi и р2 — действительные отрицательные числа, особая точка — устойчивый узел. Точка, определяющая состояние системы на фазовой плоскости, апериодически приближается к состоянию равновесия; d) р\ и р2 — действительные положительные числа; особая точка — неустойчивый узел. Точка, определяющая состояние системы, апери- одически удаляется от состояния равновесия;
Автоколебания и предельные циклы 213 Рис. 8.5. Состояния равновесия в автономной системе двух обыкновенных дифференциальных уравнений в) р\ и р2 — комплексные числа с отрицательной действительной ча- стью; особая точка — устойчивый фокус. Точка, определяющая состо- яние системы, совершает затухающие колебания и асимптотически приближается к состоянию равновесия; г) р\ и р2 — комплексные числа с положительной действительной частью; особая точка — неустойчивый фокус. Точка, определяющая состояние системы, совершает колебания растущей амплитуды и уда- ляется от состояния равновесия; д) Р\ и р2 — действительные числа, имеющие разные знаки; особая точка — седло', неустойчивый режим. При малом случайном откло- нении от состояния равновесия система начинает удаляться от него в заданном направлении. Однако, «точно прицелившись», можно бесконечно долго двигаться по направлению к особой точке. Две выделенные интегральные кривые, входящие в особую точку, назы- ваются устойчивыми многообразиями седла (ОА и ОВ). Линии, вдоль которых точка быстрее всего удаляется от положения равновесия — неустойчивые многообразия', е) р\ и 02 — чисто мнимые числа; особая точка — центр. Наблюдаются незатухающие колебания и фазовая траектория системы представляет собой эллипс. При малом отклонении от равновесия система начи- нает описывать эллипс вокруг точки (ж*, у*). Положение равновесия здесь устойчиво, но не асимптотически устойчиво. Как мы видели из уравнения (8.12), тип особой точки определяется следом и детерминантом матрицы линеаризованной системы или чис-
214 Глава 8 лами ац и ао- Если считать, что система (8.1) зависит от параметра Л и соответственно aj = ai(A), аг = аг (А), то для того, чтобы разобрать- ся, как может измениться тип особой точки при изменении параметра, полезным оказывается рис. 8.6. Этот рисунок построен, исходя из теоремы Виета и элементарных свойств квадратного уравнения (8.12). В частности, из него видно, что при малом изменении центр обычно становится устойчивым или не- устойчивым фокусом. Кроме того, видно, что на линии ао = а,/4 фокус становится узлом. 3. Существуют ли предельные циклы в системе (8.1) и каковы они? Существование предельных циклов является главным отличием си- стемы двух дифференциальных уравнений от одного уравнения. Рас- смотрим вначале самую простую модель, в которой единственным ат- Рис. 8.6. Разбиение про- странства параметров по типу состояний рав- новесия: 1 — устойчи- вый узел; 2 — неустой- чивый узел; 3 — устой- чивый фокус; 4 — не- устойчивый фокус; 5 — седло; 6 — центр трактором является предельный цикл и в котором можно найти аналитически все множество инте- гральных кривых. Эта динамическая система воз- никает в химической кинетике, в гидродинамике, в теории волн, при асимптотическом описании множества моделей вида (8.1), параметры которых лежат вблизи линии ai = 0, ао > 0 (см. рис. 8.6). Эту систему двух уравнений для x(t) и у(1) удобно записать в виде одного уравнения для ком- плексной функции JF(0, W(t) = x(t) + iy(t), dW э —- = ЛИ'-(1-Нс2)|ИТИЛ, 1Г(О) = РГо. (8.13) dt Анализ этого уравнения намного упростится, если перейти в полярную систему координат, считая, что х = г cos <р, у = г sin ip. Тогда \W\2 = х2 + у2 = г2. Учитывая, что х = г cos <р - г sin р • р, у = t sin у? 4- г cos р • р, перепишем уравнения (8.13) в полярной системе координат f cos р - г sin р • р = Ar cos р - г3(cos р - с2 sin р), г sin р 4- г cos р • р = Ar sin р - r3(sin р 4- с2 sin р). Домножив первое уравнение на cos у?, а второе на sin р и сложив, получим г — Аг - г3. (8.14)
Автоколебания и предельные циклы 215 Домножив первое уравнение на -sinу?, а второе на cosy? и сложив, получим ф = -С2Г2. (8.15) Замечательным свойством обсуждаемой модели является то, что урав- нение для г можно решать отдельно, не обращая внимание на уравнение для у?. Особой точкой для уравнения (8.13) является начало координат г = 0. При А > 0 существует еще одна особая точка г = VX. В исходном уравне- нии этой точке соответствует замкнутая кривая, являющаяся окружностью г = ^Х, у? = -C2Xt. (8.16) Именно эта кривая является устойчивым предельным циклом. В этом можно убедиться, построив все остальные интегральные кривые г = Хг - г3; г = R(t) exp {Xt}, R = -R3 exp {2Ai}> 1 1 exp {2Ai} 2 ’ Я1 = 2A + C' •U Из формулы (8.17) следует, что при А < 0 независимо от начальных усло- вий г(0) = Го и у?(0) = у?о фазовые кривые стремятся к началу координат. Когда А > 0, из этого соотношения видно, что ехр{А£} -> оо, и поэтому r(t) -> JX. Следовательно, аттрактором здесь является решение (8.16). Таким образом, при А = 0 происходит следующая бифуркация: устойчивый фокус становится неустойчивым и рождается устойчивый предельный цикл малой амплитуды ~у/Х. Эта бифуркация в литерату- ре называется бифуркацией рождения предельного цикла или бифуркацией Андронова—Хопфа. Типичная картина при положительных и отрицатель- ных значениях А представлена на рис. 8.7 а. Зависимость аттрактора от параметра А показана на рис. 8.7 б. Возможен и другой вариант бифуркации рождения цикла, в результате которой появляется неустойчивый предельный цикл (см. рис. 8.7 в). Она, в частности, происходит в системе dW , — = -XW + (1 + гс2) | W |2 W. dt Это уравнение переходит в модель (8.13) в результате замены t -> -t. Это приводит к тому, что картина в этом случае будет в точности такой же, как
216 Глава 8 Рис. 8.7. Бифуркация рождения предельного цикла: а) зависимость аттрактора системы (8.13) от параметра А; б) рождение устойчивого цикла при увеличении параметра А; в) «аннигиляция» устойчивого фокуса и неустойчивого предельного цикла на рис. 8.7 а, если на нем направления стрелок изменить на противопо- ложные. При этом устойчивый фокус станет неустойчивым, устойчивый предельный цикл — неустойчивым. Следовательно, здесь в результате бифуркации из неустойчивого фокуса рождается неустойчивый цикл, а фокус в начале координат становится устойчивым. Здесь мы сталкиваемся с интересным нелинейным явлением: в ре- зультате столкновения двух неустойчивых инвариантных множеств рож- дается аттрактор — устойчивый фокус. Размер области притяжения этого аттрактора растет при увеличении параметра как \/А. Приведем при- мер математической модели, в которой обнаружение предельного цикла сыграло ключевую роль. Пример 2. Модель брюсселятора. Модель брюсселятора или тримолекулярная модель, как ее часто называют, предложенная в 1968 г. И. Пригожиным и Р. Лефевром, вероятно, сейчас является одной из наиболее известных моделей химической кинетики. С помощью этой модели и ее обобщения на пространственно-распределенные системы было предсказано несколь- ко интересных нелинейных явлений. Будем рассматривать химическую реакцию с двумя промежуточными продуктами X и Y, концентрация которых может меняться со временем. Система предполагается открытой и все остальные концентрации — постоянными. Рассматриваемая совокупность реакций такова: fci Е + А X, 2Х + Y к-\ k-j k-2 Л-4
Автоколебания и предельные циклы 217 Неравновесные условия создаются за счет немедленного удаления веществ D и Е из реактора. Это эквивалентно предположению о том, что fc_4 = к-2 = 0. Будем считать также, что к-\ ~ 0, что имеет место в условиях избытка вещества А, и Л-з ~ 0. Эти предположения вместе с законом действующих масс приводят к динамической системе X = к,А - (к2В + kt)X + k3X2Y, ___ __ (8.18) Y = к2ВХ - k2X2Y. Замены переменных, связанные с изменением масштабов t,X,Y и пере- обозначениями, позволяют перейти к уравнениям Х = Я-(В+1)Х + Х2У, Y = ВХ - X2Y, (819> О < t < оо, Х(0, t) = Хо, У (О, t) = Уо. Динамическую систему (8.19) и называют брюсселятором. Ее особые точки определяются алгебраическими уравнениями А - (В + 1)Х + X2Y = 0, ВХ - X2Y = 0. Второму уравнению удовлетворяют значения X = 0 и X = В/Y. Однако если X = 0, то не будет выполнено первое уравнение. Из второго уравне- ния видно, что Y 0, так как иначе X = 0. Следовательно, учитывая, что XY = В, находим координаты осо- бой точки Выясним, при каких условиях, эта точка устойчива. Считая, что X = ДХ + A, Y = ДУ -|- В/А получим линеаризованную в окрестности осо- бой точки систему ДХ = (В - 1)ДХ + Л2ДУ, ДУ = -ВДУ - Л2ДУ. Рис. 8.8. Характерный вид предельного цикла в модели брюсселятора вдали от точки бифуркации Отсюда следует, что ао = A2, ai = Л2 + 1-В. Параметром, который можно изменять в системе, является концентрация В. Рисунок 8.6 показывает, что будет происходить с особой точкой этой системы при увеличении параметра В. Поскольку ао = Л2 > 0, точка, характеризующая систему в пространстве параметров, лежит в верхней полуплоскости. Когда В мало (В < Л2-2Л-1-1, линия ao = af/4), особая точка является узлом. Затем она
218 Глава 8 становится устойчивым фокусом. И, наконец, при В = Л2 +1 устойчивый фокус становится неустойчивым. Здесь происходит бифуркация Хопфа. Аттрактором системы становится предельный цикл. Пример такого цикла при достаточно больших значениях параметра В показан на рис. 8.8. До начала 70-х гг. большинство химиков считало, что химические реакции не могут идти в колебательном режиме. Экспериментальные ис- следования советских ученых Б. П. Белоусова и А. М. Жаботинского убеди- тельно продемонстрировали существование таких реакций. Встал вопрос об их теоретическом анализе и построении соответствующих математиче- ских моделей. Можно сказать, что модель брюсселятора находится внизу большой иерархии математических моделей, описывающих колебатель- ные химические реакции. Она показывает, насколько простой может быть схема реакции, чтобы в открытой системе происходили автоколебания. Дальнейший анализ модели связан с выяснением закона изменения периода, амплитуды колебаний и других параметров предельного цикла в зависимости от параметра В. Обычно это делается с помощью тех или иных численных методов. Обратим внимание на несколько самых простых. 1. Метод установления. Задаются какие-либо начальные данные (X, Y) и набор параметров Л(Л1, Аз,...), для которых будут проводиться расчеты. При каждом значении параметра достаточно долго считается траектория (чтобы иметь дело с аттрактором, а не с переходным процессом) до тех пор, пока не происходит выход на предельный цикл, т. е. пока для некоторого интервала Т(Х), с желаемой точностью в, не будет выполнено условие |Х(« + Т(А)) - X(t)| + \Y(t + Т(А)) - У(«)| < е. Выполнение этого неравенства и дает основание утверждать, что в преде- лах точности расчетов мы имеем дело с периодическим решением. Основным достоинством такого подхода является простота. Два глав- ных недостатка следующие. Выход на аттрактор, особенно вблизи линий бифуркаций, может быть очень долгим. Стартуя с одних начальных дан- ных, можно при изменении параметра попасть в область притяжения другого аттрактора (поскольку области притяжения, естественно, зависят от параметров). Это может привести к неверному заключению, например, что цикл исчез или скачком изменил параметры. 2. Исследование функции последования, условие устойчивости пре* дельного цикла. Попробуем развить альтернативный подход нахождения цикла, не связанный с интегрированием траектории, до тех пор, пока она не выйдет на цикл. Проведем луч О А (см. рис. 8.9 а), заведомо пересекающий пре- дельный цикл и близкие траектории. Например, выходящий из особой точки О, которая лежит внутри предельного цикла. Введем координа- ту г вдоль этого луча. Рассмотрим траекторию, выходящую из точки А, принадлежащей лучу (см. рис. 8.9 а). Пусть эта траектория в первый раз
Автоколебания и предельные циклы 219 а) х б) х в) Рис. 8.9. Построение функции последования пересекает луч в точке В. Введем функцию ГВ = (8.20) которая каждой точке с координатой г а сопоставляет координату точ- ки В — гв- Предположим также, что время, за которое траектория попадает из точки А в точку В, конечно для цикла и всех близких к нему траекторий. Функция f является непрерывной и однозначной. Предположим противное. Если у функции f есть разрыв в точке С lim f(rc + е) / lim f(rc - е), е—>0 с->0 то это будет означать, что для модели (8.1) несправедлива теорема о не- прерывной зависимости решения от начальных данных в точке С. Если считать, что функция f неоднозначна, то это значит, что в неких точках не выполнена теорема единственности. Следовательно, до тех пор, пока не стало ясно, что мы столкнулись с ситуацией, когда приходится изучать модели, для которых стандартные теоремы существования и единствен- ности не выполнены, нет оснований считать отображение f разрывным или неоднозначным. Обозначим через гп координату n-го пересечения траектории с лу- чом. Тогда (8.20) можно записать в эквивалентном виде как одномерное отображение r„+I=/(r„). (8.21) Предельному циклу соответствует неподвижная точка этого отображе- ния г* г’ = /(/). (8.22) В самом деле, равенство (8.22) означает, что выйдя из точки с коорди- натой г* на оси О А, траектория через конечное время вернется в ту же самую точку. Очевидно, что если тп —>г* для всех и, принадлежащих е-окрестности точки г*, предельный цикл, которому соответствует значение г*, будет асимптотически устойчив.
220 Глава 8 Достаточное условие устойчивости совпадает с условием сходимости метода простой итерации (8.21) для решения алгебраического уравнения г = /(г) Т <«.«> аг Достаточное условие неустойчивости предельного цикла > I. <8.24) аг Замечание. Когда мы обсуждали одномерные отображения (условия устойчивости неподвижной точки) и сходимость метода простой итерации, то в соответствующих неравенствах стоял модуль. Здесь его можно опустить, поскольку df(x*)/dx 0. Последнее связано с тем, что фазовые траектории лежат на плоскости и не могут пересекаться. Из сказанного ясно, каким образом может быть численно построен предель- ный цикл в модели (8.1). Для этого достаточно решить алгебраическое уравне- ние (8.22) и найти точку с координатой г*, принадлежащую циклу. Это можно сделать, если удалось обнаружить точки з и q: f(s) > з и f(q) < q (см. рис. 8.9 б). Тогда в силу непрерывности функции f найдется точка г*, где f(r*) = г*. Чтобы найти ее, делим отрезок [s, g] пополам и рассматриваем значение f((s 4- q)/2). Если f((s 4- q)/2) > (s 4- q)/2, то на следующем шаге рассматриваем отрезок (s,,gi): Si = f((s 4- g)/2), q{ = q. Если f((s + q)/2) < (s + q)/2, to на следуй .нем шаге имеем дело с отрезком (sh q\): 3\ = з, q\ = f((s 4- q)/2). Отрезок (<8i, ) таков, что f(s\) > 3[, f(q\) < q\, поэтому к нему можно применить только что описанную процедуру, рассмотреть значение функции в середине этого отрезка f((sx 4-?i)/2), построить отрезок (s2,92) и т. д. Понятно, что |9п “ snl I? - з\/2п, поэтому k'-s„l s: Достоинством описанного подхода является его простота. Кроме то- го, он работает независимо от того, устойчив предельный цикл или нет, что может быть очень существенно. Основной недостаток — медлен- ная сходимость. Отметим, что обсуждавшийся раньше алгоритм счета на установление не позволяет выделять неустойчивые циклы. Напомним, что для получения значения /(г) по данному г нам нужно интегрировать систему дифференциальных уравнений с начальны- ми данными с координатой г до тех пор, пока траектория не пересечет луч О А. Поэтому применение в данном случае метода простой итера- ции, т. е. построение последовательности {гп}, (гп -> г* при п -> оо) по правилу ’’n+1 = f(r„) в этом случае эквивалентно счету на установление. Для решения уравнения (8.22), которое можно записать в виде F(r*) = 0, можно использовать метод Ньютона, но для этого нужно знать производ- ную dF/dr = \-df /dr. Самый простой способ сделать это — действовать
Автоколебания и предельные циклы 221 по определению производной: выбирается точка г1, близкая к ней точка г' + е. Обе траектории строятся численно до пересечения с лучом, что дает /(г') и f(r' 4- е). df(r) f(r +£) ~ f(r ) , . —-—~---------------- (см. рис. 8.9 tf). dr е Однако этот способ может быть неудобен, потому что нам приходится вычислять разность двух близких величин f(r' 4- е) и которые могут быть известны с довольно большой погрешностью, и делить ее на ма- лую величину. Поэтому поступают иначе — рассматривают две близкие траектории и = Л(й), v = h(v), u(0) = и, tf(0) = и 4- еы, (8.25) •U v(t) = u(t) 4- Au(0, u(t) 4- Дй(0 = h(u(t) 4- Au(0) = h(u) 4- Au 4-..., du Au(0) = еш. Затем получают уравнение для отклонения траектории v(t) от u(t) — Su(t), рассматривая разложения в ряд Тейлора. Если считать, что траектории u(t) и v(t) бесконечно близки, можно полагать, что квадратичные члены малы. Это позволяет получить так называемое уравнение в вариациях Дй(£) — —^-Аи = А(й)Ай. (8.26) ди Это уравнение линейно по Ай, производная dh(u)/du или матрица А — это не что иное, как якобиан, вычисляемый вдоль решения u(t). Если систему (8.25) записать в координатном виде, ui = hi(ui,...um) “dm — (U\, ... Um), TO ЙЦ ... Oim tfAl(Ul(Q...Um(O) du i dhm du i dhi dum ♦ * dhm dum (8.27) Oml • • • ^mm В качестве Дй(О) нужно было бы брать еш. Однако поскольку уравне- ние (8.26) линейно, то в качестве Дй(О) удобно брать единичный вектор
222 Глава 8 (8.28) в интересующем нас направлении ш. В нашем случае двух переменных вектор ш направлен вдоль луча О А Дй(0) = ш. Тогда, решив задачу (8.26), (8.28), мы получим v(t) = u(t) 4- eAu(t) => Su(t) = —^0- £ Таким образом, Дй(^) — производная решения u(t) по направлению ш. Ее очень удобно вычислять, решая одновременно с исходным уравнени- ем (8.25) систему в вариациях (8.26). Если для правой части (8.25) известно аналитическое выражение, то по формуле (8.27) может быть вычислена и правая часть системы в вариациях. Переходя от общего случая к конкретной системе двух уравнений и рассматривая более подробно рис. 8.9 в, можно найти производную df/dr. Пусть Т\ — время, через которое рассматриваемая траектория вновь пересекла луч О А, Дй(1\) — решение системы в вариациях (8.26), (8.27) в момент времени Т\. Вектор Дй(Т1) можно разложить по направлению луча ш (компонента Д«1 на рис. 8.9 в) и по перпендикулярному направ- лению (компонента Диг). Компонента Дг/i описывает смещение точки пересечения возмущенной траектории вдоль луча, компонента Д^2 отве- чает за то, что возмущенная траектория попадет на луч ОА несколько быстрее, чем исходная. Далее из простых геометрических соображений можно оценить производную df/dr. Обобщение обсуждавшегося подхода сейчас стало очень популярно при исследовании нелинейных явлений. При этом, переходя от моде- ли (8.1) к системам большего числа измерений, вместо луча О А нужно рассматривать некоторую гиперплоскость •Е1 , (8.29) О>\ 0>т которую называют плоскостью Пуанкаре. Сечение траекторий изучаемой динамической системы этой плоскостью называют сечением Пуанкаре. Аналогом координаты г является набор координат и,..., гт_\. Вместо одномерного отображения (8.21) возникает т - 1-мерное отображение fn+i=G(fn), f = (ri,...rm-i). (8.30) Простейшему предельному циклу соответствует неподвижная точка отоб- ражения (8.30) f * = £(f *). Однако предельный цикл в пространстве более двух измерений может не- сколько раз пересекать плоскость Пуанкаре. Циклы, q раз пересекающие эту плоскость, иногда обозначают через Sq. Переход от непрерывной системы т дифференциальных уравне- ний кт- 1-мерному отображению в ряде задач очень полезен. Прежде
Автоколебания и предельные циклы 223 всего потому, что о многих нелинейных явлениях гораздо проще го- ворить на языке дискретных отображений, чем на языке непрерывных динамических систем. Кроме того, многие системы дифференциальных уравнений порождают похожие отображения. Поэтому сейчас часто од- номерные и двумерные отображения рассматривают как упрощенные модели различных процессов. Во многих случаях важно не только уста- новить существование предельного цикла, но и выяснить, как зависят его характеристики от параметров задачи. Весьма часто это удается уста- новить с помощью асимптотических методов. Характерные черты этих методов мы проиллюстрируем на примере классической модели теории колебаний. Генератор Ван дер Поля Уравнение Ван дер Поля является одной из базовых математиче- ских моделей. Эта динамическая система — одно из наиболее полно исследованных дифференциальных уравнений. Данная модель возникла в радиоэлектронике при описании генера- ции колебаний в электронных схемах. Наличие сопротивления в линейном колебательном контуре приводит к тому, что энергия, имеющаяся в си- стеме, уменьшается и колебания затухают. Напомним, что сопротивление проводника играет роль вязкого трения в механической системе, которая описывается такими же уравнениями. Для того чтобы происходили незатухающие колебания, необходим приток энергии извне. Это может быть обеспечено, если в системе есть активные элементы. После прохождения тока через такие элементы колебания не ослабевают, а усиливаются. Такое поведение может обеспе- чиваться различными физическими процессами, например, включением электронных ламп, реализующих положительную обратную связь, в элек- трические цепи. Активные элементы могут быть созданы с помощью полу- проводников и сверхпроводящих туннельных диодов, диодов Ганна и т. д. К активным элементам относятся в более сложных системах оптические квантовые усилители, различные плазменные устройства, электронные пучки. Способы построения таких элементов подробно анализируются в курсах электроники и теории колебаний. Простейшим способом выяснить, к чему приводит наличие актив- ного элемента в цепи, является включение нелинейного сопротивления. Предположим, что в цепи есть элемент, который не удовлетворяет закону Ома. Это означает, что зависимость силы тока через элемент от при- ложенного напряжения г = i(v) (или, как ее называют, вольт-амперная характеристика) нелинейна i = i(v) = «о + a\v -I- d2V2 + ... . Самый простой активный элемент может быть линейным i = a\V, «1 = const < 0.
224 Глава 8 Однако область приложения такой модели очень невелика. В самом деле, энергия колебаний в системе должна неограниченно возрастать. В этом нетрудно убедиться — замена t на — t в линейной системе эквива- лентна замене R на -R. Поэтому замена знака сопротивления означает рост энергии. Следовательно, все отрицательные элементы по мере на- растания амплитуды тока или напряжения должны стать «менее отрица- тельными», а затем и положительными. Поэтому в большинстве случаев активные элементы приходится считать нелинейными. Рассмотрим простейший генератор, электрическая схема которого показана на рис. 8.10д. Вольт-амперная характеристика нелинейного эле- мента представлена на рис. 8.10 Она представляет собой кубическую параболу / 4t?\ i = i(v) = -GI v - - I. \ 3«02/ Когда |t>| < (\/3/2)г>о, сопротивление отрицательно. Если сила тока лежит в этом интервале, активный элемент обеспечивает поступление энергии в систему, вне этого интервала — ее диссипацию. Рис. 8.10. Модель Ван дер Поля: а) схема генератора; б) вольт-амперная характеристика активного элемента В соответствии с законом Кирхгофа, сумма токов в точке А должна быть равна нулю. Поэтому Продифференцировав это соотношение по времени и учитывая зависи- мость i = i(v), получим уравнение Ван дер Поля d2v G / 4v2 \ dv v ~dP~ С V ~^)~di + LC= * Замены переменных вида t' -> pt, v1 -> qu приводят это уравнение к следующей форме: й 4- и - б(1 - и2)й = 0. (8.31)
Автоколебания и предельные циклы 225 Естественно, его можно записать и как систему двух дифференциальных урав- нений первого порядка v = е(1 - u2)v - и, й = v. При е = 0 уравнение Ван дер Поля переходит в уравнение для колебаний математического маятника с частотой Шо = 1. Рис. 8.11. Когда величина G/С ма- ла, то уравнение Ван дер Поля опи- сывает колебания, близкие к сину- соидальным С помощью компьютера нетруд- но выяснить, что при малых значе- ниях е в системе есть единственный предельный цикл, а установившиеся колебания близки по форме к синусо- идальным (см. рис. 8.11). Следовательно, схему, показанную на рис. 8.10, можно использовать как генератор таких колебаний. Синусоидальные электромагнитные колебания широко используются в радио- и телевеща- нии. На них накладывается медленная модуляция, кодирующая звук или изображение. Возникает закономерный вопрос: какова частота и амплитуда пре- дельного цикла в динамической системе (8.31) и других системах такого рода? Зная из расчетов, что колебания близки к гармоническим, а пара- метр е мал, воспользуемся асимптотическими методами. Для чего нужны асимптотические методы? Прежде чем воспользоваться каким-либо методом, естественно вы- яснить, нельзя ли действовать самым простым и естественным образом, исходя из первых принципов. Будем искать прямое разложение решения в виде u(t, е) — Uo(t) -I- EU\(t) + £2«2(0 • • • (8.32) Подставим этот вид в уравнение (8.31) tio + siii + • • • + «о + eui + •.. = е(1 - «о “ 2e«o«i + • • -)(«о + + ...) и приравняем члены при различных степенях € €° => Йо + = 0, 1 •• • 2 • € => Щ + U\ = Uq - UqUq. (8.33а) (8.336) Естественно далее последовательно решать линейные уравнения отно- сительно uo,«i и т.д. и получать решение в виде (8.32). Цель всех дальнейших рассуждений этого пункта сводится к тому, чтобы показать, что так действовать нельзя.
226 Глава 8 Решение уравнения (8.33а) имеет вид Uq = A sin (t 4- <ро), А = const, <ро = const. Подставив это выражение в уравнение (8.336), получим Й1 4- Ui = A cos (t 4- 9?о) - ^43 cos (t 4- 9?о) sin2(f 4- <£о) = , z, к z. , . 1 - cos (2t 4-2^0) = A cos (t 4- 9?о) - A cos (t 4- <ро) = A cos (t 4- <ро) - А 2 cos (t 4- y?o) + cos (3f 4- 3y?o) = cos (t 4- ¥>o) A - — 4- — cos (3t 4- 3y>o). 4 (834) Здесь мы воспользовались тем, что ,2 1 - cos 2а Л 1 - , ЛЧ1 sm а =----------- и cos a cos р = -[cos (а 4- р) 4- cos (а -p)J. Поскольку уравнение (8.34) линейно, его решение можно представить в виде суммы решений трех уравнений (8.356) где Частные решения этих уравнений: • /X ч ct p = osin(r4-^i), ^i— const, —cos r = ~ — cos(3f + 39?o). О (8.36) Особенно важной представляется зависимость q(t), в которую явно входит временная координата. (Уравнение (8.356) можно решить, вос- пользовавшись методом вариации постоянных.) Таким образом, прямое разложение дает следующее асимптотическое решение u(t, г) = A sin tcos(t 4-y>o)-— cos(3f4-y>o) 4-... • (8.37)
Автоколебания и предельные циклы 227 Замечание. Построенное решение должно удовлетворять начальным условиям. Если им удовлетворяет u0(t), то uo(O 4- ^ui(0 этим условиям удовлетворять не будет. Поэтому удобно считать, что А = Ао + бА\ 4- А2 + ..., у>о = “Ь 4- Е?ф2 + • • • • При этом, исходя из вида решения (8.37), нетрудно найти постоянные Ао, At,...; ^0,^1, ••• • Это позволяет считать, что зависимость p(t) (см. (8.36)) учтена уже в первом члене A sin (t 4- фо). Наличие подчеркнутых членов в выражении (8.36) и (8.37) играет принци- пиальную роль. Оно приводит к тому, что построенное приближенное решение не является периодическим. Кроме того, при t О(е~') поправочный член по- рядка е оказывается того же порядка, что и первый член разложения Uo(t), а то и больше его, что противоречит исходной посылке |ио(0| » |eui (i)l • Следователь- но, полученное разложение (8.37) является неравномерным по t, поскольку при больших временах его справедливость явно нарушается. В небесной механике произведения алгебраических и тригонометрических функций (у нас t cos (t + фо)) называют вековыми или секулярными членами (от французского sidcle — век, столетие). Это связано с тем, что в математических моделях астрономии величина е очень мала и произведение et начинает играть существенную роль на величинах порядка столетий. Таким образом, попытка пойти наиболее простым путем и использовать прямое разложение оказалась неудачной из-за появления секулярных членов. Метод перенормировки В чем причина возникших трудностей? Прежде всего в том, что период предельного цикла в уравнении Ван дер Поля, вообще говоря, не совпадает с периодом решения невозмущенного уравнения й 4- и = 0. Если бы секулярного члена в выражении (8.37) не было, то это означало бы, что периоды решения u(t, е) и uo(t) совпадают с огромной точностью. Чтобы строить периодические решения нелинейных уравнений с пе- риодом, зависящим от параметра е, часто пользуются приемом, называе- мым методом перенормировки. При этом переходят к новой независимой переменной T = wt = (1 +£(*>! 4-.. .)t => t = т( 14-4-...) 1 — . (8.38) После подстановки этого выражения в разложение (8.37) получим 32 Входящие в это разложение синусы и косинусы можно разложить в ряд Тейлора следующим образом: sin(т + - ^17 4-...) = sin(т 4-у?0) - ewir cos (т 4- у?0) 4-..., cos (т 4- фо - еш^т 4-...) = cos (т 4- ^?0) + sin (т 4- фо) 4-..., cos (Зт 4- Зу>о - 3ewiT + ...) = cos (Зт 4- З9З0) 4- Зеш\т sin (Зт 4- Зу?о) 4-... .
228 Глава 8 Пользуясь этими соотношениями, разложение (8.39) можно переписать в виде и = A sin (т 4- у?о) 4- cos (т + <р0) 4- 1 / Л3\ А3 1 4- - ( А - — ) т cos (7 4- у?°) - — cos (Зт 4- З^о) У 4- ... . Чтобы в этом выражении не было секулярных членов, должны выпол- няться равенства Аш[ =0 => wi — 0, / л2\ Л11- — \ =0 => 4 = 2. Поскольку нас интересует предельный цикл, а не тривиальное решение, берем А 0. Следовательно, предельный цикл в уравнении Ван дер Поля опреде- ляется соотношением т = t 4- О(е2) е и = 2 sin (t 4- у?о) - cos (3t 4- Зу?о) 4-... . (8.40) Таким образом, применение метода перенормировки позволяет полу- чить асимптотическое выражение для аттрактора Ван дер Поля при малых значениях е. Интересно, что с точностью до е2 период предельного цикла и решения невозмущенного уравнения совпадают и равны 2тг. Однако са- ма возможность строить решения с периодом, зависящим от е, заложенная в методе перенормировки, позволяет избавиться от секулярных членов. К сожалению, метод перенормировки не позволяет построить реше- ния, описывающие выход на предельный цикл в уравнении Ван дер Поля, что также важно в ряде случаев. В самом деле, допустим, что мы хотим использовать систему, описываемую уравнением Ван дер Поля, как ге- нератор автоколебаний. Такие колебания должны иметь с достаточной точностью постоянный период и форму. Поэтому естественно выяснить, когда они станут таковыми после включения прибора. Это требует при- менения других асимптотических методов. Метод усреднения Идея этого метода имеет много общего с методом вариации про- извольных постоянных при решении обыкновенных дифференциальных уравнений. При е = 0 решение уравнения Ван дер Поля имеет вид и = a cos (t 4-/3), (8.41) где а и /3 — некоторые произвольные постоянные. При е #= 0 мы будем предполагать, что решение уравнения (8.31) имеет тот же вид, но считать, что величины а и /3 зависят от времени а = a(t), /3 = /3(t) u(t, е) = a(t) cos [£ 4- (3(t)]. (8.42)
Автоколебания и предельные циклы 229 Вместо одной неизвестной функции u(t), которая удовлетворяет уравнению (8.31), мы получили три — u(t), a(t), 0(t). Их связывает соотношение (8.42). Оно предоставляет определенный произвол, которым можно распорядиться, чтобы найти решение в наиболее простом виде. Это можно сделать по аналогии с линейным случаем. Из соотношения (8.41) следует, что й = -a sin (£ + /?). Будем считать, что это верно и для нелинейного уравнения: u(t, е) = -a(t) sin [t 4- Д(0]. (8.43) Дифференцируя соотношение (8.42), получим и — -a sin (t 4- Д) 4- a cos (t 4- Д) - аД sin (t 4- Д). Учитывая соотношение (8.43), имеем a cos (t 4- /3) - аД sin (^ 4- 0) = 0- (8.44) Дифференцирование по времени формулы (8.43) дает выражение для й: й = -a cos (t 4- Д) - a sin (t 4- Д) - аД cos (t 4- Д). Подстановка полученных соотношений для и, й, й в исходное уравне- ние (8.31) приводит к выражению a sin (t 4- Д) 4- аД cos (t 4- Д) = еа sin (t 4- Д) (1 - a2 cos2(f 4- Д)). (8.45) Систему двух обыкновенных дифференциальных уравнений первого по- рядка (8.44), (8.45) для функций а и Д можно разрешить относительно а и Д. Домножив равенство (8.44) на cos (<4-Д), равенство (8.45) на sin (<4-Д), получим а = га sin2(t 4- Д) (1 - a2 cos2(£ 4- Д)). (8.46а) После домножения (8.44) на - sin (£4-Д), соотношение (8.45) на cos (^4-Д) и сложения обоих выражений, имеем аД = га cos (t 4- Д) sin (t 4- Д) (1 - a2 cos2(Z 4- Д)). (8.466) Воспользуемся для преобразования системы (8.46) элементарными триго- нометрическими соотношениями .2 11 sin 7 = - - - cos 2 2 cos 7 sin 7 = - sin 27; 2 2 11 sin 7 cos 7 — - - - cos 47, О о 3 1 1 sin 7 cos 7 = - sin 27 4- - sin 47, a = га 1 7 !--a - sin 2 2 1 a2 - - cos (2t 4- 2Д) —— cos (4t 4- 4Д) , Д = £ - sin (It 4- 2Д) 4- - sin (4t 4- 4Д) 4 о (8-47)
230 Глава 8 Поскольку синусы и косинусы любых действительных аргументов лежат на отрезке от -1 до 1 для любого ограниченного а, получаем а — О(е) и /3 = 0(e). Следовательно, при достаточно малом значении параметра е a(t) и 0(t) оказываются медленно меняющимися функциями времени. Поэтому на отрезке [0, 2тг] они меняются мало и, следовательно, на этом интервале в первом приближении их можно считать постоянными. Это дает возможность усреднить на отрезке [0,2тг] левые и правые части уравнений (8.47) Здесь мы воспользовались тем, что р « t (иначе нужно было бы по- другому выбрать пределы интегрирования и усреднять по периоду), и тем, что средние по периоду значения функций sin (nip) и cos (т<р) (п,т = 1,2,3,...) равны нулю. Усредняя точно так же уравнение (8.47) для функции 0(t) получим, что 3 = 0. (8.486) Таким образом, уравнения (8.48а) определяют закон изменения перемен- ных a(t) и /3(0. Вместе с равенством (8.43) они определяют приближенное решение уравнения Ван дер Поля. При этом в рамках метода усреднения удается описать не только параметры предельного цикла, но и переходный режим. Сингулярные возмущения, «утки», жесткие системы Радиотехника в свое время поставила перед прикладной математикой и теорией колебаний множество задач, связанных с математическим моделированием различных нелинейных систем. Аттракторами в этих моделях обычно являлись предельные циклы, описывающие колебания, близкие к гармоническим. Однако развитие радиолокации, телевидения, вычислительной тех- ники потребовало расширения класса моделируемых электронных схем и соответствующих нелинейных процессов. Электронные схемы, исполь- зуемые в этих областях, зачастую должны генерировать электрические импульсы прямоугольной или пилообразной формы. Можно сказать, что в них есть два характерных временных масштаба. Это «быстрое время», за которое формируется фронт или спад импульса, и «медленное время», которое характеризует возникновение гладкой вершины импульса, либо интервал между колебаниями. Такие процессы получили название релак- сационных, от английского to relax — ослаблять, уменьшать напряжение.
Автоколебания и предельные циклы 231 Множество математических моделей этого сорта возникло в аэродинами- ке в связи с развитием сверхзвуковой авиации и космической техники, что стимулировало как создание математических теорий, так и появление представлений о качественных особенностях нелинейных релаксацион- ных процессов. Рассматривая уравнение Ван дер Поля, мы имели дело с ситуацией, в которой некоторые члены в дифференциальном уравнении были го- раздо меньше остальных. Это отражал малый параметр е. Невозмущенная система, в которую переходит исходная система при е = 0, имела тот же тип и тот же порядок, что и исходная. В этом случае говорят, что мы имеем дело с регулярными возмущениями. Однако возможна иная ситуация. Пусть динамическая система, опи- сывающая изучаемый объект, имеет вид dz du eM=F('Z'y’t)' (8.49) z(0) = 2°, 2/(0) = yQ. При e = 0 мы получим систему алгебраических и дифференциальных уравнений F(z, y,t) = O, = f(z, у, t). (8.50) dt Обратим внимание на то, что фазовое пространство систем (8.49) и (8.50) различно. В самом деле, пусть z — вектор, имеющий т компонент, у — вектор, имеющий п компонент. Чтобы однозначно определить состояние системы (8.49), нужно задать (тп+п) чисел. Траектория определяется тп+п начальными условиями. В случае системы (8.50) фазовое пространство п-мерно, и нужно только п начальных условий. Систему (8.49) по отношению к (8.50) часто называют возмущенной. Систему (8.50) по отношению к (8.49) — вырожденной. Когда тип систе- мы при наличии возмущения меняется по сравнению с невозмущенной системой таким образом, что для определения решений возмущенной системы требуется большее число дополнительных условий, чем для не- возмущенной, возмущение называют сингулярным. К чему могут приводить сингулярные возмущения, можно продемон- стрировать на примере простейшей линейной модели dz п = az 4- b, z(0) = zQ. dt Вырожденное уравнение является алгебраическим b az + b = 0 => z =—. (8.51) CL Проинтегрировав исходное уравнение, получим точное решение
232 Глава 8 Рис. 8.12. Характерный вид решений сингулярно возмущенных задач: а) погранич- ный слой на границе области, который может описывать некоторый переходный режим; б) внутренние пограничные слои, которые могут соответствовать «пичковым» стационарным диссипативным структурам Сравним формулы (8.51) и (8.52). Видим, что если t > е/а, то первый член в формуле (8.52) становится мал и z(t) -Ь/а при t оо, т. е. решение возмущенной системы стремится к решению невозмущенной. Однако в области 0 < t < е/а эти решения существенно отличаются, как бы не был мал параметр е. Это явление, состоящее в том, что при наличии сингулярного возмущения решение возмущенного уравнения (8.49) зна- чительно отличается от решения вырожденного (8.50), получило название погранич! >го слоя. Характерный вид пограничного слоя в системе (8.49) показан на рис. 8.12 о. Здесь компоненты вектора z экспоненциально убывают на мас- штабах, связанных с «быстрым временем» — т = t/E, и затем плавно меняются на масштабе «медленного времени» t. Название пограничный слой пришло из гидродинамики. Здесь было выяснено, что уравнения идеальной, невязкой жидкости не пригодны для описания течения вблизи границы обтекаемого тела, даже если вязкость мала. Эту область вблизи границы и назвали пограничным слоем. Можно сказать, что мир математических моделей полон сингулярно возмущенных уравнений. Это модели гидродинамики, где в качестве ма- лого параметра часто выступает величина 1/Я, где R — число Рейнольд- са. Это уравнения квантовой механики, где малость параметра связана с малостью постоянной Планка Л. Это во многих случаях уравнения и нелинейной оптики, акустики и других областей. Уравнения (8.49) имеют наглядную интерпретацию в задачах хими- ческой кинетики. Они описывают ситуацию, когда одна группа реакций проходит в \/е раз быстрее, чем другая. Естественно возникает вопрос, когда можно считать компоненты z(t) квазистационарными, целиком определяемыми компонентами y(t). В синергетике параметры поряд- ка y(t) часто называются долгоживущими модами, в противоположность короткоживущим модам z(t). Говорят, что для систем, в которых через определенное время можно перейти от модели вида (8.49) к модели (8.50), справедлив принцип подчинения короткоживущих мод долгоживущими (этот принцип был сформулирован Г. Хакеном).
Автоколебания и предельные циклы 233 Рассмотренный линейный пример показывает, что перейти от систе- мы (8.49) к (8.50) можно далеко не всегда. В самом деле, если в форму- ле (8.52) а < 0, то функция z(t) ни при каких значениях t к решению вырожденной системы (8.51) стремиться не будет. Классическим резуль- татом, дающим достаточные условия, при которых решение вырожденной системы является близким к решению исходной при е —> 0, дает теорема А. Н. Тихонова. Поясним условия этой теоремы и ее утверждение. Вернемся к вырожденной системе (8.50). Допустим, что удалось найти решение уравнения F(z,y,t) = 0 => z = <p(y,t\ Предположим, что z — непрерывная функция аргументов у и t и что z — изолированный корень уравнения F(z, y,t) = 0 (т. е., изменив z на малый вектор р, получим F(z 4- v, у, t) / 0. После подстановки найденного решения в уравнение для у имеем ПТ = fMv, t), у, t), »(0) = у0. (8.53) at Понятно, что вектор (y(t), <р(у, t)) и будет решением вырожденной систе- мы (8.50). Введем в рассмотрение так называемую присоединенную систему = F(z, у, t), г(0) = yQ, (8.54) ат в которой правая часть зависит от параметров у и t. Физически эта система описывает процессы, протекающие на временах Это — изменение «быстрых компонент», при котором медленные переменные измениться практически не успевают. Математически система (8.54) нужна, чтобы сформулировать аналог условия а < 0 для решения линейной задачи. Понятно, что решение алгебраического уравнения F(z, у, t) = 0, z = tp(y, t) будет особой точкой динамической системы (8.54). Предполо- жим, что эта точка асимптотически устойчива z(r) -> (р(у, t) при т —> оо. Пусть при значениях параметров у = уо, t = 0 начальные данные для системы (8.54) z° принадлежат области притяжения этой особой точки. Тогда, при выполнении традиционных условий, касающихся суще- ствования и единственности решений соответствующих дифференциаль- ных уравнений, решение задачи (8.49) y(t, е), z(t, е) таково, что lim y(t, е) = y(t) при 0 t Т, Е—>0 lim z(t, е) = z(t) = <p(y(t), t) при 0 < t T, £->0 где [0, T] — отрезок, на котором рассматривается решение. Эта теорема дает условия, при которых решение вырожденной си- стемы может давать представление о поведении исходной. Однако в ряде случаев важно представлять изменение переменных в пределах погра- ничного слоя. При этом также используются асимптотические методы.
234 Глава 8 Соответствующие асимптотические ряды существенно отличаются от тех, которые появляются в регулярно возмущенных задачах. В последних приближенное решение xn(t, е) к точному x(t, е) часто ищется в виде степенного ряда п е) = 52 к=0 Как правило, этот ряд имеет точность ||ж(<, е) - xn(t, е)|| порядка O(en+1) равномерно на отрезке 0 t Т. В обсуждаемых сингулярно возму- щенных задачах ряд содержит также члены, называемые пограничными функциями Щ(т) п xn(t, е) = 52 e*(z*(0 4- Щ(т)). л=о Пограничные функции зависят от быстрого времени и так же, как в линейной задаче, содержат экспоненциально убывающий множитель. Алгоритмы построения таких рядов в задачах вида (8.49), в интегральных уравнениях, системах с запаздыванием, ряде уравнений в частных про- изводных были разработаны в работах А. Б. Васильевой и В. Ф. Бутузова. Этот подход в литературе называют методом пограничных функций. Итак, в сингулярно возмущенных задачах на границах исследуемых областей изменения независимых переменных могут возникать погра- ничные слои. Но может иметь место и более сложная ситуация. Ранее мы обсуждали системы типа реакция—диффузия, широко используемые при моделировании различных нелинейных систем. Стационарные дис- сипативные структуры, которые они описывают, в одномерном случае определяются решениями краевой задачи для системы двух обыкновен- ных дифференциальных уравнений второго порядка d2u Di—2+f(u,v) = Q, ах£ d2u D2dx^ =0’ 0 < x < I, (8.55) ux(0) = ux(l) = 0, vx(Q) = vx(l) = 0. При этом в ряде моделей морфогенеза и химической кинетики предполагается, что есть некоторое вещество и, «активатор», стимули- рующий возникновение неоднородностей, неустойчивостей, и «ингиби- тор» v, препятствующий этим процессам. Во многих случаях оказывается, что коэффициенты диффузии веществ различаются на несколько поряд- ков D\ <С D2. Малым параметром в этой задаче является отношение коэффициентов диффузии е = D\/D2. В подобном случае возникают так называемые внутренние погра- ничные слои (см. рис. 8.126). Характерный масштаб изменения одной
Автоколебания и предельные циклы 235 Рис. 8.13. Уравнение Ван дер Поля с малым параметром при старшей производной: а) характерный вид предельного цикла на плоскости Льенара; б) интегральные кривые уравнения при е = 0; в) типичный вид релаксационных колебаний переменной v определяется коэффициентом D^. Ширина «пичков» ак- тиватора связана с коэффициентом D\. Диссипативные структуры такого типа, называемые пичковыми структурами, были обнаружены во многих нелинейных системах. Асимптотический анализ таких решений являет- ся достаточно сложной задачей, поскольку приходится определять число и положение пограничных слоев. Кроме того, задача (8.55) обычно имеет не одно, а несколько решений, причем их число растет с увеличением длины области I. Это вносит дополнительные трудности. Классический пример релаксационных колебаний дает обсуждавше- еся в этой главе уравнение Ван дер Поля. Очевидно, можно подобрать параметры электрической схемы таким образом, что малый параметр будет коэффициентом при старшей производной: ex -I- (х2 - 1)я 4- х = 0. (8.56) Вырожденное уравнение (х2 - 1)± 4- х = 0 можно проинтегрировать х2 log |ж| —— = t - а, а = const. (8.57) Характерный вид интегральных кривых в этом случае представлен на рис. 8.13 б. Обратим внимание на значение времени t = а — 1/2. В этой точке х = ±1 и четыре ветви, которые определяет формула (8.57), не могут быть продолжены. Обратим внимание на принципиальное отличие этой ситуации от той, которая рассматривается в теореме А. Н. Тихонова. В последней фигури- руют системы, у которых вырожденное уравнение имеет решение при 0 t < оо. Такие решения и «притягивают» траектории возмущенной системы. В обсуждаемом случае эти траектории исчезают, и можно ожи- дать, что быстрые процессы, определяемые членом ех, переводят решение на «медленную траекторию», описываемую формулой (8.57) при другом значении постоянной а. Интегральная кривая оказывается как бы склеена из «быстрых» и «медленных» кусков (см. рис. 8.13 в). Встает вопрос, каким образом должно осуществляться такое склеивание.
236 Глава 8 Сделаем замену переменных и перейдем к системе уравнений первого порядка: ex = и- F(x), й = -х, F(x) = — - х. (8.58) Фазовое пространство этой системы называют плоскостью Лъена- ра. Продифференцировав первое уравнение системы (8.58) и подставив в него й из второго, можно убедиться, что эта система действительно эк- вивалентна модели (8.56). Векторные поля, определяемые системами вида ех = /(х, и), й = д(х,и), в литературе часто называют медленно-быст- рыми. Нулевые изоклины (т. е. кривые, задаваемые условиями /(х, и) = О и д(х, и) = 0) для системы (8.58) показаны на рис. 8.13 а. Условие х = 0 выполнено на кривой и = х3/3 — х. Рассмотрим переменную и как параметр в первом уравнении си- стемы (8.58). Тогда dF/dx = -х2 + 1. Эта величина отрицательна при |х| > 1 и положительна при |х| < 1. Следовательно, кривая и — х3/3 - х «состоит из особых точек» системы ex = u-F(x), которые устойчивы при |х| > 1 и неустойчивы при |х| < 1. В соответствии с этим на медленной кривой и = х3/3 — х можно выделить притягивающие куски при |х| > 1 и отталкивающие куски при |х| < 1. Естественно предположить (например, действуя по аналогии с прин- ципом максимального промедления, рассматриваемого в теории ката- строф), что предельный цикл выглядит так, как показано на рис. 8.13 а, т. е. лежит в окрестности замкнутой кривой Г Достаточно сложный асимптотический анализ траектории в окрестности кривой Г позволяет получить выражение для периода Т(е) = 3 - 2 In 2 + ЗПое2/3 - In - + + (з1п 2 - 1пЗ - | - 2Я1 - 2/0)е + О(?/3), где постоянные выражаются через специальные функции. Эта формула была получена в 1947 г. А. А. Дородницыным. Неожиданный новый подход к анализу сингулярно возмущенных систем и релаксационных колебаний, упрощающий ряд рассуждений, был развит в 80-х гг. Он связан с так называемым нестандартным анализом. При построении математического анализа принципиальным моментом является введение бесконечно малых и бесконечно больших величин. Однако при традиционном подходе не удается придать строгий смысл понятиям «малый» и «большой». Не удается сделать строгими такие
Автоколебания и предельные циклы 237 очевидные рассуждения, как «сумма малого числа малых слагаемых мала» или «разность большого числа и малого числа есть большое число». В нестандартном анализе строится математическая теория, в которой фигурируют обычные или, как их называют, стандартные числа, бесконечно большие числа и бесконечно малые числа. Вещественное число х называют конечным, если существует такое стандартное целое число п, что |ж| < п. Если число х не является конечным, то оно называется бесконечно большим. Вещественное чис- ло называется бесконечно малым, если |ж| < 1/п для всех стандартных положительных п. В одном из подходов к построению такого анализа эффективно используется аксиоматика теории вероятностей, где отобра- жения можно считать эквивалентными, если они равны почти всюду. Таким образом, около данного отображения есть ореол отображений бесконечно мало отличающихся от него. Точно так же вблизи стандартного числа появляется ореол бесконечно мало отличающихся от него чисел. При анализе уравнения Ван дер Поля с помощью этих методов величина е считается бесконечно малой. Естественно, все результаты, полученные с помощью нестандартного анализа, могут быть выведены и с использованием других математических инструментов. Однако эта техника позволяет упростить рассуждения и обойтись без ряда теорем, связанных с переходом к пределу. С ее помощью удалось не только повторить известные результаты, касающиеся ряда сингулярно возму- щенных обыкновенных дифференциальных уравнений, но и обнаружить интересное нелинейное явление, названное «утками». Это явление можно проиллюстрировать с помощью уравнения Ван дер Поля со свободным членом ех 4- (х2 - l)i 4- х = а. На плоскости Льенара это уравнение записывается в виде ех = и - F(x), й = а- х. Единственная неподвижная точка — (a, F(a)). Когда а <£ 1 — это неустойчивый узел, когда а > 1 — устойчивый узел. При а = 1 про- исходит бифуркация рождения предельного цикла. Наличие бесконечно малого параметра е приводит к тому, что амплитуда этого цикла исклю- чительно быстро растет в окрестности точки бифуркации (см. рис. 8.14). Величину такой окрестности можно оценить как е Зе2 fln ~ 1 — — — -. 8 32 Это явление можно рассматривать как своеобразный резонанс, при котором траектория некоторое время следует вдоль отталкивающего куска медленной кривой (убывающий участок кубической параболы). Благодаря форме этих замечательных предельных циклов, их стали называть «утка- ми» (см. рис. 8.15). Оказалось, что детально исследованная классическая модель обладает замечательными качественными особенностями. При анализе сингулярно возмущенных нелинейных дифференциаль- ных уравнений, естественно, широко используется компьютерное моде-
238 Глава 8 * а = 0,9987404512 * а = 0,9987404513 Рис. 8.14. Сингулярно-возмущенное уравнение Ван дер Поля со свободным чле- ном. Сверхбыстрый рост амплитуды предельного цикла после бифуркации Хопфа. Здесь е = 0,01 Рис. 8.15. Характерный вид резонансов, называемых «утками». Траектории «утки» некоторое время следуют вдоль отталкивающего куска медленной кривой лирование. Однако здесь приходится обращать особое внимание на при- меняемые вычислительные алгоритмы и часто использовать специальные численные методы. Суть возникающих трудностей можно проиллюстрировать на примере линейной задачи с пограничным слоем. Рассмотрим грузик малой массы е на пружинке в среде с вязким трением. Пусть его динамика описывается дифференциальным уравнением л ±=у -у - х I х\ , (Х\ £Х 4- х 4- х = 0 —> у =------ => I . I = AI I. е \vj \yj Решение этого уравнения имеет вид x(t) = С\ ехр {Л10 4- Ci exp {Л2О, где Ль Л2 в этом случае собственные значения матрицы Якоби A, Ct и Ci — постоянные, определяемые начальными данными. Здесь 1 А1 «-----h 1 4- £, А2 — — 1 — £. £ Число обусловленности этой матрицы тах|Л,| । к(А) = min|A:| е i При малых е оно очень велико. Такие матрицы обычно называют плохо обусловленными.
Автоколебания и предельные циклы 239 Качественная картина здесь будет такой же, как на рис. 8.12 а. Член Ciexp{AiO существенен на временах ~1/е и описывает пограничный слой. В этой области производная dx/dt очень велика. Член Ci exp {А2О является основным при t е и описывает мед- ленно меняющуюся функцию. Пусть x(t) — решение системы обыкновенных дифференциальных уравнений, для которого выполнено неравенство dx ~dt — max |ж(/)|. t>£ N о^т Здесь Т — интервал, на котором рассматривается решение, L(x(t)) — модуль максимального собственного значения матрицы Якоби на этом интервале, N — большое число, показывающее во сколько раз умень- шается производная вне пограничного слоя. Дифференциальные уравне- ния, имеющие такие решения, в вычислительной математике называют жесткими. Естественно было бы подойти к численному решению жестких си- стем следующим образом. В пределах пограничного слоя берется малый шаг по времени, обеспечивающий достаточно высокую точность. Вне его функция x(t) меняется медленно и шаг можно существенно увели- чить, сделав объем вычислений приемлемым. К сожалению, этот наивный подход обычно терпит неудачу. Попытки увеличить шаг при использова- нии большинства методов, эффективных при решении нежестких систем, часто приводят к резкому, взрывному росту погрешности. Это явление, иногда называемое жесткостью, можно проиллюстри- ровать на примере уравнения х = а(х - (р) 4- ф, ж(0) = х0, 9?(0) = <р0, (8.60) где р — заданная функция времени. Решение этого уравнения: х = (х0 - tpo)eat 4- <p(t). (8.61) Применение метода Эйлера в этом случае приводит к отображению , , / I \ I d<p(tn) zn+i = zn + hazn +h(pn - арп), <pn = - — , dt где h — шаг по времени. Переписав это отображение в виде (zn+i - pn+1) = (14- hazn)(zn - ipn) - (pn+i -рп- hcpn), можно найти явное выражение для zn п-1 zn = (1 4- ha)n(zQ - у?о) + <Рп 4- 22(1 4- ha)k(hpn_k_x 4- pn-k-\ - <pn-k)> k=0
240 Глава 8 Из вида этой функции ясно, что процесс численного решения будет устойчивым при условии |1+Ла|<1, (8.62) иначе малая ошибка в задании zq или у?о будет расти с номером шага в геометрической прогрессии. Пусть а = -10+9, p(0 = e-<, Тогда система (8.60) будет жесткой. В пограничном слое решение x(t) изменяется как exp{10-9t}, вне его — как exp{-f}. Естественно здесь было бы использовать крупный шаг h. Однако в соответствии с услови- ем (8.62), задача численного интегрирования в этом случае будет устой- чивой, если h < 2 • 10-9. Чтобы передать решение этого простейшего дифференциального уравнения с помощью явного метода, требуется по- рядка миллиарда шагов. Используем теперь для решения неявный метод Эйлера, в котором правая часть на шаге п вычисляется через значения переменных на этом же шаге (в отличие от явного, где используют значения на шаге п-1). Если бы уравнение было нелинейным, то на каждом шаге по времени приходи- лось бы решать систему нелинейных алгебраических уравнений. Здесь в силу линейности и специального вида уравнения можно найти явно zn zn^=zn^hazn-\+h(tp,n+x-atpn+\') => (Z’n+l — <Рп+\) = (1 — hot) (zn — tpn) — (\ —hot) (т?п+1 --Л^п+1) => zn = (l-/ia)"n(2:o-^o)+9?n+ п-1 +(l-/ta)~iy^(l-feg)~fc (htpn-k+tpn-k-i-tpn-i). к=0 Условие устойчивости этого алгоритма |1 - ha\ > 1. Таким образом, в случае отрицательных значений а, как в рассматрива- емом уравнении, ограничений на шаг интегрирования нет. Шаг можно выбирать из соображений аппроксимации производной разностью . Далее его можно увеличивать, исходя из характера решения. Необходимость при моделировании многих нелинейных процессов решения сингулярно возмущенных задач привела к появлению многих специальных методов, ориентированных на жесткие системы. Естествен- но, такие же проблемы возникают при численном решении уравнений в частных производных. В таких задачах часто приходится подстраивать шаг и по времени, и по пространству. Построение алгоритмов такого ти- па, разностных схем, адаптирующихся к решению, является сейчас одним из быстро развивающихся направлений вычислительной математики.
Автоколебания и предельные циклы 241 Вопросы и задачи 1. Конкурентное взаимодействие двух видов или взаимное ингибирование двух групп нейронов в ряде работ описывалось математической моделью еп еп еп + уп * еп + жп v Исследовать качественное поведение решений при различных значениях п, считая, что 0 = 1/2. 2. Состояние равновесия в автономной системе двух обыкновенных дифферен- циальных уравнений таково, что Ai О, А2 0. Всегда ли устойчиво такое состояние равновесия? 3. Как ведут себя фазовые траекториии динамической системы, особая точка которой представляет собой седло-узел х = Аж2, у = by? 4. Для описания колебательной химической реакции Белоусова—Жаботинского Р. Филдом и Р. Нойесом была предложена следующая схема реакции где f — некоторый коэффициент. Какая система дифференциальных урав- нений описывает изменение концентраций веществ X, Y, Z? Сколько су- щественных параметров в этой модели? Каковы они? При каких условиях особая точка этой системы теряет устойчивость? (Ответ: эта модель, называ- емая орегонатором, может быть приведена к виду , , 2ч . -у-ху + fz х = s(y-xy + x-qx ), у=--------------, z=w(x-z). S Характерные значения коэффициентов q ~ 10~\ s ~ 102, ш — бифуркаци- онный параметр.) 5. Классические уравнения движения самолета в вертикальной плоскости име- ют вид ip = р - cos р, р = 2р(А - рр- sin <р). Провести качественный анализ этой системы при различных р. Есть ли в этой системе гетероклинические траектории, идущие из одной особой точки в другую? Как ведет себя система при других значениях р? 6. При феноменологическом описании жесткой потери устойчивости в автоко- лебательных системах в ряде работ используется уравнение w = A! w + а2 |wq2 w + А31 w|4 w, где W — комплексная функция, Ai,A2,A3 — комплексные параметры. Провести качественный анализ этой модели и построить бифуркационную диаграмму.
242 Глава 8 7. Для описания гликолитических колебаний в качестве простейшей математи- ческой модели используется динамическая система х = 1 - ху7, у = 4ху7 - 4у, 7 > 0. Проведите качественный анализ этой системы. 8. Простейшая система с запаздывающей отрицательной обратной связью име- ет вид z(t) — Az(t) + Bz(t - т). Такие модели возникают, например, при описании иммунной системы. Полу- чите условия, при которых стационарное состояние этой системы устойчиво. При каких условиях в этой системе могут начаться колебательные процессы? 9. Рассмотрим маятник, описываемый системой вида х + g(t)x + u2(t)x = 0, где — положительная монотонная функция. Получите достаточные усло- вия ограниченности колебаний в этой системе. (Указание: сделайте замену t переменных т = f ш(з) ds и рассмотрите изменение энергии системы.) i 10. Исследуйте качественное поведение динамических систем х = ху, у = х2 + у2 и х = ху, у = у2 - X*. Рекомендуемая литература Представление о классической теории колебаний, в которой предельные циклы играют ключевую роль, дают книги: Андронов А. А., Витт А. А., Хайкин С. Э. Теория колебаний. М.: Наука, 1981; Рабинович М. И., Трубецков Д. И. Введение в теорию колебаний и волн. М.: Наука, 1984; Баутин Н. Н., Леонтович Е.А. Методы и приемы качественного исследования динамических систем на плоскости. М.: Наука, 1976. Строгие результаты приведены в книге: Хартман Ф. Обыкновенные дифференциальные уравнения. М.: Мир, 1970. Асимптотические методы анализа таких систем рассмотрены в книге: Найфе А. Введение в методы возмущений. М.: Мир, 1984. Введением в теорию сингулярно возмущенных задач может служить книга: Васильева А. Б., Бутузов В. Ф, Асимптотические разложения решений сингу- лярно возмущенных уравнений. М.: Наука, 1973. Методы исследования релаксационных колебаний подробно рассмотрены в книге: Мищенко Е. Ф., Розов Н.Х. Дифференциальные уравнения с малым парамет- ром и релаксационные колебания. М.: Наука, 1975. Использование нестандартного анализа в исследовании сингулярно возмущенных задач рассмотрено в статьях: Картье П. Сингулярные возмущения обыкновенных дифференциальных уравнений и нестандартный анализ // Успехи мат. наук. 1984. Т. 39. Вып. 2. — С. 57-76;
Автоколебания и предельные циклы 243 Звонкий А. К., Шубин М. А. Нестандартный анализ и сингулярные возмущения обыкновенных дифференциальных уравнений // Успехи мат. наук. 1984. Т. 39. Вып.2. - С. 77-127. Алгоритмам исследования жестких систем посвящена книга: Ракитский Ю. В., Устинов С. М., Черноруцкий И. Г. Численные методы реше- ния жестких систем. М.: Наука, 1970. Думаю, что физикам будут близки книги, которые отражают курсы, в свое время читавшиеся на кафедре прикладной математики Московского физико-техниче- ского института и в Саратовском государственном университете соответственно: Моисеев Н. И. Асимптотические методы нелинейной механики. М.: Наука, 1969; Трубецков Д. И. Введение в синергетику. Хаос и структуры / 2-е изд. Сер.: «Синергетика: от прошлого к будущему». М.: URSS, 2004. О творцах асимптотического анализа, об истоках этого направления и многих новых приложениях рассказывается в книге: Андрианов И. В., Баранцев Р. Г., Маневич Л. И. Асимптотическая математика и синергетика: путь к целостной простоте / Сер.: «Синергетика: от прошлого к будущему». М.: URSS, 2004.
Escher M. C. Knots. 1966 Эшер М. К. Узлы
Глава 9 Топологические методы в исследовании нелинейных систем В некотором смысле слова топология — это наука, изучающая непрерывность: исходя из не- прерывности пространства или форм, она пе- реходит к обобщениям, которые затем по ана- логии приводят к новому понятию непрерывно- сти, а «обычное» пространство, как мы себе его представляем, остается далеко позади. С. Барр Геометрические образы и представления играют важную роль в ис- следовании нелинейных явлений. При этом особое значение приобретают методы раздела математики, первоначально являвшегося частью геомет- рии — топологии. В 1872 г. выдающийся математик Феликс Клейн сформулировал исследовательскую программу, связанную с классифика- цией различных областей геометрии, получившую название Эрлангенской программы. Геометрические фигуры в плоскости или пространстве могут под- вергаться различным преобразованиям (переносам, поворотам, деформа- циям). Естественно выяснить, какие свойства фигур сохраняются, когда фигура подвергается различным преобразованиям. Система утвержде- ний, касающихся таких свойств, составляет геометрию данного класса преобразований. Например, в аффинной геометрии допустимыми преоб- разованиями являются параллельный перенос и центральная симметрия. Утверждения этой геометрии, многие из которых были известны Евклиду, сохраняют силу при параллельном проектировании с одной плоскости на другую. Окружности в этой геометрии не рассматриваются и уг- лы не измеряются. Зато ее утверждения сохраняют силу в геометрии пространства—времени Минковского, которая используется в специаль- ной теории относительности. Группа, характеризующая аффинную геометрию, состоит из аффин- ных преобразований (х, у) -» (х1, у1) х' = ах + by + р, у = сх + dy + q, ad - bc^ 0.
246 Глава 9 Рис. 9.1. В проективной геометрии рас- сматриваются свойства, сохраняющиеся при центральном проектировании Последнее неравенство не- обходимо, чтобы преобразование было взаимно однозначно. В про- ективной геометрии рассматри- ваются свойства, сохраняющие- ся при центральном проектиро- вании из точки О (см. рис. 9.1) фигур, лежащих на плоскости тг, на плоскость тг'. При этом плос- кости тг и тг' могут быть как па- раллельны друг другу, так и не па- раллельны. Инвариантом отно- сительно таких преобразований является двойное соотношение: (4BCD) = (Л'В'С'тУ). \ О-О / \LfD J Однако преобразования, которые рассматриваются в аффинной и проективной геометриях, являются частными случаями более широкой группы топологических преобразований. Эти преобразования между точ- ками р фигуры А и точками р' фигуры А' обладают: 1. Взаимной однозначностью. Другими словами, каждой точке р фигу- ры А сопоставлена одна и только одна точка р' фигуры А' и обратно. 2. Взаимной непрерывностью. Если мы возьмем две точки — р и q — фигуры А и станем двигать р так, чтобы расстояние между р и q стремилось к нулю, то расстояние между точками р' и д' фигуры А! также будет стремиться к нулю (см. рис. 9.2). Это верно и для обратного преобразования А! -> А. Отображения, которые обладают этими двумя свойствами, называют гомеоморфными. Свойства фигур, которые не изменяются при гомеоморф- ных преобразованиях, называют топологическими свойствами фигур или топологическими инвариантами. Изучением топологических свойств фигур и занимается топология. Для того, чтобы наглядно представить отличие различных геометрий, посмотрим, в какие фигуры может перейти квадрат ABCD при различ- ных преобразованиях (см. рис. 9.2). Аффинные преобразования способ- ны перевести этот квадрат в произвольный параллелограмм AtB'C'D' (рис. 9.2 а). Проективные преобразования — в произвольный четырех- угольник A"B"C"D" (рис. 9.2 б). Топологические преобразования на плос- кости задаются отображениями х' = f(x,y), у' = д(х, у), являющимися взаимно непрерывными и взаимно однозначными. Степень произвола здесь очень велика, fug могут быть любыми нелинейными функциями, удовлетворяющими этим требованиям. Топологические преобразования могут перевести квадрат ABCD в любую фигуру, не имеющую разрывов внутри себя (или как ее на-
Топологические методы в исследовании нелинейных систем 247 Рис. 9.2. Аффинные преобразования позволяют перевести квадрат ABCD в паралле- лограмм A'B'C'D', проективные — в четырехугольник A"B"C"D", топологические — в «пятно» или «осьминога» зывают, односвязную) А!”В"'С'"D'". Однако при этом точки А!"В'"С'"D'" будут принадлежать границе фигуры. Свойство «принадлежать грани- це» является топологическим инвариантом. Кроме того, порядок точек на границе А!” В'" С'" D"' является в точности таким же, как у исходной фигуры. Другими словами, если мы двигались вдоль границы и пооче- редно проходили точки Л, В, С и В, то, путешествуя по границе фигуры А'"В'"С"'D'" и попав из точки А!" в В"', можно быть уверенным, что при движении в том же направлении встретится сначала С"', потом D'", а за- тем мы вернемся в исходную точку А1". Однако форма фигуры может быть причудливой. Такой как у «пятна» или «осьминога» на рис. 9.2 г и 9.2 д. Можно наглядно представить себе исходную фигуру, нарисованную на резиновом листе, который деформируется произвольным образом без разрывов и наложений. То, что получается на этом листе из исходной фигуры, и будет ее образом при топологическом преобразовании. Поскольку произвольные непрерывные нелинейные функции возни- кают при описании множества нелинейных явлений, их топологические свойства представляются очень важными. Топологические методы являются, вероятно, самыми мощными ин- струментами для доказательства теорем существования. Можно сказать, что во многих случаях они дают «правила запрета», показывают, какими свойствами математическая модель из очень широкого класса в принципе не может обладать. Кроме того, в последние годы активно развивается ряд
248 Глава 9 областей, где топология дает ключ к созданию объектов с принципиально новыми физическими свойствами. Постараемся с помощью нескольких простейших примеров дать представление о возможностях этого подхода. Непрерывность Простейший пример топологической теоремы дает утверждение, ко- торое обычно доказывается в курсах математического анализа. Теорема. Если функция f(x) определена и непрерывна для всех значе- ний х в некотором замкнутом промежутке а х Ъ, то на этом отрезке функция достигает наименьшего значения т и наибольшего значения М. Кроме того, для каждого значения у в замкнутом проме- жутке т у М уравнение у = f(x) имеет по крайней мере одно решение х, принадлежащее промежутку а х Ъ. Сформулированную теорему ил- люстрирует рис. 9.3. На геометри- ческом языке утверждение означа- ет, что непрерывная кривая, идущая из точки минимума (хт, т) в точку максимума (хм, Af) хотя бы один раз пересекается с любой горизонталь- ной прямой у = с (с — любое число т с М). На рисунке видно, что решений это нелинейное уравнение может иметь несколько. Замечатель- ной чертой утверждения является его общность. Оно оказывается справед- ливым для любой непрерывной функ- ции. Оборотной стороной этого до- стоинства является то, что теорема и способ ее доказательства не дают более конкретной информации о решении или способа его найти. С этой теоремой связано несколько интересных и неожиданных результатов. Обратим внимание только на два. Первый результат представля- ет собой решение так называемой задачи Уитни. Поезд двигается из точки А в точку В по произволь- ному закону s = f(t), где з — расстояние от точки А. При этом он может ускоряться, замедляться и даже некоторое время двигаться назад. К полу одного из вагонов прикреплен твердый тяжелый стержень. Стержень может без трения дви- гаться вокруг оси, параллельной осям вагонов, вперед и назад — от пола до пола. При этом, прикоснувшись к полу, он в дальнейшем может остать- ся лежать на полу. Возникает вопрос: можно ли в момент отхода поезда
Топологические методы в исследовании нелинейных систем 249 поместить стержень в такое начальное положение а, чтобы на протяжении всего пути от А до В он не прикоснулся к полу (см. рис. 9.4)? Как это ни удивительно, такое положение существует при любом законе движения s(t). Для того, чтобы установить этот факт, не требуется даже знание законов динамики. Достаточно знать, что движение стержня определяется некоторым дифференциальным уравнением. Будем считать, что решение этого уравнения непрерывно зависит от начальных условий. Предположим, что в начальный момент стержень неподвижен и состав- ляет с полом угол «о- Физическая интерпретация непрерывности здесь очевидна: если при данном начальном положении «о стержень во время пути упадет вправо а = 0, то при «о + Дао, где величина Дао достаточно мала, он не упадет в противоположную сторону (а = 180°). Доказательство будем проводить от противного. Предположим, что при любом начальном положении стержень в точке В обязательно упадет в ту или иную сторону, т. е. угол а примет значение 0° или 180°. Определим функцию /(ао). Пусть она будет равна значению угла а, который составляет стержень с полом в точке В, отнесенное к тг. Эта функция равна 1, если стержень упал вправо, -1 — если влево по ходу движения через достаточно большое время. Естественно, функция /(ао) непрерывна. Очевидно, /(0) — +1, /(180°) = -1. Допустим теперь, что функция принимает только два значения (т. е. стержень всегда падает, независимо от ао). Из сформулированной в начале этого пункта теоремы следует, что при некотором «о, /(ао) = 0. Это противоречит предпо- ложению о том, что функция f(x) принимает только два значения +1 и -1. Следовательно, существует по крайней мере одно начальное поло- жение ао, при котором стержень во время путешествия от Л до В на пол не упадет. Рассмотрим следующую задачу. Можно ли вокруг любой ограни- ченной фигуры F на плоскости описать квадрат? При этом квадрат, естественно, должен быть таким, чтобы на каждой его стороне лежала по крайней мере одна точка фигуры F. Рассуждения, показывающие, что это всегда можно сделать, таковы. Выберем две произвольные параллельные прямые I и I' под каким-нибудь углом а к горизонтали (см. рис. 9.5 а). Будем перемещать эти прямые параллельно себе до тех пор, пока они не коснутся фигуры F. Пусть это будут прямые I и ? (см. рис. 9.5 б). Далее выберем две опорные прямые т и т', перпендикулярные прямым I и I'. Также будем двигать их до тех пор, пока они не коснутся фигуры F. Пусть это будут прямые тит'. При этом фигура F окажется вписанной в прямоугольник ABCD. Покажем, что при некотором направлении прямой I = 1(а*) этот прямоугольник превращается в квадрат. Обозначим длину стороны AD, параллельной I, через длину стороны АВ — через Л2(Ца)). Прямоугольник ABCD будет квадратом, если h\(l(a)) = Лг(Ца)). Будем теперь поворачивать прямую I. Когда она повернется на 90°, прямая I совпадет с т, сторона AD займет место АВ,
250 Глава 9 Рис. 9.5 сторона АВ — место AD. Следовательно, Л,(/(а)) = h2(l(a + 90°)); h2(l(a)) = hi(l(a + 90°)). Рассмотрим функцию д(а) = - h2(l(a)). Очевидно, д(а) = Л1(/(а)) - h2(l(a)) = h2(l(a 4- 90°)) - + 90°)) = -д(а + 90°). Следовательно, функция д(а) в точках а и а + 90° имеет разные знаки. Поэтому по сформулированной теореме найдется такое значение а*, что р(а*) = 0. Следовательно, = h2(l(a*)). При этом значении угла описанный прямоугольник и является квадратом. Открытые множества, непрерывность, топологические инварианты Для «резиновой» геометрии, в которой допускаются растяжения, сжатия и множество других непрерывных преобразований, нет смысла измерять углы, длины, площади. Ключевыми становятся такие понятия как окрестности, открытые и замкнутые множества. Проиллюстрируем их на простейших примерах и покажем, как на этом топологическом языке можно говорить о непрерывности. Пусть некоторое множество X лежит в евклидовом пространстве R”. В этом пространстве по теореме Пифагора расстояние между точками А и В, заданными координатами (xf,..., х„) и ,..., ж„), определяется формулой (п к 1/2 ЁЖ-*?)2) . t=l ' Пусть х — точка, принадлежащая множеству X, а т — некоторое поло- жительное число. Тогда окрестностью радиуса т точки х в множестве X называется множество всех точек из X, расстояние которых от х мень- ше т. Такая окрестность обозначается символом N(r, х, X). Определение. Подмножество U множества X (U С X) называется открытым множеством, если для каждой точки х Е U существует такое число т > 0, что N(x, г, U) С U.
Топологические методы в исследовании нелинейных систем 251 В качестве упражнения читатель может убедиться, что все окрестности являются открытыми множествами и что пересечение любого конечного числа открытых множеств в X является открытым множеством в X. Пустое множество 0, не содержащее ни одной точки, также есте- ственно считать открытым. Так как множество 0 не имеет точек, то можно считать, что каждая его точка имеет окрестность, содержащуюся в 0. С другой стороны, если множество А не является открытым, то оно содержит некоторую точку, у которой нет окрестности, содержащейся в А. Следовательно, такое множество не может быть пустым. Определение. Пусть X — множество в DV*. Подмножество А С X называется замкнутым в X, если его дополнение (т. е. совокупность точек, которые принадлежат X, но не принадлежат А) открыто. Другими словами, А замкнуто в X, если X - А — открыто в X. Введенные определения позволяют дать «топологическое определе- ние» непрерывности. Теорема. Функция f : X -> Y непрерывна в том и только в том случае, если прообраз каждого открытого множества в Y, есть множество, открытое в X. Или функция f непрерывна тогда и только тогда, когда прообраз каждого замкнутого в Y множества есть множество, замкнутое в X. Классическое е - д определение, имеющееся в курсах математическо- го анализа и восходящее к Коши, таково. Функция / непрерывна, если для каждой точки х € X и каждого £ > 0 существует такое б > 0, что функция f отображает <5-окрестность точки х в £ -окрестность точки /(ж). Предположим, что / — непрерывная функция и V — произволь- ное открытое множество в У. Нам нужно доказать, что у каждой точки х € f~lV существует окрестность, содержащаяся в f~lV. По сделанно- му предположению f(x) G V и V — открытое множество в У. Зна- чит, существует такое число £ > 0, что N(f(x),£, У) С V. Поскольку функция / непрерывна, в соответствии с классическим определением, найдется б > 0, при котором образ окрестности N(x, б, X) будет содер- жаться в N(f(x), £, У), а значит в V. Таким образом, N(x, б,Х) С f~xV, и поэтому прообраз каждого открытого в У множества V открыт в X. Докажем теперь обратное утверждение. Пусть функция f такова, что прообраз f~lV каждого множества V, открытого в У, открыт в X. Покажем, что она непрерывна в соответствии с £ - б определением. Пусть х Е X и дано £ > 0. Окрестность N(f(x), £, У) является открытым множеством в У. Обозначим ее прообраз в X через U. По условию теоремы, множество U открыто. Следовательно, найдется окрестность N(x, б, X), принадлежащая U. Окрестность N(x, б, X) С f~lV. Поэтому f(N(x,6,X)) С N(f(x), £, У) и функция непрерывна в смысле £- 6 определения. Часть теоремы, касающуюся замкнутых множеств, читатель может доказать самостоятельно, действуя аналогично.
252 Глава 9 Таким образом, доказанная теорема утверждает, что непрерывные преобразования переводят открытые множества в открытые. Другими словами, свойство множества быть открытым является топологическим инвариантом. Однако представим, что множество является замкнутым. Пусть, на- пример, это будет буква, написанная на резиновом листе. Легко предста- вить, какие причудливые конфигурации она может принять после набора сжатий и растяжений. Букву «С» нетрудно перевести в «S», затем в «Г», потом в «U» и т.д. Поэтому возникает вопрос, какие же буквы нельзя перевести друг в друга. Очевидно, нельзя перевести те, которые имеют различные топо- логические инварианты. Например, букву «ы» нельзя перевести в «д», потому что «ы» состоит из двух, не связанных между собой частей, а «д» — из одной. Число связных «кусков» или компонент (т. е. таких частей, по которым можно путешествовать, не покидая фигуры) явля- ется топологическим инвариантом. Две гомеоморфные фигуры состоят из одинакового числа компонент. Можно считать, что буква состоит из конечного числа дуг. Фигуры, состоящие из конечного числа дуг, в топологии называют конечными гра- фами. В конечном графе можно выделить набор точек (вершины графа), соединяющихся непересекающимися дугами (ребрами графа). При этом две вершины могут соединяться несколькими ребрами. Кроме того, могут существовать замкнутые ребра «петли», которые начинаются и кончаются в одной точке. Число дуг, сходящихся в вершине, называется ее индексом. Очевидно, число вершин с данным индексом является топологическим Рис. 9.6 инвариантом данной фигуры. Это поз- воляет, например, доказать, что букву «е» нельзя перевести в «ж». У пер- вой буквы есть единственная вершина с индексом 3, у буквы «ж» их две. Все топологические инварианты такого типа кажутся наглядными и очевидными. Однако даже они ока- зываются полезными при решении со- всем не простых задач. В микроэлек- тронике часто бывает необходимо вы- яснить, можно ли соединить данный набор точек на одном уровне, без пересечений. Простейшей задачей та- кого типа является задача о домиках и колодцах. Пусть на плоскости дано шесть точек — домики D\,D2,D^ и колодцы К\, К}, К$. Важно выяснить, можно ли провести тропинки от каждого домика к каждому колодцу, чтобы никакие две тропинки не пересеклись (см. рис. 9.6). Решение этой задачи связанно с введением новых топологических инвариантов. Пусть а, Ъ — два отрезка на плоскости, ни один из которых не содержит концов другого. Если эти отрезки пересекаются, то индекс
Топологические методы в исследовании нелинейных систем 253 пересечения отрезков aub j(a,b) будем считать единичным j(a, b) = 1, в противном случае j(a, b) = 0. Конечный граф, в каждой вершине которого сходится четное число ребер, будем называть циклом. Введем величину, называемую индексом пересечения двух циклов 1(а, Ь). Для этого вначале вычислим сумму S = т. е. сумму w индексов пересечения каждого отрезка а\,...,ам, входящего в цикл а с каждым отрезком bi,... ,Ъя, входящим в цикл Ь. Если S — четное число, то 1(а, Ь) = 0, иначе I(a, b) = 1. Другими словами, /(a, b) = S mod 2. Убедимся, что индекс пересечения двух циклов на плоскости равен нулю. Напомним, что каждая вершина цикла имеет четный индекс, т. е. в ней сходится четное число ребер. Отсюда следует, что она содержит замкнутую ломаную, гомеоморфную окружности. В самом деле, предста- вим, что мы путешествуем по циклу с вершинами ..., Cl. Допустим, путешествие начинается в вершине С\. Попав в вершину С* (k / 1), мы можем продолжить путешествие. Если бы путешествие закончилось в Ск, то это означало бы, что в эту вершину входит только одно ребро, что противоречит определению цикла. Поскольку число вершин конечно, то рано или поздно траектория вернется в С\. Если при этом мы побывали во всех вершинах, то это означает, что вся ломаная гомеоморфна окруж- ности. В противном случае выбросим все ребра, по которым мы прошли. При этом вновь получится один или несколько циклов (поскольку индекс каждой оставшейся вершины будет по-прежнему четным). Повторив эту процедуру достаточное число раз, убедимся, что каждый цикл можно представить как объединение конечного числа замкнутых ломаных, го- меоморфных окружности. Причем эти ломаные не имеют общих отрезков. Поэтому, чтобы проверить, что индекс пересечения двух циклов равен нулю, достаточ- но рассмотреть случай, когда обе они гомеоморфны окруж- ности (см. рис. 9.7). Пример двух таких циклов представлен на рис. 9.7 (цикл b в положе- нии 1). Выберем прямую I и бу- дем сдвигать цикл b параллель- но этой прямой. Для простоты выберем направление прямой I Рис. 9.7 так, чтобы ни одна вершина цикла а не попадала при движении в вершину цикла Ь. Пусть то же относится и к ребрам. Кроме этого, будем считать, что когда одна из вершин цикла лежит на ребре так, как показано на рис. 9.7 (цикл b в положении 2), то индексы пересечения отрезков J(at, Ьт) и j(ai,bm+i) равны нулю. Понятно, что при движении цикла мы будем время от времени стал- киваться только с ситуацией, показанной на рис. 9.7. Однако при этом индекс пересечения двух циклов остается постоянным. Каждый раз число
254 Глава 9 пересечений уменьшается ровно на два. Достаточно далеко продвинув цикл b относительно цикла а, мы придем к ситуации, когда эти циклы не имеют общих точек. Но в этом случае 1(а, Ь) = 0. Таким образом, индекс пересечения двух циклов равен нулю. Вернемся к задаче с домиками и колодцами. Назовем несмежными тропинки, идущие от разных домиков к разным колодцам. Например, не- смежными для тропинки D\K\ будут тропинки Рг-Кь D2K3, D3K2, D3K3. На рис. 9.6 показана некоторая конфигурация тропинок, в которой не- смежные тропинки один раз пересекаются. Покажем, что это число нельзя уменьшить. Прежде всего докажем, что, непрерывно меняя кон- фигурацию тропинки, показанную на рис. 9.6, можно получить любую другую, но нельзя изменить индекс пересечения несмежных тропинок. В самом деле, пусть у нас есть две конфигурации и {D'xK^D^K'iD^Ky}. При этом вершины D1K1D2K2D3K3 принадлежат и первому набору ломаных, и второму, однако сами ломаные могут быть Рис.9.8 иными (см. рис. 9.8). Пусть в первом слу- чае D\K\ — это ломаная а, во втором D\К'х — а (см. рис. 9.8). Ломаные аа со- ставляют цикл. Обозначим его аа. Одна- ко D2K2D3K3D2 также составляют цикл. Однако индекс пересечения этих цик- лов равен нулю, т. е. заменив тропинку D\K\, на ломаную D\K'}, мы не изме- нили четности пересечения. Рассуждая так же относительно других тропинок, убедимся, что так же можно деформировать остальные тропинки, пере- водя {D1K1D2K2D3K3} в {D'xK'xD^K^D^Ky}. Допустим, что существует такое расположение тропинок, при котором пересечений нет и, следова- тельно, индекс пересечения несмежных тропинок 1п равен нулю. Пусть это будет {В\К\В'2К'2В'тК'3}. Но индекс пересечения этой конфигурации 1п в точности такой же, как у расположения тропинок, показанного на рис. 9.6, где In = 1. А значит, провести дорожки от домиков к колодцам, чтобы они не пересекались, не удастся. Близкие, хотя и более сложные задачи, связанные с поиском то- пологических инвариантов, возникают в теории узлов. В этой теории выясняется, можно ли один узел, завязанный на веревке, перевести в дру- гой, не разрывая концов веревки. В последнее время теория узлов начала активно применяться в статистической физике. Вероятно, появятся другие области приложений, прежде всего в химии, где приходится не разрубать гордиевы узлы, а анализировать их конфигурацию. Многогранники, теорема Эйлера Один из замечательных топологических результатов был известен еще Эйлеру и Декарту. Можно проверить, что для пяти правильных многогранников — тетраэдра, куба, октаэдра, додекаэдра и икосаэдра,
Топологические методы в исследовании нелинейных систем 255 а также для пирамид и призм имеет место соотношение В — Р + Г = 2. (9.1) Здесь В — число вершин многогранника, Р — число ребер, Г — граней. В каждом из этих многогранников любая грань гомеоморфна кругу. Поверх- ность этих, а также любых других выпуклых многогранников гомеоморфна сфере. Теорема Эйлера утверждает: Для всякого многогранника, поверхность которого гомеоморфна сфере, а каждая грань гомеоморфна кругу, выполняется соотношение (9.1). Представим, что многогранник внутри пустой и сделан из тонкой резины. Надуем его, как детский шарик, и превратим в сферу, потом вырежем одну грань, а оставшуюся часть «резинового» многогранника растянем на плоскости. Пример такой процедуры показан на рис. 9.9, где «вынута» грань куба ABCD. В результате такого преобразования число вершин и ребер не изменится, а число граней уменьшится на одну, поскольку одна грань вырезана. Покажем, что для получившегося графа на плоскости число В — Р Ч- Г = 1. Рис. 9.9 Если среди граней имеются многоугольники, то будем проводить диа- гонали до тех пор, пока все грани не станут треугольниками (см. рис. 9.9). Легко убедиться, что, проводя диагонали, мы увеличиваем число гра- ней и ребер на единицу, а следовательно величина В — Р + Г остается неизменной. Будем затем удалять по одному граничному треугольнику из полу- ченной треугольной сетки, как показано на рис. 9.10. При этом нам будут попадаться такие треугольники, как АВЕ и как CFG (см. рис. 9.9). Удаляя треугольник первого типа, мы уменьшаем число ребер и граней на едини- цу. При этом величина В - Р-1-Г сохраняется. При удалении треугольников второго типа число граней и вершин уменьшается на единицу, а число ребер — на 2, и величина В - Р + Г вновь сохраняется. В конце концов, на плоскости остается один треугольник, имеющий три вершины, три реб- ра и одну грань. Поэтому для него В-Р+Г=1,нов силу проведенных рассуждений таким оно должно быть и для исходной сетки на плоскости. Учитывая вырезанную вначале грань, убедимся, что В — Р -I- Г = 2.
256 Глава 9 Рис. 9.10 Теорема Эйлера позволяет решать множество различных задач. Одним из ключевых геометрических результатов Евклид считал до- казательство того, что существует пять выпуклых правильных многогран- ников. Напомним, что выпуклым многогранником называется замкнутая конечная область пространства, ограниченная некоторым числом плоско- стей. Причем внутренность многогранника лежит по одну сторону от каж- дой плоскости. Для правильных многогранников все грани конгруэнтны (равны) и все плоские углы при вершинах равны между собой. Платон считал правильные многогранники символами четырех эле- ментов — земли, огня, воздуха и воды, а пятый многогранник — фигурой, охватывающей всю Вселенную. Вписывая эти многогранники друг в дру- га, Кеплер пытался построить теорию, предсказывающую размеры орбит планет Солнечной системы. Число и характеристики правильных многогранников могут быть предсказаны на основе теоремы Эйлера. Будем считать, что в каждой из В вершин сходятся q ребер. Тогда gB = 2Р, поскольку каждое ребро считается дважды. Если каждая из граней имеет р сторон, то 2Р = рГ. Таким образом, qB = 2Р = рГ. Однако В_Р_Г_В-Р+Г_ 2 _ 4pq - | - --1 + - - + - -1 2p + 2q-pq q 2 р q 2 ' р q ' р 2 г ' ъ гъ D 4р р 2pg г 2p + 2q — pq’ 2p + 2q-pq’ 2p+2q-pq Поскольку эти числа положительны, 2р + 2q - pq > 0 => (р - 2)(д - 2) < 4. Произведение двух целых положительных чисел может быть меньше четырех, если сомножители равны, соответственно, 1-1; 2-1; 1-2; 31; 1-3. Это приводит к следующим парам {р, q}: {3,3} — тетраэдр, {4, 3} — куб, {3,4} — октаэдр, {5,3} — додекаэдр, {3, 5} — икосаэдр.
Топологические методы в исследовании нелинейных систем 257 Эйлерова характеристика поверхности и теорема Пуанкаре Теорема Эйлера справедлива для многогранников, поверхность кото- рых гомеоморфна сфере. Поэтому естественно считать, что величина X = В - Р + Г, называемая эйлеровой характеристикой, отражает прежде всего свойства поверхности, а не каждого конкретного многогранника. Можно ожидать, что другие поверхности имеют другие эйлеровы характеристики. В качестве примера найдем эту величину для тела, называемого сферой с ручкой (см. рис. 9.11). Рис. 9.11 Воспользуемся тем, что мы имеем дело с «резиновой» геометрией и тем, что эйлерова характеристика любого многогранника на поверхности сферы равна двум. Пусть в основании ручек лежат треугольные или квадратные грани некоторого многогранника. Разобьем поверхность сферы с ручкой на поверхность двух тел: сфе- ры с двумя дырками и ручки, которая гомеоморфна боковой поверхности призмы (см. рис. 9.11). Для сферы с двумя дырами число граней у соответ- ствующего многогранника на 2 меньше, чем в том случае, когда дыр нет. Следовательно, х = О- У боковой поверхности вершины и ребра, лежащие в основании призмы, были уже учтены при подсчете эйлеровой характе- ристики многогранника на сфере. Таким образом, нужно учесть только новые ребра и столько же новых граней, но для них также В - Р -I- Г = О, т. е. эйлерова характеристика сферы с ручкой равна нулю. Такие же рассуждения показывают, что значение х₽ Для сферы с р ручками Хр = 2 - 2р. С помощью более строгих рассуждений можно доказать, что эйлерова характеристика является топологическим инвариантом. Замечательная поверхность, построенная Мебиусом, показывает, что эйлерова характеристика не обязательно является четным числом, и что само понятие поверхности является более глубоким и сложным, чем кажется на первый взгляд. Эта поверхность, называемая листом Мебиуса, получается после пере- кручивания листа прямоугольной формы, и склеивания противоположных
258 Глава 9 Рис. 9.12. Отожествляя отрезок АВ с отрезком А'В', можно получить лист Мебиуса концов (см. рис. 9.12). При этом отрезок АВ склеивается (отождествляет- ся) с отрезком А'В' (см. рис. 9.12). Эта поверхность является односторон- ней. Читатель может сделать модель этой поверхности. Если закрашивать кольцо, начиная с некоторой точки, то закрашенной окажется только одна часть — внешняя или внутренняя. Обычное бумажное кольцо име- ет два края, каждый из которых гомеоморфен окружности. Напротив, лист Мебиуса будет закрашен целиком. Кроме того, край этого листа гомеоморфен одной окружности. Односторонние поверхности обладают еще одним интересным свой- ством, которое позволяет дать другое определение односторонней по- верхности. Проведем нормаль из некоторой точки листа А и вокруг ее основания опишем небольшую окружность, на которой отметим направ- ление вращения. Пусть вращение, если смотреть из конца нормали, будет происходить против часовой стрелки. Будем перемещать точку А вдоль листа вместе с нормалью и окружностью. После обхода листа Мебиуса и возврата в исходное положение нор- маль будет направлена в противоположную сторону и направление вра- щения на окружности изменится на противоположное. Такие замкнутые траектории, называются обходами, меняющими ориентацию. Если на по- верхности таких обходов нет, то поверхность называется двусторонней или ориентируемой. Если есть, то односторонней или неориентируемой. Наличие такого объекта, как лист Мебиуса, позволяет строить не- обычные объекты. В самом деле, чтобы задать поверхность, нам надо было определить окрестность каждой точки. Должно быть ясно, куда мы будем попадать, двигаясь в различных направлениях по поверхности. Такую окрестность можно задать, не только непрерывно растягивая или сжимая некоторое исходное множество, но и склеивая или отождествляя различные точки или отрезки. Именно так и было сделано при построе- нии листа Мебиуса. Эта операция не зависит от того, насколько хорошо нам удается представить этот объект, и от того, вкладывается ли он без самопересечений в трехмерное пространство. Заметим, что край листа Мебиуса гомеоморфен окружности. По- ступим следующим образом. Вырежем из сферы р кругов и заклеим их листами Мебиуса, отождествляя точки получившейся окружности с точка- ми края листа Мебиуса. Понятно, что после такой операции мы получим замкнутую поверхность. Обозначим ее через Np.
Топологические методы в исследовании нелинейных систем 259 Нарисовав чертеж, можно убедиться, что эйлерова характеристика та- кой поверхности равна 2-р. Это замкнутое множество не удается располо- жить в трехмерном пространстве без самопересечений. Одним из наиболее известных примеров обсуждаемых поверхностей является бутылка Клейна. Обозначим сферу с к ручками через Р*. На первый взгляд, кажется, что заклеивая в сфере дыры ручками, листами Мебиуса, сложным образом зацепляя их, можно получить самые разнообразные причудливые поверх- ности. Кажется, что задача топологической классификации, т. е. перечис- ления всех попарно негомеоморфных замкнутых поверхностей, таких, что любая замкнутая поверхность гомеоморфна одной из них, неразрешима. И тем более замечательным представляется результат, полученный Мебиусом и Жорданом в прошлом веке. Ими было доказано, что набор сфер с ручками Pq, Р\,..., Pk,... дает полную топологическую классифи- кацию замкнутых ориентируемых поверхностей, а набор сфер с листами Мебиуса N\,N2,, Nq,... — полную классификацию замкнутых неори- ентируемых поверхностей. Эти результаты непосредственно связаны с теорией динамических систем вида у = д(х,у), в которых замкнутая поверхность может играть роль фазового простран- ства. Это пространство совсем не обязательно должно быть плоскостью. Вспомним математический маятник. В нем угловая переменная <р опре- делена с точностью до 2тг, а скорость <р определена однозначно. Следова- тельно, точки (<р, ф) и (у? + 27Г7п, <р), т = ±1, ±2,... можно отождествить. При таком отождествлении фазовое пространство приобретает вид трубы. Функции f(x, у), д(х, у) задают в фазовом пространстве G некоторое векторное поле. Это поле определяет в каждой точке поверхности G неко- торый касательный вектор. С геометрической точки зрения это понятно. Если бы это было не так, то точка (x(t), y(t)), характеризующая состо- яние динамической системы, покидала бы поверхность G. Но тогда G не было бы фазовым пространством. Обратим внимание на особые точки динамической системы. В этих точках абсолютная величина вектора фазовой скорости v = (f(x,y),g(x,y)) стремится к нулю. Если рассмотреть направление этого вектора ш = гГ/|г>|, то окажется, что в регулярных точках эта функция непрерывно зависит от фазовых переменных х и у. В особых точках функция ш терпит разрыв. Это видно из рисунка, на котором представлены векторные поля в окрестности различных особых точек (см. рис. 9.13). Встает вопрос, можно ли построить на данной поверхности, напри- мер, на сфере, непрерывное поле направлений й, т. е. в каждой точке определить касательный вектор так, чтобы при перемещении от точки к точке он менялся непрерывно. Другими словами, определить вектор- ное поле, т. е. динамическую систему вида (9.2), которая не имела бы
260 Глава 9 Рис. 9.13. Вектор ш в окрестности различных особых точек особых точек. Эту задачу иногда называют «задачей о еже». Представим себе, что из каждой точки сферы проведен некоторый вектор-«колючка». Спрашивается, можно ли так «причесать ежа», чтобы ни одна «колючка» не торчала перпендикулярно сфере. Спроектировав «колючку» на сферу, можно убедиться, что ответ был бы положительным, если бы существовало векторное поле на сфере, не имеющее особых точек. Рис. 9.14. Чтобы определить индекс особой точки векторного поля, надо следить, как меняется при обходе вокруг этой точки направление вектора ш Решение этой проблемы было дано А. Пуанкаре. Обратимся к рис. 9.14. Будем обходить каждую из нарисованных особых точек по замкнутому контуру против часовой стрелки. При обходе узла, фокуса или центра вектор повернется на 2тг, при обходе седла — на -2тг, т. е. совершит один оборот в противоположном направлении. Будем узлу, фокусу и центру приписывать индекс (+1), седлу — (-1). А. Пуанкаре доказал следующее утверждение. Пусть на замкнутой ориентируемой поверхности G задано поле нену- левых касательных векторов, непрерывное всюду, кроме конечного числа особых точек. Тогда сумма индексов всех особых точек этого поля равна эйлеровой характеристике поверхности G — x(G). Отсюда сразу следует, что «причесать ежа» нельзя. Эйлерова характе- ристика сферы равна двум, т. е. векторное поле должно иметь на сфере, как минимум, две особые точки. Например, два узла (как на глобусе, на котором точка движется вдоль меридианов). Если мы хотим, чтобы поле имело седло, то надо добавить еще одну точку с индексом +1, например, фокус. И общее число точек станет равно четырем. Из этой теоремы следует, что можно «причесать колючий тор» — векторное поле
Топологические методы в исследовании нелинейных систем 261 на этой поверхности может не иметь ни одной особой точки (очевидно, тор — это сфера с одной ручкой). Ни на одной другой сфере с ручками такого поля не существует. При мягком моделировании биологических объектов, экологических систем, различных электронных схем у специалистов в этих областях часто есть интуитивные представления об изучаемой системе, о чис- ле и характере состояний равновесия исследуемого объекта. Обращаясь к специалистам по математическому моделированию, они обычно просят отразить это в создаваемых моделях. И здесь теорема Пуанкаре часто играет принципиальную роль. Она дает своеобразное «правило запре- та», показывающее, какие модели могут быть, в принципе, построены, а какие нет. Поясним основную идею доказательства теоремы Пуанкаре. Для этого проверим вначале, что сумма индексов двух любых векторных полей, заданных на поверхности G, одинакова, а потом вычислим ее для наиболее простого векторного поля. Предположим, что на ориентируе- мой поверхности G заданы два ненуле- вых векторных поля V\(x, у) и V2(x,y), имеющие конечное число особых то- чек. Разобьем поверхность G на малень- кие многоугольники так, чтобы в каж- дом многоугольнике было не более од- ной особой точки и чтобы эти точки не попадали на границу многоугольни- ков (см. рис. 9.15). Отметим, что вдали от особых точек Рис.9.15. Один из многогран- ников, на которые разбита поверхность G мы можем поворачивать векторы иссле- дуемых векторных полей, оставляя сами поля непрерывными и не меняя сумму их индексов. Воспользовавшись этим, по- вернем векторы поля V\(x, у) вблизи вершин построенных многоуголь- ников так, чтобы в каждой вершине векторы V\(x,y) и v2(z, у) совпали (здесь через V\(x, у) обозначено «модифицированное» поле V\(x,y)). Выберем на поверхности положительное направление отсчета углов. Например, против часовой стрелки, если смотреть с внешней стороны. Это можно сделать, поскольку поверхность G ориентируема. Возьмем какое-нибудь ребро многоугольника. Например, и, соеди- няющее вершины А и В. Допустим, что мы при движении от Л к В следим за некоторым вектором который совпадает с Vi(x,y). Предпо- ложим, что на пути от В к А этот вектор совпадает с V2(x,y). При движении от Л к В, а затем от В к Л вектор ш совершит целое число оборотов. Это следует из построения векторного поля V1 (х, у) - V\ (Л) = и2(Л), V1 (В) = v2(B).
262 Глава 9 Рис. 9.16. При обходе мно- гоугольников М[ и М2 против часовой стрелки ребро rs обходится два- жды, причем в противопо- ложных направлениях Обозначим число оборотов вектора ш при дви- жении вдоль ребра и через d(ri). На рис. 9.15, к примеру, d(ri) = 1, d(r2) = 0, d(r3) = -1. Заметим, что если бы мы обходили ребро ri в противоположном направлении от В к А и на- зад к В, то величина d(rj) изменила бы знак. Рассмотрим один из построенных много- угольников М. Будем обходить его в положи- тельном направлении. Пусть при этом вектор у) совершит Z\(M) оборотов. Обойдем те- перь контур в противоположном направлении. Пусть при этом вектор v2(x, у) совершит z2(M) оборотов. Естественно, zi и z2 — целые числа, поскольку рассматриваемые векторы после обхода по замкнутому контуру возвращаются в исходное положение. В результате вектор ш совершит zi(M)-z2(Af) оборотов. Вместе с тем, рассматривая движение вдоль отдельных ребер, можно убедиться, что zi(M) - z2(M) = d(r\) +... + d(rk). (9.3) В самом деле, и получая величины zj и z2, и получая значения d(r*) мы обходили каждое ребро один раз в положительном направлении, следя за Vi(x, у), и один раз в противоположном, следя за v2(x, у). Просуммируем теперь формулу (9.3) по всем многоугольникам, на ко- торые разбита поверхность G. Тогда правая часть обратится в ноль. Причина этого понятна из рис. 9.16. Реб- ро гв, к примеру, встретится в этой сумме дважды, поскольку к нему примыкают два многоугольника Mi и М2. Заметим, что при обходе этих многоугольников против часовой стрелки ребро rs будет обходиться в различных направлениях. При обходе Mi это даст d(r3), при обходе М2 — -d(ra). То же справедливо для любого другого реб- ра. Следовательно, £>(М*)-5>2(М*) = 0. (9.4) к к Однако Zi(Mk) определяется сум- к мой индексов векторного поля Vi(x, у) (и, следовательно, vj (х, у)). Причину этого по- ясняет следующее рассуждение. Рис. 9.17. Построив систему за- мкнутых линий, можно убедить- ся, что угол поворота вектора ш при обходе вдоль контура опре- деляется индексом особой точ- ки внутри многоугольника
Топологические методы в исследовании нелинейных систем 263 Пусть внутри многоугольника М находится особая точка xq (см. рис. 9.17). Построим систему близких друг к другу замкнутых линий так, как показано на рисунке. Пусть одна из них совпадает с маленькой окруж- ностью с центром в точке xq, а другая — с контуром многоугольника М. При переходе от одной линии к близкой ей, как следует из соображений непрерывности,число оборотов вектора V\(x,y) должно меняться мало. Однако число оборотов является целым, на малую величину изменить- ся оно не может и, следовательно, остается постоянным. Но при об- ходе малой окружности с центром в точке Xq мы получим индекс этой точки. При обходе вдоль контура многогранника — величину zj(M). Следовательно, обе эти величины равны. Тогда из формулы (9.4) сле- дует, что сумма индексов векторных полей 1?1(ж, у) и V2(x, у) (а значит, и других полей на поверхности G) одинакова. Выберем теперь векторное поле, сумму индексов для которого лег- ко посчитать. Для этого разобьем поверхность G на многоугольники. В каждой вершине расположим узел (см. рис. 9.18 а), в середине каж- дого ребра — седло (рис. 9.18 6), в середине каждого многоугольни- ка — тоже узел (рис. 9.18 в). Харак- терная картина такого векторного поля представлена на рис. 9.19. Его индекс равен Рис. 9.18. Особые точки векторного поля, индекс которого легко вычис- лить: а) узел, расположенный в вер- шине; б) седло, расположенное в се- редине ребра; в) узел, находящийся в середине грани Рис. 9.19. Характерный вид построенного векторного поля (+1)в + (-1)Р + (+1)Г = x(Q). Таким образом, существует замечательная связь между топологи- ческими свойствами фазового пространства G и векторными полями, которые на этой поверхности могут быть построены. Вычислительный эксперимент, молекулярный дизайн и топологические методы Традиционный подход математического моделирования к проблемам естествознания связан с выделением наиболее важных черт различных объектов и явлений и их описанием. Однако все большее значение при-
264 Глава 9 обретает в последнее время и другой класс задач, в которых следует предсказать свойства не существующих в природе или пока не найденных объектов. Такая ситуация возникает, например, при разработке новых композитных материалов, компьютерном проектировании лекарств, со- здании новых электронных приборов. Кроме того, во многих случаях мы располагаем гигантской ин- формацией: банки данных белков, различных химических соединений, космические снимки, данные с метеорологических и сейсмических стан- ций и т. д. Существует огромная избыточность многих информационных ресурсов. При ответе на конкретный вопрос обычно требуется ничтожная часть всей имеющейся информации. Чтобы выделить ее, часто требуется найти своеобразные параметры порядка в информационном массиве. Топологические методы в таких задачах могут играть важную роль. Они приводят к необычному подходу, к математическому моделирова- нию, связанному с новыми возможностями натурного и вычислительного эксперимента. Одним из крупных открытий в современной химии стало открытие класса соединений, называемых фуллеренами, которые обладают многими замечательными свойствами. Автор оригинальных «научных фантазий», которые публиковались в журнале “New Scientist” Дэвид Джоунс в 1966 г. обратил внимание на любопытную закономерность. Существует разрыв между плотностями газов (порядка 0,001 г/см3) и плотностями жидкостей и твердых тел (от 0,5 до 25 г/см3). Вещества с промежуточными плотностями в физических справоч- никах отсутствуют. Этот промежуток, по мнению Джоунса, могли бы заполнить так называемые «полые молекулы» — некоторые полимерные молекулы, которые могут иметь сферическую или более сложную форму. Естественным кандидатом на роль материала для таких молекул яв- ляется углерод. Если атом углерода связан с четырьмя такими же атомами, то получается трехмерная решетка, характерная для алмаза. Если соседей двое, то получаются линейные конструкции, характерные для полимер- ных молекул. Если есть три ближайших соседа, то атомы могут лежать в вершинах правильных шестиугольников, заполняющих плоскость. Такое расположение возникает в кристаллах графита. Спросим себя, можно ли, имея в распоряжении только атомы углерода, сконструировать некото- рые пространственные многогранники. Будем полагать, что, так же как в графите, каждый атом имеет три ближайших соседа. Предположим, что желаемый многогранник имеет только шестигран- ные ячейки, число которых равно щ. Тогда число граней Г = вершин В = 6пв/3, ребер Р = 6Пб/2. Воспользуемся теоремой Эйлера. Для этого многогранника X = В + Г — Р = 0, т. е. поверхность такого многогранника гомеоморфна сфере с одной ручкой или тору. Мне не доводилось читать сообщений об углеродных структурах тороидальной формы. Однако с помощью квантомеханических расчетов
Топологические методы в исследовании нелинейных систем 265 интересно было бы выяснить принципиальную возможность существова- ния таких конфигураций. Итак, для построения «полых молекул» с поверхностью, гомеоморф- ной сфере, одних шестиугольных граней недостаточно. Предположим, что у нас есть еще п$ пятиугольных и пу семиугольных граней. Роль вершин будут играть атомы, ребер — валентные связи. В этом случае, используя теорему Эйлера (см. задачи) можно проверить, что П5 - Пу — 12. Самое замечательное состоит в том, что простейшая конструкция такого типа очень часто попадается нам на глаза. Это обычный футболь- ный мяч, сшитый из 12 правильных пятиугольников и 20 правильных шестиугольников (см. рис. 9.20 а). Рис. 9.20. а) многогранник, определяющий структуру фуллерена Сео! б) структура /3-циклодекстрина Эта конфигурация очень красива. Однако после того, как она «скон- струирована», следует проверить, стоит ли искать ее в натурном экспе- рименте. Для этого существует вычислительный эксперимент и много- численные программы для расчета молекул. В одних из них атомы заме- няются шариками, а валентные связи — пружинками, в других вводятся элементы квантовомеханического описания. С помощью этих программ можно выяснить, насколько энергетически выгодна такая конфигурация и имеет ли она право на существование. Такая методика работы полу- чает очень широкое распространение. В частности, широко используется компьютерное проектирование лекарств. Прежде чем синтезировать слож- ные химические соединения, очень желательно знать о них достаточно много. Еще в большей степени это относится к биотехнологии, где ищут- ся и культивируются микроорганизмы, способные производить нужные нам вещества. Итак, молекула Сбо оказалась устойчивой. Оказалось, что таких моле- кул достаточно много в природе. Они встречаются в газовой саже, свежем нагаре и т.д. Это вещество было названо в честь американского архи- тектора и инженера Бакминстера Фуллера, разработавшего конструкции
266 Глава 9 ячеистых куполов, бакминстерфуллереном. Эту молекулу называют для краткости бакиболом или футболино. Удивительная геометрическая структура приводит к замечательным физическим свойствам. Эти молекулы обладают очень большой проч- ностью: они не разрушаются, даже сталкиваясь с преградой со скоро- стью 104 м/с. Это позволяет использовать их в качестве смазки. С другой стороны, их пустотелость дает возможность с помощью фуллеренов (со- единений со структурной формулой Cik) упаковать отдельные атомы или молекулы, что может иметь принципиальное значение для микробиоло- гии и медицины. Замечательными свойствами обладают и соединения фуллеренов. Например, фуллерит КуСю и другие соединения оказались высокотемпературными сверхпроводниками. Более того, выяснилось, что выращивание фуллеренов может быть исключительно эффективным и де- шевым, если испарять графит в гелиевой атмосфере. Процесс изменения топологии молекул может играть весьма большую роль и для более сложных органических веществ, которые участвуют в био- химических процессах. Сотрудник Уфимского Института биологии РАН Н. Г. Усанов обратил мое внимание на штаммы микроорганизмов, зани- мающихся изменением топологии. Оказалось, что существуют бактерии, превращающие обычные линейные молекулы крахмала в своеобразные «клубки», напоминающие по форме торы и состоящие из нескольких сотен атомов — циклодекстрины (см. рис. 9.206). В них также можно «упаковывать» различные молекулы, заставляя растворяться вещества, которые были нерастворимы без этой процедуры. С их помощью можно придавать различным объектам желаемые запахи. За последние годы в мире было получено более 4000 патентов, связанных с различными технологиями, использующими циклодекстрин. Исследо- вания Н. Г. Усанова показали, что участие циклодекстрина в обычных реакциях «из школьного учебника» может кардинально повлиять на их ход. В последние годы появились также веские основания считать, что циклодекстрины и их аналоги не являются столь уж большой экзотикой и природа использует их во многих своих конструкциях. Прямой органический синтез циклодекстринов является сложным и дорогим. Поэтому ищут и отбирают микроорганизмы, которые могут превращать обычный крахмал в циклодекстрин. Для чего же самим бак- териям заниматься изменением топологии, производя циклодекстрины? Обсуждаются две гипотезы. В соответствии с первой, это нужно опреде- ленным штаммам, чтобы запасти питание, создав своеобразные «консер- вы», которые непригодны для конкурентов. В соответствии с другой, это нужно, чтобы с помощью циклодекстринов изменить растворимость ряда веществ, участвующих в жизненном цикле бактерий. Однако поиск микроорганизмов, производящих аналоги циклодекс- тринов и родственные объекты, требует больших усилий. Поэтому вновь приходится прибегать к математическому моделированию: оценивать с по- мощью компьютера устойчивость молекул, производители которых ищут-
Топологические методы в исследовании нелинейных систем 267 ся, моделировать химические реакции, в которые создаваемые соединения должны вступать в рамках той или иной технологии. Есть еще одна важная область прикладных исследований, где тополо- гические методы приводят к важным результатам. В настоящее время от- крыто и описано более 7 млн химических соединений. Как на этой основе предсказывать свойства еще не созданных веществ? Как прогнозировать характеристики уже известных объектов, не проводя многочисленных и дорогих экспериментов? Возможен следующий подход. Молекула рассматривается как некото- рый граф. При этом игнорируется трехмерная форма молекул, величины углов между химическими связями и множество других характеристик. Вводятся некоторые топологические индексы, отражающие, например, со сколькими атомами связан каждый атом данной молекулы, образу- ют ли они линейные цепи или разветвленные структуры. Простейший индекс, связанный с топологическим инвариантом «хи- мического графа», был известен давно. Если рассматривать углеводороды, т. е. соединения, состоящие только из углерода и водорода, то можно считать, что граф составляют только атомы углерода (вершины) и связи между ними (ребра). Простейший инвариант — число вершин. Он из- вестен в химии как углеродное число и действительно связан с рядом физических характеристик углеводородов. Однако анализ разветвленных молекул требует более сложных топо- логических параметров. Один из них — индекс Винера. В теории графов иногда используют понятие топологического расстояния между верши- нами. Это число ребер, связывающих кратчайшим путем эти вершины. Для молекулы индекс Винера равен сумме топологических расстояний между всеми парами атомов ее углеродного скелета. Оказывается, зная индекс Винера, можно весьма точно определить температуру кипения для большого класса соединений. Ряд топологических индексов позволяет прогнозировать такие харак- теристики, как температура плавления, октановое число, выход сажи при неполном сгорании углеводородов. Некоторые из индексов удалось свя- зать с проявлением физиологической активности молекул, — с их запахом, токсичностью, способностью подавлять рост ряда бактерий и степенью канцерогенности. «Молекулярная топология» оказалась эффективным пу- тем упрощения анализа изучаемых объектов, что является очень важным при математическом моделировании. Вопросы и задачи 1. Доказать, что произвольное непрерывное отображение / окружности в пря- мую переводит какую-нибудь пару диаметрально противоположных точек в одну.
268 Глава 9 2. Доказать, что нелинейное алгебраическое уравнение нечетной степени f(x) = d2n+iX2n+l + d2nX2n + ... + (Jo = 0, (J2n-»-l 0 имеет хотя бы один действительный корень. 3. К специалисту по математическому моделированию обратились с просьбой сконструировать динамическую систему со следующими свойствами * = f (я, у), у = д(х,у), f(x, у) = f(x 4- а, у), д(?, У) = !/), №,!/) = №,!/ + &), При этом система должна обладать «триггерными свойствами», — иметь два устойчивых узла и седло и не иметь других особых точек. Пожалуйста, сконструируйте такую систему, либо докажите, что это невозможно. 4. Один из простейших многоклеточных организмов — водоросль «вольвокс» — представляет собой сферическую оболочку, сложенную из пятиугольных, ше- стиугольных и семиугольных клеток. В каждой вершине этого тела сходятся 3 клетки. Биологи заметили, что пятиугольных клеток ровно на 12 больше, чем семиугольных. Почему? 5. Можно ли десять городов соединить между собой непересекаюшимися до- рогами так, чтобы из каждого города выходило пять дорог, входящих в пять других городов? 6. Доказать, что у любого выпуклого многогранника найдутся две грани с оди- наковым числом ребер. 7. Доказать, что не существует многогранника, у которого к каждой вершине и к каждой грани примыкает не менее чем по четыре ребра. 8. На тарелке лежат два блина неправильной формы. Можно ли одним взмахом ножа разрезать их на две равновеликие (имеющие одинаковую площадь) части? 9. Можно ли разрезать блин на плоскости на четыре равные части двумя перпендикулярными прямыми? 10. Одним из первых результатов проективной геометрии, полученных в XVII в., стало следующее утверждение. Пусть на плоскости расположены треуголь- ники АВС и А'В'С' так, что прямые АА', ВВ', СС' пересекаются в одной точке. Обозначем через Р, Q, R точки пересечения прямых АВ и А'В', АС и А'С', ВС и В'С' соответственно. Требуется доказать, что точки Р, Q и R лежат на одной прямой. 11. Каждая точка окружности является черной или белой. Доказать, что найдется равнобедренный треугольник, вершины которого имеют одинаковый цвет. 12. Три башни замка расположены в вершинах треугольника АВС. Четвертая башня — в точке О внутри треугольника. Крепостные стены идут вдоль отрезков АВ, ВС, АС, АО, ВО, СО. Можно ли осмотреть весь замок (т. е. пройти по всем крепостным стенам и посетить все башни), не проходя ни по одной крепостной стене дважды? 13. Можно ли накрыть всю плоскость конечным числом внутренностей парабол?
Топологические методы в исследовании нелинейных систем 269 14. На плоскости проведено п прямых линий. Доказать, что области, на которые эти прямые разбивают плоскость, можно закрасить двумя красками так, что никакие две соседние области (которые соприкасаются по отрезку прямой) не будут закрашены одной и той же краской. 15. Склеим ленту Мебиуса, а потом разрежем ее вдоль средней линии. Будет ли получившаяся поверхность неориентируемой? 16. Докажите, что у произвольного непрерывного отображения круга в себя найдется хотя бы одна неподвижная точка. (Указание. Обратите внимание на аналогию этой задачи с проблемой «причесывания» сферы или тора.) 17. Внутри остроугольного треугольника АВС найти точку О, чтобы сумма длин отрезков О А, ОВ, ОС была минимальной. (Указание. Обратите вни- мание на близкие проблемы, возникающие в связи с мыльными пленками, минимальными поверхностями и т. д.) 18. Населенные пункты А, В, С, D находятся в вершинах квадрата. Какова си- стема дорог минимальной протяженности, соединяющая А, В, С, D (так, чтобы из каждого населенного пункта можно было бы проехать в каж- дый)? Можно ли обобщить, по вашему мнению, этот результат на систему из п населенных пунктов Л1,..., Ап? Какими вычислительными алгорит- мами вы бы посоветовали пользоваться в этом случае? (Указание. Обратите внимание на результат предыдущей задачи.) 19. Склеим лист Мебиуса из бумажной ленты. Будем уменьшать длину ленты до тех пор, пока это возможно. Какая фигура возникнет в конце концов? 20. Можно ли так соединить три кольца, чтобы все они были связаны вместе, однако каждые два не были бы сцеплены между собой? 21. Представим себе сферу с двумя ручками, продетыми одна в другую. Не проти- воречит ли существование такой фигуры сформулированной теореме о клас- сификации ориентируемых двумерных поверхностей? 22. Возьмите кофту, имеющую петли и пуговицы, карандаш и нитку. Сделайте из нитки петлю, меньшую, чем половина длины карандаша. Проденьте эту нитку в петлю кофты, а затем проденьте в ниточную петлю карандаш и потом жестко закрепите нитку вблизи конца карандаша (обычно бывает удобно сделать бороздку на карандаше и обвязать). В результате этой операции карандаш будет прикреплен к кофте. Можно ли вынуть его, не ломая и не разрывая нитку? 23. Равносторонний треугольник разбит на конечное число треугольников. До- казать, что хотя бы у одного из них каждый угол не превосходит 120°. 24. Раскрашивая карту Великобритании, английский студент в прошлом веке заметил, что для раскраски, при которой соседние графства (имеющие общую границу) раскрашены в разные цвета, достаточно четырех красок. Это наблюдение положило начало большому циклу работ, связанных с анализом проблемы четырех красок. Постройте пример, показывающий, что для карты, нарисованной на поверхности тора четырех красок будет недостаточно. 25. Три вершины графа — А, В, С — находятся в вершинах треугольника АВС. Вершины Е и F — концы отрезка, находящегося внутри треугольника АВС. Ребра графа связывают каждую вершину со всеми остальными. Мож- но ли расположить этот граф на плоскости таким образом, чтобы его ребра не пересекались? 26. Вписать в данный остроугольный треугольник треугольник минимального периметра. (Указание. Ключ к решению может дать принцип Ферма и законы геометрической оптики.)
270 Глава 9 Рекомендуемая литература Основные понятия топологии на элементарном уровне обсуждаются в книгах: Болтянский В. Г., Ефремович В. А. Наглядная топология. М.: Наука, 1982; Стинрод Н., Чинн У. Первые понятия топологии. М.: Издательство ЛКИ/URSS, 2008; Кокстер Г. С. М. Введение в геометрию. М.: Наука, 1966. Более серьезный курс, рассматривающий реализацию топологической части про- граммы А. Пуанкаре, см. в книге: Борисевич Ю. Г., Близняков Н.М., Израилевич Я. А., Фоменко Т.Н. Введение в топологию. М.: Высшая школа, 1980. Примеры использования топологических методов в анализе динамических систем приводятся в книгах: Баутин Н. Н., Леонтович Е.А. Методы и приемы качественного исследования динамических систем на плоскости. М.: Наука, 1976; Арнольд В. И. Дополнительные главы теории обыкновенных дифференциаль- ных уравнений. М.: Наука, 1978. Открытие фуллеренов и использование топологических методов в «проектирова- нии» новых веществ обсуждаются в работах: Джоунс Д. Изобретения Дедала. М.: Мир, 1985; Тйходеев С. Конструкции из углерода // Квант. 1993. № 1/2. — С. 15-25; Рувре Д. Г. Химию прогнозирует топология // В мире науки. 1986. №11. - С. 14-22.
Escher M.C. Hand with reflecting sphere. 1935 Эшер M. К. Рука с отражающей сферой
Глава 1О Нейронные сети Сегодня мы не можем сказать с уверенно- стью, содержит ли уравнение Шредингера и лягушек, и композиторов, и даже мораль, или там ничего похожего и быть не может. Мы не можем сказать, требуется ли что- либо сверх уравнения, вроде каких-то богов, или нет. Поэтому каждый из нас может иметь на этот счет свое особое мнение. Р. Фейнман Нейронаука Вычислительные машины дали очень много нелинейной динами- ке. Они позволили исследовать математические модели, возникающие в разных областях, и обнаружить множество интересных нелинейных эф- фектов. Сейчас нелинейная динамика «возвращает долги» компьютерным наукам и вычислительной технике. Компьютерное моделирование играет важную роль в междисципли- нарном подходе, называемом нейронаукой. Этот подход призван ответить на вопрос, как работает мозг, какие психические события определяются паттернами нервных импульсов в мозге. Нейронаука возникла на сты- ке многих научных дисциплин. Среди них нейрофизиология, биохимия, когнитивная психология, математика, вычислительная техника. Развитие нейронауки показало, что основным способом понимания протекающих в мозге процессов, осмысления имеющихся эксперимен- тальных данных, постановки новых проблем является построение и ис- следование математических моделей. Естественно, следует отдавать себе отчет, что путь от нынешнего состояния работ в этой области к глубокому пониманию принципов работы мозга, по-видимому, очень длинен. Моде- ли скорее отвечают на вопрос, как могли бы работать те или иные системы, в каких-то чертах согласующиеся с данными об архитектуре, функциях, особенностях мозга. Тем не менее, исследования в нейронауке уже откры- ли пути для создания новых компьютерных архитектур и наделению вы- числительных систем своеобразной интуицией, ассоциативной памятью,
274 Глава 10 способностью к обучению и обобщению поступающей информации, т. е. возможностями, которые раньше считались прерогативами живых систем. Огромный интерес, проявляемый к этим работам в последние пятна- дцать лет, обусловлен несколькими причинами. В 60-е и 70-е гг. большие надежды возлагались на научное направление, называемое искусствен- ным интеллектом. Предполагалось, что, опираясь на логику, дискретную математику, можно будет создать программное обеспечение, решающее широкий круг задач: от доказательства теорем и сочинения стихов до шах- матной игры, медицинской диагностики, государственного планирования. Несмотря на отдельные успехи в решении конкретных задач, на этом пути возникли принципиальные трудности. Во многих случаях формализация процедур оценки ситуации и вы- работки решения оказалась очень сложной. Их программная реализация, создание детальных инструкций для гигантского числа возможных ситуа- ций, с которыми может встретиться компьютерная система, также требует очень больших затрат. В частности, одним из принципиальных моментов, заставивших США в свое время отказаться от системы полномасштаб- ной противоракетной обороны с элементами космического базирования (программа «звездных войн»), стали трудности создания программного обеспечения. Ряд экспертов оценивали объем работы по созданию такой системы в сотни тысяч человеко-лет работы высококвалифицированных разработчиков. Это заставило искать новые принципы и по-новому взглянуть на по- разительную способность человеческого мозга ориентироваться в незнако- мой, не встречавшейся ранее ситуации, управлять движением, принимать быстрые и достаточно точные решения, распознавать образы. В самом деле, трехлетний ребенок с легкостью отличает кошку от собаки в жизни, на картинке, при разном освещении. Для компьютерных программ это нерешенная проблема. Второе обстоятельство, способствовавшее бурному развитию нейро- науки и большому интересу к ней, — успехи биологии. В последние сорок лет стало ясно, как в ряде важных случаев проходится путь от взаимо- действия отдельных молекул до реакции организма как целого. На новом уровне, связанном с развитием молекулярной биологии, стала ясна уни- версальность многих биологических механизмов. Появилась надежда, что благодаря новым методам, инструментам, идеям этот путь может быть пройден и для процессов, связанных с восприятием, сознанием, психикой. Наконец, развитие точных наук, успехи в исследовании нелинейных математических моделей помогли сформулировать новые идеи в этой области. Основная идея состоит в том, что восприятие, обучение, мыш- ление, другие функции мозга обусловлены коллективным процессом, приводящим к согласованной работе ансамблей достаточно просто устро- енных нервных клеток — нейронов. Самоорганизация («самопрограмми- рование») таких ансамблей и является ключом к объяснению функций мозга. Работы по исследованию памяти человека и животных показали, что нельзя выделить в мозге одной четко локализованной структуры,
Нейронные сети 275 отвечающей за запоминание. Это заставляет предположить, что мы име- ем дело с распределенной системой. Простым физическим прообразом ситуации, которая, вероятно, имеет место, является голограмма. Голограмма дает возможность записывать и хранить информацию с помощью когерентных пучков света. Принцип ее получения — запись на фотопластинке интерференционной картины, возникающей при на- ложении падающего и рассеянного фиксируемым объектом монохрома- тического излучения. Если осветить зафиксированную на фотопластинке интерференционную картину лучом того же лазера, то он при рассея- нии даст изображение первоначального объекта. При этом информация о данной точке на поверхности объекта оказывается «рассредоточенной» по всей поверхности фотопластинки-голограммы. Испортив часть голограммы, мы не ут- ратим изображение объекта, а лишь сделаем его менее четким. Это кардинально отлича- ется от организации стандартной «фотогра- фической» памяти. Отрезав и выбросив ку- сок фотографии, мы утратим возможность узнать, что на нем было запечатлено. Другую «математическую метафору» распределенной памяти дает преобразова- ние Фурье. В самом деле, пусть нам дан не- который силуэт. Его контур можно хранить в виде графика некоторой функции x(t) (см. рис. 10.1 о), заданной в дискретном на- боре точек 1, <2» • • •, $лг)« Однако его мож- но хранить и в виде набора фурье-гармоник, например, Рис. 10.1. Искажения, вносимые при различных способах запи- си информации, меняют карти- ну по-разному: а) исходный си- луэт; б) картина, которая воз- никает, если «испорчена» часть функции x(t); в) картина, воз- никающая, если высшие коэф- фициенты Фурье Ck утрачены «Забыв» значения х в отдельных точ- ках, мы довольно быстро теряем представ- ление о картинке в целом (см. рис. 10.1 б). «Забыв» старшие коэффициенты Фурье, мы всего лишь делаем контур более размытым (см. рис. 10.1в). Поэтому, работая с ненадежными элементами, лучше иметь дело с коэффициентами Фурье, чем с исходным контуром — «класть все яйца в одну корзину». В этой главе мы вначале рассмотрим элементарные представления о работе головного мозга, которые в том или ином виде отображают различные модели, а также обсудим несколько базовых математических моделей в этой области.
276 Глава 10 Рис. 10.2. Схематичес- кое изображение ти- пичного нейрона: 1 — тело клетки, 2 — денд- риты, 3 — аксон, 4 — один из синапсов Элементарные представления о работе мозга Более сотни лет назад Сантьяго Рамон-и-Кахаль использовал для ис- следования нервных клеток новый метод их окраски солями серебра, предложенный К. Гольджи. Это стало началом научного исследования мозга. Оказалось, что мозг содержит около 1012 нейронов, и состоит из некоторого набора дискретных функциональных единиц. Типичный нейрон представлен на рис. 10.2. Он состоит из тела клетки и сильно разветвленных древовидных отростков, получивших на- звание дендритов. Дендриты получают информацию от других нейронов. За передачу информации отвечает длинный нераз- ветвленный отросток, называемый аксоном. Участ- ки контакта между нейронами получили название синапсов. Они обеспечивают превращение электри- ческих импульсных сигналов, распространяющихся как волна по аксону, в химические. Эти импульсы получили название потенциалов действия. Потенци- алы действия, приходя в синапсы, вызывают в них выделение веществ, называемых нейромедиаторами. Нейромедиаторы диффундируют через узкую щель между синапсом данного и дендритом связанного с ним нейрона. Рецепторы дендритов таковы, что с их помощью нейрону удается осуществлять об- ратное преобразование — превращать химические сигналы в потенциалы действия. Число синапсов у разных клеток различно. У так называемых пирамидных клеток около 104 синапсов, у клеток Пуркинье их более 15 • 104. Ти- пичный закон изменения потенциала действия, из- меренного в одной из точек аксона, представлен на рис. 10.3. Характерный временной масштаб здесь имеет порядок миллисекунд. Амплитуда и форма импульсов обычно считаются постоянными. Изме- нение состояния клетки проявляется в изменении частоты генерации потенциалов действия. Это наводит на мысль, что, ве- роятно, для систем мозга характерно частотное кодирование информации, а сам нейрон напоминает электронную схему, которую в импульсной тех- нике называют блокинг-генератором. При подаче на вход такой схемы сиг- нала он генерирует «стандартный импульс» заданной формы и амплитуды. Этот автоколебательный процесс таков, что после каждого такого «взрыва» система оказывается невосприимчивой к внешним воздействиям. Послед- нее состояние называют рефрактерным. Можно сказать, что мы имеем дело с возбудимой системой, которая может находиться в фазе покоя (до того, как пришел потенциал действия), возбуждения (в то время, как импульс пришел) и рефрактерности (в течение определенного временного интер- вала сразу после прохождения импульса). Наличие рефрактерного периода
Нейронные сети 277 Рис. 10.3. Типичный вид потенциала действия в точке нейрона, располо- женной на аксоне определяет предельную возможную частоту генерации потенциалов дей- ствия. Она не превышает 200 Гц. Нейрон является типичным не- линейным элементом, действую- щим по принципу «все или ниче- го». Когда суммарный сигнал, при- ходящий от других нейронов, пре- вышает некоторое критическое зна- чение, генерируется «стандартный» импульс. В противном случае ней- рон «молчит». Потенциалы действия служат не только для передачи и обработки информации. Они могут изменять те нервные сети, по которым передают- ся. Эта пластичность синапсов и нейронных сетей является, в соответствии с нынешними воззрениями, основой для обучения. Даже поверхностное сопоставление мозга и электронно-вычисли- тельной машины показывает, как сильно отличаются эти объекты. Ключевое отличие состоит в том, что мозг является «самопрограм- мируемой машиной», способной создавать, модифицировать, совершен- ствовать программы своей деятельности. Хотя и мозг, и компьютер состоят из большого количества элемен- тарных структур (в одном случае — нейронов, в другом — триггеров, соединенных определенным образом), между ними есть принципиальная разница. Элементы компьютера являются весьма ненадежными структу- рами. Выход из строя любого из них может означать выход из строя всей системы. По мере взросления человека число нейронов снижается. Этот процесс происходит неравномерно. Однако к старости, как утвер- ждают специалисты, ряд структур мозга может терять 30-40 % клеток. Тем не менее, это не обязательно приводит к нарушениям умственной деятель- ности. Пока неясно, какова возможная архитектура такого «компьютера с исчезающими элементами». Разительно отличаются количественные характеристики обеих си- стем. Максимальная скорость нервного импульса сейчас оценивается в 100 м/с. Это примерно в миллион раз меньше, чем скорость распростра- нения электрического сигнала по хорошему проводнику. Тактовая частота современных персональных компьютеров — сотни мегагерц. Предельная «тактовая частота» нейронных систем более чем в миллион раз меньше. Чем же обеспечивается исключительная эффективность работы мозга при решении огромного количества задач в сравнении с компьютерами? В настоящее время общепринятая точка зрения объясняет это параллель- ной работой множества «элементарных процессоров», а также совершен- ной архитектурой системы, позволяющей эффективно «распараллеливать задачу». Попытки создания вычислительных машин с высокой степе- нью параллельности — многопроцессорных комплексов, транспьютеров,
278 Глава 10 машин клеточных автоматов, — показали, что создание параллельных алгоритмов, при использовании которых части вычислительной системы не мешают друг другу и не слишком долго ждут результатов от других ча- стей, представляет весьма сложную задачу. По-видимому, природе в ходе эволюции удалось найти очень удачное ее решение. Кроме того, можно ожидать, что в мозге реализованы исключительно эффективные алгоритмы обучения нейронных ансамблей, обеспечиваю- щие эффективную коррекцию и самонастройку программ. Следует отметить, что при анализе такой системы, как мозг, труд- но отделить ключевые факторы от второстепенных, принципы действия от деталей «технической реализации». Мнения специалистов на этот счет часто расходятся. Для нейронов характерно довольно большое структурное разнооб- разие. Внешне клетки Пуркинье и клетки структуры мозга, называемой бледным шаром, выглядят совершенно по-разному. Возможно, эти су- щественные различия следует учитывать в моделях. Число известных нейромедиаторов приблизилось к пятидесяти. Вероятно, это также важ- ный фактор, обеспечивающий «развязку» различных информационных каналов или повышающий надежность и живучесть всей системы. Нако- нец, исследования Д. Хьюбела и Т. Визела по анализу зрительной коры привели к обнаружению важной структурной особенности в организации мозга. Было обнаружено, что нейроны с одинаковыми функциями сгруп- пированы в виде колонок, своеобразных модулей, пронизывающих кору. Модуль может включать более 100 тыс. клеток, большинство которых образует локальные нейронные сети. Может быть, ключ к разгадке психи- ческих процессов связан с алгоритмами и механизмами взаимодействия таких модулей? В отличие от компьютера, принципы организации памяти мозга неизвестны. И это приводит к кардинально отличающимся взглядам на то, что же мозг может запомнить. Несмотря на большое количество нерешенных проблем в этой об- ласти, в нейронауке были достигнуты крупные успехи. К ним можно отнести новое поколение препаратов для лечения психических забо- леваний, названных нейролептиками, и создание нейрокомпьютерных вычислительных систем. Модель Хопфилда Нейронная сеть Хопфилда, по-видимому, является сейчас наиболее популярной математической моделью в нейронауке. Это обусловлено ее простотой и наглядностью. Кроме того, она оказалась близка по сво- ему математическому описанию к объекту, детально исследовавшемуся в статистической физике — модели спиновых стекол. Сеть Хопфилда показывает, каким образом в принципе может быть организована память в сети из элементов, которые не являются очень надежными.
Нейронные сети 279 Обратим внимание на несколько важных особенностей памяти жи- вотных и человека, которые интересно было бы воспроизвести в модели. Ассоциативность, устойчивость по отношению к шуму Представим себе память как некоторый «черный ящик». Для того чтобы система могла впоследствии вспоминать информацию, ее следует вначале обучить. Другими словами, элементарная формализация рабо- ты запоминающего устройства приводит к следующей картине. Пусть на вход «черного ящика» подается некоторый входной образ содер- жащий N бит информации. Допустим, нам нужно обучить устройство распознавать М различных образов, которые мы назовем ключевыми. На выходе «черного ящика» по предъявлении данного ключевого образа должен появляться выходной образ, который мы будем обозначать £°ut. Пространства входных и выходных образов могут быть как одинаковыми, так и различными. Пример 1. Множество р = I,... ,М] может представлять фотогра- фии коллег, {£°ut, р = 1,...,М} — их имена; {Сд} — имена друзей, {££“*} — номера их телефонов. В процессе обучения определенным образом устанавливаются связи между данным ключевым образом (р = 1,..., М) и желаемым выхо- дом {£°ut}. Естественно предположить, что в процессе работы устройства оно должно по предъявлении на входе выдавать £°ut на выходе. Кроме того, будем требовать, чтобы при предъявлении «близких», «похожих» на данный ключевой образ образов £‘п, «черный ящик» вспоминал «настоящий» ключевой образ и, соответственно, на выходе давал неискаженный образ £°ut. Пример 2. £‘п — запомненная устройством памяти картинка, — какой- нибудь фрагмент этой картинки или она сама с наложенным на нее шумом, £°ut — неискаженная картина, хранящаяся в памяти; — за- помненный фрагмент текста, £,п — фраза или несколько слов из этого текста, £°ut — библиографические данные о тексте, содержащем предъ- явленный фрагмент; — «идеальная» кардиограмма, соответствующая данному заболеванию, — кардиограмма данного больного, £°ut — диагноз, указывающий, с каким заболеванием столкнулись врачи. Иначе говоря, у создаваемого «черного ящика» должны возникать верные ассоциации. Понятно, что такое распознавание предъявленных об- разов может быть полезно для справочных и поисковых систем, для оценки ситуации. Ясно также, что важная проблема состоит в определении «похоже- сти», другими словами, нормы в пространстве образов ||£Jn -£Jn||. Разные нейронные сети, вообще говоря, имеют разные нормы. Тот образ, который одна сеть считает похожим на данный, другая может таковым не считать. И выбирать между ними приходится, исходя из своих представлений
280 Глава 10 о решаемой задаче. Это компетенция не нейронной сети, а того, кто обратился к ее помощи. Распределенный характер хранения информации, высокая надежность Будем исходить из обсуждавшихся представлений о работе мозга. Поскольку в мозге не удается указать конкретного элемента, отвечающего Рис. 10.4. Желаемая зависимость вероятности правильного распо- знавания р от доли вышедших из строя нейронов d за хранение данного образа, будем счи- тать, что информацию об объекте хранит не один элементарный «нейрон» в «чер- ном ящике», а целая группа. Кроме того, желательно, чтобы создаваемое устрой- ство, как и в случае мозга, было бы спо- собно действовать и при потере или вы- ходе из строя части элементов. Было бы хорошо, чтобы вероятность правильного распознавания для создаваемой нейрон- ной сети в зависимости от доли уни- чтоженных элементов вела себя так, как показано на рис. 10.4. Быстрый доступ к информации Несмотря на крайне медленную, в сравнении с компьютерами, ско- рость передачи сигналов и инерционность элементов мозга, наша память работает весьма быстро. Вероятно, мозг не просматривает всю информа- цию, которой он располагает, а действует гораздо рациональнее. Жела- тельно, чтобы создаваемый «черный ящик» также позволял бы определять выходной образ по входному достаточно быстро. Универсальность и адаптивность Важно было бы обеспечить структуру «черного ящика», позволяю- щую иметь дело с различными входными образами (изображения, звук, запахи и т. д.). Должна быть обеспечена возможность перенастроить нейронную сеть, меняя рецепторы, периферию, число образов и т. д. Сопоставим эти требования с организацией памяти традиционных, «фон-неймановских» компьютеров. В рамках этой архитектуры весьма трудно обеспечить устойчивость по отношению к шуму. Достаточно слож- но иметь дело со входным образом если число бит N, необходимое для его кодировки, велико, даже в том случае, если мы умеем вычислять норму ||£31п - £f||. Кроме того, мы сталкиваемся с необходимостью пере- бирать различные ключевые образы, сравнивая их с данным. Естественно, это может потребовать много времени. Основная идея построения сети Хопфилда непосредственно связа- на с качественной теорией дифференциального уравнения х = v(x),
Нейронные сети 281 где х — скаляр. Напомним, что аттракторами этого уравнения могут быть только особые точки ж*, v(x*) = 0. На прямой, являющейся фазо- вым пространством этой системы, устойчивые особые точки чередуются с неустойчивыми. Последние определяют границы области притяжения устойчивых точек. Точка устойчива, если dv(x*)/dx < 0, и неустойчива, если dv(x*)/dx > 0. Сопоставим аттракторам этого уравнения набор ключевых образов (д = 1,..., М). Предъявляемым образам £ будет соответствовать началь- ное значение ж(0). Распознавание образа будет соответствовать выходу на аттрактор. Предъявленный образ будет близок к данному ключевому, если он попадает в его область притяжения (см. рис. 10.5). Для этого уравнения существует функция Ляпунова или потенциал X U(x) = - У v(y) dyt Хо v(x) = ~^’ L<.x) = U(x). OX £i £2 £з х Рис. 10.5. Уравнение (10.1) позволя- ет реализовать простейший вариант ассоциативной памяти Следовательно, решение уравнения х = v(x), ж(0) = £, (ЮЛ) при t —> оо стремится к одному из клю- чевых образов «(?д) = 0. Другими словами, если бы и входные образы, и ключевые образы были бы действи- тельными числами, то вычислительная система, решающая уравнение (10.1), могла бы играть роль запоминающего «черного ящика». Обучению такой «сети» соответ- ствовало бы построение функции v(x) с устойчивыми особыми точками в точках числовой оси (д= 1,.. .,ЛГ); им соответствуют минимумы потенциальной функции. Функцию v(x) можно построить так, чтобы неустойчивые особые точки ж* («(ж*) = 0) принимали заданные значения (см. рис. 10.5). Они определяют области притяжения ключевых образов и говорят о том, какие числа £ «похожи друг на друга» и на известный ключевой образ. Обратим внимание на важ- ную деталь — здесь мы можем задавать по своему усмотрению не только ключевые образы, но и их области притяжения. Реальные ситуации, с которыми приходится сталкиваться и в которых применяются нейронные сети, разумеется, гораздо сложнее. Прежде все- го потому, что предъявляемые £ и запомненные образы представляют собой векторы большой размерности. Например, это могут быть изобра- жения, и в 4 «записана» информация о цвете каждого пиксела на экране.
282 Глава 10 Тем не менее, общая идея и постановка задачи остается такой же. Если считать, что исследование аттракторов заданной динамической си- стемы — прямая задача качественной теории, то здесь мы имеем дело с обратной задачей. При ее решении следует построить динамическую систему, обладающую заданным набором аттракторов (а в идеале и за- данными областями притяжения этих аттракторов). Эта задача является некорректной. Самые разные динамические системы могут иметь одни и те же аттракторы. (В самом деле, самые разные функции U(x) могут иметь экстремумы в одних и тех же точках.) Поэтому можно упростить ситуацию, считая, например, что мы имеем дело с динамическими систе- мами специального вида, у которых есть к тому же функция Ляпунова. Этот подход используется в модели Хопфилда и во множестве других нейронных сетей. Нейронные сети, имеющие функцию Ляпунова или ее аналог, в этой области исследований часто называют конвергентными (от английского to converge — сходиться). Чтобы описать нейронную сеть, надо: — определить динамику ее отдельных элементов — нейронов; — задать архитектуру сети; — определить правила, по которым нейроны будут взаимодействовать друг с другом; — описать алгоритм обучения, т. е. формирования связей для решения поставленной задачи. Дискретная модель Последний пункт является особенно важным. Чтобы подчеркнуть его значение, в зарубежной литературе алгоритмы обучения нейронных сетей иногда называют «искусственной психикой», а само направление работ — коннекционизмом (от английского to connect — связывать). Мы рассмотрим классическую, дискретную версию модели Хопфил- да, хотя основные идеи ее построения непосредственно связаны с непре- рывной моделью (10.1). Кроме того, в литературе можно найти непрерыв- ные сети такого же типа. Будем обозначать через S(t) активность нейрона в момент времени t. Эта величина дискретна и может принимать значение +1, что соответ- ствует состоянию «возбуждения», и -1, что отвечает «торможению». Эта дискретность отражает нелинейный, пороговый характер функциониро- вания нейрона и известный из нейробиологии принцип «все или ничего». Пусть h(t) — внешнее воздействие, оказываемое на нейрон, на- пример, со стороны других нейронов. Традиционной моделью теории нейронных сетей является нейрон Мак-Каллока—Питтса. Его динамика определяется соотношением ( 1, h(t)>0, S(f + 1) = sign (Л(0) = < I -1, Й(0<О, (Ю.2)
Нейронные сети 283 (случай h(t) = 0 не рассматриваем). Очевидно, sign (Л) — это просто знак функции h. Время считаем дискретным: t = 1,2,... . Будем иметь в виду, что мембранный потенциал нейрона i в момент времени t зависит от состояния других нейронов. Чтобы описать это обстоятельство в моде- ли, будем считать, что воздействие на данный нейрон со стороны других определяется взвешенной суммой = (Ю-З) 3 Веса связей Jij являются идеализированным описанием взаимодей- ствия между дендритами данного нейрона и синапсами других. Иногда для каждого нейрона вводят локальный порог 0,, по превышении кото- рого нейрон переходит в активное состояние: ЛДО = ~ 3 Будем считать, что архитектура сети такова, что каждый нейрон связан с каждым. Величины Jij удобно представлять в виде квадратной матрицы размером N х N, называемой матрицей связей J = {Л/}. Итак, эволюция состояния сети {5,(<)} определяется дискретной динамической системой Si(t + 1) = sign 1 t= 1,2,... . (10.4) Входной образ, который предъявляется для распознавания %, соот- ветствует начальным данным для системы (10.4) < = {S,(0), i=l.....N}. (10.5) Эти представления нейронауки, отраженные в модели, имеют прямой аналог в теории спиновых стекол. Клетке-нейрону соответствует спин; состоянию покоя (возбуждения) — ориентация спина -1 (+1); синаптиче- ским весам — связи J^; возбуждающим связям — Jij > 0; тормозным — Jij < 0; порогам 0, — локальные поля. Модель (10.4) значительно упрощает предположение о том, что связи симметричны Jij — Jji> Jkk — 0, I С i, j, k N. (10.6) Вообще говоря, это предположение гораздо более оправдано в теории спиновых стекол, чем в моделях нейронауки, где связи между синапсами одного нейрона и дендритами другого являются однонаправленными. Назовем величину N N i=l j=\ (Ю.7)
284 Глава 10 энергией. Можно сказать, что для рассматриваемой модели эта величина играет роль функции Ляпунова. В самом деле, представим себе, что в момент времени t + А/ мы изменили значение переменной S только для одного нейрона с номером к: Sk(t + Ad) = Sk(t) + AS. Очевидно, сумма (10.7) при этом изменится на величину 1 ” N - - £ JjkSj^St - j=l — yJkkSj(ASk) + QkASk — ASk (10.8) Принципиальной здесь является возможность «свернуть» обе суммы в одну и избавиться от квадратичного по ASk члена, что обеспечивается выполнением равенств (10.6). Но выражение в квадратных скобках в фор- муле (10.8) будет противоположно по знаку величине ASk, если состояние нейрона будет меняться по правилу (10.4). Именно поэтому величина АЕ будет неположительна. Более строгие рассуждения, учитывающие, что состояние может менять не один, а несколько нейронов, приводят к тому же выводу. Обратимся теперь к алгоритму обучения нейронной сети. Этот алго- ритм позволяет по заданному набору ключевых образов £^n, 1 /z < М, найти матрицу связей J. Обозначим через значение переменной Si (т. е. состояние г-го нейрона), в случае входного образа с номером д. В модели Хопфилда значения пороговых параметров О, выбраны равными нулю, а матрица связей определяется правилом обучения Хебба 1 м Jij = ПРИ * 7^ J j Ju = (Ю-9) /4=1 Правило Хебба было предложено, исходя из следующих нейро- физиологических представлений. Обучение нейронных ансамблей, по- видимому, связано с возникновением положительных обратных связей. Очевидно, эти связи должны, в первую очередь, устанавливаться между теми нейронами, которые при выполнении одной задачи оказываются в одинаковом (например, возбужденном) состоянии. При этом эффек- тивность взаимодействия соответствующих синапсов и дендритов должна возрастать. В модели это должно соответствовать увеличению веса связи, например, между г-м и j-м нейроном . Другими словами, в форму- ле (10.9) подсчитывается общее число раз, которое нейроны оказывались в одинаковом состоянии при предъявлении всем М ключевых образов, и далее нормируется на число нейронов. Аналогичные рассуждения про- водятся, если нейроны, как правило, оказываются в противофазе и между ними возникает отрицательная обратная связь.
Нейронные сети 285 Характерная метафора, которую здесь иногда используют — соскаль- зывание камня по глинистому склону: чем больше раз камень скользил по одному пути, тем глубже становится возникшая колея и тем с большей вероятностью он будет двигаться по ней же. Убедимся, что в ключевых образах д = 1,... ,М в нейронной сети, обученной по правилу Хебба, действительно достигается минимум функционала энергии. Подставим соотношение (10.9) в формулу (10.7) при в, = 0 , N N м N N . М N N ~ 2N У' = j-1 J=1 м м N 2 N д=1 3 = p=i N где тпд = у Очевидно, S2£2 = 1. Условие i j в (10.10) следует :=1 из формулы (10.6). Величина гпц, очевидно, соответствует корреляции, или скалярному произведению, данной нейронной конфигурации и ключевого образа р. Формула (10.10) определяет квадратичную формулу относительно компо- нент вектора {5,}. Если ключевые образы ортогональны друг к другу , N 1, если д = v, 0, если д / и, то mi = 1, m2 = 0, ту = 0, если Si = Значение энергии в этом случае равно E(£i) = —N/2 + М/2. В точности таким же оно будет и для других ключевых образов. Если бы были непрерывными величинами, то можно было бы проверить, что дЕ/дт^ = 0, а матрица д2Е/(дтцдти) отрицательно определена. То есть энергия Е, как функция тпд, имеет локальный минимум. Если образы выбраны наугад, то можно ожидать, что т„ ~ * VN Значение энергии в этом случае близко к нулю (~Af/2 — М/2), что существенно выше. Итак, соотношения (10.4), (10.5), (10.9) полностью определяют ди- намику сети Хопфилда, в которой при определенных условиях ключевым образам соответствуют аттракторы.
286 Глава 10 Излюбленным тестом для модели Хопфилда является распознава- ние картинок, изображающих различные буквы алфавита. На рис. 10.6 показаны три входных образа — изображения букв А, У, К, которым в соответствии с правилом Хебба обучена сеть. Затем показано, како- ва эволюция нейронной конфигурации в случае искаженной буквы А. При этом достаточно быстро происходит выход на аттрактор, соответ- ствующий ключевому образу. В силу того, что все элементы действуют параллельно, распознавание обычно происходит всего за несколько шагов. Важной характеристикой нейронной сети является отношение числа ключевых образов М, которые могут быть запомнены, к числу нейронов сети N М Для модели Хопфилда в литературе часто указывается а = 0,14. Однако такая оценка может иметь место только в случае, если образы близки к некоторому набору взятых наугад векторов. Обычно коэффициент а существенно меньше. Для многих нелинейных систем, в которых возможны коллективные процессы, можно выделить ведущие переменные, параметры порядка, Ubbbbbb мвввваввв inn вв вив МВ ввв step : 7 и е: 1211Е*О6 е: .1740Е*06 е: .1861Е+06 Рис. 10.6. Пример распознавания образа сетью Хопфилда. В верхнем ряду—ключевые образы. В нижнем — распознавание буквы «А», на которую наложен шум. Параметр step соответствует номеру шага Т, е — энергии представленной конфигурации S(t). За несколько шагов сеть верно распознает образ
Нейронные сети 287 к которым подстраиваются все остальные степени свободы исследуемой системы. Для модели Хопфилда такие параметры также существуют. Их роль играют величины, называемые корреляциями между образами: 1 N = ~N : = 1 Традиционный вопрос, который возникает при анализе сети: можно ли записать в дополнение к имеющимся М образам еще один См+1 так, чтобы он также стал аттрактором исследуемой системы, а остальные продолжали оставаться аттракторами. В последние годы было показано, что ответ на этот вопрос однозначно определяется корреляциями между образами. Интуитивно понятно, что чем больше корреляция нового образа с одним из уже записанных, тем «труднее» нейронной сети запомнить и распознать его. Смысл хаоса Для модели Хопфилда характерны два существенных недостатка. Первый в литературе называется «ложной памятью», существованием «призраков», «фантомов», «ложных образов». Суть этого явления показы- вает рис. 10.7. Здесь также сеть обучена распознавать изображения трех е: -.36Э2Е+04 е: -.?544Е»05 е: -.1530Е*06 Рис. 10.7. Эффект «ложной памяти». Верхний ряд — набор ключевых об- разов, которым обучена сеть. Нижний ряд иллюстрирует выход сети на стационарную, не зависящую от времени конфигурацию. Эта конфигурация не соответствует ни одному ключевому образу
288 Глава 10 букв. Каждое из них является аттрактором соответствующей динамической системы. Снизу показан процесс распознавания, когда на изображение буквы А наложен довольно большой шум. Здесь также происходит выход на аттрактор, но на такой, который не совпадает ни с одним из ключевых образов. Другими словами, обучая нейронную сеть по правилу Хебба, мы получили наряду с «настоящими», желаемыми, еще и набор паразитных аттракторов. Другой недостаток связан с достаточно простым мысленным экспе- риментом. Предположим, что сеть «научена» распознавать изображение кошки и собаки. Допустим, что мы предъявили изображение птицы. Пусть траектория сети благополучно миновала все ложные образы. Произошло распознавание, функционал энергии уменьшился и достиг локального минимума, и сеть распознала в предъявленном изображении собаку. Бу- дем ли мы удовлетворены результатом? Очевидно, нет. Отсюда ясен еще один существенный недостаток: сеть не умеет говорить «не знаю», она распознает, даже если для этого нет никаких оснований. Ниже мы обсудим модифицированную модель Хопфилда. В этой модели предпринята попытка устранить оба недостатка, усложнив модель нейрона. Идеализированный нейрон Мак-Каллока—Питтса мгновенно реагирует на состояния соседей, причем независимо от того состояния, в котором в данный момент находится он сам. Это противоречит ря- ду нейрофизиологических данных, утверждающих, что реальный нейрон является чрезвычайно сложной инерционной системой. Исследование электрической активности при распознавании запахов млекопитающими показало, что принципиальную роль в этом процессе играют регулярные и хаотические колебания. Распознавание запахов на- чинается с обонятельных рецепторов, которые выстилают носовые ходы. Они вступают в контакт с молекулами пахучего вещества и посылают сигнал клеткам обонятельной луковицы. Каждому запаху соответствует определенный паттерн активности рецепторов, который часто бывает ис- каженным, так как в результате турбулентных завихрений вдыхаемого воздуха не все рецепторы взаимодействуют с пахучим веществом. Из результатов, полученных профессором У. Фрименом и его колле- гами, следует, что когда активность рецепторов отсутствует, активность обонятельной луковицы носит низкоамплитудный, нерегулярный и, по всей видимости, хаотический характер. Когда животное вдыхает знакомый запах, активность становится пе- риодической. В каждой точке обонятельной луковицы колебания потен- циала электроэнцефалограммы синфазны, но отличаются по амплитуде. При этом каждому знакомому запаху отвечает свой пространственный паттерн амплитуд, своеобразная стоячая волна, которая не изменяется в течение всего времени постановки опыта. Было установлено, что если вдыхаемый запах незнаком, то активность обонятельной луковицы остается хаотической. Однако если в процессе обучения на данный запах будет выработан условный рефлекс, то и ответ становится периодическим.
Нейронные сети 289 Итак, можно сказать, что в состоянии покоя и при вдыхании незна- комого запаха активность обонятельной системы хаотична, что характе- ризуется как состояние «не знаю». При распознавании выученного образа активность системы периодична и, вероятно, определяется некоторым предельным циклом. На основе проведенных экспериментов У. Фримен пришел к выводу о том, что «без хаотического поведения нейронная си- стема не может добавить новый запах к своему репертуару уже выученных запахов». Чтобы отобразить эти наблюдения в модели, предположим, что рас- познавание запахов обеспечивается некоторой нейронной сетью хопфил- довского типа. Однако пусть нейроны в этой сети обладают более сложной динамикой, чем элементы, введенные Мак-Каллоком и Питтсом. Отме- тим, что в последних не используется абсолютная величина входа h. Существенным является только ее знак. Логично было бы предположить, что при больших |Л| переход в состояние возбуждения действительно про- исходит быстро, а при уменьшении \h\ его скорость уменьшается. Кроме того, нейробиологические данные говорят о том, что состояние нейрона в последующий момент зависит не только от внешних воздействий, но и от состояния самого нейрона в предыдущий момент времени. Чтобы учесть эти два обстоятельства, будем считать, что динамика одиночного нейрона определяется некоторым одномерным отображением S(t + 1) = F(S(0,V(t)), (10.11) зависящим от величины входа V, как от параметра. Величину входа в этой модели обозначим V, поскольку она будет вычисляться несколько иначе, чем входная функция h в модели Хопфилда. Величину S(t) также будем считать не дискретной, а непрерывной величиной. Пусть при V 0 это отображение представляется горизонтальным отрезком, что соответствует нейрону Мак-Каллока—Питтса (см. рис. 10.8 о). Допустим теперь, что правый конец отрезка закреплен, а левый может вращаться вокруг этой точки как вокруг оси. Очевидно, что если угол между отрезком и горизон- талью не равен нулю, то переход в состояние возбуждения уже не будет мгновенным (см. рис. 10.8 б). В этом случае величина S(t) будет прибли- жаться к +1 экспоненциально, причем чем больше угол, тем медленнее приближение. Если обозначить зависимость угла наклона от внешнего воздей- ствия V через функцию K(V), то отображение F(S, V) в формуле (10.11) для V > 0 запишется в виде F(S,V) = ! + ($- ОЯЮ- Соответственно, при V < 0 F(S,V) = -l+(S+\)K(V). Оба эти соотношения можно записать в виде одной формулы F(S, V) = sign V + (S - sign V)K(V),
290 Глава 10 Рис. 10.8. Каждый нейрон моделируется одномерным отображением S(«+l)=F(S(0,y(O), зависящим от внешнего воздействия V(t) как от параметра: а) для боль- ших V данный нейрон эквивалентен нейрону Мак-Каллока—Питтса; б) для не очень больших значений V > 1 состояние возбуждения «+1» все еще является устойчивой неподвижной точкой; в) при V < 1 отображение ста- новится растягивающим, а динамика нейрона — хаотической где функция К(V) симметрична, положительна и монотонно стремится к нулю при V -> оо. При К (у) < 1 отображение является сжимающим. Его аттрактор — неподвижная точка. С уменьшением величины внешнего воздействия V угол наклона К(V) увеличивается. Ряд данных нейробиологии свидетельствует в пользу того, что при сильном гиперполяризующем или деполяризующем воздей- ствии поведение нейрона регулярно (в нашей модели это соответствует значениям параметров V -1 и F>+1), а при некотором промежу- точном воздействии поведение нейрона хаотично. Пусть этому диапазону воздействий отвечает интервал -1 < V < +1. Потребуем, чтобы при малом входном воздействии |V| < 1 модель нейрона также обладала бы хаотическим поведением. Для этого достаточ- но, чтобы в этом случае отображение (10.11) было растягивающим. Этого можно добиться, положив K(V) > 1 при всех |V| < 1, и F(S,V) = (sign V + (S - sign V)K(V) + 1) mod 2- 1. (10.12) Функция K(V) = и отображения F(S, V) для различных значений V представлены на рис. 10.9. Итак, построенное одномерное отображение, описывающее дина- мику нейрона, выбрано так, что при сильном положительном (V 1) или отрицательном (V -1) воздействии нейрон переходит в состоя- ние возбуждения или торможения соответственно, а при слабом внеш- нем воздействии активность нейрона хаотична. Различные типы дина- мики одиночного нейрона при фиксированном входе V представлены на рис. 10.10.
Нейронные сети 291 Рис. 10.9. Вид функции K(V), задающей угол наклона кусочно-линейного, кусочно- непрерывного одномерного отображения, определяющего динамику одиночного нейрона. В квадратиках сверху показана функция F(S, V) при значениях V, отложенных по оси абсцисс. При |V| > I одномерное отображение сжимающее, при |У| < 1 — растягивающее Рис. 10.10. Активность одиночного нейрона в зависимости от внешнего воздействия V. Для наглядности S(t) и S(t + 1) соединены отрезком. При V = 0,7 (V = -0,7) динами- ка нейрона явяется хаотической, но нейрон проводит большую часть времени в состоя- нии возбуждения (торможения). При V = 0 оба состояния (возбуждения и торможения) являются равноправными Обучение, как и в классической модели Хопфилда, будем проводить в соответствии с правилом Хебба I м Jij — &Д&Д ПРИ 1 j'l Л» = 0. д=1 Для описания взаимодействия нейронов введем параметр А, имеющий смысл «силы» взаимодействия между нейронами tf J=1 Из формул (10.11) и (10.12) следует, каково будет поведение такой сети в двух предельных случаях. При А = 0 она распадается на N несвя- занных одномерных отображений с хаотическим поведением. При А -> оо она эквивалентна стандартной модели Хопфилда со всеми присущими ей недостатками. В частности, даже при не очень больших соотношени- ях М/N существует огромное количество «ложных образов», т. е. аттрак- торов, не совпадающих ни с одним из ключевых образов 1 д М. При анализе обобщенной сети Хопфилда, построенной по описан- ному выше рецепту, был обнаружен чрезвычайно интересный эффект. Оказалось, что эта нейронная сеть умеет «бороться» с ложными образами, делая неустойчивыми соответствующие им неподвижные точки отобра- жения.
292 Глава 10 Будем рассматривать входной образ {5,(0), 1 < i < N} как век- тор 5(0). Пусть Л < сю. Стартуя с некоторого начального состояния 5(0), вектор 5(0 попадает в область притяжения какого-либо аттрактора не сра- зу, а после некоторого переходного процесса, который можно назвать «размышлением». Чем больше похож входной образ 5(0) на какой-либо ключевой образ, тем меньшее время необходимо нейронной сети для раз- мышления. Соответственно, чем меньше похож предъявленный образ 5(0) на ранее запомненные, тем большее время требуется нейронной сети для принятия решения. По прошествии достаточно большого времени Т вектор 5(0 мо- жет сходиться к устойчивой неподвижной точке. |Vi | > 1, 5t находится в окрестности +1 или -1 и У,5, >0 для всех i. Если же для какого-либо нейрона |Vi| < 1, то активность нейронной сети хаотична. При проведении численных экспериментов перед нейронной сетью ставилась задача распознать предъявленный случайный образ 5(0) за ко- нечное число шагов Т = 250. По истечении этого времени сеть может находиться в одном из трех состояний: — состояние правильного распознавания, когда 5(0 сходится к одному из запомненных образов; — состояние ошибочного распознавания, когда 5(0 сходится к ложному образу; — состояние «не знаю», когда нейронная сеть находится все еще в стадии размышления, либо вышла на хаотический аттрактор. Если обозначить через Р\,Р2,Рз, соответственно, вероятность пра- вильного распознавания, ошибочного распознавания и состояния «не знаю» (pi +Р2 +Рз = 0» то зависимость этих величин от «силы синапти- ческих связей Л», как показывают расчеты, выглядит следующим образом (см. рис. 10.11). Обратимся к результатам типичного расчета. В этой сети N = 128, М = 8, образы , 1 < р < М выбраны наугад. При А = оо, как и в классической модели Хопфилда, вероятность попасть в ложный образ значительно превышает вероятность правильного распознавания. Но уже при А = 5 нейронная сеть намного реже попадает в ложные образы, а при еще меньшем значении А практически все ложные образы потеряли устойчивость. Однако за эту удивительную способность бороться с ложными об- разами приходится платить тем, что с уменьшением А увеличивается время, необходимое нейронной сети для размышления, и увеличивается вероятность того, что нейронная сеть не успеет принять решение за от- веденное время Т (кривая рз на рис. 10.11). В стандартной сети выход на аттрактор происходил бы за 5-6 итераций. Тем не менее, существует большой участок значений параметра А, при которых нейронная сеть хорошо справляется с распознаванием за приемлемое время.
Нейронные сети 293 О 0,4 0,8 1/Л Рис. 10.11. Типичная зависимость от параметра А вероятностей правильного распо- знавания (pi), ошибочного распознавания (р2) и состояния «не знаю» (рз). При А-1 = 0 хаос отсутствует и данная модель эквивалентна модели Хопфилда. При увеличении А-1 вероятность правильного распознавания не только не уменьшается, но, наоборот, увеличивается. При 0,3 < А-1 < 0,5 все ложные образы потеря- ли устойчивость и нейронная сеть либо дает правильный ответ, либо переходит в состояние «не знаю» Заметим, что параметр А не влияет на количество и положение в фазовом пространстве неподвижных точек. Он влияет лишь на их устойчивость. При большом А, как и в модели Хопфилда, рядом с запомненны- ми образами могут находиться ложные образы. При уменьшении этого параметра, как показывает анализ областей притяжения, первыми «поги- бают» неподвижные точки, соответствующие ложным образам. В то же время область притяжения неподвижных точек, которые соответствуют запомненным образам, не только не уменьшается, но даже увеличивается. В настоящее время общепризнанным в нейронауке является представ- ление о важной роли хаоса в работе мозга. Большие периодические участки энцефалограммы обычно свидетельствуют о приступах эпилепсии. Из- лишняя упорядоченность во многих случаях свидетельствует о серьезных заболеваниях. В литературе описано более десятка гипотез относитель- но механизмов мозга, «использующих» динамический хаос. Построенное обобщение модели Хопфилда позволяет выдвинуть еще одно предполо- жение. Хаос может быть одним из средств борьбы с «ложной» памятью. Он может соответствовать состояниям «не знаю», в которых информации для принятия решения либо времени недостаточно. Многослойные нейронные сети Нейросети и задача интерполяции Для модели Хопфилда прообразом служили динамические систе- мы вида х — v(x), а основной задачей было конструирование систем, обладающих ассоциативной памятью.
294 Глава 10 с какими заболеваниями обращались Рис. 10.12. Типичная картина, возникающая в задачах диагностики Однако не менее важным представляется другой круг проблем, при решении которых желательно, чтобы вычислительные системы обла- дали аналогами интуиции и «умели учиться на собственных ошибках». Приведем две типичные задачи. Допустим, мы располагаем прекрасной диагностической аппарату- рой, которая дает обширную информацию о состоянии больных. Пусть кроме этого мы имеем большой набор историй болезней, показывающий, пациенты. Было бы желательно иметь своеобразного компью- терного эксперта, который, ис- ходя из результатов обследова- ний, а также предыдущего опы- та, высказывал бы мнение от- носительно диагноза. Эту задачу можно форма- лизовать следующим образом. Пусть результаты обследования больного определяются набо- ром переменных (аь...,а#). Состояние больного характери- зуется точкой в этом N-мер- ном фазовом пространстве (см. рис. 10.12). Разным заболевани- ям в этом пространстве, по- видимому, соответствуют раз- личные группы близких точек. Например, множество точек {Sm} характеризует пациентов с т-м заболеванием. Если точ- ки множества Sm не близки, а случайным образом разбросаны по пространству, то это факт в пользу того, что наша диагностика для этого заболевания неэффективна. (Нет од- ного или группы признаков, определяемых переменными ап, по которым можно было бы отличать больных от здоровых.) Именно на этом этапе нужен опыт и истории болезней. Допустим, нам удалось построить в этом многомерном пространстве области G\,..., Gm,..., в каждую из которых входят только точки, соответственно, из множеств Si,..., Sm,... и не входят другие (см. рис. 10.12). Тогда можно было бы создать компьютерную систему, которая по ре- зультатам обследования, т. е. конкретному набору переменных (щ,...,ау) для данного больного определяла бы принадлежность соответствующей точки множеству Gm, 1 т М. Это дало бы возможность предпо- ложить, что мы имеем дело с заболеванием т. Если точка не попала ни в одну из построенных областей, то это позволяло бы утверждать, что пациент не болеет теми болезнями, выявлять которые должна была бы предполагаемая диагностика.
Нейронные сети 295 Другими словами, нам надо решить задачу, которая сводится к про- блеме интерполяции в N-мерном пространстве, т. е. к определению зна- чения функции в заданной точке в некоторой области по известному набору значений в точках ..., Ь^. В задачах диагностики, например, эта функция может равняться единице в области бп, двойке — в G2, п — в Gn и нулю вне всех этих областей. Несмотря на простоту постановки задачи, при создании компьютерных систем обычно возникает множество трудностей. Во-первых, пространство может иметь очень высокую размер- ность, что, естественно, затрудняет интерполяцию. Во-вторых, мы обычно не знаем, как уменьшить число переменных и воспользоваться каким- нибудь простым логическим алгоритмом. В-третьих, области Gm могут иметь достаточно сложную геометрию, к примеру, не быть выпуклыми. Другая задача связана с про- гнозом. Пусть нам дан ряд изме- рений величины а — Исходя из этих данных, надо пред- сказать значение алг+i. Допустим, что нам очень повезло, и значение ат+\ (т = 1,2,...) зависит только от числа ат, т. е. существует зависи- мость (10.13) Ятп-Ы — /(®т)- Рис. 10.13. Задача прогноза поведения динамической системы по временному ряду сводится к проблеме интерполяции В этом случае стратегия ре- шения задачи такова. Для просто- ты предположим, что все элементы последовательности {ат} принадле- жат интервалу j, т. е. функция f отображает этот интервал в себя. Рассмотрим плоскость {am, ат+1}. Име- ющаяся выборка из N элементов позволяет определить N— 1 точку на этой плоскости: (аь «2), («2, «з)> («з, • • • • Очевидно, эти точки должны ле- жать на непрерывной однозначной кривой, уравнение которой задается формулой (10.13) (см. рис. 10.13). Следовательно, нужно произвести ин- терполяцию по N - 1 точкам и приближенно найти зависимость у = f(x). Обозначим эту функцию, приближающую /, через /. В известных точках кривой эти функции должны совпадать: am+i = /(am), m= 1,...,ЛГ-1. (10.14) Пользуясь построенной функцией /, можно подставить в нее значе- ние a# и найти приближенное значение алг+ь aN+\ ~ /(un)- Существует множество методов построения функции f или алгорит- мов интерполяции. Два самых простых иллюстрирует рис. 10.14. В первом случае значение f в точке х считается таким же, как у известного бли- жайшего соседа из множества {жт}, 1 < m < N — 1. Естественно, такая
296 Глава 10 Рис. 10.14. Простейшие типы интерполяции: а) интерполяция кусочно-постоянными функциями; б) интерполяция кусочно-линейными функциями интерполяция кусочно-постоянными функциями имеет большой недоста- ток. Во-первых, ее точность невелика, во-вторых, она «склеивает» образы различных точек х, принадлежащих одному интервалу. Во втором случае интерполяция производится с помощью кусоч- но-линейных функций. Здесь точность выше. Кроме того, интерполяция локальна — чтобы определить приближенное значение функции в проме- жуточных точках интервала, достаточно знать ее только в краевых точках интервала (см. рис. 10.14). Наконец, можно действовать в соответствии с методом Лагранжа. Пусть значение функции в точке ж, равно у,. Приближенное значение / вычисляется как сумма N - 1 слагаемого ~ । (ж - ж2)(ж - ж3) ♦ • ♦ (ж - E/v-i) + + 2,1 (Ж1 - ж2)(ж2 - Жз) ... (Ж1 - Жлг-1) (ж - ж2)(ж - ж3)... (ж - Ждг-2) N 1 (XN-1 - - Ж2) ... (ждг-1 - Ждг_2) Очевидно, множитель при у\ таков, что в точке Ж1 равен единице, а в точках ж2,..., ждг-i равен нулю. Точно так же множитель при у2 равен единице в ж2 и нулю в остальных точках множества {жш}. Поэтому гра- фик многочлена (10.15) проходит через все точки (ж,, yi), 1 < i < N - 1. Поскольку, чтобы задать многочлен степени к, достаточно задать его значения в (к+ 1)-й точке, то формула (10.15) позволяет находить не при- ближенные, а точные значения, если функция у = /(ж) является много- членом степени ниже N - 1. Несмотря на высокую точность, этот способ интерполяции также обладает существенными недостатками. Здесь велик объем вычислений, интерполяция нелокальна — изменение значения уь в точке ж* скажется на всех точках функции /. Наконец, следует иметь в виду, что при интерполяции, по-видимому, придется использовать ЭВМ, которая хранит числа с конечной точностью
Нейронные сети 297 и, соответственно, вносит ошибку округления. Это может привести к тому, что в ходе вычислений придется делить одно малое число, заданное с большой погрешностью, на другое. Естественно, это понизит точность, с которой приближается функция f. Теория интерполяции является одной из наиболее развитых обла- стей вычислительной математики. Однако попытка использовать боль- шинство алгоритмов в случае пространства высокой размерности или в ситуациях, когда элементы множества {ж,} и {^} заданы с некоторой погрешностью, наталкивается на большие трудности. Даже задача поиска соседей (возникающая, если мы хотим воспользоваться локальными ал- горитмами интерполяции) в многомерном пространстве может оказаться совсем не простой и потребовать использования специальных численных методов. Нейронные сети в определенном смысле решают интерполяционные задачи. В ряде случаев эти решения оказываются вполне удовлетвори- тельными. На их основе удается создавать замечательные распознающие, диагностирующие, предсказывающие системы. Однако теория таких си- стем, позволяющая априорно оценивать, в каких задачах на что можно рассчитывать, сегодня находится в начале своего развития. Обучение персептрона Основные идеи и проблемы, возникающие при создании интер- полирующих сетей, можно проиллюстрировать на примере простейших однослойных сетей, предназначенных для распознавания изображений. Такие сети были предложены Мак-Каллоком и Питтсом в пятидесятые годы и названы персептронами (от английского perception — восприятие). Схема такой системы показана на рис. 10.15. Допустим, что система обучена, т. е. веса подобраны таким об- разом, чтобы распознавать предъявляемые образы х. Будем считать, что х — 2V-мерный вектор х = (□?>,..., жуу). Персептрон действует следую- Рис. 10.15. Схема простейшего персептрона, который должен отличать согласные буквы от гласных
298 Глава 10 щим образом. Вначале суммирующий элемент вычисляет величину N S — XjUJi. 1=1 Затем этот сигнал подается на некоторый нелинейный пороговый эле- мент. Если величина S превышает порог, то элемент срабатывает (система говорит, к примеру, «да»). В противном случае система не срабатывает и персептрон отвечает «нет». Как же обучить такую систему? Для этого, так же как в модели Хоп- филда, надо предъявить множество ключевых образов {£&} и тех ответов, которые, по нашему мнению, нейронная сеть должна давать по предъяв- лении этих ключевых образов. Обозначим множество этих ответов Q(&). Множество упорядоченных пар {&, Q(&)} будем называть обучающей выборкой. Для примера представим себе простейший персептрон, которому предъявляются черно-белые изображения различных букв и который дол- жен определять, является ли показанная ему буква гласной. Если эта буква гласная, то на выходе должно возникнуть число 1 («да»), если согласная, то 0 («нет»). Чувствительное устройство (например, сканер), которому предъявля- ется изображение, разобьем на элементарные квадратики (см. рис. 10.15). Пусть, если m-й квадратик «темный» (черных пикселов в нем больше, чем белых), то величина хт равна единице, в противном случае — нулю. То есть = (а?|,..., , где 1 в индексе вектора f соответствует первой предъявленной букве, f = (zf,..., x2N) и т. д. Идею обучения (т. е. настройки весов шт) можно пояснить с помо- щью следующей притчи. Допустим, что в некотором королевстве королю приходится довольно часто принимать ответственные решения. Для этого ему надо советоваться со своими министрами или экспертами. Других экспертов взять ему неоткуда и нужно опираться на имеющихся. Как повысить эффективность принимаемых решений? Надо смотреть, ка- кие советы давали эксперты и были ли правильны принятые решения. На основе этого опыта король может выяснить, как следует относиться к экспертам. Естественно, решать проблемы голосованием неразумно. Одних экспертов следует слушать и поступать так, как они советуют, дру- гих следует слушать и поступать наоборот. Различное отношение короля к разным экспертам и определяют величины {шт}. Алгоритм обучения можно описать следующим образом: если на (i+1)-m шаге обучения персептрон выдал правильный ответ, то веса связей не меняются (10.16) Здесь нижний индекс соответствует номеру связи, верхний — шагу по вре- мени. Пусть хт — значение на входе m-го нейрона.
Нейронные сети 299 Допустим, ответ неправильный. Пусть он равен нулю, в то время как при правильном ответе персептрон должен выдавать единицу. Тогда + (10.17) Иными словами, мы увеличиваем вес, значение элементов, голосую- щих «за» в этом случае. Если выдан неправильный ответ «единица», то ^+1=^-хга. (10.18) После этого на вход подается тот же образ и вновь корректируются связи, если ответ неправильный. Формулы (10.16), (10.17), (10.18) могут быть записаны в более про- стой и компактной форме, если ввести величину рассогласования между реальным ответом на г-м шаге R1 и желаемым ответом Q — <5 = (Я'(Й) - П(6)). (Аргумент £3 показывает, что нейронной сети был предъявлен s-й клю- чевой образ.) Тогда формулы (10.16), (10.17), (10.18) можно записать в виде «4+‘=«4 + Дь Д;=<5^. (10.19) В последнем равенстве 6 — уже введенная величина рассогласования. Нетрудно проверить, что домножение на величину Xi, которое принято в литературе, не меняет формул с (10.16) по (10.18). Числовой коэффици- ент tj < 1 носит название «скорости обучения». Этот коэффициент вводят, чтобы изменение весов связей при обучении не было слишком быстрым. Этот алгоритм обучения получил название «дельта-правила». Встает вопрос, каким входным образам £$ можно обучить персеп- трон. В начале развития этого направления исследований казалось, что принципиальных ограничений здесь не существует: взяв достаточно боль- шой входной вектор х и обучая нейронную сеть достаточно долго, можно аппроксимировать любую область G в пространстве входных образов (ес- ли точка оказалась внутри области G, персептрон говорит «да», если вне ее — «нет»). Исследование простейших персептронов позволило разделить два важных понятия, связанных с этими системами. Первое понятие — персептронная представляемость. Определенная логическая функция или множество в пространстве входных образов обладает этим свойством, если существует набор весов {о?т}, с помощью которых в ответ на заданные ключевые образы {£s} персептрон будет давать желаемые ответы {Q(£s)}. Однако для того, чтобы настроить веса таким образом, должна суще- ствовать некоторая систематическая обучающая процедура, позволяющая по обучающей выборке найти желаемое множество весов {о>т}. (Такой процедурой может быть, например, обсуждавшееся дельта-правило.) На- личие такой процедуры для конкретных задач означает, что персептрон обладает свойством обучаемости.
300 Глава 10 Исследования Ф. Розенблатта, проведенные в 60-е гг., показали, что простейшие персептроны при весьма общих условиях обладают свойством обучаемости, если функция, которую они должны реализовать, относится к персептронно представляемым. Но как велико последнее множество? И вообще, существуют ли функции, которые в него не входят? Работы М. Минского, также выполненные в 60-е гг., показали, что этих функций очень много, что персептронной представляемостью не об- ладают даже очень простые функции. Этот вывод заставил большинство исследователей прекратить работы в области нейронных сетей. Возрожде- ние интереса к интерполирующим сетям в 80-е гг. было связано с перехо- дом к многослойным нейронным сетям и к новым алгоритмам обучения. Классический пример М. Минского связан с функцией «исключаю- щее ИЛИ». Это простейшая функция двух аргументов, каждый из которых может быть нулем или единицей. Она должна принимать значение еди- ницы, только когда один из аргументов равен единице. Обозначим один вход через х, другой через у. Соответственно, входные векторы £ бу- дут иметь две компоненты Обучающие пары для этой функции представлены в таблице. Обратимся теперь к простейшему персептрону. Суммирующий эле- мент на выходе дает функцию S = • Переключение нелинейного Рис. 10.16. Пространство вход- ных образов для функции «ис- ключающее ИЛИ» элемента будет происходить при выполнении условия = 0, (10.20) где 9 — порог. Мы считаем, что у нас есть нейрон Мак-Калл ока—Питтса — Q = sign (S - 0) + В таком представлении он на выходе да- ет + 1 или 0, а не -1-1 и -1, как рань- ше. Уравнение (10.20) определяет некоторую прямую на плоскости Над прямой нейрон будет давать одно значение выхо- да (например, +1), под прямой — другое
Нейронные сети 301 (например, 0). Точки, соответствующие функции «исключающее ИЛИ», должны лежать в вершинах квадрата Л0В1Л1В0 (см. рис. 10.16). Причем точки Ло и Л1 должны лежать по одну сторону от прямой, а точки Во и В\ — по другую. Но из рис. 10.16 ясно, что такой прямой не существует. Точки Ло,Л1 и Bq, В\ нельзя разделить прямой. Функции, обладающие этим свойством, называются линейно неразделимыми. Если рассмотреть ситуацию, когда персептрон имеет п двоичных вхо- дов, то число возможных входных образов будет равно 2”. Соответственно, число логических функций от этих аргументов будет 22 . Если в случае двух аргументов из 16 различных возможных функций линейно разделимы 14, то при п = 6 из примерно 1,8 х 1019 разделимы только 1,5 х 107. Функ- ции, которые сможет распознать рассмотренный персептрон, являются не правилом, а редким исключением даже при небольших значениях п. Возвращаясь к притче с королем и министрами, можно сказать, что при такой системе управления могут быть приняты только достаточно простые решения. Поэтому нужна более сложная структура. Многослойные сети Вспомним задачу о диагностике. Пусть у нас, как на рис. 10.16, на вход сети подается два диагностических параметра £х и . Для простоты бу- дем считать, что это непрерывные величины. Пусть областью G, которая соответствует болезни, является треугольник (см. рис. 10.17). Можно ли, исходя из рассмотренной нейронной сети, построить систему для диагно- стики в этом случае? Рассмотренная ранее однослойная сеть позволяла в одной полуплоскости говорить «да», в другой полуплоскости — «нет». Треугольник можно рассматривать как фигуру, вырезанную из плоскости тремя прямыми А1А2, В1В2, С1С2 (пусть у нас есть три нейрона в первом слое, на каждый из которых подается вектор (£х,£у) (см. Рис- 10.18)). Подберем веса {о;} так, чтобы первый нейрон говорил «да» (т. е. на вы- ходе вырабатывал 1), когда точка в плоскости (&,^) лежит выше А1А2, Рис. 10.17. Простейшая задача ди- агностики, в которой надо опре- делить, попадет ли точка внутрь заштрихованного треугольника Рис. 10.18. Простейший двухслой- ный персептрон, который может решить задачу, представленную на рис. 10.17
302 Глава 10 Рис. 10.19. В задачах компью- терной диагностики могут воз- никать невыпуклые области Рис. 10.20. Трехслойная нейронная сеть мо- жет решить задачу, которую иллюстрирует рис. 10.19 что, очевидно, можно сделать. Второй нейрон будет говорить «да», когда точка лежит ниже В1В2, третий — когда ниже С1С2. Выходы всех этих нейронов подадим на один нейрон второго слоя, который говорит «да», когда все три нейрона предыдущего слоя говорят «да». Это можно сделать, установив веса связей между элементами первого слоя равными единице, а порог элемента второго слоя установив чуть меньше трех. Итак, переход от однослойной к двухслойной нейронной сети позво- ляет построить диагностирующую систему в этом случае. В притче о коро- ле это означает, что каждому министру (нейрону первого слоя) нужен штат экспертов. Они определяются весами {ш” } нейронов первого слоя. Но по- строенная система имеет очень серьезный недостаток. Фигуры, которые можно реализовать в плоскости {£ж, ^}, должны лежать по одну сторону от прямых, т. е. фигура должна быть выпуклой. Фигуры, представленные на рис. 10.12, которые вполне могут возникнуть в задачах компьютерной диагностики, двухслойной сети недоступны (см. также рис. 10.19). Однако с этой задачей вполне может справиться трехслойная сеть (см. рис. 10.20). Представим себе, что во втором слое имеется два нейрона. Один говорит «да», когда точка попадает в треугольник А1А2А3. Другой говорит «да», когда точка не попадает в треугольник ВхВ^Ву. И нейрон в выходном третьем слое говорит «да», когда «да» сказали оба нейрона второго слоя. Как видим, чтобы принимать решение в таких случаях, ко- ролю надо иметь министров, к мнению которых следует, вообще говоря, относиться по-разному. Тем надо иметь помощников, которым, в свою очередь, надо иметь экспертов. Если {£} — не двумерные векторы, а векторы более высокой размер- ности, то придется иметь дело не с плоскостью, а с пространством, и не с прямыми, а с гиперплоскостями. Однако принципиально это картины не меняет. Из сказанного ясно, что возможности трехслойных сетей велики. Но встает вопрос, как же учить такие сети? Как подстраивать веса в каждом
Нейронные сети 303 из трех слоев, исходя из имеющейся обучающей выборки? По существу, в королевстве надо принять общие законы, определяющие, как следует менять отношение к министрам, помощникам, экспертам в зависимости от результатов их работы. Поэтому большой интерес к таким сетям оказался связан с созданием эффективных алгоритмов обучения. Алгоритм обратного распространения ошибки Идея этого алгоритма проста. Королю, министрам, помощникам на своем уровне следует оценивать, чей вклад в принятие неверного решения был наибольшим. Отношение к ним следует менять в первую очередь. Кроме того, его можно рассматривать как некоторое обобщение дельта- правила. Рис. 10.21. Функция «сигмоид», обыч- но используемая при построении нейронных сетей Рис. 10.22. При обучении трехслой- ных нейронных сетей часто исполь- зуется алгоритм обратного распро- странения ошибки В качестве нелинейного элемента в трехслойных сетях часто исполь- зуют не нейрон Мак-Каллока—Питтса, а нейрон, реализующий функцию, называемую сигмоидом (см. рис. 10.21) У = №> = (TTFn- Эта функция удобна, поскольку она имеет простую производную ^=У('~У)- (10.21) ах Рассмотрим нейронную сеть, представленную на рис. 10.22. Прямой проход Пусть j — типичный элемент выходного слоя, i — типичный эле- мент слоя, предшествующего выходному. Активность элемента выходного слоя определяется по следующей схеме. На первом шаге вычисляется взвешенная сумма хз = (10.22)
304 Глава 10 где yi — уровень активности г-го элемента в предшествующем слое, Uij — вес связи между г-м и j-м элементом. Затем нелинейный элемент вычисляет активность выходного эле- мента • Пусть мы имеем уже обученную трехслойную сеть, на вход которой подается некоторый вектор. Тогда по этому алгоритму осуществляется сначала переход от нейронов первого слоя к элементам второго, а затем от элементов второго к нейронам третьего, которые и дадут «ответ сети» на «заданный вопрос». На этом работа сети кончается. Если сеть еще не обучена, то результат, полученный после прямого прохода, может нас не устроить. При предъявлении входного вектора & из обучающей пары на выходе может быть получен после прямого прохода ответ у(£s), не совпадающий с желаемым П(£). Тогда нужен обратный проход, позволяющий корректировать веса . Обратный проход Шаг 1. После определения активности выходных элементов yj в резуль- тате прямого прохода вычисляется ошибка (Ю.23) J где yj и Qj — j-e компоненты соответствующих векторов; аргумент для краткости будем опускать. Если е = 0, то веса не меняются. В про- тивном случае надо перейти к следующему шагу. Шаг 2. Оценка того, насколько быстро меняется ошибка при изменении активности выходного элемента де EAj = = yj ~ Hj. (10.24) Шаг 3. Оценка того, насколько быстро меняется ошибка при изменении суммарного входа выходного нейрона — Xj де де du, Elj = 77 = 77 77 = EAjVj(\ - у,). (10.25) CrXj oyj uXj Именно здесь и используется «удобное» выражение для производной сигмоида (10.21). Шаг 4. Оценка того, как быстро меняется ошибка при изменении весов связей Wij де де дх, EWii = =-£7. 7Г-= EIi' У'- (10-26> Значение последней производной получается при дифференцирова- нии формулы (10.22).
Нейронные сети 305 Шаг 5. Оценка того, насколько велик вклад в ошибку г-го элемента слоя, предшествующего выходному де w л де дх« < л = Г = Е Г" ? = ЕИ''(10.27) dyi dxj ду, *-' где мы воспользуемся формулой (10.25). Шаг 6. Подстройка весов с помощью некоторого варианта дельта- правила Uij(n + 1) = шц(п) + TjEWijin), п = 0,1,2,..., (10.28) где п — номер прохода (подразумевается, что все величины в форму- лах (1О.23)-( 10.27) относились к проходу n), 7} — скорость обучения, коэффициент, лежащий в интервале от 1 до 0,01. Шаг 7. Получив на шаге 5 величину EAi для нейронов слоя, предшеству- ющего выходному (например, второго слоя, если выходной — третий), мы оказались в точности в том же состоянии, как после шага 2 для ней- ронов выходного слоя. Другими словами, заменив EAj на EAi, мы можем, пользуясь формулами (10.23)-(10.28), подстроить веса, связываю- щие элементы слоя, предшествующего выходному, с предыдущим слоем (например, первого со вторым). После того, как все веса в нейронной сети подстроены, опять осу- ществляется прямой проход. Величина п увеличивается на единицу. Вы- числяется величина ошибки е (шаг 1). И если она неприемлема (пре- вышает точность, с которой мы хотим обучить сеть), то следует перейти к шагу 2 и т. д. Метод обратного распространения ошибки по своей идее близок к ме- тоду градиентного спуска. В этом методе при поиске минимума функции U(xi,, хр) выбирается начальная точка а = (aj,..., ар) и находится направление, при движении в котором функция убывает быстрее всего. Для этого вычисляются частные производные dU(a)/dx\,..., dU(a)/dxp и делается шаг по градиенту. Это дает новую точку В и т. д. Грубо гово- ря, в методе градиентного спуска мы с помощью метода Эйлера решаем уравнение х = -dU/dx, аттрактор которого соответствует минимуму функции U. Во многих случаях при минимизации функционалов применение метода градиентного спуска и его модификаций дает отличные резуль- таты. Именно поэтому под разными названиями в различных областях исследований он неоднократно переоткрывался. То же самое относится и к алгоритму обратного распространения ошибки. Он тоже является одним из самых известных, простых и надежных методов обучения ней- росетей. После того, как его предложил П. Вербос в 1974 г., он также несколько раз переоткрывался. Оба метода имеют ряд важных ограничений. С помощью обоих этих методов ищется локальный, а не глобальный минимум некоторой потен-
306 Глава 10 циальной функции. Сменив начальную точку а, мы можем попасть в дру- гой локальный экстремум. Кроме того, если потенциал имеет «овражную» структуру, т. е. путь к минимуму идет по дну глубокого извилистого «уще- лья» функции U(xi,..., Хр), то эти методы могут потребовать много вре- мени. Анализ ряда типичных задач показывает, что структура потенциала, возникающего при обучении нейросетей, часто оказывается именно такой. Кроме того, при обучении многослойной сети может возникнуть явление, называемое «параличом сети». Оно проявляется в том, что, несмотря на длительное время обучения, ошибка может практически не убывать, оставаясь достаточно большой. Такая ситуация может воз- никнуть, если веса связей и значения активностей велики по модулю. При этом вход ряда нейронов оказывается на «крыльях» сигмоида, где производная мала. Поэтому сеть может слабо реагировать на коррекцию весов. Это одна из причин, по которой часто используют не сам алгоритм обратного распространения ошибки, а его модификации. Другая причи- на — необходимость обойтись меньшим числом нейронов и повысить надежность работы сети. В самом деле, если два нейрона первого или второго слоя говорят «да» или выдают близкие значения на всей обуча- ющей выборке, то, очевидно, можно обойтись одним. Разработка таких подходов, которая сейчас интенсивно ведется, важна и в связи с пробле- мой «прозрачности сети». Допустим, что обученная сеть оказалась очень эффективной при решении некоторой задачи. Тогда желательно не только считать и диагностировать, но и понимать. Хорошо было бы несколько упростить сеть, чтобы понять, какие признаки являются решающими для сети. Другими словами, сделать ее работу «прозрачной». При изучении нелинейных явлений нейронные сети могут выступать в двух различных качествах. Они могут использоваться для анализа, диа- гностики, прогноза, поиска закономерностей, которые в дальнейшем мо- гут быть использованы при построении традиционных моделей. В самом деле, прогнозирующая сеть сама по себе тоже представляет своеобразную имитационную модель изучаемого процесса. Нейронные сети также могут быть использованы как инструмент для моделирования различных нелинейных систем. На сегодняшний день они представляют собой один из немногих прообразов организованной сложности, характерной для ряда физических, многих биологических, технических и социальных систем. Вопросы и задачи 1. Рассмотрим модель Хопфилда, в которой > 0, 1 < i N, 1 j < N. Ка- кова типичная конфигурация в этом случае? Каким материалам соответствует такое поведение? Каковы будут ответы на те же вопросы, если j < 0? 2. В спиновых стеклах известны эффекты, называемые фрастрациями, — изме- нение ориентации отдельного спина не меняет энергию системы. Рассмот- рите три спина и выясните, при каком соотношении знаков Jt2> Лз> Лз этот эффект возможен?
Нейронные сети 307 3. Нейронная сеть Хопфилда, состоящая из 9 элементов, обучена двум ключе- вым образам 1 1 0 1 0 0 1 0 0 0 0 1 О 0 1 О 1 1 Какова будет финальная конфигурация, если на вход сети подан образ О 1 О О 1 О О 1 О 4. При численном исследовании описанного дискретного варианта сети Хоп- филда, в котором состояния всех элементов обновлялись синхронно, было обнаружено, что при некоторых начальных конфигурациях происходит вы- ход на циклы S2. Объяснить это явление. Как оно согласуется с наличием функционала Ляпунова? 5. В конце прошлого века Эббингаузом были поставлены классические экспери- менты, которые легли в основу теории обучения. Испытуемым предъявлялось на определенное время множество бессмысленных слов из трех букв. Затем выяснялось, насколько точно запомнено это множество. Оказалось, что в подавляющем большинстве случаев вероятность ошибки зависела от числа предъявлений множества N как P^Ce~XN, С = const. Постройте математическую модель, объясняющую эту зависимость. 6. Оказалось, что закон Эббингауза не верен для ситуаций, в которых про- исходит длительное обучение сложным навыкам (подготовка операторов атомных электростанций, пилотов самолетов-истребителей и т.д.). Вначале время принятия решения меняется в зависимости от времени обучения Т как т = т0 + Се~хт, где постоянные т0, С, А, естественно, зависят от способностей обучаемого. Затем происходит «качественный скачок» и время г существенно уменьша- ется. Объясните это явление, имея в виду подход теории бифуркаций либо концепцию параметров порядка. 7. Построить простейшую нейронную сеть, которая по предъявленному вектору (£г, £г) определяет, попала ли соответствующая точка в кубик с ребром а заданной ориентации с центром в заданной точке пространства. 8. Предложите простейшую нейронную сеть, предсказывающую движение ис- следуемого объекта на основе его предыстории. Рекомендуемая литература Уоссерман Ф. Нейрокомпьютерная техника. М.: Мир, 1992. — 237 с. Ижикевич Е. М., Малинецкий Г. Г. О возможной роли хаоса в нейросистемах // Докл. РАН. 1992. Т. 326. - С. 626-632. Костылев И. А., Малинецкий Г. Г., Потапов А. Б. Параметры порядка в ней- ронной сети Хопфилда // Журн. вычисл. матем. и матем. физ. 1994. Т. 34. — С. 1733-1740.
308 Глава 10 Нейронные сети активно используются не только при решении конкретных при- кладных задач, но и существенно меняют парадигму современного естествознания. Этот взгляд представлен в книгах: Новое в синергетике: Взгляд в третье тысячелетие / Сер.: «Информати- ка: неограниченные возможности и возможные ограничения»; Под ред. С. П. Курдюмова, Г. Г. Малинецкого. М.: Наука, 2002. — 480 с. (www.keldysh.ru/book/ns.html); Редько В. Г. Эволюционная биокибернетика / Сер.: «Кибернетика: неогра- ниченные возможности и возможные ограничения». М.: Наука, 2001. — 156 с.; и статьях: Малинецкий Г. Г. Сценарии, стратегические риски, информационные техно- логии // Информационные технологии и вычислительные системы. 2002. №4. — С. 83-108 (www.keldysh.ru/e-biblio/ij/s_r/jst.htm); Редько В. Г. Модели адаптивного поведения — естественно-научный подход к развитию информационных технологий // Информационные технологии и вычислительные системы. 2004. № 1. — С. 19-43.
:ru •~*8$8388883^ URSSru URSSru IBbrssju1'ItlURSSJriilllliURSSJrul.il URSSlruI ~URSSlrufc^ URSS^Hir^ URSS.mi ||||||ын1>ш. й ii i. । it ш . диаам—*—ы**аигн . , Другие книги нашего издательства: Серия «Синергетика в гуманитарных науках» Коротаев А. В., Малков С. Ю. (ред.) История и синергетика: Методология v исследования. URSS Коротаев А. В., Малков С. Ю. (ред.) История и синергетика: Математическое моделирование социальной динамики. Назаретян А. П. Антропология насилия и культура самоорганизации. Вагурин В. А. Синергетика эволюции современного общества. Митюков Н. В. Имитационное моделирование в военной истории. Буданов В. Г. Методология синергетики в постиеклассической науке и в образовании. Милованов В. П. Синергетика и самоорганизация: Общая и социальная психология. Милованов В. П. Синергетика и самоорганизация: Экономика и биофизика. Милованов В. П. Неравновесные социально-экономические системы. Панов А.Д. Универсальная эволюция и проблема поиска внеземного разума (SETI). Хиценко В. Е. Самоорганизация: элементы теории и социальные приложения. Москальчук Г. Г. Структура текста как синергетический процесс. Белоусов К. И. Синергетика текста: От структуры к форме. Ельчанинов М. С. Социальная синергетика и катастрофы России в эпоху модерна. Старостенков Н. В., Шилова Г. Ф. Российская цивилизация в социальном измерении. Математическая экономика Бабешко Л. О. Основы эконометрического моделирования. Альсевич В. В. Введение в математическую экономику. Конструктивная теория. Мантенья Р. Н., Стенли Г. Ю. Введение в эконофизику. Ширяев В. И. Исследование операций и численные методы оптимизации. Ширяев В. И. Финансовая математика. Кн. 1,2. Ширяев В. И. Финансовые рынки: Нейронные сети, хаос и нелинейная динамика. Ширяев В. И. Модели финансовых рынков. Ширяев В. И., Ширяев Е. В. Принятие решений. Кн. 1,2. Ширяев В. И., Баев И. А., Ширяев Е. В. Алгоритмы управления фирмой. Ширяев В. И., Баев И. А., Ширяев Е. В. Управление фирмой. Гонтарева И. В., Нижегородцев Р. М., Новиков Д. А. Управление проектами. Новиков Д.А., Иващенко А. А. Модели и методы организационного управления инновационным развитием фирмы. Бурков В. Н., Коргин Н.А., Новиков Д. А. Введение в теорию управления организационными системами. Воронин А. А., Новиков Д. А. и др. Математические модели организаций. Абрамова Н. А., Гинсберг К. С., Новиков Д. А. (ред.) Человеческий фактор в управлении. Новиков Д. А. и др. Модели и методы материального стимулирования. Учитель Ю. Г, Учитель М. Ю. SWOT-анализ и синтез — основа формирования корпоративной стратегии. Морозов В. В. и др. Исследование операций в задачах и упражнениях. Светуньков С. Г, Светуньков И. С. Производственные функции комплексных переменных: Экономико-математическое моделирование производственной динамики. Бойков А. В. Страхование и актуарные расчеты. Белых А. А. История российских экономико-математических исследований. AURSSlruW WURSSW H URSS ru URSSru URSS.ru URSS.ru 4 URS&ru=^URSS.ru "URSS.ru URSS.r
uRsslg^^ijiisg^teURs.s^Uj ||^и^шмм^^^^^ммамммаанвм^маММНММНММММММ*Мм^Ышм>аМ*мЫЩ^^^ммЛШммЫ^НМШШШНИНКЙШйЫ*ммММшмм*ммй^мМмммйЫм№^ Другие книги нашего издательства $ g*"« Математическое моделирование Малинецкий Г. Г. (ред.) Будущее прикладной математики. Малинецкий Г. Г. (ред.) Робототехника, прогноз, программирование. URSS Малинецкий Г. Г., Коротаев А. В. (ред.) Проблемы математической истории. Тарасевич Ю. Ю. Математическое и компьютерное моделирование. Тарасевич Ю. Ю. Информационные технологии в математике. Тарасевич Ю. Ю. Перколяция: теория, приложения, алгоритмы. Мышкис А.Д. Элементы теории математических моделей. Блехман И. И., Мышкис А.Д., Пановко Я. Г. Прикладная математика. Плохотников К. Э. Математическое моделирование и вычислительный эксперимент. Калман Р., Фалб П., Арбиб М. Очерки по математической теории систем. Ресин В. И., Дарховский Б. С., Попков Ю. С. Вероятностные технологии в управлении развитием города. Серия «Будущая Россия» Малинецкий Г. Г. (ред.) Будущее России. Вызовы и проекты: Экономика. Техника. Инновации. Малинецкий Г. Г. (ред.) Будущее России. Вызовы и проекты: История. Демография. Наука. Оборона. Осипов Г. В. (отв. ред.) Повальный кризис западной цивилизации и Россия. Ильин В. И. Манифест русской цивилизации. Арутюнов В. С., Лисичкин Г. В., Малинецкий Г. Г. (ред.) Наука России. От настоящего к будущему. Геловани В. А., Бритков В. Б., Дубовский С. В. СССР и Россия в глобальной системе (1985—2030): Результаты глобального моделирования. Серия «Классический университетский учебник» Колмогоров А. И., Драгалин А. Г. Математическая логика. Гнеденко Б. В. Курс теории вероятностей. Петровский И. Г. Лекции по теории обыкновенных дифференциальных уравнений. Ишханов Б. С, Капитонов И. М., Юдин И. П Частицы и атомные ядра. Кононович Э. В., Мороз В. И. Общий курс астрономии. Квасников И. А. Термодинамика и статистическая физика. В 4 т. Серия «Науки об искусственном» Финн В. К. Интеллектуальные системы и общество. Редько В. Г. (ред.) От моделей поведения к искусственному интеллекту. Шамис А. Л. Поведение, восприятие, мышление. Саймон Г. Науки об искусственном. Гаазе-Рапопорт М. Г, Поспелов Д.А. От амебы до робота: модели поведения. Попов Э. В. Общение с ЭВМ на естественном языке. Арбиб М. Метафорический мозг. Тарасов В. Б. От многоагентных систем к интеллектуальным организациям. Варшавский В. И., Поспелов Д.А. Оркестр играет без дирижера: Размышление об эволюции некоторых технических систем и управлении ими. ^Ш»ЖШ1%К11Й8Й:1Ш ЙХ й£ 44 I» • у:--х«лу <<-:• -. w H.X<X.S g IIО С IIР Ч Q х FBI |U К ио а । U К U Ша17Р I»
URSS.ru lit,иЯ88лч1 У .URSSTif Я WRSS.ruM ll-URSSBil* Я *‘URSSlruW HI .ЦЯ88;ПЦ^^-\^иЯ881Й.иг^^": Другие книги нашего издательства: Серия «Синергетика: от прошлого к будущему» Редько В. Г. Эволюция, нейронные сети, интеллект. Белецкий В. В. Очерки о движении космических тел. IIRSS.FU . *... Л| URSS Тюкин И. Ю., Терехов В. А. Адаптация в нелинейных динамических системах. Васильков Г. В. Эволюционная теория жизненного цикла механических систем. Долгоносое Б. М. Нелинейная динамика экологических и гидрологических процессов. Чумаченко Е. Н. и др. Сверхпластичность: материалы, теория, технологии. Гуц А. К., Фролова Ю. В. Математические методы в социологии. Турчин П. В. Историческая динамика. На пути к теоретической истории. Котов Ю. Б. Новые математические подходы к задачам медицинской диагностики. Гельфанд И. М., Розенфельд Б. И., Шифрин М.А. Очерки о совместной работе математиков и врачей. Белотелое Н. В., Бродский Ю. И., Павловский Ю. Н. Математическое моделирование и гуманитарный анализ. Суздалев И. П. Нанотехнология: физико-химия нанокластеров, наноструктур и наноматериалов. Серия «НАУКУ — ВСЕМ1 Шедевры научно-популярной литературы» Колмогоров А. Н. Математика — наука и профессия. Мизес Р. Вероятность и статистика. Стинрод Н., Чинн У. Первые понятия топологии. Вольберг О. А. Основные идеи проективной геометрии. Меннхен Ф. Некоторые тайны артистов-вычислителей. Вильямс Дж. Д. Совершенный стратег, или Букварь по теории стратегических игр. Широков П. А. Краткий очерк основ геометрии Лобачевского. Ланге В. Н. Физические парадоксы, софизмы и занимательные задачи. Кн. 1,2. Гарднер М. Теория относительности для миллионов. Сазанов А. А. Четырехмерная модель мира по Минковскому. Перельман Я. И. Занимательная астрономия. Кононович Э. В. Солнце — дневная звезда. Харкевич А. А. Автоколебания. Ашкинази Л. А. Электронные лампы: Из прошлого в будущее. Шейд К. Опыты по химии для начинающих. Кац Е. А. Фуллерены, углеродные нанотрубки и нанокластеры. Телефакс: (499) 135-42-46, (499) 135-42-16, E-mail: URSS@URSS.ru http://URSS.ru Наши книги можно приобрести в магазинах: «Библио-Глобус» (и. Лубянка, ул. Мясницкая, 6. Тел. (495) 625-2457) «Московский дои книги» (и. Арбатская, ул. Новый Арбат, 8. Тел. (495) 203-8242) «Молодая гвардия» (и. Полянка, ул. Б. Полянка, 28. Тел. (495) 238-5001,780-3378) «Дом научно-технической книга» (Ленинский пр-т, 40. Тел. (495) 137-6019) «Дои книга на Ладожской» (и. Бауманская, ул. Ладожская, 8, стр.1. Тел. 267-0302) «Гнозис» (м. Университет, 1 гум. корпус МГУ, комн. 141. Тел. (495) 939-4713) «У Кентавра» (РГГУ) (м. Новослободская, ул. Чаянова, 15. Тел. (499) 973-4301) «СПб. дои книга» (Невский пр., 28. Тел. (812) 448-2355) URSS.I?U^'T:>URSS.ru URSS.ru URSS.ru
«Wj .................................... 2URSS!r^z~*'URSS.ril Уважаемые читатели! Уважаемые авторы! Наше издательство специализируется на выпуске научной и учебной литературы, в том числе монографий, журналов, трудов ученых Россий- ской академии наук, научно-исследовательских институтов и учебных заведений. Мы предлагаем авторам свои услуги на выгодных экономи- ческих условиях. При этом мы берем на себя всю работу по подготовке издания — от набора, редактирования и верстки до тиражирования и распространения. URSS Среди вышедших и готовящихся к изданию книг мы предлагаем Вам следующие: Серия «Синергетика: от прошлого к будущему» Малинецкий Г. Г., Потапов А. Б. Нелинейная динамика и хаос: основные понятия. Малинецкий Г. Г., Потапов А. Б., Подлазов А. В. Нелинейная динамика. Капица С. П., Курдюмов С. П., Малинецкий Г. Г. Синергетика и прогнозы будущего. Малинецкий Г. Г. (ред.) Будущее России в зеркале синергетики. Малинецкий Г. Г. (ред.) Синергетика: Исследования и технологии. Пенроуз Р. НОВЫЙ УМ КОРОЛЯ. О компьютерах, мышлении и законах физики. Майнцер К. Сложносистемное мышление: Материя, разум, человечество. Хакен Г. Информация и самоорганизация. Климонтович Ю. Л. Турбулентное движение и структура хаоса. Трубецков Д. И. Введение в синергетику. В 2 кн.: Колебания и волны; Хаос и структуры. Арнольд В. И. Теория катастроф. Безручко Б. П. и др. Путь в синергетику. Экскурс в десяти лекциях. Данилов Ю.А. Лекции по нелинейной динамике. Элементарное введение. Князева Е. И, Курдюмов С. П. Основания синергетики. Синергетическое мировидение. Князева Е. Н., Курдюмов С. П. Основания синергетики. Человек, конструирующий себя и свое будущее. Князева Е. Н., Курдюмов С. П. Синергетика: нелинейность времени и ландшафты КОЭВОЛЮЦИИ. Быков В. И. Моделирование критических явлений в химической кинетике. Баранцев Р. Г. Синергетика в современном естествознании. Баранцев Р. Г. и др. Асимптотическая математика и синергетика. Чернавский Д. С. Синергетика и информация (динамическая теория информации). Олемской А. И. Синергетика сложных систем: Феноменология и статистическая теория. Анищенко В. С. Знакомство с нелинейной динамикой. Пригожин И. Неравновесная статистическая механика. Пригожин И. От существующего к возникающему: Время и сложность в физических науках. Пригожин И., Стенгере И. Время. Хаос. Квант. К решению парадокса времени. Пригожин И., Стенгере И. Порядок из хаоса. Новый диалог человека с природой. Пригожин И., Николае Г. Познание сложного. Введение. Пригожин И., Гленсдорф П. Термодинамическая теория структуры, устойчивости и флуктуаций. По всем вопросам Вы можете обратиться к нам: телефакс (499) 135-42-16, 135-42-46 или электронной почтой URSS@URSS.ru Полный каталог изданий представлен в интернет-магазине: http://URSS.ru Научная и учебная литература URSSlru’-WgUffSSWM 1 .URSSWfWllSSlfu ; В* IURSS.ru/: : д HRSS.ru i
Q-Сельзя построить содержательную общую теорию нелинейных систелс, — считал Т)жон срок О-Сейииан. Великий математик, ошибался. В этоле убеждают книги этой серии, посвященные синергети- ческой парадиглее, нелинейной науке, бисруркациялл., срракталалл, хаосу и многилл другилл. интереснылс вещалс. Георгий Геннадьевич МАЛИНЕЦКИЙ Заместитель директора ИПМ им. М. в. Келдыша РАН. доктор фи- зико-математических наук, профессор. Один из ведущих специалистов в области нелинейной динамики, автор около 450 научных трудов, более 60 научно-популярных статей и нескольких книг, изданных в России и в США. Среди них «Нестационарные диссипативные структуры и диффузион- ный хаос», «Современные проблемы нелинейной динамики» (URSS), «Синергетика и прогнозы будущего» (URSS), «Управле- ние риском», «Нелинейная динамика и хаос. Основные понятия» (URSS), «Нелинейная динамика. Подходы, результаты, надежды» (URSS). Является редактором серии книг «Будущее прикладной математики» и председателем редакционных коллегий серий книг «Синергетика: от прошлого к будущему» и «Будущая Россия», выпускаемых издательством URSS. Наиболее известные его результаты — теория диффузионного хаоса, модели системы обра- зования, исследовательский проект, связанный с созданием «теоретической истории», а также проект создания Национальной системы научного мониторинга опасных явлений и процессов в природной, техногенной и социальной сферах. Г. Г. Малинецкий — создатель и руководитель специализации «Нелинейные процессы» в Московском физико-техническом институте, профессор Московского государственного тех- нического университета им. Н. 3. Баумана и Российской академии государственной службы при Президенте РФ. Является лауреатом премии Правительства РФ в области образования. В последние годы занимается мягким моделированием, прогнозом бедствий и катастроф, кри- зисных явлений на основе методов нелинейной динамики, а также теории русел и джокеров, проблемами проектирования будущего. НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА E-mail: URSS@URSS.ru Каталог изданий в Интернете: http://URSS.ru Тел./факс: 7 (495) 135-42-16 URSS Тел./факс: 7 (495) 135-^2-46 Любые отзывы о настоящем издании, а также обнаруженные опечатки присылайте по адресу URSS@URSS.ni. Ваши замечания и предложения будут учтены и отражены на web-странице этой книги в нашем интернет-магазине http://URSS.ru