Text
                    Г.Г.Малинецкий
Введение в нелинейную динамику

Г.Г.Малинецкий хвое • СТРУКТУРЫ • вычислительный ЭКСПЕРИМЕНТ * Введение в нелинейную динамику Эдиториал УРСС • Москва • 2000
Малинецкий Георгий Геннадьевич Хаос. Структуры. Вычислительный эксперимент: Введение в нелинейную динамику. — М.: Эдиториал УРСС, 2000. — 256 с. ISBN 5-8360-0132-4 Книга представляет собой введение в нелинейную динамику, синергетику и другие области «нелинейной науки». В ней наводятся мосты между традиционными естественно- научными дисциплинами, математическими курсами и фундаментальными проблемами, над которыми сейчас работают ученые. Книгу отличает ясное и наглядное изложение материала, большое количество ил- люстраций. В ней содержится около сотни задач различных уровней сложности. В основу книги легли вводные курсы нелинейной динамики и математического моделирования, читавшиеся в течение ряда лет в МГУ и МФТИ, а также опыт работы группы ученых Института прикладной математики им. М. В. Келдыша РАН. Книга рассчитана на студентов, аспирантов, специалистов в смежных областях, на всех, кого интересуют идеи, перспективы, методы и проблемы синергетики. Издательство «Эдиториал УРСС». 113208, г. Москва, ул. Чертановская, д. 2/11, к. п. Лицензия ЛР №064418 от 24.01.96 г. Гигиенический сертификат на выпуск книжной продукции №77.ФЦ.8.953.П.270.3.99 от 30.03.99 г. Подписано к печати 29.05.2000 г. Формат 60x84/16. Тираж 1000 экз. Печ. л. 16. Зак. № 96 Отпечатано в ТОО «Типография ПЭМ». 121471, г. Москва, Можайское шоссе, 25. Эдиториал УРСС научная и учебная литература Тел./факс: 7(095)135-44-23 Тел./факс: 7(095)135-42-46 E-mail: urss@urss.ni Каталог изданий в Internet: http://urss.ru ISBN 5-8360-0132-4 © Г. Г. Малинецкий, 1997 © Эдиториал УРСС, 2000
ПРЕДИСЛОВИЕ Основным препятствием для широкого использования математиче- ского моделирования и вычислительного эксперимента в науке, тех- нике, управлении является недостаток квалифицированных специали- стов. Решение ряда крупных проблем сдерживается не отсутствием компьютеров, а недостатком коллективов, работающих на современном уровне. Требования, предъявляемые к специалисту в области математиче- ского моделирования, весьма высоки и вместе с тем противоречивы. С одной стороны, он должен быть профессионалом, глубоко понимающим достаточно узкую конкретную область исследований. С другой сторо- ны, обычно ему приходится выступать не как исполнителю, а как уче- ному, который видит проблему в целом и способен уточнить, а иногда и радикально изменить постановку задачи, предложенную физиками, химиками или биологами. Работа в области математического моделиро- вания предполагает своеобразный стиль мышления, в котором глубина и конкретность сочетаются с широтой и пониманием общих идей. Кроме того, успех в математическом моделировании при решении большинства серьезных задач опирается, как на трех китов, на триаду: модель—алгоритм—программа. Поэтому, чтобы верно наметить стратегию исследований, нужно хо- рошо представлять имеющийся инструментарий и основные достиже- ния в каждой из областей. Это очень важно, поскольку, например, вычислительная математика сегодня все чаще выступает не только как инструмент, но и как источник новых идей в моделировании, физике, естествознании. На эту связь неоднократно обращается внимание в кни- ге. Центральным моментом при решении многих крупных проблем, на- чиная с совершенствования химической технологии и проблемы упра- вляемого термоядерного синтеза и кончая актуальными задачами кван- товой теории поля и созданием нового поколения компьютеров, являет- ся анализ нелинейных явлений. В обширной области, часто называемой сейчас нелинейной наукой, или нелинейной динамикой, возникли свои оригинальные подходы, новые идеи и методы. Цель настоящей книги — познакомить студентов старших курсов, аспирантов и заинтересован- ных специалистов с этой дисциплиной. В 70-х годах началась и продолжается до настоящего времени на- учная революция, связанная с появлением новой технологии научных исследований — вычислительного эксперимента. Ее следует рассма- тривать как новую ступень в развитии математического моделирования, пронизывающего большинство областей науки. Главное из того, что дал вычислительный эксперимент, — возмож- ность анализировать нелинейные явления в физике, химии, биологии, социологии — привело к рождению новых идей, теорий, методов» к раз- витию междисциплинарных подходов. Это, в свою очередь, помогло сформулировать новые понятия и открыть замечательные явления при- роды. По-видимому, наиболее удивительное в области моделирования состоит в том, что небольшое число сравнительно простых математи- ческих моделей дает ключ к пониманию и исследованию огромного ко- личества различных явлений. Таким моделям — их часто называют базовыми — а также концепциям, родившимся при их анализе, и по- священа эта книга. В ее основу положен материал лекций и семинаров, которые в тече* ние ряда лет проводились на кафедре численных методов факультета 3
вычислительной математики и кибернетики МГУ, а также в МФТИ Опыт работы с аспирантами и старшекурсниками показал, что у мно- гих из них есть существенный пробел в образовании. Разобравшись в каких-то частных вопросах, сдав множество общих и специальных кур- сов, они слабо представляют область, в которой им предстоит работать, взаимосвязи между моделями, алгоритмами и современными пробле- мами. За формализмом и конкретными задачами они иногда не видят идей и контекста, в котором такие задачи имеют смысл. Это затруд- няет чтение оригинальной научной литературы и порой довольно долго не позволяют начать самостоятельные исследования. Я буду считать свою задачу решенной, если работа студентов и аспи- рантов над книгой позволит отчасти восполнить этот пробел или хотя бы осознать его наличие. Стиль книги во многом определяется опытом преподавания. Отдель- ные вопросы, обычно легко воспринимаемые студентами, излагаются конспективно. Ряд фундаментальных результатов математической фи- зики, вычислительной математики, теории динамических систем, обсу- ждавшихся в предшествующих курсах, без которых невозможен анализ нелинейных явлений, приходится напоминать. И одновременно с этим некоторые важные проблемы, недостаточно освещенные или совсем не затронутые в учебной литературе, рассматриваются весьма подробно. В книге приведено большое количество примеров и иллюстраций. Там, где это возможно, основное внимание уделено ключевым идеям и конкретным моделям, ради которых и создавались те или иные инстру- менты. В ряде случаев пришлось пожертвовать общностью, строгостью и рядом технических деталей ради наглядности. Книга рассчитана на активного заинтересованного читателя. По- этому в каждой главе обращается внимание на различную литературу, начиная от стандартных учебников и кончая монографиями, обзорами и оригинальными статьями, которые помогут более глубоко ознакомить- ся с обсуждаемой проблемой. Список литературы не претендует на полноту. В нем обращается внимание на наиболее простые и доступ- ные источники. Для удобства читателей он снабжен комментариями, показывающими, что и где можно найти. Было бы важно, чтобы читатель не только многое знал, но и умел решать элементарные задачи, связанные с анализом нелинейных явле- ний. Поэтому в книге приводится около сотни задач, использовавшихся при проведении семинаров. Объем книги примерно соответствует полугодовому вводному кур- су, сопровождаемому семинарами, который читается студентам мате- матикам, физикам, вычислителям на четвертом - пятом курсах. У этих студентов за плечами курсы математического анализа, линейной алгебры, математической физики, численных методов, теоретической физики. Однако большой интерес к курсу моделирования нелинейных явлений проявляли химики, биологи, инженеры, не обладающие столь солидной подготовкой. Их интересы также в определенной мере учтены. В книге обращается внимание на некоторые принципиальные результа- ты основных математических курсов, на которые опирается изложение. Осталось сказать, что предлагаемый материал отражает лишь не- большую часть нелинейной науки, тесно связанную с вычислительным экспериментом, и представляет только фрагмент огромной области ис- следований. Выбор материала отчасти диктовался субъективными при- страстиями автора. Каждая глава имеет свою нумерацию рисунков и формул. Представления нелинейной науки оказались созвучны творче- 4
ству Морица Эшера. В каждой главе помещена одна из работ этого ху- дожника. Все иллюстрации в настоящей книге взяты из альбома ’’Мир М.К. Эшера”1, включая художественные элементы обложки2 Развитие науки XX века показало необходимость построения мно- жества различных моделей для описания одного явления или объекта, создания альтернативных картин реальности Мы вынуждены жить не в мире абсолютных законов, истин в последней инстанции, всеобъ- емлющих концепций, поэтому исследователям приходится иметь дело с моделями, с взглядами, фиксирующими одно и игнорирующими мно- гое другое. Мы должны играть, создавая миры, в которых от нашего ’’настоящего”, слишком сложного и запутанного, взято совсем немного. Пожалуй, именно в этой подчеркнутой условности, умении выделить немногое, парадоксальности создаваемых миров, в кажущейся легко- сти и произвольности и состоит очарование работ Эшера. Лавина информации, порожденная компьютерами, заставила заду- маться над тем, как ее понять, осмыслить, упорядочить, как восполь- зоваться тем богатством, которое нам досталось. Как разумно распоря- диться открывшимися возможностями, отделить самое интересное от просто интересного? Решение оказалось по-эшеровски парадоксаль- ным. Выход состоит в разработке междисциплинарных подходов, в создании новых миров. Становление и развитие кибернетики, синер- гетики, нелинейной динамики показали, что это не только возможно, но и захватывающе интересно. Не удивительно ли, что в журналах по нелинейной науке ("nonlinear science” — в англоязычных странах) можно увидеть статьи математиков и географов, психологов и физи- ков. Они осваивают новый нелинейный язык, который прячется за от- дельными задачами, уравнениями, областями исследований. Возника- ет своеобразная натурфилософия компьютерной эры. Это игра с очень высокими ставками. В ходе ее может выясниться, какой смысл иссле- дователи будут вкладывать в слово "понимать”. Считаю приятным долгом выразить признательность своим учите- лям — С П Курдюмову, А.А. Самарскому, а также коллегам и учени- кам, во многом определившим подбор материала и стиль изложения. Я очень благодарен В.Г. Комаровой за огромную помощь в подготовке рукописи. 'The World of М.С. Escher. Abradale Press. Harry N. Abrams, Inc., Publishers. 1988. 2Ha первой странице обложки — Escher M.C. Sky ahd Water I. 1938 (Эшер M.K. Небо и вода I); на четвертой странице — Escher М.С. Stars. 1948 (Эшер М К. Звезды).
Escher M.C. Reptiles. 1943 Эшер М.К. Рептилии
ГЛАВА 1 МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ В СОВРЕМЕННОМ МИРЕ И НЕЛИНЕЙНЫЕ ЯВЛЕНИЯ Грядущая великая эра пробужде- ния человеческого разума прине- сет с собой метод понимания каче- ственного содержания уравнений. Сегодня еще мы не способны на это. Р.ФейнмаН Результаты математического моделирования (ММ) сейчас влияют, без преувеличения, на жизнь каждого человека. От политики госу- дарств, опирающейся на математические модели экономики и страте- гической стабильности, до новых лекарств, проектируемых с помощью компьютеров. От поколения новых товаров, использующих ряд ориги- нальных технологий, до гигантских компьютерных систем, продающих авиабилеты, обеспечивающих телекоммуникации или издание газет. В сфере деятельности, связанной с ММ, все более важную роль игра- ют построение и анализ математических моделей нелинейных явлений. Остановимся на причинах этого. В 50-х годах началась научная революция, коренным образом изме- нившая роль математики в целом и вычислительной математики в част- ности в науке и технологии. Это было связано с реализацией двух круп ных проектов — созданием ядерного оружия и освоением космическо го пространства. Оба проекта потребовали огромных затрат ресурсов, тщательного выбора наилучших вариантов. Сложность возникших за- дач делала их недоступными для стандартных приемов теоретической физики. Решение этих проблем стимулировало создание компьютеров и новых областей математики. В обоих случаях были сформированы научные коллективы, опыт которых позволил получить выдающиеся результаты в ряде областей науки. В нашей стране примером может служить Институт прикладной математики им. М.В. Келдыша, В США — исследовательские центры в Лос-Аламосе и Ливерморе. Возникла новая технология научных исследований — вычислитель- ный эксперимент. Он включает в себя построение и исследование ма- тематических моделей, связанное с использованием больших серий рас- четов на ЭВМ. Он опирается также на использование классических методов математики и теоретической физики, теории алгоритмов, на разработку новых подходов, на создание и применение адекватных про- граммных средств. В настоящее время ММ играет ключевую роль в анализе нескольких жизненно важных проблем, стоящих перед человечеством. Приведем пример. Энергетическая проблема и управляемый термоядерный син- тез. Благополучие человечества самым тесным образом связано с его энерговооруженностью. Например, за последние 50 лет затраты энергии на производство условной единицы сельскохозяйственной продукции в развитых странах возросли более чем в 100 раз. При этом урожайность зерновых возросла за этот период только в 3 раза. В мире сейчас проживает около 6 млрд, человек и средняя потре- бляемая на душу населения мощность составляет чуть более 2 квт. Де- мографический прогноз ООН предсказывает быстрый рост численности 7
населения земного шара в ближайшие 60-70 лет и к 2100 году стабилиза- цию на уровне 12 млрд, человек. Утилизация отходов, обогащение руд, опреснение воды, возрастающие масштабы природоохранной деятельно- сти потребуют довести потребляемую мощность на душу населения до величины, находящейся в диапазоне от 10 до 20 квт. Истощение запасов энергоносителей, большие проблемы, связанные с атомной энергетикой, требуют поиска альтернативных источников энергии. Одна из возможностей связана с использованием энергии термоядер- ных реакций. Существуют три изотопа водорода, отличающихся чи- слом нейтронов, — обычный водород Я/, дейтерий и тритий Возможна следующая реакция D + T= Яе4 + п+ 17,6Мэв, в результате которой возникает атом гелия Не4, нейтрон л и выде- ляется энергия, равная 17,6 мегаэлектронвольт. Напомним, что под электронвольтом понимается энергия, которую приобретает электрон при перемещении в электрическом поле в вакууме между двумя точ- ками с разностью потенциалов в 1 вольт. 1 электрон вольт равен 1,60207 10“ 19дж. Для сравнения можно сказать, что 1 грамм дейтерий — тритиевой смеси может дать энергии больше, чем тонна условного топлива. Однако, чтобы такая реакция шла, нужно сблизить ядра до рассто- яния 10“13 см, где начинают действовать ядерные силы. Для этого требуется преодолеть силы электростатического отталки- вания, что требует гигантских температур, превышающих 100 миллио- нов градусов. Американский физик Дж. Лоусон вывел критерий, указывающий, в какой области параметров энергетические затраты на создание условий термоядерной реакции меньше энергии, получаемой от самой реакции: где п — концентрация реагирующей смеси, т — время реакции. Наиболее популярны оказались два подхода. Первый, предложен- ный А Д. Сахаровым и И.Е. Таммом, связан с использованием магнит- ных полей для удержания ионизованного газа — плазмы. При этом обычно создают сложные системы катушек, излучателей, магнитов, окружающих тороидальную полость, в которой удерживается плазма. Такие установки получили название токамаков. Проектирование и создание токамаков оказалось чрезвычайно слож- ной научной и технической задачей и потребовало проведения огромно- го комплекса работ, связанных с математическим моделированием. В частности, пришлось развить новую науку — магнитную гидродинами- ку, изучающую свойства проводящей жидкости. В ходе поставленных вычислительных экспериментов были обнаружены новые физические явления Например, группой исследователей из Института прикладной математики им. МВ. Келдыша был открыт эффект Т-слоя, внесенный в Государственный реестр открытий. В натурном, физическом экспери- менте этот эффект был обнаружен только через несколько лет. Одна из проблем, возникающих при магнитном удержании плазмы, связана 8
с тем, что доступные магнитные поля сравнительно невелики. Они да- же не позволяют удерживать плазму такой концентрации, как концен- трация молекул в воздухе ~ 1019см"3. Пока удается в течение секунд удерживать плазму с п~ 1013см-3. Поэтому конфигурацию магнитных полей приходится выбирать очень тщательно, используя огромный ар- сенал созданных к настоящему времени моделей и самые современные компьютеры. Другой путь, предложенный нашими соотечественниками Н.Г. Басо- вым, О.Н. Крохиным и американцами Дж Наккольсом, Э. Теллером, состоит в создании серии управляемых термоядерных микровзрывов. Для обычной водородной бомбы критерий Лоусона оказывается выпол- ненным, поскольку, благодаря взрыву атомной бомбы, удается создать очень высокие значения концентрации на время, пока продукты взрыва не успели разлететься. Роль атомного боезаряда, сжимающего и нагревающего термоядер- ное горючее, в этом случае предстоит сыграть лазерам большой мощно- сти. Анализ и реализация этого проекта уже потребовали многолетних совместных усилий физиков и специалистов в области математического моделирования. Вычислительный эксперимент играет ключевую роль в решении не только многих прикладных, но и фундаментальных проблем. Ряд таких задач есть в современной астрофизике. Большой взрыв и образование Вселенной. В 60-х — 70-х годах огромные усилия ученых направлялись на ис- следование структуры материи, изучение элементарных частиц. Были созданы гигантские ускорители и вычислительно-измерительные ком- плексы, а также соответствующие математические модели. Последние позволили предсказать новые элементарные частицы. С помощью ком- пьютеров, анализирующих огромное количество фотоснимков, фикси- рующих столкновения элементарных частиц, удалось обнаружить имен- но те редкие события, ради которых и ставились эксперименты. Однако в этой области вычислительному эксперименту предстоит стать не вспомогательным, а основным инструментом исследования. В самом деле — чем меньше пространственные масштабы, процессы на ко- торых изучаются, чем больше масса открываемых частиц, тем больши- ми энергиями должны обладать ускоряемые частицы. Это, в свою оче- редь, требует увеличения размеров установок. В частности, создавав- шийся в США ускоритель, использующий сверхпроводящие магнитные системы SSC (сверхпроводящий суперколлайдер), должен был иметь диаметр 80 км. По-видимому, и в отдаленном будущем не удастся уве- личить размеры таких установок более чем на 2-3 порядка. Означает ли это, что процессы, происходящие на меньших масштабах, в принципе недоступны исследованию? По-видимому, нет. Уникальные условия были созданы в первые доли первой секун- ды Большого взрыва — акта творения нашего мира О происшедшем в эти мгновения можно судить по косвенным данным, по излучениям, приходящим из далекого космоса, по частицам, прилетающим оттуда, по структуре Вселенной, доступной нашим наблюдениям. Судьба ми- ра определяется фундаментальными свойствами элементарных частиц и наоборот — свойства частиц могут быть определены, исходя из эво- люции огромных космических объектов Недавно возникшее направле- ние науки, рассматривающее Вселенную как гигантский ускоритель, получило название космомикрофизики. Один из главных результатов космомикрофизики — построение фундаментальных теорий, описыва- 9
ющих структуру вещества на микроуровне. В основе этих теорий лежат математические модели, представляющие собой нелинейные дифферен- циальные уравнения. Обычно задачи математической физики относятся к прямым: из- вестны уравнения, краевые условия, начальные данные, и требуется определить решение. Но в космомикрофизике, медицинской томогра- фии, физике плазмы, геологии все чаще приходится иметь дело с так называемыми обратными задачами: известны некоторые параметры решения, те или иные особенности системы (априорная информация) и требуется восстановить характеристики изучаемой системы (например, уравнения, описывающие объект). Анализ и решение обратных задач сейчас стали важным направлением математического моделирования. Вычислительный эксперимент. Триада: модель — алгоритм — программа Схему новой технологии научных исследований — вычислительного эксперимента — наглядно можно представить в виде схемы. Учитывая требования к точности предсказаний и постановку проблемы, строят математическую модель. Исходя из наиболее важных особенностей из- учаемой задачи, в данном конкретном классе систем разрабатывают алгоритмы. После оценки того, насколько широк будет круг исследователей, из- учающих проблему, и какие ЭВМ доступны, создаются программные продукты. Это могут быть уникальные программные продукты или не- сложные программы для персональных компьютеров. Это могут быть пакеты прикладных программ, если речь идет о массовых расчетах, либо системы, включающие создание специализированных алгоритми- ческих языков. После этого проводятся расчеты. Их результаты срав- нивают с данными наблюдений или натурных исследований. И далее, обычно, происходит возврат к первому шагу, к построению моделей. В зависимости от результатов сравнения предсказаний теории и реально- сти, модель модифицируют, уточняют, либо строят заново. В настоящее время ключевым звеном, определяющим эффектив- ность использования вычислительной техники в науке и технологии, являются математические модели. Это стало особенно очевидно после появления огромного множества персональных компьютеров и при со- здании проектов суперкомпьютеров. В первом случае количество пер- сональных компьютеров, используемых для решения научных задач, а не для редактирования текстов, компьютерных игр, хранения деловой информации, оказалось ничтожно, а их влияние на развитие науки на- много меньше, чем представлялось вначале. Во втором случае создание суперкомпьютеров во многом сдерживается отсутствием постановок за- дач, математических моделей, изучение которых принесло бы крупный экономический эффект, но которые не могут быть решены на существу- ющих ЭВМ. Поскольку в дальнейшем речь в основном будет идти о математи- ческих моделях, приведем пример, иллюстрирующий взаимосвязь всех компонентов триады. Традиционными объектами моделирования являются системы, обес- печивающие процессы теплопередачи. ’’Докомпьютерная эра”. Математические модели процесса тепло- проводности линейны. Для решения используются метод разделения переменных, а также асимптотические методы. Известно несколько ав- томодельных решений нелинейного уравнения теплопроводности. 10
’’Начало компьютерной эры”. Простейшие нелинейные моде- ли. Обычно используются простые разностные схемы, как наиболее быстрые и простые алгоритмически. Расчеты на ЭВМ ведутся неболь- шими группами исследователей. Производительность ЭВМ - десятки тысяч операций в секунду. Скромная компьютерная графика. У боль- шинства исследователей свои собственные программы объема 102 — 103 команд на языках высокого уровня. Обычно решаются простейшие дву- мерные задачи, которые сводятся к последовательности одномерных. ’’Героический период”. Огромное расширение круга задач, ре- шаемых с помощью вычислительного эксперимента. Появление множе- ства новых моделей теплопроводности, например, учитывающих огра- ничение теплового потока, изменение типа уравнения при определенных условиях. Необходимость решать отдельные трехмерные задачи. Раз- витие теории разностных схем, позволившее выдвинуть фундаменталь- ные принципы их построения, например, консервативность — выпол- нение разностных аналогов законов сохранения. Обычно используются неявные разностные схемы и итерационные методы решения возника- ющих линейных уравнений. Появление ЭВМ с производительностью 106 — 107 операций в секунду. Появление пакетов прикладных программ объемом 104 — 105 операторов, привлечение к их созданию специалистов по системному программированию. Возможность вести расчеты в диа- логовом режиме. Черно-белая компьютерная графика, позволяющая строить видовые проекции, линии уровня распределений температуры. Современный этап. Необходимость в задачах технологии расче- та огромного количества сложных трехмерных конструкций. Появле- ние в распоряжении ученых и инженеров ЭВМ с производительностью 10® - 109 операций в секунду. Разностные схемы, адаптирующиеся к решению. Возрождение прямых методов решения линейных уравне- ний с разреженными матрицами. Появление нового поколения алго- ритмов, рассчитанных на проведение параллельных вычислений с помо- щью многопроцессорных систем, транспьютеров. Создание пакетов при- кладных программ, доступных с помощью компьютерных сетей широко- му кругу инженеров. Возможность проводить расчеты уникальных кон- струкций с учетом множества физических процессов (вход ’’Шаттла" в атмосферу, тепловой расчет ракетных двигателей с целью оптимизации и т.д.). Цветная графика, создание компьютерных фильмов, позволяю- щих проследить динамику процесса. Ближайшее будущее. Возможность построения ’’интеллектуаль- ных" компьютерных систем, проведения тепловых расчетов, выбираю- щих, исходя из поставленной задачи и результатов ранее проведенных расчетов, математическую модель и численный алгоритм. Использова- ние компьютерных систем с высокой степенью параллельности, напри- мер, клеточных автоматов, имитирующих тепловые процессы, а также нейросистем, способных делать выводы из накопленного опыта. Воз- можность поручить ЭВМ проблему адекватного представления резуль- татов расчетов. В ряде случаев проведение тепловых расчетов в ре- альном масштабе времени с целью оптимизации технологических про- цессов. Огромные возможности решения обратных задач, позволяющие синтезировать тепловые поля желаемой конфигурации. Иерархия упрощенных моделей Работа над крупными проектами в таких областях как вычислитель- ная физика плазмы, гидродинамика, расчет атомных электростанций,
широкомасштабный анализ экологических процессов позволила сфор- мулировать концепцию иерархии упрощенных моделей. В эпоху становления вычислительного эксперимента казалось, что изучение сложной системы аналогично складыванию мозаичной карти- ны. Например, при изучении биосферы, одной группе исследователей можно поручить строить модели атмосферы, другой — океана, третьей — биоценозов тундры. Затем эти куски — блоки сшиваются в единое целое и получается, по замыслу, прекрасная модель. Провал несколь- ких крупных проектов такого сорта показал, что так поступать нельзя. Обычно получаются результаты, интерпретация которых не ясна. Поэтому приходится действовать иначе. Вначале выделяются основ- ные, ключевые процессы, играющие главную роль в изучаемом явлении на данном пространственном и временном масштабах. Затем строится еще более простая модель явления с меньшей областью применимости и учитывающая еще меньшее количество факторов. И так происходит до тех пор, пока не возникает простейшая модель, поведение которой уже понятно. Только после того как модель нижнего уровня изучена и понята, удается перейти на следующий, более высокий уровень. Можно сказать, что основным достижением и основной целью ис- следований при решении сложных задач является построение иерар- хии упрощенных моделей. При этом должно быть установлено, какой уровень модели разумно использовать в тех или иных случаях. По- ка почти все построенные иерархии относятся к физическим системам. Идет строительство иерархий в ряде областей химии и математической экономике. Эта проблема ставится в биологии. Замечательной чертой иерархии упрощенных моделей является на- личие базовых математических моделей^ т. е. таких математических объектов, исследование которых позволяет эффективно строить и из- учать большие классы моделей различных явлений. Можно сказать, что базовые модели часто выступают как кубики, с их помощью кон- струируют описание конкретного явления. Важно подчеркнуть два принципиальных факта, выяснившихся в последние двадцать лет, — базовых математических моделей немного. Можно строить предельно простые нелинейные математические модели, которые являются глубо- кими и содержательными. Второй факт. С их помощью, не проходя все ступени иерархии, связанные с детализацией и усложнением матема- тического описания, оказалось возможным предсказывать неизвестные явления природы. Глубина и универсальность простейших нелинейных математиче- ских моделей стали основой для создания междисциплинарных подхо- дов. Моделирование динамики популяций Сказанное выше относится к крупным научным проектам, работу над которыми ведут большие исследовательские группы. Однако это справедливо и на ’’микроуровне”, при решении небольших задач. Основная часть специалистов, занимающаяся моделированием нели- нейных процессов, сталкивается именно с этой ситуаций. Перед ними встает проблема анализа конкретной физической, химической, техниче- ской или какой-то иной системы. Требуется выделить наиболее важные черты в изучаемом явлении, найти количественные характеристики мо- делируемых процессов Дать математическое описание системы. И за- тем использовать его для решения задачи прогноза, оптимизации либо какой-то другой. 12
Перед исследователем обычно стоит персональный компьютер, как правило, более мощный чем ЭВМ, которыми располагали участники первых ядерных или космических проектов. Ему самому приходится строить модели, выбирать алгоритмы, создавать или использовать име- ющиеся программы. К сожалению, довольно часто применяемая стратегия состоит в том, чтобы взять модель, свойства которой непонятны и, не задумываясь об алгоритмах, воспользоваться каким-либо стандартным пакетом ком- пьютерных прогамм. Такие действия очень редко приводят к успеху и почти никогда не дают понимания изучаемых процессов. Последнее, в то же время, является одной из главных целей исследования. Создаваемая модель должна быть согласована с теми данными, ко- торые доступны, и с теми вопросами, ответы на которые предполагается получить с ее помощью. Для того чтобы сделать ясными эти общие утверждения, можно при- вести конкретный пример, связанный с моделированием динамики по- пуляций. Это весьма известный объект, который очень часто моделируют и обсуждают в связи с изучением экологических проблем. Представим себе начинающего исследователя, которому экологи пред- лагают построить математическое описание ”их” экосистемы и дать прогноз ее развития. Как правило после работы с литературой, изучения предшествую- щих исследований, бесед с экспертами возникает соблазн, построить се- рьезную, достаточно полную модель. Например, она может иметь вид и1( = ЕЦДп] +/i(u1(0,u1(f-T1),...,um(f),urn(t- гт)) Umt = DmAum 4- - T1), .... Um(t), Um(t - Tm)), wt(r,0) = hfc(f), f€C, Ufc(rJ) = и*(«), f G Г, fc=l,..,m. (1) Здесь ui,..., um могут соответствовать численности или биомассе различных видов. Члены D\ Ди^ (где Д — оператор Лапласа 4- описывают их подвижность или способность к миграции. Нелинейные функции ft характеризуют взаимодействие видов. Величина запазды- ваний тк показывает, насколько система инертна. Она может, например, определяться периодом беременности у какого-то вида и таким образом отражать возрастную структуру популяции. Она может описывать си- туацию, в которой основную часть ресурсов потребляют не все особи, а те, которые имеют возраст тт и ’’вошли в силу”. Система уравнений должна решаться в области G, соответствующей рассматриваемому аре- алу с границей Г. Задачу (1) следует дополнить начальными данными Лк(г), соответствующими некоторому известному состоянию системы, и краевыми условиями и*(£), показывающими, как изучаемый объект взаимодействует с окружением. Такая модель является весьма общей. Она в принципе может опи- сывать огромный класс явлений от нашествий саранчи до динамики популяций рыб в водоемах. Такая модель согласуется с представлени- ями о трофических цепях, играющих важную роль в экологии. В свое время Ч Дарвин обратил внимание на связь между урожаем клевера в 13
английских деревнях и числом кошек у поселян. Нетрудно сконструи- ровать модель (1) так, чтобы она отражала эту взаимосвязь. Состояние моделей вида (1) обычно вызывает глубокое уважение у специалистов, не занимающихся математическим моделированием. Де- ло в том, что нужно иметь очень глубокие основания для использования такого математического описания. Во-первых, если мы хотим иметь де- ло с пространственным распределением популяций, то нам нужна ин- формация о том, какова численность изучаемых видов в разных участ- ках региона (которая обычно недоступна). Во-вторых, следует поду- мать, как по экспериментальным данным будут определяться функции /1,..., /т и коэффициенты Di,. .., Dmt ть ..., тт. Во многих случаях это представляет весьма сложную самостоятельную задачу. В-третьих, о качественном поведении решений систем уравнений ви- да (1) известно весьма немного. Опыт накоплен в основном для случаев, когда есть всего два вида тп = 2 и нет запаздывания. Сами нелиней- ные уравнения с запаздыванием — одни из наиболее сложных объектов в современном моделировании. Например, весьма непростым является анализ элементарной на вид модели — уравнения Хатчинсона i = ar(t)(l — r(t — т)). (2) Его достаточно трудно анализировать как с помощью численных, так и с помощью асимптотических методов при больших значениях параметра а. Поэтому, имея дело с уравнением (1), мы можем столкнуться с не- обычным поведением решений и математическими трудностями. Сле- дует ли их преодолевать, чтобы проанализировать конкретную эколо- гическую систему? Ответ на этот вопрос является часто наиболее важной и трудной ча- стью работы. При ответе на него — в контакте с экспертами — следует выяснить, чем можно пренебречь и чтЬ является ключевым. Например, если мы представляем численность популяций в целом, но не имеем данных ни о ее пространственном распределении, ни о воз- растной структуре, то разумно перейти к системе обыкновенных диф- ференциальных уравнений й) = /1(^1,- -1 «т) Йт — fm (U1 » um)- (3) Если наиболее важны взаимодействия между двумя видами, например, хищниками и жертвами, то систему можно еще более упростить: и - f(u, v) t> = s(u,v). (4) Этот объект прекрасно исследован. Некоторые из свойств таких моде- лей будут обсуждаться в 8-Й главе. Эти уравнения могут описывать периодические колебания численности видов, что допускает ясную ин- терпретацию, либо выход на такой режим. С другой стороны, если вида хотя бы три, то могут возникнуть не- периодические, хаотические колебания. И тут мы имеем отдельные 14
примеры такого поведения в конкретных системах, а не ясную и за- конченную теорию. Разумеется, эти модели оправданы, если мы знаем или можем узнать численность видов, которые фигурируют в уравне- нии для реальной моделируемой системы. Наконец, может оказаться, что мы знаем численность только одного вида. Но именно этот вид и является определяющим. Если к тому же принципиальным для него является не взаимодействие с другими ви- дами, а внутривидовой отбор, то будут, например, возникать уравнения типа й = ац(1 — и). (5) Эта модель и многие другие объекты такого сорта допускают подробное аналитическое исследование. Они обсуждаются в главах 4, 5 и 6. Но уравнение вида (5) не может, к примеру, описывать периодиче- ские колебания численности. Если такие колебания есть и существен- ны, надо возвращаться назад и усложнять модель. Уравнение (5) может описывать выход численности популяции с течением времени на посто- янное значение, определяемое ресурсами региона. Однако, может быть, нас интересует как будет расти численность вида, освающего новую эко- логическую нишу, а не долговременные процессы. Тогда описание дает элементарная линейная модель — уравнение Мальтуса: й = аи. (6) Но есть и другой путь упрощения. Если численность вида, к приме- ру, считается раз в году, то разумно перейти от непрерывного времени t к дискретному — л и от дифференциальных уравнений к отображе- ниям. Например, при анализе конретной биологической ситуации био- логом Р. Мэем было использовано отображение, называемое логисти- ческим цп + 1 - aun(l - un) (7) Оно оказалось поразительно интересным математическим объектом. Его изучение позволило ответить на ряд фундаментальных вопросов современного естествознания и потребовало больших усилий. О таких объектах, называемых одномерными отображениями, речь идет в седь- мой главе. Для них построена глубокая и обширная теория. Однако небольшая модификация уравнения (7) (переход к простей- шему дискретному аналогу уравнения Хатчинсона) un+1 = aun(l - un_i), (8) приводит нас к двумерным отображениям. О таких отображениях из- вестно гораздо меньше. Они интенсивно исследуются в настоящее вре- мя. Итак, даже на "микроуровне” перед исследователем открывается множество различных возможностей. Ему приходится выбирать уро- вень, на котором он будет описывать систему и математический ’’язык” , которым он будет пользоваться. Представление об этих возможностях и лают курсы математического моделирования и нелинейной динамики. Мягкое моделирование и нелинейные явления. В последнее время все большее внимание уделяется направлению исследований, часто называемому мягким моделированием. В гидроди- намике, квантовой механике, теории упругости известны законы, опре- деляющие ход изучаемых явлений И задача часто сводится к получе- нию конкретных частных следствий из общих законов В психологии, 15
социологии, истории, многих других областях попытки поиска эффек- тивного математического описания только начаты. Здесь часто важно проверить те или иные гипотезы. Поэтому обычно основное внимание обращается на качественные эффекты. Модели нелинейной динамики могут выступать как простейшие объ- екты, демонстрирующие желаемое качественное поведение. С этим, например, связано широкое использование моделей теории катастроф, динамических систем на плоскости, одномерных отображений, рассма- триваемых в этой книге, при описании различных явлений в экономике, медицине, при анализе природных и техногенных катастроф. Кроме того известные нелинейные модели, появившиеся в одной области, иногда могут использоваться в качестве своеобразных блоков, "кубиков” в других дисциплинах. Приведем характерный пример. Одним из важнейших эксперимен- тальных достижений в науке XX века стало открытие Б.Б. Белоусовым колебательных химических реакций. Это привело к построению соот- ветствующих математических моделей. Анализ последних привел к ги- потезе о "химическом хаосе”, — колебательных химических реакциях с хаотическим поведением. Профессором О. Ресслером были предложены гипотетические модели реакций, в которых возможен хаос. Позже было показано, что эти модели при небольшой модификации позволяют описывать эпидемии ряда заболеваний. И в прошлом году А.Ю. Андреев и М.И. Левандовский предложили использовать близкую систему для описания забастовочного движения. Их модель имеет вид X = m(N - X) -bXZ Y = bXZ-(m + a)Y Z = aY — (m 4- g)Z W = gZ - mW, где N — общее число рабочих, X — число рабочих, еще не восприняв- ших информацию о забастовке, Y — рабочие, согласившиеся бастовать, но не ведущие активной агитации, Z — рабочие, ставшие агитаторами, W — рабочие, отказавшиеся от стачечной борьбы после одной из забо- стовок. Оказалось, что эта модель дает удовлетворительное описание ста- чечного движения во Владимирской губернии в период с 1895 по 1905 год Модель, родившаяся в одной области, оказалась достаточно уни- версальной. Такая ситуация — не редкость в мягком моделировании Рекомендуемая литература Принципиальную роль в становлении нелинейной динамики сыграли кни- ги: Николис Г., Пригожин И Самоорганизация в неравновесных системах. М Мир, 1979; Хакек Г. Синергетика. М.' Мир, 1980 Различные подходы к построению математических моделей сложных си- стем обсуждаются в книгах: Самарский А.А., Михайлов А.П Компьютеры и жизнь М : Педагогика, 1989; Моисеев Н.Н. Математические задачи систем- ного анализа. М.: Наука, 1981; Краснощеков ПС., Петров А.А Введение в математическое моделирование. М : Наука, 1984; Компьютеры, модели, вычислительный эксперимент М : Наука, 1988 16
К простейшим математическим моделям нелинейной динамики можно от- нести модели, описывающие диссипативные системы с помощью обыкновен- ных дифференциальных уравнений. Их можно рассматривать как развитие на новом уровне теории колебаний. Такие исследования во многих случаях связаны с динамическим хаосом Этот круг проблем обсуждается в книгах. Шустер Г. Детерминированный хаос. Введение. М.: Мир, 1986; Неймарк Ю.И., Ланда П.С. Стохастические и хаотические колебания. М.; Наука, 1987; Рабинович М.И., Трубецков Д.И. Введение в теорию колебаний и волн. М.: Наука, 1984, Анищенко В.С. Сложные колебания в простых системах. М.: Наука, 1990; Дмитриев АС., Кислов В.Я. Стохастические колебания в радиофизике и электронике. М.: Наука, 1989; Лоскутов А.Ю., Михайлов А.П. Введение в синергетику. М : Наука, 1990. Более простое обсуждение этих проблем предлагается в книгах: Мун Ф. Хаотические колебания. М.: Мир, 1990; Берже П , Помо И., Видаль К. По рядок в хаосе. М.: Мир, 1991. Нелинейная динамика играет важную роль в анализе химических и био- логических систем. Представление об этом направлении работ дают книги: Романовский Ю.М., Степанова Н.В., Чернавский Д.С. Математическая био- физика. М.: Наука, 1984; Марри Дж. Нелинейные дифференциальные урав нения в биологии: Лекции о моделях. М.: Мир, 1983; Гарел Д., Гарел О. Колебательные химические реакции. М.; Мир, 1986. Об энергетической проблеме, космомикрофизике и других "сверхзада- чах”, в решении которых принципиальную роль играет моделирование не- линейных явлений, более подробно рассказывают книги: Басов И.Г, Лебо И.Г, Розанов В.Б. Физика лазерного термоядерного синтеза. М.: Знание, 1988; Хлопов М.Ю. Космомикрофизика. М.: Знание, 1989; Моисеев Н.Н Математика ставит эксперимент. М.: Наука, 1979. Материал этой книги примерно соответствует полугодовому курсу, сопро- вождаемому семинарскими занятиями. Возможная программа годового курса предлагается в брошюре: Л/алинецкий Г.Г. Базовые модели и ключевые идеи синергетики. М., 1994. (Препр. ИПМ им М.В.Келдыша РАН; N70) Небольшой задачник с решениями по нелинейной динамике есть в сбор нике: Новое в синергетике. М.: Наука, 1996. Представление о философских проблемах, возникших в связи с широким использованием компьютерного эксперимента и изучением нелинейных явле- ний, дают книги: Пригожин И., Стенгере И. Порядок из хаоса: Новый диалог человека с природой. М.: Прогресс, 1986; Пригожин И., Стенгере И. Время, хаос, квант: К решению парадокса времени. М.: Прогресс, 1994; Князева Е.Н., Курдюмов С.П. Законы эволюции и самоорганизации сложных систем. М.: Наука, 1994.
Escher M.C. Drawing Hands. 1948 Эшер М.К. Рисующие руки
ГЛАВА 2 ЛИНЕЙНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ Линейные уравнения очень важ- ны Они настолько важны, что , физики и инженеры, пожалуй, по- ловину всего времени тратят на решение линейных уравнений. Р. Фейнман Прежде чем заниматься нелинейными явлениями и их моделирова- нием, обсудим примеры линейных моделей и методы их анализа. Это позволит осознать, от чего придется отказаться, переходя к построению и изучению нелинейных математических моделей. До недавнего времени линейные уравнения (алгебраические, диф- ференциальные, интегральные) были основным инструментом теорети- ческой физики. Однородное линейное уравнение можно представить в символиче- ском виде Lu = 0, где L — линейный оператор, а и — искомая функ- ция. Свойство линейности означает, что L(u + v) = Lu + Lv, L(au) = aLu, где a — постоянная. Для таких уравнений справедлив принцип суперпозиции: если U] и и? — решения уравнения Lu = 0, то их линей- ная комбинация or«i +^и2> где а и fl — постоянные, тоже будут решени- ем. В самом деле Lu\ = 0, Lu2 = 0 => L(au\ + /?и2) = L(oru]) + £(/?u2) = orLui + fiLui = 0. Принцип суперпозиции позволяет эффективно решать линейные неоднородные уравнения Lu = /, где функция / не зависит от и. При решении множества различных задач достаточно решать толь- ко линейные уравнения. Роль последних действительно очень велика. В связи с этим возникает несколько вопросов. Почему линейных ма- тематических моделей так много в самых разных областях науки от астрофизики и биологии до физики плазмы и теории упругости? Поче- му линейные модели квантовой механики, гидродинамики, электроди- намики, оптики, сыграли ключевую роль в становлении современного естествознания? В чем причина поразительной эффективности линей- ных моделей? Мы дадим два ответа на эти связанные между собой вопросы и при- ведем ряд примеров, подтверждающих их и демонстрирующих основ- ные способы исследования линейных уравнений. Суть первого ответа сводится к тому, что линейные уравнения адекватно отражают многие явления природы. Суть второго, более формального, состоит в том, что популярность линейных уравнений связана с наличием эффектив- ного математического аппарата, активно развивающегося в течение по- следних двухсот лет. Наши аргументы удобно сформулировать в виде нескольких тезисов. В подтверждение каждого из них мы приведем несколько простых примеров. 1. Многие зависимости между различными величинами, ха- рактеризующими ряд явлений природы, линейны. В самом деле, посмотрим глазами математика на закон Ома, связы- вающий напряжение, приложенное к проводнику V, ток, текущий через него It и сопротивление R. Естественно предположить, что существует некоторая зависимость I = /(V), /(0) = 0. Последнее равенство очевид- но: когда напряжение не приложено, тока нет Разложив эту функцию 19
в ряд Тейлора в точке V = 0, получим При ДУ —► 0 можно оставить первый член, ^|^Д[/ и назвать число — проводимостью 1/Н, а коэффициент R — сопротивлением. В чем же тогда суть закона Ома? Ведь то, что мы сделали, справедливо для любой дифференцируемой функции /(V). Суть закона состоит в том, что в очень большом интервале ДУ, представляющем интерес, для очень многих проводников член ^^ДУ гораздо больше остальных членов ряда. Другой пример — уравнение Шредингера, определяющее изменение плотности вероятности нахождения частицы во времени и простран- стве xp(x,t). В мире атомных процессов в одних случаях свет удобно рассматривать как поток частиц — квантов, в других — как электро- магнитную волну. Как говорят физики, имеет место дуализм "волна — частица”. В 1924 году Луи де-Бройль высказал гипотезу, позволя- ющую в рамках единого подхода рассматривать как волновые, так и корпускулярные свойства объектов микромира. В конце XIX века Гамильтон обратил внимание'на аналогию между геометрической оптикой и классической механикой. Оказывается, что основные законы этих теорий можно представить в тождественной мате- матической форме. При этом движению материальной частицы в поле У (т, у, z) соответствует распространение светового луча в оптически не- однородной среде с некоторым показателем преломления р(т, у, z). Од- нако, когда длиной световой волны нельзя пренебрегать, как в случае интерференции или дифракции, необходимо переходить от геометриче- ской к волновой оптике. Луи де-Бройль предположил, что необходи- мо расширить аналогию и создать волновую механику, описывающую явления микромира. Простейшая плоская волна, описывающая колебания в пространстве с частотой ш и волновым вектором k ("периодом по пространству"), определяется формулой expfikx — iwt). В соответствии с гипотезой Луи де-Бройля, чтобы объяснить дифрак- цию электронов, интерференцию микрочастиц и многие другие явления, этой волне следует сопоставить движение частицы с энергией Е = Ли/ и импульсом р = hk, где Л = 1,054 10“27 эрг сек — постоянная Планка, характеризующая свойства нашей Вселенной. Подставив выражения для Е и р в формулу для бегущей волны, получим волновую функцию для частицы с энергией Е и импульсом р = ezp(i?- - i — t). п Л Следовательно, в этом частном случае — = Етр и ; — PV>- Соб- ственным значением линейного оператора 1ЛД здесь является энергия Е, а собственным значением оператора — импульс р В качестве собственной функции в обоих случаях выступает волновая функция 20
Создатели квантовой механики предположили, что так же мож- но действовать и в общем случае — сопоставлять наблюдаемым физи- ческим величинам собственные значения линейных операторов. Пусть материальная частица массы тп с энергией Е и импульсом р движется в поле с потенциалом V(x,y, z), зависящим от пространствен- ных координат z,j/ и z. Потенциальная энергия такой частицы равна г), кинетическая — В силу закона сохранения энергии 2 Чтобы получить волновой аналог этого соотношения, подставим вместо энергии оператор , вместо р2 = р2 + р2 + р2 — оператор — + = -Л2Д, где А — оператор Лапласа, вместо V(xyy,z) — оператор умножения на У(х,у, z). Это даст фундаментальное уравнение волновой или квантовой ме- ханики, называемое уравнением Шредингера = -^-Д^ + V4>- (1) at 2т Оно описывает движение одной частицы в заданном поле. Это уравне- ние определяет эволюцию комплексной волновой функции Вероят- ность P(G,t) того, что частица находится в момент времени t в некото- рой области G, определяется квадратом амплитуды волновой функции P(G,t) = I ip(ftt)ipi,(ftt)dxdydzl Jg где звездочка (★) соответствует комплексному сопряжению. Поскольку в каждый момент времени частица где-либо находится в пространстве, полная вероятность где-нибудь обнаружить частицу P(t) должна быть равна единице. Поэтому надо потребовать, чтобы P(l) = f tp^dxdydz = 1. (2) Задача (1), (2) вместе с начальными условиями ^(г,0) = ipo(r) (3) определяет эволюцию волновой функции ^(f, t), если известна волновая функция V'o(r) в начальный момент. Предположим, что начальные данные выбраны таким образом, что любое измерение может дать только одно значение энергии частицы. Тогда dip at 21
Решение этого линейного уравнения, естественно, является экспонентой гр(хЛ) = exp(^)tp(x). Подставим, этот вид в уравнение (1), получим задачу на собственные значения д2 zoo Еу> = — -—Ду» + dxdydz = 1. (4) 2m J_ qq Собственные значения En определяют, какие значения энергии может иметь частица, двигающаяся в этом потенциале. Собственные функ- ции у>п, соответствующие им, показывают, с какой вероятностью ча- стицу можно обнаружить в разных точках пространства. Поскольку ^n(z.t) = и эта вероятность не зависит от времени. Подчеркнем, что это уравнение не было выведено из каких-либо дру- гих математических моделей, а было открыто. Решив уравнение Шредингера для кулоновского потенциала V ~ — 1/г, можно найти энергетические уровни атома водорода. При этом получаются результаты с огромной точностью согласующиеся с экс- периментальными наблюдениями. Таким образом, в основе одной из самых глубоких и эффективных физических теорий — квантовой ме- ханики — лежит линейная математическая модель — уравнение Шре- дингера. 2. Для ряда задач,' в которых можно удовлетвориться не- высокой точностью, либо в которых воздействия на изучаемую систему малы, можно ограничиться линейными уравнениями. Пример 1. Уравнение теплопроводности. Классической мо- делью математической физики является уравнение теплопроводности Tt = аТГ1, — сю < х < оо. Оно выводится, исходя из закона сохранения энергии и закона Фурье, в соответствии с которым тепловой поток W ~ дТ/дх. Представим себе, что начальное возмущение задано в ограниченной области простран- ства T(z,0) = То(х), тогда в первый же момент, как можно убедиться, температура станет ненулевой во всем пространстве, т. е. скорость рас- пространения сигнала оказывается неограниченной, что противоречит фундаментальным физическим представлениям. Но при больших зна- чениях х функция T(xt t) мала. Если точность, с которой нас интересу- ет ответ, такова, что с этими ‘’нефизическими" значениями можно при-. мириться, то модель нам подходит. В противном случае ее следует мо- дифицировать, исходя из особенностей изучаемой задачи. В ряде моде- лей физики плазмы и газовой динамики иногда считают, что сам коэф- фициент теплопроводности является функцией температуры k = к(Т), что делает модель нелинейной. Например, если к(Т) = k0Tff,cr > 1, то температура Т(хЛ) может быть отлична от нуля в каждый момент только в ограниченной области пространства. Скорость распростране- ния возмущений будет конечна. П р и м е р 2 Волновое уравнение. Одно из фундаментальных уравнений классической математической физики — волновое уравне- ние, которое описывает колебания струны ut( - c2urr = 0, u(x, 0) = u0(r), Uf(x,0) = vo(*). -oo < x < oo. (5) 22
Оно моделирует не только волны, которые распространяются по струне/но также и распространение звука в среде (акустическое при- ближение). В частности, из этого уравнения следует, что, как бы ни было ве- лико возмущение, оно будет распространяться с постоянной скоростью с. Разумеется, это так, лишь когда возмущения малы. Чтобы анали- зировать возмущения достаточно большой амплитуды, в первом случае надо учитывать растяжение связывающих нитей и изменение их натя- жений. Это приводит к появлению членов вида (их)2. Для звуковых волн большой амплитуды известен такой физический эффект, как воз- никновение ударных волн. Нетрудно предположить что их скорость зависит от интенсивности возмущения. Когда воздействие на среду велико, приходится отказываться от ли- нейной модели — уравнений акустики — и иметь дело с более сложным объектом — уравнениями газовой динамики 3. Для линейных уравнений справедлив принцип суперпо- зиции, что позволяет ’’сшивать” решение данной линейной за- дачи из решений более простых линейных задач. Пример 1. Линейная алгебра. Простейшим объектом в этой области является одно линейное уравнение ах = 6, которое при а 0 имеет единственное решение, при а = 0,6 = 0 — бесконечно много решений. При а = 0 и 6 / 0 уравнение не имеет решений. Рассмотрим систему линейных уравнений Ах — 6, где А уже матрица, х и 6 — векторы. Выберем новый базис е< в котором х — Syt 6 = Sc В этом базисе ASy = Sc => S 1 ASy ~ с ~ Dy. В соответствии с основным результатом линейной алгебры, в случае действительных различных собственных значений матрицы А базис можно выбрать так, что матрица D будет диагональной, т. е. Но в этом базисе мы получаем уравнения вида \кУк =bkt k = 1,.. ,N, совпадающие по виду с уравнением ах = 6, которое мы решать умеем Сложная задача "распалась” на набор простых П р и м е р 2. Обыкновенные дифференциальные уравнения Обратим внимание на две простые, но очень полезные модели, связан- ные с линейными дифференциальными уравнениями. 23
Математическая модель радиоактивного распада. Множество экспериментов, связанных с изучением радиоактивного распада, позволили установить следующее. Отношение числа распав- шихся за единицу времени атомов к общему числу атомов является по- стоянной величиной, зависящей только от вида атомов. Это отношение у называется вероятностью распада. При этом считается, что общее число атомов весьма велико. Обозначим число атомов, не распавшихся к моменту времени t, через 7V(t). В момент времени t + dt это количество будет равно N(t + dt). Следовательно за время dt распадется /V(t) + N(t + dt) атомов Это уравнение вместе с начальным условием N(0) = No позволяет най- ти число атомов в последующие моменты времени: = -ydt => У = -yt => N ~ Noe'yt. Несложные выкладки позволяют установить, что время полураспада (т. е. время, за которое распадется половина начального количества атомов) будет равно Т = /п2/у. Кроме того можно убедиться, что 1/у — среднее время жизни атома. Как и следовало ожидать, N(t) —* 0 при t —* оо. Простейшая модель роста народонаселения. Рассматривая проблемы, связанные с ростом народонаселения, Маль- тус предположил, что скорость роста населения dN/dt в отсутствие сдерживающих факторов пропорциональна численности населения N. Коэффициент пропорциональности получил название мальтузианского коэффициента at. Это предположение приводит к следующей модели dN -j- — aNt N(Q) — NOt a — const > 0. (7) dt Решение этого уравнения: N(t) = Noeat. В соответствии с ним насе- ление удваивается через время 1п2/а. Решение таково, что 7V(t) —> оо при t —* оо. Это говорит о том, что область применимости модели огра- ничена: при больших значениях N надо учитывать стабилизирующие факторы. Системы линейных дифференциальных уравнений. Рассмотрим теперь систему х = Ах, где А — матрица, х — вектор. Вновь выберем новый базис etl х = Sy Тогда Sy — ASy => y = S~lASy => у = Dy Точно так же, как в предыдущем примере, выберем преобразование S так, чтобы матрица D была диагональна. Здесь мы вновь имеем Ук = *кУк, k = J, .... 24
Следовательно, здесь также сложная исходная задача в принципе сво- дится к набору простейших Для At > 0 мы получаем уравнения вида (7), совпадающие с моделью роста народонаселения. Для А* < 0 полу- чающиеся уравнения будут аналогичны уравнению (6), описывающему радиоактивный распад. Мы обсудили случай, когда собственные значения At действительны и различны. Напомним традиционный способ решения системы диффе- ренциальных уравнений в этом случае. Вначале решается характери- стическое уравнение det | А - AEJ =0, находятся его корни Аь , Ап. Затем из системы линейных алгебраических уравнений находятся соб- ственные векторы ft, соответствующие собственным значениям At =At6- Далее начальное х(0) условие разлагается по собственным векторам £t > что вновь требует решения системы линейных алгебраических уравне- п кий для Ск xq = 22 Ctft- Затем пользуясь принципом суперпозиции, 4 = 1 решение можно записать в виде оо x(t) = £CieA“fb 4 = 1 4. Анализ устойчивости решений нелинейных задач часто сводится к исследованию линейных уравнений. Пример 1: Устойчивость особых точек динамических си- стем. Пусть нас интересует устойчивость стационарного решения х* системы нелинейных дифференциальных уравнений *=/(*)• (8) Вектор х* называют точкой равновесия, или особой точкой если /(£*) = 0. Рассмотрим малое отклонение от особой точки x(t) = х* + Ax(t). По- сле такой замены переменных и разложения в ряд гейлора получим х* 4- Ах = /(х* + Ах) = /(х*) + ^Ах + G(Ax). (9) 0Х Здесь матрица А = Ц с элементом а,, = называется матрицей Якоби или якобианом. В G входят нелинейные по Ах члены. В соответ- ствии с первым методом теории устойчивости Ляпунова, если матрица А не имеет собственных значений с нулевыми действительными частя- ми и кратных собственных значений, то при исследовании устойчивости решения х* остаток ряда G(Ax) может быть отброшен. Вновь выберем новый базис е}, Ах = Sy. Тогда Sy = ASy => y = S~lASy у = Dy Так же как в предыдущем примере, выберем S так, чтобы матрица D была диагональна. Это приводит к уравнению У4 = At yk, t = 1, , TV, 25
для каждой компоненты вектора у = (j/i (• • •, которое мы уже об- судили. Для наглядности мы ограничились здесь случаем веществен- ных различных собственных значений А*. Однако и в случае комплекс- ных собственных значений мы вновь сталкиваемся с объектом из пре- дыдущего примера — системой линейных дифференциальных уравне- ний Дх = ЛДх. То есть и в этом случае наша задача свелась к бо- лее простой. Понятно, что если действительная часть хотя бы одно- го собственного значения Л,- будет больше нуля, то —* оо, если ух(0) ф 0 и поэтому решение х" неустойчиво. Если же ReA* < 0 для к — 1,....,ЛГ, то ук —* 0 при Л = и состояние равновесия будет устойчивым. 5. Ряд важных нелинейных уравнений может быть сведен к линейным. П р и м е р 1. Уравнение Бюргерса. В некоторых математических моделях плотность потока транспорта u(x,t), а также ряд процессов в гидродинамике описывается уравнением Бюргерса и( 4- иих — vuXXt u(x,0) = u0(x), —oo < x < oo. Член uur описывает образование "пробок” — быстрые машины до- гоняют медленные и возникает скачок плотности u(x,t). Член обеспечивает конечную ширину скачка, которая обусловлена тем, что автомобили не сталкиваются друг с другом. Коэффциент и показывает, насколько велика "вязкость" в такой системе. Хопфом и Коулом было показано, что это уравнение некоторой за- меной переменной ф = ^(и) сводится к линейному уравнению тепло- проводности. П р и м е р 2. Уравнение Кортевега—де-Вриза. В теории мелкой воды движение большого класса волн описывается уравнени- ем Кортевега—де-Вриза U( + иих иххх = 0, -оо < X < оо, ц(х, 0) = Uo(x), Вначале это уравнение.анализировали численно. Позже было показано, что оно обладает бесконечным числом законов сохранения. И наконец, М. Крускал, Дж. Грин, К. Гарднер и К. Миура создали технику, на- зываемую методом обратной задачи теории рассеяния. Эта техника позволяет свести уравнение Картевега—де-Вриза к некоторому линей- ному интегральному уравнению. По образному выражению одного из математиков, граница между линейными и нелинейными уравнениями в свое время была проведена неверно. Многие уравнения нелинейные по форме являются линейными по существу. 6. Известный вид решений линейных задач позволяет сво- дить задачи более сложного типа к задачам более простого ти- па. Мы уже видели, как исследование линейных дифференциальных уравнений сводится к анализу алгебраических уравнений. В полной мере это относится и к линейным уравнениям математической физики. Пример!. Решение краевой задачи для уравнения тепло- проводности. Найдем частные решения, удовлетворяющие уравнению теплопроводности и краевым условиям Tf(0, t) = Tx(J,t) = 0 Tt =TIX. (10) 26
Простейшими решениями уравнений в частных производных являются решения, сохраняющие свою форму, или автомодельные Т - f(z)g(l). функция /(т) здесь определяет форму, g(t) — амплитуду решения. Обычно, подставив этот вид в уравнение, пользуются методом разде- ления переменных g,f = gfxx=> ?±=^ = Х=> g, - = 0, fxx - А/ = О, 9 J /г(0, t) = fx(l, t) = 0 => f - cos(irmi//) => A = -7г2гл2//2 => => g = exp(-TT2m2Z//2). Однако, зная, что решениями линейных обыкновенных дифференци- альных уравнений бывают экспоненты с вещественными или комплекс- ными показателями, можно сразу искать решение в виде Т- еоге^, что даст тот же ответ Tm(x,0 = ехр( * ™ *) cos(7rmx//). т = 0,1,2,.... Принцип суперпозиции позволяет здесь действовать в точности так же, как при решении системы линейных обыкновенных дифференциальных уравнений, — искать общее решение в виде суммы частных оо T(x,t)= (11) m=0 7о(х) = 5? GnTmfz.O) = У2 cmcos(irmx/l). (12) m=0 m=0 В последнем равенстве учтено, что Тт(х,0) при t = 0 совпадает с cos(rmx/f). Однако последнее равенство представляет собой разложе- ние функции То(х) по системе функций {cos(xmx//)}. Ст здесь вы- ступают как коэффициенты Фурье Чтобы найти их, будем домножать равенство (12) на cos(irnx/l) и интегрировать по х от 0 до /. Учтем, что i cos(irmx//) cos(7rnx//)dx = О, о при т / п; I l I (л I / 2/ /lx j / 1 + cos(2xmx//) J dx = /, J cos (irmxfi)dx — J -------------—dx — 1/2 0 0 о 27
Следовательно i I Co^ J T0(x)dx/l, Cn(r) = 2 j To(x)cos(irnx/l)dx/l. (13) 0 0 Это позволяет записать общее решение в виде T(x,t) = ^2 Cm exp(--jr2m2f//2) cos(%mx//). (14) m=0 Учитывая формулы (3), последнее выражение можно переписать в виде । T(x.t) = J ф,(,1)Т0(М (15) О где = У2 а(,п) cos(irm4//) cos(irnir//) ехр( —ir2m2t//2). т = 0 Здесь Of(m) = 1// при т 0, а(т) — 2// при m = О Функцию G(z,£,t) часто называют функцией Грина или функцией влияния. Структура решения, аналогичная (15), характерна для большинства линейных за- дач математической физики. Их анализ связан с нахождением функции Грина и последующим интегрированием. 7. Существование множества методов, ориентированных на линейные уравнения. Пример 1. Обобщенные функции. Чтобы проиллюстрировать это обстоятельство, рассмотрим одну из наиболее изящных конструк- ций математической физики, связанную с построением так называемых обобщенных функций. Рассмотрим обсуждавшееся выше решение уравнения теплопровод- ности с начальными данными 7о(х) вида Тс(х) = | при zq < х < z0 + с, Tt(x) = 0 в остальных точках. Начальная энергия Е, кото- рую при этом сообщают стержню, будет одной и той же независимо от £ Г X о + с Е = jTt(x)dx = J -dx = 1. О х0 Предельная функция Тс(х) при £ —* 0 не принадлежит к классу непрерывных функций. Эта функция должна была бы быть равной бесконечности в точке х, нулю в остальных точках отрезка, а интеграл от нее должен был бы быть равен единице. Для непрерывных функций это невозможно. Вместе с тем эта предельная функция описывает вполне реальную физическую ситуацию, когда был нагрет очень малый участок стержня 28
в окрестности точки х. При этом стержню была сообщена единичная энергия. Естественно предположить, что формула (15) должна давать разум- ный результат и в этом предельном случае. Убедимся в этом и покажем, что I limI= G(x,x0,t). О В самом деле, (7(rt i) — непрерывная функция своих аргументов. По- этому для сколь угодно малого числа Д найдется с. такое, что | G(x,t,t) - G(x,x0,t) |< А, если | zq - £ |< £, Для всех значений х и t. Следовательно I J G(x, (, t)Tc(()d(-G(x.x0,t) О = J [G(z,f,O-G(r,zo.<)]|^ I I Здесь мы учли, что f G(z, zo, t)Tt(()d£ = G(z, zo, t), так как f Tc(()d£ = о 0 1, а также то, что функция 7Ь(с) отлична от нуля только на интервале (хо»*о + е). Это показывает, что саму функцию Грина G(z,(,t) можно интер- претировать как распределение температур, когда начальные данные определялись пределом Те(() при € —► 0. Этот предел называют дельта- функций Дирака 6(х — (). По определению для любой непрерывной функции 9?(z) J 6(x)<f>(x)dx = («.у?) = р(0) Здесь символ (5, р) обозначает число у>(0) — значение функционала 6 на функции Для того, чтобы можно было определить операцию дифференци- рования обобщенных функций, функции у>(х) должны быть гладкими и определенными в ограниченной части пространства. В самом деле, если бы р(г) была гладкой функцией, равной нулю вне ограниченной области G с границей Г, то J g'(x)<p(x)dx = g(x)g>(x) |г - У д(х)>р (x)dx. G G Но д(х)<р(х) |г= 0. Поэтому естественно определить («',¥>) = («,¥>') = /(0). 29
Таким образом 6 (х) — функционал, который сопоставляет непрерыв- ной дифференцируемой функции ее производную в точке 0 - уэ'(О). ’’Хорошие” функции ^>(х) считают принадлежащими пространству основных функций D. Пространству D принадлежат бесконечно диф- ференцируемые функции, которые отличны от нуля только в конечной области. Существование таких функций само по себе совершенно не очевидно Примером ненулевой основной функции является "шапочка” шг(х) = \ с * I 1 I — £> I 0, |х|>£. Читатель может проверить, что она действительно принадлежит к бес- конечно дифференцируемым функциям. С ее помощью можно постро- ить множество других функций из D. Это позволяет ввести следующее определение обобщенной функции /. Обобщенная функция f это линейный непрерывный функционал на D, т е каждой функции у? 6 D функция f сопоставляет некоторое число (/, Этот функционал линеен (/, А<р + pV) - MJ, V>) + Р(/. V1). (где Аир — числа; ф 6 D) и непрерывен —оо, если (pt Jt —► оо в D. Здесь р 6 D. Считается что функции рд стремятся к у?, если не только | ^t(x) - у>(х) |—► 0 при k —* оо, но и все их производные для тех точек, где функции ^jt(x) отличны от нуля, стремятся к пределу, равному соответствующей производной функции ¥>(*) Основы теории обобщенных функций были заложены С. Л. Соболе- вым и Л. Шварцем. Этот подход позволил обобщить само понятие ре- шения Пусть Lu = f(x). Обобщенным решением этого уравнения в области G называется обоб- щенная функция и, удовлетворяющая равенству (Lu,<p) = (/,¥>), (16) для любой основной функции <р из D, отличной от нуля в области G. Общая схема здесь остается в точности такой же, как в рассмотрен- ном ранее примере с уравнением теплопроводности. Вначале ищется G(x) — решение уравнения LG = 6(x). Затем функцию / представляют в виде "суммы дельта-функций” /(X) = J 30
И далее, исходя из принципа суперпозиции, выписывают решение « = j fttMx - ем Приведем несколько примеров Пример 1: Задача Коши для уравнения теплопроводности. Tt = а?Тхх 4- f(x J), -оо < х < оо, (17) T(z,0) = О, Gt = a2Gxx 4- 6(х,£), G(x,l) = ^Lzp(-r2/(4a20), где 0(0 = 0 при t < 0, 0(0 = 1 при t > 0. Здесь 6(х, 0 = 6(х) • 6(0 r(z,t)= J Jf(er)G(x-et-r)didr. -со О П р и м е р 2. Задача Коши для волнового уравнения. utt — = /(*iOi —о° < х < °°> u(x,0) = 0, u((z,0) = 0 (18) Здесь Gtt - a2Gxx = 6(z, 0; G = O(at— | x |)/2a, u(x,t)=J JG(x-et-r)f(er)d^dr. -co 0 ПримерЗ Уравнение Пуассона в трехмерном простран- стве. Ди = /(г), 0 <| г |< оо, (19) Ди = 4(г), G(r) = -^, u = J G(|r-i |)/((W. Таким образом введение дельта-функции позволяет находить функ- цию Грина для линейных задач математической физики. Если эта функция известна, то решение неоднородных уравнений в частных про- изводных сводится к обычному интегрированию. Кроме этого во многих случаях в отдельных областях решение как линейных, так и нелиней- ных уравнений может не иметь достаточного количества производных. 31
В этом случае появляется возможность рассматривать обобщенные ре- шения, для которых выполнено равенство (16). Вычисление функций Грина.3 Обсудим вопрос, как найти функции Грина для выписанных задач математической физики. Основная идея здесь состоит в использовании прямого, а затем обратного преобразования Фурье. Покажем, как это можно сделать, используя обобщенные функции. Преобразование Фурье основной функции определяется соотношени- ем ГМ = £({) = У <p(x)e'(Idx Поскольку функция и ее производные обращаются в нуль при не- котором z > Ъ и х < а, интегрирование по частям позволяет найти Фурье-образ производной 3 д^от) да<е(х) дха ОО оо J дад^ei(Idz = '= (-и)О / ^хУ(Чх = -ОО -00 (20) В последних равенствах мы а раз проинтегрировали по частям и вос- пользовались обращением в нуль подстановок в бесконечных пределах. Из теории преобразования Фурье следует, что обратное преобразо- вание определяется формулой оо ?(*) = F-:(^(f)) = J — СО Пользуясь последним соотношением, нетрудно проверить равенства ОО p(r) = F-‘(F(p)) = F(F-l№), F-1(№))=^ = -OO - oo oo = “ / =±; I = ^Fip(-(). (21) Zir J 21Г J Z7T oo —oo В последней цепочке равенств мы сделали замену переменных в ин- теграле f —* -f 3Пря первом знакомстве с курсом этот материал может быть опущен. Студентам физикам и математикам, приступающим к изучению нелинейной науки, он поможет вспомнить традиционные подходы "линейной" математической физики. 32
Введем теперь Фурье-преобразование обобщенной функции /. Рас- смотрим функционал где F(f) — преобразование Фурье функции fа у? — одна из основных функций. Если оы функция f была ’’хорошей” и были бы выполне- ны условия теоремы об изменении порядка интегрирования в кратном интеграле, то была бы справедлива цепочка равенств J F(/({)Mf)df = IJ (ptf)df = = j f(x) j 4>(£)e'(ld£ dz = J f(z)F(ip(z))dx. Таким образом (F(/),^) = (/,F(v)). (22) Последнее равенство мы и будем считать определением преобразования Фурье F(f) обобщенной функции /. Обратное преобразование Фурье введем, исходя из равенства (21), F-W)) = (23) Найдем, к примеру, преобразование дельта-функции (F(«(x - zo)), Ч>) = № - zo), F(p» = FMz0)) = I = = (e,Io(, у,) => F(f(x - r0)) = е,Хо( Положив хо = 0, убедимся, что F(6(x)) = 1 Следовательно 6(х) = F-1(l). Учитывая формулу (23), получим 6(z) = F-i(1)=-!-F(1). Поэтому К(1) = 2ж«(х) Проинтегрируем функцию 6(1) по времени: (24) ОО У 6(r)dr = е(«), -оо где 0(t) = 0 при —оо < t < 0, и 0(t) = 1 при t > 0 Следователь- но зависимость 0(t) представляет собой функцию Хевисайда Другими 33
словами, 0(t) является решением обыкновенного дифференциального уравнения 57 = W). и(—оо) = О al или функцией Грина для уравнения = => v(l) = У 6(1 - r)f(r)dr. -оо Точно так же можно убедиться, что функция IV(t) = 0(t)e“e< является функцией Грина для уравнения dx dW — +az = /(!), — + aW = 4(1). (25) at at Полученные соотношения позволяют получить функцию Грина для уравнения теплопроводности. Возьмем Фурье-образ F от обеих частей равенства Gt — g.2GXx + 6(z,i), имея в виду пространственную координату х. В соответствии с формулой (20) F(a2G„) = -a2f2G(f). F[4(x, I)] = F[4(z) 6(t)] = 1 6(t). Итак, для Фурье-образа функции G — функции мы имеем обыкновенное дифференциальное уравнение ?2+a^G = 6(t). ut Однако последнее уравнение по виду совпадает с (25), поэтому его ре- шение определяется формулой С(С0 = е(1)е-а’«,‘. Сделаем обратное преобразование Фурье оо оо -OO —oo 2x J 2*a>/i J 2аУй7 34
оо В последнем равенстве мы воспользовались тем, что I = f е~2 dz — ОО 00 J 00 по у/тг В самом деле, /2 = f e~z dz f e~y dy = f f e~* dzdy Пе- — OO —00 —DO—OO реходя в полярную систему координат: z = г cosip, у = rsin^, z2 4- у2 = г2, dzdy => rdrdfp, получим оо 2* J J e~r rdrd<p = о о о Аналогичным образом находятся функции Грина и для остальных задач Было бы заманчиво пойти дальше и определить произведение обоб- щенных функций. (Естественно так, чтобы оно было ассоциативно и коммутативно ) Именно это было бы очень важно для решения нели- нейных задач. Л, Шварцем было показано, что, к сожалению, по этому пути продвинуться не удается; это можно проиллюстрировать следую- щим примером. Введем обобщенную функцию, называемую главным значением ин- теграла от X zP| = 1л поскольку = J ¥>(*)<** - (1» ¥>)• Кроме того a(z)6(z) = a(0)6(z) Действительно (аб, у>) = (6, ау?) = а(О)у?(О) = (а(0)<5, у?). Бели бы можно было определить умножение обобщенных функций, то имели бы место равенства О = opi = (х6(х))Р (= (6(х)х)Р- = 6(х) ( хР- | = «(г), Z \ Z / Z \ X) которые и приводят к противоречию. Именно это обстоятельство су- жает сферу приложений теории обобщенных функций. Этот замеча- тельный подход оказывается ориентированным в основном на линейные задачи. Такая ситуация является общей и для многих других аналити- ческих подходов. 35
Вопросы и задачи 1. Построить математическую модель, позволяющую предсказывать интенсивность излучения, испускаемого радиоактивными веще- ствами, находящимися в некотором хранилище. Считать, что на- чальные количества всех веществ, периоды их полураспада и за- кон, по которому они с течением времени поступают на склад, известны. 2. Маятник совершает малые колебания. Найти закон движения ма- ятника, считая, что на него действует внешняя сила по закону Asinwi. Как изменится этот результат, если учесть малое тре- ние, пропорциональное скорости маятника? 3. Каков закон движения маятника, на который действует периоди- ческая вынуждающая сила? 4. Каков закон движения маятника, на который действует сила ме- няющаяся со временем по заданному закону? 5. Как меняется со временем температура холодного вначале тепло- изолированного на концах стержня? Считать известным закон, по которому этот стержень нагревают /(z,t). 6. На концах теплоизолированного первоначально холодного стерж- ня температура меняется по закону L(t) и Как меняется рас- пределение температуры стержня со временем? 7. Момент импульса произвольного твердого тела L = (Lx, Lz) и его угловая скорость w = (wx,wy,wx) связаны соотношением L = Iw, где I — тензор инерции 7хх ^ху /у г 1уу Лх Цу Матрица I симметрична /ху = /ух, 1х, 7/г I Ity — Iyi‘ Сколько существует осей, при вращении вокруг которых L и w направлены в одну сторону? Что можно сказать о взаимном рас- положении этих осей? 8. Рассмотрим сферу единичного радиуса с центром в начале коор- динат в n-мерном евклидовом пространстве. На векторы, идущие из начала координат в точки сферы подействуем линейным опе- ратором А. Во что перейдет сфера? Что произойдет после мно- гократного применения оператора А? Как можно использовать это для численного решения задачи на собственные значения для оператора А? 9. Показать, что с помощью поворота систем координат и сдвига, кривую второго порядка ах2 4- Ьху 4- су2 4- dx 4- су + f = 0 можно привести к каноническому виду jy 4- = 1 (эллипс) Jy — = 1 36
(гипербола) у — Сх2 (порабола) Можно ли линейное уравнение второго порядка с постоянными коэффициентами аихх + 6иху 4 cuyy 4 dux + euy 4- f = 0 с помощью замен независимых переменных привести к каноническому виду uxx+uyy = 0 (уравнение Лапласа), ux = иуу (уравнение теплопроводности), uxx - uyy = 0 (уравнение колебаний струны)? 10. Процессы в некоторой среде описываются уравнением и д2и д2и 2" + (С* + С^дхд1 + С1С25х2 - °' Каковы решения этого уравнения? Какие физические явления, на Ваш взгляд, можно было бы моделировать с его помощью7 11. Найдите общее решение линейного разностного уравнения zn+k + aizn+Jt_] + • + акхп =0, л = 1,2,3, • • • Как Вы бы поставили для этого уравнения задачу Коши? Рекомендуемая литература Методы исследования линейных математических моделей подробно обсу- ждаются в основных курсах линейной алгебры, обыкновенных дифференци- альных уравнений, математической физики. Например, в следующих: Гант- матер Ф.Р. Теория матриц М.: Наука, 1988; Тихонов А.Н., Васильева А Б.. Свешников А.Г. Дифференциальные уравнения М.: Наука, 1980; Арнольд ВИ Обыкновенные дифференциальные уравнения. М.: Наука, 1971; Пон- трягин Л. С Обыкновенные дифференциальные уравнения. М.: Наука, 1974; Тихонов А.Н., Самарский А.А. Уравнения математической физики. М.г На- ука, 1972; Свешников А.Г., Боголюбов А.Н., Кравцов В.В. Лекции по матема тической физике. М.: Изд-во МГУ, 1993; Курант Р. Уравнения с частными производными. М.: Мир, 1964. Обобщенные функции подробно рассматриваются в книгах: Владимиров В.С. Уравнения математической физики. М.: Наука, 1976; Владимиров В.С. Обобщенные функции. М.: Наука, 1985. О принципиальной роли линейных математических моделей можно су- дить, просмотрев тома курса теоретической физики Ландау Л.Д., Лившица Е.М. "Теория поля", "Квантовая механика. Нерелятивистская теория", "Те- ория упругости”.
Escher M.C. Double Planetoid. 1949 Эшер MK. Двойной планетоид
ГЛАВА 3 ПРОСТЕЙШИЕ НЕЛИНЕЙНЫЕ МОДЕЛИ Всякое человеческое познание на- чинает с созерцания, переходит от него к понятиям и заканчивает идеями И. Кант Математическим моделированием нелинейных явлений с помощью дифференциальных уравнений ученые занимаются уже более трехсот лет, поэтому было предложено несколько альтернативных подходов. Их удобно проиллюстрировать на примере простейших моделей. Мы об- судим несколько упрощенных, стилизованных схем анализа, которые позволят лучше представить возможности каждого подхода. Математический маятник Рассмотрим задачу о математическом маятнике. Пусть нам дана система, представленная на рисунке 1. При моделировании приходится, неизбежно, делать различные допущения. Предположим, что размеры груза пренебрежимо малы, и можно считать его материальной точкой массы т. Нить будем полагать невесомой. Кроме того предположим, что маятник при движении не испытывает сопротивления воздуха. Рис. 1. Подход физика-теоретика. Воспользуемся вторым законом Ньютона mr = F. Спроектируем векторы, стоящие в правой и левой части равенства, на направление, перпендикулярное нити (см. рис. 1). Получим mbp + mg sin = 0. (1) 39
Это равенство можно записать и по-другому, учитывая, что эта си- стема консервативна и полная энергия Е в ней сохраняется. Кине- тическая энергия при этом равна t потенциальная — mght где Л = /(1 — cosy?) — высота, на которой находится материальная точка. Следовательно 4- mgtfl — cosy?) = Е. (2) Продифференцировав это равенство по времени и сократив на ф, вновь получим уравнение движения (1). Естественно оценить амплитуду ма- лых колебаний, когда начальный угол у>о, а следовательно и размах колебаний, малы. При этом можно считать, что sin^ ~ Тогда мы приходим к линейному уравнению £+у*> = 0 (3) Следовательно, частота малых колебаний wq = \/дЩ их период Т — 2^\/Цд, а колебания являются гармоническими у>(0 = у>0 cos(w0t). Это очень распространенный подход. Область явлений в физике, ко- торую удалось описать с помощью линейных уравнений, и в частности уравнения (3), огромна. Подход физика. Представим специалиста, знакомого с арсеналом современной физи- ки, однако по странной случайности не успевшего овладеть дифферен- циальными уравнениями и не слышавшего о математическом маятнике. Как он подойдет к этой проблеме? Изучаемая физическая система зависит от трех величин: массы ма- ятника, характерного линейного размера и ускорения силы тяжести. Размерность первой величины килограммы [М], второй — метры [L], третьей — м/сек2 [ЛТ-2]. Символы в квадратных скобках показывают, как соотносятся данные величины с единицами массы, длины, времени. Эти обозначения являются общепринятыми в теории подобия и размер- ности. Период колебаний маятника в этом пункте обозначим через т. Предположим, что период колебаний т, измеряемый в сек [Т], является степенной функцией от всех параметров задачи г -* Ста1^ду. Будем считать, что С — безразмерный коэффициент, и приравняем размерно- сти правой и левой части [Г] = [Л/]“[£]'’[£Т-2р. Это эквивалентно системе уравнений 1 - -21, о = 0; 0 4- 7 = О Откуда 0 = 1/2, 7 = -1/2 иг-* \/Цд. Таким образом, пользуясь самыми общими представлениями, мы получили верную зависимость. 40
Комме н т а р и й. Описанная схема, отражающая основную идею метода подобия и размерности, обычно очень широко использует- ся на начальном этапе анализа многих нелинейных явлений. Предполо- жение о степенном характере зависимостей оказывается оправданным для очень многих задач нелинейной механики Одной из наиболее красивых и важных задач, решенных с помощью этого метода, является задача о сильном взрыве. Предположим, что на поверхности происходит взрыв, в результате которого выделяется энер- гия Е. Будем считать, что взрыв производится в атмосфере с плотно- стью р. Известно, что при этом возникает ударная волна. Выясним, как зависит скорость ударной волны от времени. Пусть координата волны равна r(Z) [Е] = ML2T~2, [p] = ML~3, [г] = L, [t] = Т Приравняв соответствующие показатели степеней, получим г = С I2'* -3/5 Эта задача была детально проанализирована академиком Л.И. Се- довым в 1945 году. Полученная зависимость прекрасно подтвердилась опытными данными, полученными при ядерных испытаниях в Нью- Мексико в том же году. Судя по воспоминаниям очевидцев, Энрико Ферми во время первого ядерного испытания, чтобы определить силу взрыва, бросал бумажки и смотрел, на какие расстояния их относит. По-видимому, он также пользовался соображениями подобия и размер- ности. Полученная таким образом оценка Е оказалась очень близка к истинной величине энергии взрыва. Подход экспериментатора. Даже небольшая серия опытов позволит обнаружить, что период колебаний Т не зависит от массы т, и пропорционален №2 и д~х^2 Кроме того можно будет установить коэффициент пропорциональности Однако эксперимент лает возможность обнаружить еще одну важ- ную особенность С его помощью можно выяснить, как зависит период колебаний от энергии. Зависимость будет следующей. Существует та- кое значение энергии Eq, что при Е —* Eq, Т —> оо. Когда Е < Eq, то энергию можно выразить через начальное отклонение от положения равновесия Е ~ mgl(\ - cos^?o) = 2mg/sin2(y>o/2) Для графика 7' = Т(Е) характерен очень пологий начальный уча- сток (см рис 2, верхняя кривая) Поэтому Галилей считал, что мате- матический маятник обладает свойством изохронности, - его период колебаний не зависит от начального отклонения. Гюйгенс, эксперимен- тально изучавший эту систему, в книге, изданной в 1673 году отметил, что изохронность заметно нарушается при ^>0 ~ 60°, а для <pQ - 90° отношение периода к периоду малых колебаний уже равно 34/29 Особенность при Е = Eq связана с тем, что маятник при этой энер- гии либо находится в верхнем положении равновесия, либо в течение бесконечного времени стремится к этому положению Когда Е > Eq, маятник начинает вращаться вокруг точки подвеса 41
Рис. 2. Зависимость периода колебаний математического маятника от угла начального отклонения «ро- Кривая 1 соответствует предсказаниям линейной теории, кривая 2 — ангармоническому осциллятору (6) и закону (9), кривая 3 соответствует выражению (11), зависимость 4 описывает экспериментальные данные и точное решение уравнения (1) Поэтому с точки зрения экспериментатора успех в математическом моделировании маятника определяется тем, насколько точно удается предсказать зависимость Т = Т(Е), или, что то же самое, Т(р0). Математик XVII века. Проинтегрируем это уравнение. Его можно переписать в виде у>2 = 2wJ cos <р + С, (4) wg = д/l, С = (2Ет~Ч~2 - 2дГ1). Следовательно период колебаний маятника равен Vo Vo _______dy> _ 4 Г____dip_____ (2wq cos ip + С)1/2________________________(2wq)*/2 J (cos <p — cos у?о)'^2 0 0 <десь мы учли следствие уравнения (4). При ф = 0, = и поэтому >s у?о = -C/(2wjJ) Интеграл (5) и является решением. Дифференци- альное уравнение интегрируется е квадратурах Однако вычислить интеграл с помощью элементарных функций не удается. Формально ответ получен, однако извлечь из него конкретную информацию и, в частности, зависимость, представленную на рисунке 2, оказывается не просто. Математик XVIII века. Рассмотрим начальный участок зависимости Т = Т(Е). Будем счи- тать, что амплитуда колебаний маятника настолько велика, что при- ближение sinp ~ уже не удовлетворительно Учтем второй член в 42
разложении этой функции в ряд Тейлора 1 з sin^> = у? - -у? + . .. о Это даст уравнение движения = ° и Уравнение (6) уже не будет описывать гармонические колебания, поэтому систему, которую оно описывает, в литературе часто называют ангармоническим осциллятором. Будем искать приближенное решение уравнения (6) в виде <р = (pQ sin wt 4- €<ро sin 3wt. (7) Появление второго члена связано с тем, что при возведении первого в куб ч 3 . 1 . п sin wt = - sin wt — - sin 3wi, 4 4 возникнет член, описывающий колебания с утроенной частотой, или, как иногда говорят, третью гармонику. Естественно при возведении в куб выражения (7) появится девятая гармоника c3 4sin9wf Однако считая, что € мало, и существенны только первые члены ряда, этими членами будем пренебрегать После подстановки вида (7) в уравнение (6) получим <р = — w2<pq sin wt — 9w2e<pq sin 3u4, w%tp = WqV>o sin wt + sin 3wZ, 1 •) я 1 9 4 =-£wo¥?o b b 3 Зе Зе2\ . 4 + T + T)sinwl + /1 3e Зе3 \ . _ C4 + T + ~)s,n3wt+ 3e2\ . 3c2 — 1 sin 5wt +------sin Iwt 4 ) 4 (8) Сумма левых частей, исходя из уравнения (6), должна быть равна ну- лю. Правая часть также должна быть, насколько это возможно, близка к нулю. Идеально было бы потребовать, чтобы сумма коэффициен- тов при sinwt, как и при sin3wt, sin Suf и sin7wt, была равна нулю. Однако это невозможно (иначе возникла бы переопределенная систе- ма алгебраических уравнений) Обусловлено это тем, что в формуле (7) мы ограничились только двумя членами. Поэтому воспользуемся стандартным приемом, часто применяемом при построении асимптоти- ческих решений, — учтем только наиболее важные члены, в которые малый параметр е входит в минимальной степени, а также будем пре- небрегать более высокими гармониками. Исходя из последнего требо- вания, отбросим все члены, в которые входят sin bwt и sin 7wt В скобке перед sinwf и перед sin 3wt учтем только члены, в которые не входит 43
€. Таким образом, остается только два члена, подчеркнутые в формуле :») Собирая члены при sinwi, получим q -w2 + w2 - — = 0. 24 Следовательно W2 - Wq ( 1 - ) - W ~ U/Q (] - ^>q/16) \ о / Здесь мы использовали формулу yi + р » 1 4-р/2, где д <С 1 Прирав- нивая члены при sin3wt, получим W2 -9.W2£ + Wgt + = °- Положив w cr wo, из последнего равенства получим с = ^/192. Таким образом учет первого нелинейного члена в sin у? дает sin wt + (^o sin 3wi/192, w ~ wq(1 — y>o/16), Тг2я(1 + ^2/16)/и;0. (9) Из формулы (9) ясно, почему колебания даже при довольно больших углах оказываются близки к гармоническим. Это обусловлено тем, что коэффициент (/?о/192 мал. Конечно, формула (9) дает представление о части кривой Т = Т(Е), однако она не дает возможности проанализи ровать, что будет при энергиях близких к Eq. Зависимость (9) показана на рисунке 2. На нем нижняя горизон- тальная прямая соответствует линейной задаче, второй график — за- висимости (9). Комментарий. В конце XVIII века после работ П.С. Ла- пласа асимптотические методы стали основным инструментом анализа многих математических моделей и, в частности, моделей небесной ме- ханики. Поскольку было известно решение задачи двух тел, а массы всех остальных небесных тел в Солнечной системе несравненно меньше массы Солнца, их влияние на движение данной планеты можно считать малым возмущением и пользоваться асимптотическими методами. Уве- ренность в том, что поняты основные законы природы и построен эф- фективный математический аппарат была очень велика. В частности, Лаплас отвечал Наполеону, интересовавшемуся математикой и прочи- тавшему его книгу по небесной механике, что не нуждается в гипотезе о творце - вседержателе. И действительно, на этом пути были достигну ты выдающиеся успехи в моделировании нелинейных явлений, — были предсказаны новые планеты Уран и Плутон. В XX веке возможности использовать асимптотические методы для анализа нелинейных мате- матических моделей стали неизмеримо больше. Однако вместе с этим 44
пришло понимание того, насколько ограниченной является область при- менения этих методов, среди множества всех нелинейных ^моделей, ко- торые необходимо исследовать. Математик XIX века. Успех в исследовании множества математических моделей связан с тем, что у нас есть такие специальные функции sin z, cosx, ехрх. Эти функции можно рассматривать как решения некоторых дифференци- альных уравнений. Кроме того можно считать, что эти функции возни- кают при интегрировании определенных выражений Расширим множе- ство уравнений и интегралов и попробуем ввести на этой основе новые специальные функции По этому пути шли Эрмит, Бессель, Якоби, Лягер, Матье и другие выдающиеся математики. На этом пути были введены эллиптические функции и, в частности, эллиптический интеграл первого рода ж/2 /(Л) = / {1 - № sin ^),/Г (10) О Читатель может проверить, что замена переменных sin ip — sin(y?/2)/ sin(y?o/2) приводит интеграл (5) к виду (10). Из теории эллиптических функций известно разложение этого интеграла в ряд по степеням К Г dip _ v J (1 - К2 sin2 V0T/2 = 2 о {оо п = 1 1 • 3 • 5 • • (2п - 1) 2-4-6-.. (2п) К2п Учитывая несколько первых членов, получим T = + + ] (1|) Эта формула позволяет предсказать несколько больший участок зави- симости Т = Т(<р0) (см. рис. 2, кривая 3). Кроме того существуют таблицы эллиптических функций и, пользуясь ими, можно получить всю зависимость Т = Т(Е) Комментарий. В XIX веке и в первой трети XX века те- ория специальных функций рассматривалась как один из важнейших разделов прикладной математики. К сожалению, многие надежды, воз- лагавшиеся на этот математический аппарат, оказались в большой сте- пени неоправданными. Дело в том, что во многих случаях составление таблиц специальных функций требует большого объема вычислений и применения численных методов. Кроме того, в отличие от экспоненты и тригонометрических функций, область применимости каждой из более сложных специальных функций значительно меньше Из этого обсуждения ясно, что даже при изучении этой простейшей модели, естественно воспользоваться численными методами, которые стали очень широко применяться к исследованию нелинейных явлений в XX веке. Движение планеты вокруг массивной звезды. В качестве второго примера рассмотрим одну из первых и наиболее важных математических моделей, возникшую в небесной механике 45
Книга И. Ньютона ’’Математические начала натуральной филосо- фии” сделала обыкновенные дифференциальные уравнения на несколь- ко веков основным классом математических моделей естествознания. Сам И. Ньютон в полной мере осознавал эффективность созданного им инструмента. Единственным утверждением, которое он счел необходи- мым зашифровать в виде анаграммы, была фраза о том, что полезно изучать дифференциальные уравнения. С помощью этого математиче- ского аппарата была решена задача о движении планеты вокруг звезды. Решение этой задачи произвело огромное впечатление на современни- ков. Остается только удивляться, насколько простым оказывается ре- шение ключевой задачи небесной механики после формулировки фунда- ментальных понятий и законов природы и построения математической модели. И. Ньютон, обобщая опытные данные, сформулировал закон движе- ния тела, размеры которого пренебрежимо малы (материальной точки) ^2 £ = А £(0) = £о’ = (12) Этот закон имеет парадоксальное следствие: в отсутствие силы F = О дифференциальное уравнение (12) имеет решение x(t) = хо + vot- Тело движется равномерно и прямолинейно неограничено долго. Это, на пер- вый взгляд, противоречит обыденному опыту. Такое следствие не со- гласуется с предшествующими взглядами Аристотеля. В соответствии с ними тело движется только если прикладывать силу. В современных обозначениях закон движения в физике Аристотеля имеет вид dx - т — = F, х(0) = z0 at при F(0) — 0, г(<) = хо = const. Обратим внимание на глубину и содержательность понятий массы, силы и ускорения. Для того, чтобы относиться к закону Ньютона как к содержательному утверждению (а не как к определению силы), необхо- димо иметь принципиальную возможность независимо измерять уско- рение, силу и массу. Это и умеют делать физики. По гипотезе И. Ньютона форма орбиты определяется притяжением планеты к Солнцу Сила такого притяжения в соответствии с законом всемирного тяготения равна F=_G^F, (13) 46
где Me — масса Солнца, тп. — планеты, G — гравитационная постоян- ная (коэффициент, устанавливаемый экспериментально), г— радиус- вектор, соединяющий Солнце и планету (см.рис. 3), г — длина этого вектора. Знак минус говорит о том, что тела притягиваются друг к ДРУгу. Будем считать, что Me т, и что движение планеты никак не влияет на звезду. Поэтому последнюю можно считать неподвижной. Соотношения (12) и (13) вместе с определением скорости и начальными условиями и дает математическую модель dv аг dt = "Р’ где о = GMc, —- = V, х(0) — хо» v(0) = й0. (14) dt Спроектировав вектора на оси декартовой системы координат (см рис 3) г = (г, у, z), v = (vr, vy., vz), можно записать уравнение (14) в скаляр- ном виде dvx ax dvy ay dvx az ~dt = ~ 7^ ’ ~dt ”7^’ (15) dx dy dz dt = Vz' dt=vv' di — z(0) = io. 1/(0) = l/o, z(0) = zo, vt(0) = v°, vy(0) = v°, v,(0) = vt° Эту автономную систему шести обыкновенных дифференциальных урав- нений можно анализировать по-разному. Можно воспользоваться чи- сленными методами Можно непосредственно решить эти уравнения, как это делают в теоретической механике. Ситуация, в которой есть несколько способов анализировать модель, является общей. Поэтому мы наметим оба подхода, а затем сравним их достоинства и недостатки. Уточним постановку задачи. Пусть нам нужно узнать положение планеты в момент времени t, если известна ее начальная скорость, по- ложение и коэффициент а. Основная идея состоит в замене производных конечными разностя- ми. Например, будем аппроксимировать производную соотноше- нием x(t + r)-z(t) _ x(t) + ^(t)r + ^^p-x(t) dx rd2x(t') -----г----- ~ ------------г-----------= di + 2 ~dP~’ (16) t < Г < t + г. Здесь мы воспользовались разложением функции т(1 + т) в ряд Тейлора с остаточным членом в форме Лагранжа. Представив (r(<), y(t), z(t)t vx(t), vy(i), vr(t)), в виде вектор-столбца, а соответствующие правые части в виде вектор-функции, получим ^l = F(X(t)). Х(0) = Хо Д17) 47
Эту систему дифференциальных уравнений будем аппроксимировать отображением Х((п + 1)т) -Х(пг) = F(X(nr)), (18) переводящим вектор Х(пг) в вектор Х((п + 1)т). В самом деле, Х((п+ 1)т) = X(nr) + rF(X(nr)). (18') Подход, позволяющий перейти от дифференциального уравнения (17) к отображению (18), получил название метода Эйлера. Представление об этом методе дает рисунок 4а. Непрерывная кри- вая X(t) заменяется набором ломаных. Погрешность такой аппрокси- мации связана с тем, что мы заменяем кривую ОА прямой ОН, а также тем, что на следующем шаге мы вычисляем правую часть не в точке А (F(X(r))), а в точке В (#(>?(0)) + r(F(X(0)))). Рис. 4 Численное решение задачи о движении планеты вокруг массивной звезды: а) погрешность, вносимая при использовании метода Эйлера, связана с тем, что кривая заменяется набором ломаных и производная считается не в той точке; 6) пример численного решения задачи (15) с помощью метода Эйлера. Видно, что эта зависимость близка к части эллипса Эллипс соответствует и точному решению дифференциального уравнения Разность, стоящая слева в выражении (16), стремится к производной если т — 0 и производная остается конечной. Дальнейшая стратегия ясна Интервал [0,7"] разбивается на N ин- тервалов т - T/N. Далее вычисляются итерации отображения (18) Можно ожидать, что если шаг по времени г достаточно мал, го итера- ции отображения и значения функции Х(пт) для исходного уравнения будут близки Типичный результат соответствующего расчета для об- суждаемой задачи показан на рисунке 46 Видно, что представленная 48
последовательность ломаных неплохо аппроксимирует точное решение дифференциального уравнения, являющееся эллипсом. Отображение (18), также как исходное уравнение, описывает детер- минированную систему с конечномерным фазовым пространством. Раз- мерность этого пространства совпадает с числом компонент вектора X. Однако временная координата здесь уже является дискретной вели- чиной. Она может принимать только значения (0, г, 2т, ..). К этому важному и интересному классу объектов мы еще не раз будем возвра- щаться. И системы обыкновенных дифференциальных уравнений (17), в которых время непрерывно, и отображения вида (18), в которых время дискретно, сейчас называют динамическими системами. В методе Эйлера отличие разностной производной ^т((п + 1)т) — z(nr)^/r от имеет порядок О(т). Такие методы называют мето- дами первого порядка. Традиционный путь совершенствования числен- ных методов состоит в том, чтобы аппроксимировать эту производную с более высокой точностью, например O(rN). Такие методы называют методами N-го порядка Это может быть сделано, например, так. Пусть г(<) одна из компонент вектора X i((n + 1)т) - z(nr) r d2x(nr) _ dx(nr) r2 d3z(t*) г 2 dt2 ~ dt 6 dt3 { ’ Допустим, что производную d (второй член в левой части) нам удалось аппроксимировать каким-либо разностным оператором с точно- стью не ниже О(т). Тогда производная , которая нас интересует, будет определяться вторым членом в правой части последнего равен- ства. Приблизить d довольно просто Пользуясь рядом Тейлора и рассуждая так же, как при анализе равенства (16), получим <13х(пт) _ d/(z(nr)) __ /(z((n 4- 1)т)) - /(z(nr)) d2f(x(t")} dt2 dt т + 6 dt2 пт < Г* < (n + l)r. Возвращаясь к равенству (19), получим z((n + l)r) = x(nr) + r/(z(nT)) + ^(/(z(n+l)r)-/(z(nT))) + O(T3). (20) Последнюю формулу нельзя рассматривать как алгоритм решения, потому что в правую часть входит член |(/(г(п + 1)т)), значение ко- торого неизвестно Однако его можно найти с помощью более простого и грубого метода Эйлера Тогда вместо ^(/(г(п + 1)т)) в формуле (20) должен появиться член y(/(z(nr) 4- т/(г(пт)))) Итак, вместо соотно- шения (20) мы получаем приближенное равенство z((n + l)r) = z(nr) + T/(z(nr))+ ^[/(x(nT) + T/(z(nT)))-/(z(nr))) (21) 49
Оно позволяет находить приближенное решение исходного дифферен- циального уравнения. Из формулы (19) следует, что на отрезке (пт, (п+ 1)т) решение будет известно с точностью О(т3). Но для того, чтобы по- считать решение на интервале (О, Т), потребуется Т/т шагов. Читатель может убедиться, что при этом ошибка будет иметь порядок О(т2). Формула (21) становится особенно наглядной, если записать ее в виде двух равенств у((п + 1)г) - i(nr) + т/(х(пт)), z((n + 1)т) = z(nr) + r/(i(nr)) + Т-[/(j/((n + 1)т)) - Дг(пт))]. Первый шаг — получение у((п + 1)т) можно рассматривать как полу- чение грубого прогноза значения х((п + 1)т). Второй шаг — уточнение или коррекция этого прогноза Именно поэтому такие методы называ- ют методами типа "предиктор — корректор" (от английского to predict — предсказать и to correct — исправлять). Обобщение на случай век- тора X и вектор-функции F(X) очевидно. С помощью таких методов был исследован на компьютере ряд важных моделей нелинейной науки. Обратим внимание еще на одну возможность. Дифференциальные уравнения можно записать в виде интегрального уравнения Х(0 = Х(0)+ [ F(X(t))dt. Jo Для его решения можно воспользоваться методом последовательных приближений, т. е. построить последовательность функций {X* } , ко- торая при $ —* оо сходится к решению уравнения (17). Эту последова- тельность можно, например, построить так t XJ+1(0 = Х(0) + / F(X'(t))dt. О Условия сходимости этой последовательности будут обсуждаться да- лее. Для простоты здесь мы предположили, что располагаем методом достаточно точного вычисления интеграла. Комментарий. Последняя формула дает не только способ итерационного построения численного решения, но и ключ к доказа- тельству центрального результата теории обыкновенных дифференци- альных уравнений — теорем существования и единственности. В самом деле, эта формула может быть записана в символическом виде %s+1 = AXS. Точному решению системы дифференциальных уравнений соответ- ствует неподвижная тонка отображения А: X" = АХ", те. такой вектор X*, который отображение А переводит в себя. Иначе говоря, соотношение, выражающее Х5+1 через Xs, определяет итерационный 50
процесс для решения уравнения X* = АХ" методом последовательных приближений. Встает вопрос, когда этот процесс сходится. Оказывается сходимость можно весьма просто доказать для так на- зываемых сжатых отображений Для последних существует постоян- ная А, 0 < А < 1, такая что р(Ах,Ау) < Ар(х,у), где р — метрика в рассматриваемом полном метрическом пространстве. Сжатые отображения имеют единственную неподвижную точку, к которой сходится последовательность z, Ах, А2х, . .. для любой началь- ной точки z. В самом деле р(Апх, Ап + 1х) < Ар(Ап~1 х, Апх) < < Апр(х,Ах). Ряд ^Пх сходится. Очевидно, для любого числа £ можно ука- зать такой номер N, что p(Xnz,Xmz) < £, если т > /V и n > N. В математическом анализе доказывается, что такие последовательности, называемые последовательностями Коши, сходятся. В силу полноты рассматриваемого пространства, они сходятся к элементу X, принадле- жащему этому пространству X = lim Апх п-*оо Точка X является неподвижной, так как АХ = A lim Апх = lim 4n + 1z = X. п—«оо п—*оо Эта точка единственна, поскольку, если допустить существование второй неподвижной точки Y, то возникнет противоречие р(Х, У) = р(АХ, AY) < Ар(Х, У). Поскольку А < 1,р(Х,У) = 0. Очевидно, рассматриваемый итерационный процесс таков, что |lxs+1(<) - Xs(t)| = I [F(Xs(r)) - F(%s-1(r))]dr||. 11 11 1!Л=о II Здесь прямыми скобками || обозначена метрика p(X,Y) = max(|Xi ~ У1|,...,^ -У„|), где X = XN), У = (УЬ...,У*). Допустим, что существует величина L, называемая постоянной Лип- шица, такая, что ||Лу)- F(^||<£||y-i1|. Если для множества векторов /(z5), фигурирующих в итерацион- ном процессе, можно найти постоянную Липшица, то оператор, опреде- ляющий решение дифференциального уравнения, можно превратить в сжатый ||xs+,(T) - XS(T)|| < J* i||xs(i) - Xs- ’ll dr < 51
^£ТоТЛХт11*5(г)’*5‘,(г)11 Для этого достаточно выбрать рассматриваемый промежуток таким, что LT < 1. Уточняя детали, связанные с полнотой пространства непрерывных функций и с выбором множества, для которого существует постоянная Липшица, можно получить теорему Пикара—Линделефа. Пусть 6 RN, функция F(t,X) непрерывна в параллелепипеде R : 0 < t < а,|Х - Хо| < b и удовлетворяет условию Липшица по X. Пусть М является верхней границей для |F(Z, Х)| на R. и Т = min(a,6/A/). Тогда задача Коши X = F(t,X)t Х(0) = Хо имеет на отрезке [0, 7] единственное решение X = X(t). Перейдем к аналитическому решению системы уравнений (15) Эти уравнения справедливы в любой неподвижной декартовой системе коор- динат. Дабы упростить дальнейший анализ, выберем эту систему так, чтобы z(0) = 0,vr(0) = О. Но тогда из третьего уравнения следует, что и — 0, поэтому движение будет происходить в плоскости (х, у). Это движение будет описываться четырьмя уравнениями первого порядка, которые можно привести к виду ах ау 1 = У="?з- Перейдем в полярную систему координат, сделав замену переменных х = г cos р, у = г sin р, и учтем, что х = г cos р — гф sin у = г sin + rp cos р, х = г cos р — 2rp sin p — rp2 cos p - rp sin p, у = r sin p 4- 2rp cos p - rp2 sin p + rp cos p. Это позволит переписать изучаемые уравнения в виде л. . ... .э а Г COS Р — 2rp Sin Р — rp Sin Р — rp COS Р =-2 COS pl ... .2 Of г sin р + 2г(^ cos-^> 4- rp sin p - rp sin p = sin p. Домножив первое уравнение на - sin р, второе — на cosy? и сложив, получим 2гр + гр = 0. После домножения на г это выражение можно проинтегрировать 2ггр 4- г2р = 0 => -т-(г2¥?) = 0 => г2 р = const (23) at 52
Смысл этого равенства понятен из рисунка 3, на нем показаны радиус- векторы планеты в момент времени t и t + dt. Площадь, описываемая радиус-вектором за время dt, равна с точностью до бесконечно малых более высокого порядка |г2Ду>. Из полученного равенства следует вто- рой закон Кеплера: радиус-вектор планеты описывает равные площа- ди за равные промежутки времени Эта же величина пропорциональна векторному произведению [rxv] или М = [гхр], где р= mv — импульс. Величина М называется моментом импульса. Из сделанных выкладок следует, что он сохраняется при действии любой центральной силы Домножив первое уравнение на cosy?, второе на siny>, имеем . 2 “ Г - rip = г* Выражая ф через момент ф - М/(тг2), и подставляя в последнюю формулу, получим М2 а т2г3 г2 d (т, 1 М2 тГ ~ “ Т ( U + О-----2 dr \ 2 тпг2 где функция U — — —dU/dr) называется потенциалом. До- множим последнее выражение на г и учтем, что тгг = ^(|тг2) и 27й(г) = ^г, где д — любая функция г. Отсюда получим d f 1 1 М2 ,,\ п □7 ( ~тг + о—? + t/) = ° at \ 2, 2 mr* I (24) Следовательно, величина в скобках, называемая полной энергией си- стемы Е, будет постоянна. Последнее равенство можно было записать в самом начале, если вос- пользоваться законом сохранения энергии и учесть, что потенциальная энергия равна U(r), а кинетическая |т(г2 + г2у>2). Выражение в скоб- ках представляет собой полную скорость планеты. Величина г — со- ставляющая вдоль радиус вектора, гф — ортогональная состовляющая (см. рис. 3). Выражение для квадрата этой скорости следует из теоре- мы Пифагора. Из равенства (24) следует, что ,2r2' dr r=dt После разделения переменных это выражение можно проинтегриро- вать t - t0 = dr (25) Форму орбиты можно найти, используя равенство (23), в виде , М , dp = ---?dt тг' 53
Следовательно (26) ¥? - <Ро Учитывая, что U = - *, получим где z = М/г — хпа/М. т2а2 Л?2 В итоге М/г - тпа/М = arccos т 4- const. (27) Выбрав начало отсчета так, чтобы константа была равной нулю, полу- чим уравнение орбиты р/г = 1 + е cos ip, где р = М2/та, е = \/1 4- 2еМ2/тпа2. Из аналитической геометрии известно, что при е < 1, (Е < 0) это урав- нение элипса с полуосями а = р/(1 —е2) и b = р/(I -е2)1^2. Зависимость координаты от времени дается интегралом (25), либо более изящным, но тем не менее неявным выражением. Сопоставим оба обсуждавшихся подхода, имея в виду приведенные примеры. Достоинством стратегии, связанной с применением численных мето- дов, является ее простота. Несложный алгоритм, который нетрудно запрограммировать, в принципе дает решение поставленной задачи. Ее другое преимущество — универсальность. Немного усложним задачу, предположив, что у нас не два, а три тела. Например, звезда, планета и астероид. Эта задача, которая ставилась еще И. Ньютоном и А. Пуанкаре, даже в простейшем случае, когда планета движется по окружности, представляет большие сложности, если действовать в рамках чисто аналитических подходов. Вместе с тем численное решение системы ТИ4Г4 = т, пи * = 1, описывающей гравитационное взаимодействие j тел (пц — их масса, г*. — радиус-вектор, г,ь — расстояния между ними ftk = ri - ft), по существу, так же просто, как и численный анализ задачи двух тел. Однако при таком подходе обычно возникают и серьезные проблемы. 54
Во-первых, получив результаты расчета для данных значений кон- стант, мы ничего не узнали о других возможностях, о зависимости ре- шения от параметров На этой основе трудно сделать какие-либо общие выводы. Законы природы в обсуждаемых случаях были сформулированы в виде дифференциальных уравнений. При численном анализе изучался совершенно другой объект — конечномерные отображения. Возникает проблема соответствия между дискретной и непрерывной моделями изучаемого явления. (Построенное отображение тоже можно рассма- тривать как модель исследуемого процесса.) Чтобы подчеркнуть серьезность возникающей здесь проблемы, обра- тим внимание на следующее. При построении дискретной модели обыч- но есть возможность сохранить немногие наиболее важные черты непре- рывной модели (в разных задачах они, разумеется, будут различны). Ключевое значение во многих математических моделях физики име- ют законы сохранения В непрерывной модели взаимодействия звезды и планеты сохранялись момент и энергия. Нет никаких оснований ду- мать, что в простейшей дискретной модели, построенной на основе ме- тода Эйлера, эти величины будут сохраняться. Их несохранение может существенно исказить траекторию на больших характерных временах. Преимущество аналитического подхода состоит в том, что, пользу- ясь элементарными приемами математического анализа и аналитиче- ской геометрии, удалось найти общую формулу для решения. Из нее видно, как зависит решение от начальных данных и параметров зада- чи. Кроме того можно найти внутренние симметрии задачи, связанные с законами сохранения. Приведенное решение оставляет ощущение больших возможностей для дальнейшего развития теории. В значительной степени это спра- ведливо. В частности, можно показать, что при Е > 0 движение будет происходить по гиперболе, что в этой задаче существует еще один инте- грал движения [i7x AY] + аг/г = const. Рассматривая значения а другого знака (взаимное отталкивание), можно получить формулу Резерфорда для рассеяния заряженных частиц, сыгравшую важную роль в атомной физике. Кроме того, пользуясь асимптотическими методами, можно по- пытаться учесть влияние других планет на данную. Двигаясь по этому пути, Адамс и Леверье, анализируя нерегулярности в движении пла- неты Уран, в 1846 году предсказали существование планеты Нептун. Можно сказать, что эта исследовательская программа во многом опре- деляла развитие всей прикладной математики до начала XX века. К недостаткам приведенных аналитических решений можно отнести следующие. Получено одно решение одной динамической системы. Чи- сло уравнений, в которых разделяются переменные и в которых тем более удается перейти от системы шести уравнений к одному, очень невелико. Достаточно ограничена и область применимости асимптоти- ческих методов. Кроме того не должно создаваться впечатление, что приведенное аналитическое решение позволяет совершенно избежать применения чи- сленных методов. В самом деле, формула (25) выражает зависимость г от t неявно. Это предполагает при проведении конкретных расчетов численное интегрирование, либо, по крайней мере, численное решение трансцендентных уравнений. Концепция вычислительного эксперимента во многом связана с по- пыткой объединить оба подхода. Вернемся к задаче о движении пла- неты вокруг звезды. В самом деле, гораздо разумнее было бы вначале 55
выделить законы сохранения, существующие в этой задаче, затем пе- рейти к уравнениям для г и ф и уже потом анализировать их численно. Это привело бы к автоматическому сохранению в дискретной модели аналогов энергии и момента. Кроме того переход к численным методам более высокого порядка (например, методу Рунге — Кутта четверто- го порядка), помог бы значительно увеличить точность расчета. На- личие простого аналитического решения (например, при е = О, когда движение происходит по окружности) также очень полезно. Его мож- но использовать в качестве теста: вычислив это решение с помощью компьютера, можно было бы сравнивать его с точным. Это помогло бы оценить точность расчета и наилучшим образом выбрать шаг по време- ни т. Создание соответствующих программ во многом связано с тем, насколько велик класс задач типа, который мы собираемся анализиро- вать. Чем больше этот класс, тем более эффективное и универсальное программное обеспечение приходится создавать. Мы перечислили лишь небольшую часть вопросов, встающих при постановке вычислительного эксперимента. Их анализ обычно требует больших усилий от специали- стов по математическому моделированию. Однако во многих случаях альтернативы вычислительному эксперименту нет. Несмотря на хрестоматийность этого класса задач, они по-прежнему активно изучается специалистами по нелинейной науке. Сложность за- дачи трех тел была осознана еще А. Пуанкаре. Возможность появле- ния сложных хаотических траекторий в этой задаче, неустойчивость по отношению к параметрам потребовали многочисленных компьютер- ных экспериментов и разработки глубоких математических подходов. Кроме того, в последние десятилетия были обнаружены новые пара- доксальные решения для системы тел, взаимодействующих в соответ- ствии с законом всемирного тяготения. Оказалось, что возможно таким образом разместить в пространстве пять тел (не говоря уже о большем числе объектов), что все они уходят на бесконечность за конечное вре- мя. Здесь также строгим результатам предшествовали компьютерные расчеты. Исследовательская программа А. Пуанкаре Расширение арсенала математических моделей в конце прошлого ве- ка, в частности, необходимость анализа моделей, связанных с упра- влением механическими системами, привело к появлению новых идей. Многие из этих идей, определивших развитие математического модели- рования и создание нескольких разделов математики, были выдвинуты А Пуанкаре. Обратимся к некоторым из них, которые в дальнейшем будут обсуждаться более подробно и использоваться при анализе раз- личных нелинейных явлений. Аттракторы и качественный анализ динамических систем. В XIX веке основные усилия исследователей были направлены на анализ математических моделей замкнутых систем, которые не способ- ны к обмену энергией с другими системами, и собственная энергия кото- рых сохраняется. Их примером может служить математический маят- ник и движение планеты в поле звезды. Такие системы будем называть консервативными (Позже мы обсудим более строгие формулировки.) В консервативных системах начальные данные не могут быть ’’за- быты'' Обратим внимание на фазовые траектории для гармонического осциллятора mz+Jhz = 0. показывающие, как с течением времени может меняться состояние системы на плоскости (z,i). Можно считать, что 56
m — масса грузика на пружинке с жесткостью к (см рис. 5а). Точ- ка, изображающая состояние динамической системы, будет двигаться по эллипсу, соответствующему данной энергии. Она не может перейти на другую замкнутую кривую. Потенциальная энергия в этой систе- ме задается квадратичной параболой U = кх2/2 (см. рис. 56). Точки пересечения этой кривой с линией Е = const определяют амплитуду колебаний осциллятора. Рис. 5. Пример консервативной системы — гармонический осциллятор: а) фазовые траектории, которые в этом случае являются эллипсами; б) потенциал для этой системы Однако, если мы учтем сколь угодно слабые диссипативные процес- сы, например, вязкое трение, которое описывается членом F = —ух, тпх + + fcz = 0, (28) то картина существенно изменится. Разыскивая решение в виде экс- поненты х — еА1, получим Л1.2 = -^ ± Следовательно x(t) —► 0 независимо от начальных данных. Фазовые траектории в этом случае представлены на рисунке 6. Видно, что они ’’наматываются” по спирали на начало координат. Эта система, как и математические модели других систем, называемых диссипативными, не имеет инте- гралов движения или сохраняющихся величин. В них независимо от начальных данных возникает с течением времени один и тот же уста- новившийся режим. А. Пуанкаре предложил сосредоточить внимание не на переходных процессах, а на установившихся режимах, т. е на асимптотическом по- ведении решений при t —* оо. Математическим образом установившихся режимов является притягивающее множество в фазовом пространстве или аттрактор (от английского to attract — притягивать). При этом наиболее важными, по мнению А. Пуанкаре, являются качественные особенности аттракторов. В частности, важно, описывает ли аттрак- тор не меняющиеся во времени переменные, периодические или более сложные режимы. Существенным является число и тип аттракторов, а также множество начальных данных, с которых происходит выход на данный аттрактор. Эти множества называют областями притяже- ния аттрактора. Эти проблемы и рассматривает качественная теория дифференциальных уравнений. Результаты качественной теории обык- новенных дифференциальных уравнений являются очень общими. Они 57
показывают, что огромное количество нелинейных диссипативных си- стем ведут себя одинаково. Рис. 6. Пример диссипативной системы — гармонический осциллятор с вязким трением. Фазовые траектории в этом случае являются спиралями Пусть дано уравнение £ = /И (29) и Известно, что решение x(t) существует и ограничено при 0 < t < оо. Тогда, какую бы функцию f мы не взяли, всегда будет возникать интегральная кривая одного и того же вида. Функция х(1) монотонно стремится к состоянию равновесия х’. В случае системы двух автономных обыкновенных дифференциаль- ных уравнений = ^ = Л(х,у) (30) аттрактором также может быть устойчивая особая точка (см. рис. 7а). Однако существует и вторая возможность. Аттрактор в диссипативной системе двух нелинейных обыкновенных дифференциальных уравнений может описывать установившееся периодическое движение: lim z(t) = X(t), lim y(t) = Y(t) (—»oo t—*oo X(t 4- T) = X(t), Y(t + T) = Y(t). (31) Величина T в этих формулах называется периодом решения. Аттрактор в этом случае называют устойчивым предельным циклом. В фазовом пространстве ему соответствует замкнутая кривая (см. рис. 76). Дру- гих вариантов нет, какие бы функции g и Л мы не использовали. Отсюда понятно, насколько важным является качественный анализ для моделирования нелинейных явлений. Например, если мы наблю- даем установившийся колебательный процесс в диссипативной систе- ме и периодическое внешнее воздействие отсутствует, то для ее мо- делирования понадобятся, как минимум, два автономных обыкновен- ных дифференциальных уравнения. Если наблюдается двухчастотный (при котором, например, одна из переменных может меняться по за- кону z(t) = sin wit sin W2O или хаотический режим, то система должна включать не меньше трех уравнений. Значение качественного анализа для прикладных проблем стало осознаваться в тридцатые годы в связи с анализом радиотехнических 58
систем. В эти годы физики обнаружили, что работа генераторов и ряда других электронных приборов тесно связана с реализацией режимов, описываемых устойчивыми предельными циклами. Возникла теория колебаний. Некоторые из ее базовых моделей мы проанализируем ни- же. Рис. 7. Типы аттракторов в автономной системе двух обыкновенных дифференциальных уравнений. Слева — интегральные кривые, справа — характерный вид фазовых траекторий: а) устойчивая особая точка; б) предельный цикл Локальный анализ динамических систем. При решении алгебраических уравнений принципиальную роль ча- сто играет удачная замена переменных. Поэтому было бы естествен- но найти такие замены переменных в дифференциальных уравнениях, которые позволяют представить их в наиболее простом виде. Можно ожидать, что найти одну такую замену во всем фазовом пространстве (глобально) не удастся. Однако, если рассмотреть эту задачу локально, в небольшой окрестности фазового пространства, то можно рассчиты- вать на успех. В самом деле, обратим внимание на фазовые траектории, фигуриро- вавшие в этой книге. Их типичный вид вдали от особых точек примерно таков, как показано на рисунке 8а. Можно предположить, что есть за- мена переменных ’’выпрямляющая'1 фазовые траектории и приводящая их к виду, показанному на рисунке 86. Однако последнее векторное поле, т. е набор векторов х в фазовом пространстве, соответствует простейшему дифференциальному уравне- нию х' = с, у7 = 0. И действительно справедлива теорема о выпрямлении векторного поля. Она утверждает, что есть функция Л, осуществляющее отобра 59
жение некоторой окрестности G точки X в /V-мерном фазовом простран- стве V системы (17), переводящее ее в окрестность точки Y = Л(Х) в фазовом пространстве V системы У1 - с, у? = . .. - yjv = 0. При этом отображение Л и обратное отображение Л-1 осуществляют- ся дифференцируемыми функциями и являются взаимно однозначным Такие отображения называются диффеоморфизмами. При этом пред- полагается, что точка X не является особой. Таким образом, вдали от особых точек все динамические системы локально эквивалентны про- стейшему уравнению. + I f t t f I t I I I f Рис. 8. Вдали от особых точек с помощью замены переменных локально векторное поле может быть "выпрямлено”. Слева исходное векторное поле, справа — "выпрямленное” Мы видели, что устойчивость особых точек уравнения х = f(x) определяется линейным членом, когда соответствующая производная не равна нулю. Это позволяет надеяться на возможность приведения к каноническому виду и в этом случае, что означает возможность клас- сификации. В самом деле, естественно отнести к одному классу все динамические системы, которые локально можно привести к одному и тому же каноническому виду. Кроме того представляет большой интерес анализировать не одно уравнение, а целое семейство динамических систем i = /(x,A) и привести это семейство к каноническому виду в некоторой окрестно- сти фазового пространства и пространства параметров. При этом очень важной оказывается идея типичности, грубости, или структурной устойчивости. Эта идея родилась в связи с анали- зом математических моделей радиотехнических систем А.А. Андроно- вым и JI .С. Понтрягиным и получила большое развитие в последующие годы. Смысл этой идеи очень прост. При математическом моделиро- вании различных явлений мы знаем параметры уравнений с конечной точностью, а сами уравнения являются приближенными. Поэтому есте- ственно потребовать, чтобы математические модели описывались урав- нениями, качественные свойства которых не меняются при небольших возмущениях ("шевелении”) параметров. Например, если некоторый процесс описывается уравнением х = А + г2, 60
то естественно считать, что каждая отдельная система, взятая наугад, будет относиться к случаю, когда А > 0 и нет ни одного состояния рав- новесия, либо к случаю, когда А < 0 и есть два состояния равновесия (см. рис. 9) Систему с А = 0 естественно считать нетипичной или негрубой. Если она возникла в ходе моделирования, то можно предпо- ложить, что либо существенные факторы оказались неучтенными, либо система обладает какими-то специальными свойствами (например, сим метрией), делающими ее нетипичной. Реализация идеи локального анализа привела к возникновению и развитию таких разделов математики как теория нормальных форм, теория бифуркаций, теория катастроф, играющих важную роль в мо- делировании нелинейных явлений. Область приложения этих идей в моделировании и ряд конкретных моделей, изучаемых с помощью этих методов, мы неоднократно будем обсуждать далее Глобальный анализ. Во многих случаях важно представлять решение не только локаль- но, в малой окрестности точки фазового пространства, но и глобально. Например, важно знать, сколько и каких аттракторов имеет изучаемая система, как может измениться число и тип аттракторов при изменении параметров. Приведем пример, иллюстрирующий идею глобального анализа. В физике известны законы сохранения непрерывных величин, таких как энергия, импульс, момент импульса. Однако наряду с ними известны законы сохранения другого типа. Могут сохраняться дискретные вели- чины, например, такие, как барионный или электрический заряды. Они означают, что, приписав каждой частице некоторый заряд <?, и просум- мировав по всем частицам, входящим в некоторую замкнутую систему о = $2?.. 1=1 мы обнаружим, что величина суммарного заряда Q будет сохранять- ся. Это накладывает серьезные ограничения на возможные в природе процессы. Если в системе рождается барион с зарядом +1, то должен 61
родиться и антибарион с зарядом —1, электрон может рождаться толь- ко в паре с позитроном. Мы покажем, что похожая ситуация имеет место в уравнении г = v(z). Пусть 0 < х < 2тг и v(0) = и(2%). В этом случае правые части пери- одичны и фазовым пространством является окружность. Мы покажем, что здесь также можно ввести аналог такого заряда. Будем говорить, что состояние равновесия = 0) обладает топологическим за- рядом q, равным —1, если < 0, и 4-1, если > 0 и 0, если =0 Сумму по всем состояниям равновесия в таких системах назовем топологическим зарядом системы Q = 22?»- Покажем, что для всех динамических систем с непрерывной функцией v(r) топологический за- ряд равен кулю. Л В Рис. 10. При "натягивании нити” топологический заряд системы не меняется В простейшем случае, когда и(х) — постоянная величина, Q = 0 (см. рис 10а). Покажем, что эта величина не меняется при непрерывной деформации функции v(z). Можно рассуждать следующим образом. Будем считать что и(г) — нитка, закрепленная в точках А и В (см рис.106). Будем натягивать эту нитку. До тех пор пока не меняется число состояний равновесия, величина Q не меняется. При некоторой длине "нитей” возникает ситуация, показанная на рисунке 10в, (кривая 2) одновременно исчезают два состояния равновесия. В момент исчез- новения топологический заряд состояния равновесия х’ равен нулю. Когда исчезли два состояния, одно с зарядом 4-1, другое -1, величина Q также останется такой же, как до деформации Действуя в точно- 62
сти гак же в общем случае, когда есть любое конечное число состояний равновесия, приходим к выводу о том, что величина Q не меняется при непрерывной деформации. Поскольку для случая, показанного на рисунке 10а, Q — 0, то такой она будет и в других случаях. Топологи- ческий заряд для таких систем сохраняется. Более глубокие и содержательные рассуждения, опирающиеся на понятие непрерывности, на возможность анализировать свойства гео- метрических объектов, сохраняющиеся при непрерывных преобразова- ниях, и легли в основу топологии. А. Пуанкаре считал топологию или "геометрию положения”, сложным и абстрактным разделом анализа. Топологические методы позволили получить ряд важных общих резуль- татов, касающихся больших классов нелинейных математических моде- лей, а также предсказать ряд новых физических явлений. Значение исследовательской программы А. Пуанкаре в развитии естествознания и исследовании нелинейных явлений оказалось очень велико На многие вопросы, поставленные в начале века, удалось полу- чить глубокие содержательные ответы только с появлением компьюте- ров Это привело к появлению нового поколения нелинейных математи- ческих моделей, к новому уровню понимания многих явлений природы, к рождению нелинейной науки. Вопросы и задачи 1. Объем газового пузыря, образовавшегося в результате глубинно- го подводного взрыва, колеблется с периодом, пропорциональным рарьЕс. Здесь р — давление, р — плотность воды, Е — полная энергия взрыва. Найти а, 6, с 2 Как сила, действующая на сферу, движущуюся в жидкости, за- висит от радиуса сферы г, скорости движения и и вязкости г)? Размерность вязкости — кг м" 1сек”1. 3. Грузик массы m на пружинке с жесткостью k совершает коле- бания в жидкости. Насколько велик должен быть коэффициент вязкого трения у, чтобы грузик без колебаний двигался к поло- жению равновесия? 4. Допустим, что все пространственные масштабы в Солнечной си- стеме изменились в а раз. Насколько при этом изменятся времен- ные масштабы? 5. Можно ли покинуть пределы Солнечной системы, если межпла- нетный корабль движется со скоростью реактивного самолета? 6. Простейшим уравнением, описывающим нелинейные колебания является уравнение Дюффинга т + w2x + рх3 = 0. Считая, что р < 0, выяснить каков период малых колебаний. При каком зна- чении энергии период стремиться к бесконечности? 7 Как происходят колебания в системе, где возвращающая сила убывает со временем £ + р = 0? 8. Как происходят колебания в системе, где и возвращающая сила, и коэффициент вязкого трения убывает со временем г + ~ 4- fj = 0? 63
9. Какой должна быть сила, действующая на материальную точку, чтобы численное решение дифференциальных уравнений, полу- ченное с помощью метода Эйлера, совпало с точным? 10. Считая, что р малый параметр в уравнении Дюффинга, выяснить, как зависят малые колебания от этого параметра. 11. Представим, что Земной шар — твердое тело с постоянной плотно- стью р. Допустим, что в нем сделано отверстие, проходящее через центр. В это отверстие брошен камень. Что будет происходить далее? 12. Рассмотрим движение частицы в центральном поле с потенциалом U(г) = Лгп. В каком случае частица, двигающаяся в таком поле, может упасть на центр? 13. Доказать, что при движении в центральном поле U = а/г величи- на [v х Af] + сохраняется. (Напомним, что М = m[Fv].) 14. Исследовать движение материальной точки в центральном поле U = ог2. 15. Задачу об определении периода колебаний Т(Е) в зависимости от энергии Е в заданном потенциале U(z) можно рассматривать как прямую задачу. Одназначно ли разрешима обратная задача — определение потенциала U(x) по заданной зависимости Т(Е)? 16. Существует ли потенциал, в котором колебания обладают свой- ством изохронности, т. е. их период не зависит от амплитуды колебаний? 17 Можно ожидать, что поведение классической частицы (движе- ние которой определяется вторым законом Ньютона) и кванто- вого объекта (который описывается уравнением Шредингера) в некоторых потенциалах существенно отличаться. Не могли бы вы привести примеры таких потенциалов? 18. Математический маятник отклонили от верхнего положения на малый угол с. Как будет зависеть период колебаний от параметра С? 19. Представим, что в некоторый момент времени показатель степени в законе всемирного тяготения изменился. Постоянная G стала такой, чтобы ускорение свободного падения на поверхности Зе- мли осталось прежним. Как при этом изменится окружающий нас мир? 20 Специалисты по теории эволюции утверждают, что самым боль- шим насекомым была гигантская стрекоза с размахом крыльев в 70 см, жившая в каменно-угольном периоде палеозойской эры. Почему, на ваш взгляд, не было насекомых более крупного разме- ра7 64
Рекомендуемая литература Методы подобия и размерности при исследовании различных нелинейных явлений рассматриваются в книге: Седое Л.В. Методы подобия и размерно- сти в механике. М.: Наука, 1974. Асимптотические методы решения различных физических задач обсужда- ются в книгах: Найфэ А. Введение в методы возмущений. М.: Мир, 1984; Мигдал А.Б. Качественные методы в квантовой теории. М.: Наука, 1975; Андрианов И.В., Маневич Л.И. Асимптология: идеи, методы, результаты. М.: Аслан, 1994. Рассмотренная модель математического маятника играет принципиаль- ную роль в теории нелинейного резонанса: Заславский Г. М. Стохастичность динамических систем. М.: Наука, 1984. Множество задач, связанных с движением в центральном поле, обсужда- ются в курсах тесшетической механики: Ландау Л.Д. Механика. М.: Наука, 1973; Голдетейн Г. Классическая мехеника. М.: Наука, 1975. Обе рассмотренные модели относятся к гамильтоновым системам. В от- личие от диссипативных систем, которые обсуждаются в этой книге, здесь возникают своеобразные задачи и методы их исследования. О них рассказы- вается в книгах: Лихтенберг А., Либерман М. Регулярная и стохастическая динамика. М.: Мир, 1984; Заславский Г.М., Сагдеев Р.З. Введение в нелиней- ную физику: От маятника до турбулентности и хаоса. М.: Наука, 1988. Численные методы интегрирования обыкновенных дифференциальных уравнений описаны в учебниках: Самарский А.А. Введение в численные ме- тоды. М.: Наука, 1982; Калиткин Н.Н. Численные методы М.: Наука, 1978; Бахвалов Н.С. Численные методы. М.: Наука, 1975. Доказательство теоремы о выпрямлении векторного поля изложено в кур- се: Арнольд В.И. Обыкновенные дифференциальные уравнения М.: Наука, 1971. Представление о программе Пуанкаре, в реализации которой принципи- альную роль играет вычислительный эксперимент, дают книги: Guckenheimer J., Holmes Р. Nonlinear oscillations, dynamical systems and bifurcations of vector fieldes. N.Y. etc.: Springer, 1983; Компьютеры и нелинейные явления. М.: Наука, 1988; Ахромеева Т.С., Курдюмов С.П., Малинецкий Г.Г., Самарский А.А. Нестационарные структуры и диффузионный хаос, М.: Наука, 1992.
Escher М.С. Swans. 1956 Эшер М.К. Лебеди
ГЛАВА 4 АТТРАКТОРЫ УРАВНЕНИЯ г = и(х) Добивайтесь того, чтобы играть легкие вещи правильно и хорошо это лучше, чем посредственно ис- полнять трудные. Р. Шуман Качественная теория уравнения х = v(x) Уравнение х = v(x) с начальным условием z(0) = zo является заме- чательным объектом потому, что для него удается провести детальное качественное исследование, — определить все аттракторы, доказать, что именно к ним траектории сходятся при t —* оо и указать, при каких именно начальных данных на какой аттрактор происходит выход. Пре- жде чем заняться изучением этих вопросов, напомним основные поня- тия теории обыкновенных дифференциальных уравнений и рассмотрим несколько моделей, приводящих к уравнению обсуждаемого типа. Дифференциальные уравнения как математические модели. Допустим, мы хотим построить математическую модель объекта, ко- торый обладает следующими свойствами. 1. Объект может быть однозначно охарактеризован конечным набо- ром чисел Z},...,z/7. Эти числа называют фазовыми переменны- ми. Пространство, которому они принадлежат, называют фазо- вым пространством, а величину N — числолс степеней свободы. 2. Состояние объекта может меняться со временем t, т. е. все чи- сла xy,...txpf зависят только от одной независимой переменной Поведение объекта является детерминированным: состояние из- учаемой системы зависит только от ее предыстории, т. е. от значений zj, ...,х^ в предыдущие моменты времени. 3. Все зависимости zi(f), ...,z/v(t) являются гладкими (дифференци- руемыми) функциями независимой переменной I. 4. Фазовая скорость изучаемого объекта ii(i), • , z/v(t) может зави- сеть только от фазовых переменных Z](i),..., xj\f(t) и времени t (а не от Zi(t - т) Ti(z)dz и т.д ). Числа zi, ..,,zyv можно интерпретировать как координаты точки, дви- жущейся в фазовом пространстве Величину ~ — v при этом называют скоростью или фазовой скоростью. В теории обыкновенных дифференциальных уравнений считаются известными векторы скорости в точках фазового пространства. Мно- жество таких векторов называют векторным полем Задача теории обыкновенных дифференциальных уравнений состо- ит в том, чтобы по векторному полю v и начальному положению z(0) найти траекторию точки в фазовом пространстве x(t) или зависимость координат вектора z от времени I, называемую интегральной кривой. 67
Другими словами, надо найти траекторию z(f), удовлетворяющую дифференциальному уравнению dz dt = ” и начальному условию £(0) = £q. Эти понятия мы проиллюстрируем ниже с помощью нескольких примеров. Однако вначале сделаем заме- чание, касающееся терминологии. Замечание. Если векторное поле v = {vj,.... u/v) зависит только от вектора z и не зависит явно от времени, систему дифференциальных уравнений называют автономной. Размерность фазового пространства при этом совпадает с числом компонент вектора х — №. В противном случае v = v(z, t) систему уравнений называют неав- тономной. Фазовое пространство Т), ...,x^,t имеет размерность N + 1. В самом деле, этот случай сводится к предыдущему. В этом можно убе- диться, добавив к исходной системе уравнение = 1. Это позво- лит записать векторное поле в виде (ui(zi,..., zyy, zjv+i),..., vx(zi,.... z/v, z/v+i), 1), и сделает изучаемую систему автономной. В некоторых кни- гах при обсуждении неавтономных систем множество точек {zi,...,z/v} называют фазовым пространством. Множество {zj,....хдг, t) — рас- ширенным фазовым пространством. П ример. Простейшая автокаталитическая реакция. Из школьного курса химии известен закон действующих масс, спра- ведливый для многих химических реакций, идущих в газообразной или жидкой фазе. В реакции, где два вещества X и У, реагируя, дают ве- щество Z(X + Y —► Z),скорость изменения концентрации вещества Z пропорциональна произведению концентраций веществ X и У. Коэф- фициент пропорциональности называется постоянной реакции k. Обо- значая через X, У, Z концентрации соответствующих веществ, можно записать = (1) В самом деле, для того, чтобы реакция шла, молекулы вещества X должны сталкиваться с молекулами вещества У. Очевидно, веро- ятность этого пропорциональна числу молекул X в единице объема (т. е. концентрации X). Точно так же она должна быть пропорциональ- на концентрации У. Коэффициент пропорциональности /с зависит от размеров молекул, их скоростей и т.д. Это и отражает формула (1). Если в реакции п молекул X взаимодействуют с одной молекулой У, то изменение концентрации вещества Z пропорционально ХПУ. Рассмотрим схему более сложной реакции А + 2Х^ЗХ, (2) Полная реакция имеет вид А В. В ходе этой реакции вещество А пре- вращается в вещество В через промежуточный продукт X. Молекулы вещества X производятся при участии молекул того же сорта X в каче- стве катализатора. Такие реакции называются автокаталитическими. Эти реакции описываются нелинейными по некоторым концентрациям зависимостями. 68
В схеме реакции учтены не только прямые реакции, скорости ко- торых определяются постоянными fc] и кз, но и обратные, константы которых равны соответственно к2 и Jt«. В качестве идеализации будем рассматривать открытую систему. Предположим, что она может вза- имодействовать с неограниченными резервуарами веществ А и В. В результате этого концентрации веществ А и В можно считать постоян- ными. Исходя из закона действующих масс, можно записать кинетическое уравнение, определяющее изменение концентрации вещества X со вре- менем ^-= -к2Х3+ kiAX2 - к3Х+ к<В. (3) dt Пусть начальное значение концентрации известно Х(0) = Хо. Возника- ют вопросы об аттракторах системы, их областях притяжения, а также о зависимости установившихся режимов от параметров А и В. Комментарий. Автокаталитические реакции, которые опи- сываются нелинейными уравнениями с кубической нелинейностью, из- вестны в химической кинетике. В частности, в реакции, протекающей в верхних слоях атмосферы, образование озона происходит при тройном столкновении атомов кислорода: О’+ О2 + М Оз 4- Л/, где М некоторая частица, роль которой состоит в отведении энергии, выделяющейся в этой реакции. Кроме того выражения для скоростей ряда биохимических реакций в некоторых предельных случаях можно свести к кубическому виду. Однако значение автокаталитических реакций выходит далеко за пределы анализа отдельных химических систем. Согласно концепции немецкого исследователя, лауреата Нобелевской премии М. Эйгена та- кие реакции сыграли ключевую роль на добиологической стадии эво- люции. М. Эйген предположил, что после того как на Земле появились биополимеры, спотанно возникли последовательности циклических ре- акций, называемые гиперциклами. В гиперцикле конечный продукт, получающийся в последней реакции цикла, может служить исходным веществом, вступающим в первую реакцию, либо выступать в качестве катализатора. При этом у системы появляется возможность к самовос- произведению, к копированию. Конкуренция гиперциклов приводит к состоянию с наибольшей устойчивостью по отношению к флуктуациям или ошибкам копирования. Исследователи полагают, что в ходе такой селекции, при которой реализуется дарвиновский принцип "выживания наиболее приспособленных", у системы должна появиться способность накапливать опыт с помощью некоторого первичного "генетического ко- да” . Ряд моделей математической генетики играют ключевую роль в теории гиперциклов Эйгена. Вернемся к исходной задаче качественного исследования уравнения х = v(z), z(0) = то- (4) Рассмотренные выше примеры показали, что решения этого уравнения могут монотонно стремиться к постоянному значению z(f) —► I* при t —► оо, и(г*) = 0 (5) 69
(например, как в логистическом уравнении х — az(L — т)), могут не- ограниченно возрастать за бесконечное время x(t) —+ оо при t —* оо (6) (как в уравнении Мальтуса), или за конечное время tj x(t)—> оо при t (7) (как в простейшей модели цепной реакции х = х^,/3 > 1). Теоремы сравнения Традиционные подходы классической математики, связанные с по- лучением решений в квадратурах, с асимптотическими разложениями, с введением специальных функций, в конце XIX века начали встречать- ся с нарастающими трудностями Это потребовало новых идей. Один из методов анализа, примене- ние которого не связано с линейностью, с той или иной симметрией уравнения, — теоремы сравнения. Простейшие из них можно проиллю- стрировать на примере двух элементарных математических моделей. Движение автомобиля во время ралли. Будем считать, что водителю выдан график движения, показыва- ющий в какой момент времени какую скорость v(t) он должен иметь. Тогда его путь х определяется уравнением dx dt = Зная график движения, можно выяснить, какой автомобиль первым придет к финишу. В ряде случаев это удается сделать, не решая урав- нения, а воспользовавшись следующей теоремой сравнения Рис. 1 Примеры интегральных кривых дифференциальных уравнений, описывающих движение автомобилей Теорема 1. Пусть дамы решения двух дифференциалных урав- нений с одинаковыми начальными данными x\(t) и *г(0 ^^ = «'1(0. ^^ = V2(0. Х1(0) = Х2(0). at at Пусть кроме того V2(l) > vi(0- х?(0 > ri(0 70
Смысл теоремы прост: если в каждый момент времени ехать быстрее соперника, то к финишу придешь первым. Геометрическую интерпретацию теоремы дает рисунок 1. Угол о наклона касательной к кривой X|(t) (тангенс которого совпадает со ско- ростью vi(/)) меньше, чем угол наклона 0 к кривой х2(0> если брать их в один момент времени Г. Доказательство очевидно Вычитаем второе уравнение из первого и интегрируем. t г2(0-Х1(<) = J~ 0 Справа стоит интеграл от положительной функции Поэтому x?(t) > Лыжник на трассе. Допустим по трассе бегут два лыжника. Их скорость зависит от участка маршрута, который проходится, v = v(x) Одному лыжни- ку сообщают график движения другого и он старается пройти каждый участок маршрута быстрее V](r) > и2(х). Можно ли утверждать, что он придет к финишу первым? Теорема 2. Пусть даны решения двух автономных обыкновенных дифференциальных уравнений с одинаковыми начальными данными ri(0) = r2(0) = 0. Пусть также vj(z) > и2(г) для всех значений z. Тогда x\(t) > x2(f) Эту теорему иллюстрируют рисунок 2. Здесь tga(x*) = vi(r*) > tg0(x*) = и2(х*). В этом случае угол наклона к кривой хД<) должен быть больше, чем угол наклона к кривой х2(<) при одном значении ко- ординаты х". Однако в определенные моменты времени (например, в момент С см. рис. 2) скорость второго лыжника может быть больше, чем скорость первого Рис 2 Примеры интегральных кривых дифференциальных уравнений, описывающих движение лыжников Для доказательства предположим противное. Пусть до некоторого момента t* утверждение было выполнено. Однако в этот момент вто- рой лыжник догнал первого хДГ) = z2(C). Напомним известную из 71
математического анализа теорему Лагранжа, если функция f(x) не- прерывна на отрезке [а, 6] и дифференцируема в каждой внутренней точке отрезка то внутри отрезка найдется точка с такая, что будет справедливо равенство: Итак xi(t’ - At) > x2(f - At), ri(t’) = r2(f) Сл едовател ьно Zi(t') - Ii(f - At) z2(f) - z2(f - At) At At Воспользовавшись теоремой Лагранжа, приходим к неравенству t>i(r - 61Д/) < v2(<* - 0гАО- Переходя к пределу при А/ —► 0 и учитывая, что zi(Г) = х2(Г), полу- «1(f) < V2(f). Однако последнее неравенство противоречит условиям теоремы. Слу- чай, когда t* = 0, предоставляем рассмотреть читателям самостоятель- но. Теоремы сравнения сейчас являются очень эффективным инстру- ментом анализа математических моделей. Допустим, что нас интересу- ет поведение некоторого процесса, который описывается динамической системой. = v(x), х(0) = х0. (8) Пусть у нас есть два уравнения, решения которых известны. ^• = Vl(*l). 21(°) = 22(°) = Z<> Кроме того, vi(y) < v(y) < v2(y) для 0 < у < оо. В этом случае мы смо- жем "зажать” решение в коридор между функциями < x(t) < z2(t), что может дать важную информацию о поведении изучаемого объекта. Проиллюстрируем это на примере первого метода устойчивости Ля- пунова для состояний равновесия простейшего уравнения Для того, чтобы проанализировать устойчивость состояния равновесия i* (v(i*) = 0), достаточно было выяснить знак dv^ ) = а (когда о / 0), т е. для того, чтобы исследовать устойчивость особой точки, достаточ- но взять линейные члены, отбрасывая квадратичные. Воспользуемся доказанной теоремой сравнения, чтобы показать это 72
Для этого нам понадобится найти в явном виде решение логистиче- ского уравнения у = ay — 0у2, (9) с которым мы и будем сравнивать решение интересующей нас задачи Логистическое уравнение. Обсудим несколько подробнее это уравнение, при а > 0,/3 > О явля- ющееся одной из базовых математических моделей нелинейной динами- ки. При выводе уравнения Мальтуса предполагалось, что доступные ресурсы неисчерпаемы и скорость роста популяции никак не зависит от ее численности. Однако очевидно, что это приближение может быть оправдано, только если потребляемые ресурсы малы в сравнении со всем объемом ресурсов, имеющихся в месте обитания сообщества. Рис. 3. Решения уравнения вида у = ау - 0у2; а) вид правой части, соответствующей логистическому уравнению; б) вид нескольких интегральных кривых, соответствующих этому уравнению; в) вид правой части, соответствующей модели цепной реакции; г) вид нескольких интегральных кривых в этом случае Если это не так. то надо учитывать различные ограничивающие фак- торы Например, ухудшение питания может привести к уменьшению среднего времени жизни членов сообщества, а значит, и к стабилиза- ции его численности. Усиление внутривидовой конкуренции, ухудше- ние условий жизни может сказываться на численности вида Все это грубо можно учесть с помощью ограничивающего члена > 0). 73
Функция f(y) = ау—/3у2 имеет вид квадратичной параболы (см. рис. За) Эта парабола пересекает ось абсцисс в точках у = 0 и у — т. е проходит через положения равновесия. Нетрудно убедиться, что > q < q, ПОЭТОМу ВТорое положение равновесия устойчиво, первое — не!. Показанная функция f(y) описывает следующие процессы. Когда популяция мала, численность увеличивается. Однако в системе есть отрицательная обратная связь: чем больше сообщество, тем медленнее оно растет и наконец, при у = fl/a рост прекращается (см.рис. 36, кривая 1). С другой стороны, если численность вначале у(0) превышала этот предел, то величина y(t) начинает уменьшаться (см.рис. 36, кривая 2) Смысл постоянных а и /7 очень прост. Коэффициент а показывает, насколько быстро растет популяция, пока она мала. Коэффициент /3 показывает, насколько велика может быть предельная численность у. Фазовым пространством системы является полупрямая у > 0 По смыслу задачи функция y(t) неотрицательна. Движение точки, опре- деляющей состояние динамической системы у — f(y), по этой пря- мой, можно очень просто предсказать с помощью графика f(y). Если /(у) > Oi то точка будет двигаться вправо со скоростью, пропорцио- нальной f(yY если f(y) <0 — влево. Простейшая модель цепной реакции. Дифференциальное уравнение (9) представляет собой полезную мо- дель и в том случае, когда коэффициенты а и /7 отрицательны. Мы уже рассматривали автокаталитические реакции и обсуждали возмож- ные причины появления нелинейных источников. Простейший источ- ник такого типа — квадратичный — 0у2(0 < 0). Линейный сток может описывать распад вещества (как, например, в модели радиоактивного распада), диффузию или другие процессы. Эта модель переходит в предыдущую, если обратить знак времени. Другими словами, модель (9) инвариантна относительно преобразова ния t —► — £,а —* —а,/? —► — 0tf(y) —* —f(y) Отсюда ясно, что особая точка у — 0 будет устойчива, а точка у = +/?/а — неустойчива. Ди- намика системы также очевидна. Когда начальные данные у(0) ниже порога 3/(0) < у, то потери превышают прирост концентрации, возни- кающий в ходе реакции и у(1) —► 0. Однако если порог у превышен, реакция идет с нарастающей скоростью (см.рис. Зв, Зг). Здесь мы сталкиваемся с одним важным свойствам, характерным 1ля многих нелинейных явлений — с пороговым характером процессов Превышение некоторого критического значение одним из параметров в нашем случае начальными данными j/(0)) приводит к тому, что ход ipoiiecca качественно меняется Можно сказать, что здесь количество переходит в качество. Сделав замену переменных у = ге°' => у(0) = z(0), получим :eat 4- aze°' = а?е“' - /№' 74
z = -0z2ea‘ £ = -0^dt -1 x a Или, учитывая начальные условия, имеем 1 ea1 г~е + «а| fj/л ’ 1101 Уо а ° Это решение вполне согласуется с интуитивными представлениями о логистической модели, обсуждавшимися ранее. В самом деле, при а > О (как показано на рисунке 3) eat —► оо при t —* оо, поэтому y(t) —> а//?. При а < 0 и уо < <*//?, у(0 —* 0 при t —* оо. Отметим, что система в обоих случаях "забывает” начальные данные при t —♦ оо. Как мы уви- дим далее, это свойство является общим для многих математических моделей Почему можно отбросить нелинейные члены? Вернемся к уравнению (1) Сделаем замену переменных х = г* + Az(f). = д,- + Д.) = л.-) + + о < е < 1. Здесь мы предположили, что функция f(x) является достаточно глад- кой и имеет первую и вторую производную на отрезке [г‘, г‘ + Ах], и воспользовались формулой Тейлора с остаточным членом в форме Лагранжа. Таким образом =ОДх + /3(х)Дг2. at Пусть вторая производная на этом интервале ограничена Р < < Р, где р и р — постоянные (см рис 4а). Следовательно можно вос- пользоваться теоремой сравнения и решением уравнений (2) 21 = ОГ2| + Pzl, г2 = + Pz], у(0) - 2J0) = z2(0) = 6, где 6 достаточно малое число, а а = ) Вид интегральных кривых Az(f),zi(f) и z2(t) представлен на рисунке 46 Пользуясь теоремами сравнения, можно "зажать” исследуемое решение между двумя извест- ными 21(f) и z2(f). Тогда 22(f) < Al(f) < Z!(t) 75
Выберем значение с. Тогда если 6 = г < |о/2/?|, то Дх(<) < е При- веденное рассуждение показывает, что квадратичные члены действи- тельно можно отбросить, когда а 0. В самом деле, когда а < 0, то zi(i) —* 0, z2(Z) —► 0, а значит, и Дх(<) —* 0. Когда о > 0, то ?i(t), и z2(f) возрастают. Следовательно будет возрастать и Дх(0 Рис. 4. Теоремы сравнения позволяют ’’зажать” исследуемое решение Дт(<) между двумя известными zj(t) и zj(t) • Первый метод Ляпунова относится к задачам локального анализа, когда траектория находится в окрестности состояния равновесия. Для качественного анализа уравнения х — и(х) было бы важно понимать, что происходит вне этой окрестности. В обсуждаемой задаче это можно сделать, используя функцию Ляпунова. Напомним в основных чертах такой подход, подробно обсуждаемый в курсах обыкновенных диффе- ренциальных уравнений Функция Ляпунова. Рассмотрим более общую модель dx - = х(0) = z0. (11) Будем считать, что х = 0 является положением равновесия, а также, что в некоторой окрестности начала координат G задана непрерывная и дифференцируемая положительно определенная функция У(х). В качестве G удобно выбрать шар радиуса R. Под положительной определенностью в G понимается следующее свойство: У(х) > 0 в G, причем У(х) = 0 только при х = 0. Положи- тельно определенные функции обладают следующим свойством: для всех || х ||> 6 > 0 существует г > 0 такое, что V(z) >€ Верно и обрат- ное. Из неравенства У(х) > я > 0 следует существование постоянной I/ > 0 || х ||> р (см. рис. 5а). В самом деле, допустим противное. Пусть при выполнении неравен- ства || х ||> 6 неравенство И(х) > г не выполнено ни при каком положи- тельном значении £. Это означает, что можно выбрать последователь- ность {сп}, —* 0 при п —► оо такую, что |1 хп ||> i, а К(тп) < £п —► 0. Пусть все числа хп ограничены сверху некоторой постоянной С. Сле- довательно € <|| хп ||< С Поэтому из последовательности {хп} можно 76
выделить сходящуюся подпоследовательность {уп} с пределом у. Оче- видно, € <|| у ||< С. Однако в силу непрерывности функции V(z) lim Hi/n} = V(y). п—»оо Поскольку limn—« V(j/n) = 0, V(y) = 0. Функция V(z) является по- ложительно определенной, следовательно у = 0. Но это противоречит неравенству с <|| У II • Действуя аналогичным образом, читатель может доказать обратное утверждение. а Рис. 5. Построение функции Ляпунова в окрестности состояния равновесия позволяет исследовать его устойчивость: а) положительно определенные функции; б) рисунок, поясняющий выбор величины б Справедлива следующая теорема. Теорема. Пусть в области G существует непрерывная вместе с частными производными первого порядка положительно определен- ная функция L(x), называемая функцией Ляпунова Пусть скалярное произведение W(x, i) = (gradL, f(tt x)) удовлетворяет неравенству W(x, t) <0 t > 0, x € G Пусть /(t,0) = 0 Тогда состояние равновесия x — 0 устойчиво. Если дополнительно к этим условиям выполнено неравенство W(xtt) < - Й^х), где W(x) — положительно определенная в G функция, то эта особая точка асимптотически устойчива: lim z(t) = 0. t—»оо В самом деле, зададим постоянную £ > 0. В силу свойств непре- рывных положительно определенных функций существует значение д, при котором L(x) > р > 0, если || х ||> е. Поскольку L(x) непрерывная функция, можно выбрать такое 6, что при || х ||< 6 выполнено неравен- ство Цх) < р/2 (см рис. 56). 77
Выберем начальные данные в сфере радиуса 6— || х(0) ||< 6, По- кажем, что при этом траектория будет лежать в сфере радиуса €~ и ад и<е- Если это не так, то при некотором значении tj b(i(ti)) > fl. Но тогда L(r(G)) - Ц*(0)) > я - р/2 > 0. Однако в силу теоремы Лагранжа L(f(ti)) - L(z(0)) = ‘i = (ffradL,/(£,<*))G = at \ OX at / = 1У(х(Г),Г)^ <0, (0<r <G). Поскольку неравенство выполнено во всей области G, в том числе и на траектории, то возникает противоречие, которое и доказывает теорему. Чтобы доказать асимптотическую устойчивость, можно действовать следующим образом. Поскольку = w(£, t) < -w(£(<)) <о, at то функция L(z(T)) монотонно не возрастает, поэтому lim L(x, t) = a > 0. t—*oo Если постоянная a — 0, то x(t) —* 0. В самом деле, иначе существо- вало бы значение с и последовательность {x(fn)}, tn —* оо при п —► оо, у которой || £(<п) ||> б > 0. Но тогда £(x(tn)) > р. (см.рис.5), что противоречит равенству о = 0. Докажем, что а = 0. Пусть а > 0. Положим р = а. Тогда в си- лу положительной определенности функции Ляпунова для некоторого значения с будет выполнено неравенство || х(1п) ||> ^ > 0. Но поскольку -IV(f) тоже положительно определенная функция, то W’fxft)) > /3 > 0. Поэтому — lV(x(t)) < — р < 0. Следовательно Ц£(0) - Г(х(0)) = |(=(-Г < -IV(f,(f))t < -01, 0 < I < t at Таким образом £(х, t) —* —оо. Но это противоречит положительной определенности функции L Следовательно о = 0. Таким образом, точка г = 0 действительно является аттрактором системы (8) Комментарий В приведенной теореме Ляпунова не делается каких-либо предположений о линейности системы и о конкретном виде функции L. Это открывает простор для ее широкого использования и множества обобщений Однако класс интересных систем в нелинейной динамике, для которых существует функция Ляпунова, сравнительно 78
невелик Грубо говоря, эти системы устроены слишком просто Мож- jio сказать, что их ’’цель”, которую удается достичь только в особых точках, состоит в минимизации функции L. Вместе с тем в ряде математических моделей, появившихся в по следние годы в теории нейронных сетей и связанных с распознавани- ем образов и построением ассоциативной памяти, построение и анализ функций Ляпунова оказались очень важными и полезными. Обратимся к исходной задаче — качественному исследованию одно- го автономного обыкновенного дифференциального уравнения Запи шем его в виде где z(0) = io- (12) Функцию U назовем потенциальной энергией или потенциалом. От- метим, что максимумы и минимумы потенциала соответствуют особым точкам системы (8): dU(a) п дх Кроме того, максимум потенциала соответствует неустойчивым, а ми- нимум — устойчивым точкам. В самом деле, условие минимума в точке А, записывается в виде д2и(а) Эх2 df(a) дх последнее равенство, как мы ранее точки А. Покажем, что именно потенциал убедились, означает устойчивость и является функцией Ляпунова W = 0. dU(x(t)) _dU dx _dU_ dt дх dt дх Если нас интересует, например, устойчивость состояния равновесия Л, то, добавив постоянную С(Л1) (см.рис. ба), мы получим положительно определенную функцию в окрестности Ль для которой выполнены все условия теоремы Ляпунова. Следовательно точка Л1 (равно как Л2 и Л3 на рисунке 6а) является асимптотически устойчивой, т. е. аттрак- тором . Из убывания функции Ляпунова следует, что точка в фазовом про странгтве движется в направлении, противоположном градиенту до ближайшего минимума потенциала. Отсюда ясно, например, что обла- стью притяжения особой точки Лз, будет интервал (B\t В?) Скорость движения вдоль фазовой прямой определяется производ- ной Поэтому, чтобы получить представление о решении, достаточ- но представить себе лыжника, съезжающего по потенциальной функ- ции, на дне которой он останавливается 79
Осталась рассмотреть случаи, когда функция t/(r) не является огра- ниченной снизу. Мы сталкивались с двумя такими случаями. Первый относится к мальтузианскому уравнению, где U = —ах2/2 и г(0 —* оо за бесконечное время. Второй — к уравнению, с /(z) = z^,/? > 1 и U — -х0+х/(Р 4- 1) где z(t) —► оо при t —* tj < оо. Способ отличить неограничено растущие за бесконечное время реше- ния от решений, растущих в режиме с обострением, дает утверждение, называемое критерием Осгуда. Чтобы решение задачи (8) существовало в течение конечного вре- мени if необходимо и достаточно, чтобы интеграл (13) сходился. Значение этого интеграла совпадает с tj. В самом деле, l^)=dt |?=0 Если проинтегрировать удается и существует предел интеграла при х —* оо, то Т = tf Можно вернуться к аналогии с лыжником. Если гора бесконечная и не очень крутая, то он будет двигаться к бесконечности бесконечно долго, но если гора достаточно крутая, то он успеет сделать это за конечное время (см. рис. 66). Рис 6 Правые части v(r) и соответствующие потенциалы U(x). а) характерный вид потенциала, когда решение ограничено; 6) случай, когда решение неограниченно возрастает, 1 — решение существует неограниченное время, 2 - время существования решения конечно Замечание Читатели, знакомые с механикой, наверно, заме- тили противоречие между двумя разными значениями термина ’’потен- циал” в модели математического маятника и в системе (8) В первом 80
случае движение определяется дифференциальным уравнением второ- го порядка, во втором — первого Один физик остроумно сравнил это противоречие с разницей между механиками Ньютона и Аристотеля. В самом деле, представим себе движение материальной точки в очень вязкой среде под действием силы Г(х) = -• Сила вязкости пропорциональна скорости, поэтому уравнение движения имеет вид dU тх + ух = -^7. В предельном случае исчезающе малой вязкости это выражение перехо- дит во второй закон Ньютона, определяющий движение частицы в поле с потенциалом U(x). В другом предельном случае оно отражает пред- ставление Аристотеля — чтобы тело двигалось, надо прикладывать си- лу. Термин ’’потенциал” в литературе, посвященной математическому моделированию нелинейных явлений, действительно употребляется в двух смыслах. Далее мы будем уточнять, какой из них имеется в виду, если это не будет очевидно. Корректность и модели нелинейных явлений В начале XX века Ж. Адамар, исследуя уравнения в частных произ- водных, сформулировал условия корректности задачи математической физики. Он назвал задачу корректной, если ее решение: существует, единственно, устойчиво. Устойчивость может пониматься по отношению к малым изменениям начальных данных, краевых условий, параметров уравнения. Теоремы о существовании и единственности для системы обыкно- венных дифференциальных уравнений показывают, что задача с на- чальными условиями (или, как ее называют, задача Коши) является корректной на некотором интервале времени 0 < t < Т. Этот интер- вал может быть конечным, зависеть от правых частей уравнения и от начальных данных. На первый взгляд, кажется, что только математические модели, обладающие свойством корректности, могут претендовать на описание каких-либо явлений природы. Однако анализ ряда нелинейных ма- тематических моделей заставил по-новому взглянуть на корректность. Это привело к более глубокому пониманию различных процессов, по- могло сформулировать несколько оригинальных гипотез, глубже осо- знать ограничения концепции корректности. Обсудим несколько про- блем, возникших в этой области Приведем вначале пример некорректной линейной задачи Уравнение теплопроводности с отрицательным коэффици- ентом. Пусть некоторое явление описывается следующей моделью U( = “Urx , 0 < х < тг, 0 < t < оо и(х, 0) = uo(i). ur(0, О = иг(тг, t) = 0. (14) 81
Уравнение (14) не является экзотикой, как может показаться В са- мом деле, представим, что в результате термической обработки в печи был нагрет некоторый образец. Его распределение температур задава- лось функцией й(х) Далее он был вынут из печи. И через время Т, когда удалось измерить его распределение температур, оказалось, что последнее определяется функцией йо(х) Можно ли по этим данным выяснить, каким был начальный профиль й(х)? Здесь мы сталкиваемся еще с одним примером обратной задачи. По результатам наблюдений йо(х) надо восстановить исходную температу- ру разных точек образца. Очевидно, функция йо(х) является решением уравнения теплопроводности u(z,T) с начальными данными й(х). Чтобы найти = u(xtT) по функции й(т), надо найти реше- ние обычного уравнения теплопроводности с начальными данными й(г). Чтобы найти й(т) по u(z, Т), надо решить уравнение теплопроводности, в котором t заменено на -t на интервале [О, Г], то есть в точности урав- нение (14). Задачи такого типа часто возникают при решении проблем технологии. Другой пример из геофизики. Можно ли по результатам бурения, например, в районах вечной мерзлоты, судить о климате за последние тысячи лет? В самом деле, допустим что на поверхности Земли задан определенный температурный режим T(t), —оо < t < <о> а мы знаем распределение температуры в зависимости от глубины в данный момент tQ - T(xt 10). Можно ли по таким данным судить о зависимости T(t)? В этом случае также приходится иметь дело с аналогом уравнения (14). Эти и другие задачи привели академика А.Н. Тихонова и его учени- ков к обобщению понятия .корректности задачи математической физики и к разработке методов решения некорректных задач Кроме того, уранения типа (14) возникают в физике плазмы, как математическая модель так называемой взрывной неустойчивости. Те- чения газа с отрицательной вязкостью, описание которых требует ре- шения похожих задач, иногда рассматриваются в физике атмосферы. Будем действовать так же, как в случае обычного линейного урав- нения теплопроводности, и искать решение в виде разложения по соб- ственным функциям области {v’jt(x) = cos(kx)} оо и(х, 0 = 52 Ск(1)сох(кх) В результате мы получим бесконечную систему, не зависящих друг от друга, обыкновенных дифференциальных уравнений Ci = l-2Ct (к = 0,1,2,..). Каждое из этих уравнений совпадает с уравнением Мальтуса и имеет решение, как мы видели, существующее при 0 < t < оо: Ck(t) = Ck(Q)ek\ Покажем, тем не менее, что есть начальные данные ио(х), при кото- рых решение задачи (1) существует время, не превышающее конечной 82
величины t/ Пусть vo(r,t/) = Cfc(0)cos(Jtr) = У2е* *'со$(1сх). (15) t=o t=o Напомним, что чем быстрее убывают коэффициенты Фурье, тем более гладкой является функция. (Если при больших k Ct < Akn, n — const, то функция v(z) = £2CfcCos(fcr) имеет непрерывную n-ю производную.) Функция uu(z) является очень гладкой, а именно, дифференцируе- мой бесконечное число раз. Решение уравнения (14) естественно искать в классе ограниченных функций т“г | u(x, I) |< С, у которых существуют производные и<(х, t) и urr(x, t) Покажем, что решение уравнения (14) не будет принадле- жать этому классу уже при t = tf в случае начальных данных вида (15). v(x, t) = е* *е~* tfcos(kx). к=0 При t < tf ряд сходится и решение существует. При f и z = О он стремится к бесконечной сумме положительных слагаемых, т. е. к бесконечности max . . v(x, t) —► оо при t — tf. Таким образом рассмотренное решение не существует на интервале 0 < t < оо. Рис 7 Характерный вид решения уравнения теплопроводности с отрицательным коэффициентом Кроме того, если есть начальные данные uo(^), приводящие к реше- нию, ограниченному при 0 < t < оо, то в силу принципа суперпозиции решение с начальными данными йо(т) = uq(^) + £Ь'о(^» t/) вновь будет существовать только до момента tf, каким бы малым мы ни выбрали значение £ При этом время tf также можно выбрать сколь угодно ма- лым. Таким образом, даже если мы потребуем, чтобы начальные дан- ные в модели принадлежали к классу бесконечно дифференцируемых 83
функций и ограничимся конечным интервалом времени Т, (0 < t < T)t то задача (14) не будет корректной. Физический смысл этих рассуждений очень прост. Обычное уравне- ние теплопроводности ’’делает” за время t из 6-функции Дирака очень гладкую функцию. Уравнение теплопроводности с отрицательным ко- эффициентом ’’прокручивает пленку’’, на которой снято это решение, в обратном направлении: из гладкого профиля через время tj получает- ся дельта-функция. Типичная картина такого процесса представлена на рисунке 7. Еще двадцать лет назад считалось, что уравнения, решения кото- рых не существуют в целом, не имеют физического смысла. Однако с тех пор появились сильные аргументы в пользу анализа некорректных задач. Рассмотрим одну из базовых математических моделей, возника- ющую при исследовании многих нелинейных явлений. Системы с сильной положительной обратной связью. Можно представить, что в ходе цепной реакции, либо при демогра- фическом взрыве скорость изменения изучаемой величины п пропорци- ональна не самой п, а его степени: = п^, п(0) - По, /3>1. (16) at Тогда п>- Р ——=t + c => n(t) = A(tj - , где A = l)^r, tj = (п0(Д- (17) Непосредственно проинтегрировав уравнение, убедимся, что его реше- ние существует только до момента </, называемого временем обостре- ния. Причем сам момент обострения зависит от начального значения переменной п. Чем больше п(0), тем меньшее время существует реше- ние. Поведение решений, при которых одна или несколько изучаемых величин за конечное время возрастают до бесконечности, получили на- звание режимов с обострением (английский эквивалент — with blow up). Отметим, что вплоть до момента tj выполнены условия теоремы существования и единственности. Однако существование решения в не- большой области фазового пространства совсем не означает его глобаль- ного существования (или, как часто говорят, существования в целол<). Типичный вид функции n(t) при различных начальных данных представлен на рисунке 8. В течение длительного времени в системе как будто бы ’’ничего не происходит”. Однако затем, вблизи момента обострения, происходит сверхбыстрый, взрывной рост решения. Пусть некий реальный процесс в течение некоторого времени мо- жет быть описан уравнениями, которые имеют решения, растущие в режиме с обострением. Тогда попытка прогнозировать ход процесса на основе линейной или более сложной интерполяции обычно оказыва- ется обречена на провал. Решения близкого типа были обнаружены в математических моделях экологии и экономики. При этом подход ’’пла- нирования от достигнутого” и логика ’’завтра будет примерно так же, как сегодня” оказываются неприменимы. 84
Режимы с обострением характерны для ряда моделей физики плаз- мы (коллапс ленгмюровых волн, явление самофокусировки, пробой в электромагнитных СВЧ полях и т.д.) и газовой динамики (схождение сферических ударных волн к- центру, класс явлений с отрицательной сжимаемостью) Размышления над простейшими моделями нелинейных явлений, в которых соответствующие уравнения описывают режимы с обострени- ем, привело исследователей к нескольким оригинальным идеям. Обра- тим внимание лишь на две. Одной из нерешенных проблем, стоящих перед естествознанием уже сотни лет, является задача описания турбулентности, — неупорядочен- ных хаотических движений жидкости. Практика убеждает, что в огром- ном количестве конкретных случаев движение жидкости описываются уравнениями Навье - - Стокса. Их можно представить в виде u( = Lu, (18) где u(f, t) поле скоростей, характеризующее состояние жидкости, L — нелинейный оператор, зависящий от функции й и ее производных. Принципиальный вопрос, на который до сих пор нет удовлетвори- тельного ответа, состоит в следующем: позволяет ли математическая модель вида (18) описывать турбулентные течения? Вычислительный и натурный эксперименты показали, что трехмер- ные течения и количественно, и качественно существенно отличаются от двумерных. Многочисленные попытки доказать корректность ря- да задач для уравнения Навье — Стокса, и, в частности, теоремы су- ществования и единственности в трехмерном случае, предпринимались ведущими математиками в течение десятков лет Они оказались безре- зультатными. Это привело Ж. Лере и ряд исследователей к мысли, что причина возникших трудностей кроется не в недостатках существующего мате- матического аппарата, а в фундаментальных свойствах самих уравне- ний Навье — Стокса При этом совсем не обязательно, чтобы скорость в какой-то точке обратилась в бесконечность. Достаточно, чтобы су- ществовали начальные данные, при которых хотя бы одна из простран- ственных производных, входящих в уравнение, перестала существовать. До тех пор, пока не представлены доказательства теорем существования и единственности для трехмерных задач, ученым, вероятно, не удастся отвергнуть эту остроумную гипотезу. Другая идея связана с энергетической программой и реализацией инерциального термоядерного синтеза. В этом случае следует сверх- сильными лазерными импульсами, направленными на ’’мишень” — та- блетку ’’дейтерий — тритиевого льда", сжать ее до такой плотности, при которой возможна реакция синтеза Последовательность таких ядерных микровзрывов и должна служить источником энергии. Физические оценки и компьютерные расчеты, проведенные для до- вольно простых моделей, показали, что величина энергии, которую сле- дует "вложить" в мишень может быть снижена в сотни или даже в тысячи раз. Однако зависимость интенсивности излучения Z(i) долж- на соответствовать не простейшему прямоугольному импульсу (I(t) = /0 при t\ < t < t?, и I(t) = 0 вне этого интервала), а изменяться в течение некоторого времени в режиме с обострением Ф)^(*/~0’°. о > О, 85
т е. так, как показано на рисунке 8. Рис. 8. Характерный вид решения уравнения (16) при разных начальных данных Эта идея в течение ряда лет активно прорабатывалась в крупней- ших мировых центрах в области термоядерного синтеза. И, в частно- сти, в Физическом институте и в Институте прикладной математики им. МВ Келдыша Академии наук. Анализ ряда осложняющих факторов, построение более глубоких и детальных моделей заставили физиков от- казаться от нее. Предпочтение отдано сериям из нескольких импульсов, отличающихся по длительности и длине волны друг от друга, а также сложным многослойным мишеням. Тем не менее простая и яркая идея, опирающаяся на представление о режимах с обострением, сыграла важ- ную роль в развитии термоядерных проектов. Разумеется, ни интенсивность лазера, ни численность населения, ни количество делящихся атомов не могут достигать бесконечных значе- ний Однако если I(t) или n(t) могут стать достаточно большими, то уравнения, имеющие неограниченные решения, могут служить полез- ной идеализацией процессов. Те уравнения, которые в начале века могли бы быть отброшены из-за некорректности, из-за несуществова- ния решения в целом, сейчас активно используются в математическом моделировании нелинейных явлений. Мы обсудили примеры несуществования решений в математических моделях. Другой причиной некорректности задачи может быть неедин- ственность решения. Альтернативная гипотеза, связанная с гидродина- мической турбулентностью, состоит в том, что решение уравнений На- вье — Стокса существует, однако оно неединственно. Другими словами, одни и те же начальные данные могут определять несколько решений Эту возможность иллюстрирует следующий элементарный пример 86
Рассмотрим задачу ^=х,/3. z(0) = 0. at Непосредственно проинтегрировав ее, можно убедиться, что она имеет два решения (см. рис 9) x(t) = (2/3)3/2 t3/2 и x(t) = 0. Отметим, что теорема о единственности в точке фазового простран- ства х = 0, t = 0 неприменима Здесь |i-o= сю и не удается подо- брать постоянную Липшица L. Рис 9 Интегральные кривые уравнения, решения которого неединственно Можно построить пример уравнения, в котором решение неедин- ственно в каждой точке фазового пространства. Если такие точки в фазовом пространстве существуют и в уравнении Навье — Стокса, то для описания турбулентности нужно переходить к другим моделям, где решение при любых начальных данных определялось бы однозначно. Другая возможность состоит в принципиальном отказе от детермини- рованного описания, учете малого шума и случайных процессов в урав- нениях гидродинамики. При этом математическая модель может иметь вид й( = Lu + 6(t), где -- случайная функция. В этом случае нам придется отказаться от детерминированного динамического описания, и говорить о турбу- лентных течениях только на статистическом, вероятностном языке В понятие корректности входят не только требования существова- ния и единственности, но и устойчивости. Исследование нелинейных явлений потребовало существенно изменить взгляд на устойчивость не- линейных систем. Напомним классическое определение. Решение у = y(t, уо) задачи у=^(у). у(°) = Уо (19) 87
называется устойчивым по Ляпунову, если для любого с > 0 суще- ствует значение 6(e) такое, что при || Дуо ||< 6(e) для всех t > О справедливо неравенство II y(t.yo 4- Дуо) - y(t,yo) ||< £ (20) Аттракторы, изучение которых имеет первостепенное значение в рамках исследовательской программы А. Пуанкаре, являются матема- тическими образами установившихся режимов. Кроме того, близкие к притягивающему множеству траектории y(t) из его области притяжения стремятся к аттрактору. Поэтому естественно считать, что траектория принадлежащая аттрактору будет устойчивой. Уже упоминавши- еся особые точки и предельные циклы, будучи аттракторами динами- ческих систем, действительно являются устойчивыми траекториями. Именно это свойство и позволяет предсказывать поведение таких систем, даже если начальные данные уо были известны с некоторой погрешностью. Однако в 70-х годах при исследовании упрощенных математических моделей физики атмосферы с помощью вычислительного эксперимента были открыты так называемые странные аттракторы. Они описы- вают непериодические, хаотические режимы в динамических системах вида (19). Рис. 10. Чувствительность к начальным данным связана с "разбеганием" бесконечно близких траекторий Странные аттракторы не обладают свойством устойчивости. Более того, какое бы малое начальное отклонение Ду мы не выбрали (см. формулу (20)) расстояние между близкими вначале траекториями экс- поненциально растет со временем. II y(t, Уо) - y(t, Уо + Дуо) ||~ еЛ« II Д!/о II, (21) где А > 0 Это лишает нас возможности предсказывать динамику си- стемы, на временах Т ~ 1/А (см. рис. 10). Сколь угодно малая по- грешность в начальных условиях приведет к тому, что при t > Т, мы потеряем какую-либо информацию о положении нашей системы в фазо- вом пространстве. Следовательно, в классическом смысле задачи, свя- занные с изучением странных аттракторов, не являются корректными. Открытие странных аттракторов позволило предсказать и обнаружить ряд интересных явлений, и некоторые из них мы далее рассмотрим. 88
Обсудим более подробно проблему, связанную с устойчивостью ди- намических систем. Для изучаемых объектов обычно выполняются те- оремы существования и единственности на конечном интервале 0 < t < Т. (Ситуация здесь такая же, как с уравнением Мальтуса х = ах. Та- ким образом, |х'(Т)-х"('Г)| < £, если |х(0)-г"(0)| < 6 = еехр(-аТ).) И в этом смысле задача корректна. Однако в рамках исследовательской программы Пуанкаре изучаются аттракторы, т. е. поведение решений при t — оо. И здесь такого значения <5, которое бы гарантировало бли- зость траекторий при 0 < t < оо и которое фигурирует в классическом определении устойчивости решения по Ляпунову, указать не удается (хотя, в отличие от уравнения х = ах, решения могут оставаться огра- ниченными). Это связано не с недостатками определений или ограниченностью используемого формализма, а с интересным физическим явлением, на- званным динамическим хаосом. Математическим образом установив- шегося хаотического поведения в динамических системах являются странные аттракторы. Открытие странных аттракторов оказалось связано с использованием вычислительного эксперимента, а их история насчитывает чуть больше трех десятилетий. Эти объекты были обнару- жены американским метеорологом Э. Лоренцем в 1963 году. Оказалось, что они существуют даже в сравнительно простой системе трех обыкно- венных дифференциальных уравнений, в правые части которых входят только линейные и квадратичные члены. Рис. 11. Вид странного аттрактора, описывающего динамический хаос в одной модели химической кинетики: а) проекция аттрактора на плоскость ((,!/); б) видовая проекция аттрактора. Этот аттрактор порождается динамической системой £ = 2£ - 2£(£ 4- I/) - £u(cos 0 4- с2 sin ©), i> = 2v - 2t/(2£ + 3u-/4) - 2fi/(cos © - ca sin 0) - 2(t//)2u, © = c2(2( - u/2) + sin 0(2< + p) + c2 cos 0(2f — v) 4- 2c\(r/l)2 , при значениях параметров c> = 7,ci = —6,/ = я Пример странного аттрактора представлен на рисунке 11. Если предельный цикл внешне похож на петлю, которая может быть слож- ным образом изогнута в фазовом пространстве, то странный аттрактор похож на клубок траекторий. Представленный аттрактор описывает установившийся режим, возникающий в одной системе типа реакция- диффузия На рисунке 11а представлена его проекция на одну из плос- 89
костей в фазовом пространстве, на рисунке 116 — видовая проекция Она напоминает две ленты, склеенные друг с другом. Если мы будем следить на экране дисплея за тем, как точка, ха- рактеризующая состояние системы, ’’бегает” по аттрактору, то увидим, что она случайным образом попадает то на левую, то на правую ленту Это наводит на мысль дать символическое описание такой траектории в виде бесконечного набора нулей и единиц. Если на it-м витке точка двигается по левой ленте, на fc-м месте последовательности будем пи сать нуль, если по правой — единицу. Оказалось, что такое описание иногда очень полезно. О многих странных аттракторах непрерывных систем гораздо проще говорить на этом предельно простом дискретным языке. Такой подход получил название символической динамики и ак- тивно развивается в настоящее время. Допустим, что мы бросаем бес- конечное число раз монету. Если в Jk-Й раз выпал "орел”, будем писать на k-м месте последовательности, описывающей эту серию, единицу, в противном случае — ноль. Замечательный факт, доказанный для ряда странных аттракторов, состоит в том, что по этой последовательности нельзя отличить динамическую систему от классичекого объекта тео рии вероятностей — серии бросаний монеты. "Странность” странных аттракторов связана с их замечательным свойством, называемым чувствительностью к начальным данным. Вы- берем две близкие точки £'(0) и х*'(0), лежащие на аттракторе, и посмо- трим как меняется расстояние d(t) = |£'(t) - zz/(OI с течением времени. £'(i) и z"(t) это решения исследуемых уравнений, соответственно, с на- чальными данными — £'(0) и £"(0) (см- рис. Ю). Геометрически d(t) соответствует длине отрезка с концами £'(/) и Если аттрактор особая точка, то d(l) = 0. Если аттрактор — предельный цикл, то d(t) будет периодической функцией времени. У странного аттрактора d(t) ~ еА|,А > 0. Для того, чтобы величина А характеризовала аттрак- тор, естественно рассматривать бесконечно близкие траектории и сред- нюю скорость разбегания по большому интервалу времени. Формально ее вводят следующим образом: А(£' (0), ш) = lim lim t-»ood(0)-0 11п tln d(0)J ’ (22) где w — вектор от точки £'(0) к точке £"(0) (см. рис. 10). Понятно, что, выбирая различные точки £*'(0) и £'(01, мы, вообще говоря, будем получать различные числа. Однако в 1968 году В. Осе- ледец показал, что при весьма общих условиях почти все точки £'(0) и £"(0) в окрестности странного аттрактора в TV-мерной динамической системе будут давать один и тот же набор N ляпуновских показателей Ai, , А/v. Смысл их очень прост. Показатель А характеризует изме- нение длины отрезка |£'(0 — £"(()|, изменение площади треугольника с вершинами £'(t), £"(t), £"'(0, пропорционально exp((Aj + A2)t). Изме- нение it-мерного объема — exp((Aj + + At)i). Поскольку мы рас- сматриваем аттракторы /V-мерных диссипативных систем, у которых ^-мерный объем малого элемента в фазовом пространстве сокращает- ся, Aj + А2 + • • • + A/v < 0. Чувствительность к начальным данным, положительные ляпунов- ские показатели заставляют совершенно иначе взглянуть на саму воз- можность предсказания явлений природы. В самом деле, когда аттрак- тор — цикл или точка, то, наблюдая за системой достаточно долго, 90
можно дать достоверный прогноз, даже если F(t) мы знаем с неболь- шой ошибкой (ведь |£'(0 - xzz(/)| не будет расти). Однако у странного аттрактора через время т 1/А две близкие вначале траектории пере- станут быть близкими Существуют фундаментальные ограничения на возможность прогноза в нелинейных системах. Другая ’’странность” хаотических аттракторов связана с их геоме- тричекими свойствами. Часто эти объекты имеют сложную структуру, обладающую масштабной инвариантностью. В мелком масштабе они выглядят примерно так же как в крупном. Вычисление ляпуновских показателей в тех случаях, когда извест- на функция /(f), с помощью компьютера достаточно просто Однако для этого следует использовать не определение, а рассматривать так называемую систему в вариациях. Пусть известна траектория x(t). Рассмотрим близкую траекторию x‘(t) = f(t) + y(t). Тогда X = f(x) X1 = f(x) => X + у = fix + у) Я fix) + ox f(0) - Xq Z(0) = xQ => y(0) = - f0 Здесь = A(f(i)) — матрица системы, линеаризованной в окрест- ности траектории x(t) Если траектории x(t) и z'(t) бесконечно близ- ки, то членами, квадратичными по у, можно пренебречь. Тогда при ||у(0)|| —► 0 отклонение траектории xr(t) от x(t) определяется системой в вариациях для y(t) A(x(t))y, Д= lim [111М], у(0) = уо. (23) U llvoll J Ясно, что определенный таким образом ляпуновский показатель эквивалентен исходному, заданному соотношением (22). Однако ис- пользование формулы (23) в расчетах представляется более простым и точным. Другими словами, чтобы определить старший ляпуновский показа- тель, наряду с исходным уравнением считают систему в вариациях (23). Чтобы решение y(t) не было слишком большим, через определенный интервал времени его перенормируют (делят на достаточно большое число). В соответствии с этим модифицируется и формула (23) Пере- нормировка нужна, чтобы повысить точность определения показателей. Взяв наугад уЬ, мы обычно получаем первый ляпуновский показатель. Чтобы оценить р ляпуновских показателей Aj, А2, , Ар считают р систем в вариациях Вычисляют р-мерный объем и пользуются соотно- шениями, аналогичными формуле (23). Здесь через определенное время приходится проводить не только перенормировку у\, ,ур, но и орто- гонализацию. Последнее связано с тем, что все векторы у2| , ур с течением времени стремятся повернуться вдоль yi, соответствующего наибольшему ляпуновскому показателю В настоящее время ляпуновские показатели являются одними из наиболее эффективных и просто вычисляемых характеристик динами- ческого хаоса. 91
Приведенные примеры иллюстрируют общие черты, связанные с из- учением нелинейных явлений. С одной стороны, исследование простей- ших нелинейных явлений заставляет по-новому взглянуть на фунда- ментальные понятия, связанные с моделированием. С другой стороны, изучение простейших объектов в этой области дает возможность стро- ить оригинальные содержательные гипотезы. Вопросы и задачи 1. В реакторе началась цепная реакция, в ходе которой скорость из- менения концентрации вещества п изменяется по закону 0п* t (/? > 0, 7 > 1). В начальный момент этого вещества в реакторе нет. С течением времени вещество вводится в реактор по закону at2 Оценить время, через которое реакция закончится, либо простей- шая модель, описывающая изменение концентрации только одного вещества, станет неприемлемой? 2 Экологи построили модель, определяющую изменение численно- сти популяции, которая описывается уравнением г = F(x). Равновесная численность популяции определяется особой точкой этого уравнения г*. В силу специальных причин оказывается, что dF(x’)/dx — 0. Устойчиво ли это положение равновесия? Что будет происходить, когда численность популяции х будет близка К I*? 3 Упрощенной математической моделью некоторой химической ре- акции является уравнение х — (х — a)(i — b)(x — с)(х — d)(x — е), т(0) = х, Q<a<b<c<d<e. Как будет вести себя концентрация z(t) на больших характерных временах при различных значениях х? 4. Допустим, мы решаем задачу п = /? > 1, n(0) = п с помощью метода Эйлера с шагом по времени г. Будет ли полу- ченное численное решение согласовываться с решением исходно- го дифференциального уравнения? Будут ли совпадать их каче- ственные особенности? 5. Скорость таяния снежка, внесенного в помещение, пропорциональ- на площади его поверхности S. Пусть один снежок, имеющий фор- му шара, в два раза больше по объему, чем второй. Какая часть первого снежка останется, когда первый растает полностью? Рас- смотрите также более общую модель, в которой скорость таяния предполагается пропорциональной Sa. При каких показателях а процесс таяния снежка занимает конечное время? 92
6. Многие демографы считают, что уравнение Мальтуса х = az, (a) следует заменить другой моделью, лучше согласующейся с кривой роста народонаселения за последние 100 тысяч лет х = ax*+t, г > 0. (6) Каково Ваше мнение об этой модели? Какова ее область приме- нения? В чем качественное отличие моделей (а) и (Ь)? Рекомендуемая литература Представления о дальнейшем развитии качественной теории обыкновен- ных дифференциальных уравнений дают книги: Баутин Н.Н, Леонтович Е.А. Методы и приемы качественного исследования динамических систем на плоскости. М.: Наука, 1976; Хартман Ф. Обыкновенные дифференци- альные уравнения. М/ Мир, 1970; Полис Ж., ди Мелу В. Геометрическая теория динамических систем: Введение. М.: Мир, 1986; Арнольд В.И. Допол- нительные главы теории обыкновенных дифференциальных уравнений. М., "Наука”, 1978; Рейссиг Р., Сансоне Г., Конти Р. Качественная теория нели- нейных дифференциальных уравнений. М.: Наука, 1974; Еругин Н.П. Книга для чтения по общему курсу дифференциальных уравнений. Минск: Наука и техника, 1979. Введение в теорию некорректных задач дает книга: Тихонов А.Н., Арсе- нин В.Я. Методы решения некорректных задач. М.: Наука, 1974. О динамическом хаосе в сосредоточенных и распределенных системах и о математических моделях, в которых решения, не существующие в целом, играют ключевую роль, рассказывают книги: Странные аттракторы. М.: Мир, 1981; Ахромеева Т.С., Курдюмов С.П., Малинецкий Г.Г., Самарский А.А Нестационарные структуры и диффузионный хаос. М.: Наука, 1992; Самарский А.А., Галактионов В.А., Курдюмов С.П., Михайлов А.П. Режимы с обострением в задачах для квазилинейных параболических уравнений. М.: Наука, 1987.
Escher М.С. Metamorphosis II. 1939-40 Эшер М.К. Метаморфозы II
ГЛАВА 5 ЭЛЕМЕНТЫ ТЕОРИИ БИФУРКАЦИЙ Что ожидает нас в более слож- ных уравнениях, если даже в та- ком простом уравнении, с одним единственным параметром, мы ви- дим такое разнообразие возможно- стей? Р. Фейнман Вернемся к задаче о моделировании обсуждавшейся автокаталити- ческой реакции. Будем рассматривать установившиеся режимы. При этом состояния равновесия будут определяться корнями кубического уравнения -kzx3 4- fci4x2 - kjBx 4- = 0. Особый интерес представляют те значения параметров А, В, С, при ко- торых меняется число или устойчивость состояний равновесия. Раз- дел математики, позволяющий находить такие значения параметров и анализировать решения в их окрестности, получил название теории ве- твления или теории бифуркаций. Эта теория стала одним из наиболее эффективных методов анализа нелинейных явлений. Классической за- дачей этой теории, поставленной еще в прошлом веке, является задача об изгибе колонны Представим себе колонну прямоугольного сечения, на которую свер- ху действует нагрузка Р (рис. 1). При увеличении нагрузки колонна будет укорачиваться и утолщаться, но ее ось будет оставаться прямой Однако при некотором критическом значении Рс картина качествен- но изменится — колонна потеряет прямолинейную форму и прогнется вправо или влево. При Р < Рс у колонны есть единственная равновес- ная форма При Р < Рс их три: прямолинейная форма, которая стала неустойчивой, и две устойчивые (одна соответствует прогибу вправо, другая — влево). Если мы нарисуем зависимость отклонения А оси колонны от величины нагрузки Р, то картина будет такой, как пока- зано на рис. 2. На этом и других рисунках в этой главе устойчивые состояния равновесия лежат на сплошной кривой, неустойчивые — на пунктирной. При Р = Рс изменяется число состояний равновесия и 95
их устойчивость. Изменение числа и устойчивости решений уравнения называется ветвлением или бифуркацией решений. Это типично нели- нейное явление. Классическая линейная теория упругости дает в этом случае единственное прямолинейное состояние равновесия. Рис. 2. Зависимость отклонения оси колонны от величины нагрузки. Сплошная линия соответствует устойчивым состояниям равновесия, пунктир — неустойчивым Задачей о потере устойчивости колонны занимались Эйлер, Бернул- ли, Лагранж. Одним из первых термин "бифуркация” ввел К. Якоби в 1834 г. Однако в полной мере значение теории бифуркаций было осо- знано А. Пуанкаре в конце прошлого века. Пусть нам известно решение некоторой нелинейной задачи при зна- чении параметра А = Ао1 тогда можно попробовать найти решение и при Ao -I- ДА, где ДА — малое число. При этом наш анализ становится локальным — вместо поиска общего решения мы ограничиваемся изуче- нием того, что происходит с конкретным решением в окрестности одного значения параметра. Естественно в первую очередь выбрать наиболее важные значения параметра, где поведение системы качественно меня- ется, т. е. точки бифуркации. При этом важнейшей целью становит- ся выяснение всех основных типов бифуркаций в различных задачах. А. Пуанкаре полагал, что решение этой большой и сложной проблемы поможет в исследовании многих конкретных нелинейных явлений. Простейшие типы бифуркаций, характерных для систем реакция- диффузия, рассмотрим на следующем примере. Пусть у нас есть химическая реакция, в которой изменение концен- трации интересующего нас продукта зависит от самой концентрации I и внешних воздействий, которые могут описываться параметром А Это дает обыкновенное дифференциальное уравнение dx ^ = F(«,A). (1) at Решения этого уравнения ведут себя очень просто. При t —» оо функция r(t) стремится к постоянному значению х. Будем считать, что неогра- ниченных решений это уравнение не имеет. Таких значений х может быть несколько: ii, х? и т. д. Понятно, что при этом F(i,A) = 0. (2) В зависимости от начальных данных т(0) решение стремится к одному из гп. Поэтому осталось решить уравнение (2) и найти зависимость всех его корней от параметра А . 96
Допустим, что нам известно какое-либо одно решение уравнения (2) Sx0tA0). Для того, чтобы найти решение при близком значении А = 4- ДА, ДА < 1, можно воспользоваться формулой Тейлора F(x0 + Дг.>о + ДА) - Г(*о.Ао) + ДА + 9F(*-Ao)4x+ 0л иХ + 1 ra*F(zo, Ао)(Дд)2 + 2Э^(х°’ Ао) ДхДА + Щ^^ДА)1] + д, 2 I ох* охол од* j (3) где G — остаток ряда, в который входят члены, пропорциональные (Дх)3, (Дх)2ДА, Дх(ДА)2, (ДА)3 и т. д., его конкретный вид для нас не важен. Поскольку нас интересует состояние равновесия, то положим F(ro + Дх, Ао + ДА) = 0. Но тогда получаем при Дх —► О, ДА —* 0 Дх = _^о) М’1 0А [ ОХ Из этой формулы следует, что если значение 0Г^Л°) отлично от ну- ля, то мы можем приближенно определить новое состояние равновесия (рис. 3). Такое состояние, судя по формуле (4), будет одно, а значит, в точке Ао, хо не происходит бифуркации. Рис. V Ситуация, в которой можно воспользоваться теоремой о неявной функции В соотношении (4) мы учли только два ненулевых члена в ряде Тей- лора (3). Встает вопрос, насколько это правомерно и какое отношение это имеет к интересующей нас нелинейной задаче (2). Ответ на него дает, известная из курса математического анализа, теорема о неявной функции, играющая ключевую роль в теории бифуркаций. Напомним ее; Пусть F(xq.Xq) = 0, и пусть функция F является непрерывно дифференцируемой в некоторой области плоскости (х,А). Тогда если —# 0» то существуют постоянные а и Р, такие, что: 1 Уравнение (2) имеет единственное решение х = х(е), когда Ао - а < А < Ао + or, такое, что х0 - Р < х < х0 + Р- 97
2. Функция х = z(A) непрерывно дифференцируема при Ао — а < А < Aq 4- or. 3 A)/<f(x(A),A). За-мечание. Уравнение (2) можно разрешить относительно А = А(х), если |у(х0, ^о) # 0. Точки, в которых выполняются условия теоремы о неявной функ- ции будем называть регулярными точками уравнения (2). В ходе вычи- слительного или натурного эксперимента часто получают зависимости х = х(А), или, как их называют, бифуркационные диаграммы. Поэтому важно представлять типичный вид таких диаграмм, изменение правой части, а также простейшую модельную систему, где такие бифуркации возможны х = h(x, А). Набор таких диаграмм, включающий кроме об- суждаемых еще несколько возможностей, представлен в таблице 1. Может оказаться, что — 0, и тогда нужно учитывать сле- дующие слагаемые. Если — / 0, то вместо (4) получится следу- ющая формула: Д. = ± = ±ч/^дл (s) У ОЛ \ ох* / t Здесь картийа другая (рис. 4) — при А > Ао появились два решения, а при А < Ао их нет совсем (если считать, что ci положительно). Точки (ло,Ао) в которых производная меняет знак и эг(*°’Ло) £ 0 будем называть регулярными экстремальными точками. Рис. 4. Пример регулярной экстремальной точки. В этой точке "ниоткуда" возникает два состояния равновесия Пример такого Поведения дает все та же задача о нагрузке колонны. Пусть в начальном состоянии колонна не идеально прямая, а немного изогнута в одну сторону. Тогда зависимость максимального изгиба от нагрузки, изображенная на рис. 2, изменится и станет такой, как пока- зано на рис. 5. Если колонна находится в устойчивом состоянии, соответствующем точке на нижней ветви бифуркационной диаграммы (см. рис. 5), и на- грузка медленно уменьшается, то при некотором значении Р произойдет скачкообразный переход в другое равновесное состояние на верхней 98
ветви. Это явление, получившее название "хлопка”, используется в технике Изменение типа бифуркационной диаграммы, например, при малом нарушении симметрии изучаемой системы, исследуется одним из разделов теории бифуркаций — теорией несовершенств Рис. 5. Бифуркационная диаграмма, соответствующая деформации неидеальной балки, либо эффекту ”хлопка” Отметим, что если бы мы рассматривали х как независимую, а Л как зависимую переменную, то в случае регулярной экстремальной точки была бы применима теорема о неявной функции. Однако в исходных переменных в точке (zq, Ао) происходит бифуркация — "ниоткуда” ро- ждаются два состояния равновесия. Можно показать, что заключения, связанные с анализом несколь- ких первых членов ряда Тейлора, относятся и к решению нелинейной задачи (1). А именно: в окрестности регулярной экстремальной точки бифуркационная диаграмма определяется соотношением А-Ао = v(z)(z-z0)“. v(zo,Ao) = v0 / 0, Az = z-z0, Fa(z0,A0) # 0 (6) В самом деле, перейдем к новым переменным и рассмотрим кривую G(v,x) = 2Г(х,А)/(Дх)2 = 2W(x)FA(r0,A0) + F„(z0, Ао) + О(| Дх |) (см. ряд Тейлора (3)). В него подставлено вместо ДА выражение u(z) |Дх |2 Определим v(z) так, чтобы u(z0, Ao)Aa(zo, Ао) + Frt(z0, Ао) = О Для этого достаточно, чтобы v0 ~ u(zq) = 1/cj (см. формулу (5)). Кро- ме того — f\(z01A0) / 0 (по предположению). Следовательно, для функции G(u,z) в точке (иО1хо) выполнены условия теоремы о не- явной функции. Это гарантирует существование функции v(z) и сле- довательно существование решения вида (6) в окрестности регулярной экстремальной точки. На бифуркационной диаграмме кривые, на которых лежат устойчи- вые состояния равновесия, отмечены сплошной линией Линии соответ- ствующие неустойчивым состояниям равновесия, показаны пунктиром 99
Типы простейших Название ^/слоЗае х'=х(Л) Регулярная точка х i А. *о А* Регулярная экстремальная точка F3¥=O, F = о A i А^ ОсоЗь/е тачки Дбойньте точки 1 \ 7 * \ / \/ /\ / \ / \ Особая экстремальна я точка ^0 В>0 X i Г X* Сопряженная точка D < 0 i 1 • L “X* Обозначения; J- А<Лр; 2~АшЛр;
особых точек крибой Г(х,Л) =0 F(x,A) и (Л, А) Простейшая система W IvM' / z r x =A~x L JC x =Л~хг Fl-o. гл-о 3 ~ * > \
Из таблицы видно, что в регулярной экстремальной точке рождаются устойчивое и неустойчивое состояние равновесия. Покажем, что это действительно так Как было показано ранее, устойчивость состояния равновесия (х*, А*) в системе х = F(xt А) опре- деляется величиной а = ^у(хв,А‘). Продифференцируем по х формулу F(z,A) = 0, считая, что А = А(х), (это соответствует тому, что мы рас- сматриваем некоторую кривую, например, бифуркационную диаграм- му) 5Г(т01А0) aF(xO1Ao)dA(ro) дх + дХ dx Или _ dF(z0,A0) . 5F(z0,A0) Q — --------- = — Л г-—-----, дх ЭА По предположению в регулярной экстремальной точке / 0 и существует кривая А - А(х), у которой производная в точке хо ме- няет знак Следовательно на одной ветви, выходящей из точки (хо, Ао), состояния равновесия будут устойчивы (а < 0), на другой (а > 0) — нет. Обратим внимание на изменение потенциала в регулярной экстре- мальной точке При А < Ао, функция У(х) представляет собой мо- нотонно возрастающую кривую, при А = Aq у нее появляется точка перегиба. ПричА > Ао возникают максимум и минимум. Рис 6 Бифуркации, возникающие в тех случаях, когда их тип определяется квадратичными членами: а) особая экстремальная точка, ’’внлка"; 6) транскритическая бифуркация "обмен устойчивостью"; в) изменив направление параметра А и знака правой части переводит картину, показанную на рисунке а) в подкритическую бифуркацию, представленную на рисунке в) Особыми точками кривой F(x, А) = 0 будем называть, точки, в которых Fr(z0,A0) = Fa(z0jA0) = 0 (7) Двойная точка кривой Г(т, А) = 0 — это особая точка, через кото- рую проходят две и только две ветви F(x,A) = 0, имеющие разные касательные В такой точке не все вторые производные одновременно обращаются в нуль. 102
Особая экстремальная точка кривой F(xt А) - 0 — это двойная точка, в которой хд изменяет знак на одной ветви (см. рис 6) Сопряженная точка — это изолированное особое точечное решение F(x. А) = 0. Итак, мы рассматриваем ситуацию, когда равны нулю все первые производные и отлична от нуля хотя бы одна вторая Выясним, при каких условиях на производные мы будем иметь дело с двойной особой точкой, особой экстремальной или сопряженной точкой В двойной точке функцию F(xtX) можно представить в виде 2F(z, А) = F„(z0, A0)(4z)2 + 2Fxa(z0, А0)ДхДА + +Faa(z0, А0)(ДА)2 + О[(| Дх | + | ДА |)2]. (8) Поскольку далее все производные будут относиться к точке (хо.Ао), аргументы у этих функций мы будем опускать. Обозначим через k = Дх/ДА тангенсы углов наклона касатель- ных к кривым, выходящим из точки (xq, Aq) Перейдем к пределу Дх —► 0 и ДА —» 0. Это позволит учесть только первые три члена в формуле (8). Разделив на (ДА)2 получим квадратное уравнение для коэффициента k. F„i2 + 2FrAt + Faa = 0. (9) Следовательно 4” = fci = -FXA/Frl + z^ = ^ = -f'^IFII-\fDTF2I, (10) где D = F^ - FItFxx. Если D < 0, то не существует касательных, проходящих через (xo.Aq), и мы имеем дело с сопряженной точкой. Если D > 0, то из точки (хо, Ао), как видно из формулы (10), выхо- дят две ветви с различными касательными. И следовательно это двой- ная точка (см. рис. 66). Пусть D > 0 и Frr = 0, тогда Егд / 0 и исходное уравнение можно представить в виде ДА[2*Ггл+Ла] = 0. Это соотношение определяет две касательных с тангенсами наклона Аг(хо, Ао) = 0 и k = -Faa(xo, Ao)/2Fxa(io,Ao)- В случае D = 0 кривые имеют касание более высокого порядка и не могут быть отнесены к одному из перечисленных классов. Вновь, пользуясь теоремой о неявной функции, можно показать, что наличие соответствующих касательных при D > 0 гарантиру- ет также существование двух ветвей решений нелинейного уравнения F(x,A) = 0, выходящих из точки (хо, Ао). В самом деле, положим Дх = и(х)ДА и v(io) = ха(хо), где ia(i0) = или тд(х0) = k2 (см формулу (9)). Перейдем к новым переменным и введем функцию G(v,z) = 2F(z, А)(ДА)-2 — Faa-1 2FXtv 4 F„«2 + i(Fr„v3 + 103
+3/\ггди2 + 3Fzaav + Faaa}(AA) 4- о(ДА). Однако <7(vo,xo) = 0 для каждого из двух значений Vo, которые полу- чаются из уравнения (10). Кроме того I Gv(uo,zo) |=| 2(v(z0)F„ 4- Лх) |=| 2(za(x0)F„ + FaJ |= =| 2(-ГЛг ± y/D + FaJ |=| 2VD I/ 0. Здесь мы воспользовались соотношением для k и предположением, что D 0. Таким образом выполнены условия теоремы о неявной функ- ции, поэтому можно утверждать существование двух ветвей решений уравнения F(z,A), имеющих вид ДА = u(z)Az и выходящих из точки (хо, Ао). Проводя несложный анализ устойчивости, и нарисовав графики по- тенциала и бифуркационные диаграммы, заполним еще три строки в таблице 1.' Обратим внимание на то, что в особой экстремальной точке (в которой пересекаются две ветви бифуркационной диаграммы, у од- ной из которых ха меняет знак) при А < Ао может существовать одна устойчивая ветвь При А > Ао возникает своеобразная ’’вилка”, — эта ветвь потеряет устойчивость и появятся две новые устойчивые ветви (см. также рис. 6). Особенно наглядна перестройка потенциала, у ко- торого вместо одной потенциальной ямы рождаются две и появляется новый "холм”. Развитие теории бифуркаций С теорией бифуркаций связано два крупных принципиально важных направления в нелинейной динамике. Каждому из них посвящено мно- жество книг. С математическим аппаратом этой теории и даже основ- ными приложениями нельзя познакомить во вводном курсе нелинейной динамики. Тем не менее, даже если не удается рассмотреть отдельные "деревья”, полезно взглянуть на контуры "леса" — основные идеи и проблемы теории. Первое направление связано с обобщениями на более сложные, в частности, пространственно-распределенные системы. Очень важным оказалось обнаружение обсуждавшихся выше простейших бифуркаций и тех бифуркаций, о которых речь пойдет в главе 7, в математических моделях, описывающих процессы в нелинейных средах. Это позволило по-новому взглянуть на способ "понимания” процес- сов в сложных системах. Оказалось, что здесь часто удобно пользо- ваться аналогом "исторического подхода” — выяснять, что было при предшествующих и последующих значениях параметров, смотреть ка- чественные особенности "соседей" по параметрическому пространству. "Понять” возникновение того или иного режима — сейчас означает по- следовательность бифуркаций, приводящую к его появлению. Выясни- лось существование нескольких универсальных сценариев перехода от простейших упорядоченных режимов (которым могут соответствовать особые точки или предельные циклы) к хаотическому, турбулентному поведению в диссипативных системах (которому могут отвечать стран- ные аттракторы). Многочисленные компьютерные эксперименты, которые проводи- лись в последние двадцать лет, показали, что мы имеем дело с новым уровнем единства В начале века единство природы, проявляющееся 104
в универсальности математических моделей, исследователи видели в том, что множество самых разных явлений описываются линейными уравнениями в частных производных второго порядка Сейчас во мно- жестве случаев пишутся различные уравнения, однако способ усложне- ния аттрактора, последовательность бифуркаций или, как его называ- ют, сценарий перехода к хаосу, оказывается одним и тем же Единство оказывается связано не с появлением аналогичных уравнений, а с уни- версальным качественным поведением. Сверхзадача в этом направлении связана с анализом возникновения гидродинамической турбулентности, и, в частности, с исследованием уравнения Навье—Стокса Последнее описывает движение вязкой не- сжимаемой жидкости и( + v gradv = -gradp + f(x) 4- — Ди, г G О, divv = 0, i Е П, v — д(х), х 6 дО, (11) Здесь v — поле скоростей жидкости, р — давление, член /(т) характе- ризует заданную внешнюю силу. Уравнение должно решаться в трех- мерной области Q с границей ЭП. Компоненты вектора v gradv имеют вид dvi dvt dvi vi-x— + , OX\ UX2 CrXj i = 1,2,3. В уравнение (а точнее в систему трех параболических уравнений) вхо- дят четыре неизвестные функции Vi (х, t), vjf1. 0,из(х, t),р(х, t). Усло- вие divv — 0 позволяет исключить одну. Число Рейнольдса играет роль бифуркационного параметра. Член ^Ди описывает вязкость. Часто физически интересные значения параметра R лежат в интервале от 103 до 106. Следовательно, мы имеем типичный пример задачи с малым па- раметром при старшей производной, сложной как для численного ана- лиза, так и для аналитического исследования. Основные трудности свя- заны с членом v gradv. Читатель может проанализировать уравнение и( + vt>1 = 0 и убедиться что его решение не обязательно существовует в целом, поэтому просто ’’выбросить” стабилизирующий "вязкий” член Ди//? нельзя. В исследование этой математической модели были вложены огром- ные усилия. При изучении конкретных течений были достигнуты впе- чатляющие успехи. Теория бифуркаций помогла детально проанали- зировать потерю устойчивости простейших течений В последние годы использование суперкомпьютеров позволило получить большую инфор- мацию о статистических Свойствах турбулентных течений, о поведении жидкости вблизи стенок труб или каналов. Тем не менее невыясненными остаются многие принципиальные де- тали, и мы до сих пор не можем убедительно ответить на вопрос, "играет ли Бог в кости" в этих явлениях или нет Достаточно ли выписанной модели или других гидродинамических уравнений, представляющих со- бой детерминированные уравнения в частных производных, решения которых единственны и существуют при 0 < t < ос для моделирова- ния наблюдаемого хаотического поведения7 Либо нужны малые слу- чайные силы и радикальный отказ от детерминистического описания турбулентных течений 105
Другой классической областью приложений теории бифуркаций явля ется теория упругих оболочек. Нелинейные задачи теории упругости, которые обобщают упоминавшуюся задачу о прогибе балки, оказались очень важны для многих задач строительной механики Гораздо более простым объектом для бифуркационного анализа ста- ли модели типа ’’реакция—диффузия” X = Di Xrr + f(X'Yt А) Г( = D2Yrr + $(Х,У,А) (12) О < г < /, 0 < t < оо, Х(г,0) = %о(г), Г(г,0) = Го(г), Xr(OJ) = Xr(l,t) = Гг((М) = Yr(/t £) = 0. Здесь члены £>] Хгг и £?2^гг описывают диффузионные процессы, не- линейные функции f(X.Y А) и g(X,Yt А), зависящие от параметра, — кинетику химических реакций. Первая модель такого типа была предложена А Тьюрингом в 1952 году для математического описания клеточной дифференцировке, или морфогенеза. Этот класс задач связан с появлением различий, возни- кающих в ходе развития у разных клеток, которые обладают одина- ковой генетической информацией. В соответствии с подходом А. Тью- ринга этот процесс связан с химическими реакциями, которые в про- стейшем случае описываются моделью (12). При изменении параме- тра при А < Ао аттрактором является пространственно-однородное ста- ционарное распределение концентраций X и Y. При А > Ао проис- ходят бифуркации, приводящие к тому, что аттрактором становятся пространственно-неоднородные стационарные распределения. Выход па них происходит с целого класса начальных данных Хо(г), Уо(»")- Эти распределения были названы стационарными диссипативными струк- турами для того, чтобы подчеркнуть принципиальную роль диссипа- тивных процессов в формировании этого типа упорядоченности. Диссипативные структуры возникают во многих нелинейных откры- тых системах, т. е. системах, способных к обмену энергией или веще- ством с окружающей средой. На рисунке 7а представлен характерный вид стационарных дисси- пативных структур в одной из наиболее известных систем вида (12) - модели брюссслятора. Название связано с тем, что она была предложе- на в брюссельской научной школе, возглавляемой И. Пригожиным Эта модель описывает распределения реагентов в некоторой автокаталити ческой реакции. В ней f = А — (В + 1)Х + X2Y, g = ВХ — X7Y, где А и В считаются постоянными. В качестве бифуркационного параметра в этой модели часто выступает величина В или длина области /. Типичный вид бифуркационной диаграммы для модели брюсселято- ра показан на рисунке 76. Видно, что все бифуркации за исключением одной здесь в точности такие, как в рассмотренной модели г = /(z,A). Причину этого можно пояснить следующим образом Грубо говоря, мо- дели, представляющие собой уравнения в частных производных, можно представить как бесконечные системы обыкновенных дифференциаль- ных уравнений. Переменными в этих уравнениях могут, например, быть Фурье-компоненты функций X и Y. Аттракторами этих уравнений так- же могут быть особые точки в бесконечномерном фазовом простран- стве. Именно эти точки и соответствуют стационарным диссипативным структурам. Поэтому вполне естественно здесь должны возникать би- фуркации, типичные для особых точек. 106
Рис. 7. Стационарные диссипативные структуры: а) типичный пример стационарного пространственного распределения веществ в модели брюсселятора; 6) пример бифуркационной диаграммы. Переменная М может быть максимумом, нормой либо другой величиной, характеризующей возникающую структуру ’’Необычная” с точки зрения простейшей динамической системы г = и(т), показанная на рисунке 76, — рождение трех неустойчивых ветвей из одной неустойчивой — точка 3 Она связана с тем, что в отличие от модели (1), где зависимость аттрактора от параметра z(A) полностью характеризует решение, в модели (12) бифуркационная диа- грамма представляет собой только проекцию на некоторую ось вектора х из бесконечномерного пространства. Поэтому решение может терять устойчивость по другому направлению, связанному с пространственной неоднородностью решения. Возникновение одних и тех же бифуркаций в сложных и простых си- стемах привело к рождению направления мягкого моделирования, ко- торое иногда называют "стратегической фантастикой” В теории эво- люции, при моделировании социальных процессов, в исследовании не- обратимо развивающихся объектов эксперты часто выделяют поворот- ные пункты, ситуации, в которых была выбрана одна из альтернатив Естественно такие точки отождествить с точками бифуркации в неко- торой динамической системе. Разумеется, это правомерно, если речь идет о процессах, развивающихся по своим внутренним законам, а не зависящим кардинально от внешнего управления Сказанное можно проиллюстрировать примером, в котором дела- лась попытка сопоставить различным сценариям исторического разви- тия, выделенным выдающимся историком XX века А.Дж. Тойнби, раз- личные бифуркационные диаграммы Будем предполагать, что в каче- стве параметра А, отложенного по оси ординат, выступают реальные доходы на душу населения, в качестве бифуркационного параметра А, отложенного по оси абсцисс — время 107
Пусть с течением времени климат меняется и урожайность зерновых культур в некотором государстве падает. Выращиваемого на доступных посевных площадях становится недостаточно. Возрастает социальная нестабильность, сообщество подходит к точке бифуркации. По термино- логии А.Дж. Тойнби обществу "брошен исторический вызов” На него можно отреагировать разными способами. Например, уменьшить по- требности, перенести внутренние проблемы вовне и начать проводить жесткий курс по отношению к соседям (Путь Ликурга). Этому ответу соответствует нижняя ветвь на рисунке 8а (точка А]). Второй ответ, например, колонизация заморских территорий, в которых государства находятся на более низкой стадии развития и не могут оказать серьезно- го сопротивления. Следующий выбор (точка А2), например, может быть связан с тем, направить ли силы на то, чтобы стать торговой державой, либо обосноваться за морем ’’всерьез и надолго”. Труды А.Дж. Тойнби и ЛИ. Гумилева дают много эпизодов, где развитие шло в соответствии со сценарием, представленным на диаграмме 8а. Диаграмма, предста- вленная на рисунке 86, может соответствовать кризису ’’общества по- требления", имеющего весьма высокие жизненные стандарты. Рис. 8. Характерные примеры бифуркаций, возникающие в задачах, связанных с историческим анализом. Точка бифуркации соответствует здесь ситуации, в которой у системы появляется несколько путей развития, либо происходят катастрофические изменения Но, пожалуй, гораздо интереснее и важней анализировать и пред- сказывать ситуации, представленные на рисунке 8в. Эта картина соот- ветствует, например, разрушению окружающей среды при использова- нии традиционных технологий природопользования, резкому пониже- нию жизненных стандартов и выходу с течением времени на уровень возобновляемых ресурсов. Две верхние изолированные ветви (устойчи- вая и неустойчивая) соответствуют, например, новой технологии при- родопользования. И здесь становится ясна большая польза диаграмм, подобных нарисованным. Допустим, что мы никоим образом не пред- ставляем кривой своего исторического развития. Тогда нас ожидают 108
катастрофы, бедствия и серьезные неприятности в точках Аз и А< (см. рис. 8в). Однако, если мы имеем развитый и эффективный аппарат прогно- за, то ситуация существенно меняется Допустим, что управление и мобилизация ресурсов общества позволяет в течение некоторого интер- вала времени (А. А + ДА) несколько изменить ход развития, сместив бифуркационную диаграмму на этом промежутке. Тогда становится применима к этой ситуации пословица ’’предупрежден, следовательно вооружен” Здесь может оказаться ’’поворотный пункт” А", где мобили- зация ресурсов и усилий с целью перейти на верхнюю ветвь разумна и оправдана. Именно на этом участке исторического развития могут быть осуществлены такие программы. Позже для этого попросту может не оказаться возможностей. Ситуация очень похожа на ту, которая сложилась у геофизиков, за- нимающихся прогнозом землетрясений: чем более обоснован и достове- рен прогноз, тем более масштабные и энергичные меры можно предпри- нять, чтобы уменьшить ущерб от стихийного бедствия. Разумеется, ин- терпретация исторических событий, использующая представления тео- рии бифуркаций, либо получение прогнозов, немыслима без активного участия профессионалов-историков. Основы классического подхода к анализу бифуркаций были зало- жены на рубеже XX века А. Ляпуновым и Е. Шмидтом. Эти методы были развиты в тесной связи с решением прикладных задач о фигурах равновесия вращающейся тяжелой жидкости и о решении нелинейных интегральных уравнений. Идею этого подхода можно пояснить на следующем примере, связан- ном с уравнением (1). Обратим внимание на важную зависимость ме- жду бифуркациями и устойчивостью исследуемых решений. В самом деле, устойчивость особой точки (z’,A*) уравнения (1) определялась решением линеаризованной задачи Представим решение этого линейного уравнения в виде у = у То- гда мы получим, что устойчивость состояния равновесия определяется задачей на собственные значения для некоторого линейного оператора А .дГ(х‘,А) fiip = Aip, А = -------------------------- Здесь р является собственным значением, — некоторой собственной функцией, а оператор сводится к умножению на число. Мы видели, что бифуркации происходили в тех точках, где dF(x*, Х*)/дх = 0 (в против- ном случае можно было применять теорему о неявной функции). Но это именно те точки, в которых состояние равновесия теряет устойчивость. Ситуация в общем случае оказывается близкой. В качестве т, у и у? здесь выступают векторы в гильбертовом пространстве Н (полном ли- нейном пространстве, в котором определено скалярное произведение). Линеаризованная задача имеет вид Lju = pLju- где £| и L? - огра- ниченные линейные операторы в Н Бифуркационная задача может быть дописана в виде L\u + /Ущ = 109
Здесь Ni и Na строго нелинейные операторы, т. е. N.(0) = 0; ||Niu||< Jb||u|r* + O(||u|n); > i; = 1,2. Отсюда ясно, что бифуркационная задача имеет нулевое решение при всех значениях параметра и. Справедлива следующая теорема. Теорема. Точки бифуркации нелинейного уравнения L\u + N\u = p(L2U + N?u) могут встретиться только среди точек спектра линеа- ризованного уравнения L^u = pLiu. Эта теорема оправдывает прием, широко используемый в теоре- тической физике и математическом моделировании. Вначале ищут пространственно-однородное решение исследуемых уравнений. Затем линеаризуют изучаемую модель в его окрестности и ищут решение этих линейных уравнений в виде с exp(tfcz + iut), где с — постоянный век- тор. Условие разрешимости этого уравнения дает зависимостьw = w(t), иногда называемую дисперсионным уравнением. Если при некоторых параметрах у и появляется мнимая часть, "возмущения нарастают”, то это свидетельствует в пользу неустойчивости. Итак, пусть собственное значение линеаризованной задачи имеет кратность р (отсюда совсем не следует, что в нелинейной задаче будет происходить бифуркация, см. задачи). В теории Ляпунова—Шмидта исследуемое уравнение представляется как два уравнения. Одно урав- нение в конечномерном подпространстве размерности р, и другое в его бесконечномерном ортогональном дополнении. Предложена техника, позволяющая находить коэффициенты конечномерной системы р урав- нений с р неизвестными, которые также называют уравнениями развет- вления. Аналитические методы теории бифуркаций, как правило, дают асим- птотические разложения в окрестности определенных точек в фазовом пространстве и пространстве параметров. При моделировании конкрет- ных нелинейных явлений этого часто бывает недостаточно. Обычно важно представлять разбиение пространства на области $ одинаковым качественным поведением динамической системы. Для этого приходит- ся строить линии, на которых происходят бифуркации. Кроме того во многих случаях нужно знать всю бифуркационную диаграмму для ре- шений определенного типа, а не только поведение в окрестности точек бифуркации, которые определяют асимптотические разложения. Все это привело к развитию большого класса вычислительных методов те- ории бифуркаций. В литературе их часто называют методами продол- жения по параметру. Их идею можно проиллюстрировать следующими примерами. Допустим, нас интересует численное построение бифуркационной диаграммы. Пусть для простоты эта диаграмма определяет зависи- мость особых точек х динамической системы х = F(x, А) от параме- тра А. Эти точки определяются корнями нелинейного алгебраического уравнения F(x, А)= О Типичная стратегия действий такова. Вначале находят с помощью аналитических или численных методов какую-либо точку (г*, А*), при- надлежащую диаграмме (см. рис. 9). Затем делается прогноз "по касательной", чтобы приближенно най- ти положение следующей точки на диаграмме. гргеДА* + ДА) = х’(Х’) + —J^AA □А 110
Геометрический образ этой процедуры показан на рисунке 9. Вели- чина dr । — "производная особой точки по параметру” может быть определена с помощью дифференцирования неявной функции _. .. Л dF dF dx F(z, А) - 0 => + -д- = 0 => дХ дх аХ дх(Х') _ dF(X') dF(X') дХ дХ дх Затем уравнение F(z’, А* + ДА) = О решается с помощью метода Ньютона, где значение ipred(^‘ + ДА) ис- пользуется в качестве начального приближения. (Представление о ме- тоде Ньютона дается в 7-й главе этой книги и в большинстве курсов вычислительной математики.) Если производная оказывается намного меньше, чем | то разумно "идти по параметру z”, а не по параметру А (см. рис 9). Рис. 9. Слева — графическое представление простейшего вычислительного алгоритма построения бифуркационной диаграммы Справа — пример изолированной ветви диаграммы Из рисунка 9 ясно, что, действуя таким образом, можно числен- но построить бифуркационную диаграмму в окрестности регулярной эктремальной точки. В более сложных случаях можно строить "дис- кретные аналоги" формул, фигурировавших в начале этой главы. Они включают производные более высокцх порядков. Вместе с тем описанный подход имеет принципиальные ограничения лаже в простейшем случае особых точек Причина этого понятна из правой части рисунка 9 На нем’показана ветвь решений уравнения F(z, А) = 0, изолированная от основной бифуркационной диаграммы (в литературе такие ветви иногда называют изоллталси). Как бы ни были совершенны алгоритмы движения по параметру, мы не можем "перескочить" с исходной кривой на эту изолированную ветвь Нужны возмущения конечной амплитуды, либо случайные алго- ритмы поиска решений вне основной бифуркационной диаграммы. Ill
В ряде задач именно такие изолированные решения играют боль- шую роль. К примеру, такая ситуация часто имеет место в теории ги- дродинамической устойчивости. В частности, при движении жидкости по круглой трубе простейшее течение с параболическим профилем ско- рости устойчиво при любых числах Рейнольдса. Однако эксперименты показывают, что при превышении числом Рейнольдса некоторого порога движение жидкости становится турбулентным. Следовательно, ’’особая точка”, соответствующая простейшему течению и устойчивая в линей- ном приближении, не лежит на бифуркационной диаграмме, по которой можно пройти от простейшего ламинарного к турбулентному течению. Приходится искать другие ветви. Очень важным оказывается поиск изолированных ветвей в задачах химической технологии, связанных с проектированием химических ре- акторов. Здесь новая ветвь ’’особых точек" может означать возмож- ность создания новых, более эффективных технологий. Численное построение линий бифуркаций в пространстве параме- тров очень похоже на расчет бифуркационных диаграмм. В главе 6, например, рассмотрена задача о качалке, в которой состояние исследу- емой системы х определяется двумя параметрами а и 6: F(z,a,6) = 0. (13) Это уравнение в данной задаче имеет решение х при любых значениях а и Ь. Однако число решений может измениться при условии 3F -=-(x,a,t) = 0. (14) 0Х Эту линию в пространстве параметров часто называют линией крат- ных корней. Цля поиска этой линии в пространстве параметров а и Ь приходится решать систему нелинейных алгебраических уравнений (13), (14). Здесь также вначале находится точка на изучаемой линии, затем делается прогноз по касательной, потом решение уточняется с помощью метода Ньютона и т.д. Большой интерес к теории бифуркаций, проявляемый в настоящее время, связан с несколькими крупными успехами. Это прежде всего открытие нескольких универсальных сценариев возникновения динами- ческого хаоса. Два из них — сценарий Фейгенбаума и перемежаемость — рассмотрены в седьмой главе. Исследование ряда простейших динамических систем позволило при- дать новый смысл слову "понять" при анализе моделей со сложным поведением. "Понимание” в нелинейной динамике обычно оказывает- ся связано с анализом последовательности бифуркаций, приводящий к появлению изучаемого аттрактора. Для этого часто конструируются упрощенные модельные системы, демонстрирующие части такой после- довательности или всю ее целиком (это могут быть различные отобра- жения или системы обыкновенных дифференциальных уравнений более низкого порядка) Типичный пример такого подхода дает анализ модели Рикитаки, описывающей так называемое земное магнитное динамо. Палеомагнит- ные данные свидетельствуют, что последние 600 миллионов лет распо- ложение магнитных полюсов Земли менялось сложным нерегулярным образом. Для объяснения этого феномена Рикитаки предложил ориги- нальную электромеханическую модель. 112
Модель представляет собой два диска, соединенных так, что ток от каждого диска проходит через катушку другого (см рис 10). Диски в этой модели имитируют два большие вихря в ядре Земли Рис 10 Схема двухдискового динамо и изменение аттрактора в обобщен кий моде пи Рикитики при изменении параметра ц : Vi - 0, 004, р? — 0 002 Эта система описывается следующими уравнениями *1 - -рГ1 z2z3 1 13
Z2 = -ДХ2 + xlx4 x3 = 1 - ZjX2 - ^1X3 X4 = 1 — I]Z2 — V2X4, где i] и I? — токи, /i — сопротивление проводника, x3 и X4 — угловые скорости дисков, Pi и i/2 — коэффициенты трения. Одна из проекций аттрактора в этой системе представлена на ри- сунке 10. Видно, что несколько раз в этой последовательности вид аттрактора качественно меняется. Это естественно связывать с бифур- кациями. Близкая картина детально исследовалась при изучении моде- ли Лоренца, дающей приближенное описание динамики подогреваемого снизу слоя жидкости. Принципиальные трудности возникают уже при анализе достаточно простых хаотических аттракторов в системе трех или четырех обык- новенных дифференциальных уравнений. Из рисунка видно, что при изменении аттрактора существенно меняется тип хаотического аттрак- тора. Было бы очень желательно рассматривать не только бифуркации, связанные с предельными циклами или особыми точками, но и те, при которых один странный аттрактор переходит в другой. Однако сделать это оказывается очень трудно. При бифуркации особых точек можно было следить за изменением их числа и устойчивости. В случае хаотических аттракторов обычно не удается корректно определить небольшой набор чисел, изменение кото- рых приводит к появлению качественных особенностей в наблюдаемом динамическом хаосе. По-видимому, здесь потребуются принципиально новые идеи. Другое важное направление теории бифуркаций -- вывод и анализ модельных уравнений, которые описывают поведение системы в окрест ности точки бифуркации. В самом деле, в силу теоремы о выпрямлении векторного поля в окрестности точки, которая не является особой, с помощью замены переменных, локально динамическую систему можно привести к ви- ду х — с. В окрестности невырожденной особой точки х* (у которой матрица Якоби А не имеет нулевых собственных значений) поведение динамической системы локально определяется собственными значени- ями матрицы А, т. е. она оказывается эквивалентна линейной системе Y = AY. Можно ожидать, что в окрестности точек бифуркации так- же будут возникать модельные системы, локально определяющие ди- намику исходной системы. Коэффициенты этих модельных уравнений естественно будут определяться не только линейными членами, возни- кающими при разложении правых частей в окрестности особой точки Это направление, связанное с получением таких модельных урав- нений, носит название теории нормальных форм. Здесь получен ряд фундаментальных результатов, связанных с локальным анализом не- линейных моделей. Вместе с тем, техника перехода от конкретной си- стемы к нормальной форме (т. е определение коэффициентов, входя- щих в последнюю) может быть достаточно сложной даже для простых бифуркаций. Например, этой технике в случае бифуркации рождения предельного цикла, о которой речь пойдет в 8-Й главе, посвящено не сколько книг Реализация подхода, связанного с получением локаль ных модельных уравнений для динамических систем специального ви- да, привела к развитию теории катастроф, обсуждаемой в следующей главе 114
Вместе с тем, эти результаты имеют принципиальное значение. Они показывают, в каких случаях можно рассчитывать на универсальное описание различных нелинейных систем с помощью одних модельных уравнений. Кроме того, в семидесятые годы в связи с изучением распределенных систем активно начала развиваться теория центральных многообразий. В этой теории также рассматриваются отображения V», порождаемые динамической системой (например x(i) —» z(t 4 1)) Особым точкам не- прерывной динамической системы соответствуют неподвижные точки отображения 0 : 0(г‘) =• х*. Если спектр линеаризованного операто- ра rfV'(s’) в этой точке лежит внутри единичной окружности, то точка устойчива. В точке бифуркации спектр разбивается на две части. Од- на лежит на ненулевом расстоянии от единичной окружности, другая лежит на ней Последней части соответствует обобщенное собственное подпространство Y размерности d. (В простейшем случае d совпадает с суммой кратностей собственных значений, равных по модулю едини- це.) При этом во многих случаях удается доказать, что в рассматрива- емом фазовом пространстве Р существует окрестность V точки х* и многообразие М размерности d, проходящее через точку х~ и лежащее в И, которое: 1. обладает свойством локальной инвариантности; если х Е Л/ и 0(г) € V, то ^(т) Е /V/; 2. обладает локальной устойчивостью; если фп(х) Е V для п = О, 1,2, • • •, то фп(х) —» М. при п —> оо. Множество М при этом называют центральным многообразием точ- ки Другими словами, в окрестности точки бифуркации локально вбли- зи точки i" динамика определяется поведением переменных в некото- ром d-мерном пространстве Переменные, лежащие в этом простран- стве, и определяют поведение остальных степеней свободы, т. е. служат параметрами порядка В ряде случаев удается явно найти уравнения, связывающие переменные на центральном многообразии. Принципиальным шагом, имеющим большое значение для нелиней- ной динамики, стало обобщение этого подхода и построение теории инерциальных многообразий Это множества Л/ в фазовом пространстве Р — компактны и инвариантны, т. е. траектория, начинающаяся в одной из точек М не покидает этого множества, — таковы, что все решения исходной задачи экспоненциально стре- мятся к Л/; — обладают асимптотической полнотой; для любых начальных данных в исходном уравнении существует точка х в М, такая, что расстояние между траекторией исходной задачи и траекторией на М, начинающейся в £, экспоненциально стремится к нулю Представим себе, что Р — бесконечномерное фазовое пространство некоторого уравнения в частных производных, решения которого ведут себя хаотическим образом. Тогда асимптотическая полнота, по суще- ству. означает эквивалентность уравнения в частных производных при t --- оо некоторой конечномерной динамической системе. Последнюю обычно называют инерциальной формой Таким образом, например, И5
дело обстоит для одной из базовых моделей нелинейной динамики Wt = IV + (1 + ici)Wr, - (1 + ic2)|VV|2lV W(z, 0) = VV0(z), 0 < z < /, 0 < Z < oo Wr(0,f)= ^(/,0 = 0, (15) называемой уравнением Курамото—Цузуки или обобщенным завися- щим от времени уравнением Гинзбурга—Ландау. К сожалению, построить инерциальную форму в интересных случа- ях явным образом не удается. Однако само ее существование открывает новые возможности в создании новых подходов к проблемам нелиней- ной динамики и конструированию вычислительных алгоритмов. Во многих важных случаях коэффициенты уравнений в частных производных являются малыми параметрами. Особенно сложны слу- чаи, когда малые параметры входят множителями при старших произ- водных Например, таковы системы уравнений реакция-диффузия при малых коэффициентах диффузии. Оказалось, что и в этом случае с помощью многомасштабных разло- жений можно получать модельные уравнения, дающие универсальное описание при определенных бифуркациях. В частности, таковым ока зывается уравнение (15). Можно ожидать, что модельные системы, ко- торые возникают при использовании теории бифуркаций, будут играть роль ориентиров при изучении различных нелинейных явлений. Вопросы и задачи I Построить бифуркационную диаграмму для динамической систе мы т = X (6 - Az) (А + 2х - х2) ((А - 10)2 + (х - 5)2 - 1) (А2 - х) 2 В теории бифуркаций широко используется предположение Хоп фа о ’’строгом пересечении”, в соответствии с ним следует ограни- чить бифуркационный анализ двойными точками и не рассматри- вать точки возврата (где D = 0)и особые точки высокого порядка. Почему? 3. Как выглядит бифуркационная диаграмма вблизи точки возврата второго порядка? В этой точке ветви диаграммы имеют точку касания второго порядка. Найти асимптотические выражения для соответствующих кривых в окрестности этой точки. 4. Дифференциальное уравнение ф — Q - A sin р, А > 0, Q > 0, где берется по модулю 2 я, использовалось для моделирова- ния двух связанных, спонтанно колеблющихся нервных клеток- нейронов. В этом случае переменная <р представляет собой раз- ность фаз между активностями двух нейронов Исследовать каче- ственное поведение решений и бифуркации в зависимости от па- раметров Q и А. 116
5. Вокруг вертикальной оси, проходящей через центр, вращается об- руч радиуса R с частотой ш. По обручу может двигаться шарик Когда частота вращения обруча превышает некоторое критиче- ское шс, шарик покидает нижнее положение равновесия и перека- тывается в повое Постройте математическую модель этого явле- ния. Оцените величину шГ| найдите новое положение равновесия 6. При описании конвекции в подогреваемом снизу слое жидкости или газа, явлении, оказывающем большое влияние на динамику атмосферы, американским метеорологом Э. Лоренцем была пред- ложена и исследована следующая модель г = -cr(x - у) У ~ -xz + тх - у z - ту - bz. Здесь х характеризует одну из фурье-компонент поля скоростей, у и z — компоненты поля температура. Параметр г — число Рэлея, а -- число Прандтля, величина b отражает геометрию области Будем считать, что вначале параметр г мал. Каковы простейшие бифуркации, которые будут происходить при увеличении г? Как будут вести себя фазовые траектории вблизи соответствующих со- стояний равновесия? 7. Будем считать, что функции f и д в системе реакция-диффузия линейны, а состояние равновесия X = О, Y — О устойчиво. Бу- дем рассматривать в качестве бифуркационного параметра один из коэффициентов диффузии. Может ли при увеличении этого параметра возникнуть неустойчивость? Рекомендуемая литература К наиболее доступным и простым учебникам по теории бифуркаций мож- но отнести книги: Йосс Ж., Джозеф Д. Элементарная теория устойчивости и бифуркаций. М.: Мир, 1983; Баутин Н.Н., Деонтович Е.А. Методы и приемы качественного исследования динамических систем на плоскости. М . Наука, 1976. На более подготовленных читателей рассчитаны книги: Guckenheimer J, Holmes Р. Nonlinear oscillations, dynamical systems and bifurcations of vector fields. N.Y. etc.: Springer, 1983; Арнольд В.И. Дополнительные главы тео- рии обыкновенных дифференциальных уравнений. М.: Наука, 1978; Марсден Дж., Мак-Кракен М Бифуркация рождения цикла и ее применения. М.: Мир, 1980; Теория ветвления и нелинейные задачи на собственные значе ния//Под ред. Келлера Дж Б и Антмана С. М.: Мир, 1974 Применение методов теории бифуркаций к анализу распределенных си- стем, которые описываются уравнениями в частных производных, рассмо- трено в двух последних книгах, а также в книгах: Л'аксн Г. Синергетика. М.: Мир, 1980; Николис Г., Пригожин И. Самоорганизация в неравновесных системах. М.г Мир, 1979. Применение методов теории бифуркаций в сочетании с численным ана- лизом на примере конкретной системы обыкновенных дифференциальных Уравнений -- системы Лоренца рассмотрено в книге: Sparrow С The Lorenz equations: bifurcations, chaos and strange attractors. В : Springer, 1982
Escher M.C. Rippled Surface. 1950 Эшер M К. Рябь на поверхности
ГЛАВА 6 МАТЕМАТИЧЕСКИЕ МОДЕЛИ ТЕОРИИ КАТАСТРОФ Теория катастроф — математи- ческий инструментарий. Как и всякий другой инструментарий, его можно употреблять и непра- вильно. Прошедшее десятилетие свидетельствует, что он являет- ся мощным средством, способным пролить свет на решение самых разнообразных проблем, но требу- ет осторожного и умелого обраще- ния. Т. Постон, И. Стюарт В математическом моделировании нелинейных явлений теория ка- тастроф занимает особое место. Ее развитие показывает, насколько важным может быть введение новых понятий и изменение точки зре- ния на предмет. Ее приложения являются примером того, как много интересных явлений в различных областях может быть объяснено или предсказано с помощью простых и наглядных моделей. Важную роль в создании теории катастроф сыграли работы Р. То- ма и его книга ’’Структурная устойчивость и морфогенез” Проблема морфогенеза является принципиальной задачей в прикладной матема- тике. Она сводится к выделению наиболее существенных особенностей в начальных стадиях развития организма и их математическому описа- ниию. По мнению Р. Тома, наиболее важным в морфогенезе является по- явление новых качеств, например, изменения типа симметрии, наблю- даемые в ходе развития организма. Кроме того, характерной чертой биологических и многих других систем являются скачки — резкие пе- реходы в новое состояние, происходящие при непрерывной эволюции параметров. Эти внезапные изменения были названы Р. Томом ка<- тастрофами, чтобы подчеркнуть быструю, кардинальную перестройку изучаемого объекта. Идея описания -кататсроф сводится к следующему Пусть состояние объекта описывается некоторой динамической системой вида х = (1) ОТ Тогда, как мы видели, ограниченные решения стремятся к аттракторам г*, которые определяются равенством Функцию U будем называть потенциалом, а точку, в которой производ- ная по х равна нулю (а в общем случае все частные производные равны нулю), будем называть критической точкой. Из алгебраического уравнения (2) можно найти координаты всех критических точек г’(А), .... z’(A) Они зависят от параметра (или 119
целого набора параметров) А. Предположим, что параметры меняются очень медленно. Настолько медленно, что траектория x(t, А) оказыва- ется очень близка к одному из своих аттракторов z"(A). Можно представить себе ситуации, в которых при плавном изме- нении параметра А и потенциала (7(х,А) критическая точка испыты- вает скачок. Пример такого поведения мы видели, обсуждая теорию бифуркаций, когда при прохождении регулярной экстремальной точки скачком появляется или исчезает пара состояний равновесия. В модели морфогенеза, например, А может интерпретироваться как медленно ме- няющаяся в ходе развития концентрация каких-либо веществ, а х как точка в фазовом пространстве, характеризующая состояние организма. В упомянутой книге Р. Том предложил такие модели в качестве основы для построения математической биологии. Поскольку речь идет о мягком моделировании, где неизвестны за- коны. определяющие процесс, где могут быть сделаны самые общие предположения о виде потенциала, естественно сосредоточить внима- ние на типичных ситуациях. Под последними понимаются свойства, ко- торые сохраняются при малых вариациях, "малых шевелениях” потен- циала. Теория катастроф позволила провести классификацию ’’типич- ных” критических точек и выяснить, каковы ’’типичные катастрофы” при различном числе параметров А, определяющих состояние системы. Теория катастроф стала синтезом определенных областей классиче- ского математического анализа и топологии. Наглядность и простота ее подхода ко многим задачам вызвала огромный поток работ, связанных с ее использованием при анализе различных математических моделей. Обратной стороной этого стало некритическое использование результа- тов теории во многих областях, связанных с мягким моделированием, неоправданная экстраполяция ее выводов и широкие дискуссии по это- му поводу. Однако ее успешное использование в прикладных задачах, связан- ных с ’’жестким” моделированием, применение ее методов как эвристи- ческого подхода на ранней стадии построения математических моделей показывает важность и эффективность этого математического инстру- мента в моделировании. Эта глава не может заменить подробных руководств различного уровня сложности по теории катастроф. В ней мы постараемся решить гораздо более скромную задачу. Вначале мы попытаемся максимально просто обрисовать несколько характерных проблем и показать, на ка- ком этапе возникает потребность в математических результатах теории катастроф. Далее будет доказано несколько утверждений, которые не требуют аппарата, выходящего за рамки элементарного математическо- го анализа и линейной алгебры, но дают представление о самом подходе теории. При этом неоднократно будет подчеркиваться глубокая связь этих методов с исследовательской программой Пуанкаре. Затем мы вернемся к прикладным задачам, где уравнение (1) дает удовлетвори- тельное описание ситуации, либо служит эффективной упрощенной мо- делью. Простейшие математические модели теории катастроф. В теории катастроф существует несколько элементарных математи- ческих моделей, позволяющих проиллюстрировать характерные черты простейших катастроф Обсудим одну из них Представим себе сегмент параболы, у = г2. отсекаемый прямой у = Уд Допустим, что это тонкая пластинка, которая все время оста- ется в вертикальной плоскости и может перекатываться по горизон- 120
тальной прямой АВ (см. рис. 1). Будем считать также, что вся масса пластинки сосредоточена в одной точке. Обозначим координаты этой точки в системе координат, связанной с параболическим сегментом че- рез (а, 6). Рис. 1. Когда центр тяжести пересекает линию "клюва”, качалка может перевалиться с одного бока на другой Нетрудно изготовить механическую модель такого типа, вырезав два одинаковых тонких параболических сегмента, и установив между ними распорки. Это позволит с помощью небольшого кусочка магнита ме- жду параболическими сегментами и кусочка железа с другой стороны имитировать "сосредоточенную массу” в точке (а, 6). .Изучим динамику системы, плавно перемещая точку (а, 6). Есте- ственно, при таком перемещении состояние равновесия, в которое при- ходит этот сегмент, или, как его часто называют, качалка, меняется. Но в одних случаях это происходит плавно: малое изменение коорди- нат (а, 6) мало меняет состояние равновесия (см. рис. 1). В других случаях происходит резкий скачок — качалка внезапно ’’переваливается на другой бок” (см. рис. 1). Немного поэкспери- ментировав, можно убедиться, что такие катастрофы происходят, ко- гда точка (а, 6) пересекает некоторую кривую, имеющую характерный вид ’клюва" . Любопытно, что в одних случаях скачки при пересечении этой кривой происходят, а в других нет. Чтобы понять такое поведение, а также получить аналитическое выражение для кривой, описывающей "клюв”, построим математиче- скую модель описанного явления Состояние обсуждаемой системы, очевидно, характеризуется одним параметром, — координатой точки I, в которой качалка касается плос- кости. В теории катастроф переменная, определяющая положение си- стемы, называется переменной состояния. Множество возможных зна- чений переменных состояния будем называть пространством перемен- ных состояния. В нашем случае это пространство состоит из отрезка [~>/Уо> \/Уо1 - Параметры, с. помощью которых можно менять состояние системы, называют переменными управления. У нас этих переменных две — а и Ь. Множество .значений этих переменных — пространство управления. В обсуждаемой модели это множество совпадает с множе- ством внутренних точек сегмента. В соответствии с законами механики, состоянию равновесия отве- чает минимум потенциальной энергии пластинки U = mght где т — масса, д — ускорение свободного падения, h — высота точки с коорди- натами (а, 6) над горизонтальной плоскостью. Найдем явное выражение для потенциала. В системе координат (х.у) горизонтальная плоскость — это каса- тельная к параболе в точке (t,t2) Тангенс угла ее наклона равен 121
у' — 2t. Учитывая, что она проходит через точку получим урав нение горизонтали у — 2tx - t2 Воспользуемся известным из аналитической геометрии соотношени ем, определяющим расстояние S от точки с координатами (а, 6) до пря- мой) заданной уравнением у - рх 4- q 2 _ 62 + 92 + п2р2 — 2bq + 2apq - 2abp s ~ TTp2 ‘ В нашем случае p = 2/, q = ~t2 и 2 _ b2 4- 2bt2 + f4 4- 4a2t2 - 4at3 - 4abt 5 = ПГ4Р Заметив, что выражение в числителе равно (b - 2at 4- t2)2, получим ,,, ч 6- 2at -И2 = (Г-МР)»/2"* Продифференцировав это выражение и приравняв производную к нулю, получим условие экстремума потенциала . 2mg(2t3 + (I — 2b)t — а) _ ( ) ~ (1+4<2)3/3 Следовательно, состояния равновесия качалки определяется корнями многочлена I7(t) = 2t3 + (1 - 2b)t - а, (3) зависящего от параметров а и Ь. Формула (3) имеет простой физический смысл: в состоянии равновесия центр тяжести должен располагаться над точкой касания с горизонталью В противном случае возникает момент двух сил, — силы тяжести, приложенной в центре масс, и си- лы реакции опоры, приложенной в точке касания с плоскостью Этот момент и вращает качалку. Нормаль к параболе в точке касания (t,t2) имеет уравнение —i Л о 1 Л Л о 1 у= — + C=>t2 = --+C=>C = l2 + -=> => 2ty 4- х = 2t3 4- t => 2Z3 4- (1 - 2y)t - x = 0 Подстановка x =. a, у = b в последнюю формулу приводит к соотно- шению (3). Следовательно, центр тяжести, находящийся в точке (а,Ь), действительно лежит на нормали к параболе в точке касания. Итак все возможные состояния равновесия пластинки определяются корнями кубического многочлена U(t) Как любой многочлен нечетной степени, U(I) имеет по крайней мере один действительный корень. В са мом деле, U(t) — непрерывная функция U(t) —► оо при t —• оо, U(t) —* —оо при t —* —оо и, значит, должно быть хотя бы одно значение I, при котором U(t) обращается в нуль (см. рис. 2а). Можно предположить, что в плоскости управляющих параметров (а,Ь) найдется область, где 122
действительных корней три (см. рис. 26). На границе этой области U(t) имеет два корня (см. рис. 2в). Это возможно только, если один из корней многочлена — кратный (см. рис. 2в). Из рисунка 2в видно, что в точке t, где многочлен U(t) имеет кратный корень, график касается оси абсцисс и, следовательно, Uf(t) = 0. Это простое соображение позволяет найти значения управляющих параметров, при которых уравнение U(t) = 0 имеет два решения. Такое множество часто называет линией кратных корней U(t) = 0 => 2t3 + t(l - 26) + а = 0, U(t) = 0 => 6t2 + (1 - 26) = 0. Исключив переменную t, получим 27 а2 = 2(2Ь — 1)э. (4) Отметим, что при а = 0, Ь = 1/2 U(t) — 2t3 уравнение U(t) = 0 имеет трехкратный корень t = 0. Множество В, которое задается уравнени- ем (4), называют бифуркационным множеством функции V или дис- криминантным множеством функции U. Изобразим это множество в плоскости (а. 6) и представим характерный вид потенциала в различных точках этой плоскости. На рисунке За показано число решений уравне- ния U(t) = 0в различных участках плоскости параметров. На рисунке 36 — примерный вид потенциала. Рисунок 36 позволяет понять, что происходит с пластинкой при перемещении центра тяжести. Например, зафиксируем параметр 6 и будем менять а. До значения ai потенциал V(t) имеет единственный минимум, а система, соответственно, един- ственное положение равновесия. В точке ai на линии кратных корней возникает еще одно устойчивое и неустойчивое состояние равновесия. Это особенно ясно видно на рисунке 4, где в плоскости (a, t) показаны все значения t, отвечающие равновесным положениям пластинки при 6 = 6: а также характерный вид потенциала при различных значени- ях а. Напомним, что устойчивому состоянию соответствует минимум потенциальной энергии, неустойчивому — максимум. Для наглядно- сти можно считать, что V(t,a) это яма. в которой находится шарик с большим коэффициентом трения. Естественно он попадает на дно ямы и находится в локальном минимуме до тех пор, пока этот локальный минимум существует. Такое поведение в теории катастроф называется принципом максимального промедления. Шарик на рисунке 46 показан жирной черной точкой. Когда данный локальный минимум исчезает 123
(a = as), шарик скатывается в другой локальный минимум, а система делает катастрофический прыжок или скачок. В обсуждаемой модели это соответствует тому, что качалка переваливается на другой бок. Рис. 3. Потенциал V(t) в различных точках пространства управления (a,b): а) число решений уравнения U(t) = 0; 6) характерный вид потенциала Итак, мы столкнулись с замечательным явлением, характерным для многих нелинейных систем. При малом изменении управляющей пере- менной А переменная состояния скачком меняет свое значение! На ри- сунке 4 величина скачка обозначена через Д£]. Скачки могут происходить в точках, где меняется число возможных откликов системы на внешние воздействия (число экстремумов потен- циальной энергии). В общем случае множество значений в пространстве управления, при которых меняется число возможных откликов, также называют бифуркационным множеством. Рис 4. Изменения состояния системы при изменении параметра a Другое важное явление, которое наблюдается в этой модели — ги- стерезис. Это название употребляется по аналогии с магнетизмом Под гистерезисом понимается следующее. Если мы обратим путь в пространстве управления, то это не всегда будет приводить к обра* щению пути в пространстве состояний. Такое поведение удобно про- 124
следить с помощью рисунка 4. Будем менять параметр а от а) до а2 (что соответствует перемещению центра тяжести вдоль оси z), здесь t(a) является неоднозначной функцией переменной а. При изменении параметра а со стороны малых а точка, описывающая состояние систе- мы, двигается по верхнему листу и перескакивает на нижний в точке а? Обратим путь в пространстве управления — будем двигаться от а2 к ai. Точка при этом будет находиться на нижней части листа, а не на верхней, и скачок произойдет в точке а1( а не в точке а2. Это и объяс- няет тот факт, с которым мы столкнулись, экспериментируя с моделью качалки, — скачки могут происходить не каждый раз при пересече- нии бифуркационного множества в пространстве параметров. Можно сказать, что они происходят только тогда, когда точка далее не может двигаться по тому листу, на котором находится. Множество всех возможных равновесных положений в пространстве состояний, соответствующих различным значениям переменных упра- вления, часто называют поверхностью отклика. Кривая на рисунке 4а это сечение поверхности отклика плоскостью Ь = const. Существование нескольких листов у поверхности отклика приводит еще к одному любопытному явлению — расхождению: небольшие раз- личия в пути могут привести к большим различиям в состоянии. Это может происходить, даже если пути начинаются и заканчиваются в од- них и тех же точках пространства управления и при движении не воз- никает скачков. Пример таких путей показан на рисунке За. При дви- жении по пути АСВ точка оказывается на верхнем листе поверхности. При движении по пути ADB — на нижнем. Читатель может самостоятельно найти пути, двигаясь по которым, мы можем прийти в конечное состояние со скачком, либо без него Рассмотрим геометрические свойства поверхности отклика М в про- странстве (t,a,6). Уравнение этой поверхности V(t) = 2t3 + t(l -26)-a = 0. Отметим, что нормаль к параболе в точке (t, t2) задается уравнением 2t3 + t(l - 2у) -х = О Направим ось t вертикально (см. рис. 5). При фиксированном значении to V(to,atb) = 0 представляет собой горизонтальную прямую 2tg + to(l-26)-a = 0. С другой стороны, последнее равенство определяет нормаль к пара- боле b = а2, лежащей в плоскости t = to. Эта нормаль берется в точке с координатами t = t0)« = lo>b = (см. рис. 5). Следовательно поверх- ность М можно построить из нормалей к параболе b = а2 в плоскости (а, 6), если нормаль, взятую в точке (toJo)* сдвинуть по вертикали на высоту to (см. рис. 6). Вертикальная плоскость b = 60 пересекает поверхность М по кубической параболе 2t3 + ((l-26o)-a = 0. Когда 60 > 1/2, эта парабола имеет максимум и минимум. Поэто- му поверхность' М имеет складку, такую, как показано на рисунке 6. Проекция этой складки на плоскость управляющих параметров (а, 6) 125
определяет бифуркационное множество, при пересечении которого и возможны катастрофические скачки. Поверхность М делит простран- ство (/, а, 6) на две части. Сверху V(t) > 0, снизу V(t) < 0 Возможна и другая интерпретация. Рис. 5. Поверхность отклика можно построить, рассматривая семейство нормалей к параболе Рис. 6. Поверхность отклика М, возникающая в задаче о качалке. Такие же поверхности появляются в других системах, где имеет место катастрофа сборки Уравнение V(tta,6) = 0 представляет собой уравнение нормали к параболе 6 = а2 в точке (t, t2). Когда параметр меняется, возникает целое семейство нормалей. Спроектируем все эти нормали на гори- зонтальную плоскость. Мы увидим примерно такую картину как на рисунке 7. Огибающая этого семейства имеет характерный вид ’’клю- ва”. Найдем уравнение огибающей. Выясним, в какой точке плоскости (а, 6) пересекаются две бесконечно близкие нормали. Пусть одна из них соответствует значению параметра I, другая — t + Д*. Эти прямые пересекаются в точке 1/(а,6,£)= И(а,6,( + At) Чтобы найти эту линию, представляющую собой огибающую семейства нормалей, которая касается каждой линии семейства, достаточно ис- ключить параметр t из двух последних равенств. Нс именно это мы и делали, когда искали бифуркационное множество для нашего потенци- ала Огибающая нормалей к кривой называется эволютой этой кривой Следовательно, бифуркационное множество 27а2 - 2(26 - I)3 и определяет эволюту. Здесь можно вспомнить геометрическую оптику. Допустим, у нас есть пучок света, лучи в котором совпадают с семей- ством нормалей к параболе Очевидно, огибающая этих лучей будет 126
представлять яркую светящуюся линию В оптике такие линии назы- вают каустиками (от латинского слова ’’жгущая”). Каустики можно наблюдать, глядя на то, как меняется освещенность какой-нибудь плос кости после прохождения света от лампы через стакан со сладким, но плохо размешанным чаем (чтобы оптические свойства существенно от- личались в разных частях стакана). Рис 7. Семейство нормалей к параболе. Огибающая этого семейства определяет каустику Возникновение каугтик происходит и при прохождении лучей све- та через толстое стекло с поверхностью сложной формы. Это часто используется в современном дизайне. Обратим внимание на то, что эволюта гладкой кривой — параболы имела особенность на оси симметрии. Это типично для задач оптики. Особенно наглядно возникновение особенностей можно проследить на примере распространения волнового фронта. Вспомним принцип Гюй генса чтобы найти положение ^>(1 + AZ) фронта в момент t + AZ, надо взять его положение в момент Z, провести семейства нормалей и сме- стить точку фронта вдоль нормали на расстояние rAZ, где с - скорость распространения возмущений (см. рис. 8). Пусть волновой фронт представляет собой эллипс и лучи света распространяются вовнутрь Характерная картина, которую мы увидим, представлена на рисунке 9. Здесь возникают замечательные особенности. Классификация типичных каустик, особенностей волновых фрон- тов, представляют собой одно из наиболее важных и интересных при ложений теории катастроф. Любопытно, что математический аппарат, создававшийся для анализа типичных нелинейных явлений — бифурка- ций и катастроф, оказывается очень полезным в классических "линей- ных теориях", — геометрической и волновой оптике. В семидесятых годах внимание астрофизиков привлекла проблема крупномасштабного распределения вещества во Вселенной. Оказалось, что это распределение имеет характерные геометрические особенности. Скопление галактик часто имело вид блинов или блюдец. Группа сотрудников Института прикладной математики им.М .В. Кел- дыша АН СССР под руководством Я.Б Зельдовича провела теоретиче- ское исследование процессов, которые могут привести к таким распре- делениям. В первом приближении удалось описать их с помощью очень простой модели — системы невзаимодействующих частиц с заданными Начальными скоростями Они движутся так же, как лучи в геометриче- ской оптике И там, где возникают каустики, плотность вещества резко 127
Рис. 8. Принцип Гюйгенса позволяет находить положения волнового фронта в последовательные моменты времени Рис. 9. Положение волнового фронта в различные моменты времени. С течением времени у фронта появляются особенности возрастает. Чтобы проиллюстрировать качественные особенности моде- ли, СФ. Шандариным был предложен оригинальный вариант "натур- ного эксперимента". Брался бугристый лист стекла, через него пропус- кался свет. Неровности нужны были, чтобы имитировать неоднородное начальное распределение скоростей. И далее на экране можно было видеть характерный вид каустик. Качественно они были очень похожи на результаты астрофизических наблюдений. Позже был построен бо- лее строгий теоретический подход, опирающийся на результаты теории катастроф. Машина Зимана. Рассмотрим еще одну математическую модель, широко используе- мую в теории катастроф — машину Зимана. Эта машина представляет собой колесико, которое может свободно вращаться вокруг своей оси (точка О). К точке С на краю колесика прикреплены две резинки. Конец одной из них жестко закреплен в точке А. Конец второй резинки привязан к указке, которая может ока- зываться в различных точках плоскости (см. рис. 10а). Поэкспериментировав с этой машиной, можно убедиться в существо- вании четыоехугольной области G, состоящей из четырех характерных "клювов", (см рис. 10). Один из таких "клювов" мы видели раньше в задаче о качалке. Пока указка находится вне области G, колесико под действием пружинок устанавливается лишь в одном положении равно- весия. Если рукой повернуть его на некоторый угол и затем отпустить, оно окажется в том же положении. Внутри области G положений рав- новесия два, и когда указка пересекает границу области G, то возможен катастрофический скачок. Точно так же, как в модели качалки, скачок происходит не при всяком пересечении границы. Наша цель вновь состоит в том, чтобы определить форму области G и разобраться, в каких случаях скачок будет происходить, а в каких нет. Для этого построим математическую модель. Внутренним пара- метром естественно считать угол 0, на который повернут диск (см. рис. 10). Управляющими параметрами — координаты точки В. Для 128
Рис. 10. Машина Зимана, одна нз простейших математических моделей теории катастроф. Она, как и качалка, демонстрирует катастрофу сборки простоты выберем конкретные значения параметров для машины, счи- тая ОС = 1/2, ОА = 2, а длины резинок в нерастянутом положении единичными. Определим положение острия нижнего клюва (точка Р на рисунке 10). В силу симметрии задачи этой точке соответствует угол 6 = 0. Естественно, скачок происходит при значении, где устойчивое положе- ние равновесия (локальный минимум энергии) становится неустойчи- вым (локальный максимум). Будем считать, что угол О близок к нулю. Обозначим длины рези- нок АС и СВ через ей? соответственно. Тогда по закону Гука потен- циальная энергия системы будет равна к(е) = А(е_1)’Ц(е'-1)г. (5) В этом выражении коэффициент А характеризует упругость резины. По теореме Пифагора (см. рис. 10) 2 Л 1 е2 = I 2 — -cosOj + 1 V -sme) Считая угол 6 малым и разлагая stn6 и созб в ряд Тейлора, получим ‘г= (2'1(1-т)) +(Н +°(в*)= ®+е’ + о(04) Воспользовавшись тем, что >/1 + a « 1 + аг/2 (что следует из раз ложе- 129
ния радикала в ряд Тей лора)* получим еЧ + 502 + О(е4) Точно так же (см рис. 10) / 1 X /1 \ / 1 \ /1 \ е'~ = I $+ ~cos0J + I -sin0 1 - (5 + 2^ ~ ©2/2) ) + ( 2®) + +О(04) = (s + 5 \2 / 1V е2/4) +е2/4 + о(04) = ь+ -} + +2(s+0 (4) + т + О(04)= 6+-D -^+О(е4); \ 2/ \ 4 / 4 \ 2/ 2 S02 2(2s+ 1) + О(04) Следовательно, в соответствии с формулой (5), имеем ‘'<e> = ;fH’-5)’ + e’G s(2s — 1)\ 2(2s + 1) J + 0(е4). (6) В теории устойчивости решений обыкновенных дифференциальных урав нений, по теореме Ляпунова, в ряде случаев можно было пренебречь квадратичными членами и всеми членами более высоких порядков. Например, так можно* было поступать, если при изучении устойчиво- сти особой точки оказывалось, что матрица системы, линеаризованной в окрестности этой точки, невырождена, т. е. не имеет нулевых соб- ственных значений. Представляется естественным существование ана- логичного утверждения, позволяющего в выражении (6) пренебрегать членами порядка О(04). когда коэффициент при квадратичном члене отличен от нуля. Это утверждение, получившее название леммы Морса, является од- ним из важных результатов теории катастроф. В следующем разделе мы обсудим его доказательство и геометрическую интерпретацию. Будем считать, что это утверждение справедливо, и отбросим члены О(04). Коэффициент при 02 положителен, если 1 s(2s - 1) 3 > 2(2s+ 1) В этом случае потенциальная энергия имеет минимум, и состояние рав- новесия будет устойчиво. При выполнении противоположного неравен- ства устойчивость теряется Изменение типа состояния равновесия, ко- торое происходит на границе G в точке Р, происходит при значении s, которое определяется равенством 5 = =* 2s’~,! + ! = ° ’ 130
Действуя аналогичным образом, и разлагая вблизи 0 = тг, можно опре- делить положение положение вершины верхнего клюва, точки Q. Выясним теперь, какова форма клюва, и действительно ли она такая же, как в задаче о качалке. Будем считать, что точка В движется не только вдоль оси симметрии, как раньше (для описания чего было достаточно одного параметра s), но и в других направлениях. В этом случае возникают два управляющих параметра о и Р (см рис. 106). При этом длина резинки ВС определяется формулой , / 1 V /1 \2 с = 1$ 4- -cos© — a j 4-1 -sin© 4- /? j Разложение потенциальной функции с точностью до членов пятого порядка имеет вид Ц,^(0) = До 4- Д^0 + а2аО2 4- д3/?03 + д404 4- О(05). Не останавливаясь на вычислении постоянных aOt , а2, а3, а4, отметим, что в точке Р а = р — 0 и Vafi(Q) = а0 + а4еч + О(05), а4 > 0. И здесь вновь возникает вопрос, можно ли при получении качествен- ных результатов для состояния равновесия Р отбросить члены пятого и всех более высоких порядков. В теории катастроф доказывается, что это можно сделать, причем не только в точке Р, но и в ее окрестности. Отбросим эти члены. . Оставшееся выражение также можно упро- стить. Замена переменных х = 0 + /?а3/4а4 позволяет избавиться от кубического члена. (При этом члены а3/?03 + а404 войдут в член х4.) Изменив масштаб параметров управления a —► —* Dp, выражение для потенциала можно привести к виду И1б(г) = |х4 + ^az2 4- bx 4- с. 4 2 Поскольку в обсуждаемой задаче интерес представляют только крити- ческие точки, можно перенести начало отсчета функции V и считать с = 0. Это приводит к выражению И,б(х) = |х4 4- ^ах2 4- 6х. (7) Эта формула определяет поверхность отклика, которая в теории ка- татстроф называется катастрофой сборки. Но это в точности та же формула, которая возникла в задаче о качалке. В самом деле, в этой задаче U(t) = 2t3 4- (1-26)14- а. Но эта функция соответствует, в частности, потенциалу ^)=2р+(1^+а< 131
Однако замена переменных х = y^Si, а* = (1-2Ь)у^, bf = а\/5, приводит этот потенциал к виду Wa^(x) = что совпадает с формулой (7)- Возникновение одних и тех же катастроф в самых разных задачах представляется поразительным. В качестве примера можно привести один из экспериментов в психологии восприятия. В основе этого эксперимента лежат следующие соображения. В те- ории управления для слежения за сигналом используют некоторые ди- намические системы. Они могут описываться, например, уравнениями вида (1) или более сложными соотношениями, где параметры А( опре- деляют некоторые характеристики воспринимаемого объекта, а пере- менная (или набор переменных) х — свойства возникающего образа. Можно предположить, что аналогичным способом действует и мозг, формируя некоторую динамическую систему, позволяющую следить за объектом. Чем проще решаемая задача, тем более простой должна быть возникающая система. Здесь также имеет место аналог самоорганиза- ции — из огромного числа степеней свободы, которыми располагает мозг, выбирается лишь небольшое число. Но тогда мы должны на- блюдать качественные эффекты в восприятии, которые представляют- ся теорией динамических систем и, в частности, теорией катастроф, В пользу этого говорит оптическая иллюзия, показанная на рисунке 11 Рис. 11. Оптическая иллюзия, демонстрирующая бистабильность восприятия Среди представленных фигур четвертая слева в верхнем ряду, вос- принимается с равной вероятностью как мужское лицо и как фигура девушки Если эта фигура включена в последовательность (верхний ряд на этом рисунке), то восприятие средних фигур сдвигается в за- висимости от порядка, в котором рассматривается этот ряд — слева направо или справа налево. Наблюдается бистабильность, — два воз- можных отклика при одних и тех же значениях управляющих пара- метров, и гистерезис. Оба этих явления мы подробно рассматривали, обсуждая задачу о качалке. Введем еще один параметр, определяющий степень детальности изображения. Он меняется вдоль оси ординат. По- 132
экспериментировав с этим рисунком, читатель может сам убедиться, что область бистабильности, где фигура интерпретируется и как лицо мужчины, и как девушка, в зависимости от порядка просмотра, лежит внутри ”клюва”. Это позволяет предположить, что и здесь мы имеем дело с катастрофой сборки, такой же, как в случае качалки и машины Зимана. Естественно считать, что изменение восприятия, обычно про- исходящее на границе клюва, связано с катастрофическими скачками в некоторой динамической системе. Однако решение вопроса о том, как происходит процесс самооргани зации, какие механизмы обеспечивают выделение параметров порядка, требует совместных усилий психологов и математиков. Теория катастроф позволяет на определенном уровне понять, поче- му в самых разных задачах возникают одни и те же катастрофы. Ока- зывается типичные катастрофы определяются числом управляющих параметров в изучаемой системе. Когда есть единственный управляю- щий параметр — а, то единственная возможная катастрофа — складка, которая определяется потенциалом г3 Ua(z)=— + ax, (8) О когда параметра два, то возможны складка (8) и сборка (7). По мере увеличения числа параметров, а значит усложнения системы, число возможных катастроф увеличивается и поверхность отклика становит- ся все более причудливой. Один из создателей теории катастроф Р. Том показал, что если число управляющих параметров не превышает четы- рех, то в типичных ситуациях возможны только семь элементарных катастроф. Этот результат можно рассматривать как реализацию ис- следовательской программы А. Пуанкаре для градиентных систем (1). При этом ограничивая тип математических моделей небольшим клас- сом динамических систем вида (1), а их анализ изучением окрестностей особых точек, исследователи получили возможность провести класси- фикацию катастроф. Рассматривая машину Зимана, мы несколько раз столкнулись с не- обходимостью отбрасывать высшие члены в различных разложениях. Интуитивно понятно, что именно так и следовало делать, однако тео- рия катастроф позволяет такую процедуру строго обосновать. Это осо- бенно важно, если задача является многомерной и многие ’’очевидные” соображения оказываются неверны. Структурная устойчивость и идеи теории катастроф Приведение к каноническому виду. Одним из приемов, облегчающих исследование нелинейных матема- тических моделей, является приведение изучаемых уравнений к кано- ническому виду. При этом обычно удается выяснить, какие члены со- храняются, а от каких можно избавиться с помощью различных замен переменных. Замечательная возможность привести множество различ- ных систем вида (1) к некоторому каноническому виду лежит в основе теории катастроф. С простейшим примером такого подхода мы сталкиваемся в аналити- ческой геометрии. Пусть некоторая кривая на плоскости (т, у) задается многочленом ах2 + Ьху 4- су2 + dx + еу + f = 0. (9) 133
Какие типы кривых определяет это соотношение? Какие коэффици- енты здесь существенны, а от каких можно избавиться с помощью замен переменных? Чтобы избавиться от линейных членов сделаем замену пе- ременных и = х — р, v = у — q. Геометрический смысл этой замены — параллельный перенос осей координат (см. рис. 12). Произведем эту замену и приведем подобные члены a(u2+2pu+p2)+6(uv + u7+vp+pg)+c(u2+2gv+g2)+d(u+p)+e(v+g) + / = = au2 4- 6uv + си2 4- u[2ap 4- bq + + o[2cg 4- bcp 4- cj4- + {/ 4- ap2 4- bpq 4- cq2 4- dp 4- eg} (10) Рис. 12. Приведение кривой второго порядка к каноническому виду Коэффициенты при линейных членах обращаются в нуль, если рав- ны нулю оба выражения в квадратных скобках. Это дает систему ли- нейных уравнений относительно р и q 2ар + bq = —d bp 4- 2ag = —e. Эта система имеет единственное решение, если ^Ц2*1 2с || ^0 => б’-4ас#0 (И) Пусть условие (11) выполнено, система двух линейных уравнений решена, а значения р и q подставлены в формулу (9). Это дает равенство au2 4- buv 4- cv2 4- д = 0. (12) Коэффициент д здесь равен фигурной скобке в выражении (10). Геоме- трически произведенное преобразование означает, что мы поместили на- чало координат в центр исследуемой фигуры (см. рис. 12). Соотноше- ние (12) инвариантно относительно преобразования (и —* —и, и —» —v). Приведем квадратичную форму au2+buv+cv2 к еще более симметрично- му виду. Выберем новые координаты так, чтобы она была симметрична относительно новых координатных осей. 134
Для этого есть два способа Один обычно используют в теории ка- тастроф, другой применяют в аналитической геометрии. Обсудим оба подхода Поскольку детерминант не равен нулю (см. (И)), то, по крайней мере, одно из чисел а, b или с отлично от нуля. Пусть это будет ко- эффициент при квадратичном члене, например а. Выделим полный квадрат аи2 + buv 4- cv2 = a(u2 4—uv 4-----*v2) 4- cv2-v2 = Ar2 4- Bv2, (13) a 4aJ 4a где г = и 4- 6v/2a, A = a, В = c — 62/4a. Таким образом, переход к переменным г, v позволяет привести ква- дратичную форму к виду, не содержащему перекрестных членов Когда а = 0, с = О, b 0, то замена переменных и = г + s, v — г - s позволяет привести квадратичную форму к виду (13) buv = 6(г 4- s)(r - s) = br2 - bs2. Если детерминант равен нулю, то 6 = 2у/ас. Следовательно квадратич- ные члены уже образуют полный квадрат ат2 4- 2у/асху 4- су2 4- dx 4- еу 4- f = О, (x/ai 4- усу)2 4- еу 4- —т=-х + (d--=-)х 4- / = О, Vе Vе г2 4- -^=г 4- Ах 4- f = О, где г = (у/ах 4- х/су), А = d - ex/a/x/c, е е2 е2 г2 4- -у=г 4- — 4-4x4-/- — = 0, у/c 4с 4ас (г 4- гД=)2 4- Ах 4- д = 0 => s24-4x4-y = 0, (14) 2у/с где 5 = г 4- е/(2у/с), д = / 4- с2/4с. Поскольку b2 = 4ас, то а и с должны иметь один знак. Мы предпо- ложили выше, что а > 0,с > 0. В противном случае можно разделить все члены на а (если а / 0). Это сведет задачу к предыдущему случаю Если а — 0, то и 6 = 0 и преобразование упрощается су2 4- dx 4- еу 4- / = 0 => с(у2 4- -у 4- 7-5-) 4- dx - 4- / = ст2 4- dx 4- д. с 4сл 4с/ Здесь г = у 4- е/(2с), д = f - е2/(4с2). Итак, описанные замены переменных, связанные с выделением пол- ного квадрата, позволяют привести равенство (9) к каноническому виду 4г2 4- Bs2 = G. Если А. В и С имеют один знак, то это эллипс Если знак G не совпадает со знаками А и В, то это уравнение не определяет 135
какой-либо кривой на плоскости (г, $). Если А и В имеют разные знаки, то это уравнение гиперболы. При Ь2 = 4ас уравнение (9) определяют параболу. Можно изменить масштабы и привести формулу (9) к виду р2+$2 = 1 р2 - «2 = 1 р - «2 = о. При этом часть информации теряется. Например, все эллипсы, не- зависимо от величины их полуосей и расположения на плоскости, пе- рейдут в окружность единичного радиуса с центром в начале координат (см. рис. 12). Проведенные преобразования меняли масштабы вдоль координат- ных осей, сдвигали начало координат. Они меняли углы, переводя пря- моугольную систему координат в косоугольную. Читатель может в этом убедиться, проследив как действует отображение (z,y) —* (mz + пу,у), которое мы использовали (см. формулу 13). Вместе с тем величина Ь2 - 4ас являлась инвариантом и определяла, к какому каноническому виду может быть приведено уравнение (13). Кроме того, инвариантом является соотношение знака а (если а 0) и свободного члена (напри- мер, у в формуле 12). При одном соотношении знаков может, к примеру, возникнуть равенство р2 + q2 = 1, определяющее окружность, при дру- гом — р2 — q2 = 1, не определяющее какой-либо кривой. Произведенные замены переменных не могут изменить этого. Можно сказать, что выбранный набор преобразований сохранял ка- чественную информацию, определяющую тип кривой. Эта информация может быть использована для классификации. Например, к эллипсам можно отнести все кривые вида (9), которые с помощью описанных пре- образований могут быть приведены к виду р2 + q2 — 1. Вместе с тем в ряде задач такой набор преобразований, который не сохраняет ни длин, ни углов, является слишком широким. Поэтому в аналитической геометрии обычно поступают иначе. Там при приведе- нии к каноническому виду обычно считают допустимыми переносы и повороты ортогональной системы координат. Известно, что координаты точки при повороте системы координат на угол а определяются соотношениями (см. рис. 12) uf = u cos а + v sin а v* = vcostt — u sin а, (15) или эквивалентными равенствами u = u'cos о - t/sina, v = v'cosa + и'sin а Вернемся к формуле (12) и выясним, на какой угол а следует по- вернуть систему координат, чтобы уничтожить перекрестные члены au2+6uv+cu2 = a(u' cos о — v' sin q)2+6(u' cosa-t/ sin a)(v' cosa+u'sin or)+ +c(v' cos a 4 u'sin o)2 = u'2(a cos2 a + 6 sin a cos a + csin2 a)+ 136
+u'u'[—2a sin a cos a — 6(cos2 a — sin2 or) 4- 2c sin a cosa]+ +v'2(sin2 a — 6sin a cos a + ccos2a). Воспользовавшись соотношениями sin 2a = 2 sin a cos a, cos 2a = cos2 a - sin2 a, преобразуем выражение в квадратной скобке и прирав- няем его к нулю (с - a) sin 2а - 6 cos 2а = 0. Именно это уравнение и определяет угол поворота системы. Читатель может более подробно проанализировать свойства уравнения (15). Первый из описанных выше подходов в линейной алгебре естествен- но обобщается на случай многих переменных. Напомним основные определения и ход рассуждений. Квадратичной формой или квадрикой от п переменных zj,. .,, хп бу- дем называть выражение вида — УТ • О Набор чисел А|; образует квадратную матрицу размеры и х п, называ- емую матрицей квадратичной формы. Преобразование А^ = 1/2(А,у + A,.), = + -\м)> как нетрудно убедиться, не меняет квадра- тичной формы однако делает матрицу этой формы симметричной А^ = А'. Будем далее считать, что такое преобразование уже проведе- но, и матрица квадратичной формы симметрична. Каждая квадратичная форма от п переменных может быть приве- дена к диагональному виду <?(у) = + • + <*пУп- Это может быть сделано с помощью невырожденного линейного пре- образования, то есть такого, у которого детерминант соответствующей матрицы отличен от нуля. В самом деле, пусть Ан / 0. Если это не так, то найдем диаго- нальный элемент матрицы Л = {А(,}, 1 < < п, отличный от нуля. Перенумеруем переменные zj,..., хп так, чтобы этот элемент стал эле- ментом Ап. Этого нельзя сделать, если А„ = 0,1 < i < п. В этом случае найдем ненулевой элемент Ач. В силу симметрии / 0. Сле- довательно, в квадратичную форму входит член 2\jXiXj. После за- мены переменных, эквивалентной повороту системы координат на тг/4, !Л = (г, + z>)/\/2, yj = (z, - Zj)/>/2, yk = zt при k / i, k / j, вместо 2XtjXiXj возникнут члены A.jy? - A.jy2. Поскольку коэффициент при одном из квадратичных членов стал отличен от нуля, можно переобо- значить переменные и считать,.что Ан / 0. Пусть pij = Aij/Ац Вернемся к старым обозначениям, считая что все предварительные преобразования уже проделаны q(z) = Ац = ij 137
= Аи n xi + 2^2 + члены, не содержащие zj j =2 — ^11 n n (zj + jJijZj)2 — ^^(pijx;)2 + члены, не содержащие zj J=2 j=2 Сделаем замену переменных У1 = Z! 4- у, = Z,(l > 1), J=2 эквивалентную невырожденному линейному преобразованию (детерми- нант соответствующей матрицы не равен нулю). После этой замены квадратичная форма будет приведена к виду ?(]/) = А11У? +7(У2, -.Рп), где <j — квадратичная форма от переменных j/2> • • - .Ул- Поэтому далее можно проводить несколько раз описанную выше процедуру, вначале применив ее к квадратичной форме д, затем к форме от переменных уз,... ,уп и т.д После этого форма будет приведена к диагональному виду: 9(У) = diVi + •• • + dn!/n- Изменим масштаб, сделав замену переменных zt = yt/^/jdtj, dt / 0. После этого в квадратичной форме g(zl останутся только квадраты, коэффициенты при которых равны 1, -1 или 0. Перенумеровав пере- менные так, чтобы сначала шли единицы, затем минус единицы и по- том нули, убедимся, что любую квадратичную форму от п переменных с помощью невырожденной замены переменных можно привести к виду g(z) = Z) + . . . + z2 - zr2+1 - . .. - zf, s < n Число s называют рангом квадратичной формы. В курсе линейной ал- гебры доказывается, что оно совпадает с рангом матрицы Л и не за- висит от выбора линейного преобразования. Кроме этого инвариантом является разность S = r — (s — r) = 2г —s, называемая сигнатурой. Лю- бая квадратичная форма единственным образом определяется рангом и сигнатурой с точностью до линейного невырожденного преобразования. Мы здесь имеем в точности такое же преобразование, с помощью кото- рого квадратичная форма (9) приводилась к каноническому виду так, что все эллипсы переводились в одну окружность единичного радиуса. К примеру, квадратичная форма, которую мы обсуждали g(z,j/) = ах2 + Ьху 4- су2, в зависимости от ранга Ran и сигнатуры S, может быть приведена к виду 1)ц2 4- v2 (Ran = 2,5 = 2); 2)u2 - v2 (Ran = 2,5 = 0); 3) — u2 — v2 (Ran = 2, 5 =—2); 4)u2(Ran = 1,5= 1); 138
5) — u2 (Ran — 1, S = — 1); 6)0 (Ran = 0, S = 0). Очень полезно рассмотреть пространство коэффициентов (а, 6, с) и выяснить, к какому виду может быть приведена квадратичная форма в различных частях этого пространства. Читатель может самостоятельно убедиться, что разбиение пространства будет именно таким, как пока- зано на рисунке 13. Рис. 13. Разбиение пространства (а, 6, с) по типам квадратичных форм Уравнение Ь2 — 4ас задает двойной конус. Из рисунка 13 следует важный факт. Зададим наугад тройку чисел —(а,6,с). Почти всегда мы будем иметь квадратичную форму, которую можно привести к виду и2 + V2, и2 — v2 или — и2 — v2. Только в исключительных случаях, когда точка оказывается на поверхности конуса, возможны иные ситуации. Кубические формы и квартики. При увеличении числа управляющих параметров проводить класси- фикацию, связанную с выделением "типичных” катастроф, становится все сложнее. Это связано не с увеличением числа катастроф, что было бы вполне естественно, а с возникновением новых явлений, которых не было в пространствах меньшего числа измерений. Возникающие трудности удобно проиллюстрировать на примере про- стейшей задачи о классификации кубических форм (кубик) от двух пе- ременных с(х, у) = otx3 + fix2y 4- уху2 4- бу3 и однородных многочленов четвертой степени (квартик) d(xt у) = ах4 + рх3у 4- уг2у2 4- Ьу3х 4- су4. Мы покажем, как решается эта задача для кубик, и обсудим прин- ципиальные трудности, которые возникают уже в случае квартик. Рассмотрим множества, вдоль которых многочлены c(z, у) и d(x,y) обращаются в нуль. Эти множества представляют собой набор прямых, проходящих через начало координат. В самом деле, обе формы таковы, что c(crz.cry) = or3c(z,y), d(ax}ay) = or4<f(z,y), где or — любая постоян- ная. Поэтому если с(а,6) = 0, то с(аа,а6) = 0и, следовательно, форма c(z,y) будет принимать нулевое значение вдоль всей прямой у = Ъх/а То же относится к форме d(z,y). Эти прямые называют корневыми прямыми. Заметим, что никакие линейные невырожденные преобразо- вания не могут изменить число корневых прямых (см. рис 14) 139
Чтобы выяснить их расположение, рассмотрим их пересечение с вер- тикальной прямой х = 1 (см. рис. 14). Точки пересечения с этой пря- мой определяются кубическим уравнением Г(у) = л + ^у + 7У2 + *у3 = о. Это уравнение имеет не более трех решений уьУг.Уз- Возможна ситу- ация, когда одной из таких прямых является ось ординат х = 0. Из выражения для с(т,у) видно, что это может произойти при 6 = 0. г Рис. 14. Возможные расположения корневых прямых для кубической формы Возможны несколько ситуаций: 1. существуют три различные прямые ОЛ, OBt ОС (рис. 14а). 2. существуют две прямые О А,ОС (случай кратного корня (см. рис. 146)). 3. существует единственная прямая ОА, соответствующая простому корню ОА (см. рис. 14в) 4. существует прямая, соответствующая трехкратному корню (см. рис. 14г). Рассмотрим первый случай. Выберем новую систему координат, в которой ось абсцисс идет вдоль прямой ОА (см. рис. 14а), а ось ор- динат — вдоль прямой ОС В новых координатах (u, v) ось ОА будет 140
задаваться уравнением и = 0, ось ОС - и — 0. Выберем единицы из- мерения таким образом, что прямая ОВ задается равенством и — v. Следовательно в новых переменных корневые прямые задаются урав- нениями и = 0, v = 0, v = и, и кубическая форма поэтому может быть записана в виде c(u, v) = uv(u — v). Сделаем далее замену переменных p=(u + v)/2, g = (u-v)/2, приводящая форму с к виду г(Р,ч) = 2g(p - q)(p + ?) (множитель перед этим выражением несущественен). Таким образом в случае трех различных корневых прямых кубическая форма может быть приведена к виду с(р, q) = p2q - q3. Рассмотрим остальные случаи. В каждом из них, кроме триви- ального случая а = р = у = 6 — 0, существует корневая прямая. Пусть ее уравнение имеет вид 1х + ту = 0. Следовательно выра- жение 1х + ту должно быть делителем с(г,у). Поэтому c(xty) = (/z + ту)(ах2 4- bxy 4- су2). Воспользуемся результатами, касающиеся квадратичных форм, и сделаем преобразование, приводящее квадратич- ную форму к каноническому виду. При этом член 1х + ту перейдет в Lu + Afv. Кубическую форму при этом можно будет записать в виде: a) (Lu + Afv)(u2 — V2), б) (Lu 4- Mv)u2, в) (Lu 4- Mv)(u2 4- v2). (Знак, ко- торый имела приведенная форма, например -и2 - и2, перенесем в член Lu 4- Mv.) В случае a) (Lu 4- Mv)(u2 — и2) = (Lu 4- Mv)(u 4- v)(u — v). Поэтому, если L / M или L — Л/, то мы имеем уже рассмотренный случай трех различных корневых прямых. Если L = Л/, то замена u4-v = p,v — q приводи! форму к виду р2(р — 2q), то есть к случаю б). (Мы будем опускать несущественные множители ) Точно также при L = -М мы приходим к случаю б). В случае б) новые координаты t = Lu 4- Af v, s = u приводит форму к виду ts2. Если М = 0, то замена t = Lx^3u приводит форму к виду /3 В случае в) при L = 0 или Af = 0 возникает кубическая форма вида (t2 4- s2)s. Когда L 0 и М / 0, то повернем систему координат: t = (Lu - Mv)/\/L2 + М2, s = (Lv + Mu)/y/L2 + М2. Тогда t2 + s2 = и2 + ъ2, и c(t,s) = \/L2 4- M2s(s2 4- t2). Изменив масштаб, вновь получим форму s(t2 4- s2) Собирая все полу- ченные выражения, приходим к выводу, что с помощью невырожденной линейной замены координат любую ненулевую кубическую форму мож- но привести к виду; 1) х2у-у\ 2) z2y4-y3, 3) х2у, 4) х3. Так же, как в случае квадратичных форм, здесь удалось получить список стандарт- ных кубик, на основе которого можно проводить классификацию. 141
Рис. 15. Возможные расположения корневых прямых для квартики К сожалению, это не удается сделать уже в случае однородных мно- гочленов четвертой степени. Для формы d(xt у) также существуют кор- невые прямые (см рис. 15). Будем действовать так же, как в случае кубических форм. Одну координатную ось и направим вдоль прямой ОА, другую и — вдоль прямой ОС. Выберем масштаб так, чтобы урав- нение прямой ОС можно было записать как v = и. Тогда в случае четырех различных корневых прямых квартику можно будет записать в виде d — uv(y — u)(v — au). Здесь и = au уравнение прямой OD. С помощью линейных преобра- зований не удается избавиться от непрерывно меняющегося углового коэффициента а. Непрерывно меняющийся инвариант, сохраняющий- ся при выбранном наборе преобразований называют модулем. Наличие модулей намного снижает ценность классификации. Когда возникают модули, появляется несчетное число различных канонических форм. В отличие от ненулевых квадратичных форм, которые могут быть при- ведены к одной из пяти канонических форм, от кубик, для которых существует четыре формы, для квартик канонических форм становит- ся бесконечно много. Однако, может быть, выбранный подход неудачен и другие наборы линейных преобразований позволяют избавиться от коэффициента о? В проективной геометрии доказывается, что это не так Существует ин- вариант с, который называется двойным отношением четырех прямых. Он определяется равенством с _ (У1 - Уз)(У2 - Уч) (У2 - Уэ)(У1 - уч)’ где у 1, t/2» Уз, У4 — ординаты точек пересечения с прямой х — 1 Если од- на из прямых совпадает с осью у, (у< —► оо), то с = (у\ — 1/з)/(уз - Уз) В проективной геометрии доказывается, что в качестве двойного отноше- ния может получиться любое вещественное число, кроме нуля. Двой- ное отношение не меняется при линейных заменах координат, когда со- храняется нумерация прямых С наличием инварианта е и связано то 142
обстоятельство, что не удается в случае квартик избавиться от коэф- фициента а. Возникновение модулей — одна из принципиальных проблем, с ко- торой столкнулись математики и специалисты по математическому мо- делированию, изучая нелинейные явления. Там, где размерность про- странства параметров достаточно велика (как в теории катастроф), ли- бо большой является размерность исследуемой динамической системы (как в системах, содержащих более двух обыкновенных дифференци- альных уравнений) модули естественно возникают. В теории катастроф при большом числе управляющих параметров ”не хватает” преобразо- ваний, чтобы "уничтожить” все непрерывные параметры, превратив их в +1 или в —1, как при приведении квадратичной формы к канониче- скому виду. С аналогичной ситуацией мы встречались, ^бсуждая клас- сификацию квартик При анализе обыкновенных дифференциальных уравнений отсут- ствие модулей тесно связано с грубостью или структурной устойчиво- стью, то есть с возможностью привести близкие динамические системы с помощью некоторого класса топологических преобразований, о кото- рых речь пойдет дальше, к стандартному виду. Так, например, дело обстоит в системах двух обыкновенных дифференциальных уравнений. Если бы это было так в общем случае, то можно было бы провести клас- сификацию динамических систем, приводя их к счетному числу кано нических типов. В 60-х годах нашего века американским математиком С. Смейлом была доказана неразрешимость этой проблемы. ’’Физический смысл” этого результата был выяснен в ходе интенсив- ного исследования динамического хаоса и странных аттракторов. Эти объекты оказались слишком сложными, чтобы характеризовать их с по- мощью какого-либо набора целых чисел. Странные аттракторы внешне напоминают запутанный клубок траекторий. Если бы задача класси- фикации была разрешима, то было бы ясно, чем один клубок качествен- но отличается от другого и какие бифуркации могут превратить один хаотический аттрактор в другой. К сожалению, это не так. Одним из следствий этих математических проблем является отсутствие классификации и набора базовых матема- тических моделей для большого класса динамических систем. Неясно, какое поведение является типичным и какие математические модели следует изучать в первую очередь. Приходится часто опираться на ин- туитивные соображения, а это не дает уверенности, что принципиаль- ные качественные эффекты не упущены. Правоэквивалентность. Классификация функций одной пе- ременной. Рассматривая задачу о качалке и машину Зимана, мы видели, на- сколько важным является тип состояния равновесия. Изменение типа при изменении параметра может приводить к катастрофическим скач- кам. Тип состояния равновесия определяется локальным поведением потенциала, то есть поведением в окрестности состояния равновесия. При этом важно было бы провести классификацию всех возможных типов поведения U(x) в окрестности данной точки х. Будем считать, что все изучаемые функции являются достаточно гладкими, то есть имеют необходимое число непрерывных производных. Естественно счи- тать, что гладкие обратимые замены координат не меняют качествен- ного поведения потенциальной функции. Такие замены переменных осуществляются диффеоморфизмами. Напомним определение диффео- морфизма. 143
Пусть U и V открытые множества в евклидовом пространстве 3^п, причем f(U) = V. Будем называть функцию f диффеоморфизмом, если: 1 она является гладкой, то есть имеет непрерывные производные любого порядка: 2. она имеет обратную функцию g: V —♦ 5?, f(g(x)) = lv. ?(/(*)) = It/ (индекс снизу показывает, какому множеству принадлежит еди- ничный элемент); 3. обратная функция g является гладкой. Локальный диффеоморфизм в точке г, это диффеоморфизм, опре- деленный в некоторой окрестности точки х. Геометрически действие диффеоморфизма можно представить как Рис 16. Действие диффеоморфизма можно представить как гладкое изгибание координатных осей В линейной алгебре доказывается, что линейное отображение А не вырождено, т. е. переводит элементы пространства 9СП в (а не в прямую или точку), если его ранг равен п. Для этого достаточно, чтобы определитель матрицы Л не равнялся нулю (см. риг. 17). Рис. 17. Линснейный оператор, действующий в двумерном пространстве. Если определитель не равен нулю, то он переводит квадрат в некоторый параллелограмм а); если одно собственное значение равно нулю, то в прямую — б), если оба — в точку в) Отображения, осуществляемые гладкими функциями у — /(х), г € W", у € $Rn локально, в окрестности данной точки х, действуют как линейные отображения. Отображению f, можно сопоставить в окрест- ности данной точки х линейное отображение, матрица которого назы- 144
вается якобианом У1 = /1(Х1,...,Хп), Уп — /п(®1, • • •»in); Или в более короткой записи z = Df(x)t. Линейное отображение невырождено, если и только если detDf(x) 0. В простейшем случае, когда г и у скаляры, это условие эквивалентно тому, что д((х)/дх / 0. В этих терминах один из фундаментальных результатов математи- ческого анализа, теорема об обратной функции, формулиуется следу- ющим образом. Пусть f: U —* гладкое отображение и х 6 U. Если линейное отображение Df(x) невырождено, то f — локальный диффеоморфизм в точке х. Грубо говоря, если линеаризованное в окрестности данной точки отображение является невырожденным, а значит обратимым, то и для исходного нелинейного отображения существует обатная функция. Принципиальную роль играет в теории катастоф и другой результат математического анализа — теорема о неявной функции. Она отвечает на вопрос, когда множество решений уравнения f(x,y) = 0 является графиком функции у = y(i) Так же, как в теореме об обратной функ- ции, локально это определяется линейным отображением Df(x, у). Теорема. Рассмотрим функцию f(x,y) двух переменных. Пусть х - т-мерный вектор, у - п-мерный вектор, а сама функция р-мерный вектор. Пусть для некоторой точки (т,у) ё Rm х SRn множество = 0, (где — линейное отображение (16), определяемое якобином, взятым в точке (х,у)), является графиком функции у = у(х). Тогда и для исходной нелинейной функции равенство f(x, у) = /(*, у) определяет график некоторой гладкой финции у = у(х) (см. рис. 18) Вернемся к классификации гладких функций в окрестности данной точки х. Сдвигом системы координат можно добиться, чтобы х = 0. Естественно считать две функции f и g эквивалентными, если одна переводится в другую с помощью гладкой невырожденной замены пе- ременных у — у(х). Исходя из этого интуитивно очевидного предста- вления, введем следующее определение. Определение. Две гладкие функции fug, отображающие в SR будем называть правоэквивалентными вблизи нуля, если существует такой локальный диффеоморфизм у : -+ JRn в окрестности нуля и такая постоянная С, что вблизи нуля ?(*) - /(у(*)) + с (17) 145
Постоянная С необходима, чтобы вернуть значение функции к ну- лю и учесть возможные переносы начала координат. Название ’’правая эквивалентность” связано с тем, что функция f стоит только справа от /. Чтобы яснее представить, какие функции эквивалентны в соответ- ствии с этим определением, а какие нет, приведем несколько примеров. П р и м е р 1. Функции f = у2 и д = —х2 при х = 0, у = 0 не являются правоэквивалентными. (Другими словами, рассматриваются функции, переводящие точку х — 0 в точку у = 0 — у(0) = 0.) В самом деле, допустим противное. Тогда -х2 = (у(х))2 + С. В точке х = 0 левая часть равенства равна нулю, у(0) = 0 по условию. Следовательно С ~ 0. Но тогда в сколь угодно малой окрестности точ- ки х = 0 в равенстве (17) слева будет стоять отрицательная функция, справа — положительная. Это противоречие доказывает, что отобра- жения у(х) не существует. Пример?. Функции хк и хт не являются правоэквивалентными при к / т Вновь положим, что у(0) = 0. Будем для определенности считать, что к < тп. Если эти функции эквивалентны, то должно быть выполнено равенство X* = (у(х))"1 + С. Рассматривая точку х = 0 так же, как в предыдущем примере, приходим к выводу, что С — 0. Будем дифференцировать правую и левую часть последнего равенства: tx1'1 = my(x)m'1y'(x)1 k(k - 1)х*-2 = т(т - l)(y'(x))2y(x)m-2 + my(x)’n-1y"(x), Продифференцировав m раз, получим 0 = m!(y'(z))m + у(х)[ . .] В точке х — 0,у(т) = 0, следовательно j/(r) — 0. Однако это противо- речит тому, что у(х) — невырожденное преобразование 146
С помощью представления о правоэквивалентности можно провести локальную классификацию гладких функций. То есть показать, что не- которой заменой переменной в окрестности данной точки кривую мож- но привести к каноническому виду. С точки зрения классификации и исследовательской программы А. Пуанкаре этот результат идеален. Обсудим его подробнее. Имеет место замечательное утверждение о правоэквивалентности любой гладкой степенной функции хк при нечетном k, или одной из функций ±z* при четном k, если k-я производная в этой точке отлична от нуля, в то время как первые к — 1 производных равны нулю. Докажем его. Сначала рассмотрим следующие две леммы. Лемма 1. Пусть гладкая функция f : 9?п —* 9? такова, что ДО) = 0, тогда в некоторой окрестности начала координат i = l где 5i(xj,гп) — гладкие функции и 0,(0) = df(Q)/dii. Доказательство. Представим функцию f в виде /1 —(f(txt,izi, .,tx„))dt = дц Выбрав функции в виде df(txlt. dxi получим f = 227=1 х'9' Продифференцировав последнее равенство по Zi, имеем - g.tn. • ,»„) + Ь*------------- 1 = 1 Поскольку в начале координат z,: = 0 при 1 < i < п, то ^/(0) dxi = <ь(0). Л е м м а 2. Пусть гладкая функция q(x) такова, что 7(0)= D?(O) = ..= D‘Q(O)=O, где символ Dn соответствует n-fl производной, тогда в некоторой окрестности нуля существует гладкая функция 1(х), такая, что ?(*) = zl + 4(z). 147
Доказательство. Воспользуемся методом математической индукции. При £ = 0 применима предыдущая лемма и функцию q(x) можно представить в виде g(x) = x/i(x), где 1у(х) —- гладкая функция. Продифференцировав последнее равенство т раз, получим Dmq(x) = xDmli(z) + rnDm-lli(x). (18) Будем считать, что лемма верна вплоть до k — 1, то есть, если д(0) = ... = D*-1g(0) = 0, то g(x) = xkl(x). Докажем, что это так и для значения к. Положив х = 0 в формуле (18), и учитывая равенства д(0) = ... = D*g(x) = 0, приходим к выводу, что и /1(0) = ... = D*-1/](0) = 0. Следовательно по предположению индукции /](х) = хк1(х), где Z(x) гладкая функция в окрестности начала координат. Следовательно д(х) = х* + 1/(х), что и доказывает лемму. Это утверждение также носит название лел<л<ы А дамар а. Оно позво- ляет доказать сформулированную теорему. Теорема. Пусть f : 3ft —► 3ft — гладкая функция, для которой /(0) = £)/(0) = .. . — Dfc-1/(0) = 0, но Dk/(0) -ф- 0. Тогда с помощью некоторой гладкой локальной замены координат ее можно привести к виду хк при нечетном к и ±х* при четном к. Доказательство. Разложим функцию х в окрестности начала координат, выделив первые к членов ряда Тейлора /(х) = 1о‘/(0)х‘ + ,(х). где q(x) имеет порядок к + 1. Пусть pPfc/(0) = от / 0. По предыдущей лемме в некоторой окрестности начала координат q(x) = xt+4(x), где I — гладкая функция. Следовательно /(х) = х*(а + х/(х)) = ±х*|а 4- х/(х)|, где знак совпадает со знаком а в достоточно малой окрестности нуля, потому что х/(х) = 0 при х = 0. Пусть д(х) = х|ог 4- х/(х)|1^*, где в качестве корня взят единственный положительный корень. Покажем, что функция g-: 9ft —► 3ft является локальным диффеоморфизмом. Вос- пользуемся теоремой об обратной функции Производная функция д(х) отлична от нуля: Dg(x) = [х 1|о + Z(x)|(1/tьi(/(x) + xDl(x)) + |а + x/(x)|j = |а| # 0, поэтому по теореме существует обратная функция х = д-1(у) и замена координат у = является гладкой и обратимой. Однако /(х) = ±д(х)к = . Когда к нечетно, можно заменить у на —у и сделать знак положительным. В случае четного к знак про- изводной Dk /(0) является существенным, поскольку при определении д(х) приходится извлекать корень четной степени. И, как мы убедились ранее, функции х2т и — х2т не правоэквивалентны. 148
Рис. 19. Пример очень плоской функции Следовательно, функции f(x) и ±х* при четном к и хк при нечетном к действительно локально являются правоэквивалентными. Подчеркнем важное отличие этого результата от стандартного раз- ложения в ряд Тейлора. Функция f(x) может быть переведена в степен- ную хк в малой окрестности данной точки с точностью до постоянной без какого-либо остаточного члена. Кроме того важно подчеркнуть, что полученный результат не зависит от того, сходится ли ряд Тейлора функции /(z) в точке х = 0. Отметим, что для гладких функций, име- ющих бесконечное количество производных ряд Тейлора может не схо- диться или сходиться к другой функции. Пример такого поведения дает функция /(х) = 0 при z = 0 и /(z) = ехр( — 1/х2) при х 0. Эта функ- ция представлена на рисунке 19. Такие функции иногда называют очень плоскими. Можно проверить, что все производные этой функции при z = 0 равны нулю, Следовательно ряд Тейлора О + О х + О z2-h0 z3+. . сходится, но не к функции /(х). Следует подчеркнуть, что здесь мы сталкиваемся с важным изме- нением точки зрения на проблему анализа нелинейных систем, также связанную с исследовательской программой А. Пуанкаре. До начала нашего века большое внимание уделялось сходимости рядов, соответ- ствующих изучаемым объектам. Было построено несколько убедитель- ных примеров, показывающих, что многие действия с расходящимися рядами некорректны. А. Пуанкаре обосновал использование асимпто- тических рядов, которые не сходятся к изучаемой функции при неогра- ниченном увеличении числа членов при фиксированном малом пара- метре. Однако у которых первые к членов дают описание изучаемого объекта при стремлении малого параметра к 0. Возник вопрос, в какой мере и когда первые к членов ряда Тейло- ра, или, как их йасто называют, к-струи, характеризуют исследуемые функции. Рассмотренная теория в простейшем случае дает ответ на него. Простота и упорядоченность, которую в ряде случаев вносит в мир нелинейных явлений теория катастроф, связана с тем, что разные объекты локально характеризуются одними и теми же fc-струями, либо их аналогами, зависящими от параметров. Доказанная теорема дает классификацию гладких функций /(z) в окрестности любой данной точки. С другой стороны, она кажется оче- видной, — качественное поведение функции определяется первым не- исчезающим членом ряда Тейлора. 149
Кажется, что так же дело обстоит и в случае функций нескольких переменных. Но это не так. Это можно продемонстрировать на сле- дующем примере. Рассмотрим функцию ffz^y) = z2y. Эта функция принимает нулевое значение вдоль двух прямых х = 0 и у = 0. А те- перь рассмотрим функцию j(z, у) = х2у + еу2* + 1, где значение с может быть сколь угодно мало, a k сколь угодно велико. Функция д(х, у) ведет себя совершенно иначе. Она обращается в ноль только вдоль прямой у = 0. Вопрос о том, сколько членов ряда Тейлора необходимо взять, чтобы получить информацию о качественном поведении функции не- скольких переменных, является достаточно сложным. Он решается в теории катастроф и требует развития оригинального математического аппарата. Однако в некоторых важных частных случаях ответ оказы- вается достаточно простым. Рассмотрим функцию /(i|,...lzn) в окрестности начала коорди- нат. Если 0/(0) / 0, т. е. хотя бы одна из частных производных df(O)/dxi,..df(O)/dxn отлична от нуля, то функция f(x\,. . ., rn) ло- кально представляет собой участок плоскости и после замены перемен- ных может быть приведена к виду / = ui + С, (см. рис. 18) Точки гладкой функции / : Э?п —♦ 3R, в которых 0/(0) = 0, или в координатной записи dfW_________а/(о) dxi дхп будем называть критическими. Значение функции в критической точке будем называть критическим значением. Рис. 20. Примеры критических точек функции одной переменной Геометрически сформулированное условие означает, что в критиче- ской точке касательная плоскость (или прямая при п = 1) горизон- тальна. В одномерном случае критические точки могут быть л<ини- мумами (достаточное условие df/dx — 0,52//дх2 > 0), максимумами df/dx = 0,d2f/dx2 < 0) и точками перегиба. Соответственно точки А,В,С на рисунке 20. В двумерном случае наиболее распространен- ными критическими точками являются максимумы, минимумы, сед- ла Примеры таких критических точек дают соответственно функции / = -х2 - у2, / = х2 + у2, / = х2 - у2 (см. рис. 21 а, б, в). Однако могут существовать и более сложные критические точки. Пример таких точек дает функция / = х2, которую часто называют желоб. Назва- ние ясно из рисунка 22. Все перечисленные критические точки, кроме 150
желоба, были изолированы, — в их окрестности не было других крити- ческих точек В случае желоба критические точки составляют целую прямую. Если потенциал определяется желобом, то точка в фазовом пространстве, определяющая состояние системы, находится в безраэ личном равновесии. Возможны и другие, более сложные типы особых точек Рис. 21. Простейшие критические точки функции двух переменных Кажется естественным, что в типичных случаях, возникающих при моделировании различных систем должны возникать простейшие кри- тические точки, — максимумы, минимумы и седла. Утверждение, назы- ваемое леммой Морса, формулирует достаточные условия, при которых возникают такие критические точки. По существу, она обобщает доста- точные условия максимума и минимума гладкой функции у = у(х) на случай нескольких переменных. Кроме того она позволяет приводить определенный класс функций вблизи критических точек к канониче- скому виду Рис 22. Функция называемая желобом. Критические точки составляют здесь целую прямую Введем следующее определение. Определение Функция / имеет в точке и невырожденную критическую точку, если Df(u) = 0, и квадратичная форма D2/(u), которую определяют вторые производные функции /: Л av(u) невырождена. 151
Другими словами, ранг этой квадратичной формы равен п или ма- трица невырождена, и, в частности, имеет ненулевой детерминант detHffu) / 0. Последнюю матрицу называют также матрицей Гессе. Отметим, что этим условиям удолетворяют максимумы, минимумы и седла, формулы которых были приведены выше, и не удовлетворяет желоб. ЛеммаМорса. Пусть и — невырожденная критическая точка гладкой функции f : 3?п —► Э?. Тогда в некоторой окрестности точки и можно указать систему координат у\, , S/n,!/i(u) = 0, 1 < е < п такую, что f = /(“) - У1 - • - У? + У?+1 + + Уп • Можно перенести начало координат в и и считать, что и = 0. Не ограничивая общности, будем полагать, что /(и) = /(0) = 0. Тогда в некоторой окрестности нуля, в соответствии с леммой 1, функцию f можно представить в виде п /(*) = >=1 Поскольку точка критическая D/(0) = 0 —* ffj(0) = д/(0)/дт, = 0. Тогда, в соответствии с той же леммой, существуют гладкие функции hij’ п 9j(x) = '£xih<>(x} 1 = 1 Следовательно п /(*) = ^х<х>^ч(х) (19) Дифференцируя два раза равенство (19) по х, И по Xj, убедимся, что в начале координат По условию леммы матрица Я1; является невырожденной. Сделаем преобразование, не меняющее квадратичную форму, но де- лающее соответствующую матрицу симметричной нч = + Л>-)' 1 Будем действовать в точности так же, как при приведении квадратич- ной формы к каноническому виду. Перенумеровав координаты или по- вернув систему координат, если необходимо, добьемся, чтобы верхний диагональный элемент был отличен от нуля Ян # 0 152
Возьмем функцию ^(ui, . •, un) = \Z|Hn(ui,..., un)| и сделаем за- мену переменных ....“"’Г ft "<«........... v, = и, при i > 2. Матрица Якоби этого преобразования в точке uj = ... = un = 0 имеет вид 01(U1, ...,un) .... 0 1 O' 1 1 Видно, что детерминант этого преобразования отличен от нуля, поэтому замена переменных является гладкой и невырожденной. Это гаранти- рует теорема об обратной функции. После этой замены переменных функция / будет приведена к виду / = ±«1 + ViV;H<,(Vb...,Vn). i.j>2 Знак при v? будет таким же, как у Яц(иь .. . ,un). Можно непосредственно проверить, что матрица Я'; является также невырожденной. Вновь делаем такие же замены переменных, как при приведении обычной квадратичной формы к каноническому виду v'l = V1, ....“•>'(- v'j = Vj (j > 2). Действуя таким же образом вплоть до i = п и перенумеровывая пере- менные, приводим функцию f к виду / = Zi+ ... + z’_| -z„_l+i (20) Это равенство справедливо в окрестности начала координат, где локальное существование обратной функции гарантирует теорема об обратной функции. Функция (20) называется морсовским 1-седлом. Если I = п, то это седло определяет максимум, если / = 0 — мини- мум. Итак, любую критическую точку, в окрестности которой невырожде- на матрица вторых производных, можно привести к виду морсовского седла. При этом она будет правоэквивалентна исходной функции. Если матрица вырождена, то все зависит от ранга этой матрицы. Вид функции в этом случае определяется утверждением, называемым леммой расщепления 153
Лемма. Пусть гладкая функция f : 3?п —* 5? имеет критическую точку в начале координат, в которой матрица Гессе имеет ранг г. Тогда вблизи начала координат функция f правоэквивалентна функции ±*1 ± ... ± х? 4- /(Zr+1, • (хп), где f : Rn-r —* 3?, некоторая гладкая функция. Доказательство этого утверждения в основных чертах аналогично доказательству леммы Морса. Введенное понятие правоэквивалентности позволяет ввести, опира- ясь на приведенный пример, важное понятие структурной устойчиво- сти. Часто соображения структурной устойчивости позволяют делать заключения о том, чего ’не может быть” в изучаемой системе. Основой современного естествознания является требование повторя- емости эксперимента. В тех областях знания, где постановка экспери- мента затруднена или принципиально невозможна, таких как история, экономика, социология, психология, ряд задач экологии, часто возника- ют серьезные проблемы. В них намного сложнее предложить содержа- тельные математические модели, чем в традиционных областях. Вместе с тем, обеспечить в точности те же условия эксперимента не удается да- же в самом благоприятном случае. Поэтому требование повторяемости подразумевает нечувствительность к малым возмущениям, которые мо- гут меняться от эксперимента к эксперименту. Естественно такой не- чувствительностью должна обладать и математическая модель. При этом устойчивые свойства, которые могут быть наблюдаемы при по- вторных экспериментах в математических теориях называют грубыми или структурно устойчивыми. При построении математической модели конкретного явления надо решить, какие возмущения допустимы и какие изменения в поведении системы мы будем игнорировать. В теории катастроф обычно допускаются малые гладкие возмуще- ния потенциала и требуется, чтобы получившаяся система была пра- воэквивалентна исходной. (Далее мы познакомимся с другим типом эквивалентности, охватывающим семейства функций.) Обратим внимание на то, что здесь уже на этапе выбора типа модели мы используем идеализацию, — считаем, что и-сами функции, и их возмущения должны быть гладкими. И в каждом конкретном случае надо решать, насколько приемлема эта идеализация. Отметим, что взятая наугад функция, вообще говоря, не должна быть гладкой. Существует большой класс непрерывных функций, ни- где не имеющих производной, которые сейчас широко используются в различных областях естествознания. Приведем примеры структурной устойчивости и структурной не- устойчивости. Будем вновь рассматривать малую окрестность начала координат. Естественно считать, что функция р мала, если она мала вместе со всеми ее производными. Для простоты вначале положим Dp(o) = 0- Рассмотрим, как дей- ствует такое возмущение на морсовскую функцию /. В морсовской особой точке detH/ О (И, как и раньше матрица вторых произ- водных или матрица Гессе). Если возмущение р достаточно мало, то detH(f(0) 4- р(0)) # 0, поскольку определитель является непрерывной функцией. Следовательно f 4- р также является морсовским седлом. Имея в виду малость функции р и процедуру приведения к канониче- 154
скому виду, читатель может проверить, что это не меняет тип седла (число / в формуле (20)). Если отбросить условие Dp(0) = 0, то морсовская точка в начале координат перестанет быть критической, но вблизи возникнет другая критическая точка того же типа. Не доказывая это, приведем примеры. Пусть f = х2, f(0) = 0., Г(0) + 0,р = 2ех, £ < 1 f + р = х2 + 2ех = (х + с)2 - е2. Функция f +р имеет минимум в точке [(х4-е)2 — е2]' = 2(х + с);х = Смещение гладко зависит от с, но точка не меняет своего типа. Совершенно другую картину мы видим, если точка неморсовская. Пусть f = х3, f(0) = 0, /"(0) = 0 f +р = X3 + Зех, (/ 4- р)' = Зх2 4- Зе = 3(х2 4- с). При € < 0, х = ± х/ГЁТт (/ 4- р)" = бх И+\/Й) + р"(\/к1) = бИе| >0, Г(-УЙ) + р"(-Ук1) = -бч/и < 0. Таким образом критическая точка х3 при возмущении р = Зех распа- лась при е < 0 на две морсовские точки — максимум и минимум. Следовательно, она структурно неустойчива. В теории катастроф доказывается, что критическая точка структурно устойчива, тогда и только тогда, когда она невырождена. Таким образом каждая выро- жденная точка структурно неустойчива. Поэтому, казалось бы, такое экзотическое неустойчивое явление как вырожденные критические точ- ки не заслуживают подробного изучения и не должны возникать при моделировании конкретных явлений. И действительно это так, — в случае отдельных гладких функций вырожденных критических точек быть не должно. Однако в случае семейств функций дело может обсто- ять совершенно иначе. Одним из наиболее эффективных методов анализа нелинейных си- стем является бифуркационный анализ, — выяснение того как меня- ется поведение системы при изменении ее параметров. Центральный момент в теории катастроф — изучение не отдельных функций, а се- мейств гладких функций, зависящих от параметра. Определение эквивалентности семейств получается как естествен- ное обобщение понятия правоэквивалентности. Напомним, что две функции f и д : —» 5? правоэквивалентны вблизи начала коорди- нат, если существует локальный диффеоморфизм у(х) : 3Rn —* и ’’сдвигающий” член у, такой, что j(*) =/(у(*)) + ? (21) Будем рассматривать семейства функций f(x, А) и д(х, А) : !Rn х йг —. R, в которых переменная х принадлежит пространству Rn, параметр А — пространству Вместо отдельного диффеоморфизма у, фигуриру- ющего в формуле (21), вводится семейство диффеоморфизмов, уд(х), гладко зависящих от параметра А. Кроме того вместо одной постоян- ной у приходится ввести семейство функций у(А) (3?г -> й). Кроме того 155
необходимо ввести диффеоморфизм д = р(А) (Э?г —* 3?п), отражающий возможность замены переменных в пространстве параметров Определение. Назовем два семейства функций Дх, А) и д(х, А) эквивалентными, если существуют функции /, у, 7, определенные в не- которой окрестности нуля такие, что 9(х,А) = /(уа(х),д(А)) + 7(А). (22) Геометрический смысл введенного определения иллюстрирует рисунок 23. Здесь пространства переменных у: Э?п и параметров Йг одномер- ны. На рисунке слева представлены линии уровня семейства функции f : /(z,A)=const и семейства функций g: g(x, A)=const. Эти функции эквивалентны. Отображение ^(А) сжимает или растягивает представленный набор линий уровня вдоль оси абсцисс. Это преобразование переводит вер- тикальные линии A=const (см. левую часть рис. 23) в вертикальные линии ji(A)=const (правая часть того же рисунка). Отображение у>(г) определяет деформацию этой картины вдоль оси ординат. Рис. 23. Пример двух эквивалентных семейств функций Можно представить себе часть пространства Э?п х ЗГ как резиновый куб, в котором существуют поверхности уровня /(z, A)=const. Функции А(я) и уд(х) определяют деформацию этого куба. При этом не проис- ходит разрывов и близкие вначале точки остаются близкими и после деформации. Мы упоминали, что взятая наугад критическая точка будет невы- рожденной. Свойства, которыми обладает взятая наугад функция из данного класса, называют типичными. Введенные определения позволяют сформулировать фундаменталь ный результат теории катастроф классификационную теорему Тома ТеоремаТома. В типичном случае г - параметрическое се- мейство гладких функций 3in —► SR для всякого п и всех г < 5 структур- но устойчиво и эквивалентно (в смысле введенного выше определения) вблизи некоторой точки одной из следующих форм: некритическая uj невырожденная критическая или морсовская и? + .. . + и? - и’+1 - ... - и’ (1 < I < п) 156
каспоидные катастрофы: А2 складка u? + Aiui + (М) Аз сборка ±(uf + ^2^1 4- Aiui) 4- (Л/) Л4 ласточкин хвост и® + Ази^ 4- Aju2 + A1U1 4- (Л/) Л5 бабочка ±(и® 4- A4uf + A^ug 4- Ajuj 4- A1U1) 4- (M) Лб вигвам uj 4- Aju® 4- A4uf 4- A3U? 4- A2Vj 4- Ajui 4- (A/) омбилические катастрофы: D* эллиптическая омбилика UjU2 - u* + A3U1 4- A2U2 4- AiUi 4- (N) £)| гиперболическая омбилика u[u2 4- u2 + ^3^? 4- A2U2 + Mui 4- (N) D$ параболическая омбилика ±UiU2 + u2 4-A4Uj4-A3Ui4-A2U24-AiUi + (N), вторая эллиптическая омбилика u?u2 — u® 4- A5U2 4- A4u4 4- A3UJ 4- А2и2 4- Ajui 4- (№) гиперболическая омбилика ViU2 + u2 + ^5U2"*_^4u2 + ^3U) + A2U24- A1U1 4- (N) Eg символическая омбилика ±(ui 4- u2 + ^^1^2 + + ^31*1^2 + A2V2 + A1U1) 4- (AT)i где (ui,...,un) G $Rn, (Ai,..., Ar) G SRr, символ M обозначает морсов- скую функцию вида 4- ... 4- u? - u?+i - ... - и*,(1 < i < n), N — функцию вида uj 4- ... 4- u? — и?+1 — • • • — и?» (2 < ii < л). Первые семь катастроф из этого списка, в которые не входит параметр А5, носят название элементарных катастроф. В списке катастроф фигурирует некоторый потенциал, не завися- щий от параметров, который принято называть ростком катастрофы и функция зависящая от параметров и называемая возмущением. Каждая из элементарных катастроф детально исследовалась. Хо- тя нельзя построить такие же простые наглядные картинки, как при анализе складки и сборки, если число параметров более двух, каче- ственная картина и в этом случае подробно описана. Наличие тако- го принципиального обобщающего результата позволяет использовать теорию катастроф при математическом моделировании на нескольких уровнях. На первом уровне, в тех случаях, когда модель имеет вид (1) и число управляющих параметров невелико, можно воспользоваться стандарт- ными результатами теории. Типичный пример такого плана — классическое описание фазовых переходов. При термодинамическом описании уравнение состояния ве- щества задает некоторое n-мерное многообразие в 2п-мерном простран- стве. Первые п переменных 1 < t < л в этом пространстве характе- ризуют интенсивные, вторые А,, 1 < i < п — экстенсивные термодина- мические параметры. Экстенсивные переменные определяют управля- ющие параметры, интенсивные — переменные состояния. Для описа- ния физической системы вводится семейство потенциальных функций, зависящих от параметров V(z, А). Предполагается, что состояние функ- ции описывается критическим значением переменной г, минимизирую- щим этот потенциал. Т. е. при описании изучаемого объекта следует изучать критические точки dV -z- = О, 1 < I < л, 0X1 157
которые являются локально устойчивыми, матрица Гессе в них —II dxtdij || должна быть положительно определенной. При этом фазовым переходам соответствует переход с одной ветви, характеризуающей состояния равновесия, на другую — при изменении некоторого параметра А. Если следовать принципу максимального про- медления, то фазовые переходы будут происходить, когда кривая, опи- сывающая изменение состояния системы при варьировании параметров будет пересекать компоненту бифуркационного множества, на которой рождаются или исчезают локальные минимумы (как в задаче о ка- чалке). Можно сказать, что при этом система "локально минимизи- рует" потенциальную функцию. Точное поведение иллюстрирует рису- нок 24а. Однако, если в исследуемой системе уровень шума достаточно высок (детальное описание флуктуаций требует более сложной модели, чем уравнение (1)), то система имеет возможность "оценивать” не толь- ко локальный минимум, в котором находится, но и близкие значения потенциала, где могут быть свои минимумы. При этом может проис- ходить не локальная, а глобальная минимизация. Состояние системы при этом будет определяться глобальным минимумом потенциальной функции. Типичное поведение системы в этом случае представлено на рисунке 246. Это приближение, часто используемое в теории фазовых переходов, называется принципом Максвелла. V У У У у V VMyJM Рис. 24. Во многих физических задачах параметры, при которых происходят катастрофические скачки, определяются не принципом максимального промедления — а); а принципом Максвелла — 6) При описании фазовых переходов второго рода широко используется модель Гинзбурга — Ландау Она определяется потенциалом V(x,a)= + (22) где х — некоторый параметр порядка, описывающий состояние систе- мы. а — бифуркационный параметр, имеющий смысл отклонения тем- пературы Т от критического значения Тс. Бифуркационная диаграмма 158
у этом случае фигурирует в таблице 1 (см. гл. 5). Этот ’’трезубец” с точностью до изменения направления оси абсцисс является таким же, как в задаче о прогибе колонны. Потенциал (22) описывает систему, инвариантную относительно изменения знака х Однако существуют физические процессы, нарушающие эту симметрию. Тогда приходится иметь дело с потенциалом И1, я) = + ^ах2 + (23) Этот потенциал совпадает с катастрофой сборки и нелинейные эф- фекты в такой системе будут такими же, как в задаче о качалке или о машине Зимана. Другими словами, задача свелась к ранее изученной. Некоторые отличия могут возникнуть, если, исходя из физических осо- бенностей задачи, придется исходить не из принципа максимального промедления, как обычно, а из принципа Максвелла. Однако при описании фазовых переходов первого рода приходится иметь дело с еще более общим потенциалом И(х. a, dt с, d) = ~х6 4- тая4 + ±Ьх3 + ^ст2 4- dx. 6 4 3 2 Однако этот потенциал определяет ни что иное, как катастрофу ’’ба- бочка” 4s, подробное описание которой имеется в учебниках теории катастроф. Итак, на первом уровне математические модели различных нелиней- ных систем удается сопоставлять с уже изученными моделями теории катастроф. В ряде случаев это позволяет в ряде областей обнаружи- вать новые эффекты. Однако во многих дисциплинах, в частности, в термодинамике, те- ории упругости, физике лазеров, теории устойчивости кораблей прин- ципиальные проблемы были решены без привлечения представлений теории катастроф. Однако общая теория позволяет сформулировать обнаруженные за- кономерности в наиболее простом и ясном виде. Кроме того, появляется возможность выделить общие качественные черты различных нелиней- ных систем. Третий, наиболее глубокий и интересный, уровень связан с анализом более сложных объектов, требующих выхода за рамки элементарной теории катастроф. Это часто требует как создания новых моделей, так и развития математического аппарата. Вопросы и задачи 1 Рассмотреть бифуркационное множество для катастрофы ласточ- киного хвоста ^аЬг(я) = я5/5 + ах3/3 + 6z?/2 + сх. Где в окрестности точки х ~ 0 имеют место складки и сборки? Как Вы представляете бифуркационное множество в пространстве па- раметров а, 6, с? В каких физических задачах, по Вашему мнению, могла бы возникнуть такая катастрофа? 159
2. Для описания фазовых переходов Ван дер Ваальсом было пред- ложено феноменологическое уравнение состояния (Р + a/V2)(V - 0) = ЯТ. Здесь Р, V и Т — давление, объем и температура среды, R — постоянная. Иногда вместо объема рассматривают плотность р = 1/V. Эксперименты показывают, что если температура меньше некото- рой критической Тс, то имеются давления, при которых возможны несколько значений плотности. В таких системах возможны скач- ки — трудносжимаемая жидкость внезапно становится легкосжи- маемым газом. Описывает ли такое поведение модель Ван дер Ва- альсаб 7 Будем рассматривать температуру и давление в качестве переменных управления, а плотность — переменной состояния. Имеет ли здесь место катастрофа? Каково критическое значение Тс? Можно ли эту модель локально привести к некоторому кано- ническому виду? 3. Поставим пустую кастрюлю на солнце. Попадающий в нее свет отражается от ее цилиндрических стенок и дает каустику. Каков вид этой каустики? Каково ее уравнение? 4. Почему мы видим радугу? Почему при наблюдении с самолета мы видим ее как круговую полосу, а не как дугу? Можем ли рассма- тривать ее как каустику? Исследовать геометрию параллельных лучей с одинаковой длиной волны, падающих на капельку. 5. Во многих задачах акустики, волновой оптики, квантовой механи- ки возникают аналогичные дифракционные картины. Это связано с тем, что решения этих уравнений часто представляют собой бы- стро осциллирующие интегралы u(z, г) = [ е,г*(*'°)а(г, а, т)с/а, JG где т — большой параметр, а интегрирование ведется по некоторой области G. В ряде случаев интеграл аппроксимируют суммой г >=1 где ац, . ,аг(х) при данном х являются решениями уравнения ^-^(х,а) = 0. Оа Почему такая аппроксимация часто оказывается применима? Ка- кова типичная картина, если си, .,аг(т) — морсовские особенно- сти? б Доказать, что при центральном проектировании двойное отноше- ние остается инвариантом. 160
7. В некоторых случаях дикие пчелы не образуют колоний В дру- гих — образуют колонии, в которых живут десятки тысяч осо- бей. Промежуточных вариантов практически нет. Объяснить это явление, считая, что плотность пчел должна поддерживаться на уровне В пчел/км2. Считать, что колония живет в области, имею- щей форму круга. Число пчел /V ~ яЯ2В. Время, затрачиваемое на полет ”из центра” и обратно ~ Я. Продуктивность отдельной пчелы принять равной Р(Я) = с — дЯ. Считать, что выигрыш от кооперации 5(Я) определяют функцией, для которой > О при Я = Ятщ и lim до = 0 при Я —► оо. Рассмотрите функцию полезности Я(Я) = Р(Я) + 5(Я) и выясните, с какой катастрофой мы имеем дело в этом случае. 8. Энергия системы, представляющей собой жесткий стержень, опи- рающийся на шарнир без трения с пружинками в плоскостях ху и xz, определяется потенциалом (модель Аугусти) и = а(ха + у2) + Ь(х4 4- у4) + сх2у2, где х и у перемещения конца стержня. Возможны ли в такой си- стеме скачки ("катастрофичекое прощелкивание”)? Рекомендуемая литература Элементарное введение в теорию катастроф и ее приложения со множе- ством примеров и иллюстраций дает книга: Постон Т.г Стюарт И. Теория катастроф и ее приложения. М.: Мир, I960. Изложение в этой книге начинается с базовых представлений линейной алгебры, аналитической геометрии, математического анализа. Рассмотрены приложения к теории устойчивости судов, двумерные течения жидкости, гео- метрическая и волновал оптика, теория упругости, физика лазеров и большой круг задач, связанных с мягким моделированием. Более сложный учебник, раскрывающий математические особенности те- ории и важные приложения к задачам аэродинамики, климатологии, кванто- вой механики, см.: Гилмор 3. Прикладная теория катастроф. М.: Мир, 1984. Т.1, 2. Особенность этой книги состоит в том, что в ней рассматривается переход от теории катастроф к теории бифуркаций, которая позволяет исследовать более сложные математические модели, которые не описываются некоторой потенциальной функцией. Брошюра Арнольда В.И. Теория катастроф (М.: Изд-во МГУ, 1983) рас- сматривает приложения теории катастроф к задаче анализа крупномасштаб- ного распределения вещества во Вселенной, проблемам оптимизации, задаче об обходе препятствия. В ней также обсуждаются глубокие связи теории с Другими разделами современной математики. Более строгие математические подходы предлагают книги: Брус Дмсиблик П. Кривые и особенности М.: Мир, 1988; Брекер Т., Ландер Л. Дифференцируемые ростки и катастрофы. М.: Мир, 1977. Изложение строгих результатов теории дает книга. Арнольд В.И., Вар- ченко А.Н., Гусейн-Заде С.М. Особенности дифференцируемых отображений. М.: Наука, 1981.
Escher M.C. Waterfall. 1961 Эшер М.К. Водопад
ГЛАВА 7 ПРОСТЕЙШИЕ СИСТЕМЫ С ДИСКРЕТНЫМ ВРЕМЕНЕМ Каждой эпохе воздадим по заслу- гам! Новое время также имеет блестящие достижения. Р. Шуман Еще не так давно казалось, что более глубокое понимание нели- нейных явлений будет связано с анализом все более сложных матема- тических моделей. И тем более поразительно, что крупные успехи в изучении нелинейных систем, в предсказании новых эффектов были достигнуты в ходе исследования вызывающе простых математических моделей — одномерных отображений, зависящих от параметров: x„+1=/(xn.A) (1) zi = z', п = 1,2,3,... Явная формула (1), задающая одномерное отображение, позволяет по числу хп определить следующее число zn + i, и таким образом опре- деляет всю последовательность {zn}. Можно сказать, что соотношение (1) соответствует некоторому итерационному процессу. Поэтому последовательность чисел {zn} часто называют итерация- ми начальной точки х*. Простейшие отображения вида (1) были известны еще Евклиду и Архимеду. При /(zn,A) = Ахп соотношение (1) определяет геометриче- скую прогрессию со знаменателем А. При /(zn, А) = А 4- хп — арифме- тическую прогрессию. Однако если /(т,А) простейшая нелинейная функция аргумента I, например, квадратичная парабола, то свойства последовательности {хп} могут оказаться совершенно необычными. Принципиальный шаг в их понимании был сделан в 70-х годах и оказался возможным, благо- даря использованию компьютеров. В настоящее время одномерные отображения выступают, с одной стороны, как упрощенные модели множества различных процессов. С другой стороны, как язык, на котором можно говорить о многих слож- ных явлениях. Исследование одномерных отображений позволило ввести новые по- нятия, применимые к большому классу диссипативных систем, обна- ружить ряд новых явлений, ответить на несколько принципиальных вопросов. Как происходит переход от простейших упорядоченных к хаотическим режимам при изменении параметров? Как чередуются в пространстве параметров области, в которых наблюдаются порядок и хаос? Как происходит усложнение упорядоченности при изменении па- раметра? Каковы простейшие типы хаоса в открытых нелинейных си- стемах и способы их описания? Приведем несколько типичных ситуаций, в которых одномерные ото- бражения выступают как математические модели, либо возникают при численном решении уравнений. Отображения как модели процессов с дискретным временем. Выше мы обсуждали свойства нелинейного дифференциального урав- нения, называемого логистическим уравнением. В этой модели время 163
t считается непрерывным. Эта переменная может быть любым дей- ствительным числом в интервале 0 < t < оо. Численность популяции z(t) предполагается непрерывной и дифференцируемой функцией этого аргумента. По существу, мы неявно подразумеваем, что у нас есть воз- можность в любой момент времени измерить величину x(t) и сравнить ее с предсказаниями модели. Но возможна совершенно иная ситуация. Допустим, что существует возможность оценить численность популяции только раз в год. То- гда естественно временную переменную считать не непрерывной, а дис- кретной. Например, такой, которая может принимать только целые действительные значения п = 1,2,.... Численность популяции тогда будет выражаться функцией дискретного аргумента z(n) или, как ее часто обозначают, zn. Последовательность zi,z21... для краткости бу- дем обозначать {zn}- Можно считать, что zn — численность популяции в год с номером п. По-видимому, среди чисел гп есть какая-то закономерность.. Есте- ственно ожидать, что численность популяции в данный год zn + i зави- сит от того, сколько животных было год назад, то есть от величины гп. Таким образом, в простейшем случае (когда величина zn+] зависит только от численности в предыдущий год, а не от zn_i, хп~2, и т.д.) мы приходим к математической модели, вида (1). В этой модели f — непрерывная однозначная функция своих аргументов, А — параметр, который зависит от того, какую конкретную задачу мы рассматриваем, х* — начальное значение, — первый член в последовательности {хп}. Часто используется функция f вида Az(7V — z): zn + 1 = Xxn(N - zn), 0 < zn < /V. (2) Эта зависимость выбирается из тех же соображений, что и правая часть в логистическом уравнении. Формула (2) показывает, что если XN > 1, то численность вида растет, пока она мала хп <С N. В силу огра- ниченности ресурсов численность животных начинает убывать, когда животных становится слишком много. Так же, как в логистическом уравнении, это учитывается с помощью ограничивающего квадратич- ного члена. Удобно сделать замену переменных zn = x'nN, А — X'/N. При этом формула (2) приобретает вид <+1 = А'<(1 - О. О < < < 1- (3) В дальнейшем штрихи у новых переменных будем опускать. Ото- бражения (2) и (3) часто называют логистическим отображением. Нас интересует вопрос о том, что произойдет с различными видами по прошествии достаточно долгого времени, то есть каковы аттракторы изучаемого отображения. Для ответа на него в этой простейшей моде- ли достаточно выяснить, какой будет последовательность {zn}, п —» оо при различных значениях А. Отображения вида (1) в настоящее время используют при феноменологическом описании ряда процессов в эко- номике, гидродинамике, электронике, в других областях. Отображения, возникающие в результате применения мето* да Эйлера к дифференциальным уравнениям. Обсуждая линейные дифференциальные уравнения, мы рассмотре' ли модель Мальтуса, в соответствии с которой численность популяции должна неограничено расти. Для того чтобы учесть ограниченность 164
ресурсов, доступных популяции, и внутривидовой отбор, естественно ввести нелинейный ограничивающий член. Это приводит к уравнению Мы выбрали единицы измерения так, чтобы за единицу была взята пре- дельная численность популяции. При 0 < ДО(0) < 1,ДО(<) —* 1 при t —► оо. В этом нетрудно убедиться, проводя качественное исследование этой модели. Неподвижная точка N = 0 является неустойчивой, точка ДО = 1 устойчивой. Применим к этому уравнению метод Эйлера ДО ( (fc 4- 1)т) - N(Jcr) —------------------ = оДО(*т)( 1 - ДО(Лт) и введем обозначения ДО(Лгт) = ДО*, ДОк + i ~ 7 = ат + 1, 6 = ат. Следовательно, мы вновь получаем одномерное отображение (3) Как мы убедимся далее, его свойства похожи на свойства дифферен- циального уравнения только при небольших г. Когда шаг по времени г превышает некоторое критическое значение, поведение этих двух объ- ектов начинает качественно отличаться. Отображения, возникающие при численном решении нели- нейных алгебраических уравнений. Стандартным методом численного решения нелинейных алгебраиче- ских уравнений вида X = F(z) является построение последовательности {хп}, сходящейся к его корню х“. Это можно сделать с помощью метода простой итерации (рис. 1) ^п+1 — Г(хп), либо метода Ньютона х -х ' n+l -Хп~ Как мы видим, в обоих случаях возникают одномерные отображения^ Построение отображения как способ обработки эксперимен- тальных данных. Пусть мы наблюдаем за каким-либо сложным процессом, развива- ющимся во времени и характеризующимся функцией х(<). Поступим следующим образом. Выделим локальные максимумы функции xltY Первый максимум обозначим через второй через М2, fc-й через АД (см рис. 2а). Первый максимум достигается в момент $>, второй в Момент $2 и т.д. На плоскости {Mt, Affc+i} будем откладывать точки с координатами (Мк,Шц), т. е., первая точка будет (Л/1,Л/2), вторая 165
Рис. 1. Графическое изображение итерационного процесса, применяемого для решения нелинейных алгебраических уравнений: а) метод простой итерации; 6) метод Ньютона — (Л/2,Л/3) и т.д. (см. рис. 26). Оказывается, для некоторых колеба- тельных химических реакций, математических моделей гидродинамики и ряда других систем точки { Л/*, Л/*+j} с высокой точностью ложат- ся на однозначные непрерывные кривые Л/п+1 = /(Л/п) Типичный вид отображения, возникающего в натурном эксперименте, по исследо- ванию колебательных химических реакций с хаотическим поведением, представлен на рисунке 26. Рис. 2. Одномерное отображение может возникнуть при анализе экспериментальных данных: а) выделенке локальных максимумов в зависимости z(t); 6) характерный вид отображения, возникавшего при анализе колебательных химических реакций с хаотическим поведением Наличие такой функции / позволяет в ряде случаев строить про- стые феноменологические модели изучаемых явлений. Такие модели, в частности, дают возможность по предыдущим значениям локальных максимумов предсказывать следующие, т. е. прогнозировать дальней- ший ход процесса, исходя из его предыстории. Существование кривой / показывает, что в системе происходит са- моорганизация: ее динамика эффективно описывается дискретной ди- 166
нами ческой системой всего лишь с одной степенью свободы. В обсуждаемом случае мы можем предсказать величину Mn + i, если известен максимум Мп и отображение /, однако одномерное отображе- ние не позволяет узнать момент tn+i ® некоторых системах, напро- тив, интервалы времени Atn = Zn + i — tn, через которые функция x(t) достигает локальных максимумов, с высокой точностью определяются некоторым отображением A£n+i = g(A/n). Естественно, в общем случае при анализе экспериментальных дан- ных точки (Мп,Мп+1) заполняют целые области на плоскости (Afn, Mn + i) Поэтому если какие-то экспериментальные данные определя- ют одномерное отображение, то это следует рассматривать как большую удачу Переход к хаосу. Сценарий Фейгенбаума Анализ логистического отображения позволил выяснить многие об- щие свойства одномерных отображений. Рассмотрим более подробно эту математическую модель. При небольших значениях А(0 < А < 1) хп —*• 0 при п —* оо незави- симо от выбора Ж). Поведение последовательности в этом и в других случаях удобно представлять графически. Рис. 3. Графическое представление последовательности (in) для логистического отображения в том случае, когда zn —* 0 при п —» оо Нарисуем кривую у = /(ж) при выбранном значении А и прямую у = х (рис. 3). Отложим Xi по оси абсцисс, проведем вертикаль до пе- ресечения с кривой у = /(ж) (точка А), затем из нее горизонталь до пе- ресечения с линией у = х (точка В). Теперь вновь проведем вертикаль до пересечения с осью х. Полученную точку пересечения обозначим через х2. Легко проверить, что ж2 = Взяв точку ж2 за началь- ную и повторив все те же операции, получим жз, затем Х4 и т.д. Эта процедура называется построением лестницы Ламе рея. Она позволяет графически находить члены последовательности {жп}. Из рисунка 3 видно, что жп —» 0 при п —► оо. Из формулы (3) следует, что функция /(ж) переводит отрезок [0,1] в отрезок [О, А/4]. Если А < 4, то все зна- чения хп лежат на отрезке [0,1] при условии, что 0 < Xi < 1 Именно поэтому говорят, что формула (3) задает отображение отрезка в себя. Пусть теперь А немного больше единицы. Пои этом последователь- ность {жп} ведет себя по-другому (рис. 4): {жп) стремится к постоян- ному значению ж* > 0. В применении к исходной биологической задаче 167
Рис. 4. Функция /(z) и первые элементы последовательности (in), zn —* х‘ при л —* оо это означает, что численность такого вида по прошествии нескольких лет стабилизируется и перестанет меняться со временем. Значение х* может быть найдено из уравнения r-=/(z-,A). (4) Все точки, удовлетворяющие этому уравнению, называются непо- Звижмыми точками отображения, так как хп = х* при любом п, если zi = z". Типичная картина итераций одномерного отображения в окрестно- сти неподвижной точки х* представлена на рисунке 4. В окрестности этой точки величины хп — х* при больших п стремятся к геометрической прогрессии lim (xn + j — тп)/(хп — хп-j) — 7 = 77 - п — оо 0Х Отметим, что все неподвижные точки отображения лежат на пересече- нии графика функции Xn + i = /(*п,А) с биссектрисой первого коорди- натного угла Xn + i = хп. В самом деле, точка пересечения этих линий xn + l = f(xn А) = хп удовлетворяет определению неподвижной точки Поэкспериментировав с лестницей Ламерея, либо рассмотрев про- стейшее отображение хп + 1 = У которого ноль - неподвижная точ- ка х* и df(x*)/dx — у, можно установить следующие факты. Когда /г(х", А) > 0, элементы последовательности {хп} монотонно сходятся к х* при 1 > /Х(х*, А) > 0 или расходятся от нее при /Х(х*, А) > 1. Когда /г(т*,А) < 0, то элементы последовательности {хп} оказываются по- очередно то справа, то слева от неподвижной точки (см. рис. 1а). Они сходятся, если 0 > /(*", А) > — 1, и расходятся, когда Д(х*, А) < — 1. При А < 1 квадратное уравнение х* — Ах*(1 - х*) имеет один нео- трицательный корень х' = 0. При А > 1 неотрицательных корней два: I* = 0 и I* = (А - 1)/А. При А = 1 неподвижная точка х* = 0 теряет устойчивость, а вновь появившаяся точка становится устойчивой. В самом деле, нетрудно определить, будет ли устойчивой неподвиж- ная точка I* отображения /(х,А). Пусть хп = х" + Дхп, где Дхп — малое число. Если точка устойчива, то с ростом п величина] Дхп| долж- на уменьшаться Перепишем формулу (1) в виде х’ + ДГп+1 = /(г' + Д*п. А) ~ f(z') + 168
При анализе устойчивости особых точек обыкновенных дифферен- циальных уравнений в невырожденном случае все определяется линей- ными членами (первый метод теории устойчивости Ляпунова). Прово- дя здесь аналогичные рассуждения, можно убедиться, что устойчивость точки г* определяется поведением линейного отображения л.,... (5) ОХ Но это ни что иное, как обычная геометрическая прогрессия. Сле- довательно |Дгп| —* 0, когда выполнено неравенство дх < 1. (6) Это и есть достаточное условие устойчивости неподвижной точки х*. Оно, естественно, совпадает с достаточным условием сходимости мето- да простой итерации. Если выполнено противоположное неравенство, то можно утверждать, что точка х* будет неустойчивой. Если произ- водная равна единице, то нужно рассматривать следующие члены ряда Тейлора. Будем дальше увеличивать параметр А. Поведение системы снова изменится: в последовательности {хп}, начиная с достаточно больших п, будут чередоваться два числа: и а2. (Точнее говоря, последова- тельность {in} устроена так, что ijn + i —* ai,i2n —* а2 при п —► оо.) Эти числа связаны соотношениями щ = /(в2),а2 = /(а1) Будем го- ворить, что в этом случае отображение (3) имеет устойчивый цикл с периодом 2, и обозначать его S2. Рис. 5 показывает, как выглядит цикл S2 на графике. Рис. 5. Цикл S3 в логистическом отображении. Точка максимума z = 1/2 является элементом цикла. Такие циклы принято называть сверхустойчивымн Рис. 6. Функция /(z) и устойчивый цикл S4 Переход от неподвижной точки (ее можно считать циклом S1) к ци- клу S2 произошел в результате бифуркации, которая получила назва- ние бифуркации удвоения периода. Точка х* при этом не исчезла, однако величина стала меньше -1. 169
При дальнейшем увеличении А последовательность {zn} опять из- меняется. Возникает цикл S4 : х^т —* ai)Z4m+i —► aj.z^m+a аз.Ецт+з —* сц при т —* оо, причем а2 = /(аДаз = /(аг)>а4 = /(аз),ai = /(а4) (рис. 6). Увеличивая далее значение параметра А, мы увидим циклы S8 * * * * * * *, S16, S32 и т. д. При этом каждый раз цикл S2₽ теряет устойчивость, про- исходит бифуркация удвоения периода, и устойчивым становится цикл S2'+I Наконец, при некотором значении А (его иногда обозначают Aqq) формула (3) дает уже непериодическую последовательность {хп}. Наблюдаемая картина оказывается очень интересной. Во-первых, в поразительно простой модели (1) заложено очень сложное поведение. Во-вторых, в ней удается проследить большое количество бифуркаций, приводящих к усложнению решения. Сделать это в более сложных мо- делях гораздо труднее. В-третьих, при 0 < А < А» устойчивы только циклы, период которых равен 2Р. Хотелось бы понять, чем это вызвано, и изучить поведение модели более подробно. Наряду с отображением (1), удобно рассмотреть отображение Хп+1 = /(/(х„,А)) = /2(хп,Л). (7) Рис. 7. Зависимость у = /2(х). Отображение /(х) при этом значении параметра имеет устойчивую неподвижную точку В этой главе /n(z,A) всегда будет соответствовать n-й итерации функции /. В нашем случае вид функции /2(г,А) показан на рис. 7 и 8. Первый рисунок соответствует устойчивой неподвижной точ- ке, второй — устойчивому циклу S2. График /2(z,A) пересекается с прямой у = z во всех неподвижных точках отображения, а также в точках, принадлежащих циклам S2. Действительно, если х* = /(z"), то /(/(**)) = /(х*) = х*. Кроме того, если aj и а2 элементы цикла S2, то а2 = /(aj = / (/(аг. А)), ai = /(a2, А) = /(/(ai,A)). Увеличи- вая параметр А, мы растягиваем функцию /2(z, А) вдоль оси у. И если при некотором значении А линии у = х и у = /2(х,Х) пересекаются в одной точке (см. рис. 7), то с увеличением А могут появиться еще две точки пересечения (см. рис. 8). Они-то и будут определять цикл 170
Рис. 8. Такой вид имеет функция /э(т) для логистического отображения, когда f(x) определяет сверхустойчивые циклы: a-цикл S3; 6-цикл S4 S2. Переход S1 —* S2 в отображении /(х, А) обусловлен тем, что в ото- бражении /2(х,А) одна из неподвижных точек теряет устойчивость, и в ее окрестности появляются две новые устойчивые неподвижные точ- ки. Рассматривая функции /4(х, А),/®(х, А) и т. д., можно увидеть, как происходят следующие удвоения. В каждом из этих случаев одна точка теряет устойчивость и появляются две другие устойчивые точки, поэтому период цикла удваивается. При этом возникновение устойчи- вого цикла S4 у отображения xn+i = f(^n > А) связано с появлением двух устойчивых циклов у отображения /2 и четырех неподвижных точек у Л Действуя так же, как в случае неподвижной точки, можно пока- зать, что устойчивость цикла S? с элементами xi,...,Xp будет опре- деляться величиной | k = 1, ...,р. В самом деле — точки Х1,...,хр будут неподвижными точками отображения G(xt А) = fp(x,A) : = /(/(*р-1, А)) = ... = /(/...(ii)) = G(xbA) и т.д. ррвз Следовательно, достаточное условие устойчивости неподвижной точки ii (либо любой из точек Х2,...,Хр) можно использовать для функции G : I 1< 1’ Продифференцировав эту функцию в соответствии с правилом дифференцирования сложной функции, и опустив зависи- мость от параметра А, легко убедиться, что это эквивалентно неравен- ству Э/(11) X ...X df{x^ дх дх < 1. (8) Из этой формулы следует также, что величина | | будет одной и той же во всех точках цикла Sp. Оказалось, что на примере модели (3) удается понять не только качественные, но и количественные закономерности возникновения ха- 171
оса. Чтобы проследить за ними, построим график z(A). По оси х будем откладывать Z[,Z2, • лежащие на устойчивом цикле либо другом аттракторе, по оси А — значения параметра. Такую бифуркационную диаграмму довольно просто построить на компьютере: надо рассчитать несколько тысяч итераций отображения /, первые 300-500 значений от- бросить, а остальные отложить на плоскости (z, А) (см. рис. 9). Первые члены следует отбросить, чтобы исключить переходный процесс. Ци- клу S2 будут соответствовать две точки на одной вертикали, циклу S4 — четыре, и т.д. Обозначим через Л^Лз.Лз,... те значения параметра А, при которых происходили удвоения, а через А1( А3| Аз,... — значения параметра, при которых х = 1/2 является элементом цикла S2 f S4, S8, и т.д. (такие циклы называются сверхустойчивыми). Название ясно из неравенства (8). Введем также величины d^, </3> -- . *4». • . равные рас- стоянию между z = 1/2 и ближайшим к нему элементом цикла 52 при А = А2 . Все эти обозначения пояснены на рис. 9. Из этого рисунка видно, что dn = (|) - 1/2. Рис. 9. Усложнение устойчивых циклов в отображении zn+i = Ain(l — in), происходящее в результате бифуркаций удвоения периода Расчеты, проведенные на ЭВМ, показали, что числа Лп и Ап при больших п ведут себя как геометрическая прогрессия. Ее знаменатель определяется постоянной 6 = 4, 6692016... Другими словами, (9) Отношение dn/<4i + i также имеет предел, равный а, где а = -2, 5029078. Можно вместо (3) рассмотреть другое семейство симметричных функ- ций, имеющих на отрезке [0,1] один максимум и близких около вер- шины к квадратичной параболе, в котором также происходит беско- нечный каскад бифуркаций удвоения периода при изменении пара- метра А. Оказалось, что в любой такой модели числа а и 6 бу- дут одними и теми же. Более того, независимо от вида f(x) предел 172
Jim (—a)n/2"((x - 0.5)/(—а)п, Лп) существует и будет одним и тем же. п—*0О Его называют универсальной функцией до(х). Эти удивительные закономерности были обнаружены и поняты аме- риканским математиком М. Фейгенбаумом в 1978 году. М. Фейгенбаум предложил функциональные уравнения, определяющие о, 6, <7о(*) В си- лу универсальности чисел а, 6, ро(^) и других функций такого типа, эту теорию называют теорией универсальности. То, что переход к хаосу во многих одномерных отображениях происходит в результате бесконеч- ного каскада бифуркаций удвоения периода, было установлено в ряде предшествующих работ. Однако свойство (9) и существование универ- сальных функций получили объяснение именно в теории универсаль- ности. В этой теории применяется метод ренорм-группы, широко исполь- зуемый в квантовой теории поля и статистической физике. При таком подходе задачу обычно сводят к решению некоторого функционального уравнения, инвариантного относительно перенормировки, связанной с изменением параметров изучаемого объекта. В теории универсально- сти постоянная сг может быть определена из уравнения, которое имеет наглядный геометрический смысл. Сравним рис. 5а и 86. Элемент кривой /2(т), попавший внутрь меньшего квадрата, очень похож на дугу функции Р(х), содержащую- ся внутри квадрата на рис. 5а. Практически, они отличаются только масштабом и ориентацией осей. Расчеты показывают, что для функций /2", n > 1, при А = Ап такое подобие также имеет место. Оно выполня- ется тем точнее, чем больше п. Перейдем к переменной хдов = zct_0. 5- Пусть для некой функции д(х) такое подобие выполняется точно. Если считать, что коэффициент растяжения вдоль обеих осей равен а, то для функции д(х) можно получить функциональное уравнение я(^) = -ад (s (”)) = (Тд)(х). (10) Оно позволяет определить как функцию так и значение а. Функ- ция д определена на отрезке [-1,1];. считается, что она имеет един- ственный максимум при х = 0 и симметрична: д(х) = д(—х). Вблизи максимума д(х) должна быть близка к квадратичной Параболе, причем р(0) = 1. Оператор Т называется преобразованием удвоения. В теории универсальности рассматривается пространство отображе- ний отрезка [—1,1] в себя таких, что /(х) € С2([-1,1]), х = 0 является точкой максимума /(0) = 1. Это пространство инвариантно относи- тельно преобразования Т: Можно показать, что функция д(х) определяется некоторым рядом д(х) = 1 - 1,52763х2 + 0,104815х4 — 0,0267057х6 + ... Существует наглядная аналогия между неподвижными точками одно- мерных отображений и объектами теории универсальности. 173
Элементы теории универсальности4 Чтобы убедиться в этом введем по аналогии с $о(х) целое семейство универсальных функций ffi(x) = lim (-<*)"/£ [— П—do [(—Of)’ Можно убедиться, что $h(r) и ffi-i(z) связаны между собой преобразо- ванием удвоения Т: У,-1(х) - (-a)gi [у, (”)] = T9i(z) В самом деле, 1 = 0, 1,2, ... =_i™ = Следовательно, переходя к пределу при i ?(*) = lim gi(z), I—*oo получаем уравнение для неподвижной точки оператора удвоения $(х) = Tg(z) = -ад (“)] • Чтобы убедиться в том, что существует универсальная постоянная 6 и то, что значения Ап образует геометрическую прогрессию, можно рассуждать следующим образом. Пусть после сдвига координаты х на 1/2 координата вершины совпа- дает с х = 0. Следовательно значения Ап > при которых есть сверхустой- чивые циклы, удовлетворяют уравнению /2"(0,А„) = 0 (см. рис. 5, б) Разложим функцию /(А, г) в точке А^ f(x, А) = /(z, А») + (А - A«)6/(z), 4 При первом знакомстве с книгой этот пункт можно опустить. 174
где bf(x) = Применение к этому равенству оператора удвоения дает T/(z, А) = 77(z, Лоо) + (А - A„ )i(/(x, Ато))6/ + 0[(6/)2]. Добавив малое приращение 6/(х) к функции /(х), нетрудно убедиться T(f + 6f) -Tf= L(f)6f = _а {/' [/ (-f)] } , n-кратное применение оператора удвоения дает следующий результат T"/(r, А) = Tnf(x, A.») + (А - Am) £7" “’/(*. М- + +Lf(x. Xm)8f + О[(«/)2]. Однако поскольку д(х) = lim ffi(x) = lim lim (-a)n/2 I—‘OO I—•oon-»oo »(-a)”/2" (-Л^,А„) =T"/(x,Aoo) прип»1, то имеет место приближенное равенство Г'Цх, А) « д(х) + (А - при n > 1. Естественно предположить, что линейный оператор L имеет собствен- ные значения pt и собственные функции Разложим по этим функ- циям bf(x) ЦИ1))?* = 6f(x) = к =1,2,... к Ln(g(x))8f = к В теории универсальности показывается, чтод1 > 1;| д* |< 1 при k / 1. Следовательно Ln(9(x))6f = С1Д?¥>1 при n > 1. Поэтому 7^/(1, Ап) = д(х) + (А - А„(^)с1 Напомним, что ^(0) = 1, а при значениях АП| соответствующих сверх- устойчивому циклу S2 , Г’/(0,Ап) = (-а)"/2’(0,А„) = 0 Следовательно lim (An — Aoo)pj — —— — const, n —оо Cl У>1(0) Таким образом числа Ап образуют геометрическую прогрессию с одним тем же знаменателем д"1, назависимо от функции /. Отсюда яс- НЛгЧто собственное значение Д) совпадает с универсальной постоянной ФАгенбаума 6 175
Сценарий Фейгенбаума и переход к хаосу в различных нелинейных системах Сценарий возникновения непериодического движения, хаотического аттрактора, в результате каскада бифуркаций удвоения периода пер- воначально был подробно исследован для логистического отображе- ния. Позже были получены строгие результаты, позволяющие выде- лить классы одномерных отображений, для которых переход к хаосу происходит в соответствии со сценарием Фейгенбаума. Однако экспери- ментальное изучение и компьютерное моделирование множества нели- нейных систем показали, что для них характерна последовательность бифуркаций удвоения периода, а значения бифуркационных параме- тров и амплитуды циклов характеризуются теми же универсальными постоянными а и б. При этом изучаемые объекты могут описываться многомерными отображениями, автономными или неавтономными си- стемами обыкновенных дифференциальных уравнений, либо уравнени- ями в частных производных. Это замечательный факт. Большой класс нелинейных явлений демонстрирует не только одинаковое качественное поведение, но и универсальные количественные закономерности. Приведем несколько примеров. Логистическое отображение, как и остальные одномерные отобра- жения с достаточно сложным поведением, необратимы; в них одному и тому же образу xn+i может соответствовать два прообраза х'п и z". (На- пример, для логистического отображения хп = (1 ± ^/1 — 4zn+> /А)/2.) С другой стороны, эта ситуация нетипична для дифференциальных уравнений. Отображения, которые они порождают z(t) —► x(t + Т), обычно являются взаимно однозначными для конечных промежутков времени Т — одному образу x(t + Т) соответствует единственный про- образ x(t). Отображения часто используются как упрощенные модели дифференциальных уравнений, и во многих случаях важно, чтобы они отражали эту однозначность. Этим свойством обладает одно из наиболее известных двумерных отображений — отображение Хенона хп + 1 — 1 ~ ~~ Ьуп Уп + 1 = Хп- (11) Это отображение было предложено как упрощенная модель дина- мической системы с непрерывным временем — модели Лоренца. По- следнее, в свою очередь, возникло как модель, описывающая движе- ние жидкости. С другой стороны, замена переменных zn + i = zn 4- С позволяет избавиться от постоянного члена и привести его к виду *п+1 = д(хП1 гп+1)> напоминающему логистическое отображение. Его можно интерпретировать как модель динамики популяции, в которой ресурс расходуется не только одним поколением с численностью zn, но и предыдущим с численностью rn-i. Модель (11) демонстрирует хаотическое поведение. При этом пере- ход к хаосу может происходить в результате каскада бифуркаций удвое- ния периода, например, в интервале параметров b = 0,3; 1,2 < А < 1,96 Двумерные отображения используются в качестве математических моделей в нелинейной оптике. В работах японского исследователя К. Икеды был рассмотрен резонатор, частично заполненный средой с 176
так называемой фазовой нелинейностью. Эта среда меняет фазу элек- тромагнитной волны Е в зависимости от ее амплитуды |Е|. Резонатор возбуждается лучом лазера; с помощью системы зеркал выходящий луч вновь заводится в резонатор. В простейшем случае эта физическая си- стема описывается отображением Е„+1 = А + ВЕп exp(ij£n|2). Здесь А — параметр, характеризующий интенсивность излучения ла- зера, В — величина, определяемая оптическими свойствами резона- тора. Еп — комплексная амплитуда электромагнитной волны по- сле n-кратного прохождения света через резонатор. Каскад бифур- каций удвоения периода наблюдается, например, при В «г 0,154 и 100, 8 > А > 99, 5. Многочисленные натурные эксперименты с нелиней- ными резонаторами подтвердили существование ’’оптического хаоса” и позволили детально исследовать его свойства. Представим себе обсуждавшуюся модель математического маятни- ка. Допустим, что его длина I меняется периодически с частотой Q. Это может соответствовть тому, что вы периодически приседаете и выпря- мляетесь, качаясь на качелях. Кажется естественным, что, подобрав частоту Q, можно попасть в резонанс (в этом случае он называется па- рах етрическим резонансом) и многократно увеличить энергию колеба- ний. При больших скоростях становятся существенны диссипативные процессы, например, вязкое трение. Это приводит к неавтономному обыкновенному дифференциальному уравнению второго порядка: х + ух 4- (1 4- AcosQt)sinz = 0. При 7 = 0,15;Q = 1,56 и изменении амплитуды А в интервале 0,51 < А < 0,92 здесь также происходит переход к хаосу в соответствии со сценарием Фейгенбаума. Одной из наиболее известных моделей нелинейной динамики, в ко- торой впервые было убедительно продемонстрировано существование странного аттрактора, является система Лоренца. Американский ме- теоролог Э Лоренц, анализируя результаты наблюдений сети метео- станций, столкнулся с явлением, которое позже получило название чув- ствительности к начальных данным. Оно связано с расходимостью близких траекторий. Именно с этим свойством динамики атмосферы Э. Лоренц связал принципиальные трудности в получении среднесроч- ного (на время 2-3 недели) прогноза погоды. Эти трудности не удалось преодолеть, используя более эффективные компьютеры и вычислитель- ные алгоритмы, они обусловлены внутренними свойствами нелинейных процессов, влияющих на состояние атмосферы. В качестве такого про- цесса Э. Лоренц рассматривал конвекцию в подогреваемом снизу слое жидкости или газа. Такая модель отражает тот факт, что поверхность Земли, прогреваемая Солнцем, гораздо теплее верхних слоев воздуха. Простейшая модель этого явления — система Лоренца: х = -рх 4- ру у = -xz 4- VI — у z = ху - bz, где г — число Релея, р — число Прандтля, пропорциональное отно- шению кинематической вязкости и теплопроводности, коэффициент 6 177
отражает геометрию задачи. Переменные у и z соответствуют фурье- гармоникам поля температур, х — поля скоростей При исследовании этой математической модели были обнаружены многие интересные явления, апробированы различные асимптотические и вычислительные алгоритмы. При больших значениях числа Рэлея в этой системе возникают "окна периодичности", в которых аттракторами являются предельные циклы. Уменьшая величину т внутри этих полос, можно наблюдать каскад бифуркаций удвоения периода. Властности, такой каскад наблюдается при р = 10; b = 8/3; 100,8 < т < 99, 52. Эти и многие другие задачи, активно изучавшиеся в восьмидесятые годы, показывают, что мы имеем дело с универсальным поведением, характерным для огромного множества различных систем. Шумящие циклы, окна периодичности, перемежаемость До сих пор мы рассматривали итерации логистического отображе- ния до того значения параметра Лоо, при котором последовательность {zn} не стремится к циклу. В этом случае аттрактор определяется непериодической траекторией. Рассмотрим бифуркационную диаграм- му при больших значениях параметра Л. В крупном масштабе она выглядит так, как показано на рисунке 10. Полосы, в которых точ- ки {zn} заполняют целые отрезки, и которые естественно связать с динамическим хаосом, в них чередуются с "окнами периодичности". На рисунке видно, что самое большое "окно" здесь связано с циклом S3 При увеличении параметра Л в этом окне происходят бифурка- ции S3 — S6 —* 512 —*. S24 —» .... т. е. мы вновь имеем дело с каскадом бифуркаций удвоения периода. Если рассмотреть эволю- цию исходного отображения и устойчивых циклов отображения /3(z), то она окажется аналогичной той, которая обсуждалась для каскада S —> S2 —> S* —» S8 —> .... Его характеризуют те же постоянные а и 6. Аналогичная картина наблюдается и в других окнах периодично- сти — переход к хаосу происходит в них в соответствии со сценарием Фейгенбаума. Рис. 10. Виды бифуркационной диаграммы для логистического отображения. На рисунке видны окна периодичности Интересно выяснить, как же возникает "из хаотического аттракто- ра" при увеличении параметра Л устойчивый цикл S3? Подобные про- блемы появляются и при исследовании других динамических систем 178
Обычно они встают после компьютерного построения бифуркационной диаграммы, аналогичной той, которая показана на рисунке 10. Одной из гипотез, которую часто высказывают и которую следует иметь в виду при изменении типа аттрактора, такова. Если мы фик- сировали начальные данные zi (либо даже если брали их с аттрактора при предшествующем значении параметра), то может оказаться, что в системе несколько аттракторов и изменение параметра Л переводит точку zi из области притяжения одного в область притяжения друго- го. Чтобы принять или отвергнуть эту гипотезу, нужно представлять сколько аттракторов может иметь исследуемая система и каковы их области притяжения. Даже для двумерных отображений ответы на эти вопросы оказываются весьма сложными. К счастью, для логистического отображения ситуация оказывается достаточно простой. Вопрос о числе аттракторов был решен Д. Син- гером для так называемых S-унимодальных отображений К таким отображениям может быть приведена и модель (3) после замены пере- менных. Функцию S-унимодальноЙ, если она: 1) непрерывна; 2) /(0) = 1; 3) f строго убывает на [0,1] и строго возрастает на [-1,0]; 4) /'(0) = 0, /" < 0; 5) f отображает отрезок [/(1), 1] на себя; 6) величина, называемая производной Шварца 5/(х) — Г"(:) 3 ГГ(*)12 /'(*) 2 [/'(*)] ’ такова, что Sj(x) < 0 для всех х 6 [—1,1], а в точке г — 0 она может быть равна —оо. Было доказано, что если отображение f S-унимодально, то оно име- ет не более одного устойчивого цикла и, возможно, устойчивую непо- движную точку на интервале [—Если устойчивый цикл суще- ствует, то итерации почти всех начальных точек из отрезка (/(1), 1) сходятся к нему. В частности, к нему сходятся итерации точки х = 0. Последнее утверждение дает способ строить отображения, не имею- щие устойчивых циклов. Для этого нужно проследить, чтобы одна из итераций нуля.попала в неустойчивую точку или неустойчивый цикл. При анализе бифуркационной диаграммы естественно уточнить, ка- кие аттракторы можно отнести к хаотическим. Первый подход к этой проблеме непосредственно опирается на аналогию с теорией вероятно- стей. В этой теории сначала выясняется, какие события могут произой- ти, а затем, как часто они случаются, что позволяет сопоставить таким событиям вероятности. Если х некоторая случайная величина, значения которой принад- лежат некоторому интервалу, то можно поступить следующим обра- зом. Разбить весь отрезок на М интервалов длины е. Затем построить функцию n((7V), показывающую, как часто величина х попадает в i-й интервал. Для этого достаточно в компьютерной программе положить величину ni(N) вначале нулевой n((7V) = 0 при 1 < i < Л/ и увели- чивать nt(/V) на единицу, как только величина х приняла значение, принадлежащее fc-му интервалу Сказанное иллюстрирует рисунок 11. Если длина исследуемой выборки М, то затем надо отнормировать зна- чения тц(7У) — nt = nk(N)/N> Эта процедура называется построением гистограммы. Для наглядности можно считать, что мы бросаем кубик N раз и считаем сколько выпало единиц — тц, двоек — nj и т.д. 179
Рис. 11. Представление о хаотическом аттракторе можно получить, построив гисторгамму для последовательности {xn) по N элементам последовательности. Переходя к пределу при —* оо и с —* 0, можно получить инвариантную меру Если N достаточно велико, то величины iii будут стремиться к со- ответствующим вероятностям lim nt(N) = pi = 1/6. N—*оо Аналогичным образом дело обстоит и для непрерывной величины lim nt(W) = pt(e), /V — ОО где Pk(c) вероятность того, что случайная величина х попадет в Jb-й интервал длины е. Пусть у = (k — 1)с + с/2 — середина этого интер- вала. Зафиксируем точку у и будем уменьшать величину с. Мы будем получать вероятности р(у, с). Рассмотрим предел =,(В). который будем называть плотностью вероятности. Другими словами, вероятность того, что величина х принадлежит интервалу длины € с серединой в точке у, равна р(у) е. Более строгие рассуждения и условия существования пределов при- водятся в курсах теории вероятностей и случайных процессов. Вернемся к одномерным отображениям. В случае неподвижной точ- ки х’ плотность вероятности определяется дельта-функцией Дирака р(х) = 6(х — х"), поскольку элементы последовательности {хп) с ро стом п будут все точнее ’’попадать" в точку х*. В случае устойчивого цикла S? = - х|)> р 1=1 где х/, 1 < I < р — элементы цикла. Однако элементы последовательности {хп} могут заполнять весь отрезок или несколько "островов" на нем. Примеры таких аттракто- ров представлены на рисунке 12. Аттракторы последнего типа получи- ли название "шумящих циклов" или ’'полупериодических траекторий”. 180
Пусть плотность отлична от нуля в пределах р островов. Такие ат- тракторы обозначают хр Порядок обхода островов оказывается строго фиксированным, поэтому можно точно предсказать, в пределах какого из островов окажется элемент хл при любом п (это сближает их с цикла- ми). Однако положение точки при больших п меняется нерегулярным образом, и в этом смысле они близки к стохастическим режимам. Рис. 12. Примеры инвариантных мер одномерных отображений: а) мера имеет особенности при х = — 1 и х = 1; б) мера является непрерывной ограниченной функцией, отличной от нуля внутри всего интервала; в) мера сосредоточена на двух "островах", что соответствует шумящему циклу На гистограммы и плотности распределения можно взглянуть с дру- гой точки зрения. Представим себе, что мы рассматриваем не одну, а бесконечное множество одинаковых динамических систем, начальные данные х0> в которых распределены с плотностью ро(х). Первая итерация, вообще говоря, изменит это распределение и пе- реведет его в распределение pi(x). Однако возможна ситуация, когда плотность р(х) после применения отображения f не изменится. В этом случае говорят, что отображение f имеет инвариантную меру с плот- ностью р(х). Инвариантные меры характеризуют "предельное" распре- деление вероятностей, аттрактор исследуемого отображения. Как мы видим, такими мерами могут быть наборы дельта-функций. Возможны распределения, у которых плотность р(х) отлична от нуля на одном или нескольких островах. В ряде случаев у них есть интегриру- емые особенности (см. рис. 12а). Наконец, мера может быть подобной себе на меньших масштабах, т. е. обладать масштабной инвариантно- стью. Таков, например, аттрактор Фейгенбаума, возникающий после бесконечного каскада бифуркаций удвоения периода. Таким образом, выяснить насколько хаотичен аттрактор одномер- ного отображения можно, построив гистограмму, дающую представле- ние об инвариантной мере. Чем более гладкой и регулярной является плотность распределения р(х), тем более сильными стохастическими свойствами обладает аттрактор. Другой часто используемый "тест на хаотичность” связан с выяс- нением вопроса, обладает ли система чувствительностью к начальным данным. Для этого нужно оценить ляпуновский показатель для тра- ектории на исследуемом аттракторе. Здесь так же, как в непрерывных системах, удобно рассматривать не итерации двух бесконечно близких 181
точек хо и £о + €, а отображения в вариациях „ X _ ^п) £п+1 — f{Xn) 1/п + 1 — Уг|| Xq = a, ig = а + £ ^- уо = £ Понятно, что yn + i = П?=о '€- Если limn-oo у |П?=о | > то система обладает чувствительностью к начальным данным, расстояние между итерациями двух бесконечно близких вначале точек в среднем растет. Это говорит в пользу того, что мы имеем дело с хаотическим аттрактором. (В соответствующих компьютерных программах обычно вычисляется не произведение, а сумма логарифмов £2"=0 In |%^|-) Вернемся к вопросу, как из хаотического аттрактора, обладающего чувствительностью к начальным данным, возникает окно периодично- сти. Ответ на него был получен в 1980 году П. Манневилем и И. Помо. Итак при некотором значении параметра А (А » 3,83) из хаоса скачком появляется устойчивый цикл S3. Рассмотрим отображение /3(х) = /(/(/(х, А))) до того, как цикл появился А < А (см. рис. 13а), и после этого А > А (см. рис. 136) При увеличении параметра А кривая /3(х) становится круче и у нее появляются новые точки пересечения с прямой у = х. Они обозначены буквами Л/12,з и /Vi.2,3 на рис. 136. Все они являются неподвижными точками отображения /3(х). Производная /3(х) в точках М12,з одинакова и по модулю не превосходит единицы (см. условие устойчивости цикла). Именно эти точки и определяют устойчивый цикл S3 Наклон графика в точках Wi.2.3 также одинаков, но там выполняется противоположное неравенство. В отображении f им соответствует неустойчивый цикл S3, который появился одновре- менно с устойчивым. Одновременное появление устойчивой и неустойчивой особых точек получило название касательной или тангенциальной бифуркации. На- звание связано с тем, что в точке бифуркации кривая f(x) касается диагонали у = х. Соответственно, производная в этой точке равна единице. Обратим внимание на аналогию этой бифуркации с регуляр- ной экстремальной точкой, рассмотренной в главе 5, где "ниоткуда” одновременно появлялись устойчивое и неустойчивое состояния равно- весия. Зададим какое-нибудь начальное значение и посмотрим, как дей- ствует отображение /3(х), когда А > А и А < А. Другими словами, мы будем следить за каждым третьим элементом последовательности {тп} Расчеты показывают, что в первом случае после длительного пе- реходного процесса точки притягиваются к циклу S3 (см. рис. 14а). Во втором случае вначале происходит медленнее движение к точке Л/ (см. рис. 146). Однако потом элементы последовательности быстро от- ходят от этой точки. В дальнейшем они вновь начинают приближаться к ней. Такое поведение для одного из отображений с острой вершиной иллюстрирует рисунок 15. Видно, что интервалы движения к точке М, когда решение похоже на регулярное, чередуются в нем с быстрыми 182
Рис. 13. Вид функции f3 до появления устойчивого цикла S3 и после этого: а) А < Ас; б) А > Ас хаотическими выбросами. В зависимости in от п короткие турбулент- ные всплески чередуются с длительными промежутками ’’ламинарной фазы” (см. рис. 156). В этой простейшей модели есть перемежаемость. Рис. 14. Так выглядит функция /3 в более крупном масштабе; а — А = 3,830, точка Afj соответствует устойчивому циклу S3, точка — неустойчивому; б — А = 3,825, цикл 53 еще не появился Анализ реальных систем с перемежаемостью вблизи точки танген- циальной бифуркации представляет значительные трудности, так как в течение длительного времени может наблюдаться только ламинарная фаза. Оценим, как зависит продолжительность Т ламинарной фазы 183
Рис. 15. Типичная картина перемежаемости: а) несколько итераций отображения rn+i = 1 — |zn - A|l^2[l + (zn - A)2], A = 0,769; б) зависимость последовательности от номера итерации. Для наглядности точки х„ и in+i соединены от параметра А. Пусть при А = 0 происходит тангенциальная бифур- кация. Из рисунка 146 ясно, что на интересующем участке изучаемое отображение может быть приближено следующим образом Zn+1 =in+ az„ - А. (12) Поскольку Гп + 1 - хп «С 1, при А —► 0 последнюю формулу можно аппроксимировать дифференциальным уравнением ^—= az2 — А. (13) ат Ясно, что отображение (12) представляет собой разностную аппрокси- мацию уравнения (13), полученную с помощью метода Эйлера, ст = 1. Интегрируя уравнение (13), можно убедиться, что время Т (а значит и количество итераций), которое траектория х(т) проводит вблизи нуля, пропорционально А-1/2. Именно такая зависимость и наблюдается в расчетах. Переход к хаосу, связанный с перемежаемостью, встречается во мно- гих нелинейных системах. При определенных параметрах он имеет ме- сто и в системе Лоренца Его связывают также с явлением переме- жаемости в гидродинамических системах. В некоторых течениях мож- но видеть, как в упорядоченном ламинарном потоке вдруг появляются вихри, поведение которых кажется случайным. Затем картина течения вновь становится простой, регулярной и упорядоченной. Упорядочен- ный режим здесь перемежается с ’’островами” хаоса. Вопросы и задачи 1 Пусть известно одномерное отображение in + i = /(хп) и Jt-Й член последовательности (хп). Можно ли определить по этим данным и т.д Всегда ли это возможно? Нужна ли для этого какая-либо дополнительная информация7 184
2. Какие математические модели с дискретным временем могут быть предложены для систем типа "хищник - жертва", "паразит - хозя- ин" , для описания динамики двух видов, конкурирующих за общие ресурсы? 3. Найти приближенное решение уравнения Фейгенбаума 5(х) = -ад(д(-х/а)), считая, что в д(х) входит только постоянная и квадратичный член. Считать, что функция д(х) четная и д(0) = 1. 4. Квадратный трехчлен /(z) = az2 + fcz + с таков, что уравнение /(х) = z не имеет вещественных корней. Доказать, что уравнение /(/(г)) = х также не имеет вещественных корней. 5. Решить систему уравнений COSZi = Z2 COSZj = Z3 COSZn-1 = «п COSZn = Ij. 6. Человек держит за конец резиновый жгут длиной 1м, привязан- ный к дереву. У другого конца жгута сидит жук. Каждую секунду жук проползает 1 см по жгуту. Каждую секунду человек, держа конец жгута, удаляется от дерева на 1 м. Доползет ли жук до человека? Если нет, то почему? Если да, то за какое время? 7. Бесконечная наклонная плоскость расположена под углом а к го- ризонту. Угол падения абсолютно упругого мяча на плоскость равен тг/2 — 0, скорость падения и. Отскакивая от плоскости и па- дая вновь, мяч начинает "подниматься" по плоскости. Найти ко- ординату n-го отскока и оценить максимальное расстояние вдоль плоскости, на котором окажется мяч от точки первоначального падения. 8. Рассмотрим треугольник АВС Проведем в нем высоты. Обозна- чим их основания (т. е. точки, где они пересекаются с соответ- ствующими сторонами) через Л1, В\, Ci. Рассмотрим треугольник Л1В1С1 и обозначим основания высот в нем через Л2, Вг, И т.д. Обозначим углы треугольника Ai, В\, Ci — । Л, 711 треугольни- ка AnBnCn через ani/3n,yn. Постройте отображение: ®п + 1 — /((^п , > 7п ) 0п + 1 — ff(Qni^n>7n) 7n+i = Л(оп, , уп), п = О, 1,2,... Оо = а, Ро = р, 7 = 7о Чему равны ляпуновские показатели этого отображения? Имеет ли оно нетривиальные неподвижные точки или циклы (отличные от а" = 0* = 7* = тг/З)? 185
9. Какой должна быть сила, действующая на материальную точку, чтобы численное решение дифференциальных уравнений, полу- ченное с помощью метода Эйлера, совпало с точным? 10- Что происходит с итерациями отображения хп + 1 = Ахп(1 — хп) при А > 4? Существуют ли такие начальные точки х, при которых О < хп < 1 при всех п? 11. Решить уравнение 12. Одна из первых математических моделей, представляющая со- бой динамическую систему, возникла в задаче Леонардо из Пизы, предложенной в начале XIII века. Леонардо сформулировал свою задачу так: "Некто поместил пару кроликов в загоне, огорожен- ном со всех сторон, дабы знать, сколько пар кроликов родится в течение года. Природа кроликов такова, что через месяц пара кроликов производит на свет другую пару, а потомство дают они со второго месяца после своего рождения. Поскольку первая па- ра в первом месяце дает потомство, то удвой число кроликов, и в первом месяце окажутся две пары. Из них одна, а именно первая, пара дает потомство и в следующем месяце, так что во втором ме- сяце окажутся три пары ... Сколько пар произвела первая пара в загоне к концу одного года?" Найти формулу, показывающую сколько кроликов Fn будет через п месяцев. Каково будет отно- шение Fn+\/Fn при больших п? 13. В трапеции A BCD с основанием АВ = а и CD = b проведен отрезок Л1В], соединяющий середины диагоналей. В трапеции AyByCD проведен отрезок, соединяющий середины диагоналей и т.д. Что Вы можете сказать о последовательности длин отрезков {АпВп}? 14. Предположим, что универсальная функция у(х), которая являет- ся решением уравнения д(х) = -ад(д(—х/ar)), имеет неподвижную точку х*. Показать, что она имеет и цикл S2. 15. Как ведут себя итерации отображения xn+i = 16. Почему у "растягивающих" одномерных отображений, у которых ||f | > 1 на всем отрезке, не бывает устойчивых циклов? 17. Каковы достаточные условия устойчивости неподвижной точки (х*, у*) двумерного отображения 1п + 1 = f(xn > Уп) Уп+\ = у(хп,ул)? 186
18. Пусть zi = 1,Z2 = a > 0 и Zn + 1 — ®n\/(^n 4" ®n + l )/(2Zn —1 )i n > 1. Докажите, что последовательность {zn} сходится и определите ее предел. 19. Пусть с0 > 0,ci > 0 и сп+1 = у/с^ + у/с^ при n > 1. Доказать, что последовательность сходится и найти ее предел. 20. С какого дня чаще всего начинается новый год: с суботы или с воскресенья? Напомним, что обычно в високосном году 366 дней, однако годы, номера которых делятся на 100, но не делятся на 400, имеют 365 дней 21. Последовательность {хп} задана следующим образом: zi — а, zn+i = (2z^)/(3z„ - 1) при n > 1 Найти все а, при которых последовательность {zn} определена и имеет конечный предел. Рекомендуемая литература Общий взгляд на теорию одномерных отображений и обсуждение осно- вополагающих результатов дают книги: Collet Р., Eckmann J.P. Iterated maps on the interval as dynamical systems. Basel; Stuttgart: Birkhauser, 1980; Guckenheimer J., Holmes P. Nonlinear oscillations dynamical systems and bifurcations of vector fields. N.Y. etc.: Springer, 1983; Шустер Г. Детермини- рованный хаос: Введение. M.: Мир, 1988. Теория универсальности обсуждается, как в этих книгах, так и в статьях: Фейгенбаул* М. Универсальность в поведении нелинейных систем//Успехи физ. наук. 1983. Т. 141, N 2. С.343; Кузнецов А.П., Кузнецов С.П. Критиче- ская динамика одномерных отображений. 4.1. Сценарий Фейгенбаума//Изв. вузов. Прикл. нелинейная динамика. 1993. Т. 1, Nl/2. С.15-33. Более серьезной математической подготовки требует чтение оригиналь- ных статей: Feigenboum M.J. Quantitative universality for a class of nonlinear transformations//J. Statist. Phys. 1978. Vol. 19, Nl. P.25-52; Feigenbaum M.J. The universal metric properties of nolinear transformations//Ibid. 1979. Vol. 21, N6. P.669-706; Вул Ё.Б., Синай Я.Г., Ханин К.М. Универсальность Фейген- баума и термодинамический формализм//Успехи мат. наук. 1984. Т.39, N3. С.3-37. Обзор ряда ключевых результатов в этой области, ориентированный на математиков, дают книги: Шарковский АН., Майстренко Ю.А., Романенко Е.Ю. Разностные уравнения и их применения. Киев: Наук, думка, 1986; Ито- ги науки и техники. Современные проблемы математики. Фундаментальные направления. Динамические системы. М.: ВИНИТИ, 1985. Т.2.
Escher M.C Witch. 1931 Эшер М.К. Ведьма
ГЛАВА 8 АВТОКОЛЕБАНИЯ И ПРЕДЕЛЬНЫЕ ЦИКЛЫ Не кто иной, как Ньютон, показал нам, что закон есть лишь необхо- димое соотношение между настоя- щим состоянием и состоянием, не- посредственно следующим Все другие законы, открытые позднее, дают то же самое: это — в итоге — дифференциальные уравнения. А. Пуанкаре Фундаментальный закон динамики — второй закон Ньютона — определяется системой дифференциальных уравнений Когда движе- ние происходит вдоль прямой и сила, действующая на материальную точку, зависит только от координат и скорости точки F = F(x,x)t эту модель можно представить в виде системы двух автономных дифферен- циальных уравнений i = /(1.!/) (О х(0) = х0, J/(0) = J/o (В случае материальной точки /(х, у) — у, д(х, у) = F(x, у)/тп.) Модели такого типа, появившиеся вначале в динамике (отсюда и об- щее название — динамические системы), сейчас широко используются в электронике, химической кинетике, экологии и во многих других обла- стях. Системы вида (1) составляют основу теории колебаний. Одним из их наиболее интересных свойств является то, что эти системы могут описывать автоколебания. Под автоколебаниями понимают незатухаю- щие колебания в неконсервативных нелинейных системах, при которых основные характеристики колебаний (амплитуда, частота, форма коле- баний и т.д ) определяются параметрами системы и в некоторых пре- делах не зависят от выбора исходного начального состояния (хо.уо)- Фазовым пространством этого уравнения является плоскость либо другая двумерная поверхность, что делает наглядным поведение семей- ства фазовых траекторий и позволяет получить ясное представление о качественном поведении модели. Несколько таких систем, связанных с движением маятника и движе- нием планеты вокруг Солнца, мы рассмотрели в первых главах. В этой главе мы обсудим некоторые другие базовые модели вида (1), обращая основное внимание на способы их качественного исследования. Ины- ми словами, нас будут интересовать приемы, позволяющие ответить на вопросы: каково число состояний равновесия у данной динамической системы, устойчивы они или нет, существуют ли замкнутые траектории, сколько их, как они расположены, каковы их области притяжения. Начальное исследование систем вида (1) обычно начинают с анализа следующих вопросов. 1. Диссипативна ли изучаемая система? Важно выяснить, имеет ли система аттракторы, стремятся ли в ней друг к другу близкие траектории. Чтобы научиться отвечать на этот 189
вопрос, уточним понятие диссипативной системы. Для этого нам при- дется изменить точку зрения на все модели, которые мы рассматривали раньше. До сих пор в каждом случае речь шла об одной конкретной ди- намической системе, поведение которой задавалось одними начальны- ми данными. Теперь мы на время откажемся от этого подхода и будем иметь дело с ансамблем динамических систем, начальные данные ко- торых (хо.Уо) принадлежат некоторой области фазового пространства ^алее мы представим, что каждая из этого бесконечного множества систем эволюционирует в соответствии с уравнением (1). Выясним, как при этом меняется образ области фазового пространства (7(0) — G(t) (см. рис. 1). Области G(t) принадлежат точки в фазовом пространстве (z(t), y(t)) системы с начальными данными (хо,!/о), принадлежащими (7(0). Область G(t) с течением времени не может разбиться на несколь- ко несвязанных кусков. Кроме того, точка (z(t),y(t)) не может ока- заться образом двух различных точек (z'(0), j/(0)), (х"(0), у"(0)). Иное поведение противоречило бы теореме о непрерывной зависимости реше- ний от начальных данных, а также теореме единственности. Рис. 1. Типичная картина изменения фазового объема малого элемента: а) в консервативной; б) в диссипативной системе Выясним, как будет меняться фазовый объем области G(t) (в случае двух переменных он просто совпадает с площадью). Выберем вначале некоторый малый треугольник АВС. Посчитав площадь соответствующих треугольников (см. рис. 2) и трапеции, ли- бо воспользовавшись известной из аналитической геометрии формулой для векторного произведения, убедимся, что S^abc = || j* || = i(aife2 - а^). Возьмем малое конечное приращение Д(. Пусть в момент динами- ческая система находилась в точке фазового пространства (z(G), y(ti)) Тогда в момент I] + At она окажется в точке x(ti + Д«) = x(t 1) + At/(zi,yi), 190
Рис. 2. Изменение фазового объема малого элемента y(tx + At) = y(ti) 4- Atj(xi,yi), (2) как это следует из уравнения (1). Бесконечно малыми величинами бо- лее высокого порядка(Д^2, (At)3 и т.д будем пренебрегать. Тогда точ- ки Л, В, С (см. рис. 2) через интервал At окажутся в точках Л', В*, С' фазового пространства Л = (хьУ1) -»(х] 4-At/(z1(yi),yi 4-Aty(x11y1)) = Л', В = (*i 4- в1, У1 4-^1) —► (xi 4* О) 4~ At/(xi 4- oi, 4- yi), У1 4- 6i 4- Aty(xj 4-аь61 4- yi)) = В', С = (xi 4- аг, yi 4- 62) —* (xi 4- аз 4- At/(zi 4- 02, yi 4- 62), У1 4- 62 4- Aty(xi 4- 02, yi 4- 62)) = С'. В этих равенствах мы для краткости обозначили х(М и y(G) соответ- ственно через xi и yi. Считая, что треугольник АВС имеет малые размеры, воспользуемся разложением в ряд Тейлора /(xi 4- 01,6] 4- yi) = f 4- /ТО1 4- /у61 + ... Здесь мы опустили аргументы у функции /, поскольку далее все будет относиться к точке (x],yi). Это дает возможность найти координаты векторов Л'В' — (а'2, Ь‘7), А'С'-Ы. 61) а! » О] 4- At(oi/X 4- 6]/у), 61 « 61 4- At(atyx 4- 61уу), а2 ss а2 + Д^а2/г 4- 62/у), 6'2 ЙЗ 62 4" Д<(О2Уг 4- б2Уу). 191
Последние соотношения позволяют найти площадь треугольника А' В’С (малыми искажениями ребер можно пренебречь) с 1 а1 + ДЦа1/х + &1/у) = А в с 2 02 + Д^(аз/» + ^з/у) h + ДЦазЗх + &20у) 41:: th Sabc = V’(ti), Sx'B'C' = V(h + ДО- В этих равенствах мы пренебрегаем членами порядка (At)3 Из форму- лы (3) видно, что мыщ=(/,+Л)И11). Таким образом изменение малого элемента фазового объема опре- деляется соотношением V = QVy гдеП = Л+ру. (4) Это важное соотношение обобщается на автономные системы любого порядка N Zi = /|(гь ...,z/v); i = 1, ...,N V = QV, где Q = V d/.(*i. **) (5) OXi 1 = 1 Формула (5) позволяет уточнить понятие диссипативной системы. Дис- сипативными мы будем называть динамические системы, у которых Q < 0, хотя бы в некоторых областях фазового пространства. Кон- сервативными системами мы будем называть динамические системы с Q = 0. Можно проверить, что рассмотренные выше модели маятника и дви- жения планеты таковы, что Q = 0. Таковыми являются все гамильто- новы системы, к которым относится большинство математических мо- делей классической механики дн(р,ч) дн(р,п ... * = ~д^—’ Pi = —д^Г’ (6) Р=(Р1. -,Pjv), Я = (91, n = \-(^ + ^L\=Y' - &*Н(р,д)\ = о “ dpi / \ Opidqi ) Существует принципиальное отличие между нелинейными явлени- ями, которые описываются диссипативными и консервативными систе- мами. Для того, чтобы моделировать то или иное явление с помощью консервативной системы, нужно иметь ясное представление, что в из- учаемом случае сохраняется и по каким причинам. Именно поэтому 192
при мягком моделировании в экономике, экологии, социологии, психо- логии обычно обращаются к диссипативным системам. Кроме того, во многих задачах гидродинамики, радиофизики, химической кинетики, биологии, физики плазмы существенную роль играют диссипативные процессы, связанные с рассеянием энергии, вещества, с необратимыми явлениями, поэтому и там обычно появляются диссипативные динами- ческие системы. Консервативные системы возникают в задачах класси- ческой механики, особенно небесной механики, физики плазмы, теории волн, а также в ряде фундаментальных теорий, в которых ключевую роль играют различные симметрии и связанные с ними законы сохра- нения. Кардинальное отличие диссипативных систем от консервативных со- стоит в том, что в первых системах может происходить выход на ат- тракторы и "забывание начальных данных". В то время как во вторых начальные данные не забываются, а поэтому играют гораздо более важ- ную роль. Кроме того диссипативные ситемы часто обладают свойством грубости или структурной устойчивости. Под этим понимается часто сохранение качественных свойств (в частности числа и типов аттрак- торов) при малых изменениях правых частей. Вместе с тем достаточно внести сколь угодно малое "диссипативное" возмущение в консервативную систему и ее поведение при t —* оо станет совершенно иным. Естественно, отличается и математический аппарат разработанный для анализа этих двух классов систем. В дальнейшем мы сосредоточим внимание на диссипативных системах. При изучении некоторых систем трех и большего числа дифферен- циальных уравнений часто возникают ситуации, когда величина Q < О во всем фазовом пространстве. Однако обратившись к рассмотренному логистическому уравнению, мы увидим, что величина к положительна при 0 < х < 1/2 и отрицательна при 1/2 < х < оо. Так же устроено большинство систем двух автономных обыкновенных дифференциаль- ных уравнений. В таких системах области с Q > 0 иногда называют областями недиссипативности. Выделение областей недиссипативности при анализе конкретных си- стем часто бывает очень полезным, поскольку аттрактор динамиче- ской системы (5) не может целиком лежатъ в области медиссипа- тивнссти. Предположим, что это не так, и аттрактор системы А (на рисунке 16 это предельной цикл) вместе с областью притяжения В принадлежит области недиссипативности G (Q > 0, если х G G). Выделим узкую трубку вокруг аттрактора, которая принадле- жит В Рассмотрим, что произойдет с фазовым объемом V(i) тех си- стем, у которых f(0) 6 Ga Поскольку А — аттрактор и Ga при- надлежит его области притяжения f(t) —* х С А. Поэтому V(t) —* У(Л), при t —* оо. Будем считать, что фазовый объем аттрактора А равен нулю (очевидно это так для особых точек и предельных циклов, которые мы уже рассматривали). Поэтому V(t) —* 0 при t —* оо. Но это противоречит соотношению (5), в силу которого величина V(t) должна возрастать! Для системы дифференциальных уравнений (1) имеет место другой замечательный результат, связывающий существование предельных ци- клов и величину Q. 193
Теорема 1. Если в некоторой односвязной области D выражение Q нигде не меняет знак и не равняется тождественно нулю, то в области D нет предельных циклов. Сформулированную теорему часто называют критерием Бендиксо- на. Это утверждение можно доказать от противного. Действительно, допустим, что в области D существует предельный цикл Г с внутренней областью G. По теореме Стокса Adv — г G Положим, что А = (—g, f)\ df = (dx, dy) = (fdt, gdt) Именно в последнем равенстве учитывается то, что мы имеем дело с векторным полем, соответствующем динамической системе (1). Очевидно интеграл по предельному циклу от вектора А равен нулю. Из формулы для ротора векторного поля У j (rotA)ndG rot А = det t i * II a a a 5y 57 ’ Az ]| в которой i, j, k — единичные векторы в направлении осей х, у, z, Ах, Ау, А; — компоненты вектора А, получим, что (rotA)x = (rotA)y = О, (гоМ)2 = k ~ = + 0у)- Следовательно, учитывая, что Г — предельный цикл динамической системы, получим ° = У У(fl + 9t')<^<iy = У У Sl(x,y)dzdy. G G Это противоречит условиям теоремы, поскольку интеграл по области G должен быть либо положительным, либо отрицательным. Это доказы- вает сформулированное утверждение. Рассмотрим в качестве примера одну из наиболее известных моделей вида (1). Пример. 1. Модель Лоттка — Вольтерра. Одной из первой математических моделей, в которой система двух обыкновенных дифференциальных уравнений использовалась для мяг- кого моделирования, стала модель, описывающая изменение численно- сти двух взаимодействующих биологических видов. В. Вольтерра в на- чале века обратил внимание на периодические колебания численности крупных рыб-хищников и мелких рыб. Первая модель, названная впоследствии моделью типа хпщних- жертва, была предложена для объяснения именно этого явления. В. Вольтерра обосновывает эту модель следующим образом: "Если бы в среде, где обитают эти виды, находился только один из них, а имен- но, жертва, то у него был бы некоторый коэффициент прироста ко- торый мы будем предполагать постоянным и положительным. Другой вид (хищник), питающийся только (или в основном) жертвой, в пред- положении, что он существует изолированно, имеет некоторый коэф- фициент прироста — г?, который будем считать постоянным и отрица- тельным. Когда такие два вида сосуществуют в ограниченной среде, 194
первый будет развиваться тем медленнее, чем больше существует ин- дивидумов второго вида, а второй — тем быстрее, чем многочисленнее будет первый вид. Гипотеза, довольно простая, состоит в том, что ко- эффициенты прироста равны соответственно £1-71^2 и -Сг + 72^1, (11,72 — положительные постоянные). Это приводит к системе диф- ференциальных уравнений для описания численности видов: ^- = ЛГ1(е1-71ЛГ2) at = -ЛМ£2 - 72*1) (^^2,71.72 > о)’\ (7) Характерной особенностью этой системы является наличие неко- торой сохраняющейся величины. Непосредственно из уравнений (7) следует, что dN, dN2 V М 72-jj- + 71-^- = £172*1 -€271*2 1 i <w2 .. м C2^^ + £l^“dF = -71£2jV2 + £1^1- Поэтому 72М - £-^1+71*2 --£-^2= о *1 N2 72*1 - EzlogNl + 71*2 - €1/О0*2 = С = const e'l,N‘ N-t, _ (8) В фазовой плоскости (*i,*2) каждому значению С соответствует замкнутая кривая (см. рис. 3). Внутри этих кривых находится особая точка (ег/72» /71)» в которой /(*1, *2) = jr(*i, *2) = 0. Если считать, что в начальный момент времени (7V\(0), /V2(0)) близки к этой особой точке, то можно линеаризовать динамическую систему (8) в окрестности этого состояния равновесия *1 = £2/72 + Д*ь *2 = ei/7i + Д*2 После стандартной процедуры, связанной с линеаризацией и отбрасы- ванием бесконечно малых второго порядка, получим Д *, = Zinkan 72 195
Рис. 3. Типичные фазовые траектории в модели Лоттка — Вольтерра AN2 = => AN, +wlNl = О 71 W = y/Cl&l u AN, = AN,(0)cos(wt) AN2 = — AN2(0)sin(uit). fall Другими словами, в этом приближении уравнение сводится к ли- нейной динамической системе, описывающей малые колебания матема- тического маятника с частотой В окрестности особой точки колебания близки к гармоническим. Вдали от этой точки колебания имеют более сложную форму. Эти колебания можно интерпретировать следующим образом. До тех пор пока численность популяции жертв достаточно велика, численность хищников тоже растет (участок АВ на рис. 4). Однако имеет место отрицательная обратная связь: увеличе- ние числа хищников приводит к уменьшению популяции жертв. Это приводит к тому, что начинает уменьшаться число хищников (участок ВС на рисунке 4). Но когда становится достаточно мало, то на- чинает вновь расти численность жертв. Это снова приводит к росту численности хищников и т.д. Комментируя биологические следствия построенной математической модели В. Вольтерра, отмечает: "Тем, кто займется эксперименталь- ной проверкой полученных результатов, т.е. приложением теории, вы- падет на долю детальный анализ начальных предположений и биоло- гической законности выводов на основе экспериментов, наблюдений и их статистической обработки”. Следует отметить, что во многих зада- чах, связанных с математическим моделированием, эта часть работы является наиболее сложной и трудоемкой. Именно поэтому на стадии математического исследования модели следует выявить ее возможные недостатки. 196
Рис 4. Характерный вид интегральной кривой в модели (7) Для динамической системы (7) к таким недостаткам, по-видимому, следует отнести существование интеграла (8). В самом деле, естествен- но предположить, что если в определенном ареале обитания животных имеют место колебания численности популяций, то их амплитуда и период зависят от свойств ареала и проживающих в нем видов. В то же время можно полагать, что от малого изменения начальных дан- ных /^1(0) и TV2(O) амплитуда и период не зависят. Другими словами, в системе должны наблюдаться автоколебания. Этим свойством модель (7) и не обладает. В самом деле, величины Л/] (0) и У2(0) однозначно определяют постоянную С в .соответствии с формулой (8). В то же время различным значениям этой постоянной отвечают различные замкнутые кривые на фазовой плоскости и, следо- вательно, колебания различной амплитуды, т е начальные данные в такой системе никогда не будут забыты. Обратим внимание на то, что это происходит, хотя в этой системе Q 0. Вернемся к тем традиционным вопросам, которые обычно выясня- ют при исследовании систем двух обыкновенных дифференциальных уравнений. 2. Каковы состояния равновесия в изучаемой модели? Чтобы выяснить это. нужно решить систему двух алгебраических уравнений = 0,j(x,y) = 0. (9) Пусть (z*, у*) одно из решений этой системы. Пара чисел (х*, у*) опре- деляет координаты особой точки в фазовом пространстве. Чтобы опре- делить, каков тип этой точки, т. е. каково поведение траекторий в ее окрестности, рассматривают уравнение (1), линеаризованное в окрест- ности этой точки: z(0 = Az(f) + X*, y(t) = Ду(<) + у* Дх = /(х’ + Дх,у‘ + Ду) к /(х",у*) + анДх 4- а12Ду Ду = 9(^‘ + Дх, у’ 4- Ду) w y(z’, у*) -I- а21 Дх 4- а22Ду, где аи - fx(x* ,y’),ai2 = fy (i’ > у’), a2i = Уг(х‘. у’). a22 = Уу(х\у’), т. е. правые части содержат первые три члена в соответствующих рядах Тейлора. Учитывая, что (х’,у*) — точка равновесия и пренебрегая бесконечно малыми второго порядка, получим линейное уравнение Дх = ацДх + ДпАу. 197
Ду = а21Дх + а22Ду. (10) Предположив, что Дг = с\ехр pt, Ду = ciexp pt (ci и с2 — постоянные), получим однородное линейное уравнение («и -p)cj + ацс2 = 0, ^21 ci + (о22 - р)с2 = 0. (11) Чтобы уравнение (11) могло быть выполнено, величина р должна удовлетворять характеристическому (вековому) уравнению <,2> 4 р2 - (on + огг)р + (оц<>22 - 012021) = О p2 + crip + ao = 0, где ai = -SpA, or0 = DetA, A = II “ll Gl2 || II «21 a22 и Здесь через SpA и DetA обозначены соответственно след и детерминант матрицы А. Тип особой точки (ж*,у*) определяется корнями pi и р2 уравнения (12). Рис. 5 Состояния равновесия в автономной системе двух обыкновенных дифференциальных уравнений Разным типам равновесных состояний соответствуют различные ти- пы движения в окрестности равновесия, которые часто также называют режимами Обратимся к рисунку 5. 198
1 pi и р2 — действительные отрицательные числа, особая точка — устойчивый узел. Точка, определяющая состояние системы на фазовой плоскости, апериодически приближается к состоянию равновесия. 2 pi и р2 — действительные положительные числа; особая точка — неустойчивый узел. Точка, определяющая состояние системы, апериодически удаляется от состояния равновесия. 3 pi и р2 — комплексные числа с отрицательной действительной ча- стью; особая точка — устойчивый фокус. Точка, определяющая состояние системы, совершает затухающие колебания и асимпто- тически приближается к состоянию равновесия. 4 . Pi и р2 — комплексные числа с положительной действительной ча- стью; особая точка — неустойчивый фокус. Точка, определяющая состояние системы, совершает колебания растущей амплитуды и удаляется от состояния равновесия. 5 . Pi и р2 — действительные числа, имеющие разные знаки; особая точка — седло; неустойчивый режим. При малом случайном от- клонении от состояния равновесия система начинает удаляться от него в заданном направлении. Однако, ’’точно прицелившись”, можно бесконечно долго двигаться по направлению к особой точ- ке. Две выделенные интегральные кривые, входящие в особую точку, называются устойчивыми многообразиями седла (ОА и О В). Линии, вдоль которых точка быстрее всего удаляется от положения равновесия — неустойчивые многообразия. 6 . pi и р2 — чисто мнимые числа; особая точка — центр. Наблю- даются незатухающие колебания и фазовая траектория системы представляет собой эллипс. При малом отклонении от равновесия система начинает описывать эллипс вокруг точки (z*, у*). Поло- жение равновесия здесь устойчиво, но ле асимптотически устой- чиво. Как мы видели из уравнения (12), тип особой точки определяется следом и детерминантом матрицы линеаризованной системы или чи- слами О] и Если считать, что система (1) зависит от параметра А и соответственно ari = oi(A),or2 = 02(A), то для того, чтобы разобрать- ся, как может измениться тип особой точки при изменении параметра, полезным оказывается рисунок 6. Этот рисунок построен, исходя из теоремы Виета и элементарных свойств квадратного уравнения (12). В частности, из него видно, что при малом изменении центр обычно становится устойчивым или не- устойчивым фокусом. Кроме того видно, что на линии ао = *aJ/4 фокус становится узлом. 3. Существуют ли предельные циклы в системе (1) и каковы они? Существование предельных циклов является главным отличием си- стемы двух дифференциальных уравнений от одного уравнения. Рас- смотрим вначале самую простую модель, в которой единственным ат- трактором является предельный цикл и в котором можно найти анали- тически все множество интегральных кривых Эта динамическая систе- ма возникает в химической кинетике, в гидродинамике, в теории волн, 199
при асимптотическом описании множества моделей вида (1), параметры которых лежат вблизи линии ori = O.qq > 0 (см. рис 6). Рис. 6. Разбиение пространства параметров по типу состояний равновесия: 1 - устойчивый узел; 2 - неустойчивый узел; 3 - устойчивый фокус; 4 - неустойчивый фокус; 5 - седло; 6 - центр Эту систему двух уравнений для х(0 и y(t) удобно записать в виде одного уравнения для комплексной функции IV(t), W(t) = x(t) + »y(t) dW — = XW - (1 + ic2)|W\2W, W(0) = Wo (13) at Анализ этого уравнения намного упростится, если перейти в полярную систему координат, считая что х = rcostp, у = rsinp. Тогда |W|2 = z2 4- у2 = г2. Учитывая, что * х — rcostp — rsintp у?, у = rsintp + rcostp перепишем уравнения (13) в полярной системе координат rcostp — rsintp <р = Xrcostp - r3(costp — c^sintp) rsinip + rcostp • <p = Arsing - r3(sin^ 4- C2«:n^). Домножив первое уравнение на cosp, а второе на sinp и сложив, полу- чим г = Аг - г3. (14) Домножив первое уравнение на -siny?, а второе на cosp и сложив, по- лучим V’=-C2’’2 (15) Замечательным свойством обсуждаемой модели является то, что уравнение для г можно решать отдельно, не обращая внимание на урав- нение для р. 200
Особой точкой для уравнения (13) является начало координат г = 0. При А > 0 существует еще одна точка г = у/Х. В исходном уравнении этой точке соответствует замкнутая кривая, являющаяся окружностью г = х/A, = —cjAL (16) Именно эта кривая является устойчивым предельным циклом. В этом можно убедиться, построив все остальные интегральные кривые г — Аг - г3, г = /?(!)ехр(А1) R = -Яэехр(2А0 0 1 = exp(2At)/(2A) + с г(0 = exp(Xt)>/A/(exp(2At) - 1 + Аг(0)“2). (17) Из формулы (17) следует, что при А < 0 независимо от начальных условий г(0) = го и у>(0) = <ро фазовые кривые стремятся к началу координат Когда А > 0 из этого соотношения видно, что exp(At) —► оо и поэтому r(t) —* у/Х. Следовательно аттрактором здесь является решение (16). Таким образом, при А = 0 происходит следующая бифуркация: устойчивый фокус становится неустойчивым и рождается устойчивый предельный цикл малой амплитуды — у/Х. Эта бифуркация в ли- тературе называется бифуркацией рождения предельного цикла или би- фуркацией Андронова—Хопфа. Типичная картина при положительных и отрицательных значениях А представлена на рисунках 7а. Зависи- мость аттрактора от параметра А показана на рис. 76. Возможен и другой вариант бифуркации рождения цикла, в резуль- тате которой появляется неустойчивый предельный цикл (см рис. 7в). Она, в частности, происходит в системе dW — = -AW + (1 + «c2)|WflV. at Это уравнение переходит в модель (11) в результате замены t —* -t. Это приводит к тому, что картина в этом случае будет в точности та- кой же, как на рисунке 7а, если на нем направления стрелок изменить на противоположные, При этом устойчивый фокус станет неустойчи- вым, устойчивый предельный цикл — неустойчивым. Следовательно здесь в результате бифуркации из неустойчивого фокуса рождается не- устойчивый цикл, а фокус в начале координат становится устойчивым. Здсь мы сталкиваемся с интересным нелинейным явлением: в ре- зультате столкновения двух неустойчивых инвариантных множеств ро- ждается аттрактор — устойчивый фокус Размер области притяжения этого аттрактора растет при увеличении параметра как >/А. Приведем 201
Рис. 7. Бифуркация рождения предельного цикла: а) зависимость аттрактора системы (13) от параметра А; б) рождение устойчивого цикла при увеличении параметра А; в) ” аннигиляция* устойчивого фокуса и неустойчивого предельного цикла пример математической модели, в которой обнаружение предельного цикла сыграло ключевую роль. Пример. Модель брюсселятора. Модель брюсселятора или тримолекулярная модель* как ее ча- сто называют, предложенная в 1968 г. И. Пригожиным и Р. Ле- февром, вероятно, сейчас является одной из наиболее известных моде- лей химической кинетики. С помощью этой модели и ее обобщения на пространственно-распределенные системы было предсказано несколько интересных нелинейных явлений. Будем рассматривать химическую реакцию с двумя промежуточны- ми продуктами X и У, концентрация которых может меняться со време- нем. Система предполагается открытой и все остальные концентрации постоянными. Рассматриваемая совокупность реакций такова Е + А X, 2Х + Y ЗХ, В + X з Y, X +А D Неравновесные условия создаются за счет немедленного удаления веществ D и Е из реактора. Это эквивалентно предположению о том, что = k-2 = 0. Будем считать также, что « 0, что имеет место в условиях избытка вещества А, и к-з ss 0 Эти предположения вместе с законом действующих масс приводят к динамической системе X = к1А - (к2В + кл)Х + Y = к2ВХ - k3X2Y (18) 202
Замены переменных, связанные с изменением масштабов t, X, Y и пере- обозначениями, позволяют перейти к уравнениям X = А - (В + 1)Х + №у Y = BX-X2Y, (19) О < < < оо, X(0,i) = Xo, У(ОД) = У0. Динамическую систему (16) и называют брюсселлтором. Ее особые точки определяются алгебраическими уравнениями А-(В+1)Х + Х2У = 0, BX-X2Y = 0. Второму уравнению удовлетворяют значения X = 0 и X = В/У' Од- нако если X = 0, то не будет выполнено первое уравнение. Из второго уравнения видно, что Y / 0, так как иначе X = 0. Следовательно, учитывая, что XY — В> находим координаты особой точки X = A, Y = В/А. Выясним, при каких условиях, эта точка устойчива. Считая, что X — ДХ +A, Y = ДУ + В/A получим линеаризованную в окрестности особой точки систему ДХ = (В - 1)ДХ + А2ДУ, ДУ = -ВАУ - Л2ДУ. Отсюда следует, что ого = A2,ai = А2 + 1 - В. Параметром, который можно изменять в системе, является концентрация В. Рисунок 6 пока- зывает, что будет происходить с особой точкой этой системы при увели- чении параметра В. Поскольку ао = А2 > 0, точка, характеризующая систему в пространстве параметров, лежит в верхней полуплоскости. Когда В мало (В < А2 — 2А + 1, линия ао = а?/4), особая точка являет- ся узлом. Затем она становится устойчивым фокусом. И, наконец, при В = А 2 4-1 устойчивый фокус становится неустойчивым. Здесь происхо- дит бифуркация Хопфа. Аттрактором системы становится предельный цикл. Пример такого цикла при достаточно больших значениях пара- метра В показан на рисунке 8. До начала 70-х годов большинство химиков считало, что химические реакции не могут идти в колебательном режиме. Экспериментальные исследования советских ученых Б.Б. Белоусова и А.М. Жаботинского убедительно продемонстрировали существование таких реакций. Встал вопрос об их теоретическом анализе и построении соответствующих ма- тематических моделей. Можно сказать, что модель брюсселятора нахо- дится внизу большой иерархии математических моделей, описывающих колебательные химические реакции. Она показывает, насколько про- стой может быть схема реакции, чтобы в открытой системе происходили автоколебания. Дальнейший анализ модели связан с выяснением закона'изменения периода, амплитуды колебаний и других параметров предельного цикла в зависимости от параметра В. Обычно это делается с помощью тех или иных численных методов Обратим внимание на несколько самых простых 203
Рис. 8 Характерный вид предельного цикла в модели брюсселятора вдали от точки бифуркации 1). Счет на установление. Задаются какие-либо начальные дан- ные (X, У) и набор параметров A(Ai, Аз. ). Для которых будут про- водиться расчеты. При каждом значении параметра достаточно долго считается траектория (чтобы иметь дело с аттрактором) до тех пор, по- ка не происходит выход на предельный цикл, т. е. пока для некоторого интервала Т(А), с желаемой точностью € не будет выполнено равенство |A7(t + Т(А)) - A'(t)l + |У(« + TW) - У(«)| < е. Выполнение этого равенства и дает основание утверждать, что в преде- лах точности расчетов мы имеем дело с периодическим решением. Основным достоинством такого подхода является простота. Два главных недостатка следующие. Выход на аттрактор, особенно вбли- зи линий бифуркаций, может быть очень долгим. Стартуя с одних на; чальных данных, можно при изменении параметра попасть в область притяжения другого аттрактора (поскольку области притяжения, есте- ственно, зависят от параметров). Это может привести к неверному за- ключению, например, что цикл исчез или скачком изменил параметры 2). Исследование функции последования, условие устойчи- вости предельного цикла. Попробуем развить альтернативный под- ход нахождения цикла, не связанный с интегрированием траектории до тех пор, пока она не выйдет на цикл. Проведем луч ОА (см. рис. 9а), заведомо пересекающий предельный цикл и близкие траектории. Например, выходящий из особой точки О, которая лежит внутри предельного цикла. Введем координату г вдоль этого луча. Рассмотрим траекторию', выходящую из точки А, принадлежащей лучу (см. рис. 9а). Пусть эта траектория в первый раз пересекает луч в точке В Введем функцию гв =/(гх), (20) которая каждой точке с координатой гА сопоставляет координату точ- ки В — гр Предположим также, что время, за которое траектория 204
Рис. 9 Построение функции последования попадает из точки А в точку В, конечно для цикла и всех близких к нему траекторий. Функция f является непрерывной и однозначной Предположим противное. Если у функции / есть разрыв в точке С lim/(rc 4- с) # lim f(rc — с), то это будет означать, что для модели (1) несправедли- ва теорема о непрерывной зависимости решения от начальных данных в точке С. Если считать, что функция f неоднозначна в них, то это значит, что в неких точках не выполнена теорема единственности. Сле- довательно, до тех пор, пока не стало ясно, что мы столкнулись с си- туацией, когда приходится изучать модели, для которых стандартные теоремы существования и единственности не выполнены, нет оснований считать отображение f разрывным или неоднозначным. Обозначим через гп координату n-го пересечения траектории с лу- чом. Тогда (20) можно записать в эквивалентном виде как одномерное отображение гп+1 = f(rn). (21) Предельному циклу соответствует неподвижная точка этого отображе- ния г’ г’=/(г’). (22) В самом деле, равенство (22) означает, что выйдя из точки с координа- той г* на оси О А, траектория через конечное время вернется в ту же самую точку. Очевидно, что если гп —* г* для всех и принадлежащих £-окрестности точки г*, предельный цикл, которому соответствует значение г’, будет асимптотически устойчив Достаточное условие устойчивости совпадает с условием сходимости метода простой итерации (21) для решения алгебраического уравнения г = /(г) ^^<1. (23) dr Достаточное условие неустойчивости предельного цикла d/(r’) > 1 (24) 205
Замечание. К,огда мы обсуждали одномерные отображения (условия устойчивости неподвижной точки) и сходимость метода про- стой итерации, то в соответствующих неравенствах стоял модуль. Здесь его можно опустить, поскольку ) > 0. Последнее связано с тем, что фазовые траектории лежат на плоскости и не могут пересекаться. Из сказанного ясно, каким образом может быть численно построен предельный цикл в модели (1). Для этого достаточно решить алгебраи- ческое уравнение (22) и найти точку с координатой г', принадлежащую циклу. Это можно сделать, если удалось обнаружить точки $ и q : f(s) > s и f(q) < q (см. рис. 96). Тогда в силу непрерывности функции f найдется точка г*, где /(г*) = г". Чтобы найти ее, делим отрезок ($, 7] пополам и рассматриваем значение /(($ -I- q)/2). Если f((s + q)/2) > s, то на следующем шаге рассматриваем отрезок ($i, 71) : si = f((s + q)/2), Qi = q. Если /((s + g)/2) < s, то на следующем шаге имеем деле с отрезком (si, qi) : $i = s, qi = f((s 4- q)/2). Отрезок («!, gi) таков, что /(si) > -si,/(qi) < qi, поэтому к нему можно применить только что описанную процедуру, рассмотреть значение функции в середине этого отрезка /(($i + gi)/2)t построить отрезок (53,72) и т.д. Понятно, что |qn - sn| < |q - s|/2n. поэтому qn — ги, sn — г* : |qn - г’| < |g-s|/2\ |г‘- sn| < |q — s|/2n. Достоинством описанного подхода является его простота. Кроме того он работает независимо от того, устойчив предельный цикл или нет, что может быть очень существенно. Основной недостаток — медленная сходимость. Отметим, что обсуждавшийся раньше алгоритм счета на установление не позволяет выделять неустойчивые циклы. Напомним, что для получения значения /(г) по данному г нам нуж- но интегрировать систему дифференциальных уравнений с начальными данными с координатой г до тех пор, пока траектория не пересечет луч ОА. Поэтому применение в данном случае метода простой итерации, то есть построение последовательности {гп},(гп —* г. при п —» оо) по правилу гп + 1 = f(rn) в этом случае эквивалентно счету на установление. Для решения уравнения (22), которое можно записать в виде F(re) = 0, можно использовать метод Ньютона, но для этого нужно знать произ- водную = 1 — Самый простой способ сделать это — действовать по определению производной: выбирается точка г', близкая к ней точка г' -i-е Обе траектории интегрируются до пересечения с лучом, что дает У(г') и /(г' + е) S3 /Сг ) (см рИС 96) Однако этот способ может быть неудобен, потому что нам приходит- ся вычислять разность двух близких величин f(r' + е) и /(г'), которые могут быть известны с довольно большой погрешностью и делить ее на малую величину Поэтому поступают иначе — рассматривают две близкие траектории й=Л(й) v = h(v) u(0) = u' , v(0) = й' + еш 206
v(t) = u(t) + Au(t) - dh(u) u(t) + Au(t) = h(u(t) + Au(t)) = h(u) 4- Au + Ди(О) = cw. Затем получают уравнение для отклонения траектории v(t) от u(i) — Au(t), рассматривая разложения в ряд Тейлора. Если считать, что тра- ектории u(t) и v(t) бесконечно близки, можно полагать, что квадратич- ные члены малы. Это поз(воляет получить так называемое уравнение в вариациях Au(t) = Дй = А(й)Ди. (26) ди Это уравнение линейно по Дй, производная или матрица А — это не что иное как якобиан, вычисляемый вдоль решения u(t): Если систему (25) записать в координатном виде, «1 = Ai(ui, ...um) Um — ^m(ui, ...Um) A(i) = (27) В качестве Дй(0) нужно было бы брать еш. Однако поскольку уравне- ние (26) линейно, то в качестве Ди(0) удобно брать единичный вектор в интересующем нас направлении ш. В нашем случае двух переменных вектор J направлен вдоль луча О А Дй(0) = ш. (28) Тогда решив задачу (26), (27) мы получим и(е) = «(t) + eAu(t) => Au(t) = ~ . Таким образом Дй(/) — производная решения u(t) по направлению ш. Ее очень удобно вычислять, решая одновременно с исходным уравнени- ем (25) систему в вариациях (26). Если для правой части (25) известно аналитическое выражение, то по формуле (27) может быть вычислена и правая часть системы в вариациях. Переходя от общего случая к конкретной системе двух уравнений и рассматривая более подробно рисунок 9в, можно найти производную 207
Пусть Т\ — время, через которое рассматриваемая траектория вновь пересекла луч О A Au(Ti) — решение системы в вариациях (26), (27) в момент времени 7\. Вектор Дй(Т]) можно разложить по напра- влению луча w (компонента Aui на рис. 9в) и по перпендикулярному направлению (компонента Auj)- Компонента Atq описывает смещение точки пересечения возмущенной траектории вдоль луча, компонента Auj отвечает за то, что возмущенная траектория попадет на луч ОА несколько быстрее, чем исходная. Далее из простых геометрических соображений можно оценить производную Обобщение обсуждавшегося подхода сейчас стало очень популярно при исследовании нелинейных явлений. При этом, переходя от моде- ли (1) к системам большего числа измерений, вместо луча ОА нужно рассматривать некоторую гиперплоскость ^1/^1 “Ь ••^тп/^тп —- ао, (29) которую называют плоскостью Пуанкаре. Сечение траекторий изуча- емой динамической системы этой плоскостью называют сечением Пу- анкаре. Аналогом координаты г является набор координат гь Вместо одномерного отображения (21) возникает т — 1 — мерное отобра- жение гп + ] = G(fn), г — (гь ...гт_|). (30) Простейшему предельному циклу соответствует неподвижная точка отображения (30) г-=(5(г-). Однако предельный цикл в пространстве более двух измерений может несколько раз пересекать плоскость Пуанкаре. Циклы q раз пересека- ющие эту плоскость иногда обозначают через S7. Переход от непрерывной системы т дифференциальных уравнений к т — 1- мерному отображению в ряде задач очень полезен. Прежде всего потому, что о многих нелинейных явлениях гораздо проще го- ворить на языке дискретных отображений, чем на языке непрерывных динамических систем. Кроме того многие системы дифференциальных уравнений порождают похожие отображения. Поэтому сейчас часто од- номерные и двумерные отображения рассматривают как упрощенные модели различных процессов. Во многих случаях важно не только уста- новить существование предельного цикла, но и выяснить как зависят его характеристики от параметров задачи. Весьма часто это удается установить с помощью асимптотических методов. Характерные черты этих методов мы проиллюстрируем на примере классической модели теории колебаний. Генератор Ван дер Поля. Уравнение Ван дер Поля является одной из базовых математиче- ских моделей. Эта динамическая система — одно из наиболее полно исследованных дифференциальных уравнений. Данная модель возникла в радиоэлектронике при описании генера- ции колебаний в электронных схемах. Наличие сопротивления в линей- ном колебательном контуре приводит к тому, что энергия, имеющаяся в системе, уменьшается и колебания затухают. Напомним, что сопроти- вление проводника играет роль вязкого трения в механической системе, которая описывается такими же уравнениями. 208
Для того чтобы происходили незатухающие колебания, необходим приток энергии извне. Это может быть обеспечено, если в системе есть активные элементы. После прохождения тока через такие элементы колебания не ослабевают, а усиливаются. Такое поведение может обес- печиваться различными физическими процессами, например, включе- нием электронных ламп, реализующих положительную обратную связь, в электрические цепи. Активные элементы могут быть созданы с помо- щью полупроводников и сверхпроводящих туннельных диодов, диодов Ганна и т.д К активным элементам относятся в более сложных систе- мах оптические квантовые усилители, различные плазменные устрой- ства, электронные пучки. Способы построения таких элементов подроб- но анализируются в курсах электроники и теории колебаний. Простейшим способом выяснить, к чему приводит наличие активно- го элемента в цепи, является включение нелинейного сопротивления. Предположим, что в цепи есть элемент, который не удовлетворяет за- кону Ома. Это означает, что зависимость силы тока через элемент от приложенного напряжения t = t(v) (или, как ее называют, волът- амперная характеристика) нелинейна i = i(u) = do + div 4- a2v2 + •••• Самый простой активный элемент может быть линейным t = ajv, Q] — const < 0. Однако область приложения такой модели очень невелика В са- мом деле, энергия колебаний в системе должна неограниченно возра- стать. В этом нетрудно убедиться, — замена t на — t в линейной системе эквивалентна замене А на —Я. Поэтому замена знака сопротивления означает рост энергии. Следовательно, все отрицательные элементы по мере нарастания амплитуды тока или напряжения должны стать ’’менее отрицательными”, а затем и положительными. Поэтому в большинстве случаев активные элементы приходится считать нелинейными. Рассмотрим простейший генератор, электрическая схема которого показана на рисунке 10а. Вольт-амперная характеристика нелиней- ного элемента представлена на рисунке 106. Она представляет собой кубическую параболу Когда |и| < ^vq, сопротивление отрицательно. Если сила тока лежит в этом интервале, активный элемент обеспечивает поступление энергии в систему, вне этого интервала — ее диссипацию. В соответствии с законом Кирхгофа сумма токов в точке А должна быть равна нулю. Поэтому * '(и) + Т [ v(r)dT = 0 ac l J о Продифференцировав это соотношение по времени и учитывая зависи- мость ! = i(v). получим уравнение Ван дер Поля d2v G / 4v2 \ dv v _ 209
Рис. 10. Модель Ван дер Поля: а) схема генератора; б) вольт-амперная характеристика активного элемента Замены переменных вида V —* р/, и' —► qu. приводят это уравнение к следующей форме й 4- и — с(1 — и2)й = 0. (31) Естественно, его можно записать и как систему двух дифференциаль- ных уравнений первого порядка v = с(1 — u2)v — и, й = v. При £ = 0 уравнение Ван дер Поля переходит в уравнение для колеба- ний математического маятника с частотой u>o = 1. С помощью компьютера нетрудно выяснить, что при малых значени- ях с в системе есть единственный предельный цикл, а установившиеся колебания близки по форме к синусоидальным (см. рис. 11). Сле- довательно схему, показанную на рисунке 10, можно использовать как генератор таких колебаний. Синусоидальные электромагнитные коле- бания широко используются в радио и телевещании. На них наклады- вается медленная модуляция, кодирующая звук или изображение. Рис. 11. Когда величина G/С мала, то уравнение Ван дер Поля описывает колебания, близкие к синусоидальным Возникает закономерный вопрос, какова частота и амплитуда пре- дельного цикла в динамической системе (31) и других системах такого рода. Зная из расчетов, что колебания близки к гармоническим, а пара метр £ мал, воспользуемся асимптотическими методами Для чего нужны асимптотические методы? Прежде чем воспользоваться каким-либо методом, естественно вы яснить, нельзя ли действовать самым простым и естественным образом исходя из первых принципов. 210
Будем искать прямое раоложение решения в виде u(t, с) = u0(t) 4- eui(t) + c2u2(t)... (32) Подставим этот вид в уравнение (31) йо + + •• + «о + eui + ••• = с(1 - «о ” 2cuoui + ...)(«о + £i*i 4- ) и приравняем члены при различных степенях е £° => «о + t*o = 0 (33а) Е1 => ti 1 + = ito - «о^о- (336) Естественно далее последовательно решать линейные уравнения отно- сительно ио» U1 и т.д. и получать решение в виде (32). Цель всех даль- нейших рассуждений этого пункта сводится к тому, чтобы показать, что так действовать нельзя. Решение уравнения (33а) имеет вид Но = Asin(t + У>о), Л = const, (pQ — const. Подставив это выражение в уравнение (336), получим iij + ut = Acos(t + ^q) - X3cos(t + y>o)sin2(t 4- y>o) = = Acos(t + y>o) - A3cos(t 4- y?o)[l - cos(2t + 2<p0)]/2 ~ = Acos(t + (p0) - A3{cos(t 4- ¥?o)/2 - [cos(t + y>0) + cos(3t + 3y?o)]/4} = A3 = cos(t 4- - A3/4] 4- —cos(3t 4- 3^0). (34) Здесь мы воспользовались тем, что sin2or = [1 - cos2a]/2 и cosacosff = |[cos(a + 4- cosfot - /?)]. Поскольку уравнение (34) линейно, его решение можно представить в виде суммы решений трех уравнений «1(0 = р(0 + g(0 + r(t), р + р = 0, (35а) q 4- q = Ccos(t 4- у>о)» (356) г 4- г = Dcos(3t 4- Зу>о), (35в) где С = [А - А3/4), D = А3/4. Частные решения этих уравнений: р = asin(t 4- <р\), tpi = const, Ч = ~2СОЗ(* + ¥»о). 211
г = — — cos(3t + З^о)- (36) о Особенно важной представляется зависимость g(t), в которую явно входит временная координата. (Уравнение (356) можно решить, вос- пользовавшись методом вариации постоянных.) Таким образом прямое разложение дает следующее асимптотиче- ское решение u(t, с) = Asin(t + ¥>о) + £ 1 А3 -(А - A3/4)tcos(t + у?о) - 32COS(3* + W») + Замечание. Построенное решение должно удовлетворять начальным условиям. Если им удовлетворяет uo(t)» то «о(О + (О этим условиям удовлетворять не будет. Поэтому удобно считать, что А = Ло 4- еА\ 4- e2Ai 4- .... ¥>о = фо 4- Еу\ 4- £2у>2 + ••• При этом, исходя из вида решения (37), нетрудно найти постоянные Л1, Aj,^?о> V3! > Это позволяет считать, что зависимость p(i) (см.(36)) учтена уже в первом члене Лзт({ 4- ^о)- Наличие подчеркнутых членов в выражении (36) и (37) играет прин- ципиальную роль. Оно приводит к тому, что построенное приближенное решение не является периодическим. Кроме того при t > О(е-1) попра- вочный член порядка £ оказывается того же порядка, что и первый член разложения ио(О» з то и больше его, что противоречит исходной посылке |uq(Z)| Ieuj(t)|. Следовательно полученное разложение (37) является неравномерным по t, поскольку при больших временах его справедливость явно нарушается. В небесной механике произведения алгебраических и тригонометри- ческих функций (у нас tcos(t + <ро)) называют вековыми или секуляр- ными членами (от французского siecle — век, столетие). Это связано с тем, что в математических моделях астрономии величина е очень ма- ла и произведение Et начинает играть существенную роль на величинах порядка столетий. Таким образом, попытка пойти наиболее простым путем и исполь- зовать прямое разложение оказалась неудачной из-за появления секу- лярных членов. Метод перенормировки. В чем причина возникших трудностей? Прежде всего в том, что период предельного цикла в уравнении Ван дер Поля, вообще говоря, не совпадает с периодом решения невозмущенного уравнения й 4- и = 0. Если бы секулярного члена в выражении (37) не было, то это означало бы, что период решения u(Z,e) и совпадают с огромной точностью. Чтобы строить периодические решения нелинейных уравнений с периодом, зависящим от параметра е, часто пользуются приемом, на- зываемым методом перенормировки. При этом переходят к новой неза- висимой переменной г = = (1 4-Eu>i + ...)t t — r(l 4- eu>\ 4- )-1 = т - EU}T - ... (38) После подстановки этого выражения в разложение (37) получим u = Asinfr 4- ¥>о - ЕШ]Т 4- . ) 4- £ .. )х 212
xcos(r 4- фо — ciujt 4- — — cos(3r 4- 3y*o — 3ecJ] r 4- ...) uZ + ... (39) Входящие в это разложение синусы и косинусы можно разложить в ряд Тейлора следующим образом, 51п(т 4- ¥>о — 4- ) = sin(r 4- у>о) “ £wiTcos(r 4- ^0) 4- cos(t 4- фо — си/] т 4- ...) = соз(т 4- у?о) + rsin(r + ^>q) + cos(3r 4- Зу?о - Зба^т 4- • ) = cos(3r 4- 3y?o) + 3£Wirsin(3r 4- 3^o) + Пользуясь этими соотношениями, разложение (39) можно переписать в виде u — Asin(r 4- Фо) 4- £< -wj Atcos(t 4- Po)+ Чтобы в этом выражении не было секулярных членов, должны выпол- няться равенства Ашу =0 => wj — 0, Л(1 - 42/4) = 0 => А = 2. Поскольку нас интересует предельный цикл, а не тривиальное решение А ± 0. Следовательно предельный цикл в уравнении Ван дер Поля опреде- ляется соотношением т = t 4- О(е2) и = 2sin(t 4- ¥>о) ~ ^cos(3t + 3<ро) 4- (40) Таким образом, применение метода перенормировки позволяет по- лучить асимптотическое выражение для аттрактора Ван дер Поля при малых значениях е. Интересно, что с точностью до е2 период предель- ного цикла и решения невозмущенного уравнения совпадают и равны 2тг. Однако сама возможность строить решения с периодом, зависящим от б, заложенная в методе перенормировки, позволяет избавиться от секулярных членов. К сожалению, метод перенормировки не позволяет построить реше- ние, описывающие выход на предельный цикл в уравнении Ван дер По- ля, что также важно в ряде случаев. В самом деле, допустим, что мы хотим использовать систему, описываемую уравнением Ван дер Поля как генератор автоколебаний. Такие колебания должны иметь с доста- точной точностью постоянный период и форму Поэтому естественно выяснить, когда они станут таковыми после выключения прибора Это требует применения других асимптотических методов. Метод усреднения. Идея этого метода имеет много общего с методом вариации произ- вольных постоянных при решении обыкновенных дифференциальных уравнений При € = 0 решение уравнения Ван дер Поля имеет вид u = acos(t 4 0), (41) 213
где акр — некоторые произвольные постоянные. При £ 0 мы будем предполагать, что решение уравнения (31) имеет тот же вид, но считать, что величины акр зависят от времени а = <*(£)• 0 — /?(0 u(t, t) = a(£)cos[r + P(t)]. (42) Вместо одной неизвестной функции u(t), которая удовлетворяет уравнению (31), мы получили три — u(i),a(t)tP(t). Их связывает со- отношение (42). Оно предоставляет определенный произвол, которым можно распорядиться, чтобы найти решение в наиболее простом виде. Это можно сделать по аналогии с линейным случаем. Из соотношения (41) следует, что й = —asin(t 4- р). Будем считать, что это верно и для нелинейного уравнения: ti(i,f) = -a(t)sin[t + /?(<)]- (43) Дифференцируя соотношение (42), получим й = —asin(t + /?) + dcos(t 4- р) — apsin(t 4- /?). Учитывая соотношение (43), имеем dcos(t + р) - apsin(t + р) = 0. (44) Дифференцирование по времени формулы (43) дает выражение для й: u = — acos(t 4- Р) — dsin(t 4- Р) — apcos(t 4- /?). Подстановка полученных соотношений для и, и, й в исходное уравнение (31) приводит к выражению asin(t 4- Р) 4- apcos(t 4- Р) = €asin(t 4- Р)(1 — a2cos2(t 4- Р)). (45) Систему двух обыкновенных дифференциальных уравнений первого порядка (44), (45) для функций а и Р можно разрешить относитель- но а и р. Домножив равенство (44) на cos(t 4- 0), равенство (45) на sin(£ 4- P)t получим а =. easin2(t 4- P)(l — a2cos2(t 4- P)) (46a) После домножения (44) на -sin(t 4- P), соотношение (45) на cos(f 4- p) и сложения обоих выражений, имеем ар = eacos(t 4- P)sin(t 4- /?)(1 - a2cos2(t 4- Р))- (466) Воспользуемся для преобразования системы (46) элементарными три- гинометрическими соотношениями 2 1 1 п 2 2 1 1 sin у = - — -cos2y; sin ycos 7 = - - -cos4y 2 2 8 8 214
a — еа cosysiny = -sin2y\ sinycos3y = — sin2y 4- -sin47 5 fl — — |cos(2t + 20) ——cos(4t 4- 40 0 — e i sin(2t + 20) - a2 r^sin(2t + 20) 4- -sini Поскольку синусы и косинусы любых действительных аргументов ле- жат в интервале от —1 до 1 для любого ограниченного а, получаем d = 0(c) и 0 = 0(c). Следовательно, при достаточно малом значении параметра с a(Q и 0(t) оказываются медленно меняющимися функци- ями времени. Поэтому на интервале 2тг они меняются мало и следо- вательно на этом интервале в первом приближении их можно считать постоянными. Это дает возможность усреднить на интервале [0, 2тг] левые и правые части уравнений (47) Lfadt= 2 т / о 1 а2 -cos(2t 4- 20) ——cos(4t 4- 40) а = са (48a) Здесь мы воспользовались тем, что <р tt (иначе нужно было бы по- другому выбрать пределы интегрирования и усреднять по периоду) и тем, что средние по периоду значения функций sin(n^) и eos(m^) (п, т = 1, 2, 3, ...) равны нулю. Усредняя точно так же уравнение (47) для функции 0(t) получим, что 0 = 0. (486) Таким образом, уравнения (48) определяют закон изменения перемен- ных a(t) и 0(t). Вместе с равенством (43) они определяют приближенное решение уравнения Ван дер Поля. При этом в рамках метода усред- нения удается описать не только параметры предельного цикла, но и переходный режим. Сингулярные возмущения, ’’утки”, жесткие системы Радиотехника в свое время поставила перед прикладной математи- кой и теорией колебаний множество задач, связанных с математическим моделированием различных нелинейных систем. Аттракторами в этих моделях обычно являлись предельные циклы, описывающие колебания, близкие к гармоническим. Однако развитие радиолокации, телевидения, вычислительной тех- ники потребовало расширения класса моделируемых электронных схем 215
и соответствующих нелинейных процессов. Электронные схемы, ис- пользуемые в этих областях, зачастую должны генерировать электри- ческие импульсы прямоугольной или пилообразной формы. Можно сказать, что в них есть два характерных временных масштаба. Это “быстрое время”, за которое формируется фронт или спад импульса, и “медленное время”, которое характеризует возникновение гладкой вер- шины импульса, либо интервал между колебаниями. Такие процессы получили название релаксационных от английского to relax — осла- блять, уменьшать напряжение. Множество математических моделей этого сорта возникло в аэродинамике в связи с развитием сверхзвуко- вой авиации и космической техники, что стимулировало, как создание математических теорий, так и появление представлений о качественных особенностях нелинейных релаксационных процессов. Рассматривая уравнение Ван дер Поля, мы имели дело с ситуаци- ей, в которой некоторые члены в дифференциальном уравнении были гораздо меньше остальных. Это отражал малый параметр £. Невоз- мущенная система, в которую переходит исходная система при г = О, имела тот же тип и тот же порядок, что и исходная. В этом случае говорят, что мы имеем дело с регулярными возмущениями. Однако возможна иная ситуация. Пусть динамическая система, опи- сывающая изучаемый объект, имеет вид ^=F(z,y,t), ^ = f(z,y,t) (49) at at ,(о) = А i/(0) = у°. При £ = 0 мы получим систему алгебраических и дифференциальных уравнений F(i,y.t) = 0. % = f(z,y,t). (50) at Обратим внимание на то. что фазовое пространство систем (49) и (50) различно. В самом деле, пусть z — вектор, имеющий т компонент, у — вектор, имеющий л компонент. Чтобы однозначно определить состояние системы (49), нужно задать (т+п) чисел Траектория определяется т-|- л начальными условиями. В случае системы (50) фазовое пространство n-мерно, и нужно только л начальных условий. Систему (49) по отношению к (50) часто называют возмущенной. Систему (50) по отношению к (49) — вырожденной. Когда тип систе- мы при наличии возмущения меняется по сравнению с невозмущенной системой таким образом, что для определения решений возмущенной системы требуется большее число дополнительных условий, чем для невозмущенной, возмущение называют сингулярным. К чему могут приводить сингулярные возмущения, можно продемон- стрировать на примере простейшей линейной модели £^— - az + 6, z(0) = zQ. dt Вырожденное уравнение является алгебраическим + = -Ъ/а. (51) 216
Проинтегрировав исходное уравнение, получим точное решение z = (z° + 6/a)ezp(at/e) — 6/а. (52) Сравним формулы (51) и (52). Видим, что если t » с/а, то первый член в формуле (52) становится мал и z(t) —► -b/а при t -+ оо, т. е. решение возмущенной системы стремится к решению невозмущенной. Однако в области 0 < t < с/а эти решения существенно отличаются, как бы не был мал параметр с. Это явление, состоящее в том, что при наличии сингулярного возмущения решение возмущенного уравнения (49) значительно отличается от решения вырожденного (50), получило название пограничного слоя. Характерный вид пограничного слоя в системе (49) показан на ри- сунке 12а. Здесь компоненты вектора z экспоненциально убывают на масштабах, связанных с " быстрым временем" — т — t/e.H затем плав- но меняются на масштабе "медленного времен^' t. Рис. 12. Характерный вид решений сингулярно возмущенных задач: а) пограничный слой на границе области, который может описывать некоторый переходный режим; 6) внутренние пограничные слои, которые могут соответствовать "пичковым" стационарным диссипативным структурам Название пограничный слой пришло из гидродинамики. Здесь бы- ло выяснено, что уравнения идеальной, невязкой жидкости не пригод- ны для описания течения вблизи границы обтекаемого тела даже если вязкость мала. Эту область вблизи границы и назвали пограничным слоем. Можно сказать, что мир математических моделей полон сингуляр- но возмущенных уравнений. Это модели гидродинамики, где в каче- стве малого параметра часто выступает величина 1/R, где R — число Рейнольдса. Это уравнения квантовой механики, где малость параме- тра связана с малостью постоянной Планка А. Это во многих случаях уравнения и нелинейной оптики, акустики, и других областей. Уравнения (49) имеют наглядную интерпретацию в задачах химиче- ской кинетики. Они описывают ситуацию, когда одна группа реакций проходит в 1/е раз быстрее, чем другая. Естественно возникает вопрос, когда можно считать компоненты z(t) квазистационарными, целиком определяемыми компонентами y(t). В синергетике параметры порядка y(t) часто называются долгоживущими модами в противоположность короткоживущим модам z(t). Ситуацию, в которой через определен- ное время можно перейти при описании изучаемых систем от модели вида (49) к модели (50), часто связывают с принципом подчинения ко- роткоживущих мод долгоживущими. 217
Рассмотренный линейный пример показывает, что перейти от систе- мы (49) к (50) можно далеко не всегда. В самом деле, если в формуле (52) а < 0, то функция z(t) ни при каких значениях i к решению выро- жденной системы (51) стремиться не будет. Классическим результатом, дающим достаточные условия, при которых решение вырожденной си- стемы является близким к решению исходной при € —* 0, дает теорема А Н. Тихонова. Поясним условия этой теоремы и ее утверждение. Вернемся к вырожденной системе (50). Допустим, что удалось найти решение уравнения F(z,j/,t) = 0 => z — ^(y^t). Предположим, что г — непрерывная функция аргументов у и t и что z — изолированный корень уравнения F(z,y, I) = 0 (то есть, изменив z на малый вектор и, получим F(z + р, у, t) / 0. После подстановки найденного решения в уравнение для у имеем $ = №(?.«). у. О. У(0) = у°. (53) UI Понятно, что вектор (y(t), t)) и будет решением вырожденной си- стемы (50). Введем в рассмотрение так называемую присоединенную систему £ = F(2,V,t), i(0) = у0, (54) в которой правая часть зависит от параметров у и I. Физически эта система описывает процессы, протекающие на временах ~ €. Это изме- нение ''быстрых компонент”, при котором медленные переменные изме- ниться практически не успевают. Математически система (54) нужна, чтобы сформулировать аналог условия а < 0 для решения линейной задачи. Понятно, что решение алгебраического уравнения F(ztytt) = 0,i = </>(y,t) будет особой точкой динамической системы (54). Предположим, что эта точка асимптотически устойчива i(r] —► у?(у, t) при г —► оо. Пусть при значениях параметров у = jfo,t = б начальные данные для системы (54) х° принадлежат области притяжения этой особой точки. Тогда, при выполнении традиционных условий, касающихся суще- ствования и единственности решений соответствующих дифференци- альных уравнений, решение задачи (49) j/(t,c),z(t,£) таково, что limy(t,£) = j/(t), при 0 < t < Т Hm z(t, £) = z(t) = y>(y(t)t t) при 0 < t < Г, где [0,Т] — интервал, на котором рассматривается решение. Эта теорема дает условия, при которых решение вырожденной систе- мы может давать представление о поведении исходной. Однако в ряде случаев важно представлять изменение переменных в пределах погра- ничного слоя. При этом также используются асимптотические методы. Соответствующие асимптотические ряды существенно отличаются от тех, которые появляются в регулярно возмущенных задачах. В послед- них приближенное решение xn(i, с) к точному z(t, с) часто ищется в виде 218
степенного ряда xn(t,c) = У^£* Xt(t). 1=0 Как правило, этот ряд имегт точность || z(t,е) — xn(tt€) || порядка O(en+l) равномерно на отрезке 0 < t < Т. В обсуждаемых сингулярно возмущенных задачах ряд содержит также члены, называемые погра- ничными функциями П*(т) п xn(t,e) = £?(xt(0 + nt(T)). k=0 Пограничные функции зависят от быстрого времени и так же, как в линейной задаче, содержат экспоненциально убывающий множитель. Алгоритмы построения таких рядов в задачах вида (49), в интеграль- ных уравнениях, системах с запаздыванием, ряде уравнений в частных производных были разработаны в работах А.Б. Васильевой и В.Ф. Буту- зова. Этот подход в литературе называют методом пограничных функ- ций. Итак, в сингулярно возмущенных задачах на границах исследуемых областей изменения независимых переменных могут возникать погра- ничные слои. Но может иметь место и более сложная ситуация. Ранее мы обсуждали системы типа реакция-диффузия, широко используемые при моделировании различных нелинейных систем. Стационарные дис- сипативные структуры, которые они описывают, в одномерном случае определяются решениями краевой задачи для системы двух обыкновен- ных дифференциальных уравнений второго порядка Di у-ч + /(и. и) = о, 0 < х < I, ах* <Ри = 0. (55) ах* «е(0) = мп = о, vx(o) = mz) = о. При этом в ряде моделей морфогенеза и химической кинетики пред- полагается, что есть некоторое вещество и, "активатор”, стимулирую- щий возникновение неоднородностей, неустойчивостей, и "ингибитор” и, препятствующий этим процессам. Во многих случаях оказывается, что коэффициенты диффузии веществ различаются на несколько порядков D\ Di- Малым параметром в этой задаче является отношение коэф- фициентов диффузии е = D\/Di. В подобном случае возникают так называемые внутренние погра- ничные слои (см. рис. 126). Характерный масштаб изменения одной переменной и определяется коэффициентом £>?. Ширина "пичков” ак- тиватора связана с коэффициентом D\. Диссипативные структуры та- кого типа, называемые пичковылси структурами, были обнаружены во многих нелинейных системах. Асимптотический анализ таких решений является достаточно сложной задачей, поскольку приходится опреде- лять число и положение пограничных слоев. Кроме того, задача (55) обычно имеет не одно, а несколько решений, причем их число растет с увеличением длины области I. Это вносит дополнительные трудности, 219
Классический пример релаксационных колебаний дает обсуждавше- еся в этой главе уравнение Ван дер Поля. Очевидно, можно подобрать параметры электрической схемы таким образом, что малый параметр будет коэффициентом при старшей производной: ех 4- (я2 - 1)х + х = 0. (56) Вырожденное уравнение (х3 - 1)х + х = 0 можно проинтегрировать z2 log |х| - — = t - а, а = const. (57) Характерный вид интегральных кривых в этом случае представлен на рисунке 136. Обратим внимание на значение времени t = а - 1/2. В этой точке х = ±1 и четыре ветви, которые определяет формула (57) не могут быть продолжены. Рис. 13. Уравнение Ван дер Поля с малым параметром при старшей производной: а) характерный вид предельного цикла на плоскости Льенара; 6) интегральные кривые уравнения при е = 0; в) типичный вид релаксационных колебаний Обратим внимание на принципиальное отличие этой ситуации от той, которая рассматривается в теореме А.Н. Тихонова. В последней фигу- рируют системы, у которых вырожденное уравнение имеет решение при 0 < t < оо. Они и "притягивают” траектории возмущенной системы. Здесь эти траектории исчезают и можно ожидать, что быстрые процес- сы, определяемые членом €х переводят решение на другую "медленную траекторию", описываемую формулой (57) при другом значении посто- янной а. Интегральная кривая оказывается как бы склеена из "бы- стрых" и "медленных” кусков (см. рис. 13в). Встает вопрос, каким образом должно осуществляться такое склеивание. Сделаем замену переменных и перейдем к системе уравнений перво- го порядка: ex = и — Г(х), й = —х, F(x) = х3/3 — х. (58) Фазовое пространство этой системы называют плоскостью Лъена- ра. Продифференцировав первое уравнение системы (58) и подставив в него й из второго, можно убедиться, что эта система действительно эквивалентна модели (56). Векторные поля, определяемые системами вида сх = /(х,и),й = д(х,и), в литературе часто называют медленно- быстрыми, Нулевые изоклины (т. е. кривые, задаваемые условиями 220
f(x,u) = 0 и ?(z, u) = 0) для системы (58) показаны на рисунке 13а. Условие х = 0 выполнено на кривой u = z3/3 — х. Рассмотрим переменную и как параметр в первом уравнении систе- мы (58). Тогда = — х2 + 1 Эта величина отрицательна при |z| > 1 и положительна при |х| < 1 Следовательно кривая и = z3/3 - х "со- стоит из особых точек" системы сх — и — F(z), которые устойчивы при |х| > 1 и неустойчивы при |z| < 1. В соответствии с этим на медленной кривой u = z3/3 — х можно выделить притягивающие куски при |z| > 1 и отталкивающие куски t при |z[ < 1. Естественно предположить (например, действуя по аналогии с прин- ципом максимального промедления, рассматриваемого в теории ката- строф), что предельный цикл выглядит так, как показано на рисунке 13а, т. е. лежит в окрестности замкнутой кривой Г -2 < х < -1, и = z3/3 - z; -1 < х < 2, и = 2/3; 1 < х < 2, и = z3/3 - z; -2 < х < 1, u= -2/3. (59) Достаточно сложный асимптотический анализ траектории в окрестно- сти кривой Г позволяет получить выражение для периода Т(е) = 3 - 21п2 + ЗПое2/3 - |cln - + J € (3 In 2 - In 3 - 3/2 - 2П, - 2/о)е + О(е',/3), где постоянные Qo, Q i, /о выражаются через специальные функции. Эта формула была получена в 1947 году А.А. Дородницыным. Неожиданный новый подход к анализу сингулярно возмущенных си- стем и релаксационных колебаний, упрощающий ряд рассуждений, был развит в 80-х годах. Он связан с так называемым нестандартным ана- лизом. При построении математического анализа принципиальным мо- ментом является введение бесконечно малых и бесконечно больших ве- личин. Однако при традиционном подходе не удается придать строгий смысл понятиям "малый” и "большой". Не удается сделать строгими такие очевидные рассуждения как "сумма малого числа малых слагае- мых мала" или "разность большого числа и малого числа есть большое число". В нестандартном анализе строится математическая теория, в которой фигурируют обычные или, как их называют, стандартные чи- сла, бесконечно большие числа и бесконечно малые числа. Вещественное число г называют конечным, если существует такое стандартное целое число п, что |z| < п, Если число х не является ко- нечным, то оно называется бесконечно большим. Вещественное число называется бесконечно малым, если |г| < 1/п для всех стандартных положительных п. В одном из подходов к построению такого анализа эффективно используется аксиоматика теории вероятностей, где ото- бражения можно считать эквивалентными, если они равны почти всю- ft- 221
Таким образом, около данного отображения есть ореол отображений бесконечно мало отличающихся от него. Точно так же вблизи стандарт- ного числа появляется ореол бесконечно мало отличающихся от него чисел. При анализе уравнения Ван дер Поля с помощью этих методов ве- личина с считается бесконечно малой. Естественно, все результаты, полученные с помощью нестандартного анализа, могут быть выведены и с использованием других математических инструментов. Однако эта техника позволяет упростить рассуждения и обойтись без ряда теорем, связанных с переходом к пределу. С ее помощью удалось не только повторить известные результаты, касающиеся ряда сингулярно возму- щенных обыкновенных дифференциальных уравнений, но и обнаружить интересное нелинейное явление, названное ” утками”. Это явление можно проиллюстрировать с помощью уравнения Ван дер Поля со свободным членом сх 4- (х2 - 1) j 4- х = а. На плоскости Льенара это уравнение записывается в виде сх = и - F(x),u = а — х. Единственная неподвижная точка — (а,Г(а)). Когда а 1 — это неустойчивый узел, когда а >> 1 — устойчивый узел. При а = 1 происходит бифуркация рождения предельного цикла. Наличие бесконечно малого параметра е приводит к тому, что амплитуда этого цикла исключительно быстро растет в окрестности точки бифуркации (см. рис. 14). Величину такой окрестности можно оценить как л0 « 1 - е/8 - 3с2/32. 74^57 £ 0*0,9987*04513 Рис. 14. Сингулярно-взмущенное уравнение Ван дер Поля со свободным членом Сверхбыстрый рост амплитуды предельного цикла после бифуркации Хопфа. Здесь е = 0,01 Это явление можно рассматривать как своеобразный резонанс, при котором траектория некоторое время следует вдоль отталкивающего куска медленной кривой (убывающий участок кубической параболы) Благодаря форме этих замечательных предельных циклов их стали на- зывать "утками” (см. рис. 15). Оказалось, что детально исследованная классическая модель обладает замечательными качественными особен- ностями При анализе сингулярно возмущенных нелинейных дифференциаль- ных уравнений, естественно, широко используется компьютерное мо- делирование Однако здесь приходится обращать особое внимание на 222
Рис. 15. Характерный вид резонансов, называемых "утками”. Траектории "утки”, некоторое время следуют вдоль отталкивающего куска медленной кривой применяемые вычислительные алгоритмы и часто использовать специ- альные численные методы. Суть возникающих трудностей можно проиллюстрировать на при- мере линейной задачи с пограничным слоем. Рассмотрим грузик малой массы € на пружинке в среде с вязким трением. Пусть его динамика описывается дифференциальным уравнением ех + х + х = 0 =>у = (-.у - х)/е=> (^)=Л(у) Решение этого уравнения имеет вид x(t) = С1втр(А]1) + С2ехр(А2<), где Ai, А2 в этом случае собственные значения матрицы Якоби А, С\ и С2 — постоянные, определяемые начальными данными. Здесь А] й? —1/с 4- 1 4- е, А2 = -1 — с. Число обусловленности этой матрицы k(A) = max|Aj|/min|A|| ss 1/е. i । При малых € оно очень велико. Такие матрицы обычно называют плохо обусловленными. Качественная картина здесь будет такой же, как на рисунке 12а. Член Ciezp(Ait) существенен на временах 1/е и описывает погранич- ный слой. В этой области производная очень велика. Член C2ezp(A2t) является основным при t и описывает медленно меняющуюся функцию. Пусть z(t) решение системы обыкновенных дифференциальных урав- нений, для которого выполнено неравенство dr dt < max |т(01 ^O<I<T 1 v 1 Здесь Т — интервал, на котором рассматривается решение, — модуль максимального собственного значения матрицы Якоби на этом 223
интервале, N — большое число, показывающее во сколько раз уменьша- ется производная вне пограничного слоя. Дифференциальные уравне- ния, имеющие такие решения, в вычислительной математике называют жесткими. Естественно было бы подойти к численному решению жестких си- стем следующим образом. В пределах пограничного слоя берется ма- лый шаг по времени, обеспечивающий достаточно высокую точность. Вне его функция x(t) меняется медленно и шаг можно существенно уве- личить, сделав объем вычислений приемлемым. К сожалению, этот на- ивный подход обычно терпит неудачу. Попытки увеличить шаг при ис- пользовании большинства методов, эффективных при решении нежест- ких систем, часто приводят к резкому, взрывному росту погрешности. Это явление, иногда называемое жесткостью, можно проиллюстри- ровать на примере уравнения i = а(г - у?) + у?, х(0) = х0. ¥>(0) = ро. (60) где у? — заданная функция времени. Решение этого уравнения: z = (z0 - Рок"' + V’(t)' (61) Применение метода Эйлера в этом случае приводит к отображению *п+1 = + hazn + h(y>n - or^n), у>п = , где Л — шаг по времени. Переписав это отображение в виде (г„+1 - р„+1) = (1 + hazn)(zn - р„) - (pn + 1 - <f>„ - h<p'n), можно найти явное выражение для хп п- 1 zn = (1 + ha)n(z0 - v?0) 4- tpn + 52(1 + Aa)k(h^_t_, + - Pn-t) fc = 0 Из вида этой функции ясно, что процесс численного решения будет устойчивым при условии |1 + ho| < 1. (62) Иначе малая ошибка в задании zq или у?о будет расти с номером шага в геометрической прогрессии. Пусть а = —10+9, у>(1) = е“*, 0 < t < 1. Тогда система (60) будет жесткой. В пограничном слое решение r(t) изменяется как erp(10“9f), вне его — как exp(-t) Естественно здесь было бы использовать круп- ный шаг h. Однако в соответствии с условием (62) задача численного интегрирования в этом случае будет устойчивой, если Л < 2 10"9 Что- бы передать решение этого простейшего дифференциального уравнения с помощью явного метода, требуется порядка миллиарда шагов Используем теперь для решения неявный метод Эйлера, в котором правая часть на шаге п вычисляется через значения переменных на этом же шаге (в отличие от явного, где используют значения на шаге 224
п - 1). Если бы уравнение было нелинейным, то на каждом шаге по времени приходилось бы решать систему нелинейных алгебраических уравнений. Здесь в силу линейности и специального вида уравнения можно найти явно zn Zn+i = zn + hazn-i + Л(у>„+1 - <*pn+1) => => (zn+i -¥>n+l) = (1 -hn)~l(z„ -v»n)-(1 -ha)~l(<pn+i -<pn -h<p'n+i) => => zn = (1 - ha)~"(zo - <f>o) + ¥>n + П— 1 +(1 - Ла)-1 52(1 - ha)~k(h<p'n_k + - ¥>n-i). k=Q Условие устойчивости этого алгоритма |1 — ha| > 1. Таким образом, в случае отрицательных значений а, как в рассма- триваемом уравнении, ограничений на шаг интегрирования нет. Шаг можно выбирать из соображений аппроксимации производной разно- стью (zn+i - *п)/Л Далее его можно увеличивать, исходя из характера решения. Необходимость при моделировании многих нелинейных процессов решения сингулярно возмущенных задач привела к появлению мно- гих специальных методов, ориентированных на жесткие системы. Есте- ственно, такие же проблемы возникают при решении уравнений в част ных производных. Здесь обычно приходится подстраивать шаг и по времени, и по пространству. Построение алгоритмов такого типа, раз- ностных схем, адаптирующихся к решению, является сейчас одним из быстро развивающихся направлений вычислительной математики. Вопросы и задачи 1. Конкуретное взаимодействие двух видов или взаимное ингибиро- вание двух групп нейронов в ряде работ описывалось математиче- ской моделью i = en/(0" + vn)-* t/ = en(en + zn)-!/ Исследовать качественное поведение решений при различных зна- чениях п, считая что 0 = 1/2. 2. Состояние равновесия в автономной системе двух обыкновенных дифференциальных уравнений таково, что А1 < 0, Аз < 0. Всегда ли устойчиво такое состояние равновесия? 3. Как ведут себя фазовые траекториии динамической системы, осо- бая точка которой представляет собой седло-узел х = Ах2, у = by? 225
4. Для описания колебательной химической реакции Белоусова— Жаботинского Р. Филдом и Р. Нойесом была предложена следую- щая схема реакции A + Y X X + Y ii Р В + X 2% + Z Z fY, где f — некоторый коэффициент. Какая система дифференци- альных уравнений описывает изменение концентраций веществ X, У, Z1 Сколько существенных параметров в этой модели? Ка- ковы они? При каких условиях особая точка этой системы те- ряет устойчивость? (Ответ: эта модель, называемая орегонато- ром, может быть приведена к виду х = $(у — ху + х — qx2)ty = (—у - ху + fz)/s, z — u(z - z). Характерные значения коэффици- ентов q ~ 10“’,$ 102,w — бифуркационный параметр.) 5. Классические уравнения движения самолета в вертикальной плос- кости имеют вид <р = р — cos <р р = 2р(Х - рр — sin <р). Провести качественный анализ этой системы при различных р. Есть ли в этой системе гетероклинические траектории, идущие из одной особой точки в другую? Как ведет себя система при других значениях д? 6. При феноменологическом описании жесткой потери устойчивости в автоколебательных системах в ряде работ используется уравне- ние W = Al W + Л21W I2 W + Аз I W|4 W, где W — комплексная функция, AjtЛэ, Лэ — комплексные пара- метры. Провести качественный анализ этой модели и построить бифуркационную диаграмму. 7. Для описания гликолитических колебаний в качестве простейшей математической модели используется динамическая система X = 1 - ху1 у = Ъху1 - Ьу, у > 0. Проведите качественный анализ этой системы. 8. Простейшая система с запаздывающей отрицательной обратной связью имеет вид i(t) = Az(t) + Bz(t - т). Такие модели возникают, например, при описании имунной систе- мы. Получите условия, при которых стационарное состояние этой системы устойчиво. При каких условиях в этой системе могут начаться колебательные процессы? 226
9. Рассмотрим маятник, описываемый системой вида х 4- g(t)x + w2(t)r = О, где w(f) положительная монотонная функция. Получите доста- точные условия ограниченности колебаний в этой системе. (Ука- зание: сделайте замену переменных г = f* w(s)ds и рассмотрите изменение энергии системы.) 10. Исследуйте качественное поведение динамических систем х = ху, у = х2 + у2 и х = xyt у = у2 - х4. Рекомендуемая литература Представление о классической теории колебаний, в которой предельные циклы играют ключевую роль, дают книги: Андронов А.А., Витт А.А., Хай- кин С.Э. Теория колебаний. М.:1 Наука, 1981; Рабинович М.И., Трубецков Д.И. Введение в теорию колебаний и волн. М.: Наука, 1984; Баутин Н.Н., Леонтович Е.А. Методы и приемы качественного исследования динамиче- ских систем на плоскости. М.: Наука, 1976. Строгие результаты приведены в книге: Хартман Ф. Обыкновенные диф- ференциальные уравнения. М.: Мир, 1970. Асимптотические методы анализа таких систем рассмотрены в книге: Найфе А. Введение в методы возмущений. М.: Мир, 1984. Введение в теорию сингулярно возмущенных задач может служить кни- га: Васильева А.Б., Бутузов В.Ф. Асимптотические разложения решений сингулярно возмущенных уравнений. М.: Наука, 1973. Методы исследования релаксационных колебаний подробно рассмотрены в книге: Мищенко Е.Ф., Розов Н.Х. Дифференциальные уравнения с малым параметром и релаксационные колебания. М.: Наука, 1975. Использование нестандартного анализа в исследовании сингулярно воз- мущенных задач рассмотрено в статьях: Картье П. Сингулярные возму- щения обыкновенных дифференциальных уравнений и нестандартный ана- лиз/ /Успехи мат. наук. 1984. Т.39. Вып.2. С.57-76; Звонким А.В., Шубин М.А. Нестандартный анализ и сингулярные возмущения обыкновенных диф- ференциальных уравнений//Успехи мат. наук. 1984. Т.39. Вып.2. С.77-127. Алгоритмам исследования жестких систем посвящена книга: РакиглскиО Ю.В., Устинов С.М., Черноруцкий И.Г. Численные методы решения жестких систем. М.: Наука, 1970.
Escher M C. Knots. 1966 Эшер М.К. Узлы
ГЛАВА 9 ТОПОЛОГИЧЕСКИЕ МЕТОДЫ В ИССЛЕДОВАНИИ НЕЛИНЕЙНЫХ СИСТЕМ В некотором смысле слова топо- логия — это наука, изучающая непрерывность: исходя из непре- рывности пространства или форм, она переходит к обобщениям, ко- торые затем по аналогии приводят к новому понятию непрерывности, а ''обычное" пространство, как мы себе его представляем, остается далеко позади. С. Барр Геометрические образы и представления играют важную роль в ис- следовании нелинейных явлений. При этом особое значение приобре- тают методы раздела математики, первоначально являвшегося частью геометрии — топологии. В 1872 году выдающийся математик Фе- ликс Клейн сформулировал исследовательскую программу, связанную с классификацией различных областей геометрии, получившую назва- ние Эрлангенской программы. Геометрические фигуры в плоскости или пространстве могут под- вергаться различным преобразованиям (переносам, поворотам, дефор- мациям). Естественно выяснить, какие свойства фигур сохраняют- ся, когда фигура подвергается различным преобразованиям. Система утверждений, касающихся таких свойств, составляет геометрию данно- го класса преобразований. Например, в аффинной геометрии допусти- мыми преобразованиями являются параллельный перенос и централь- ная симметрия. Утверждения этой геометрии, многие из которых были известны Евклиду, сохраняют силу при параллельном проектировании с одной плоскости на другую. Окружности в этой геометрии не рассма- триваются и углы не измеряются. Зато ее утверждения сохраняют силу в геометрии пространства — времени Минковского, которая использу- ется в специальной теории относительности. Группа, характеризующая аффинную геометрию, состоит из аффин- ных преобразований (г, у) —* (х, i/) х' = ах + by + р у = сх + dy + q, ad — be / 0. Последнее неравенство необходимо, чтобы преобразование было взаим- но однозначно. В проективной геометрии рассматриваются свойства, сохраняющиеся при центральном проектировании из точки О (см. рис. 1) фигур, лежащих на плоскости тг, на плоскость тг'. При этом плос- кости я и тг' могут быть как параллельны друг другу, так и не парал- лельны. Инвариантом относительно таких преобразований является двойное соотношение: (СА\ /ПА \ “1 7777 = (A'B'C'D>). С> D / \ UD j 229
о Рис. 1. В проективной геометрии рассматриваются свойства, сохраняющиеся при центральном проектировании Однако преобразования, которые рассматриваются в аффинной и проективной геометриях, являются частными случаями более широкой группы топологических преобразований. Эти преобразования между точками р фигуры А и точками р' фигуры А* обладают: 1. Взаимной однозначностью. Другими словами каждой точке р фигу- ры Л сопоставлена одна и только одна точка р' фигуры А1 и обратно. 2. Взаимной непрерывностью. Если мы возьмем две точки р и q фигу- ры А и станем двигать р так, чтобы расстояние между р и q стремилось к пулю, то расстояние между точками рг и qf фигуры А* также будет стремиться к нулю (см. рис 2). Это верно и для обратного преобразо- вания А* —► А. Отображения, которые обладают этими двумя свойствами, называ- ют гомеоморфными Свойства фигур, которые не изменяются при го- меоморфных преобразованиях, называют топологическими свойства- ми фигур или топологическими инвариантами. Изучением топологических свойств фигур и занимается топология. Для того, чтобы наглядно представить отличие различных геоме- трий, посмотрим, в какие фигуры может перейти квадрат ABCD при различных преобразованиях (см. рис. 2). Аффинные преобразова- ния способны перевести этот квадрат в произвольный параллеограмм A'B'C'D'. Проективные преобразования — в произвольной четырех- угольник А” В"С” D". Топологические преобразования на плоскости задаются отображениями х* = /(**у)(1/ — <?(x,j/)( являющимися вза- имно непрерывным и взаимно однозначными. Степень произвола здесь очень велика, fug могут быть любыми нелинейными функциями, удо- летворяющими этим требованиям. Топологические преобразования могут перевести квадрат A BCD в любую фигуру, не имеющую разрывов внутри себя (или как ее называ- ют, односвязную) А”'B”'Cl”D/,f (в качестве одной такой фигуры может быть выбрано ’’пятно” см рис. 2г, в качестве другой — ’’осьминог” рис 2д). Однако при этом точки A,lfB,”C,nDm будут принадлежать грани- це фигуры. Свойство ’’принадлежать границе” является топологиче- ским инвариантом. Кроме того, порядок точек на границе Atff Bfrt CHt Dtil является в точности таким же, как у исходной фигуры. Другими сло- вами, если мы двигались вдоль границы и поочередно проходили точки А, В. С и D, то, путешествуя по границе фигуры А,пВ,пСтDnt и попав 230
из точки А'" в В1". можно быть уверенным, что при движении в том же направлении встретится сначала С". потом D”*, а затем мы вернемся в исходную точку А"'. Однако форма фигуры может быть причудливой Такой как у ’’пятна’’ или ’’осьминога" на рис. 2г и 2д. Рис. 2 Аффинные преобразования позволяют перевести квадрат ABCD в параллелограмм А* В* CD', проективные — в четырехугольник А"В"С"D", топологические — в "пятно” или "осьминога" Можно наглядно представить себе исходную фигуру, нарисованную на резиновом листе, который деформируется произвольным образом без разрывов и наложений. То, что получается на этом листе из исходной фигуры, и будет ее образом при топологическом преобразовании. Поскольку произвольные непрерывные нелинейные функции возни- кают при описании множества нелинейных явлений, их топологические свойства представляются очень важными. Топологические методы являются, вероятно, самыми мощными ин- струментами для доказательства теорем существования. Можно ска- зать, что во многих случаях они дают "правила запрета", показывают какими свойствами математическая модель из очень широкого класса в принципе не может обладать. Кроме того в последние годы активно развивается ряд областей, где топология дает ключ к созданию объек- тов с принципиально новыми физическими свойствами. Постараемся с помощью нескольких простейших примеров дать представление о воз- можностях этого подхода. 231
Непрерывность. Простейший пример топологической теоремы дает утверждение, ко- торое обычно доказывается в курсах математического анализа. Теорема. Если функция f(x) определена и непрерывна для всех значений х в некотором замкнутом промежутке а < х < Ь, то на этом отрезке функция достигает наименьшего значения m и наиболь- шего значения М. Кроме того для каждого значения у в замкнутом промежутке т < х < М уравнение у — f(x) имеет по крайней мере одно решение х, принадлежащее промежутку а < х < Ь. Сформулированную теорему иллюстрирует рисунок 3 На геометри- ческом языке утверждение означает, что непрерывная кривая, идущая из точки минимума в точку максимума (хмУМ) хотя бы один раз пересекается с любой горизонтальной прямой у = с (с - любое число m < с < М). На рисунке видно, что решений это нелинейное уравнение может иметь несколько. Замечательной чертой утверждения является его общность. Оно оказывается справедливым для любой непрерывной функции. Оборотной стороной этого достоинства является то, что тео- рема и способ ее доказательства не дают более конкретной информации о решении или способа его найти. С этой теоремой связано несколько интересных и неожиданных ре- зультатов. Обратим внимание только на два. Первый результат представляет собой решение так называемой за- дачи Уитни. Поезд двигается из точки А в точку В по произвольному закону s = f(t), где 5 — расстояние от точки А. При этом он может ускоряться, замедляться и даже некоторое время двигаться назад. К полу одного из вагонов прикреплен твердый тяжелый стержень Стер- жень может без трения двигаться вокруг оси, параллельной осям ва- гонов, вперед и назад — от пола до пола. При этом, прикоснувшись к полу, он в дальнейшем, может остаться лежать на полу Возникает вопрос можно ли в момент отхода поезда поместить стержень в такое начальное положение а, чтобы на протяжении всего пути от А до В он не прикоснулся к полу (см рис. 4)? Как это ни удивительно, такое положение существует при любом законе движения s(t). Для того, чтобы установить этот факт, не тре- буется даже знание законов динамики Достаточно знать, что движе- 232
A В Рис. 4. ние стержня определяется некоторым дифференциальным уравнением Будем считать, что решение этого уравнения непрерывно зависит от начальных условий. Предположим, что в начальный момент стержень неподвижен и составляет с полом угол а0* Физическая интерпретация непрерывности здесь очевидна: если при данном начальном положе- нии ого стержень во время пути упадет вправо а — 0, то при ого + Дао, где величина Дао достаточно мала он не упадет в противоположенную сторону (о = 180°). Доказательство будем .проводить от противного. Предположим, что при любом начальном положении стержень в точке Д обязательно упа- дет в ту или иную сторону, то есть угол а примет значение 0е или 180°. Определим функцию /(ао). Пусть она будет равна значению угла о, который составляет стержень с полом в точке В, отнесенное к я. Эта функция равна 1, если стержень упал вправо, —1, если влево по ходу движения. Очевидно /(0) = 4-1,/(180°) = —1. Допустим, что функция принимает только два значения В силу сделанного предположения эта функция непрерывна. Из сформулированной в начале этого пункта те- оремы следует, что при некотором ао, /(ао) = 0 Это противоречит предположению о том, что функция /(z) принимает только два зна- чения 4-1 и — 1. Последнее соответствует тому, что стержень по ходу движения обязательно падает вправо или влево при любом начальном положении ого- Следовательно, существует по крайней мере одно на- чальное положение ого, при котором стержень во время путешествия от Л до В на пол не упадет. Рассмотрим следующую задачу. Можно ли вокруг любой ограни- ченной фигуры F на плоскости описать квадрат? При этом квадрат, естественно, должен быть таким, чтобы на каждой его стороне лежала по крайней мере одна точка фигуры F. Рассуждения, показывающие, что это всегда можно сделать, таковы Выберем две произвольные параллельные прямые / и I' под каким- нибудь углом а к горизонтали (см. рис. 5а) Будем перемещать эти прямые параллельно себедо тех пор, пока они не коснуться фигуры F. Пусть это будут прямые / и Г (см рис. 56). Далее выберем две опорные прямые тит', перпендикулярные прямым I и Также будем двигать их до тех пор, пока они не коснутся фигуры F. Пусть это будут прямые 233
m и fn'. При этом фигура F окажется вписанной в прямоугольник ABCD. Покажем, что при некотором направлении прямой / - /(о") этот прямоугольник превращается в квадрат. Рис. 5 Обозначим длину стороны AD, параллельной / через hi(1(a)), длину стороны АВ через Л2(/(а)). Прямоугольник ABCD будет квадратом, если hi(1(a)) = Л2(/(а)). Будем теперь поворачивать прямую I. Когда она повернется на 90°, прямая I совпадет с т, сторона AD займет место АВ, сторона АВ — место AD. Следовательно hi(Z(or)) = h2(l(a 4- 90°)); h2(l(a)) = h}(l(a + 90°)). Рассмотрим функцию <?(о) = hi (1(a)) - h2(l(a)). Очевидно ff(a) = /»!(/(*)) - h2(l(a)) = Л2(/(о + 90°)) - h](/(a + 90°)) = + 90°). Следовательно, функция д(а) в точках а и а + 90° имеет разные знаки Поэтому по сформулированной теореме найдется такое значение а", что д(а") =ф. Следовательно h\(l(a*)) = Л2(/(о*)). При этом значении угла описанный прямоугольник и является квадратом. Открытые множества, непрерывность, топологические ин- варианты. Для "резиновой” геометрии, в которой допускаются растяжения, сжатия и множество других непрерывных преобразований, нет смысла измерять углы, длины, площади. Ключевыми становятся такие поня- тия как окрестности, открытые и замкнутые множества. Проиллюстрируем их на простейших примерах и покажем, как на этом топологическом языке можно говорить о непрерывности. Пусть некоторое множество X лежит в еклидовом пространстве Э?п В этом пространстве по теореме Пифагора расстояние между точками А и В, заданными координатами (т*, . . , х*) и (xf,. . определяется формулой / п \ 1/2 р(а,в)= - г»)2 Пусть г - точка, принадлежащая множеству X, а т - некоторое положи- тельное число. Тогда окрестностью радиуса т точки х в множестве 234
А называется множество всех точек из X, расстояние которых от х меньше т. Такая окрестность обозначается символом /У(т, х,Х). Определение. Подмножество U множества X(U С А) называется открытым множеством, если для каждой точки х Е U существует такое число г > 0, что N(x, г, If) С U. В качестве упражнения читатель может убедиться, что все окрест- ности являются открытыми множествами и что пересечение любого ко- нечного числа открытых множеств в X является открытым множеством в X. Пустое множество 0, не содержащее ни одной точки, также есте- ственно считать открытым. Так как множество 0 не имеет точек, то можно считать, что каждая его точка имеет окрестность, содержащу- юся в 0. С другой стороны, если множество А не является открытым, то оно содержит некоторую точку, у которой нет окрестности, содержа- щейся в А. Следовательно такое множество не может быть пустым. Определение. Пусть X — множество в 5?п. Подмножество А С X называется замкнутым в X, если его дополнение (т. е. со- вокупность точек, которые принадлежат X, но не принадлежат А) открыто. Другими словами, А замкнуто в X, если X - А — открыто в X. Введенные определения позволяют дать ’’топологическое определе- ние” непрерывности Т е о р е м а. Функция f: X —► Y непрерывна в том и толь- ко в том случае, если прообраз каждого открытого множества в Y, есть множество, открытое в X. Или функция f непрерывна тогда и только тогда, когда прообраз каждого множества замкнутого в Y множества есть множество, замкнутое в X. Классическое € - 6 определение, имеющееся в курсах математиче- ского анализа и восходящее к Коши, таково Функция / непрерывна, если для каждой точки х 6 X и каждого £ > 0 существует такое 6 > О, что функция / отображает 6-окрестность точки х в с-окрестность точки /(*)• Предположим, что f непрерывная функция и V — произвольное открытое множество в У. Нам нужно доказать, что у каждой точки г Е f~'V существует окрестность, содержащаяся в f~lV. По сделан- ному предположению f(x) е V и V открытое множество в Y. Зна- чит, существует такое число е > 0, что N(f(x), £, Y) С V. Поскольку функция / непрерывна, в соответствии с классическим определением, найдется Ь > 0, при котором образ окрестности N(x,b,X) будет содер- жаться в N (f(x),c, Y), а. значит в V. Таким образом, N{x, Ь, X) С f~lV и поэтому прообраз каждого открытого в Y множества V открыт в X Докажем теперь обратное утверждение Пусть функция / такова, что прообраз f~xV каждого множества V, открытого в Y, открыт в X. Покажем, что она непрерывна в соответствии с е - 6 определением Пусть х Е X и дано с > 0. Окрестность N(f(x), е, Y) является откры- тым множеством в Y Обозначим ее прообраз в X через U. По условию теоремы множество U открыто. Следовательно, найдется окрестность N(x,8,X) принадлежащая U. Окрестность N{x.b,X) С f~xV Поэто- му 6, X)) С N(/(х), с, Y) и функция непрерывна в смысле е - 6 определения Часть теоремы, касающуюся замкнутых множеств, читатель может доказать самостоятельно, действуя аналогично. 235
Таким образом, доказанная теорема утверждает, что непрерывные преобразования переводят открытые множества в открытые. Другими словами, свойство множества быть открытым является топологическим инвариантом. Однако представим, что множество является замкнутым. Пусть, на- пример, это будет буква, написанная на резиновом листе. Легко пред- ставить, какие причудливые конфигурации она может принять после набора сжатий и растяжений. Букву ”С" нетрудно перевести в ”S”, затем в ”Г”, потом в ”1’*' и т.д. Поэтому возникает вопрос, какие же буквы мелъал перевести друг в друга. Очевидно, нельзя перевести те, которые имеют различные тополо- гические инварианты. Например, букву ”ы” нельзя перевести в ”д", потому что ”ы” состоит из двух, не связанных между собой частей, а ”у” — из одной. Число связанных ’’кусков” или компонент (т. е. таких частей, по которым можно путешествовать, не покидая фигуры) явля- ется топологическим инвариантом. Две гомеоморфные фигуры состоят из одинакового числа компонент. Можно считать, что буква состоит из конечного числа дуг. Фигуры, состоящие из конечного числа дуг, в топологии называют конечными графами. В конечном графе можно выделить набор точек, соединя- ющихся непересекающимися дугами (ребрами графа). При этом две вершины могут соединяться несколькими ребрами. Кроме того, могут существовать замкнутые ребра ’’петли”, которые начинаются и конча- ются в одной точке. Число дуг. сходящихся в вершине, называется ее индексом. Очевидно, число вершин с данным индексом является то- пологическим инвариантом данной фигуры. Это позволяет, например, доказать, что букву ”е” нельзя перевести в ”ж”. У первой буквы есть единственная вершина с индексом 3, у буквы ”ж” их две. Все топологические инварианты такого типа кажутся наглядными и очевидными. Однако даже они оказываются полезными при решении совсем не простых задач. В микроэлектронике часто бывает необходимо выяснить, можно ли соединить данный набор точек на одном уровне, без пересечений. Простейшей задачей такого типа является задача о домиках и колодцах. Пусть на плоскости дано шесть точек — домики Di, D2, D3 и колодцы К], It?, К3. Важно выяснить, можно ли провести тропинки от каждого домика к каждому колодцу, чтобы никакие две тропинки не пересеклись (см. рис. 6). Решение этой задачи связанно с введением новых топологических инвариантов. Пусть а,Ь два отрезка на плоскости, ни один из ко- 236
торых не содержит концов другого. Если эти отрезки пересекаются, то индекс пересечения отрезков а и b J(ayb) будем считать единичным J(a,6) = 1, в противном случае J(atb) = 0. Конечный граф, состоящий из конечного числа отрезков, в каждой вершине которого сходится четное число ребер, будем называть циклом. Введем величину, называемую индексом пересечения двух циклов 1(а, Ь). Для этого вначале вычислим сумму 5 = j т- е- сум- му индексов пересечения каждого отрезка aj,..., ам, входящего в цикл а с каждым отрезком 6],..., входящим в цикл 6. Если S ~ четное чи- сло, то Ца, Ь) = 0, иначе 1(а, b) = 1. Другими словами, 1(а, 6) = Smod2. Убедимся, что индекс пересечения двух циклов на плоскости равен нулю. Напомним, что каждая вершина цикла имеет четный индекс, т. е. в ней сходится четное число ребер. Отсюда следует, что она содер- жит замкнутую ломаную, гомеоморфную окружности. В самом деле, представим, что мы путешествуем по циклу с вершинами Допустим, путешествие начинается в вершине С]. Попав в вершину / 1), мы можем продолжить путешествие. Если бы путешествие закончилось в Ct, то это означало бы, что в эту вершину входит толь- ко одно ребро, что противоречит определению цикла. Поскольку число вершин конечно, то рано или поздно траектория вернется в С\. Если при этом мы побывали во всех вершинах, то это означает, что вся ло- маная гомеоморфна окружности. В противном случае выбросим все ребра, по которым мы прошли. При этом вновь получится один или не- сколько циклов (поскольку индекс каждой оставшейся вершины будет по-прежнему четным). Повторив эту процедуру достаточное число раз, убедимся, что каждый цикл можно представить как объединение конеч- ного числа ломаных, гомеоморфных окружности. Причем эти ломаные не имеют общих отрезков. Поэтому, чтобы проверить, что индекс пересечения двух ломаных равен нулю, достаточно рассмотреть случай, когда обе они гомеоморф- ны окружности (см. рис. 7). Пример двух таких циклов представлен на рисунке 7а (цикл 6 в положении 1). Выберем прямую 1 и будем сдвигать цикл b параллельно этой прямой. Для простоты выберем направление прямой I так, чтобы ни одна вершина цикла а не попадала при дви- жении в вершину цикла Ь. Пусть то же относится и к ребрам. Кроме этого, будем считать, что когда одна из вершин цикла лежит на ребре так, как показано на рисунке 7 (цикл b в положении 2), то индексы пересечения отрезков /(а,,6т) и J(ai,fcm+i) равны нулю. Понятно, что при движении цикла мы будем время от времени сталкиваться только с ситуацией, показанной на рисунке 7. Однако при этом индекс пересече- ния двух циклов остается постоянным. Каждый раз число пересечений уменьшается ровно на два. Достаточно далеко продвинув цикл b отно- сительно цикла а, мы придем к ситуации, когда эти циклы не имеют общих точек. Но в этом случае 7(а,6) = 0. Таким образом индекс пересечения двух циклов равен нулю. Вернемся к задаче с домиками и колодцами. Назовем несмежными тропинки, идущие от разных домиков к разным колодцам. Например, несмежными для тропинки DjA'j будут тропинки D2А'2, D2А'3) D3А2, D3K3. На рисунке 6 показана некоторая конфигурация тропинок, в которой несмежные тропинки один раз пересекаются. Покажем, что это число нельзя уменьшить. Прежде всего докажем, что, непрерыв- но меняя конфигурацию тропинки, показанную на рисунке 7, мож- но получить любую другую, но нельзя изменить индекс пересечения 237
несмежных тропинок. В самом деле, пусть у нас есть две конфи- гурации и {D{ При этом вершины Di Л'] £>2 A263/I3 принадлежат и первому набору ломаных, и второму, однако сами ломаные могут быть иными (см. рис Н). Пусть в первом случае D\K\ — это ломаная о, во втором D\K\ — а (см. рис. 8). Ло- маные ad составляют цикл Обозначим его ad Однако D2 А'2^3 A3D2 также составляют цикл. Однако индекс пересечения этих циклов равен нулю. т. е заменив тропинку D\ К\, на ломаную D{ A'J, мы не изменили четности пересечения. Рассуждая так же относительно других тропи- нок, убедимся, что так же можно деформировать остальные тропинки, переводя {D\ к1А'г^з А'э} в {^i А'[ . Допустим, что суще- ствует такое расположение тропинок, при котором пересечений нет и, следовательно, индекс пересечения несмежных тропинок /п равен нулю. Рис 8 Пусть это будет { D\ A j D'2 КЧ D'3 A3} Но индекс пересечения этой конфигурации /п в точности такой же, как у расположения тропинок, показанного на рисунке 6, где In = 1 А значит провести дорожки от домиков к колодцам, чтобы они не пересекались, не удастся Близкие, хотя и более сложные задачи, связанные с поиском то- пологических инвариантов, возникают в теории узлов. В этой теории выясняется, можно ли один узел, завязанный на веревке, перевести в другой, не разрывая концов веревки. В последнее время теория уз- лов начала активно применяться в статистической физике Вероятно, появятся другие области приложений, прежде всего в химии, где прихо- дится не разрубать гордиевы узлы, а анализировать их конфигурацию 238
Многогранники, теорема Эйлера. Один из замечательных топологических результатов был известен еще Эйлеру и Декарту. Можно проверить, что для пяти правильных многогранников — тетраэдра, куба, октаэдра, додекаэдра и икосаэдра, а также для пирамид и призм имеет место соотношение В - Р + Г = 2 (1) Здесь В число вершин многогранника, Р — число ребер, Г — гра- ней. В каждом из этих многогранников любая грань гомеоморфна кругу. Поверхность этих, а также любых других выпуклых многогранников го- меоморфна сфере Теорема Эйлера утверждает Для всякого многогранника, поверхность которого гомеоморфна сфе- ре. а каждая грань гомеоморфна кругу, выполняется соотношение (1). Представим, что многогранник внутри пустой и сделан из тонкой резины. Надуем его, как детский шарик, и превратим в сферу, потом вырежем одну грань, а оставшуюся часть ’’резинового” многогранника растянем на плоскости. Пример такой процедуры показан на рисунке 9, где ”вынута” грань куба AB.CD. В результате такого преобразования число вершин и ребер не изменится, а число граней уменьшится на од- ну, поскольку одна грань вырезана. Покажем, что для получившегося графа на плоскости число В - Р 4- Г = 1. Если среди граней имеются многогранники, то будем проводить диа- гонали до тех пор, пока все грани не станут треугольниками (см. рис. 9). Легко убедиться, что, проводя диагонали, мы увеличиваем число граней и ребер на единицу, а следовательно величина В — Р+ Г остается неизменной Будем затем удалять по одному граничному треугольнику из полу- ченной треугольной сетки, как показано на рисунке 10 При этом будут возникать такие треугольники как АВЕ и как CFG (см рис 9, 10) Удаляя треугольник первого типа, мы уменьшаем число ребер и граней на единицу При этом величина В - Р 4- Г сохраняется При удале- нии треугольников второго типа число граней и вершин уменьшается на единицу, а число ребер на 2, и величина В - Р 4- Г вновь сохраняется. В конце концов на плоскости остается один треугольник, имеющий три вершины, три ребра и одну грань. Поэтому для него В - Р + Г - 1,нов силу проведенных рассуждений таким оно должно быть и для исходной сетки на плоскости Учитывая вырезанную вначале грань, убедимся, что В - Р + Г = 2 Теорема Эйлера позволяет решать множество различных задач 239
Одним из ключевых геометрических результатов Евклид считал, до- казательство того, что существует пять выпуклых правильных много- гранников. Напомним, что выпуклым многогранником называется за- мкнутая конечная область пространства, ограниченная некоторым чи- слом плоскостей. Причем внутренность многогранника лежит по одну сторону от каждой плоскости. Для правильных многогранников все грани конгруэнтны (равны) и все плоские углы при вершинах равны между собой. Платон считал правильные многогранники символами четырех эле- ментов — земли, огня, воздуха и воды, а пятый многогранник — фигу- рой, охватывающей всю Вселенную. Вписывая эти многогранники друг в друга, Кеплер пытался построить теорию, предсказывающую размеры орбит планет Солнечной системы. Число и характеристики правильных многогранников могут быть предсказаны на основе теоремы Эйлера. Будем считать, что в каждой из В вершин сходятся q ребер. Тогда qB — 2Р, поскольку каждое ребро считается дважды. Если каждая из граней имеет р сторон, то 2Р — рГ. Таким образом qB = 2Р = р Г. Однако В _ Р _ Г _ В - Р+ Г _ 2 _ 4pq \/ч ~ 1/2 “ 1/р - 1/<? - 1/2+ 1/р “ 1/7 + 1/р — 1/2 ~ 2р + 2Ч - рЧ ^В= -------, Р = ----------, Г = ----------. 2р + 2q - pq 2р + 2q - pq 2р + 2q - pq Поскольку эти числа положительны, 2р+ 2? - р<1 > 0 => (р - 2)(? - 2) < 4. Произведение двух целых положительных чисел может быть меньше четырех, если сомножители равны соответственно 1 1; 2 1; 1 2; 3 • 1; 1 3. Это приводит к следующим парам {р, д} : {3,3} - тетраэдр, {4,3} - куб, {3 4} - октаэдр, {5,3} - додекаэдр, {3,5} - икосаэдр. 240
Эйлерова характеристика поверхности и теорема Пуанкаре. Теорема Эйлера справедлива для многогранников, поверхность ко- торых гомеоморфна сфере. Поэтому естественно считать, что величина Х = В-Р + Г, называемая эйлеровой характеристикой, отражает прежде всего свой- ства поверхности, а не каждого конкретного многогранника. Можно ожидать, что другие поверхности имеют другие эйлеровы характери- стики. В качестве примера найдем эту величину для тела, называемого сферой с ручкой (см. рис. 11). Рис. 11. Возпользуемся тем, что мы имеем дело с ’’резиновой” геометрией и тем, что эйлерова характеристика любого многогранника на поверхно- сти сферы равна двум. Пусть в основании ручек лежат треугольные или квадратные грани некоторого многогранника. Разобьем поверхность сферы с ручкой на поверхность двух тел: сфе- ры с двумя дырками и ручки, которая гомеоморфна боковой поверхно- сти призмы (см. рис. 11). Для сферы с двумя дырами число граней у соответствующего многогранника на 2 меньше, чем в том случае, ко- гда дыр нет Следовательно х = О У боковой поверхности вершины и ребра, лежащие в основании призмы, были уже учтены при подсчете эйлеровой характеристики многогранника на сфере. Таким образом, нужно учесть только новые ребра и столько же новых граней, но для них также В — Р + Г = 0, т. е. эйлерова характеристика сферы с ручкой равна нулю Такие же рассуждения показывают, что значение %Р для сферы с р ручками Хр = 2- 2р. С помощью более строгих рассуждений можно доказать, что эйле- рова характеристика является топологическим инвариантом. Замечательная поверхность, построенная Мебиусом, показывает, что эйлерова характеристика не обязательно является четным числом, и что само понятие поверхности является более глубоким и сложным, чем кажется на первый взгляд. Эта поверхность, называемая листом Мебиуса, получается после перекручивания листа прямоугольной формы, и склеивания противо- положных концов (см. рис. 12). При этом отрезок АВ склеивается (отождествляется с отрезком А'В* (сМ. рис 12)). Эта поверхность является односторонней Читатель может сделать модель этой поверх- ности Если закрашивать кольцо, начиная с некоторой точки, то за- крашенной окажется только одна часть — внешняя или внутренняя 241
Обычное бумажное кольцо имеет два края, каждый из которых гомео- морфен окружности. Напротив, лист Мебиуса будет закрашен целиком. Кроме того край этого листа гомеоморфен одной окружности. Рис. 12. Отожествляя отрезок АВ с отрезком А'В1, можно получить лист Мебиуса Односторонние поверхности обладают еше одним интересным свой- ством. которое позволяет дать другое определение односторонней по- верхности. Проведем нормаль из некоторой точки листа А и вокруг ее основания опишем небольшую окружность, на которой отметим напра- вление вращения. Пусть вращение, если смотреть из конца нормали, будет происходить против часовой стрелки. Будем перемещать точку А вдоль листа вместе с нормалью и окружностью. После обхода листа Мебиуса и возврата в исходное положение нор- маль будет направлена в противоположную сторону и направление вра- щения на окружности изменится на противоположное. Такие замкну- тые траектории, называются обходами, меняющими ориентацию. Если на поверхности таких обходов нет, то поверхность называется двусто- ронней или ориентируемой. Если есть, то односторонней или неори- ентируемой. Наличие такого объекта, как лист Мебиуса, позволяет строить необычные объекты. В самом деле, чтобы задать поверхность, нам надо было определить окрестность каждой точки. Должно быть ясно, куда мы будем попадать, двигаясь в различных направлениях по поверхности. Такую окрестность можно задать, не только непрерывно растягивая или сжимая некоторое исходное множество, но и склеивая или отождествляя различные точки или отрезки. Именно так и бы- ло сделано при построении листа Мебиуса. Эта операция не зависит от того, насколько хорошо удается представить этот объект, и от того, вкладывается ли он без самопересечений в трехмерное пространство. Заметим, что край листа Мебиуса гомеоморфен окружности. По- ступим следующим образом. Вырежем из сферы р кругов и заклеим их листами Мебиуса, отождествляя точки получившейся окружности с точками края листа Мебиуса. Понятно, что после такой операции мы получим замкнутую поверхность. Обозначим ее через Np. Нарисовав чертеж, можно убедиться, что эйлерова характеристика такой поверхности равна 2 - р. Это замкнутое множество не удается расположить в трехмерном пространстве без самопересечений. Одним иэ наиболее известных примеров обсуждаемых поверхностей является бутылка Клейна. Обозначим сферу с к ручками через Р* На первый взгляд, кажет- ся, что заклеивая в сфере дыры ручками, листами Мебиуса, сложным образом зацепляя их, можно получить самые разнообразные причудли- 242
вые поверхности. Кажется, что задача топологической классификации, т. е. перечисления всех попарно негомеоморфных замкнутых поверх- ностей таких, что любая замкнутая поверхность гомеоморфна одной из них, неразрешима. И тем более замечательным представляется результат, полученный Мебиусом и Жорданом в прошлом веке. Ими было доказано, что набор сфер с ручками Ро( А ••••.» дает полную топологическую классифи- кацию замкнутых ориентируемых поверхностей, а набор сфер с листа- ми Мебиуса Ni, Ws, • • • > • - — полную классификацию замкнутых неориентируемых поверхностей. Эти результаты непосредственно связаны с теорией динамических систем вида i = f(x, У) У = y(i.y). (2) в которых замкнутая поверхность может играть роль фазового про- странства Это пространство совсем не обязательно должно быть плос- костью. Вспомним математический маятник. В нем угловая перемен- ная определена с точностью до 2тг, а скорость ф определена однознач- но Следовательно точки (^>, ф) и (у? + 27гт, у>), т = ±1, ±2,... можно отождествить. При таком отождествлении фазовое пространство при- обретает вид трубы. Функции f(x, у),д(х, у) задают в фазовом пространстве G некоторое векторное поле. Это поле определяет в каждой точке поверхности G некоторый касательный вектор. С геометрической точки зрения это понятно. Если бы это было не так, то точка (z(<), y(t)), характеризую- щая состояние динамической системы, покидала бы поверхность G. Но тогда G не было бы фазовым пространством. Обратим внимание на особые точки динамической системы. В этих точках абсолютная величина вектора фазовой скорости v = (f(x,y), д(х,у)) стремится к нулю. Если рассмотреть направление этого век- тора w = t7/|v|, то окажется, что в регулярных точках эта функция непрерывно зависит от фазовых переменных х и у. В особых точках эта функция терпит разрыв. Это видно из рисунка, на котором пред- ставлены векторные поля в окрестности различных особых точек (см. рис. 13). 4 ♦ Рис. 13. Вектор и в окрестности различных особых точек Встает вопрос, можно ли построить на данной поверхности, напри- мер, на сфере, непрерывное поле направлений ш, т. е. в каждой точке определить касательный вектор так, чтобы при перемещении от точки к 243
точке он менялся непрерывно. Другими словами, определить векторное поле, т. е динамическую систему вида (2), которая не имела бы особых точек. Эту задачу иногда называют ’’задачей о еже”. Представим се- бе, что из каждой точки сферы проведен некоторый вектор-”колючка”. Спрашивается, можно ли так "причесать ежа”, чтобы ни одна ’’колюч- ка” не торчала перпендикулярно сфере. Спроектировав "колючку” на сферу, можно убедиться, что ответ был бы положительным, если бы существовало векторное поле на сфере, не имеющее особых точек. Решение этой проблемы было дано А. Пуанкаре. Обратимся к ри- сунку 14 Будем обходить каждую из нарисованных особых точек по замкнутому контуру против часовой стрелки. При обходе узла, фокуса или центра вектор повернется на 2т, при обходе седла на —2т, т. е. совершит один оборот в противоположном направлении. Будем узлу, фокусу и центру приписывать индекс ( + 1), седлу — (—1) А. Пуанкаре доказал следующее утверждение. Рис. 14. Чтобы определить индекс особой точки векторного поля, надо следить, как меняется при обходе вокруг этой точки направление вектора ш Пусть на замкнутой ориентируемой поверхности G задано поле ненулевых касательных векторов, непрерывное всюду кроме конечного числа особых точек. Тогда сумма индексов всех особых точек этого поля равна эйлеровой характеристике поверхности G — x(G). Отсюда сразу следует, что "причесать ежа” нельзя. Эйлерова ха- рактеристика сферы равна двум, т. е. векторное поле должно иметь на сфере, как минимум, две особые точки. Например, два узла (как на глобусе, на котором точка движется вдоль меридианов). Если мы хотим, чтобы поле имело седло, то надо добавить еще одну точку с индексом +1, например, фокус. И общее число точек станет равно че- тырем. Из этой теоремы следует, что можно "причесать колючий тор” — векторное поле на этой поверхности может не иметь ни одной особой точки. Ни на одной другой сфере с ручками такого поля не существует. При мягком моделировании биологических объектов, экологических систем, различных электронных схем у специалистов в этих областях часто есть интуитивные представления об изучаемой системе, о числе и характере состояний равновесия исследуемого объекта. Обращаясь к специалистам по математическому моделированию, они обычно просят отразить это в создаваемых моделях. И здесь теорема Пуанкаре часто играет принципиальную роль. Она дает своеобразное "правило запре- та”, показывающее, какие модели могут быть в принципе построены, а какие нет. Поясним основную идею доказательства теоремы Пуанкаре. Для этого проверим вначале, что сумма индексов двух любых векторных 244
полей, заданных на поверхности Gt одинакова, а потом вычислим ее для наиболее простого векторного поля. Предположим, что на ориентируемой поверхности G заданы два не- нулевых векторных поля vi(z,y) и v2(z,y), имеющие конечное число точек. Разобьем поверхность G на маленькие многоугольники так, что- бы в каждом многоугольнике было не более одной особой точки и чтобы эти точки не попадали на границу многоугольников (сМ. рис. 15). Рис. 15. Один иэ многогранников, на которые разбита поверхность G Отметим, что вдали от особых точек мы можем поворачивать векто- ры исследуемых векторных полей, оставляя сами поля непрерывными и не меняя сумму их индексов. Воспользовавшись этим, повернем век- торы поля ui(z,y) вблизи вершин построенных многоугольников так, чтобы в каждой вершине векторы vi(z,y) и v2(z,y) совпали (здесь че- рез V)(z, у) обозначено "модифицированное” поле vi(z,y)). Выберем на поверхности положительное направление отсчета углов. Например, против часовой стрелки, если смотреть с внешней стороны. Это можно сделать, поскольку поверхность G ориентируема. Возьмем какое-нибудь ребро многоугольника. Например, г1( соеди- няющее вершины А и В. Допустим, что мы при движении от А к В следим за некоторым вектором w, который совпадает с vi(z,y). Пред- положим, что на пути от В к А этот вектор совпадает с v2(z,y). При движении от А к В, а затем от В к А вектор ш совершит целое число оборотов. Это следует из построения векторного поля vi(z,y) — иДЛ) = v2(A), vi (В) = v2(B). Обозначим число оборотов вектора и при движении вдоль ребра и через На рисунке 15, к примеру, d(n) = 1, J(r2) = 0, </(гэ) = —1. Заметим, что если бы мы обходили ребро г2 в противоположном направлении от В к А и назад к В, то величина d(ri) изменила бы знак. Рассмотрим один из построенных многоугольников М. Будем обхо- дить его в положительном направлении Пусть при этом вектор U](z, у) совершит ri(Af) оборотов. Обойдем теперь контур в противоположной направлении. Пусть при Этом вектор v2(z,y) совершит z2(Af) оборотов. Естественно, z\ и z2 — целые числа, поскольку рассматриваемые век- торы после обхода по замкнутому контуру возвращаются в исходное положение. 245
В результате вектор J совершит z\ (М) — Zi(M) оборотов. Вместе с тем, рассматривая движение вдоль отдельных ребер, можно убедиться, что z1(Af)-z2(A/)=d(r1) + ... + d(rt). (3) В самом деле, и получая величины z\ и z21 и получая значения d(r^) мы обходили каждое ребро один раз в положительном направлении, следя за vi(г, у), и один раз в противоположном, следя за v2(z, у) Рис. 16. При обходе многоугольников Л/j и Л/з против часовой стрелки ребро т$ обходится дважды, причем в противоположных направлениях Просуммируем теперь формулу (3) по всем многоугольникам, на ко- торые разбита поверхность G. Тогда правая часть обратится в ноль. Причина этого понятна из рисунка 16. Ребро гл, к примеру, встретится в этой сумме дважды, поскольку к нему примыкают два многоуголь- ника Mi и Mi. Заметим, что при обходе этих многоугольников против часовой стрелки ребро г, будет обходиться в различных направлени- ях. При обходе Mi это даст с/(гД при обходе Л/2 — — d(ra). То же справедливо для любого другого ребра. Следовательно £z,(A/t)-^z2(A/t) = 0. t к (4) Однако z\(Mt) определяется суммой индексов векторного поля V] (г, у) (и, следовательно, Vi (г, у)). Причину этого поясняет следующее рассуждение. Пусть внутри многоугольника М находится особая точка zq (см. рис. 17). Построим систему близких друг к другу замкнутых линий так, как показано на рисунке. Пусть одно из них совпадает с малень- кой окружностью с центром в точке zo, а другая с контуром много- угольника М. При переходе от одной линии к близкой ей, как следует из соображений непрерывности, число оборотов вектора vi(x,y) долж- но меняться мало. Однако число оборотов является целым, на малую величину измениться оно не может и, следовательно, остается посто- янным. Но при обходе малой окружности с центром в точке zq мы получим индекс этой точки. При обходе вдоль контура многогранника — величину zi(A/). Следовательно обе эти величины равны. Тогда из формулы (4) следует, что сумма индексов векторных полей vj (z, у) и v2(z,y) (а 'значит и других полей на поверхности G) одинакова Выберем теперь векторное поле, сумму индексов для которого легко посчитать. Для этого разобьем поверхность G на многоугольники. В середине каждого многоугольника расположим узел (см. рис. 18а), в середине каждого ребра — седло (рис. 186), в каждой вершине тоже 246
Рис. 17. Построив систему замкнутых линий, можно убедиться, что угол поворота вектора ш при обходе вдоль контура определяется индексом особой точки внутри многоугольника узел (рис. 18в). Характерная картина такого векторного поля предста- влена на рисунке 19. Его индекс равен (+1)В + (-1)Р + (+1 )Г = х(О Рис. 18. Особые точки векторного поля, индекс которого легко вычислить: а) вершина; б) середина ребра; в) середина грани Рис. 19 Характерный вид построенного векторного поля Таким образом существует замечательная связь между топологи- ческими свойствами фазового пространства G и векторными полями, которые на этой поверхности могут быть построены. 247
Вычислительный эксперимент, молекулярный дизайн и топологические методы Традиционный подход математического моделирования к пробле- мам естествознания связан с выделением наиболее важных черт раз- личных объектов и явлений и их описанием. Однако все большее зна- чение приобретает в последнее время и другой класс задач, в которых следует предсказать свойства не существующих в природе или пока не найденных объектов. Такая ситуация возникает, например, при разра- ботке новых композитных материалов, компьютерном проектировании лекарств, создании новых электронных приборов. Кроме того во многих случаях мы располагаем гигантской инфор- мацией. Банки данных белков, различных химических соединений, кос- мические снимки, данные с метеорологических и сейсмических станций и т.д. Существует огромная избыточность многих информационных ре- сурсов. При ответе на конкретный вопрос обычно требуется ничтожная часть всей имеющейся информации. Чтобы выделить ее, часто требует- ся найти своеобразные параметры порядка в информационном массиве. Топологические методы в таких задачах могут играть важную роль. Они приводят к необычному подходу, к математическому моделирова- нию, связанному с новыми возможностями натурного и вычислитель- ного эксперимента. Одним из крупных открытий в современной химии стало откры- тие класса соединений, называемых фуллеренами, которые обладают многими замечательными свойствами. Автор оригинальных "научных фантазий", которые публиковались в журнале "New Scientist" Дэвид Джоунс в 1966 году обратил внимание на любопытную закономерность. Существует разрыв между плотностями газов (порядка 0,001 г/смэ) и плотностями жидкостей и твердых тел (от 0,5 до 25 г/см3). Вещества с промежуточными плотностями в физических справоч- никах отсутствуют. Этот промежуток, по мнению Джоунса, могли бы заполнить так называемые "полые молекулы” — некоторые полимер- ные молекулы, которые могут иметь сферическую или более сложную форму. Естественным кандидатом на роль материала для таких молекул является углерод. Если атом углерода связан с четырьмя такими же атомами, то получается трехмерная решетка, характерная для алмаза. Если соседей двое, то получаются линейные конструкции, характер- ные для полимерных молекул. Если есть три ближайших соседа, то атомы могут лежать в вершинах правильных шестиугольников, запол- няющих плоскость. Такое расположение возникает в кристаллах гра- фита. Спросим себя, можно ли, имея в распоряжении только атомы углерода, сконструировать некоторые пространственные многогранни- ки. Будем полагать, что. так же как в графите, каждый атом имеет три ближайших соседа. Предположим, что желаемый многогранник имеет только шести- гранные ячейки, число которых равно Пб Тогда число граней Г = не, вершин — В = 6лб/3, ребер Р = 6пб/2. Воспользуемся теоремой Эй- лера. Для этого многогранника у = В + Г - Р = 0, то есть поверх- ность такого многогранника гомеоморфна сфере с одной ручкой или тору. Мне не доводилось читать сообщений об углеродных структурах тороидальной формы. Однако с помощью квантомеханических расчетов интересно было бы выяснить принципиальную возможность существо- вания таких конфигураций. 248
Итак для построения "полых молекул" с поверхностью, гомеоморф- ной сфере, одних шестиугольных граней недостаточно. Предположим, что у нас есть еще пятиугольных и п? семиугольных граней. Роль вершин будут играть атомы, ребер — валентные связи. В этом случае, используя теорему Эйлера (см. задачи) можно проверить, что п5 - п7 = 12. Самое замечательное состоит в том, что простейшая конструкция та- кого типа очень часто попадается нам на глаза. Это обычный футболь- ный мяч, сшитый из 12 правильных пятиугольников и 20 правильных шестиугольников (см. рис. 20а). Рис. 20. а) многогранник, определяющий структуру фуллерена Сбо; б) структура /7-циклодекстрина. Эта конфигурация очень красива. Однако после того как она ’’скон- струирована”, следует проверить, стоит ли искать ее в натурном экс- перименте. Для этого существует вычислительный эксперимент и мно- гочисленные программы для расчета молекул. В одних из них атомы заменяются шариками, а валентные связи — пружинками, в других вво- дятся элементы квантомеханического описания. С помощью этих про- грамм можно выяснить, насколько энергетически выгодна такая кон- фигурация и имеет ли она право на существование. Такая методика работы получает очень широкое распространение. В частности, широ- ко используется компьютерное проектирование лекарств. Прежде чем синтезировать сложные химические соединения очень желательно знать о них достаточно много. Еще в большей степени это относится к био- технологии, где ищутся и культивируются микроорганизмы, способные производить нужные нам вещества. Итак молекула Сбо оказалась устойчивой. Оказалось, что таких молекул достаточно много в природе. Они встречаются в газовой саже, свежем нагаре и т.д. Это вещество было названо в честь американ- ского архитектора и инженера Бакминстера Фуллера, разработавшего конструкции ячеистых куполов, бакминстерфуллереном. Эту молеку- лу называют для краткости бакиболом или футболино. Удивительная геометрическая структура приводит к замечательным физическим свойствам. Эти молекулы обладают очень большой проч- 249
ностью: они не разрушаются, даже сталкиваясь с преградой со скоро- стью 104 м/сек. Это позволяет использовать их в качестве смазки. С другой стороны, их пустотелость дает возможность с помощью фулле- ренов (соединений со структурной формулой Сцс) упаковать отдельные атомы или молекулы, что может иметь принципиальное значение для микробиологии и медицины. Замечательными свойствами обладают и соединения фуллеренов. Например, фуллерит А'зСво и другие соедине- ния оказались высокотемпературными сверхпроводниками. Более того, выяснилось, что выращивание фуллеренов может быть исключительно эффективным и дешевым, если испарять графит в гелиевой атмосфере. Процесс изменения топологии молекул может играть весьма боль- шую роль и для более сложных органических веществ, которые уча- ствуют в биохимических процессах. Сотрудник Уфимского Института биологии РАН Н.Г. Усанов обратил мое внимание на штаммы микроор- ганизмов, занимающихся изменением топологии. Оказалось, что суще- ствуют бактерии, превращающие обычные линейные молекулы крахма- ла в своеобразные "клубки", напоминающие по форме торы и состоящие из нескольких сотен атомов - циклодекстрины (см. рис. 206). В них также можно "упаковывать" различные молекулы, заставляя растворяться вещества, которые были нерастворимы без этой процеду- ры. С их помощью можно придавать различным объектам желаемые запахи. За последние годы в мире было получено более 4000 патен- тов, связанных с различными технологиями, использующими цикло- декстрин. Исследования Н.Г. Усанова показали, что участие цикло- декстрина в обычных реакциях "из школьного учебника” может кар- динально повлиять на их ход. В последние годы появились также вес- кие основания считать, что циклодекстрины и их аналоги не являются столь уж большой экзотикой и природа использует их во многих своих конструкциях. Прямой органический синтез циклодекстринов является сложным и дорогим. Поэтому ищут и отбирают микроорганизмы, которые могут превращать обычный крахмал в циклодекстрин. Для чего же самим бактериям заниматься изменением топологии, производя циклодекстри- ны? Обсуждаются две гипотезы. В соответствии с первой, это нужно определенным штаммам, чтобы запасти питание, создав своеобразные "консервы”, которые непригодны для конкурентов. В соответствии с другой, это нужно, чтобы с помощью циклодекстринов изменить рас- творимость ряда веществ, участвующих в жизненном цикле бактерий. Однако поиск микроорганизмов, производящих аналоги циклодекс- тринов и родственные объекты, требует больших усилий. Поэтому вновь приходится прибегать к математическому моделированию. Оце- нивать с помощью компьютера устойчивость молекул, производители которых ищутся, моделировать химические реакции, в которые созда- ваемые соединения должны вступать в рамках той или иной технологии. Есть еще одна важная область прикладных исследований, где то- пологические методы приводят к важным результатам. В настоящее время открыто и описано более 7 миллионов химических соединений. Как на этой основе предсказывать свойства еще не созданных веществ? Как прогнозировать характеристики уже известных объектов, не про- водя многочисленных и дорогих экспериментов? Возможен следующий подход. Молекула рассматривается как неко- торый граф. При этом игнорируется трехмерная форма молекул, ве- личины углов между химическими связями и множество других харак- теристик. Вводятся некоторые топологические индексы, отражающие, 250
например, со сколькими атомами связан каждый атом данной молеку- лы, образуют ли они линейные цепи или разветвленные структуры. Простейший индекс, связанный с топологическим инвариантом "хи- мического графа", был известен давно. Если рассматривать углеводо- роды, т. е. соединения, состоящие только из углерода и водорода, то можно считать, что граф составляют только атомы углерода (вершины) и связи между ними (ребра). Простейший инвариант — число вершин. Он известен в химии как углеродное число и действительно связан с рядом физических характеристик углеводородов. Однако анализ разветвленных молекул требует более сложных то- пологических параметров. Один из них — индекс Винера. В теории графов иногда используют понятие топологического расстояния между вершинами. Это число ребер, связывающих кратчайшим путем эти вер- шины. Для молекулы индекс Винера равен сумме топологических рас- стояний между всеми парами атомов ее углеродного скелета. Оказыва- ется, зная индекс Винера, можно весьма точно определить температуру кипения для большого класса соединений. Ряд топологических индексов позволяет прогнозировать такие ха- рактеристики как температура плавления, октановое число, выход са- жи при неполном сгорании углеводородов. Некоторые из индексов уда- лось связать с проявлением физиологической активности молекул, — с их запахом, токсичностью, способностью подавлять рост ряда бак- терий и степенью канцерогенности. "Молекулярная топология" оказа- лась эффективным путем упрощения анализа изучаемых объектов, что является очень важным при математическом моделировании. Вопросы и задачи 1. Доказать, что произвольное непрерывное отображение f окруж- ности в прямую переводит некоторую пару диаметрально проти- воположных точек в одну. 2. Доказать, что нелинейное алгебраическое уравнение нечетной сте- пени /(х) = в2п+1Х2п+1 + а2пх2п + ... + ао = О, <>2п+1 / 0 имеет хотя бы один действительный корень. 3. К специалисту по математическому моделированию обратились с просьбой сконструировать динамическую систему со следующими свойствами z = у = д(х.у), у) = f(z + а, у), д(х, у) = д(х + а, у), /(г. у) = Я*. У + Ъ), д(х, у) = д(х, у + Ъ). При этом система должна обладать "триггерными свойствами", - иметь два устойчивых узла и седло и не иметь других особых то- чек. Пожалуйста, сконструируйте такую систему, либо докажите, что это невозможно. 251
4. Один из простейших многоклеточных организмов — водоросль "вольвокс1’ — представляет собой сферическую оболочку, сложен- ную из пятиугольных, шестиугольных и семиугольных клеток. В каждой вершине этого тела сходятся 3 клетки. Биологи заметили, что пятиугольных клеток ровно на 12 больше, чем семиугольных. Почему? 5. Можно ли десять городов соединить между собой непересекающи- мися дорогами так, чтобы из каждого города выходило пять дорог, входящих в пять других городов? 6. Доказать, что у любого выпуклого многогранника найдутся две грани с одинаковым числом ребер. 7 Доказать, что не существует многогранника, у которого к каждой вершине и к каждой грани примыкает не менее, чем по четыре ребра. 8. На тарелке лежат два блина неправильной формы. Можно ли одним взмахом ножа разрезать их на две равновеликие (имеющие одинаковую площадь) части? 9. Можно ли разрезать блин на плоскости на четыре равные части двумя перпендикулярными прямыми? 10. Одним из первых результатов проективной геометрии, получен- ных в XVII веке, стало следующее утверждение. Пусть на плос- кости расположены треугольники ЛВС и А'В'С' так, что пря- мые АА', ВВ' ,СС пересекаются в одной точке. Обозначем через Р, О. R точки пересечения прямых АВ и Л'В', АС и Л'С', ВС и В'С' соответственно. Требуется доказать, что точки Р, Q и R ле- жат на одной прямой. И. Каждая точка окружности является черной или белой. Дока- зать, что найдется равнобедренный треугольник, вершины кото- рого имеют одинаковый цвет. 12. Три башни замка расположены в вершинах треугольника АВС. Четвертая башня — в точке О внутри треугольника. Крепостные стены идут вдоль отрезков АВ, ВС, АС, АО, ВО, СО. Можно ли осмотреть весь замок (т. е. пройти по всем крепостным стенам и посетить все башни), не проходя ни по одной крепостной стене дважды? 13. Можно ли накрыть всю плоскость конечным числом внутренно- стей парабол? 14. На плоскости проведено п прямых линий. Доказать, что области, на которые эти прямые разбивают плоскость, можно закрасить двумя красками так, что никакие две соседние области ( которые соприкасаются по отрезку прямой) не будут закрашены одной и той же краской. 15. Склеим ленту Мебиуса, а потом разрежем ее вдоль средней линии. Будет ли получившаяся поверхность неориентируемой? 252
16. Докажите, что у произвольного непрерывного отображения кру- га в себя найдется хотя бы одна неподвижная точка. (Указание. Обратите внимание на аналогию этой задачи с проблемой "приче- сывания" сферы или тора.) 17. Внутри остроугольного треугольника АВС найти точку Ot чтобы сумма длин отрезков ОЛ, ОВ, ОС была минимальной. (Указание. Обратите внимание на близкие проблемы, возникающие в связи с мыльными пленками, минимальными поверхностями и т. д.) 18. Населенные пункты Л,В,С, D находятся в вершинах квадрата. Какова система дорог минимальной протяженности, соединяющая Л, В, С, D (так, чтобы из каждого населенного пункта можно было бы проехать в каждый)? Можно ли обобщить, по вашему мнению, этот результат на систему из п населенных пунктов Л1,..., Лп? Ка- кими вычислительными алгоритмами вы бы посоветовали пользо- ваться в этом случае? (Указание. Обратите внимание на резуль- тат предыдущей задачи.) 19. Склеим лист Мебиуса из бумажной ленты. Будем уменьшать дли- ну ленты до тех пор, пока это возможно. Какая фигура возникнет в конце концов? 20. Можно ли так соединить три кольца, чтобы все они были связаны вместе, однако каждое из них не было бы сцеплено с другим? 21. Представим себе сферу с двумя ручками, продетыми одна в дру- гую. Не противоречит ли существование такой фигуры сформу- лированной теореме о классификации ориентируемых двумерных поверхностей? 22. Возьмите кофту, имеющую петли и пуговицы, карандаш и нитку. Сделайте из нитки петлю меньшую, чем половина длины каран- даша. Проденьте эту нитку в петлю кофты, а затем проденьте в ниточную петлю карандаш и потом жестко закрепите нитку вбли- зи конца карандаша (обычно бывает удобно сделать бороздку на карандаше и обвязать). В результате этой операции карандаш бу- дет прикреплен к кофте. Можно ли вынуть его, не ломая и не разрывая нитку? 23. Равносторонний треугольник разбит на конечное число треуголь- ников. Доказать, что хотя бы у одного из них все углы не превос- ходят 120°. 24. Расскрашивая карту Великобритании, английский студент в про- шлом веке заметил, что для раскраски, при которой соседние графства (имеющие общую границу) раскрашены в разные цвета, достаточно четырех красок. Это наблюдение положило начало большому циклу работ, связанных с анализом проблемы четырех красок. Постройте пример, показывающий, что для карты, нари- сованной на поверхности тора четырех красок будет недостаточно. 25. Три вершины графа А, ВtC находятся в вершинах треугольни- ка АВС. Вершины Е и F концы отрезка, находящегося внутри треугольника АВС. Ребра графа связывают каждую вершину с каждой. Можно ли расположить этот граф на плоскости таким образом, чтобы его ребра не пересекались? 253
26. Вписать в данный остроугольный треугольник треугольник мини- мального периметра. (Указание. Ключ к решению может дать * теорема Ферма и законы геометрической оптики.) Рекомендуемая литература Основные понятия топологии на элементарном уровне обсуждаются в кни- гах: Болтянский В.Г., Ефремович В.А. Наглядная топология. М.: Наука, 1982; Стинрод И., Чинн У. Первые понятия топологии. М.: Мир, 1967; К оке тер Г.С.М. Введение в геометрию. М.: Наука, 1966. Более серьезный курс, рассматривающий реализацию топологческой ча- сти программы А.Пуанкаре, см. в книге: Борисевич Ю Г., Близняков Н.М., Израилевич Я.А., Фоменко Т.Н. Введение в топологию. М.: Высшая школа, 1980. Примеры использования топологических методов в анализе динамических систем приводятся в книгах: Баутин Н.Н., Леонтович Е.А. Методы и прие- мы качественного исследования динамических систем на плоскости. М.: На- ука, 1976; Арнольд В.И. Дополнительные главы теории обыкновенных диф- ференциальных уравнений. М.: Наука, 1978. Открытие фуллеренов и использование топологических методов в "проекти- ровании” новых веществ обсуждаются в работах: Джоунс Д. Изобретения Дедала. М.: Мир, 1985; Тиходеее С. Конструкции из углерода//Квант. 1993. Nl/2. С. 15-25; Рувре Д.Г. Химию прогнозирует топология//В мире науки. 1986. Nil. С.14-22.
ОГЛАВЛЕНИЕ Предисловие....................................... 3 Глава 1. Математическое моделирование в современном ми- ре и нелинейные явления........................... 7 Глава 2. Линейные математические модели.......... 19 Глава 3. Простейшие нелинейные модели............ 39 Глава 4. Аттракторы уравнения х = v(z)........... 67 Глава 5. Элементы теории бифуркаций.............. 95 Глава 6. Идеи теории катастроф.................. 119 Глава 7. Простейшие системы с дискретным временем .. 163 Глава 8. Автоколебания и предельные циклы....... 189 Глава 9. Топологические методы в исследовании нелинейных систем.......................................... 229