Text
                    В. И. Арнольд
ГЕОМЕТРИЧЕСКИЕ МЕТОДЫ
В ТЕОРИИ
ОБЫКНОВЕННЫХ
ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ
Издание второе, исправленное и дополненное
Редакция журнала
«Регулярная и хаотическая динамика»
МЦНМО, ВКМ НМУ
1999


УДК 517.2 ББК 22.161.6 А 84 А 84 Арнольд В. И. Геометрические методы в теории обыкновенных дифференци- дифференциальных уравнений. — Ижевск: Ижевская республиканская ти- типография. 2000. — 400 с. В книге изложен ряд основных идей и методов, применяемых для исследования обыкновенных дифференциальных уравнений. Эле- Элементарные методы интегрирования рассматриваются с точки зрения общематематических понятий (разрешение особенностей, группы Ли симметрии, диаграммы Ньютона и т.д.). Теория уравнений с част- частными производными первого порядка изложена на основе геометрии контактной структуры. В книгу включены классические и современные результаты те- теории динамических систем: структурная устойчивость, У-системы, аналитические методы локальной теории в окрестности особой точки или периодического решения (нормальные формы Пуанкаре), теория бифуркации фазовых портретов при изменении параметров (мягкое и жесткое возбуждение автоколебаний при потере устойчивости), удво- удвоение периода Фейгенбаума, теорема Дюлака и др. Книга рассчитана на широкий круг математиков и физиков — от студентов до преподавателей и научных работников. ISBN 5-89806-028-4 ББК 22.161.6 @ Редакция журнала «Регулярная и хаотическая динамика», 2000
Содержание Предисловие 5 Некоторые используемые обозначения 9 Глава 1. Специальные уравнения 11 § 1. Дифференциальные уравнения, инвариантные относи- относительно групп симметрии 11 § 2. Разрешение особенностей дифференциальных уравнений 19 § 3. Уравнения, не разрешенные относительно производных . 25 § 4. Нормальная форма уравнения, не разрешенного относи- относительно производной, в окрестности регулярной особой точки 37 § 5. Стационарное уравнение Шредингера 44 § 6. Геометрия дифференциального уравнения второго поряд- порядка и геометрия пары полей направлений в трехмерном пространстве 57 Глава 2. Уравнения с частными производными первого по- порядка 75 § 7. Линейные и квазилинейные уравнения с частными про- производными первого порядка 75 § 8. Нелинейное уравнение с частными производными перво- первого порядка 85 § 9. Теорема Фробениуса 104 Глава 3. Структурная устойчивость 108 § 10. Понятие структурной устойчивости 109 § 11. Дифференциальные уравнения на торе 117 § 12. Аналитическое приведение к повороту аналитических диффеоморфизмов окружности 136 § 13. Введение в гиперболическую теорию 144 § 14. У-системы 151 § 15. Структурно устойчивые системы не всюду плотны . . . 166
4 Содержание Глава 4. Теория возмущений 169 § 16. Метод усреднения 170 § 17. Усреднение в одночастотных системах 174 § 18. Усреднение в многочастотных системах 179 § 19. Усреднение в гамильтоновых системах 192 § 20. Адиабатические инварианты 196 § 21. Усреднение в слоении Зейферта 202 Глава 5. Нормальные формы 209 § 22. Формальное приведение к линейной нормальной форме . 209 § 23. Резонансный случай 213 § 24. Области Пуанкаре и Зигеля 217 § 25. Нормальная форма отображения в окрестности непо- неподвижной точки 223 § 26. Нормальная форма уравнения с периодическими коэффи- коэффициентами 226 § 27. Нормальная форма окрестности эллиптической кривой . 235 § 28. Доказательство теоремы Зигеля 250 Глава 6. Локальная теория бифуркаций 258 § 29. Семейства и деформации 258 § 30. Матрицы, зависящие от параметров, и особенности дек- декремент-диаграмм 276 §31. Бифуркации особых точек векторного поля 301 § 32. Версальные деформации фазовых портретов 307 § 33. Потеря устойчивости положения равновесия 312 § 34. Потеря устойчивости автоколебаний 330 § 35. Версальные деформации эквивариантных векторных по- полей на плоскости 349 § 36. Перестройки топологии при резонансах 372 § 37. Классификация особых точек 388 Образцы экзаменационных задач 394
Предисловие Основное открытие Ньютона, то, которое он счел нужным засекре- засекретить и опубликовал лишь в виде анаграммы, состоит в следующем: «Data aequatione quotcunque fluentes quantitae involvente fiuxiones invenire et vice versa». В переводе на современный математический язык это означает: «Полезно решать дифференциальные уравнения». В настоящее время теория дифференциальных уравнений пред- представляет собой трудно обозримый конгломерат большого количества разнообразных идей и методов, в высшей степени полезный для все- всевозможных приложений и постоянно стимулирующий теоретические исследования во всех отделах математики. Большая часть путей, связывающих абстрактные математические теории с естественнонаучными приложениями, проходит через диф- дифференциальные уравнения. Многие разделы теории дифференциальных уравнений настолько разрослись, что стали самостоятельными наука- науками; проблемы теории дифференциальных уравнений имели большое значение для возникновения таких наук, как линейная алгебра, теория групп Ли, функциональный анализ, квантовая механика и т. д. Таким образом, дифференциальные уравнения лежат в основе естественно- естественнонаучного математического мировоззрения. При отборе материала для настоящей книги автор старался изло- изложить основные идеи и методы, применяемые для изучения дифферен- дифференциальных уравнений. Особые усилия были приложены к тому, чтобы основные идеи, как правило простые и наглядные, не загромождались техническими деталями. С наибольшей подробностью рассматривают- рассматриваются наиболее фундаментальные и простые вопросы, в то время как из- изложение более специальных и трудных частей теории носит характер обзора. Книга начинается с исследования некоторых специальных диффе- дифференциальных уравнений, интегрируемых в квадратурах. При этом ос- основное внимание уделяется не формально-рецептурной стороне элемен- элементарной теории интегрирования, а ее связям с общематематическими идеями, методами и понятиями (разрешение особенностей, группы Ли,
6 Предисловие диаграммы Ньютона), с одной стороны, и естественнонаучным прило- приложениям — с другой. Теория уравнении с частными производными первого порядка рас- рассматривается при помощи естественной контактной структуры в мно- многообразии 1-струй функций. Попутно излагаются необходимые элемен- элементы геометрии контактных структур, делающие всю теорию независи- независимой от других источников. Значительную часть книги занимают методы, обычно называе- называемые качественными. Современное развитие основанной А. Пуанкаре качественной теории дифференциальных уравнений привело к пони- пониманию того, что, подобно тому, как явное интегрирование диффе- дифференциальных уравнений, вообще говоря, невозможно, невозможным оказывается и качественное исследование сколько-нибудь общих диф- дифференциальных уравнений с многомерным фазовым пространством. В книге обсуждается анализ дифференциальных уравнений с точки зрения структурной устойчивости, то есть устойчивости качествен- качественной картины по отношению к малым изменениям дифференциальных уравнений. Изложены основные результаты, полученные после первых работ А.А.Андронова и Л. С. Понтрягина в этой области: начала тео- теории структурно устойчивых У-систем Аносова, все траектории кото- которых экспоненциально неустойчивы, и теорема Смейла о неплотности множества структурно устойчивых систем. Обсуждается также вопрос о значении этих математических открытий для приложений (речь идет об описании устойчивых хаотических режимов движения, вроде тур- турбулентных). К наиболее мощным и часто применяемым методам исследова- исследования дифференциальных уравнений относятся различные асимптоти- асимптотические методы. В книге изложены основные идеи метода усреднения, восходящего к работам основоположников небесной механики и ши- широко используемого во всех областях приложений, где нужно отде- отделить медленную эволюцию от быстрых осцилляции (Н.Н.Боголюбов, Ю. А. Митропольский и др.). Несмотря на обилие исследований по усреднению, в вопросе об эво- эволюции даже для простейших многочастотных систем далеко не все яс- ясно. В книге дается обзор работ о прохождении резонансов и о захвате в резонанс, направленных к выяснению этого вопроса. Основой метода усреднения является идея уничтожения возмуще- возмущений посредством подходящего выбора системы координат. Эта же идея
Предисловие 7 лежит в основе теории нормальных форм Пуанкаре. Метод нормаль- нормальных форм является основным методом локальной теории дифференци- дифференциальных уравнений, описывающей поведение фазовых кривых в окрест- окрестности особой точки или замкнутой фазовой кривой. В книге изложены основы метода нормальных форм Пуанкаре, включая доказательство фундаментальной теоремы Зигеля о линеаризации голоморфного ото- отображения. Важные применения метод нормальных форм Пуанкаре находит не только при исследовании отдельного дифференциального уравнения, но и в теории бифуркаций, когда предметом изучения является семейство уравнений, зависящих от параметров. Теория бифуркаций изучает изменения качественной картины при изменении параметров, от которых зависит система. При общих значе- значениях параметров обычно приходится иметь дело с системами общего положения (все особые точки простые и т.д.). Однако, если система зависит от параметров, то при некоторых значениях параметров неиз- неизбежно встречаются вырождения (например, слияние двух особых точек векторного поля). В однопараметрическом семействе общего положения встречаются лишь простейшие вырождения (те, от которых нельзя избавиться ма- малым шевелением семейства). Таким образом возникает иерархия вы- вырождений по коразмерностям соответствующих поверхностей в функ- функциональном пространстве всех изучаемых систем: в однопараметри- ческих семействах общего положения встречаются лишь вырождения, соответствующие поверхностям коразмерности один, и т. д. В последние годы в теории бифуркаций наблюдается значитель- значительный прогресс, связанный с применением идей и методов общей теории особенностей дифференцируемых отображений X. Уитни. Книга заканчивается главой о теории бифуркаций, в которой при- применяются развитые в предыдущих главах методы и описаны резуль- результаты, полученные в этой области, начиная с основополагающих работ А.Пуанкаре и А.А.Андронова. При изложении всех вопросов автор стремился избежать аксиома- аксиоматически-дедуктивного стиля, характерным признаком которого явля- являются немотивированные определения, скрывающие фундаментальные идеи и методы; подобно притчам, их разъясняют лишь ученикам на- наедине.
Предисловие Продолжающаяся, как утверждают, уже более 50 лет аксиоматиза- аксиоматизация и алгебраизация математики привела к неудобочитаемости столь большого числа математических текстов, что стала реальностью всег- всегда угрожающая математике угроза полной утраты контакта с физикой и естественными науками. Автор старался вести изложение таким об- образом, чтобы книгой могли пользоваться не только математики, но все потребители теории дифференциальных уравнений. У читателя настоящей книги предполагаются лишь очень неболь- небольшие общематематические представления в объеме примерно первых двух курсов университетской программы; достаточно (но не необходи- необходимо), например, знакомство с учебником В.И.Арнольда «Обыкновенные дифференциальные уравнения», М., 1974.* Изложение построено таким образом, чтобы читатель мог пропус- пропускать места, оказавшиеся для него трудными, без большого ущерба для понимания дальнейшего: были приняты меры к тому, чтобы по возмож- возможности избегать ссылок из главы в главу и даже из параграфа в параграф. Содержание настоящей книги составил материал ряда обязатель- обязательных и специальных курсов, читавшихся автором на механико-матема- механико-математическом факультете МГУ в 1970-1976 годах для студентов-математи- студентов-математиков П-Ш курсов, для слушателей факультета повышения квалифика- квалификации и на экспериментальном потоке математиков естественнонаучного профиля. Автор выражает благодарность студентам О. Е. Хадину, А. К. Ко- вальджи, Е. М. Кагановой и доц. Ю. С. Ильяшенко, чьи конспекты были очень полезными при подготовке этой книги. Составленный Ю. С. Ильяшенко конспект специального курса, а также конспекты лек- лекций на экспериментальном потоке в течение ряда лет находились в библиотеке факультета. Автор благодарен многочисленным читате- читателям и слушателям этих курсов за ряд ценных замечаний, использован- использованных при подготовке книги. Автор благодарен рецензентам Д. В. Аносову и В.А.Плиссу за тщательное рецензирование рукописи, способствовав- способствовавшее ее улучшению. Июнь 1977 г. В. Арнольд 1При изложении нескольких отдельных вопросов используются или упоминают- упоминаются также самые первоначальные сведения о дифференциальных формах, группах Ли и функциях комплексного переменного. Для понимания большей части книги знакомство с этими сведениями не обязательно.
Некоторые используемые обозначения К — множество всех вещественных чисел. С — множество всех комплексных чисел. Z — множество всех целых чисел. W1 — n-мерное вещественное линейное пространство. 3 — существует. V — для всякого. a G А — элемент а множества А. А С В — подмножество А множества В. А Г) В — пересечение (общая часть) множеств А и В. Аи В — объединение множеств А и В. А\ В — разность множеств А и В (часть А вне В). А х В — прямое произведение множеств А и В (множество пар (а, b), a G А, Ъ G В). А® В — прямая сумма линейных пространств. /: А —» В — отображение / из А в В. ж i->- у или у = /(ж) — отображение / переводит элемент ж в эле- элемент у. Im/ или f(A) — образ отображения / (но Im z — мнимая часть z). f~1{y) — полный прообраз точки у при отображении / (множество всех ж, для которых /(ж) = у). Кег/ — ядро линейного оператора / (полный прообраз нуля). / — скорость изменения функции / (производная по времени t). /', /*, -/-, —/- — производная отображения /. ах их ТХМ — касательное пространство к многообразию М в точке ж. А => В — из утверждения А следует В. А Ф> В — утверждения А и В равносильны. ш\ Лоо2 — внешнее произведение дифференциальных форм ш\ и оо2- fog — суперпозиция отображений ((/ о g)(x) = f(g(x))). Lvf — производная функции / по направлению векторного поля v.
10 Некоторые используемые обозначения Пусть (xi, ... , хп) — координатные функции. Вектор v задается тогда своими компонентами v\, ... , vn. Производная по направлению поля v задается формулой Lvf = V!- Ь ... + v I . . . | ип ОХ\ ОХп При фиксированной системе координат (х±, ... , хп) используются следующие обозначения: dxk — функция от вектора, равная его fc-й компоненте. т^— — векторное поле, fc-я компонента которого равна 1, а осталь- ные компоненты равны нулю. Для дифференциального уравнения х = v(x) область определения правой части называется фазовым пространством, точка х называется фазовой точкой, вектор v(x) называется вектором фазовой скорости, v называется векторным полем фазовой скорости. Если х = (p(t) — решение уравнения, то образ отображения ip называется фазовой кривой, а график отображения ip — интегральной кривой. Для дифференциального уравнения х = v(x, t) область опреде- определения правой части называется расширенным фазовым пространст- пространством; v задает в расширенном фазовом пространстве поле направлений; если х = ip(t) — решение, то график отображения ip называется интег- интегральной кривой.
Глава 1 Специальные уравнения При исследовании дифференциальных уравнений применяются ме- методы всех отделов математики. В настоящей главе обсуждаются отдель- отдельные специальные уравнения и типы уравнений. Особое внимание обра- обращается, с одной стороны, на значение рассматриваемых уравнений для приложений и с другой — на связи методов исследования с различными общематематическими вопросами (разрешение особенностей, диаграм- диаграммы Ньютона, группы Ли симметрии и т.д.). Глава заканчивается эле- элементарной теорией стационарного одномерного уравнения Шредингера и геометрической теорией нелинейного уравнения второго порядка. § 1. Дифференциальные уравнения, инвариантные относительно групп симметрии В этом параграфе изложены общие соображения, на которых осно- основаны методы интегрирования дифференциальных уравнений в явном виде. В качестве примера обсуждается теория подобия, т. е. теория од- однородных и квазиоднородных уравнений. А. Группы симметрии дифференциальных уравнений. Рассмотрим векторное поле v в фазовом пространстве U. Определение. Диффеоморфизм g: U —>¦ U называется симметри- симметрией поля v, если он переводит поле v в себя: v(gx) = g+xv{x). Поле v называется тогда инвариантным относительно диффеомор- диффеоморфизма g. Пример 1. Векторное поле с независящими от х компонентами на плос- плоскости с координатами (ж, у) инвариантно относительно сдвигов вдоль оси ж (рис. 1).
12 Глава 1 Пример 2. Векторное поле хдх -\-уду на евклидовой плоскости (ж, у) ин- инвариантно относительно растяжений g(x, у) = (Аж, Ху) и относительно пово- поворотов. У и Все симметрии данного поля обра- образуют группу. Задача. Найти группу симметрии поля хдх + уду на плоскости с координа- координатами (ж, у). Рассмотрим поле направлений в расширенном фазовом пространстве. Рис. 1 Определение. Диффеоморфизм расширенного фазового пространства называется симметрией поля на- направлений, если он переводит поле в себя. Поле направлений называется тогда инвариантным относительно этого диффеоморфизма. Пример 1. Поле направлений уравнения ж = v(x) инвариантно относи- относительно сдвигов вдоль оси t (рис. 2 а). X л б) Рис. 2 Пример 2. Поле направлений уравнения ж = v(t) инвариантно относи- относительно сдвигов вдоль оси ж (рис. 2 6). Определение. Дифференциальное уравнение х = v(x) (соответ- (соответственно, х = v(x, t)) называется инвариантным относительно диф- диффеоморфизма g фазового пространства (соответственно, расширенного фазового пространства), если векторное поле v (соответственно, поле направлений v) инвариантно относительно этого диффеоморфизма g; диффеоморфизм g называется тогда симметрией данного уравнения.
§ 1. Инвариантные уравнения 13 Теорема. Симметрия уравнения переводит фазовые (интеграль- (интегральные) кривые уравнения в фазовые (интегральные) кривые того же урав- уравнения. Доказательство. Пусть х = (f(t) — решение уравнения х = v(x) и g — симмет- симметрия. Тогда х = g(<f(t)) — тоже решение, поэтому симметрия переводит фазовую кривую в фазовую кривую. Для интегральных кривых дока- доказательство аналогично. ¦ Пример. Семейство интегральных кривых уравнения ж = v(t) переходит в себя при сдвигах вдоль оси ж, а уравнения ж = v(x) — при сдвигах вдоль оси t. Следующие примеры часто встречаются в приложениях под назва- названием «теории подобия», «теории размерностей» или «соображений авто- модельности». Б. Однородные уравнения. Определение. Поле направлений на плоскости без точки О назы- называется однородным, если оно инвариантно относительно всех растяже- растяжений gx(x, у) = (ехх, еху), AGl. (Ill Дифференциальное уравнение -^ = v(x, у) называется однородным, если его поле направлений однородно (рис. 3). Иными словами, направления поля во всех точках каждого луча, выходящего из начала ко- координат, должны быть параллельны: v(exx, exy) = v(x, у). Пример. Функция / называется однородной сте- степени d, если /(еАж, еху) = eXdf(x, у). Примером яв- является любая форма (однородный многочлен) степе- степени d. Пусть Р и Q — две формы степени d от ж и у. Дифференциальное уравнение О х Рис. 3 У =
14 Глава 1 задается векторным полем на плоскости. Соответствующее поле направлений в области Р ф О является полем направлений однородного уравнения dy dx р\ например, dy ax + by dy dx ex + dy' dx x2-y2 x2 +y2 ИТ.П.1 Замечание. Областью определения однородного поля не обяза- обязательно должна быть вся плоскость без точки О — однородные поля можно рассматривать в любой однородной (= инвариантной относи- относительно растяжений) области, например, в угле с вершиной О и т. п. Теорема. Интегральная кривая однородного уравнения под действием растяжений gx перехо- переходит в интегральную кривую того же уравнения. Таким образом, для исследования однородно- однородного уравнения достаточно исследовать по одной ин- интегральной кривой в каждом секторе плоскости. Доказательство получается непосредствен- непосредственным применением теоремы п. А. Задача. Докажите, что фазовые кривые системы х — Р, у — Q, где Р и Q формы степени d, получаются друг из друга при помощи гомотетий (рис. 4). Если какая-либо из этих кривых за- замкнута и проходится за время Т, то при растяжении g из нее получится замкну- замкнутая фазовая кривая с периодом обраще- Рис. 4 В. Квазиоднородные уравне- уравнения и «соображения размернос- размерностей». Зафиксируем вещественные чис- числа а и C и рассмотрим семейство рас- Рис. 5 тяжений в разное число раз по разным направлениям на плоскости gs(x, у) = (easx, е*'у). A) Заметим, что формула A) задает однопараметрическую группу ли- линейных преобразований плоскости (рис. 5).
ч ч ч § 1. Инвариантные уравнения 15 Определение. Функция / называется квазиоднородной степени d, если f(gs(x, у)) ее edsf(x, у). Пример. Если а = E = 1, то получаются обычные однородные функции степени d. Квазиоднородные степени складываются при умножении функций. Они называются также весами. Таким образом, ж имеет вес а, у — вес f3, х2у — вес 2а + E и т. д. Все ква- квазиоднородные одночлены фиксированной сте- степени легко увидеть на следующей диаграм- диаграмме Ньютона (рис. 6). Будем изображать од- одночлен хр yq точкой (р, q) на квадранте цело- Рис- 6 численной решетки. Тогда показатели всех одночленов степени d — это целые точки на отрезке с уравнением d = ар + flq на плоскости пока- показателей (р, q). Задача. Подобрать веса так, чтобы функция ж2 + ху3 была квазиодно- квазиоднородной. (Ill Определение. Дифференциальное уравнение -j- — v(x, у) назы- называется квазиоднородным (с весами а, /3), если поле направлений v инва- инвариантно относительно растяжений A). Из общей теоремы п. А о симметриях вытекает Теорема. Интегральные кривые квазиоднородного уравнения полу- получаются друг из друга под действием растяжений A). Задача. Докажите, что функция v(x, у) задает квазиоднородное диффе- дифференциальное уравнение (с весами (а, /3)), если и только если она квазиодно- квазиоднородная степени d = ft — a. Замечание. Приведенные определения и теоремы легко перено- переносятся на случай большего двух числа переменных и на дифференциаль- дифференциальные уравнения порядка выше 1. В частности, легко доказывается Теорема. Пусть на плоскости (ж, у) дана кривая j: у = у (ж), и в точке (жо, у о) имеем —^ = F. Тогда для кривой ^j в соответ- соответствующей точке будет dky (fi-ka)sj? dxh
16 Глава 1 Иными словами, —f преобразуется при преобразовании A) как -^ чем и объясняется удобство обозначения dxk Задача. Докажите, что если частица в силовом поле с однородной сте- степени d силой проходит траекторию Г за время Т, то эта же частица пройдет гомотетичную траекторию ЛГ за время j2 Решение. Уравнение Ньютона —- = F(x), в котором F однород- на степени d, переходит в себя при подходящих преобразованиях A). Именно для этого нужно взять веса а (для ж) и /3 (для t) так, что- чтобы а — 2C — ad. Итак, /3 — —-—а. Поэтому растяжению х — \х соответ- ствует Т' = AA"d)/2T. Задача. Докажите третий закон Кеплера: квадраты времен прохожде- прохождения подобных траекторий в поле тяготения относятся как кубы линейных размеров. Решение. Из решения предыдущей задачи при d = —2 (закон всемир- всемирного тяготения) получаем Т' = Л3^2Т. Задача. Выясните, как зависит от амплитуды период колебаний в слу- случае возвращающей силы, пропорциональной отклонению (линейный осцилля- осциллятор) и кубу отклонения (мягкая сила). Ответ. Для линейного маятника период не зависит от амплитуды, а для мягкого обратно пропорционален амплитуде. Задача. Известно, что волчок с вертикальной осью имеет критическую угловую скорость: если угловая скорость больше критической, волчок стоит вертикально устойчиво, а если меньше — то падает. Как изменится критическая угловая скорость, если перенести волчок на Луну, где ускорение силы тяжести в шесть раз меньше земного? Ответ. Уменьшится в л/б раз. Г. Применения однопараметрических групп симметрии к понижению порядка. Теорема. Если известна однопараметрическая группа симметрии поля направлений в М.п, то задача интегрирования соответствующего дифференциального уравнения сводится к задаче интегрирования урав- уравнения в М".
p § 1. Инвариантные уравнения 17 В частности, если известна однопараметрическая группа сим- симметрии поля направлений на плоскости, то соответствующее урав- dy ?( ч нение -j- = /(ж, у) интегрируется явно. Доказательство. Пусть {g-8} — данная группа симметрии. Рассмотрим орбиты {gsx} потока {g8}. Можно (по меньшей мере локально) определить (п—1)-мер- ное пространство орбит (фактор-пространство по действию g?) и ото- отображение р исходного пространства на фактор-пространство (орбиты потока {g8} p переводит в точки). Оказывается, исходное поле направле- направлений переходит при отображении р в некоторое новое поле направлений в (п — 1)-мерном пространстве орбит; его только и остается проинтег- проинтегрировать. ¦ Точнее говоря, рассмотрим какую- нибудь точку жо € R"; мы предполагаем, что проходящая через точку жо орбита группы симметрии {gs} является кривой и. Прове- Проведем через точку жо какую-либо (п — 1)-мер- ную локальную трансверсаль S к кривой а. В окрестности точки жо введем локальную систему координат (s, и), где паре s?R, m6S отвечает точка gsu исходного про- пространства. Тогда отображение р проекти- ^ р 7 рования на пространство орбит и действие группы симметрии gs задаются в окрестности точки жо формулами p(s, и) = и, gSl (s2, и) = (si + s2, и) (точки поверхности S параметризуют локальные орбиты). Заметим, что если группа gs явно известна, то координаты (s, и) можно явно найти. Запишем в этих координатах наше исходное дифференциальное уравнение. Если наше поле направлений в точке жо не касается поверхности S (чего всегда можно добиться выбором S), то в окрестности этой точки наше уравнение принимает вид ? = „(.,«). При этом группа симметрии {g3} имеет вид сдвигов вдоль оси s, поэто- поэтому функция v от s не зависит. Векторное поле v(u) на S определяет на этой (п — 1)-мерной поверхности поле направлений; зная его интегральные кривые, мы найдем (квадратурой) решения уравнения —— = v(u), а значит — as интегральные кривые исходного уравнения. 2 В. И. Арнольд
18 Глава 1 В частном случае п — 2 выбор координат (s, и) сразу приводит к интег- интегрируемому уравнению —— = v(u). as Замечание. Практически часто бывает удобно вместо координаты s ис- использовать подходящую функцию z переменной s. В такой системе координат уравнение, допускающее группу симметрии {gs}, будет записываться в виде уравнения (в случае п — 1 — в виде уравнения с разделяющимися переменными). Пример. Однородное уравнение приводится к уравнению с разделяющи- разделяющимися переменными в полярной системе координат, а также в системе коор- динат и — —, z — х (рис. 8 а). Здесь {g3} — однопараметрическая группа растяжений в es раз; S для полярной системы — окружность х2 + у2 — 1, а для второй системы коорди- координат — прямая х = 1; z = es. у=их а) уа=их13 Рис. 8 Задача. В каких координатах интегрируется явно квазиоднородное уравнение где вес х равен а, вес у равен C (так что v — квазиоднородная функция степени ft — а). Решение. Можно взять и — —-, z — х (в области, где х ф 0). См. рис. 8 б. х1 Задача. Выписать явно уравнение с разделяющимися переменными, к которому приводится уравнение предыдущей задачи в координатах (и, z).
§2. Разрешение особенностей дифференциальных уравнений 19 Решение. уа — их^, поэтому aya~1dy = xl3du+fluxfi~1dx. Если dy — v dx, то aya~1v dx = x^ du + ftux^'1 dx, т. е. du = ay^v - Pux?-1 dx X0 Ho v(x, y) = x^^a^~1w(u), поэтому du _ aw(u) -flu dx x § 2. Разрешение особенностей дифференциальных уравнений Здесь коротко описан один важный общематематический прием, называемый разрешением особенностей, раздутием или сг-процессом. А. (т-процесс. Вблизи неособой точки все векторные поля устроены просто и оди- одинаково. Для исследования мелких деталей всевозможных математических объектов вблизи особых точек разработан специальный аппарат, име- имеющий, подобно микроскопу, большую разрешающую силу — т. н. раз- разрешение особенностей. С аналитической точки зрения речь идет о вы- выборе таких систем координат вблизи особой точки, в которых малым перемещениям вблизи особенности соответствуют большие изменения координат. Этим свойством обладает уже полярная система координат, но пе- переход к полярным координатам требует трансцендентных (тригономет- (тригонометрических) функций, поэтому алгебраически часто удобнее другая про- процедура — так называемый сг-процесс, или раздутие особенности. Мы начнем с одной вспомогательной конструкции. Пусть р: Ш,2 \ О —> IRP1 — стандартное расслоение, определяющее проектив- проективную прямую. (Проективная прямая — это многообразие, точками ко- которого являются прямые на плоскости, проходящие через начало коор- координат. Отображение р сопоставляет точке плоскости прямую, соединя- соединяющую ее с началом координат.) Рассмотрим график Г отображения р. Этот график представляет со- собой гладкую поверхность в прямом произведении (М2\О)хМР1 (рис. 9). Вкладывая плоскость без точки в плоскость, мы можем рассматривать график как гладкую поверхность Г в прямом произведении IR2 x IRP1.
20 Глава 1 Рис. 9 Рис. 10 Естественная проекция щ: Ш2 х IRP1 —> М2 диффеоморфно отображает график Г на проколотую плоскость IR2 \ О. (Чтобы яснее представить себе все это, полезно заметить, что Г локально имеет вид винтовой лестницы; в целом проективная прямая диффеоморфна окружности S1, а произведение IR2 x IRP1 диффеоморфно внутренности баранки.) Теорема. Замыкание графика Г отображения р в Ш2 х IRP1 явля- является гладкой поверхностью 1\ = Г U (О х IRP1). Поверхность 1\ диф- диффеоморфна листу Мёбиуса (рис. 10). Доказательство. /it Пусть (ж, у) — координаты на плоскости, и = ^ — аффинная ло- локальная координата в IRP1. Тогда (ж, у, и) — локальная система ко- координат в!2х IRP1. В этой системе координат Г задается уравнени- уравнением у = их, х ф 0, поэтому Fi в этой системе координат задается ло- локальным уравнением у — их. Эта поверхность гладкая; она получается добавлением к части Г, покрытой нашей системой координат, попавшей туда части проективной прямой О х IRP1. Доказательство гладкости 1\ завершается рассмотрением второй локальной системы координат (ж, у, v), где ж = vy. Проекция 7Г2: М2 х IRP1 —>• IRP1 расслаивает Fi на прямые. При полном обходе окружности IRP1 соответствующая прямая на IR2 пово- рачивается на угол тг; отсюда следует, что лист Мёбиуса. Определение. Переход от IR2 к 1\ называется а-процессом с цент- центром О, или раздутием точки О в прямую О х IRP1. Отображе- Отображение 7Ti: Fi —>• IR2 называется антисигма-процессом или сжатием окруж- окружности О х IRP1 в точку О.
§2. Разрешение особенностей дифференциальных уравнений 21 Отображение ж\: Fi —> Е2, суженное на Г, является диффеоморфиз- диффеоморфизмом на проколотую плоскость. Поэтому всевозможные геометрические объекты на плоскости, имеющие особенность в точке О, переносятся на Fi. При этом особенности могут упрощаться или «разрешаться». Пример. Рассмотрим три прямые, проходящие через точку О. На Fi им соответствуют три прямые, пересекающие RP1 уже в разных точках (рис. 11). О Рис. 11 Рис. 12 ЗАДАЧА. Рассмотрим две кривые, имеющие в точке О касание порядка п (например, у — Оиу — х2,п — 2). Доказать, что на ГЧ им соответствуют две кривые, имеющие в соответствующей точке О\ касание порядка п — 1 (рис. 12). Если после сг-процесса особенности не сводятся к трансверсальным пе- пересечениям, то можно сделать еще сг-процесс в полученных особых точках, и т. д., пока все не сведется к трансверсальным пересечениям. Можно до- доказать, что особенности всякой алгебраической кривой могут быть таким образом разрешены (сведены к трансверсальным пересечениям) за конечное число шагов. Задача. Разрешить особенность кривой х2 — у3. Ответ. См. рис. 13. Рис. 13 Б. Формулы разрешения. Практически с-процесс означает переход от координат (ж, у) к ко- координатам (ж, и = ^) там, где ж / 0, и к координатам (v=^,y) там, где у ф 0 (рис. 14). Посмотрим, что происходит при этом с дифференци- дифференциальным уравнением, заданным векторным полем на плоскости (ж, у). Мы будем предполагать, что точка О — особая точка нашего вектор- векторного поля.
22 Глава 1 Рис. 14 Теорема. Гладкое векторное поле w с особой точкой О превра- превращается после а-процесса в векторное поле на Т, продолжающееся до гладкого поля на Fi. Доказательство. Пусть w — поле, задающее систему х = Р(х, у), у = Q(x, у). В ко- координатах (ж, и = т? ) находим х = Р(х, их), и = 1, их) — иР(х, их) Правые части гладкие, так как Р@, 0) = Q@, 0) = 0. Во второй системе координат (v = ^, у) тоже получится гладкое поле. ¦ Замечание. Может оказаться, что полученное векторное поле об- обращается в нуль на всей вклеенной при с-процессе прямой. В таком случае поле можно поделить на ж в области первой системы координат и на у в области второй. Деление не меняет направлений векторов поля. Поэтому на Fi возникает поле направлений с особыми точками, лежа- лежащими на вклеенной прямой, но не заполняющими ее целиком. В окрест- окрестности каждой особой точки поле направлений задается гладким вектор- векторным полем. Каждому «направлению входа» фазовых кривых исходного поля в О соответствует особая точка полученного поля, лежащая на вклеенной при о"-процессе прямой ЕР1. Если эти особые точки 0% устроены недостаточно просто, можно сделать в них с-процессы. Продолжая таким же образом, можно в конце концов прийти к случаю, когда хотя бы одно из собственных чисел линеаризации поля в каждой особой точке отлично от нуля. Во многих случаях уже первый с-процесс позволяет разобраться в поведении фазовых или интегральных кривых вблизи особой точки.
§2. Разрешение особенностей дифференциальных уравнений 23 Например, интегральные кривые однородного уравнения переходят при наших заменах координат (ж, у) \—> (ж, и = ^ I в интегральные кривые уравнений с разделяющимися переменными. В. Пример. Исследование маятника с трением. Проиллюстрируем метод на тривиальном примере линейного уравнения. Уравнение маятника с коэффициентом трения к имеет вид х + кх + х = 0. Уравнение эквивалентно системе с фазовой плоскостью (ж, у): х = у у = -ку-х. Мы приходим к однородному уравнению ? = -*+!¦ dx x Согласно общей теории, после сг-процесса, т. е. в системе координат ( х, и— — ), тт „ du и2 + ки + 1 о переменные должны разделяться. Действительно, —— = — . Вводя dx ux еще 1п|ж| = z, получаем — К, dz Исследуем интегральные кривые этого уравнения при различных зна- значениях коэффициента к > 0. График функции / = и + — — гипербола (рис. 15). Следовательно, график функции —k—f(u) имеет вид, изображенный на рис. 16. Соответственно, интегральные кривые уравнения —— = — к — f(u) dz будут иметь вид, изображенный на рис. 17. Возвращаясь на фазовую плос- плоскость (ж, у), получаем рис. 18. Итак, при малых значениях коэффициента трения @ < к < 2) маятник совершает бесконечное число колебаний, а при к ^ 2 направление движения маятника меняется не более одного раза. ЗАДАЧА. Построить фазовые кривые уравнений z — azn и z — a~zn, z € С. Г. Пример. Период малых колебаний. Теорема. Предположим, что все фазовые кривые, проходящие через близкие к положению равновесия О точки, замкнуты. Тогда предел периода колебаний вблизи О при стремлении амплитуды колебаний к 0 равен периоду колебаний в линеаризованной системе. Доказательство. После сг-процесса замкнутые фазовые кривые, обходящие один раз во- вокруг О, перейдут в кривые на листе Мёбиуса, замыкающиеся после двух
24 Глава 1 f\ 2 -1 У Л ч / ] -2 и Рис. 15 \ и 1 к) fc=2 и Рис. 16 \) к>2 и 0<к<2 /\к=2 \ У 0<к<2 Рис. 18 оборотов; стремление амплитуды колебаний к 0 соответствует стремлению фазовой кривой на листе Мёбиуса к вклеиваемой при сг-процессе проективной прямой (к средней линии листа Мёбиуса). По теореме о непрерывной зависимости решения от начального усло- условия предел периода колебаний при стремлении амплитуды к 0 равен удво- удвоенному периоду обращения по вклеенной прямой RP1 в системе, полученной при сг-процессе. Но скорости движения по вклеенной прямой для данного по-
§ 3. Уравнения, не разрешенные относительно производных 25 ля и для его линеаризации одинаковы (см. уравнение для и в п. Б). Легко проверить, что все фазовые кривые линеаризованного уравнения замкнуты. Эти замкнутые кривые в линейной системе проходятся за одинаковое время, так как линейное векторное поле переходит в себя при растяжениях фазовой плоскости. Следовательно, предел периода колебаний в исходной системе ра- равен пределу периода колебаний в линеаризованной системе и, значит, равен просто периоду колебаний в линеаризованной системе. ¦ Замечание. Предел, о котором шла речь, называется периодом малых колебаний. ЗАДАЧА. Вычислить период малых колебаний маятника х = — sin ж вбли- вблизи положения равновесия х — 0. § 3. Уравнения, не разрешенные относительно производных В этом параграфе основные понятия теории дифференциальных уравнений, не разрешенных относительно производных, рассматрива- рассматриваются с точки зрения общей теории особенностей гладких отображений и геометрии пространства струй. А. Основные определения. Речь идет об уравнении F(x, у, р) = 0, A) dy TJXeP=Tx- Примеры. 1) р2 — х; 2) р2 — у; 3) у — рх +р2. Трехмерное пространство с координатами (ж, у, р) называется про- пространством 1-струй функций у(х). (Две гладкие функции yi, y^ имеют в точке Жо одинаковую fc-струю, если \у\(х) — у^(ж)| = о(\х — Хо\к); та- таким образом, 1-струя функции определяется выбором точки ж, выбором значения у функции в этой точке и выбором значения р производной.) Уравнение A) задает в пространстве струй поверхность. Оказы- Оказывается, на этой поверхности возникает поле направлений. Вот как оно строится. Рассмотрим какую-либо точку в пространстве струй. Компо- Компоненты вектора ?, приложенного в этой точке, будем обозначать dx(^), dy(^), dp{^). Таким образом, dx, dy и dp — это не какие-то мистические бесконечно малые величины, а вполне определенные линейные функции от вектора ?.
26 Глава 1 В точке (ж, у, р) пространства струй рас- рассмотрим плоскость, составленную из векто- векторов ?, для которых dy = pdx. Иными слова- F=0 ми, вектор ?, приложенный в точке (ж, у, р), попадает в указанную плоскость (рис. 19), ес- если его проекция на евклидову плоскость (ж, у) имеет направление с тангенсом угла наклона р -.q к оси ж, равным р. Построенная плоскость на- называется контактной плоскостью. Таким об- образом, в каждой точке пространства 1-струй приложена контактная плоскость; все вместе они образуют контактное поле плоскостей (или, как еще говорят, контактную структуру) в пространстве 1-струй. ЗАДАЧА*. Существуют ли поверхности в пространстве 1-струй, касающи- касающиеся в каждой своей точке приложенной в этой точке контактной плоскости? Ответ. Нет. Предположим, что поверхность в пространстве 1-струй, заданная уравнением A), гладкая. [Это — не очень большое ограничение, так как для гладкой (= бесконечно дифференцируемой) функции F общего положения значение 0 не критическое и множество уровня 0 гладкое; если для данной функции это не так, то при почти всяком сколь угодно малом изменении функции F множество уровня 0 становится гладким: например, достаточно прибавить к F малую константу (см. теорему Сарда, § 10 п. Е).] Рассмотрим какую-либо точку на гладкой поверхности М, задан- заданной уравнением A), и предположим, что в этой точке касательная плос- плоскость к поверхности не совпадает с контактной плоскостью. Тогда эти две плоскости пересекаются по прямой. Более того, касательные и кон- контактные плоскости во всех близких точках поверхности пересекаются по прямым, так что в окрестности рассматриваемой точки возникает поле направлений на М. Интегральными кривыми уравнения A) называются интегральные кривые полученного поля направлений на поверхности М. Решить (или исследовать) уравнение A) — значит найти (или исследовать) эти кри- кривые. Связь интегральных кривых на М с графиками решений уравне- уравнения A) на плоскости (ж, у) обсуждается ниже; подчеркнем, что интег- интегральные кривые на М определяются не в терминах решений уравне- уравнения A), а в терминах контактных плоскостей.
3. Уравнения, не разрешенные относительно производных 27 Б. Регулярные точки и дискриминантная кривая. Направление оси р в пространстве струй будем называть верти- вертикальным направлением. Пусть М — гладкая поверхность в простран- пространстве струй, заданная уравнением A). Рассмотрим отображение проек- проектирования вдоль вертикального направления тг: М Тг(ж, у, р) = (ж, у). Определение. Точка поверхности М называется регулярной, если она не является критической точкой отображения тг. Иными словами, точка поверхности М регулярна, если касатель- касательная плоскость в этой точке не вертикальна, или еще — если отображе- отображение проектирования на плоскость (ж, у) в окрестности этой точки — диффеоморфизм. Множество критических значений отображения тг (т.е. проекция множества критических точек) называется дискриминантной кривой уравнения A). Пример. Для уравнения р2 — х дискриминантной кривой является ось у, а для уравнения р2 = у — ось х (рис. 20). Рис. 20 Рассмотрим регулярную точку поверхности М. По теореме о неяв- неявной функции в окрестности этой точки М является графиком гладкой функции р = v(x, у). Теорема. Проектирование на плоскость (ж, у) переводит интег- интегральные кривые уравнения A) на М в окрестности регулярной точки
28 Глава 1 в точности в интегральные кривые уравнения в окрестности проекции этой точки (рис. 21). Доказательство. По определению контактной плоскости, ее проекция на плос- плоскость (ж, у) есть прямая поля направлений B). Поэтому поле направле- направлений уравнения A) в окрестности рассматриваемой регулярной точки на М переходит при локальном диффеоморфизме тг в поле направлений уравнения B); значит переходят друг в друга и интегральные кривые. Замечание. В целом проекции интегральных кривых уравне- уравнения A) на плоскость (ж, у) не являются, вообще говоря, интегральными кривыми никакого поля направлений. Проекции интегральных кривых уравнения A) на плоскость (ж, у) имеют на дискриминантнои кривой в общем случае точки возврата, но для некоторых уравнений A) эти проекции остаются гладкими и в точках дискриминантнои кривой. В. Примеры. Пример 1. р2 = х (рис. 22). Поверхность М — параболический цилиндр. Дискриминантная кри- кривая — ось у. Чтобы найти интегральные кривые, удобно взять за коорди- координаты на М не х и у, а р и у (тем более что последняя система координат — глобальная). Запишем условия, наложенные на компоненты dx, dy, dp вектора ?, при- приложенного в точке (ж, у, р) поверхности М и принадлежащего нашему полю направлений: р2 — х (условие принадлежности М); 2pdp = dx (условие касания М); dy =pdx (условие принадлежности контактной плоскости). Следовательно, в координатах (р, у) интегральные кривые определяются из уравнения dy = 2p2 dp. Итак, интегральные кривые на М даются соотношениями у + С = тг]?3, о х = р2 • Их проекции на плоскость (ж, у) — полукубические параболы.
3. Уравнения, не разрешенные относительно производных 29 V =У Рис. 22 Рис. 23 Пример 2. р2 = у (рис. 23). Поступая как в предыдущем примере, получаем 2 Р =У, 2р dp — dy, dy = pdx. Выбирая в качестве координат на поверхности М на этот раз жир, получаем p(dx — 2dp) — 0, откуда либо р — 0, у — 0, либо х = 2р + С, у=р2. Проекции этих кривых на плоскость (ж, у) — параболы, касающиеся дискри- минантной кривой у — 0. Пример 3 (Уравнение Клеро). y = px + f(p) (рис. 24). Поверхность М — линейчатая (ее пересечения с плоскостями р = = const — прямые). За координаты на М удобно взять х и р. Интег- Интегральные кривые ищем из соотношений dy = p dx + x dp + f dp, dy = p dx. Находим (x + /') dp = 0. Точки, где х + f = 0 — критические, а осталь- остальные регулярные. На плоскости с координатами (ж, р) интегральные кривые — прямые р = const = С; эти прямые, вообще говоря, пере- пересекают линию критических точек (х + /' = 0).
30 Глава 1 Рис. 24 Проекции интегральных кривых на плоскость (ж, у) — прямые у = Сх + /(С), касающиеся дискриминантной кривой. [Строго говоря, точки пересечения с кри- критической линией не входят в интеграль- интегральные кривые на М, так как для данного уравнения в этих точках поле направле- направлений не определено: контактная плоскость касается М.] Дискриминантная кривая находится из условий = 0. p Например, если f(p) = —Цг, то дискриминантная кривая — пара- х2 бола у = ^-, а проекции интегральных кривых — ее касательные. Теория уравнения Клеро связана с важными общематематически- общематематическими понятиями: преобразованием Лежандра и проективной двойствен- двойственностью. Г. Преобразование Лежандра. Пусть дана функция / переменной х. Преобразованием Лежандра1 этой функции называется новая функция g новой переменной р, которая определяется следующим образом. Рассмотрим график / на плоскос- плоскости (ж, у). Проведем прямую у = рх с тангенсом угла наклона к оси ж, равным р. Найдем точку, где график всего дальше от прямой по на- направлению оси ординат. Рассмотрим разность ординат точек прямой и графика. Эта разность и есть значение функции g в точке р (рис. 25): g{p) = - /(ж)). 2 Пример 1. Пусть /(ж) = —. Вычисляя преобразование Лежандра, полу- 2 ^ Р чаем g{p) = —. гВ литературе преобразованиями Лежандра называют несколько разных объек- объектов, связываемых также с именами Минковского и Юнга, но мы не будем стремить- стремиться к полной педантичности терминологии.
3. Уравнения, не разрешенные относительно производных 31 Рис. 25 Пример 2. Пусть /(ж) = ^-. Тогда g(p) = (Здесь х, р, а и C неотрицательны). где а'1 + /Г1 = 1. Если функция / строго выпуклая (/" > 0), и ее производная за- задает диффеоморфизм прямой на прямую, то функция g также строго выпуклая; при этом верхняя грань достигается в единственной точке ж, где /'(ж) = р. Такие точки ж и р называются соответствующими друг другу при преобразовании Лежандра. Теорема. Имеет место неравенство /(ж) + g{p) ^ рх. Если f строго выпукла и f — диффеоморфизм на, то равенство дости- достигается если и только если точки х и р соответственные. Доказательство. Функция рх — /(ж) не превосходит своей верхней грани g{p). ¦ Пример. При любых неотрицательных ж, р имеет место неравен- ство рх ^ ^- + Z-. В формулируемых ниже следствиях предполагается, что рассмат- рассматриваемые функции fug строго выпуклы и их производные задают диффеоморфизмы прямой на прямую. Следствие. Преобразование Лежандра инволютивно: преобразова- преобразованием Лежандра функции g(p) является (при подходящем обозначении координаты) функция /(ж).
32 Глава 1 Доказательство. Действительно, неравенство предыдущей теоремы симметрично относительно fug. Ш Следствие. Переход от строго выпуклой функции g, задающей уравнение Клеро у = рх — g(p), к функции f, задающей огибающую ре- решений по формуле у = f(x), есть преобразование Лежандра. Доказательство. График функции / является огибающей своих касательных. ¦ Замечание. Преобразование Лежандра для функций п перемен- переменных определяется совершенно аналогично и обладает теми же свой- свойствами. Если х — точка Ш,п, то р — точка двойственного линейного пространства (пространства Жп* линейных функций на Ш,п). Д. Проективная двойственность. Преобразование Лежандра является частным случаем одной общей конструкции проективной геометрии. Рассмотрим проективное про- пространство размерности п. Это пространство обозначается через МРП. Точка проективного пространства задается ненулевым вектором х из аффинного пространства En+1, определенным с точностью до ум- умножения на число, отличное от нуля. Это определение записывается кратко так: Ш>п = (Rn+1\O)/{R\O). Гиперплоскость в проективном пространстве состоит из всех точек проективного пространства, для которых соответствующие точки аф- аффинного пространства принадлежат одной гиперплоскости, проходящей через нуль. Рассмотрим множество всех гиперплоскостей в n-мерном проек- проективном пространстве. Это множество само естественно является п-мер- ным проективным пространством. Действительно, гиперплоскость в проективном пространстве зада- задается однородным уравнением (а, х) = 0, же Rn+1, a G Rn+1* \ О, где Mn+1* — пространство линейных функций в Жп+1 (это пространст- пространство само линейно, имеет размерность п + 1 и называется двойственным или дуальным к исходному линейному пространству Mn+1).
§ 3. Уравнения, не разрешенные относительно производных 33 Таким образом, гиперплоскости в проективном пространстве со- соответствует ненулевой вектор в Мп+1*, определенный с точностью до умножения на отличное от нуля число. Следовательно, множество всех гиперплоскостей в МРП имеет естественную структуру проективного пространства размерности п: Проективное пространство гиперплоскостей в данном проективном пространстве МРП называется двойственным к МРП пространством и обозначается через МРП*. Например, пространство всех прямых на про- проективной плоскости само является проективной плоскостью, двойст- двойственной исходной. Заметим, что двойственность является взаимным понятием, т.е. МРП** = ЕРП. Это следует из симметрии а и ж в уравнении ги- гиперплоскости (а, ж) = 0. Примеры. Все прямые, проходящие через одну точку проективной плоскости, образуют, как нетрудно сообразить, прямую на двойствен- двойственной плоскости. Все прямые, проходящие через одну точку проективной плоскости внутри угла с вершиной в этой точке, образуют, как нетруд- нетрудно видеть, отрезок на двойственной плоскости. Все касательные к невырожденной кривой второго порядка на про- проективной плоскости образуют невырожденную кривую второго поряд- порядка на двойственной плоскости. Вообще, все касательные к любой глад- гладкой кривой образуют (не обязательно гладкую) кривую на двойствен- двойственной плоскости. Эта кривая называется двойственной к исходной. Теорема. Графики строго выпуклой функции и ее преобразования Лежандра проективно двойственны друг другу. Доказательство. Рассмотрим всевозможные прямые на аффинной плоскости с ко- координатами (ж, у), не параллельные оси у. Эти прямые сами образу- образуют плоскость: можно задать прямую уравнением у = рх — z и рас- рассматривать (р, z) как аффинные координаты на новой плоскости. В та- таком случае преобразование Лежандра сводится к переходу от графика функции / к семейству касательных к этому графику: когда точка на плоскости (ж, у) пробегает график функции /, касательная к графику функции / пробегает на плоскости (р, z) кривую, являющуюся графи- графиком преобразования Лежандра, z = g(p). Ш 3 В. И. Арнольд
34 Глава 1 Таким образом, преобразование Лежандра есть не что иное, как переход от кривой к проективно двойственной кривой, записанный в аф- аффинных координатах. Пример. Пусть график / — выпуклая (вниз) ломаная. Опорной прямой называется прямая, от которой график лежит вверх, но с которой он имеет общую точку1. Рассмотрим все опорные прямые к выпуклой ломаной. Легко проверить, что они сами образуют выпуклую ломаную на двой- двойственной плоскости. Действительно, опорные прямые в каждой вершине ис- исходной ломаной заполняют угол и, следовательно, образуют отрезок на двой- двойственной плоскости. Точно так же вершины на двойственной плоскости по- получаются из отрезков исходной ломаной. Проективная двойственность позволяет рассматривать более общие слу- случаи, чем преобразование Лежандра. Задача. Построить кривую, проективно двойственную кривой рис. 26. Указание. Двойным касательным исходной кривой отвечают точки са- самопересечения двойственной кривой — следовательно, двойственная кривая имеет 4 точки самопересечения. Точкам перегиба исходной кривой соответствуют точки возврата двой- двойственной кривой. Действительно, если / = ж3, то касательная к графику в точке х = t задается координатами р = 3? , z = It . Эти соотношения определяют на плоскости с координатами (р, z) кривую с точкой возврата. Итак, двойственная кривая имеет 8 точек возврата, по две между каждыми последовательными самопересечениями. Рис. 26 Рис. 27 1 Вообще, опорная гиперплоскость к выпуклому телу есть плоскость, имеющая с телом общую точку и такая, что тело лежит в одном из полупространств, на ко- которые плоскость делит пространство.
§ 3. Уравнения, не разрешенные относительно производных 35 Далее, рассмотрим исходную кривую как пару пересекающихся эллип- эллипсов, слегка сглаженных вблизи точек пересечения (части каждого эллипса внутри другого выкинуты). Двойственная кривая также связана с парой эллипсов. Точкам пересече- пересечения исходных эллипсов соответствуют двойные касательные двойственных. Отсюда уже легко сообразить, какой перестройкой двойственная кривая по- получается из пары пересекающихся эллипсов с их двойными касательными (рис. 27). Е. Преобразование Лежандра и сопряженные нормы. Определение. Нормой в Rn называется вещественная неотрицательная выпуклая положительно однородная четная функция первой степени, равная нулю лишь в начале координат: /^0, f(x)=0&x = 0, f(Xx) = \X\f(x), f(x + y)^f(x) + f(y). Пусть / — норма в Rn. Функция / задается множеством, где она равна единице. Это множество является выпуклой центрально-симметричной от- относительно нуля гиперповерхностью в Rn. Обратно, каждое компактное вы- выпуклое центрально-симметричное относительно нуля тело, содержащее нуль в Rn, определяет единственную норму, равную 1 на его границе. Эта гипер- гиперповерхность f — 1 называется единичной сферой нормы /. Задача 1. Найти единичные сферы следующих норм в R3: а) / = д/(ж5 ж)> б)/ = тах|ж;|, в) / = )] \xj\. Рассмотрим пространство Rn*, сопряженное к Rn. Определение. Сопряженная норма в Rn* определяется как g(p) = Легко проверить, что g действительно норма. Отношение сопряженности взаимно, так как определяющее неравенство можно переписать в симметричном виде \(р, х)\ ^ f{x)g{p). Сопоставим каждой точке р сопряженного пространства гиперплос- гиперплоскость р — 1 в исходном пространстве. Теорема. Единичная сфера сопряженной нормы есть множество опор- опорных гиперплоскостей единичной сферы исходной нормы. Доказательство. Условие g(p) = 1 означает, что (р, х) на исходном шаре имеет максимум, равный 1, т.е. что плоскость р = 1 опорная для исходной сферы. ¦
36 Глава 1 Множество всех гиперплоскостей, опорных к данной выпуклой гипер- гиперповерхности, называется двойственной выпуклой гиперповерхностью. Таким образом, единичные сферы двойственных норм двойственны. Задача 2. Найти поверхности в R3, двойственные а) сфере, б) тетраэдру, в) кубу, г) октаэдру. Задача 3. Найти нормы, сопряженные нормам задачи 1. Из всего сказанного выше видно, что переход от выпуклой гиперповерх- гиперповерхности к двойственной ей локально задается преобразованием Лежандра. Ж. Задача об огибающих семейства плоских кривых. Две гладкие функции двух переменных х = x(s, t), у = y(s, t) задают семейство кривых на плоскости, параметризованных параметром t (указывающим точку на кривой) и занумерованных параметром s (указыва- (указывающим номер кривой). ЗАДАЧА. Нарисовать семейства кривых, заданных функциями а) х — (s + tJ, у = t, б) х = s + st + ?3, у = t2 (s и t малы), в) х = (s + t2J, y = t. Ответ. См. рис. 28. a) Рис. 28 Можно показать, что для семейства общего положения огибающая — кривая, единственные особенности которой точки возврата (как у полукуби- полукубической параболы) и точки самопересечения; при этом в окрестности каждой точки гладкости огибающей семейство приводится к одной из нормальных форм а), б), в) гладкими заменами координат Х(х, у), Y(x, у) и парамет- параметров S(s), T(s, t). В то же время в окрестности общей точки дискриминантной кривой уравнение, не разрешенное относительно производной, приводится, вообще говоря, к нормальной форме гладкой заменой координат Х(х, у), Y(x, у) (см. § 4).
§ 4. Нормальная форма уравнения, не разрешенного относительно ... 37 В этих координатах проекциями интегральных кривых на плоскость (X, Y) являются полукубические параболы. Таким образом, дискриминант- ная кривая является огибающей проекций интегральных кривых лишь для исключительных уравнений (например, для уравнения Клеро). В частности, при небольшом общем изменении уравнения Клеро дискриминантная кривая из огибающей превратится в геометрическое место точек возврата проекций интегральных кривых. § 4. Нормальная форма уравнения, не разрешенного относительно производной, в окрестности регулярной особой точки Здесь исследуются особенности семейства интегральных кривых для дифференциального уравнения общего положения, не разрешенного относи- относительно производной. А. Особые точки. Рассмотрим уравнение F(x, у, р) = 0, где Р= -?, A) заданное гладкой функцией F в некоторой области. Мы предположим, что уравнение A) задает гладкую поверхность в трех- трехмерном пространстве струй с координатами (ж, у, р). По теореме о неявной функции для этого достаточно, чтобы в точках, где F — 0, не обращался в нуль полный дифференциал функции F, что мы и будем предполагать. Рассмотрим проекцию поверхности F = 0 на координатную плос- плоскость (ж, у) параллельно ^-направлению. Определение. Точка поверхности F — 0 называется особой для уравне- уравнения A), если проектирование (ж, у, р) \—> (ж, у) поверхности на плоскость в окрестности этой точки не является локальным диффеоморфизмом поверх- поверхности на плоскость. По теореме о неявной функции, особые точки — это те точки поверх- ности F — 0, в которых -?— = 0. ар Б. Криминанта. Рассмотрим множество всех особых точек уравнения A). Это множество OF задается двумя уравнениями F — 0, -j— — 0 в трехмерном пространстве струй. Поэтому, вообще говоря, особые точки образуют кривую.
38 Глава 1 Определение. Множество особых точек уравнения F = 0 в трехмерном пространстве струй (ж, у, р) называется криминантой уравнения. По теореме о неявной функции, криминанта является гладкой кривой в трехмерном пространстве струй в окрестности каждой своей точки, в ко- которой ранг производной отображения (ж, у, р) i—> ( F, ¦—— 1 трехмерного пространства на плоскость максимален (равен 2). В. Дискриминантная кривая. Определение. Проекция криминанты на плоскость (ж, у) параллель- параллельно ^-направлению называется дискриминантной кривой1. По теореме о неявной функции, окрестность точки криминанты диффео- морфно проектируется на плоскость (ж, у) параллельно ^-направлению, если криминанта в рассматриваемой точке не касается ^-направления. Замечание. Дискриминантная кривая может в этих условиях все же иметь особенности. Они происходят от того, что в одну точку дискриминантной кривой мо- могут проектироваться, вообще говоря, несколько точек криминанты. Эти осо- особенности будут, вообще говоря, точками самопересечения дискриминантной кривой. Для «общего уравнения» в окрестности такой точки дискриминант- дискриминантная кривая состоит из двух ветвей, пересекающихся под ненулевым углом. Точкам же, где криминанта касается ^-направления, соответствуют «в общем случае» точки возврата на дискриминантной кривой. Все более сложные особенности дискриминантной кривой, кроме точек самопересечения и возврата, устраняются малым шевелением уравнения. Особенности же этих двух типов сохраняются при малой деформации урав- уравнения лишь немного смещаясь. Г. Точки касания криминанты с контактной плоскостью. В каждой точке (ж, у, р) пространства струй имеется контактная плос- плоскость dy = pdx. В частности, такая плоскость имеется в точках криминан- криминанты. Касательная к криминанте в данной точке может лежать в контактной плоскости или пересекать ее. Определение. Точка криминанты называется точкой касания с кон- контактной плоскостью, если касательная к криминанте в этой точке лежит в контактной плоскости. Заметим, что точки касания криминанты с ^-направлением являются точками касания с контактной плоскостью. Действительно, контактная плос- плоскость в каждой точке содержит ^-направление. 1Это определение — переформулировка определения дискриминантной кривой из 8 3.
§ 4. Нормальная форма уравнения, не разрешенного относительно ... 39 Д. Регулярные особые точки. Определение. Особая точка уравнения A) называется регулярной, если в этой точке выполнено условие гладкости криминанты1 гапк((Ж, у, р) .—> (F, Fp)) = 2 и криминанта не касается контактной плоскости. Пример. Рассмотрим уравнение р2 — х. Криминанта задается уравне- уравнениями р = 0, х = 0. Это — ось у. Условие гладкости выполнено. Касательный к криминанте вектор @, 1, 0) не лежит в контактной плоскости dy — Odx. Следовательно, каждая особая точка уравнения р2 = х регулярна. Замечание. Для уравнения «общего положения» почти все особые точки регулярны: нерегулярные точки лежат на криминанте дискретно. Если для данного уравнения это не так, то во всяком случае этого можно добиться ма- малым шевелением уравнения. (Обоснование этого и предыдущих «соображений общего положения» проводится с помощью теоремы Сарда, § 10.) Е. Теорема о нормальной форме. Теорема. Пусть (хо,уо,Ро) — регулярная особая точка уравнения F(x,y,p) = 0. Тогда существует диффеоморфизм окрестности точки (хо, уо) плоскости (х, у) на окрестность точки @, 0) плоскости (X, Y), приводящий 2 dY уравнение F = 0 к виду Р = X, где Р = -jtf- dX Пояснение. Уравнение F = 0 задает поверхность в трехмерном про- пространстве линейных элементов на плоскости (ж, у). Диффеоморфизм плоскос- плоскости переводит каждый линейный элемент в новый линейный элемент. Утверж- Утверждается, что часть поверхности F — 0 вблизи регулярной особой точки можно перевести в часть поверхности Р2 = X вблизи точки (X = 0, Y = 0, Р = 0). Следствие. Семейство интегральных кривых уравнения A) в окрест- окрестности регулярной особой точки диффеоморфно как семейство кривых на плос- плоскости (ж, у) семейству полукубических парабол у — х3^2 + С. Доказательство. Указанный в теореме диффеоморфизм переводит интегральные кривые уравнения A) на плоскости (ж, у) в интегральные кривые уравнения Р2 = X на плоскости (X, Y). Эти последние интегральные кривые являются полуку- полукубическими параболами с острием на дискриминантной кривой: —— = dX Y = |х3/2 + С. 1 Рангом (rank) отображения называется ранг его производной.
40 Глава 1 Ж. Доказательство теоремы о нормальной форме. Доказательство. 1°. Редукция к случаю, когда криминантой является ось у. Пусть (жо, уо, ро) — регулярная особая точка уравнения F(x, у, р) — 0. Тогда дискриминантная кривая в окрестности точки (жо, уо) гладкая. Рас- Рассмотрим проекции контактных плоскостей в точках криминанты на плос- плоскость (ж, у). Мы получим в окрестности точки (жо, уо) гладкое семейство прямых, не касающихся дискриминантной кривой. Выберем теперь локальную систему координат на плоскости (ж, у) вбли- вблизи точки (жо, уо) так, чтобы 1) дискриминантная кривая имела уравне- уравнение ж = 0; 2) линии у = const пересекали дискриминантную кривую по построенным только что направлениям. Эти координаты мы будем по-прежнему обозначать через (ж, у); произ- (ill водная —— по-прежнему будет обозначаться через]?. Особая точка (жо, уо, Ро) ах получает теперь координаты @, 0, 0). 2°. Анализ условий регулярности. Криминанта, согласно нашему выбору системы координат, является осью у: на ней ж = 0, р = 0 (у = const). Из этого следует, что для нашего урав- уравнения записанного в введенных координатах, F@, у, 0) = 0, Fp@, у, 0) = 0. Условие регулярности криминанты имеет теперь вид det D(F, Fp) D(x, p) F F ф О, т. e. det ж ж -fn -fn #0, (так как в точках криминанты Fy — 0, Fyp — 0). Далее, в точках крими- криминанты Fp = 0. Следовательно, условие регулярности криминанты запишется в виде ад, у, о)/о, fpp(o, у, о) ф о. Условие некасания с контактной плоскостью выполнено автоматически. Разложим F в ряд Тейлора по р с остаточным членом степени 2: F(x, у, р) = А(х, у)+рВ(х, у) +р2С(х, у, р). Из полученных выше соотношений следует, что А@, у) = 0, В@, у) = 0. Поэтому мы можем записать А(х, у) = жа(ж, у), В(х, у) = х/3(х, у), где а и /3 — гладкие функции. Условия регулярности криминанты имеют вид Ах@, у)фО, С@, у, 0)^0. Мы можем даже предположить для дальнейшего, что С > 0, Ах < 0 (если это не так, сменим знаки F и/или ж). Итак, а@, 0) < 0, С@, 0, 0) > 0.
§ 4. Нормальная форма уравнения, не разрешенного относительно ... 41 3°. Исследование квадратного уравнения. Рассмотрим соотношение F = О как квадратное уравнение относитель- относительно р с коэффициентами С, В, А. Мы получаем _ -В± VB2 - ААС 2С 2С где 7 = —4аС + ж/32 есть функция от (ж, у, р); при этом 7@, 0, 0) = = -4а@, 0, 0) • С@, 0, 0) > 0. Пусть, наконец, ж = ?2. Тогда получаем, оставляя лишь знак «+» в «±», Применим к этому уравнению относительно р(^, у) теорему о неявной функ- функции. Получим решение р = ?ш(?, у), где ш гладкая функция, ш@, 0) ф 0. 4°. Дифференциальное уравнение для Заметим, что р = — = -z—-rz- Поэтому мы получили дифференциальное ах IE, dt, уравнение для ^| = 2С2о;(С, у), ш@, 0) ф 0. B) Интегральные кривые на плоскости (^, у) пересекают ось ? = 0, имея с ли- линиями у = const касание второго порядка. Поэтому уравнение имеет пер- первый интеграл вида / = (?, у) — у — ?3К(?, у), где К — гладкая функция, К@, 0) ф 0 (/ — координата точки пересечения с осью ? = 0; К ф 0, так как о; т^ 0). 5°. Построение нормализующих координат. Разложим К на четную и нечетную по ? части: Здесь L и М — гладкие функции от ж и у, L@, 0) 7^ 0. В этих обозначени- обозначениях /(^, у) = у — ^4Af(^2, у) — ^3L(^2, у). Введем новые переменные У, Н по формулам S = С \/Ь(С2, у), У = у - C4M(f, у). Тогда I = Y -Е3. Рассмотрим еще X — S2. Тогда X = ж ^2(ж, у), У = у - ж2М(ж, у). Эти формулы задают локальный диффеоморфизм плоскости в окрестности точки @, 0), так как L@, 0) ф 0. Первый интеграл принимает вид I = Y -X 3/2
42 Глава 1 / \ 2 Теперь I —— I = -тХ, и указанная в формулировке теоремы нормальная форма получается растяжением одной из координатных осей. ¦ 3. Замечания. Основным моментом приведенного доказательства является подстанов- подстановка ж = ?2, т. е. переход к двулистному накрытию плоскости (ж, у) с ветвлени- ветвлением вдоль дискриминантной кривой. Из топологических соображений (прав- (правда, в комплексной области) заранее ясно, что на этом двулистном накры- накрытии двузначность р(х, у) исчезает и уравнение распадается на два. Возня с квадратным уравнением нужна лишь для обоснования этого обстоятельст- обстоятельства в вещественной области. Полученное на накрытии уравнение B) остается привести к нормальной форме диффеоморфизмом, опускаемым с накрытия на исходную плоскость — что легко достигается разложением первого ин- интеграла на четную и нечетную по ? составляющие. Первое доказательство теоремы нормальной форме было дано Ю. А. Брод- Бродским; оно основано на работе Р. Тома, который привел уравнение лишь к ви- виду р2 = хЕ(х, у). ЗАМЕЧАНИЕ. Наше доказательство использовало представление четной функции в виде функции от квадрата аргумента. Для аналитических функ- функций (или для формальных рядов) такое представление очевидно. В случае же гладких функций оно нуждается в обосновании. Действительно, четную бесконечно дифференцируемую функцию мож- можно рассматривать как функцию от квадрата аргумента, заданную на поло- положительной полуоси. Она бесконечно дифференцируема во всех точках этой полуоси, включая нуль. Требуется же представить ее как сужение на поло- положительную полуось функции, бесконечно дифференцируемой на всей оси. Возможность такого представления означает возможность гладкого продолжения на отрицательную полуось. Она гарантируется теоремой (Э. Бореля) о существовании бесконечно дифференцируемых функций на пря- прямой с любым рядом Тейлора в нуле. На доказательстве этой теоремы (впро- (впрочем, несложном) мы не останавливаемся. Кроме регулярных особых точек, в отдельных точках гладкой дискри- дискриминантной кривой уравнения общего положения встречаются точки касания контактной плоскости с поверхностью уравнения. В окрестности такой точки уравнение общего положения диффеоморфизмом плоскости (ж, у) приводится к нормальной форме у — (р + кхJ {А. А. Давыдов. Нормальная форма урав- уравнения, не разрешенного относительно производной, в окрестности его особой точки. Функциональный анализ и его приложения. 1985, т. 19, вып. 2, 1-10; А. В. Пхакадзе, А. А. Шестаков. О классификации особых точек дифференци- дифференциального уравнения первого порядка, не разрешенного относительно производ- производной. Матем. сборник, 1959, т. 49, вып. 1, с. 3-12.)
j 4. Нормальная форма уравнения, не разрешенного относительно ... 43 Рис. 29 Рис. 30 Поле направлений на поверхности уравнения имеет в соответствующей точке криминанты такую же особенность, как поле направлений векторно- векторного поля на плоскости в окрестности обыкновенной особой точки типа седло, фокус или узел. Поэтому возникающие здесь особые точки неявных диффе- дифференциальных уравнений называются сложенным седлом, фокусом или узлом: они получаются из обычных при помощи отображения складывания. Инте- Интересно, что складывание не вносит новых модулей: параметр к в нормальной форме определяется отношением собственных чисел линеаризации векторно- векторного поля, при складывании фазового портрета которого получается сложенная особая точка (рис. 29). Напротив, особые точки, в которых дискриминантная кривая имеет точ- точку возврата (проекции точек сборки Уитни отображения поверхности урав- уравнения на плоскость (ж, у)) имеют функциональные модули относительно не
44 Глава 1 только диффеоморфизмов, но и даже относительно гомеоморфизмов плос- плоскости (ж, у) (см. цитированную работу Давыдова). Брюс заметил, что при проекции интегральных кривых на плоскость (ж, у) в этом случае можно по- получить из семейства сечений ласточкиного хвоста {(а, 6, с): t4 + at2 + Ы + с имеет кратный корень} плоскостями а = const (рис. 30) при надлежащем гладком отображении ранга 2 пространства (а, 6, с) на плоскость (ж, у) (это следует из описанных перестроек волновых фронтов в V. I. Arnold. Wavefronts evolution and the equivariant Morse lemma. Comm. Pure and Appl. Math. 1976, 29, 6, 557-582, J. W. Bruce. A note on first-order differential equations of degree greater than one and wavefront evolution. Bull. London Math. Soc. 1984, 16, 139-144. Нерегулярные особые точки общего положения исследованы подробно А.А.Давыдовым (А. А. Давыдов. Нормальная форма уравнения, не разрешен- разрешенного относительно производной, в окрестности его особой точки.) § 5. Стационарное уравнение Шредингера В этом параграфе изложены простейшие математические основы элементарной квантовой механики. Мы не останавливаемся на физичес- физических мотивировках вводимых определений, но используем физическую терминологию для описания свойств решений уравнения. А. Определения и обозначения. В физике уравнение 9~Т' + (?-*7(ж))Ф = 0 A) dx2 называется стационарным уравнением Шредингера. Независимая переменная х называется декартовой координатой частицы. Неизвестная функция Ф, вообще говоря, комплексная, на- называется волновой функцией частицы; решения уравнения Шредингера называются состояниями частицы. Спектральный параметр Е называ- называется энергией частицы. Известная функция U называется потенциалом или потенциальной энергией частицы. Квантовая механика занимает- занимается в основном исследованием свойств уравнения A) и обобщающих его уравнений и систем уравнений с частными производными. Пример. Пусть [7 = 0. Тогда частица называется свободной. Уравнение Шредингера для свободной частицы с энергией Е — к2 имеет вид XX \^ • \ /
§5. Стационарное уравнение Шредингера 45 Это уравнение имеет два линейно независимых решения Ф+ = eikx, Ф_ = e~ikx. Эти два решения называются частицей, движущейся вправо (с импульсом к > 0), и частицей, движущейся влево, соответственно. Таким образом, про- пространство состояний свободной частицы с энергией Е — двумерное комп- комплексное пространство. Квадрат модуля волновой функции физики называют плотностью вероятности того, что частица находится в данном месте. Таким об- образом, свободная частица с импульсом к «с одинаковой вероятностью находится в любой точке» (этой терминологией можно пользоваться, не заботясь о том, что означают эти слова и как все это связано с теорией вероятностей). Б. Потенциальные барьеры. Предложим, что потенциал финитен (отличен от нуля лишь в не- некоторой области). Если U ^ 0, то говорят, что задан потенциальный барьер, а если U ^ 0 — потенциальная яма. Область, где потенциал отличен от нуля, называется носителем потенциала (рис. 31). Приход слева —> /////УХ. ~*~ Уход вправо Уход влево ~*~ у////ууууХ **~ Приход справа Рис. 31 Предположим, что энергия частицы Е = к2 положительна. Тог- Тогда левее носителя уравнение Шредингера A) совпадает с уравнением свободной частицы B). Следовательно, уравнение Шредингера имеет два решения, которые левее носителя совпадают с егкх и е~гкх соот- соответственно. Эти два решения называются частицей, приходящей слева, и частицей, уходящей влево, соответственно. Заметим, что решения эти определены при всех х, но совпадают с егкх и е~гкх лишь левее носителя. Точно так же существуют два решения, которые совпадают с егкх и е~гкх правее носителя. Эти решения называются частицей, уходящей вправо, и частицей, приходящей справа, соответственно.
46 Глава 1 ЗАДАЧА. Может ли частица, пришедшая слева, целиком отразиться влево (т. е. может ли волновая функция справа от барьера быть нулем, а слева нет)? Целиком уйти вправо? Ответ. Нет, да. В. Оператор монодромии. Определение. Оператором монодромии уравнения Шредингера A) с финитным потенциалом называется линейный оператор, действую- действующий из пространства состояний свободной частицы с энергией Е = к2 в себя, определенный следующим образом. Решению уравнения свободной частицы B) сопоставляется реше- решение уравнения Шредингера, совпадающее с ним левее носителя, а этому решению — его значение правее носителя. Оказывается, оператор монодромии обладает замечательными свойствами A, 1)-унитарности. Чтобы их сформулировать, введем сле- следующие Обозначения. Обозначим через Ж2 пространство вещественных решений уравнения Шредингера A). Пространство состояний частицы (т.е. пространство комплексных решений уравнения), является комп- лексификацией Ш2; мы его обозначим через С2 = СЖ2. Этому простран- пространству принадлежат все четыре состояния приходящей и уходящей влево и вправо частицы. Пространство вещественных решений уравнения свободной части- частицы B) обозначим через М2, (так как для свободной частицы U = 0). В этом пространстве имеется естественный базис ex = coskx, в2 = sinkx. Пространство состояний свободной частицы мы обозначим через С2,; это комплексификация пространства IRq. Естественный базис образу- образуют состояния частиц, движущихся вправо и влево соответственно. Мы обозначим их через f Лкх f —ikx /1-е ? /2-е Заметим, что ei, е2 тоже определяют базис в пространстве состояний. Эти два базиса связаны соотношениями /i = ei +ie2, h = ei - ге2.
§5. Стационарное уравнение Шредингера 47 Определение. Группа SUA, 1) A, 1)-унитарных унимодулярных матриц состоит из всех комплексных матриц второго порядка с опреде- определителем 1, сохраняющих эрмитову форму \zi\2 — l^]2. Иными словами, это матрицы (" ^), для которых а\2 - \Ь\2 = \с\2 - \d\2 = 1, ac-bd = 0, ad - be = 1. Теорема. Матрица оператора монодромии в базисе (/i, /2) при- принадлежит группе SUA, 1). Причина, по которой оператор монодромии принадлежит SUA, 1), состоит в том, что фазовый поток уравнения A) сохраняет площади. Для доказательства я напомню некоторые сведения о группе SUA, 1). Г. Алгебраическое отступление: группа SUA, 1). Рассмотрим вещественное линейное пространство Ж2 и его комп- лексификацию С2. Выберем в Ж2 элемент площади и будем обозначать через [?, rj] ориентированную площадь параллелограмма, натянутого на векторы ? и 7]. Кососкалярное произведение [, ] называется симплек- тической структурой. Если в Ш2 фиксирован базис (ei, ег), на кото- котором [ei, ег] = 1, то [?, rj\ равно определителю, составленному из компо- компонент векторов ?, ц в базисе ei, e<i. Комплексификация билинейной формы [,] задает симплектичес- кую структуру в С2; мы будем и ее обозначать теми же скобками. Заметим, что форма [,] невырождена: если [?,rj\ = 0 для всех ?, то 7] = 0. Рассмотрим в С2 эрмитову форму (?, rj) = |[?, rj]. Это действи- тельно эрмитова форма: (А^, г\) = А(^, rj), (^, rf) = G7, С)- Для дальней- дальнейшего полезно вычислить эрмитовы произведения векторов /1 = e\ и /2 = ei — ie2. Легко проверяется Лемма. Имеют место соотношения Доказательство. Например, I n -P \ ^ Г -P -P 1 ^ Г -f -f 1 % \/l? /l/ — 7) L/l 5 /lj — 7)|_/l5 /2j — К -i • Li Li Li A. I = 1.
48 Глава 1 Таким образом, эрмитова форма (, ) имеет «тип A,1)» (один положительный и один отрицательный квадрат в каноническом ви- де<^) = |г1|2-|*2|2). Рассмотрим теперь линейные преобразования плоскости С2, сохра- сохраняющие эрмитову, симплектическую и вещественную структуры. Определение. Группа линейных преобразований плоскости С2, сохраняющих эрмитову форму ( , ), называется A,1)-унитарной груп- группой и обозначается через U(l, 1). Группа линейных преобразований плоскости С2, сохраняющих симплектическую структуру [ , ], называется специальной [или уни- модулярной) линейной группой второго порядка и обозначается че- через SLB, С). Группа всех вещественных линейных преобразований плоскос- плоскости С2 (т.е. группа, элементы которой — комплексификации линейных преобразований в Ж2) называется вещественной линейной группой вто- второго порядка и обозначается через GLB, Ж). Таким образом мы определили в группе GLB, С) всех линейных преобразований в С2 три подгруппы: A,1)-унитарную U(l, 1), унимо- дулярную SLB, С) и вещественную GLB, Ж). При этом эрмитова форма ( , ), определяющая унитарную группу, симплектическая структура [,], определяющая унимодулярную груп- группу, и комплексное сопряжение, определяющее вещественную группу, связаны соотношением (а, Ь) = ^[а, Ъ]. Li Теорема. Пересечение любых двух из этих трех подгрупп совпа- совпадает с пересечением всех трех (рис. 32). Это пересечение называется специальной A, 1)-унитарной группой1 и обозначается через SUA, 1). (Оно также называется вещественной унимодулярной группой и обозначается через SLB, Ж). Оно называет- называется также вещественной симплектической группой второго порядка и обозначается через Sp(l, Ж).) Доказательство. Если преобразование А вещественно и унимодулярно, то [А?, Arj\ = = [?, rj] и А?=А?. Поэтому (А?, Avj) = ^ [А?, Arj\ = -| L4?, Arj] = ^ [?, rj] = (?, if). ill 1 Подчеркнем, что речь идет о группе операторов, а не матриц. Матрицы этих операторов принадлежат группе матриц SUA, 1) при специальном выборе базиса, указанном выше.
;5. Стационарное уравнение Шредингера 49 Если А вещественно и A, 1)-унитарно, то (А?, Аг)) = (?, rf) и А?=А?. Поэтому = -2t<?, If) = [?, rj\. Если А A,1)-унитарно и унимодулярно, то [А?, Arj\ = [?, ту] и [-^С? ^] — [С? *?]• Поэто- Поэтому [yl?, Лту] = [^4^? ^] Для всех ^ и ту- Следо- Следовательно, [?, Лту — -А/у] = 0 для всех ^ и зна- значит Аг\ = Л^ для всех 7], т. е. А вещественно. " Рис. 32 Следствие.Если матрица оператора в вещественном базисе (ei, ег) вещественная унимодулярная, то матрица этого оператора в комп- комплексно сопряженном базисе (/i = е\ + гв2, /2 = е.\ — ie-i) специальная A, 1)-унитарная, и обратно. Доказательство. Эрмитов скалярный квадрат вектора zifi + ?2/2 выражается через координаты (zi, 22) в базисе (/i, /2) по формуле (z, z) = \z\\2 — \z2\2 (см. лемму). Поэтому (матрица А в базисе (ei, ег) вещественна и уни- модулярна) ^(ie GLB, М) П SLB, С)) ^ (i e SUA, I)) ^^ <^=^> (матрица Л в базисе (Д, /2) A, 1)-унитарна и унимодулярна). ¦ Д. Геометрическое отступление: SUA, 1) и геометрия Лобачевского. Группы матриц SLB, Ж) и SUA, 1) следующим образом связаны с геометрией Лобачевского (рис. 33). SLB, Рис. 33 Рис. 34 Вещественная унимодулярная матрица второго порядка определя- определяет дробно-линейное преобразование z 1—> ——-, переводящее в себя верхнюю полуплоскость. Это преобразование является движением 4 В. И. Арнольд
50 Глава 1 плоскости Лобачевского, представленной в виде верхней полуплоскос- полуплоскости. Все движения плоскости Лобачевского получаются таким способом. Группа движений плоскости Лобачевского изоморфна SLB, Ж)/±Е. Унимодулярная A,1)-унитарная матрица второго порядка опреде- определяет дробно-линейное преобразование, переводящее в себя единичный круг. Действительно, конус \zi\2 < \z2\2 при A,1)-унитарном унимоду- лярном преобразовании переходит в себя. При естественном отображе- отображении этот конус переходит в единичный круг |ги| < 1, а линейные преобразо- преобразования в С2 переходят в дробно-линейные преобразования СР1 (рис. 34). Получающиеся из матриц из SUA, 1) дробно-линейные преобразо- преобразования единичного круга в себя являются движениями плоскости Ло- Лобачевского, представленной как внутренность единичного круга. Все движения плоскости Лобачевского получаются таким способом. Груп- Группа движений плоскости Лобачевского изоморфна SUA, 1)/ ± Е. Группы матриц SLB, Ж) и SUA, 1) изоморфны: они получаются из одной и той же группы операторов. Матрицы этих операторов в ве- вещественном базисе (ei, е2) принадлежат SLB, Ж), а в комплексно со- сопряженном базисе (/i, /2) принадлежат SUA, 1). Переход от SLB, Ж) к SUA, 1) соответствует переходу от вещественного базиса к комп- комплексно сопряженному и от модели плоскости Лобачевского на верхней полуплоскости к модели в единичном круге. Задача. Докажите, что группа SLB, R) гомеоморфна полноторию S1 xD2 (внутренности баранки). Е. Свойства оператора вещественной монодромии. Вернемся к оператору монодромии уравнения Шредингера A). Кроме пространств Ж2 и IR2, решений уравнения A) и уравнения свобод- свободной частицы B), рассмотрим еще фазовую плоскость М|. Точки фазовой плоскости — это пары вещественных чисел (Ф, Фж). Зафиксируем х 6 Ш. Рассмотрим линейный оператор, сопоставля- сопоставляющий каждому (вещественному) решению уравнения A) его начальное условие в точке х Вх: Ж2 -+ М|, Ф \-ч- (Ф(ж), Фх{х)). Этот оператор — изоморфизм. Изоморфизм g^ — Bx'2(BXl)~1 называ- называется фазовым преобразованием от х\ к Х2-
§5. Стационарное уравнение Шредингера 51 Для уравнения свободной частицы B) оператор (решение i—> фа- фазовая точка) 2 2 определяется таким же образом. В этих обозначениях вещественный оператор монодромии М опре- определяется коммутативной диаграммой изоморфизмов. ТВ2 Kg By М к Eg Здесь л означает точку х левее носителя, а п — правее. От выбора этих точек оператор М не зависит. Теорема. Определитель оператора монодромии уравнения Шредин- Шредингера равен 1. Доказательство. В пространстве вещественных состояний свободной частицы IRq выбран базис е\ = cos/гж, в2 = sin/гж. В вещественном фазовом про- пространстве Жф выбраны координаты Ф, Фж, следовательно, также отме- отмечен базис. Матрица оператора Bq имеет в этом базисе вид —ksinkx kcoskxj ' Следовательно, det Bq = k не зависит от х. В частности, определи- определители левого и правого вертикальных изоморфизмов в диаграмме оди- одинаковы. Следовательно, detM = detg? (диаграмма коммутативна). Но фазовый поток сохраняет площади по теореме Лиувилля (в уравнение Шредингера не входит член с Фж). Значит, detg? = 1. Следователь- Следовательно, detM =1. ¦ Ж. Свойства оператора комплексной монодромии. Доказательство теоремы об A,1)-унитарности из п. В. Комплексный оператор монодромии есть комплексификация ве- вещественного (см. п. В).
52 Глава 1 Матрица оператора монодромии в вещественном базисе (ei, 62) принадлежит SLB, Ж) (см. п. Е). Следовательно, матрица этого опе- оператора в комплексно сопряженном базисе (/i = е\ + гег, /г = е.\ — «ег) принадлежит SUA, 1) (см. п. Г, следствие). ¦ ЗАДАЧА. Доказать, что у уравнения Шредингера A) не может быть не- ненулевого решения, совпадающего с аег х левее носителя и с Ъе~г х правее носителя (частица не может приходить, не уходя). Решение. Оператор монодромии сохраняет A,1)-эрмитов квадрат \zi\2 - \z2\2. Но {aeikx, aeikx) = \а\2, (be~ikx:, be~ikx) = -\Ъ\2 (см. лемму п. Г.). Следовательно, \а\2 = —16|2, т. е. а = Ъ = 0. 3. Коэффициенты прохождения и отражения. Определение. Говорят, что частица, пришедшая слева, с импуль- импульсом к > 0 прошла барьер с коэффициентом прохождения \А\2 и коэф- коэффициентом отражения \В\2, если уравнение Шредингера A), в кото- котором Е = к2, имеет решение Ф, равное егкх _|_ ве-гкх левее барьера, Аегкх правее барьера (рис. 35). Лемма. Решение Ф и комплексные постоянные А и В, удовле- удовлетворяющие описанным условиям, существуют и единственны при лю- любом к > 0. Доказательство. Рассмотрим уходящую вправо частицу (решение, равное егкх правее барьера). Слева ^ от барьера это решение, как и любое другое, имеет вид линейной комбинации егкх и е~гкх, х причем коэффициент при егкх отличен от ну- нуля ввиду A,1)-унитарности оператора моно- Рис. 35 дромии (см. задачу в п. Ж). Разделив на этот отличный от нуля коэффициент, получаем требу- требуемое решение. Итак, коэффициенты А и В определены однозначно. ¦ Задача. Доказать, что коэффициент прохождения всегда отличен от нуля. Решение. Если Ф = 0 справа от барьера, то Ф = 0 и слева.
§5. Стационарное уравнение Шредингера 53 Теорема. Сумма коэффициентов прохождения и отражения равна единице. Доказательство. Лемма. Матрица оператора монодромии в базисе (/i = егкх, f2=e~lkx) выражается через комплексные коэффициенты А и В по фор- формуле / -В/АЛ J Доказательство. По определению коэффициентов А и В, оператор монодромии дей- действует так, что /i + Вfi '—> Afi Поскольку оператор монодромии ве- вещественный, мы можем найти и образ комплексно сопряженного век- вектора. Учитывая, что Д = /2, получаем /г + Bfi 1—> А Д. Деля на А ф О и А ф 0, получаем матрицу обратного к монодромии оператора , / IIА В~/А [Чтобы обратить унимодулярную матрицу второго порядка, доста- достаточно поменять местами диагональные элементы и изменить знаки не- недиагональных: а Ъ\ ( d -Ь\ _ fad -be О с dj \—с а) \ 0 ad — be Условия М G SUA, 1) дают 1/\А\2 - \В\2/\А\2 = 1. ¦ Задача. Вычислить коэффициенты прохождения и отражения для по- потенциала, равного константе С/о при 0 ^ х ( аи нулю в остальных местах (рис. 36). Ответ. 2 _ _ л Uq sin2 aki + АЕ{Е - С/о) где Е — fc2, E — Uo — k\ (проходя над барьером, частица замедляется, поэтому плотность вероятности найти ее в пределах барьера больше, чем вне). При
54 Глава 1 Е=к Рис. 36 Рис. 37 больших E коэффициент отражения стремится к О, \в АЕ{Е - С/о) sin ak\. Если энергия частицы меньше высоты барьера, то коэффициент прохож- прохождения экспоненциально мал: | д\2 — 4fc >с II /72, 2\i2 ,,172 2' где Е = к2, Uo — Е = х2 (рис. 37). Хотя коэффициент прохождения через высокий и широкий барьер мал, он все же всегда отличен от нуля («туннель- («туннельный эффект»: квантовая частица «проходит под барьером», непреодолимым для классической). И. Матрица рассеяния. Наряду с прохождением через барьер сле- 1 ва направо, можно рассматривать прохождение справа налево. Соответствующее решение \&2 2 равно х В2е ikx Рис. 38 А2е правее барьера, левее барьера (рис. 38). Определение. Матрицей рассеяния (или 5-матрицей) называется матрица А В S = В2
§5. Стационарное уравнение Шредингера 55 Замечание. Исходя из стационарного уравнения Шредингера, не- нелегко понять, какой оператор соответствует этой матрице и почему эта матрица обладает замечательными свойствами, которые мы сейчас до- докажем. Объяснение состоит в том, что S «преобразует приходящие час- частицы в уходящие» — этим словам можно придать точный смысл, если рассмотреть нестационарное уравнение (чего мы делать не будем). Теорема. Матрица рассеяния унитарна, причем коэффициенты прохождения слева направо и справа налево одинаковы: А = А2. Доказательство. Оператор монодромии действует так: A2f2 ^ /2 + B2fi, A2/i 1—> /1 + В2/2. Следовательно, / 1/А2 В2/А2 (М) = \В2/А2 1/А2 Сравнивая с вычисленной в лемме п. 3 матрицей, получаем А2 =А, В2 = -В А/А. Поскольку \А\2 + \В\2 = \А2\2 + \В2\2 = 1 и АВ2 + В~А2 = 0, матрица S унитарна. ¦ Замечание. Мы рассматривали уравнение Шредингера A) с веществен- вещественным значением спектрального параметра Е = к2. Очень полезным оказыва- оказывается также рассмотрение комплексных значений к. При этом оказывается, что свойства унитарности и симметрии матрицы рассеяния имеют место и при комплексных к. Кроме того, S обладает свойством «вещественнос- «вещественности», S(—k) = S(k), и «аналитичности»: А(к) является предельным значением функции, аналитической в верхней полуплоскости Im к > О, имеющей конеч- конечное число полюсов на мнимой оси. Поскольку коэффициенты прохождения и отражения можно измерять, возникает т. н. обратная задача теории рассеяния об определении потенциа- потенциала U по матрице рассеяния S(K). Потенциал U задается вещественной функцией на вещественной пря- прямой или двумя вещественными функциями на полупрямой. Коэффициенты А и В — это две комплексные функции на полуоси к > 0, т. е. четыре вещест- вещественные функции на полуоси. Условие унитарности \А\2 + \В\2 — 1 снижает число вещественных функций на полуоси с четырех до трех.
56 Глава 1 Поскольку 3 > 2, можно ожидать, что не всякая пара А, В с услови- условием \А\ + |Д| = 1 соответствует потенциалу; для восстановления потенциала по А и В нужно наложить на эти коэффициенты еще одно условие. Таким условием и оказывается условие аналитичности. Как это ни удивительно, приведенные здесь грубые эвристические со- соображения, основанные на подсчете числа произвольных функций, удалось превратить в точно формулируемые и доказанные теоремы (выходящие, од- однако, за рамки нашего курса). К. Связанные состояния. Рассмотрим теперь потенциал в виде финитной ямы (U(x) ^ О, U(oo) = 0). Говорят, что частица находится в яме, если Ф —> 0 при х —>• ±00 (рис. 39). Ясно, что частица может находиться в яме лишь если ее энергия Е отрицательна. Левее и правее ямы решение имеет вид линейной комбинации экспонент e >cx r. — >cx , где к2 = -Е, х > 0. Следовательно, условие нахождения частицы в яме состоит в том, что левее ямы обращается в нуль коэффициент при растущей влево экспо- экспоненте, а правее ямы — при растущей вправо. Решение с такими свой- свойствами существует не при всяком отрицательном значении энергии. -ц Рис. 39 Рис. 40 Оказывается, если яма достаточно глубока и широка, то сущест- существует конечное число отрицательных значений энергии Е, при которых частица может стационарно находиться в яме; этих значений тем боль- больше, чем глубже и шире яма. Соответствующие значения Е называются стационарными уров- уровнями, а волновые функции Ф, затухающие при х —>• ±оо, называют- называются связанными состояниями (в случае, если яма не финитна, требует- требуется / |Ф|2(/Ж < 00). Задача. Определить стационарные уровни энергии в прямоугольной яме глубины С/о, расположенной между х = 0 и х = а (рис. 40).
6. Геометрия уравнения второго порядка 57 Ответ. Е = 4— — С/о, где ? — корни уравнений > 0 для первого уравнения, tg? < 0 для второго). ЗАДАЧА. Докажите, что волновые функции Фл, соответствующие связан- связанным состояниям с разными уровнями энергии, ортогональны: J Ф1Ф2 dx = 0. ЗАДАЧА *. Как связаны стационарные уровни энергии связанных состо- состояний и полюса б'-матрицы на мнимой оси fc? § 6. Геометрия дифференциального уравнения второго порядка и геометрия пары полей направлений в трехмерном пространстве Здесь обсуждаются локальные свойства решений дифференциального уравнения второго порядка, которые являются геометрическими, т. е. инва- инвариантными относительно диффеоморфизмов плоскости зависимой и незави- независимой переменных. С каждым дифференциальным уравнением второго порядка связана па- пара полей направлений в трехмерном пространстве. Задача локальной класси- классификации уравнений второго порядка с точностью до диффеоморфизмов плос- плоскости оказывается эквивалентной задаче локальной классификации пар полей направлений общего положения в трехмерном пространстве с точностью до диффеоморфизмов пространства. Ниже рассматриваются инварианты и «нор- «нормальные формы» в этих двух эквивалентных задачах. А. Конфигурационные свойства решений линейных уравнений. Графики решений уравнения —- = 0 (прямые) удовлетворяют конфи- dx гурационным теоремам (Паппа, Дезарга и т. д.) проективной геометрии. Теорема. Семейство графиков всех решений любого линейного однород- однородного уравнения второго порядка dx2 dx локально (в окрестности любой точки х = хо) диффеоморфно1 семейству графиков всех решений простейшего уравнения —- = 0. dx 1гГ. е. существует диффеоморфизм окрестности прямой ж = жо на плоскос- плоскости (ж, у), переводящий графики решений в прямые.
58 Глава 1 Следствие. Конфигурационные теоремы проективной геометрии вы- выполняются {локально) для графиков решений любого линейного уравнения вто- второго порядка, например, для семейств кривых у — A sin ж + Bcosx или у = Аех + Ве ~х Доказательство. Рассмотрим решение yi, не обращающееся в нуль в точке жо, и другое решение, уг, обращающееся в 0 в точке жо, но не равное нулю тождественно. Формулы задают искомый диффеоморфизм. ¦ Замечание 1. Координаты (X, Y) определены с точностью до дроб- дробно-линейного преобразования (которому они подвергаются при замене ре- решений у г и у 2 их линейными комбинациями). В частности, координата X задает на оси ж структуру локально проективного одномерного многообразия (атлас, в котором функции перехода — проективные преобразования прямой, т. е. дробно-линейные функции.) Точно так же на плоскости (ж, у) линейное однородное уравнение вто- второго порядка задает структуру локально проективной плоскости. Замечание 2. Эквивалентностью локально проективных многообра- многообразий называется диффеоморфизм, переводящий одну локально проективную структуру в другую. Задача. Перечислить все различные структуры локально проективного многообразия с точностью до эквивалентности а) на прямой, б) на окружнос- окружности. Указание. Все локально проективные структуры на прямой индуциро- индуцированы отображением в проективную прямую (т. е. в окружность) с не обраща- обращающейся в нуль производной; число прообразов точки окружности при этом отображении — инвариант структуры. Двулистное накрытие проективной прямой задает на окружности струк- структуру локально проективного многообразия, не эквивалентную структуре про- проективной прямой. Однако не всякая локально проективная структура на окружности индуцируется из структуры проективной прямой. Классифика- Классификация локально проективных структур на окружности связана с классификаци- классификацией уравнений Хилла (линейных уравнений второго порядка с периодическими коэффициентами). Уже уравнения с постоянными коэффициентами задают структуры, не индуцируемые с проективной прямой.
§6. Геометрия уравнения второго порядка 59 Б. Нормальная форма квадратичной части уравнения второго порядка в окрестности данного решения. Рассмотрим теперь произвольное нелинейное уравнение второго порядка dx2 Мы собираемся исследовать геометрию двухпараметрического семейст- семейства кривых, заданного этим уравнением на плоскости (ж, у). В частности, нас интересует вопрос, выполняются ли в этом семействе конфигурацион- конфигурационные теоремы и можно ли это семейство выпрямить (превратить в семейство прямых) подходящим диффеоморфизмом плоскости. Мы увидим, что такое выпрямление возможно не всегда, и укажем инварианты, измеряющие «ин- финитезимальную недезарговость» (нарушение конфигурационных теорем). Теорема. Всякое дифференциальное уравнение второго порядка в окрест- окрестности каждого линейного элемента (ж, у, р) плоскости зависимой и незави- независимой переменной может быть приведено локальным диффеоморфизмом этой плоскости к виду в окрестности элемента (ж = 0, у — О, р — 0). Доказательство. 1°. Уничтожение линейных членов. Данный линейный элемент определяет единственное решение, график которого можно принять за ось ж. Линеаризуем данное уравнение в окрест- окрестности этого решения. Полученное линейное уравнение, по теореме п. А, мож- d2y но локально выпрямить (привести к виду —- = 0) подходящим выбором1 dx системы координат. В этой системе координат наше уравнение второго по- порядка имеет правую часть Ф(ж, у, р), которая обращается в нуль при у = 0, р = 0 вместе с производными по у и по р. Таким образом, в рассматриваемой системе координат разложение Ф в ряд Тейлора по у и р начинается с членов не ниже второй степени: pL = А(х)у2 + В(х)ур + С(х)р2 + О(\у\* + \р\"). dx ^^Для дальнейшего полезно заметить, что если правая часть Ф была многочленом степени n J> 1 по аргументу р, то и в новых координатах, построенных в п. А, будет выполнено то же свойство.
60 Глава 1 2°. Преобразование независимой переменной. Рассмотрим локальный диффеоморфизм плоскости (ж, у), заданный под- подстановкой ж = F(X, У), у = У (переводящий точку с координатами (ж, у) в точку с координатами (X, У)). Лемма. Уравнение преобразуется указанной подстановкой в уравнение = Ф(Х, У, Р), где d2Y dX2 Ф(Х, У, Р) = рф[ F, У, Р = dY dX' F" + 2PFY + P2FYY здесь А = F' + PFY, штрих обозначает частную производную по X, аргумен- аргументами F и производных F являются X uY. Доказательство. Пусть у — и(х) — решение исходного уравнения, У = U(X) — его образ. Тогда р Следовательно, d2U д dX2 Далее, d du dX dx dU dX d du dX dx _ du dx • a F F(X,U{X)) _ d2u F(X,U(X)) dx2 ' + PFY), ^ F(X,U(X)) P A' ( F" + 2FYP + FYYP2 dX2 = «4_| Д = Ф F(X, ЩХ)), U(X), ? А. Итак, 1 1 d2U — , U, д J A Y + P tYY) , откуда и вытекает приведенная выше формула. ¦ Из доказанной формулы непосредственно вытекает Следствие 1. Пусть Ф = 0. Тогда Ф — многочлен не выше третьей степени относительно Р.
§6. Геометрия уравнения второго порядка 61 Следствие 2. Пусть Ф — многочлен не выше третьей степени относи- относительно р. Тогда Ф — многочлен не выше третьей степени относительно Р. Замечание. Многочлены степени не выше п ^ 4 по р при нашем преоб- преобразовании Ф i—у Ф уже не переходят в многочлены относительно Р. Дейст- вительно, А3 [ ~г ) — не многочлен относительно Р при п > 3. Следствие 3. Дифференциальное уравнение второго порядка задает на графике каждого своего решения структуру локальной проективной прямой и на нормальном расслоении к графику — структуру локально проективной плоскости. Доказательство. Рассмотрим уравнение в вариациях вдоль данного решения. Это — ли- линейное однородное уравнение второго порядка, поэтому на плоскости зависи- зависимой и независимой переменной возникает структура локально проективной плоскости, а вдоль исходного решения — структура локально проективной прямой (см. п. А). В обозначениях леммы уравнение в вариациях имеет вид —- = Фц., dx где Ф = Ф1 + Фг + ... — разложение в ряд по степеням у и р. Рассмотрим теперь нормальное расслоение графика рассматриваемого решения на плоскости. Нормальное пространство подмногообразия в некото- некоторой его точке есть фактор-пространство касательного пространства к объ- объемлющему многообразию по модулю касательного пространства к подмного- подмногообразию в рассматриваемой точке. Нормальное расслоение подмногообразия есть объединение нормальных пространств во всех точках подмногообразия (снабженное естественной проекцией на подмногообразие). Решение уравнения в вариациях можно считать принимающими значе- значения в нормальном расслоении графика рассматриваемого решения исходного уравнения. В самом деле, уравнение в вариациях определялось при помощи системы координат (ж, у), в которой ось х была графиком рассматриваемого решения. Значение решения уравнения в вариациях в точке — это касательный к объ- объемлющей плоскости вектор у-направления в рассматриваемой точке оси х. Его проекция в нормальное пространство к оси х в этой точке определяет вектор нормального расслоения. Решения уравнения в вариациях определя- определяют, таким образом, кривые в пространстве нормального расслоения. Оказы- Оказывается, эти кривые не зависят от того, какая система координат использо- использовалась для их построения; именно в этом смысле мы и говорим, что уравнение в вариациях можно рассматривать как уравнение в нормальном расслоении.
62 Глава 1 Доказательство выделенного утверждения легко извлечь, например, из доказанной выше леммы. В обозначениях леммы доказываемое утверждение означает, что ес- если F(X, 0) = X и Фх — линейный по у и р член разложения Ф в ряд Тейлора по у и р, то &i(X, У, Р) = Фг(Х, Y, Р). Последнее равенство легко следует из формул леммы. Итак, заданная уравнением в вариациях структура локально-проектив- локально-проективной плоскости задана на нормальном расслоении. ¦ 3°. Преобразование зависимой переменной. Рассмотрим локальный диффеоморфизм плоскости (ж, у), заданный под- подстановкой у — G(X, Z), х — X, переводящий точку с координатами (ж, у) в точку с координатами (X, Z). Лемма. Уравнение d2y ^i ч dy —2 = #(*, „, р), р=Тх, преобразуется указанной подстановкой в уравнение 0 = Цх, z, п), п = §, где Ф(Х, Z, П) = ^-[Ф(Х, G(X, Z), G' + UGZ) - G" - 2UG'Z - U2GZz]; Gz здесь штрих есть частная производная по X, аргументами у G и ее произ- производных всюду являются X и Z. Доказательство. Пусть у — v(x) — решение исходного уравнения, Z — V(X) — его образ. Тогда -j- — G + V Gz ах (здесь и далее аргументы у С и ее производных — X и V(X)). Далее, Щ = G" + 2G'ZV' + GzzV'2 + GZV" = Ф(Х, G, Gf + XGZ). dx Находя V" из последнего равенства, получаем формулу, приведенную в лемме. ¦ Из доказанной леммы непосредственно вытекают
§6. Геометрия уравнения второго порядка 63 Следствие 1. Пусть Ф = 0. Тогда Ф — многочлен не выше второй сте- степени относительно П. Следствие 2. Пусть Ф — многочлен не выше п-й степени относитель- относительно р, п ^ 2. Тогда Ф — многочлен не выше п-й степени относительно П. 4°. Вычисление квадратичных членов. Рассмотрим локальный диффеоморфизм плоскости, заданный подста- подстановкой. х = F(X, Z) = X + f(X)Z + O(\Z\2), у = G(X, Z) = Z + g(X)Z2 + O(\Z\3). Лемма. Уравнение ^| (,у,р), р^, dx dx преобразуется указанной подстановкой в уравнение 0 = *(x,z,n), п=§, где , Z, П) = Ф(Х, Z, П) + п(Х, Z, П) + O(\Z\3 + |П|3), a = -g", P = -±g' + f'\ 7 = -2g+2f (в качестве аргумента у /, g и их производных подставлено X). Доказательство получается применением лемм о преобразовании сна- сначала независимой, а затем зависимой переменной. Разлагая правые части полученных там формул в ряд по (Z, П) и оставляя лишь квадратичные чле- члены, получим в качестве добавки к квадратичным членам Ф указанную выше величину Q. ш 5°. Приведение квадратичных членов. Обозначим квадратичные члены исходной правой части Ф через Ф2 = Ау2 + Вур + Ср2. Тогда квадратичные члены для преобразованного уравнения будут Ф2 = (А - g")Z2 + (B- 4g' + f")ZIL + (C-2g+ 2/')П2 (у функций А, В, С, /, g и их производных в качестве аргумента подстав- подставлено X, совпадающее, впрочем, с х вдоль рассматриваемого решения). Непо- Непосредственно проверяется
64 Глава 1 Лемма. Величина I = QA - 2В' + С" не меняется при переходе от Фг кФг- Выбирая произвольные функции fug, можно аннулировать два из трех коэффициентов А, В, С (сохраняя величину /). В частности, выберем fug из условий 4g - f" = В, 2g-2f = С. Тогда получим Ф2 = AZ2, ~А = ^, что и доказывает теорему. ¦ В. Инфинитезимальная недезарговость. Система координат, в которой дифференциальное уравнение второго по- порядка записывается вблизи графика фиксированного своего решения в виде определена неоднозначно. Исследуем, в какой мере коэффициент Л, пре- препятствующий выпрямлению семейства решений и измеряющий инфините- зимальную недезарговость в данной точке по данному направлению, инвари- инвариантен, т. е. не зависит от способа приведения к нормальной форме. Теорема. Дифференциальная форма степени 5/2 вдоль графика нулевого решения ш = A(x)\dx\5/2 определена инвариантно, с точностью до мультипликативной постоянной. Иными словами, если (X, Y) — другая система координат, в которой уравнение также записывается в нормальной форме, причем решению Y = О отвечает у — 0 и коэффициент А(х) заменен на А(Х), то _ 5/2 А(Х) = СА(х) || где С не зависит от х. Мы будем называть форму ш «формой недезарговости вдоль данного ре- решения». Доказательство. Наиболее общий диффеоморфизм, оставляющий на месте ось у = 0, пе- переводит точку (ж, у) в точку X = /о (ж) + yfi(x) + ..., Y = ygl(x) + y2g2(x) + ...
§6. Геометрия уравнения второго порядка 65 Вектор нормального расслоения, приложенный в точке ж и имеющий у-ком- поненту ?, переходит при этом в вектор, приложенный в точке /о (ж) и име- имеющий у-компоненту gi(x)^. Проективная структура нормального расслоения определена инвариант- инвариантно (см. п. Б), поэтому преобразование (ж, ?) i—> (/о(ж), gi(x)^), построенное по диффеоморфизму (ж, у) i—У (X, Y), переводящему некоторое уравнение в нормальной форме в уравнение в нормальной форме, должно быть проек- проективным. Отсюда мы находим , _ ах + Ь _ С /0 ~ сх + d' g d' gl cx + d' Всякий диффеоморфизм, оставляющий на месте ось у = 0 и сохраня- сохраняющий проективную структуру ее нормального расслоения, можно поэтому представить в виде произведения специального преобразования X = fo(x), Y = ygl(x) и диффеоморфизма, сохраняющего нормальное расслоение поточечно: (X, У)^(Х + ?МХ) + ...,? + 2 Последний диффеоморфизм можно представить в виде произведения преобразований зависимой и независимой переменной, рассмотренных в п. Б. Поэтому составленный из квадратичных по у и р членов правой части урав- уравнения инвариант / (см. п. Б, 5°) при этом диффеоморфизме не меняется. Исследуем поведение / при специальном проективном преобразовании. Всякое проективное преобразование прямой разлагается в произведение сдвигов, растяжений и преобразования х \—У —. Величина / инвариантна относительно сдвигов, а при растяжениях х и у лишь умножается на постоянную. Поэтому достаточно рассмотреть ее поведение при замене ж = —, у = —. X X Вычисляя производные Р = -j— и -j— = -, находим Р = у — рх, dX dX dX dP ,r--\dp . (fj/, ^ —— = X —- (где «=——). Следовательно, dX dx dx а У -V-—з \ r- — л. л dX2 •¦2 , \^ —5 Поэтому коэффициент при Y2 равен Х~5А(х). 5 В. И. Арнольд
66 Глава 1 Г. Построение скалярных инвариантов. Из определенной выше дифференциальной формы ш можно получить ска- скалярные функции, инвариантно связанные с уравнением. Прежде всего заметим, что с дифференциальной формой ш (любой степе- степени) на одномерном многообразии инвариантно связано векторное поле (форма степени —1): значение формы на векторе этого поля в каждой точке равно 1. Например, с формой A(x)(dxM^2 инвариантно связано поле v(x) —, где v — А~2/5. Теорема. Пусть v(x) -jr- — векторное поле на прямой. Тогда следую- С/Х щие скалярные функции связаны с полем инвариантно относительно проек- проективных преобразований прямой: h — 2v v - v , h — 2v v , ... , In — vln_1, ... Здесь штрих означает производную по х. Доказательство. Инвариантность /г легко проверить непосредственным вычислением: достаточно рассмотреть замену х = —, так как инвариантность относитель- X. но сдвигов и растяжений очевидна. Производная функции вдоль заданного поля связана с функцией и полем инвариантно не только относительно проек- проективных преобразований, но и относительно всех диффеоморфизмов прямой. Поэтому инвариантность всех 1п вытекает из инвариантности /г. ¦ Замечание 1. Инвариант /г построен из следующих соображений. Ал- Алгебра Ли проективной группы прямой порождена полями —, ж — , ж2 — .1 CJX CJX CJX Поэтому каждое векторное поле в любой точке с точностью до квадратичных членов включительно можно аппроксимировать проективным полем (полем из алгебры Ли проективной группы). 1 Соответствующие однопараметрические группы проективных преобразований имеют в аффинных координатах вид gbx = ж + t, glx = е*ж, gtx = (ж/1 — tx) и, следовательно, в однородных координатах задаются унимодулярными матрицами второго порядка 1 Л /ехр(</2) 0 \ / 1 О О 1) ' ^ 0 exp(-t/2)y ' \-t I Поэтому матрицы производящих операторов суть О 1\ /1/2 0 \ /00 0 0J ' I 0 —1/2/ ' \-1 0
§6. Геометрия уравнения второго порядка 67 При проективных преобразованиях проективное поле, аппроксимирую- аппроксимирующее исходное поле в исходной точке, переходит в новое проективное поле, аппроксимирующее преобразованное поле в точке-образе. Действие проектив- проективных преобразований прямой на трехмерном пространстве проективных полей есть присоединенное действие проективной группы на своей алгебре Ли. Но такое действие сохраняет квадратичную форму на алгебре. Действительно, если записывать проективные преобразования матрицами второго порядка, а проективные поля — матрицами соответствующих им производящих опе- операторов однопараметрических групп, то действие преобразования g на поле v записывается как произведение матриц gvg~x. Но det gvg~x — det v. Поэтому определитель матрицы v является квадратичной формой на алгебре Ли проек- проективных полей, инвариантной относительно присоединенного представления. Следовательно, этот же определитель, вычисленный для проективного поля, аппроксимирующего заданное векторное поле, является скаляром, связанным с данным полем инвариантно относительно проективных преобразований. Аппроксимирующее проективное поле имеет в указанном выше базисе алгебры Ли компоненты (v, г/, v"/2). Соответствующая полю матрица имеет поэтому вид v'/2 v -v"/2 -«'/2, ее определитель и есть /г (с точностью до несущественного множителя). Замечание 2. По-видимому, всякая функция (многочлен, ряд ...) от зна- значений v и конечного числа производных v, инвариантно связанная с полем v относительно проективных преобразований, выражается через построенные инварианты Ik- Замечание 3. Проективные инварианты функции на проективной пря- прямой можно построить так: функции сопоставляется ее дифференциал A-фор- ма), форме — поле, полю — инварианты //,. В частности, простейшим инва- инвариантом функции / относительно проективных преобразований независимой переменной является 2/7'" - з/ Hf\ = pi (эта величина отличается от производной Шварца, инвариантной относитель- относительно проективных преобразований оси значений функции, лишним множите- множителем /' в знаменателе). Замечание 4. Построенные выше инварианты /г, /з, ... при умноже- умножении векторного поля на число А умножаются на Аг, Аз, ... Из них легко составить комбинации, уже нечувствительные к умножению поля на число, например, J = /|/^з-
68 Глава 1 Величина J, соответствующая полю v, построенному по E/2)-форме ш, является скалярной функцией на пространстве линейных элементов плоскос- плоскости, уже совершенно не зависящей от выбора координат, но лишь от исходного дифференциального уравнения второго порядка. Д. Уравнения, кубические относительно производной. Обращение в нуль построенной выше формы недезарговости ш вдоль лю- любого решения необходимо для выпрямления уравнения (приведения его к ви- виду —- = 0), но, как мы сейчас увидим, недостаточно. dx Теорема 1. Предположим, что дифференциальное уравнение приводится к виду d2y/dx2 — 0 диффеоморфизмом плоскости. Тогда Ф — мно- многочлен не выше третьей степени относительно р. Иными словами, дифференциальное уравнение семейства всех прямых на плоскости, записанное в любой системе криволинейных координат, име- имеет правой частью многочлен не выше третьей степени относительно первой производной. Теорема 1 вытекает из следующего (удивительного) факта: Теорема 2. Предположим, что правая часть дифференциального урав- уравнения —| = Ф(ж, у, р) dx — многочлен не выше третьей степени относительно р. Тогда после любо- любого диффеоморфизма плоскости уравнение переходит в уравнение такого же вида, т. е. правая часть остается многочленом не выше третьей степени, относительно производной. Доказательство. Теорема 2 вытекает из лемм п. Б о действии замен независимой и за- зависимой переменной на правую часть уравнения (см. следствия в п. Б), так как любой локальный диффеоморфизм плоскости можно получить, последо- последовательно применяя такие замены. ¦ Доказательство. Теорема 1 вытекает из теоремы 2 и того, что ноль — многочлен не выше третьей степени относительно р. ¦
§6. Геометрия уравнения второго порядка 69 Задача. Сделать в уравнении d у /3 /2 , / , —~ = аоу — а\у -\- Ь\у — Оо dx1 (где a;, bi — функции от ж, у) замену (ж, у) ->• (у, ж). Ответ. d X т /3 , /2 / —- = оож — bix + aix — ао. dy Замечание. Можно показать, что условия ш = 0 и —- = 0 независи- dp мы. Поэтому условие ш = О недостаточно для приведения уравнения к ви- Оба условия {ш = 0, —j = 0} вместе уже достаточны для приведения уравнения к виду —- = 0. Это можно усмотреть из формул п. Б (после некоторых вычислений). Задача. Докажите, что каждое уравнение второго порядка локаль- локально (в окрестности точки х = 0 решения у = 0) приводится к виду —\ = р2В (ж, у, р), V=-v~- dx1 dx Б. Геометрия пары полей направлений в трехмерном пространстве. Рассмотрим пару полей направлений в трехмерном пространстве. Ока- Оказывается, локальная классификация таких пар общего положения (с точнос- точностью до диффеоморфизмов пространства) эквивалентна локальной классифи- классификации дифференциальных уравнений второго порядка (с точностью до диф- диффеоморфизмов плоскости зависимой и независимой переменной; локально = вблизи данной точки с направлением). Прежде всего сопоставим паре полей направлений в трехмерном про- пространстве двухпараметрическое семейство кривых на плоскости. С этой целью выпрямим первое поле с помощью локального диффеомор- диффеоморфизма пространства, переводящего семейство интегральных кривых первого поля в семейство параллельных вертикальных прямых. После этого спроекти- спроектируем интегральные кривые второго поля на горизонтальную плоскость вдоль вертикальных прямых. На горизонтальной плоскости (на фактор-плоскости пространства по интегральным кривым первого поля) получим двухпарамет- двухпараметрическое семейство кривых.
70 Глава 1 Теперь построим по двухпараметрическому семейству кривых диффе- дифференциальное уравнение второго порядка, для которого эти кривые являются графиками решений. С этой целью заметим, что в общем локальном двухпараметрическом семействе кривых на плоскости вблизи каждого линейного элемента (точки и направления) кривой семейства через каждую точку плоскости по каждому направлению проходит кривая семейства и притом одна (для этого должен лишь не обращаться в нуль соответствующий определитель Якоби). Если семейство — общее в указанном смысле и (ж, у) — координаты на плоскости, то значение —- на кривой семейства является гладкой функци- dx ( dy\ ей от рассматриваемого элемента, т. е. от ж, у, — . Мы получаем таким \ dx) d у ^ ( dy образом дифференциальное уравнение второго порядка —- = Ф [ х, у, —- dx2 V ах Графики решений этого уравнения являются кривыми семейства (по теореме единственности). Таким образом, мы сопоставили паре полей направлений в трехмерном пространстве дифференциальное уравнение второго порядка, при некотором условии невырожденности: должен быть отличен от нуля соответствующий определитель Якоби. Определение. Поле направлений в трехмерном пространстве называ- называется невырожденным относительно вертикали, если направление поля нигде не вертикально и при этом горизонтальная проекция направления поля по- поворачивается с ненулевой скоростью при движении точки приложения вдоль вертикальной прямой. Пара полей направлений в трехмерном пространстве называется невы- невырожденной, если после диффеоморфизма, делающего первое поле вертикаль- вертикальным, второе становится невырожденным по отношению к первому. Замечание. Нетрудно видеть, что определение корректно: если второе поле становится невырожденным по отношению к первому после некоторо- некоторого диффеоморфизма, выпрямляющего интегральные кривые первого поля, то оно станет таковым и после любого другого диффеоморфизма, выпрямляю- выпрямляющего первое поле. Нетрудно проверить также, что невырожденность пары сохраняется при изменении порядка полей (т. е. что все равно, какое из двух полей выпрямлять). Выше мы сопоставили каждой невырожденной паре локальных полей на- направлений в трехмерном пространстве дифференциальное уравнение второго порядка. Действительно, наше условие невырожденности в точности совпада-
§6. Геометрия уравнения второго порядка 71 9(у, у') ет с отличием от нуля определителя Якоби — -, где (и, v) — параметры д(и, у) семейства. Покажем теперь, что это соответствие устанавливает полную эк- эквивалентность задач о локальной классификации пар полей направлений в R3 и дифференциальных уравнений второго порядка. Теорема. Каждое уравнение второго порядка получается описанной вы- выше конструкцией из подходящей невырожденной пары полей направлений в трехмерном пространстве. Если две пары полей переводятся одна в другую диффеоморфизмом про- пространства, то соответствующие уравнения переводятся одно в другое диф- диффеоморфизмом плоскости. Обратно, если два уравнения второго порядка пере- переводятся одно в другое диффеоморфизмом плоскости, то любые две пары полей, отвечающие им, переводятся одна в другую диффеоморфизмом пространства. Таким образом, пара полей восстанавливается по уравнению однозначно (с точностью до диффеоморфизмов пространства). Доказательство. i2 , , ч d *y I dy\ Для каждого уравнения —= = Ф I ж, у, — 1 рассмотрим в трехмерном dx \ ах) пространстве 1-струй с координатами (ж, у, р) семейство «вертикальных» ли- линий р-направления (ж = const, у — const) и семейство интегральных кривых dy dp системы --- = р. --- = Ф, эквивалентной уравнению. dx dx При проектировании вдоль вертикального направления получим семей- семейство графиков решений нашего уравнения. Итак, для каждого уравнения мы предъявили пару полей направлений, из которой оно получается. Диффеоморфизм пространства, переводящий каждую вертикальную прямую в вертикальную, задает диффеоморфизм горизонтальной плоскости. Поэтому из диффеоморфизма двух пар полей в R3 следует диффеоморфизм соответствующих уравнений. Обратно, диффеоморфизм горизонтальной плоскости действует на ли- линейные элементы (направления) кривых на плоскости. Поэтому диффеомор- диффеоморфизм, переводящий первое уравнение во второе, определяет диффеоморфизм трехмерного пространства с первой парой полей направлений во второе. [Точ- [Точке первого пространства отвечает элемент кривой на плоскости, диффеомор- диффеоморфизм переводит его на новое место, полученный элемент является проекцией направления второго поля второй пары в единственной точке второго про- пространства — эта точка и сопоставляется исходной.] ¦ Из доказанной теоремы следует, что все описанные выше результаты о геометрии семейства решений уравнения второго порядка могут быть пе- переформулированы в терминах геометрии невырожденной пары полей направ- направлений в трехмерном пространстве (или, если угодно, в терминах геометрии
72 Глава 1 системы двух уравнений первого порядка, не разрешенной относительно про- производных, в простейшем случае, когда производные зависят от координат двузначно). Заметим также, что невырожденная пара полей направлений задает в трехмерном пространстве контактную структуру (вполне неинтегрируе- мое поле плоскостей, натянутых на данные направления, подробнее см. гл. 2). Интегральные кривые наших полей образуют в смысле этой структуры ле- жандровы расслоения1. Поэтому мы можем переформулировать предыдущие результаты как результаты о геометрии пары лежандровых расслоений в R3. Ж. Двойственность. Выше мы построили для каждой невырожденной пары полей направле- направлений в трехмерном пространстве дифференциальное уравнение второго по- порядка, выпрямляя первое поле и проектируя интегральные кривые второго. Однако можно было бы поступить наоборот: выпрямлять второе поле, а про- проектировать интегральные кривые первого. В результате получится, вообще говоря, другое уравнение второго порядка. Таким образом, для каждого дифференциального уравнения второго по- порядка имеется двойственное ему уравнение. В терминах пар полей направлений в трехмерном пространстве переход к двойственному уравнению сводится к тому, что мы меняем местами по- поля пары. Другое описание двойственного уравнения состоит в следующем. Предположим, что семейство решений уравнений второго порядка для у(х), зависящих от двух параметров (и, v), записано в виде F(x, у; и, v) = 0. Бу- Будем теперь считать параметрами х и у, а переменными и и v. Тогда это же соотношение определит двухпараметрическое семейство функций v(u). Это семейство является семейством решений уравнения второго порядка; это уравнение и есть уравнение, двойственное исходному. Задача. Докажите, что форма недезарговости ш уравнения второго по- порядка (см. п. Б) равна нулю тогда и только тогда, когда правая часть двой- двойственного уравнения — многочлен не выше третьей степени относительно производной. Таким образом, условие выпрямляемости уравнений второго порядка можно сформулировать так: »2 / j \ i2 Уравнение —^ = Ф ( ж, у, — ) приводится к виду —^ = 0, если и толъ- dx \ dxj dx2 ко если правая часть является многочленом не выше третьей степени от- относительно производной как для данного уравнения, так и для двойственного уравнения. 1Лежандровым подмногообразием контактной структуры называется интеграль- интегральное подмногообразие наибольшей возможной размерности. Лежандрово расслое- расслоение — это расслоение с лежандровыми слоями.
§6. Геометрия уравнения второго порядка 73 3. Обзор. Геометрия уравнения второго порядка послужила источником ряда ма- математических теорий. 1°. А. Трессе, ученик С. Ли, в диссертации «Determination des invariants punctuels de l'equation differentielle ordinaire de second ordre», Leipzig, 1896 (см. также его статью «Sur les invariants differentiels des groupes continues des transformations», Acta Mathematica, 1894, 18, 1-88) построил все «полуинва- «полуинварианты» уравнения. (Полуинвариантом порядка к называется функция от значения правой части уравнения и ее производных порядка не выше к в данной точке про- пространства (ж, у, р), обращение которой в нуль для данного уравнения в дан- данной точке этого трехмерного пространства элементов влечет за собой ее обра- обращение в нуль для преобразованного диффеоморфизмом плоскости уравнения в преобразованном элементе.) Оказывается, имеется ровно два функционально независимых полуинва- полуинварианта четвертого порядка. Один из них —j. Другой — скалярный инвари- др ант /г, построенный по форме инфинитезимальной недезарговости (см. п. Г). Для уравнения в нормальной форме —- = А{х)у2 + О(\у\3 + \р\3) dx следовательно, полуинвариантом является ЪАА" — 12А' . Трессе нашел еще три полуинварианта пятого порядка, а при к > 5 к2 — к — 8 еще полуинвариантов порядка к; все прочие полуинварианты — z функции от этих. Трассе указывает также, что все полуинварианты «выво- «выводятся из трех простейших» дифференцированиями. 2°. Задача о геометрии дифференциального уравнения второго порядка привела Э. Картана к теории многообразий проективной связности (Е. Cartan. Sur les varietes a connection projective. Bull. Soc. Math. France, 52, 1924, 205-241; Oeuvres, III, 1, №70, Paris, 1955, 825-862). Проективная связность на многообразии есть сопоставление каждому гладкому пути на многообразии проективного отображения касательного пространства в исходной точке пути в касательное пространство в конечной точке, гладко зависящего от пути1. В частности, замкнутому пути отвечает проективное преобразование исходного касательного пространства, а обходу 1 Удовлетворяющее некоторым естественным условиям, которые мы здесь не при- приводим.
74 Глава 1 по «бесконечно малому параллелограмму» отвечает «бесконечно малое проек- проективное преобразование», называемое формой кривизны связности. Проективная связность называется связностью без кручения, если нача- начало координат касательного пространства остается при обносе по замкнутому пути на месте. Среди всех связностей без кручения Картан выделяет нор- нормальные связности. В двумерном случае нормальность связности означает, что каждая прямая, выходящая из начала координат касательной плоскости, при обносе по замкнутому пути переходит в себя. Геодезической линией связности называется линия на многообразии, ка- касательная к которой при переносе вдоль этой линии переходит в касательную. Оказывается, геодезические проективной связности без кручения на плоскости являются графиками решений уравнения второго порядка, правая часть которого — многочлен не выше третьей степени относительно про- производной. Обратно, всякому уравнению второго порядка с правой частью в виде многочлена не выше третьей степени соответствует в точности одна нормальная проективная связность без кручения, для которой геодезически- геодезическими являются графики решений. Что касается общих уравнений второго порядка, то им Картан тоже од- однозначно сопоставляет нормальную проективную связность без кручения, но перенесение двумерной плоскости определяется уже вдоль путей в трехмер- трехмерном пространстве элементов (подробности см. в цитированной работе Кар- тана). 3°. Перевод теории Трассе на язык пары полей направлений в про- пространстве проделан Болем (G.Bol. Uber topologische Invarianten von zwei Kurvenscharen in Raum. Abhandhmgen Math. Sem. Univ. Hamburg, 9, 1 A932), 15-47). В этой теории, по-видимому, остался нерешенным вопрос о простран- пространстве орбит, в частности, вопрос о том, сколькими параметрами нумеруются орбиты fc-струи уравнения второго порядка (под действием группы диффео- диффеоморфизмов плоскости на пространстве fc-струй уравнений) в окрестности точки общего положения пространства fc-струй.
Глава 2 Уравнения с частными производными первого порядка Уравнения с частными производными изучены гораздо хуже, чем обыкновенные дифференциальные уравнения. Один из результатов этой теории — теорию одного уравнения с частными производными первого порядка — удается свести к изучению специальных обыкно- обыкновенных дифференциальных уравнений, так называемых уравнений ха- характеристик. Сущность этой связи состоит в том, что сплошная среда из невзаимодействующих частиц может описываться как уравнением в частных производных для поля, так и обыкновенными уравнениями для частиц. В настоящей главе изложена эта теория (в математическом отноше- отношении сводящаяся к геометрии так называемых контактных структур). Рассматривается также вопрос об интегрируемости поля гиперплоскос- гиперплоскостей (теорема Фробениуса). § 7. Линейные и квазилинейные уравнения с частными производными первого порядка Интегрирование уравнения с частными производными первого по- порядка сводится к интегрированию системы обыкновенных дифферен- дифференциальных уравнений — так называемых уравнений характеристик. В основе этого сведения лежат простые геометрические соображения об образовании поверхностей из семейств кривых. Мы начнем с этих гео- геометрических соображений, а затем применим их к уравнениям с част- частными производными. А. Интегральные поверхности поля направлений. Пусть X — гладкое многообразие, V — поле направлений на X.
76 Глава 2 Определение. Гладкое подмногообразие Y С X называется ин- интегральной поверхностью поля V, если касательная плоскость к Y в каждой точке содержит направление поля V (рис. 41). Теорема. Подмногообразие Y С X является интегральной поверх- поверхностью поля V тогда и только тогда, когда оно вместе с каждой своей точкой содержит интервал интегральной кривой, проходящей через эту точку. Доказательство. Утверждение теоремы локально и инвариантно относительно диф- диффеоморфизмов. Поэтому его достаточно доказать для стандартного поля параллельных направлений в линейном пространстве. Но в этом случае утверждение теоремы очевидно (оно сводится к тому, что функция, заданная на интервале, постоянна тогда и только тогда, когда ее про- производная равна нулю, рис. 42). ¦ Рис. 41 Рис. 42 Рис. 43 Пусть Г — fc-мерное подмногообразие в n-мерном многообразии X (рис. 43). Г называется гиперповерхностью, если к = п — 1. Определение. Задачей Коши для поля направлений V с началь- начальным многообразием Г называется задача об отыскании (к + 1)-мерного интегрального подмногообразия поля V, содержащего начальное под- подмногообразие Г. Заметим, что интегральные кривые, проходящие через Г, не всегда образуют подмногообразие даже локально, в окрестности начального многообразия Г (см. рис. 44). Определение. Точка начального многообразия называется харак- характеристической в поле направлений V, если направление поля V в этой точке касается начального многообразия.
§ 7. Линейные и квазилинейные уравнения 77 Теорема. Пусть дана нехарактеристичес- г кая в поле направлений V точка k-мерного началь- начального многообразия. Тогда существует (к + 1)-мер- 1)-мерная интегральная поверхность поля, содержащая р ,л окрестность этой точки на начальном многооб- многообразии. Эта поверхность единственна в том смысле, что любые две интегральные поверхности, содержащие окрестности указанной точки на начальном многообразии, совпадают в некоторой окрестности этой точки. Доказательство. Утверждение локально и инвариантно относительно диффеомор- диффеоморфизмов. Поэтому его достаточно доказывать для стандартного поля па- параллельных направлений в линейном пространства. В этом же случае утверждение очевидно (почему?). ¦ Б. Линейное однородное уравнение первого порядка. Определение. Линейным однородным уравнением первого порядка называется уравнение Lau = 0, A) где а — заданное векторное поле на многообразии М. Пусть поле а имеет в координатах (xi,...,xn) компоненты (ai,... , an); каждая компонента является функцией от координат. Тог- Тогда уравнение A) записывается в виде п ди , , ди _ п /9ч а1Т. \-... + ап-—— U. Ш Определение. Поле а называется характеристическим вектор- векторным полем для уравнения A), а его фазовые кривые называются ха- характеристиками. Уравнение х = а(х) называется уравнением характе- характеристик для уравнения с частными производными A). Теорема. Функция и является решением линейного уравнения первого порядка тогда и только тогда, когда она является первым ин- интегралом уравнения характеристик. Доказательство. Это определение первых интегралов. ¦
78 Глава 2 Определение. Задачей Коши для уравнения A) на- называется задача о нахождении решения и, удовлетворя- удовлетворяющего условию и\7 = (р, где 7 — некоторая гладкая ги- гиперповерхность в М, а (р — заданная гладкая функция на этой гиперповерхности. Гиперповерхность 7 называется начальной гиперпо- гиперповерхностью, а функция (р — начальным условием. Заметим, что такая задача не всегда имеет решение. Действительно, вдоль каждой характеристики решение и постоянно. Но характеристика может пересекать начальную поверхность 7 несколько раз. Если значения заданной функции ср в этих точках различны, то соответствующая задача Коши не имеет решения ни в какой области, содержащей указанную характеристику (рис. 45). Определение. Точка х на начальной гиперповерхности 7 назы- называется нехарактеристической, если характеристика, проходящая через эту точку, трансверсальна (не касательна) к начальной гиперповерх- гиперповерхности. Теорема. Пусть х — нехарактеристическая точка на начальной гиперповерхности. Тогда существует такая окрестность точки х, что задача Коши для уравнения A) в этой окрестности имеет решение, и притом только одно. Доказательство. По теореме о выпрямлении можно выбрать вблизи х координаты так, что компоненты поля а будут иметь вид A, 0, ... , 0) и уравнение 7 примет вид х\ = 0 (рис. 46). Задача Коши в этих координатах принимает вид ди дх\ = Ч>- C) Единственное (в выпуклой области) решение: и{х,\, х') = (f(x'), где х' = (ж2, ... , хп). ш Замечание. Решения любого обыкновенного дифференциального уравнения образуют конечномерное многообразие: каждое решение за- задается конечным набором начальных условий. Мы видим, что у линей- линейного однородного уравнения первого порядка с частными производны-
§ 7. Линейные и квазилинейные уравнения 79 ми относительно функции от п переменных «столько решений, сколько существует функций п — 1 переменных». Мы увидим далее, что аналогичное явление имеет место и для общих уравнений с частными / производными первого порядка. Ф В. Линейное неоднородное уравнение пер- первого порядка. х1 Определение. Линейным неоднородным урав- уравнением первого порядка называется уравнение Рис. 46 Lau = b, D) где а — заданное векторное поле на многообразии М, а 6 — заданная функция на М. В координатной записи где ак = ак(хг, ..., хп), Ъ = Ь(жь ... , хп). Задача Коши для уравнения D) ставится так же, как для однород- однородного уравнения A). Теорема. Задача Коши для уравнения D) с достаточно малой окрестности любой нехарактеристической точки х$ начальной поверх- поверхности 7 имеет решение, и притом единственное; оно дается формулой t u(g(x, t)) = (р(х) + / b(g(x, r)) dr, где g(x, t) — значение решения уравнения характеристик (с начальным условием g(x, 0) = х на начальной поверхности) в момент времени t. Доказательство. После выпрямления поля а приходим к задаче ди _ г, „. _ / /ч
80 Глава 2 g(x,t) Единственное решение u(xi, x') = <p(x') + / &(?, x') d^. Иными словами: уравнение D) означает, Рис. 47 что производная решения вдоль характерис- характеристик — известная функция, Ь. Стало быть приращение решения вдоль отрезка характеристики равно интегралу от функции Ь вдоль этого от- отрезка (рис. 47). Г. Квазилинейное уравнение первого порядка. Определение. Квазилинейным уравнением первого порядка назы- называется уравнение Lau = F) где а(х) = а(х, и(х)), /3(х) = Ь(х, и(х)). Здесь х — точка многообра- многообразия М, и — неизвестная функция на М, а — заданное векторное поле, касательное к М, зависящее как от параметра от точки и G Ш, Ь — заданная функция на М х Ж = J°(M, Ж). В координатах квазилинейное уравнение F) имеет вид a\(ж, и)-pr^- + ... + an(x, u)-^- = b(x, u). G) Отличие от линейного уравнения лишь в том, что коэффициенты аи и Ь могут зависеть от неизвестной функции. Пример. Рассмотрим одномерную среду, состоящую из частиц, движущихся по прямой по инерции, так что скорость каждой час- частицы остается постоянной. Обозначим скорость частицы, находящей- находящейся в момент t в точке х через и(х, t). Запишем уравнение Ньютона: ускорение частицы равно нулю. Если х = cp(t) — движение частицы, то ф = u((p(t), t) и ди - . ди п ди . ди дх dt дх dt
7. Линейные и квазилинейные уравнения 81 Следовательно, поле скоростей и среды из невзаимодействующих частиц удовлетворяет квазилинейному уравнению иих + щ = 0. (8) t=t, Рис. Рис. 49 Задача. Построить график функции и( ¦, ?), если график функции и( ¦, 0) имеет представленный на рис. 48 вид. "D С. Рис. 50 Ответ. См. рис. 49. При t ^ t\ гладкого ре- решения не существует. Начиная с этого момента частицы в среде сталкиваются. [Физическое усло- условие движения по инерции, т. е. отсутствия вза- имодействия между частицами, становится не- реалистическим и должно быть заменено дру- другим физическим условием — описанием характе- характера столкновения. Так возникают так называемые ударные волны — функции вида, изображенного на рис. 50, удовлетворяющие уравнению (8) вне разрыва и дополнительным условиям физического происхождения на разрыве.] Д. Характеристики квазилинейного уравнения первого порядка. Мы только что видели, как полезно перейти от поля скоростей к движению частиц для специального квазилинейного уравнения (8). Нечто подобное можно сделать и в случае общего уравнения F). При этом роль движения частиц играют некоторые кривые в прямом произ- произведении области определения и области значений неизвестной функции; эти кривые называются характеристиками квазилинейного уравнения. Квазилинейное уравнение F) относительно неизвестной функ- функции и: М ->• Е La(x,u(x))u = F) 6 В. И. Арнольд
82 Глава 2 означает, что если точка ж выходит из жо и начинает двигаться по М со скоростью а(жо, щ), то значение решения и = щ начинает меняться со скоростью &(жо, щ). Иными словами, вектор A(xq, щ), приложен- приложенный в точке (жо, wo) пространства Мх1и име- имеющий компоненты а(жо, щ) вдоль М и &(жо, щ) вдоль Ш, касается графика решения (рис. 51). Определение. Вектор A(xq, уо) называется характеристическим вектором квазилинейного уравнения F) в точке (жо, уо). Характеристичес- Характеристические векторы во всех точках пространства М хШ образуют векторное поле А. Это поле называется Рис. 51 характеристическим векторным полем квазили- квазилинейного уравнения F). Фазовые кривые характеристического вектор- векторного поля называются характеристиками квазилинейного уравнения. Дифференциальное уравнение, заданное полем фазовой скорости А, называется уравнением характеристик. Пример. Пусть М есть Шп с координатами (жх, ... , хп). Характе- Характеристическое поле задается своими компонентами; их значения в точ- точке (ж, и) равны аг(х, и), ... , ап(х, и); Ь(х, и). Уравнение характеристик имеет вид Х\ = а\(х, и), ... , хп = ап(х, и); й = Ь(х, и). Задача. Найти характеристики уравнения среды из невзаимодейству- невзаимодействующих частиц иих + щ = 0. Ответ, х — и, i — 1, й — 0. Характеристики — прямые х — а + Ы, и — Ъ. Замечание. Линейное уравнение является частным случаем ква- квазилинейного, однако характеристики линейного уравнения — не то же самое, что характеристики того же уравнения, рассматриваемого как квазилинейное: характеристики линейного уравнения лежат в М, а квазилинейного — вМхЕ. Характеристики линейного уравнения — это проекции характеристик того же уравнения, рассматриваемого как квазилинейное, из М х Ж на М.
§ 7. Линейные и квазилинейные уравнения 83 Е. Интегрирование квазилинейного уравнения первого порядка. Пусть А — характеристическое векторное поле квазилинейного уравнения F). Предположим, что это поле нигде не обращается в нуль. Тогда это векторное поле определяет поле направлений. Определение. Поле направлений характеристического векторно- векторного поля квазилинейного уравнения называется характеристическим по- полем направлений этого уравнения. Характеристики квазилинейного уравнения являются интеграль- интегральными кривыми характеристического поля направлений. Пример. Уравнение характеристик в случае М = Шп с координата- координатами (xi, ..., хп) принято записывать в так называемом симметричном виде dxi _ dx^ _ _ dxn, _ du fli ~ «2 ~ an - 5 ' означающем коллинеарность касательной к характеристике с характе- характеристическим вектором. Теорема. Функция и тогда и только тогда является решением квазилинейного уравнения, когда ее график является интегральной по- поверхностью для характеристического поля направлений. Доказательство. Это очевидно, так как уравнение F) выражает касание графика с характеристическим вектором. ¦ Следствие. Функция и тогда и только тогда является решением квазилинейного уравнения, когда ее график содержит вместе с каждой своей точкой интервал характеристики, проходящей через эту точку. Доказательство. См. п. А. ¦ Таким образом, нахождение решений квазилинейного уравнения сводится к отысканию его характеристик. Если характеристики из- известны, то остается лишь составить из них поверхность, являющуюся графиком функции: эта функция будет решением квазилинейного урав- уравнения, и все решения получаются таким способом.
Глава 2 Ж. Задача Коши для квазилинейного уравнения первого порядка. Пусть 7 С М — гиперповерхность (подмно- (подмногообразие коразмерности 1) в многообразии М и пусть (р: у —>• !& — гладкая функция (рис. 52). Определение. Задача Коши для квазили- квазилинейного уравнения F) с начальным условием ср на 7 состоит в том, чтобы отыскать решение и, которое на у обращается в ср. рис 52 Решение этой задачи легко свести к реше- решению задачи Коши для поля характеристических направлений. Рассмотрим график функции ср: 7 —>¦ К- Этот график является ги- гиперповерхностью в прямом произведении у х Ж. Поскольку 7 вложено в М, мы можем рассматривать график Г функции ср как подмногооб- подмногообразие (коразмерности 2) в М х Ш (рис. 52). Определение. Начальным подмногообразием для начального усло- условия ср на 7 называется подмногообразие Г С М х I, являющееся гра- графиком <? на у. Таким образом, начальное многообразие Г задает как гиперповерх- гиперповерхность 7 в -W, так и начальное условие <р на у. Определение. Начальное условие G, ф) называется нехаракте- нехарактеристическим для квазилинейного уравнения F), е точке х$ из 7, если вектор а(жо, Мо) (^о = <р(жо)) в этой точке не касается поверхности у (рис. 52). [Замечание. Если уравнение линейно, то вектор а(хо, щ) не за- зависит от uq и поэтому можно определить нехарактеристические точки поверхности у. Для квазилинейного же уравнения характеристической или нехарактеристической является точка (жо, щ) Е Г, а о характерис- характеристичности точки жо ? 7 говорить не приходится.] Теорема. Решение квазилинейного уравнения F) с нехарактерис- нехарактеристическим в точке xq начальным условием в окрестности этой точки существует и локально единственно. Доказательство. Из нехарактеристичности начального условия в точке xq следует, что:
§8. Нелинейное уравнение с частными производными первого порядка 85 1) Характеристическое поле А не обращается в окрестности точ- точки (жо, уо) в нуль. Поэтому в окрестности этой точки определено глад- гладкое поле характеристических направлений. 2) Характеристическое направление не касается начального много- многообразия Г в рассматриваемой точке и, следовательно, в ее окрестности. Поэтому существует и единственная локальная интегральная поверх- поверхность характеристического поля направлений, содержащая начальное многообразие Г (см. п. А). 3) Касательная плоскость к интегральной поверхности в точ- точке (жо, «о) невертикальна (не содержит оси и). Поэтому интегральная поверхность является графиком функции. Эта функция и есть искомое решение (см. п. Е). ¦ Замечание. Доказательство содержит также процедуру построе- построения решения задачи Коши для квазилинейного уравнения. § 8. Нелинейное уравнение с частными производными первого порядка Нелинейные уравнения с частными производными первого поряд- порядка, как и линейные, интегрируются при помощи характеристик. Но ес- если характеристики линейного уравнения относительно функции на М лежат в М, а квазилинейного — в М х I, то для общего нелинейного уравнения с частными производными первого порядка характеристики лежат в многообразии 1-струй функций, ^(М, Ж). Многообразие 1-струй функций имеет естественную контактную структуру. В основе интегрирования нелинейных уравнений с частными про- производными первого порядка лежат простые факты геометрии контакт- контактной структуры, с которых мы и начнем. А. Контактные многообразия. Контактным многообразием называется многообразие, снабженное полем гиперплоскостей в касательных пространствах, удовлетворяю- удовлетворяющим условию «максимальной неинтегрируемости». Поле плоскостей (в отличие от поля одномерных направлений) мо- может не иметь интегральных поверхностей, размерность которых равна
86 Глава 2 Рис. 53 размерности плоскостей. Чтобы измерить препятствие к существова- существованию интегральных гиперповерхностей у поля гиперплоскостей, проде- проделаем следующую конструкцию. Введем в окрестности интересующей нас точки О многообразия координаты так, чтобы плоскость поля в О стала координатной гипер- гиперплоскостью; мы будем называть соответствую- соответствующие координаты горизонтальными, а оставшуюся координатную ось назовем вертикальной. Для любого пути в горизонтальной плоскости построим цилиндр над этим путем с вертикаль- вертикальной образующей. След нашего поля плоскостей на поверхности цилиндра есть поле направлений. Интегральные поверх- поверхности (если они существуют) пересекают цилиндр по интегральным кривым этого поля направлений (рис. 53). Таким образом мы можем поднять любой путь с горизонтальной плоскости на искомую поверхность. Пусть теперь (?, г/) — два вектора на горизонтальной координат- координатной плоскости в рассматриваемой точке. Рассмотрим параллелограмм, натянутый на (?, if). Из рассматриваемой точки в противоположную вершину параллелограмма ведут два пути по сторонам параллелограм- параллелограмма. Поднимая эти пути, мы получим над противоположной вершиной, вообще говоря, две разные точки. Их различие и есть препятствие к по- построению интегральной гиперповерхности или, как говорят, к «интег- «интегрируемости» поля гиперплоскостей. Рассмотрим разность вертикальных координат двух полученных точек. Главная, билинейная (относительно ? и rf) часть этой разнос- разности измеряет степень неинтегрируемости поля. Чтобы дать формальное определение, проделаем следующее построение. Поле касательных гиперплоскостей на многообразии локально зада- задается дифференциальной 1-формой а, не обращающейся нигде в нулевую форму и определенной с точностью до умножения на не обращающу- обращающуюся нигде в нуль функцию: плоскости поля — это нули формы (под- (подпространства касательного пространства, на которых значение формы равно нулю). Пример. Рассмотрим в пространстве М2га+1 с координатами (xi, ... , хп\ щ pi, ... , рп) 1-форму a=du—pdx (где pdx=pi dx\-\-... +рп dxn)- 1-форма а
Рис. 54 §8. Нелинейное уравнение с частными производными первого порядка 87 ни в одной точке в М2га+1 не обращается в нулевую форму и, следовательно, задает поле 2п-мерных плоскостей а = 0 в М2га+1 (рис. 54). Определение. Дифференциальная 1-форма а, не обращающаяся нигде в форму 0 на многообразии М, называ- называется контактной, если внешняя произ- производная da формы а определяет в каждой плоскости а = 0 невырожденную внеш- внешнюю 2-форму. [Билинейная форма ш:1х!->1 невырождена, если V? E L \ ОЗг] Е L: "(?, V) Ф 0.] Невырожденная кососимметричес- кая 2-форма на линейном пространст- пространстве называется также симплектической структурой. Пример. Построенная в предыдущем примере форма контактная. Дей- Действительно, внешняя производная формы а равна dx\ Л dpi + ... + dxn Л dpn- В плоскости а = 0 координатами служат (xi, ... , хп\ pi, ... , рп). Матрица формы ш — da\a=o в этих координатах имеет вид (^ ~ов ) , где Е — единичная матрица порядка п. Определитель этой матрицы равен единице. Следователь- Следовательно, 2-форма uj невырождена. Замечание. Невырожденные кососимметрические билинейные фор- формы бывают только в четномерных пространствах. Поэтому контактные формы бывают только на нечетномерных многообразиях. Теорема. Пусть а — контактная форма, а / всюду отличная от нуля функция. Тогда fa тоже контактная форма. При этом симплек- тические структуры da\a=o, d(fa)\fa=o на плоскости а = 0 отличаются на не обращающийся в нуль множи- множитель.
88 Глава 2 Доказательство. По формуле Лейбница d(fa) = df A a + fda. Но df А а на плоскости а = 0 есть нулевая 2-форма. Следовательно, 2-формы da и d(fa) на плоскости а = 0 отличаются на ненулевой мно- множитель /. В частности, 2-форма d(fa)\a=o = fda\a=o невырождена, поэтому fa — контактная форма. ¦ Определение. Контактной структурой на многообразии М на- называется поле касательных гиперплоскостей, локально задаваемое как множество нулей контактной 1-формы. Гиперплоскости поля называ- называются контактными гиперплоскостями. Мы будем обозначать контакт- контактную гиперплоскость в точке х через Пж. (рис. 55). Замечание 1. Из предыдущей теоремы следу- следует, что свойство 1-формы, задающей поле плоскос- плоскостей, быть контактной не зависит от выбора формы, но определяется самим полем контактных плоскос- плоскостей. Действительно, если C — другая форма, задаю- р __ щая то же поле, то (локально) /3 отличается от а на не обращающийся нигде в нуль множитель; следо- следовательно, формы [3 и а контактные (или неконтактные) одновременно. Замечание 2. Контактные структуры бывают только на нечетно- мерных многообразиях. Определение. Подмногообразие контактного многообразия назы- называется интегральным многообразием поля контактных плоскостей, ес- если касательная плоскость к подмногообразию в каждой точке принад- принадлежит контактной плоскости. Задача. Докажите, что размерность интегрального многообразия поля контактных плоскостей на контактном многообразии размернос- размерности 2п + 1 не превосходит п. Решение. На таком многообразии Y форма г*а (где г: Y —>• _>. М2п+1 — вложение) равна нулю. Поэтому г*da = di*a = 0. Поэ- Поэтому каждые два вектора касательного пространства косоортогональ- ны: u;(?, rj) = 0. Отсюда следует, что размерность касательного про- пространства не больше п (см. ниже п. Г, задача 2).
§8. Нелинейное уравнение с частными производными первого порядка 89 Замечание. Интегральные многообразия размерности п контакт- контактного поля в М2п+1 существуют. Они называются лежандровыми под- подмногообразиями. Как мы сейчас увидим, каждой функции соответству- соответствует лежандрово подмногообразие в пространстве 1-струй. Б. Контактная структура на многообразии 1-струй функций. Пусть V — n-мерное многообразие. Рассмотрим многообразие 1-струй функций на V, J^V, Ж). 1-струя функции / на V определяется точкой х Е V, значени- значением и = f(x) функции / в этой точке и первым дифференциалом функ- функции / в точке х. Таким образом, многообразие 1-струй функций на V имеет размерность 2п + 1. Если (xi, ... , хп) — локальные коорди- координаты на V, то 1-струя функции / на V задается набором 2п + 1 чи- чисел (ж1, ... ,хп; щ ри ... , рп), где pt = ^(ж). Определение. Стандартной контактной формой на многообра- многообразии 1-струй функций J1^, Ж) называется 1-форма а = du — pdx (pdx = рх dx1 + ... + рп dxn). Выше мы уже видели, что это действительно контактная 1-форма вМ2п+1. Нетрудно видеть, что форма а, определенная с помощью коорди- координат, в действительности от выбора (х±, ... , хп) не зависит и определена в целом. Определение. 1-графиком функции /: V —>• Ж называется подмно- подмногообразие, составленное из 1-струй функции / во всех точках из V. Таким образом, 1-график функции п переменных является п-мер- ной поверхностью в Bп + 1)-мерном пространстве. Теорема. Стандартная контактная форма на многообразии 1-струй функции п переменных обращается в нуль на всех касатель- касательных плоскостях к 1-графикам функций. Замыкание объединения каса- касательных плоскостей ко всем 1-графикам функций совпадает с нулевым подпространством этой формы (е каждой точке пространства струй). Доказательство. Первая часть вытекает из определения полного дифференциала
90 Глава 2 функции, du = р dx. Вторая следует из существования функции с лю- любыми частными производными в точке. ¦ Из доказанной теоремы следует, что поле плоскостей, заданное стандартной контактной формой в пространстве 1-струй, не зависит от выбора системы координат, участвовавшей в определении стандартной контактной формы. Это позволяет ввести следующее Определение. Стандартной контактной структурой на много- многообразии 1-струй функций на V называется поле гиперплоскостей, явля- являющихся объединениями касательных плоскостей к графикам функций на V. Задача. Группы диффеоморфизмов пространств ^иК естественно дей- действуют на многообразии 1-струй функций J1(Vr, Ж). Докажите, что стан- стандартная контактная структура пространства 1-струй инвариантна отно- относительно этого действия. Кроме того, стандартная контактная 1-форма а инвариантна относи- относительно действия группы диффеоморфизмов пространства V, а при действии диффеоморфизмов прямой Ж умножается на функцию, не обращающуюся в нуль. В. Геометрия на гиперповерхности в контактном много- многообразии. Вернемся к общему контактному мно- многообразию М2п+1. Пусть Е2п — гладкая ги- гиперповерхность в М2п+1 (рис. 56). Определение. Поверхность Е2п в кон- контактном многообразии М2п+1 называется нехарактеристической, если ее касательная плоскость и контактная плоскость в каждой точке х трансверсальны (т.е. в сумме дают все касательное пространство к М2п+1, или, что то же, пересекаются по Bп — 1)-мерному пространству).1 Рис. 56 1На поверхности общего положения в контактном пространстве могут быть от- отдельные точки, в которых контактная плоскость совпадает с касательной и условие трансверсальности нарушается — особые точки уравнения с частными производ- производными, заданного поверхностью. Для поверхности общего положения в окрестности такой точки контактная струк-
§8. Нелинейное уравнение с частными производными первого порядка 91 Определение. Пересечение касательной плоскости к нехаракте- нехарактеристической гиперповерхности с контактной плоскостью в точке ги- гиперповерхности в контактном многообразии называется характерис- характеристической плоскостью в этой точке: РХ = ТХЕППХ. Таким образом, характеристические плоскости на гиперповерхнос- гиперповерхности в М2п+1 образуют поле Bп — 1)-мерных плоскостей на 2п-мерном многообразии: это поле плоскостей, высекаемых на касательных про- пространствах гиперповерхности контактными плоскостями. Оказывается, контактная структура определяет в каждой из этих Bп — 1)-мерных плоскостей еще избранную прямую — так называемое характеристическое направление. Г. Косоортогональные дополнения. Чтобы определить характеристическое направление, напомним, что в линейном пространстве с невырожденной билинейной формой определены ортогональные дополнения (ортогональность пары векто- векторов определяется как равенство нулю значения формы на этой паре). Пример 1. Пусть (L,uj) — евклидово пространство, т.е. L — ли- линейное пространство, аи; — скалярное произведение. Каждому векто- вектору ? соответствует 1-форма и;(?, •) — скалярное произведение с векто- вектором ?. Значение этой 1-формы на векторе г] равно и>(?, г/). Например, grad/ — это вектор, соответствующий 1-форме df. Прямой в L соответствует ортогональное дополнение к этой прямой (= плоскость нулей 1-формы, соответствующей вектору прямой). тура и поверхность вместе приводятся диффеоморфизмом к стандартному виду dt = ^Pkdqk -qkdpk,t = Q{p, q), где Q — невырожденная квадратичная форма от р и q (в комплексном случае можно считать, что Q — Yl ^kPkQk)- В классе гладких (бесконечно дифференцируемых) функций это установил В.В.Лычагин в 1976 году (см. В. В. Лычагин. Локальная классификация уравнений с частными производными первого порядка. УМН 1975, 30, №1, стр. 101-171 и В. И. Арнольд, А. Б. Гивентпаль. Симплектическая геометрия. Итоги науки и тех- техники. Современные проблемы математики. Фундаментальные направления. Т. 4, стр. 5-140, М.: ВИНИТИ, 1985.). На аналитический случай теорему Лычагина пере- перенес М. Я. Житомирский (Функциональный анализ и его прилож., 20, 2 A986), 65-66).
92 Глава 2 Каждая плоскость коразмерности 1 в L является ортогональным дополнением к прямой (рис. 57). Заметим, что при умножении ш на отличное от нуля число ортогональность векторов сохраняется. По- этому соответствие между прямыми и их ортогональ- ортогональными дополнениями не меняется при умножении ска- скалярного произведения ш на отличное от нуля число. Пример 2. Пусть (L, ш) — симплектическое пространство, т.е. L — линейное пространство, aw — кососкалярное произведение (билиней- (билинейная кососимметрическая невырожденная форма). Каждому вектору ? соответствует 1-форма ш(?, •) — скалярное произведение с вектором ?. Значе- Значение этой 1-формы на векторе ту равно и;(?, ту) (рис. 58). Например, гамильтоново поле с функцией Га- мильтона Н — это поле, соответствующее 1-фор- Рис. 5о 1ТТ ме аН. Прямой в L соответствует косоортогональное дополнение к этой прямой (= плоскость нулей 1-формы, соответствующей вектору пря- прямой). Каждая плоскость коразмерности 1в! является косоортогональ- косоортогональным дополнением к единственной прямой. Заметим, что при умножении ш на отличное от 0 число ортого- ортогональность сохраняется. Поэтому соответствие между прямыми и их косоортогональными дополнениями не меняется при умножении сим- плектической структуры ш на отличное от 0 число. Задача 1. Докажите, что каждая прямая лежит в своем косоортогоналъ- ном дополнении. Решение. ш(?, ?) = -ш(?, ?) = 0. Задача 2. Докажите, что если все векторы подпространства 2п-мер- ного симплектического пространства попарно косоортогональны друг другу, то размерность этого подпространства не превосходит п. Решение. Косоортогональное дополнение к fc-мерному подпространству имеет размерность 2п — к (действительно, выберем базис (ei, ... , е&); тогда уравнения a>(ei, ?) = 0, ... , uj(ek, С) = 0 образуют к независимых уравнений относительно ?, так как из зависимости между уравнениями вытекала бы зависимость между векторами ej, ввиду невырожденности формы ш). Если к > п, то размерность ортогонального дополнения меньше п и про- пространство не может быть косоортогональным самому себе.
I 8. Нелинейное уравнение с частными производными первого порядка 93 Замечание. Косоортогональные себе подпространства размерности п в 2п-мерном симплектическом пространстве существуют. Они называются лагранжевыми подпространствами. Д. Характеристики на гиперповерхности в контактном пространстве. Вернемся к геометрии на нехарактеристической гиперповерхности в контактном многообразии М2п+1. В каждой точке этой гиперповерхности Е2п мы определили харак- характеристическую Bп — 1)-мерную плоскость Р: пересечение контактной плоскости и касательной плоскости к Е2п (рис. 59). Определение. Характеристическим направлением в нехаракте- нехарактеристической точке х на гиперповерхности в контактном пространстве называется косоортогональное дополнение к характеристической плос- плоскости в контактной плоскости (кососкалярное произведение определя- определяется как da\a=o): lx = косоортогональное дополнение в -1 = ТтЕ2п П П т2п Заметим, что характеристическое направление лежит в характе- характеристической плоскости (см. п. Г); в случае п = 1 характеристическое направление просто совпадает с характеристической плоскостью. Рис. 59 Рис. 60 Рис. 61 В общем случае характеристические направления во всех точках нехарактеристической гладкой гиперповерхности в контактном про- пространстве образуют гладкое поле направлений на этой гиперповерх- гиперповерхности; характеристическое направление в каждой точке принадлежит также контактной гиперплоскости в этой точке (рис. 60).
94 Глава 2 Определение. Интегральные кривые поля характеристических направлений на нехарактеристической гиперповерхности Е в кон- контактном многообразии называются характеристиками гиперповерхнос- гиперповерхности Е. Пусть Nk — fc-мерное интегральное многообразие поля контакт- контактных плоскостей, лежащее в Е2п. Определение. Точка х Е Nk называется нехарактеристической, если касательная плоскость к N в этой точке не содержит характерис- характеристического направления (рис. 61). Задача. Докажите, что если х — нехарактеристическая точка многооб- многообразия Nk, то к ^ п — 1, и приведите пример n-мерных интегральных поверх- поверхностей контактного поля плоскостей в М2га+1, лежащих в Е2п. Оказывается, характеристики, проходящие через точки интеграль- интегрального нехарактеристического многообразия Nk, сами образуют (локаль- (локально) интегральное (к + 1)-мерное подмногообразие поля контактных плоскостей, лежащее на гиперповерхности Е2п. Чтобы это доказать, нам потребуется одна простая общая лемма об инвариантности по- поля плоскостей относительно однопараметрической группы диффеомор- диффеоморфизмов. Е. Отступление: условие инвариантности поля плоскостей. Пусть а —дифференциальная 1-форма, не обращающаяся в 0. Та- Такая форма задает поле гиперплоскостей. Пусть v — векторное поле, не обращающееся в 0. Такое поле задает поле направлений (т.е. поле прямых). Мы предположим, что направление поля v в каждой точке принад- принадлежит гиперплоскости нулей формы а в этой точке: a(v) = 0. Лемма. Для того чтобы поле нулей формы а было инвариантно относительно фазового потока поля v, необходимо и достаточно, что- чтобы da(v, ?) = 0 для всех ? из плоскости поля, а(?) = 0. Доказательство. Утверждение леммы локально и инвариантно относительно диф- диффеоморфизмов, поэтому его достаточно доказать для стандартного по- ля v = -^— в евклидовом пространстве с координатами (х\, ... , хп) (по ОХ\
§8. Нелинейное уравнение с частными производными первого порядка 95 теореме о выпрямлении векторного поля). Пусть а = a\dxi+.. . + andxn. Тогда по условию а\ = 0 (т. к. а (г;) = 0). Задача. Докажите, что значение внешней производной формы а на паре (v, ?) (где v = -^—, a(v) = 0, ? — любой вектор) совпадает со значением частной производной -^- на векторе ?. Решение. Л **) => И», о = Но oi = 0. [Другое, быть может, более понятное, решение получается при при- применении формулы Стокса к параллелограммам со сторонами v, ?.] Условие инвариантности поля нулей формы а относительно сдви- гов вдоль оси х\ состоит в том, что частная производная -^- должна обращаться в нуль на плоскости поля, а = 0. Зная, что трЦ^) = da(v, ?), мы видим, что условие инвариантное- ти имеет вид (а@ = 0) => (da(t;, 0 = 0). и Ж. Задача Коши для поля характеристических направлений. Вернемся к нехарактеристической гиперповерхности Е2п в кон- контактном многообразии М2п+1. Пусть Nk — интегральное подмногооб- подмногообразие поля контактных плоскостей, лежащее в Е2п. Определение. Задача Коши для гипер- гиперповерхности Е2п в контактном многообра- многообразии М2п+1 с начальным многообразием Nn~1 состоит в отыскании интегрального многообра- многообразия Yn поля контактных плоскостей, лежаще- лежащего в Е2п и содержащего начальное многообра- многообразие TV"-1 (рис. 62). Теорема. Пусть х — нехарактеристичес- ^ис- ^2 кая1 точка начального многообразия Nn~1. Тогда существует та- такая окрестность U точки х, что решение задачи Коши для Е2п П U 1 Определение нехарактеристических точек дано в п. Д.
96 Глава 2 с начальным условием Nn~1 П U существует и локально единственно (т. е. любые два решения с общим начальным условием совпадают в не- некоторой окрестности точки х). Многообразие Yn состоит из характеристик, проходящих через точки начального многообразия Nn~1. Доказательство. Семейство характеристик, проведенных через точки начального многообразия, образует в окрестности точки х гладкое подмногообра- подмногообразие Yn размерности п в Е2п. Докажем, что это многообразие является интегральным для поля контактных гиперплоскостей. Рассмотрим контактную 1-форму а, задающую в окрестности точ- точки х контактное поле гиперплоскостей. Обозначим через а сужение фор- формы а на окрестность точки х в гиперповерхности Е2п. Форма а не обращается в 0, так как гиперповерхность Е2п нехарак- нехарактеристическая (см. п. В). Эта форма определяет на Е2п поле касатель- касательных гиперплоскостей (это следы контактных гиперплоскостей на Е2п). Поле характеристических направлений на Е2п лежит в поле нулевых плоскостей формы а (см. п. Д). Рассмотрим в окрестности точки х на Е2п какое-либо векторное поле v, направление векто- вектора которого в каждой точке характеристическое. Обозначим через {#*} определенную полем v ло- локальную однопараметрическую группу диффео- диффеоморфизмов на Е2п (g* определена в окрестности рис 03 точки х при t, близких к 0), рис. 63. Каждую точку многообразия Yn можно по- получить из некоторой точки начального многообразия посредством под- подходящего диффеоморфизма g1. Лемма А. Форма а равна нулю на касательной плоскости к Y в точках начального многообразия. Лемма Б. Диффеоморфизмы g1 переводят, нулевые плоскости фор- формы а в нулевые. Доказательство. А. На векторах, касательных к Nn~1, форма а равна 0, так как многообразие N интегральное. На векторе v форма а равна нулю, так
§8. Нелинейное уравнение с частными производными первого порядка 97 как характеристическое направление лежит в контактной гиперплос- гиперплоскости. Значит, форма а равна 0 на сумме TXN + Шу. ¦ Б. Рассмотрим какой-нибудь вектор ?, на котором форма а обра- обращается в 0 (приложенный не обязательно в точке начального многообра- многообразия). Вычислим значение da на паре (v, ?) в этой точке. По определению формы а = (х\е, это значение равно значению производной контактной формы da(v, ?). По определению характеристического направления, по- последнее число равно 0 для любого вектора ? в контактной плоскости. По лемме п. Е, а = 0 инвариантно относительно {g1}. Ш Из лемм А и Б вытекает, что форма а обращается в 0 на всех каса- касательных векторах к Yn. Следовательно, многообразие Yn интегральное. Итак, мы построили интегральное подмногообразие Yn С Е2п поля контактных гиперплоскостей, проходящее через начальное многообра- многообразие N71'1. 3. Доказательство единственности. Лемма. Касательная плоскость к любому п-мерному интеграль- интегральному многообразию поля контактных плоскостей, лежащему в Е2п, со- содержит характеристическое направление. Доказательство. Сужение контактной 1-формы а на любое свое интегральное мно- многообразие равно 0. Сужение 2-формы da на это многообразие равно про- производной сужения формы а, то есть нулю. Следовательно, любые два касательных вектора к интегральному многообразию косоортогональ- ны (в смысле кососкалярного произведения da\a=o). Вектор характеристического направления на Е2п косоортогонален всем векторам из Е2п, лежащим в плоскости а = 0. Предположим, что он не принадлежит касательной плоскости к интегральному п-мерному многообразию поля контактных плоскостей, лежащему в Е2п. Натяну- Натянутое на этот вектор и на эту касательную плоскость подпространство имеет тогда размерность п + 1. Но все векторы построенного подпро- подпространства попарно ортогональны. Согласно задаче 2 п. Г, размерность такого подпространства не превосходит п. ¦ Из леммы следует, что всякое интегральное n-мерное многообразие поля контактных плоскостей, лежащее в Е2п, содержит вместе с каж- каждой своей точкой интервал характеристики, проходящей через эту точ- 7 В. И. Арнольд
98 Глава 2 ку. Отсюда следует единственность интегрального многообразия, со- содержащего данное начальное многообразие. И. Применение к нелинейному уравнению с частными производными первого порядка. Рассмотрим теперь нелинейное уравнение с частными производ- производными первого порядка относительно функции и: Vn —>• Ж как гиперпо- гиперповерхность Е2п в многообразии 1-струй M2n+1 = J1(Fri, Ж), снабжен- снабженном стандартной контактной структурой. Пусть (rci, ... , хп) — локальные координаты на Vn, и — на Ж; обо- обозначим через (a?i, ... , хп; щ pi, ... , рп) соответствующие локальные координаты в пространстве 1-струй. Тогда дифференциальное уравне- уравнение (локально) записывается в виде Ф(ж,и,р) = 0. A) Отыскание решений этого уравнения сводится к отысканию интег- интегральных поверхностей поля контактных плоскостей, лежащих в Е2п и являющихся 1-графиками функций (см. пункт Б). Наши общие теоремы сводят отыскание решений этого уравнения к построению характеристик на Е2п, для чего нужно найти интеграль- интегральные кривые поля направлений на Е2п (т.е. решить систему 2п — 1 обык- обыкновенных дифференциальных уравнений). Теорема. Решения уравнения A) — это функции, 1-графики ко- которых состоят из характеристик на Е2п. Доказательство. См. пп. Б, Ж, И. ¦ К. Задача Коши для нелинейного уравнения с частными производными первого порядка. Пусть 'уп~1 с Vn — (п-1)-мерное подмногообразие многообра- многообразия Vn, <p: 7n-1 —>• Ш — гладкая функция, Е2п С J1(Fn, Ж) — гладкая нехарактеристическая гиперповерхность, заданная уравнением A). Определение. Задачей Коши для уравнения A) называется задача отыскания решения и: V —> Ж, которое на у обращается в ср. Определение. Начальным многообразием N, построенным по на- начальному условию G, (f), называется множество, состоящее из всех 1-струй функций на V71, удовлетворяющих следующим условиям (рис. 64):
I 8. Нелинейное уравнение с частными производными первого порядка 99 1) Точка приложения струи лежит на у .71-1 (xQ,uQ, 2) Значение функции в этой точке рав- [ но значению ср. 3) Значение полного дифференциала функции в этой точке таково, что его суже- сужение на касательную плоскость к уп~1 равно полному дифференциалу начального усло- условия ср. 4) Струя принадлежит Е2п. Рис. 64 Определение. Точка начального многообразия называется неха- нехарактеристической для уравнения A), если проекция характеристичес- характеристического направления в этой точке на V трансверсальна к у. (Это опреде- определение отличается от данного в п. Д.) Замечание. Говорят, что «производные искомой функции по п— 1 направлению вдоль у определяются начальным условием, а производ- производная по последнему направлению (трансверсальному 7) определяется из уравнения A)». Пример. Пусть у задано уравнением х\ = 0 в пространстве с ко- координатами (a?i, х'). Тогда N задается условиями = 0, определяется из уравнения Ф(ж, м, р) = 0. дх' Теорема. Предположим, что точка (жо, Щ, ро) пространства 1-струй является нехарактеристической точкой начального многообра- многообразия N. Тогда решение уравнения A) с начальным условием N в некото- некоторой окрестности U начальной точки Xq существует и локально един- единственно (е том смысле, что всякие два решения уравнения, удовлетво- ряющие начальному условию и совпадают в некоторой окрестности точки = и0, du(x0) = р0, Доказательство. Это вытекает из теоремы п. Ж, которая дает также и способ по- построения решения. ¦
100 Глава 2 Л. Вычислительные формулы. Задача. Выписать явно дифференциальное уравнение характеристик для уравнения Ф(ж, и, р) = 0. Ответ. х = Фр, Р= -Ф* -рФ«, Решение. Рассмотрим вектор, касательный к многообразию Ф=0. Для такого вектора с компонентами (X, U, Р) Этот вектор лежит в контактной плоскости, если на нем обращается в нуль форма du — р dx, т. е. если U = рХ. Итак, условие, необходимое и достаточное для того, чтобы век- вектор (X, рХ, Р) лежал в пересечении контактной плоскости с касательной к многообразию Ф = 0, есть (Фя + Фир)Х + ФРР = 0. B) Характеристический вектор (ж, й = рх, р) определяется условием ра- равенства нулю кососкалярного произведения со всеми векторами (X, рХ, Р), удовлетворяющими предыдущему равенству. Но это кососкалярное произведение равно значению da — dx f\dp на паре векторов (ж, й = рх, р), (X, U = рХ, Р), т. е. равно жР — рХ. Итак, уравнение B) относительно X и Р должно быть эквивалентно уравнению ж - рХ = 0. C) Следовательно, коэффициенты при X и при Р в уравнениях B) и C) пропор- пропорциональны. Это и дает приведенный ответ, ввиду равенства й = рх. М. Условия нехарактеристичности. Задача. Выписать явно условия на j, ip и Ф, при которых точка (жо, мо, Ро) является нехарактеристической для уравнения Ф(ж, и, р) — 0 с начальным условием ip на -у. Ответ. Фр(жо, ио, ро) не касается у в жо (рис. 64 на стр. 102). Решение. Спроектируем касательную плоскость к поверхности, об- образованной характеристиками, проходящими через начальное многообра- многообразие, на ж-пространство. Если поверхность — 1-график решения и точ- точка (жо, мо, Ро) нехарактеристическая, то касательная плоскость порождена
§8. Нелинейное уравнение с частными производными первого порядка 101 касательной к N и характеристическим направлением, а проектируется изо- изоморфно. Следовательно, ж-компонента характеристического вектора должна быть трансверсальна к 7 в точке жо. Но эта компонента есть Фр (см. п. Л). Обратно, пусть Фр не касается 7 в точке жо. Тогда 1) Гиперповерхность Ф = 0 в окрестности точки (жо, мо, ро) гладкая. Действительно, Ф„ Ф 0 и, следовательно, <1Ф . . Ф 0. ^ (ЖО,ИО>РО) 2) Уравнение Ф = 0 в точке (жо, уо, ро) нехарактеристическое. Дей- Действительно, вектор @, 0, Фр) лежит в контактной плоскости и не касается поверхности Ф=0 в точке (жо, мо, ро), так как Фр(жо, мо, ро)фО. 3) Начальное многообразие N вблизи точки (жо, мо, ро) гладкое. Действительно, выберем координаты (х±, ... , хп) = (х\, ж') так, чтобы локальное уравнение 7 приняло вид х\ — 0. Тогда условие разрешимости уравнения относительно pi (ж') Ф (О, ж', <р(х), pi, принимает вид Ф 0; условие некасания вектора Фр с 7 имеет (ж0, М(ъРо) тот же вид. 4) Точка (жо, мо, ро) начального многообразия нехарактеристическая. Действительно, если бы характеристический вектор касался начального многообразия N, то его проекция Фр касалась бы проекции 7 многообразия N на ж-пространство. 5) Характеристики, пересекающие начальное многообразие в окрестнос- окрестности точки (жо, мо, ро), образуют в этой окрестности гладкое многообразие, диффеоморфно проектирующееся на ж -пространство (и, стало быть, являю- являющееся 1-графиком функции). Действительно, образ касательной плоскости к этому многообразию в точке (жо, мо, ро) при проектировании на ж-пространство содержит каса- касательную плоскость к 7 трансверсальный ей вектор. Следовательно, произ- производная изучаемого отображения в точке (жо, мо, ро) является изоморфизмом, а само отображение проектирования — лекальным диффеоморфизмом (по те- теореме об обратной функции). Таким образом, все пять условий нехарактеристичности выполнены в точке (жо, мо, ро), если в этой точке Фр не касается 7- Н. Уравнение Гамильтона —Якоби. Определение. Уравнением Гамильтона - Якоби называется урав- уравнение Н(х, их) = 0. A)
102 Глава 2 Отличие от общего уравнения с частными производными первого порядка состоит в том, что значение неизвестной функции не входит явно в уравнение. Пример. Пусть 7 — гладкая гиперповерхность в евклидовом про- пространстве Жп, и(х) — расстояние от точки ж до 7 (рис. 65). Тогда функ- функция и (в точках гладкости этой функции) удовлетворяет уравнению Гамильтона - Якоби ди ди = 1. B) Действительно, модуль градиента этой функции равен модулю про- производной расстояния до 7 по нормали к j, т.е. 1. В целом функция и может не быть гладкой. Например, пусть 7 — эллипс на плоскости. Тогда особенности и образуют внутри эллипса отрезок (рис. 66). Рис. 66 Задача. Докажите, что всякое решение уравнения Гамильтона-Якоби B) локально является суммой расстояния до гиперповерхности и константы. При рассмотрении уравнения Гамильтона-Якоби полезно вместо многообразия 1-струй J:(Fn, Ж) функций на Vй рассматривать кока- сателъное расслоение T*Vn. Пространство T*Vn называется в механи- механике фазовым пространством для конфигурационного пространства Vй. Кокасательный вектор к Vn в х есть, по определению, линейная од- однородная функция на касательном пространстве к Vn в х. Все кока- сательные векторы к Vn в х образуют линейное пространство, назы- называемое кокасателъным пространством к Vй в ж и обозначаемое T*Vn.
§8. Нелинейное уравнение с частными производными первого порядка 103 Кокасательные векторы к Vn во всех точках образуют гладкое многооб- многообразие размерности 2п. Оно называется пространством кокасателъного расслоения к Vn (или, короче, кокасательным расслоением) и обозна- обозначается через T*Vn. Пусть {х\, ... , хп) — локальные координаты на Vn. Тогда кокаса- тельный вектор к Vn в х задается набором п чисел (pi, ... , рп). А имен- именно, набору чисел {ри} соответствует 1-форма р\ dx\-\-... +рп dxn на ка- касательном пространстве к Vn в ж. Набор 2п чисел (pi,... ,pn; xi,... ,xn) образует систему локальных координат в кокасательном расслоении к Vn. Имеется естественная проекция тг пространства 1-струй функ- функции J1(Fn, Ж) на кокасательное расслоение к Vй тг: ^(Уп,Ш) -^T*Vn. Отображение тг состоит в «забывании значения функции», в координа- координатах оно задается так: (жь ... ,хп; щ pi, ... , рп) i—У (pi, ... , рп; xi, ... , хп). Определение. Характеристиками уравнения Гамильтона -Яко- би A) называются проекции характеристик уравнения с частными про- производными первого порядка A) в кокасательное расслоение. Задача. Найти дифференциальное уравнение характеристик уравнения Гамильтона-Якоби A). Ответ, х = Нр, р = —Нх. Замечание. Эта система дифференциальных уравнений называется сис- системой канонических уравнений Гамильтона. Соответствующее векторное по- поле определено не только на поверхности Н = 0, но и на всем фазовом про- пространстве. Задача. Найти характеристики уравнения Гамильтона-Якоби B). Ответ, х — 2at + &, р — а (а и Ъ — постоянные векторы, о? — 1). Таким образом, проекции характеристик на Vn — прямые линии. В геометрической оптике уравнение Гамильтона-Якоби B) назы- называется уравнением эйконала; проекции характеристик на Vn называют- называются лучами. Функция и называется оптической длиной пути, ее поверх- поверхности уровня называются фронтами. Кроме этих объектов, в геомет- геометрической оптике очень существенную роль играют каустики. Рассмот- Рассмотрим, например, стену, освещенную лучами, отраженными от вогнутой
104 Глава 2 поверхности (например, от внутренности чашки). На стене видны более яркие линии с особыми точками — это и есть каустики. Определение каустик состоит в следующем. Рассмотрим задачу Ко- ши для уравнения с частными производными первого порядка. Даже если соответствующие характеристики неограниченно продолжаются и не пересекаются, так что образуется глобальное интегральное многооб- многообразие, проекция этого многообразия на Vn, вообще говоря, не является диффеоморфизмом. Множество критических значений проектирования интегрального многообразия на Vй и называется каустикой. В частном случае уравнения Гамильтона-Якоби B) с начальным условием и = 0 на 7 каустика есть геометрическое место фокальных точек или центров кривизны гиперповерхности 7- Рис. 67 Задача 1. Нарисовать геометрическое место центров кривизны эллипса на плоскости. Задача 2. На каждой внутренней нормали к эллипсу отложен отрезок длины t. Нарисовать полученную кривую и исследовать ее изменение с рос- ростом t. Ответы. См. рис. 67. § 9. Теорема Фробениуса Поле направлений на плоскости всегда определяет семейство ин- интегральных кривых и локально выпрямляемо (диффеоморфизмом при- приводится к полю параллельных плоскостей). Начиная с трехмерного про- пространства это уже не так: поле плоскостей в Ж3 может вообще не иметь интегральных поверхностей.
§9. Теорема Фробениуса 105 В этом параграфе выясняются условия локальной выпрямляемости поля гиперплоскостей, т.е. условия, при которых поле является полем касательных к семейству гладких гиперповерхностей. А. Вполне интегрируемое поле гиперплоскостей. Пусть Мп — гладкое многообразие, на котором задано поле каса- касательных гиперплоскостей. В окрестности точки такое поле задается дифференциальной 1-фор- мой а, не обращающейся в нулевую форму и определенной с точностью до умножения на функцию, не обращающуюся нигде в нуль. Определение. Поле гиперплоскостей называется вполне интегри- интегрируемым, если форма da в плоскости поля тождественно равна нулю. Замечание. Свойство полной интегрируемости поля не зависит от выбора локально задающей его формы а, так как форма da\a=o при ум- умножении а на отличную от нуля функцию умножается на эту функцию (см. § 8, п. А). Предложение. Чтобы поле гиперплоскос- гиперплоскостей а = 0 было вполне интегрируемым, необхо- необходимо и достаточно равенство a /\da = 0. Доказательство. Выберем в касательном пространстве к Мп в рассматриваемой точке базис (рис. 68) из п — 1 «горизонтального» вектора (е\, ..., en_i) в плоскости а = 0 и еще одного «вертикального» вектора /. Значение 3-формы а Л da на трех горизонтальных векто- векторах равно нулю, т. к. а = 0. Далее, (da Л a)(ei, ej, /) = 0 как сумма, в которой каждое слагаемое содержит в виде сомножителя либо а(в(), либо da(ei, ej), эти же величины равны нулю. Обратно, если a Ada = 0, то da(ei, ej) = 0. Действительно, единст- единственное слагаемое в (а Л da)(ei, ej, /), не содержащее множители а(е«) или a(ej), есть da(ei, ej) • a(f); но a(f) ^0. ¦ Замечание. Условие а Л da = 0 называется условием интегриру- интегрируемости Фробениуса. Из доказанного предложения следует, что это — условие на поле плоскостей: оно выполнено или не выполнено для всех форм а, задающих поле, одновременно.
106 Глава 2 Б. Существование интегральных многообразий. Теорема. Для того чтобы поле гиперплоскостей а = 0 было полем касательных к семейству гиперповерхностей, необходимо и достаточ- достаточно, чтобы это поле удовлетворяло условию интегрируемости Фробени- уса а Л da = 0. Доказательство. На поверхностях семейства а = 0, поэто- поэтому da = 0. Обратно, пусть da = 0 в плоскос- плоскостях а = 0. Тогда мы построим семейство интег- интегральных поверхностей в окрестности точки х сле- следующим образом. Пусть v — какое-либо вектор- векторное поле, для которого a(v) = 0 (т.е. вектор поля Рис. 69 в каждой точке лежит в плоскости поля плоскос- плоскостей). Пусть Гк — какое-либо интегральное подмно- подмногообразие поля плоскостей (рис. 69), и пусть v(x) не лежит в касатель- касательной плоскости к Тк в точке х. Лемма. Фазовые кривые поля v, проходящие через точки интег- интегрального многообразия Тк, вблизи х образуют гладкое интегральное мно- многообразие Yk+1 вполне интегрируемого поля плоскостей а = 0. Доказательство. Обозначим через {g*} локальный фазовый поток поля v. Тогда а) диффеоморфизмы g1* переводят плоскости нашего поля а = 0 в плос- плоскости поля. Действительно, da(^) = 0 для всякого вектора ? плоскости поля, по- поэтому поле плоскостей инвариантно относительно диффеоморфизмов^ по лемме п. Е § 8. Далее, б) касательное пространство к Yk+1 в точках начального многообразия Гк лежит в плоскости поля. Действительно, и касательная плоскость к интегральному много- многообразию Гй, и вектор v принадлежат плоскости поля, а касательное пространство к Yk+1 в х порождено v(x) и TxYk. Из а) и б) следует, что многообразие Yk+1 — интегральное для поля плоскостей а = 0. ¦ Теперь интегральные многообразия размерности п — 1 строятся последовательным увеличением размерности.
§9. Теорема Фробениуса 107 / ^ д/дх, Рис. 70 Рис. 71 Рассмотрим локальную систему координат (xi, ... , хп-\\ у), в ко- которой координатная плоскость у = 0 в точке ноль принадлежит полю плоскостей а = 0. Проекция вдоль оси у из плоскости поля на координатную плос- плоскость (xi, ... , хп-\) в окрестности точки ноль является изоморфизмом (рис. 70). Рассмотрим базисные векторные поля в координатной плоскос- плоскости, ( тг—, ••• , тг^— )• Их прообразы в плоскостях поля образуют \д ) в окрестности точки О гладкие векторные поля. Обозначим эти поля через (ui, ... , vn-i). В качестве начального (нульмерного) интегрального многообра- многообразия Г° возьмем точку уо оси у (рис. 71). Применяя лемму к Г° и vi, получим одномерное интегральное мно- многообразие Y1. На Y1 имеем хч = ... = хп-\ — 0, поэтому Vi (? TqY1. Применяя лемму кУ1 и^, получим двумерное интегральное мно- многообразие Y2. Двигаясь дальше таким же образом, мы начинаем с ин- интегрального многообразия Yk на котором x^+i = ... = хп-\ = 0, дейст- действуем потоком поля Vk+i и получаем интегральное многообразие Yk+1, на котором Xk+2 = • • • = хп-\ = 0. Процесс заканчивается построением искомого многообразия Yn~1.
Глава 3 Структурная устойчивость При использовании любой математической модели возникает во- вопрос о корректности применения математических результатов, о пове- поведении модели в реальной действительности. В самом деле, предполо- предположим, что результат сильно чувствителен к малейшему изменению мо- модели. В таком случае сколь угодно малое изменение модели (скажем, малое изменение векторного поля, задающего дифференциальное урав- уравнение) приводит к модели с совершенно другими свойствами. Такие результаты опасно распространять на исследуемый реальный процесс, ибо при построении модели всегда проводится некоторая идеализация, параметры определяются лишь приближенно и т. д. Таким образом, воз- возникает вопрос об отборе тех свойств модели процесса, которые мало чувствительны к небольшому изменению модели и, следовательно, мо- могут восприниматься как свойства реального процесса. Одна из попыток выбора таких свойств привела к понятию грубос- грубости или структурной устойчивости (А.А.Андронов и Л. С.Понтрягин, 1937). Значительные успехи теории структурной устойчивости в слу- случае малой размерности фазового пространства A и 2) породили оп- оптимистические надежды, разбитые лишь в 1960-х годах после работ С. Смейла: Смейл показал, что при большей размерности фазового про- пространства существуют системы, в окрестности которых нет ни одной структурно устойчивой системы. Этот результат имеет для качествен- качественной теории дифференциальных уравнений примерно такое же значение, как теорема Лиувилля о неразрешимости дифференциальных уравне- уравнений в квадратурах — для теории интегрирования дифференциальных уравнений. Именно он показывает, что задача полной топологической классификации дифференциальных уравнений с многомерным фазовым пространством безнадежна, даже если ограничиваться уравнениями об- общего положения и пренебрегать всеми вырожденными случаями. В этой главе приведен краткий обзор основных понятий, методов и результатов теории структурной устойчивости.
10. Понятие структурной устойчивости 109 § 10. Понятие структурной устойчивости В этом параграфе определяется структурная устойчивость и ис- исследуются структурно устойчивые векторные поля на одномерном фа- фазовом пространстве. А. Наивное определение структурной устойчивости. Мы будем рассматривать дифференциальное уравнение х = v(x), х G М, заданное векторным полем v на многообразии М. Мы будем также гово- говорить, что поле v задает динамическую систему (или, короче, систему). Мы будем предполагать (как правило), что решения уравнения продол- продолжаются неограниченно; это всегда так, если М компактно. k>0 Рис. 72 Пример. Уравнение маятника с трением (рис. 72): х\ = ж2, х2 = —xi — кх2. Если к = 0, то все фазовые кривые замкнуты. Если к > 0, то они наматываются на особую точку О типа фокус. Следовательно, неболь- небольшое изменение коэффициента трения качественно меняет поведение фазовых кривых, если до изменения он был равен нулю, и не меняет качественной картины, если коэффициент трения был положителен. Приведенное ниже определение структурной устойчивости форма- формализует это различие: маятник без трения оказывается структурно не- неустойчивой системой, а маятник с трением — структурно устойчивой. Определение. Система называется структурно устойчивой, если при всяком достаточно малом изменении векторного поля полученная система эквивалентна исходной.
110 Глава 3 Чтобы придать этому определению смысл, нужно определить, что такое малое изменение поля и какие системы считаются эквивалент- эквивалентными. Б. Топологическая эквивалентность. Наиболее тонкая классификация дифференциальных уравнений ос- основана на понятии диффеоморфизма. Две системы (Mi, v\) и (М2, i^) называются диффеоморфными, если существует диффеоморфизм h: Mi —> М2, переводящий векторное поле v\ в векторное поле v-i- Диффеоморфные системы совершенно неразличимы с точки зре- зрения геометрии гладких многообразий. Следующий пример показывает, что классификация с точностью до диффеоморфизма является слишком тонкой (слишком многие системы оказываются неэквивалентными). Пример. Рассмотрим уравнения с одномерным фазовым простран- пространством х = х и х = 2х. В обоих случаях 0 — единственное и притом отталкивающее поло- положение равновесия. Однако эти две системы не диффеоморфны. Доказательство. Если диффеоморфизм переводит особую точку одного векторного поля в особую точку другого век- векторного поля, то производная этого диффеоморфиз- диффеоморфизма переводит оператор линейной части первого поля в особой точке в оператор линейной части второго по- ис" ля в его особой точке. Следовательно, эти два линей- линейных оператора подобны и, в частности, имеют одинаковые собственные числа. Таким образом, собственные числа линеаризации векторного по- поля в особой точке являются непрерывно меняющимися с полем инва- инвариантами относительно диффеоморфизмов. Такие инварианты называ- называют модулями. Существование модулей приводит к тому, что разбиение множества векторных полей на классы диффеоморфных оказывается не дискретным, а непрерывным (рис. 73). В частности, два указанных выше поля не диффеоморфны, так как 1 ф2. ш Чтобы не различать эти два поля, вводится более грубое отноше- отношение эквивалентности — так называемая топологическая эквивалент- эквивалентность. Заметим, что гомеоморфизмы (взаимно однозначные и взаимно
§ 10. Понятие структурной устойчивости 111 непрерывные преобразования) не действуют на векторные поля. Поэ- Поэтому топологическая эквивалентность векторных полей определяется следующим образом. Рассмотрим фазовые потоки, определяемые данными векторны- векторными полями. Фазовый поток поля v на М состоит из преобразований g*: М —>• М, переводящих каждое начальное условие жо уравнения х = v(x) в момент 0 в значение gfxo этого решения в момент ?; оче- очевидно, gt+s = gtgs, g° = 1. Если М компактно, то gtx определены при всех t ? Ж и х ? М. Определение. Две системы топологически эквивалентны, если существует гомеоморфизм фазового пространства первой системы на фазовое пространство второй, переводящий фазовый поток первой в фа- фазовый поток второй: hg\x = g\hx. Иными словами, диаграмма коммутативна. Например, системы х = х и х = 2х топологически эквивалентны. Замечание. Применения гомеоморфизмов для изгнания модулей, подобные проведенному выше, явились основной причиной создания по- понятия гомеоморфизма и непрерывной (не дифференциальной) тополо- топологии. В. Орбитальная эквивалентность. К сожалению, понятие топологической эквивалентности систем не спасает от модулей. Пример. Рассмотрим векторное поле, имеющее замкнутую фазо- фазовую кривую, скажем — предельный цикл. Тогда всякая топологически эквивалентная система тоже имеет предельный цикл, причем с тем же периодом. При малом изменении поля период может немного изменить- измениться. Следовательно, период движения по циклу является непрерывно ме- меняющимся инвариантом (модулем) и относительно топологической эк-
112 Глава 3 вивалентности. Чтобы избавиться от этого модуля, вводится еще более грубая, чем с точностью до гомеоморфизма, классификация систем. Определение. Две системы называются топологически орбиталъ- орбиталъно эквивалентными, если существует гомеоморфизм фазового про- пространства первой системы на фазовое пространство второй, переводя- переводящий ориентированные фазовые кривые первой системы в ориентиро- ориентированные фазовые кривые второй. При этом не требуется никакого согла- согласования движений по соответственным фазовым кривым. Гипотеза структурной устойчивости состоит в том, что разбиение систем на классы орбитальной эквивалентности уже не имеет модулей (дискретно), по меньшей мере если ограничиться случаями «общего по- положения» и пренебречь вырождениями. Г. Окончательное определение структурной устойчивости. Пусть М — компактное гладкое многообразие (класса Cr+1, г ^ 1). Пусть v — векторное поле класса Сг (если М имеет край, то предпо- предполагается, что v не касается края). Система (М, v) называется структурно устойчивой, если сущест- существует такая окрестность поля v в пространстве С1, что всякое векторное поле из этой окрестности задает систему, топологически орбитально эквивалентную исходной, причем гомеоморфизм, осуществляющий эк- эквивалентность, близок к тождеству. Д. Одномерный случай. Пусть М — окружность. Векторное поле на окружности задает- задается периодической функцией. Особые точки поля соответствуют нулям этой функции. Особая точка называется невырожденной, если в этой точке производная функции отлична от нуля. Теорема. Векторное поле на окружности задает структурно устойчивую систему тогда и только тогда, когда оно имеет лишь не- невырожденные особые точки. Два векторных поля с невырожденными особыми точками на окружности топологически орбитально эквивалентны тогда и только тогда, когда числа особых точек у них одинаковы. Структурно устойчивые векторные поля образуют в пространстве всех векторных полей на окружности открытое всюду плотное мно- множество.
§ 10. Понятие структурной устойчивости 113 Доказательство. Пусть все особые точки поля невырождены. Тогда их конечное чис- число и они попеременно устойчивы и неустойчивы. Всякое непостоянное решение уравнения х = v(x) стремится к устойчивому положению рав- равновесия при t —>• +00 и к неустойчивому при t —>• —оо. Отсюда легко вытекают все утверждения теоремы, кроме одного: остается доказать, что все особые точки поля можно сделать невырожденными посредст- посредством сколь угодно малого шевеления поля. Доказательство этого последнего утверждения удобно провести с помощью так называемой леммы Сарда. Лемма. Мера множества критических значений гладкой функции на отрезке [0, 1] равна нулю. Доказательство. Разобьем отрезок на N равных частей и отметим те из них, кото- которые содержат критические точки. Если N достаточно велико, то про- производная функции на каждой из отмеченных частей не превосходит ^ (С — некоторая не зависящая от N постоянная). Поэтому длина образа С каждой из отмеченных частей не превосходит -Ц> Покроем этот образ 1С интервалом длины =^. Мы получили покрытие множества критичес- N ос ких значений интервалами суммарной длины не более -^-. ¦ Рассмотрим семейство векторных полей с параметром е на окруж- окружности, заданное формулой v(x, е) = v(x) — е. Тогда точка х — вырож- вырожденная особая точка поля, соответствующего значению е параметра, если и только если е — критическое значение функции v в точке х. Но все критические значения образуют множество меры нуль, по- поэтому существуют сколь угодно малые некритические значения. За- Зафиксируем некритическое значение е. Все особые точки поля, соответ- соответствующего этому значению параметра, невырождены. ¦ Е. Отступление: теорема Сарда. Пусть /: М —>• N — гладкое отображение многообразий любой раз- размерности. Точку пространства-прообраза назовем критической, если размер- размерность образа дифференциала отображения в этой точке меньше размерности пространства образа. Значение отображения в критической точке называется критическим значением. 8 В. И. Арнольд
114 Глава 3 Теорема. Мера множества критических значений всякого достаточно гладкого отображения равна нулю. Доказательство. 1°. Если размерность пространства-прообраза равна нулю, то теорема очевидна; если эта размерность 1, то она уже доказана выше. Предполо- Предположим, что теорема доказана во всех случаях, когда размерность пространства- прообраза равна т — 1, и докажем ее для размерности пространства- прообраза, равной т. 2°. Разобьем множество К критических точек отображения на части. Точка пространства-прообраза называется точкой уплощения порядка г, если в ней равны нулю все частные производные порядков 1, ... , г. Обозначим через Кг множество точек уплощения порядка г. 3°. Рассмотрим вначале множество критических точек К\К\. Докажем, что мера соответствующего множества критических значений (т. е. мера множества f(K \ К\)) равна нулю. В каждой точке из К \ К± отлична от нуля одна из частных производ- производных, скажем, —— в координатной записи. В окрестности такой точки можно ох г принять функцию Д за локальную координату в прообразе вместо a?i, со- сохранив Ж2, ... , хт. В построенных координатах / записывается как однопа- раметрическое семейство гладких отображений (т — 1)-мерных пространств в (п — 1)-мерные (Д; х2, ... , хт) i—> (Д; Д, • • • , fn). Зафиксируем значение с параметра Д. Отображение / индуцирует ото- отображение /с плоскости fi — с размерности го - 1 в прообразе в плос- плоскость Д = с размерности п — 1 в образе. Множество критических значений отображения /с имеет в плоскости Д = с в образе (п — 1)-мерную меру нуль по предположению индукции (тео- (теорема доказана для (т— 1)-мерных прообразов). По теореме Фубини гг-мерная мера объединения множеств критических значений отображений /с по с рав- равна нулю. Но образ множества критических точек из К\Кх, лежащих в окрестнос- окрестности рассматриваемой точки, содержится в этом объединении. Отсюда следует, что мера f(K \ К\) равна нулю. 4°. Рассмотрим множество точек r-уплощения, Kr \Kr+i. Докажем, что мера соответствующего множества критических значений f(Kr\Kr+i) рав- равна нулю. В каждой точке множества Kr \ Kv+\ отлична от нуля одна из частных dg производных порядка г + 1, скажем, тг^-5 где g — одна из частных производ- OXi ных Д порядка г (в подходящих локальных координатах).
§ 10. Понятие структурной устойчивости 115 В окрестности такой точки множество Kr \ Кг+\ содержится в гладкой (т— 1)-мерной гиперповерхности g = 0. Точки множества Кг\Кг+\ являются критическими для сужения / на эту гиперповерхность, так как df — 0 на Кг. По предположению, мера образа множества критических значений сужения / на эту гиперповерхность равна нулю. Следовательно, мера /(Кг\Кг+1) равна нулю. 5°. Наконец, рассмотрим множество Кг r-плоских критических точек при достаточно большом г. Докажем, что мера соответствующего множест- множества критических значений f(Kr) равна нулю, если г достаточно велико. С этой целью разделим каждую сторону m-мерного куба в пространстве- прообразе (выбрав локальные координаты) на N равных частей, разделим куб на Nm равных маленьких кубиков и отметим те из них, в которых есть точки из Кг. Диаметр образа отмеченного куба не превосходит тогда ——- Nr+ (где постоянная с не зависит от N). Поэтому все образы отмеченных кубов покрываются открытыми кубами суммарной меры не более ClNm даже если все Nm кубиков отмечены. Это число при N —>• оо стремится к нулю, поэтому mesf(Kr) = 0 при т > — — 1. Представим все множество К критических точек как объединение мно- множеств K\Ki, Ki\Ki+i и Кг. Мы доказали, что мера образа каждого из этих множеств равна нулю. Поэтому мера всего множества критических значений равна нулю. ¦ Ж. Структурно устойчивые системы на двумерной сфере. Переходя к системам с фазовым пространством размерности боль- больше единицы, мы сталкиваемся прежде всего с особыми точками и за- замкнутыми фазовыми кривыми. Определение. Особая точка векторного поля называется вырож- вырожденной, если нуль является собственным числом линеаризации поля в этой точке. Замечание. Невырожденная особая точка поля не исчезает при малом шевелении поля, а лишь слегка сдвигается (по теореме о неяв- неявной функции). Напротив, вырожденная особая точка при малом шеве- шевелении поля, вообще говоря, бифурцирует (делится на несколько невы- невырожденных) или исчезает. Поэтому у структурно-устойчивой системы все особые точки невырождены.
116 Глава 3 Определение. Замкнутая фазовая кривая (цикл) векторного по- поля называется вырожденной, если 1 является собственным числом ли- линеаризации функции последования. [Функция последования — это ото- отображение трансверсали к циклу в себя, сопоставляющее каждой точке трансверсали, близкой к циклу, следующую точку пересечения фазо- фазовой кривой, выходящей из этой точки трансверсали, с трансверсалью, см. рис. 74.] Рис. 74 Рис. 75 Замечание. Невырожденный цикл не исчезает при малом шевеле- шевелении поля, а лишь слегка сдвигается (по теореме о неявной функции). Напротив, вырожденный цикл при малом шевелении поля, вообще гово- говоря, бифурцирует (делится на несколько невырожденных) или исчезает. Поэтому у структурно-устойчивой системы все циклы невырождены. Рассмотрим векторное поле на двумерной поверхности. В двумер- двумерном случае невырожденные особые точки — топологически либо сед- седла, либо узлы. Фазовая кривая, стремящаяся к седлу при t —>• +оо, называется входящей сепаратрисой седла, а при t —> — оо — выходя- выходящей (рис. 75). Теорема. Векторное поле на двумерной сфере задает структурно- устойчивую систему тогда и только тогда, когда выполнены все следу- следующие условия: 1) Поле имеет конечное число особых точек. 2) Все особые точки поля невырождены. 3) Ни одна выходящая сепаратриса седла не является входящей. 4) Поле имеет конечное число замкнутых фазовых кривых. 5) Все замкнутые фазовые кривые — невырожденные циклы. Замечание. Доказательство структурной неустойчивости системы в слу- случае, когда нарушено хотя бы одно из условий 1)-5), несложно (см. рис. 76). До- Доказательство того, что из условий 1)-5) вытекает структурная устойчивость,
§11. Дифференциальные уравнения на торе 117 сложнее; оно подробно проведено Де Баггисом (см. Н. F. De Baggis. Dynamical systems with stable structures, Contrib. Theory Nonlinear Oscillation, 2 A952), 37-59; M. M. Peixoto. Structural stability on two-dimensional manifolds. Topology, 1 A962), 101-120; 2 A963), 179-180). Рис. 76 О структурно устойчивых системах на плоскости см. также: Г. Ф. Баг- гис. Грубые системы двух дифференциальных уравнений. Успехи Мат. наук, 10, 4 A955), 101-126; М. С. Peixoto, M.M. Peixoto. Structural stability in the plane with enlarged boundary conditions, Anais da Acad. Brasileira de Ciencias, 31, 2 A959), 135-160. Теорема. Структурно устойчивые векторные поля образуют в про- пространстве всех векторных полей на двумерной сфере открытое всюду плотное множество. Доказательство. Эта теорема вытекает из предыдущей. ¦ Замечание. Аналогичные результаты справедливы для вектор- векторных полей на круге, которые не касаются граничной окружности. § 11. Дифференциальные уравнения на торе В этом параграфе изложена принадлежащая А. Пуанкаре и А. Дан- жуа теория векторных полей без особых точек на двумерном торе, в частности описаны все структурно устойчивые поля. А. Двумерный тор. Тором размерности п называется прямое произведение п окруж- окружностей. Двумерный тор Т2 = S1 x S1 можно представлять себе как
118 Глава 3 квадрат {ж, у : 0 ^ ж ^ 2тг, О ^ у ^ 2тг} со склеенными противоположными сторонами (отождествляются точ- точки @, у) и Bтг, у), а также (ж, 0) и (ж, 2тг) рис. 77). Тор можно также рассматривать как множество классов смежнос- смежности группы Ж2 по подгруппе 2ttZ2 целочисленных векторов, умноженных на 2тг: Т2 = Ж2/2тгй2 = {(ж, у) е Ж2 modd 2тг}. Таким образом, плоскость Ж2 локально диффеоморфно накрывает тор. Накрытие Ж2 —>• Т2 (рис. 78) позволяет переносить каждую кар- картину с тора на плоскость (где она бесконечно размножается). Гладкие функции на торе соответствуют гладким 2тг-периодическим функциям на плоскости. О о О о О о ф Рис. 77 Рис. 78 Каждой замкнутой кривой на плоскости соответствует на торе за- замкнутая кривая. Обратное неверно: замкнутые кривые на торе соот- соответствуют не только замкнутым кривым на плоскости, но и отображе- отображениям (р: [0, 1] —>• Ж2, для которых у?@) = у>A) modd 2тг. При этом если координаты срA) — ср(О) равны Bтгр, 2тгд), то гово- говорят, что кривая на торе замыкается после р оборотов по параллели и q оборотов по меридиану. Б. Векторные поля на торе. Всякое векторное поле на торе определяет на плоскости поле, пе- периодическое с периодом 2тг по обеим координатам. Обратно, всякому полю, 2тг-периодическому по обеим координатам на плоскости, соот- соответствует векторное поле на торе.
§11. Дифференциальные уравнения на торе 119 Пример. Уравнение х = а, у = Р, где а и C — постоянные, определяет на торе векторное поле без особых точек. Теорема. Если отношение А = ^ рационально, то все фазовые кривые уравнения на торе замкнуты, а если иррационально — то всюду плотны. Доказательство. 1) Пусть А = ^. Фазовая кривая, проходящая через точку (жо, уо) (х - хо)р имеет уравнение у — уо = ^ . Ьсли х — xq = Itrq, то у — уо = 1жр, следовательно, (ж, у) = (хо, уо) modd 2тг, то есть фазовая кривая замк- замкнута. 2) Мы докажем далее, что фазовая кривая (в случае, когда Л ирра- иррационально) равномерно распределена на торе, т. е. проводит в каждой части тора1 время, пропорциональное площади этой части. Из этого следует, в частности, что достаточно длинный отрезок фазовой кривой побывает в сколь угодно малой окрестности любой точки тора, т. е. что фазовая кривая всюду плотна. ¦ В. Равномерное распределение. Общее определение равномерного распределения состоит в следую- следующем. Пусть v — векторное поле на компактном гладком многообразии М с фиксированным элементом объема (например, поле на торе с элемен- элементом площади dxdy). Будем обозначать объем (площадь) области D че- через n{D). Рассмотрим решение ц> уравнения х — v(x) с начальным услови- условием z. Обозначим через t(D, T, z) меру множества тех значений време- времени, t G [О, Т], для которых (p(t) принадлежит области D. Определение. Решения уравнения х = v(x) равномерно распреде- распределены, если для всякой области D с кусочно-гладкой границей т(Р, Т, z) = fi(D) ^ Т fj,(M)' 1Под частью тора здесь понимается измеримая по Жордану область, например — область с кусочно гладкой границей.
120 Глава 3 Теорема. При иррациональном ^ решения уравнения х = а, у = /3 равномерно распределены на торе. Равномерная распределенность может быть также определена в терминах временных средних функций. Пусть / — функция на М (вообще говоря, комплекснозначная). Определение. Предел ± J j\gtz)dt = называется временным средним функции / (здесь g* — фазовый поток). Замечание. Разумеется, такой предел существует не всегда, а ес- если и существует, то зависит, вообще говоря, от начальной точки. Теорема о равномерном распределении на торе вытекает из следу- следующей теоремы. Теорема (о совпадении средних). При иррациональных А = ^ временное среднее любой непрерывной (или хотя бы интегрируемой по Риману) функции f: Т2 —>• С вдоль решений уравнения на торе х = а, у = C существует, не зависит от начальной точки и совпадает с про- пространственным средним: <U>fdx dy. Доказательство. Чтобы получить из этой теоремы теорему о равномерном распре- распределении, достаточно взять в качестве / характеристическую функцию множества D (равную единице на D и нулю вне D). ¦ Г. Доказательство теоремы о совпадении средних. Обозначим вектор с компонентами (а, C) через и. Тогда решение с начальным условием z принимает вид z + wt. Утверждение теоремы гласит: г ^J ^jj f(z) dx dy.
§ 11. Дифференциальные уравнения на торе 121 Доказательство. Заметим, что среди функций на торе имеются гармоники — функ- функции вида ег^к'я\ где к — целочисленный вектор. Для гармоник теорема проверяется непосредственным вычислением интеграла. Пусть к ф О, тогда / е^ z+^ dt = eikz [ е^ ">« dt = J J г(к, ш) Функция в квадратной скобке ограничена, поэтому временное среднее гармоники с ненулевым номером к равно нулю. Пространст- Пространственное среднее также равно нулю. При к = 0 гармоника равна единице. Оба средних единицы равны единице. Совпадение средних для гармо- гармоник доказано. Из совпадения средних для гармоник следует их совпадение для тригонометрических многочленов: среднее от линейной комбинации равно линейной комбинации средних с теми же коэффициентами. В частности, теорема доказана для / = cos(fc, z) и sin(fc, z). Теперь докажем теорему для вещественных функций; тогда (ввиду линейности средних) она будет доказана и для комплексных. Прибли- Приблизим данную функцию / сверху и снизу непрерывными функциями Р #dx du (Q — Р) — < е (возможность такого 4тг2 приближения при любом е > 0 характеризует функции, интегрируемые по Риману). Приблизим затем функции Р и Q тригонометрическими многочленами р и q так, что \р — Р\ < е, \q — Q\ < e. Обозначим через р0 и q0 свободные члены этих многочленов. Чис- Числа ро и q0 являются как пространственными, так и временными сред- средними многочленов р и q (так как для тригонометрических многочленов временные средние совпадают с пространственными). Таким образом, пространственное среднее /о функции / зажато между ро и q$: Ро < /о < Qo, Qo-Po < ?¦ Обозначим через рт, fT и qT средние р, / и q за время Т: 1 Pt(z) = т / p{z + cjt)dt и т.д.
122 Глава 3 Тогда pT(z) < fT(z) < qT(z) при любом Т, и при достаточно больших Т \Pt(z) ~Ро\ <?, \Qt(z) ~Qo\ <?• Следовательно, при достаточно больших Т Д. Некоторые следствия. 1°. Двумерность тора во всем предыдущем не играла роли. Рас- Рассмотрим уравнение z = и, z ? Тп на n-мерном торе. Вектор частот ш называется резонансным, если существует целочисленный не нулевой вектор к такой, что (ш, к) = 0. Если вектор ш нерезонансный, то временные и пространственные средние непрерывных (или хотя бы интегрируемых по Риману) функ- функций совпадают, и решения равномерно распределены. 2°. Из теоремы о равномерном распределении следует, что первая цифра числа 2п чаще равна семи, чем восьми. Точнее, обозначим че- через Nk{n) число натуральных значений га $C п, для которых 2т начи- начинается с цифры к. Тогда lim ^^ lg8~lg7 = N8{n) lg9 — lg8' 3°. Поводом к открытию теорем о равномерном распределении послужила следующая задача Лагранжа: найти и; = lim -arg/(?), где f{t) = t akeiw>*. k=i Приведем ответ для нерезонансного вектора ш = (ш\, ... , шп). Пусть п = 3. Тогда, если из трех отрезков (ai, аг, аз) можно соста- Е(Хь<аЗь ^ , где аь — угол против стороны а^. При произвольном п ответ также имеет вид взвешенного среднего частот ujk: ш = ^ Wk^k- Веса Wk вычисляются следующим образом. Обозначим через W(ai, ... , а8; Ь) вероятность того, что расстояние от начала до конца плоской ломаной из s звеньев длин ai, ... , а8 со слу- случайными направлениями меньше Ь. Тогда Wk = W(cik', а к) («а — набор из всех чисел а» кроме а^). Доказательство см., например, в статье: Г. Вейль. Среднее движе- движение. УМН, 31, 4A976), 213-219.
§ 11. Дифференциальные уравнения на торе 123 Лагранж пришел к сформулированной выше задаче (называемой за- задачей о среднем движении) следующим образом. Рассмотрим вектор, соединяющий Солнце с центром эллипса, по которому движется плане- планета (он называется вектором Лапласа). В первом приближении теории возмущений эволюция вектора Лапласа под влиянием взаимного тяго- тяготения планет имеет вид движения суммы равномерно вращающихся векторов (их число равно числу планет). Если для планет Солнечной системы подсчитать частоты ш^ и амп- амплитуды а*,, то окажется, что для всех планет, кроме Земли и Венеры, одна из амплитуд аи больше суммы всех других. Поэтому Лагранж сумел найти среднее движение перигелиев всех планет, кроме Земли и Венеры. В случае же Земли и Венеры несколько слагаемых имеют примерно одинаковую амплитуду. Проблема была решена только в два- двадцатом веке в работах Боля, Серпинского и Г. Вейля. Е. Функция последования и угловая функция. Рассмотрим общее дифференциальное уравнение на торе Предположим, что поле ш не имеет особых точек и, более того, что ct>i^O. [Если особых точек и циклов нет, то в подходящей системе коор- координат первая компонента поля всюду отлична от нуля (см. С. L. Siegel. Note on differential equations on the torus. Ann. Math., 46, 3A945), 423-428); нетрудно построить поле без особых точек, но с циклами, не допускающее такой системы координат).] Мы приходим теперь к изучению интегральных кривых неавтономного уравнения с двоякопериоди- ческой правой частью dy - \(т v) А - ^2 — -\{х, у), А-—. Все решения этого уравнения продолжаются не- неограниченно, так как правая часть ограничена. Рис. 79 Определение. Функцией последования для рассматриваемого урав- уравнения на торе называется отображение А оси у в себя, сопоставляющее каждой начальной точке @, у0) значение решения с этим начальным условием при х = 2тг (рис. 79).
124 Глава 3 Функция последования дифференцируема (по теореме о дифферен- цируемости решения по начальным условиям) и обладает свойством периодичности А(у + 2тг) = А(у) + 2тг; обратное отображение А~г так- также дифференцируемо. Таким образом, А определяет диффеоморфизм окружности на себя. Можно представлять себе функцию последования как диффеоморфизм меридиана тора в себя, переводящий каждую точ- точку меридиана в следующую точку пересечения интегральной кривой, проходящей через эту точку, с тем же меридианом. Изучение свойств интегральных кривых на торе сводится, таким образом, к изучению свойств диффеоморфизмов окружности. Напри- Например, предположим, что диффеоморфизм окружности имеет неподвиж- неподвижную точку. Тогда на торе имеется замкнутая интегральная кривая. Обратное неверно (пример — поворот окружности на угол тг). Для того чтобы интегральная кривая, проходящая через данную точку мериди- меридиана тора, была замкнутой, необходимо и достаточно, чтобы эта точка была периодической точкой диффеоморфизма, т.е. чтобы она перехо- переходила в себя после нескольких применений диффеоморфизма. Функция последования задает сохраняющий ориентацию диффео- диффеоморфизм окружности, поэтому ее можно записать в виде Ау = у + а(у), где а(у + 2тг) = а(у), а'(у)>-1. Функцию а мы будем называть угловой функцией. Ж. Число вращения. Число вращения характеризует средний наклон интегральных кри- кривых уравнения на торе; для простейшего уравнения с постоянной пра- правой частью -j- = А число вращения есть А. Определение. Числом вращения уравнения -^- = А(ж, у) на торе называется ц = lim ——, где (р — решение соответствующего уравнения на плоскости. Число вращения выражается через угловую функцию: /1 = ~- lim ^7Г А;->-оо
11. Дифференциальные уравнения на торе 125 В таком виде определение переносится на любой диффеоморфизм окружности, сохраняющий ориентацию. Теорема. Предел в определении числа вращения существует и не зависит от начальной точки; он рационален тогда и только тогда, когда некоторая степень диффеоморфизма имеет неподвижную точ- точку (т. е. когда дифференциальное уравнение имеет замкнутую фазовую кривую). Доказательство. 1°. Рассмотрим угол поворота точки у при fc-кратном применении диффеоморфизма. Обозначим его через ак{у) = а{у) + а{Ау) + а{А2у) Для любых двух точек у\ и у2 имеем а{Ак-1у). 2тг. Действительно, неравенство имеет место при \yi — г/21 < 2тт, так как преобразования прямой А и Ак переводят отрезки длины 2тг в отрезки длины 2тг. Но функция ак 2тг-периодична, поэтому у2 можно изменить на целое кратное 2тг так, что ак{у2) не изменится, а расстояние у\ до у2 станет меньше 2тг. 2°. Обозначим через тк целое число, такое, что 2тгтк ^ ак@) < 2тг(тк + 1). Докажем, что при любом у и при любом целом I аы{у) _ mk_ 2тгЫ к <§• Действительно, \ак(у) — 2тгтк\ < 4тг при любом у, согласно 1°, поэтому ак{у) 2-кк тк к <!¦ аы(у) , , Ho _ f / есть среднее арифметическое / величин 2тгк1 ъ = 0, ... , 1-1. 2ттк , где yi = Агу,
126 Глава 3 6 . Обозначим отрезок ——, , ——, через а^. Мы доказали, что V к к 1 при всех I принадлежит а к- Докажем, что отрезки аи с разными к 2тгк1 пересекаются. тт - аы(у) Действительно, принадлежит как аь, так и щ. 2тгк1 4°. Итак, отрезки аи имеют стремящиеся к 0 длины и попарно пересекаются. Следовательно, они имеют единственную точку пересе- пересечения: она и есть число вращения. Мы доказали, что предел, определя- определяющий число вращения, существует и не зависит от начальной точки. 5°. Пусть на окружности Aq имеет неподвижную точку у- тогда на прямой соответствующая точка при g-кратном отображении сдви- сдвигается на целое кратное 2тг, т.е. aq(y) = 2тгр . В этом случае при лю- любом / aqi(y) = 2тф/, поэтому число вращения ^—-^ рационально. 6°. Пусть /1 = ^. Если при всех у будет aq(y) > 2тгр, то при неко- некотором е > 0 будет aq(y) > 2тгр + е для всех у. Но тогда ц > ^. Если бы было aq(y) < 2тгр для всех у, то было бы ji < jj. Итак, aq — 2тгр меняет знак. Следовательно, существует та- такое у, что aq(y) = 2тгр. ¦ Замечание. Если число вращения /л, иррационально, то порядок точек (у, Ау, А2у, ... , ANy) на окружности при любом у такой же, как в случае поворота на угол 2тг//. Действительно, aq(y) > 2тгр тогда Р и только тогда, когда /j, > -. Заметим еще, что число вращения уравнения на торе зависит от выбора окружности, трансверсальной фазовым кривым (оси у в наших обозначениях). 3. Структурно устойчивые уравнения на торе. Простейшее уравнение на торе z = ш структурно неустойчиво как при резонансном, так и при нерезонансном значении ш. dij Теорема 1. Дифференциальное уравнение на торе -j- = Л(ж, у) структурно устойчиво тогда и только тогда, когда число вращения ра- рационально и все периодические решения невырождены1. 1 А. Г. Майер. Грубые преобразования окружности в окружность. Ученые запис-
§ 11. Дифференциальные уравнения на торе 127 Доказательство. Эта теорема вытекает из доказанного ниже аналогичного предло- предложения о диффеоморфизмах окружности, сохраняющих ориентацию. ¦ Определение. Циклом порядка q диффеоморфизма А: М —»• М называется множество из q точек (у, Ау, ... , Aq~1y) в случае, когда они все различны и Aqy = у. Цикл называется невырожденным, если его точка у является невырожденной неподвижной точкой отображения Aq (т.е. 1 не является собственным числом производной отображения Aq в точке у). Замечание. Производные отображения Aq в разных точках одно- одного цикла подобны, поэтому все точки одного цикла вырождены или невырождены одновременно. Теорема 2. Сохраняющий ориентацию диффеоморфизм окружнос- окружности структурно устойчив если и только если число вращения рациональ- рационально и все циклы невырождены. Структурно устойчивые диффеоморфизмы образуют открытое всюду плотное множество в пространстве С2 всех дважды дифференцируемых сохраняющих ориентацию диффеоморфизмов окружности. Таким образом, диффеоморфизмы общего положения с рациональ- рациональным числом вращения устроены достаточно просто: топологический тип отображения определяется числом циклов, которое должно быть четным (ввиду чередования точек устойчивых и неустойчивых цик- лов). Порядок всех циклов равен q, если число вращения \± = ^. Поря- Порядок точек одного цикла на окружности такой же, как для отображения поворота на угол 2тг//. Теорема 2 доказана ниже в пункте К. Доказательство несложно по модулю следующей нетривиальной теоремы Данжуа A932). Теорема 3. Если сохраняющий ориентацию диффеоморфизм окруж- окружности класса С2 имеет иррациональное число вращения \i, то он то- топологически эквивалентен повороту окружности на угол 2тг//. Предыдущая теория принадлежит Пуанкаре A885); теорему Дан- Данжуа Пуанкаре высказал в виде гипотезы (для уравнений, правая часть ки ГГУ, 12 A939), 215-229; В. А. Плисе. О грубости дифференциальных уравнений, заданных на торе. Вестник ЛГУ, сер. «Мат.» 13, 3 A960), 15—23.
128 Глава 3 которых тригонометрический многочлен). Данжуа привел также при- примеры, показывающие, что С2 нельзя заменить на С1. И. Доказательство теоремы Данжуа. Доказательство. 1°. Точки ... , А~1у, у, Ау, А2у, ... орбиты отображения А на окружности идут в том же порядке, что и точки орбиты поворота на угол 2тг// (см. п. Ж). Поэтому для доказательства теоремы достаточно установить, что орбита отображения А всюду плотна на окружнос- окружности. Действительно, мы получим гомеоморфизм окружности, переводя- переводящий А в поворот, продолжая по непрерывности отображение, которое переводит точки орбиты ...А~1у, у, Ау, ... в соответственные точки орбиты поворота. 2°. Если на окружности есть дуга, свободная от точек орбиты А, то все образы этой дуги при применении степеней диффеоморфизма А попарно не пересекаются. Действительно, рассмотрим максимальную дугу, содержащую данную и свободную от точек орбиты. Все ее об- образы — тоже максимальные дуги. Концы максимальной дуги принад- принадлежат замыканию орбиты. Поэтому концы максимальных дуг не мо- могут лежать в максимальных дугах. Значит, любые две пересекающиеся максимальные дуги обязательно совпадают. Но если максимальная ду- дуга совпадает со своим образом, то ее граничная точка принадлежит циклу, вопреки иррациональности //. 3°. Сумма длин образов максимальной дуги ограничена. Поэтому длины последовательных образов такой дуги под действием как AN, так и A~N стремятся к нулю при N —> оо. Следовательно, интегралы якобианов как положительных, так и отрицательных итераций А по максимальной дуге стремятся к нулю: если обозначить N-l N-1 _ П i=0 a i=0 то при N —»• оо / uN dy -t 0, / vN dy -t 0 (интегралы по максимальной дуге). 4°. Рассмотрим последовательность точек орбиты поворота на угол 2тф (а?о5 сц? о?25 •••)• Предположим, что aq — ближайшая к ад
§ 11. Дифференциальные уравнения на торе 129 среди точек (а±, ... , aq). Тогда точки aq, ... , «2^-1 перемежаются с точками ао, ... , aq-\. Действительно, рассмотрим дугу (а8, ocq+s), s < q, длины 5, рав- равной расстоянию от ао до aq. Предположим, что на этой дуге лежит аг. Если г < s, то на дуге (as-r, as-r+q) лежит ао, поэтому расстояние от as-r до ао меньше д, вопреки выбору aq. Если г > s, то на ду- дуге (ао, aq) лежит аг-8, поэтому г — s > q. Но тогда расстояние от ао до ar-s-q меньше S. Итак, на дуге (as, aq+s) нет точек ar, r < 2q, что и требовалось доказать. 5°. Рассмотрим точки (у, Ау, ... , Aq~1y) и (А~1у, ... , A~qy). Эти два множества точек перемежаются D°). Поэтому для любой функ- функции / ограниченной вариации на окружности, для любой точки у и для любого q, определенного в 4°, величина ограничена сверху и снизу не зависящими от у и q постоянными. 6°. Рассмотрим в качестве / функцию In ^. Это функция ограни- ограниченной вариации, так как А класса С2. Следовательно, величина г=0 У j=0 У ограничена сверху и снизу не зависящими от у и q положительными постоянными (если q выбирается как в 4°). 7°. Противоречие с 3° завершает доказательство теоремы: приме- применяя неравенство Шварца к Л/п^, Л/щ, получаем К. Доказательство теоремы о структурно устойчивых диффеоморфизмах окружности. Доказательство. 1°. Для любых двух сохраняющих ориентацию диффеоморфизмов окружности с одинаковыми рациональными числами вращения и оди- одинаковым числом циклов, если все циклы невырождены, существует го- гомеоморфизм, переводящий первый диффеоморфизм во второй. 9 В. И. Арнольд
130 Глава 3 Для доказательства нужно сначала сопоставить точкам одного устойчивого цикла первого диффеоморфизма точку какого-либо устой- устойчивого цикла второго, затем соседнего неустойчивого и т. д. для всех циклов (порядок точек цикла на окружности такой же, как у поворота). Это сопоставление можно затем продолжить на смежные интервалы, пользуясь следующей легко доказываемой леммой: Любые два гомеоморфизма интервала на себя, не имеющие непо- неподвижных точек, топологически сопряжены. 2°. Если число вращения рационально и все циклы невырождены, то при малом шевелении число вращения, число циклов и невырож- невырожденность циклов сохранятся (по теореме о неявной функции). Следо- Следовательно, диффеоморфизм с рациональным числом вращения, все циклы которого невырождены, структурно устойчив (см. 1°). 3°. Если диффеоморфизм имеет вырожденный цикл, то малым ше- шевелением диффеоморфизма в окрестности точек этого цикла можно из- изменить число циклов. Поэтому диффеоморфизм с вырожденным циклом структурно неустойчив. 4°. Если число вращения иррационально, то его можно изменить сколь угодно малым изменением диффеоморфизма. Действительно, рас- рассмотрим возмущенный диффеоморфизм у \—> А(у) + ?, ? > 0. По теореме Данжуа, в некоторой системе координат (не гладкой) z \—> i—> z + 2-kji + (p(z), cp > 0. Поэтому число вращения возмущенного диф- диффеоморфизма больше \1. Итак, всякий диффеоморфизм с иррациональным числом вращения структурно неустойчив. 5°. Число вращения — непрерывная функция от диффеоморфизма. Действительно, //, < ^ если и только если при g-кратком применении диффеоморфизма все точки сдвигаются меньше, чем на 2тгр. Это свой- свойство сохраняется при достаточно малом изменении диффеоморфизма. 6°. Диффеоморфизмы с рациональными числами вращения образуют плотное множество. Это вытекает из 4°, 5° и плотности множества рациональных чисел. 7°. Все циклы диффеоморфизма с рациональным числом вращения можно сделать невырожденными, сколь угодно мало изменив диффео- диффеоморфизм. Действительно, сколь угодно малым шевелением в окрестности од- одного цикла можно сделать этот цикл невырожденным. Пусть 7 — одна из дуг, на которые один невырожденный цикл делит окружность. Опре-
11. Дифференциальные уравнения на торе 131 делим гладкую функцию (р, равную 1 на 7 вне малой окрестности кон- концов 7 и равную 0 вне 7- Положим А?у = А(у) +еср(у). Число вращения этого диффеоморфизма прежнее, так как цикл сохранился. Пусть q — порядок цикла. Тогда Aq(y) на дуге А*у совпадает с Aq(y)+e вне окрест- окрестности концов дуги А*у. Применим к функции Aq(у) — у na Aj лемму Сарда. Мы убеждаем- убеждаемся, что при почти всех е все неподвижные точки Aqe на Aj невырожде- невырождены. Но каждый цикл отображения Ае имеет представителя на дуге А*у. Следовательно, все циклы отображения А? невырождены. ¦ Л. Обсуждение. 1°. Предыдущие теоремы создают впечатление, что «общий» диф- диффеоморфизм окружности имеет рациональное число вращения, а диф- диффеоморфизмы с иррациональным числом вращения являются исклю- исключением. Численные эксперименты, однако, обычно приводят к всюду плотным (по меньшей мере на вид) орбитам. Чтобы объяснить это яв- явление, рассмотрим, например, семейство диффеоморфизмов А, У esmy, a e [0, 2тг], ? € [0, 1). Будем изображать каждый диффеоморфизм точкой на плоскости (а, е). Множество диффеоморфизмов с числом вращения /л, = ^ ограничено (как нетрудно сосчитать) парой гладких кривых, и подходит к оси е = О тем более узким языком, чем больше q. Объединение всех этих мно- множеств всюду плотно. Однако оказывается, что мера множества точек плоскости параметров, для которых число вращения рационально, в об- области О $С е $С ?о? О $С а $С 2тг мала по сравнению с мерой этой области (рис. 80). //=1/6//=1/3 //=1/2 //=2/3//=5/6 //=1 2л- Рис. 80
132 Глава 3 Таким образом, наугад взятый диффеоморфизм нашего семейства с малым е с подавляющей вероятностью имеет иррациональное число вращения. Более того, аналогичный результат имеет место для любого анали- аналитического или достаточно гладкого семейства диффеоморфизмов, близ- близких к поворотам, например, для семейства у \—У у + а + еа(у) с любой аналитической функцией а: при малых е орбиты с подавляющей веро- вероятностью всюду плотны на окружности, и число вращения иррацио- иррационально. Таким образом, точка зрения структурной устойчивости не явля- является единственным подходом к понятию системы общего положения. Метрический подход, указанный выше, в ряде случаев лучше подходит для описания реально наблюдаемого поведения системы. 2°. Согласно теореме Данжуа, гладкое отображение с иррациональ- иррациональным числом вращения топологически эквивалентно повороту. Возника- Возникает вопрос, будет ли это отображение гладко эквивалентно повороту. Ответ на этот вопрос оказывается отрицательным в случае, когда число вращения ненормально быстро аппроксимируется рациональны- рациональными числами (А.Финци). Вопрос о гладкой эквивалентности повороту сводится к вопросу о гладкости инвариантной меры преобразования. Если число вращения рационально, то инвариантная мера сосредоточе- сосредоточена в отдельных точках. Если же число вращения очень быстро аппрок- аппроксимируется рациональными числами с не слишком большими знаме- знаменателями, то инвариантная мера столь быстро аппроксимируется ме- мерами, сосредоточенными в отдельных точках, что она не может быть даже абсолютно непрерывной относительно меры Лебега. Поэтому го- гомеоморфизмы в теореме Данжуа нельзя заменить диффеоморфизмами. 3°. С метрической точки зрения наугад взятое число ц с вероят- вероятностью 1 иррационально и, более того, не допускает слишком быстрой аппроксимации рациональными числами с небольшими знаменателями. Например, при любом е > 0 с вероятностью 1 существует С > 0 такое, что - С - q2+e для любых целых р, q > 0. Поэтому возникает предположение, что яв- явление 2° встречается лишь с вероятностью 0. Сформулируем два ре- результата в этом направлении.
§ 11. Дифференциальные уравнения на торе 133 Теорема. Для почти всякого числа вращения \i достаточно глад- гладкий (класса С3 или выше) диффеоморфизм окружности с числом враще- вращения ji гладко эквивалентен повороту на угол 2-kji (М.Эрман, 1976). Здесь «почти всякий» означает, что мера Лебега исключаемого мно- множества чисел вращения равна нулю. Теореме Эрмана предшествовали аналогичная теорема для отобра- отображений близких к повороту и следующий результат (доказанный в ана- аналитическом случае в 1959 г., а в гладком Ю. Мозером в 1962 г.) Теорема. В достаточно гладком семействе у \—> у + а+еа(у) ме- мера множества пар (а, е) в области О $С а $С 2тг, О $С е $С е0, для которых диффеоморфизм не приводится к повороту гладким диффеоморфизмом, стремится к нулю вместе с е$. Эта теорема справедлива и для отображений n-мерного тора. Доказательство этих результатов выходит за рамки настоящего курса, однако мы рассмотрим в следующем параграфе принадлежащую А. Н. Колмогорову технику доказательства теорем этого рода в простей- простейшем случае аналитического диффеоморфизма. М. Приближения иррациональных чисел рациональными. Теорема. Для любого иррационального числа ji существуют сколь угодно точные рациональные приближения, ошибка которых меньше об- обратной величины квадрата знаменателя: Например, число тг можно приблизить с ошибкой порядка одной миллионной рациональной дробью с трехзначными числителем и зна- знаменателем, ТГ ~ уу|. Прежде чем доказывать теорему, укажем геометрический способ нахождения бесконечной последовательности таких приближений (на- (называемый алгоритмом цепных дробей, или алгоритмом вытягивания носов, или попросту алгоритмом Евклида). Рассмотрим плоскость с координатами (ж, у) (рис. 81).
134 Глава 3 Проведем прямую у = fix. Для опре- определенности будем считать ц > 0. Отметим в первом квадранте все точки с целыми коор- координатами. Исключая точку О, они не лежат на нашей прямой, так как ц иррационально. Рассмотрим выпуклые оболочки целых точек квадранта, лежащих по одну сторону от на- нашей прямой («ниже» её) и по другую («вы- («выше»). [Чтобы построить эти выпуклые обо- оболочки, можно представить себе нить, закреп- закрепленную в бесконечности и лежащую на на- нашей прямой. Представим себе, что в каждой отличной от О целой точке нашего квадран- та вбит гвоздь. Потянем нить за свободный конец О вниз (соответственно вверх). Тогда нить натянется, наткнувшись на некоторые гвозди, образуя границу нижней (соответственно верхней) выпуклой оболочки.] Вершины по- построенных выпуклых ломаных определяют приближения к иррацио- иррациональному числу //, о которых шла речь. Если целые числа (q, p) — координаты вершины, то дробь ^, отвечающая вершине, называется подходящей дробью для ji. Оказывается, для любой подходящей дро- дроби у. V У А У W 7 J V ез / *У= Ч / JUX Рис. 81 p Для доказательства этого неравенства опишем построение наших выпуклых ломаных другим способом. Обозначим через e_i базисный вектор A, 0) и через е0 — вектор @, 1). Эти векторы лежат по разные стороны от прямой у = fix. Будем строить последовательность векто- векторов ei, ег, ... по следующему правилу. Пусть ek-i и ек, уже построены и лежат по разные стороны от нашей прямой. Будем прибавлять к век- вектору е^_1 вектор ек столько раз, сколько можно, чтобы сумма лежала по ту же сторону от прямой у = fix, что и ek-i- Таким образом, получаем последовательность натуральных чи- чисел а/г и последовательность целочисленных векторов аоео, ek+1 = ек- акек, Векторы ек и являются вершинами наших двух выпуклых оболочек (попеременно — верхней при четных к и нижней при нечетных).
§ 11. Дифференциальные уравнения на торе 135 Лемма. Площадь параллелограмма, натянутого на векторы , ел), равна (с учетом ориентации) (—1)к. Доказательство. Для исходного параллелограмма (ео, e_i) это очевидно. Каждый следующий параллелограмм имеет с предыдущим общую сторону и равную высоту, и задает противоположную ориентацию плоскости. ¦ Следствие. Обозначим координаты точки ек через qk ирк. Тогда разность двух последовательных подходящих дробей равна Рк Рк+i (-1)* Qk Qk+1 Qk Qk+1 ' Доказательство. При приведении дробей к общему знаменателю числителем оказы- оказывается определитель из компонент ек+1 и е^, равный ориентированной площади параллелограмма. ¦ Доказательство теоремы. Векторы ек лежат попеременно то по одну, то по другую сторону от прямой у = цх. Поэтому подходящие дроби попеременно то больше, то меньше, чем II. Следовательно, разность между \± и подходящей дробью мень- меньше модуля разности между этой подходящей дробью и следующей. По следствию эта разность по модулю равна —^—, что не больше -^, так ^ как qk+1 ^ qk при к ^ 0. Qk Замечание. Числа ак называются неполными частными. Подхо- Подходящие дроби выражаются через неполные частные так: Рк . 1 — = а0 -\ qk Выражение uq -\ -^— называется бесконечной цепной дробью. Число [I разлагается в бесконечную цепную дробь в том смысле, что Hm^ = /i.
136 Глава 3 § 12. Аналитическое приведение к повороту аналитических диффеоморфизмов окружности В этом параграфе при помощи принадлежащей А. Н. Колмогорову моди- модификации метода Ньютона доказывается теорема об аналитических диффео- диффеоморфизмах окружности, близких к повороту и имеющих почти любое число вращения. А. Формулировка теоремы. Обозначим через Пр полосу |Imy| < р. Для голоморфной функции а, ограниченной в этой полосе, будем обозначать ||а||р = sup |а(у)|, у ? Пр. Пусть /i — иррациональное число, К > О, ег > 0. Мы скажем, что /i число типа (К, ег), если для любых целых р и q ф 0 К 2+а ' Теорема. Существует такое е > 0, зависящее только от К, р, а, что если а — 2тг-периодическая аналитическая вещественная на вещественной оси функция с \\a\\p < е такая, что преобразование у i—у у + 2тгр, + а(у) задает диффеоморфизм окружности с числом вращения ц типа {К, а), то этот диффеоморфизм аналитически эквивалентен повороту на угол 2тг/л. Б. Гомологическое уравнение. Обозначим через it поворот на угол 2тг/л и через Н искомый диффеомор- диффеоморфизм, превращающий поворот в А: коммутативна диаграмма я, Запишем Н в виде Hz = z-\-h(z), h(z + 2тг) = h(z). Тогда для h получаем функциональное уравнение h(z + 2-Kfi) - h(z) — a(z + h(z)). Если А мало отличается от поворота, то а мало. Естественно ожидать, что и h — того же порядка малости. Тогда a(z + h(z)) отличается от a(z) на величину более высокого порядка малости, чем а. Поэтому «в первом при- приближении» мы получаем для h уравнение h(z + 2-Kfi) - h(z) = a(z). Это линейное уравнение называется гомологическим уравнением.
§12. Аналитическое приведение к повороту 137 Замечание. Мы можем рассматривать совокупность всех диффеомор- диффеоморфизмов А как «бесконечномерное многообразие», на котором действует «бес- «бесконечномерная группа» диффеоморфизмов Н. При этом функцию а можно интерпретировать как касательный вектор к многообразию диффеоморфиз- диффеоморфизмов в точке il, а функцию h — как касательный вектор к группе в единице. В этих терминах гомологическое уравнение имеет следующий смысл: а принадлежит касательному пространству к орбите точки il под действием группы если и только если гомологическое уравнение относительно h разре- разрешимо. В. Формальное решение гомологического уравнения. Разложим известную функцию а и неизвестную h в ряды Фурье: Сравнивая коэффициенты при ег z, находим hk = -^~1 • е — 1 Для разрешимости уравнения необходимо, чтобы знаменатели обраща- обращались в нуль лишь одновременно с числителями. В частности, гомологическое уравнение неразрешимо, если ао ф 0. Если ао = 0 и число вращения р, ирра- иррационально, то предыдущие формулы дают решение гомологического уравне- уравнения в классе формальных рядов Фурье. Чтобы получить настоящее решение, необходимо исследование сходимости этого ряда. Г. Поведение коэффициентов Фурье аналитических функций. Лемма 1. Если f — 2тг-периодическая функция, аналитическая в поло- полосе Ир, непрерывная в замыкании этой полосы, и \\f\\p ^ M, то ее коэффици- коэффициенты Фурье убывают в геометрической прогрессии Доказательство. Как известно, Д = тг~ ф f(z)e~lkzdz. Пусть к > 0. Сдвинем путь ин- 2тг/ тегрирования вниз (на — ip). Интеграл не изменится, так как интегралы по вертикальным сторонам полученного прямоугольника равны. Итак, — кр Д = ±J f(x-ip)e-ik*-k»dx, |Д| ^ Ме о При к < 0 путь нужно сдвинуть вверх (на ip).
138 Глава 3 Лемма 2. Если |Д| ^ Me~'fe'p, то функция f = ^ fk^lkz аналитична в полосе Ир, причем \\f\\p-s ^ —?- ирм 5 < р, S < 1. Доказательство. \eikz ЗАМЕЧАНИЕ. В случае функций п переменных лемма 1 сохраняется, а в лемме 2 оценка —^ заменяется на , где С = С(п) — не зависящая о о от S и / постоянная. Д. Малые знаменатели. При решении гомологического уравнения коэффициенты Фурье правой части приходится делить на числа е2пгк>г — 1. Если число /i иррационально, то при к ф 0 эти числа отличны от 0. Однако некоторые из них очень близки Р к 0. Действительно, каждое число /i допускает рациональные приближения — < —г- при сколь угодно большом q. При к = q знамена- с ошибкой ' " «* тель е2жгк1г — 1 будет очень мал. Оказывается, с вероятностью 1 все эти малые знаменатели допускают степенную по к оценку снизу. Лемма 3. Пусть а > 0. Тогда для почти каждого вещественного /i су- существует К = if(/i, ег) > 0 такое, что К - ы2+* для всех целых р и q ф 0. Доказательство. Рассмотрим на отрезке [0, 1] те числа /i, для которых приведенное не- неравенство (с фиксированными р, q, К, а) нарушается. Эти числа образуют отрезок длины не больше . Объединение таких отрезков для всех р (при
§12. Аналитическое приведение к повороту 139 фиксированных q > О, К, а) имеет суммарную длину не более . Сумми- руя по q, получаем множество меры, не большей СК, где С=2 Следовательно, множество чисел \i (E [0, 1], для которых требуемое в лемме К не существует, покрывается множествами сколь угодно малой меры. Значит, это множество имеет меру ноль (на отрезке [0, 1] и, следовательно, на всей прямой). ¦ Замечание. Числа /i, удовлетворяющие указанному выше неравенству, названы в п. А числами типа (К, ег). Для числа /i типа (К, ег) малый знаменатель допускает следующую оцен- оценку снизу: е2пгк(г _\\-^ — <МА > 0). 2\к\1+" Доказательство. Действительно, расстояние от k\i до ближайшего целого числа оценивает- оценивается снизу числом —П^5 а хоРДа единичной окружности не короче, чем длина \к\ +<Т меньшей из стягиваемых ею дуг, поделенная на тг. ¦ Е. Исследование гомологического уравнения. Пусть а — 2тг-периодическая аналитическая функция со средним значе- значением 0. Лемма 4. Для почти всех /i гомологическое уравнение имеет ^-перио- ^-периодическое аналитическое решение {вещественное, если а вещественная функ- функция). Существует такая постоянная v = v(K, a) > 0, что если \i ти- типа (К, а), то для любого S > 0, меньшего р, и для любого р < ^ ЗАМЕЧАНИЕ. Таким образом, переход от а к h ухудшает свойства функ- функции не сильнее, чем г/-кратное дифференцирование. [Полезно отметить, ^ С||/|1^~v 1 согласно оценке Коши коэффициентов Тейлора.] Если пренебречь ухудшением функции, вызванным г/-кратным дифференци- дифференцированием, то можно сказать, что решение h гомологического уравнения того же порядка малости, что и его правая часть а. Доказательство. 1°. По лемме 1, |а&| ^ Me~|fe|p, если ||а||р ^ М.
140 Глава 3 2Me-lklp\k\1+c 2°. Поскольку ц типа (К, ег), \hk\ к 3°. Функция хте~ах, х ^ 0, имеет максимум в точке х = Щ-. Поэто- _ _ /гп\т му хте ах ^ Са т, С — [-?) при любых а > 0, х > 0. Следовательно, для любого а > 0 4°. Итак, |/ife| ^ Ме-1Щр-аJСК-1а-т. По лемме 2, \\h\\ps где D = -. Возьмем а. = —. Число D не превосходит 6~1У, если г/ К а (б — а) * достаточно велико (ибо S < —)¦ ¦ Ж. Построение последовательных прибли^кений. Решим гомологическое уравнение с правой частью а — а — ао (ао — сред- среднее значение функции а). Обозначим решение через h°. Определим отображе- отображение Но формулой Hqz — z + h°(z). Построим отображение А\ — Н^1 о Ао Но. Определим функцию а1 соотношением A±z = z + 2тг/л + a1 (z). Иными словами, мы ввели на окружности новую координату z\ (где z = Ho(zi)) и записали отображение А через новую координату. Получилось отображение z\ \—> A±zi, отличающееся от поворота на угол 2тг/л на «невяз- «невязку» а1. Следующее приближение строится точно таким же образом, отправ- отправляясь от А\ вместо А. Мы строим h1 и замену Hi, превращающую А± вАг = Н^1 о Ai о Hi. Возникает последовательность замен Нп. Рассмотрим замену Жп = Ноо oHi о ... о Нп-г. Имеем Ап = Ж~х о Ао Жп. Оказывается, последовательность Жп сходится, если /i — число ти- типа (К, а) и если \\а\\р достаточно мала. Предельная замена Ж превращает исходное отображение в Ж~х о Ао Ж = limАп =поворот на угол 2тг/^. 3. Оценка невязки после одного приближения. Лемма 5. Существуют постоянные хг, А > 0, зависящие лишь от К и а, такие, что для любого б из интервала @, р), где р < -^, Замечание. Это означает, что оставшаяся после первой замены пере- переменной невязка а1 имеет второй порядок малости по сравнению с исход- исходным отличием от поворота, а (с точностью до ухудшения типа Л-кратного
12. Аналитическое приведение к повороту 141 дифференцирования функции). Таким образом, в приведенной схеме последо- последовательных приближений ошибка каждого следующего приближения порядка квадрата ошибки предыдущего. После п приближений получим ошибку по- порядка е2 , где е — ошибка исходного, нулевого приближения. Такая сходимость, характерная для ньютоновского метода касатель- касательных (рис. 82), позволяет парализовать влияние появляющихся на каждом шагу малых знаменателей (т.е. влияние ухудшающего множителя 5~х); этот метод борьбы с малыми знаменателями изобретен А. Н. Колмогоровым A954). Доказательство. 1°. Пусть П, — выпуклая область в Сп (или Мп), h: П. —>¦ С" (соответственно М.п) — гладкое отображе- отображение, причем ||h* || = sup 11h* (x) \ \ < 1. Тогда отображе- отображении ние H, переводящее х в x + h(x), является диффео- диффеоморфизмом Г2 на Н$1. ~>" Доказательство. Собственные числа Н*(х) отличны от 0, поэто- Рис. 82 му Н локальный диффеоморфизм. Ввиду условия \h*\ < q < 1 и ввиду выпуклости П, отображение h сжимающее. Следовательно, разность между сдвигами любых двух разных точек при отображении Н меньше расстояния между этими точками, поэтому их образы различны, т. е. Н взаимно одно- однозначно. ¦ 2° Покажем, что если >с достаточно велико, то отображение А\ аполи- аполитично в полосе li-n-s- Доказательство. Пусть \\a\\p < М = 5*. Тогда \ао\ -a < 2Ma~v. Следовательно, М, ||о| р-2а 1М. По теореме п. Е, Выберем а — —. Тогда, если х достаточно велико, то мы получим из 8 предыдущих неравенств ||а||р < a, \\h°\\p-a < а, —— < а. dZ p-2a Следовательно, согласно 1°, Н\ — диффеоморфизм полосы Пр_2а, и образ содержит полосу Пр_за. Теперь H0Up-s С Пр_5+а, А о HOUP-S С Up-S+2a С Пр_3а. Следова- Следовательно, диффеоморфизм i?^1 определен на А о Hollp-s- Значит, отображе- отображение Ai — Hq1 oAoHq аналитично в Hp-s и является там диффеоморфизмом.
142 Глава 3 3°. Оценим невязку о1. Доказательство. Коммутативная диаграмма, определяющая о1, дает z + 27Tfj, + al(z) + h°(z + 2тф + а1^)) = z + u°(z) Учитывая гомологическое уравнение, получаем a\z) = [a(z + h°(z)) - a(z)] - [h°(z + 2тг/х + аг(г)) - h°(z + 2тф)] + o0. Первая квадратная скобка оценивается по теореме о среднем и неравенству Коши. На основании 2° получаем \\a(z + h°(z)) - a(z)\\p-s ^ f\\h°\\p-s ^ M2S~U, где постоянная и зависит лишь от i/, т.е. лишь от К и а. Вторая квадратная скобка оценивается аналогично: ||[ ]||„_* < 2Ма-{'/+1)\\а1\\р-8 ^ MS-^W^lls. Итак, 4°. Оценим теперь величину |оо|, пользуясь тем, что число вращения преобразования А, а значит и А±, равно Доказательство. Из этого следует, что о1 обращается в нуль в некоторой вещественной точке zq. Подставим в формулу для о1 (z) значение zq. Мы получим оо = = a(zo) — a(zo + h°(zo)) и, следовательно, |оо| ^ М28~и (см. 3°). ¦ 5°. Из оценок 3° и 4° следует, что По.1 ||р—5 < 4М25~и. ¦ И. Сходимость системы приближений. 1°. Построенное на п-м шагу отображение Ап мы будем рассматривать в полосе радиуса рп, уменьшающегося с каждым приближением: ро = р, Рп — Рп-1 — firif Последовательность чисел дп мы выберем убывающей следующим обра- образом: Sn = S3n/21, 5o<2- р Тогда при достаточно малом ^о будет ^J ^„ < —. 2°. Образуем последовательность чисел Мп, полагая Достаточно большое число iV (зависящее лишь от К и а) будет окончательно выбрано ниже. Заметим, что Мп = М^_г.
§12. Аналитическое приведение к повороту 143 3°. Предположим, что \\а\\р ^ Mq. Докажем, что ||ап||рп ^ Мп. Доказательство. Согласно предложению 3, если N > >г, то Но SqN~x < 6? = SqN/2, если N > 2А. Выберем JV, большее чем 2А и ус. Тогда получим На1!!,! ^6? = Мг. Переход от ап~1 к ап аналогичен. ¦ 4°. Докажем сходимость произведений Жп = Но о ... о Нп-\ в Пр/2- Диффеоморфизм i/о аналитичен в ПР1 и удовлетворяет неравенст- \Р1 (см. 2° п. 3). Точно так же для Hn-i получается \\hn 1\\Рп ^ dn-i dhr dz Рп Sn-1 Следовательно, Жп аналитично в ИРп и имеет производную, ограниченную сверху и снизу величинами С = J|(l + 6k), с = J|(l — 6k)- Отсюда следует, что Жп диффеоморфизм ПРп и что в Пр/2 последова- последовательность Жп сходится. Действительно, \р/2 ^ С8п- Обозначим через Н предел последовательности Жп- Переходя к пределу в соотношении А о Жп = Жп о Ап, получаем А о Ж = Ж о И, где it — поворот на угол 2тг/х. Теорема доказана. ¦ К. Замечания. 1°. Ю. Мозер заметил, что комбинируя описанные приближения со сгла- сглаживанием Нэша можно доказать аналогичную теорему в случае конечной гладкости (см. Ю. Мозер. Быстро сходящийся метод итераций и нелинейные дифференциальные уравнения. УМН 23, 4 A968), 179-238). В первых работах Мозера требовались сотни производных. В даль- дальнейшем усилиями Мозера и Рюссмана число производных было снижено (Н. Russmann. Kleine Nenner II: Bemerkungen zur Newtonischen Methode. Nachr. Acad. Wiss Gottingen, Math. Phys Klasse 1 A972), 1-10). 2°. В многомерном случае число вращения не определено. Тем не менее в семействе отображений у \—> у + а + а(у) с малым о, уЕТп, для большин- большинства а отображение гладко эквивалентно сдвигу у \—у у + 2тг/л. В частности, для аналитического семейства у \—> у + а + eai(y) + е2ог(у) + ... при почти каждом ц, существует аналитическая функция а(е) = 2тг/л + efii + ..., такая, что отображение у \—> у + а(е) + eai(y) + ... превращается в у \—у у + 2тг/х после аналитической замены у = z + ehi(z) +
144 Глава 3 Коэффициенты hi, ... можно найти, приравнивая члены с одинаковой степенью е. Однако доказать сходимость так полученных рядов по е удается лишь косвенно, с помощью ньютоновских приближений. 3°. Кажется правдоподобным, что аналитический диффеоморфизм окру- окружности аналитически эквивалентен иррациональному повороту тогда и толь- только тогда, когда неподвижные точки степеней диффеоморфизма не накапли- накапливаются к вещественной оси. Можно также думать, что для некоторых ир- иррациональных A, ненормально хорошо приближаемых рациональными, функ- функция а(е), описанная в 2°, не является даже гладкой (даже в одномерном слу- случае). § 13. Введение в гиперболическую теорию В этом параграфе доказывается теорема Аносова о структур- структурной устойчивости автоморфизма тора и теорема Гробмана-Хартмана о структурной устойчивости седла. А. Простейший пример: линейный автоморфизм тора. Дифференциальные уравнения с многомерными фазовыми про- пространствами определяют большой класс структурно устойчивых сис- систем, в которых каждая фазовая кривая расположена среди соседних та- таким же образом, как положение равновесия типа седло среди соседних гипербол. Начнем с простейшего примера (рис. 83). Рассмотрим автоморфизм А тора Т2, который задается цело- целочисленным унимодулярным (име- (имеющим определитель 1) линейным ^ ^ /^Ш^^ ]Щ^^//А преобразованием А плоскости с ШЯШ ¦*- /^Л иг/?\ матрицей Рис. 83 2 1 1 1 Решетка 2ttZ2 переходит под действием А в себя. Поэтому эквивалент- эквивалентные (сравнимые по модулю 2тг) точки плоскости А переводит в экви- эквивалентные. Следовательно, А определяет отображение А тора на себя. Обратная матрица А~х тоже целочисленная, так как det A = 1. Поэто- Поэтому А является диффеоморфизмом тора на себя. Кроме того, А является автоморфизмом группы Т2 = Ж2/2ttZ2.
§ 13. Введение в гиперболическую теорию 145 Б. Свойства автоморфизма тора. Конечное множество точек называется циклом отображения А, ес- если А переставляет их циклически. Теорема 1. Автоморфизм тора А имеет счетное число циклов. Все точки, обе координаты которых — рациональные кратные 2тг и только они, являются точками циклов автоморфизма А. Доказательство. 1°. Зафиксируем целое число N, тогда точки тора, координаты ко- которых — рациональные кратные 2тг со знаменателем N, образуют ко- конечное множество. Преобразование А переводит это множество в себя. Следовательно, все точки этого множества принадлежат циклам. 2°. Пусть 2тг? — точка цикла порядка п > 1. Тогда Ап^ = ? + га, где га — целочисленный вектор. Полученное линейное уравнение отно- относительно ? имеет отличный от нуля определитель. Поэтому компонен- компоненты ? рациональны. ¦ Теорема 2. Итерации автоморфизма А равномерно размазывают по тору произвольную область F : для любой области G Um mes(A"F) П G = mesG n-юо mes-F mesT2 Это свойство автоморфизма А называется перемешиванием; оно имеет место для любых измеримых множеств F, G. Доказательство. В терминах функций на торе это соотношение можно переписать в виде где (щ v) = ju(x)v(x)dx, (An*f)(x) = f(Anx). Пусть теперь / — экспонента: / = el^p'x\ Тогда Ап* f также экс- экспонента с волновым вектором р' = Ап р. Если р ф 0, то орбита точки р под действием операторов Ап бесконечна. Поэтому для любой экспо- экспоненты g = ег(д>ж) имеем Km (Ап* /, g) = 0. Аппроксимируя /и^в сред- п—юо нем квадратичном суммами экспонент, получаем требуемое. ¦ 10 В. И. Арнольд
146 Глава 3 Более поучительное (хотя и бо- более сложное при аккуратном прове- проведении) доказательство перемешива- перемешивания получается следующим образом. Теорема 3. На торе сущест- существуют два поля направлений, инвари- инвариантных относительно автоморфиз- автоморфизма А. Интегральные кривые каждо- каждого из этих полей направлений всюду плотны на торе. Автоморфизм А переводит интегральные кривые первого поля в интегральные кривые того же поля с растяжением в А > 1 раз, а второго — со сжатием в А раз (рис. 84). Рис. Доказательство. 3± Рассмотрим собственные числа преобразования A, Air2 = Очевидно, Ai > 1 > А2 и числа Ai, A2 иррациональны. Рассмотрим на плоскости семейство всех прямых, параллельных первому собственно- собственному вектору преобразования А. Поскольку Ai иррационально, компонен- компоненты собственного вектора несоизмеримы. Поэтому на торе прямые се- семейства определяют всюду плотные обмотки. Преобразование плоскос- плоскости А переводит это семейство прямых в себя, с растяжением в Ai > 1 раз. Поэтому преобразование тора А переводит в себя семейство об- обмоток, с таким же растяжением. Это семейство называется расширяю- расширяющимся слоением преобразования А. Второе собственное направление определяет таким же образом сжимающееся слоение. ¦ Рассмотрим теперь образ плоской области F под действием пре- преобразования плоскости Ап. Это преобразование представляет собой ги- гиперболический поворот: растяжение в А™ раз по первому собственному направлению и сжатие в А" раз по второму. Поэтому образ области F представляет собой при больших п узкую длинную полосу, вытянутую вдоль первого собственного направления. Следовательно, на торе образ области F под действием преобразования Ап представляет собой длин- длинную узкую полосу, близкую к длинному отрезку фазовой кривой урав- уравнения х = со с нерезонансным вектором ш. Но эта кривая равномерно распределена по тору. Отсюда вытекает, что при увеличении п обра-
§ 13. Введение в гиперболическую теорию 147 зы AnF пересекут любую область G на торе; немного потрудившись, можно вывести из этих соображений и свойство перемешивания. В. Структурная устойчивость автоморфизма тора. Удивительный факт, открытый в начале 60-х годов и явившийся одним из важнейших достижений в теории дифференциальных урав- уравнений за последние десятилетия, состоит в том, что рассматривавший- рассматривавшийся выше автоморфизм тора структурно устойчив в классе всех диф- диффеоморфизмов тора. В частности, всякий диффеоморфизм, достаточно близкий к А, имеет счетное число циклов и всюду плотное множество периодических точек. Теорема Аносова. Автоморфизм тора А: Т2 —>¦ Т2, заданный матрицей I ^ г ], структурно устойчив в С1 топологии. Иными сло- словами, каждый диффеоморфизм В, достаточно близкий к А вместе с производной, сопряжен с А при помощи некоторого гомеоморфизма Н- В = Н~1 оАоН. Замечание. Гомеоморфизм Н можно выбрать сколь угодно близ- близким к тождественному преобразованию, если В достаточно близко к А, но нельзя, вообще говоря, сделать гладким. Теорема Аносова показывает, что в случае систем с многомерным фазовым пространством возможно и сохраняется при малых шевелени- шевелениях поведение фазовых кривых, не сводящееся к притяжению к устой- устойчивым положениям равновесия и циклам, как это было в случае век- векторных полей на двумерной сфере или торе. Физический смысл такого более сложного, чем автоколебания, поведения динамических систем мы обсудим позже. Доказательство теоремы Аносова дано в следую- следующих пунктах Г-Ж. Г. Гомологическое уравнение. Мы ищем гомеоморфизм Н, Н(х) = х + h(x), делающий коммута- коммутативной диаграмму ТП) 2 » ТП) 2 н\ Г' о 2 -™-, тть 2 где В(х) = Ах + /(ж); функции / и h имеют по х период 2тг.
148 Глава 3 Из диаграммы получаем нелинейное функциональное уравнение относительно h: h{Ax) - Ah(x) = f(x + h(x)). Мы считаем функцию / малой, предполагаем, что h окажется ма- малой того же порядка и поэтому заменяем правую часть на /(ж), отбра- отбрасывая «малую второго порядка». Получаем линеаризованное уравнение h(Ax)-Ah(x) = f(x). Это уравнение называется гомологическим уравнением. Д. Решение гомологического уравнения. Левая часть гомологического уравнения линейно зависит от h. Обо- Обозначим линейный оператор, переводящий h в левую часть гомологичес- гомологического уравнения, через L. Решение гомологического уравнения имеет вид h = L~x f. Нужно лишь доказать, что оператор L обратим. Лемма 1. Пространство векторных полей на торе распадается в прямую сумму двух подпространств, инвариантных относительно оператора L. Доказательство. Пространства векторных полей, параллельных первому и второ- второму собственному направлению оператора А, инвариантны относитель- относительно преобразования, и каждое векторное поле единственным образом представляется в виде суммы двух полей, направленных вдоль собст- собственных направлений. ¦ Пусть / = /iei + /262, h = h\e\ + h,2e2 — разложения полей / и h. Тогда гомологическое уравнение принимает вид системы h2(Ax) - X2h2{x) = /2(ж). Здесь Ai = Aj > 1 > A2 = A — собственные числа. Рассмотрим оператор сдвига аргумента на А в пространстве не- непрерывных функций на торе. Обозначим его через S. Имеем (Sg)(x)=g(Ax), ||5|| = 1, HS-^l. Гомологическое уравнение записывается теперь в виде {S - ХгЩЫ = fi, t = l,2.
§ 13. Введение в гиперболическую теорию 149 Пусть г = 1. Тогда E - AiE) = -Х(Е + XS + Л2S2 + ...)• Поскольку Л < 1 и ||5|| = 1, обратный оператор существует и Аналогично (S - ЛзЕ) = S'^E - XS'1)-1 = S-\E + XS'1 + X2S~2 + ...), K^-Aa^)!! ^ A-A)-1. Таким образом, оператор L~x существует, причем ЦХ!! ^ A — Л). Гомологическое уравнение решено. Е. Построение отображения Н. Нелинейное функциональное уравнение из пункта Г решается те- теперь простейшим методом сжатых отображений. Положим Наше функциональное уравнение имеет вид Лемма 2. Если норма f в С1 достаточно мала, то оператор Ь~гФ в пространстве С0 сжимающий. Доказательство. Достаточно проверить, что нелинейный оператор Ф удовлетворяет условию Липшица с малой константой. Действительно, согласно Д, II" ¦¦¦¦" ¦— ¦¦¦¦" и --с -I \ Но ЦФ/i1 — Ф/а2|| = тах|/(ж + ^1(ж))-/(ж + ^2(ж))| ^ \\f\\cA\h1 - h2\\. Итак, оператор Ь~гФ сжимающий, если ||/||ci < 1 — А. ¦ При этом условии наше уравнение решено и Н построено.
150 Глава 3 Ж. Свойства отображения Н. Докажем, что Н — гомеоморфизм тора. Доказательство. Если h мало в метрике С1, то отображение Н = Е + h — гомео- гомеоморфизм. Мы знаем лишь, что h мало в метрике С0. Тем не менее, из Н(х) = Н(у), ввиду гиперболических свойств преобразования плос- плоскости А, следует, что х = у. Действительно, на плоскости ВН = НА. Поэтому НАх = НАу, и вообще НАпх = НАпу. Но ввиду гиперболичности А расстояние между точками Апх и Апу стремится к оо либо при п —> +оо, либо при п —> —оо. Это противоречит ограниченности h. Стало быть, х = у и, значит, на торе х = у. Докажем, что образ отображения Н есть весь тор. Действитель- Действительно, образ круга достаточно большого радиуса на плоскости под дей- действием Н содержит круг радиуса 2тг (так как h ограничено). Поэто- Поэтому НТ2 = Т2. Итак, Н — гомеоморфизм тора. При этом ВН = НА. ¦ Теорема п. В доказана. 3. Теорема о структурной устойчивости седла. Предыдущие рассуждения доказывают также следующее предло- предложение. Теорема Гробмана—Хартмана. Пусть А: Жп —>¦ Жп — линей- линейное преобразование без собственных чисел, равных 1 по модулю. Тогда всякий локальный диффеоморфизм В: (Rn, О) —>• (Жп, О) с линейной частью А в неподвижной точке О топологически эквивалентен А в до- достаточно малой окрестности точки О. Доказательство. Локальный диффеоморфизм В совпадает в окрестности точки О с глобальным диффеоморфизмом С: Жп —>• Жп, определенным так: пусть ip — гладкая функция, равная 0 вне 1-окрестности точки О и равная 1 в малой окрестности точки О. Тогда С совпадает с А вне ег-окрестности, где <?>е отлично от О, а внутри этой окрестнос- окрестности С = А + ipe • (В - А); здесь <ре(х) = <р f|J. Предыдущее доказательство теоремы Аносова доказывает, что вся- всякий С1-близкий к А диффеоморфизм Жп —>• Жп топологически эквива- эквивалентен А. Но С1-малости разности С — А можно добиться подходящим
14. У-системы 151 выбором е > 0, ибо в ^-окрестности нуля \В-А\ ^се2, \{В-А)' Итак, С топологически эквивалентно А. Но С, как и А, имеет лишь одну неподвижную точку О. Следова- Следовательно, гомеоморфизм, переводящий А в С, оставляет О на месте. ¦ § 14. У-системы В этом параграфе определяются У-диффеоморфизмы и У-потоки и обсуждаются их применения в теории геодезических потоков на мно- многообразиях отрицательной кривизны и в других вопросах. А. Определение У-диффеоморфизма. Анализ рассмотренного выше автоморфизма тора показывает, что существенно для предыдущих рассуждений только сжимающееся и рас- расширяющееся слоение; поэтому можно ввести общее определение гипер- гиперболического диффеоморфизма, не предполагая более, что М — тор. Пусть А: М —>¦ М — диффеоморфизм компактного многообразия. Предположим, что 1) касательное пространство к М в каждой точке разложено в пря- прямую сумму двух подпространств: ТХМ = XX®YX- 2) поля плоскостей X = {Хх} и Y = {Yx} непрерывны и инвари- инвариантны относительно диффеоморфизма А; 3) для некоторой римановой метрики диффеоморфизм А сжимает плоскости первого поля и растягивает плоскости второго: существует число Л < 1, такое, что для любой точки х из М Тогда говорят, что А есть У-система. Пример. Пусть М = Т2 — тор, 2 1 его автоморфизм. Тогда А есть У-система.
152 Глава 3 Действительно, собственные направления соответствующего авто- автоморфизма плоскости определяют на торе инвариантные поля направле- направлений: сжимающееся и растягивающееся. Замечание. 1. Вместо выписанных неравенств можно требовать на вид более слабого условия х с\п, п > 0; а: < сЛ~п, п < 0. Если это условие выполнено для одной метрики, то оно (возможно, с другим с) выполняется и для любой другой. Из этого условия вы- вытекают и приведенные выше неравенства (возможно, для измененной метрики). 2. В определении не требуется гладкости полей плоскостей X и У. Диффеоморфизм тора, близкий к автоморфизму 2 1 1 1 является всегда У-системой, однако его сжимающееся и растягиваю- растягивающееся поле направлений могут не принадлежать классу Сч даже в слу- случае, когда диффеоморфизм аналитический (в многомерном случае поля плоскостей могут не принадлежать даже классу С1). 3. Определение и термин У-система предложены Д.В.Аносовым. Название происходит от первой буквы слова условие. Аносов назвал условия 1-3 условиями У и предлагал, чтобы по-английски их называли conditions С; он предложил также называть У-диффеоморфизмы У-кас- кадами. Смейл ввел для них же термин «диффеоморфизмы Аносова». Б. Свойства У-диффеоморфизмов. Теорема (Аносова). Каждый У-диффеоморфизм структурно ус- устойчив. Доказательство проводится тем же методом, как в § 13 для авто- автоморфизмов тора; детали можно найти, например, в статье Дж. Мазера (МазерД. Диффеоморфизмы Аносова. Математика. 13:2, 1969, 142-144). Первоначальное доказательство было связано со следующим свой- свойством У-диффеоморфизмов.
14. У-системы 153 Теорема. Сжимающееся и расширяющееся поля плоскостей У-диф- феоморфизма вполне интегрируемы. Иными словами, существуют сжимающееся и расширяющееся слоения1, касательные плоскости к которым образуют сжимающееся и расширяющееся поля плоскостей. Заметим, что здесь нельзя пользо- пользоваться теоремой Фробениуса, так как наши поля негладкие. Доказательство основано на том, что при применении У-диффео- морфизма угол между плоскостями, не слишком далекими от плоскос- плоскостей расширяющегося поля, уменьшается: расширяющееся поле являет- является притягивающей неподвижной точкой в функциональном пространст- пространстве полей плоскостей при действии У-диффеоморфизма на это простран- пространство. Чтобы построить расширяющееся слоение, можно разбить много- многообразие на достаточно малые области и взять в каждой из них произ- произвольное слоение, слои которого имеют размерность плоскостей расши- расширяющегося поля и образуют с этими плоскостями не слишком большой угол. Применим к этим слоениям У-диффеоморфизм и его итерации. Оказывается, полученная последовательность кусочных слоений схо- сходится к настоящему расширяющемуся слоению. Замечание. Частным случаем этой конструкции является построение входящего и выходящего инвариантных многообразий неподвижной точки диффеоморфизма в случае, когда модули всех собственных чисел линейной части диффеоморфизма отличны от единицы. Для построения выходящего многообразия можно применять итерации диффеоморфизма к любому мно- многообразию, касающемуся выходящего инвариантного подпространства линей- линейной части диффеоморфизма. Описанная конструкция позволяет построить сжимающееся и рас- расширяющееся слоения не только для данного У-диффеоморфизма, но сра- сразу и для близких к нему У-диффеоморфизмов. Таким образом, свойство быть У-диффеоморфизмом сохраняется при малом (с производными) шевелении диффеоморфизма. Кроме того, из конструкции видно, что сжимающееся и расширяющееся слоения (или лучше поля плоскостей) непрерывно зависят от диффеоморфизма. 1 Слоением на n-мерном многообразии называется его разбиение на подмногооб- подмногообразия (слои) одинаковой размерности к, удовлетворяющее следующему условию: у каждой точки многообразия существует окрестность, разбиение которой на связ- связные компоненты слоев диффеоморфно разбиению ^-мерного куба на параллель- параллельные /г-мерные плоскости.
154 Глава 3 После того как сжимающееся и расширяющееся слоения для исход- исходного и для возмущенного диффеоморфизмов построены, доказательство теоремы Аносова уже не сложно. Действительно, рассмотрим какую-либо фазовую точку и после- последовательность ее образов при исходном диффеоморфизме. Рассмотрим систему ^-окрестностей точек-образов. Число е выбирается малым и по нему подбирается расстояние от возмущенного диффеоморфизма до невозмущенного. Если это расстояние достаточно мало, то каждая из gr-окрестностей расслоена на связные компоненты слоев сжимающе- сжимающегося расслоения как для исходного, так и для возмущенного диффео- диффеоморфизма. Мы будем называть эти компоненты вертикальными дисками. Рас- Рассмотрим вертикальный диск исходного слоения, проходящий через ис- исходную точку, и его образы под действием положительных степеней исходного У-диффеоморфизма. Существует единственный вертикальный диск возмущенного сло- слоения, такой, что его образы под действием положительных степе- степеней возмущенного диффеоморфизма остаются внутри описанных выше ^-окрестностей. Действительно, исходный У-диффеоморфизм растягивает в гори- горизонтальном направлении. Поэтому возмущенный диффеоморфизм так- также растягивает в горизонтальном направлении. Обозначим описанные выше окрестности через Un, их расслоения на возмущенные вертикальные диски через Un —»• Вп, возмущенный диффеоморфизм — через А. Поскольку в горизонтальном направле- направлении А растягивает, отображение А~г индуцирует сжимающие отобра- отображения ап: Вп^Вп-\. Искомая точка &о ? Bq определяется теперь как • • • L&T1 -Dyi > Точно так же существует единственный горизонтальный возму- возмущенный диск, образы которого при применении отрицательных степе- степеней нашего диффеоморфизма не выходят из окрестностей с отрицатель- отрицательными номерами. Пересечение построенных возмущенных дисков — горизонтально- горизонтального и вертикального — определяет ту точку, которую сопрягающий го- гомеоморфизм сопоставляет исходной фазовой точке.
14. У-системы 155 Проверка того, что описанная конструкция действительно опреде- определяет гомеоморфизм, сопрягающий невозмущенный У-диффеоморфизм с возмущенным, не представляет особых трудностей после всего, ска- сказанного выше. У-диффеоморфизмы с инвариантной мерой, заданной положитель- положительной плотностью, имеют всюду плотное множество периодических то- точек (циклов). Весьма полное исследование эргодических свойств У-диф- феоморфизмов с инвариантной мерой (перемешивание и т. д.) проведе- проведено Д.В.Аносовым и Я. Г. Синаем (см. Аносов Д. В. Геодезические пото- потоки на замкнутых римановых многообразиях отрицательной кривизны. Труды Матем. ин-та им. В. А. Стеклова, 90 A967), 3-209). В. У-потоки. При переходе к однопараметрическим группам диффеоморфизмов определение ги- гиперболичности следует несколько изменить, так как вдоль фазовых кривых не происхо- происходит ни сжатия, ни растяжения. Рассмотрим интегральные кривые в слу- случае седла ж = —ж, у = у (рис. 85). Ось t явля- является пересечением двух плоскостей, состав- рис gg ленных из интегральных кривых, приближающихся к ней при t —»• +оо (плоскость (ж, t)) и при t —»• —оо (плоскость (у, ?)); остальные интег- интегральные кривые удаляются от оси как при t —»• +оо так и при t —»• —оо. Однопараметрическая группа диффеоморфизмов называется У-по- током, если фазовые кривые вблизи любой данной фазовой кривой рас- расположены так, как интегральные кривые в приведенном выше примере. Формальное определение состоит в следующем. Определение. Пусть М — компактное гладкое многообразие, v — векторное поле без особых точек на М, {g*} — соответствующий фазо- фазовый поток. Предположим, что 1) касательное пространство к М в каждой точке представлено в виде прямой суммы трех подпространств ТХМ = Хх ф 1Х ф Zx; 2) поля плоскостей X, У, Z непрерывны и инвариантны относи- относительно фазового потока; 3) поле Z порождено полем фазовой скорости;
156 Глава 3 4) для некоторых положительных констант с, Л, и некоторой рима- новой метрики на М x\ се при t > О, Jt II / „„At ь* У I ceAt при t < 0. Тогда фазовый поток называется У-потоком, а уравнение ж=г>(ж) — У- системой. Пример. Рассмотрим трехмерное многообразие М, которое полу- получается из прямого произведения тора на отрезок [0, 1] склейкой торце- торцевых торов по У-автоморфизму: (ж, 1) склеивается с (Ах, 0), где х ? Т2, Рассмотрим векторное поле, направленное вдоль сомножителя [0, 1] в прямом произведении Т2 х [0, 1]. Это поле после склейки М из прямого произведения превращается в гладкое (почему?) поле v на М. Полученное поле v определяет У-поток на М. Теорема. Всякий У-поток структурно устойчив. Доказательство. Доказывается таким же методом, как для У-диффеоморфизмов (см. цитированные выше работы). ¦ Всякий У-поток имеет бесконечное множество замкнутых фазовых кривых. Таким образом, даже ограничиваясь структурно устойчивыми векторными полями, нельзя надеяться получить в многомерном случае такую же простую картину с конечным числом положений равновесия и циклов, как в случае систем на двумерной сфере. В 1961 г. С. Смейл построил первые примеры структурно устойчи- устойчивых систем с бесконечным числом циклов. В этих примерах экспонен- экспоненциальное разбегание имело место не на всем фазовом пространстве, а на некотором замкнутом его подмножестве. Такие множества теперь на- называют гиперболическими. Общая теория гиперболических множеств была построена позже и под влиянием теории У-систем. Появление подобных примеров привело к резкому изменению пред- представлений о поведении фазовых кривых многомерных систем. Неко- Некоторые специалисты поспешили объявить эти результаты не имеющи- имеющими реального значения, так как подобные системы, хотя и структурно
§ 14. У-системы 157 устойчивы, «не могут описывать никаких реальных, физических про- процессов» ввиду неустойчивости отдельных траекторий. Однако имеются весьма важные реальные случаи, когда, по- видимому, именно системы с экспоненциальным разбиением траекто- траекторий лучше всего описывают действительность. Речь идет о математи- математическом описании явлений типа турбулентности и о движении соударя- соударяющихся частиц (скажем, в моделях газа из твердых сфер). Более прос- простой, но вполне реальной является задача о движении по геодезическим на многообразиях отрицательной кривизны. Мы разберем сейчас самый простой вариант этой задачи — задачу о геодезических на поверхнос- поверхностях постоянной отрицательной кривизны. Для этого нам потребуются некоторые сведения из геометрии Лобачевского. Г. Плоскость Лобачевского. Плоскостью Лобачевского называется верхняя полуплоскость Imz>0 с метрикой1 . о dx2 + dy2 ds — , где z — х + %у. У Прямая у — 0 называется абсолютом. Заметим, что углы в этой мет- метрике совпадают с евклидовыми углами, и что расстояние до абсолюта бесконечно. Теорема. Геодезическими плоскости Лобачевского являются все окружности и прямые, ортогональные абсолюту, и только они (рис. 86). Доказательство. Метрика инвариантна относительно 1) перено- сов вдоль абсолюта; 2) растяжений от начала ко- координат; 3) симметрии z i—> —~z (это очевидно). Нетрудно проверить, что 4) метрика инвариантна также и относительно инверсии z \—> г. Из 1)-4) вытекает инвариантность метрики от- относительно всех дробно-линейных преобразований Рис. 86 верхней полуплоскости в себя. Кроме того, из 3) следует, что ось у гео- геодезическая. Но дробно-линейным вещественным преобразованием мож- можно перевести ось у в любую окружность или прямую, ортогональную абсолюту. Следовательно, все они — геодезические. 1А также любое риманово многообразие, изометричное указанному.
158 Глава 3 Обратно, через каждую точку по каждому направлению проходит окружность или прямая, ортогональная абсолюту. Следовательно, дру- других геодезических нет. ¦ Замечание. Одновременно доказано, что движения (сохраняю- (сохраняющие метрику и ориентацию) плоскости Лобачевского — это дробно- линейные преобразования верхней полуплоскости в себя. Теорема. Окружностями на плоскости Лобачевского являются все евклидовы окружности, не пересекающие абсолют, и только они. Доказательство. Рассмотрим единичный круг. Дробно-линейным преобразованием можно перевести верхнюю полуплоскость в единичный круг (ср. гл. I, § 5. п. Д). Поэтому внутренность единичного круга можно также рас- рассматривать как модель плоскости Лобачевского (рис. 34). Дробно-линейные преобразования, сохраняющие верхнюю полу- полуплоскость, переходят при этом в дробно-линейные преобразования, со- сохраняющие единичный круг. Поэтому метрика плоскости Лобачевско- Лобачевского в модели на круге инвариантна относительно всех дробно-линейных преобразований, сохраняющих круг. Но среди этих преобразований есть повороты вокруг центра. Сле- Следовательно, все точки евклидовой окружности, имеющей с единичным кругом общий центр, равноудалены от этого центра в смысле метри- метрики Лобачевского. Итак, евклидова окружность является окружностью Лобачевского, если ее центр — в центре круга. Но любая евклидова окружность, не пересекающая абсолюта, мо- может быть движением плоскости Лобачевского превращена в евклидо- евклидову окружность с центром в начале координат. Следовательно, всякая евклидова окружность, не пересекающая абсолюта, является окруж- окружностью в смысле метрики Лобачевского (как в модели на круге, так и в модели на полуплоскости). Отсюда следует, что и обратно всякая окружность Лобачевского является евклидовой окружностью. ¦ Определение. Предел последовательности касающихся в одной точке окружностей растущего радиуса на плоскости Лобачевского на- называется орициклом. Теорема. Орициклами на плоскости Лобачевского являются ев- евклидовы окружности или прямые, касающиеся абсолюта, и только они.
14. У-системы 159 Доказательство. Рассмотрим полугеодезическую, выходящую из некоторой точки плоскости Лобачевского (рис. 87). Выберем на этой полугеодезической точку на расстоя- расстоянии t от исходной точки. Тогда окружность радиуса t с центром в построенной точке проходит через исход- исходную точку перпендикулярно геодезической. Пусть те- теперь t стремится к плюс бесконечности. Тогда в евкли- ис" довом смысле построенная окружность стремится к окружности, пер- перпендикулярной рассматриваемой геодезической и проходящей через ее точку на абсолюте. Эта евклидова окружность касается абсолюта. ¦ Замечание 1. Таким же предельным переходом при t —»• оо можно строить орициклы на поверхностях отрицательной кривизны и орисфе- ры на многообразиях отрицательной кривизны. Замечание 2. Через каждую точку плоскости Лобачевского про- проходят два орицикла с общей касательной; они получаются из предыду- предыдущей конструкции при t —»• +оо и при t —»• —оо. Д. Геодезические потоки на поверхностях отрицательной кривизны. Пусть М — риманово многообразие. Мы будем предполагать, что М полно как метрическое пространство. Например, любое ком- компактное многообразие полно; плоскость Лобачевского полна, так как расстояние до абсолюта бесконечно. Рассмотрим множество всех касательных векторов к многообра- многообразию М, имеющих длину 1. Это множество является многообразием размерности 2п — 1, если М имеет размерность п. Оно обозначается через TiM. Определение. Геодезическим потоком на М называется однопа- раметрическая группа диффеоморфизмов многообразия касательных векторов длины 1, определенная следующим образом: каждый вектор за время t сдвигается вперед вдоль касающейся его геодезической на расстояние t, оставаясь касательным к этой геодезической. Теорема. Геодезический поток на плоскости Лобачевского удов- удовлетворяет условиям 1)^4) определения У-потока.
160 Глава 3 Доказательство. 1°. Построим сжимающееся и расширяю- расширяющееся слоения. С этой целью для каждого век- вектора построим ортогональный ему орицикл, яв- являющийся пределом окружностей, центры ко- торых расположены впереди точки приложения РИС. оо _ этого вектора. Снабдим этот орицикл в каждой точке нормальным ему единичным вектором, так, чтобы получилось непрерывное поле нормальных векторов (рис. 88). Заметим, что если бы мы начали с любого из этих векторов, то мы получили бы тот же самый орицикл с тем же полем. Этот орицикл с полем можно рассматривать как кривую в трехмерном пространст- пространстве Т\М единичных касательных векторов плоскости Лобачевского. Та- Таким образом, мы построили одномерное слоение в Т\М — разбиение пространства единичных касательных векторов на кривые. Это разби- разбиение есть сжимающееся слоение. Расширяющееся слоение строится таким же обра- образом, начиная от окружностей, центры которых распо- расположены сзади точки приложения вектора. 2°. Условия 2, 3 выражают инвариантность гео- геодезических и орициклов относительно геодезического потока и проверяются непосредственно. Действитель- Действительно, семейство геодезических, перпендикулярных одно- р од му орициклу, пересекает абсолют в точке касания абсо- абсолюта с орициклом, а всякий орицикл, касающийся абсо- абсолюта в этой точке, ортогонален всем геодезическим семейства (рис. 89). Поэтому геодезический поток переводит каждый орицикл (осна- (оснащенный полем нормалей) в орицикл, касающийся абсолюта в той же точке (и также оснащенный полем нормалей). 3°. Условие 1 означает, что касательные векторы к геодезической, оснащенной касательным полем, и к обоим орициклам, оснащенным нормальными полями, линейно независимы. Оно проверяется непосред- непосредственно: важно лишь, что касание обоих орициклов — первого, а не более высокого порядка. 4°. Докажем, что отрезки сжимающегося орицикла под действием фазового потока экспоненциально сжимаются. Предположим, что на- начальный орицикл — прямая у = 1 на верхней полуплоскости. Геодези-
§ 14. У-системы 161 ческие — прямые х = const, геодезический поток за время t превраща- превращает прямую у = 1 в прямую у = е* (расстояние вдоль оси у от точки 1 до точки у равно In у). Следовательно, каждый отрезок орицикла пере- переходит в отрезок, длина которого в ег раз меньше. Отсюда следует, что фазовый поток сжимает слои сжимающегося слоения (в смысле естес- естественной метрики на Т\М). Проверка условия 4 определения У-системы заканчивается анало- аналогичным рассуждением для расширяющихся орициклов. ¦ Следствие. Геодезический поток на компактной поверхности по- постоянной отрицательной кривизны является У-потоком. Доказательство. Заменой времени можно свести все к слу- случаю кривизны —1. Для поверхности постоян- постоянной отрицательной кривизны —1 универсаль- универсальной накрывающей является плоскость Лоба- Лобачевского; поверхность получается из плоскости Лобачевского отождествлением точек, перехо- переходящих друг в друга под действием некоторой дискретной группы движений плоскости Лоба- Лобачевского (рис. 90). При этом отождествлении геодезические, окружности, орициклы плоскости Лобачевско- Лобачевского проектируются в геодезические, окружнос- окружности, орициклы поверхности; геодезический поток на поверхности и его сжимающееся и растягивающееся слоения проектируются в такие же слоения для поверхности. ¦ В частности, отсюда следует, что геодезический поток на ком- компактной поверхности постоянной отрицательной кривизны структур- структурно устойчив и имеет всюду плотное множество замкнутых геодезичес- геодезических. Замечание. Для многомерного многообразия отрицательной кри- кривизны (не обязательно постоянной) геодезический поток также являет- является У-потоком. Доказательство близко к приведенному выше для прос- простейшего случая: немного сложнее лишь доказательство существования орициклов (орисфер). См. цитированную выше книгу Д.В.Аносова. Рис. 90 11 В. И. Арнольд
162 Глава 3 Е. Биллиардные системы Рассмотрим геодезический поток на поверхности эллипсоида. Предположим, что малая ось эллипсоида уменьшается до нуля, так что эллипсоид уплощается и превращается в эллипс. Геодезический по- поток в пределе переходит в так называемую биллиардную систему в области, ограниченной эллипсом: точка движется по прямой внутри области, а от границы отражается Рис. 91 по закону «угол падения равен углу отражения» (рис. 91). Биллиардная траектория внутри эллипса никогда не бывает всю- всюду плотной. Но для областей, ограниченных другими кривыми (на- (например, негладкими кривыми, обращенными выпуклостью внутрь об- области), биллиардное движение обладает почти такими же свойствами экспоненциальной неустойчивости траекторий и перемешивания, как У-потоки. Рассмотрим, в частности, биллиардную систему на торе с дыркой. Эту систему можно рассматривать как предел геодезических потоков на поверхности кренделя (крендель вырождается в двусторонний тор с дыркой так же, как эллипсоид в двусторонний эллипс). Более того, двусторонний тор с плоской метрикой и с дыркой можно считать пре- предельным случаем кренделя отрицательной кривизны (при вырождении вся кривизна собралась вдоль края дыры). Поэтому неудивительно, что эта биллиардная система обладает свойствами У-потока. Имеется надежда, что соображения, близкие к гиперболической те- теории, позволят доказать эргодичность системы твердых шаров в ящи- ящике, со времени Больцмана постулируемую в статистической механике. (Эргодичность означает, что каждое инвариантное подмножество фазо- фазового пространства имеет меру нуль, либо полную меру; она влечет сов- совпадение почти всюду временных и пространственных средних. В дан- данном случае под фазовым пространством понимается множество уровня энергии.) В плоском случае доказательство опубликовано Я. Г. Синаем (Я. Г. Синай. Динамические системы с упругими отражениями. Эргоди- ческие свойства рассеивающих биллиардов. УМН 25, 2 A970), 141-192). О биллиардных системах см. также: Л. А. Бунимович. О биллиардах, близких к рассеивающим. Матем. сборник 94, 1 A974), 49-73.
14. У-системы 163 Ж. У-системы и прогонка. Гиперболическая ситуация возникает в задачах вычислительной математики, решаемых методом прогонки. Предположим, для примера, что мы хотим решить краевую задачу для уравнения второго поряд- порядка х = х (т. е. для системы х = р, р = х) на отрезке [О, Т]. Предположим, что заданы неоднородные граничные условия: начальная точка <р@) с координатами (ж@), р@)) лежит на заданной прямой /о фазовой плос- плоскости (ж, р), а конечная точка <р(Т) — на заданной прямой 1Т. Если бы начальная точка <р@) бы- была известна, то при попытке решить за- задачу Коши с начальным условием (р@) мы столкнулись бы с потерей точности, экспоненциально растущей с длиной Т отрезка интегрирования. Действительно, решения с начальным условием, пропор- пропорциональным растягивающемуся векто- вектору A, 1), экспоненциально растут. Таким образом, при переходе от плоскости t = О к плоскости t = Т происходит растяже- растяжение в направлении вектора A, 1) (в даль- дальнейшем это направление называется го- горизонтальным) и сжатие в направлении вектора A, —1) (называемого вертикальным, см. рис. 92). Рассмотрим теперь образ прямой /о под действием нашего преобра- преобразования. Хотя образ каждой точки прямой находится с экспоненциально большой потерей точности, образ самой прямой определяется, вообще говоря, весьма точно. Действительно, направление этого образа близко, вообще говоря, к горизонтальному направлению. Поэтому ошибка в вычислении точки на этой почти горизонтальной прямой мало влияет на положение прямой: у ошибки может быть велика как раз горизонтальная компонента, а вертикальная мала. Точку <р(Т) мы находим как пересечение прямой 1Т и образа пря- прямой /о- Теперь для окончательного определения решения нужно решать задачу Коши назад. При этом ошибка по горизонтали не растет, а верти- вертикальная компонента точки cp{t) фиксирована тем, что эта точка лежит на уже найденной прямой l(t) = <§"%• Таким образом, сначала мы, пе- Рис. 92
164 Глава 3 реходя от 0 к Т, находим прямые l(t), а потом, возвращаясь от Т к О, выбираем на каждой из них по точке — и все это без экспоненциальной потери точности. 3. О применениях У-систем. У-системы и родственные им объекты находятся сейчас в таком же положении, в каком находились предельные циклы во времена Пуан- Пуанкаре. Весь математический аппарат исследования предельных циклов был создан, но инженерное серьезное применение предельных циклов началось лишь спустя несколько десятков лет, когда развитие радио- радиотехники сделало теорию нелинейных колебаний прикладной областью математики. С начала 1960-х годов известна гипотеза, что естественной облас- областью применения У-потоков является теория турбулентного движения жидкости. Представим себе замкнутый сосуд, заполненный несжима- несжимаемой вязкой жидкостью, приводимой в движение какой-либо внешней силой (мешалкой). Мешалка нужна, чтобы вязкость не погасила со вре- временем всякое движение. Гидродинамические уравнения Навье-Стокса задают динамичес- динамическую систему1 в функциональном пространстве (точками этого беско- бесконечномерного фазового пространства являются бездивергентные век- векторные поля, поля скоростей жидкости). Положения равновесия этой динамической системы — это стацио- стационарные поля скоростей, т.е. такие движения жидкости, для которых скорость в каждой точке пространства не меняется со временем. Цик- Циклам этой системы отвечают периодические движения жидкости, в ко- которых скорость в каждой точке пространства меняется периодически. Такое движение можно иногда наблюдать, открывая водопроводный кран. Гипотеза о математическом описании турбулентности состоит в том, что дело в сущности сводится к конечномерной динамической системе, так как вязкость быстро гасит высокие гармоники. Иными словами, предполагается, что в бесконечномерном фазовом простран- пространстве имеется конечномерное многообразие или множество, к которо- 1По правде говоря, теория уравнений с частными производными до сих пор не может справиться с проблемой существования и единственности решений для трех- трехмерного уравнения Навье-Стокса, но мы пренебрежем этим обстоятельством.
14. У-системы 165 му притягиваются все фазовые кривые; на самом же этом множестве фазовый поток представляет собой У-систему или обладает близкими свойствами экспоненциальной неустойчивости траекторий и перемеши- перемешивания. В таком случае наблюдаемые свойства движения жидкости долж- должны быть такими: при любом начальном условии движение довольно быстро выходит на определенный режим; однако этот режим не явля- является ни стационарным, ни периодическим; хотя предельное движение и определяется конечным числом параметров («фаз» предельного ре- режима), сами эти параметры крайне неустойчивы (предельные течения с близкими начальными фазами экспоненциально расходятся); впро- впрочем, статистические характеристики течения от этих неустойчивых фаз не зависят. В этом направлении пока сделано следующее. Если вязкость доста- достаточно велика, система Навье-Стокса имеет единственную неподвиж- неподвижную точку, к которой притягиваются все фазовые кривые. Это т. н. ламинарное движение. Всякое другое течение под воздействием вязкос- вязкости со временем стремится превратиться в ламинарное. С уменьшени- уменьшением вязкости ламинарное течение может терять устойчивость, причем возникает устойчивый предельный цикл (см. гл. 6). При дальнейшем уменьшении вязкости может терять устойчивость и цикл, причем из цикла может рождаться более сложное, непериодическое, притягиваю- притягивающее соседей движение. Ожидается, что это движение будет, вообще го- говоря, обладать свойством экспоненциальной неустойчивости фазовых кривых на притягивающем множестве. Хотя этому вопросу за послед- последние годы посвящено много как теоретических, так и эксперименталь- экспериментальных исследований (см., например, обзор J. В. Mclaughlin, P. С. Martin. Transition to turbulence of a statically stressed fluid system. Phys. Rev. A 12 A975), 186-203), указанная выше гипотеза еще далека от теоремы. Следует, впрочем, заметить, что появление притягивающего мно- множества с экспоненциально неустойчивыми траекториями на нем не обя- обязательно связано с потерей устойчивости ламинарного течения: это множество может возникнуть вдали от положения равновесия и даже при таких значениях вязкости, при которых ламинарное течение еще устойчиво.
166 Глава 3 § 15. Структурно устойчивые системы не всюду плотны В этом параграфе предъявляется свободная от структурно устой- устойчивых систем область в функциональном пространстве гладких дина- динамических систем класса С1. А. Пример Смейла. В 1965 году С. Смейл построил пример диффеоморфизма трехмер- трехмерного тора, в окрестности которого нет ни одного структурно устойчи- устойчивого диффеоморфизма. Следовательно, на четырехмерном многообразии имеется вектор- векторное поле, которое нельзя сделать структурно устойчивым посредством малого шевеления. Позже поля с этим свойством были построены и на трехмерных многообразиях (см. S. Newhous. Nondensity of Axiom A (a), Global Analysis, Proceed. Simp. Pure Math. AMS, 14 A971), 191-203). В этом параграфе излагается конструкция Смейла. Б. Описание примера. Введем на Т3 координаты (ж, у, z modd 2тг). Диффеоморфизм А: Т3 —» Т3 мы определим в окрестностях тора Т2: z = 0 и некоторого интервала оси z (вид диффеоморфизма А в остальной части трехмер- трехмерного тора нам не важен). В окрестности U тора Т2 отображение А задается формулой А(х, у; z) = В окрестности точки О с координатами @, 0, тг) отображение А задается формулой /XV \ А(х, у; тг + и) = у-, -; тг + 2и) . Таким образом, точка О является седловой, причем выходя- выходящее инвариантное многообразие —это кривая j, содержащая интер- интервал (тг, тг — е) оси z. Кривая 7 инвариантна относительно А и растягивается под дейст- действием А; таким образом, итерируя А, мы получим из указанного интер- интервала половину инвариантного многообразия, которая либо заканчива-
§ 15. Структурно устойчивые системы не всюду плотны 167 ется в неподвижной точке преобразования А, либо имеет бесконечную длину. Мы потребуем, чтобы кривая эта входила в область U, указанную выше, и там имела неограниченную длину. Нетрудно видеть, что диф- диффеоморфизмы тора с указанными свойствами существуют. В. Устойчивые свойства диффеоморфизма А. 1°. Сужение А на достаточно малую окрестность тора Т2 струк- структурно устойчиво. Доказательство. Действительно, это можно доказать с помощью того же приема, ко- которым мы доказали теорему Гробмана-Хартмана. Заменим диффеомор- диффеоморфизм А: Т3 —> Т3 преобразованием А': Т2 х М. —> Т2 х R, заданным всюду той же формулой, которая определяет А в области U. Близкий к А диф- диффеоморфизм А можно заменить преобразованием А': Т2 х Ж —»• Т2 х IR, согласованным с А в окрестности тора Т2 хО так, что разность А' — А' имеет компактный носитель и мала в С1. Теперь мы можем применить теорему Аносова (или, точнее, ее доказательство); получаем топологи- топологическую эквивалентность А' с А' и значит А с А в окрестности тора Т2. ¦ 2°. Из доказанного следует, что диффеоморфизм А имеет инва- инвариантное многообразие Т2, близкое к тору Т2, и на нем — счетное всюду плотное? множество периодических точек. Через каждую точку окрестности U тора Т2 проходит однозначно определенный и непре- непрерывно зависящий от точки^ гладкий слой двумерного сжимающегося слоения диффеоморфизма А (он состоит из точек, сближающихся при итерациях диффеоморфизма). 3°. Преобразование А имеет неподвижную точку О, близкую к не- неподвижной точке О преобразования А. Доказательство. Это следует из теоремы о неявной функции, так как точка О не- невырожденная и диффеоморфизм А близок к А. ¦ Собственные числа линеаризации А в этой точке О близки к соб- собственным числам А в О. _ По теореме Гробмана-Хартмана, точка О, как и О, является сед- ловой и имеет одномерное выходящее инвариантное многообразие 75
168 Глава 3 близюэе, как легко видеть, к 7- В частности, 7 входит в окрестность U тора Т2. 4°. Сколь угодно малым шевелением отображения А вдали от U можно изменить кривую 7 так, что она будет «иметь носик»: локально будет лежать по одну сторону от одного из слоев сжимающегося рас- расслоения для А, содержащего одну точку кривой 7? причем касание 7 с этим слоем будет первого порядка. Обозначим так определенное ото- отображение через А\. Г. Структурная неустойчивость. Докажем, что диффеоморфизм А\, вместе со всеми близкими к нему диффеоморфизмами, структурно неустойчив. Доказательство. Включим отображение А\ в однопараметрическое семейство диф- диффеоморфизмов As, отличающихся лишь малым изменением в окрест- окрестности прообраза точки носика при отображении А\. Каждое из ото- отображений А8, достаточно близких к А\, обладает перечисленными вы- выше свойствами А\\ инвариантным тором, двумерными сжимающимися слоями, седловой точкой с выходящим инвариантным многообразием и с носиком на нем. Мы предположим, что с изменением s носик дви- движется поперек слоев сжимающегося слоения. Рассмотрим теперь сжимающийся слой, содержащий носик. Этот слой может содержать или не содержать периодическую точку на то- торе. Поскольку периодические точки всюду плотны на торе, сколь угод- угодно малым изменением А\ в нашем семействе можно поместить носик как на слой содержащий, так и не слой не содержащий периодическую точку. Но свойство слоя содержать или не содержать периодическую точ- точку топологически инвариантно, поэтому топологический тип А\ меня- меняется при сколь угодно малом изменении этого отображения. Следова- Следовательно, отображение; А\ структурно неустойчиво. Пусть теперь А\ — любой диффеоморфизм, достаточно близкий к А\. Тогда, согласно сказанному в пункте В, для А\ можно повторить все построение, только что проведенное для А\. Следовательно, А\ — структурно неустойчивый диффеоморфизм. ¦
Глава 4 Теория возмущений Большинство дифференциальных уравнений не допускает ни точ- точного аналитического решения, ни сколько-нибудь полного качественного исследования. Теория возмущений представляет собой в высшей степе- степени полезный набор методов исследования уравнений, близких к уравне- уравнениям специального вида. Эти уравнения специального вида называются невозмущенными, и их решения предполагаются известными. Теория возмущений учитывает влияние небольших изменений дифференциаль- дифференциальных уравнений на поведение решений. Если величина возмущения характеризуется малым параметром е, то влияние возмущений на временах порядка 1 приводит к изменению решения на величину порядка е. Эту величину можно приближенно по- получить, решая уравнения в вариациях вдоль невозмущенного решения. Однако, если нас интересует поведение решения в течение большого от- отрезка времени, скажем, порядка е~1, то возникает гораздо более слож- сложная задача, составляющая предмет т. н. асимптотических методов ис- исследования теории возмущений. Важнейшим из этих методов является метод усреднения, который и рассматривается в настоящей главе. Метод усреднения используется в небесной механике со времени Лагранжа и Лапласа для определения эволюции планетных орбит под влиянием взаимных возмущений планет друг другом. Гаусс формули- формулировал его так: для определения эволюции следует размазать массу каж- каждой планеты по орбите пропорционально времени, проводимому в каж- каждой части орбиты, и заменить притяжение планет притяжением полу- полученных колец. Однако обоснование метода усреднения — задача и сейчас далеко не до конца решенная.
170 Глава 4 § 16. Метод усреднения В этом параграфе описывается рецептура метода усреднения в его простейшем варианте. Вопросы обоснования этого метода обсуждаются в следующих параграфах. А. Невозмущенная и возмущенная системы. Рассмотрим гладкое расслоение тг: М —»• В. Векторное поле v на многообразии М называется вертикальным, если оно касается каждого слоя (рис. 93). В приложениях слои обычно бывают торами. Рис. 93 Рис. 94 Функции на базе В расслоения тг определяют первые интегралы уравнения x—v(x) на М. Векторное вертикальное поле v называется не- невозмущенным. Возмущенным полем называется близкое к v поле v+sv±. Рассмотрим возмущенное дифференциальное уравнение X = v(x) ?V\{x). Каждая фазовая кривая невозмущенного уравнения проектируется при отображении тг в одну точку базы. Движение по фазовым кривым возмущенного уравнения проектируется на базу в виде медленного дви- движения, скорость которого порядка е. Заметное передвижение проекции по базе происходит за время порядка е~1. Метод усреднения предна- предназначен для описания этого медленного движения по базе при помощи векторного поля на базе. Это медленное движение описывается в мето- методе усреднения как комбинация малых осцилляции в систематической эволюции или дрейфа (рис. 94). Пример. Рассмотрим планетную систему. Невозмущенные урав- уравнения учитывают только взаимодействие Солнца и планет. В невозму- невозмущенном движении планеты движутся по кеплеровским орбитам. Роль возмущения играет взаимное притяжение планет. Роль е играет отно- отношение массы планет к массе Солнца; это — величина порядка 1/1000.
16. Метод усреднения 171 Характерная единица времени — период обращения вокруг Солнца, т. е. величина порядка года или десятка лет, характерная единица дли- длины — радиус планетной орбиты. В этом примере М — фазовое пространство, база В — пространст- пространство наборов кеплеровых эллипсов, слои-торы, размерность которых рав- равна числу планет (каждый набор кеплеровых эллипсов определяет тор, точка которого задается указанием положений планет на эллипсах). Сдвиг по базе на величину порядка 1 соответствует, таким образом, изменению радиуса орбиты, скажем, вдвое. Время порядка е~г — это время порядка тысячи или десятка тысяч лет. Таким образом, систематическое медленное движение (дрейф) по базе со скоростью е в этом примере за время порядка тысячелетий могло бы изменить радиус орбиты Земли вдвое, что было бы гибель- гибельным для нашей цивилизации, которая своим существованием обязана тому, что этот дрейф фактически не происходит (во всяком случае в направлении изменения радиусов орбит; изменение эксцентриситетов происходит и, по-видимому, влияет на ледниковые периоды). Б. Процедура усреднения. Для описания усреднения введем несколько обозначений. Мы бу- будем предполагать, что слои нашего расслоения являются n-мерными то- торами. Расслоение в окрестности каждой точки базы является прямым произведением. Мы ограничимся такой окрестностью и будем задавать точку из пространства расслоения М парой ((р, I), где / — точка базы, а (р — точка n-мерного тора F. Обозначение / выбрано потому, что координаты (/]_, ...,/&) точ- точки / определяют на М первые интегралы невозмущенной системы. Точка ср тора F задается набором п угловых координат (<^i, ... , срп) modd27r. [В приложениях обычно координаты срк определены сущест- существом дела однозначно, с точностью до выбора начала отсчета на каждом торе и с точностью до целочисленных унимодулярных линейных пре- преобразований. Мы фиксируем систему координат (ср, I).] Определение. Невозмущенным уравнением метода усреднения на- называется уравнение ( ф = w(J), 1 1 = 0,
172 Глава 4 где и) — вертикальное векторное поле, заданное зависящим от точки базы / вектором частот (lji(I), ... , cjn(I)). Определение. Возмущенным уравнением метода усреднения на- называется уравнение где fug имеют по ср период 2тг, еС 1 — малый параметр. Угловые координаты (fi, называются быстрыми переменными, а координаты на базе Ij — медленными переменными. Определение. Усредненным уравнением называется уравнение j = eG{J), где G(J) = J av"],r'i'—-—— — среднее значение функции g по слою. Решения усредненного уравнения называ- называются усредненными движениями. Пример. Рассмотрим возмущенное уравне- уравнение ф = uj, I = г (а + bcostp). Усредненное уравнение имеет вид Рис'95 j = sa. Таким образом, при переходе к усредненному уравнению мы отбра- отбрасываем в правой части уравнения для / величины такого же поряд- порядка, как оставляемые. На временах порядка 1 как отбрасываемые, так и оставляемые величины дают одинаковый эффект (порядка е). Однако их влияние на временах порядка е~1 совершенно различно: оставленные члены приводят к систематическому дрейфу, а отброшенные — лишь к малому дрожанию. Доказательство. Решение возмущенного уравнения дает (скажем, для ср0 = 0) что лишь осциллирующей малой добавкой отличается от решения усредненного уравнения (рис. 95) J(t) = Iq + sat. ¦
16. Метод усреднения 173 В. Пространственное и временное средние. Рассмотрим отрезок времени Т, большой по сравнению с 1, но ма- малый по сравнению с е~1. За такое время траектория возмущенного дви- движения не успевает заметно сместиться с начального слоя. Вычислим перемещение проекции возмущенной траектория на ба- базу за время Т. Это перемещение — величина порядка еТ <С 1. Скорость перемещения равна eg(I, <p, е). В первом приближении можно считать здесь I постоянным, е равным нулю и ср меняющимся в соответствии с невозмущенным уравнением. Тогда для величины перемещения за время Т мы получим приближенное выражение , O)dt o(sT). Наше время Т ~^> 1 велико, поэтому величина, стоящая в квадратной скобке, близка к временному среднему функции g. Введем медленное время г = et. Изменению t от 0 до е~1 соответ- соответствует изменение г от 0 до 1. Будем обозначать скорости движений по отношению к медленному времени штрихом. Тогда предыдущее равен- равенство принимает вид -т— и временное среднее g, I' = временное среднее g. At Заменим временное среднее пространственным. Тогда получится усредненное уравнение J' = G(J), G = пространственное среднее g. Таким образом, переход к усредненному уравнению соответствует замене временных средних вдоль невозмущенного движения простран- пространственными. Г. Обсуждение. Применение метода усреднения состоит в том, что возмущенное уравнение заменяется гораздо более простым усредненным уравнени- уравнением. Решения усредненного уравнения исследуются на отрезках времени порядка е~1 (т.е. на отрезках медленного времени порядка 1). Затем делаются выводы о поведении возмущенного движения в течение вре- времени порядка е~г (обычно — выводы о том, что /-компонента решения
174 Глава 4 возмущенного уравнения близка к решению усредненного уравнения в течение времени е~1). Это заключение не вытекает из предыдущих рассуждений и нуж- нуждается в обосновании. Действительно, при выводе усредненного уравне- уравнения мы заменяли временные средние пространственными. Эта замена разумна, если траектория невозмущенного движения равномерно рас- распределена на торе размерности п, т. е. когда частоты несоизмеримы. Однако при резонансах траектория невозмущенного движения всюду плотно заполняет не n-мерный тор, а тор меньшей размерности. Поэто- Поэтому замена временного среднего пространственным средним по п-мер- ному тору вблизи резонансов явно незаконна. И действительно, существуют примеры, которые показывают, что различие между проекцией возмущенной траектории на базу и реше- решением усредненного уравнения за время е~1 достигает величины поряд- порядка 1: усредненный дрейф и проекция истинного движения направлены в разные стороны. Практически единственный до конца изученный случай — это слу- случай одночастотных систем, когда слои — одномерные торы, т. е. окруж- окружности. § 17. Усреднение в одночастотных системах Здесь формулируется и доказывается теорема, обосновывающая метод усреднения для одночастотных систем. А. Формулировка теоремы. Рассмотрим фазовое пространство М, являющееся прямым произ- произведением области В евклидова пространства Ш. и окружности S1. Угло- Угловая координата на окружности обозначается через ср mod 2тг, а точка из В обозначается через /. Возмущенное уравнение с 2тг-периодическими по (р функциями / и g дает усредненное уравнение j = sG(J), G(J) = ^Jg(J, V, 0) dip.
§ 17. Усреднение в одночастотных системах 175 Рассмотрим начальную точку 1$ из В и предположим, что реше- решение J(t) усредненного уравнения с начальным условием J@) = Iq оста- остается в области В в течение времени t = Те~1 (т.е., что в течение мед- медленного времени г = Т решение уравнения ^j- — G(J) с начальным условием /о не покидает В). Теорема. Предположим, что частота со не обращается в нуль в области В. Тогда расстояние между значением решения усредненного уравнения J(t) и I-компонентой решения возмущенного уравнения I(t) с 1@) = J@) остается малым в течение времени t G [0, Те~1], если е достаточно мало: где постоянная С не зависит от е. Б. Основная конструкция. Основная идея доказательства теоремы состоит в том, чтобы по- постараться уничтожить возмущение при помощи подходящей замены переменных. Эта идея имеет много приложений (см., например, пре- предыдущую и следующую главы) и является основой всего формального аппарата теории возмущений. Выберем вместо / новую координату Р = I + eR(I, cp) так, что- чтобы Р-компонента решения перестала осциллировать. Для этого в пра- правой части уравнения для Р мы хотим уничтожить члены порядка е, зависящие от ср. Иными словами, мы постараемся построить диффеоморфизм мно- многообразия М, (/, ср) i—> (Р, ср) так, чтобы возмущенное поле перешло в поле, имеющее на каждом слое почти постоянную (с точностью до ошибки порядка е2) проекцию на базу. Дифференцируя Р = I + sh(I, (p) по времени и собирая члены пер- первого порядка по е, мы получаем где аргумент е у функции g заменен нулем; остаток г (как мы ниже проверим) есть величина второго порядка малости относительно е. Постараемся выбрать h так, чтобы уничтожить члены первого по- порядка по е, т.е. чтобы квадратная скобка обратилась в нуль. Мы полу-
176 Глава 4 чаем формально (Здесь используется условие теоремы ш ф 0.) В действительности такой способ решения уравнения g + ш— = 0 незаконен, так как Оср функция h должна быть 2тг-периодической по ср, чтобы отображение (I, (p) i—> (Р, ср) было определено на М. Предыдущая формула определяет функцию h на окружности (а не на накрывающей ее прямой), лишь если среднее значение функции g по окружности равно нулю. Таким образом, выбор h позволяет уничтожить не все возмуще- возмущение g, а лишь его осциллирующую часть g(I,cp,0)=g(I,cp,0)-G(I). Среднее по периоду функции ^уже равно нулю, и мы можем определить периодическую функцию h формулой A) о Теперь для Р получается уравнение р = ?G(P) + sR. Это уравнение малой величиной sR порядка е2 отличается от усреднен- усредненного уравнения J = eG{J). Поэтому решения расходятся со скоростью порядка е2 и, следовательно, за время е~г разойдутся на расстояние порядка е. Отличие Р от I есть также величина порядка е. Поэтому и расстояние между I(t) и J(t) остается величиной порядка е в течение времени порядка е~1. Доказательство этого утверждения требует еще проведения (прос- (простых) оценок отброшенных выше членов.
§ 17. Усреднение в одночастотных системах 177 В. Оценки. 1°. Обозначения. Пусть К С В — компактная выпуклая область, со- содержащая точку /о. Мы предполагаем, что J(t) не выходит на границу К в течение времени Те~1. Будем обозначать через | • |о и | • |i нормы в про- пространствах С0 и С1 (максимум модуля функции в максимум модулей функ- функции и ее первой производной). Обозначим через а такую постоянную, что для I из К |/|i < ci, \g\i < ci, \ш~г\1 < ci. 2°. Докажем, что отображение A: (J, 97) '—У (Р, ф) — диффеомор- диффеоморфизм К х S1 при достаточно малых е. Доказательство. Из определения h (формула 1) следует, что h ? С1. Значит \eh\i < 1 при достаточно малых е. Если бы две точки при отображении А перешли в одну, разность значений eh в этих точках была бы равна разности значе- значений J; это противоречит неравенству \eh\i < 1, так как область К выпуклая. Из \eh\i < 1 вытекает также, что А локальный диффеоморфизм. Итак, А — диффеоморфизм. ¦ 3°. Оценка величины R. Имеем , е), <р, e) = Ri+R2 + Rs+R4+ Д5, Rt = g(I, ^ 0) - g(P(I, ^ e), if, 0), R2 = g(I, <p, e) - g(I, <p, 0), R3 = h(I, ф) - h(P(I, tp, e), v), R4 = eg(I, tp, e)||, R5=ef(I,<p,e)^. Предположим, что I и P(I, ip, e) принадлежат К. Тогда, поскольку P = I + eh(I, if), \Ri\ < e\g\i\h\0, \R2\ < e\g\i, \Rs\ < e|fe|i|fe|o, |Д4| ^e|fe|i|gr|o, \Rs\ ^e|fe|i|/|0. Входящие сюда нормы f,gnh оцениваются через с\. Окончательно, если I и РA, (р, г) принадлежат К, то |Д(РA, <р, е), <р, е)\ < с2е, где C2(ci) > 0 — не зависящая от J, ip, e постоянная. 4° Оценка P(t)-J(t). 12 В. И. Арнольд
178 Глава 4 Обозначая штрихом производную по медленному времени т = et, мы получаем, что Р и J удовлетворяют соотношениям J' = G(J). Следовательно, Р — J — Z удовлетворяет неравенству \z\' <:a\z\ + b, где а = |6r|i, Ъ = сг? до тех пор, пока Р, I и J остаются в области К. Обозначим |^@)| = с. Решая уравнение z = az-\-b с начальным услови- условием с, получаем оценку \Z(r)\^(c + br)ea\ пока Р, J, J остаются в области К. 5°. Окончание доказательства теоремы п. А. Доказательство. Обозначим через сз величину \h\o- Тогда |Р(/, ^ ?) — -^1 ^ сз?. В то же время доказанная выше оценка дает \P(t) - J(i)K с4?, С4 = (сз + с2Т)е аТ при е* < Т, пока J(i), P(t) = P(I(t), <p(t), e) и J(t) остаются в К. Обозначим через р расстояние от траектории усредненного движе- движения {J(t), et ^ Т} до границы К. Если (сз + с$)е < р, то, согласно предыду- предыдущим оценкам, J(i), P(t) и J(t) не могут выйти на границу К при е? ^ Т. Но тогда в течение всего этого времени \Щ - J(t)\ < \Щ - P(t)\ + \P(t) - J(t)\ < с3е + с4е. я Г. Пример. Уравнением Ван-дер Поля называется уравнение х = —х + еA — х2)х. Это уравнение маятника, в котором добавлено нелинейное «тре- «трение», положительное при больших амплитудах и отрицательное при ма- малых. Невозмущенное уравнение х = —х можно записать в стандартном виде ^ = —1,7 = 0, где ср = arg(a? + гх), 21 = х2 + х2. Уравнение для / в возмущенном движении имеет вид 1 = еA- х2)х2 = 2е!A - 21 cos2 ip) sin2 ср.
§ 18. Усреднение в многочастотных системах 179 Усредненное уравнение, следовательно, есть 2 Это уравнение имеет отталкивающее положение равновесия J = О и притягивающее J = 2. Положения равновесия уравнения для J соответствуют циклам возмущен- возмущенной системы. Доказанная выше теорема позволяет утверждать, что изменение / в возмущенной системе близко к изме- нению J в усредненной системе в тече- течение времени порядка е~1. Но если усред- усредненная система имеет невырожденное (например, устойчивое по первому при- приближению) положение равновесия, то возмущенная система (при доста- достаточно малых е) будет иметь невырожденный (например, устойчивый по первому приближению) цикл; это легко следует из теоремы о неявной функции. В частности, уравнение Ван-дер Поля при малых е имеет устойчи- устойчивый предельный цикл, близкий к окружности ж2 + ж2 = 4 (рис. 96). Рис. 96 § 18. Усреднение в многочастотных системах Многочастотный случай изучен гораздо хуже, чем одночастотный. В этом параграфе содержится обзор основных результатов в этой об- области. А. Резонансные поверхности. Рассмотрим обычную возмущенную систему метода усреднения Г ф = u(I) + e/(J, <р,е), <ре Тп, е « 1, и ф О, \i p,e), l?BcRk. Вектор частот со = (lj-l, ... , и)п) называется резонансным, если сущест- существует целочисленный ненулевой вектор m = (mi, ... , mn), для которо- которого (m, и)) = 0. Целочисленный вектор m называется номером резонанса.
180 Глава 4 Точка / из базы В называется резонансной, если вектор ш{1) резо- резонансный. Все резонансные точки /, соответствующие одному резонансу с номером т, образуют в базе В нашего расслоения гиперповерхность Эта поверхность называется резонансной поверхностью. В общем случае как резонансные, так и нерезонансные точки лежат в В всюду плотно (если число частот п > 1). Пример 1. Рассмотрим невозмущенную двухчастотную систему ф\ = Л, Ф2 = h, = 0. Здесь В — плоскость с координатами Д, Д (без нуля, т.к. мы пред- предполагаем, что и ф 0); резонансные поверхности — это все прямые, проходящие через 0 с рациональным тангенсом угла наклона к оси Д. Как и в этом примере, в общем случае двухчастот- ной системы резонансные поверхности образуют, вооб- вообще говоря, семейство непересекающихся гиперповерх- гиперповерхностей (рис. 97; вообще говоря = если ранг -^j макси- максимален). В этом случае при движении точки / по базе эта точка, вообще говоря, трансверсально пересекает резо- резонансные поверхности. Совершенно по-другому расположены резонансные поверхности в случае, когда число частот 3 или больше. Пример 2. Рассмотрим невозмущенную трехчастот- ную систему Рис. 97 Ф\ - = 0. Рис. Здесь В — плоскость с координатами Д, /г; резонансные поверхности — это все прямые с рациональными уравне- уравнениями. В этом случае при движении точки I по плоскости эта точка ес- если и пересекает трансверсально все резонансные кривые, то, во всяком случае, многие из них пересекает под малыми углами, ибо сколь угод- угодно близко к любому линейному элементу имеется линейный элемент резонансной кривой (рис. 98).
§ 18. Усреднение в многочастотных системах 181 Замечание. Сказанное станет, быть может, понятнее, если рас- рассмотреть отображение базы в проективное (п —1)-мерное пространство П: В ^RFn-\ Резонансные поверхности — это прообразы рациональных гиперплос- гиперплоскостей в МРП-1. В двухчастотном случае п = 2 и резонансам соответ- соответствуют рациональные точки на проективной прямой. Если же число частот п > 2, то рациональные гиперплоскости обра- образуют связное всюду плотное множество, так что от окрестности любой точки до окрестности любой другой можно добраться по резонансам. В соответствии со сказанным, в двухчастотных системах основным эффектом является прохождение через резонансы, а при большем числе частот обязательно нужно учитывать также касания с резонансами. Б. Влияние отдельного резонанса. Чтобы представить себе возможный эффект одного резонанса, рас- рассмотрим простейшие примеры. Пример 1. Возмущенная система: <pi = h, Ф2 = 1, Л = е, 12=есо8(рг. Рассмотрим резонанс ш\ = 0. Резонансная кривая 1\ = 0 пересекается в усредненном движении с ненулевой скоростью. Изменение /г в точ- точном решении за время от —сю до +оо, как нетрудно сосчитать, дается интегралом Френеля оо cos ( щ + Щу-) dt cos ( V В усредненной системе Ji не меняется со временем. Заметим, что основной вклад в интеграл дает окрестность резо- резонанса шириной порядка л/г; интеграл сам имеет порядок л/ё и зависит от начальной фазы (р$. Таким образом, в этом простейшем примере пересечение резонан- резонанса приводит к рассеянию решений возмущенного уравнения, имеющих общее начальное значение /, на расстояние порядка л/г друг от друга,
182 Глава 4 причем это рассеяние происходит в окрестности резонансной поверх- поверхности ширины порядка у/е. Появление величин порядка у/е характерно для всех задач, связан- связанных с прохождением резонанса. В то время как в первом примере прохождение резонанса приво- приводит лишь к небольшому рассеянию проекций траекторий возмущенной системы на базу по отношению к траекториям усредненной системы, в следующем примере возмущенное и усредненное движения совершен- совершенно различны. Пример 2. Рассмотрим возмущенную систему <pi = h, Ф2 = h, Л = е, Л = ?cos(<^i -(р2). Усредненная система: Зх = ?, j2 = 0. Усредненное движение с начальным условием Ji@) = 1, «/2@) = 1 при t = е'1 дает ,h{t) = 2, J2(t) = 1. Возмущенное движение с начальным условием /i@) = 1, /2@) = 1, V?i@) = 0, <^2@) = 0 приводит при t = е'1 к h(t) = 2, I2(t) = 2. Таким образом, проекция возмущенного движения на базу систе- систематически движется совсем не в ту сторону, что траектория усреднен- усредненного движения. За время t = е~г эти две траектории на базе расходятся на большое расстояние (порядка 1). Причина, по которой усредненное уравнение непригодно для опи- описания рассмотренного возмущенного движения, состоит в том, что эта возмущенная траектория все время остается на резонансной поверхнос- поверхности, а вблизи резонанса усреднение явно неприменимо, так как времен- временное среднее не близко к пространственному среднему по всему п-мер- ному тору. Захватывание части траекторий на резонансные режимы харак- характерно для систем с числом частот больше 1. Пример 3 (А. И. Нейштадт). Рассмотрим систему1 - I). 1 Полученную дописыванием тривиального уравнения ф>2 = 1 из одночастотной системы; резонанс в полученной системе соответствует обращению в 0 частоты в од- одночастотной.
18. Усреднение в многочастотных системах 183 Для исследования этой системы рассмотрим уравнения маятника с крутящим моментом и трением ф = е(а + simp — ф), к которому она легко сводится. Введем медленное время г = \fet (интервалу t ~ г соответствует г ~ г/2). Обозначая штрихом производные по медлен- медленному времени, получаем уравнение <р" = а + simp — л/ё(р'. Фазовые портреты при е = 0 изображены на рис. 99 (U — потенциаль- потенциальная энергия). Рис. 99 Мы будем предполагать, что а > 0. В зависимости от величины крутящего момента а возможны два случая. Если а > 1 (крутящий момент велик по сравнению с колебательным), то член simp не играет существенной роли: / меняется монотонно. Прохождению через резо- резонанс / = 0 отвечает изменение направления вращения маятника. Если а < 1, то возможен колебательный режим движения маятни- маятника (петля внутри сепаратрисы на фазовом портрете). Этот колебатель- колебательный режим соответствует траекториям, постоянно остающимся вблизи резонанса. Эффект малого трения л/е^р' состоит в основном в разрушении пет- петли сепаратрисы. Вместо нее на плоскости (ср, ср') появляется узкая (ши- (ширины порядка у/е) полоса вдоль неограниченной части сепаратрисы, состоящая из захватываемых притягивающим положением равновесия фазовых точек; вся область внутри сепаратрисы также захватывает- захватывается (рис. 100).
184 Глава 4 Рис. 100 Возвращаясь к исходной системе, мы обнаруживаем, что при а < 1 происхо- происходит захватывание в резонанс. При этом в резонанс захватывается малая доля всех <Р траекторий (мера множества начальных условий, (J, if), захватываемых за вре- время е~г, порядка л/е). Для этих захватыва- захватываемых начальных условий различие меж- ду изменением медленной переменной / и изменением решения усредненного урав- уравнения J за время г достигает величины порядка 1. Для остальных же начальных условий (т. е. для всех начальных условий, кроме множества меры порядка у/е) различие между / и J за время е~х остается малым (порядка д/elne, как можно сосчитать). Если же а > 1, то захват в резонанс вообще не происходит. В. Прохождение через резонансы в двухчастотной системе. Рассмотрим двухчастотную систему с частотами u)i(T), иJA)'- <fi = wi+efi, ф>2 — ш2 +ef2, Л = egi, U = eg2. Определение. Система удовлетворяет условию А, если скорость изме- изменения отношения частот -^ вдоль траекторий возмущенной системы всюду отлична от нуля: дш 1 , дш2 д! д! Система удовлетворяет условию А, если всюду отлична от нуля скорость изменения отношения частот -^ вдоль траектории усредненной системы: dl dl Мы будем предполагать, что все рассматриваемые системы ческие. аналити- Теорема. Если система удовлетворяет условию А, то различие меж- между медленным движением I(t) в возмущенной системе и J(t) в усредненной остается малым в течение времени t = е~1: \I(t) - J(t)\ ^ су/ё, если 1@) = J@), 0 ^ ? ^ е.
§ 18. Усреднение в многочастотных системах 185 Доказательство основано на том, что выделяется конечное число резо- нансов с небольшими номерами (большое при малых е), и вне малых окрест- окрестностей выделенных резонансных поверхностей используются обычные заме- замены переменных (см. § 17). Прохождение окрестностей выделенных резонансов приводит к рассея- рассеянию порядка л/ё (как в примерах выше). Суммируя результаты рассеяния вблизи выделенных резонансов и дрей- дрейфа в промежутках между ними, получаем приведенную выше оценку. ¦ Подробности см.: В. И. Арнольд. Условия применимости и оценка погреш- погрешности метода усреднения для систем, которые в процессе эволюции проходят через резонансы, ДАН СССР, 161, 1, 1965; А. И. Нейштадт. О прохождении через резонансы в двухчастотной задаче, ДАН СССР, 22, 2, 1975; диссертация А. И. Нейштадта «О некоторых резонансных задачах в нелинейных системах», МГУ, 1975, содержит доказательство приведенной выше оценки с у/е, взамен первоначальной оценки y^ln2 e в первой из цитированных работ. Теорема (А. И. Нейштадт). Если система удовлетворяет условию А и еще некоторому условию В (выполненному почти всегда), то для всех на- начальных точек (Jo, ipo), кроме множества меры, не превосходящей ciy/e, раз- различие между медленным движением I(t) в возмущенной системе и движени- движением J(t) в усредненной остается малым в течение времени е~1: \I(t) - J(t)\ ^ с2л/ё\ 1пе|, если 1@) = J@). Доказательство основано на том, что выделяется конечное число резо- резонансов с небольшими номерами и вне малых окрестностей выделенных резо- резонансных поверхностей используются обычные замены переменных. При исследовании выделенных резонансов используется усреднение по окружностям, являющимся траекториями невозмущенного движения при ре- резонансе. С этой целью зафиксируем номер резонанса (mi, 1112), где т\ и тг вза- взаимно просты, и выберем на торе вместо угловых координат (<^i, ^2) новые угловые координаты G, S), где 7 = tniipi + тг^. Скорость изменения уг- угловой координаты 7 B невозмущенном движении при резонансе обращается в нуль, так как т\ш\ + т.2^2 = 0. На базе также введем специальную координату р — miu>i +4712^2- Урав- Уравнение резонансной поверхности имеет теперь вид /9 = 0, так что величина р характеризует уклонение от резонанса. Точку резонансной поверхности бу- будем обозначать через а. В окрестности этой поверхности можно характери-
186 Глава 4 зовать точку базы значением расстояния до резонанса, р, и проекцией на резонансную поверхность, а. Во введенных координатах возмущенная система принимает вид j = р + eFi, ё = a(I) + eF2, р = eFs, & = bFa, где функции Fk, имеют по j и 5 период 2тг. Усреднение по траекториям резонансного движения сводится к усредне- усреднению по S. Усредненная система имеет вид j = p + eGi, p Функции Gfe, имеют период 2тг по ¦j и зависят также от р и е. Введем медленное время г = л/et и нормированное расстояние от резо- резонанса г = —. Тогда, обозначая производные по г штрихом, запишем усред- ненное уравнение в виде 1 = г + y/eGi, г' = G3, Аргументами у функций Gu являются j, y/sr, awe. Полагая в этом уравнении е = 0, получаем в качестве первого прибли- приближения уравнение jf — г, г' — u(j,a), a' — 0. Таким образом, в первом приближении получается уравнение маятника с крутящим моментом, зависящее от параметра а. Гамильтоновость полу- полученного уравнения первого приближения — удивительный факт, обнаружив- обнаружившийся в результате вычислений и отнюдь не очевидный заранее. Рассмотрим фазовый портрет уравнения первого приближения на плос- плоскости G, г). Он выглядит как в примере 3 п. Б при а < 1 или при а > 1, в зависимости от того, меняет ли знак функция и. Оказывается, что петли сепаратрисы возникают лишь для небольшого числа резонансов с не слишком большими номерами (здесь используется усло- условие А). Действительно, из условия А вытекает, что среднее значение функ- функции и по 7 отлично от нуля. Для резонансов с большими номерами в урав- уравнении первого приближения получается функция и, мало отличающаяся от своего среднего значения (так как усреднение по S близко в этом случае к усреднению по тору) и поэтому всюду отличная от нуля. Это соответству- соответствует маятнику с крутящим моментом, который велик по отношению к качаю- качающему моменту. В этом случае уравнение первого приближения не имеет ни положений равновесия, ни колебательной области.
§ 18. Усреднение в многочастотных системах 187 При переходе от уравнения первого приближения к полному уравне- уравнению из петли сепаратрисы возникает зона захвата в резонанс, как в при- примере 3 п. Б1. Мера множества захватываемых точек фазового пространства оценивается величиной порядка л/е, если все положения равновесия урав- уравнения первого приближения простые (т. е. если нули функции и простые: и = 0 =>¦ -^ ф 0). Это ограничение простоты и есть условие В теоре- мы Нейштадта. Заметим, что условие накладывается на уравнения первого приближения, соответствующие конечному числу резонансов (поскольку при условии А только для конечного числа резонансов уравнения первого прибли- приближения имеют положения равновесия). Доказательство теоремы завершается соединением оценок изменения ве- величин / в нерезонансных промежутках и вблизи резонансов — в незахваты- ваемой части фазового пространства. Подробности см. в цитированной выше диссертации Нейштадта. ¦ Замечание. Для двухчастотных систем остался неисследованным слу- случай, когда условие А нарушается, т. е когда отношение частот быстрого дви- движения в усредненном движении меняется немонотонно. Такое поведение не- невозможно в случае одномерной базы, но если число медленных переменных / два или больше, то поворот отношения частот вспять есть явление общего положения, неустранимое шевелением системы. Г. Многочастотные системы. Случаи, когда число частот больше двух, изучен гораздо слабее, чем двухчастотный. Для систем общего положения частоты быстрого движения несоизмеримы для почти всех значений медленных перемен- переменных. Поэтому естественно ожидать, что для большинства начальных условий метод усреднения правильно описывает эволюцию медленных переменных на отрезках времени порядка е~1. Первые общие теоремы в этом направлении принадлежат Д. В. Ано- Аносову {Д. В. Аносов. Осреднение в системах обыкновенных дифферен- дифференциальных уравнении с быстроколеблющимися решениями. Изв. АН СССР, сер. матем., 24, 5 A960), 721-742) и Т.Касуге (Т. Casuga. On the adiabatic theorem for the hamiltonian system of differential equations in the classical mechanics. I, II, III, Proc. Japan acad. 37 7, 1961). Теорема Аносова утверждает, что для любого положительного чис- числа р мера множества начальных условий (из компакта в фазовом про- *В отличие от примера п. Б, в общем случае «захваченные» траектории не обязаны навсегда оставаться вблизи резонанса.
188 Глава 4 странстве), для которых max \I(t) - J(t)\ > р при /@) = J@) стремится к нулю при е, стремящемся к нулю (здесь, как обычно, / — проекция возмущенного движения, a J — усредненное движение; пред- предполагается, что частоты независимы, в том смысле, что ранг производ- производись < ной частот по медленным переменным — равен числу быстрых пере- переменных). Эта теорема доказана в действительности при более общих предпо- предположениях: условная периодичность быстрых движений не предполага- предполагается, а предполагается эргодичность быстрого движения на почти всех торах; как обычно, предполагается, что решение усредненного уравне- уравнения J продолжается на время е~г. Множество малой вместе с е меры, где возможны большие уклоне- уклонения от усредненного движения за время г, соответствует всем траек- траекториям, захватываемым в резонанс или блуждающим вдоль резонанс- резонансных поверхностей, переходя с одной на другую, что также возможно, если число частот больше двух. Представляет интерес реалистическая оценка меры этого множес- множества. Например, для двухчастотных систем из результатов Нейштадта (см. п. В) следует оценка \I(t) — J(t)\ ^ С2у/ё\ In?г| вне множества меры не более с\\[е (при небольших ограничениях на систему). Предположим, что частоты независимы, т.е. что ранг -^у равен числу частот. Теорема (А. И. Нейштадт). Для системы с независимыми час- частотами вне множества малой меры к погрешность метода усреднения max \I(t) - J(t)\ при /@) = J@) оценивается сверху величиной Сз — . Эквивалентная формулировка: обозначим через Е(е, р) множество начальных условий в пределах фиксированного компакта, для которых погрешность достигает величины р или большей величины при указан- указанном значении е.
Тогда 18. Усреднение в многочастотных системах 189 mesE(e, р) ^ с^~^~- Доказательство см. в статье: А. И. Нейштадт. Об осреднении в многочастотных системах. II, ДАН СССР, 226, 6 A976), 1295- 1298. Это доказательство использует идею цитированной выше рабо- работы Т.Касуги: замена переменных метода усреднения модифицируется (сглаживается) таким образом, чтобы она задавалась гладкими функ- функциями не только вне окрестностей резонансов, но всюду. Результат А. И. Нейштадта можно истолковать как указание на статистическую независимость приращений отклонения / от J на по- последовательных отрезках времени длины 1. Действительно, прираще- приращение / — J за время Г порядка 1 имеет величину порядка е, а число интервалов длины Г в интервале е~г имеет порядок е~1. Если бы при- приращения на каждом интервале длины Г были независимы, ожидаемое приращение за время г оказалось бы, по законам теории вероятности, пропорциональным произведению приращения за время Г на корень из числа испытаний, т.е. оказалось бы величиной порядка eJ- = л/е. Теорема Нейштадта дает такой же порядок величины приращения, однако не для всех начальных условий: приходится исключить мно- множество начальных условий меры порядка у/е, на котором наблюдают- наблюдаются захват в резонанс и большие уклонения, не соответствующие схеме с независимыми приращениями. Представление о независимости приращений отклонения / от J, по-ви- по-видимому, может быть обосновано гораздо более полным образом в ситуации, когда быстрое движение является не условно-периодическим, а У-системой. На это указывает, в частности, центральная предельная теорема для функ- функций на фазовом пространстве (Я. Г. Синай. Центральная предельная теорема для геодезических потоков на многообразиях постоянной отрицательной кри- кривизны. ДАН СССР, 133, 6 A960), 1303-1306; М. Е. Ратнер. Центральная пре- предельная теорема для У-потоков на трехмерных многообразиях. ДАН СССР, 186, 3 A969), 519-521). Эта теорема обосновывает сформулированные выше представления для специального случая, когда как медленное, так и быстрое движение не зависит от медленных переменных: Вероятностные соображения становятся особенно интересными в том случае, когда нас интересует поведение системы на временах, больших по
190 Глава 4 сравнению с е~г (скажем, порядка е~3^2 или е~2). Если за время е~г проис- происходит захват в резонанс у/ё-й доли всех траекторий и если на следующих от- отрезках времени длины е~г будут таким же образом захватываться все новые траектории, то через время порядка е~3^2 большинство траекторий окажется захваченным резонансами и через время е~2 будут наблюдаться лишь резо- резонансные движения. Но, разумеется, независимость захватов на разных отрез- отрезках длины е является сильным дополнительным предположением, а наряду с захватом в резонанс происходит и обратный процесс. Имеющееся в теореме Нейштадта ограничение — независимость час- частот — существенно сужает область ее применимости. Условие ранг -^j = числу частот можно заменить условием независимости отношений частот: ранг отображения / i—> (^i(I) '¦••¦• шпA)) равен п — 1. Однако в случае, когда число медленных переменных мало (меньше, чем число частот без единицы) не может выполняться и это условие. Распространение теоремы Нейштадта на случай, когда число медлен- медленных переменных существенно меньше числа частот, требует, в частности, ис- исследования диофантовых приближений на подмногообразиях евклидова про- пространства. Для отображений ш: Rk —>Rn, к < п, удовлетворяющих условиям невырожденности (отличия от нуля некоторых определителей) ожидается такая же оценка снизу |(т, шA))\ ^С\т\-", m?Zn/0 для почти всех / из Rfe, какая имеет место для почти всех точек из Rn. Результаты этого рода получены для специальных кривых (us—Is); см. книгу: В. Г. Спринджук. Проблема Малера в метрической теории чисел. Минск, 1967; относительно общего случая см. работу А. С. Пяртли. Диофан- товы приближения на подмногообразиях евклидова пространства. Функцио- Функциональный анализ 3, 4 A969), 59-62. Заметим, что этими работами не решается ни обсуждаемый вопрос об обобщении теоремы Нейштадта, ни арифметический вопрос о точной оцен-
§ 18. Усреднение в многочастотных системах 191 ке v (не имеющий, впрочем, большого значения для нашей задачи, в которой изменение значения v будет менять лишь необходимую гладкость уравнений). В системах общего положения с любым числом быстрых и медленных переменных с достаточно большим числом параметров при почти любом зна- значении параметра мера множества начальных условий, для которых отклоне- отклонение больше р при некотором t на @, -), не превосходит С—г- и интеграл от отклонения по множеству остальных начальных условий (фазовое простран- пространство предполагается ограниченным) не превосходит Сл/е (имеется в виду максимум отклонения переменных I(t) от J(t) при t E [0, -]). Если отображение ш не принадлежит некоторому исключительному мно- множеству коразмерности N в функциональном пространстве, то в предыдущих 1 оценках у/ё можно заменить на ер+1, где п ^ С?, — к — N + 1, п — чис- число быстрых, а к — медленных переменных, причем константа С зависит от отображения, но оценка выполняется для всех, а не для почти всех систем (параметр привлекать не нужно). Сформулированные теоремы В. И. Бахтина (Об усреднении в многочас- многочастотных системах, УМН 40, №5 A985), с. 304-305; Функциональный ана- анализ и его приложения, 20, №2 A986), 1-7; см. также обзор: В. И. Арнольд, В. В. Козлов, А. И. Нейштадт. Математические аспекты классической и не- небесной механики. Итоги науки и техники. Современные проблемы матема- математики. Фундаментальные направления, т. 3, стр. 3-304, см. стр. 181) основаны на том, что почти всегда д(т, д! Ci\m\~v, v > п - 1, Vm G Zn\{0}. Отсюда выводится, что средняя по начальным условиям погрешность мето- метода усреднения оценивается сверху для систем общего положения величиной 1 порядка ер+1 при п ^ С&+р — к. Между прочим, эти оценки доставляют новую информацию и в тех раз- размерностях, где теорема Нейштадта применима. Но определитель обращается (нетождественно) в 0. Ибо в условиях теоремы Нейштадта оценивается от- С клонение в течение времени —, где С зависит от начального условия (чтобы усредненная траектория не успела дойти до поверхности вырождения якобиа- якобиана), а в теореме Бахтина множество, заметенное выходящими на поверхность вырождения траекториями, включено в выкидываемое множество малой меры.
192 Глава 4 § 19. Усреднение в гамильтоновых системах В этом параграфе кратко описаны особенности усреднения в слу- случае, когда как невозмущенная, так и возмущенная системы гамильто- новы. А. Вычисление усредненной системы. Предположим, что в невозмущенной системе введены перемен- переменные действие-угол, т. е. такие канонически сопряженные1 перемен- переменные (Ji, ... , In; (pi,.. .срп modd27r), что невозмущенная функция Га- Гамильтона Hq зависит лишь от переменных действия /. Канонические уравнения Гамильтона имеют вид т.е. при Н = Hq(I) ф = ш(Г), 1 = 0, где вектор частот ш{1) равен . Возмущенная система задается функцией Гамильтона Н = Hq(I) + +sHi(I, if, s), где функция Hi имеет по угловым переменным <р пери- период 2тг. Следовательно, уравнения возмущенного движения имеют вид Теорема. В гамильтоновой системе с п степенями свободы и п частотами эволюции медленных переменных не происходит в том смысле, что усредненная система имеет вид J = 0. Доказательство. При вычислении интеграла от —— по n-мерному тору можно сна- О(р8 чала проинтегрировать по переменной <р8. Этот однократный интеграл равен приращению периодической функции Н на периоде, т.е. нулю. 1 Координаты (/, ip) называются канонически сопряженными, если симплектичес- кая структура фазового пространства записывается а виде ш = J^ dlk Л dtp}*.
§ 19. Усреднение в гамилътоновых системах 193 Эта простая теорема показывает, что эволюция медленных пере- переменных в гамильтоновой системе резко отличается от явлений в общих, негамильтоновых системах. Б. Теорема Колмогорова. Предположим, что частоты независимы в том смысле, что произ- производная частот по переменным действиям -^= невырождена. В таком случае, как установил А.Н.Колмогоров (А. Н. Колмогоров. О сохране- сохранении условно-периодических движений при малом изменении функции Гамильтона. ДАН СССР, 98 4 A954), 527-530) при малом гамильтоно- вом возмущении большая часть инвариантных торов / = const лишь немного деформируется, не исчезая: фазовые кривые для большинства начальных условий в возмущенной системе, как и в невозмущенной, заполняют всюду плотно инвариантные торы. Если отличен от нуля якобиан отображения (п — 1)-мерной поверх- поверхности Hq(I) = h в (п — 1)-мерное проективное пространство, задан- „ Т (дЩ дН0\ ного формулой 1 I—> I : ... : I, то инвариантные торы воз- V oli oln / мущенной системы заполняют с точностью до остатка малой меры все Bп —1)-мерное многообразие уровня функции Гамильтона H(I, cp) = h. В частности, если число частот п = 2, то эти двумерные торы делят трехмерное многообразие уровня. Поэтому даже и для тех фа- фазовых кривых, которые не лежат на торах, переменные действия мало меняются в течение бесконечного интервала времени: фазовая кривая, начавшаяся в щели между двумя инвариантными торами, не может из нее выйти. Если же число частот больше двух, то торы не делят многообра- многообразие уровня функции Гамильтона, и некоторые фазовые кривые (обра- (образующие множество малой меры) могут, блуждая вблизи резонансных поверхностей между инвариантными торами, уходить далеко от исход- исходных значений переменных действия. Существуют примеры (В. И. Арнольд. О неустойчивости динами- динамических систем со многими степенями свободы. ДАН СССР, 156, 1 A964), 9-12), в которых такой уход действительно происходит. Средняя скорость ухода в примерах этого рода экспоненциально малая (поряд- (порядка е"^5). 13 В. И. Арнольд
194 Глава 4 В. Теорема Нехорошева. Оказывается, средняя скорость ухода переменных действия от их начальных значений в любых гамильтоновых системах общего положе- положения настолько мала, что она не улавливается никаким приближением теории возмущений (т. е. не проявляется в виде заметного ухода за вре- время порядка e~N ни при каком N, где е — параметр возмущения). Точнее, Н. Н. Нехорошев (Н. Н. Нехорошее. О поведении гамильто- гамильтоновых систем, близких к интегрируемым. Функциональный анализ и его приложения. 5, 4 A971); Н. Н. Нехорошев. Экспоненциальная оцен- оценка времени устойчивости гамильтоновых систем, близких к интегри- интегрируемым. УМН, 32, 6 A977), 5-66; см. также его диссертацию, МГУ, 1973) доказал, что для почти всякой невозмущенной функции Гамиль- Гамильтона Hq(I) существуют положительные числа а и Ь, такие, что средняя скорость изменения переменных действия / в возмущенной системе за время Т = е? "не превосходит еь. Заметим, что Г растет при е —»• 0 быстрее любой степени е~г, так что изменение / за время e~N мало при любом N. Постоянные а и Ь зависят от геометрических свойств невозму- невозмущенной функции Гамильтона Hq. Например, если функция Hq стро- д2Н го выпукла (положительно определена матрица —), то можно взять а = —-— , Ъ = 4ri гДе п — число частот. 6п2-Зп + 14 2' Теорема доказана для почти всех Hq в том смысле, что исключа- исключаются лишь функции Hq, удовлетворяющие бесконечному набору явно выписываемых алгебраических уравнений на коэффициенты Тейлора. Н. Н. Нехорошев называет исключительные функции некрутыми. Для некрутых Но уход возможен уже за время порядка |. В примерах экс- экспоненциально медленного ухода (см. п. Б) функция Hq крутая. Доказательство теоремы Нехорошева основано на следующем прос- простом свойстве усреднения в гамильтоновой системе. Предположим, что при некоторых значениях медленных пере- переменных / в гамильтоновой n-частотной системе имеет место резо- резонанс (ш, ш) = 0. Тогда вблизи соответствующей резонансной поверх- поверхности естественно проводить усреднение не по n-мерным торам, а по резонансным торам меньшей размерности. Размерность резонансного тора равна п — 1, если резонанс однократный, т.е. если направление целочисленного вектора т определено однозначно. Если уравнение от-
§ 19. Усреднение в гамилътоновых системах 195 носительно га (га, ш) = 0 имеет к рационально независимых решений, то траектории быстрого движения всюду плотно заполняют резонанс- резонансные торы размерности п — к, по которым и следует усреднять. Теорема. При усреднении по резонансным торам, соответствую- соответствующим резонансу (га, ш) = 0, направление эволюции переменных дейст- действия I в усредненной системе лежит в плоскости, натянутой на ре- резонансные векторы1 га (е случае однократного резонанса направление эволюции определено однозначно: это направление прямой, несущей век- вектор га). Доказательство. Рассмотрим для простоты случай однократного резонанса. Обо- Обозначим через 7 угловую координату, не меняющуюся при резонансе: j = (m, ср). Для усреднения возмущенной системы достаточно усред- усреднить функцию Гамильтона по быстрым переменным. В результате по- получим усредненную функцию Гамильтона Hq +eHi, где Hi зависит от переменных действия и от одной угловой переменной у. Уравнения усредненного движения дают теперь дер „ дНх (днЛ (ду\ ду Но —— = —-— т^— имеет направление вектора -р— = га. ¦ dip \ ду I \ocpj дер Теорема Нехорошева выводится из доказанной теоремы на осно- основании следующих соображений. Быстрая эволюция (со скоростью по- порядка е) возможна лишь при резонансе и лишь в направлениях, порож- порожденных резонансными векторами. Но условия крутизны, наложенные на Hq (например, достаточна строгая выпуклость функции Hq) гаран- гарантируют нам, что такая эволюция происходит в направлении, выводя- выводящем из резонансной поверхности. Следовательно, резонанс нарушается, и эволюция идет лишь короткое время, вследствие чего и получается экспоненциально малая оценка средней скорости эволюции сверху. Заметим, что аффинная структура в пространстве переменных действия опре- определена однозначно, и отождествление векторов пространства, двойственного к про- пространству частот, с векторами в пространстве переменных действия также одно- однозначно определено.
196 Глава 4 Если же условия крутизны нарушаются, то на резонансной поверх- поверхности можно найти кривую, касательная к которой во всех точках при- принадлежит плоскости, натянутой на резонансные векторы. Вдоль такой кривой эволюция может идти со средней скоростью порядка е, что при- приводит к уходу переменных действия от их начальных значений за вре- время порядка е~1. § 20. Адиабатические инварианты Здесь дается обзор основных результатов теории адиабатических инвариантов в гамильтоновых системах с медленно меняющимися па- параметрами. А. Понятие адиабатического инварианта. При рассмотрении гамильтоновых систем с медленно меняющи- меняющимися параметрами возникает своеобразное явление: величины, вообще независимые, становятся асимптотически (при стремлении к нулю ско- скорости изменения параметров) функциями друг друга. Например, рассмотрим маятник переменной длины. Длина маят- маятника и амплитуда колебаний, вообще говоря, независимы: если менять длину качающегося маятника, то при возвращении длины маятника к исходному значению амплитуда колебаний, вообще говоря, может измениться произвольным образом, в зависимости от того, как именно менялась длина. Оказывается, однако, что если изменение длины маятника произ- производить достаточно медленно, то амплитуда колебаний при возвращении длины к прежнему значению почти не изменится. Более того, отноше- отношение энергии маятника к частоте будет оставаться почти неизменным в течение всего процесса, хотя как энергия, так и частота при измене- изменении длины маятника меняются. Величины, асимптотически сохраняющиеся при достаточно мед- медленном изменении параметров гамильтоновой системы, называются адиабатическими инвариантами. Точнее, рассмотрим систему дифференциальных уравнений Га- Гамильтона х = v(x, A), A — параметр. Функция / от фазовой точки х и параметра А называется адиаба- адиабатическим инвариантом, если для любой гладкой (дифференцируемой достаточное число раз) функции А(т) медленного времени г = et вдоль
§20. Адиабатические инварианты 197 решения уравнения х = v(x, X(?t)) изменение величины I(x(t), X(?t)) остается малым на интервале времени 0 ^ t ^ е~г, если г достаточно мало. Б. Построение адиабатического инварианта системы с одной степенью свободы. Предположим, что функция Гамильтона Н(р, д; Л) имеет при каж- каждом значении параметра Л замкнутые фазовые кривые Н(р, q; А) = h (скажем — окружающие положение равновесия, в котором частота ма- малых колебаний отлична от нуля). Обозначим через I(p, q- А) площадь, ограниченную фазовой кри- кривой, проходящей через точку с координатами (р, q) при фиксированном значении Л, поделенную (по традиции) на 2тг. Величина / называется переменной действия. 2 т 2 Пример. Для маятника Н = Щ- + -^-; фазовая кривая Н = h — Li Li площади 7гл/-jr\ I-р- = ——• Частота колебаний и) = у/аЬ. Таким v V ° Vab эллипс образом, для маятника ~~ ~ш' Здесь роль параметра А играет пара (а, Ь). Теорема. Переменная действия I является адиабатическим ин- инвариантом гамильтоновой системы с одной степенью свободы. В. Доказательство адиабатической инвариантности действия. В основе доказательства лежит метод усреднения. Обозначим че- через (р угловую координату на замкнутых фазовых кривых, выбранную так, чтобы (р менялось вдоль каждой кривой пропорционально времени движения по кривой и вырастало на 2тг за каждый оборот (разумеется, угловая координата ср, как и переменная действия /, зависит не только от фазовых координат (р, q), но и от параметра А). Тогда уравнение нашей системы при каждом фиксированном зна- значении А можно записать в виде стандартной невозмущенной системы метода усреднения: ф = шA, А(т)), / = 0, т = 0.
198 Глава 4 Если теперь Л медленно меняется, то вместо невозмущенной сис- системы получится возмущенная ф = и + е/, I = eg, т = е, где функции fug периодичны по ср с периодом 2тг. Составим усредненную систему. Лемма. Переменная действия является первым интегралом усред- усредненной системы (то есть среднее g по ср равно нулю). Доказательство. Рассмотрим область, ограниченную замкнутой фазовой кривой / = /о при начальном значении параметра. Согласно теореме об усред- усреднении, образ этой области через любое время t из отрезка [0, е~г] есть, с ошибкой порядка е, область, ограниченная некоторой замкнутой фа- фазовой кривой I — It при значении параметра А = X(et). Но уравнения движения гамильтоновы (хотя и неавтономные). По теореме Лиувилля площадь образа равна площади прообраза. Отсюда следует It = Jo. ¦ Следствие. Отношение энергии маятника к частоте есть адиа- адиабатический инвариант. Задача. Шарик движется горизонтально между двумя вертикальными абсолютно упругими стенками, расстояние между которыми медленно ме- меняется. Докажите, что произведение скорости шарика на расстояние между стенками — адиабатический инвариант. Задача. Заряженная частица движется в магнитном поле, которое мало меняется на протяжении одного ларморовского витка частицы вокруг маг- магнитной силовой линии. Доказать, что адиабатическим инвариантом явля- является отношение квадрата компоненты скорости частицы по нормали к си- силовой линии к величине напряженности магнитного поля, -ф (см., напр., Л. А. Арцимович. Управляемые термоядерные реакции. М.: Физматгиз, 1961). Г. Адиабатические инварианты многочастотных гамильтоновых систем. Рассмотрим многочастотную систему уравнений Гамильтона р = — Hq, q = Hp, зависящую от параметра А и допускающую при фиксированном А переменные действие-угол: ф = шA, А), 1 = 0 (где
§20. Адиабатические инварианты 199 оо = °) с функцией Гамильтона Hq(I, А), зависящей от п перемен- переменных действия невырожденным образом, так что Предположим, как и выше, что параметр Л начинает медленно ме- меняться. Изменение р и q описывается уравнениями Гамильтона с пере- переменной функцией Н, а поведение переменных / описывается возмущен- возмущенной системой (мы предполагаем, что Л = et, где е — малый параметр). Лемма. Возмущенная система является гамильтоновой, с одно- однозначной функцией Гамильтона Н = Hq(I, A) + sHi(I, if, A, s). Доказательство этой леммы требует либо некоторого проникно- проникновения в симплектическую геометрию или гамильтонов формализм (см., например: В. И. Арнольд. Математические методы классической механики. М.: Наука, 1974), либо громоздких вычислений, которые мы опустим. Следствие. Переменные действия I являются первыми интегра- интегралами усредненной системы. Доказательство. Действительно, усредняемая функция — правая часть уравнения 1 = — е-— является производной периодической функции и потому имеет среднее значение нуль (см. теорему п. А § 19). ¦ Соединяя доказанное следствие с теоремой Нейштадта (см. п. Г § 18), мы приходим к следующему выводу: Изменение переменных действия I в гамильтоновой многочастот- многочастотной системе с медленно меняющимися параметрами остается мень- меньшим р в течение времени е~г, если пренебречь множеством начальных условий меры не более с— в исходном фазовом пространстве (фазо- (фазовое пространство предполагается здесь компактным, а производная -^j предполагается невырожденной). Определение. Функция F от фазовой точки гамильтоновой сис- системы и параметра называется почти адиабатическим инвариантом,
200 Глава 4 если для любого р > 0 мера множества начальных условий в компакт- компактном фазовом пространстве, для которых изменение функции F вдоль решения уравнений Гамильтона с медленно меняющимся параметром превосходит р за время е~г, стремится к нулю при е, стремящемся к нулю. Таким образом, переменные действия (Ii,...In) являются почти адиабатическими инвариантами невырожденной многочастотной га- мильтоновой системы. Д. Поведение адиабатических инвариантов при t ^> е~х. Хотя адиабатический инвариант мало меняется за время е~г, нет оснований предполагать, что его изменение останется малым за боль- большие отрезки времени (скажем, порядка е~2) или тем более за бесконеч- бесконечный отрезок времени. Пример. Рассмотрим маятник с медленно периодически меняю- меняющимся параметром х = — u;2(l + acosst)x. При сколь угодно малых е (т. е. при сколь угодно медленном измене- изменении параметра) возможен параметрический резонанс, при котором по- положение равновесия х = 0 становится неустойчивым. Ясно, что при параметрическом резонансе адиабатический инвариант линейного ма- маятника меняется неограниченно (в течение бесконечно большого про- промежутка времени). Оказывается, такое поведение адиабатического инварианта в сис- системе с периодически медленно меняющимся параметром связано имен- именно с линейностью системы, точнее с независимостью периода колеба- колебаний от амплитуды. Если же в гамильтоновой системе с периодичес- периодически медленно меняющимся параметром производная частоты быстро- быстрого движения по переменной действия отлична от нуля, то переменная действия мало меняется в течение бесконечного промежутка време- времени (см.: В. И. Арнольд. О поведении адиабатического инварианта при медленном периодическом изменении функции Гамильтона. ДАН СССР, 142, 4 1962, 758-761). Доказательство основано на том, что в этой ситуации существуют инвариантные торы, как в теореме Колмогорова (см. п. Б § 19).
§20. Адиабатические инварианты 201 Другим интересным случаем является случай, когда параметр ме- меняется таким образом, что при t —»• —сю и при t —»• +00 он имеет опре- определенные пределы. В этом случае имеет смысл говорить о значении адиабатического инварианта на минус бесконечности, его значении на плюс бесконечности и о приращении адиабатического инварианта за бесконечно большое время, Для линейного уравнения х = — cv2(et)x, cv(—00) = cv-, u;(+oo) = cv+ можно доказать, что приращение адиабатического инварианта за бес- бесконечное время — экспоненциально малая по е величина (в предпо- предположении аналитичности функции ш, которая не должна менять знака и должна разумно вести себя на бесконечности). Более того, можно указать явно главный член асимптотики приращения адиабатического инварианта при е —> 0 (см.: А. М. Дыхне. Квантовые переходы в адиа- адиабатическом приближении. ЖЭТФ, 38, 2, 1960, 570-578). Аналогичные результаты получены и для многомерных линейных систем. Аккурат- Аккуратные формулировки и доказательства имеются в статье М. В. Федорюк. Адиабатический инвариант системы линейных осцилляторов и теория рассеяния. Дифференциальные уравнения. 12, 6 A976), 1012-1018 (в ко- которой, однако, опущены ссылки на предшествовавшие физические ра- работы). Вопрос о приращении адиабатического инварианта для одномер- одномерной нелинейной системы также исследовался физиками: здесь доказа- доказана малость приращения по сравнению с eN, т.е. отсутствие измене- изменений адиабатического инварианта во всех порядках теории возмущений (A.Lenard. Ann. of Physics, 6 A959), 261-276). А.И.Нейштадт в ана- аналитическом случае получил и экспоненциальную оценку. (А.И.Ней- (А.И.Нейштадт. О точности сохранения адиабатического инварианта. Приклад- Прикладная математика и механика. 1981, 45, №1, 80-97). Экспоненциально малая погрешность принципиально неустранима, так как проекция на базу любой замкнутой кривой, близкой к слою нашего расслоения, под действием фазового потока постепенно (с экс- экспоненциально малой, т.е. порядка е~с/6, средней скоростью) растяги- растягивается вдоль /-пространства (А. И. Нейштадт. О разделении движений
202 Глава 4 в системах с быстро вращающейся фазой. Прикладная матем. и мех. 1984, 48: 2, 197-204). В окрестности сепаратрисы быстрого движения адиабатический инвариант быстро («скачком») меняется при пересечении сепаратрисы. Асимптотика таких скачков исследована в: А. И. Нейштадт. Прохож- Прохождение через сепаратрису в резонансной задаче с медленно меняющимся параметром. Прикл. матем. и механ. 1975, 39: 4, 621-632; Физика плаз- плазмы. 1986, 12, 992-1001; Скачки адиабатического инварианта и проис- происхождение люка Кирквуда 3:1. 1986. Что касается нелинейных систем с несколькими степенями свобо- свободы, то для них адиабатическая инвариантность переменных действия, вопреки утверждениям в физической литературе, вообще говоря, не имеет места: эти величины являются лишь почти адиабатическими ин- инвариантами, т.е. мало меняются для большинства начальных условий. § 21. Усреднение в слоении Зейферта При исследовании окрестности замкнутой фазовой кривой встре- встречается случай, когда близкие фазовые кривые в первом приближении также замыкаются, но при этом, прежде чем замкнуться, делают не- несколько оборотов вдоль исходной замкнутой фазовой кривой (т. н. слу- случай резонанса). Изучение поведения системы вблизи резонансного или близкого к резонансу периодического движения приводит к своеобраз- своеобразному варианту метода усреднения: усреднению в слоении Зейферта. А. Слоение Зейферта. Слоение Зейферта представляет собой разбиение прямого произве- произведения Ж2 х S1 на окружности, которое строится следующим образом. Рассмотрим в трехмерном евклидовом пространстве цилиндр с гори- горизонтальными основаниями и вертикальной осью. Разобьем внутрен- внутренность цилиндра на вертикальные отрезки. Отождествим верхнее и ниж- нижнее основания цилиндра, предварительно повернув верхнее основание на угол —-^ (мы склеиваем точку (z, 0) нижнего основания с точ- ~ / а -I \ а 2тгр кои (Az, 1) верхнего, где А — поворот на угол —^-, р и q взаимно простые целые числа). Определение. Слоением Зейферта типа (р, q) называется трех- трехмерное многообразие Ж2 х S1 вместе с его разбиением на окружности,
§21. Усреднение в слоении Зейферта 203 полученным из разбиения внутренности цилиндра на отрезки, парал- 2тгр лельные оси, при склейке основании с поворотом на угол ——. Таким образом, каждая из окружностей слоения Зейферта получа- получается склейкой q отрезков, за исключением одной, центральной окруж- окружности, полученной из оси цилиндра. Рассмотрим g-листное накрытие пространства Ж2 х S1 слоения Зейферта типа (р, q). Накрывающее пространство само диффеоморфноЖ2х5'1. Слоение Зей- Зейферта в исходном многообразии индуцирует на накры- накрывающем многообразии разбиение на окружности. Это разбиение можно рассматривать как слоение Зейферта типа (р, 1). (Склейка производится теперь с поворотом на угол 2тгр.) _, ЛПЛ г г, -А ( л\ Рис- 101 Слоение Зейферта типа (р, 1) является уже рассло- расслоением на окружности, и притом — прямым произведением. При накры- накрытии каждая окружность исходного слоения Зейферта диффеоморфно накрывается q окружностями, кроме одной, центральной окружности, накрываемой g-листно (рис. 101). Б. Определение усреднения в слоении Зейферта. Предположим, что в пространстве Ж2 х S1 слоения Зейферта да- дано векторное поле. Тогда в накрывающем расслоении также определя- определяется векторное поле. Каждый вектор поля можно спроектировать на базу Ж2 накрывающего расслоения. Усредним полученный вектор на базе вдоль слоя накрывающего расслоения. Мы получим в каждой точ- точке базы определенный вектор. Таким образом мы определили на базе векторное поле. Описанная операция построения из поля в пространстве слоения Зейферта поля на плоскости называется усреднением исходного поля вдоль слоения Зейферта. Иными словами, усреднение вдоль слоения Зейферта типа (р, q) определяется как обычное усреднение в накрывающем его д-листном расслоении. В. Свойства усредненного поля. При усреднении в обычном расслоении на базе может получить- получиться любое векторное поле. При усреднении в слоении Зейферта на ба- базе получается векторное поле со специальными свойствами: например, в центральной точке вектор усредненного поля обязательно обращается в нуль, если q > 1.
204 Глава 4 Теорема. В результате усреднения в слоении Зейферта ти- типа (р, q) получается поле, инвариантное относительно поворота плос- плоскости на угол -^-. Доказательство. Реализуем базу как одно из оснований исходного цилиндра. Тогда усреднение в слоении Зейферта превращается в усреднение по q отрез- отрезкам, параллельным оси цилиндра. При повороте на угол ^- эти q отрез- отрезков переходят друг в друга. Теперь легко видеть, что усреднение ком- 2тг / мутирует с поворотом на угол — (после поворота приходится усред- усреднять по тем же отрезкам, лишь в другом порядке). ¦ Г. Пример. Рассмотрим дифференциальное уравнение z = itvz + ef(z, t), где z E С, / — комплексная (не обязательно голоморфная) функция, имеющая пе- период 2тг по вещественному времени t, e — малый параметр. Уравнение, отвечающее е = 0, будем называть невозмущенным. Предположим, что частота невозмущенного движения со рациональ- рациональна или близка к рациональному числу -. Интегральные кривые невозмущенного уравнения с со = ^ образу- образуют в С х S1 = {z, t mod 2тг} слоение Зейферта типа ^. После усреднения вдоль этого слоения получается усредненное уравнение. z = eF(z), где векторное поле F переходит в себя при повороте плоскости пере- переменной z на угол -^. Д. Коэффициенты Тейлора симметричного поля. Будем задавать векторное поле на плоскости одной комплекс- комплексной переменной z комплексной (не обязательно голоморфной) функци- функцией F. Ряд Тейлора комплексной функции F по переменным ж, у (где z = х + iy) можно записать в виде ряда Тейлора по переменным z, ~z.
§21. Усреднение в слоении Зейферта 205 Запишем этот ряд в виде MA<. Предложение. Если поле F инвариантно относительно поворота на угол -^-, то из коэффициентов Fkj отличны от нуля лишь те, для которых к — I сравнимо с 1 по модулю q. Доказательство. Ряд Тейлора единственен. Поэтому каждый член ряда определяет векторное поле, инвариантное относительно поворота. Вектор zk~zl при 2тг (к-1Jт: повороте z на угол -?- поворачивается на угол . Этот поворот есть поворот на угол =^- если и только если к — I сравнимо с 1 по модулю q. ш Рассмотрим квадрант решетки целых неотрицательных точек (к,1). Отметим те из них, для которых к — I сравнимо с 1 по модулю q. Сре- Среди отмеченных точек всегда будет точка A, 0) и все целые точки на прямой, выходящей из этой точки параллельно биссектрисе квадранта. Эти точки соответствуют полям ,гФ(|,г|2), инвариантным относительно поворота на любой угол. Среди отмеченных точек всегда будет точка @, q — 1). Эта точ- точка соответствует полю ~zq~1, инвариантному относительно поворота на угол ^-. Все отмеченные точки образуют серию лучей, параллельных биссектрисе, начинающихся в точках @, mq — 1) и (гад + 1, 0) на сто- сторонах квадранта. Е. Случай симметрии порядка 3. Рассмотрим векторные поля, инвариантные относительно группы симметрии 3 порядка (т.е. рассмотрим случай q = 3). Мономы наименьшей степени в ряду Тейлора поля, симметричного относительно поворота на 120°, даются отмеченными точками плоскос- плоскости (к, I) с наименьшими к + l. Два первых монома — это z и г2. Таким образом, каждое поле на плоскости, инвариантное относительно пово- поворота на угол =г, имеет вид о F(z) = az + bz2 + O(\z\3).
206 Глава 4 Отбрасывая последнее слагаемое, мы получаем простейшее диффе- дифференциальное уравнение с симметри- симметрией порядка 3 z = az ы Здесь коэффициенты а, Ъ и фазовая координата z комплексны. Предположим, что а ф 0, Ь ф 0, умножая z на число и меняя еди- единицу времени, можно добиться 6 = 1, \а\ = 1. Изменение фазового портрета при а — ег1р, 6=1 показано на рис. 102. При любых а имеет- имеется 4 положения равновесия в вершинах равностороннего треугольника и в его центре. При чисто мнимых а система гамильтонова. Чтобы ис- исследовать систему при любых а, достаточно заметить, что она всегда получается из этой гамильтоновои системы формальным умножением переменных z и t на комплексные числа (т. е. поворотом и растяжением плоскости z и поворотом гамильтонова поля на постоянный угол). Ж. Учет отброшенных членов. Попытаемся теперь учесть отброшенные члены O(|z|3). Предпо- Предположим, что \а\ мал (это соответствует тому, что в исходной системе дифференциальных уравнений почти имел место резонанс третьего по- порядка). Тогда радиус треугольника особых точек также мал (имеет порядок \а\). Рассмотрим наше симметричное векторное поле в окрест- окрестности точки z = 0, которая велика по сравнению с \а\, но все же мала (по сравнению с 1). В такой окрестности отброшенные члены O(|z|3) малы по сравне- сравнению с оставленными. Из этого нетрудно вывести, что их учет не изме- изменит в существенном вида фазового портрета, если он был структурно устойчивым. В нашем случае фазовый портрет структурно неустойчив лишь при чисто мнимых а, когда система гамильтонова. Гамильтоно- вость не сохраняется при учете отброшенных членов. Для всякого луча плоскости комплексной переменной а, не идущего по мнимой оси, при достаточно малых \а\ ф 0 вид фазового портрета полной системы (при условии Ъ ф 0) в окрестности начала координат, малой по сравнению с 1 и большой по сравнению с \а\ , будет таков, как указано на рис. 102, <р ф ±^.
§21. Усреднение в слоении Зейферта 207 Исследование перестройки фазового портрета при прохождении точки а через мнимую ось составляет специальную задачу, к кото- которой мы вернемся в главе 6. В случае общего положения перестройка определяется еще одним членом ряда Тейлора: все происходит так же, как для уравнения z = az + ~z2 + cz\z\2, где Re с ф 0. 3. Применение к исходному уравнению. Проведенный анализ усредненного уравнения дает значительную информацию об исходной системе в случае, когда параметр е достаточ- достаточно мал. Не останавливаясь на обосновании, приведем лишь перевод по- полученных результатов на язык фазовых кривых исходного уравнения. Три положения равновесия в вершинах равностороннего треуголь- треугольника соответствуют одной замкнутой интегральной кривой исходного уравнения. При стремлении к нулю разницы между частотой невозму- невозмущенного движения со и резонансной частотой f = ^ эта замкнутая кри- кривая сливается с исходной замкнутой кривой, трижды обойдя вдоль нее. Устойчивость положений равновесия усредненной системы интер- интерпретируется как устойчивость периодических решений возмущенной, и т. д. Существенная разница возникает лишь в одном месте, а именно в случае, когда усредненная система имеет сепаратрису, идущую из седла в седло. В возмущенной системе седлам соответствует замкнутая кривая, а входящей и выходящей сепаратрисам — притягивающееся и отталки- отталкивающееся инвариантные многообразия этой замкнутой кривой. Но ес- если в усредненной системе сепаратрисы при пересечении сливаются, то в возмущенной системе это, вообще говоря, не так. Чтобы представить себе, как пересекаются инвариантные многообразия в трехмерном про- пространстве возмущенной системы, рассмотрим сечение этого простран- пространства плоскостью t = 0. Эту плоскость наше решение пересекает в трех точках, являющих- являющихся неподвижными точками куба отображения последования. Каждая из трех неподвижных точек имеет входящее и выходящее инвариантное многообразие (кривую). Но эти кривые, пересекаясь, не обязаны совпа- совпадать (в отличие от фазовых кривых уравнения на плоскости, которые, единожды пересекшись, обязаны совпадать на всем своем протяжении).
208 Глава 4 Рис. 103 При итерациях отображения последо- вания из пересекающихся дуг инвари- инвариантных многообразий образуется сложная сеть, называемая гомоклинической карти- картиной1 (рис. 103). И. Резонансы других порядков. Для резонансов порядка q выше 3 в качестве усредненной систе- системы первого нетривиального приближения получается таким же образом система z = az + zA(\z\2)+zq-1. В частности, для резонанса порядка 4 получается система z = az + Az\z Эти системы, а также система, соответствующая резонансу порядка 2, подробно рассматриваются в гл. 6. <р=0 (р=тг/2 Рис. 104 <р=7г (р=Ъя/2 (р=2я На рис. 104 изображена перестройка фазовых портретов в усред- усредненной системе, соответствующей резонансу пятого порядка z = az + Az\z\2 +z4 при ReA < 0, ImA < 0, а = eeiip, e <C 1. Неподвижная точка диффеоморфизма плоскости называется гомоклинической, если входящая и выходящая инвариантные кривые пересекаются, не совпадая.
Глава 5 Нормальные формы Очень плодотворный метод при работе с дифференциальными уравнениями состоит в том, чтобы их не решать, а преобразовывать к возможно более простому виду. Принадлежащая Пуанкаре теория нормальных форм указывает такие наиболее простые формы, к кото- которым можно привести дифференциальное уравнение в окрестности по- положения равновесия или периодического движения. Приведение к нормальным формам осуществляется при помощи рядов по степеням отклонения от равновесия или периодического дви- движения. Эти ряды не всегда сходятся. Но даже в случаях, когда ряды расходятся, метод нормальных форм оказывается весьма мощным ору- орудием исследования дифференциальных уравнений: несколько первых членов ряда часто дают значительную информацию о поведении реше- решений, достаточную для построения фазового портрета. Метод нормаль- нормальных форм является также основным орудием исследования в теории бифуркаций, где он применяется к семействам уравнений, зависящих от параметров. В настоящей главе изложены простейшие основные положения ме- метода нормальных форм. § 22. Формальное приведение к линейной нормальной форме Теорема Пуанкаре утверждает, что в классе формальных степен- степенных рядов «нерезонансное» векторное поле может быть приведено к сво- своей линейной части в особой точке формальным диффеоморфизмом. Сформулируем условие нерезонансности, о котором идет речь. А. Резонансы. Вместо векторного поля рассмотрим формальный векторный сте- степенной ряд v(x) = Ах+... от п переменных с комплексными коэффици- коэффициентами. Предполагается, что собственные числа матрицы А различны. 14 В. И. Арнольд
210 Глава 5 Определение. Набор собственных чисел Л = (Ai,...An) называ- называется резонансным, если между собственными числами существует це- целочисленное соотношение вида \s = (га, А), где га = (mi,.. .mn), nik ^ 0, X)m& ^ 2. Это соотношение называется резонансом. Число |га| = Ylmk называется порядком резонанса. Пример. Соотношение Ai=2A2 — резонанс порядка 2, 2Ai=3A2 — не резонанс, Ai + А2 = 0 — резонанс порядка 3 (точнее, из этого соот- соотношения следует резонанс Ai = 2Ai + А2). Б. Теорема Пуанкаре. Следующая теорема является основным результатом диссертации Пуанкаре. Теорема. Если собственные числа матрицы А нерезонансны, то уравнение х = Ах + ... формальной заменой переменной х = у + ... приводится к линейному уравнению у = Ау (многоточия означают ряды, начинающиеся с членов выше первой сте- степени). Доказательство теоремы Пуанкаре состоит в последовательном уничтожении членов второй, третьей и т. д. степеней в правой части. Каждый шаг основан на решении линейного гомологического уравне- уравнения, с вывода которого мы и начнем. В. Вывод гомологического уравнения. Пусть h — векторный многочлен1 от у порядка г ) 2и h@) = = /г'@) = 0. 1гГ. е. векторное поле, компоненты которого — многочлены. Вектор-многочлен (полином) является суммой вектор-одночленов или (вектор-мономов); последние представляют собой поля, у которых одна компонента одночлен (моном), а осталь- остальные компоненты — нули. Порядок многочлена есть степень низшего члена.
§22. Формальное приведение к линейной нормальной форме 211 Лемма. Дифференциальное уравнение у = Ау при замене х = у + h(y) превращается в х = Ах + v(x) + ... , где v{x) = — Ах—Ah{x), а многоточие означает члены порядка выше г. C/Ju Доказательство. ду I \ ду = Ах+ [||Аж - АЦх) Замечание. В квадратных скобках стоит скобка Пуассона вектор- векторных полей Ах и h(x). Мы будем обозначать через La оператор, переводящий любое поле в скобку Пуассона линейного поля Ах с данным полем: LAh = Щ±Ах - АЫх). дх v ' Определение. Гомологическим уравнением, связанным с линей- линейным оператором А, называется уравнение = v, где h — неизвестное, a v — известное векторное поле. Г. Решение гомологического уравнения. Линейный оператор La действует из пространства формальных векторных полей в себя. Он оставляет инвариантными пространства однородных вектор-полиномов любой степени. Вычислим собственные числа и собственные векторы операто- оператора La- Обозначим через е« собственный вектор оператора А с собствен- собственным числом Aj. Будем обозначать через (xi,. ..хп) координаты в бази- базисе (ei,... еп). Как обычно, хт будет обозначать ж^11, • • • х™п.
212 Глава 5 Лемма. Если оператор А диагональный, то и оператор La на про- пространстве однородных вектор-многочленов диагональный. Собственны- Собственными векторами оператора La являются вектор-одночлены xmes. Соб- Собственные числа оператора La линейно зависят от собственных чисел оператора А, а именно LAxmes = [(го, Л) - \8}хте8. Доказательство. Пусть h = xmes. Тогда у вектора ^— Ах отлична от нуля только их s-я компонента, и она равна Но Ah(x) = Xsh(x). m Если все собственные числа оператора La отличны от нуля, то он обратим. Следствие. Если набор собственных чисел оператора А нерезо- нерезонансный, то гомологическое уравнение LaJi = v разрешимо в классе формальных степенных рядов h для любого формального векторного по- поля v без свободного члена и линейной части в нуле. Если отсутствуют резонансы порядка к, то гомологическое урав- уравнение LaJi = v разрешимо для любого однородного вектор-многочлена v степени к в классе однородных вектор-многочленов степени к (здесь к>2). Замечание. Если оператор А недиагональный (имеет жордановы клетки), то и оператор La имеет жордановы клетки, но собственные числа, как легко видеть, даются той же формулой, что и в диагональном случае. Поэтому для нерезонансных (хотя бы и кратных) собственных чисел оператор La на пространстве однородных вектор-многочленов обратим. Итак, приведенное выше следствие справедливо и в случае кратных собственных чисел. Д. Доказательство теоремы Пуанкаре. Доказательство. Пусть исходное уравнение имело вид х = Ах + vr(x) +..., где vr — члены степени г (г ^ 2).
§23. Резонансный случай 213 Решим гомологическое уравнение ЬаЬ,г = vr (на основании след- следствия п. Г). Сделаем подстановку х = у + hr(y). Исходное уравнение примет вид у = Ay + wr+i(y) + ... (используем лемму п. В). Таким образом мы убили члены степени г в правой части исходного уравнения. Убивая последовательно члены степени 2, 3, ..., мы строим после- последовательность подстановок. Произведение этих подстановок стабили- стабилизируется в классе формальных рядов, т. е. члены любой фиксированной степени, начиная с некоторого шага, не меняются. Предельная подста- подстановка превращает наше формальное уравнение в у = Ау. ¦ Замечание 1. Хотя сходимость рядов и не доказана, сходящейся заменой возмущение можно в нерезонансном случае отодвинуть как угодно далеко: мы доказали, что для любого N настоящей (даже по- полиномиальной) заменой переменной исходное уравнение может быть приведено к виду у = Ay + o(\y\N). Замечание 2. Если возмущение v = vr + vr+i + ... имеет поря- порядок г, то, решая гомологическое уравнение ЬаЬ, = v, мы получаем после подстановки х = у + h уравнение с возмущением порядка 2г — 1 — об- обстоятельство, связанное со сверхсходимостью полученных повторением этой процедуры приближений (ср. §12). Замечание 3. Доказательство теоремы Пуанкаре сохраняет силу и в случае кратных собственных чисел (см. замечание в конце п. Г), лишь бы они были нерезонансными. Замечание 4. Если исходное уравнение было вещественным, а собственные числа нет, то собственный базис можно выбрать из комп- комплексно сопряженных векторов. В этом случае все замены в теореме Пуанкаре можно выбирать вещественными, т. е. переводящими комп- комплексно сопряженные векторы в комплексно сопряженные. § 23. Резонансный случай В резонансном случае теорема Пуанкаре-Дюлака утверждает, что формальной заменой переменных можно убить все нерезонансные чле- члены в уравнении.
214 Глава 5 А. Резонансные мономы. Пусть набор собственных чисел Л = (Ai, ... , А„) оператора А ре- резонансный. Пусть е8 — вектор собственного базиса, Х{ — координаты в базисе е^, хт = х™1 ... х™п — моном (одночлен) от координат а^. Определение. Вектор-моном xmes называется резонансным, ес- если \s = (га, А), \т\ ^ 2. Пример. Для резонанса Ai = 2Аг единственным резонансным мо- мономом является х\е\. Для резонанса Ai + Аг = 0 резонансными являются все мономы {x\X2)kxses. Б. Теорема Пуанкаре —Дюлака. Рассмотрим дифференциальное уравнение, заданное формальным рядом v(x) = Ах + ..., х = Ах + ... Теорема. При помощи формальной замены переменных х = у + ... уравнение можно привести к каноническому виду у = Ay + w(y), где все мономы ряда w резонансные. Доказательство. Начнем убивать нелинейные члены ряда v. Через несколько шагов мы можем столкнуться с неразрешимым гомологическим уравнением = v относительно однородного вектор-многочлена h степени г, равной по- порядку резонанса. В этом случае мы не можем уничтожить все члены степени г возмущения v подходящей подстановкой. Вместо этого мы убьем лишь те из них, какие можно. Иными словами, мы представим v и h в виде суммы вектор-одночленов \^ v ттр h — V4 h И ПОЛОЖИМ [mX) - Xs
§23. Резонансный случай 215 для тех га и s, для которых знаменатель отличен от нуля. Тем самым мы определим поле h. Выполним обычную подстановку доказательства теоремы Пуанка- Пуанкаре, х = у + h(y). Тогда в исходном уравнении исчезнут все члены сте- степени г, кроме резонансных, которые не изменятся. Уравнение примет вид У = Ay + Wr{y) + ••• , где wr состоит лишь из резонансных членов. Следующие шаги проводятся таким же образом. Оставшиеся ре- резонансные члены wr не влияют на гомологическое уравнение, которое мы решаем, и не меняются при следующих заменах. Действительно, при подстановке у = z + gs(z) уравнение у = Ау + w2{y) + ... + we{y) + ... превращается в z = Az + w2(z) + ... + wa-!(z) + [wa(z) - (LAga)(z)] + • • • ; скобка Пуассона чюч с g8 имеет уже степень s + 1. Таким образом, все нерезонансные члены степени s убиваются вы- выбором g8 и доказательство заканчивается как и в нерезонансном случае. ¦ В. Примеры. Практически теорема Пуанкаре-Дюлака используется обычно для то- того, чтобы выделить резонансные члены невысокого порядка и отодвинуть возмущение до членов некоторого конечного порядка, т. е. чтобы привести уравнение к виду х — Ах + w(x) + o(\x\N), (где w — многочлен из резонансных мономов) уже не формальной, а настоя- настоящей заменой переменных (если угодно, полиномиальной). Пример 1. Рассмотрим векторное поле на плоскости с особой точкой ти- типа узел с резонансом Ai = 2Аг. Теорема Пуанкаре-Дюлака позволяет (фор- (формально) привести уравнение к нормальной форме х\ = Aijci + сх\, Х2 = А2Ж2.
216 Глава 5 В этом случае нормальная форма полиномиальная, так как резонансных членов конечное число (всего 1). Пример 2. Рассмотрим векторное поле на плоскости R2 с особой точкой с чисто мнимыми собственными числами Ai, 2 = ±«u; (центр по линейному приближению). Перейдем к собственному базису. Собственные векторы можно взять комплексно сопряженными. Координаты на С2 в базисе из комплексно сопря- сопряженных векторов принято обозначать через z, ~z (эти числа действительно сопряжены лишь на вещественной плоскости R2 С С2). Наше дифференциальное уравнение на R2 задает на С2 уравнение, кото- которое можно записать в виде z — Xz + ... , г = Аг + ... , (многоточие означает ряд по степеням гиг). Поскольку второе уравнение получается из первого сопряжением, его можно не писать. Имеется резонанс Ai + Аг = 0. По теореме Пуанкаре-Дюлака, наше урав- уравнение приводится к виду вещественной заменой переменной (см. замечание 4 в п. Д § 23). Следова- Следовательно, г2 = |?|2 — гладкая вещественная функция на R2. Для нее (г2)' = (( + ct = B Rec)r4 + О(г6). Если вещественная часть с отрицательна (соответственно положительна), то положение равновесия устойчиво (соответственно неустойчиво). Таким образом, первые несколько шагов метода Пуанкаре дают метод решения вопроса об устойчивости особой точки, нейтральной в линейном приближении. При этом совершенно несущественно, можно ли продолжать построение дальше и сходится ли вся процедура в целом, важно лишь, чтобы величина «нелинейного декремента» Re с была отлична от нуля. Замечание. Обобщением теоремы Пуанкаре является одна общая тео- теорема теории алгебр Ли — так называемая теорема Э. Картана о репликах, обобщающая также теорему о жордановой нормальной форме. Рассмотрим конечномерную алгебру Ли. Пусть и — элемент этой алгеб- алгебры Ли. Коммутирование с этим элементом определяет линейный оператор из пространства алгебры Ли в себя, v 1—> [и, v]. Элемент и называется полупрос- полупростым, если оператор коммутирования с и диагонализуем (имеет собственный
§ 24. Области Пуанкаре и Зигеля 217 базис). Элемент и называется нилъпотентным, если оператор коммутиро- коммутирования с и нилыютентен (т. е. все собственные числа этого оператора равны нулю). Теорема о репликах утверждает, что каждый элемент алгебры разлага- разлагается (и притом единственным образом) в сумму полупростого элемента S и коммутирующего с ним нильпотентного элемента N: U = S + N, SN = NS. Элементы S и N называются репликами элемента и. [В теории жордановой нормальной формы S — оператор с диагональной матрицей, а N — сумма нильпотентных жордановых клеток.] В алгебре Ли струй векторных полей с особой точкой 0 полупростые поля — это поля, которые в подходящей системе координат линейны и зада- задаются диагональной матрицей. Нильпотентное поле состоит из нильпотентной линейной части и членов высшей степени. Условие коммутирования S и N означает как раз, что в нелинейной части поля в указанной системе коорди- координат могут присутствовать только резонансные члены. Теорему Пуанкаре-Дюлака можно было бы вывести из указанной общей теоремы о репликах (которую нужно применять к конечномерным алгебрам Ли струй векторных полей в нуле). § 24. Области Пуанкаре и Зигеля При исследовании сходимости рядов Пуанкаре, построенных в пре- предыдущих параграфах, в зависимости от расположения собственных чи- чисел на плоскости комплексного переменного существенно различаются два случая. А. Резонансные плоскости. Рассмотрим комплексное n-мерное пространство всевозможных наборов собственных чисел С" = {Л = (Ai, ... , А„)}. Определение. Гиперплоскость в С", заданная целочисленным уравнением Xs = (га, A) mk > 0, ^ mk > 2 называется резонансной плоскостью. Изменяя целочисленный вектор га и номер s, мы получим счетное число резонансных плоскостей. Посмотрим, как расположено все мно- множество резонансных плоскостей в пространстве собственных чисел С".
218 Глава 5 Оказывается, в одной части С" резонансные плоскости лежат дискрет- дискретно, а в другой — всюду плотно. Определение. Набор собственных чисел Л принадлежит области Пуанкаре, если выпуклая оболочка п точек (Ai,... А„) на плоскости од- одного комплексного переменного не содержит нуля. Набор собственных чисел А принадлежит области Зигеля, если нуль лежит внутри выпуклой оболочки п точек (Ai,...An). Замечание. При п > 2 области Пуанкаре и Зигеля открыты и раз- разделены конусом. При п = 2 область Зигеля имеет вещественную кораз- коразмерность 1 в С2. Б. Резонансы в области Пуанкаре. Предположим, что набор собственных чисел А принадлежит облас- области Пуанкаре. Теорема 1. Каждая точка области Пуанкаре удовлетворяет не более чем конечному числу резонансных соотношений Xs = (га, А), га| ^ 2, rrii ^ 0 и имеет окрестность, не пересекающуюся с другими резонансными плоскостями. Иными словами, резонансные плоскости лежат в области Пуанкаре дискретно. Доказательство. Согласно определению, на плоскости комплексных чисел сущест- существует вещественная прямая, отделяющая набор собственных чисел от нуля. Рассмотрим ортогональные проекции собственных чисел на нор- нормаль к этой прямой, направленную от нуля. Все эти проекции не мень- меньше, чем расстояние отделяющей прямой от нуля. Но коэффициенты rrii резонансного соотношения неотрицательны. Следовательно, при достаточно большом |га| проекция (га, А) на нор- нормаль будет больше наибольшей проекции собственного числа на нор- нормаль к отделяющей прямой. ¦ Теорема 2. Если собственные числа А линейной части поля v в О лежат в области Пуанкаре, то даже в резонансном случае поле фор- формальной заменой переменных приводится к полиномиальной нормальной форме.
§ 24. Области Пуанкаре и Зигеля 219 Доказательство. Согласно теореме 1, число резонансных членов конечно, так что теорема 2 вытекает из теоремы 1 и теоремы Пуанкаре-Дюлака. ¦ Замечание. В области Пуанкаре резонанс возможен только в слу- случае, если одно из собственных чисел с неотрицательными коэффици- коэффициентами выражается через остальные, не считая его самого, т.е. если Х8 = (m, Л), то ms = 0. Действительно, если т8 > 0, то 0 = (га, Л) — Xs имеет положительную проекцию на нормаль к отделяющей прямой. В. Резонансы в области Зигеля. Предположим теперь, что набор собственных чисел Л принадлежит области Зигеля. Теорема 3. В области Зигеля резонансные плоскости лежат всю- всюду плотно. Доказательство. Точка 0 лежит либо внутри некоторого треугольника с вершина- вершинами (Ai, A2, А3), либо на отрезке (Ai, A2). В первом случае рассмотрим угол с вершиной 0, образованный линейными комбинациями чисел Ai и А2 с вещественными неотрицательными коэффициентами. Отрицательные кратные числа Аз лежат в этом угле. Разобьем угол на параллелограммы с вершинами в целочисленных линейных комби- комбинациях чисел Ai и А2. Пусть d — диаметр такого параллелограмма. Для любого натурального числа N число —NX% лежит в одном из наших параллелограммов. Следовательно, оно лежит не далее d от одной из вершин, так что \NX3 + raiAi + га2А2| ^ d. Из этого неравенства следует, что расстояние от нашей точки А до резонансной плоскости А3 = rriiAi +ГМ2А2 + (ЛГЧ-1)Л3 не превосходит -^. Итак, теорема доказана, если нуль лежит в треугольнике. В случае, когда 0 лежит на отрезке между Ai и Аг, существуют сколь угодно большие целые pi и р2 с |piAi +P2A2I ^ d. Это дает резонансную плоскость на расстоянии меньше р- от А.
220 Глава 5 Определение. Точка Л = (Ai,... А„) ? Сп называется точкой ти- типа (С, и), если при любом s |As-(ra,A)|> -g_ fit для всех целочисленных векторов га с неотрицательными компонента- компонентами nii, ^rrii = |га 2. Теорема 4. Мера множества точек, не являющихся ни при каком С > 0 точками типа (С, v), равна нулю, если v > —-—. Li Доказательство. Зафиксируем шар в С" и оценим меру не (С, г/)-точек в нем. Нера- Неравенство, входящее в определение, определяет окрестность резонансной С С плоскости ширины не более —^—-. Поэтому мера части этой скрест- скрестен С2 ности, попавшей в шар, не превосходит —2 . Суммируя по га с фик- \т\ С С2 сированным |га|, получаем не более Iral"—3 . Суммируя по |га|, \т\ "+ получаем С^{у)С2 < оо, если v > ^——. Следовательно, множество Li не (С, г^)-точек в шаре покрывается множествами сколь угодно малой меры. ¦ В вещественном случае в теореме 4 требуется v > п — 1. Г. Теоремы Пуанкаре и Зигеля. Предположим теперь, что векторное поле задано не формальным, а сходящимся рядом, т. е. что мы рассматриваем дифференциальное уравнение с голоморфной правой частью. Теорема Пуанкаре. Если собственные числа линейной части го- голоморфного векторного поля в особой точке принадлежат области Пу- Пуанкаре и нерезонансны, то поле в окрестности особой точки биголо- морфно эквивалентно своей линейной части. Иными словами, ряды Пуанкаре, построенные в предыдущих па- параграфах, сходятся, если собственные числа принадлежат области Пу- Пуанкаре.
§ 24. Области Пуанкаре и Зигеля 221 Теорема Зигеля. Если собственные числа линейной части голо- голоморфного векторного поля в особой точке образуют вектор типа (С, v), то поле в окрестности особой точки биголоморфно эквивалентно своей линейной части. Иными словами, ряды Пуанкаре сходятся при почти всех (в смысле теории меры) линейных частях поля в особой точке. Замечание. Все нерезонансные векторы области Пуанкаре явля- являются векторами типа (С, v) при некоторых С > 0. Напротив, в области Зигеля всюду плотное множество образуют как векторы типа (С, и), так и резонансные векторы, равно как и векторы нерезонансные, но не являющиеся векторами типа (С, v) ни при каких С и v. Для наборов собственных чисел последнего типа, хотя и несоизме- несоизмеримых, но слишком близких к соизмеримости, ряды Пуанкаре могут расходиться, так что поле может быть формально эквивалентным своей линейной части, но биголоморфно неэквивалентным. Доказательства теорем Пуанкаре и Зигеля получаются посредст- посредством некоторых упрощений из доказательств аналогичных теорем для отображений, приведенных в § 28. Д. Теорема Пуанкаре —Дюлака Рассмотрим теперь случай резонансных собственных чисел. Теорема. Если собственные числа линейной части голоморфного векторного поля в особой точке принадлежат области Пуанкаре, то поле в окрестности особой точки биголоморфно эквивалентно полино- полиномиальному, в котором все вектор-мономы с коэффициентами степени выше первой резонансные. Иными словами, ряды Пуанкаре сходятся, если собственные числа лежат в области Пуанкаре, даже в случае резонанса. Замечание. Напротив, если собственные числа лежат в области Зигеля, то ряды, приводящие к формальным нормальным формам при наличии резонансов, часто расходятся. Первый пример этого рода по- построил еще Эйлер (L. Euler. De seriebus divergenti bus, Opera omnia. Ser. 1, 14 A924), Leipzig-Berlin, 247, 585-617; см. стр. 601). В примере Эйлера {х = х2, у = у - х
222 Глава 5 начало координат является особой точкой типа седло-узел. Несмотря на аналитичность правой части, сепаратриса, разделяющая обе половины полуплоскости х < 0, не аналитична, а лишь бесконечно дифференци- дифференцируема: у = ^2{к- 1)\хк. Много примеров расходимости рядов Пуанкаре построил А. Д. Брю- но (А. Д. Брюно. Аналитическая форма дифференциальных уравнений. Труды ММО 25 A971), 119-262; в этой работе доказана также схо- сходимость рядов в некоторых случаях, выходящих за рамки теоремы Зигеля). Е. Вещественный и неаналитический случаи. Теоремы Пуанкаре и Пуанкаре-Дюлака переносятся на вещественно- аналитический случай и на случай бесконечно дифференцируемых вектор- векторных полей или даже на случай полей конечной (достаточно большой) глад- гладкости. В случае Зигеля такое обобщение также возможно (см., например, S. Sternberg. On the structure of local homeomorphisms of Euclidean гг-space. Amer. J. Math. 80, A958), 623-631, 81, 3 A959), 578-604). Следует, однако, заметить, что ситуации, в которых применимы эти те- теоремы, топологически тривиальны. Действительно, случай Пуанкаре для ве- вещественного поля может встретиться лишь когда собственные числа лежат либо все в левой полуплоскости, либо все в правой. В этом случае (независи- (независимо от резонансов), система в окрестности неподвижной точки в веществен- вещественном пространстве топологически эквивалентна стандартной системе х = —х (либо х — +х). Все фазовые кривые входят в асимптотически устойчивое по- положение равновесия при t —У +оо (либо выходят из равновесия при t —У — оо). В ситуации теоремы Зигеля в вещественной области применима теоре- теорема Гробмана-Хартмана (система топологически эквивалентна стандартному седлу). Действительно, если хотя бы одно из ненулевых собственных чисел линейной части лежит на мнимой оси, то на мнимой оси лежит и комп- комплексно сопряженное собственное число; пара Ai, 2 = ±га; приводит к резонан- резонансу Ai + A2 = 0. Нулевое собственное число всегда резонансное. Таким обра- образом, теорема Зигеля применима в вещественном случае лишь к системам без собственных чисел на мнимой оси, а такие системы локально топологически эквивалентны своей линейной части (теорема Гробмана-Хартмана, § 13). В отличие от теорем Пуанкаре и Зигеля, метод Пуанкаре применим к исследованию топологически сложных случаев, когда имеются собствен- собственные числа на мнимой оси. А именно, метод применяется для нормализации конечного числа членов ряда Тейлора. После этого доказывается, что члены более высокого порядка уже не изменят качественной картины.
§25. Нормальная форма отображения 223 Простейший пример этого рода разобран выше в п. В § 23. Особенно полезен этот метод в теории бифуркаций (см. гл. 6). § 25. Нормальная форма отображения в окрестности неподвижной точки Построение подходящей системы координат для отображения про- пространства в себя вблизи неподвижной точки параллельно теории нор- нормальных форм дифференциальных уравнений в окрестности положения равновесия. В этом параграфе указано, какой вид принимают основные положения теории нормальных форм в этом случае. А. Резонансы. Области Пуанкаре и Зигеля. Рассмотрим формальное отображение F: Сп —> Сп, заданное фор- формальным степенным рядом F(x) = Ах + ... Пусть (Ai, ... , Хп) — соб- собственные числа линейного оператора А. Резонансом называется соотно- соотношение А, = Ат, где Ат = А™1...А™», тк ^ О, ^тк ^2. Пример. При п = 1 резонансными собственными числами явля- являются 0 и все корни любой целой степени из единицы, а все остальные числа А не резонансные. Определение. Набор собственных чисел принадлежит области Пуанкаре, если модули собственных чисел все меньше единицы или все больше единицы. Таким образом, отображение F с собственными числами линейной части, принадлежащими области Пуанкаре, является в окрестности на- начала координат сжатым (если |А| < 1), или же (если |А| > 1) сжатым является обратное отображение. Определение. Дополнение к области Пуанкаре составляет об- область Зигеля. При п = 1 область Зигеля сводится к единичной окруж- окружности |А| = 1. Уравнение резонанса \s = Хт определяет в пространстве собственных чисел Сп комплексную гиперповерхность. Она называется резонансной поверхностью. В области Пуанкаре резонансные поверхнос- поверхности лежат дискретно. В области Зигеля как резонансные, так и нерезо- нерезонансные точки всюду плотны.
224 Глава 5 Б. Формальная линеаризация. Рассмотрим прежде всего вопрос о формальной нормальной форме отображения в неподвижной точке. Теорема. Если набор собственных чисел отображения F в непо- неподвижной точке нерезонансный, то отображение х i—> F(x) приводит- приводится к своей линейной части х \—> Ах формальной заменой переменных х = Ж{у) =у + ...: Fojtf = Ж о А. Доказательство. Пусть Н(у) = у + h(y), где h — однородный вектор-многочлен степени г ^ 2. Тогда Я о А о Н'^х) =Ах+ ЩАх) - Ah(x)] + ... , где точками обозначены члены степени выше г. Выражение в квадрат- квадратных скобках является однородным вектор-многочленом степени г. Этот многочлен линейно зависит от h. Линейный оператор МА: h(x) ^ [h(Ax) - Ah(x)] на пространстве однородных вектор-многочленов имеет собственные числа Аш — Xs и собственные векторы h(x) = xmes (здесь, как обычно, векторы ей образуют собственный базис оператора А, хт = х™1 ... х™п, Xk — координаты в базисе {е&}; собственные числа оператора А для простоты предположены различными). Таким образом, мы приходим к гомологическому уравнению отно- относительно h MAh = v, для решения которого приходится делить коэффициенты разложения v на числа Хт — Xs. Итак, условие резонанса в нашей задаче имеет вид А, = А™. Дальнейшее доказательство теоремы не отличается от проведенно- проведенного в § 22 для случая дифференциальных уравнений. ¦ В. Вопросы сходимости. Теоремы Пуанкаре и Зигеля переносятся на рассматриваемый слу- случай дискретного времени следующим образом.
§25. Нормальная форма отображения 225 Теорема Пуанкаре. Если все собственные числа голоморфного диффеоморфизма в неподвижной точке по модулю меньше единицы (или если все больше) и резонансы отсутствуют, то отображение превра- превращается в свою линейную часть биголоморфным локальным диффеомор- диффеоморфизмом в окрестности неподвижной точки. Теорема Зигеля. Для почти всех (в смысле меры Лебега) набо- наборов собственных чисел линейной части голоморфного диффеоморфизма в неподвижной точке диффеоморфизм биголоморфно эквивалентен своей линейной части в неподвижной точке. А именно, для эквивалентности диффеоморфизма его линейной час- части достаточно, чтобы собственные числа удовлетворяли неравенствам |A,-Am| ^ C\m\-V для всех s = 1,... ,п, \т\ = ^ nik ^ 2, rrik ^ 0. Наборы собствен- собственных чисел, удовлетворяющих этому неравенству, называются набора- наборами мультипликативного типа (С, v). Множество наборов собственных чисел Л, не являющихся наборами мультипликативного типа (С, v) ни п — 1 при каком С, имеет меру нуль, если v > —-—. Доказательство теорем Пуанкаре и Зигеля проводится почти та- таким же образом, как для дифференциальных уравнений. Хотя теорема Зигеля известна уже более 30 лет, ее доказательство до сих пор, кажет- кажется, не было опубликовано. Это доказательство приведено в § 28. Г. Резонансный случай. Каждому резонансу \s = Лш соответствует резонансный вектор- моном xmes, (где е8 — вектор собственного базиса, хт = х™1 ... х™п, хи — координаты в собственном базисе). Теорема Пуанкаре —Дюлака. Формальное отображение х i—> Ах + ..., где матрица оператора А диагональна, формальной за- заменой х = у + ... приводится к нормальной форме у \—у Ay + w(y), где ряд w состоит из одних резонансных мономов. Если собственные числа линейной части оператора А по модулю все меньше (все больше) едини- единицы, то голоморфное отображение х \—> Ах + ... биголоморфной заменой приводится к полиномиальной нормальной форме из одних резонансных членов. 15 В. И. Арнольд
226 Глава 5 В резонансном случае метод Пуанкаре обычно используется для приведения к нормальной форме конечного числа членов ряда Тейлора отображения в неподвижной точке. Пример. Рассмотрим отображение С1 в себя с неподвижной точкой О, с собственным числом Л, являющимся корнем степени п из единицы. Такое отображение приводится подходящим выбором координаты к виду х ^ \х + схп+1 + О(\х\2п+1). Например, если Л = — 1, то отображение приводится к виду и—У — х + сх + О(\х\ ). Эта формула позволяет исследовать устойчивость неподвижной точки ве- вещественного отображения. Действительно, квадрат отображения имеет вид х i—> х- 2сж3 + О(|ж|5). Следовательно, если с > 0, то неподвижная точка О нашего отображения устойчива. Таким образом, первые несколько шагов метода Пуанкаре позволяют исследовать устойчивость неподвижной точки в сомнительном по линейному приближению случае. § 26. Нормальная форма уравнения с периодическими коэффициентами Одним из вариантов метода нормальных форм Пуанкаре является редукция к простейшему виду уравнения с периодическими коэффи- коэффициентами. А. Нормальная форма линейного уравнения с периодичес- периодическими коэффициентами. Рассмотрим линейное уравнение с комплексным фазовым про- пространством х = A(t)x, где комплексный линейный оператор A(t): <Сп —»• Сп зависит от t 2тг-периодически. Оператором монодромии называется линейный оператор М: <Сп —>¦ —> <Сп, переводящий начальное условие при t = 0 в значение реше- решения с этим начальным условием при t = 2тг (отображение монодромии
§ 26. Нормальная форма уравнения с периодическими коэффициентами 227 определено не только для линейных уравнений, но для любых урав- уравнений с периодическими коэффициентами; в этом более общем случае отображение монодромии обычно называется отображением (или функ- функцией) наследования Пуанкаре, или просто отображением Пуанкаре). Теорема Флоке. Если оператор монодромии диагоналей и ц8 = e2nXs — его собственные числа, то исходное линейное уравнение с периодическими коэффициентами приводится к уравнению с постоян- постоянными коэффициентами У = Ау, где А — диагональный оператор с собственными числами Xs, посредст- посредством линейной 2тг-периодической замены х = B(t)y. Доказательство. Рассмотрим линейный оператор, переводящий начальное условие исходного уравнения при t = 0 в значение решения с этим начальным условием в момент t. Обозначим этот оператор через ^: <Сп —> <Сп. Через /*: <Сп —> Сп обозначим аналогичный оператор для уравне- уравнения у = Ау. Тогда g-0 = /° = Е, g2* = /27Г = М — оператор монодромии (ввиду выбора Л). Положим B(t) = g1^/*). Оператор B(t) определяет искомую замену. ¦ Замечание. Доказательство теоремы Флоке использовало только представление оператора монодромии в виде М = е27гЛ. Поэтому пери- периодической заменой переменных приводится к уравнению с постоянны- постоянными коэффициентами не только комплексное уравнение с диагональным оператором монодромии, но всякое уравнение, для которого оператор монодромии имеет логарифм. Всякий невырожденный комплексный линейный оператор имеет логарифм (в этом легко убедиться, записав матрицу оператора в жор- дановой форме). Следствие 1. Всякое комплексное линейное уравнение с 2тг-пери- 2тг-периодическими коэффициентами приводится к уравнению с постоянными коэффициентами 2тг-периодической линейной заменой переменных. Вещественный линейный оператор не всегда имеет вещественный логарифм, даже если его определитель положителен (определитель опе- оператора монодромии всегда положителен). Действительно, рассмотрим,
228 Глава 5 например, линейный оператор на плоскости с собственными числа- числами (—1, —2). Если этот оператор является экспонентой другого линей- линейного оператора, то собственные числа этого последнего — комплекс- комплексные, но не комплексно сопряженные числа. Поэтому наш оператор на вещественной плоскости не имеет вещественного логарифма. С другой стороны, нетрудно проверить, что квадрат вещественно- вещественного линейного оператора всегда имеет вещественный логарифм. Отсюда вытекает Следствие 2. Всякое вещественное линейное уравнение с 2тг-пери- одическими коэффициентами приводится к уравнению с постоянными коэффициентами 4тг-периодической линейной заменой переменных. Обычно удобнее пользоваться комплексной приводимостью, чем вещественной с удвоенным периодом. Б. Вывод гомологического уравнения. Рассмотрим линейное уравнение с постоянными коэффициента- коэффициентами у = Ау. Сделаем в этом уравнении 2тг-периодическую по времени t нелинейную замену координат x = y + h(y, t), где h — вектор-функция (или формальный ряд по степеням у) с 2тг-пе- риодическими коэффициентами. Лемма. Если h = O(\y\r) (или ряд h начинается с членов степени не ниже г), г ^ 2, то х = Ах + \jrAx - Ah + ^ [д t где многоточием обозначены члены степени выше г относительно х. Доказательство. х = (Е + hy)Ay + ht = {E + hy)A(x - h(x, t)) + ht + ... = = Ax + [hxAx — Ah(x, t) + ht] + ... ¦ Определение. Гомологическим уравнением, связанным с уравне- уравнением с 2тг-периодическими коэффициентами у = Ау, называется урав- уравнение относительно 2тг-периодического по t векторного поля h ht = v,
§ 26. Нормальная форма уравнения с периодическими коэффициентами 229 где v — заданное 2тг-периодическое векторное поле, {LAh)(x, t) = ^Ах - Ah(x, t). Мы будем также рассматривать случай, когда h и v формальные ряды с 2тг-периодическими по t коэффициентами. В. Решение гомологического уравнения. Пусть сперва v и h — ряды Тейлора-Фурье v(r +\ _ V\, mikt w j.\_\^fo rmikt Формальное решение гомологического уравнения дается формулой h m, к, s .-, i л \ л 5 ik + (га, A) — Xs где Xj — собственные числа оператора Л. Условие резонанса: Xs = (га, Л) + ik, тз ^ 0, X^mj ^ 2, —оо ^ А; ^ +оо, 1 ^ s ^ п. Если для данных га, s резонанса нет, то ряд Фурье ^2hm^k,s^lkt и его производная по t сходятся. Поэтому в отсутствие резонансов го- гомологическое уравнение разрешимо в классе однородных многочленов с 2тг-периодическими по t коэффициентами, а значит и в классе фор- формальных степенных рядов с 2тг-периодическими по t коэффициентами. Если же резонанс имеет место, то гомологическое уравнение фор- формально разрешимо в случае, когда ряд Тейлора-Фурье для v не содер- содержит резонансных членов, т. е. когда обращаются в нуль коэффициен- коэффициенты vm^k,s Для тех членов ряда, для которых выполнено условие резо- резонанса Х8 = ik + (га, Л). Г. Формальная нормальная форма. Действуя обычным способом, мы в нерезонансном случае приво- приводим уравнение с 2тг-периодическими формальными коэффициентами к линейному уравнению с постоянными коэффициентами у = Ау по- посредством замены переменной, имеющей вид формального ряда по у с 2тг-периодическими по t коэффициентами.
230 Глава 5 В резонансном случае мы приводим уравнение к виду у = Ay + w(y, t), где w — формальный ряд по степеням у с 2тг-периодическими по t коэффициентами, состоящий из одних лишь резонансных членов (за- (заметим, что резонансные члены любого фиксированного порядка по у содержат лишь конечное число гармоник Фурье, так как условие резо- резонанса \s = (га, Л) + ik однозначно определяет к). Практически используется обычно лишь нормализация членов не- невысокого порядка. Пример. Рассмотрим уравнение с 2тг-периодическими коэффициентами. Предположим, что размерность фазового пространства п равна 2 и что оба собственных числа оператора монодромии комплексны и равны по модулю единице. Линеаризованное комплексифицированное уравнение в подходящей сис- системе координат имеет вид Z = Ш Z (как обычно, уравнение для ~z, как сопряженное с выписанным, опускается). Собственные числа: Ai, 2 = ±га>. Резонансные члены в уравнении для z опре- определяются из условия ik + (mi — ni2 — 1)ш — 0. Если вещественное число ш иррационально, то к — 0, mi = ГП2 + 1. Сле- Следовательно, уравнение приводится к не зависящей от времени формальной нормальной форме i I I2 i I I4 Z — IUJZ + CiZ\z\ + C2Z\Z\ ... Настоящей (не формальной) заменой переменной можно привести урав- уравнение, например, к виду z = iujz + c\z\z\ +... , где Bтг-периодическая) зависимость от t сохранилась лишь в членах 5 поряд- порядка малости по 2, обозначенных многоточием. Заметим, что в этом случае каждый шаг метода Пуанкаре сводится к усреднению по t и argz, и что полученное уравнение инвариантно отно- относительно сдвигов t и поворотов z.
§ 26. Нормальная форма уравнения с периодическими коэффициентами 231 Д. Случай соизмеримости. Предположим теперь, что в предыдущем примере число ш рациональ- Р но, ш = —. В этом случае из уравнения для резонансных членов получаем k = pr, mi = ГП2 + 1 — qr. Для исследования нормальной формы удобно рассмотреть g-листное накры- накрытие вдоль оси времени. Заметим, что интегральные кривые линейной части нашего уравнения образуют слоение Зейферта типа (р, q) (ср. § 21). На про- пространстве g-листного накрытия интегральные кривые образуют тривиальное расслоение, и мы можем ввести координаты прямого произведения. Коор- Координату вдоль слоя мы будем обозначать через t (mod 2тгд). Координата на базе, ?, определяется из условия В этих обозначениях линейная часть нашего уравнения принимает вид ? = 0, а нормальная форма — вид не зависящего t формального ряда где к — I = I mod q. Иными словами, на базе g-листного накрытия получается (формальное) 2тг уравнение, инвариантное относительно вращении на угол ——. Если вместо полного формального приведения ограничиться нормали- нормализацией нескольких первых членов ряда, то мы получим для ? уравнение с 2тгд-периодическим по времени остаточным членом порядка q + 1: В этом случае каждый шаг метода Пуанкаре сводится к усреднению вдоль слоения Зейферта, поэтому полученное уравнение инвариантно отно- относительно сдвигов t и поворотов ? на углы, кратные ——. Исследование получившихся уравнений проведено в гл. 6. Е. Обсуждение сходимости. Область Пуанкаре для уравнения с периодическими коэффициен- коэффициентами х = Ах + . •. определяется условием: все собственные числа ли- линеаризованного уравнения лежат в левой полуплоскости Re Л < 0 (либо все в правой).
232 Глава 5 В этой области 1) резонансные плоскости {Л: \8 = (га, Л) + ik} лежат дискретно; 2) нормальная форма при резонансе содержит лишь конечное число членов; 3) ряды Пуанкаре сходятся. Дополнение к области Пуанкаре образует область Зигеля. В облас- области Зигеля 1) резонансные плоскости образуют всюду плотное множес- множество; 2) нормальные формы могут содержать бесконечное число членов; 3) ряды Пуанкаре могут расходиться. Однако для почти всех (в смысле меры Лебега) наборов собствен- собственных чисел А оператора А голоморфное 2тг-периодическое по t диффе- дифференциальное уравнение х = Ах + ... в окрестности нулевого решения приводится к автономной нормальной форме х = Ах биголоморфным 2тг-периодическим по t преобразованием (теорема Зигеля для случая пе- периодических коэффициентов). Доказательство обычное, см. § 28. ¦ Ж. Окрестность замкнутой фазовой кривой. Рассмотрим автономное дифференциальное уравнение х = v(x), имеющее периодическое решение и, следовательно, замкнутую фазо- фазовую кривую. Все сказанное выше об окрестности нулевого решения уравнения с периодическими коэффициентами непосредственно пере- переносится на этот случай. Действительно, в окрестности замкнутой фазовой кривой можно выбрать координаты так, что поле направлений, заданное векторным полем v, будет полем направлений уравнения с периодическими коэф- коэффициентами, причем размерность фазового пространства уменьшится на единицу (координата, меняющаяся вдоль фазовой кривой, станет называться временем). Замечание. Если фазовое пространство — многообразие, то окрестность замкнутой фазовой кривой может оказаться не диф- феоморфной прямому произведению окружности на трансверсальный диск. Пример. Фазовое пространство — лист Мебиуса, фазовая кри- кривая — его осевая окружность. Вообще, окрестность окружности в многообразии не будет пря- прямым произведением, если и только если многообразие не ориентиру- ориентируемо и окружность — его дезориентирующий путь. В этом случае для
§ 26. Нормальная форма уравнения с периодическими коэффициентами 233 перехода к уравнению с периодическими коэффициентами приходится прибегать к двулистному накрытию исходной окружности. 3. Связь с функциями последования. Теорию нормальных форм уравнений с периодическими коэффициента- коэффициентами можно было бы вывести из теории нормальных форм их отображении последования, т.е. нормальных форм диффеоморфизмов в окрестности не- неподвижной точки. Обратно, изучение диффеоморфизма в окрестности непо- неподвижной точки можно свести к исследованию уравнения с периодическими коэффициентами, для которого этот диффеоморфизм является функцией по- последования. В случае конечной и даже бесконечной вещественной гладкости постро- построение дифференциального уравнения с периодическими коэффициентами по данному отображению последования не представляет больших трудностей. В аналитической или голоморфной ситуации положение более сложно. Этот вопрос эквивалентен вопросу об аналитической (голоморфной) тривиальнос- тривиальности аналитических (голоморфных) расслоений над круговым кольцом, в пред- предположении топологической тривиальности. Хотя в сущности положительный ответ и следует из теории пучков и многообразий Штейна, доказательст- доказательство, насколько мне известно, не опубликовано (я благодарен В. П. Паламодову и Ю. С. Ильяшенко за разъяснения по этому поводу). Мы не будем вдаваться в эту теорию, тем более что все необходимые для изучения дифференциаль- дифференциальных уравнений и диффеоморфизмов результаты можно не выводить одни из других, а получать независимо, используя тот же метод доказательства. И. Случай условно-периодических коэффициентов. Метод Пуанкаре допускает непосредственное обобщение на случай условно-периодических коэффициентов. Речь идет об уравнении х = Ах + v(x, (p), где (р точка г-мерного тора, ш — постоянный вектор, Л: Сп —> Сп — линейный оператор (не зависящий от (р), v — векторное поле, линейная часть которого в точке х = О равна нулю. На компоненты вектора частот ш накладываются обычные условия нормальной несоизмеримости. Условия резонанса имеют в этой ситуа- ситуации вид Xs = i(k, ш) + (га, Л), 1 Включить данное отображение в фазовый поток автономного уравнения, вообще говоря, нельзя (пример — диффеоморфизм окружности с иррациональным числом вращения, дифференцируемо не эквивалентный повороту, см. § 11).
234 Глава 5 где к пробегает решетку целых точек г-мерного пространства, а т удов- удовлетворяет обычным условиям тр ^ 0, ^2тР ^ 2. Функция v предполагается аналитической (голоморфной) по ж и у?, периода 2тг по (р = (<р\,.. .<рг). Доказывается приводимость системы к виду у = Ау, ф = ш аналитической (голоморфной) заменой х = у + h(y, (p), 2тг-периодичес- кой по (р (Э. Г. Белага. О приводимости системы обыкновенных диффе- дифференциальных уравнений в окрестности условно-периодического движе- движения. ДАН СССР, 143, 2 A962), 255-258.) Недостатком этой теории является несовершенство теории линей- линейных уравнений с условно-периодическими коэффициентами: в то вре- время как для уравнений с периодическими коэффициентами постоян- постоянства линейной части можно было добиться подходящим периодичес- периодическим линейным преобразованием координат, для уравнений с условно- периодическими коэффициентами предположение о независимости Л от (р является существенным ограничением. К. Проблема приводимости линейных уравнений с условно-периодическими коэффициентами. Под линейным уравнением с условно-периодическими коэффици- коэффициентами ниже понимается система х = А((р)х, ф = iv, где х G Cn, (p G Тг, ш — вектор с целочисленно независимыми компо- компонентами, А(<р) — линейный оператор в Сп. Таким образом, уравнение задается парой (А, ш), где А есть глад- гладкая функция на торе с операторными (если угодно, матричными) зна- значениями, аш — вектор на торе. Определение. Линейное уравнение с условно-периодическими ко- коэффициентами приводимо, если существует такая (гладкая) оператор- операторная функция на торе В, что замена х = В((р)у превращает исходное уравнение в уравнение с постоянными коэффициентами у = Су. Проблема приводимости состоит в том, приводимо ли линейное уравнение общего положения.
§ 27. Нормальная форма окрестности эллиптической кривой 235 Неизвестно даже, не существует ли в функциональном простран- пространстве аналитических пар (А, ш) области, свободной от приводимых сис- систем. Вопрос о приводимости линейных (и нелинейных) уравнений с условно-периодическими коэффициентами естественно возникает при исследовании окрестности инвариантного тора автономного уравнения, несущего условно-периодические движения. Сам этот тор обычно отыс- отыскивается при помощи последовательных приближений, которые в слу- случаях общего положения, как правило, можно модифицировать так, что- чтобы одновременно как получить инвариантный тор, так и привести к нормальной форме уравнения в вариациях вдоль него, обойдя таким образом нерешенную проблему приводимости (по существу использу- используется приводимость для некоторой «невозмущенной» задачи). § 27. Нормальная форма окрестности эллиптической кривой Теория Пуанкаре нормальных форм дифференциальных уравнении в окрестности особой точки имеет близким аналогом теорию нормальных форм окрестностей эллиптических кривых на комплексных поверхностях. В настоящем параграфе коротко рассматривается эта теория, являющаяся приложением методов теории дифференциальных уравнений к аналитичес- аналитической геометрии и сама имеющая приложения в теории дифференциальных уравнений (см. §36). А. Эллиптические кривые. Эллиптической кривой называется одномерное комплексное многообра- многообразие, гомеоморфное тору. Пример. Рассмотрим плоскость комплексного переменного С и два комплексных числа (ал, а>г), отношение которых невещественно. Отождест- Отождествим каждую точку <р из С с точкой, полученной из нее сдвигами на ил и на а>2, а следовательно, и со всеми точками cp + kiuji -\-k2uj2, где ^и^ — целые чис- числа). После такого отождествления плоскость С превратится в эллиптическую кривую Г = Таким образом, эллиптическую кривую Г можно представить себе как парал- параллелограмм со сторонами (a>i, 0*2), в котором отождествлены соответственные точки на противоположных сторонах.
236 Глава 5 Можно доказать, что конструкцией описанного примера получаются (с точностью до биголоморфной эквивалентности) все эллиптические кри- кривые. Этот факт — отнюдь не очевидная теорема. Рассмотрим, например, полосу 0 ^ Im ср (ги склеим все точки ср, (р+2тг, а также склеим точки краев полосы, отождествляя точку ср с ip+iT+cr+- sinip при вещественных <р. Полученное многообразие биголоморфно отображается на фактор-многообразие C/a>iZ + a^Z, но доказать это нелегко. При г —>¦ О, вероятно, -^ стремится к числу вращения при обычных диофантовых усло- условиях. Числа ш\ и UJ2 называются периодами кривой. Если умножить оба пери- периода на одно и то же комплексное число, то получатся новые периоды, которые задают эллиптическую кривую, биголоморфно эквивалентную исходной. По- Поэтому периоды всегда можно выбрать так, чтобы ш\ = 2тг. В таком случае мы будем обозначать второй период через ш. Всегда можно считать, что Ima; > 0. Разным ш соответствуют, вообще говоря, биголоморфно неэквивалентные эллиптические кривые (точнее, кривые би- биголоморфно неэквивалентны, если соответствующие решетки a>iZ + W2Z не переводятся друг в друга умножением на комплексное число). Задача.1 Докажите, что фазовые кривые одномерного уравнения Ньюто- Ньютона с потенциальной энергией 3 или 4 степени — эллиптические кривые (если их рассматривать в комплексной области). Указание. Роль координаты <р на накрывающей эллиптическую кри- кривую плоскости играет время t движения по фазовой кривой, определенное соотношением dt — -^ (время называется также эллиптическим интегралом первого рода). ЗАДАЧА. Пусть потенциальная энергия — многочлен четвертой степени с двумя минимумами. Докажите, что периоды колебаний (не обязательно малых) с одинаковой полной энергией в обеих ямах совпадают. Указание. Интегралы первого рода вдоль любых двух меридианов тора одинаковы. Задача. Пусть потенциальная энергия — многочлен третьей степени с локальными максимумом и минимумом. Докажите, что период колебаний в яме равен периоду движения из бесконечности в бесконечность по неком- некомпактной фазовой кривой с тем же значением полной энергии. 1 Решение этой и последующих задач основано на элементарных сведениях о топо- топологии римановых поверхностей, имеющихся в любом курсе теории функций комп- комплексного переменного.
§ 27. Нормальная форма окрестности эллиптической кривой 237 ЗАМЕЧАНИЕ. Подбирая потенциальную энергию третьей или четвертой степени, можно получить любую эллиптическую кривую. Поэтому из ре- результатов предыдущих задач следует, что эллиптическая кривая является алгебраическим многообразием. Б. Простейшие расслоения над эллиптической кривой. Простейшей поверхностью, содержащей эллиптическую кривую, являет- является прямое произведение эллиптической кривой на комплексную прямую. По- Подобно тому, как над окружностью кроме прямого произведения окружности на прямую есть нетривиальное расслоение со слоем прямая (лист Мёбиуса), над эллиптической кривой, кроме прямого произведения, существуют другие расслоения со слоем С. Рассмотрим расслоение плоскости двух комплексных переменных на комплексные прямые. Мы будем называть слои этого расслоения вертикаль- вертикальными прямыми. Координаты в С2 мы будем обозначать (г, <р), причем координата г бу- будет считаться вертикальной, а ip горизонтальной. Наше расслоение С2 —> С сопоставляет точке (г, ср) точку <р горизонтальной комплексной прямой. Пусть Г — эллиптическая кривая, накрываемая горизонтальной пря- прямой. Кривая Г получается из горизонтальной оси <р отождествлением точек, различающихся на целые кратные периодов (ш±, и^). Отождествим на плоскости С вертикальные прямые, проекции кото- которых на горизонталь различаются на целые кратные периодов. Такое отож- отождествление превратит С2 в расслоение над эллиптической кривой Г. Но само отождествление вертикальных прямых можно провести разными способами (подобно тому, как при склеивании расслоения над окружностью из прямо- прямоугольника можно получать либо цилиндр, либо лист Мёбиуса, в зависимости от того, как склеиваются вертикальные прямые). Простейший способ склейки состоит в том, что мы отождествляем точ- точку (г, <р) с точками (г, ср + ал) и (г, ср + Ш2)- При этом получается прямое произведение. Следующий по сложности способ склейки включает подкручи- подкручивание склеиваемых вертикальных прямых. Пример. Пусть Л — комплексное число, отличное от нуля, и пусть Г — эллиптическая кривая с периодами Bтг, и). Отождествим на плоскости С с координатами (г, ср) точки (г, ф), (г, </? + 2тг), (Лг, (р + ш). После такого отождествления С2 превращается в гладкую комплексную по- поверхность X, а расслоение С2 —>¦ С, (г, ip) \—> ip, превращается в расслое- расслоение X —>¦ Г, базой которого является эллиптическая кривая Г, а слоем С. Уравнение г = О задает вложение Г в S.
238 Глава 5 Поверхность X можно представить себе следующим образом (в случае вещественного Л). Рассмотрим вещественное трехмерное пространство с го- горизонтальной плоскостью {ср (E С}, расслоенное на вертикальные прямые. Рассмотрим полосу 0 ^ limp ^ Ima;. Склеим вертикальные плоскости, огра- ограничивающие эту полосу, отождествляя точку (г, ф) на вертикальной плос- плоскости Im^ = 0 (г — координата по вертикали) с точкой (Лг, <р + ш) на плос- плоскости Im<р — Ima;. Кроме того, склеим точки, различающиеся лишь на 2тг по координате ip. Получится расслоение над эллиптической кривой, слоем которого является прямая. Чтобы представить себе комплексную поверхность X, остается заменить вещественные вертикальные прямые комплексными. Топологически построенное расслоение является прямым произведени- произведением. Однако с голоморфной точки зрения это расслоение, вообще говоря, не- нетривиально. В. Тривиальные и нетривиальные расслоения. Теорема. Пусть А ф егки}, к (Е Z. Тогда никакая окрестность эллипти- эллиптической кривой Г в описанной выше поверхности S не отображается биголо- морфно на окрестность этой кривой Г в прямом произведении. Доказательство. В прямом произведении кривую Г можно деформировать: для любо- любого е уравнение г = е определяет эллиптическую кривую в прямом произ- произведении. Пусть Fi — эллиптическая кривая в пространстве расслоения S, близкая к кривой Г, являющейся нулевым сечением расслоения (уравне- (уравнение Г имеет вид г = 0). Тогда кривая Fi задается уравнением г = f(<p), где /(^ + 2тг) = f(<p), f(<p + uj) = \f((p). Разлагая / в ряд Фурье / = ? fkeikip, находим Де* ш = АД. Следовательно, Д. = 0 и Fi совпадает с Г. Итак, наша эллиптическая кривая в расслоении с А ф егки} не деформируема. ¦ ЗАДАЧА. Доказать, что при А = егкш расслоение S —>¦ Г является прямым произведением (голоморфно тривиально). ЗАДАЧА. Доказать, что расслоения Si —>¦ Г, S2 —>¦ Г, заданные комп- комплексными числами Ai, A2, биголоморфно эквивалентны если и только ес- если Ai = Агег ш для некоторого целого к. Замечание. Классы биголоморфной эквивалентности расслоений опи- описанного вида над фиксированной эллиптической кривой Г образуют группу (умножение состоит в перемножении чисел А). Из результатов предыдущих задач следует, что эта группа естественно отождествляется с фактор-группой мультипликативной группы комплексных
§ 27. Нормальная форма окрестности эллиптической кривой 239 чисел по подгруппе чисел вида егки!. Фактор-группа С* /{егкш} сама биголо- морфно отображается на исходную эллиптическую кривую. Эта группа назы- называется также группой Пикара или многообразием Якоби кривой Г (эти понятия определяются не только для эллиптических кривых, но для произвольных ал- алгебраических многообразий, и в общей ситуации не совпадают с исходным многообразием). ЗАДАЧА. Рассмотрим расслоение над эллиптической кривой, заданное отождествлениями (г, ip) ~ (Air, ip + ал) ~ (А2г, ip + а>2). Докажите, что это расслоение биголоморфно эквивалентно расслоению с ш\ = 2тг, Ai = 1. Замечание. Можно доказать, что все топологически тривиальные одно- одномерные векторные расслоения над эллиптической кривой биголоморфно эк- эквивалентны описанным выше расслоениям X —>¦ Г. Г. Топологически нетривиальные расслоения над эллиптичес- эллиптической кривой. Топологически все описанные выше расслоения тривиальны (гомеоморф- ны прямому произведению). Инвариантом, позволяющим различать тополо- топологически неэквивалентные расслоения, является индекс самопересечения ну- нулевого сечения. Пусть Mi, M2 — гладкие ориентированные компактные подмногообра- подмногообразия ориентированного вещественного гладкого многообразия М (речь идет о многообразиях без края). Предположим, что размерность многообразия М равна сумме размерностей многообразий Mi и Mi. Предположим, что Mi и М2 пересекаются трансверсально (т. е. в каждой точке пересечения каса- касательное пространство к первому и второму подмногообразиям в сумме дают касательное пространство к объемлющему многообразию М). Индексом пересечения М± и Мг в М называется число точек пересе- пересечения с учетом ориентации (точка пересечения считается со знаком плюс, если положительно ориентирующий Mi репер вместе со следующим за ним положительно ориентирующим Мг репером определяют репер, положительно ориентирующий М). Пусть Mi — ориентированное гладкое компактное подмногообразие по- половинной размерности в М. Индекс самопересечения М± в М определяется как индекс пересечения Mi с многообразием Мг, полученным из Mi малой деформацией и пересекающим Mi трансверсально. Например, индекс само- самопересечения меридиана тора равен нулю, так как соседние меридианы не пересекаются.
240 Глава 5 Можно доказать, что индекс самопересечения Mi в М не зависит от выбора многообразия Мг, лишь бы оно получалось из М± малой деформацией. ЗАДАЧА. Найти индекс самопересечения сферы S2 в пространстве ее ка- касательного расслоения. ОТВЕТ. +2. Вообще, индекс самопересечения многообразия в своем ка- касательном расслоении равен эйлеровой характеристике многообразия. Рассмотрим теперь одномерное векторное расслоение ? —>• Г над эллип- эллиптической кривой, полученное из расслоения С2 —>¦ С склейкой вертикальных прямых (вертикальная координата обозначена через г) по правилу (г, ф) ~ (г, ср + 2тг) ~ (Ae*PVr, ср + ш), где р — целое число, Л — комплексное число, отличное от нуля. ЗАДАЧА. Найти индекс самопересечения нулевого сечения (г = 0) в про- пространстве полученного расслоения, считая, что ? ориентирована как комп- комплексное многообразие (ориентации комплексных многообразий определяются так, что индекс пересечения комплексных плоскостей всегда положителен: пространство с комплексными координатами (zi,... zn) ориентируется коор- координатами (Re2i, Imzi,..., KeZn, lmzn)- Ответ, —p, если Ima; > 0. Замечание. Полученными расслоениями исчерпываются, с точностью до биголоморфной эквивалентности, все одномерные векторные расслоения над эллиптической кривой. Д. Окрестность эллиптической кривой на комплексной поверх- поверхности. Рассмотрим эллиптическую кривую на комплексной поверхности. Окре- Окрестность кривой на поверхности определяет одномерное векторное расслоение над этой кривой — ее нормальное расслоение. Слоем нормального расслое- расслоения в точке кривой является фактор-пространство касательного пространст- пространства к поверхности в этой точке по подпространству, касательному к кривой. Пространство нормального расслоения само является комплексной по- поверхностью. Исходная эллиптическая кривая вложена в эту поверхность (как нулевое сечение расслоения). Возникает вопрос, будет ли достаточно малая окрестность кривой на исходной поверхности биголоморфно отображаться на ее окрестность в нор- нормальном расслоении. Оказывается, этот вопрос весьма близок к вопросу о приводимости дифференциального уравнения (или гладкого отображения) в окрестности неподвижной точки к линейной нормальной форме и решается теми же методами.
§ 27. Нормальная форма окрестности эллиптической кривой 241 Покажем прежде всего, что окрестность эллиптической кривой на по- поверхности может вообще не расслаиваться голоморфно над этой кривой. Пример. Рассмотрим семейство эллиптических кривых, такое, что со- соседние кривые семейства биголоморфно не эквивалентны друг другу. Та- Такое семейство можно получить, например, отождествляя на плоскости двух комплексных переменных (ip, ю) точки (ip, ю), (ip + 2тг, ю), (ip + ю, ю). Об- Область Imu; > 0 превращается после отождествлений в объединение эллипти- эллиптических кривых w = const. Никакая окрестность ни одной из этих кривых не отображается голоморфно на эту кривую так, чтобы сама кривая оставалась на месте. Действительно, если бы такое отображение было возможным, мы по- получили бы близкое к тождеству биголоморфное отображение эллиптических кривых с близкими разными и; друг на друга, что невозможно. Оказывается, рассмотренный пример является в некотором смысле ис- исключительным: окрестность эллиптической кривой, вложенной в комплекс- комплексную поверхность с нулевым индексом самопересечения, вообще говоря, биго- биголоморфно эквивалентна окрестности кривой в нормальном расслоении (в том же смысле, в котором дифференциальное уравнение в окрестности особой точки, вообще говоря, эквивалентно линейному). Исключительность рас- рассмотренного примера связана с тем, что нормальное расслоение каждой из эллиптических кривых в построенном семействе тривиально (является пря- прямым произведением). Б. Предварительная нормальная форма. Эллиптическую кривую можно получить из кругового кольца голоморф- голоморфным склеиванием граничных окружностей. Точно так же окрестность эллип- эллиптической кривой на поверхности можно получить из окрестности кругово- кругового кольца на поверхности голоморфной склейкой граничных многообразий. Эти граничные многообразия имеют вещественную размерность три; склей- склейка продолжается голоморфно на окрестность границы. Оказывается, достаточно малая окрестность биголоморфного образа за- замкнутого кругового кольца на комплексной поверхности всегда биголоморф- биголоморфно отображается на окрестность кругового кольца, вложенного в комплекс- комплексную прямую С в прямом произведении С х С. Подобно упомянутым выше результатам о голоморфной классификации одномерных векторных расслоений над эллиптической кривой, сформулиро- сформулированный выше результат об окрестности кольца доказывается непросто: тре- требуется некоторая техника теории функций нескольких комплексных пере- переменных (пучки, эллиптические уравнения с частными производными или что-нибудь их заменяющее). 16 В. И. Арнольд
242 Глава 5 Мы не будем доказывать это, а прямо предположим, что наша поверх- поверхность, содержащая эллиптическую кривую, получается склейкой из окрест- окрестности кругового кольца в прямом произведении. Таким образом, мы рассматриваем поверхность, точки которой получа- получаются из точек (г, ф) плоскости двух комплексных переменных склейками г\ ( г \ I rA(r, ф) ip) \(р + 2тг! \ip + u) + rB(r,ip) где 2тг-периодические по (р функции А и В голоморфны в окрестности ве- вещественной оси ip. Здесь круговое кольцо получается из полосы 0 ^ \гшр ^ Imu; на комп- комплексной оси ip при склейке точек @, ф) ~ @, ip + 2тг); г и (р — координаты в прямом произведении. Пара функций (А, В), задающих склейку, определяет окрестность. Под- Подходящим выбором координат (г, ip) можно изменять вид функций А и В. Постараемся выбрать эти координаты так, чтобы сделать функции А и В возможно проще. Рассмотрим вначале линейную замену координат гНОвое = С{ф)г, где функция С голоморфна в полосе 0 ^ \пар ^ Imu; оси ip, имеет период 2тг и нигде не обращается в этой полосе в нуль. Теорема. Функцию С, определяющую линейную замену вертикальной координаты, можно выбрать так, что при записи склейки в новых коорди- координатах функция А@, ф) примет вид Xeipip (р — целое число, равное минус индексу самопересечения эллиптической кривой г = О в рассматриваемой по- поверхности). Доказательство. Функция А@, ф) определяет нормальное расслоение кривой г — 0 в на- нашей поверхности. Это расслоение биголоморфно эквивалентно расслоению, получаемому склейкой (г, ip) ~ (г, ip + 2тг) ~ (\eipvr, ip + u) (см. замечание в пункте Д). Линейная замена переменной г, приводящая склейку нормального расслоения к этому каноническому виду, приводит к указанному выше виду функцию А@, ф). ¦ Определение. Предварительной нормальной формой окрестности эл- эллиптической кривой на поверхности, где кривая имеет нулевой индекс са- самопересечения, называется склейка rA(l + ra(r, ip)) \ I r ip + и; + rb(r, (р) I \ (р + 2тг
§ 27. Нормальная форма окрестности эллиптической кривой 243 где а и Ь — голоморфные в окрестности вещественной оси ц> 2тг-периодичес- кие по ip функции, Л — отличное от нуля комплексное число. В дальнейшем мы не будем каждый раз указывать отождествления то- точек, отличающихся лишь на 2тг по координате (р, имея в виду, что встречаю- встречающиеся функции по ip 2тг-периодичны и координату <р можно считать принад- принадлежащей цилиндру С mod 2тг. Ж. Формальная нормальная форма. Определение. Пара чисел (Л, о;) называется резонансной, если Xn=elkw при некоторых целых п и fc, не равных вместе нулю. Теорема. Резонансные пары образуют всюду плотное множество в про- пространстве всех пар комплексных чисел. Доказательство. Это следует из всюду плотности множества точек вида г ( —ш + ^ (кит целые, п натуральные) на комплексной прямой. Теорема. Пара (А, ш) резонансная если и только если соответствую- соответствующее склейке (г, ф) ~ (г, <^ + 2тг) ~ (Лг, ip + us) расслоение тривиально над неко- некоторым циклическим п-листным накрытием исходной эллиптической кривой. Доказательство. Если Лп = elkip, то (г, ф) ~ (егкшг,(р + пш) и, следовательно, расслоение над C/2ttZ + пи)Ъ тривиально (см. пункт В). Обратное доказывается анало- аналогично. ¦ Определение. Формальной склейкой называется «отображение» г\_( гА(г, ф) где А и В — формальные степенные ряды по г с аналитическими на вещест- вещественной оси (р 2тг-периодическими по <р коэффициентами, А@, ф) ф 0. Формальной заменой переменных называется «отображение» гС(г, ф) <pj \<р + rD(r, <p)J ' где С и D — формальные степенные ряды по г с аналитическими в полосе 0 ^ lvcup ^ Imu; комплексной оси ip 2тг-периодическими по <р коэффициента- коэффициентами, С@, ф) ф 0.
244 Глава 5 Формальная замена переменных g действует на формальную склейку / по формуле / i—у g о / о g~x (правая часть определяется естественной под- подстановкой степенных рядов и сама является формальной склейкой). Теорема. Если пара (А, ю) нерезонансная, то всякая формальная склейка гАA + га(г, ( (р + ш + rb(r, формальной заменой переменных приводится к линейной нормальной форме Лг Доказательство. Будем последовательно уничтожать члены степени 1, 2, ... по г в га и гЬ. Для этого нам потребуется, как обычно, решать линейное гомологическое уравнение. Выпишем уравнение для нормализации членов степени п. Лемма. Рассмотрим уравнение относительно и где v — 2тг-периодическая функция, аналитическая в полосе а ^ 1икр ^ /3. Если т — Imu; > О, А ф О и Хп ф егкш при целых к, то уравнение имеет 2тг-периодическое решение и, аналитическое в полосе а ^ limp ^ /3 + т. Доказательство. Пусть Тогда ик = ^ . При к —>¦ +схэ \vh\ оценивается сверху величиной порядка ек^а~?\ а егкш стремится к нулю. Поэтому \ик\ оценивается сверху величиной по- порядка ек{а-?\ При к —>• — оо \vk\ оценивается сверху величиной порядка a |e*feaI| растет как e'fe'T (т = Imu; > 0). Следовательно, \ик\ оценивается свер- сверху величиной e~lfel^+T+?). Отсюда вытекает сходимость ряда Фурье для и в окрестности полосы а ^ Im^ ^ /3 + т. ¦ Пусть га = rnan(ip) + ..., rb = rnbn(ip) + ..., где точки означают члены порядка выше п.
§ 27. Нормальная форма окрестности эллиптической кривой 245 Сделаем формальную замену переменных, в которой C(r, ip) = l+rnCn(ip), rD(r,ip) — rnDn((p). Непосредственной подстановкой убеждаемся, что коэф- коэффициенты при гп в га и в rb после замены имеют вид ап((р) = ап((р) + ХпСп((р + ш) - Сп((р), Ъп(<р) = Ьп(<р) + XnDn{ip + ш)- Dn(<p). Найдем Сп и Dn из уравнений ап = 0, Ьп = 0. По лемме эти уравнения имеют аналитические в полосе 0 ^ lvmp ^ т решения. Мы построили формальную замену, после которой степень членов низшего порядка в га, rb увеличивает- увеличивается. Повторяя это построение при п = 1, 2,..., получаем формальную замену переменных, после которой га и rb исчезают полностью. ¦ 3. Аналитическая нормальная форма. Определение. Пара комплексных чисел (Л, ш), где Imu; ф 0, Л ф 0, называется нормальной, если существуют постоянные С > 0, v > 0, такие, что |А е - 1| > C7(|n| + |fc|) для всех целых к и п (п ф 0). Легко доказывается Теорема. Ненормальные пары образуют всюду плотное множество ле- лебеговой меры 0 при каждом фиксированном ш. Теорема. Если (А, ю) — нормальная пара, то всякая голоморфная склейка гАA + га(г, ур + и> + rb(r, приводится к линейной нормальной форме (г, ip) \—У (гA, ip + ю) голоморфной заменой переменных. Доказательство аналогично приведенному в § 28 доказательству теоре- теоремы Зигеля. ¦ Переведем эту теорему на язык вложений эллиптических кривых. Определение. Голоморфное векторное расслоение ? называется жест- жестким, если для всякого вложения его базы в комплексное многообразие, такого, что нормальное расслоение есть ?, достаточно малая окрестность базы, вло- вложенной в многообразие, биголоморфно отображается на окрестность нулевого сечения расслоения ?. В этих терминах наша теорема формулируется так.
246 Глава 5 Следствие. Почти все (е смысле меры Лебега) одномерные векторные расслоения степени О над эллиптической кривой жесткие. Замечание. Для некоторых нерезонансных расслоений, в которых па- пары (Л, о;) ненормальные, формальные ряды, приводящие склейку к нормаль- нормальной форме, могут расходиться. Такие ненормальные пары (Л, ю) образуют всюду плотное множество меры нуль. Этот вопрос обсуждается подробнее в §36. И. Отрицательные окрестности. Рассмотрим случай, когда индекс самопересечения эллиптической кри- кривой на поверхности отличен от нуля. Если этот индекс отрицателен, то кривая недеформируема в классе голоморфных кривых. Действительно, в противном случае продеформированная кривая пересекалась бы с исходной с положи- положительным индексом пересечения (так как обе кривые комплексные). Таким образом, кривая с отрицательным индексом самопересечения ле- лежит на поверхности изолированно. Такая кривая называется исключительной кривой, а ее окрестность — отрицательной окрестностью. Теорема (Грауерта). Нормальное расслоение исключительной кривой всегда жесткое, т. е., окрестность кривой с отрицательным индексом са- самопересечения на комплексной поверхности определяется (с точностью до голоморфной эквивалентности) нормальным расслоением этой кривой. Наметим здесь простое доказательство этой теоремы для случая эллип- эллиптической кривой. Доказательство. Мы начинаем с предварительной нормальной формы склейки ypj у ip + uj + rb(r, ip) Предположим, что члены степени меньше п по г в га и в гЬ уже убиты, т. е. что га — rnan(ip) + ..., гЪ — rnbn(ip) + .... Делаем формальную замену переменных g(r, <р) = (гA + гпСп((р)), <р + rnDn((p)). Коэффициенты при гп в га и в гЪ после замены (т.е. для склейки go f о g~x) имеют вид - Сп(<р) - ipDn(<p), Ьп(<р) = Ъп(ф) + \neipn*Dn(ip + u>)- Dn(<p). Обратим Ьп и ап в нуль. С этой целью мы сперва находим Dn из вто- второго уравнения, а затем Сп из первого. В обоих случаях приходится решать гомологическое уравнение вида \neipnvu(<p + ш)- и(<р) = v(<p)
§ 27. Нормальная форма окрестности эллиптической кривой 247 относительно неизвестной 2тг-периодической функции и с известной 2тг-пе- риодической функцией v. К. Исследование гомологического уравнения. Рассмотрим разложения неизвестной и известной функций в ряды Фурье Uke , v — 2_^vke • Для коэффициентов Фурье получаются уравнения Лп i(k — pn)<xi Эти уравнения позволяют в принципе последовательно вычислить все неизвестные коэффициенты ии по первым рп из них. Однако получаемые формальные ряды Фурье не всегда сходятся. Оказывается, отрицательность индекса самопересечения исходной эллиптической кривой на поверхности (т. е. положительность числа р) гарантирует сходимость. Действительно, рассмотрим вначале однородное уравнение, т. е. будем считать, что все vu равны нулю. Наше уравнение связывает между собой значения ии с к на арифмети- арифметической прогрессии с шагом рп. Вычислим все значения ик с к из этой про- прогрессии через одно из них. Нам придется последовательно умножать числа вида \пег(к-Рп)и;^ где ? принадлежит нашей прогрессии. Логарифмы этих чи- чисел образуют арифметическую прогрессию с разностью ipnui. Следовательно, суммы логарифмов образуют последовательность вида где s — номер члена последовательности, 2а — ipnu). Если р > 0, Imu; > 0, то Re a < 0. В этом случае последователь- последовательность \еаз +/3-s+7| быстро стремится к нулю при s —>¦ +оо и при s —>¦ — оо. Отсюда следует, что однородное гомологическое уравнение при р > 0 име- имеет рп линейно независимых решений, быстро убывающих при \к\ —>• оо. Будем теперь решать неоднородное уравнение. Вначале предположим, что отличен от 0 только один из коэффициентов Фурье известной функ- функции, vm- Левее т мы положим ии — 0, а при к ^ т определим ии из урав- уравнения. Таким образом, правее т ии будет совпадать с одним из решений 2 однородного уравнения и, следовательно, будет убывать как \eas \. Решение однородного уравнения в общем случае строится как линейная комбинация построенных решений с коэффициентами vu- Сходимость обеспе- обеспечивается условием Rect < 0, т. е. отрицательностью индекса самопересечения исходной эллиптической кривой на поверхности.
248 Глава 5 Проводя подробно намеченные здесь оценки, мы убеждаемся в разреши- разрешимости гомологического уравнения для случая отрицательного индекса само- самопересечения (т.е. для случая положительных р). Тем самым доказывается формальная жесткость отрицательного нормального, расслоения эллиптичес- эллиптической кривой на поверхности. Более внимательный анализ нашего построения доказывает и аналитическую жесткость (т. е. теорему Грауерта): доказатель- доказательство сходимости здесь настолько же проще, чем в случае р — О, исследован- исследованном в пп. Ж, 3, насколько теорема Пуанкаре проще теоремы Зигеля (§ 28). ¦ Л. Положительные окрестности. Предположим, что индекс самопересечения эллиптической кривой на по- поверхности положителен. В этом случае гомологическое уравнение, изучен- изученное в предыдущем пункте, вообще говоря, неразрешимо, так как \eas +/3-s+7| растет при \s\ —>• оо. Это значит, что окрестность эллиптической кривой с положительным индексом самопересечения на общей комплексной поверх- поверхности не только не отображается биголоморфно на окрестность этой кривой в нормальном расслоении, но такое отображение невозможно уже на уровне 2-струй (т. е. с пренебрежением членами 3-го порядка по отношению к рас- расстоянию от кривой). Окрестность эллиптической кривой с положительным индексом самопересечения называется положительной. Положительная окрестность эллиптической кривой, согласно сказанно- сказанному выше, должна иметь модули, и более того, функциональные модули: «нор- «нормальная форма» окрестности должна содержать произвольные функции (и да- даже, по-видимому, функции двух переменных или ростки функций двух пе- переменных в нескольких точках). В то время как кривая с отрицательным индексом самопересечения ле- лежит на поверхности изолировано, эллиптическую кривую с положительным индексом самопересечения всегда можно деформировать. Теорема (частный случай теоремы Римана —Роха). Если индекс самопересечения эллиптической кривой на поверхности равен р, то нормаль- нормальное расслоение имеет р линейно независимых сечений. Доказательство. Вопрос сводится к однородному гомологическому уравнению вида имеющему, как мы видели в пункте К, р линейно независимых решений. ¦ Переходя к членам высшего порядка относительно расстоянию до эл- эллиптической кривой, можно убедиться, что существует р-параметрическая деформация кривой в ее окрестности.
§ 27. Нормальная форма окрестности эллиптической кривой 249 Отсюда следует, между прочим, что окрестность эллиптической кривой на поверхности, где кривая имеет положительный индекс самопересечения, как правило, не допускает структуры расслоения над этой кривой. Действи- Действительно, комплексная структура эллиптической кривой при деформации, во- вообще говоря, меняется. Поэтому среди близких продеформированных кривых будут встречаться, в общем случае, кривые, не допускающие биголоморфного отображения на исходную кривую. При изучении прохождения дифференциальных уравнений через резо- резонанс встречаются лишь окрестности эллиптических кривых на таких по- поверхностях, где они имеют индекс самопересечения нуль. М. Эллиптическая кривая в пространстве. Многое из того, что сказано выше об окрестности эллиптической кривой на поверхности, переносится на случай эллиптической кривой в многомер- многомерном пространстве. Для этого в приведенных выше формулах следует считать переменную г многомерной. Векторные расслоения произвольной размерности над эллиптической кривой описываются склейками (г, <р) ~ (г, <р + 2тг) ~ (Л(^)г, <р + о;), где Л (у?) — линейный оператор в жордановой нормальной форме с собственными числами вида Хегр(р. Расслоение называется отрицательным (неположительным, нулевым), если все числа р положительные (неотрицательные, нулевые). Предположим, что нормальное расслоение эллиптической кривой отри- отрицательно. Тогда окрестность кривой в многообразии биголоморфно отобра- отображается на ее окрестность в нормальном расслоении (теорема Грауерта), т. е. нормальное расслоение жестко. В классе нулевых нормальных рассло- расслоений жесткость нарушается лишь с вероятностью ноль. Условие резонанса имеет вид Xs = XnetkL0, где к целое число, Ап = А ... A^m, m = dim{r}, rij ^ 0, ^2rij ^ 2. Нерезонансное расслоение формально-жесткое. Для настоящей голо- голоморфной жесткости достаточно обычного неравенства (С, г>-)-нормальности: |А е - As| ^ С(\п\ + \к\) , \п =ni + ... + пт, для всех п ^ 0, ^2 rii ^ 2 и целых к. Мера множества векторов А, которые ни при каких (С, ь>) > 0 не (С, г>-)-нормальны, равна нулю. Жесткость с вероятностью 1 имеет (по-видимому) место также и для неположительных расслоений. Вопрос о строении окрестностей кривых рода больше единицы изучен весьма мало, исключая случай, когда нормальное расслоение отрицательно и, следовательно, жесткое по теореме Грауерта.
250 Глава 5 § 28. Доказательство теоремы Зигеля В этом параграфе доказывается теорема о голоморфной локальной экви- эквивалентности отображения и его линейной части в неподвижной точке. А. Формулировка теоремы. Определение. Набор (Ai,...An) 6 Сп имеет мультипликативный тип (С, f), если \Xa-Xk\^C\k\-v (\k\ = ki+... + kn, Xk =Xk11 ...Xknn) для любого s и для любого целочисленного вектора к с неотрицательными компонентами по модулю большего единицы (С > 0, v > 0). Теорема. Предположим, что набор собственных чисел линейной части голоморфного отображения в окрестности неподвижной точки О в Сп имеет мультипликативный тип (С, v). Тогда в некоторой окрестности точки О отображение биголоморфно эквивалентно своей линейной части. Пусть А — заданное в окрестности точки О 6 Сп биголоморфное ото- отображение, оставляющее О на месте, и пусть линейный оператор Л — ли- линейная часть А в О. Утверждается, что существует оставляющий О на мес- месте биголоморфный в окрестности точки О диффеоморфизм Н, такой, что Н о Ао Н~г = Л в некоторой окрестности точки О. Мы будем доказывать эту теорему в случае, когда все собственные чис- числа As оператора Л различны. В этом случае можно выбрать систему коорди- координат так, чтобы матрица оператора Л была диагональной. Зафиксируем такую систему координат. Б. Построение замены координат Н. Запишем данное отображение А и замену Н в виде A(z) = Az + a(z), H(z) = z + h(z), где ряды Тейлора а и h в нуле не содержат членов степени 0 и 1. Запишем отображение Н о Ао Н~г , вычисляя члены нулевой и первой степеней отно- относительно h и а. Мы получаем (НоАо Я)^) = Az + [a(z) - Ah(z) + h(Az)] + Д([о], [h])(z), где остаточный член R имеет относительно а и h второй порядок малости в смысле, который будет точно определен далее. Мы заключили аргументы у R в квадратные скобки, чтобы подчеркнуть, что этот оператор действует на функции, а не на их значения в точке z.
§28. Доказательство теоремы Зигеля 251 Рассмотрим гомологическое уравнение относительно h Kh(z) — h(Kz) = a(z). Здесь ряды Тейлора известной вектор-функции а и неизвестной h не имеют свободных и линейных членов. В классе таких рядов уравнение одно- однозначно разрешимо, так как набор собственных чисел нерезонансный. Мы докажем в п. В, что полученные ряды сходятся, если набор собст- собственных чисел имеет мультипликативный тип (С, v) при каких-нибудь поло- положительных С и f. Обозначим через U оператор, переводящий правую часть а гомологического уравнения в его решение h = С/([а]). Определим по индукции функции as, hs формулами h3 — U([a3]), as+i — R([a3], [h3]), начиная с ao — a. Построим отображения Ho, Hi,..., определенные формулами Hs{z) = z + hs(z). Искомая замена координат дается, как мы докажем, формулой Н — lim Hs о ... о Hi о Но. а-ЮО В. Исследование гомологического уравнения. Мы предполагаем, что ряды Тейлора правой части и решения гомологи- гомологического уравнения kh{z) - h(Az) = a(z) не имеют свободных и линейных членов. Через \z\ мы будем обозна- обозначать max \zj\. Лемма 1. Пусть набор собственных чисел диагонального линейного опе- оператора А. имеет мультипликативный тип (С, v). Предположим, что правая часть а гомологического уравнения непрерывна в полицилиндре \zj\ ^ r и го- голоморфна внутри этого полицилиндра. Тогда гомологическое уравнение имеет решение h, голоморфное внутри полицилиндра, причем для любого S, такого, что 0 < S < -, выполняется неравенство \и( м ^ И^I max \h(z)\ ^ max где положительная постоянная а = е*(Л) не зависит ни от д, ни от а, ни от г.
252 Глава 5 Доказательство. Разложим а и h в ряды Тейлора и обозначим коэффициенты при zkes через а% и h% соответственно. Тогда h% = a%/(Xs — Хк). Оценим числители при помощи неравенств Коши для коэффициентов Тейлора, а знаменатели — исходя из того, что {Xs} типа (С, ь>). Обозначим max|a(z)| через М. Согласно неравенству Коши, \а%\ ^ ——. \k\v Следовательно, \h3k\ ^ МС~Х —г-. Оценим сумму Тейлора ^2hf,zk. Рассмотрим члены степени |fc| = р. Их число не превосходит ci(n)pn~1, поэтому Х)ци= h%zk\ где С2 = -?7 w т = ь> + п — 1. Функция хте~х имеет максимум ( —-) , поэтому рте \ е / / п ( -4г V сз = ( -4г^ I • Следовательно, при |г| ^ ге~5 имеем \h\ ^ Мс^8 V / , \h\ ^ Mc^S (-m+i-), где С4 = 4с2Сз не зависит от а, г, д. Ш е" — е"'~ В дальнейшем нам потребуется кроме оценки функции h еще оценка функции h о Л, определяемой условием (h о Л)(z) — h(A.z). Лемма 2. В условиях леммы 1 | ^ max , где положительная постоянная «о = «о(А) не зависит от 5, а, г. Доказательство. Начнем со следующего замечания. Пусть {А} имеет мультипликативный тип (С, г^). Тогда существует такая не зависящая от к постоянная Со, что для всех s = 1,... ,п и для всех целочисленных векторов к с неотрицатель- неотрицательными компонентами, сумма которых \к\ не меньше 2. Доказательство. Обозначим max|As| через ц. При |Afe| ^ 1ц можно взять Со = iz-- При |Afe| > 2fj, можно взять Со = тт- ¦
§28. Доказательство теоремы Зигеля 253 Оценивая ряд Тейлора, получаем на основании доказанного предложения Xkzk Дальнейшие оценки — как в доказательстве леммы 1. ¦ Г. Порядок операторов. Для проведения дальнейших оценок удобно ввести следующие обозначе- обозначения. Пусть / — функция, непрерывная в полицилиндре \z\ ^ г, голоморфная во внутренних точках и обращающаяся в нуль в центре полицилиндра. Мы введем для таких функций норму и/и ||/||Р = sup Пример. Функция f(z) = ez имеет норму |е| независимо от радиуса по- полицилиндра. Замечание. Удобство введенной нормы состоит в ее инвариантности относительно изменений масштаба: для всякого коэффициента растяжения х Значения функции / могут быть не числами, а элементами нормирован- нормированного пространства, например, векторами, матрицами и т. д. Пусть Ф — оператор, действующий на функции описанного выше клас- класса1. Пусть d, а, /3 — положительные числа, и пусть 0 < г < 1. Определение. Оператор Ф имеет порядок (d; а \ C), если для любого S из интервала @,-1 и для любого г из @, 1) как только ||/||г ^ S^. Мы будем записывать это соотношение в виде Ф([/]) -< fd(oi \ C), или, короче, Ф([/]) -< fd. Оператор имеет порядок d, если существуют постоянные а и C такие, что он имеет порядок (d; а \ C) (существенно, что а и /3 не зависят от /, от г (Е @, 1) и от S (Е (».§))• xMbi будем обозначать одной буквой операторы, действующие на функции из классов с разными г, при условии, что они совпадают как операторы на пространстве ростков функций, подобно тому, как в обычном анализе не меняют обозначения синуса, меняя область определения.
254 Глава 5 Пример 1. Рассмотрим оператор, переводящий правую часть а гомо- гомологического уравнения в его решение h. Этот оператор имеет порядок 1, если {Xs} типа (С, v). Действительно, нужное неравенство доставляется лем- леммой 1. Точно так же из леммы 2 следует, что оператор, переводящий правую часть а гомологического уравнения в функцию ho А, имеет порядок 1 : h -< a, h о Л -< а. Пример 2. Рассмотрим локальный диффеоморфизм Н, H{z) = z-\- h(z). Обратный диффеоморфизм запишем в виде H~1(z) — z — g(z). Рассмотрим оператор G, переводящий h в g. Оператор G имеет порядок 1, т. е. g -< h. Доказательство. Заметим прежде всего, что из оценки Коши вытекает следующее нера- неравенство: при \z\ ^ re~s^2 dhj dZj Если \\h\\r ^ 8^ и /3 достаточно велико, то правая часть последнего не- неравенства сколь угодно мала. Теперь g строится как предел итераций: ga+i(z) = h(z-gs(z)), go = 0. Сходимость при \z\ ^ re~ и оценка g -< h легко следуют теперь из теорем о сжатых отображениях. ¦ Пример 3. В обозначениях примера 2 Доказательство. Действительно, по определению функции g, h{z)-g{z) = h{z)-h{z-g{z)). Пользуясь неравенством A) и полученной выше оценкой \g\\re-S ^ IN|r5~a, получаем при \z\ ^ re~s \h(z) - g(z)\ ^ C\\h\\r{l - e-S/2)-\\\h\\r8-a.
§ 28. Доказательство теоремы Зигеля 255 Заметим, что в наших обозначениях 2/^/, /2^/; если /i-</2 и /г-</з, то Д -< /3. Распространим введенные выше обозначения на операторы от несколь- нескольких функций. Пусть оператор Н переводит пару функций г/, ? в функцию ?. Пусть у? — многочлен. Мы будем писать С -< pin, С), если существуют такие положительные постоянные (а; /3±, /Зг), что для лю- любого 8 из интервала I 0, ^ I и для любого г из @, 1) выполняется неравенство V 1) как только \\т)\\г ^ S^1, \\C\\r ^ <^2- Здесь постоянные а и C не должны зави- зависеть от г/, С, от г G @, 1) и 5 G ( 0, 7j ) • Если г] -< ф((т, т), то ? -< ф(ф((т, т), ?)• Пример 4. Определим оператор Н формулой Тогда ? -< г/С- Доказательство. Доказывается с помощью того же неравенства A), которое мы исполь- использовали в примерах 2 и 3 выше. ¦ Д. Оценка остаточного члена. Выпишем явно остаточный член R, определенный в п. Б. Мы будем поль- пользоваться обозначениями H(z) = z + h(z), H-\z) = z - g{z). По определению R(z) = (Я о А о Я)^) - Kz- [a(z) - Ah(z) + h(Az)]. Представим R в виде R — Ri + R2 + -R3, где Ri(z) = A(h(z) - g(z)), R2(z) = a(z - g(z)) - a(z). Rs(z) = h(Kz - Kg(z) + a(z - g{z))) - h(Az). Для удобства дальнейших оценок представим R в виде оператора от трех аргументов a, h и и = h о Л.
256 Глава 5 Введем операторы G, G([h]) = g, S, Н([а], \g])(z) = a(z - g{z)) - a(z). В этих обозначениях где «(г) = #(z) - Л^ - ^(г)). При подстановке и = /г о А оператор R± + R2 + -R3 превращается в ин- интересующий нас остаточный член Д([а], [h]). Пусть h -К id (id = тождество; условие означает, что производная h мала). Оценка 1. Имеют место оценки Ri([h]) -< h2, R2([a], [h]) -< ah, R3([u], [a], [h]) -< u(h + a). Доказательство. Оценка R± -< h2 доказана в примере 3 п. Г, неравенство H([a], [g]) -< ag — в примере 4. Согласно примеру 2, G([R\) -< h, поэтому ife([a], [h]) -< ah. Для введенной выше величины v из уже полученных оценок g -< h по- получаем v -< h + а. Следовательно, согласно оценке оператора Н из примера 4, получаем R3 -< u{h + a). ¦ Оценка 2. Пусть U — оператор, решающий гомологическое уравнение. Тогда оператор Ф, заданный формулой Ф([а]) = Д([а], С/([а])), имеет поря- порядок 2. Доказательство. По леммам 1, 2 и 3 п. В имеем h -< a, h о А. -< а, где h — U([a\). Сопоставляя это с оценкой 1, получаем )^a2, Д2([о], U([a]))~<a2, Л3(С/([а])оЛ, [о], U([a]))~<a2. ¦ Е. Сходимость приближений. Окончание доказательства теоремы Зигеля в точности такое же, как оценки § 12.
§28. Доказательство теоремы Зигеля 257 Доказательство. Мы выбираем последовательности чисел So, Si = So , S2 = Si , ... Mo = С Mi = м03/2, ..., мв= m*L\ = С ¦ • •; ro, r\ = e~ °ro, гг = е~ Vi, ... Эти последовательности определяются выбором So, N и го. Число 5о выбирается столь малым, чтобы все rs были больше -?-. Опишем выбор числа N. Согласно оценке 2, существуют постоянные а и C такие, что ||ВД, U([a]))\\re-s ^ \\а\\18~а, как только ||a||r ^ 8^. Определим as+i = R([as], U([as])). Предположим, что ||as||ra ^ Ms = 8™. Тогда при N > /3 применимо предыдущее неравенство с 8 = Ss, и мы полу- получаем | fts + l||rs + i ^ MS6 = Os Если N > 2а, то правая часть не превосходит Ms+i — 8gN'2. Поэтому мы фиксируем N > (/3, 2а). Тогда, если ||ао||го ^ Мо = 8$, то при всех s бу- будет ||аа||Га ^ Ms — 8^. Наконец, выбираем го- По условию, начальная функция ао = а имеет в начале координат нуль не менее второго порядка. Следовательно, в некото- некоторой окрестности точки z = О \a(z)\^K\z\2. Отсюда вытекает, что ||ao||ro Значит, при достаточно малом го условие ||ao||ro ^ &о? выполнено. Зафикси- Зафиксируем такое го. Теперь все числа Ss, M3, rs определены. При всех s выполнены неравенства ||aa||re ^ Ms. Из них следуют оценки для hs. Поэтому произведе- произведено ния Hs о ... о Н\ определены при \z\ ^ — и при s —>• 00 сходятся к пределу Н. Нетрудно проверить, что для предельного диффеоморфизма ЯоЛоЯ = Л. 17 В. И. Арнольд
Глава 6 Локальная теория бифуркаций Слово бифуркация означает раздвоение и употребляется в широ- широком смысле для обозначения всякой качественной, топологической пе- перестройки картины при изменении параметров, от которых зависит изучаемый объект. Объекты могут быть самые разнообразные: напри- например, вещественные или комплексные кривые или поверхности, функ- функции или отображения, многообразия или расслоения, векторные поля или уравнения, дифференциальные или интегральные. Если объект зависит от параметров, то говорят, что задано семей- семейство. Если мы интересуемся семейством локально, при малом изме- изменении параметров в окрестности фиксированных значений, то говорят о деформации объекта, соответствующего этим значениям параметров. Оказывается, во многих случаях изучение всевозможных дефор- деформаций сводится к исследованию одной единственной, из которой полу- получаются все остальные. Такая деформация, в некотором смысле самая богатая, должна давать все возможные бифуркации данного объекта; она называется версальной деформацией. В настоящей главе рассматриваются главным образом бифуркации и версальные деформации фазовых портретов динамических систем в окрестности положений равновесия и замкнутых траекторий. § 29. Семейства и деформации В этом параграфе обсуждаются общие «эвристические» соображе- соображения, на которых основана теория бифуркаций. Эти общие соображения принадлежат в основном А. Пуанкаре. А. Случаи общего положения и особые случаи малой ко- коразмерности. При исследовании всякого рода аналитических объектов (напри- (например, дифференциальных уравнений, или краевых задач, или задач оп- оптимизации) обычно можно выделить случаи общего положения. Напри- Например, из особых точек векторного поля на плоскости точками общего
§29. Семейства и деформации 259 положения являются узлы, фокусы и седла, в то время как, скажем, центры разрушаются сколь угодно малым шевелением поля. Изучение случаев общего положения является всегда первоочеред- первоочередной задачей при анализе явлений и процессов, описываемых данной ма- математической моделью. Действительно, сколь угодно малым изменени- изменением модели случай необщего положения превращается в случай общего положения, а параметры модели обычно определяются приближенно. Однако встречаются ситуации, в которых естественно возникает необходимость исследования случаев необщего положения. А именно, предположим, что мы изучаем не индивидуальный объект (скажем, векторное поле), а целое семейство, объекты которого зависят от неко- некоторого числа параметров. Чтобы лучше представить себе ситуацию, рассмот- рассмотрим функциональное пространство, точкой которого яв- являются наши объекты (скажем, пространство всех век- векторных полей). Случаи необщего положения соответ- соответствуют некоторым гиперповерхностям коразмерности 1 в этом пространстве. Сколь угодно малым сдвигом точ- точка может быть сдвинута с гиперповерхности в область случаев общего положения. Гиперповерхности особых случаев образуют границы областей случаев общего по- Рис. 105 ложения (рис. 105). Семейство с к параметрами изображается fc-мерным многообрази- многообразием в нашем функциональном пространстве. Например, однопараметри- ческое семейство — это кривая в функциональном пространстве (жир- (жирная линия на рисунке). Кривая в нашем функциональном пространстве может пересекать гиперповерхность особых случаев. Если это пересечение происходит «под ненулевым углом» (трансверсально), то оно сохраняется при малом шевелении семейства: всякая близкая кривая пересекает гиперповерх- гиперповерхность особых случаев в некоторой близкой точке (нежирная линия на рисунке). Таким образом, хотя каждый индивидуальный член семейства мо- может быть приведен в общее положение сколь угодно малым шевелением, нельзя добиться того, чтобы все члены семейства сразу были общего положения: при деформации семейства можно избежать случая необ- необщего положения для каждого фиксированного значения параметра, но при некотором близком значении параметра этот случай необщего по- положения все равно возникнет.
260 Глава 6 На гиперповерхностях особых случаев в нашем функциональном пространстве, вообще говоря, есть свои особенности (например, там, где одна из гиперповерхностей пересекает другую, что соответству- соответствует одновременному появлению двух вырождении (см. рис. 105)). При исследовании общих однопараметрических семейств этими особеннос- особенностями гиперповерхностей особых случаев можно пренебрегать. Дейст- Действительно, множество всех этих особенностей имеет в функциональном пространстве коразмерность не менее 2. Поэтому кривую в функцио- функциональном пространстве сколь угодно малым шевелением можно снять с этих особенностей, так что она будет пересекать гиперповерхности особых случаев лишь в точках общего положения. Итак, в однопарамет- рическом семействе общего положения встречаются как неустранимые лишь простейшие вырождения, соответствующие неособым точкам ги- гиперповерхности особых случаев. Эти вырождения называются вырож- вырождениями коразмерности 1. Изучение вырождений коразмерности 1 поз- позволяет непрерывно перейти от любой общей точки функционального пространства к любой другой общей точке, так как делят функциональ- функциональное пространство только множества, коразмерность которых не больше единицы. Во время перехода мы, вообще говоря, должны пересекать поверх- поверхности вырождений коразмерности 1. Изучение особенностей коразмер- коразмерности 1 позволяет описывать бифуркации, происходящие при пересече- пересечениях этих поверхностей. При исследовании fc-параметрических семейств общего положе- положения неустранимыми будут лишь вырождения, коразмерность кото- которых не превосходит к. Все прочие вырожденные объекты образу- образуют в функциональном пространстве множество коразмерности боль- больше fc, и от них можно избавиться сколь угодно малой деформацией ^-параметрического семейства. Чем больше коразмерность вырождения, тем труднее исследовать это вырождение и тем (как правило) меньше пользы от такого исследо- исследования. Изучение особенностей большой коразмерности к разумно про- проводить лишь в том случае, когда мы интересуемся не индивидуальным объектом, а fc-параметрическим семейством. Но тогда естественным объектом изучения является не индивидуальный объект (скажем, век- векторное поле со сложной особой точкой), а столь большое семейство, что особенность рассматриваемого типа при малой деформации семейства не исчезает.
§29. Семейства и деформации 261 Это простое соображение Пуанкаре показывает тщетность столь большого числа исследований в теории дифференциальных уравнений и в других областях анализа, что его всегда несколько опасно упоми- упоминать. В сущности, всякое исследование вырожденного случая должно сопровождаться вычислением соответствующей коразмерности и ука- указанием бифуркаций в семействе, для которого рассматриваемое вырож- вырождение неустранимо. С этой точки зрения, основанной на изучении ^-параметрических семейств, можно вовсе пренебречь исследованием вырождений беско- бесконечной коразмерности, так как от них можно избавиться малым шеве- шевелением любого ^-параметрического семейства при любом конечном к. Разумеется, вырожденные случаи могут быть полезны в качестве легко исследуемых первых приближений теории возмущений. Б. Отступление о случаях бесконечной коразмерности. Иногда приходится исследовать и вырождения бесконечной коразмер- коразмерности. Например, гамильтоновы системы или системы с какой-либо группой симметрии образуют подмногообразие коразмерности бесконечность в про- пространстве всех динамических систем. В таких случаях часто удается заранее сузить функциональное пространство так, чтобы коразмерности изучаемых вырождений стали конечными (например, ограничиться только гамильтоно- выми системами и их гамильтоновыми деформациями). Впрочем, такое сужение функционального пространства не всегда легко сделать. Рассмотрим, например, краевые задачи для уравнений с частны- частными производными. Речь идет о пересечении двух подмногообразий в функ- функциональном пространстве: пространства решений и пространства функций, удовлетворяющих граничным условиям. Оба эти многообразия имеют беско- бесконечную размерность и бесконечную коразмерность. Анализ этой ситуации требует умения различать разные бесконечные размерности и коразмернос- коразмерности: условие обращения в нуль функции одного переменного, построенной по данному объекту, выделяет в функциональном пространстве «многообразие меньшей (бесконечной) коразмерности», чем условие обращения в нуль функ- функции двух переменных. Одной из простейших задач, где требуется такое исчисление бесконеч- бесконечных коразмерностей, соответственно ядрам и коядрам, состоящим из функ- функций на многообразиях разного числа измерений, является задача с косой про- производной. В этой задаче на сфере, ограничивающей rt-мерный шар, задано векторное поле, касательное к n-мерному объемлющему пространству. Тре- Требуется определить гармоническую в шаре функцию, производная которой по направлению этого поля равна заданной граничной функции.
262 Глава 6 Рассмотрим, например, случай п = 3. В этом случае поле общего положе- положения касается сферы на некоторой гладкой кривой. На этой кривой имеются еще особые точки, где поле касается самой кривой. Строение поля в окрест- окрестности каждой из этих особых точек стандартное: можно доказать, что при любом п для поля общего положения1 в окрестности каждой точки границы поле задается в надлежащей системе координат одной из формул вида Ж201 + жз^2 + ... + Xkdk-i + dk, к ^ п, где дк = т;— и на границе х± = О (см.: С. М. Вишик. О задаче с косой произ- дхк водной. Вестник МГУ, сер. «Матем.», 1 A972), 21-28). Задача с косой производной должна, по-видимому, ставиться по такой схеме. Многообразия касания поля с границей, многообразия касания поля с многообразиями касания и т. д. делят границу на части разной размер- размерности. На некоторых из этих частей границы следует задавать граничные условия, на других же, напротив, граничная функция сама должна удовле- удовлетворять определенным условиям для существования классического решения задачи. Несмотря на обилие исследований по задаче с косой производной (осо- (особенно полно задача исследована в работах В. Г. Мазьи, которым предшествова- предшествовали работы М. Б. Малютова и Ю.В.Егорова с В.А.Кондратьевым), описанная выше программа реализована лишь в двумерном случае (когда граница — окружность). В. Пространства струй. Исследование бифуркаций в ^-параметрических семействах общего положения есть в сущности исследование функционального пространст- пространства, разбитого на части, соответствующие разным вырождениям, с пре- пренебрежением вырождениями коразмерности большей, чем к. Чтобы избавиться от бесконечномерности самого функционально- функционального пространства, разработан специальный аппарат конечномерных ап- аппроксимаций: многообразия А;-струй (термин jet введен Эресманом). Ниже фиксируются термины и обозначения, которыми мы будем пользоваться. Все утверждения этого и следующего пунктов совершен- совершенно очевидны. Пусть /: Мт —> Nn — гладкое отображение гладких многообразий (можно считать, что М и N — области в евклидовых пространствах соответствующего числа измерений). 1гГ. е. для всякого поля из некоторого открытого всюду плотного в функциональ- функциональном пространстве гладких полей множества.
/l м §29. Семейства и деформации 263 Определение. Два таких отображения /i, /2 на- называются касающимися порядка к или к-касающимися * в точке ж из М, если (рис. 106) PN{h{y), /2B/)) = o(pkM(x, у)) при г/ -+ ж. Q Л Рис. 106 «Здесь р означает какую-либо риманову метрику; легко видеть, что свойство А;-касания от выбора метрик рм и pN не зависит. Два отображения 0-касаются в точке ж, если их значения в точке х совпадают. Касание порядка к является отношением эквивалентности (/i ~ h =>¦ /2 ~ hi /1 ~ /2 ~ /з =>¦ /i ~ /з, /i ~ /i)- Определение, к-струей гладкого отображения / в точке х назы- называется класс А;-касающихся в х отображений. Обозначение. j*(f) = {/1: /1 fc-касается / в точке х}. Точка х называется истоком, а точка f(x) устьем этой струи. Выберем координаты на М и на N в окрестностях точек х и /(ж) соответственно. Тогда А;-струя любого отображения, близкого к /, в лю- любой точке, близкой к ж, задается набором коэффициентов отрезка ряда Тейлора степени к. Таким образом, при фиксированных координатных системах струю порядка к можно отождествить с набором коэффици- коэффициентов отрезка ряда Тейлора степени к. Пример. 0-струя отображения / оси ж в ось у в точке ж задается па- парой чисел (ж, у), где у = /(ж). 1-струя задается тройкой чисел (ж, у, р), df Кроме касания порядка к, есть еще одно отношение эквивалентнос- эквивалентности, приводящее вместо струй к росткам отображений. Определение. Два отображения, заданные в двух окрестностях одной и той же точки, имеют общий росток в этой точке, если они сов- совпадают в некоторой третьей окрестности этой точки (третья окрест- окрестность может быть меньше пересечения первых двух). Ростком отображения в точке называется класс эквивалентности по введенному отношению эквивалентности.
264 Глава 6 Для ростка, как и для отображения, можно определить его 0-струю в точке, 1-струю и т. д. Рассмотрим множество всех А;-струй ростков1 гладких отображе- отображений из М в N во всевозможных точках из М. Определение. Множество всех fc-струй ростков отображений из М в N называется пространством к-струй отображений из М в N и обозначается через Jk(M, N) = пространство fc-струй отображений из М в N. Пример. J1(M, Ж) есть трехмерное пространство с координатами (ж, у, р) (см. § 3). Множество Jk(M, N) имеет естественную структуру гладкого многообразия. Действительно, выберем системы координат в окрест- окрестности точки из М и в окрестности образа этой точки в N при не- некотором отображении / . Тогда fc-струя отображения / и все близкие струи задаются координатами точки-прообраза и наборами коэффици- коэффициентов отрезка ряда Тейлора отображения в этой точке. Тем самым мы построили карту многообразия струй Jk(M, N) в окрестности той его точки, которой является А;-струя отображения / . Размерность многообразия струй легко сосчитать. Например, J°(M, N) = M xN, dim J°(M, N) = dimM + dim TV, dim J1 (M, N) = dim M + dim N + dim M dim JV. Имеется естественное отображение Jk+1(M, N) -)- Jk(M, N) ((к + 1)-струя определяет fc-струю, так как из (к + 1)-касания выте- вытекает А;-касание). Это гладкое отображение является расслоением. Мы получаем цепочку расслоений ... ->• Jk ->• Jk~x ->• ... ->• J1 ->• J° = M x N. Слой каждого из этих расслоений диффеоморфен линейному простран- пространству, но не имеет (при к > 1) естественной линейной структуры («не- («неинвариантность высших дифференциалов»). ХВ вещественно-гладком случае все равно, рассматривать ли здесь струи рост- ростков, или струи отображений всего М, так как каждый росток является ростком глобального отображения. В комплексной же ситуации глобальное гладкое отобра- отображение с заданной струей может и не существовать.
§ 29. Семейства и деформации 265 Многообразия Jk являются своего рода конечномерными аппрок- аппроксимациями бесконечномерного функционального пространства гладких отображений из М в N. Г. Группы струй локальных диффеоморфизмов и про- пространства струй векторных полей. Рассмотрим пространство струй Jk(M, M). В этом многообразии лежит подмногообразие fc-струй диффеоморфизмов. Это подмногообра- подмногообразие — не группа, так как струи можно умножать только если устье одной струи есть исток другой. Зафиксируем некоторую точку на М и рассмотрим все ростки диф- диффеоморфизмов М, оставляющих эту точку на месте. Их fc-струи уже образуют группу. Определение. Группа А;-струй ростков диффеоморфизмов М, оставляющих на месте точку ж, называется группой к-струй локаль- локальных диффеоморфизмов многообразия М в точке х и обозначается через Пример. Группа 1-струй локальных диффеоморфизмов изоморфна ли- линейной группе Jl{Mm) = GL(Rm). При к > 1 получается более сложная группа Ли. Поскольку fc-струя опре- определяет (к — 1)-струю, получаем цепочку отображений -)• 4(М) -)• ... -)• jl(M) = GL(Rm). Легко видеть, что эти отображения (отображения забывания членов сте- степени к в многочлене Тейлора) — гомоморфизмы, а их ядра — коммутативные группы. Пусть, например, т — 1. Тогда: Доказательство. Если /(ж) = x + axk(mod xk+1) и g{x) = x + bxk(mod xk+1), то (fog)(x) = = x + axk + bxk (mod xk+1). ¦ Векторное поле на многообразии М — это сечение касательного расслоения р: ТМ —> М, т.е. такое гладкое отображение v: М —> ТМ, что коммутативна диаграмма
266 Глава 6 Определения ростков, струй и пространств струй векторных полей повторяют предыдущие определения. Группа диффеоморфизмов многообразия М действует на простран- пространстве всех векторных полей на М, а также на пространствах А;-струй векторных полей на М. Группа fc-струй локальных диффеоморфизмов многообразия М в точке действует на пространстве (к — 1)-струй векторных полей на М в этой точке; это действие линейно. Пример. Пусть у — а\х + а,2Х2 + ... — 2-струя локального диффеомор- диффеоморфизма в нуле. Образ 1-струи поля v(x) = Vo + V\X + .... дается формулой ш(х) — и>о + ojix + ..., где и>о — aivo, ил — aivia^1 + 2a2a^1vo. Доказательство. Эта формула получается при записи уравнения х = v(x) в координатах у. ¦ Д. Слабая теорема трансверсальности. Доказательства возможности приведения в общее положение часто удается заменить ссылкой на некоторые стандартные (и очевидные) те- теоремы трансверсальности. Ниже приведены формулировки и наброски доказательств наиболее употребительных теорем трансверсальности. Ссылки на теоремы трансверсальности служат в основном для эконо- экономии места: в каждом конкретном случае соответствующее конкретное утверждение легко доказать непосредственно. Определение. Два линейных подпространства X и Y линейного пространства L называются трансверсальными, если их сумма есть все пространство: Например, две пересекающиеся под ненулевым углом плоскости в трехмерном пространстве трансверсальны, а две прямые — нет. Пусть А и В — гладкие многообразия, и пусть С — гладкое под- подмногообразие в В (здесь и далее слово многообразие означает многооб- многообразие без края). Определение. Отображение /: А —» В называется трансверсаль- ным к С в точке а из А, если либо /(а) не принадлежит С, либо каса- касательная плоскость к С в точке /(а) и образ касательной плоскости к А в точке а трансверсальны (рис. 107):
§ 29. Семейства и деформации 267 Определение. Отображение /': А —»• В транс- версалъно к С, если оно трансверсально к С в любой точке многообразия-прообраза. Например, вложение прямой в трехмерное про- пространство трансверсально другой прямой в этом прост- Рис. 107 ранстве, если и только если прямые не пересекаются. Замечание. Отображение прямой на плоскость может не быть трансверсальным лежащей на плоскости прямой даже и в том случае, когда образом этого отображения является нормаль к данной прямой (образ касательного пространства и касательное пространство к обра- образу — не одно и то же). Отметим также, что если /: А —» В трансверсально к С, то про- прообраз С в А есть гладкое подмногообразие, и его коразмерность в А равна коразмерности С в В. Часто встречается ситуация, когда С — не гладкое подмногообра- подмногообразие, а подмногообразие с особенностями. Определение. Стратифицированным подмногообразием гладкого многообразия называется конечное объединение попарно непересекаю- непересекающихся гладких многообразий (стратов), удовлетворяющее следующему условию: замыкание каждого страта состоит из него самого и конечного объединения стратов меньших размерностей. Отображение называется трансверсальным стратифицированному подмногообразию, если оно трансверсально каждому страту. Пример. Пусть С — объединение двух пересекающихся по прямой плоскостей в трехмерном пространстве, стратификация — разбиение на прямую пересечения и четыре полуплоскости. Трансверсальность к С означает трансверсальность к каждой из плоскостей и трансвер- трансверсальность к прямой пересечения. Например, кривая, трансверсальная к стратифицированному многообразию С, не пересекается с прямой особенностей С. Теорема. Пусть А — компактное многообразие, и С — компакт- компактное подмногообразие в многообразии В. Тогда отображения /: А —»• В, трансверсальные к С, образуют открытое всюду плотное множество в пространстве всех достаточно гладких отображений А —»• В (близость
268 Глава 6 отображений / определяется как близость функций, задающих /, и их производных до достаточно большого порядка г). Эта теорема называется слабой теоремой трансверсаль- трансверсальности. Ее утверждение означает, что малым шевелением можно превратить отображение, не трансверсальное фикси- фиксированному подмногообразию, в трансверсальное (рис. 108). Если же трансверсальность имеет место, то она сохраняется при малых шевелениях. Рис. 108 Доказательство. Рассмотрим частный случай, когда В есть линейное пространство, В = Ж", а С — его подпространство Жп~к. Представим В в виде суммы В = С + D двух подпространств дополнительной размерности, С = Жп~к и D = Жк. Спроектируем В на D вдоль С; обозначим эту проекцию через тт. Рассмотрим отобра- отображение тг о /: А —> D. Точка 0 является критическим значением для этого отображения тогда и только тогда, когда отображение /: А —> В не трансверсально подмногообразию С С -В. По лемме Сарда (§ 10) почти все точки из D не являются критическими значениями для отображения тго/. Пусть е — точка из D, не являющаяся критическим значением для тго/. Построим отображение f?: А —» В, положив f?{a) = f(a)—e. Тогда отображение f? трансверсально к С. Поскольку е можно было взять сколь угодно ма- малым, всюду плотность трансверсальных отображений в нашем частном случае доказана. Открытость следует из теоремы о неявной функции. Общий случай легко сводится к рассмотренному. ¦ Замечание. Если С не компактно, то «открытое» нужно, вообще говоря, заменить на «пересечение счетного множества открытых». Пример 1. В — тор, С — его обмотка, А — окружность. Пример 2. В — плоскость, А — вложенная в плоскость окружность, С — касательная к ней (без самой точки касания). Вложение трансверсально к С, но существуют сколь угодно близкие не трансверсальные к С отобра- отображения. Для того чтобы трансверсальные к С отображения компактного А в В образовывали открытое всюду плотное множество, достаточно вместо ком- компактности С потребовать, чтобы у каждой точки из В нашлась такая окрестность, что пара (окрестность, ее пересечение с С) диффеоморфна па- паре (Rb, Rc) либо паре (Rb, пустое множество).
§ 29. Семейства и деформации 269 Если А не компактно, то пространство отображений удобно снабжать «тонкой топологией». В этой топологии окрестность отображения /': А —» В определяется следующим образом. Фиксируем открытое множество G в про- пространстве струй Jk(A, В) при каком-либо к. Множество С°°-отображений /: А —У В, fc-струи которых в каждой точке принадлежат G, открыто в тон- тонкой топологии. Такие непустые открытые множества берутся в качестве ба- базиса окрестностей, задающих тонкую топологию в пространстве бесконечно- дифференцируемых отображений. Таким образом, близость двух отображений в тонкой топологии озна- означает сколь угодно быстрое сближение этих отображений (с любым числом производных) «на бесконечности»; в частности, график достаточно близкого к / отображения лежит в сколь угодно быстро утончающейся «на бесконеч- бесконечности» окрестности графика отображения /. Отсюда следует, что сходимость последовательности в тонкой топологии влечет полное совпадение вне некоторого компактного множества всех членов последовательности, начиная с некоторого. Тем не менее, любая окрестность данного отображения в тонкой топологии содержит отображения, нигде не совпадающие с данным. Если открытость и всюду плотность понимать в смысле тонкой тополо- топологии, то теорема трансверсальности верна и для некомпактных А (для откры- открытости С должно быть компактным или удовлетворять сформулированному выше условию). Теорема трансверсальности очевидным образом распространяет- распространяется на случай стратифицированного подмногообразия С. Однако в этом случае теорема гарантирует, что трансверсальные отображения обра- образуют не открытое всюду плотное множество, а лишь всюду плотное пересечение счетного числа открытых множеств. Чтобы трансверсальные к стратифицированному многообразию отображения образовывали открытое всюду плотное множество, доста- достаточно, чтобы стратификация удовлетворяла следующему дополнитель- дополнительному условию: всякое вложение, трансверсальное к страту меньшей размерности, трансверсально ко всем примыкающим стратам большей размерности в некоторой окрестности этого страта меньшей размер- размерности. Пример 1. Пусть С — конечное объединение плоскостей в линейном пространстве, стратифицированное естественным образом (например, пара пересекающихся плоскостей в R3). Из трансверсальности к Ш.к следует транс- трансверсальность к объемлющему Ш. , поэтому наше условие выполнено.
270 Глава 6 Пример 2. Пусть С — конус х2 = y2+z2 в R3, стра- стратификация — разбиение на точку 0 и две полы. Наше условие, как нетрудно проверить, выполнено. Пример 3. Пусть С — зонтик Уитни, заданный уравнением1 у2 = zx2 в R3 (рис. 109). [Часть z ^ 0 этого УЖ~ стратифицированного многообразия является образом отображения tp: R2 —> R3, заданного формулами х = и, Рис. 109 z = v2, у = uv. Уитни доказал, что 1) при малом шеве- шевелении отображения ср сохраняется особенность такого же (с точностью до диффеоморфизмов R2 и R3) типа; 2) это единственная особенность отображений двумерных многообразий в трехмерные, сохраня- сохраняющаяся при малых шевелениях (кроме линии самопересечения), все прочие особенности при малом шевелении распадаются на особенности этого типа.] Из трансверсальности к особой прямой х = у = 0 не следует трансверсаль- трансверсальность к многообразию близких к этой прямой регулярных точек поверхности (плоскость z — 0 трансверсальна прямой и не трансверсальна поверхности). Если условие на стратификацию С трансверсальность к меньшему => трансверсальность к большему выполнено, то трансверсальность ко всей стратификации достигается так. 1) Страты минимальной размерности гладкие, к ним применима обычная теорема. 2) В окрестности стратов минимальной размерности трансверсальность достигнута на всех стратах. 3) Выкидываем из объ- объемлющего многообразия замыкание окрестности стратов минимальной размерности и переходим к стратам следующей размерности. Пример. Пусть В — пространство линейных операторов Ъ: Шт—>Шп, С — множество операторов не максимального ранга. Операторы ран- ранга г образуют гладкое подмногообразие, коразмерность которого в про- пространстве В равна (га — г)(п — г). Разбиение на многообразия операторов различных рангов задает стратификацию на С. Отображение /: А —> В — это семейство линейных операторов из Шт в Кп гладко зависящих как от параметра от точки многообра- многообразия А. Многообразие А называется базой семейства. Из теоремы транс- трансверсальности сразу вытекает 1Зонтик включает ручку, изображенную на рис. 109 жирной линией.
§ 29. Семейства и деформации 271 Следствие. В пространстве гладких семейств матриц поряд- порядка тхп всюду плотное множество образуют семейства, трансверсалъ- ные стратифицированному многообразию С матриц не максимального ранга. В частности, значения параметра, которым соответствуют матри- матрицы ранга г, образуют, вообще говоря (для семейств из всюду плотно- плотного пересечения открытых множеств в пространстве семейств), гладкое подмногообразие коразмерности (га — г)(п — г) в базе семейства. Например, в пятипараметрическом семействе общего положения матриц порядка 2x3 ранг падает до 1 на трехмерном гладком под- подмногообразии пространства параметров и не равен 0 ни в одной точке пространства параметров; если для данного семейства это не так, то сколь угодно малой деформацией семейства можно добиться того, что семейство станет семейством общего положения. Е. Теорема трансверсальности Тома. Теорема трансверсальности Тома является обобщением слабой те- теоремы трансверсальности, в котором роль подмногообразия С играет подмногообразие пространства струй. С каждым гладким отображением /: М —> N связано его «?;-струй- ное расширение» /: М —> Jk(M, N), f(x) = J%(f) (точке х из М сопо- сопоставляется fc-струя отображения / в точке х). Теорема. Пусть С — подмногообразие пространства струй Jk(M, N). Тогда множество отображений /: М —>• N, k-струйные рас- расширения которых трансверсальны к С, — всюду плотное счетное пе- пересечение открытых множеств в пространстве всех гладких отобра- отображений из М в N. Эта теорема означает, что малым шевелением гладкого отображе- отображения можно привести его в общее положение не только по отношению к любому гладкому подмногообразию в пространстве-образе, но и по отношению к любому условию, наложенному на производные любого конечного порядка. Замечание. Слабая теорема трансверсальности получается из сформу- сформулированной при к = 0. Сильная же из слабой непосредственно не вытекает по следующей причине. Можно было бы применить слабую теорему к отображе- отображению /: М —>• Jk и получить близкое к / трансверсальное к С отображение. Однако это близкое отображение, вообще говоря, не будет fc-струйным рас- расширением никакого гладкого отображения из М в N.
272 Глава 6 Теорема трансверсальности Тома утверждает, что трансверсали- зирующую деформацию можно выбрать в более узком классе дефор- деформаций: достаточно ограничиться деформацией ^-струйного расшире- расширения в пространстве fc-струйных расширений, а не в пространстве всех сечений М —>• Jk. Таким образом, теорема означает, что условия ин- интегрируемости (выполнение которых отличает fc-струйные расширения отображений из М в N от произвольных сечений М —> Jk) не мешают достигнуть трансверсальности. Доказательство. Сущность доказательства состоит в такой же редукции к лемме Сарда, как и для слабой теоремы трансверсальности. Основное отли- отличие состоит в том, что трансверсализирующая деформация ищется не в классе отображений f? = / — е, а в более широком классе полиноми- полиномиальных деформаций f? = f + е\е\ + ... + eses, где е$ — всевозможные вектор-мономы степени не выше к. Лемма 1. Рассмотрим гладкое отображение F: АхЕ —»• В прямо- прямого произведения гладких многообразий А и Е в гладкое многообразие В. Будем рассматривать F как семейство отображений F? многооб- многообразия А в В, зависящих от точки е многообразия Е как от параметра. Тогда если отображение F трансверсалъно к подмногообразию С мно- многообразия В, то почти каждый член F?: А —» В соответствующего F семейства трансверсален к С. Доказательство. Рассмотрим F~1(C). По теореме о неявной функции, это гладкое подмногообразие в АхЕ. Рассмотрим проекцию этого подмногообразия на Е вдоль А. По лемме Сарда, почти все значения не критические. Пусть е — не критическое значение. Тогда F?: А —»• В трансверсально к С (ибо F трансверсально к С, а А х е трансверсально к F~1(C)). Лемма 2. Пусть / — гладкое отображение из Ш,т в Ш,п. Зафик- Зафиксируем в Ш,т и в М.п системы координат и рассмотрим гладкое ото- отображение прямого произведения пространства Жто на пространство Ms в пространство k-струй отображений Jh(M, N), определенное форму- формулой (х, е) —> (jife), где fe = f-\-Eiei + ...-\- ?ses (ei,... , es — всевозможные произведения
§29. Семейства и деформации 273 мономов степени не выше к от координат точки х из Жт на базисные векторы в Жп). Утверждается, что построенное отображение не имеет крити- критических значений {и, следовательно, трансверсально любому подмного- подмногообразию пространства к-струй). Доказательство. Координатами в пространстве Jk являются координаты точки х из Жт и коэффициенты Тейлора струи в этой точке до степени к вклю- включительно. При подходящем выборе коэффициентов ?i,... ,es вектор- многочлен ?iei + ... + ?ses будет иметь в любой наперед заданной точ- точке х любой наперед заданный набор коэффициентов Тейлора до членов степени к включительно. Отсюда непосредственно вытекает утвержде- утверждение леммы. ¦ Пусть С — гладкое подмногообразие в В = Jk(M,m, Ш,п). При- Применим к отображению леммы 2 лемму 1 (в которой А = Шт, E = RS; F(x, е) = Jxfe). По лемме 1 для почти всех е отображение Fe = F(-, e) трансверсально к С. Выбрав е достаточно малым, мы получим сколь угодно близкое к / (в любой конечной части Жте) отображение fe: Ш,т —> Ш,п, А;-струйное расширение которого трансверсально к С. Переход от этой локальной конструкции к глобальной (замена IRm, Шп на М, N) не представляет затруднений. ¦ Ж. Пример: распадение сложных особых точек векторно- векторного поля. В качестве приложения теорем трансверсальности рассмотрим во- вопрос о том, какие особые точки имеет векторное поле общего положе- положения. Определение. Особая точка х векторного поля v называется не- невырожденной, если оператор линейной части поля в особой точке невы- невырожден. Из теорем трансверсальности вытекает Следствие. В функциональном пространстве гладких векторных полей на компактном многообразии открытое всюду плотное множес- множество образуют поля, все особые точки которых невырождены (и, следо- следовательно, изолированы). 18 В. И. Арнольд
274 Глава 6 Доказательство. Особые точки — это прообразы гладкого многообразия (нулево- (нулевого сечения) в пространстве 0-струй векторных полей. Невырожден- Невырожденность особой точки есть трансверсальность 0-струйного расширения поля к этому многообразию. ¦ Итак, вырожденная особая точка распадается на невырожденные при сколь угодно малом шевелении поля. Пример. Рассмотрим особую точку типа «седло-узел»: При шевелении х = х2 — е, у = —у седло-узел распадается на две особых точки: седло и узел. Возникает вопрос, на сколько особых точек распадается данная сложная особая точка при малых шевелениях. Как это обычно бывает (скажем, в теории алгебраических уравнений), вопрос наиболее естес- естественно решается в комплексной области. Определение. Число невырожденных (комплексных) особых то- точек, на которые распадается сложная особая точка при малом шевеле- шевелении, называется кратностью особой точки. Замечание. Строго говоря, кратность определяется следующим обра- образом: 1) фиксируется достаточно малая окрестность особой точки в комплекс- комплексном пространстве; 2) по выбранной окрестности выбирается малость шевеле- шевеления; 3) для пошевеленного поля считается число особых точек в окрестности данной точки. Ниже будет указана формула для кратности особой точки в тер- терминах диаграмм Ньютона (А. Г. Кушниренко, Д.Н. Бернштейн, А Г. Хо- Хованский). Пусть / = X) fmXm — числовой формальный ряд по степеням пе- переменных xi, ... , хп (хт = ж™1 ...ж™"). Рассмотрим октант решетки целых точек га с неотрицательными координатами га^. Обозначим этот октант через Z™. Определение. Носителем ряда / называется множество точек га из октанта Z™, для которых fm ф 0. Обозначение:
§29. Семейства и деформации 275 Определение. Многогранником Ньютона ряда / называется вы- выпуклая оболочка объединения параллельных Z™ октантов с вершинами в точках носителя в октанте Ж™ вещественного линейного пространст- пространства. Обозначение: Г/ = выпуклая оболочка объединения га + Z™, га G supp/. Многогранник Ньютона называется удобным, если он пересекает все координатные оси. Теорема. Пусть даны п удобных многогранников Ньютона 1\,..., Гп. Рассмотрим векторное поле v\-^—\-... + vn-^—, где многогранни- ОХ\ ОХп ки Ньютона для компонент vi, ... , vn суть Fi, ... , Гп. Тогда крат- кратность /i особой точки нуль нашего векторного поля не меньше, чем определяемое ниже число Ньютона v(Ti, ... , Гп) и совпадает с ним для почти всех полей с данными многогранниками Ньютона компонент (для всех полей, исключая гиперповерхность в пространстве полей с данны- данными многогранниками). Замечание. Условие удобности многогранников не является ограниче- ограничением, так как можно доказать, что его выполнения можно добиться добав- добавлением членов сколь угодно высокой степени, не меняющих кратности (если только она конечна). Для определения числа Ньютона системы удобных многогранников нам потребуется понятие смешанного объема. Пусть Г — удобный многогранник Ньютона. Под объемом V(T) мы будем понимать объем (невыпуклой) области между нулем и границей многогранника Г в положительном октанте Ж". Пусть Fi, Г2 — два удобных многогранника Ньютона. Сум- Суммой Fi + Г2 называется арифметическая сумма, т.е. множество всевоз- всевозможных сумм векторов из Fi и из Гг. Сумма также является удобным многогранником Ньютона. Таким образом, удобные многогранники Ньютона образуют ком- коммутативную полугруппу. Из этой полугруппы обычным методом стро- строится группа (она называется группой Гротендика): элементом группы является формальная разность двух многогранников Ньютона Fi — Г2, причем по определению Fi — Г2 = Г3 — Г4 если и только если Fi + Г4 = = Г2 + Г3. Построенная группа определяет также линейное пространство над полем вещественных чисел: если Л положительное число, то ЛГ озна-
276 Глава 6 чает многогранник, полученный из Г гомотетией с центром в 0 с ко- коэффициентом Л. Объем V(Y) однозначно продолжается на это линейное пространство в качестве формы степени п (доказательство этого не со- совсем очевидного факта оставляется любознательному читателю в виде упражнения). Каждая форма степени п единственным образом представляется в виде значения симметричной n-линейной формы при совпадающих аргументах; например, 2 к к к ((* + ЪJ-а2-Ъ2) а = аи а = о, аи = ^ . Определение. Смешанным объемом (Минковского) системы мно- многогранников (Г1!, ... , Гп) называется значение на наборе (Fi, ... , Гп) той единственной симметричной n-линейной формы, которая совпадает с объемом V(T) при Fi = ... = Г„ = Г. Обозначение: V(Ti, ... , Гп). Пример. В плоском случае п = 2 и смешанный объем пары (Fi, Гг) есть V(TU Г,) = ИГ.+ГО-УУО-УУ,^ Li Определение. Число Ньютона ^(Fi, ... , Гп) определяется следу- следующим образом: 1/(Гь ...,Г„)=п!У(Г1, ...,Г„). Пример. В двумерном случае пусть Fi, Г2 ограничены прямыми, пересекающими оси координат в точках (ai, &i) для Fi и (аг, &г) для Гг. Тогда и(Гх, Г2) равно min(aib2? a2bi). Следовательно, почти всегда кратность особой точки равна /i = min(aib2, § 30. Матрицы, зависящие от параметров, и особенности декремент-диаграмм В качестве подготовки к исследованию бифуркаций особых точек векторных полей мы рассмотрим здесь задачу о нормальной форме се- семейств эндоморфизмов линейного пространства.
§30. Матрицы, зависящие от параметров 277 А. Задача о нормальной форме матриц, зависящих от па- параметров. Приведение матрицы к жордановой нормальной форме — не устой- устойчивая операция, если среди собственных чисел есть кратные. Действи- Действительно, сколь угодно малое изменение матрицы может при наличии кратных собственных чисел совершенно изменить жорданову форму. Поэтому если матрица известна лишь приближенно, то приведение ее к жордановой нормальной форме в случае кратных собственных чи- чисел практически невозможно. Оно и не нужно, так как матрица общего вида не имеет кратных собственных чисел. Кратные собственные числа возникают неустранимым малым ше- шевелением главным образом в случае, когда мы интересуемся не отдель- отдельной матрицей, а семейством матриц, зависящих от параметров. В этом случае, хотя мы и можем привести к жордановой нормальной форме каждую индивидуальную матрицу семейства, как эта нормальная фор- форма, так и приводящее к ней преобразование, будут, вообще говоря, раз- разрывно зависеть от параметра. Таким образом, возникает вопрос о том, к какому простейшему виду можно привести семейство матриц, гладко (для определенности, голоморфно) зависящих от параметров при помощи гладко (голоморф- (голоморфно) зависящих от параметров замен координат. Рассмотрим множество всех квадратных комплекс- комплексных матриц порядка п как линейное пространство размер- размерности п2. Отношение подобия матриц разбивает все про- 2 странство С" на многообразия (орбиты линейной груп- группы): две матрицы лежат в одной орбите, если у них сов- совпадают собственные числа и размеры жордановых кле- клеток. Из-за собственных чисел это разбиение континуально. В качестве грубой модели можно представлять себе раз- разбиение трехмерного пространства на страты многообразий Рис. 110 х2 +у2 -z2 =С (рис. 110). Семейство матриц задается отображением пространства парамет- 2 ров семейства в пространство матриц С" . Оказывается, среди всех се- семейств матриц можно выделить такие семейства, что приведение к ним осуществляется уже гладко зависящей от параметров заменой базиса (и гладкой заменой параметра). Такие семейства называются версаль- ными деформациями (точное определение см. ниже). Версальные де-
278 Глава 6 формации с минимальным возможным числом параметров называют- называются миниверсальными. Таким образом, миниверсальные деформации — это нормальные формы с наименьшим возможным числом параметров, при приведении к которым можно сохранить гладкую зависимость от параметров. Пример. Если все собственные числа диагональной матрицы раз- различны, то в качестве ее миниверсальной деформации можно взять се- семейство всех диагональных матриц (параметры — собственные числа). Мы укажем ниже миниверсальные деформации произвольных матриц. Б. Версальные деформации. Определение. Семейством матриц мы будем называть голо- 2 морфное отображение А: Л —у Сп , где Л — окрестность начала ко- координат в некотором пространстве параметров С1. Росток семейства А в точке 0 мы будем называть деформацией матрицы А{0). Деформация А' матрицы А@) называется эквивалентной деформа- деформации А, если существует такая деформация единицы С, что А>(\) = С(\)А(\)(С(\)Г1. Пусть ср: (М, 0) —> (Л, 0) — голоморфное отображение (М С Ст, ЛсС1). Определение. Семейством, индуцированным из А при отображе- отображении ср, называется семейство (р*А: ()) /а еМ. Индуцированная деформация ср*А матрицы А@) определяется та- такой же формулой. Определение. Деформация А матрицы Ао называется версалъной, если любая деформация А' матрицы Ао эквивалентна деформации, ин- индуцированной из А. Версальная деформация называется универсальной, если это индуцирующее отображение ср определяется деформацией А' однозначно. Версальная деформация называется миниверсалъной, если
§30. Матрицы, зависящие от параметров 279 размерность пространства параметров — наименьшая возможная для версальной деформации. Пример. Семейство диагональных матриц с диагональными эле- элементами (щ + Aj), где все щ различны, a Aj — параметры деформации, является версальной, универсальной и миниверсальной деформацией матрицы (щ). 2 Семейство всех матриц С" определяет п2-параметрическую вер- сальную деформацию любой своей матрицы. Однако эта деформация не является, вообще говоря, ни универсальной, ни миниверсальной. Размерность миниверсальной деформации произвольной матрицы дается следующей теоремой. Обозначим через щ собственные числа матрицы Aq и пусть rii(ai) ^ П2{щ) ^ ... — размеры принадлежа- принадлежащих щ жордановых клеток, упорядоченных, начиная с наибольшей. Теорема 1. Наименьшее число параметров версальной деформа- деформации матрицы Aq равно Сами миниверсальные деформации можно выбирать по-разному. В частности, три нормальные формы, описанные в следующей теореме, являются версальными деформациями матрицы, приведенной к верх- верхнетреугольной жордановой нормальной форме. Теорема 2. Пусть А — голоморфно зависящее от параметра A G С семейство линейных операторов из Сп в себя, и пусть при не- некотором значении Xq параметра А оператор A(Xq) имеет собственные числа oti и жордановы клетки порядков Тогда существует базис в Сп, голоморфно зависящий от парамет- параметра X, меняющегося в некоторой окрестности точки Xq, и такой, что матрица оператора А(Х) имеет в этом базисе блочно-диагональный вид где Aq — жорданова верхнетреугольная матрица оператора A(Xq), а В{Х) — блочно-диагональная матрица, блоки которой соответству- соответствуют собственным числам матрицы Aq.
280 Глава 6 Блок В(, соответствующий собственному числу щ заполнен нуля- нулями, за исключением мест, отмеченных на рис. 111; на этих местах стоят голоморфные функции от А. щ — г б) Рис. 111 в) На рисунке 111 представлены три нормальные формы. В первых двух число ненулевых элементов в В{ равно п\{а,{) + %П2(сц) + •••; в третьей все элементы на каждом косом отрезке равны. Миниверсаль- ные деформации матрицы Aq получатся, если считать отмеченные эле- элементы матриц Bi независимыми переменными; их число во всех трех случаях равно X^[ni(a«) + Зп2(«г) + •••]. Преимуществом первых двух нормальных форм является то, что в них число ненулевых элементов матрицы — наименьшее возможное. Преимуществом третьей формы является ортогональность версальной деформации к соответствующей орбите (в смысле поэлементного скалярного умножения матриц). В. Доказательство версальности. 2 Пусть А: А —> Сп — деформация матрицы Ао = А@) с пара- параметром A G Л, такая, что отображение А трансверсально к орбите С матрицы Aq под действием группы линейных замен координат. Пред- Предположим, что число параметров деформации минимально (т.е. равно 2 коразмерности орбиты в пространстве С" всех матриц). Такая дефор- деформация называется минитрансверсальной. Лемма 1. Минитрансверсальная деформация А миниверсальна. Для доказательства леммы нам потребуется следующее Определение. Централизатором матрицы и называется множес- множество всех матриц, коммутирующих с и. Обозначение: Zu = {v: [и, v] = 0}, [и, v] = uv — vu.
§30. Матрицы, зависящие от параметров 281 Централизатор любой матрицы порядка п является линейным под- 2 пространством пространства Сп всех матриц порядка п. Пусть Z — централизатор матрицы Aq. Проведем через единицу е в пространстве невырожденных матриц гладкую поверхность, транс- версальную к е + Z, размерность которой равна коразмерности центра- централизатора (т.е. имеет минимальное возможное значение). Обозначим эту поверхность через Р и рассмотрим отображение Ф:РхА^Сп\ Ф{р,Х)=рА(Х)р-1. Лемма 2. Отображение Ф в окрестности точки (е, 0) — локалъ- 2 ный диффеоморфизм на (Cn , Aq). Для доказательства леммы 2 рассмотрим отображение ф группы 2 невырожденных матриц в пространство Сп всех матриц, заданное фор- формулой ф(Ь) = ЬАоЬ'1. 1°. Производная отображения ф в единице есть оператор комму- коммутирования с Aq: 2 „2 г Доказательство. (е + еи)А0(е + ей)'1 = Ао + е[и, Ао] + ... Из 1° вытекает 2°. Размерность централизатора матрицы Aq равна коразмернос- коразмерности орбиты, а размерность трансверсали к централизатору — размер- размерности орбиты: dim Z = dim Л, dim P = dim С. 2 Введем в пространстве Сп эрмитово скалярное произведение {А, В) = tr(AB*), где В* — матрица, полученная из В транспони- транспонированием и комплексным сопряжением. Соответствующий скалярный квадрат — это просто сумма квадратов модулей элементов матрицы. 2 Лемма 3. Вектор В из касательного пространства к Сп в точ- точке Aq перпендикулярен к орбите матрицы Aq если и только ес- если [В*, Aq] =0. Доказательство. Касательные векторы к орбите — это матрицы, представленные в виде [X, Aq]. Ортогональность В к орбите означает, что при любом X
282 Глава 6 имеем ([X, Aq], В) = 0. Иначе говоря, при любом X 0 = tr([X, Ао], В*) = tr(XА0В* - А0ХВ*) = Щ \ s Ввиду произвольности X это условие эквивалентно [Ао, В*] = 0. Итак, лемма доказана: ортогональное дополнение к орбите матрицы получается из ее централизатора транспонированием и сопряжением. ¦ Централизаторы матриц, приведенных к жордановой нормальной форме, выписать нетрудно. Предположим вначале, что матрица имеет только одно собственное число и ряд верхнежордановых клеток поряд- порядков П\ ^ П2 ^ . • . Лемма 4. С матрицей Ао коммутируют матрицы, изображенные на рис. 112, и только они. На рис. 112 каждый косой отрезок означает ряд одина- одинаковых чисел, а в незаполненных местах подразумеваются нули. Таким образом, число отрезков равно размерности централизатора. Рис. 112 Доказательство. Лемма 4 доказывается непосредственным вычислением коммута- коммутатора (см. например, Ф. Р. Гантмахер. Теория матриц. М.: Наука, 1967, стр. 199-207). ¦ Из леммы 4 следует, что размерность централизатора матрицы Ао (равная коразмерности орбиты и минимальной возможной размерности версальной деформации) дается формулой d = п\ + Зггг + 5ггз + ... Если жорданова матрица Ао имеет несколько собственных чисел, разобьем ее на блоки, соответствующие собственным числам. Тогда матрицы, коммутирующие с Ао, будут блочно-диагональными, при- причем каждому собственному числу соответствует блок описанного на рис. 112 вида. Поэтому формула для размерности централизатора (ко- (коразмерности орбиты, размерности миниверсальной деформации) полу- получается из предыдущей суммированием по всем различным собствен- собственным числам. Действительно, ф* есть линейное отображение пространств оди- одинаковой размерности, поэтому размерность ядра равна коразмерности образа.
§30. Матрицы, зависящие от параметров 283 Доказательство леммы 2. Производная Ф по р в (е, 0) есть ф*, а производная по Л есть А*. Эти операторы по доказанному выше изоморфно отображают касатель- касательные пространства кРвеикЛвОна трансверсальные пространства тех же размерностей (касательное к орбите С в Aq для Р и трансвер- сальное к ней для Л). Следовательно, производная Ф в точке (е, 0) есть изоморфизм линейных пространств размерности п2. По теореме об об- обратной функции Ф есть локальный диффеоморфизм. ¦ Доказательство леммы 1. Будем рассматривать р и Л как координаты точки Ф(р, Л). Пусть 2 А': (М, 0)—>(Сп , Aq) — любая деформация матрицы Aq. Пусть fiEM — параметр деформации. Определим Л = (р(ц) формулой (р(ц) = \(А'(ц)) и положим В(ц) = p(A'(/j,)). Тогда А'(ц) = B(/j,)A((p(fj,))B~1 /i, что и доказывает версальность деформации А. Минимальность размерности базы этой деформации очевидна. ¦ В качестве трансверсальной деформации матрицы Aq можно взять семейство матриц вида Aq+B, где матрица В принадлежит описанному выше ортогональному дополнению к орбите матрицы Aq. Мы получаем таким образом миниверсальную деформацию матрицы Aq. В случае, когда матрица Aq имеет только одно собственное число, матрица В имеет вид, изображенный на рис. 111, в. Здесь на каждом косом отрезке стоит ряд равных чисел; число параметров равно числу отрезков и дается указанной выше формулой. Матрица В имеет много ненулевых элементов. Можно построить миниверсальные деформации Aq + В, в которых число ненулевых эле- элементов матрицы В минимально возможное (равно числу параметров). С этой целью выберем в централизаторе базис: сопоставим каждому косому отрезку на рис. 111 в матрицу из нулей и единиц, у которой единицы стоят на этом косом отрезке. Систему независимых уравнений касательной плоскости к орбите составляют следующие уравнения: для каждого косого отрезка рис. 111 сумма соответствующих элементов матрицы равна нулю (леммы 3 и 4). Таким образом, чтобы получить трансверсальное к орбите семейст- семейство Aq + В достаточно в качестве семейства матриц В брать матрицы, у которых на каждом косом отрезке рис. 111 в в одном месте стоит независимый параметр, а в остальных местах стоят нули. Выбирать ненулевой элемент на каждом косом отрезке можно в любом месте. Например, годится выбор, указанный в теореме 2 пункта Б. ¦
284 Глава 6 Г. Примеры. Будем обозначать верхнетреугольную жорданову матрицу произ- произведением определителей ее клеток. Например, а2 означает жорданову клетку порядка 2, а аа — матрицу второго порядка, кратную единич- единичной. Первая нормальная форма теоремы п. Б приводит к следующим миниверсальным деформациям: а) Версальная (и универсальная) двухпараметрическая деформа- деформация жордановой клетки а2 порядка 2: а О а б) Версальная (но не универсальная) четырехпараметрическая де- деформация скалярной матрицы аа порядка 2: а 0\ /Ai A2 О а) + \Хз А4 в) Версальная и универсальная трехпараметрическая деформация жордановой клетки а3: 0 0\ 0 0 . г) Версальная пятипараметрическая деформация матрицы а2а: 1 0\ /О а 0 Например, всякое голоморфное семейство матриц, содержащее при нулевом значении параметра жорданову клетку а2, приводится при близких значениях параметра к нормальной форме A), где Ai, A2 — голоморфные функции параметров. Построенные нормальные формы позволяют при исследовании мно- многих вопросов, относящихся к поведению операторов, зависящих от па- параметров, ограничиваться специальными семействами — миниверсаль- ными деформациями. Одним из таких вопросов является вопрос о стро- строении бифуркационных диаграмм.
§30. Матрицы, зависящие от параметров 285 Д. Бифуркационные диаграммы. Бифуркационной диаграммой семейства матриц мы будем назы- называть разбиение пространства параметров Л по жордановым типам мат- 2 риц. Семейство — это отображение А: Л —> Сп пространства пара- параметров в пространство матриц, поэтому для изучения бифуркацион- бифуркационных диаграмм следует изучить разбиение пространства всех матриц на матрицы с жордановыми формами разных типов. При этом разби- разбиении мы объединяем вместе матрицы с одинаковыми размерами жор- дановых клеток, различающиеся лишь величиной собственных чисел. Поэтому получающееся разбиение является конечной стратификацией пространства матриц. Каждый страт этой стратификации определяется совокупностью наборов n\(i) ^ пг(г) ^ ••• размеров жордановых клеток, соответ- соответствующих v различным собственным числам A $С г <С г/). Коразмер- 2 ность с такого страта в пространстве Сп меньше коразмерности d со- соответствующей орбиты на количество различных собственных чисел, т.е. на v: v г=1 Заметим, что простые собственные числа дают в эту сумму нуле- нулевой вклад. Применяя слабую теорему трансверсальности, мы приходим к следующему выводу. Теорема. В пространстве семейств матриц порядка п всюду плотное множество образуют семейства, трансверсальные стратифи- стратификации по жордановым типам. Эта теорема вместе с формулами версальных деформаций п. Г поз- позволяет описать бифуркационные диаграммы семейств общего положе- положения. В частности, для семейств с небольшим числом параметров мы приходим к следующим результатам. 1°. Однопараметрические семейства. Из с = 1 следует, что матрица имеет лишь одно двукратное собственное число и ему соответствует жорданова клетка порядка 2. Такой страт мы будем обозначать а2. Следствие. В однопараметрическом семействе матриц общего вида встречаются лишь матрицы с простыми собственными числа- числами, и при отдельных, изолированных значениях параметров матрицы типа а2 (с одной жордановой клеткой порядка 2). Если в семействе имеются матрицы более сложной жордановой структуры, то от них можно избавиться сколь угодно малым шевелением семейства.
286 Глава 6 Рис. 113 2°. Двухпараметрические семейства. Существует ровно два жор- дановых типа с с = 2 : а3 (одна жорданова клетка порядка 3) и a2f32 (две клетки порядка 2 с разными собственными числами). Следствие. Бифуркационная диаграмма общего двух- параметрического семейства матриц имеет вид кривой, единственные особенности которой — точки возврата и точки самопересечения (рис. 113). Точкам возврата соот- соответствуют матрицы типа а3 с одной жордановой клеткой порядка 3, точкам самопересечения — типа а2 (И2 с двумя жордановыми клетками порядка 2 при разных собственных числах, точкам кривой — с одной жордановой клеткой по- порядка 2. Точкам вне кривой отвечают матрицы с простыми собствен- собственными числами. Если в семействе имеются матрицы более сложных типов или би- бифуркационная диаграмма имеет более сложные особенности, то от них можно избавиться сколь угодно малым шевелением семейства. 3°. Трехпараметрические семейства. Имеются четыре страта с с = 3: a2f32y2 (три 2-клетки), аа (две клетки порядка 1 с одинаковым собственным числом), a2f33 B клетки второго и третьего порядка) и а4 D-клетка). Следовательно, точечные особенности бифуркационных диаграмм общих трехпараметрических семейств имеют вид, изображенный на рис. 114. Особенность а4 называется ласточкиным хвостом: эта поверх- поверхность задается уравнением А(а, Ь, с) = 0, где А — дискриминант мно- многочлена z4 + az2 + bz + с. Строго говоря, все сказанное выше относится к комплексному случаю, так что изображенные на рис. 114 поверхности следует рассматривать как комплексные. Рис. 114
§30. Матрицы, зависящие от параметров 287 Версальные деформации вещественных матриц построены Д. М. Га- линым (Д. М. Галин. О вещественных матрицах, зависящих от парамет- параметров. УМН, 27, 1 A972), 241-242). Построение производится следующим образом. Пусть вначале вещественный оператор в Ж2п, для которого ищется версальная деформация, имеет единственную пару комплекс- комплексно сопряженных собственных чисел х + iy (у ф 0) с жордановыми клетками размеров п\ ^ ггг ^ ..., так что п\ + ггг + ... = п. Тог- Тогда в некотором вещественном базисе в Ш271 матрица оператора имеет такой же вид, как матрица овеществления комплексного жорданового оператора Aq : Сп —> Сп с единственным собственным числом х + iy и жордановыми клетками размеров п\ ^ ггг ^ ..., т. е. вид X -уЕ уЕ X B) где X — верхнетреугольная жорданова вещественная матрица с собст- собственным числом х и клетками размеров п\ ^ П2 ^ ..., а Е — единичная матрица порядка п. Оказывается, е качестве минимальной версалъной деформации ве- вещественной матрицы Aq можно взять овеществление минимальной комплексной версалъной деформации комплексной матрицы Aq. Например, в качестве минимальной версальной деформации ве- вещественной матрицы четвертого порядка с двумя жордановыми клет- клетками второго порядка и с собственными числами х ± iy можно взять четырехпараметрическую деформацию, которая получается при ове- овеществлении комплексной версальной деформации z 1 0 z 0 0 Ai A2 т.е. деформацию с параметрами pi, рг, Ti, Т2: /00 0 0 \ , Pi P "*" 0 0 и Р2 (х 1 -у 0 \ О ж 0 -у у 0 ж 1 О у 0 ж О Pi -Т2 О ^ = pfc + гтк. Каждая вещественная матрица подобием над полем вещественных чисел приводится к блочно-диагональному виду, в котором каждому вещественному собственному числу отвечает вещественная жорданова
288 Глава 6 матрица, а каждой паре комплексно сопряженных собственных чисел — блок вида B). Версальная вещественная деформация приведенной к такому виду матрицы (с наименьшим возможным числом параметров) получится, если заменить каждый блок его минимальной версальной деформацией. Минимальное число параметров вещественной версальной деформации дается, таким образом, формулой А где суммирование распространяется на все v собственных чисел — как вещественных, так и комплексных. Явные формулы версальных деформаций и таблицы бифуркацион- бифуркационных диаграмм вещественных матриц приведены в работе Галина для d — v ^ 3. Для приложений в механике составлены таблицы версаль- версальных деформаций симплектических и гамильтоновых (инфинитезималь- но симплектических) матриц (имеются в виду деформации, сохраняю- сохраняющие симплектичность): Д. М. Галин. Версальные деформации линейных гамильтоновых систем. Труды семинара им. И.Г.Петровского. 1975, вып. 1, стр. 63-74. Одно из применений полученных бифуркационных диаграмм состо- состоит в следующем. Предположим, что при изучении какого-либо явления получилась бифуркационная диаграмма иной структуры, чем перечис- перечисленные здесь. Тогда, вероятно, произошло одно из двух: либо при идеа- идеализации явления пропущено что-то существенное, что может качест- качественно изменить структуру диаграммы, либо имеются какие-нибудь специальные причины для дополнительной кратности спектра или для нетрансверсальности к жордановой стратификации (например, симмет- симметрия или гамильтоновость задачи). Е. Задача о классификации особенностей декремент-диаграмм. В качестве одного из приложений версальных деформаций матриц мы рассмотрим здесь решение следующей задачи. Пусть дано семейство линей- линейных однородных автономных дифференциальных уравнений. Как известно, асимптотика решений при t —> +оо определяется тем собственным числом оператора, задающего уравнение, которое имеет наибольшую вещественную часть. Спрашивается, как эта вещественная часть зависит от параметров? Указанная вещественная часть (со знаком минус) в технике называется декрементом. Таким образом, наша задача состоит в исследовании поведения декремента при изменении параметров системы.
§30. Матрицы, зависящие от параметров 289 Поведение декремента при изменении параметров удобно описывать, указывая на плоскости (в пространстве, ...) параметров линии (поверхнос- (поверхности, ...) уровня декремента. Семейство линий уровня декремента на плоскос- плоскости значений параметров мы будем называть декремент-диаграммой. Вид декремент-диаграммы сильно меняется от семейства к семейст- семейству; в некоторых случаях декремент-диаграмма может иметь весьма слож- сложные особенности. Оказывается, однако, что в семействах общего положения могут встречаться только некоторые простейшие особенности декремент- диаграмм: все более сложные особенности распадаются при малом шевелении семейства. В настоящем параграфе описаны все особенности декремент-диаграмм двухпараметрических семейств общего положения. Классификация особенностей декремент-диаграмм общего положения может оказывать при исследовании зависимости систем от параметров такие же услуги, какие классификация особых точек общего положения оказывает при исследовании фазовых портретов. Появление на декремент-диаграмме особенности необщего положения должно вызывать тревогу: оно может объясняться специальной симметрией семейства или может свидетельствовать о неадекватной идеализации («не- («некорректности»), при которой неучтенные в уравнениях малые эффекты (на- (например, «паразитные связи» в радиотехнике) способны качественно менять картину. Классификация особенностей двухпараметрических декремент-диаграмм общего положения содержит, в частности, исследование особенностей гра- границы области устойчивости в трехпараметрических семействах линейных уравнений общего положения (поверхности нулевых декрементов). Полученные результаты можно применять и к нелинейным системам, имеющим стационарные точки, гладко зависящие от параметров: декремент линеаризации нелинейной системы в такой точке будет, как функция па- параметров, иметь лишь простейшие особенности (в случае семейства общего положения). При применении полученных результатов к нелинейным системам нуж- нужно, однако, исключить часть границы области устойчивости, соответствую- соответствующую нулевым корням, так как на ней теряется гладкая зависимость стацио- стационарной точки от параметров. Таким образом, описание особенностей границы области устойчивости для нелинейных систем общего положения (и описание декремент-диаграмм в окрестности точек этой границы) требует дополни- дополнительного исследования. Мы вернемся к этому вопросу в следующих парагра- параграфах. При изучении итераций отображений, а также уравнений с периодичес- периодическими коэффициентами или движений в окрестности периодической траекто- 19 В. И. Арнольд
290 Глава 6 рии роль декремента играет наибольший из модулей собственных чисел. Если этот модуль отличен от единицы, то его особенности (как функции от пара- параметров в семействе общего положения) такие же, как у декремента семейства общего положения. Поэтому далее рассматривается только декремент. При исследовании модулей собственных чисел в нелинейных задачах указанных только что типов результаты настоящего параграфа применимы вне границы устойчивости, и в тех точках границы, для которых единица — не собственное число. Ж. Декремент-диаграммы. Рассмотрим семейство линейных операторов А в евклидовом простран- пространстве Мга, гладко зависящих как от параметра от точки Л пространства пара- параметров Л, А ( \\ ТВ>га i. ТВ>га Определение. Инкрементом1 семейства назовем функцию / от пара- параметра, значение которой в точке Л равно наибольшей вещественной части собственных чисел оператора А(Х): /(А)= lim U t-y+oo t A(\)t Функция / непрерывна, но не обязательно дифференцируема. Наша задача — изучение особенностей функции / для двухпараметрических семейств обще- общего положения. Таким образом, пространством параметров Л можно считать плоскость R2 или область на плоскости. Семейство линий уровня функции / на плоскости Л мы будем называть декремент-диаграммой. Черточка поперек линии уровня («бергштрих» топо- топографов) будет указывать направление ската, т. е. направление, по которому / уменьшается. Иными словами, черточка направлена в сторону повышения устойчивости. Пример. Рассмотрим дифференциальное уравнение z — xz + yz, зависящее от двух параметров (ж, у). Матрица соответствующей системы имеет вид 'О 1Ч (х, у) = гВ технике величина |/| называется декрементом при / < 0 и инкрементом при / > 0.
§30. Матрицы, зависящие от параметров 291 Декремент-диаграмма изображена на рис. 115. Парабола 4ж + у2 = 0 де- делит плоскость (ж, у) на две части. В каждой из них инкремент — гладкая у функция. Слева от параболы собственные числа комплексное и / = —. Справа собственные числа вещественные, / = мента — касательные к параболе лучи. . Линии уровня инкре- 1 1 > У 1\2^3 Рис. 115 Все точки параболы являются особыми точками декремент-диаграммы. Им соответствуют матрицы А с жордановой клеткой порядка 2. При пере- пересечении параболы слева направо линейное изменение инкремента сменяется коренным. Ясно, что указанная здесь особенность неустранима малым шевелением семейства. Существуют и другие неустранимые особенности; наша цель — их полное перечисление. 3. Страты коразмерности один и два в пространстве матриц. Если максимальную вещественную часть имеет одно вещественное соб- собственное число матрицы А(\о) или одна пара комплексно-сопряженных соб- собственных чисел1, то инкремент — гладкая функция в окрестности рассмат- рассматриваемого значения параметра До. Гладкость теряется лишь в случае, когда собственное число с максималь- максимальной вещественной частью не единственно. Матрица, у которых максималь- максимальную вещественную часть имеют несколько собственных чисел сразу, образу- образуют замкнутое полуалгебраическое2 подмногообразие F в пространстве Шп 1 Здесь и дальше считается, что числа комплексно сопряженной пары не вещест- вещественны. 2Полуалгебраическим подмногообразием линейного пространства называется ко- конечное объединение множеств, заданных конечными системами полиномиальных уравнений и неравенств.
292 Глава 6 всех матриц порядка п. Коразмерность этого многообразия равна единице, а его дополнение состоит из двух открытых компонент: D\. Страт (а). Максимальную вещественную часть имеет ровно одно вещественное собственное число. Т>2- Страт (а ± га;). Максимальную вещественную часть имеет ровно одна комплексно сопряженная пара. Многообразие F легко стратифицировать. Страты максимальной раз- размерности (коразмерности 1) исчерпываются следующим списком: F\. Страт (а2). Максимальную вещественную часть имеют ровно два совпадающих собственных числа; они вещественны и им отвечает жорданова клетка порядка 2. F2- Страт (a, a±iu)). Максимальную вещественную часть имеют ровно три собственных числа: одно вещественное и одна комплексно сопряженная пара. Fs- Страт (a±«u;i, a ±«0:2). Максимальную вещественную часть имеют ровно две разные комплексно сопряженные пары. Ясно, что страты Fi, F2, F3 — гладкие регулярные незамкнутые непере- непересекающиеся подмногообразия коразмерности один в пространстве всех мат- риц Мга . Остаток F \ (Fi U F2 U F3) многообразия F (многообразия матриц с неединственным собственным числом с максимальной вещественной час- частью) является замкнутым полуалгебраическим подмногообразием коразмер- 2 ности два в пространстве всех матриц Шп . Страты максимальной размер- 2 ности многообразия F\ (Fi UF2 UF3) имеют коразмерность 2 в Шп . Их легко перечислить: G\. Страт (а3). Максимальную вещественную часть имеют ровно три собственных числа; они вещественны и им отвечает жорданова клетка по- порядка 3. (?2- Страт ((а±го;J). Максимальную вещественную часть имеют ровно две совпадающие пары комплексно собственных чисел; им отвечают жорда- новы клетки порядка 2. (?з- Страт (а2, а±га;). Максимальную вещественную часть имеют ров- ровно четыре собственных числа; двум вещественным отвечает жорданова клет- клетка порядка 2, а два комплексных образуют комплексно сопряженную пару. d. Страт (а, а ± iuii, a ± гс^г). Максимальную вещественную часть имеют ровно пять собственных чисел: одно вещественное и две разные комп- комплексно сопряженные пары. (?5- Страт (a±iuii, a±iui2, а±шз). Максимальную вещественную часть имеют ровно три разные комплексно сопряженные пары. Страты Gi — G5 являются регулярными незамкнутыми непересекающи- непересекающимися подмногообразиями1 коразмерности 2 в пространстве всех матриц Шп . xBce многообразия Di, Fi, Gi связны при достаточно больших п. Исключения:
§30. Матрицы, зависящие от параметров 293 Остаток F \ UFi \ UG; является замкнутым полуалгебраическим подмногооб- 2 разием коразмерности 3 в Rn . Из слабой теоремы трансверсальности (§ 29) вытекает Следствие. В двухпараметрических семействах матриц общего по- положения не встречаются матрицы, имеющие наборы собственных чисел с максимальной вещественной частью, отличные от перечисленных вы- выше (Di, Fi, Gi) эти же наборы встречаются лишь трансверсалъно. Таким образом, в семействе общего положения наборы собственных чисел коразмерности 1 (Fi) встречаются на гладких кривых в плоскости пара- параметров, имеющих особые точки лишь в тех точ- точках плоскости параметров, где появляются набо- наборы коразмерности 2 (Gi). Последнее обстоятельство может иметь место лишь в изолированных точках плоскости параметров. Отрезки F\ и i<2, если присоединить к ним их Рис. 116 особые точки Gi, образуют кривые, которые делят плоскость параметров на части двух типов: D\ и ?>2- Нетрудно сообразить, что все отрезки Fa лежат в части D2. Далее, точки Gi(a3) лежат на стыке Fi(a2) и F2(a, a ± ш). G2((a ± га;J) примыкают к F^(a ± го^г). (?з(а2, ol ± ш) — на стыке Fi(a2), F2(a, a ± га;), F^(a ± га;^). Ga(ol, а ± ги>1,2) — на стыке ^г(а, а ± га;) и F^(a ± «o;i, г). Gb(ot ± iui, г, з) примыкают к Fs(a ± «o;i,2). На рис. 116 изображен (гипотетический) пример конфигурации, которую могут образовывать эти линии на плоскости параметров в семействе общего положения. И. Строение декремент-диаграмм вблизи точек стратов кораз- коразмерности О и 1. На дополнении к множеству особенностей F инкремент / — гладкая функция параметров. Однако у декремент-диаграмм в некоторых точках это- этого дополнения могут быть особенности: это — критические точки функции /. Вне F инкремент семейства общего положения имеет лишь простые кри- критические точки, т. е. точки следующих трех типов, превращающихся в 6, если различать случаи вещественных корней (D±) и комплексных (D2): D°. Минимум. В окрестности рассматриваемой точки плоскости пара- параметров можно выбрать гладкие координаты (ж, у) так, что инкремент будет иметь вид / = const + х2 +у2. при п — 2 — D2 и i*i, при п — 4 — F$, G2, G3, при п = 6 — Gs имеют по две компоненты.
294 Глава 6 D]. Седло. В подходящих координатах / = const + ж2 — у2. D2. Максимум. / = const — ж2 — у2. Изучим теперь поведение функции / вблизи неособых точек множест- множества F, т. е. вблизи внутренних точек кривых Fi плоскости параметров. Здесь следует различать два случая: точка кривой Fi может быть некритической для инкремента, рассматриваемого как гладкая функция на этой кривой, но может быть и критической. Из теоремы трансверсальности вытекает, что в семействах общего по- положения критические точки сужений инкремента на кривые Fi могут быть только невырожденными максимумами или минимумами. Соединяя эту информацию с явными формулами версальных семейств матриц из п. Б, мы без труда при- приходим к следующим нормальным формам инкремента вблизи точек стратов коразмерности один. Теорема. В окрестности некритической точки сужения инкремента семейства общего положения на кривую Fi можно выбрать гладкие координаты (ж, у) на плоскости параметров так, что инкремент / примет один из следующих трех видов (рис. 117): Случай F® (жорданова клетка): О, О, 0. Рис. 117 Случай F° и F® (простой обгон): f — const + ж + \у\. Кривые F® и F^ разделяют области вещественных и комплексных кор- корней D\ и D2- Линии уровня инкремента подходят к кривой Fl со стороны вещественных корней с касанием, а со стороны комплексных — трансвер- сально. К кривым Fb и Fa линии уровня декремента подходят в точках F^, F$ трансверсально с обеих сторон. Угол линий уровня, меньший 180°, образую- образующийся на линиях излома Fi, во всех случаях содержит направление умень- уменьшения / вдоль линии. Теорема. В окрестности критической точки сужения инкремента се- семейства общего положения можно выбрать координаты (ж, у) так, что ин- инкремент примет один из ниже перечисленных 12 видов (рис. 118). Случаи F^ и F?, к — 1, ... , 4 (условный экстремум при обгоне): / = const + ex2 + р(у) + \у\, е = (—1) ,
§30. Матрицы, зависящие от параметров 295 Рис. 118 где (р(у) = ау + ... — гладкая функция, о > 0, а ф 1. Четыре значения к получаются при комбинации двух знаков е и двух возможностей для о: к 1,2 @,1) 3,4 A, +оо) Нечетные к соответствуют условному максимуму, а четные — минимуму. Чтобы получить ясное представление о виде декремент-диаграммы, доста- достаточно рассмотреть случай <р(у) = ау: в этом случае линии уровня / состоят из кусков двух парабол, сдвигаемых вдоль оси у. Случай Fi, к — 1, ... , 4 (условный экстремум с жордановой клет- клеткой а2 / = const + ex + <p(y) + 0, если у > °' если у ^ 0. Здесь е — ±1, (р(у) — ау + ... — гладкая функция, а ф 0. Четыре значения к получаются при комбинациях знаков е и а: к знак е, знак о 1 Нечетные к соответствуют условному максимуму, а четные — минимуму. Чтобы получить ясное представление о виде декремент-диаграммы, доста- достаточно рассмотреть случаи ip(y) = ±у.
296 Глава 6 Наша теорема утверждает, что никаких других особенностей во внут- внутренних точках кривых F, кроме особенностей перечисленных 15 ви- видов Ff A5 = 3 + 12), инкремент двухпараметрического семейства общего положения не имеет: если в некотором семействе есть другие особенности, то от них можно избавиться сколь угодно малым шевелением семейства. Осо- Особенности же Ff, очевидно, неустранимы. К. Строение декремент-диаграмм вблизи стратов коразмер- коразмерности 2. При исследовании особенностей стратов коразмерности 2 в двухпарамет- рических семействах общего положения можно рассматривать только «са- «самые невырожденные» случаи, так как любое вырождение повышает кораз- коразмерность и особенность становится устранимой. Комбинируя теорему трансверсальности и явные формулы для версаль- ных семейств матриц из п. Б, мы приходим к следующим нормальным фор- формам инкремента вблизи точек стратов коразмерности 2. Теорема. В окрестности точки каждого страта коразмерности 2 (d в обозначениях п. 3) на плоскости параметров семейства общего по- положения можно выбрать гладкие координаты (ж, у) так, что инкремент f примет один из нижеперечисленных 18 видов (рис. 119). Случай Gf (жорданова клетка порядка 3): / = <р(х, у) + \(х, у), где Л — наибольшая из вещественных частей корней кубического уравне- уравнения Л3 = жЛ + у, a ip — гладкая функция, такая, что ^-@, 0) = а ф 0. Вид декремент-диаграммы определяется знаком числа а. Знак «+» или «—» в Gf отвечает а > 0 и а < 0 соответственно. Чтобы составить себе ясное представление о виде декремент-диаграммы, достаточ- достаточно рассмотреть случаи ip — ±ж. К точке х — у — 0 подходят две касающиеся в ней особые кривые: луч F2 (у = 0, х < 0) и половина полукубической пара- параболы F\ Dж3 = 27у2, у < 0). Эти две кривые отделяют область комплексно- сопряженных корней Т>2 (выпуклую) от области вещественных корней D\. При движении вдоль границы областей D\ и Х)г инкремент / в случае а > 0 меняется монотонно, а в случае а < 0 имеет в точке G^[ минимум. Со сторо- стороны D\ линии уровня / касаются полукубической параболы F±. Случай Gf (комплексная пара жордановых 2-клеток): / = ip(x, у) + | Re л/х + iy\. Здесь Re — вещественная часть, ip — гладкая функция, такая, что -д—@,0) = а ф 0. Вид декремент-диаграммы определяется знаком числа а.
§30. Матрицы, зависящие от параметров 297 Aw 2 V D\K F )/ 2 A 3 \ A У \ G+, У g; ">i X У у У \ G+2 X A D2 i У G3 \ >-- A Ъ Dx Ps u2 / У г3 G3 2 D2Fu Fs\ D2 У X Gl A D2 / f Gl f\F2 *x D2Fyv G3 4 if ° D2 У X "F ^3 \ D1 \ 'x % D^F3 fJ d2 °2 \/ g; F^ F2XD> G4 -^з F2r A F \ D2 Gj a]A-f3 f37 XA Fg D2 G4 a])h-f2 j;7 a G42 ; V x FAD2 Ф G5 -^3 G5 П чЛ Р ^2 ' 3 Рис. 119 Знаки «+» и «—» в Gf отвечают а > 0 и а < 0 соответственно. Чтобы составить себе ясное представление о виде декремент-диаграммы, достаточно рассмотреть случаи <р = ±ж. К точке х = у = 0 подходит (и кончается в ней) луч F3 (у = 0, х < 0). В случае а < 0 функция / имеет в точке G^~ (ж = у = 0) минимум. В случае а > 0 точка G^ (ж = у = 0) — топологически неособая для функции /. Проходящая через эту точку линия уровня функции / имеет особенность полукубического типа. Случай Gs (k = 1, ... , 6; столкновение комплексной пары с жордановой клеткой): / = const + у + max х, ip(x, у), если ж ^ 0, 0, <р(х, у), если ж ^ 0. Здесь <р(х, у) = ах + by + ... — гладкая функция, а ф 0, Ъ ф 0, Ъ ф — 1. Шесть значений & получаются при комбинировании двух возможностей для знака а и трех интервалов изменения Ъ: знак а интервал Ъ @,+оо) @,+оо) (-1,0) (-1,0)
298 Глава 6 Чтобы составить себе ясное представление о виде декремент-диаграммы, достаточно взять функцию <р линейной. К точке подходят три гладких лу- луча Fi, F2, F3, причем F± и i<2 идут навстречу друг другу (с касанием первого порядка), a Fs подходит трансверсально со стороны комплексных корней, Х)г. В случае G| (т. е когда о < О, Ъ < — 1) инкрекент имеет в точке х = у = О минимум; в остальных случаях точка G\ (к ф 5) — топологически неособая точка функции /. Случай G% (к = 1, 2, 3) (двойной обгон): ip = const + x + max(|y|, <p(x, у)), где (р(х, у) — ах + by + ... — гладкая функция, о<0, & > О, а + 1 ф ±&. Три значения к для G\ соответствуют интервалам изменения а: к условие на о 1 Ъ- 1 < а 2 -Ь-1<а <Ь-1 3 а < -Ъ- 1 Чтобы составить себе ясное представление о виде декремент-диаграммы, достаточно взять функцию <р линейной. В каждом из трех случаев (к = 1, 2, 3) в точке G\ сходятся трансвер- трансверсально три гладкие ветви кривой F%. В последнем случае эта точка — мини- минимум инкремента, в первом и втором — топологически неособая точка. При подходе к точке G\ по к из трех лучей инкремент убывает, а по остальным растет. Случай G\ (к = ±1, ±2, 3) (двойной обгон с участием вещественного корня). Инкремент дается той же формулой, что в случаях G%, но приходит- приходится различать больше вариантов в зависимости от того, какому из векторов соответствует вещественный корень. Отрицательным к соответствуют случаи, в которых на линии Fs (на которой сталкиваются комплексные пары) при подходе к точке G\ декремент растет. Два других луча — ветви кривой Fi. Л. Обсуждение. Рассматривая перечисленные выше нормальные формы, можно прийти к ряду выводов общего характера о строении декремент-диаграмм как в ма- малом, так и в целом. Прежде всего из наших теорем вытекает Следствие. Инкремент /: Л —> R двухпараметрического семейства общего положения топологически эквивалентен гладкой функции, имеющей лишь простые критические точки. А именно, точки минимума — это точки типов ?)°, Ff, G±2, Gl, Gi,5- Топологически эквивалентны седлу точки D] и Ff. В окрестности точек максимума {D?) инкремент — гладкая функция. Точки всех остальных типов топологически неособые.
§30. Матрицы, зависящие от параметров 299 Из сформулированного следствия вытекают, очевидно, неравенства для чисел особых точек разных типов. В частности, если какая-либо замкнутая линия уровня инкремента ограничивает односвязную область, то суммарное число точек типов D®'2, Ff, G^2-> G%, Gl,5 внутри этой области на еди- единицу больше числа точек Dj, Ff. Неизвестно, переносится ли утверждение следствия на /-параметрические семейства с I > 2.1 Из того, что отрезки F\ и i<2 вместе образуют замкнутые кривые, и из описания особенностей на концах отрезков Fa вытекает Следствие. Если пространство параметров Л — замкнутое двумерное многообразие, то числа точек типов Gi и G$ одинаковой четности, и сум- суммарное чисел точек типов (?2, Сз, GU, Gs четно. Если рассматривать в качестве пространства параметров Л компакт- компактную область с краем, трансверсально пересекающим Fi и не проходящим че- через точки Gi, то результат изменится следующим образом: суммарное число точек типов G\ и (?з одинаковой четности с суммарным числом точек пе- пересечения края с F\ и i<2, а суммарное число точек типов G2, Gs, G4, G5 — с числом точек пересечения края с F^. Проведенное исследование инкремента позволяет, в частности, из- изучить особенности границы устойчивости (т. е. линии нулевых инкрементов) на плоскости параметров двухпараметрических систем общего положения. Из наших теорем вытекает Следствие. Граница устойчивости общего двухпараметрического се- семейства матриц состоит из гладких дуг, пересекающихся трансверсально в своих концевых точках. Заметим, что точки излома границы устойчивости могут быть, по клас- классификации пп. И и К, типов Fi («жорданова 2-клетка») или F®, F$ («простой обгон»). Каждая из дуг границы устойчивости продолжается поэтому за свои концевые точки без потери гладкости. При этом суммарное число точек из- излома типов Fi и F® на каждой замкнутой компоненте границы устойчивости всегда четно. Заметим также, что проведенный анализ особенностей инкремента двухпараметрических семейств достаточен для исследования границы устой- устойчивости в трехпараметрических семействах. В самом деле, особые точки стратов коразмерности 3, а также крити- критические точки сужений инкремента на страты коразмерности 0, 1 и 2 по 1Заметим, что в случае I = 2 особенности инкремента общего семейства такие же, как особенности наибольшей вещественной части корня алгебраического уравнения, коэффициенты которого — функции общего положения от I параметров. При I ^> 3 это уже не так: инкремент может иметь более сложные особенности.
300 Глава 6 Heycm.^ Heycm-t \ / Уст. Уста. F Рис. 120 теореме трансверсальности можно удалить с границы устойчивости малым шевелением семейства. Таким образом, граница устойчивости общего семей- семейства состоит из гладких поверхностей, а ее особенности лежат на кривых, по которым граница устойчивости пересекается с поверхностями типов F{, и в точках пересечения границы устойчивости со стратами d (последние в общих трехпараметрических семействах проявляются в виде кривых). Двигаясь вдоль такой кривой Gi, мы можем рассматривать наше трехпа- раметрическое семейство как однопараметрическое семейство двухпарамет- рических (два параметра — координаты в трансверсальной к d площадке, один — координата t вдоль Gi). Рассматривая нормальные формы пп. И и К, мы должны теперь считать все постоянные const и произвольные функции ip гладко зависящими от параметра t. Более того, в случае общего положения
§31. Бифуркации особых точек векторного поля 301 мы можем принять за параметр z сами эти функции ip(ж, у, t). Мы приходим, таким образом, к следующему выводу. Следствие. Особенности границы устойчивости общего трехпарамет- рического семейства матриц такие же, как особенности графиков инкремен- инкрементов общих двухпараметрических семейств1. Эти особенности, с точностью до диффеоморфизма2, исчерпываются следующим списком (рис. 120): Двугранный угол (Fi): \у\ + z = 0. Трехгранный угол (Сз,4,б): z + тах(ж, \у\) = 0. Тупик на ребре (бгг): z + | Re у/х + гу\ = 0. {Эта поверхность в М3 диффеоморфна поверхности, заданной уравнени- уравнением XY2 = Z2, где X > 0, Y > 0.) Излом ребра (d): z + X(x, у) = 0, где Л — наибольшая из вещественных частей корней уравнения Xs = хХ + у. (Эта поверхность в М3 диффеоморфна поверхности, заданной уравнением X2Y2 — Z2, где X ^ 0, Y ^ 0.) Углы границы устойчивости направлены всегда наружу, вклиниваясь в область неустойчивости. По-видимому, это — проявление весьма общего принципа, согласно которому все хорошее хрупко. Из сказанного вытекают также некоторые глобальные свойства границы устойчивости. Например, если эта граница замкнута, то суммарное число вершин типов (Gi, « > 1) четно, равно как и число вершин типов G\ и Gs вместе. Доказательства приведенных теорем можно найти в статье: В. И. Ар- Арнольд. Лекции о бифуркациях и нереальных семействах. УМН 27, 5 A972), 119-184. § 31. Бифуркации особых точек векторного поля В этом параграфе рассматриваются однопараметрические семей- семейства дифференциальных уравнений. Исследуются бифуркации особых точек для семейств общего положения. А. Кривая особых точек. Рассмотрим векторное поле, гладко зависящее от параметра. Пред- Предположим, что при некотором значении параметра поле имеет особую точку. Поставим себе вопрос: что будет происходить с особой точкой при изменении параметра? 1Точно так же особенности границы устойчивости (п + 1)-параметрических се- семейств — такие же, как у графиков инкрементов п-параметрических. 2Речь идет об отображении, продолжаемом до диффеоморфизма окрестности по- поверхности.
302 Глава 6 Теорема. Особая точка векторного поля, гладко зависящего от параметра, сама гладко зависит от параметра, пока все собственные числа линейной части поля в особой точке отличны от нуля. Доказательство. В окрестности изучаемой точки и изучаемого значения параметра семейство полей в n-мерном фазовом пространстве задается п функци- функциями от п + 1 переменной (от п фазовых координат и от параметра е). Особые точки задаются системой п уравнений относительно п + 1 пе- переменной, v(x, e) = 0. По теореме о неявной функции, эти уравнения локально определяют гладкую кривую х = j(e), если в рассматривае- рассматриваемой начальной точке определитель ^ отличен от нуля. Но этот опре- ох делитель равен произведению собственных чисел линеаризации поля в особой точке. Он отличен от 0 по предположению. ¦ Замечание. Особые точки, в которых все собственные числа ли- линеаризованного поля отличны от нуля, называются невырожденными. Таким образом, если поле гладко зависит от параметра, то его особые точки гладко зависят от параметра, пока они остаются невырожден- невырожденными. Проведенное выше доказательство сохраняет силу при любой размерности пространства параметров. У поля общего положения все особые точ- точки невырождены. Однако если рассматривает- рассматривается семейство векторных полей, то при неко- некоторых значениях параметра могут возникать вырождения, неустранимые малым шевелением семейства. ? Исследуем вырождения в однопараметри- ческих семействах общего положения вектор- векторных полей в n-мерном пространстве. Рассмотрим (п+1)-мерное пространство, являющееся прямым про- произведением фазового пространства и оси значений параметра е. Будем обозначать точку фазового пространства буквой х. Наше семейство за- задает семейство дифференциальных уравнений х = v(x, e). Рассмотрим в нашем п + 1-мерном пространстве множество, обра- образованное особыми точками уравнений семейства при всех значениях Рис. 121
§31. Бифуркации особых точек векторного поля 303 параметра (рис. 121): Г = {х, е: v(x, e) =0}. Теорема. Для семейства общего положения множество особых точек является гладкой кривой. Здесь и далее слова «семейства общего положения» означают «се- «семейства из некоторого всюду плотного множества в пространстве всех семейств»; всюду плотное множество, о котором идет речь, открытое, если область определения семейства компактна или если семейства рас- рассматриваются в тонкой топологии (см. § 29); во всяком случае это всю- всюду плотное множество является пересечением счетного количества от- открытых множеств. Доказательство. Теорема вытекает из теоремы трансверсальности (§ 29), или из леммы Сарда (§ 10). Действительно, по теореме о неявной функции, Г — локально глад- гладкая кривая, если 0 — не критическое значение локального отображения Щ,п+1 —»• Ш.п, (х, е) i—> v(x, e). Но для отображения общего положения значение 0 не критическое. ¦ Замечание. В этой теореме размерность пространства парамет- параметров также несущественна. Доказанная теорема сразу исключает некоторые бифуркации особых точек. Рассмотрим, например, бифуркации, изображен- изображенные на рис. 122 слева. Из теоремы следует, что при малом шевелении семейства такие бифуркации не со- сохранятся. Действительно, легко видеть, что, вообще говоря, эти бифуркации распадаются при малом ше- шевелении одним из указанных на рис. 122 справа спо- рис -^2 собов. Если в какой-либо задаче появляются бифурка- бифуркации вида, указанного на рис. 122 слева, то это свидетельствует о том, что рассматриваемое семейство не общего положения. Это может быть связано с какой-либо особой симметрией ситуации, или же может сви- свидетельствовать о неадекватной идеализации, при которой мы пренеб- пренебрегли каким-либо малым эффектом, способным, однако, качественно
304 Глава 6 изменить поведение особых точек в зависимости от параметра. Чтобы указать, какой именно из случаев имеет место в реальной системе, при идеализации которой возникла необщая бифуркация, нужно вычислить некоторые из отброшенных при идеализации членов дифференциаль- дифференциального уравнения. Формулы следующих разделов подсказывают, какие именно члены нужно вычислять. Б. Бифуркационные значения параметра. Предположим, что множество особых точек семейства является гладкой кривой (rank = п). Рассмотрим отображение проекти- д{х, е) рования этой гладкой кривой на ось значений параметра. Точки, в ко- которых кривая плохо проектируется на ось е — это как раз вырожденные особые точки. Действительно, по теореме о неявной функции в окрест- окрестности невырожденной особой точки кривая особых точек является гра- графиком гладкой функции от параметра. Определение. Значение параметра, которому соответствует вы- вырожденная особая точка, называется бифуркационным значением па- параметра, а сама вырожденная особая точка в прямом произведении фазового пространства на ось значений параметра — бифуркационной точкой. Рассмотрим значение параметра е как функцию на кривой особых точек. Бифуркационные значения параметра — это критические значе- значения этой функции, а бифуркационные точки — это критические точки функции (точки, где дифференциал функции равен 0). Критическая точка функции называется невырожденной, если вто- второй дифференциал функции в этой точке невырожден (в данном случае речь идет о функциях одной переменной, так что невырожденность вто- второго дифференциала означает его отличие от нуля). Соответствующая бифуркационная точка называется тогда невырожденной бифуркацион- бифуркационной точкой. Определение. Бифуркационное значение параметра называется регулярным, если ему соответствует ровно одна бифуркационная точка, и притом невырожденная. Теорема. Для однопараметрических семейств общего положения все бифуркационные значения параметра регулярны. Если фазовое про- пространство компактно, то бифуркационные значения параметра изоли- изолированы.
§31. Бифуркации особых точек векторного поля 305 Доказательство. Утверждение легко выводится из теоремы трансверсальности, де- детали представляются читателю. ¦ Замечание. Теорема означает, что по ме- мере изменения параметра особые точки семейст- семейства общего положения могут лишь попарно съе- съедать друг друга или рождаться парами, когда параметр проходит через бифуркационные зна- ? чения (рис. 121). Бифуркации этого вида устой- рис -^3 чивы (сохраняются при малом шевелении семей- семейства). Все более сложные бифуркации при малом шевелении общего ви- вида распадаются на несколько бифуркаций описанного типа (рис. 123). В. Пример: векторные поля на прямой. Рассмотрим однопараметрическое семейство векторных полей на прямой, задающее дифференциальное уравнение х = ±х2 +е, хЕШ, е ЕШ. При е = 0 это векторное поле имеет простейшую вырожденную особую точку (х = 0). При переходе параметра через регулярное бифуркацион- бифуркационное значение е = 0 происходит, в зависимости от знака перед ж2, либо взаимное уничтожение двух особых точек — устойчивой и неустойчи- неустойчивой, либо рождение пары особых точек, которые сразу же разбегаются (с асимптотикой \/f^[). Нетрудно проверить, что бифуркация в этом примере является единственной бифуркацией, неустранимой в однопараметрических се- семействах общего положения векторных полей на прямой. Определение. Пусть даны два семейства векторных полей, за- зависящих от параметра. Семейства называются топологически эквива- эквивалентными, если существуют гомеоморфизм пространств параметров и непрерывно зависящее от параметра семейство гомеоморфизмов фазо- фазового пространства, переводящие семейство ориентированных фазовых кривых первого семейства при каждом значении параметра в семейство ориентированных фазовых кривых второго семейства при соответству- соответствующем значении параметра. Заметим, что гомеоморфизмы, о которых идет речь в этом опреде- определении, определяют гомеоморфизм прямых произведений фазовых про- 20 В.И.Арнольд
306 Глава 6 странств на пространства значений параметров (ж, е) н-)- (h(x, e), <p(s)), переводящий фазовые кривые системы х = v(x, е), ё = 0 в фазовые кри- кривые второй системы такого же вида. Аналогичным образом определяется эквивалентность ростков се- семейств в точке. Если пара (жо, ?о) — точка фазового пространства и точка пространства параметров, то гомеоморфизмы, осуществля- осуществляющие эквивалентность, должны определять гомеоморфизм (ж, е) н-)- н-)- (h(x, e), (p(s)) некоторой окрестности точки (xq, Eq) в прямом про- произведении. Теорема. В окрестности невырожденной бифуркационной точки однопараметрическое семейство векторных полей на прямой эквива- эквивалентно ростку семейства, задающего уравнение х = х2 + е в точке х = 0, е = 0. Доказательство. Функция v(x, e), задающая поле, меняет знак на кривой Г. Выберем начало координат (ж, е) в бифуркационной точке. Ввиду невырожден- невырожденности этой точки, уравнение кривой Г имеет вид е=Сх2+О(\х\3), С^О. Отсюда непосредственно вытекает доказываемое утверждение. ¦ Доказанная теорема вместе с теоремой пункта Б доставляет полное топологическое описание бифуркаций особых точек векторных полей на прямой в семействах общего положения с одним параметром. Г. Бифуркации периодических решений. Совершенно таким же образом исследуются бифуркации неподвиж- неподвижных точек гладких отображений, а также бифуркации периодических решений дифференциальных уравнений (бифуркации замкнутых фазо- фазовых или интегральных кривых). Условие невырожденности неподвиж- неподвижной точки отображения состоит в том, что все собственные числа ли- линеаризации отличны от единицы. В случае периодических решений не должны обращаться в единицу собственные числа линеаризации функ- функции последования (то есть собственные числа оператора монодромии, определенного уравнением в нормальных вариациях вдоль рассматри- рассматриваемого решения). В частности, если уравнение х = v(x, е) при е = 0 имеет перио- периодическое решение х = ip{t) с периодом Т и выполнено указанное выше условие невырожденности, то при малых е существует и единственно периодическое решение х = Ф(?, е) с периодом Т(е), обращающееся в ip
§32. Версальные деформации фазовых портретов 307 при е = 0 (единственной является, конечно, фазовая кривая: начало отсчета времени можно менять). Замечание. Поиск периодического решения Ф в виде ряда по е на- называется методом малого параметра Пуанкаре; решение <р называется порождающим решением. Аналогичный метод применим в неавтоном- неавтономном случае, когда v имеет по t период Т(е) и ищутся Т(?)-периодичес- кие решения. Задача. Найти с ошибкой порядка е2 2тг-периодическое решение урав- уравнения х = sin ж + ecost, обращающееся в х = 0 при е = 0. § 32. Версальные деформации фазовых портретов В этом параграфе определяются топологически нереальные дефор- деформации фазовых портретов и указывается их явный вид для простейших вырожденных особых точек. А. Теория локальных бифуркаций и локальная качествен- качественная теория. Как уже указывалось выше, вырожденные особые точки встреча- встречаются неустранимым образом в том случае, когда мы интересуемся не индивидуальным векторным полем, а семейством полей, зависящих от параметра. При этом в семействах общего положения встречаются лишь простейшие вырождения. К исследованию строения векторного поля вблизи вырожденной особой точки можно применить обычные методы качественной теории дифференциальных уравнений (см. гл. 3). Эти методы для простейших вырождении позволяют провести достаточно полное топологическое ис- исследование фазового портрета. Таким образом, мы в состоянии изучить локальный фазовый портрет как при общих значениях параметра, так и при особых значениях. В этом состоит обычный подход к задачам о семействах дифференциальных уравнений. Рассмотрение простейших бифуркаций показывает, что при таком подходе теряется самая сущность явлений, происходящих вблизи кри- критического значения параметра. Дело в том, что окрестность невырож- невырожденной особой точки, в которой фазовый портрет дается локальной те- теорией, стягивается к нулю при подходе к особому значению параметра (рис. 124), а при особом значении параметра скачком вырастает снова. В результате перестройка фазового портрета (скажем, подход соседней особой точки) остается вне области применимости локальной теории.
308 Глава 6 Рис. 124 Таким образом, локальная теория пропускает наиболее существенное явление, происходящее при особом значении параметра явление бифуркации. Итак, мы приходим к выводу, это изучение вы- вырожденных особых точек представляет реальный ин- интерес лишь в том случае, когда оно сопровождает- сопровождается исследованием семейств, в которых рассматри- рассматриваемый тип вырождения неустраним, и притом — в окрестности вырожденной особой точки в прямом произведении фа- фазового пространства и пространства параметра. Иными словами, окрестность особой точки в фазовом пространстве, в которой следу- следует исследовать фазовый портрет, не должна зависеть от параметра (не должна стягиваться к нулю при подходе параметра к особому значе- значению). Совершенно такие же рассуждения показывают, насколько опасно неверное определение числа пара- параметров, существенных для исследования изучаемой бифуркации. Например, при изучении существенно двухпараметрического явления с однопараметричес- кой точки зрения обычным будет следующее явление (рис. 125). При каждом значении неучтенного пара- параметра удается изучить бифуркации в однопараметри- ческом семействе уравнений, зависящих от второго параметра. Но ин- интервал значений второго параметра вблизи особого значения, в котором удается провести исследование, будет стягиваться к нулю при подходе неучтенного параметра к особым значениям. Рассмотрение задачи как двухпараметрической (т. е. в не зависящей от величины второго па- параметра окрестности особого значения первого параметра) позволяет исследовать локальными методами бифуркации, которые с однопара- метрической точки зрения кажутся глобальными. Примером такой двухпараметрической задачи, которая кажется на первый взгляд однопараметрической, является задача о потере устой- устойчивости замкнутой фазовой кривой. Здесь естественным параметром является модуль собственного числа оператора монодромии; второй па- параметр, обычно упускаемый из виду, — это аргумент собственного чис- числа, переходящего через единичную окружность. Мы вернемся к этому примеру в § 34. Рис. 125
§32. Версальные деформации фазовых портретов 309 Б. Топологически версальные деформации. Рассмотрим семейство дифференциальных уравнений ж = v(x, e). Локальным семейством (v; Xq, sq) мы будем называть росток ото- отображения v в точке (жо, ?о) прямого произведения фазового пространст- пространства и пространства параметров. Таким образом, каждый представитель этого ростка задан в окрестности точки (жо, So) в прямом произведении (а не в окрестности точки Жо в фазовом пространстве). Эквивалентностью локальных семейств A) (г>;жо,?о) и B) (w;yo,?o) называется росток (в точке (жо, ?о)) непрерывного отображения h, у = h(x, е), для представителей которого h( •, е) при каждом е — гомео- гомеоморфизм, переводящий фазовые кривые системы A) (в области опре- определения К) в фазовые кривые системы B), с сохранением направления движения, причем h(xo, ?о) = уо. Заметим, что при ? ф ?q точка жо не обязана переводиться отображением h( •, е) в уо. Локальное семейство C) (щ Жо, Цо) индуцируется из семейства A) с помощью ростка в точке цо непрерывного отображения ip, ? = (p(fJ.), где <р(цо) = ?о, если и и(х, fj,) = v(x, <р{ц)). Локальное семейство (г>; Жо, ?о) называется топологически орби- тально версальной (короче, просто версальной) деформацией ростка по- поля i>o = Vo(-, ?o) в точке Жо, если всякое другое локальное семейство, содержащее тот же росток, эквивалентно индуцированному из данного. Мы будем в дальнейшем иногда говорить о деформациях, эквива- лентностях, индуцированных и версальных деформациях дифференци- дифференциальных уравнений, имея в виду соответствующие понятия для вектор- векторных полей, задающих эти уравнения. Следует подчеркнуть, что существование топологически версаль- версальной деформации данного ростка векторного поля отнюдь не очевид- очевидно; легко привести примеры полей, не допускающих такой деформации с конечным числом параметров (например, нулевое поле). Однако в тех случаях, когда версальная деформация существует, найдена и изуче- изучена, получаемая информация весьма велика. Указание и исследование версальной деформации является способом концентрированного пред- представления результатов очень полного исследования бифуркаций фазо- фазовых портретов. Пример. Деформация ж = ±ж2 + ? дифференциального уравне- уравнения ж = ±ж2 версальна. Доказательство см. в предыдущем параграфе.
X У z = ± = - =z, X2+i У, :, x У z Gl el El in _ J&, ? ТЪП- K , П)Г1+ 310 Глава 6 В. Теорема сведения Шошитайшвили. Бифуркация предыдущего примера (рождение или уничтожение пары особых точек) исчерпывает бифуркации в семействах общего по- положения векторных полей на прямой (см. §31). В многомерном случае рождение или уничтожение пары особых точек — также случай общего положения. Что происходит при этом с фазовыми портретами? Оказывается, топологически версаль- ная деформация общей вырожденной осо- особой точки в Шп в случае одного нулево- нулевого характеристического числа получает- получается из уравнения предыдущего примера простой надстройкой: Рис. 126 | ж = ±г+е, х е к, eti, A) где п- и п+ — числа корней характеристического уравнения в левой и правой полуплоскостях. Например, при п = 2 эта система описывает слияние узла и седла (рис. 126). При е = 0 получается так называемый седло-узел. В § 31 мы назвали бифуркационными точками точки в прямом про- произведении фазового пространства на пространство значений параметра, для которых характеристическое уравнение имеет нулевой корень. Теорема. В пространстве однопараметрических семейств век- векторных полей всюду плотное1 множество образуют семейства обще- общего положения, которые в окрестности каждой бифуркационной точки топологически эквивалентны семейству A) в окрестности начала ко- координат. Доказательство этой теоремы удобно провести путем редукции к случаю п = 1, в котором теорема очевидна (и доказана выше). Такое сведение, позволяющее уменьшать число фазовых координат до необ- необходимого минимума, можно провести раз навсегда в самой общей си- ситуации. 1Как обычно, множество семейств общего положения является пересечением счетного числа открытых множеств и открыто в предположении компактности об- области определения семейства или при использовании тонкой топологии.
§32. Версальные деформации фазовых портретов 311 Рассмотрим локальное семейство векторных полей, зависящих от конечномерного параметра (v; Xq, ?q). Для сокращения записи будем считать, что х0 = О G Шп, е0 = О G Шк. Предположим, что поле v( •, 0) имеет особую точку х = 0 и что соответствующее характеристическое уравнение имеет п,- (соответ- (соответственно, га+, по) корней в левой полуплоскости (соответственно в пра- правой полуплоскости, на мнимой оси). Теорема. При сделанных предположениях семейство топологичес- топологически эквивалентно надстройке над семейством с фазовым пространст- пространством размерности щ. = -у уешп-, j=z, zemn+. Доказательство. Доказательство этой теоремы имеется в статье А. Н. Шошитай- швили. Бифуркации топологического типа векторного поля вблизи осо- особой точки. Труды семинара им. И.Г.Петровского 1, 1975, стр. 279-309 (см. также «Функциональный анализ и его приложения», 6, 2A972), 97-98, где теорема впервые сформулирована). Доказательство проводится по той же схеме, что доказательство те- теоремы Аносова об У-системах: основную часть доказательства состав- составляет построение пяти слоений (сжимающегося, растягивающегося, ней- нейтрального, несжимающегося, нерастягивающегося) в прямом произве- произведении фазового пространства на пространство параметров. [Параметры можно трактовать как дополнительные фазовые переменные, которым соответствует уравнение ё = 0, но при этом надо следить, чтобы при рассматриваемых заменах плоскости е = const переходили в такие же плоскости.] ¦ Существование пяти слоений было, независимо от нужд теории бифур- бифуркации, доказано также Э.А.Тихоновой (Э.А.Тихонова. Аналогия и гомео- гомеоморфизм возмущенной и невозмущенной систем с блочно-треугольной мат- матрицей. Дифференциальные уравнения 6, 7 A970), 1221-1229), а также Хир- шем, Пью и Шубом (M.W.Hirsch, С. С. Pugh, M.Shub. Invariant manifolds. BAMS 76, 5 A970), 1015-1019). Случай n+ = 0 ранее рассматривался Плис- сом (В. А. Плисе. Принцип сведения в теории устойчивости движения. Изв. АН СССР. Сер. «Матем.», 28, 6 A964), 1297-1324).
312 Глава 6 Дифференциальное уравнение редуцированной системы ? = ш(?, е) реализуется в исходной системе на некотором гладком и гладко зави- зависящем от е нейтральном подмногообразии размерности щ в фазовом пространстве. Гладкость нейтрального подмногообразия конечна (рас- (растет при е —> 0), и это подмногообразие определяется неоднозначно (как показывают простейшие примеры). Тем не менее, поведение фазовых кривых, включая всю картину бифуркаций, для полного уравнения определяется тем, что происходит на указанном нейтральном подмногообразии (и, в частности, не зависит от выбора нейтрального многообразия). А. Н. Шошитайшвили доказал также, что версальность исходной деформации эквивалентна версальности редуцированной деформации (т. е. версальности исходной деформации на нейтральном многообразии). Таким образом, при топологическом исследовании локальных вы- вырождений фазовых портретов вблизи особых точек, включая исследо- исследования всевозможных бифуркаций, можно ограничиться случаем, ког- когда все корни характеристического уравнения лежат на мнимой оси. Переход к общему случаю совершается простой надстройкой (прямым умножением на стандартное седло у = —у, z = z). Пример. Из сказанного выше вытекает, в частности, что при рож- рождении пары особых точек в однопараметрическом семействе векторных полей общего положения из одной из родившихся особых точек в дру- другую ведет одна (и только одна) фазовая кривая (для значений парамет- параметра, близких к бифуркационным). § 33. Потеря устойчивости положения равновесия Здесь исследуются бифуркации фазового портрета дифференциаль- дифференциального уравнения при переходе пары корней характеристического урав- уравнения через мнимую ось. А. Пример: мягкая и жесткая потеря устойчивости. Начнем с восходящего к Пуанкаре и Андронову примера однопара- метрического семейства векторных полей на плоскости. Мы запишем его в комплексной форме z = г(ш + ? + czz), A)
>33. Потеря устойчивости положения равновесия 313 где z = x + iy — комплексная координата на плоскости Ж , рассматри- рассматриваемой как плоскость комплексной переменной z. В предыдущей формуле со и с — вещественные ненулевые постоян- постоянные, которые можно при желании считать равными ±1; е — вещест- вещественный параметр. При всех ? точка z = 0 — положение равновесия типа фокус. Этот фокус устойчив при е < 0 и неустойчив при е > 0. При е = 0 линейное приближение дает центр; характер особой точки при е = 0 определяется знаком с: с < 0 соответствует устойчивости, с > 0 — неустойчивости. При проведенном локальном по z анализе особых точек мы замечаем, что в момент е = 0 особая точка теряет устойчивость, но пропускаем важное об- обстоятельство, связанное с этой потерей устойчивости — рождение предельно- предельного цикла (ср. рис. 129). Чтобы не делать такой ошибки, нужно рассматривать окрестность нуля в (z, е)-пространстве, а не в г-пространстве при фиксиро- фиксированном е. ?>0 Р ?<0 о—• о Рис. 127 Исследование окрестности нуля в (z, е)-пространстве удобно про- провести следующим образом. Рассмотрим функцию p(z) = z~z. Из A) на- находим уравнение для р: Полученное семейство уравнений на луче р ^ 0 легко исследовать. Кро- Кроме присутствующей при каждом е особой точки р = 0 имеется еще (если ? и с разных знаков) особая точка р = — |. При с > 0 векторное поле р имеет, в зависимости от знака е, один из указанных на рис. 127 видов.
314 Глава 6 Точке р = 0 на плоскости z отвечает начало координат, а точ- точке р = — | — предельный цикл (вещественный лишь когда знак е про- противоположен знаку с). Чтобы лучше понять ситуацию, будем откладывать по одной оси е, а по другой в обе стороны \z\. Тогда поведение цикла при изменении параметра изобразится, в зависимости от знака с, одной из двух диа- диаграмм рис. 128. Радиус цикла пропорционален, таким образом, л/Щ. Рассмотрим сначала случай с < 0. При переходе е через 0 фокус в начале координат теряет устойчивость. При е = 0 в начале координат также устойчивый фокус, но негрубый: фазовые кривые приближаются к 0 не экспоненциально (рис. 129). ?<0 ?=0 ?>0 S<0 ?=0 ?>0 При е > 0 фазовые кривые, отойдя от фокуса на расстояние, пропор- пропорциональное у/Е, наматываются на устойчивый предельный цикл. Таким образом, потеря устойчивости при переходе е через 0 в случае с < 0 про- происходит с рождением устойчивого предельного цикла, радиус которого растет как л/ё. Иными словами, стационарное состояние теряет устойчивость и возникает устойчивый периодический режим, амплитуда которого пропорциональна квадратному корню из отклонения параметра от кри- критического значения. Физики говорят в этой ситуации о мягком возбуж- возбуждении автоколебаний. В случае с > 0 (рис. 130) предельный цикл имеется при е < 0, и он неустойчив. Когда е стремится к нулю, цикл садится на положе- положение равновесия, бывшее при е < 0 устойчивым фокусом. При е = 0 фокус становится неустойчивым (неустойчивость — слабая, не экспо- экспоненциальная). При положительных е фокус неустойчив уже в линейном приближении. Этот случай потери устойчивости называется жестким возбужде- возбуждением по следующей причине.
§33. Потеря устойчивости положения равновесия 315 Представим себе, что система находится вблизи устойчивого по- положения равновесия и что при изменении параметра это положение равновесия теряет устойчивость. В случае с > 0 при подходе е к 0 с от- отрицательной стороны (или даже несколько раньше) всегда имеющиеся возмущения выкинут систему из окрестности положения равновесия, и она разом перескочит на какой-либо другой режим (например, к дале- далекому положению равновесия, предельному циклу или более сложному притягивающему множеству). Таким образом, при непрерывном изме- изменении параметра режим движения меняется скачком, жестко. В случае с < 0 амплитуда родившихся автоколебаний зависит от параметра хотя и не гладко (коренная особенность), но все же непре- непрерывно; в этом смысле режим движения меняется плавно, мягко. При исследовании уравнения A) мы существенно использовали «версальную» точку зрения: если бы вместо окрестности в (z, ^-прост- ^-пространстве мы рассматривали окрестность в ^-пространстве при фикси- фиксированном е, то мы пропустили бы предельные циклы. Это согласуется с тем, что вырождение коразмерности к следует изучать в fc-парамет- рическом семействе: наш случай коразмерности 1 включен в однопара- метрическое семейство. Рассмотренный пример в действительности исчерпывает бифурка- бифуркации фазового портрета в однопараметрических семействах общего ви- вида, происходящие при потере устойчивости положения равновесия на плоскости и, более общим образом, при прохождении пары корней ха- характеристического уравнения через мнимую ось. Б. Теорема Пуанкаре-Андронова. Рассмотрим однопараметрическое семейство векторных полей. Предположим, что при нулевом значении параметра поле имеет особую точку 0 такую, что корни характеристического уравнения чис- чисто мнимые (размерность фазового пространства равна 2). Теорема. Локальное семейство общего положения (среди семейств с указанными свойствами) топологически эквивалентно семейству пре- предыдущего примера. Доказательство. Будем применять метод Пуанкаре для приведения уравнения к нормальной форме. При нулевом значении параметра имеется ре- резонанс, отсутствующий при близких ненулевых значениях параметра.
316 Глава 6 Соответствующие резонансные члены при нулевом значении параметра убить нельзя, а при близких значениях параметра можно. Если мы бу- будем при близких к нулю нерезонансных значениях параметра убивать члены, становящиеся резонансными при нулевом значении параметра, то наша замена будет разрывно зависеть от параметра, а радиус окрест- окрестности, в которой мы изучим фазовый портрет, будет стягиваться до нуля при подходе параметра к резонансному значению. Поэтому мы не станем убивать члены, становящиеся резонансны- резонансными при е = 0, не только при нулевом значении параметра, но и при близких значениях параметра. В результате мы получим замену, глад- гладко зависящую от параметра, после которой в системе останутся одни лишь члены, становящиеся резонансными при нулевом значении па- параметра, плюс остаток сколь угодно высокого порядка по отношению к расстоянию до особой точки. Мы собираемся изучить бифуркации в полученном семействе, отбросив остаток, а затем убедиться в том, что он не влияет на топологию перестроек (или учесть его влияние). Описанная выше программа является общей для многих задач о би- бифуркациях. Посмотрим, к чему она приводит в нашем конкретном слу- случае прохождения пары корней характеристического уравнения через мнимую ось. Резонанс имеет вид Ai + Лг =0 (Ai;2 = ±го;). Следова- Следовательно, в собственных координатах на комплексифицированной плос- плоскости С2 нормальная форма запишется в виде (см. § 23) z-l = Ai(eJ;i + a1(e)z\z2 + ... , z2 = А2(е)^2 + ^(е)-^2. + ... Заметим, что, ввиду вещественности исходного уравнения, собствен- собственный базис можно выбрать из комплексно-сопряженных векторов, а нор- нормализующие замены можно выбирать вещественными. В таком случае второе уравнение получается из первого сопряжением. Далее, на ве- вещественной плоскости Z2 =~z~i, поэтому мы можем писать одно первое уравнение, обозначая в нем Z\ через z, a z-i через ~z. Это уравнение можно считать записью исходной системы на вещественной плоскос- плоскости Ж2 в виде (неголоморфного) уравнения на комплексной прямой С1 с координатой z z = Xi(e)z + a-L(?)z2z + ... ; точками обозначен остаток пятого порядка относительно \z\. Итак, мы приходим к исследованию семейства z = \]_{e)z + ax{e)z2~z.
§33. Потеря устойчивости положения равновесия 317 Это исследование проводится таким же образом, как в рассмотренном в пункте А специальном примере. Соответствие между обозначениями: пример п. А общее семейство ш Ai@) ? ReAi(e) с Reoi(O) ' В семействах общего положения 7^0, Reai@)^0. е-0 Бифуркация состоит в рождении или уничтожении предельного цикла (рождение — в случае, когда Reai@) и Re —г^- разных знаков). de Если указанные выше три величины, вообще отличные от нуля, отличны от нуля, то учет отброшенного остаточного члена не меняет полученной картины бифуркаций. Это легко доказать, рассматривая производную функции р = \z\2 вдоль нашего векторного поля: р = 2p(Re\1(e)+pRea1(e) + О(р2)). Из этой формулы легко усмотреть, что О(р2) не влияет на бифуркации фазового портрета в некоторой (не зависящей от е) окрестности начала координат. ¦ Рассмотренная выше теорема в сущности была известна Пуанкаре; яв- явная формулировка и доказательство даны А.А.Андроновым (А. А. Андронов. Применение теории Пуанкаре о «точках бифуркации» и «смене устойчивос- устойчивости» к простейшим автоколебательным системам. С. R. Ac. Sci Paris, 189, 15 A929), 559-561; А. А. Андронов, Е. А. Леонтович-Андронова. Некоторые случаи зависимости периодических движений от параметра. Уч. записки ГГУ, 1939, вып. 6, стр. 3 (сочинения А.А.Андронова, стр. 188-216)). Р. Том, которого я обучил этой теории в 1965 году, стал широко пропагандировать ее под име- именем «бифуркации Э. Хопфа» (см., например, учебник С. Смейла и М.Хирша1). В. Многомерный случай. Соединяя теорему Пуанкаре-Андронова с теоремой сведения (§ 32), мы приходим к следующему выводу. 1М. Hirsch, S. Smale. Differential equations. Dynamical systems and Linear Algebra. New York, A. P., 1974.
318 Глава 6 Теорема. Топологически версальная деформация особой точки векторного поля общего положения в Шп с одной парой чисто мнимых корней характеристического уравнения получается простой надстрой- надстройкой из системы Пуанкаре - Андронова: z = z(i + e±zz), zEC1, ?6l; й = -и, иеш71-, v = v, v G Шп+, п = п- +п+ + 2. Исследование выписанной системы не представляет теперь никаких трудностей. Пример. Пусть п = 3, п+ = 0, знак перед z~z есть «—». В таком случае теорема утверждает, что в не зависящей от е окрестности нача- начала координат при прохождении пары собственных чисел через мнимую ось происходит рождение инвариантного цилиндра радиуса у/Е, притя- притягивающего соседние траектории. На самом цилиндре имеется устойчи- устойчивый цикл, на который в конце концов и наматываются все траектории. Таким образом, этот случай соответствует мягкой потере устойчивос- устойчивости с возникновением автоколебаний. Рассматриваемое вырождение изучалось многими авторами, в част- частности, Э. Хопф исследовал рождение цикла в многомерном случае (Е. Hopf. Abzweigung einer periodischen Losung von einer stationaren Losung. Bereich. Sachs. Acad. Wiss. Leipzig, Math. Phys. Kl. 94, 19 A942), 15-25). Дальнейшие результаты были получены Ю. И. Неймарком и Н. Н. Брушлинской. Однако общая теорема, сформулированная выше, дающая полное иссле- исследование бифуркаций фазового портрета (а не только бифуркаций цикла) была доказана лишь в цитированной выше работе А. Н. Шошитайшвили о сведении при помощи двумерных результатов Андронова-Пуанкаре. Г. Применение к теории гидродинамической устойчивости. Разобранные выше явления часто встречаются в разнообразных конкретных ситуациях: механические, физические, химические, био- биологические и экономические системы теряют устойчивость на каждом шагу. Здесь мы рассмотрим в качестве примера одну специальную за- задачу такого рода — вопрос о потере устойчивости стационарного тече- течения несжимаемой вязкой жидкости.
§33. Потеря устойчивости положения равновесия 319 Пусть D — заполненная жидкостью область, и v — поле скоростей жидкости. Движение описывается уравнениями Навье-Стокса ^ + («V, v) = vAv - grad р + /, div v = О, где коэффициент v означает вязкость, / — поле массовых, непотен- непотенциальных сил; давление р определяется из условия несжимаемости. На границе области D ставятся, скажем, условия прилипания (и v = 0). dD Предполагается, что начальное поле скоростей определяет все даль- дальнейшее движение, так что уравнение определяет динамическую систе- систему в бесконечномерном пространстве бездивергентных векторных по- полей, равных 0 на границе области D. [В действительности это доказано только в двумерном случае. Вопросам о существовании, единственнос- единственности и свойствах решений уравнений Навье-Стокса посвящена обширная литература, однако основные проблемы остаются открытыми.] Рассмотрим, например, течение Пуазейля (с параболическим профилем скоростей; рис. 131) в плоском канале. Течение Пуазейля является ста- стационарной точкой нашей динамической системы в функциональном пространстве при любом значе- значении вязкости и. Это положение равновесия устой- устойчиво при достаточно большой вязкости, однако при уменьшении вязкости оно теряет устойчи- Рис. 131 вость. Мы можем исследовать, что при этом про- происходит, пользуясь теоремой п. В. Разумеется, следует принять особые предосторожности в связи с беско- бесконечномерностью задачи. Имеется надежда, что бесконечномерность не очень опасна из-за того, что вязкость быстро гасит высокие гармоники, так что фактически при любом ненулевом значении коэффициента вязкости система сваливается к конечномерной. Другая трудность в том, что мы не можем быть уверенными, что наша система — действительно общего положения: это нужно проверять вычислениями. Кажется естественным, что система Навье-Стокса окажется системой общего положения в области «общего вида» и при общих массовых силах /, однако течение Пуазейля весьма специально, например, здесь есть большая группа симметрии. Ограничимся возмущениями, поле скоростей которых вдоль потока повторяется периодически с длиной волны /. Чтобы нормировать ско- скорость основного течения, будем менять внешние силы пропорционально
320 Глава 6 вязкости так, чтобы расход жидкости Q был постоянен (/ = const -Qv). В таком случае мы получим двухпараметрическое семейство с пара- параметрами / и v. Обычно принято рассматривать в качестве параметров обратные величины а — -у- (волновое число), R = const • — (число Рейнольдса). Таким образом, уменьшение вязкости, вызывающее не- неустойчивость, соответствует увеличению числа Рейнольдса. Вычисления (которые практически невыполнимы без машины) по- показывают, что при возрастании числа Рейнольдса при некотором кри- критическом значении числа Рейнольдса Ro = Ro(a) пара комплексных корней переходит через мнимую ось из устойчивой полуплоскости в не- неустойчивую. Следовательно, мы встречаемся здесь с тем случаем по- потери устойчивости, при котором рождается или умирает предельный цикл. Знак коэффициента с, определяюще- определяющего жесткое или мягкое возбуждение ко- колебаний, также вычислен. Для описания результата удобно нарисовать границу -w^v-// u-uo-v устойчивости на плоскости (a, R). Оказы- вается, она имеет вид изображенного на ~д рис. 132 «языка»; самая левая точка этого языка особенно важна: ее R-координата со- Рис. 132 ответствует первой потере устойчивости, а а-координата определяет самую опасную на неустойчивость длину волны. Оказывается, для всей левой и верхней части языка границы устой- устойчивости коэффициент с положителен, т. е. имеет место жесткое возбуж- возбуждение. Следовательно, еще до того, как число Рейнольдса перейдет через критическое значение Ro, где-то в фазовом пространстве, в стороне от стационарной точки (т.е. от течения Пуазейля), возникнет какой-то колебательный режим1, на который систему и выбросят малые возму- возмущения при подходе числа Рейнольдса к Ro. Этот новый режим может быть устойчивой стационарной точкой (т. е. в гидродинамических тер- терминах — стационарным течением, отличным от течения Пуазейля), или крутой возможностью в системах произвольного вида является уход на беско- бесконечность; в нашем случае, по-видимому, этого не произойдет, так как на бесконеч- бесконечности фазовая скорость направлена назад к началу координат, ввиду демпфирую- демпфирующего действия вязкости.
§33. Потеря устойчивости положения равновесия 321 предельным циклом (в гидродинамических терминах — периодичес- периодическим течением), но может иметь и более сложную структуру, например, он может оказаться условно-периодическим движением по тору. Более того, возникающий при жестком возбуждении режим может оказаться У-системой или системой гиперболического характера, т. е. притягива- притягивающим множеством с весьма нерегулярными, неустойчивыми траекто- траекториями на нем. Спектр соответствующей динамической системы может оказаться непрерывным даже несмотря на конечность числа степеней свободы (т.е. конечность размерности притягивающего множества). Экспериментаторы назвали бы такой режим течения турбулентным. В 1963 году появилась работа Лоренца (Е. N. Lorenz. Deterministic nonperiodic flow. J. Atmos. Sci. 20 A963), 130-141), который первым наблю- наблюдал нетривиальный притягивающий режим в системе с трехмерным фазовым пространством, моделирующей гидродинамическую теорию конвекции. Система Лоренца имеет вид о х — —ах + ау, у — —xz + rx — у, z — ху — bz; а — 10, г — 28, Ъ — -. о Кажется, все модели, в которых пока удалось найти гиперболические притя- притягивающие множества, содержат члены типа накачки или отрицательной вяз- вязкости, отсутствующие в уравнении Навье-Стокса. Во всяком случае, когда я в 1964 г. пытался найти гиперболическое притягивающее множество в шес- шестимерном фазовом пространстве галеркинского приближения к уравнению Навье-Стокса на двумерном торе с синусоидальной внешней силой (исполь- (используя вычислительную машину, программированную Н. Д. Введенской), то при- притягивающее множество оказалось, по-видимому, трехмерным тором (быть может, из-за слишком малого числа Рейнольдса). Насколько мне известно, гиперболические притягивающие множества для уравнений Навье-Стокса или их галеркинских аппроксимаций не найдены до сих пор. Зато описан- описанный выше численный эксперимент послужил отправной точкой ряда работ о применении геодезических потоков на группах диффеоморфизмов к гид- гидродинамике (V. I. Arnold. Sur la geometrie differentielle des groupes de Lie de dimension infinie et ses applications a l'hydrodynamique des nuides parfaits. Ann. Inst. Fourier, Grenoble, 16, 1 A966), 319-361; D. G. Ebin, J. Marsden. Groups of diffeomorphisms and the motion of an incompressible fluid. Ann. of Math. 92 A970), 102-163). Очень простая модель с неустойчивыми траекториями на притягиваю- притягивающем множестве предложена М. Эноном (М. Непоп. A Two-dimensional Mapping with a Strange Attractor. Comm. Math. Phys. 50 A976), 69-77). Энон рас- рассматривает квадратичное «преобразование Кремона» на плоскости, имеющее 21 В. И. Арнольд
322 Глава 6 вид Г = Г1Г2Г3, где Ti(x, у) = (у, х), Т2(х, у) = (Ьх, у), Г3(ж, у) = (ж, у + 1 - ах2). Интересно отметить, что наблюдаемое в численном эксперименте при а — 1,4, 6 = 0,3 притяжение к множеству, имеющему локально вид произведения канторова множества на отрезок, не удается описать в рамках существую- существующих определений гиперболичности (не исключено даже, что в это множество вкраплены области притяжения длинных циклов). Таким образом, математи- математики не признают притягивающее множество Энона гиперболическим. В то же время с точки зрения экспериментатора движение фазовой точки под дейст- действием итераций преобразования Г имеет явно выраженный стохастический, турбулентный характер (еще один пример опасности фетишизирования ак- аксиом). Примеры настоящих гиперболических притягивающих множеств на плоскости построены Р. В. Плыкиным (Р. В. Плыкин. Источники и стоки Л-диффеоморфизмов поверхностей. Математический сборник, 94, 2 A974), 243-264). Плыкин строит диффеоморфизм замкнутой области с тремя дыра- дырами, изображенной на рис. 133 наверху, на ее заштрихованную (на рис. 133 внизу) часть, обладающий следующим свойством: пересечение образов облас- области при всех итерациях диффеоморфизма является притягивающим множес- множеством (расстояние образов итераций любой точки до него стремится к нулю), это пересечение локально является произведением канторова множества на отрезок, и расстояние между близкими точками на каждом отрезке растет при итерациях преобразования. Обширная библиография работ по теории бифуркаций и ее приложениям имеется в книге Марсдена и Мак Кракен «Бифуркация Хопфа и ее приложе- приложения»1 (более 350 названий). Определение того, на какой режим выходит динамическая система на самом деле при потере устойчивости течением Пуазейля, лежит, по мнению специалистов, на грани возможностей современных машин. В этой ситуации не следует, вероятно, пренебрегать качественны- качественными предсказаниями, которые можно сделать совсем без вычислений, опираясь на изложенную выше общую теорию бифуркаций. В рассматриваемой задаче имеется два параметра, а и R. Следова- Следовательно, кроме особенностей коразмерности 1, могут встречаться так- также и особенности коразмерности 2. Обратим внимание на одну из них, а именно на ту, которая связана с изменением знака с. Вычисления по- показывают, что при достаточно большом числе Рейнольдса R жесткое 1J. E. Marsden, M. McCracken. The Hopf Bifurcation and its Applications. Springer, 1976.
§33. Потеря устойчивости положения равновесия 323 Рис. 133 возбуждение на нижней стороне языка потери устойчивости сменяется мягким. Чтобы понять, что происходит в этот момент, нужно постро- построить двухпараметрическое версальное семейство для такого двукратно- двукратного вырождения. Это семейство легко построить, оно имеет вид: z = z(iuj + ?\ + C2Z2~z2), z E С (остальные координаты в фазовом пространстве отвечают устойчивым собственным числам и не выписаны). Смысл параметров ?\ и ?2 ясен из рис. 132; характер перестройки в точке ?\ = e<i = 0 определяется знаком величины сг-
324 Глава 6 Рис. 134 Полагая, как и выше, р = z'z, получаем для р уравнение р = 2р{ег +е2р + с2р2), р^О. В зависимости от знаков е и с возможны следующие случаи: 1°. С2 < 0, ?2 < 0. При переходе ?\ от отрицательных значений к положительным система мягко выходит на периодический устойчи- устойчивый автоколебательный режим (рис. 134). 2°. С2 < 0, ?2 > 0. При переходе е\ от отрицательных значений к по- положительным система жестко выходит на устойчивый периодический автоколебательный режим, родившийся еще до потери устойчивости положением равновесия вместе с неустойчивым колебательным режи- режимом, садящимся на положение равновесия в момент потери устойчи- устойчивости. Указанный выше устойчивый предельный цикл мы смогли исследо- исследовать вблизи точки смены жесткого режима мягким, так как при этом он близок к положению равновесия. Однако аналитическое продолже- продолжение этого цикла может существовать (вдали от положения равновесия) и при других значениях параметров (a, R); мы видим, что его можно искать аналитическим продолжением неустойчивого цикла, садящегося на положение равновесия при жесткой потере устойчивости. Указанный устойчивый цикл — один из кандидатов на роль устанавливающегося при потере устойчивости режима.
§33. Потеря устойчивости положения равновесия 325 3°. С2 > 0, ?2 < 0. Потеря устойчивости мягкая, но рождающийся предельный цикл быстро умирает, слившись с пришедшим издали не- неустойчивым, после чего в системе жестко возбуждается новый режим. 4°. С2 > 0, ?2 > 0. Обычное жесткое возбуждение. Таким образом, каков бы ни был знак сг, при надлежащем знаке ?2 наш анализ позволяет установить качественно новое по сравнению с од- нопараметрическим анализом явление: при сг < 0 мы находим явно установившийся при жестком возбуждении режим, а при сг > 0 мы обнаруживаем недолговечность мягко возбудившегося режима. Чтобы узнать, какой из двух случаев (сг < 0 или сг > 0) имеет место в дей- действительности, нужно провести весьма громоздкие вычисления. В теории гидродинамической устойчивости встречаются разнообразные особенности границы устойчивости и декремент-диаграмм, так что здесь мо- могут найти применение результаты § 30. Для применений общей теории бифур- бифуркаций в теории гидродинамической устойчивости было бы важно исследовать случаи общего положения в задачах с различными группами симметрии, так как во многих гидродинамических задачах область течения D выдерживает ту или иную группу симметрии (пример — группа сдвигов в задаче о тече- течении Пуазейля; представления этой группы участвуют в исследовании в виде параметра а). Поведение жидкости после потери устойчивости стационарного тече- течения обсуждается во многих работах (см., например, учебник Л. Д. Ландау, Е. М. Лифшиц. Механика сплошной среды. М.: Гостехиздат 1954; § 27 (Воз- (Возникновение турбулентности), основан на работе Л.Д.Ландау 1943 года). При этом обычно предполагается мягкий режим возникновения автоколебаний и исследуется потеря устойчивости предельным циклом. Ландау предполо- предположил, что при этом будут возникать условно-периодические движения со все большим числом частот; несомненно, это объясняется тем, что другие дина- динамические системы не были ему известны. В 1965 году я рассказывал об изложенной выше теории на семинаре Тома в Институте Высших исследований в Бюре. В появившихся пятью годами поз- позже работах Рюэл и Такенс (D. Ruelle, F. Tokens. On the nature of turbulence. Comm. Math. Phys. 20 A971), 167-192; 23 A971)) построили примеры потери устойчивости цикла с возникновением более сложного режима, чем условно- периодический; однако их пример носит экзотический характер, так как со- соответствует очень тощей метрически (хотя и открытой) части пространст- пространства параметров деформации. Обзор дальнейших экспериментальных работ см. в J. В. McLaughlin, P. С. Martin. Transition to turbulence of a statically stressed fluid system. Phys. Rev. Letters, 33 A974); Phys. Rev. A 12 A975), 186-203.
326 Глава 6 Следует отметить, что для применимости результатов указанных работ нужно, чтобы потеря устойчивости происходила в мягком режиме, тогда как режим потери устойчивости течения Пуазейля оказался жестким. Д. Вырождения коразмерности 2. Разобранными выше случаями (рождение и уничтожение пары осо- особых точек, рождение или уничтожение предельного цикла из особой точки) исчерпываются бифуркации фазовых портретов в окрестности особой точки для общих однопараметрических семейств векторных по- полей. В двухпараметрических семействах эти особенности будут встре- встречаться на линиях плоскости параметров, но кроме них будут (в отдель- отдельных точках плоскости параметров) наблюдаться более сложные вырож- вырождения. Среди этих более сложных вырождений неустранимы малым ше- шевелением двухпараметрического семейства следующие 5 вырождений. 1°. Один нулевой корень с дополнительным вырождением. Пример: х = ±х3 + е\х + х Е (рис. 135). Легко проверить, что выписанная деформация (топологичес- (топологически) версальна; в многомерном случае версальная деформация получит- получится надстройкой седла. D* Рис. 135 Бифуркационная диаграмма (для случая +ж3) изображена на рис. 135 слева. Полукубическая парабола делит плоскость параметров на две части. В меньшей части система имеет вблизи х = 0 три поло- положения равновесия, в большей — одно. Перестройки фазового портрета при обходе параметра вокруг точки е = 0 по малой окружности, по- показаны на рис. 135 справа. Прямое произведение этой окружности на (одномерное) фазовое пространство есть круговое кольцо, положения
§33. Потеря устойчивости положения равновесия 327 А Рис. 136 равновесия образуют в этом кольце замкнутую кривую, а поведение векторов поля ясно из рис. 135. 2° Одна мнимая пара с дополнительным вырождением. Пример: z — z(iuj + Е\ + ?2%% ± z2~z2), z 6 С. Бифуркационная диаграмма состоит из прямой е\ = 0 и касающейся ее в нуле половины параболы; она изображена на рис. 136 для случая, когда в формуле стоит +z2~z2. Перестройки фазового портрета при обходе вокруг 0 по малой окруж- окружности показаны на рис. 136 справа. Изо- Изображенное на этом рисунке кольцо — прямое произведение окружности на плоскости параметров и прямой, на ко- которой откладывается ±|z|. Окружность на этом рисунке соответствует положе- положению равновесия z = 0, а каждый предельный цикл изображается двумя точками пересечения радиуса с линией е\ + ?2И2 + \z\A = 0. Бифуркационная диаграмма и семейство над окружностью для слу- случая, когда в формуле стоит — z2~z2, аналогичны. 3°. Две мнимые пары. 4°. Мнимая пара и еще один нулевой корень. Исследование этих случаев не доведено еще до той полноты, при которой можно выписывать версальные семейства; более того, неясно, имеется ли в случае двух мнимых пар двухпараметрическое (или хотя бы конечнопараметрическое) топологически версальное семейство (да- (даже в предположении нормальной несоизмеримости отношения частот при одновременном их переходе из одной полуплоскости в другую). После усреднения по быстрому вращению или после перехода к нор- нормальным формам Пуанкаре (в членах ряда Тейлора ограниченной сте- степени) эти задачи приводят к задачам о бифуркациях фазовых портретов векторных полей на плоскости, имеющих в случае одной мнимой пары одну инвариантную прямую, а в случае двух — две: х = хА(х, у, е), у = уВ(х,у,е). A) Системы такого же вида возникают при исследовании взаимодействий хищника и жертвы или конкурирующих видов в экологии (модель Лот-
328 Глава 6 ка-Вольтерра; заметим только, что здесь необходимо учитывать квад- квадратичные члены функций А, В, иначе бифуркации необщие). В терми- терминах исходной системы х, у имеют смысл квадратов амплитуд собст- собственных колебаний. Положение равновесия в плоской системе отвеча- отвечает положению равновесия в исходной многомерной, если оно лежит на пересечении инвариантных прямых, циклу — если на одной из них, и тору — если оно лежит внутри положительного квадранта плоскос- плоскости. (Частоты собственных колебаний предполагаются несоизмеримыми или по меньшей мере не связанными резонансами низких порядков.) Обоснование перехода от усредненной, плоской системы к исход- исходной можно отделить от исследования бифуркаций в системе на плос- плоскости, которое весьма нетривиально и послужило предметом несколь- нескольких неверных работ (Гукенхеймер, Холмс и др.). Правильный ответ обнаружен В.И.Швецовым в 1979 году при помощи компьютера: число рождающихся предельных циклов в плоской системе не превосходит единицы. Математическое обоснование (описание версальных дефор- деформаций в классе систем A)) получено лишь в 1985 г. X. Жолондеком, который ранее получил аналогичный результат для случая мнимой па- пары и нулевого корня: X. Жолондек. О версальности одного семейства симметричных векторных полей на плоскости. Математический сбор- сборник, 1983, 120, №4, с. 473-499. Здесь также рождается не более одного цикла. Наконец, остается последний случай коразмерности 2: 5°. Два нулевых корня. Пример — семейство уравнений на плоскости Xi = Ж2, Х2 = ?i + ?2Х\ + х\ ± с параметрами (ei, ?2)- Бифуркационная диаграмма разбивает плос- плоскость е на четыре части, обозначенные А, I?, С, D на рис. 137, соот- соответствующем выбору -\-x\X2 в формуле. Фазовые портреты, соответствующие каждой из четырех частей плоскости ?, показаны на рис. 137. Ветвям бифуркационной диаграммы соответствуют системы с вырождениями коразмерности один, изобра- изображенные на рис. 136 (Р, Q, R, S). Заметим, что бифуркация на ветви S — рождение цикла из петли сепаратрисы — не входит в нашу классификацию особенностей кораз- коразмерности 1, так как она является не локальным (вблизи особой точки), а глобальным явлением. Мы видим, таким образом, что с увеличением
§33. Потеря устойчивости положения равновесия 329 D3 ?2 D Рис. 137 числа параметров семейства при локальном исследовании бифуркаций особых точек начинают играть роль глобальные бифуркации меньших коразмерностей. Отсюда следует, что при достаточном числе парамет- параметров мы столкнемся в локальной задаче с теми же трудностями не всю- всюду плотности структурно устойчивых систем, которые были обнаруже- обнаружены Смейлом в глобальной задаче о векторных полях на многообразии (см. § 15). Бифуркации в случае, соответствующем выбору знака «—» в фор- формуле, сводятся к предыдущим изменениям знаков t и хч- Теорема. Векторные поля общего положения с двумя нулевыми корнями характеристического уравнения в особой точке на фазовой плоскости имеют топологически версалъную деформацию с двумя па- параметрами, эквивалентную одной из двух деформаций, рассмотренных выше. Иными словами, общее двупараметрическое семейство дифферен- дифференциальных уравнений на плоскости, имеющих при некотором значении
330 Глава 6 параметра особую точку с двумя нулевыми корнями характеристичес- характеристического уравнения, непрерывной заменой параметров и непрерывно завися- зависящей от параметров непрерывной заменой фазовых координат приводит- приводится к указанному выше виду. Эта теорема, доказанная Р. И. Богдановым в 1971 году, была впервые опубликована в обзоре: В. И. Арнольд. Лекции о бифуркациях и версальных семействах. УМН 27, 5 A972), стр. 119-184. Такенс анонсировал аналогич- аналогичный результат в 1974 году. Доказательство версальности не простое: глав- главную трудность представляет исследование единственности предельного цик- цикла. Р. И. Богданов преодолевает эту трудность при помощи нетривиальных соображений о поведении эллиптических интегралов в зависимости от пара- параметра. См.: Р. И. Богданов. Бифуркации предельного цикла одного семейства векторных полей на плоскости. Тр. семинара имени И. Г. Петровского, 1976, вып. 2, 23-36; Версальная деформация особой точки векторного поля на плос- плоскости в случае нулевых собственных чисел. Там же, стр. 37 65. § 34. Потеря устойчивости автоколебаний Следующей по сложности задачей теории бифуркаций (после за- задачи о перестройке фазовых портретов в окрестности положений рав- равновесия) является задача о перестройках семейства фазовых кривых в окрестности замкнутой фазовой кривой. Эта задача полностью не решена и, по-видимому, в некотором смысле неразрешима. Тем не ме- менее, общие методы теории бифуркаций позволяют получить существен- существенную информацию об этих перестройках; в настоящем параграфе дается краткий обзор основных результатов в этом направлении. А. Монодромия и мультипликаторы. Рассмотрим замкнутую фазовую кривую системы дифференциаль- дифференциальных уравнений. Нас интересуют перестройки расположения фазовых кривых в окрестности данной кривой при малом изменении уравнения. Для расположения фазовых кривых в окрестности замкнутой фазо- фазовой кривой общего положения имеется (с точностью до гомеоморфизма окрестности) конечное число возможностей. Чтобы описать их, выбе- выберем на замкнутой фазовой кривой точку О. Проведем через эту точку трансверсальную к замкнутой фазовой кривой площадку (коразмернос- (коразмерности один в фазовом пространстве). Фазовые кривые, выходящие из точек площадки, достаточно близких к точке О, вновь пересекают площад- площадку, сделав оборот вдоль кривой. Возникает отображение окрестности
§ 34. Потеря устойчивости автоколебаний 331 точки О на трансверсальной площадке в эту площадку. Это отображе- отображение называется функцией (или отображением) наследования Пуанкаре (рис. 138) (или просто отображением Пуанкаре). Точка О является неподвижной точ- точкой фуНКЦИИ ПОСЛедОВЭНИЯ. РЭССМОТ- а Притягивающееся РИМ ЛИНеарИЗацИЮ фуНКЦИИ ПОСЛеДОВЭ- ^многообразие (Л Г*"\ Отталкиваю- ния в точке О. Этот линейный оператор /-<^!&-L /Ч^ееся много- многоназывается оператором монодромии. ^ Собственные числа оператора моно- монодромии называются мультипликатора- мультипликаторами исходной замкнутой фазовой кривой. Оператор монодромии можно найти, ре- решая линейное уравнение с периодически- ис' ми коэффициентами (уравнение в нормальных вариациях вдоль нашей фазовой кривой). Предположим, что все мультипликаторы по модулю меньше едини- единицы. Тогда можно доказать, что все соседние фазовые кривые, при про- продолжении вперед притягиваются к нашей замкнутой фазовой кривой. Если хотя бы один из мультипликаторов по модулю больше единицы, то существуют фазовые кривые, удаляющиеся от замкнутой (прибли- (приближающиеся к ней при t —> — оо). В общем случае несколько собственных чисел лежат внутри еди- единичной окружности, а несколько — снаружи. В этом случае фазовые кривые, притягивающиеся к данной, образуют, как можно доказать, притягивающееся многообразие, пересечение которого с нашей транс- версалью имеет такую размерность, сколько мультипликаторов лежит внутри единичной окружности. Точно так же фазовые кривые, асимп- асимптотические к замкнутой при t —»• —оо, образуют отталкивающееся многообразие. Размерность его пересечения с трансверсалью равна чис- числу неустойчивых мультипликаторов (мультипликаторов вне единичной окружности). В окрестности нашей замкнутой фазовой кривой имеет место ги- гиперболическая ситуация (см. § 14): все прочие фазовые кривые уда- удаляются от замкнутой как при t —»• +оо (удаление происходит вдоль отталкивающегося многообразия), так и при t —> — оо (вдоль притяги- притягивающегося). Топологический тип семейства фазовых кривых в окрест- окрестности замкнутой фазовой кривой, не имеющей мультипликаторов на единичной окружности, однозначно определяется числами устойчивых
332 Глава 6 и неустойчивых мультипликаторов и тем, сколько среди тех и других отрицательных: четное или нечетное число. Посмотрим, что изменится в этой картине при малом изменении системы. Б. Простейшие вырождения. Замкнутая фазовая кривая называется невырожденной, если еди- единица не является мультипликатором. Невырожденная замкнутая фазо- фазовая кривая при малой деформации системы не исчезает, а лишь немного деформируется (по теореме о неявной функции, примененной к уравне- уравнению /(ж) = х, где / — функция последования). При деформации невы- невырожденной замкнутой фазовой кривой мультипликаторы также лишь немного деформируются. Следовательно, как число устойчивых, так и число неустойчивых мультипликаторов не меняется при деформа- деформации, если ни один из мультипликаторов исходной фазовой кривой не лежал на единичной окружности. Мультипликаторы замкнутой фазовой кривой общего положения не лежат на единичной окружности. Таким образом, расположение фазо- фазовых кривых в окрестности замкнутой фазовой кривой общего положе- положения структурно устойчиво. Но если мы рассматриваем не индивидуальную систему, а семей- семейство систем, зависящих от параметра, то при отдельных значениях па- параметра мультипликаторы могут попадать на единичную окружность, и возникает вопрос о бифуркациях. Как обычно, начнем с простейших вырождений, т.е. вырождений, не устранимых в однопараметрических семействах. Таких вырожде- вырождений коразмерности 1 в нашем случае имеется три. Действительно, ха- характеристическое уравнение оператора монодромии вещественно, поэ- поэтому каждый невещественный мультипликатор имеет комплексно со- сопряженный. Следовательно, на единичную окружность выходят либо 2 комплексно сопряженных мультипликатора, либо один вещественный, равный либо 1, либо —1. Все три случая (комплексная пара, +1, —1) со- соответствуют многообразиям коразмерности 1 в функциональном про- пространстве. Рассмотрим, например, границу области устойчивости замкнутой фазовой кривой в функциональном пространстве. Эта граница являет- является гиперповерхностью в функциональном пространстве. Она состоит из трех компонент коразмерности 1. Первая компонента соответствует
§ 34. Потеря устойчивости автоколебаний 333 фазовым кривым с одной парой комплексно-сопряженных мультипли- мультипликаторов с модулем 1, вторая — с мультипликатором +1, третья — с мультипликатором —1; все остальные мультипликаторы лежат внут- внутри единичной окружности (рис. 139). Эти три гиперповерхности коразмерности 1 пересекаются по поверхностям коразмерности 2 1т Я и имеют дальнейшие особенности. Например, са- самопересечения первой поверхности отвечают двум парам мультипликаторов с модулем 1 и т. д. Задача о потере устойчивости замкнутой фазо- фазовой кривой является, таким образом, задачей о вы- вырождении коразмерности 1, и мы должны, на пер- Рис. 139 вый взгляд, рассматривать однопараметрические семейства общего по- положения, чтобы разобраться в бифуркациях. В действительности дело обстоит не так просто: мы увидим, что в задаче о потере устойчивос- устойчивости при прохождении пары мультипликаторов через единичную окруж- окружность имеются два существенных параметра. Но вначале посмотрим, к каким выводам приводит однопараметрическая точка зрения. Начнем со случая, когда один из мультипликаторов равен 1. Этот случай в сущности не отличается от задачи о бифуркации положений равновесия в однопараметрических семействах. Ситуация общего поло- положения — это рождение или смерть пары замкнутых фазовых кривых. У функции последования при этом рождаются или умирают две непо- неподвижные точки. Пример 1. Рассмотрим отображение оси х в себя, заданное форму- формулой х \-> х + х2. Точка х = 0 неподвижна, и ее мультипликатор равен 1. Рассмотрим однопараметрическую деформацию с параметром е, близ- близким к нулю: fe(x) = Х + Х2 + ?. Эта деформация топологически версальна. Рассмотрим любое ото- отображение прямой в себя, имеющее неподвижную точку с мультипли- мультипликатором 1. Мы назовем эту (вырожденную) неподвижную точку ре- регулярной, если вторая производная отображения в неподвижной точке (в какой-нибудь и тогда любой системе координат) отлична от нуля. Если вырожденная неподвижная точка регулярна, то существует однопараметрическая топологически версальная деформация отображе- отображения. При этом как само отображение, так и его версальная деформация
334 Глава 6 локально топологически эквивалентны указанной выше деформации fs специального отображения /о в окрестности точки 0. Чтобы перейти к многомерному случаю, нужно определить над- надстройку над построенной деформацией. Пример 2. Рассмотрим отображение линейного пространства в се- себя, заданное формулой (у, z, щ v) !->• \2у, -2z, |, -|j , где у, z, и, v — точки четырех подпространств, прямым произведени- произведением которых является наше пространство. Мы будем называть такое отображение стандартным седлом (размерности пространств, которым принадлежат у и и любые, a z и v — нуль или единица). Рассмотрим любое гладкое отображение, имеющее неподвижную точку. Предположим, что ни один из мультипликаторов не лежит на единичной окружности. Тогда в окрестности неподвижной точки ото- отображение топологически эквивалентно стандартному седлу (это легко следует из теоремы Гробмана-Хартмана, § 13). Пример 3. Рассмотрим прямое произведение деформации отобра- отображения прямой примера 1 на стандартное седло. Мы получим однопара- метрическое семейство отображений с параметром е и фазовыми коор- координатами, меняющимися в окрестности нуля: (ж; у, z, и, v) и- [х + х2 + е, 2у, -2z, |, -|) . Эта деформация называется надстройкой над деформацией приме- примера 1. Она топологически версальна. Теорема. Однопараметрические семейства отображений общего положения топологически эквивалентны выписанному выше в окрест- окрестности каждой неподвижной точки с мультипликатором 1 при значени- значениях параметра, близких к тому, для которого мультипликатор стано- становится равным 1. Доказательство в одномерном случае легкое. Многомерный слу- случай сводится к одномерному при помощи теоремы Шошитайшви- ли (§ 32), которая верна не только для дифференциальных уравнений, но и для отображений. ¦
§ 34. Потеря устойчивости автоколебаний 335 В. Случаи мультипликатора — 1. При появлении мультипликатора —1 замкнутая фазовая кривая гладко зависит от параметра и сама не бифурцирует. Но при этом от нее ответвляется дважды наматывающаяся на нее замкнутая фазовая кривая. Чтобы понять, как это происходит, обратимся опять к функции последования. Пример 4. Рассмотрим отображение прямой в себя /о (ж) = —х ± ж3. Мультипликатор неподвижной точки 0 равен — 1. Включим /о в семейство: fe(x) = (е-1)х±х\ Теорема. Деформация f? отображения /о версальна. Однопара- метрическое семейство общего положения в окрестности неподвиж- неподвижной точки с мультипликатором — 1 при значениях параметра, близких к тому, при котором мультипликатор равен —1, топологически экви- эквивалентно выписанному. Доказательство. Рассмотрим любое однопараметрическое семейство отображений прямой, в котором мультипликатор неподвижной точки обращается в —1 при некотором значении параметра. Неподвижная точка гладко зависит от параметра (по теореме о не- неявной функции). Гладко зависящей от параметра заменой координат можно перенести неподвижную точку в нуль. Будем теперь делать замены Пуанкаре (см. § 25), последовательно убивающие нерезонансные члены. Эти замены будут гладко зависеть от параметра, если мы будем оставлять члены, становящиеся резонансны- резонансными при критическом значении параметра, не только при этом значении параметра (когда их и нельзя убить), но также при соседних значениях. В нашем случае резонансные члены — это все члены нечетной сте- степени. Следовательно, семейство можно привести к виду х \-> Хх + ах3 + О(|ж|5), где Л, а и О гладко зависят от параметра.
336 Глава 6 В семействе общего положения производная Л по параметру при Л = — 1 отлична от нуля. В таком случае за параметр можно при- принять е = 1 + Л. Теперь деформация имеет вид (е - а{е)х3 + 0(|ж|5). В семействе общего положения а@) ф 0. Гладко зависящим от парамет- параметра растяжением координат добиваемся а(е) = ±1. Теперь остается проверить, что член О не вли- влияет на топологический тип семейства. Рассмотрим квадрат нашего отображения: s4(e- 1Jж +(е- 1)ах3 + а{е - 1Kж3 Каждая точка х сдвигается на 0(|ж|5). h = - ... )х - Bа 0(|ж|5), Рис. 140 где ... означает О(е). Нулевую линию уровня функции h на плоскос- плоскости (ж, е) легко исследовать (рис. 140). Рис. 140 определяет топологи- топологический тип семейства. ¦ Таким образом, в общем однопараметрическом семействе отобра- отображений прямой на прямую мультипликатор неподвижной точки стано- становится равным —1 в момент трансверсального прохождения через еди- единичную окружность (в отличие от обращения мультипликатора в 1, при котором мультипликатор, вообще говоря, через окружность не прохо- проходит). В момент прохождения мультипликатора через —1 изнутри на- наружу неподвижная точка теряет устойчивость. При этом, в зависимос- зависимости от знака коэффициента при ж3, возможны два случая. Либо рядом с потерявшей устойчивость точкой (на расстоянии порядка квадратно- квадратного корня из отличия параметра от критического значения) возникает устойчивый цикл периода 2 (две неподвижные точки квадрата отобра- отображения) — это случай мягкой потери устойчивости. Либо область притя- притяжения стягивается до 0 из-за подхода цикла порядка два еще до потери устойчивости (жесткая потеря устойчивости). Многомерная картина получается надстраиванием седла, как это описано выше. Применяя все сказанное об отображениях к функции последования замкнутой фазовой кривой, получаем в случае мягкой потери устой- устойчивости картину, изображенную на рис. 141: исходный цикл теряет
§ 34. Потеря устойчивости автоколебаний 337 устойчивость, но появляется устойчивый цикл с примерно вдвое боль- большим периодом. Описанные здесь явления хорошо наблюдаются в экспериментах. Сле- Следующий пример заимствован из доклада Г. И. Баренблата на семинаре И. Г. Петровского. Рассматривается полимерная пленка, медленно растяги- растягиваемая грузом. При малых растяжениях процесс квазистационарен (время можно считать параметром, фазовая точка находится в устойчивом положе- положении равновесия, все наблюдаемые величины при каждом значении параметра постоянны, т.е. фактически с изменением времени медленно меняются). Од- Однако при некотором значении параметра (т. е. при достаточном растяжении пленки) картина меняется, и вид различных физических параметров (ска- (скажем, длины х пленки) как функции времени становится таким, как изобра- изображено на рис. 142 (каждое колебание на этом рисунке можно рассматривать как происходящее при фиксированном значении параметра, но при следую- следующем колебании параметр немного меняется). Ill J Рис. 141 Рис. 142 Истолкование этого поведения фазовых переменных со временем следу- следующее: точка 1 соответствует мягкой потере устойчивости равновесия с об- образованием автоколебаний; видно, что их амплитуда растет как корень квад- квадратный из закритичности. Точка 2 соответствует мягкой потере устойчивос- устойчивости цикла с прохождением мультипликатора через — 1. Действительно, предположим, что в фазовом пространстве происходят перестройки, указанные на рис. 141. Каждая физическая наблюдаемая величина является функцией на фазо- фазовом пространстве. Пока фазовая точка находится в положении равновесия, величина постоянна. Когда фазовая точка движется по циклу, величина х становится периодической функцией времени t (амплитуда колебаний рас- растет с циклом). Удвоению цикла, изображенному на рис. 141, отвечает имен- именно такое удвоение периода зависимости измеряемой величины от времени, которое наблюдалось в эксперименте (рис. 142). 22 В. И. Арнольд
338 Глава 6 В связи с этим заметим, что вообще при изучении автоколебаний обыч- обычно регистрируют временные зависимости измеряемых величин (скажем, на электрокардиограмме). Во многих случаях более ясное представление о ха- характере явлений можно получить из вида фазовой кривой или ее проекции на какую-либо плоскость. Этим методом давно пользуются для диагностики отказов таких механических автоколебательных систем, как насосы. Пред- Предложения применять этот метод в электрокардиографии уже высказывались медиками. Одним из наиболее поразительных открытий теории бифуркаций явилось обнаружение в конце 70-х годов бесконечных каскадов удвое- удвоений — так называемая универсальность Фейгенбаума. Сущность этого открытия состоит в следующем. При изменении параметра бифурка- бифуркация удвоения цикла повторяется, так что возникает цикл с пример- примерно в четыре раза большим периодом, затем еще раз повторяется, так что период увосьмеряется, и т. д., так что на конечном интервале из- изменения параметра происходят удвоения, разделенные промежутками, убывающими в геометрической прогрессии: их отношения стремятся к постоянному числу. Это постоянное число не зависит от конкретного вида системы и является мировой постоянной, вроде тг или е: она называется констан- константой Фейгенбаума и составляет, если делить предыдущее расстояние на следующее (меньшее), 4,6692 ... Универсальность проявляется не только в независимости этой по- постоянной от вида системы, но и в ряде деталей процесса удвоения, ко- которые все, с точностью до масштабного преобразования, становятся все более и более стандартными по мере приближения параметра к предель- предельному значению, соответствующему бесконечному числу удвоений. Удвоение легче всего исследовать для неподвижных точек и цик- циклов отображений прямой в себя. В качестве типичного примера можно взять отображения, рассматривающиеся в экологии как модели размно- размножения с учетом конкуренции: х i-» Axe~x (множитель е~х описывает влияние конкуренции, уменьшающее коэффициент размножения А). При малых значениях А неподвижная точка 0 устойчива (выми- (вымирание), затем появляется положительная устойчивая неподвижная точ- точка (рис. 143), которая при некотором значении А\ параметра А теряет устойчивость, причем собственное число проходит через —1 (отображе- (отображение, конечно, необратимо) с рождением цикла периода 2,1 начинающего 1 По-видимому, объясняющего данное явление: годы, когда горбуши приходит на нерест много, чередуются с годами меньшего «урожая».
§ 34. Потеря устойчивости автоколебаний 339 Рис. 143 А Рис. 144 каскад удвоений (рис. 144). Эти удвоения были разу же замечены эко- экологами, как только динамика описанного выше преобразования и сход- сходных с ним моделей были исследованы при помощи вычислительных ма- машин (А. П. Шапиро. Математические модели конкуренции. В кн.: Управ- Управление и информация. Владивосток: ДВНЦ АН СССР, 10 A974), с. 5-75; R. M. May. Biological populations obeying difference equations; stable points, stable cycles and chaos. — J. Theor. Biol. 1975, 51, p. 511-524; Simple mathematical models with very complicated dynamics. — Nature 261, 1976, 459-466). Анализируя эти данные, М.Фейгенбаум и обнару- обнаружил удивительный факт устойчивости бесконечного каскада удвоений, а также и еще более удивительную универсальность этого явления.
340 Глава 6 y=f(f№) у=х Рис. 145 Рассмотрим отображение прямой в се- бя х \-> /(ж) вблизи точки максимума функ- функции /. Легко сообразить, что график квадра- квадрата отображения будет иметь два максимума и минимум (рис. 145). В окрестности точки минимума после надлежащей нормировки (растяжения) коор- координат функция, с точностью до знака, по- похожа на исходную. При возведении отобра- отображения в квадрат это сходство все время возрастает, как показывает вычислительный эксперимент. Это приводит к мысли искать неподвижную точку оператора J удвоения (возведения в квадрат) с перенормировкой, определенной ниже. Такая неподвижная точ- точка, оказывается, существует, а именно, таковой является аналитичес- аналитическая четная функция Ф(ж) = 1 - 1,52763ж2 + 0,104815ж4 - 0,0267057ж6 + ... , для которой J<& = Ф, где (J/)(ж) = — ^f(f(—ax)). Константа пере- перенормировки для Ф аф = — ФA) = 0,3995 (все числовые коэффициенты, естественно, округлены). Функция Ф является неподвижной точкой оператора J, определен- определенного на четных С1-отображениях /: [—1, 1] —»• [—1, 1] с одним макси- максимумом, удовлетворяющих условиям (рис. 146) /'@) = 0, /@) = 1, /A) = -а < 0, Ь = /(а) > а, f(b) = /(/(а)) < а для каких-либо а и b, a = a,f. Оператор J в функциональном пространстве гиперболический, он имеет одномерное растягивающее пространство и коодномерное сжи- сжимающееся. Собственное число в растягивающемся пространстве — это и есть постоянная Фейгенбаума 4,6692 ... Универсальность каскада удвоений объясняется этой картиной следующим образом. Однопараметрическое семейство отображений из- изображается кривой 7 в функциональном пространстве (рис. 147). Если эта кривая проходит недалеко от неподвижной точки Ф, то при повто- повторении преобразования удвоения J она будет вытягиваться вдоль растя-
; 34. Потеря устойчивости автоколебаний 341 Рис. 146 Рис. 147
342 Глава 6 гивающегося одномерного инвариантного многообразия Г+ отображе- отображения J, одновременно приближаясь к нему. С другой стороны, рассмот- рассмотрим в функциональном пространстве бифуркационную поверхность ?, образованную отображениями с собственным числом —1 в неподвиж- неподвижной точке. Оказывается, инвариантная кривая Г+, о которой шла речь выше, трансверсально пересекает эту бифуркационную поверхность ? кораз- коразмерности 1. Следовательно, прообразы бифуркационной поверхности ? при отображении удвоения и при его итерациях образуют последова- последовательность поверхностей коразмерности 1 в функциональном простран- пространстве, приближающихся при возрастании числа итераций к сжимающе- сжимающемуся многообразию Г_ неподвижной точки (рис. 147). Точки пересе- пересечения этих поверхностей с изображающей наше семейство кривой 7 определяют те значения параметра, при которых происходит удвоение цикла. Это объясняет и появление геометрической прогрессии, и уни- универсальность ее знаменателя: он определяется последовательностью по- построенных выше поверхностей и не зависит от специального выбора трансверсальной кривой1. При переходе от отображений к диффеоморфизмам плоскости или к системам дифференциальных уравнений картина остается в общем такой же, с той же универсальной постоянной, хотя некоторые детали меняются. Для того, чтобы удвоившийся цикл претерпел новое удвое- удвоение, мультипликатор (собственное число отображения) должен пройти от 1 к —1. Действительно, удваивающийся цикл имел мультипликато- мультипликатором (в момент рождения) число —1. Значит удвоившийся цикл в мо- момент рождения имеет мультипликатор (—IJ = 1. Перейти от 1 к —1 на вещественной оси мультипликатор не может ни для дифференциально- дифференциального уравнения, ни для диффеоморфизма, так как обратимость диффео- диффеоморфизма не позволяет ему обратиться в нуль. Поэтому в явлении обязательно участвует еще один мультиплика- мультипликатор, который должен столкнуться с двигающимся из 1 в —1 по вещест- вещественной оси мультипликатором, после чего оба сойдут в комплексную область и обойдут вокруг нуля с разных сторон, а затем снова разойдут- разойдутся — один к —1, другой — на свое место. Кривая, по которой обходит- 1 Доказательства и библиография приведены в: P. Collet, J.-P. Eckmann. Iterated maps on the interval as dynamical system. Boston, Birkhauser, 1980, 248 p.
§ 34. Потеря устойчивости автоколебаний 343 ся нуль, почти окружность, и для нее тоже есть почти универсальная асимптотика при повторении удвоений (М.В.Якобсон, 1985). Универсальные удвоения имеют аналоги, соответствующие дру- другим резонансам. Рассмотрим, например, резонанс 1 : 3, когда собст- собственное число (мультипликатор) покидает единичный круг через куби- кубический корень из единицы. Для реализации такого явления в семейст- семействе общего положения нужно как минимум два параметра. На плоскос- плоскости параметров моменты утроения изображаются отдельными точками. Эти точки и в случае утроения, как и для удвоения, встречаются бес- бесконечными сериями. Асимптотически их разности образуют геометри- геометрические прогрессии со стандартным, универсальным (независимым от семейства) знаменателем. Однако этот знаменатель оказывается не ве- вещественным, как в случае удвоений, а комплексным числом, так что точки утроения образуют на плоскости параметров своеобразные дис- дискретные спирали. Аналогичные удвоениям Фейгенбаума явления происходят и в га- мильтоновых системах. В этом случае мультипликатор —1 встречается обязательно четное число раз, в системе общего положения его крат- кратность равна 2. После удвоения рождается цикл с двукратным мульти- мультипликатором, равным (в момент рождения) 1. До следующего удвоения эта пара единиц движется к —1 по единичной окружности (сверху и снизу). Соответствующая константа Фейгенбаума в этом случае зна- значительно больше, чем для обычных удвоений (примерно 8). Заметим, что по дороге мультипликаторы проходят через все корни из единицы. Поэтому, также универсальным образом, между двумя последователь- последовательными удвоениями происходят другие события: рождение циклов, пе- периоды которых равны разнообразным кратным порождающего цикла (в момент рождения). Новорожденный цикл большего периода снова имеет мультипли- мультипликатор 1 кратности 2, который достаточно часто (грубо говоря, с ве- вероятностью половина) при изменении параметра будет двигаться по единичной окружности. Таким образом, в принципе возникает ветвя- ветвящаяся схема бифуркационных значений параметра, занумерованных всеми конечными последовательностями рациональных чисел. Обыч- Обычная последовательность удвоений отвечает натуральному ряду. После- Последовательность удвоений утроившегося цикла — -, 1, 2, ... Можно рас- О
344 Глава 6 сматривать и последовательности вроде -, -, ... (каскад утроений) 1111 или ^, ^, ^, ^, ..., приводящие, вероятно, к новым универсальным константам. Рис. 148 Сопровождающие эти бифуркации явления давно наблюдались в численных экспериментах. Например, инвариантные кривые («ост- («острова»), напоминающие шляпу (рис. 148), возникают при учетверении цикла и встречались уже в ранних работах Хенона с Хейлесом и Чири- кова1, но, кажется, не получили тогда надлежащего объяснения. Г. Прохождение пары мультипликаторов через единич- единичную окружность. Этот случай изучен гораздо хуже обоих предыдущих. Топологичес- Топологически версальные деформации не выписаны и, быть может, не существуют. Тем не менее метод Пуанкаре позволяет получить существенную ин- информацию. Начнем со случая, когда аргумент мультипликатора, попав- попавшего на единичную окружность, несоизмерим с 2тг (этот случай можно считать общим, так как мера множества рациональных чисел равна нулю). Мы будем считать, что размерность отображаемого пространства равна 2. В этом случае после подходящей гладкой и гладко зависящей от параметра замены координат наше семейство отображений приводится к виду z и- А(фA + a{e)\z\2 + 0{\z\4)), 1М. Непоп, С. Heiles. The applicability of the third integral of motion: some numerical experiments. Astron. J. 69 A964), 73; Б. В. Чириков. Исследования по те- теории нелинейного резонанса и стохастичности. Новосибирск: препринт Изв. СО АН СССР №267, 1969.
§ 34. Потеря устойчивости автоколебаний 345 где вещественное число е — параметр семейства, Л@) = ега, а ф Для семейства общего положения q d\\\ О, так что за параметр можно de взять |А| — 1. Предположим, что член О(|-г|4) отсутствует. В этом случае отобра- отображение легко исследовать. Действительно, модуль точки-образа опре- определяется модулем точки прообраза, так что возникает вещественное отображение г н-> rlAlll + аг2\. При |Л| = 1 + е, \е\ <С 1, г<1 имеем + аг2\ и 1 +e Для семейства общего положения Re а ф 0. В этом случае при прохож- прохождении параметром е значения нуль из теряющей устойчивость непо- неподвижной точки рождается (или в этой точке умирает) инвариантная относительно отображения окружность, радиус которой пропорциона- пропорционален у/Щ. В первом случае (рождения окружности) она устойчива, во втором неустойчива. На самой окружности отображение сводится к по- повороту. Вернемся теперь к отброшенным членам и посмотрим, повлияют ли они на сделанные выводы. Можно показать, что инвариантная замкнутая кривая, радиусом порядка у/Щ действительно существует у полного отображения (см.: SackerR. J. On invariant surfaces and bifurcation of periodic solutions of ordinary differential equations. New York University, Report IMM-NYU 333, 1964; СРАМ 18, 4 A965), 717-732). Устойчивость этой замкнутой кривой также сохраняется при воз- возмущении. Однако устройство отображения на самой кривой для полного отображения отличается от такового для отображения с отброшенным остаточным членом. Действительно, полное отображение на инвариант- инвариантной кривой может иметь как иррациональное, так и рациональное число вращения. Возникающее отображение окружности отнюдь не обязано быть топологически эквивалентным повороту. В случае рационального числа вращения оно будет, вообще говоря, иметь конечное число пери- периодических точек, попеременно устойчивых и неустойчивых. Эти пери- периодические точки для исходного отображения плоскости на себя будут,
346 Глава 6 соответственно, седлами и узлами. Таким образом, наша инвариант- инвариантная кривая состоит в случае рационального числа вращения из цепочки сепаратрис седел, сходящихся в узлах (рис. 149). Заметим, что сепаратрисы седел гладкие. Но при подходе к узлу с двух сторон две сепаратри- сепаратрисы образуют вместе, вообще говоря, кривую лишь конечной гладкости. Таким образом, возникающая инвариантная кривая, вообще говоря, имеет лишь конечную гладкость. При приближении к значению параметра, соответствующему переходу мультипли- мультипликаторов через окружность, гладкость инвариантной Рис. 149 кривой растет до бесконечности (как нетрудно сооб- сообразить). Если наше отображение было отображением последования для диф- дифференциального уравнения, то в фазовом трехмерном пространстве ин- инвариантная кривая отображения последования определяет инвариант- инвариантный тор, сплошь состоящий из фазовых кривых. Наша инвариантная кривая — это сечение указанного тора трансверсалью. Тор имеет ко- конечную гладкость, тем большую, чем ближе момент рождения тора из цикла. При изменении параметра в семействе число вращения на торе, вообще говоря, меняется, так что оно принимает то иррациональные, то рациональные значения. Из описанной картины бифуркаций при переходе пары мультипли- мультипликаторов через единичную окружность следует также, что в однопара- метрических семействах общего положения не встречаются ответвле- ответвления от данного периодического режима периодических режимов крат- кратности, отличной от двух. Действительно, последнее могло бы происхо- происходить, лишь если бы мультипликатор переходил единичную окружность в точке с рациональным аргументом, а это — явление исключительное. Чтобы разобраться, как возникают периодические движения с боль- большими периодами, необходимо рассматривать семейства с двумя пара- параметрами. Действительно, обращение мультипликатора в корень из едини- единицы (отличный от 1 и —1) встречается неустранимо лишь в вещест- вещественно двухпараметрических семействах. Двупараметрическое рассмот- рассмотрение потери устойчивости неподвижной точки в резонансном слу- случае, т. е. когда мультипликатор близок к корню из единицы, позволяет также лучше понять бифуркации в однопараметрических семействах
§ 34. Потеря устойчивости автоколебаний 347 при пересечении мультипликаторами единичной окружности. А имен- именно, как мы увидим, некоторые перестройки, кажущиеся нелокальными при однопараметрическом подходе, поддаются исследованию локальны- локальными методами, если рассматривать задачу как двухпараметрическую. В частности, на этом пути можно исследовать некоторые случаи жест- жесткой потери устойчивости и указать, на какой режим перескочит сис- система после жесткой потери устойчивости цикла. Д. Резонанс при потере устойчивости цикла. Рассмотрим отображение плоскости в себя в окрестности непо- неподвижной точки с мультипликатором, равным корню степени q > 2 из единицы. В соответствии с общим методом Пуанкаре (гл. 5), мы можем записать семейство в подходящей системе координат в виде z н> z[A+^(|z|2)+#zg~1-|-0(|;z|g+:l)], где Л, В и О гладко зависят от е. Вместо того, чтобы исследовать это отображение, мы можем по- поступить по-другому. Каждый шаг метода Пуанкаре в случае резонан- резонанса сводится к усреднению вдоль соответствующего слоения Зейфер- та (см. § 21). Поэтому вместо приведения к нормальной форме функ- функции последования можно записать исходное уравнение фазовых кривых в окрестности цикла как неавтономное уравнение с 2тг-периодическими коэффициентами и затем приводить его к нормальной форме 2тгд-пе- риодическими по времени заменами координат (см. § 26). В результате этой процедуры мы получим в новых координатах (гладко зависящих от параметра) уравнение с 2тгд-периодическими по t коэффициентами С = еС + С^(К12) + ^С9 + O(|C|g+1). Здесь е — комплексный параметр, Aw В голоморфно зависят от е, зна- значение ? = 0 соответствует резонансу (т. е. обращению мультипликатора исходного уравнения в корень степени q из 1). Замечание 1. Из приведенных рассуждений следует, в частности, что: 1) Функция последования с точностью до членов степени q + 1 (и даже с точностью до членов сколь угодно высокой степени) совпадает с преобра- преобразованием фазового потока векторного поля на плоскости. 2) Указанное векторное поле инвариантно относительно циклической группы диффеоморфизмов плоскости (порядка q). 3) Выводы 1 и 2 имеют место не только для индивидуальной функции последования, но и для семейства, гладко зависящего от параметров, причем
348 Глава 6 как группа, так и инвариантное относительно нее поле, получаются гладко зависящими от параметров. Замечание 2. Точная функция последования, вообще говоря, не являет- является преобразованием фазового потока никакого векторного поля и не комму- коммутирует ни с какой конечной группой диффеоморфизмов. Из сказанного выше видно, что с точностью до членов сколь угодно высокой степени относительно расстояния до замкнутой фазовой кри- кривой задача о бифуркациях при потере устойчивости вблизи резонанса порядка q > 2 сводится к исследованию перестроек фазовых портре- портретов в двухпараметрических семействах общего положения векторных полей на плоскости, инвариантных относительно вращений на угол =^-. Резонанс называется сильным, если q ^ 4. Случаи резонансов порядка 2 и 1 также можно включить в эту схему. А именно, потеря устойчивости цикла при прохождении пары мультипликаторов через единичную окружность соответствует гипер- гиперповерхности коразмерности один в функциональном пространстве. Эта гиперповерхность подходит к гиперповерхностям, соответствующим мультипликаторам 1 и —1, по поверхностям коразмерности 2. Точки общего положения на этих поверхностях коразмерности 2 соответству- соответствуют таким замкнутым фазовым кривым, для которых функция после- последования имеет двукратное собственное число 1 (соответственно —1) с жордановой клеткой порядка 2. Поэтому исследование граничных случаев прохождения мульти- мультипликаторов через единичную окружность сводится, с точностью до членов сколь угодно высокой степени, к изучению перестроек фазо- фазовых портретов в общих двухпараметрических семействах векторных полей на плоскости, инвариантных относительно поворотов на угол 2тгд (q = 1, 2) и имеющих при некотором значении параметра особую точку с линейной частью в виде нильпотентной жордановой клетки; соответ- соответствующее линейное уравнение приводится к виду х = у, у = 0. Окончательно, задача о перестройках при потере устойчивости вблизи резонансов приводит к изучению бифуркаций фазовых портре- портретов в двухпараметрических семействах эквивариантных векторных по- полей на плоскости; этой последней задачей мы теперь и займемся.
§35. Эквивариантные векторные поля 349 § 35. Версальные деформации эквивариантных векторных полей на плоскости Перестройки фазовых портретов векторных полей, инвариантных относительно какой-либо группы симметрии, естественно возникают при исследовании различных явлений, в которых симметрия присут- присутствует в самой постановке задачи. Более удивительным является тот факт, что задачи о перестройках симметричных фазовых портретов возникают сами собой в несиммет- несимметричной a priori ситуации, при исследовании бифуркаций вблизи резо- нансов (см. § § 21 и 34). В настоящем параграфе рассматриваются имен- именно те бифуркации симметричных фазовых портретов, которые нужны для изучения резонансов. Е. Эквивариантные векторные поля на плоскости Пусть F — векторное поле на плоскости комплексной перемен- переменной z. Мы будем рассматривать F как комплекснозначную (не обяза- обязательно голоморфную) функцию на С. Ряд Тейлора этой функции в нуле можно записать в виде Предложение. Пусть поле F переходит в себя при повороте плос- плоскости переменной z на угол -^-. Тогда коэффициенты Fkj отличны от нуля лишь при к — I, сравнимых с 1 по модулю q. Доказательство. Ряд Тейлора единственен, поэтому каждый его член должен повер- повернуться на угол -^-, когда z поворачивается на угол -^-. Точка комп- к-i 2тг(к-1) _ лекснои плоскости z z поворачивается на угол . отот поворот совпадает с поворотом на угол -^- в точности при указанном выше усло- условии. ¦ Следствие. Дифференциальные уравнения, инвариантные относи- относительно поворотов на угол =^-, имеют следующий вид: z = zA(\z\2) + В^'1 + 0{\z\q+1) {q > 2). Доказательство. Рассмотрим на плоскости (к, I) целые точки, удовлетворяющие
350 Глава 6 сравнению к — I = l(modg). Эти точки расположены на лучах, па- параллельных биссектрисе положительного квадранта и начинающихся в точках, отвечающих мономам z, zq+1, z2q+1, ... ; г9, г29, ... Бу- Будем искать среди перечисленных мономов мономы наименьшей степени (рис. 150). Мы получим последовательно сперва несколько мономов на луче, начинающем- начинающем2к затем мо- ся в z (т. е. мономов вида z ном г9; все прочие мономы имеют сте- степень не ниже q + 1 (рис. 150). ¦ 9+1 Рис. 150 Определение. Главным уравнением, инвариантным относительно поворота на угол =?-, называется предыдущее урав- уравнение, в котором откинут член О. Пра- Правая часть главного уравнения называется главным q-жвивариантным полем. Пример. Главные уравнения, инвариантные относительно групп вращений порядков 3 и 4 имеют, соответственно, вид z = ez Az\z\ z = ez Az\z\ ^з Bz6. Для формулировки результатов исследования перестроек фазовых портретов эквивариантных векторных полей, зависящих от парамет- параметров, удобно ввести следующие определения. Ж. Эквивариантные версальные деформации. Рассмотрим семейство v\, векторных полей, инвариантных отно- относительно действия группы G на фазовом пространстве и зависящих от параметра А, принадлежащего окрестности точки 0 пространства Ш.к (называемого базой семейства). Размерность базы называется числом параметров семейства. Росток семейства в точке А = 0 называется жвивариантной дефор- деформацией поля vo. Определение. Эквивариантная деформация v\ называется зкви- вариантно топологически орбиталъно версалъной (короче версалъной)
§35. Эквивариантные векторные поля 351 деформацией поля vo, если для любой другой эквивариантной дефор- деформации Юц того же поля существует непрерывное отображение <р баз де- деформаций и такое непрерывно зависящее от [i семейство гомеоморфиз- гомеоморфизмов hfj, фазового пространства, коммутирующих с действием G, что h^ переводит фазовые кривые поля w^ в фазовые кривые поля ^(д) с со- сохранением направления движения. Иными словами, эквивариантная деформация версалъна, если вся- всякая другая эквивариантная деформация топологически орбитально эк- эквивалентна деформации, индуцированной из версалъной. Аналогичные определения даются для ростков векторных полей, а также для деформаций в классе полей со специальными свойствами (например, с фиксированной линейной частью в особой точке). Теперь мы переходим к построению версальных деформаций. 3. Главные деформации. Рассмотрим векторное поле на плоскости, инвариантное относи- относительно поворота на угол =?-, q > 2. Определение. Поле называется особым, если линейная часть поля в нуле равна нулю. Определение. Главной деформацией q-эквивариантного главно- главного особого поля vo (q>2) называется двупараметрическое семейст- семейство ve=ez+vo, где параметрами являются вещественная и мнимая части комплексного числа е. Пример. Главные деформации в случаях q = 3, 4 задаются урав- уравнениями z = ez + Az\z\2 + Бг2, z = ez + Az\z\2 + Бг3, в которых е рассматривается как параметр, а комплексные коэффици- коэффициенты А и В фиксированы. Замечание. Определенные выше объекты возникают при иссле- исследовании потери устойчивости цикла при переходе пары комплексно- сопряженных мультипликаторов через единичную окружность. В функ- функциональном пространстве всех систем системы с таким переходом об- образуют гиперповерхность. Эта гиперповерхность является одной из
352 Глава 6 трех гиперповерхностей, ограничивающих область устойчивости. Дру- Другие две гиперповерхности соответствуют переходу одного мультипли- мультипликатора через единичную окружность в точке 1 и в точке —1 соответ- соответственно. Граница гиперповерхности, соответствующей переходу комплекс- комплексной пары мультипликаторов, состоит из двух частей (двух поверхнос- поверхностей коразмерности два в функциональном пространстве всех систем). Одна из этих поверхностей коразмерности два отвечает паре мульти- мультипликаторов, равных 1, образующих жорданову клетку порядка 2, дру- другая — такой же клетке с двумя собственными числами — 1. Изучение потери устойчивости в окрестности этих граничных по- поверхностей коразмерности 2 приводит к исследованию бифуркаций в двухпараметрических семействах векторных полей на плоскости, имеющих линейной частью нильпотентную жорданову клетку поряд- порядка 2 и симметричных относительно вращений на угол 2тгд, q = 2 (для мультипликаторов —1) или q = 1 (мультипликаторы 1). Чтобы вклю- включить рассмотрение этих случаев в общую схему, удобно дать следую- следующие определения. И. Случаи q = 1 и q = 2. Определение. Поле, инвариантное относительно поворота плос- плоскости на угол -^-, q = 1 или 2, называется особым, если его линейная часть в нуле есть нильпотентная жорданова клетка второго порядка. Иными словами, при q = 1 или 2 особое поле — это поле, линейная часть которого есть поле фазовой скорости уравнения х = 0 на фазовой плоскости (ж, у = х). Легко доказывается Теорема. Особое поле, инвариантное относительно поворота плоскости на угол =^-, q = 1 или 2, приводится диффеоморфизмом, ком- коммутирующим с поворотом, к полю фазовой скорости уравнения х = ах3 + Ъх2у + О(|ж|5, \у\5) {q = 2), x = ax + bxy + 0(\x\ , \y на фазовой плоскости (ж, у = х).
§35. Эквивариантные векторные поля 353 Доказательство. Линейная часть нашего поля имеет вид у-^-. Составим гомологи- ох ческое уравнение, соответствующее этому линейному полю. Для этого вычислим скобку Пуассона нашего линейного поля Л = у-^- с произ- произвольным векторным полем h = Р-^- + Q-0-. ох оу Мы находим последовательно vp А. \уА. о А] -уп А _ о А yFxdx' [ydxiQdy\ ~VQxdy Qdx' [A,h] = (ypx-Q)A+yQxA. Итак, гомологическое уравнение относительно неизвестных функ- функций (Р, Q) имеет вид системы уРх - Q + и = 0, yQx + v = 0. Здесь и и v — известные функции, а именно компоненты векторного поля w = и-0- + v-^-. которое мы хотим убить заменой переменных. ах ду Исследуем полученную систему. Исключая Q из первого уравнения и подставляя во второе, получаем У2Рхх = ~уих - v. Чтобы добиться делимости правой части на у2, достаточно изме- изменить у функции v члены 0 и 1 степени по у. Таким образом, изменяя v на vq(x) +yvi(x), можно добиться разрешимости последнего уравнения относительно Р. Следовательно, гомологическое уравнение при произвольных (и, v) неразрешимо, но становится разрешимым, если изменить v на подхо- подходящую линейную неоднородную по у функцию. Иными словами, урав- уравнение [Л, h]+w = {v0(ж) + yvi(ж))А с подходящими (vq, vi), зависящими от w, разрешимо относительно не- неизвестного поля h. 23 В.И.Арнольд
354 Глава 6 Окончательно, метод Пуанкаре позволяет уничтожать в членах каждой степени векторного поля Л + ... все вектор-мономы, кроме вектор-мономов вида хк -^— и ухк -^—. Таким образом, в классе формаль- ду ду ных степенных рядов наше уравнение приводится к виду х = а(х) + уЪ{х). Если исходная система выдерживала поворот на угол тг (т. е. была нечетной), то компоненты исходного векторного поля были нечетными функциями. В этом случае замены метода Пуанкаре можно также вы- выбирать нечетными (коммутирующими с поворотом), так как в преды- предыдущих формулах степени (Р, Q) и (и, v) одинаковы. Тогда и ряды (а, Ь) в формальной нормальной форме будут состоять лишь из членов нечет- нечетной степени. Ограничиваясь в методе Пуанкаре несколькими первыми прибли- приближениями, мы получаем сформулированное выше предложение. ¦ Определение. Главными особыми уравнениями и полями при q = 2 и 1 называются, соответственно, уравнения х = ах3 + Ъх2у (q = 2), х = ах2 + Ъху (q = 1) и задающие их векторные поля на фазовой плоскости (х, у = х). Определение. Главной деформацией главного особого поля при q = 2 и 1 называется, соответственно, деформация, состоящая в при- прибавлении к правой части уравнения второго порядка слагаемого ах+[3у (<? = 2) и а + /3х {q = 1). Список главных деформаций g-эквивариантных полей в случаях сильного резонанса, т.е. для q ^ 4 следующий: z = ez + Az\z\2 + Бг3, (9 = 4), z = sz + Az\z\2 +Bz2, (<? = 3), х = ах + (Зу + ах3 + bx2y, (q = 2), х = а + j3x + ах2 + bxy, (q = 1). Здесь переменные z, е, А, В — комплексные; ж, у, а, /3, a, b — ве- вещественные; параметры деформации обозначены греческими буква- буквами; у — х.
§35. Эквивариантные векторные поля 355 К. Версальность главных деформаций. «Теорема». Все главные особые поля при каждом q можно разде- разделить на вырожденные и невырожденные так, что 1) Вырожденные поля образуют объединение конечного числа под- подмногообразий в пространстве главных особых полей. 2) Невырожденные поля образуют объединение конечного числа от- открытых связных областей. 3) Главная деформация ростка невырожденного поля в нуле версалъ- на. 4) Главные деформации ростков невырожденных полей в каждой компоненте связности топологически эквивалентны. Слово «теорема» заключено здесь в кавычки потому, что при q = 4 теорема не доказана. За исключением случая q = 4, условия невырожденности можно выписать явно: а ф О, Ъ ф 0 при q = 1, 2; ReA(O) ф О, В ф 0 при q ^ 3. При д = 4к этим условиям следует добавить по меньшей мере условия (на стр. 394, 3), 4), указаны, по-видимому, все остальные). Из теоремы легко выводится Следствие. В функциональном пространстве двупараметричес- ких семейств векторных полей, инвариантных относительно группы вращений на углы, кратные =^-, открытое1 всюду плотное множест- множество образуют семейства, для которых поля особы лишь при отдельных изолированных значениях параметров и в окрестности этих значений семейство топологически эквивалентно версалъной деформации невы- невырожденного главного особого поля. Иными словами: пусть собственные числа линеаризации векторно- векторного поля на плоскости, инвариантного относительно вращений на углы, обычными оговорками, если база некомпактна.
356 Глава 6 кратные -^, равны нулю. Рассмотрим поле общего положения с ука- указанными свойствами. Образуем его двухпараметрическую деформацию общего положения в классе полей с той же симметрией. Утверждается, что существует такая не зависящая от параметров окрестность точки 0, что построенная деформация приводится непре- непрерывно зависящим от параметров гомеоморфизмом с такой же симмет- симметрией к нормальной форме, указанной в пп. В и Г. Точнее, гомеоморфиз- гомеоморфизмы приводят к нормальной форме фазовые портреты соответствующих систем. Таким образом, сформулированная теорема сводит описание всех бифуркаций к описанию бифуркации в главных деформациях невырож- невырожденных особых полей. Л. Описание бифуркаций. В случае q = 1 сформулированная выше теорема доказана Р. И. Бог- Богдановым в 1971 году (см. § 33, где приведено и описание бифуркаций). В случае q = 2 заменами времени добиваемся Ъ < 0. Бифурка- Бифуркационная диаграмма («циферблат») на плоскости (а, (И) и перестройка фазового портрета для случаев а > 0 и а < 0 приведены на рис. 151. В случае q = 3 заменами времени добиваемся Re A < 0. Бифурка- Бифуркационная диаграмма и перестройки приведены на рис. 152. При q ^ 5 заменами времени добиваемся Re A < 0; бифуркационная диаграмма и перестройки изображены на рис. 153. Заметим, что зона существования неподвижных точек подходит к мнимой оси е узким языком, края которого имеют общую касательную: Ime«/(Ree)±c|Ree|(9)/2, q ^ 5. Доказательства теоремы и приведенных выше утверждений в слу- случае q ^ 5 просты, в случае q = 1 содержатся в цитированных в § 33 работах Богданова, в случае q = 4 неизвестны, а в случаях q = 2, 3 на- намечены ниже. Некоторые варианты перестроек для q = 4 изображены ниже (на рис. 157,159,160). См. также стр. 394, 1), 2), 3), 4). М. Случаи симметрии порядка 3. 1°. Пусть А = 0, в этом случае система получается из некоторой гамиль- тоновой поворотом поля. А именно, рассмотрим равносторонний треуголь- треугольник, образованный особыми точками (седлами). Стороны этого треугольни-
35. Эквивариантные векторные поля 357 Рис. 151 ка определяют 3 линейные неоднородные функции. Произведение этих трех функций и есть нужная функция Гамильтона. Знак производной этой функции в силу нашей системы z = ez + B~z2 определяется знаком вещественной части параметра е. Это позволяет исполь- использовать указанную функцию в качестве функции Ляпунова. Таким образом, при А = О главная деформация исследуется без труда.
358 Глава 6 Рис. 152 Т 2°. В общем случае заменами t = —г, z = Z е приводим систему к виду \е\ В области, в которой \Z\ мал по сравнению се 1, третье слагаемое можно рассматривать как малое возмущение. В области, где аргумент Е не близок к ±?-, это возмущение не меняет картину, полученную в 1°. Если же ве- щественная часть Е мала по сравнению с комплексной, то систему можно рассматривать как маловозмущенную систему Гамильтона —— = ±iZ + Z . Невозмущенная функция Гамильтона Н описана в 1°. 3°. Вычислим скорость изменения Н вдоль решений системы. Интег- Интегрируя по линии уровня Н = h, получаем условие рождения цикла на этой
35. Эквивариантные векторные поля 359 Рис. 153 линии в виде цг2 + Лг4 dip — О, где /л — — ^, X — ат, е — а + гт, А — —а + г'Ь; г и р — полярные координаты на плоскости. Обозначим через р радиус инерции области ограниченной эллиптической кривой Н = h. Тогда условие рождения цикла именно из линии Н = h при прохождении |е| через нуль можно записать в виде а — р2т2а. Наибольшее возможное значение р соответствует треугольнику, образо- образованному сепаратрисами седел. Функция p(h) монотонна (ср. п. И). 4°. Дальнейшее обоснование версальности главного семейства и вида би- бифуркационных диаграмм и фазовых портретов проводится как в случае q — 1. Н. Случай симметрии порядка 2. 1°. Растяжениями х и заменами времени, а также параметров, семейство можно привести к виду х = ах + 2Cу + ах3 + Ьх2у, а = ±1, 6 = -2. Это семейство с параметрами (а, /3) мы и будем исследовать. 2°. Если I/ у/а, то делаем замену х = J—ж', t = а приводя- приводящую \а\ и \а\ к 1. Получаем почти гамильтонову систему. Функция Гамиль-
360 Глава 6 тона имеет вид V x x H = у -sgncty -sgna —. :, b' = \а\Ь Диссипативные члены имеют вид 2C'у + Ь'х2у, (: 3°. Интегрируя скорость изменения Н вдоль линии уровня Н = h, по- получаем условие рождения цикла из этой именно линии при прохождении а и /3 = иа через нуль: и = г2, где 2 // %2 dx dV Я dx dV — квадрат радиуса инерции относительно оси у области, ограниченной ли- линией Н — h. 4°. Если |е*| <С |/3|, то делаем замену х = Лж', t = xt', приводящую \а\ к 1 и |6| к \/3\: л = а, Ъ' = , а = а; Получаем а' = Здесь оба параметра /3' ~ -\/|Ж И а' ~ Щ малы- При /3' = 0 получаем систему Гамильтона ж = аж + /з 2уA ± ж ) + а ж. У а'хг 2 2 ах 4 Дальнейшее исследование проводится обычным образом. О. Нули эллиптических интегралов. Выше показано, что исследование поведения циклов в наших семейст- семействах сводится к решению специальных случаев следующей «ослабленной 16-й проблемы Гильберта»: Пусть Н — вещественный многочлен степени п, Р — вещественный многочлен степени т от переменных (ж, у). Сколько вещественных нулей может иметь функция I(h) = ffpdxdyl
35. Эквивариантные векторные поля 361 Для исследования симметрии порядка 2 нужен случай При Р — (i+\x2 вопрос сводится к исследованию монотонности функции r(h), где г — радиус инерции относительно оси у области, ограниченной циклом. Лемма. Функция г на интервалах между критическими значениями Н ведет себя следующим образом: Значения a и о Интервал h Поведение г -1, 0, t +1 +1 -% -1 0 +1, о, 1 -1 + 00 т -1, о, t -1 + ОО (е третьем случае г сперва убывает, а потом растет). Аналогичная (но более слабая) лемма об эллиптических интегралах ис- использовалась уже в работах Р. И. Богданова. Доказательство Р. И. Богданова связано с длинными вычислениями. Ю. С. Ильяшенко нашел доказательства как приведенной здесь леммы, так и леммы Богданова, основанные не на вычислениях, а на комплексных топологических соображениях (монодромия и формула Пикара-Лефшеца). (См.: Ю. С. Ильяшенко. О нулях специальных абелевых интегралов в вещественной области. Функц. анализ и его прило- приложения, 11, 4 A977), 78-79; Ю. С. Ильяшенко. Кратности предельных цик- циклов, возникающие при возмущении гамильтонова уравнения. Труды сем. им. И. Г. Петровского. 3 A978), 49-60; А. И. Варченко. Оценка числа нулей абелева интеграла, зависящего от параметра, и предельные циклы. Функц. анализ и его прилож., 18: 2 A984), 14-25; А. Г. Хованский. Вещественные аналитичес- аналитические многообразия со свойством конечности и комплексные абелевы интегра- интегралы. Функц. анализ и его прилож., 18: 2 A984), 40-50; Г. С. Петров. О числе нулей полных эллиптических интегралов. Функц. анализ и его прилож., 18, 2 A984), 73-75, Эллипт. интегралы и их неколеблемость, Функц. анализ и его прилож., 20, 1 A986), 46-49; В. И. Арнольд. Теоремы Штурма и симплекти- ческая геометрия. Функц. анализ и его прилож., 19, 4 A985), 1-10). Абелевы интегралы, встречающиеся в теории бифуркаций, по не вполне понятным причинам всегда имеют минимально возможное по соображениям размерности число нулей, т. е. обладают своеобразным свойством неколебле- неколеблемости или чебышевскости. П. Случаи резонанса порядка 4. Исходное уравнение: z = ez + Az\z\2 + B~z3'. Предположим, что В ф 0. Тогда растяжениями и поворотами z и растя- растяжением времени приводим уравнение к виду z = ez + Az\z\2 +z3.
362 Глава 6 Ime Заменой знака времени и заменой z на z можно также добиться того, что Re А ^ 0, 1шА ^ 0. Исследуем сначала особые точки, отличные от нуля. 1°. Бифуркации особых точек. Для исследования бифуркаций особых точек при изменении е полезно следующее вспомогательное построение. Пусть z — гег1р — особая точка. Тогда --^ — А + N, где N — e~4iip. г Поэтому рассмотрим окружность радиуса 1 с центром в А (рис. 154). Значе- Значение е, при котором точка z особая, лежит на луче, противоположном лучу, соединяющему нуль с точкой A + N нашей окружности. При этом чем ближе точка окружности к нулю, тем больше модуль е. Из сказанного видно, что резко различают- различаются случаи, когда \А\ меньше и больше единицы. Если \А\ < 1, то нуль лежит внутри окружности. В этом случае для любого е (кроме нуля) урав- уравнение имеет 4 особых точки в вершинах квадра- квадрата. Когда е обходит вокруг нуля, поворачиваясь на 360°, квадрат из особых точек поворачивает- поворачивается на 90° в обратную сторону. Если же \А\ > 1, то на плоскости перемен- переменной е имеется угол, ограниченный продолжени- продолжениями касательных к нашей окружности. Для е внутри этого угла особых точек 8, а вне — нуль. Когда е поворачивается от одной стороны угла до другой, рождаются четыре особых точки в вершинах квадрата: этот квадрат сразу же делится на 2. За- Затем близкие особые точки начинают расходиться. Когда е подходит к другой стороне угла, каждая особая точка первого квадрата умирает, сталкиваясь с точкой второго квадрата, первоначально отстоявшей от нее на 90° (так что один квадрат особых точек поворачивается на 90° относительно другого). 2°. Типы особых точек линейного уравнения. Мы начнем с леммы, позво- позволяющей легко исследовать типы особых точек векторного поля на плоскости, записанного в комплексной форме A+N Рис. 154 Лемма. Тип особой точки 0 не зависит от аргумента Q. Эта точка седло при \Р\ < \Q\, фокус при |ImF| > \Q\ и узел при |ImF| < \Q\ < \Р\; фокус устойчив при ReP < 0 и неустойчив при ReP > 0 (рис. 155).
35. Эквивариантные векторные поля 363 |lmP Фокусы устойчивые, левые, неустойчивые Устойчивые /у Неустойчивые Фокусы устойчивые, правые, неустойчивые Рис. 155 Доказательство. При умножении ? на комплексное число А коэффициент Р не изменится, а коэффициент Q умножится на —. Выбором А можно сделать аргумент Q А любым; этим доказано первое утверждение леммы. Для доказательства вто- второго утверждения рассмотрим случай Q = 1. Пусть Р = а + гC. Запишем матрицу уравнения в базисе A, г). Эта матрица имеет вид М = = 2a, detM = а2 + {З2 - 1. /3 a-ir Следовательно, характеристическое уравнение имеет корни Ai,2 = а ± у 1 — (З2. Условие их вещественности |/3|<1. Корни имеют разные знаки при а2+C2>1. Лемма доказана при Q = 1. Условия седла, узла и фокуса для любого \Q\ следуют теперь из соображений подобия: при заменах времени Р и Q умно- умножаются на одно и то же вещественное число. ¦ Рис. 155, ясно показывающий взаимное расположение узлов, фокусов и седел в функциональном пространстве, полезно иметь в виду при всех ис- исследованиях бифуркаций особых точек на плоскости. 3°. Исследование седел. Вернемся к исходному нелинейному уравнению. Пусть zo = relip — особая точка. Линеаризуем уравнение в этой точке. Пусть z = zo + $,. Тогда, сохраняя в правой части члены первой степени по ?, ?, получаем = r2(A-N),
364 Глава 6 Лемма. Если \А\ < 1, то все особые точки — седла. Если \А\ > 1, то при каждом е особая точка с меньшим модулем — седло, а с большим — не седло. Доказательство. Условие седла имеет по лемме 2° вид \А — N\ < |A+3iV|. Рассмотрим точ- точки А — N и А + 3iV (рис. 154). Эти точки симметричны относительно А + JV, причем соединяющая их прямая проходит через А. Какая из этих точек ближе к нулю определяется тем, по какую сторону от касательной к нашей окруж- окружности, проведенной через точку А + N, лежит точка нуль. Если \А\ < 1, то нуль всегда лежит с одной стороны от касательной (с той же, где А — N). Ес- Если же \А\ > 1, то ответ зависит от того, на какой из двух дуг, ограниченных касательными к окружности из нуля, лежит А + N. Дальняя от нуля дуга отвечает седлам и ближним особым точкам (см. 1°). ¦ 4°. Устойчивость особых точек. Особые точки, соответствующие обра- обращенной к нулю части нашей окружности, могут быть узлами и фокусами. Часть дуги, непосредственно примыкающая к касательной из нуля, соответ- соответствует узлу, но при движении по дуге узел может стать фокусом, а фокус может менять устойчивость. Выясним, при каком условии происходит эта смена устойчивости фокуса. Из леммы п. 2° и формулы п. 3° следует, что смена устойчивости происходит, когда точ- точка А — N (диаметрально противоположная точ- точке А + N нашей окружности) пересекает мнимую ось, в то время как точка A+N лежит на ближней Re А к нулю дуге. Граница, отделяющая точки А, для которых такое явление происходит, определяет- определяется условием: диаметр, проведенный через точку пересечения нашей окружности с мнимой осью, перпендикулярен касательной из нуля. Уравнение границы имеет, как легко сосчитать, вид 1 + Re2 A Im A Рис. 156 1т А\ = Соответствующая линия на плоскости переменной А касается окружнос- окружности \А\ = 1 в точках А = ±г и имеет асимптотами прямые |ReA| = 1 (рис. 156). 5°. Поведение на бесконечности. При больших z слагаемым ez можно «пренебречь». Полагая w = z2, получаем линейное уравнение w = 2Aw + 2w.
35. Эквивариантные векторные поля 365 Для исследования этого уравнения остается применить лемму 2°. Таким об- образом, при \А\ < 1 особая точка на плоскости w седло, а при \А\ > 1 все траек- траектории из бесконечности притягиваются в конечную область, если Re A < 0. 6°. Бифуркации фазового портрета. Если \А\ < 1, то картина (рис. 157) по-видимому, такая же, как для резонансов третьего порядка (см. выше п. Ж). Если |ReA| > 1 то, по-видимому, происходит то же, что для резонансов порядка 5 и выше (рис. 158, 153); впрочем, особые точки могут в этом случае рождаться и не на цикле. Ср. стр. 394, задачи 1), 2), 3). Наибольшие трудности представляет случай |ReA| < 1, \А\ > 1. Рис. 157 с и Рис. 158 7°. Новые нормировки и обозначения. Для исследования случая | КеА\ < 1 полезно рассмотреть асимптотику при |1тА| —>¦ оо. Вместо того чтобы устремлять А к бесконечности, можно в исходном уравнении устремлять В к нулю. Чтобы исследовать этот случай, мы введем следующие обозначения: е — а + ir, А — —га — 7? В — /3, и будем считать малыми параметрами одного порядка величины f3, a — uf3, -у = v0 (fi —>¦ 0, U ~ V ~ 1). Нормирующие растяжение координат и времени множители выберем так, чтобы а = 1, т = 1. Введем симплектические полярные координаты р = ——, <р = argz. Li
366 Глава 6 Исходное уравнение принимает вид системы р= 2р(а - 27/9 + 2flpcos4ip), ф = т — 2а р — 2/3/9 sin 4уз. Введем еще гамильтониан Н — тр — ар2 — (Зр2 s'mAip и потенциал Л = ар?- ^-. Тогда р — —Н^ + Up, ф — Нр. В интересующем нас случае т = а = 1, а = иC, 7 = VP имеем Н = #о + (ЗНх, П = /Ш1, Н0 = р-р2. При /3 = 0 получаем невозмущенное движение (вращение с частотой Нр). В области, где Нр ф 0 (т.е. когда р не близко к ^) основной возмущающий эффект дает диссипативный член /3IIi, а при /9 ~ - нужно учитывать и /3i?i. 8°. Лемма об эффекте малой диссипации. Рассмотрим на фазовой плос- плоскости уравнение х = v + ew, где г; гамильтоново поле с функцией Гамильто- Гамильтона Н, a w потенциальное поле, w = VII (имеется в виду метрика, заданная симплектическими координатами р, q). Лемма. Производная по малому параметру е от приращения Н за обо- оборот вокруг замкнутой фазовой кривой Н = h равна при е = 0 4&Н G(h) где G(h) — область, ограниченная кривой. Доказательство. SH и ? Hdt= I Hp(-Hq + eILp) + Hq(Hp + eILq) dt = /f f Up dq — Пд dp = e II АП dp dq. J J Применяя лемму к нашему уравнению, находим SHo = 2/9(о- - 27/9) = 2Cр(и - 2vp). Таким образом, в первом приближении цикл дается формулой и_ 2v
§35. Эквивариантные векторные поля 367 Этот метод позволяет исследовать нашу систему вне кольца, в котором р близко к —. Следовательно, случай <т, близкого к 75 нужно рассмотреть от- отдельно. 9°. Исследование случая р ~ -. Делаем замену р = - + у/]ЗР, —— = Т. ^ ^ V/5 После замены полагаем /3 = 0. Получаем в качестве приближенного уравнения систему Гамильтона dP_ = dT W с функцией Гамильтона Ноо — Р и — 7 (маятник с крутящим моментом). Здесь w = и — v = —-—. Р Потенциальная яма существует при \w\ < 1. С точки зрения обозначений 7° мы перебросили из потенциальной час- ти в гамильтонову поле (а — 7)"о~- Таким образом, новые гамильтониан и потенциал имеют вид Н = р — р — (Зр sin 4уз — ftwip, 2 47/53 П = ар (а — J)p. Применяя лемму 8°, мы находим SH =11 B<т — 87/5) dp dtp внутри ямы = 2S(a — 47/>o), где S площадь внутри ямы на плоскости (р, у?), а ро — координата центра тяжести ямы. Условие рождения цикла а = 4"уро. Следовательно, нужно вычислить ро. Но ро = — + л/ftpi + ... Значит, условие рождения цикла имеет вид z а = 27 + 47V/5/51 + ..., w = — + 4^р\ + ... Вычислим величину р\. Точное уравнение замкнутой фазовой кривой Н — const имеет в координатах Р, <р вид
368 Глава 6 го=1-5 Каждому значению <р в яме отвечают два значения Р, причем P2 = —. sin4<p 1 — f3 sin A(p' Из этой формулы следует, что попра- поправочный член, который мы выше обо- обозначили через pi, равен = --^sm Aip Рис. 159 (черта означает «усреднение» по невозмущенной фазовой кривой при /3 = 0). Рассматривая расположение ямы по отношению к максимуму и мини- минимуму синуса 4ip и его изменение при изменении величины w (рис. 159), мы получаем информацию о поведении pi, на которой и основаны картины пе- перестроек (рис. 160). Изображенная на рис. 160 система перестроек реализуется при больших по сравнению с \В\ величинах | Im А\ при 0 < | КеА\ < \В\. Разумеется, изложенные выше соображения не заменяют собой доказа- доказательств и являются лишь первыми шагами исследования бифуркаций в глав- главном семействе 4-симметричных уравнений. Результаты о случаях симметрии порядка q ф 4, по-видимому, известны специалистам довольно давно; в частности, Ф. Такенс анонсировал их в не- неопубликованном препринте 1974 г. Наше изложение основано на статье автора в «Функциональном анализе и его приложениях», 1977, №2; подробные дока- доказательства проведены Э. Хорозовым. Р. Функция последования. Применения наших построений к исследованию потери устойчи- устойчивости цикла основаны на следующем. Лемма 1. Рассмотрим отображение /: (М2, 0) —> (М2,0); имею- имеющее неподвижную точку 0 с собственными числами e±2nip/q (и с жор- дановой клеткой порядка 2, если q = 1 или = 2). Тогда итерацию fq можно при любом N представить в достаточно малой окрестности точки 0 в виде суммы fq = g+ h, где h(z) = O(|^|iV)? a g — преобразо- преобразование фазового потока векторного поля, инвариантного относительно конечной циклической группы диффеоморфизмов j, порядка q. Заметим, что, в частности, g коммутирует с поворотом на угол -^-. Само отображение fq, вообще говоря, не коммутирует с действием ни- никакой конечной группы и не включается в поток. Лемма 1 показывает,
35. Эквивариантные векторные поля 369 Рис. 160 однако, что на уровне формальных рядов fq включается в поток и ком- коммутирует с конечной группой. Доказательство леммы проводится по обычной схеме построения нормальных форм Пуанкаре-Дюлака-Биркгофа (см. гл. 5). ¦ Лемма 2. Рассмотрим деформацию f\ отображения /о = /, удов- удовлетворяющего условиям леммы 1. Тогда итерацию /^ можно при лю- любом N представить в достаточно малой окрестности точки 0 в виде суммы /д = g\ + h\, где h\(z) = 0A^1^), a g\ — преобразование фазо- фазового потока векторного поля v\, инвариантного относительно конеч- конечной циклической группы диффеоморфизмов, 7а- Здесь Д, g\, h\, v\ и 7а гладко зависят от параметра \, меняющегося в окрестности нуля. 24 В. И. Арнольд
370 Глава 6 Доказательство основано на том, что приведение к нормальной форме членов степени не выше N с оставлением резонансных членов осу- осуществляется гладко зависящим от параметров диффеоморфизмом. ¦ Соединяя лемму 2 с описанием бифуркаций фазовых потоков из предыдущих параграфов, мы получаем информацию о потере устойчи- устойчивости неподвижной точки 0 отображения / (или периодического дви- движения, для которого / есть функция последования). Замечание. Можно также непосредственно приводить к нор- нормальной форме семейство дифференциальных уравнений в окрест- окрестности (р, q) — резонансного периодического решения в пространст- пространстве g-листного накрытия. Применение стандартного метода Пуанка- Пуанкаре-Дюлака-Биркгофа в этой ситуации приведет семейство векторных полей, 2тг-периодическое по времени, к сумме g-симметричного поля, не зависящего от времени, и остатка 0A^1^) периода 2тгд. С. Обсуждение. 1°. Для перевода полученных результатов на язык бифуркаций пе- периодических решений нужно найденные неподвижные точки на плос- плоскости заменить замкнутыми траекториями в пространстве, сепаратри- сепаратрисы точек — инвариантными притягивающими и отталкивающими по- поверхностями этих замкнутых траекторий, предельные циклы на плос- плоскости — инвариантными торами. Существенная разница будет лишь в перестройках сепаратрис: в то время как на плоскости сепаратрисы при бифуркациях мгновенно проходят друг через друга, в пространст- пространстве этот процесс растягивается с образованием гомоклинической (или гетероклинической1) картины (рис. 103). Инвариантные торы в пространстве разрушаются раньше, чем на плоскости цикл доходит до петли сепаратрис — однако все эти чисто трехмерные эффекты слабы (происходят от членов сколь угодно боль- большой степени в нормальных формах) по сравнению с рассмотренными выше двумерными. 2°. Рассмотрение потери устойчивости как двухпараметрического, а не однопараметрического явления позволяет легко понять некоторые обстоятельства, кажущиеся иначе удивительными. 1 Гомоклинической (гетероклинической) картиной называется сеть, образованная на секущей плоскости пересекающимися следами притягивающегося и отталкива- отталкивающегося инвариантных многообразий одной (двух) замкнутых траекторий.
§35. Эквивариантные векторные поля 371 Рассмотрим двупараметрическое семей- семейство, в котором в качестве параметра взят сам мультипликатор. Нарисуем на плоскости зна- значений параметра области существования пе- периодических решений, замыкающихся при q оборотах вдоль основного решения, сделав р оборотов поперек него. Эта область выходит на единичную окружность в точке е2пгр^ уз- узким (при q > 4) языком (ширина его на рис ;[gl расстоянии а от окружности порядка aq~2/2, см. п. Е). Поэтому кривая общего положения на плоскости мультипли- мультипликатора пересекает вблизи единичной окружности бесконечное число языков (рис. 161). Следовательно, в общем однопараметрическом семействе, в кото- котором цикл теряет устойчивость без сильного резонанса, вблизи момента потери устойчивости рождаются и умирают в бесконечном количестве длиннопериодические циклы. Доказательство этого факта, не зависящего от того, имеет- имеется ли слабый резонанс в момент потери устойчивости, было дано В. С. Козякиным (В. С. Козякин. Субфуркация периодических колеба- колебаний. ДАН СССР. 232, 1 A977), 25-27). 3°. Рассматривая кривые общего положения на бифуркационных диаграммах сильных резонансов, приведенных в п. Е, можно описы- описывать последовательности перестроек, которые являются универсальны- универсальными, но кажутся с однопараметрической точки зрения нелокальными. Например, в случае q = 2 одной из возможностей является такая последовательность событий: устойчивый цикл мягко теряет устойчи- устойчивость с образованием тора, на котором быстро образуется перетяжка, так что форма меридиана тора приближается к восьмерке; при подходе к центру восьмерки (где находится неустойчивый цикл) притягиваю- притягивающее множество, оставаясь близким к тору с почти стянувшимся в вось- восьмерку меридианом, разрушается вблизи гомоклинической сепаратрисы (Ю.И.Неймарк). В этом случае фазовая траектория совершает витки вокруг то од- одной, то другой половины разрушенного тора, перескакивая с одной сто- стороны на другую случайным на вид образом. Это описание похоже на явления, наблюдавшиеся в численном экспери- эксперименте Герценштейна и Шмидта (С. Я. Герценштейщ В. М. Шмидт. Нелиней-
372 Глава 6 ное развитие и взаимодействие возмущений конечной амплитуды при кон- конвективной неустойчивости вращающегося плоского слоя. ДАН СССР, 225, 1 A975), 59-62). § 36. Перестройки топологии при резонансах Резонансы между собственными числами линейной части вектор- векторного поля в стационарной точке мешают выбрать координаты так, что- чтобы сделать поле линейным. Даже если резонансов нет, но собственные числа близки к резонансным, ряды Пуанкаре могут расходиться и сис- система тогда не может быть превращена в линейную аналитической за- заменой координат. В то же время топологический тип фазового портрета в веществен- вещественной окрестности стационарной точки при резонансах, вообще говоря, не меняется. Например, если вещественные части всех собственных чисел отрицательны, то стационарная точка притягивающая, и, независимо от резонансов, система топологически эквивалентна стандартной ли- линейной системе. Оказывается, перестройка топологии при резонансе происходит, но, вообще говоря, в комплексной области. Система общего положения нерезонансная. Резонансы встречают- встречаются неустранимо в однопараметрических семействах. Поэтому при ис- исследовании влияния резонансов на перестройки топологии мы должны рассматривать однопараметрические семейства векторных полей. В со- соответствии со сказанным выше, мы будем считать как фазовые пере- переменные и время, так и параметр комплексными числами. А. Резонансы в области Пуанкаре. Рассмотрим комплексные фазовые кривые в окрестности особой точки О. Эти кривые образуют слоение с вещественно двумерными слоями, с особенностью в нуле. Чтобы разобраться в строении этой особенности, пересечем слоение сферой малого радиуса с центром в на- начале координат. Предположим, что линейная часть нашей системы в координатах (zi, ... , zn) диагональна: Zj = XjZj + ... , j = 1, ... , п. Теорема. Если набор собственных чисел {Xj} принадлежит об- области Пуанкаре, то каждая сфера \zi\2 + ... + \zn\2 = г2 достаточно малого радиуса пересекается со слоением трансверсалъно.
§36. Перестройки топологии при резонансах 373 Доказательство. Рассмотрим вначале линейную систему. Имеем dr2 = 2_] 'Zj dzj + Zj d~z~j = Adt + Adt, A — 2_] \zjf^j • Условие трансверсальности со сферой состоит в том, что 1-форма dr2 не должна обращаться в 0 на касательной плоскости к слою. Но фор- форма Adt + Adt нулевая только при А = 0. Соотношение А = 0 не вы- выполняется в случае Пуанкаре (и только в случае Пуанкаре) ни при ка- каком z/0. Итак, в линейном случае теорема доказана: слои пересекают сферу под ненулевым углом a(z). Рассмотрим минимум «о угла a(z) на сфере \z\ = г. Величина «о не зависит от г (так как a(cz) = a(z)). Итак, a(z) ^ «о > 0 при всех г/0. Обратимся теперь к нелинейной системе. Угол между полями на- направлений нелинейной системы и ее линейной части мал вместе с \z\. Поэтому в достаточно малой окрестности нуля он меньше «о и фазовые кривые нелинейной системы пересекают сферу трансверсально. ¦ Следствие. Пересечения комплексных фазовых кривых со сферой достаточно малого радиуса образуют одномерное слоение без особых точек на этой сфере. Слоения, полученные на всех сферах достаточ- достаточно малых радиусов, диффеоморфны. Дифференцируемый тип слоения на сфере не меняется при деформациях сферы, пока она остается транс- версальной комплексным фазовым кривым. Таким образом, изучаемое двумерное слоение в окрестности осо- особой точки гомеоморфно конусу над одномерным слоением на сфере. Это слоение на сфере является разбиением на фазовые кривые векторного поля на сфере (так как сфера и комплексное слоение ориентируемы). Замечание. В нерезонансном случае, согласно теореме Пуанкаре, система в надлежаще выбранной системе координат в достаточно ма- малой окрестности особой точки линейна. Отсюда вытекает, что диффе- дифференцируемый тип слоения на сфере в нерезонансном случае такой же, как у линейной системы. Мы заключаем, что дифференцируемый тип слоения на сфере оста- остается таким же, как у линейной части системы, не только в той окрест- окрестности начала координат, где сходятся ряды Пуанкаре, но и далеко за ее пределами.
374 Глава 6 Действительно, при приближении к резонансу область сходимости рядов Пуанкаре стягивается до нуля, тогда как радиус области транс- трансверсальности остается ограниченным снизу. Следовательно, мы можем следить за прохождением резонанса в комплексной системе по измене- изменению одномерного слоения на сфере фиксированного (не зависящего от параметра) малого радиуса. Б. Резонанс Ai = 2Лг. В качестве примера рассмотрим изменение топологии слоения на S3 при прохождении резонанса Ai = 2Лг в системе Z\ = XlZl . . . , Z2 Мы находимся в области Пуанкаре, если отношение Л = — является Л2 вещественным отрицательным числом. Рассмотрим сперва слоение на S3, отвечающее линейной части системы. Сепаратрисы z\ = 0, %2 = 0 пересекаются со сферой по большим кругам, являющимся циклами системы на S . Их коэффициент зацепления равен 1. Если Л — не вещественное число (случаи «фокуса»), то все остальные кривые слоения на сфере сматываются с одного цикла и наматываются на другой. Изучим функции доследования циклов. Заметим, что эти функции можно считать голоморфными. Действитель- Действительно, они вещественно дифференцируемо эквивалентны комплексным функци- функциям последования, отображающим голоморфную трансверсаль к сепаратрисе в себя. Следовательно, они становятся голоморфными при подходящем выбо- выборе комплексной структуры на вещественно двумерной трансверсали к циклу в S3. Из этих соображений следует также, что мультипликаторы наших цик- циклов равны е±2?ггА, е±2?ггА соответственно. Слоения на S3, соответствующие всем фокусам, гомеоморфны друг дру- другу, но не диффеоморфны: А2 + А~2 — инвариант диффеоморфизма. Если А вещественное положительное (случай узла), то мы также нахо- находимся в области Пуанкаре. В этом случае часть S между двумя зацепленны- зацепленными циклами расслоена на двумерные торы, заполненные обмотками с числом вращения А, одинаковым на всех торах. Рассмотрим теперь нелинейную систему. В случае фокуса резонанс не- невозможен, поэтому слоение на сфере в нелинейном случае диффеоморфно описанному выше слоению, построенному по линейной системе. То же вер- верно для нерезонансного узла, т. е. для всех А > 0, исключая случаи, когда А или А — целое число.
§36. Перестройки топологии при резонансах 375 Рассмотрим, например, резонанс Л = 2. В этом случае нормальная форма Пуанкаре имеет вид Z\ = \\Z\ + С%2 5 Z2 = \2Z2- Эта система имеет при с ф 0 лишь одну сепаратрису, а слоение на S имеет лишь один цикл. Заменим Л близким к 2 невещественным значением. Полученная система на S3, с одной стороны, близка к резонансной системе с одним циклом, а с другой стороны, она диффеоморфна изученной ранее системе, построенной по линейному фокусу и, следовательно, имеет два цик- цикла с коэффициентом зацепления единица. Можно показать, что один их этих циклов, Ci, близок к единственному циклу С резонансной системы. Другой же цикл, Сг, лежит на тонком торе с осевой линией С\ и замыкается после двух обходов вокруг Ci, сделав один оборот по меридиану (так что коэффи- коэффициент зацепления Сг и С\ равен 1). Итак, перестройка системы на S3 вблизи резонанса Л = 2 состоит в бифуркации двукратной периодической траекто- траектории от периодической траектории с собственными числами (—1, —1). ЗАМЕЧАНИЕ. Предыдущее изложение следует заметке автора «Замеча- «Замечания об особенностях конечной коразмерности в комплексных динамических системах», Функциональный анализ и его приложения, 3, 1 A969), 1-6. Ре- Результаты этой заметки были в дальнейшем обобщены Дж. Гукенхеймером, Н. Кейпером, Н. Н.Ладисом, Ю. С. Ильяшенко и др. Наиболее законченный характер имеют результаты о топологическом типе слоения, заданного в окрестности особой точки в комплексном пространстве линейной систе- системой. Рассмотрим, в частности, случай, когда фазовое пространство трехмер- трехмерно и треугольник из собственных чисел содержит ноль строго внутри. Ока- Оказывается, топологический тип слоения в комплексном пространстве опреде- определяется тройкой обратных величин собственных чисел, рассматриваемой как тройка векторов на вещественной плоскости (т. е. рассматриваемой с точнос- точностью до вещественных линейных преобразований овеществленной плоскости одного комплексного переменного). В многомерном случае вещественный тип набора обратных величин собственных чисел взаимно однозначно определя- определяет топологический тип комплексного слоения в окрестности особой точки линейной системы, если нуль принадлежит выпуклой оболочке собственных чисел, а их попарные отношения невещественны (см. С. Camacho, N. Kuiper, J.Palis. C.R. Acad. Sci. Paris, 282 A976), 959-961; Н.Н.Ладис. Топологичес- Топологические инварианты комплексных линейных потоков. Дифференциальные урав- уравнения, 12, 12 A976), 2159-2169; Ю. С. Ильяшенко. Замечания о топологии осо- особых точек дифференциальных уравнений в комплексной области и теорема Ладиса. Функциональный анализ и его приложения, 11, 2 A977), 28-38).
376 Глава 6 В. Версальные деформации в случае Пуанкаре. Рассмотрим аналитическое (гладкое) векторное поле с особой точ- точкой О. Предположим, что эта особая точка — типа Пуанкаре, т.е. что выпуклая оболочка набора собственных чисел не содержит точку 0. Теорема. Росток аналитического [соответственно, голоморфно- голоморфного, гладкого) векторного поля в особой точке типа Пуанкаре имеет конечно-параметрическую аналитически [соответственно, голоморф- голоморфно, гладко) версальную деформацию, состоящую из полиномиальных век- векторных полей. Иными словами: Локальное семейство аналитических [соответственно, голоморф- голоморфных, гладких) векторных полей с особой точкой О типа Пуанка- Пуанкаре аналитически [соответственно, голоморфно, гладко) эквивалент- эквивалентно в окрестности точки О семейству, составленному из достаточно длинных отрезков рядов Тейлора этих полей в точке О. Доказательство. По условию особая точка невырождена и, следовательно, гладко зависит от параметров. Поэтому гладкой и гладко зависящей от пара- параметров заменой переменных можно перенести особую точку в начало координат. Предположим, что собственные числа просты. Тогда собст- собственный базис можно выбрать гладко зависящим от параметров. В по- полученной системе координат семейство дифференциальных уравнений, отвечающее нашему семейству полей, принимает вид Xk = Afe [е)хк + ... , к = 1, ... , п. Применяя метод Пуанкаре (гл. 5), мы будем убивать только те члены, которые остаются нерезонансными при е = 0. Тогда замены гладко зависят от параметра. Поскольку собственные числа принадле- принадлежат области Пуанкаре, резонансов конечное число, и сходимость всей процедуры доказывается без труда. Мы получаем систему координат, в которой правые части всех уравнений семейства — многочлены. ¦ Случай конечно (или бесконечно) дифференцируемых правых частей также исследуется без труда. Подробности см. в статье Н. Н. Брушлинской (Я. Я. Брушлинская. Теорема конечности для семейств векторных полей в окрестности особой точки типа Пуанкаре. Функц. анализ, 5, 3 A971), 10-15), где рассмотрен также и случай кратных собственных чисел.
§36. Перестройки топологии при резонансах 377 Г. Материализация резонансов. В области Зигеля при приведении к нормальной форме возникают трудности, связанные с малыми знаменателями. В то же время тополо- топологическая картина может быть простой. Например, обыкновенное седло устроено топологически одинаково как при рациональном, так и при иррациональном отношении собственных чисел. Такое же явление бы- бывает и в области Пуанкаре: резонансы могут не влиять на топологию фазового портрета. Естественно возникает вопрос, почему резонанс, не проявляющий- проявляющийся топологически, мешает аналитическому (даже конечно-гладкому) приведению к нормальной форме. Здесь полезно иметь в виду поведение резонансов в теории возмущений условно-периодических движений. Рассмотрим дифференциальное уравнение на n-мерном торе Тп в = ш + е..., в modd 2тг Е Тп, шЕГ, е « 1. (*) Резонансу (и, к) = 0 отвечает (по меньшей мере в отсутствие возму- возмущения, т.е. при г = 0) изменение топологических свойств системы: фазовые кривые заполняют всюду плотно не n-мерный тор, как в не- нерезонансном случае, а (п — 1)-мерный. Например, при п = 2 при резо- резонансе обычно возникают грубые периодические режимы (устойчивые и неустойчивые предельные циклы на торе). Ясно, что существование таких циклов препятствует приведению уравнений к нормальной фор- форме в = и, обычной для нерезонансного случая. Близкое соображение лежит в основе данного Пуанкаре доказатель- доказательства несуществования первых интегралов в задаче трех тел. Можно предположить, что влияние резонансов на расходимость в локальной задаче, которой мы занимались выше, также имеет ана- аналогичную природу, но связано с изменениями топологии слоения, об- образованного фазовыми кривыми не в вещественной, а в комплексной области. Такое изменение, даже если оно совершенно не сказывается на вещественной части фазового пространства, заведомо препятствует аналитическому приведению и может мешать Сг-гладкому. Заметим, что система ж& = А&ж& + ... заменой х — егв приводится к виду (*) (вещественные и) соответствуют чисто мнимым А). Обыч- Обычные методы разыскания предельных циклов для системы (*) приводят к рассмотрению первого интеграла р = ег(в'к^ невозмущенной системы; в обозначениях исходной системы возникает величина р = хк. Урав-
378 Глава 6 нение первого приближения для инвариантного многообразия, соответ- соответствующего резонансу, получается из соотношения р = р[{к, \) + {к, с)р+ ...]. Мы находим формально (к, АО-)) р к> — (к, ф)) Однако наши ряды, вообще говоря, расходятся, и вывод нуждается в об- обосновании. При п = 2 наши рассуждения можно подкрепить строгим дока- доказательством существования комплексного предельного цикла, который вблизи резонанса имеет указанную асимптотику (А. С. Пяртли. Рож- Рождение комплексных инвариантных многообразий вблизи особой точки векторного поля, зависящего от параметров. Функц. анализ, 6, 4 A972), 95-96). В момент резонанса, когда (к, А) = 0, цикл (комплексная неод- носвязная фазовая кривая) приближается к комплексным сепаратри- сепаратрисам особой точки. Нестягиваемый путь, который имеется на этом цикле, при резонансе исчезает, сливаясь с положением равновесия. Частным случаем является рождение (или гибель) цикла из положе- положения равновесия при потере устойчивости (см. § 33). В этом случае к = A, 1, 0, ...), Ai + A2 = 0, и все явление наблюдаемо в вещественной области (см. рис. 129). В других случаях (даже при том же резонансе, например, в случае седла) топология вещественных фазовых кривых может не изменяться при резонансе. Различие топологии комплексных фазовых кривых уравнения (или семейства) и его нормальной формы является препятствием к аналити- аналитическому приведению к нормальной форме. Более того, если это разли- различие (как это обычно бывает) определяется по струе конечного порядка, то оно препятствует не только аналитическому приведению к нормаль- нормальной форме, но и конечно-гладкому. Например, расходимость приводя- приводящих рядов в случае, когда отношение собственных чисел хорошо при- приближается рациональными числами, может объясняться существовани- существованием в любой окрестности стационарной точки комплексных предельных циклов, происшедших от близких резонансов высоких порядков: у сис- системы в нормальной форме таких циклов нет, поэтому преобразование к нормальной форме обязано быть расходящимся.
§36. Перестройки топологии при резонансах 379 Исследование вопроса о расходимости рядов Пуанкаре далеко от завер- завершенности. Предшествовавшие работе Пяртли доказательства расходимости (Пуанкаре, Зигель, Брюно) основаны на подсчете роста коэффициентов и не выясняют причины расходимости в таком же смысле, в каком подсчет коэф- коэффициентов ряда arctgz доказывает расходимость при \z\ > 1, но не выявляет причины — особенности при z = ±г. А. С. Пяртли установил следующие результаты. 1°. При прохождении резонанса fciAi + А^Аг = 0 в С2 в общем слу- случае происходит ответвление от сепаратрис особой точки инвариант- инвариантного многообразия, уравнение которого имеет в первом приближении вид z^1 z%2 = е, где е характеризует отклонение от резонанса, a z-]_, z<i — фазовые координаты. 2°. Аналогичный результат для того же резонанса получен в Сп при ограничительных условиях на остальные собственные числа. 3°. Для «ненормально соизмеримых» Ai и Аг общим случаем являет- является существование бесконечного числа инвариантных многообразий, со- соответствующих равным резонансам, в любой окрестности особой точ- точки, что влечет расходимость рядов Пуанкаре. Работа А. С. Пяртли основана на методе Э. Хопфа. Другие доказательст- доказательства и обобщения первых двух результатов А. С. Пяртли предложил А. Д. Брюно (А. Д. Брюно. Нормальная форма дифференциальных уравнений с малым па- параметром. Математ. заметки, 16, 3 A974), 407-414; Аналитические инвари- инвариантные многообразия. ДАН СССР, 216, 2 A974), 253-256; Интегральные ана- аналитические множества. ДАН СССР, 220, 6 A975), 1255-1258). Д. Резонанс между тремя собственными числами. Следующий по сложности резонанс fciAi + &2А2 + &зАз = О, где треугольник с вершинами Ai, А2, Аз содержит 0, также исследо- исследовался А. С. Пяртли и А. Д. Брюно. Здесь также доказано ответвление от сепаратрис особой точки инвариантного многообразия при п = 3. Пусть (z-l, Z2, z$) — фазовые координаты, а е — параметр деформа- деформации (резонанс соответствует е = 0). Тогда инвариантные многооб- многообразия заполняют в пространстве с координатами (z, e) голоморфную гиперповерхность, уравнение которой имеет в первом приближении вид z11z22z33 = e в подходящей системе координат. А. С. Пяртли доказал, что для «ненормально соизмеримых» (Ai, A2, A3), образующих треугольник Зигеля, в общем случае в любой
380 Глава 6 окрестности положения равновесия 0 6 С3 имеется бесконечно много инвариантных многообразий описанного вида, соответствующих раз- различным резонансам. Из дальнейшего будет видно, что наличие в окрестности нерезо- нерезонансной точки 0 € С3 достаточно большого куска резонансного ин- инвариантного многообразия препятствует сходимости рядов Пуанка- ре-Зигеля в этой окрестности. Поэтому из цитированного результата Пяртли вытекает, что при «ненормально соизмеримых» (Ai, A2, A3) об- общим случаем является расходимость указанных рядов в любой окрест- окрестности начала координат. Е. Случай дискретного времени. Рассмотрим локальный автодиффеоморфизм А: Сп —> Сп в окрест- окрестности неподвижной точки 0. Обозначим через (Ai, ... , Хп) собственные числа линеаризации А в 0. Предыдущая теория переносится на этот случай со следующими изменениями. Резонансы: \к = X™1 ... А™и (пц ^0,J2mi^2)- Область Пуанкаре: все |А8| > 1 или все |А8| < 1. Область Зигеля: существуют |А^| ^ 1 и |Aj| $C 1. Замечание. Линейному векторному полю в Сп соответствует ли- линейное преобразование в С" («функция последования Пуанкаре»). А именно, пусть поле задает дифференциальное уравнение •• •> zn = UnZn, где ап ф 0. Рассмотрим решения с начальными условиями при t = 0 на плоскости zn = 1. Значение решения при t = -^- принадлежит той же плоскости С". Полученное отображение А: ?.п~1 —> ?.п~1 имеет собственные числа As = е2т<ха/ап (s — ]_? . #. ? п _ ]_). Аналогичная конструкция функции последования имеется (при не- небольших дополнительных предположениях) и в нелинейном случае. По- Поэтому результаты об инвариантных многообразиях и бифуркациях для отображений влекут соответствующие результаты для векторных полей. Впрочем, в большинстве случаев отмеченную связь между уравне- уравнениями и отображениями лучше использовать как эвристическое сред- средство для угадывания результатов в одной области по имеющимся ре- результатам в другой, доказательства же удобнее проводить независимо в обеих ситуациях.
§36. Перестройки топологии при резонансах 381 Ж. Бифуркация инвариантных многообразий диффеомор- диффеоморфизма. Резонанс между тремя собственными числами векторного поля kia.1 + k2a2 + k3a3 = О соответствует в дискретном случае резонансу вида л mi Л1 2 причем в области Зигеля т\ > О, т2 > 0, |Ai| ^ 1 ^ |Аг|. Мы предполо- предположим, что Ai по модулю больше 1, а Х2 меньше 1. Результаты Пяртли и Брюно в этом случае означают существова- существование инвариантных многообразий, заполняющих в пространстве с коор- координатами (е, zi, z2) поверхность, уравнение которой начинается с чле- членов вида е = г™гг™2. Здесь е — отклонение от резонанса, a (zi, z2) — подходящие (гладко зависящие от е) фазовые координаты. При фикси- фиксированном е ф 0 построенное инвариантное многообразие гомеоморфно цилиндру. Коэффициенты зацепления направляющей окружности этого цилиндра с координатными осями в С2 равны т\ и тп2. Мы покажем, что существование достаточно большого куска та- такого резонансного инвариантного многообразия в окрестности нерезо- нерезонансной неподвижной точки диффеоморфизма препятствует линеари- линеаризации диффеоморфизма в этой окрестности. Следовательно, в случае, когда резонансные многообразия имеются в любой окрестности непо- неподвижной точки, линеаризующие ряды всюду расходятся. Топологически все отображения С2 с |Ai| > 1 > |Аг| эквивалентны друг другу. В частности, все они линеаризуются и имеют много инва- инвариантных цилиндров. Однако аналитические инвариантные цилиндры являются, как мы увидим, большой редкостью. 3. Локальные сдвиги. Мы собираемся связать с резонансным инвариантным многообра- многообразием отображения С2 —> С2 эллиптическую кривую, вложенную в голо- голоморфную поверхность. Эта поверхность — многообразие орбит нашего отображения (или многообразие фазовых кривых исходного дифферен- дифференциального уравнения в С3). Чтобы точно определить многообразие ор- орбит, введем следующую терминологию. Рассмотрим цилиндр S1 х Ж. Стандартным сдвигом цилиндра на- называется прибавление 1 ко второй координате. Пусть Dq — область на
382 Глава 6 цилиндре, содержащая S1 х [0, 1]. Сужение стандартного сдвига на Dq задает диффеоморфизм t: Dq —> D\ = t(Do). Заметим, что пересече- пересечение Dq П^1 содержит окружность S1 х 1. Обозначим через D объеди- объединение Dq U D\. Пусть М — двумерное многообразие, Mq и Mi — его области, /: Mq —> Mi — гомеоморфизм. Определение. Гомеоморфизм / называется локальным сдвигом, если существует гомеоморфизм h: М —> D, переводящий Mq в Dq, М1 в D1 и / в t. Пусть М — комплексная кривая, и /: Mq —> Mi — голоморфный локальный сдвиг. Тогда склеивание каждой точки z G Mq с ее обра- образом f(z) G Mi определяет компактную комплексную кривую, гомео- морфную тору, т. е. эллиптическую кривую Г = M/f. Доказательство очевидно. ¦ Рассмотрим теперь прямое произведение цилиндра на плоскость П = (S1 х Ж) х Ж2. Пусть Т: П ->¦ П — сдвиг на 1 вдоль Ж, Ео — окрестность Do х 0, Ei = ТЕ0, Е = Ео U Е\. Пусть N — гладкое вещественное четырехмерное многообра- многообразие, М С N — двумерное подмногообразие, N\ и N2 — области в N = N1 LJ N2, F: Ni —> N2 — гомеоморфизм. Определение. Гомеоморфизм F называется локальным сдвигом N вдоль М, если существует гомеоморфизм Н: N —>¦ Е, переводящий iVo в Ео, Ni в Еи F в Т и М в D. Пусть N — комплексная поверхность, М С N — комплексная кривая, F: Nq —> N1 — голоморфный локальный сдвиг вдоль М. Тогда склеивание каждой точки z G iVo с ее образом F{z) G N\ определяет голоморфную комплексную поверхность S = N/F, являющуюся окрест- окрестностью эллиптической кривой Г = M/f. Доказательство очевидно. ¦ И. Построение эллиптической кривой по резонансному инвариантному многообразию линейного преобразова- преобразования. Пусть А: С2 —> С2 — линейное преобразование с собственными числами Ai, A2, |Ai| > 1 > |Аг|. Предположим, что собственные числа
§36. Перестройки топологии при резонансах 383 удовлетворяют резонансному соотношению А™1 А™2 = 1, где rai и гаг взаимно просты. Тогда цилиндр с уравнением z™1 z™2 = 1 (где zi, %2 — координаты в собственном базисе) инвариантен относительно А. Сужение А на этот цилиндр задает голоморфный сдвиг. Действи- Действительно, униформизуем кривую А™1 А™2 = 1 параметром Л ф 0 по фор- формуле Ai = Лт2, А2 = A~mi; на цилиндре введем параметр Z ф О по формуле Z\ = Zm2, Z2 = Z~mi. Тогда действие А на цилиндре принимает вид Z \-> AZ. Это преобразование является голоморфным сдвигом, так как |Л| > 1. Соответствующая эллиптическая кривая есть С*/{Л} ^ C/BttZ + ш%), где Л = eiu. Заметим, что линейное преобразование имеет в случае резонанса целое однопараметрическое семейство голоморфных инвариантных ци- цилиндров z™1 z™2 = с, с ф 0. Эллиптические кривые, построенные по всем этим цилиндрам, изоморфны. Подходящая окрестность любого такого цилиндра (или его доста- достаточно большого конечного куска) превращается при факторизации по действию А в окрестность эллиптической кривой на комплексной по- поверхности. Эта поверхность — прямое произведение эллиптической кривой на С. Действительно, гомотетии z \-^ kz определяют проекцию на эллиптическую кривую, а отображение z н-» z™1 z™2 — проекцию на второй сомножитель. В частности, индекс самопересечения эллиптической кривой в по- построенной поверхности равен нулю. К. Построение эллиптической кривой по резонансному инвариантному многообразию нелинейного преобразо- преобразования. Пусть А{е): U —> С2 — биголоморфное отображение области С/сС2 в С2, голоморфно зависящее от параметра е. Мы предполагаем, что е меняется в окрестности нуля в С, и что все отображения А(е) оставля- оставляют на месте начало координат в С2. Обозначим через Ai, A2 собственные числа линеаризации отображе- отображения А@) в 0. Мы предполагаем, что |Ai| > 1 > |А2| и что А™1 = A^~W2, где rai и rri2 взаимно просты. Для семейства А общего положения при прохождении при е = 0 резонанса от сепаратрис неподвижной точки ответвляется инвариант- инвариантный голоморфный резонансный цилиндр (см. п. Ж). Зафиксируем до- достаточно малое е и рассмотрим сужение А{е) на этот цилиндр. Можно
384 Глава 6 проверить, что А{е) индуцирует на соответствующей части цилиндра локальный голоморфный сдвиг. [Это следует из того, что 1) цилиндр имеет в первом приближении уравнение z^z™2 = c(e); 2) А(е) близ- близко к линеаризации А@) в 0; 3) линеаризация А@) в 0 действует на цилиндре г™гг™2 = с как локальный сдвиг (см. п. И).] Итак, при достаточно малых |е| отображение А{е) определяет эл- эллиптическую кривую Г(е), вложенную в поверхность ?(е). В гомологи- ях кривой Г(е) имеется отмеченная окружность (образ направляющей окружности цилиндра). Кривую Г(е) можно представить в виде где 2тг соответствует отмеченной окружности. Функция ш(е) имеет при ?—>0 предел luq. Из формул п. И следует, что Ai=e*w°m2, A2=e~*w°mi. Индекс самопересечения кривой Г в поверхности S равен нулю. Поэтому топологически S является прямым произведением Г на диск. Однако аналитически Г — не обязательно прямое произведение. Более того, 1) ? может не быть голоморфным расслоением над Г; окрест- окрестность Г в S может не допускать голоморфных отображений на Г тож- тождественных на Г. Так будет, например, в случае, когда рядом с Г в ? есть семейство эллиптических кривых с разными значениями моду- модуля со. 2) Г может не допускать в S деформаций, отличных от сдвигов Г по себе. Так будет, например, в случае, когда нормальное расслоение Г в S аналитически нетривиально. Положительные результаты о строении S приведены в § 27. Л. Нелинеаризуемость отображения в области, содержа- содержащей резонансный цилиндр. Теорема. Если эллиптическая кривая Г недеформируема в своей окрестности ?, то отображение А не линеаризуется биголоморфной заменой переменных в окрестности точки 0, содержащей часть голо- голоморфного инвариантного цилиндра, нужную для построения кривой Г. Доказательство. Действительно, голоморфный инвариантный цилиндр линейного отображения всегда можно продеформировать посредством малой го- гомотетии. ¦
§36. Перестройки топологии при резонансах 385 Таким образом, мы получаем оценку радиуса сходимости рядов Пуанкаре-Зигеля сверху через голоморфный инвариантный цилиндр с нетривиальным нормальным расслоением соответствующей эллипти- эллиптической кривой. Теорема (Ю. С. Ильяшенко). Если линейное отображение име- имеет голоморфный инвариантный цилиндр, направляющая окружность которого имеет с собственными осями коэффициенты зацепления (rai,ra2), а соответствующая эллиптическая кривая есть C/B7rZ+o;Z) (причем 2тг соответствует направляющей цилиндра), то собственные числа равны Ai = егшт2, Аг = е~гштП1, и, следовательно, имеет место резонанс X™1 X™2 = 1. Доказательство. Пусть (zi, Z2) — собственный координаты. Дифференциальные формы -^ на цилиндре голоморфны и инвариантны относительно ото- отображения, следовательно, определяют голоморфные формы на эллипти- эллиптической кривой. Вычислим интегралы этих форм по образующим группы гомологии тора. Одна из образующих соответствует направляющей окружности j на цилиндре. Для нее /dz\ . / dz2 o . -=— = 27Г1ГП2, ф -=— = — zirimi, так как коэффициент зацепления j с осью Z\ = 0 равен гаг, а с осью Z2 — 0 равен mi. Вторая образующая соответствует отрезку 8, со- соединяющему точку г с ее образом Az на поверхности цилиндра. Для нее [ dzi . л [ dz2 1 л / / -^— = mAi, / -^— = шАг (эти соотношения определяют вет- ветви логарифмов). Но все голоморфные формы на эллиптической кривой пропорциональны. Итак, Следствие. Пусть А — локальный диффеоморфизм с неподвиж- неподвижной точкой 0, Air2 — собственные числа. Предположим, что в некото- некоторой окрестности U неподвижной точки имеется голоморфный цилиндр. Пусть А — голоморфный сдвиг вдоль этого цилиндра и пусть uj — пе- период соответствующей эллиптической кривой. Тогда, если А и со не 25 В. И. Арнольд
386 Глава 6 связаны соотношением \\ = егшт2, Лг = е~гштг {где mi, гаг — коэф- коэффициенты зацепления с сепаратрисами особой точки), то диффеомор- диффеоморфизм А в области U аналитически не эквивалентен линейному. М. Расходимость рядов Пуанкаре. Из полученных результатов вытекает Теорема. Если в сколь угодно малой окрестности нерезонансной неподвижной точки 0 локального диффеоморфизма С2 —> С2 имеют- имеются голоморфные цилиндры, на которых диффеоморфизм действует как локальный сдвиг, то этот диффеоморфизм аналитически не эквивален- эквивалентен линейному ни в какой окрестности неподвижной точки 0 (и, сле- следовательно, ряды Пуанкаре всюду расходятся). А. С.Пяртли установил, что такое накопление инвариантных ци- цилиндров к особой точке является общим случаем для отображений, собственные числа которых «ненормально хорошо аппроксимируются резонансными». Следовательно, для таких собственных чисел расходи- расходимость рядов Пуанкаре всюду также является общим случаем. Результаты этого параграфа легко переносятся на векторные по- поля в С3 вблизи особой точки типа Зигеля. Материализацией резонан- резонанса raiAi + гагА2 + тзA3 = 0 является эллиптическая кривая. Точки этой кривой — фазовые кривые поля, лежащие на инвариантной резонансной поверхности z™1 z™2 z™3 = се + ... Н. Бифуркации эллиптических кривых на комплексных поверхностях. Изложенная выше теория бифуркаций инвариантных многообразий диф- дифференциальных уравнений имеет близким аналогом теорию бифуркаций эл- эллиптических кривых с нулевым индексом самопересечения на комплексных поверхностях. Эллиптическая кривая и ее нормальное расслоение на поверхности зада- задаются парой комплексных чисел (о;, А) (см. § 27): они получаются из комплекс- комплексной оси ср и из плоскости двух комплексных переменных (г, ср) при склейках (г, ср) ~ (г, ср + 2тг) ~ (Аг, ср + ш). Расслоение называется резонансным, если оно становится аналитически тривиальным после перехода к некоторому конечнолистному циклическому накрытию. Резонансные расслоения соответствуют в пространстве пар (А, и>) гипер- гиперповерхностям Ап = егкш. Оказывается, при общем непрерывном изменении
§36. Перестройки топологии при резонансах 387 пары (эллиптическая кривая, поверхность), в момент прохождения через ре- резонанс к эллиптической кривой приближается другая эллиптическая кривая, топологически ее накрывающая. Таким образом, материализацией резонанса является бифуркация кратной эллиптической кривой. Рассмотрим однопараметрическое семейство пар Г(е) С ?(е). Предпо- Предположим, что е — О отвечает резонанс Лп = егкш. Оказывается, уравнение ответвляющейся кривой имеет вид гпегк(р = е (после выбора подходящего параметра семейства е и после подходящей замены координат (г, ср), завися- зависящей от е; мы считаем, что резонанс соответствует е = 0 и что отсутствуют резонансы меньшего порядка: \тег11р ф 1 при О < га < п). Приведем здесь вывод уравнения ответвляющейся кривой на уровне формальных рядов. Рассуждая, как в § 27, мы приведем склейку к виду г /г^A + а? + aw + А), <р \<р + ш + (Зе + bw + В, где а, /3, а, Ъ — константы, w — rne*fc?\ А и В — ряды по степеням е и w, начинающиеся с членов степени 2. Такая подстановка переводит w в адA+ +je + cw + С), где 7 = па + ik/З, с = па + ikb, С — члены второй и более высоких степеней по е и w. Уравнение je + cw + С = 0 определяет ответвляющуюся кривую. Для семейства общего положения 7 ф 0, с ф 0. После подходящей замены коорди- координат е и г это уравнение принимает вид гпегк^ — е. Сходимость исследуется так же, как в цитированных работах Пяртли и Брюно. Замечание. Нетрудно проверить, что условие Хпегкш — 1 означает в точности, что нормальное расслоение аналитически тривиально над неко- некоторым конечнолистным циклическим накрытием эллиптической кривой. Топологически все рассматривавшиеся расслоения тривиальны. В част- частности, ответвившаяся при резонансе эллиптическая кривая проектируется (неголоморфно) на кривую Т(е) «вдоль r-направления». Эта проекция явля- является топологическим конечнолистным циклическим накрытием тора. Это — то самое накрытие, над которым нормальное расслоение становится триви- тривиальным в момент прохождения резонанса. В случае, когда (п, к) = d > 1 (но нет резонансов меньших порядков, Хтег1ш ф 1 при 0 < га < п) ответвляющаяся кривая несвязна. В этом случае она состоит из d компонент, каждая из которых ^-листно топологически d накрывает исходный тор. О. Расходимость линеаризации. Для некоторых нерезонансных расслоений (т.е. пар (Л, и>)) ряды, приво- приводящие склейку к нормальной форме, расходятся.
388 Глава 6 Ответвление материализующих резонанс кривых позволяет «объяснить» расходимость линеаризующих склейку рядов следующим образом. Предпо- Предположим, что пара (Л, ш) нерезонансная, но очень близка к резонансу. Тогда в малой окрестности исходной эллиптической кривой имеется, вообще го- говоря, еще одна эллиптическая кривая, а именно, кривая, материализующая резонанс. Если пара (Л, ш) достаточно близка к бесконечному числу резо- нансов, то в произвольно малой окрестности исходной эллиптической кри- кривой есть бесконечное число кривых, материализующих различные резонансы и циклически накрывающих исходную кривую. Между тем нормальное расслоение исходной кривой нерезонансное. Не- Нерезонансные нормальные расслоения степени 0 не имеют сечений ни над ка- каким циклическим конечнолистным накрытием эллиптической кривой. Поэ- Поэтому в нормальном расслоении исходной эллиптической кривой нет эллипти- эллиптических кривых, циклически накрывающих исходную кривую. Следовательно, никакая окрестность исходной кривой на поверхности не отображается биго- ломорфно на окрестность нулевого сечения нормального расслоения; поэтому ряды расходятся для склеек общего положения, если пара (Л, ш) слишком хо- хорошо аппроксимируется резонансными парами. Замечание. Существует аналогия между компактными комплексными подмногообразиями аналитических многообразий и предельными циклами дифференциальных уравнений: подобно тому, как предельный цикл может исчезнуть при малой деформации поля, лишь если оператор монодромии имеет собственное число 1, эллиптическая кривая на поверхности, имеющая нулевой индекс самопересечения, не исчезает при малых деформациях объ- объемлющей поверхности, если нормальное расслоение аналитически нетриви- нетривиально. Ф. А. Богомолов указал следующую общую формулировку: компактное подмногообразие комплексного многообразия не исчезает при малой дефор- деформации объемлющего многообразия, если тривиальны одномерные когомоло- гии нормального пучка. (Определение когомологий см., например, в книге: Р. Уэллс. Дифференциальное исчисление на комплексных многообразиях. М.: Мир, 1976, стр. 76.) § 37. Классификация особых точек В этом параграфе мы отказываемся от «универсальной» точки зре- зрения и рассматриваем не семейства, а индивидуальные системы диффе- дифференциальных уравнений в окрестности особой точки векторного поля, причем допускаем вырождения сколь угодно большой коразмерности. Исследование таких сложных особенностей с общей точки зрения имеет
§ 37. Классификация особых точек 389 весьма ограниченную ценность, так как сложные вырождения имеют большую коразмерность и встречаются редко. Однако знание общих, принципиальных черт произвольных особен- особенностей представляет интерес даже и в тех сложных случаях, добраться до которых не позволяют наши сегодняшние вычислительные возмож- возможности. В частности, знать, какого рода патология может встретиться в случаях большой коразмерности, полезно хотя бы для того, чтобы не тратить сил на поиски несуществующих вещей. Такими несущест- несуществующими объектами, на поиск которых потрачено много усилий, ока- оказались, например, алгебраические критерии устойчивости по Ляпуно- Ляпунову или асимптотической, а также алгебраические критерии в проблеме центр-фокус (при нулевых корнях характеристического уравнения). Чтобы показать, о каких принципиальных вопросах идет речь, мы рассмотрим вначале очень простой и легко исследуемый до конца при- пример. А. Особые точки функций на прямой. Пусть / — вещественная гладкая в окрестности точки х = О G Ж функция. Если точка 0 не критическая, то функция гладко эквивалент- эквивалентна в ее окрестности линейной (/(ж) = х + с). Как обстоит дело в критическом случае, тоже хорошо известно: если /'@) = 0, то поведение функции определяется знаком /"@) и т.д. Рассмотрим для определенности задачу об условиях минимума функции в точке 0. Ответ можно представить в следующем виде: про- пространство Jk fc-струй функций в 0 разбивается на три части, Jk = I U II U III; I — струи, гарантирующие минимум, II — струи, гарантирующие отсутствие минимума, III — струи, по которым нельзя решить, есть ли минимум. Струи типов I и II называют достаточными, а типа III — воспри- восприимчивыми. Множества I, II, III в нашей задаче обладают следующими двумя свойствами. 1°. Полуалгебраичность. Каждое из множеств I, II, III является по- полуалгебраическим подмногообразием пространства струй Jk.
390 Глава 6 Полу алгебраическое множество в Ж определяется как конечное объединение подмножеств, каждое из которых задается конечной сис- системой полиномиальных уравнений и неравенств. Если неравенства не нужны, то множество называется алгебраи- алгебраическим. Полезным свойством полуалгебраических множеств является следующая теорема (доказательства см. в A. Seidenberg. A new decision method for elementary algebra. Ann. of Math., Ser. 2, 60 A954), 356-374; E. А. Горин. Об асимптотических свойствах многочленов и алгебраичес- алгебраических функций. УМН, 16, 1 A961), 91-118). Принцип Тарского-Зайденберга. Образ полуалгебраического мно- множества при полиномиальном отображении полуалгебраичен. Более слабая по форме, но эквивалентная формулировка: Проекция полуалгебраического множества на подпространство яв- является полуалгебраическим множеством. Заметим, что уже проекция алгебраического множества может быть не алгебраическим, а лишь полуалгебраическим множеством (пример — проекция сферы на плоскость). 2°. Почти конечная определенность. При к —> ею коразмерность множества восприимчивых струй III С Jk стремится к бесконечности. Иными словами, восприимчивые струи в Jk определяются расту- растущим вместе с к числом условий. В результате оказывается, что мно- множество функций, для которых задача о выяснении того, есть ли 0 точка локального минимума, неразрешима ни при каком числе членов ряда Тейлора, очень тощее: оно имеет коразмерность бесконечность в функ- функциональном пространстве. Б. Другие примеры. Аналогичная задача для функций нескольких переменных уже не имеет простого алгоритма: если второй дифференциал вырождается, то к исследованию приходится привлекать следующие, и мы приходим к задачам типа классификации алгебраических кривых, поверхностей и т. п. Тем не менее и здесь разбиения Jk = I U II U III пространст- пространства fc-струй функций в Жп обладают свойствами полуалгебраичности и почти конечной определенности, хотя явно выписать уравнения и не- неравенства на коэффициенты Тейлора при сколько-нибудь больших п и к безнадежно. Существование этих уравнений и неравенств можно вывести из теоремы Тарского-Зайденберга, доказательство которой
§ 37. Классификация особых точек 391 содержит также и алгоритм для выписывания этих уравнений и нера- неравенств (обобщающий теорию Штурма). Начальный отрезок классификации вычислен явно и оказался связан- связанным (довольно таинственным образом) с классификацией правильных мно- многогранников, с группами Коксетера, Вейля и Ли серий Ak, -Dfe, Ek, с авто- морфными функциями, треугольниками на плоскости Лобачевского, с осо- особенностями каустик волновых фронтов и осциллирующих интегралов метода стационарной фазы (см. обзор: В. И. Арнольд. Особые точки гладких функций и их нормальные формы. УМН, 30, 5 A975), 3-65 и список литературы в нем; В. А. Васильев. Асимптотика экспоненциальных интегралов, диаграмма Нью- Ньютона и классификация точек минимума. Функциональный анализ и его при- приложения. 11, 3 A977), 1-11). Следующий пример — задача о топологической классификации ростков гладких отображений. В 1964 году Р.Том анонсировал тео- теорему о полуалгебраичности и почти конечной определенности в этой задаче; доказательство дал А. Н. Варченко (А. Н. Варченко. Локальные топологические свойства дифференцируемых отображений. Известия АН СССР, сер. «Матем.», 38, 5 A974), 1037-1090). В. Особые точки векторных полей. Вернемся к задаче о топологической классификации особых точек векторных полей. Вначале ситуация кажется столь же простой, как и в случае функций. Невырожденные особые точки классифицируются по количеству собственных чисел в левой полуплоскости. Пространст- Пространство 1-струй разбивается на конечное число частей, соответственно числу корней в левой полуплоскости. Каждая из этих частей — полуалгебраи- полуалгебраическое множество в пространстве струй; задающие его полиномиальные неравенства можно выписать даже явно (условия Рауса-Гурвица, см., например: Ф. Р. Гантмахер. Теория матриц. М.: Наука, 1967). Восприимчивые 1-струи образуют полуалгебраическое подмного- подмногообразие коразмерности 1, разделяющее области, соответствующие раз- разному числу корней в левой полуплоскости. В предыдущих парагра- параграфах мы рассмотрели ряд примеров исследования того, что происходит в этих вырожденных случаях при переходе к 2-струям, и т. д. Таким образом, возникает впечатление, что и здесь можно идти сколь угодно далеко, и только сложность вычислений и обилие вариантов не поз- позволяют дать алгебраическую классификацию в случаях произвольно большой коразмерности. Оказывается, однако, что дело обстоит не так (В. И. Арнольд. Алгебраическая неразрешимость проблемы устойчивое-
392 Глава 6 ти по Ляпунову и проблемы топологической классификации особых то- точек аналитической системы дифференциальных уравнений. Функцио- Функциональный анализ, 4, 3 A970), 1-9). Свойство полуалгебраичности теряется уже в такой простой за- задаче, как задача различения центра и фокуса при нулевых кор- корнях характеристического уравнения (А.Д.Брюно и Ю. С. Ильяшенко; см.: Ю. С. Ильяшенко. Алгебраическая неразрешимость и почти алгеб- алгебраическая разрешимость проблемы центр-фокус. Функц. анализ, 6, 3 A972), 30-37). Таким образом, для проблем устойчивости и топо- топологической классификации не может существовать алгебраический ал- алгоритм1. Остается еще некоторая надежда на существование неалгебраичес- неалгебраического алгоритма, т.е. на то, что свойство почти конечной определеннос- определенности все же имеет место: множество ростков, топологический тип (или устойчивость) которых не определяется ни по какому конечному от- отрезку ряда Тейлора, имеет, быть может, коразмерность бесконечность. Вопрос, так ли это, представляется весьма трудным; постановку его следует еще уточнить, указав точный смысл слова коразмерность: мно- множества в пространстве fc-струй, коразмерность которых нужно опре- определить, неалгебраические, и возможны теоретико-множественные за- затруднения. Р. Том высказал гипотезу, что ответ на поставленный во- вопрос отрицателен. Г. Строение множеств восприимчивости. Вопрос о почти конечной определенности относится к поведению множеств восприимчивых струй в пространстве fc-струй Jk при к, стре- стремящемся к бесконечности. Вопросы о строении множеств восприим- восприимчивости при фиксированном к кажутся более поддающимися иссле- исследованию. Зафиксируем восприимчивую (к — 1)-струю векторного по- поля в 0 и рассмотрим пространство J всевозможных fc-струй с дан- данной (к — 1)-струей. Для определенности будем рассматривать задачу об асимптотической устойчивости. Тогда пространство J делится на две (быть может, пустые) части: I (устойчивые по fc-струе) и II (неустойчи- (неустойчивые по fc-струе) и остаток III из восприимчивых струй (в случае задачи *В самое последнее время Л. Хазин и Э. Шноль установили алгебраическую нераз- неразрешимость проблемы устойчивости в случае двух пар чисто мнимых собственных чисел с резонансом 3 : 1. Этот случай соответствует подмногообразию коразмернос- коразмерности 3 в функциональном пространстве.
§ 37. Классификация особых точек 393 о топологической классификации частей больше). Разумная постанов- постановка вопроса о критерии устойчивости состоит в том, чтобы выяснить, какими свойствами обладают части I, II и граница между ними. На- Например, трансцендентность границы означает несуществование алгеб- алгебраического критерия устойчивости. Спрашивается, насколько сложно может быть устроена указанная граница? Например, может ли у нее (и у открытых частей областей I, II) быть бесконечное число компо- компонент связности? И могут ли точки частей I и II перемежаться подобно рациональным и иррациональным числам? Примеры такого рода не известны, однако можно опасаться, что именно так будет обстоять дело в особых случаях достаточно большой коразмерности в многомерном пространстве. Существует тесная связь между локальной задачей о поведении фазовых кривых вблизи особой точки в Жп и глобальной задачей о диф- дифференциальных уравнениях, заданных полиномиальной системой в про- проективном пространстве ЖРП-1 на единицу меньшей размерности. В ци- цитированной выше работе об алгебраической неразрешимости эта связь использовалась для того, чтобы вывести трансцендентность границы устойчивости в пространстве струй локальной задачи из трансцен- трансцендентности поверхности рождения предельных циклов в пространстве коэффициентов полиномиальной системы на проективной плоскости. Но в многомерной глобальной ситуации возможны гораздо более слож- сложные явления, чем предельные циклы, например, системы на торе с пе- перемежающейся соизмеримостью и несоизмеримостью чисел вращения или области в функциональном пространстве, свободные от структурно устойчивых систем. Все эти явления реализуются в полиномиальных системах в проективном пространстве, и каждое из них может давать свой вклад в запутывание границы устойчивости в пространстве J.
Образцы экзаменационных задач На письменном экзамене продолжительностью 4 часа дается 15 связан- связанных друг с другом вопросов. В квадратных скобках указано число очков за каждый вопрос. Эти числа заранее сообщаются экзаменуемым. Вариант 1. ж = — sin ж + ecost. A) I. Пусть е — 0. 1) Линеаризовать в точке ж = тг, ж = 0. [1] 2) Устойчиво ли это положение равновесия? [1] 3) Найти матрицу Якоби преобразования фазового потока за время ?=2тг в точке х — тг, х — 0. [3] 4) Найти производную решения с начальным условием х = тг, ж = 0 по параметру е при е — 0. [5] 5) Нарисовать графики решения и его производной no t при начальном условии х — 0, х — 2. [3] 6) Найти это решение. [3] П. Пусть B) — уравнение в вариациях вдоль указанного в п. 5 решения. 7) Имеет ли уравнение B) неограниченные решения? [8] 8) Имеет ли уравнение B) ненулевые ограниченные решения? [8] 9) Найти определитель Вронского фундаментальной системы решений уравнения B), зная, что W@) = 1. [5] 10) Выписать явно уравнение B) и решить его. [10] 11) Найти собственные числа и векторы оператора монодромии для урав- уравнения в вариациях вдоль решения с начальным условием х — ^, х — 0. [16] 12) Доказать, что уравнение A) имеет 2тг-периодическое решение, гладко зависящее от е и обращающееся в х — тг при е — 0. [6] 13) Найти производную этого решения по е при е = 0. [6] III. Рассмотрим уравнение щ + иих — — sin ж. 14) Написать уравнение характеристик. [2] 15) Найти наибольшее значение t, при котором решение задачи Коши с u\t=0 = 0 продолжается на [0, t). [8] Вариант 2. I. Пусть векторное поле в трехмерном пространстве имеет особую точку нуль, причем одно из собственных чисел особой точки равно нулю, а два другие чисто мнимы.
Образцы экзаменационных задач 395 1) Привести к нормальной форме члены степени 1 разложения компонент поля в ряд Тейлора в нуле. [1] 2) То же для членов степени 2. [3] 3) То же для членов любой степени. [8] 4) Усреднить систему по быстрому вращению, заданному линейной час- частью поля. [12] П. Пусть дано семейство полей, зависящих от параметра, и содержащее поле пункта I при нулевом значении параметра. 5) Гладко зависящим от параметров, меняющихся в окрестности нуля, диффеоморфизмом привести к возможно простому виду отрезок ряда Тей- Тейлора полей семейства в нуле. [10] 6) Применить к тому же семейству усреднение по быстрому вращению, заданному линейной частью исходного поля. [20] III. В пространстве 1-струй векторных полей в трехмерном пространстве выделим многообразие струй в особых точках с одним нулевым и двумя чисто мнимыми собственными числами. 7) Найти коразмерность указанного многообразия. [2] 8) Выписать условие трансверсальности семейства, записанного в най- найденном в задаче 5 виде, к указанному многообразию. [8] 9) Исследовать бифуркации особых точек в двухпараметрических семей- семействах общего положения, трансверсальных к указанному многообразию. [10] 10) Исследовать бифуркации циклов из этих особых точек. [15] 11) Исследовать существование и гладкость фазовой кривой, соединяю- соединяющей эти особые точки. [15] IV. Пусть на плоскости отмечена прямая, проходящая через нуль. Диф- Диффеоморфизм плоскости называется отмеченным, если он переводит отмечен- отмеченную прямую в себя. Векторное поле называется отмеченным, если оно ка- касается отмеченной прямой во всех ее точках. Пусть дано отмеченное поле, имеющее в нуле особую точку с двумя нулевыми собственными числами. 12) Привести отрезок ряда Тейлора поля в нуле к возможно простому виду посредством допустимого диффеоморфизма. [12] 13) Привести семейство допустимых полей, являющееся деформацией данного поля, к формальной нормальной форме посредством допустимых фор- формальных диффеоморфизмов, формально гладко зависящих от параметров, ме- меняющихся в окрестности нуля. [16] 14) Исследовать бифуркации особых точек в семействах общего поло- положения, полученных из нормальных форм задачи 13 отбрасыванием членов высокой степени. [18] 15) Применить результаты задач 12-14 к исследованию бифуркаций фа- фазового портрета поля с одним нулевым и двумя чисто мнимыми собственны- собственными числами. [25]
396 Образцы экзаменационных задач Дополнительные задачи Вариант 1. 1) z — ez + Az\z\2 + ?3. Доказать, что при | Re A\ > 1 число предельных циклов ^ 1. Указание. Разделить поле на z'z; div P(z, ~z) — 2 Re ( -75— J. 2) Пусть A — . Доказать, что если arg e — —p, то особая сепаратриса V2 4 каждого седло-узла совпадает с неособой следующего. Указание. При слиянии седла с узлом уравнение приводится к w = eie[Rw(\w\2 - 1) + i(w2 - w2)], A = (R - i)eie. Если R = 2, в = j, то сепаратрисы — прямые. 3) Исследовать кривые, разделяющие области значений А, где особые точки при изменении arge сливаются на цикле, внутри и вне. Указание. Изменение в поворачивает поле. Кривые расположены при- примерно как четыре параболы а2 — 2(±6 ±1), А — а + гЪ. 4) Доказать, что при малых | Re А\ и 1 < | Im А\ < с ~ 4, 35 уравнение A) с подходящим е имеет два предельных цикла, внутри которых лежат 9 особых точек, а при | Im А\ > с — один (А. И. Нейштадт). Граница напоминает эллипс оси 3, 11 и 2. 5) Доказать, что в системе х = х(а + ах + by), , У = у(^ + сх + dy) нет предельных циклов. Указание. При потере устойчивости фокусом система имеет первый интеграл: произведение степеней трех линейных функций (Н. Н. Баутин). Вариант 2. 1. Найти образ поля направлений dy = 0 под действием преобразования фазового потока системы у = х + у за время t.
Образцы экзаменационных задач 397 2. Исследовать зависимость периода колебаний от амплитуды (ж) для системы I ж - у х , [ у = —4ж — 2ху. 3. Имеет ли задача Коши Bу + ж2) |^ - Dж3 + 2ху) ^ = 1, и|ж=1 = О решение в окрестности точки A, уо) и единственно ли оно? 4. Найти все первые интегралы системы непрерывные в окрестности точки х = у = z = 0. Вариант 3. 1. Найти образ вектора A, 0), приложенного в точке (тг, 0), под действи- действием преобразования за время t = 1 фазового потока системы f х = У, 1 у — sin ж. 2. В каких координатах разделяются переменные в уравнении 3. Имеет ли задача Коши решение в окрестности точки (жо = 0, у = уо), и единственно ли оно? 4. Выяснить, устойчиво ли по Ляпунову решение системы с начальным условием (жо, уо, zq). 5* (дополнительная). Сколько неподвижных точек имеет отображе- отображение Аю, где A: R2 —>¦ R2, А(х, у) — (Ъу + cos ж, 5ж — cosy).
398 Образцы экзаменационных задач Вариант 4. 1. Найти положения равновесия и исследовать их устойчивость. 2. Все ли решения системы продолжаются неограниченно? 3. Сколько ненулевых решений, для которых у@) — хA) — 0, имеет система? 4. Найти производную решения с начальными условиями ж@) = у@) = е по е при е = 0. Варианты системы ( . Ч ( • ( • 2 ( . 4 ( • 2 Л — У? Ж — У, А — У? |Л — У 1 \ X — у , |Л — (/5 ^ — У? J У' ) х — У 1 ) 1*1 'У* I 7*1 'У* I 41 Т* I У - х , {у - х , ^у- х, ^ Вариант 5. 1. Найти положения равновесия и исследовать их устойчивость. 2. Все ли решения системы продолжаются неограниченно? 3. Найти диффеоморфизм плоскости, выпрямляющий поле направлений фазовых кривых в окрестности точки A, 1). 4. Найти все непрерывные на всей плоскости первые интегралы, совпа- совпадающие с у на оси у. ж ж = ж2у, 2 = ~ху , 2 = -жу , 2 = ж у, Г Ж = 1 У = Г Ж = 1 у = -ж: жу3 = жу г —а Зу2, 5 3 1 2 2 ( X \ X f* ь = -ж2у: 4 = ху , 4 = ~ху 2 3 = х у . Вариант 6. 1. Найти положения равновесия и исследовать их устойчивость. 2. Найти все начальные условия, для которых решения продолжаются неограниченно вперед. 3. Найти образ вектора A, 0), приложенного в точке 0, под действием преобразования фазового потока за время t. 4. Найти все первые интегралы, непрерывные в окрестности точки z — 1 и равные 1 на вещественной оси. .2.-2- . 2— • —2 • • —2 —2 Z = IZ , Z = Z , Z = IZ Z, Z = ZZ , Z = IZZ , Z = IZ . Вариант 7. 1. Имеет ли задача определенное на всей плоскости неограниченное ре- решение? 2. Ограничена ли величина и на характеристиках уравнения? 3. Все ли характеристики уравнения пересекают поверхность у = х + и2?
Образцы экзаменационных задач 399 4. Имеет ли уравнение характеристик первый интеграл, производная которого в начале координат равна 1? Найти производную этой производной по и вдоль характеристического вектора. и = U, у=0 ' и „= О, I и = ж=0 у=0 п 2/=0 ж=0 = 0. Вариант 8. 1. Продолжается ли решение с начальным условием ж@) = 1, ж@) = 0 на всю ось ?1 2. Ограничена ли третья производная по а при а = 0 решения с началь- начальными условиями ж@) = а, ж@) = 0? 3. Вычислить значение этой производной при t = 2тг. 4. Вычислить десятую производную решения с начальными условия- условиями ж@) = а, ж@) = 0 по а при а = 0. х + х = sh3 ж, ж + зшж = ж3, ж + ж = 2ж3, 1 з ж3 ж3 ж + х = - sh ж, x-\-sva.x=—, ж + ж=—. Вариант 9. 1. Найти третью производную решения с начальным условием ж@) = 0 в нуле. 2. Продолжается ли это решение на всю ось ?? 3. Имеет ли уравнение неограниченные решения? 4. Найти число асимптотически устойчивых периодических решений уравнения. ж = ж2 — sin2 t, ж = ж2 — cos2 t, ж = sin2 t — ж2, су су су су су су х = cos t — х , ж = sh ж - sin t, ж = sh ж — cos t.
Арнольд Владимир Игоревич Геометрические методы в теории обыкновенных дифференциальных уравнений Дизайнер М. В. Ботя Компьютерная подготовка С. В. Высоцкий А. В. Широбоков И. В. Рылова Компьютерная графика В. Г. Бахтиев Корректоры Е. Ф. Осипова, М. А. Ложкина Лицензия ЛУ №056 от 06.01.98. Подписано к печати 31.01.00. Формат 60 х 84У16. Печать офсетная. Усл. печ.л. 23,25. Уч. изд. л. 24,04. Гарнитура Computer Modern Roman. Бумага офсетная №1. Заказ №И16. Тираж 1000 экз. Отпечатано с готовых диапозитивов в Ижевской республиканской типографии, 426057, г. Ижевск, ул. Пастухова, 13.