/
Text
МАТЕМАТИКА XIX ВЕКА ЧЕБЫШЕВСКОЕ НАПРАВЛЕНИЕ В ТЕОРИИ ФУНКЦИЙ ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ ТЕОРИЯ КОНЕЧНЫХ РАЗНОСТЕЙ
АКАДЕМИЯ НАУК СССР ИНСТИТУТ ИСТОРИИ ЕСТЕСТВОЗНАНИЯ И ТЕХНИКИ
МАТЕМАТИКА XIX ВЕКА ЧЕБЫШЕВСКОЕ НАПРАВЛЕНИЕ В ТЕОРИИ ФУНКЦИЙ • ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ • ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ • ТЕОРИЯ КОНЕЧНЫХ РАЗНОСТЕЙ Под редакцией А.Н.КОЛМОГОРОВА и А.П.ЮШКЕВИЧА МОСКВА «НАУКА» 1987
УДК 51(091) Математика XIX века. Чебышевское направление в теории функций. Обыкновенные дифференциальные уравнения. Вариационное исчисление. Теория конечных разностей.— М.: Наука, 1987.— 318 с. Настоящее издание продолжает серию книг по истории математики XIX—XX вв., издаваемых Институтом истории естествознания и техники АН СССР под общей редакцией А. Н. Колмогорова и А. П. Юшкевича. Первая книга серии «Математика XIX века. Математическая логика. Алгебра. Теория чисел. Теория вероятностей» вышла в свет в 1978 г., вторая «Математика XIX века. Геометрия. Теория аналитических функций» — в 1981 г. В настоящей книге анализируется развитие в XIX в. конструктивной теории функций, теории обыкновенных дифференциальных уравнений, вариационного исчисления и теории конечных разностей. Книга рассчитана на специалистов-математиков, историков науки и студентов математических специальностей университетов и педагогических институтов. Авторы книги: член-корреспондент АН УССР Н. И. АХИЕЗЕР кандидат физ.-мат. наук С. С. ДЕМИДОВ кандидат физ.-мат. наук А. В. ДОРОФЕЕВА кандидат физ.-мат. наук С. С. ПЕТРОВА кандидат физ.-мат. наук Ф. А. МЕДВЕДЕВ доктор физ.-мат. наук Н. И. СИМОНОВ доктор физ.-мат. наук А. Д. СОЛОВЬЕВ Редакционная коллегия: доктор физ.-мат. наук И. Г. БАШМАКОВА кандидат физ.-мат. наук А. И. ВОЛОДАРСКИЙ (секретарь) кандидат физ.-мат. наук С. С. ДЕМИДОВ академик А. Н. КОЛМОГОРОВ (отв. редактор) академик АПН СССР А. И. МАРКУШЕВИЧ кандидат физ.-мат. наук Е. И. СЛАВУ ТИН (секретарь) доктор физ.-мат. наук А. П. ЮШКЕВИЧ (отв. редактор) Рецензенты: доктор физ.-мат. наук А. Н. ПАРШИН, кандидат техн. наук В. С. КИРСАНОВ 1702050000-626 М 042(02)-87 126-87-11 © Издательство «Наука», 1987 г.
СОДЕРЖАНИЕ ПРЕДИСЛОВИЕ 7 Часть первая ЧЕБЫШЕВСКОЕ НАПРАВЛЕНИЕ В ТЕОРИИ ФУНКЦИЙ ([Я. И. Ахиезер\) 9 Введение 9 1. Теория функций, наименее уклоняющихся от нуля 12 1.1. Лекции А. А. Маркова 12 1.2. Задачи Е. И. Золотарёва, неравенство В. А. Маркова 21 1.3. Чебышевская задача построения географических карт 36 2. О непрерывных дробях 39 2.1. Специальные системы ортогональных многочленов 49 2.2. Зависимость от параметров корней многочленов, получаемых при обращении рядов в непрерывные дроби 50 2.3. Исследования о предельных величинах интегралов 54 Заключение 72 Часть вторая ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ (С. С. Демидов при участии С. С. Петровой и |#. if. Симонова^ .... 80 1. Итоги развития теории обыкновенных дифференциальных уравнений в XVIII в 80 2. Проблема существования и единственности 83 2.1. Работы Коши 83 Первый метод ( 83 ). Второй метод ( 85 ) 2.2. Развитие метода мажорант 88 2.3. Метод Коши—Липшица 89 2.4. Метод последовательных приближений 91 3. Интегрирование уравнений в квадратурах 94 3.1. Лиувилль и уравнение Риккати 94 3.2. Новые классы интегрируемых уравнений 98 Уравнения Якоби ( 98 ). Исследования Миндинга ( 98 ). Уравнение Дарбу ( 99 ). Метод последнего множителя Якоби ( 100 ). Уравнение Пфаффа ( 101 ) 3.3. Софус Ли и проблема интегрируемости дифференциальных уравнений в квадратурах 104 3.4. Особые решения 109 Феномен «особого решения» ( 109 ). Теория Лагранжа ( 110 ). Примеры Коши и Курно ( 111 ). Дарбу и его полемика с Каталаном ( 112 ). Дальнейшее развитие теории особых решений ( 113 ) 4. Линейные дифференциальные уравнения 113 4.1. Общая теория 114 Методы понижения порядка ( 114 ). Линейная независимость решений. Определитель Вронского ( 115 ). Символическое исчисление ( 116 ). Уравнения с постоянными коэффициентами. Методы Бриссона и Коши ( 120 ). Уравнения с постоянными коэффициентами. Методы Грегори и Буля ( 122 ). Уравнения с переменными коэффициентами. Работы Буля ( 123 ). Исчисление Хевисайда ( 125 ). Аналогия с алгебраическими уравнениями ( 128 ). Системы линейных уравнений с постоянными коэффициентами ( 130 ) 4.2. Краевые задачи. Теория Штурма—Лиувилля 132 Работы Штурма ( 134 ). Работы Лиувилля ( 136 ). Дальнейшее развитие теории Штурма— Лиувилля ( 137 ) 4.3. Решение уравнений в виде рядов и специальные функции 139 Уравнение цилиндрических функций ( 139 ). Исследования Сонина по теории цилиндрических функций ( 141 ). Уравнение сферических функций ( 142 ). Гипергеометрическое уравнение ( 145 ). Другие уравнения, определяющие специальные функции ( 147 ) 5. Аналитическая теория дифференциальных уравнений 149 5.1. Начало теории Коши. Работы Брио и Буке 149 5.2. Б. Риман 151 5.3. Л. Фукс 154 5.4. А. Пуанкаре 157 5
5.5. Нелинейные уравнения 158 5.6. Исследования русских математиков 160 5.7. П. Пенлеве 161 6. Качественная теория дифференциальных уравнений 162 6.1. Качественная теория Пуанкаре 162 Начало качественной теории ( 162 ). Мемуар Пуанкаре 1881—1886 гг. ( 165 ). Последующие результаты Пуанкаре по качественной теории дифференциальных уравнений ( 171 ) 6.2. Теория устойчивости Ляпунова 172 А. М. Ляпунов ( 172 ). Исследования по теории устойчивости систем с конечным числом степеней свободы до Пуанкаре и Ляпунова ( 173 ). «Общая задача об устойчивости движения» Ляпунова ( 175 ). Первый метод ( 175 ). Второй метод ( 177 ). Правильные системы ( 179 ) 6.3. Дальнейшее развитие качественной теории дифференциальных уравнений 180 Заключение 180 Часть третья ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ ( А. В. Дорофеева) 184 Введение 184 1. Вариационное исчисление в первой половине XIX в 185 1.1. Теория экстремумов кратных интегралов 187 1.2. Теория Гамильтона—Якоби 191 1.3. Достаточные условия слабого экстремума 193 2. Вариационное исчисление во второй половине XIX в 202 2.1. Доказательства критерия Якоби и его уточнения. Проблема различения слабого и сильного экстремумов 203 2.2. Вариационное исчисление Вейерштрасса 207 2.3. Теория простейшей вариационной задачи во второй половине XIX в. . . 212 2.4. Создание теории поля 216 2.5. Изо периметрическая задача 223 2.6. Задача Лагранжа. Проблемы Майера и Больца 227 Заключение. О некоторых направлениях в развитии вариационного исчисления на рубеже XIX и XX вв 234 Часть четвертая ИСЧИСЛЕНИЕ КОНЕЧНЫХ РАЗНОСТЕЙ (С. С. Петрова, А. Д. Соловьев) 240 1. Интерполяция 240 1.1. Конечная интерполяция 240 1.2. Интерполяционные ряды Лапласа 243 1.3. Интерполяционные ряды Абеля 246 1.4. Оценка остаточного члена в интерполяционной формуле Лагранжа . . . 250 1.5. Аналитические методы в теории интерполяции 255 Вычеты у Коши и интерполяционная задача ( 255 ). Исследования Фробениуса сходимости интерполяционных рядов ( 257 ). Интерполяционная задача с кратными узлами у Эрмита ( 259 ). Дальнейшие исследования интерполяционных рядов ( 261 ) 2. Формула суммирования Эйлера—Маклорена 263 2.1. Задача суммирования 263 2.2. Полусходящиеся ряды. Исследования Лежандра 267 2.3. Вывод Пуассоном формулы суммирования с остаточным членом .... 269 2.4. Вывод Абеля 272 2.5. Вывод Якоби. Условия обвертываемости 273 2.6. Формула суммирования у Остроградского 275 3. Уравнения в конечных разностях 276 3.1. Постановка задачи. Итоги развития теории в XVIII в 276 3.2. Методы Лапласа 278 3.3. Исследования Пуанкаре 283 Заключение 283 БИБЛИОГРАФИЯ (Ф. А. Медведев) 286 УКАЗАТЕЛЬ ИМЕН (А. Ф. Лапко) 312
ПРЕДИСЛОВИЕ Первоначально редакторы данной серии книг предполагали издать целостный труд по истории математики XIX в., систематически переходя от одной дисциплины к другой в некотором естественном их порядке. Объективные обстоятельства, прежде всего трудности в подборе авторов,, привели к тому, что уже во второй книге от этого замысла пришлось отказаться. Вместо единой монографии мы предлагаем вниманию читателей серию книг, которая должна объять всю математику XIX в., но не в порядке общепринятой классификации составляющих дисциплин. В отличие от первых двух книг «Математики XIX века», которые были разделены на главы, третья состоит из четырех частей, что более соответствует характеру издания. Напомним, что в первой книге х были помещены очерки истории математической логики, алгебры, теории чисел и теории вероятностей, во второй 2 — история геометрии, с одной стороны, и теории аналитических функций — с другой. В настоящей, третьей книге читатель найдет: 1. Очерк развития чебышевской теории приближения функций,, названной впоследствии С. Н. Бернштейном «конструктивной теорией функций». Этот очерк, написанный весьма оригинально, принадлежит перу покойного Н. И. Ахиезера (1901—1980), автора фундаментальных: открытий в данной области. Текст Ахиезера несомненно привлечет внимание не только историков математики, но и многих специалистов в области конструктивной теории функций. Отзывы на этот раздел, написанные А. И. Маркушевичем (1908—1979) и Б. М. Левитаном, потребовали лишь самых незначительных изменений текста очерка. 2. Систематический анализ истории теории обыкновенных дифференциальных уравнений от О. Коши и некоторых его предшественников до> А. Пуанкаре и А. М. Ляпунова включительно. Равномерное освещение всех направлений рассматриваемой теории потребовало бы написания монографии большего объема. Поэтому некоторые менее существенные вопросы пришлось, несмотря на их интерес, осветить более поверхностно или даже опустить. В свое время текст этого раздела был подготовлен Н. И. Симоновым (1910—1979). Как указал рецензент В. М. Миллионщиков и как отчетливо понимал сам автор, текст нуждался в коренной переработке. Скоропостижная смерть помешала Н. И. Симонову осуществить намеченные им планы. В результате раздел был совершенно заново написан С. С. Демидовым, во многом сохранившим структуру раздела, намеченную Н. И. Симоновым. Параграф, посвященный символическим методам, был 1 Математика XIX века. Математическая логика. Алгебра. Теория чисел. Теория вероятностей. М.: Наука, 1978. 2 Математика XIX века. Геометрия. Теория аналитических функций. М.: Наука, 1981. 7
написан С. С. Петровой. Рукопись была прочитана и прорецензирована Н. X. Розовым, были учтены также замечания А. Н. Паршина и А. Д. Соловьева. Очерк развития основных направлений вариационного исчисления написан А. В. Дорофеевой. Он был прочитан В. М. Тихомировым, сделавшим ряд важных замечаний, учтенных при окончательном редактировании текста. Заканчивается том историей теории конечных разностей, в развитии которой видная роль принадлежит отечественным ученым. Авторы очерка — С. С. Петрова и А. Д. Соловьев. Всю рукопись в целом прочел В. С. Кирсанов. Указатель литературы составил, как и для предыдущих книг, Ф. А. Медведев. Там же приведены сокращения названий некоторых изданий, часто упоминаемых в книге. Указатель состоит из разделов: А. Сочинения общего характера. Б. Собрания сочинений и издания классиков литературы. Литература — к каждой из частей тома. Ссылка в тексте [A3] означает книгу 3 из раздела А, [Б23, т. 2, с. 4] — с. 4 второго тома книги 23 из раздела Б. Ссылка [14] в тексте, скажем, второй части означает книгу 14 из списка литературы к этой части. «История математики с древнейших времен до начала XIX столетия», изданная в 1970— 1972 гг., цитируется сокращенно ИМ (с указанием тома и страницы), а первая и вторая книги настоящего труда — Кн. 1 и Кн. 2 (с указанием страницы). Подбор иллюстраций осуществил А. И. Володарский. Составитель указателя имен — А. Ф. Лапко. Редакторы и авторы благодарят всех лиц, оказавших помощь в ходе подготовки рукописи. А. Н. Колмогоров А. П. Юшкевич
Часть первая ЧЕБЫШЕВСКОЕ НАПРАВЛЕНИЕ В ТЕОРИИ ФУНКЦИЙ ВВЕДЕНИЕ Хорошо известно следующее высказывание Чебышева из сочинения * «Черчение географических карт» [Б23, т. 5, с. 150—157]: «Большая часть вопросов практики приводится к задачам наибольших и наименьших величин, совершенно новым для науки, и только решением этих задач мы можем удовлетворить требованиям практики, которая везде ищет самого лучшего, самого выгодного». Карта какой-нибудь части земной поверхности считается, по Чебышеву, тем лучшей, чем меньше на ней колебание масштаба отображения, и поэтому естественно возникает задача о нахождении такой проекции, при которой это колебание будет наименьшим. Чебышев замечает, что эта задача подобна тем, которые были предметом его мемуара «Теория механизмов, известных под названием параллелограммов» [Б23, т. 2, с. 23—51], опубликованного в 1854 г. Там речь шла о нахождении элементов параллелограммов, удовлетворяющих условиям, при которых точность хода механизма наибольшая. Общим в этих задачах является следующее. Имеется некоторая область и в ней функция точки F, зависящая еще от каких-то параметров. Этими параметрами являются в задачах о механизмах конечное число констант, а в задачах о картах функция, т. е. бесконечное множество констант. При каждом наборе констант рассматриваемая функция имеет в области какой-то максимум. Требуется найти константы так, чтобы этот максимум имел наименьшее значение. Конечно, в этот круг идей включаются задачи о приближенном представлении функций при помощи более простых выражений. Уже в мемуаре о механизмах формулируется относящаяся сюда важная задача о наилучшем приближении заданной функции ф (х) посредством многочлена, где рассматриваемым выражением является F {х) =\ц> (х) — ро — pix — р2х2 рп ix71-1 |, и требуется за счет надлежащего выбора параметров р0, р1ч. . ., /?n_i сделать минимальным максимум F (х) в заданном интервале [— /i, feh По введенной Чебышевым терминологии ищется функция вида Ф (я) — Ро — Р\х — р2х2 — рп1 х71"1, наименее уклоняющаяся от нуля на интервале [—ft, h]. В соответствии с современной терминологией речь идет о наилучшем в равномерной метрике на интервале [—h, h] приближении функции ф (х) посредством многочлена степени п — 1. Равномерную метрику принято называть чебы- шевской. 1 Это сочинение было написано для торжественного акта в Петербургском университете 8 февраля 1856 г. а
П. Л. ЧЕБЫШЕВ В нескольких дальнейших работах Чебышев развивает общую теорию функций, наименее уклоняющихся от нуля, и применяет ее в задачах наилучшего приближения заданных функций с помощью многочленов или некоторых других простых выражений. Первая из работ этого цикла 1Б23, т. 2, с, 146—150] читана на физико-математическом отделении Академии наук в 1857 г., а последняя [Б23, т. 2, с. 363—372] — в 1892 г., т, е. за два года до смерти Чебышева. Еще при жизни знаменитого математика вышли в свет четыре работы <его выдающихся учеников Е. И. Золотарёва, А. А. Маркова и В. А. Маркова, представляющие важный вклад в рассматриваемую теорию. Этим завершился первый этап построения теории функций, наименее уклоняющихся от нуля, и она приобрела такой вид, что смогла сделаться предметом преподавания. Спустя один год после выхода в свет мемуара «Теория механизмов...» Чебышев опубликовал статью «О непрерывных дробях» [Б23, т. 2, с. 103— 126], которая явилась началом целого ряда статей, посвященных построению общзй теории ортогональных многочленов, а также введению некоторых важных специальных ортогональных систем. Чебышев получил некоторые новые свойства разложений в ряды, связанные с непрерывными дробями, и дал важные приложения общих результатов к теории механических квадратур и предельных величин интегралов, что позже было включено в классическую проблему моментов. Исследования Чебышева были продолжены его учениками (А. А. Марковым, К. А. Поссе), а затем Н. Я. Сониным и другими учеными. 10
Т. СТИЛТЬЕС Новым мощным импульсом для развития рассматриваемого круга идей явился замечательный мемуар Т. Стилтьеса 2 «Исследования о непрерывных дробях» [77], который сыграл выдающуюся роль в развитии всего математического анализа в XX в.3 Отправным пунктом исследований Чебышева, которые привели его к ортогональным многочленам, была задача о параболическом интерполировании по способу наименьших квадратов, являющаяся, во-первых,, важной задачей для практики и, во-вторых, снова задачей о наилучшем приближении, но на сей раз в другой метрике. Подобно некоторым задачам о функциях, наименее уклоняющихся от нуля в равномерной метрике, и эта задача редуцируется у Чебышева к неопределенному уравнению и затем трактуется с помощью аппарата непрерывных дробей. В письме к Н. Д. Брашману от 30 (18) сентября 1865 г. [Б23, т. 2, с. 412—415]: Чебышев пишет, что в вопросе об интерполировании по способу наименьших квадратов он был приведен к «новому употреблению» непрерывных дробей. Этому новому употреблению он посвящает позже две статьи. 2 Голландский математик Томас Стилтьес (1856—1894) был профессором университета в Тулузе, куда он переехал по рекомендации Эрмита. В 1905 г. в Париже вышла «Переписка Стилтьеса с Эрмитом» [БЗЗ], она содержит богатый материал главным образом по теории функций одной комплексной переменной. Издано* также «Собрание сочинений» Стилтьеса [Б56]. 3 Между прочим, в этом мемуаре построено обобщение интеграла, получившее название интеграла Стилтьеса, а также доказана хронологически первая теорема о продолжении равномерной сходимости последовательности голоморфных функций, обобщенная впоследствии Витали. it.
Аппарат непрерывных дробей был излюбленным техническим сред- ством как Чебышева, так и А. А. Маркова, и нужно признать, что владели они этим аппаратом виртуозно. Насколько мы можем судить, первый курс лекций о функциях, наименее уклоняющихся от нуля, читал в Петербургском университете сам А. А. Марков 4. В библиографическом очерке о Маркове, принадлежащем профессору А. С. Безиковичу, содержится следующая характеристика Маркова как профессора [30, с. IV]: «Основным свойством в преподавательской деятельности А. А. Маркова было стремление дать слушателям весь материал курса в безупречно строгом виде, при этом А. А. Марков стремился не к нагромождению обильного материала, но к заложению прочного фундамента, на котором у его учеников строилось строгое отношение к изучаемому материалу и к своей работе у тех из них, кто пошел по пути самостоятельного научного творчества». Сказанное характеризует не только лекции, но и книги, написанные А. А. Марковым для студентов. В частности, это относится и к двум литографированным курсам 5 «Лекции о функциях, наименее уклоняющихся от нуля» и «Лекции о непрерывных дробях». Краткий обзор первого курса является содержанием следующего раздела нашего очерка, а в дальнейших разделах мы будем часто пользоваться и вторым курсом. В заключение введения приведем по воспоминаниям одного из учеников П. Л. Чебышева слова, которые знаменитый математик любил повторять своим ученикам: «Нужно заниматься не тем, что интересно или любопытно, а тем, что важно и необходимо». 1. ТЕОРИЯ ФУНКЦИЙ, НАИМЕНЕЕ УКЛОНЯЮЩИХСЯ ОТ НУЛЯ 1.1. Лекции А. А. Маркова 1. Лекции начинаются с точной формулировки общей задачи. Пусть дана определенного вида функция v = / (х, у, . . ., z; ри р2, . . ., рп), где р±, р2, . . ., рп — параметры, а х, г/, . . ., z — координаты точки (х, г/, . . ., z), лежащей в заданной конечной замкнутой области (Q). При этом предполагается, что сама функция / и ее производные первого порядка /рх> /р2> • • •» / непрерывны, а производные второго порядка по ри Pz, • • •> Рп ограничены в области (Q). Функция I v | = | / (х, у, . . ., z; рг, р2, . . ., Рп) | также непрерывна в (Q) и по теореме Вейерштрасса имеет в (£1) максимум, который зависит от выбора параметров и называется уклонением функции v от нуля (уклонение обозначим буквой L). Задача состоит в отыскании, если возможно, таких значений для параметров, чтобы уклонение было наименьшим. Далее Марков пишет [Б13, с. 245]: «Решение этой задачи представляет большой теоретический и практический интерес и оказывается особенно полезным в вопросах о приближзнном представлении заданных функций функциями более простого вида. 4 После выхода в отставку в 1905 г. А. А. Марков по праву академика продолжал читать в Петербургском университете различные курсы, главным образом теорию вероятностей и теорию непрерывных дробей. 6 Оба курса лекций изданы в 1906 г. в литографии Богданова (СПб., Эртелев пер., 7). Второй из курсов составлен Н. Михельсоном по лекциям академика Маркова. Мы будем в дальнейшем цитировать оба курса по книге [Б13]. 12
А. А. МАРКОВ Такими вопросами впервые занялся Понселе и вполне решил задачу, которая сводится к разысканию функции вида v_.P\Z^r Р2 1Л + *Я наименее уклоняющейся от нуля, когда переменное х лежит в заданном промежутке. Но разработка общих приемов для решения таких задач и применение их к различным частным случаям принадлежит главным образом Чебышеву и его ученикам». *"? После этих кратких разъяснений доказывается основная теорема Че- бышева. Если при некотором наборе параметров рь р2, . . ., рп функция \f{x,y,...,z; Рп р2, . . ., рп) | достигает своего максимума L в точках (xt, yt, . . ., zt), полное число которых и. < оо, и если при этом наборе параметров уравнениям 6 нельзя удовлетворить иначе, как полагая Х± = Х2 = • • • = Х^ = 0, то функция v = / (х, г/, . . ., z\ pv р2, • • •» Рп) ПРИ рассматриваемом наборе параметров не будет наименее уклоняющейся от нуля. 6 (df/dpi)i, ..., (df/dpn)i суть значения частных производных dfldp^ ..., dfldpn в точке (Xi, уг, ..., Zi). 13
Безупречное в смысле строгости доказательство этой теоремы изл«к жено очень подробно. Не воспроизводя его здесь, заметим лишь, что оно» не отличается от современного доказательства. По поводу этой теоремы Марков пишет [Б13, с. 252]: «В простых сравг- нительно случаях теорема позволяет знатц какие значения должны иметь параметры, чтобы функция могла быть наименее уклоняющейся от нуля. Но при этих значениях параметров она действительно наименее уклоняется от нуля — это в каждом отдельном случае должно быть доказано- особо. Поэтому при рассмотрении различных частных случаев проще будет вместо теоремы Чебышева установить такие предложения, которые дадут систему необходимых и достаточных условий для того, чтобы функция уклонялась от нуля менее, чем всякая другая функция того же вида». 2. Следует заметить, что решение задачи часто упрощается, если заранее доказано, что искомая функция, наименее уклоняющаяся от нуля,, существует и единственна. В трех важных частных случаях, которые в статье «Вопросы о наименьших величинах, связанные с приближенным представлением функций» [Б23, т. 2, с. 151—235] Чебышев особо выделяет, это последнее обстоятельство как раз имеет место, однако у самого Чебышева оно не было ни доказано, ни даже сформулировано. Этими случаями являются задачи о наилучшем приближении заданной, функции: 1) при помощи многочлена данной степени, 2) при помощи рациональной дроби с заданным знаменателем и числителем заданной степени и 3) при помощи рациональной дроби, числитель и знаменатель которой имеют указанные степени. В лекциях Маркова подробно рассматривается первая задача: для заданной в интервале [а, Ь] непрерывной функции ф (х) найти многочлен. Р (х) = Pix71'1 + • • • + рп так, чтобы разность / (х) = ф (х) — р (х) наименее уклонялась от нуля. Доказывается в настоящее время хорошо- известная по различным книгам Теорема [Б13, с. 252—257] 7. 1) Если L > 0 есть уклонение / и х1<^х2<^. . . <% — полная система точек интервала [а, Ь], в которых I/ (х) \ = L, & v — число перемен знака в последовательности / Ы, / (*2)» • • м / (*ц), то функция / при v < п не будет, а при v Z> п будет наименее уклоняться от нуля. 2) Может существовать только одна функция /, наименее уклоняющаяся от нуля. Сформулированный критерий оптимальности приближения (в чебы- шевской метрике) обычно называют чебышевским критерием. Нарушать эту традицию, по нашему мнению, не следует, хотя у Чебышева критерий, нигде не сформулирован 8. Марков не указывает автора теоремы. Это обстоятельство, а также то, что существенная часть доказательства является простым обобщением рассуждения, примененного Марковым в заметке «Определение некоторой функции по условию* наименее уклоняться от нуля» [17], дает основание считать, что теорема принадлежит Маркову. Не исключено, что Чебышев знал рассматриваемую теорему, но по каким-то причинам ее не публиковал, как он иногда поступал с доказательствами. Возможно,, это связано с тем, что в конкретных задачах Чебышев искал процедуру, позволяющую строить решение, а не только проверять, что заданная (напримерг «угаданная») функция является решением. 14
Точки, в которых | / (х) | = L = max | / (х) |, принято называть точками уклонения, а о точках Xix <С Xi2 \ ' • * <С X4+V в которых / (х) принимает значение L с чередующимися знаками, говорят, что они образуют чебышевский альтернанс. В качестве важного частного случая рассматривается задача о нахождении многочлена / (х) = хп + Plx" 1 + . . . + рп, наименее уклоняющегося от нуля в интервале [—h, h]. Это классическая задача Чебышева. Здесь легко доказывается, что если решение существует, то должны иметь место равенство п. — п + 1 и тождество [/ (х)]2 - L2 = (х2 - /г2) [g (х)}\ (1) где g (х) = (l/n) f (х). (2) Таким образом, задача сводится к двум уравнениям (1), (2), а искомое решение / (х) должно быть многочленом степени п с равным 1 старшим коэффициентом. 3. Остановимся на различных трактовках этих уравнений в работах Чебышева, А. Маркова и Золотарёва. Это представляет интерес в связи ю другими, более сложными задачами, где появляются обобщения этих уравнений. Чебышев рассматривает одно уравнение (1), игнорируя наличие соотношения (2). Иначе говоря, он рассматривает неопределенное уравнение (1), которое надлежит решить при условии, что / (х) и g (х) — многочлены соответственно степени п и п — 1с равными 1 старшими коэффициентами9. Приведем ход дальнейших рассуждений Чебышева, заметив при этом, что Марков излагает его в лекциях о непрерывных дробях [Б13, с. 331—332], а не о функциях, наименее уклоняющихся от нуля. Итак, предполагая, что искомое решение существует, перепишем (1) в виде fix)—Лг х2 — h2g(х) = . , тде под радикалом подразумевается его арифметическое значение при х2 — h2 ^> 0. Из этого уравнения находим, что 1 _ g(x) = П ^ \[х* - № /(*) \fx* — h2 f (х) [f (x) + 1Л2 — h*g(x)]* Правая часть, если ее разложить в ряд по убывающим степеням х9 будет иметь вид На основании одной теоремы о непрерывных дробях отсюда вытекает (об этом см. следующий раздел этого очерка), что g (x)/f (х) является подходящей дробью для непрерывной дроби, в которую разлагается Пух2 — h2. 9 Заметим, что Чебышев неоднократно подчеркивал в своих работах роль «неопределенного анализа» как средства для решения новых задач о наибольших и наименьших значениях. ,15
Это разложение имеет следующий вид: 1 1 Y** — & № 2х- 2х- Так как все знаменатели первой степени, то в ряду подходящих дробей найдутся дроби с любой наперед заданной степенью в знаменателе. Поэтому, чтобы определить g (x)/f (х), нужно взять подходящую дробь g(*) = 1 f(x) № f Х~~ 2х — . где число звеньев есть п. Отсюда можно получить / (х). Не останавливаясь на выводе 10, приведем результат: Этот результат можно получить, не прибегая к непрерывным дробям, что и делает Марков в лекциях о функциях, наименее уклоняющихся от нуля [Б13, с. 257—261]. При этом, подобно Чебышеву, Марков также рассматривает лишь одно уравнение (1). Однако независимо от способа, которым решено уравнение (1), т. е, получена формула (3), необходимо доказать, что (3) является многочленом, наименее уклоняющимся от нуля в интервале [—/г, /г], и найти величину уклонения от нуля. С этой целью положим х = h cos ф (—h ^ х ^ h). Тогда чебышевский многочлен / (х) принимает вид u откуда следует, что L = hn/2n~1, а также что точками уклонения являются —h = хг = h cos (пл/п), х2 = h cos ((/г — 1) Jt/лг), . . ., #к = = h cos ((п — к + 1) л/п), . . ., хп+1 = h. При этом / Ы = ^£т cos (71 - к + 1) п = (- lf-^i -j£_ и, значит, в последовательности хпЫ) имеется v = п перемен знака. Теперь остается применить чебышевский критерий (теорема п. 2). 10 Можно применить индукцию, замечая, что при п = 1 / (х) = х, g (х) = 1, и помня, что старший коэффициент / (х) есть 1. 1 11 Обозначение Тп (х) — ■ х cos (п arccos х) впервые ввел С. Н. Бернштейн. 16
Если сразу принять во внимание оба уравнения (1), (2), то задача сведется к интегрированию дифференциального уравнения первого порядка 12. Действительно, исключая функцию g (х), мы получим из уравнений (1), (2) следующее уравнение для у = / (х): п* (£2 _ у2) = (^2 __ д.2) y>2t Отсюда dyl^L2 -у2 = ndxiyh2 - х2, и, полагая х = h cos ф, (4Х) находим dyl\fL2 — у2 = —ndy; поэтому п (ф + С) = arccos (y/L), откуда у = L cos /г (ф + С), где С — произвольная постоянная. При х = h, т. е. ф = 0, функция у должна равняться L. Следовательно, С = О и, значит, у = L cos /гф. (42) Из параметрического представления (4Х), (42) получаем формулу Так как у = хп + • • ., то L = hn/2n~1, что совпадает с ранее полученным результатом. 4. Далее Марков обобщает вторую из задач Чебышева о наилучшем приближении, заменяя в условии Чебышева рациональную дробь с заданным знаменателем выражением l/o) (х) где со (х) = (1 + агх) (1 + а2х) . . . (1 + а2пх) — заданный многочлен, положительный в интервале [—1, 1]. Если со (х) = [г|) (х)]2, т. е. является квадратом многочлена, положительного в [—1, 1], это будет задача, которую рассматривает Чебышев. Пусть идет речь о приближении функции ф (х) и пусть У со (х) Тогда для / (х) будет верна теорема п. 2. Марков рассматривает в качестве частного случая задачу о нахождении функции хп + ргх"-1 + . . . -f d / (X) = г-г-, п , (5) \/ со (х) 12 Этот прием принадлежит Золотарёву, как отмечает Марков в заметке «Определение некоторой функции по условию наименее уклоняться от нуля» [17]. 17
наименее уклоняющейся от нуля в [—1, 1]. Этой задаче Марков ранее по- •святил цитированную выше статью «Определение некоторой функции...». В ней после постановки задачи имеется примечание, которое, как нам кажется, стоит воспроизвести здесь полностью. Вот оно: «Вопрос этот принадлежит к числу тех, для решения которых мы не имеем никаких общих приемов, кроме указанных П. Л. Чебышевым в мемуаре «Вопросы о наименьших величинах...» [Б23, т. 2, с. 151—235]. Вместе с тем он представляет обобщение двух вопросов, решенных в только что упомянутом мемуаре. На этом частном примере я имею в виду показать, что для всех разобранных до сих пор примеров основные рассуждения П. Л. Чебышева (теорема 1) 13 могут быть заменены более элементарными и наглядными» 14. Затем в статье и в лекциях Маркова выводится неопределенное уравнение у* _ (Ж2 __ 1) Z2 = Ь2^ {х)^ (6) *где z — какой-то многочлен степени п — 1. Чебышев пользуется уравнением (6) для разыскания функции У = хп + рххп-1 + . . . + рп. «Но это уравнение,— пишет Марков в своих лекциях,— имеет несколько решений, из которых остается еще выбрать то, которое дает решение задачи. Так как все эти исследования являются у Чебышева довольно сложными и решение получается путем угадывания, то проще будет, не останавливаясь на решении указанного уравнения, прямо составить некоторую функцию вида (5) и доказать, что она наименее уклоняется от нуля. Это будет сделано в следующем пункте» [Б13, с. 268]. Не останавливаясь на дальнейших рассмотрениях Маркова, приведем лишь окончательное выражение уклонения: 2п+1 L = In П (1Л + «, + /1 - ак) + П (/1 + afc - ^ 1 - afr) I Заканчивая настоящий пункт, сделаем замечание о третьей задаче Чебышева, упомянутой нами выше. В этой задаче, которую в своих лекциях Марков не рассматривает, ищутся коэффициенты р0, рх, . . ., рп; q0, (ft,..., qN-i {N > п) так, чтобы функция z 2 pox + Pi* г+...+рп наименее уклонялась от нуля в интервале [—1, 1], причем коэффициенты <а0, я1? . . ., ап заданы. Решение Чебышева довольно громоздко, причем с помощью непрерывных дробей приходится определять, во-первых, величину наименьшего уклонения, а затем и искомую функцию. Между тем с помощью некоторых рассмотрений, использующих методы геометрической теории функций, можно довольно просто доказать, что наименьшее уклонение равно | X \ /2N~11 где к есть наименьший по модулю корень 13 Теорема 1 статьи, цитированной выше. Это основная теорема Чебышева (см. п.2). 14 Чебышев применял метод непрерывных дробей. Марков, таким образом, не считал его оправданным в большинстве задач теории функций, наименее уклоняющихся от нуля. Однако сведение вопросов к неопределенным уравнениям, как правило, неизбежно, когда искомыми функциями являются многочлены. 18
уравнения сп-1 СП-2>—^ со CQ о причем числа с0, съ . . ., ап формулами со Со О — А, О О — А, сп определяются по заданным числам а0, аг, [г/2] Сг — 2.) ar-2i [ N - г + 2i i (r = 0, 1, ..., п). По этому поводу см. книгу «Лекции по теории аппроксимации» [3, с. 312 — 314]. 5. Далее в лекциях рассматривается общая и важная задача теории функций, наименее уклоняющихся от нуля, постановка и решение которой принадлежат братьям А. А. и В. А. Марковым. Изложение начинается с краткой истории вопроса. В 1887 г. в работе «Исследование водных растворов по удельному весу» [32] знаменитый химик Д. И. Менделеев, поставил задачу: найти максимум модуля одного из коэффициентов многочлена второй степени р0 + ргх + р2%2, если известно, что уклонение этого многочлена от нуля в интервале [а, Ъ] не превосходит заданного числа А. В 1889 г. А. А. Марков в мемуаре «Об одном вопросе Д. И. Менделеева» [Б13, с. 51—75] решил более общую задачу о верхнем пределе для числового значения одного из коэффициентов 15 р0, р1ч рп многочлена Ро + Pix + Pzx* рпх если известно, что его уклонение от нуля в интервале [а, Ь] не превосходит заданного числа А. «В том же сочинении,— пишет А. А. Марков,— решаются еще следующие задачи: по данному А найти точный верхний предел величины 1) I Ро + PlC + • • • + РпСП \=\РП(С)\ или 2) \Pl + 2р2с + . . . + npncn-i | = | Рп (с) | , где с — данное число». В своих лекциях Марков ограничивается этой ссылкой на свой мемуар. Ни решения упомянутых задач 1), 2), ни даже формулировки вытекающего из решения задачи 2) знаменитого неравенства А. А. Маркова 2п2 I Рп (х) I < "Г т*х I Рп (х) | (Я < х < Ь)> где знак = достигается лишь на концах интервала, и притом только для чебышевского многочлена const-Гп( Х^~_^~~—)» он не приводит16. После этого в лекциях рассматривается далеко идущее обобщение задач А. А. Маркова, принадлежащее его младшему брату В. А. Маркову (1871—1897), скончавшемуся в расцвете творческих сил от туберкулеза. Обобщению, о котором идет речь, посвящен большой мемуар «О функ- 15 Для старшего коэффициента вопрос решен еще П. Л. Чебышевым: если Ъ — а= = 2h, то | ря |< 2я"1 Mhn. 16 Ниже мы на этом вопросе еще остановимся. 19
$циях наименее уклоняющихся от нуля в данном промежутке» [31], опубликованный, когда его автор был еще студентом Петербургского университета 17. Общая задача В. А. Маркова состоит в следующем. Пусть рассматриваются всевозможные действительные многочлены Р (х) = Ро + Pi* + . . . +рпхп степени ^ п и пусть даны действительные числа а0, а1? . . ., ап и с их помощью построено выражение 18 со (Р) = а0р0 + а1р1 + . . . + апРп- Будем говорить, что многочлен Р принадлежит классу соа, если для него со (Р) = а, где а — заданное действительное число. Требуется найти в классе соа тот многочлен, который наименее уклоняется от нуля в интервале [—1, 1]. В. А. Марков начинает свое исследование с установления некоторого критерия чебышевского типа. Пусть / (х) — многочлен класса соа и L ^> 0 — его уклонение от нуля в [ — 1, 1]. Пусть, далее, хх < х2 < . . . < % — все те точки интервала I—1, 1J, в которых | / (х) | = L (при любых обстоятельствах \i <^ п + 1). В таком случае справедлива следующая Л е м м а (В. А. Маркова). Если / (х) наименее уклоняется от нуля в классе соа, то в классе соо не существует многочлена g (х), для которого все числа / (*i) g (*i), / (*г) g fe)» • • •, / {4) g (Ч) отрицательны. Обратно, если в классе со0 нет многочлена g (х), для которого все эти числа отрицательны, то / (х) в классе соа наименее уклоняется от нуля. Из своей леммы В. А. Марков выводит более удобный для применений критерий. В лекциях А. А. Маркова и леммы, и этот критерий приведены € полными доказательствами. Если ввести многочлены ф (х) = {х — хг)(х — х2)...(х — Хр), Фг (х) = ®_^х)х (г = 1,2,...,|х), то критерий В. А. Маркова гласит: 17 В 1916 г. по предложению и под редакцией С. Н. Бернштейна работа В. А. Маркова была переведена на немецкий язык и напечатана в журнале «Mathematiscne Annalen». Заметим уже здесь, что в этой работе В. А. Маркова доказана одна общая теорема о корнях алгебраических многочленов. Об этой теореме автор пишет в предисловии к своей работе: «В том же § 33 я доказываю мимоходом следующую весьма простую и, если я не ошибаюсь, новую теорему алгебры. Теорема. Если корни двух целых функций G (х) и Н (х) вещественные и перемежающиеся, то и корни их производных одного и того же, но какого угодно порядка к также перемежаются между собою. Ее можно распространить и на тот случай, когда функции G (х) и Н (х) имеют равные корни. Корень функции G (х) кратности I должен быть корнем функции Н (х) кратности 1—1, I или I + 1». 18 На языке современного анализа со (Р) есть некоторый линейный функционал в пространстве многочленов степени ^ п. 20
В. А. МАРКОВ Теорема 1. Многочлен / (х) в том и только в том случае наименее уклоняется от нуля в классе соа, когда: 1) в ряду (-1)1 со (Ф±) f (Xl), (-1)2 со (Ф2) / (*2), . . ., (-1)«*а> (Ф^) / (^) нет чисел разных знаков и 2) имеют место равенства со (ф^) =0 (к = 0, 1, . . ., л — ц), если только /г > и. По поводу этой теоремы А. А. Марков пишет, что она является основной для всех дальнейших рассуждений В. А. Маркова. Однако в лекциях А. А. Маркова какие-либо приложения сформулированной теоремы 1 не приводятся 19. 1.2. Задачи Е. И. Золотарёва, неравенство В. А. Маркова 6. Большой мемуар Е. И. Золотарёва «Приложение эллиптических функций к вопросам о функциях, наименее и наиболее отклоняющихся от нуля» [13] (см. также [Б6, вып. 2, с. 1—59]) появился за год до трагической смерти его автора. В кратком введении Золотарёв пишет [Б6, вып. 2, с. 1]: Может быть, это объясняется тем, что А. А. Марков в лекциях не хотел пользоваться полиномами Е. И. Золотарёва (см. п.6) без необходимых разъяснений некоторых их свойств. 21
«Я полагаю, что со стороны приложений теория эллиптических функций: оставляет желать еще многого. Поэтому я счел не лишним рассмотреть, некоторые вопросы о наименьших величинах, которые решаются при помощи основных формул теории эллиптических функций. Эти вопросы принадлежат к тому классу вопросов о наименьших величинах, приемы для решения которых были даны в первый раз П. Л. Чебышевым». Всех задач,, решаемых в мемуаре, четыре. Первая 20 и связанная с ней вторая задачи непосредственно примыкают к вопросам, ^торыми занимался Чебышев. Однако этого нельзя сказать о задачах третьей и четвертой, если судить- о них по их формулировкам. Ниже мы прокомментируем эти задачи.. Формулировка задачи 1 такова. Среди всех многочленов я* _ пахп-1 + р2Хп-2 + . . . + рп, где о задано, найти тот, который в интервале [—1, 1] наименее уклоняется от нуля 21. При о = 0 решение этой задачи известно. Искомым многочленом является (1/2п-!) Тп (х). Золотарёв замечает, что если F \х) дает решение задачи, то (—\)nF (—х) доставит решение в том случае, когда а переменит свой знак. Поэтому можно ограничиться положительными значениями о. Пусть F (х) — решение задачи, ai= max |-F(#)|— величина укло- нения. Обозначим через хг <С х2 <С . . . <С %\х полную систему точек интервала [ — 1, 1], в которых F (х) принимает с чередующимися знаками значение L. В таком случае в силу известного критерия должно выполняться jli ^ п. А так как для многочлена п-и степени \л<^п + 1 и при |ы = п + 1 многочлен известен — это (1/27*-1) Тп (х)> то задача Золотарёва сводится к нахождению совокупности всех многочленов F (х) = хп + . . ., для которых \х = п, и определению в этой совокупности того единственного многочлена, у которого коэффициент при х71'1 равен —по, где о имеет заданное положительное значение. Простейшим многочленом со свойством [х = п (для интервала [ — 1, 1]) будет тот, который наименее уклоняется от нуля в некотором большем интервале, содержащем [—1, 1] в качестве части. Одним из концов этого большего интервала должна быть точка —1 (или точка 1), а другим — некоторая точка (3 > 1 (соответственно точка —13 < —1). Мы рассмотрим первый случай и, значит, возьмем чебышевский многочлен для интервала [ —1, р], где (3 > 1. Он имеет вид 1 + .-- (?) 1 М + Р \> /2*-Р + 1 \_ п 2n-i \ 2 ) J»\ 1 + р ) — х Таким образом, а = (р - 1)/2, р = 1 + 2а, р-1 п 2 20 В подстрочном примечании [Бб, вып. 2, с. 2] Золотарёв пишет: «Десять лет тому назад этот вопрос был мне рекомендован для занятий П. Л. Чебышевым и разобран мною в литографированном рассуждении „Об одном вопросе о наименьших величинах". Здесь я представляю решение его в совершенно переработанном виде». К этому следует добавить, что упомянутое рассуждение Золотарёв представил pro venia legendi и защитил 22 сентября ст. ст. 1868 г., после чего был допущен к чтению лекций в качестве приват-доцента Петербургского университета. гЛ У Золотарёва второй член имеет вид —ох71"1. Наше изменение приводит к некоторым упрощениям в записи дальнейших формул. 22
Е. И. ЗОЛОТАРЕВ м, значит, а)>0в полном соответствии с нашим намерением рассматривать лишь положительные о. Точками уклонения взятого многочлена в интервале [ — 1, |3] будут Xb=\(z* -г 1) -г ~l-(zk - 1) (к= 1, 2, . . . , п + 1), где zk = cos ((п + 1 — &) л/га) (А: = 1,2, . . ., п — 1) — точки уклонения чебышевского многочлена в [ — 1, 1]. Мы замечаем, что хг = — 1, . . ., хп = |3 cos 2 (л/2п) — sin2 (я/2га), хп+1 = |3 > 1. Таким образом, многочлен (7) будет удовлетворять условию \i — п для интервала [—1, 1], если Р cos2 (л/2/г) — sin2 (я/2/г) < 1, т. е. о ^ 1 4- sin2 f:x/2^ ' ^ cos2 (п/2п) ' или а = (р _ l)/2 < tg 2 (я/2/г). Поэтому при а < tg2 (я/2дг) задача Золотарёва решена и, в частности, найдено уклонение L = (1 + а)"/^-1. 23
Если а ^> tg2 (я/2/г), то искомый многочлен F (х) уже не будет наименее уклоняться от нуля в большем, чем [—1, 1], интервале с левым концом —1. Но точка 1 должна входить в число точек уклонения в качестве крайней справа (наибольшей). В близких к точке 1 и лежащих справа от нее точках F (х) будет иметь значение, меньшее чем —L. Поэтому найдется точка а ]> 1, такая, что F(a) = -L=F (1), и по теореме Ролля найдется точка у (1 < у < а), такая, что F'(y) = 0. Кроме того, найдется такая точка, р ^> а, что F (Р) = L. Теперь для получения явного выражения полинома F (х) можно, следуя Золотарёву, написать очевидные соотношения F2 (х) — L2 = (х + 1) (х - х2)2 . . . (х - Xn-J2 (х - 1) (х - а) (х - 0), F' (х) = п (х — х2) . . . (х — хп-г) (х — у), из которых следует, что 22 F'2 (х) л2 (х — у)2 F* (д.) __ /,2 (д. _|_ 1)(X _ l)(a. _ а){х _ р) > откуда (х — 7) dx ln{F(x) + VF2(x)-L2) = n^{ х + \){х — 1)(з — а)(х — Р) и, значит, решение задачи Золотарёва при а ^> tg2 (я/2я) может быть выражено через эллиптические функции. Сформулируем окончательный результат. По заданным п и о ^> tg2 (л/2п) из уравнения 2sn(A/n) Г 1 в'(А/л) 1 i гт^ 28п(А?/д) Г 1 ' а сп (А/л) dn (А/л) L sn2(A/w) в (А/л) однозначно находится модуль Л* (0 < & < 1). Затем определяются 1 + A2 sn2 (А/л) о 1 + 8п2(А/л) а"~ с!п2(А/л) ' Р сп2 (А/л) __ 1 г 1^А е2 (0) п2п L ^ 2"-i [ В\ (*/«) ©1 (*/») J " Параметрическое представление золотарёвского многочлена имеет вид Z, [Г Н(и-к/п) in _^ Г H(u + kjn) ln\ *\х)— 2 \[ Я (и + А/л)ij ' [ Н iu — */*) J J' sn2 и -f sn2 (А/л) *— sn2 а — sn2 (А/л) ' Пользоваться этим параметрическим представлением нам здесь не придется. Однако для дальнейшего удобно ввести специальное обозначение F (х) = Zn (х; к). 22 Этот путь (сведение к дифференциальному уравнению) не является единственным. Окончательный результат можно получить, применяя методы геометрической теории функций. 24
Не мешает заметить, что (п ^> 1) Jim — Zn (х; к) = - -^ Tn-i (х), lim Zn (х; к) = -—— — Тп (х cos2 -^ sin2 -£-) . i-o V ' 2й-1 cos2n (я/2л) п\ 2" 2W Рассмотренный нами вопрос, как было уже упомянуто выше, предложил Золотарёву Чебышев. Можно думать, что это связано со следующими обстоятельствами. Функции, которыми занимался Чебышев, были аналитическими. В частности, только эти функции подлежали тогда приближенному представлению при помощи многочлена. Но если сначала заменить функцию отрезком ее тейлоровского разложения, а уже затем искать наилучшее приближение этого отрезка при помощи многочлена, то получится задача о нахождении многочлена ап+1хп+1 + апхп + ... + an-u+1xn-k+1 + pn-ixn-k + .. . + Pi* -f ро, наименее уклоняющегося от нуля в заданном интервале [—h, h], если его к + 1 старших коэффициентов (они обозначены буквами аг) зафиксированы, а остальные ищутся. Сам Чебышев рассматривал случай, когда зафиксирован всего один коэффициент ап+1. Следующий по сложности случай, когда зафиксированы два коэффицизнта ап+1, ап, он рекомендовал Золотарёву для исследования 23. Закончим этот раздел формулировкой второй задачи Золотарёва: определить многочлен F (х) = хп + Plxn~i + ...+pn степени п так, чтобы его уклонение от нуля в интервале [—1, 1] было наименьшим, если дано, что в некоторой действительной точке а, лежащей вне интервала, F (х) имеет заданное значение А. Простой анализ показывает, что для искомого многочлена должно выполняться неравенство \л !> п. Но, как только это установлено, сразу получается, что решение задачи выражается через многочлены, с помощью которых решается первая задача Золотарёва. 7. Обратимся теперь к главным результатам В. А. Маркова, которым посвящены главы II и III его мемуара. В главе II изучается следующая Задача 1. Найти полином степени п, наименее уклоняющийся от нуля в интервале [—1, 1], если известно, что его производная к-то порядка в заданной действительной точке z равна 1. Эта задача есть тот случай общей задачи п. 5, в котором со (Р) =/W (z), а= 1. При к = 1 задача была изучена А. А. Марковым, но В. А. Марков не исключает из рассмотрения этот случай. Однако случаи к = 0 и к = п можно не рассматривать, так как в первом из них задача решается без всякого труда, а во втором решение было получено еще Чебышевым. Таким образом, можно с самого начала предположить, что О < к < п. В. А. Марков так и поступает. При этом с помощью несложных рассуждений он в первую очередь доказывает, что более одного решения задача имеет лишь в одном очень частном случае, а именно при п = 2, к = 1, 23 По этому поводу см. также комментарий к мемуару Золотарёва [Б6, вып. 2, с. 360]. 25
z = 0. Этот частный случай, между прочим, был известен ранее в связи- с вопросом Д. И. Менделеева 24. Теперь мы изложим ход решения задачи 1, внеся в рассуждения В. А. Маркова некоторые изменения, связанные с известным в настоящее время фактом существования решения задачи при любом действительном z. Пусть при некотором z многочлен / (х) есть решение задачи. Пусть L ^> 0 — его уклонение и х1 < х2 < . . . < х^ — все точки интервала [—1, 1], в котором | / (х) | = L. Докажем, что \i > п. Допуская противное, найдем в силу критерия В. А. Маркова, что имеют место по крайнеа мере два равенства: d Ф (z) п d „ъ / \ л г\ А и = °> -ПГ (Ф(2)2} = 0, dz dz где Ф (z) = (z — хг) (z — х2) . . . (z — Хр). Но в таком случае Ф<*> (z) = 0, Ф<*-« (z) = 0, что абсурдно, так как корни многочленов Ф<*> (я), Ф(*-«(аг) перемежаются. Итак, доказано, что [i ]> п, и поэтому либо [г = л + 1г либо \1 = л. Если |ы = л + 1, то / (#) отличается от Гп (х) лишь постоянным множителем и, значит, / (х) = Tn (х)/Т%> (z). Однако, при каких значениях z это выражение будет решением задачи, мы пока сказать не можем. Ясно лишь, что должно иметь место неравенство Т%> (z) Ф 0. Примем теперь, что |ы = п. В таком случае из критерия В. А. Маркова вытекает в первую очередь, что Ф(*> (z) = 0. (8). Чтобы получить дальнейшую информацию, нужно ввести функции Ф, (х) = Ф (х)/(х — xj), I = 1, 2, . . ., и. (= п), и составить выражения о>(Фг)=^гФИ*)- Так как ф (2) = (z- xt) Ф, (z), то Ф<*+1) (z) = {z- xt) ф|*+1) (z) + (к + 1) 0f> (z) (9)) 24 Все решения задачи 1 в этом частном случае имеют вид х + К (х* — 1), где X — произвольное действительное число, удовлетворяющее неравенству I Я 1 < v2. 26
Ф(*> (z) = (z - г,) Ф\*> (z) + A if ^ (z), (10) причем благодаря (8) справедливо неравенство Ф( +1) (z) Ф 0. Из равенств ^(9), (10) находим, что Ф(';+1) (z) 0>f > (z) = (Л + 1) [фГ> («)]« - кМ^^Ф?-» (Z) = = к {[ф}*> (г)]« - фГ'+1) (2) Ф?"" (z)} + [Ф?) {z)f. Но выражение в фигурных скобках ^> 0 25. Поэтому Ф<*+1) (z) Ф^ (z) > 0 (I = 1, 2, . . ., fx). 'Следовательно, все Ф* } (г) отличны от нуля и имеют одинаковый знак Поэтому условие 1) критерия В. А. Маркова принимает следующий врд: ,все числа (-l)/fo), (-1)2/(*2), •• -, (-1WW имеют одинаковый знак. Значит, и при jlx = /г группа чисел ^ < х2 <С . . . . . . < % представляет чебышевский альтернанс в интервале [—1, 11. Переходя к вопросу о том, для каких многочленов / (х) это обстоятельство может иметь место, нужно прежде всего указать на чебышевский многочлен / (х) = Тп-1 (х) степени п — 1, у которого крайние точки уклонения хх = —1, хп = 1 являются простыми корнями уравнения /2 (х) — — L2 = 0, а остальные корни х2 < х3 < . . , <^ хп-.г являются двойными корнями, так что в этом случае п Ф (х) = П (х — хк) = const. (х2 — 1) Тп-1 (х). 1:=1 На основании критерия В. А. Маркова мы приходим к следующему вы- шоду: если z есть один из корней уравнения -^-{(z»-l)7,;i_1(z)} = 0, (И) то решение задачи 1 имеет вид 26 / (х) = Tn-i (х)/Т{*2г (z). (12) -35 Для доказательства достаточно положить фр"1^ (х) ~ G (х) и заметить, что G (х) = (х — рх) ... (х — Pv), где все Pj действительны и различны, из чего следует соотношение v [С (*)]* - G (z) G" (2) §[^Г' правая часть которого при любом действительном z положительна. 126 Здесь, конечно, нужно еще доказать, что из равенства (11) следует неравенство ?n-i (z) Ф ®- Для этого заметим, что (И) можно переписать в виде (*я - 1) Т^? (*) + 2kzT^ (z) + к (к - 1) г£*> (z) = 0, (И') а в силу дифференциального уравнения, которому удовлетворяет Tn_v имеет место тождество (*» - 1) Т<№ (z) + (2к - 1) zT^ (z) = (n - fc)(n + к - 2) T^-D («). (») .Но соотношения (И'), (*) несовместимы с равенством г& («) = о. 27
+ 2*-P+M ^2)/( ^_,_ , ,ч_1г /-*-2g-p+l d* n \ p 4- 1 Если мы обозначим корни уравнения (И) vi < V2 < • • • < Vn-b, то при z, равном любому из этих корней, решение задачи 1 имеет вид (12). Если z отлично от всех v^, то при \л = п решением задачи 1 будет многочлен точно п-й степени и мы даже можем сразу сказать, какой это будет многочлен. А именно, это будет с точностью до постоянного множителя один из тех многочленов, к которым приводит решение первой задачи Золотарёва. Имеется два сорта этих многочленов / (х) и соответствующих функций Ф (х)~ Условившись для упрощения письма писать g (х) ж h (х), если функции g (.г), h (х) отличаются лишь положительным постоянным множителем, представим эти два сорта многочленов в виде /(1)(±*)~_Lzn(±*;*)- Qa){±x)xjLz±jLZn{±x.kh где y = y(k)>i (0</с<1) и f® (± х) » Тп (±2l~\ + i) , Ф<2> (± х) х {х ± 1) где 1 < Р < 2tg2 (л/2п). Полезно ввести в рассмотрение многочлены х») {t) = IFl(t +1} т'п m ^{t) = ~d~F[(t-i] r«(0] и их корни Si <&»<•• •<£„_* (Ь = Е^), соответственно Л1 < Л2 < .- < Лп-fr (*ni = ^f}). Нетрудно доказать, что 27 Si < Л1 < 2г < Л2 < •" < En-fe < Лп-ь- При анализе задачи 1 мы будем пользоваться существованием и единственностью решения, а также его непрерывностью как функции от ъ. В качестве отправного пункта анализа возьмем z = vj (v$ — один из корней уравнения (11)). Для этого значения z с точностью до нормировочного множителя решением задачи 1 является Тп_1 (х). Назовем далее у и L решение задачи и его уклонение от нуля при числе z, достаточно близком к v$. Тогда: 1) число jli остается равным п и оба числа —1,1 будут входить в систему точек уклонения в качестве простых корней уравнения У* _ L2 = 0; (13) 2) остальные точки уклонения, число которых \i — 2 = п — 2, будут двойными корнями уравнения (13); 3) так как степень у уже будет /г, то у уравнения (13) появятся еще два простых действительных корня одного знака: один у многочлена у + L, другой у многочлена у — L; пусть это будут а > 1, Р > а; 4) у производной многочлена у появится один простой корень -у (1 < у < а). 27 Так как корни многочленов Х^ (t), Y^p (t) перемежаются, то нужно лишь проверить, что gj^ < г\&\ Если к = п — 1, это очевидно. При &< п — 1 В. А. Марков использует равенство Х^ (ц^)'= 2T^+t) (т)^/г)) и перемежаемость корней многочленов Х(*} (*), ^+1) (0- 28
На основании сказанного этим решением задачи будет многочлен Золотарёва» Zn (х\ к). При этом мы будем иметь следующее предельное соотношение: Теперь будем уменьшать модуль к. Так как при каждом к (0 < к < 1) функция Zn (х\ к) удовлетворяет условиям критерия В. А. Маркова, то она будет представлять решение задачи 1. Соответствующие значения z находятся из уравнения d* Г z* — l d J-[-T^fdzZn^k\ dzk о, все корни которого простые. Следовательно, этим уравнением определяются п —к однозначных функций-ветвей z = zj(k) (/ = 1, 2, ..., п-к), причем /-я ветвь обладает следующим предельным свойством: lim z. (к) = v ., *—l J J "и каждая ветвь Zj (к) является монотонной функцией от к, так как решение задачи 1 при любом значении числа z единственно. К этому нужно добавить, что при каждом' к (О < к < 1) справедливо неравенство Теперь надлежит найти предельные значения функций Zj (к) при к —► 0. Как уже- выше было отмечено, / 2* — Р + 1 \ £=l-b2tg2(tt/2tt) Поэтому zj (0) являются корнями уравнения ^ Г , , / 2z — Р + 1 = 0 3=l+2tg2(tt/2n) и, значит, получаются из корней уравнения Х^р (t) = 0 с помощью преобразования» 2z-ft + l 1 =/ Р + 1 I3=l+2tg^/2n) Таким образом, *, (0) = (1 + tg2 (я/2я)) 5, + tg2 (я/2Л) = ^ (/ = 1, 2, . . . , n - A). Если z равно одному из чисел К<К< ••• < K-h'i то в состав системы точек уклонения решения задачи 1 по-прежнему входят точки х = —1 и х = 1, но z = 1 уже является двойным корнем уравнения (13). Тем самым начинается еще одна серия решений, для которых и. = п. Эти решения имеют вид где 1 < р < 1 + 2tg2 (п/п). При этом для предельного (Р = 1) решения, это будет Тп (х), уже и. = п + 1. Значения МР)<*2(Р)<.»<*я-*(Р). для которых (14) будет решением задачи, находятся из уравнения 7к о Г , / 2z —Р + 1 \1 Л ■^-[С+ЧЧ 1 + р )]-о 2d
ш, следовательно, получаются из корней уравнения X™ (t) = О с помощью преобразования (2z - р + 1)/(1 + Р) = * (1 < Р < 1 + 2tg2 (я/2;*)' Поэтому 2У (Р) = —2~ S' + —~ * Предельные значения (при р = 1) равны и мы видим, что 6j< h< VJ (/= 1, 2, ..., л-*). Таким образом, задача 1 решена, если z принадлежит множеству, образованному тинтер валами [£i, vj, [g2, v2], ..., [£n_k, vn_fr]. Аналогично, если в решениях заменить х на —х, находится решение задачи 1, когда z принадлежит множеству, образованному интервалами К, TlJ, [V2, Г)2], ..., [Vn_fr, Tln_.fr], причем вместо чисел Я7- появляются числа \ij = (1 + tg2 (я/2/г))т]7. - tg2 (я/2/г) (у = 1, 2, ..., /г - к). Итак, решение задачи 1, и притом с |х = /г, получается в том и только тв том случае, когда z принадлежит одному из открытых интервалов (Si, "Hi), (Бг> Лг), • - •, (£п-к, Лп-д). (15) Так как решение задачи 1 существует всегда, то решением будет функция Тп (х), т. е. |ы = п + 1, в том и только в том случае, когда z принадлежит точечному множеству, образованному интервалами (— ОО, J-J, [Т]1, %2], . . ., [Tln^j..!, gn_ft], [TJn^ft, ОО). (16) 8. В главе III мемуара В. А. Маркова изучается и решается Задача 2. Определить наибольшую величину, которую может иметь уклонение от нуля в данном интервале [а, Ъ] к-я производная fe<ft) (х) от многочлена h (х) степени не выше п, если уклонение от нуля в [я, Ъ] многочлена h (х) не превосходит данного положительного числа М. Прежде всего приведем формулировку результата, который носит название неравенства В. А. Маркова. Для любого многочлена степени п и любого целого к (1 <^&<^rc — 1) имеет место неравенство \P(:){t)\<{^)nTf{i)m^\Pn{t)\, .причем знак = достигается лишь для многочлена -и притом лишь на концах интервала la, Ь).
К этому следует добавить (см. с. 83—84 мемуара В. А. Маркова),. что 28 1п V1)— 1.3-5...(2А-1) (1/l)' И 29 Г</;)(1) = тах|Г^(0|. (17а) При к = I получается неравенство А. А. Маркова. Для анализа и решения задачи 2 В. А. Марков пользуется известным принципом взаимности: вместо того чтобы искать наименьшее уклонение функции заданного вида / (х), если известно, что | /<;) (z) | имеет заданное значение, можно искать максимум | /(/г> (z) | при условии, что уклонение / (х) известно. При этом z и к, конечно, задаются. В качестве интервала берется [—1, 1]. Таким образом, задача 2 редуцируется к задаче 1. Этим приемом пользовался и А. А. Марков в случае к = 1. Чтобы показать, как этот прием применяется здесь, предположим вначале, что ze [чп-Ь !]• Рассмотрим следующую задачу на экстремум в классе многочленов h (х) степени п: известно, что max | Л (л?) | = 1. (18)» Требуется найти тот из многочленов, для которого | &' ' (z) \ имеет максимум. Мы знаем, что экстремальным многочленом является Тп (х). Поэтому в силу (172) I^WKlfWKfW. причем знак = достигается только при z = 1 и h (х) = Тп (х). Очевидно, можно утверждать больше: для всякого многочлена п-й степени h (х)у удовлетворяющего условию (18) при любом 2, принадлежащем одному из интервалов [-1, У, [ть Ы, [т|2, У, ..., [Tb_fr, 1], (16х) имеет место неравенство | А<*> (z) | < /f (1), причем знак = достигается лишь в случае h (х) = Тп (х), и притом лишь в точках z = +1. Теперь допустим, что z принадлежит одному из интервалов (In ^iL [иа> 4i)i (?2» Kh •••, [ип-йп лп-яг); (15i) для определенности примем, что этим интервалом является (£$, Я$]. Мы знаем, что экстремальным многочленом теперь является 2х — Р + 1 / 2*-Р + 1\ ifll 1+Р Г 28 Из дифференциального уравнения, которому удовлетворяет Тп(х), следует, что (*» - 1) Г£+1> (х) + (2* - 1) *г£> (х) = [в* - (к - 1)*] г№-« (х), откуда и получается равенство (17х). 29 При п < 4 (0 < к < м) соотношение (172) проверяется непосредственно, а дальше- по индукции на основании элементарного тождества TV (х) = т^Ьг г& (*> + WW <*)• Заметим также, что | 2-;*) (-1) | = 7<*> (1) и | Г<*> (*) | < Т^ (1) <-!<*< 1). 31
где Р — некоторая константа, зависящая от z и удовлетворяющая пораверству 1 < Р < 1 + 2tg2 (я/л). Поэтому 2 h(nVI<(тпг) Iт™( Г+р1)I< J2£ Iг"'{х)'= п°(1)- _?? — § + 1 Таким образом, утверждение, выделенное курсивом, остается в силе, если к точечному множеству, образованному интервалами (16х), присоединить точечное множество, образованное интервалами (15!). Остается еще рассмотреть случай, когда z принадлежит одному из интервалов (^i> Hi)> (^2> ^г)> •••» ('Wi-b V-n-k)- Это наиболее «трудный вопрос» 30, что и понятно, так как здесь экстремальным является многочлен Zn (+#, к) (где к зависит от z), для которого нам известно лишь довольно сложное параметрическое представление и не видно, как этим параметрическим представлением воспользоваться. Эту трудность В. А. Марков устранил, используя лишь дифференциальное уравнение первого порядка, которому удовлетворяет многочлен Zn (+я, к). Положим, что мы этот многочлен нормировали согласно (18). Назовем его Wn (я), причем он зависит, конечно, от z е= [A,j, Vj]. В. А. Марков, доказал, что внутри интервала (ki, v$) функция | W^ (х) | не имеет максимума, который может достигаться лишь на концах. Аналогичное заключение имеет место относительно функции | W^ (— х)\, если рассматривается интервал (v$, jij). Тем самым доказательство неравенства было доведено до конца. Заканчивая настоящий пункт, приведем один результат В. А. Маркова, связанный с непосредственным обобщением вопроса Д. И. Менделеева. Теорема. Если многочлен степени не выше п р0хп + р^х71-1 + . . . + рп в интервале [—1, +1] не превосходит по модулю 1, то \Ро | < 2-i, | Pl |< 2-\ | р2 |< 2«и, \Рз\< 2я-* (п - 1), .а при i > 1 I г, \<r 9n-2i-i n(n — i — \)(п — i — 2) . . . (п — 21 + 1) | p2i | ^ * Tj , I _ \<r On-2i-2 (* — 1Xyi ~ * ~ 2Н" — ^ — 3) , , , (га — 2t) | P2i М I "Ч Z ^] » и притом каждое из этих неравенств может обращаться в равенство. В течение 45 лет довольно сложное доказательство неравенства В. А. Маркова никем не было упрощено. Впервые более простые доказательства получили независимо С. Н. Бернштейн [8] и Даффин и Шеффер {см. [55]). Эти два доказательства совершенно различны. Отметим здесь, что Даффин и Шеффер получают неравенство В. А. Маркова из предварительно доказанного ими и представляющего самостоятельный интерес 30 Здесь уместно привести выдержку из Прибавления к § 34 мемуара В. А. Маркова, относящуюся к «трудному вопросу»: «Доказательство невозможности предположения у = Ми, приведенное в § 34, было найдено мною в то время, когда настоящая статья печаталась. Ранее же я имел для случаев Л = 1, к = 2, к = п — 2, к = п — 1 следующие доказательства невозможности этого предположения». Далее идут эти доказательства и подстрочное примечание: «Для случая к = 1 доказательство заимствовало из мемуара А. А. Маркова «Об одном вопросе Д. И. Менделеева» [20]. 32
неравенства 1 р™ {х)'<{[~£^cos л6]2 + [l?~sinлв]У"_^хIр» ^'• где cos 0 = х (—1 ^ х <^ 1). При А = 1 отсюда вытекает неравенство max Fn (x)Yl—x2\^n max |Pn(a:)|, причем знак = имеет место в том и только в том случае, когда Рп (х) = = сТп (х). Этот результат обычно называют неравенством С. Н. Бернштейна, однако сам Бернштейн указал, что он содержится в известной работе А. А. Маркова, хотя и не сформулирован там в явной форме [Б2, т. 1, с. 18]. 9. Аналитическая связь между тригонометрической функцией х = = cos t и той же функцией у с периодом, в п раз меньшим, выражающая так называемое преобразование деления периода, имеет вид У = Тп (*)> где Тп (х) — многочлен, обладающий известным экстремальным свойством. Естественно возникает вопрос, не обобщается ли этот факт на функции, выражающие преобразование деления на целое число одного из периодов основной эллиптической функции. По-видимому, этот вопрос привел Е. И. Золотарёва к третьей и четвертой задачам его мемуара «Приложение эллиптических функций ....» [Б6, вып. 2, с. 1—59] 31. Приведем формулировки обеих задач. Задача 3. Найти рациональную дробь у --= Ф (ХУ$ (*)• у которой степень каждой из функций ф,г|) не превосходит данного числа п, так, чтобы у содержалась между пределами —1 и +1, когда х содержится между теми же пределами, и чтобы для значений х, численно превышающих данную величину 1/&^>1, min \у | был по возможности больше. Задача 4. Найти рациональную дробь у = ф (я)Л|) (ж), у которой степень каждой из функций ф, г|) не превосходит данного числа п, так, чтобы: 1) она была не меньше 1 в интервале 1 ^ х <^ ilk, где к задано, и не превосходила —1 в интервале — 1/к <; х ^ —1 и 2) наименее уклонялась от нуля в каждом из этих интервалов. Останавливаться на анализе этих задач и на их решении, которые дал Золотарёв, мы не будем и лишь приведем окончательный результат для задачи 4, а затем прокомментируем обе задачи. Решение задачи 4 дается следующими формулами. Пусть х --=■ sn (и; к), тогда у -— sn (и/М; X), 31 Здесь Золотарёв по этому поводу не высказывается. Однако в краткой заметке [89] (см. [Б6, вып. 1, с. 369—374]) на с. 372 идут слова: «Вот еще две проблемы, связанные с трансформацией эллиптических функций». 2 Математика XIX века зз
где L = KIM, L' = K'lnM (19) и [n/2] TT sn»((2r-l)g'/ii;*') iKi ~ 1X sn2 (2rK'/n; k') r=i Соотношения (19) показывают, что переход от х к у отвечает делению на п второго периода (transformatio realis secunda). Аналитическое выражение? этого преобразования имеет вид _ х TT 1 + x*/C2r _ sn2 (rK'/n; к') У~ М l} l + *a/C2r-i ' сп* (гК'/щ к') ' Это и есть искомая рациональная дробь. Несколько сложнее формулируется решение задачи 3, так как для нее* приходится отдельно рассматривать случай четного п и случай п нечетного. Результат здесь получается с помощью деления на п первого периода- Задача 4, очевидно, эквивалентна следующей чисто чебышевской задаче о наилучшем приближении. Задача А. Пусть Е означает точечное множество на оси х, образованное интервалами [_!/*, _1], [1, Цк] (0<Л<1). Требуется найти рациональную функцию степени п у = ф (я)Л|) (х), которая на Е наименее уклоняется от функции sgn*=( __! {x<Q)a С другой стороны, задачу 3 можно переформулировать следующим образом: Задача В. Найти рациональную функцию степени п * = / (t)lg (*), которая вне интервала {—ilk, ilk) (О <^ к < 1) на оси t удовлетворяет неравенству | z | > 1, а в интервале [ — 1, 1] наименее уклоняется от нуля. Оказывается, что одна из этих задач сводится к другой. Пусть z (t) — решение задачи В и max \ z \ = т. Положим [-1.1] к= ! l-1/T^2 „_ l+l/X t\/K-l l + l/tf J l—VK t\fK + i тогда 1 — m z — \fm y= JL^ 1 + "* z + tfm есть решение задачи A, a \i = 2]/ra7(l + m) есть уклонение у от функции sgnx на множестве Е. Наоборот, если у (х) есть решение задачи А и \i — его уклонение на Е от функции sgnx, то с помощью написанных формул легко найти т, а затем и решение z (t) задачи В. 34
10. К рассмотренным в предыдущем пункте задачам примыкает одна задача Чебышева, относящаяся к 1889 г. Этой задаче посвящена статья «О приближенном выражении квадратного корня переменной через простые дроби» [Б23, т. 3, с. 240—255]. Статья начинается следующими словами: «При вычислении квадратур нередко приходится заменять функции, представляющие затруднения для интегрирования, их приближенными выражениями. Если такое затруднение происходит от радикала второй степени, с большой пользою может быть употреблено выражение радикала Yl/x функцией вида Далее читаем: «Когда имеется в виду по возможности уменьшить предел относительной погрешности при всех значениях xoTX = lRox=h^>ly наилучшее представление радикала ]/"1Аг функцией (20) будет то, при котором отношения 1/^х Л + В1/{С1 + х) + ...+Вп/(Сп + х) А + BWx + *) + ...+ Вп1(Сп +х) ' YW наименее уклоняются от 1 между х = 1 и х = h» [Б23, т. 3, с. 240]. После этого Чебышев применяет свои методы, развитые в мемуаре «Вопросы о наименьших величинах » [Б23, т. 2, с. 151—235]. Не останавливаясь на изложении построений Чебышева, мы вначале несколько иначе сформулируем задачу, а затем прокомментируем ее. Задача Чебышева. Среди всех рациональных функций степени г Ф (t)r¥ (t) найти ту, для которой логарифм отношения Уй Ф (t)/W (t) наименее уклоняется от нуля в заданном интервале [1,1/&2], где 0 < к < 1. Заслуживает внимания то обстоятельство, что задача Чебышева эквивалентна задаче А предыдущего пункта, т. е. задаче 4 Золотарёва 32, опубликованной за 10 лет до появления статьи Чебышева. Как и в других работах Чебышева, все вычисления выполнены до конца: коэффициенты Л, Bj, Cj выражены через эллиптические функции, построены приближенные формулы для нахождения интегралов вида ? и j аи, \rv где [/и F- положительные функции, приведены конкретные примеры. Вот один из этих примеров, дающий представление о характере упомянутых 32 Для доказательства, кроме некоторых свойств решения задачи А, вытекающих лишь из его существования и единственности, нужны следующие элементарные соотношения: если max | In Y \ = In Н > 0, то max I У если max | 1 — г/ | = G < 1, то max | In ... У и у положительные). 2Я 1 Я2 Я2- Я2 + 1 * 1 1 + G ~2~ *п \ — G (пеРеменные 35
приближенных формул: при 0 < к <^ ); V2 Я/2 du = tg^u J l/l— Л2 sin2 г/ = 26 я/2 [0,3933199+ °'6066801 ,1, Z20 sin (/m/2) L (1 — 0,8104089Л,2)^/2 J где /2 - 0,9993546; 0 < 6 < 1. 1.3. Чебышевская задача построения географических карт 11. В актовой речи, где эта задача была поставлена, сформулировано» следующее утверждение [Б23, т. 5, с. 153]: «Окончательное решение о наивыгоднейшей проекции карт очень просто: наивыгоднейшая проекция для изображения какой-нибудь части земной поверхности на карте есть та, в которой на границе изображения масштаб сохраняет одну и ту же величину, легко определяемую по принятой,, нормальной величине масштаба». Доказательства своего утверждения Чебышев не публиковал, и в течение 38 лет задачу никто другой также не решил. Лишь летом 1894 г. утверждение Чебышева было, наконец, доказано Д. А. Граве (1863— 1939) — учеником П. Л. Чебышева и А. Н. Коркина. В августе того же года Граве сделал об этом сообщение на конгрессе в Кане, а через неполных два года защитил докторскую диссертацию [11], в которой последняя (четвертая) глава посвящена задаче Чебышева. В остальных главах диссертации содержатся другие важные результаты по картографии, а одна глава посвящена изложению нового метода решения задачи Дирихле для областей, ограниченных алгебраическими контурами. В дальнейшем Граве обобщил задачу Чебышева и одновременно упростил свое решение. Обобщение состоит в том, что вместо куска сферы (поверхности Земли) теперь берется кусок произвольной регулярной поверхности, во всех точках которого гауссова кривизна К сохраняет знак (плюс или минус). Мы воспроизведем прозрачные рассуждения статьи «Доказательство обобщения одной теоремы Чебышева» [59], посвященной этому вопросу. Пусть на поверхности с положительной (для определенности) кривизной К взяты так называемые изотермические координаты и, v. В этих координатах элемент дуги поверхности дается формулой ds2 = X2 {du2 + dv2). Сразу же заметим, что в силу знаменитой теоремы Гаусса К_ 1 / d2lnl , д*1пК \ X2 \ ди2 ^ dv2 J ' и поэтому во всех точках рассматриваемого куска поверхности G Д1п А < 0. (21) Пусть этот кусок поверхности конформно отображен на область в плоскости х, у с помощью функции х + yi = f (и + vi). Масштаб этого отображения равен т = Ydx2 + dyVds = \ f (и + vi) \/Х. 36
Д. А. ГРАВЕ Введя гармоническую в G функцию Н = In I /' (и + vi) | = V2 [In /' {и + vl) -f In /' (и — vi)], будем рассматривать вместо масштаба его логарифм In т = Н - In X. (22) Беря различные конформные отображения /, мы получим различные карты куска G рассматриваемой поверхности. Выберем то отображение, для которого функция Н - In X равна 0 на границе С области G. Иначе говоря, возьмем в качестве гармонической в G функции Н решение задачи Дирихле (G): АН = О, (С): Н = In X. (23) Предугаданная П. Л. Чебышевым теорема утверждает, что именно это отображение дает оптимальную в смысле Чебышева карту области G. Во время защиты диссертации Граве один из оппонентов — А. А. Марков указал на недостаточность результата диссертации, так как в ней отсутствовало доказательство существования искомой наилучшей проекции. Нужно иметь в виду, что в то время (1896 г.) разрешимость задачи Дирихле была надежно доказана лишь для немногих областей частного вида. Л е м м а (Граве). Если выполнены соотношения (21), (23), то всюду в G Н - In I < 0. 37
Допуская противное, найдем, что в некоторой точке области G функция Н — In X имеет (положительный) максимум и, значит, в этой точке д*Н д* In V 0 дЧ1 __ 0g In Я, < 0 ди2 ди? ^ ' dv2 dv2 а посему в этоц точке сумма левых частей <^ 0, что противоречит условию (21). ; Теорема. Пусть Н1 — какая-нибудь гармоническая функция в G, а /х — отвечающее ей отображение области G. Пусть далее Н1 — Н не является константой на С. В таком случае колебание в G функции In т1 = Нх I— In X (22х) больше, чем колебание в G функции (22). Это и есть теорема Чебышева. Для доказательства обозначим через А величину max In mi и введем функцию с In т2 = Н2 — 1ц X, (222) где Н2 = Н - А. Так как колебания в G функции (222) и (222) одинаковы, то будем доказывать, что : Колеб.^ In т2 ^> Колеб.^ In т. Однако на С In т = 0, max In m2 = 0, min In m2 < 0, (24) откуда Колеб. с lnm2^> Колеб. clnm, и, следовательно, достаточно доказать, что Колеб.£ In т2 > Колеб.^ In m. Для доказательства этого неравенства заметим, что гармоническая в G и отличная от константы функция Н2 — Н = In т2 — In т меньше или равна 0 на С, а значит, и всюду в G, т. е. в G In т2 <^ In т. Правая часть по лемме Граве ^ 0 всюду в G, так что In т2 ^ In т ^ 0. Из этого неравенства и формул (24) вытекает, что max^lnm2 = 0, max^lnm = 0, (25i) min^ In m2 ^ min^ In m. /252) Сравнивая (25x) и (252), заключаем, что Колеб.^ In m2 > Колеб.^ In m, что и требовалось доказать. 38
2. О НЕПРЕРЫВНЫХ ДРОБЯХ 12. Бесконечной непрерывной дробью называют выражение OCi а2 ft 1 R 4- Ks нечные и непрерывные дроби ax Pi ai Рг Pi & ' . a, Л ' • ' " ' ai ft j_ a2 Pl + P. + .# ■ -Sl P„ ~ Qn (26) P» называют подходящими к (для) дроби (26). Если принять Л = «1> Л = Pi; р* = aiP2, <?2 = PiP2 - a2; то по индукции проверяется, что числители Рп и знаменатели Qn удовлетворяют соотношениям Рп = Р A-i + апРп-2, Qn = Pn<?n-i + an^n_2. (27) Из этих соотношений следует, что PnQn-i - Pn-iQn = (~ I)""1 «1^2.. . an, или К /,»-i. = (_1)n-1.ai0'«---a- откуда вытекает равенство Pm _ «l «l«2 , ОЦХгЗз , / 4 Ч7П_ч aia2 • • • am /ооч Для бесконечных непрерывных дробей естественным образом вводятся понятия о сходимости и расходимости. В работах Чебышева важную роль играют непрерывные дроби вида Ц , (29) Р1+- Р2 где рг, р2, Рз, • • •— многочлены от х. Это — так называемые алгебраические непрерывные дроби 33. Между алгебраическими непрерывными дробями и формальными рядами по убывающим степеням х существует важное соответствие, которое может быть описано следующим образом. Пусть подходящая дробь PmIQm разложена в ряд по убывающим степеням х. Тогда в силу формул (28) при переходе от т к т + 1 в указанном ряде останутся без изменения члены до A2n/x2N включительно, если N есть показатель степени многочлена Qm. Поэтому дроби (29) можно 33 См.: Марков А. А. Избр. труды по теории непрерывных дробей и теории функций, наименее уклоняющихся от нуля. М.; JI.: Гостехиздат, 1948, где алгебраическим непрерывным дробям посвящены глэеы III — VI [Б13, с. 323—374]. 39
однозначно сопоставить степенной ряд г1=т- + 4- + -- (3°) совпадающий с разложением подходящей к (29) дроби до члена A2n/$'iN включительно, если N есть степень знаменателя этой подходящей дроби. По определению (30) и есть ряд, соответствующий дроби (29). Обычно его называют ассоциированным с дробью. Доказывается 34, что двум различным непрерывным дробям соответствуют различные степенные ряды. Далее доказывается, что для каждого степенного ряда рассматриваемого вида существует непрерывная дробь, с которой рассматриваемый ряд ассоциирован. Это делается с помощью последовательных делений. Принимая для простоты, что в заданном ряде (30) Ах Ф 0, напишем, деля 1 на z1? равенство 1 Zl= xjAb-A^ + Zb ' (31) Здесь = — 4- ^2 4- 2 х х2 ~*~ — ряд того же типа, что и zx. При этом равенство (31) понимается в том смысле, что при формальном перемножении *(*-■$+*)-«■ Продолжая эту процедуру далее, мы придем к некоторой непрерывной дроби, и легко доказывается, что для этой дроби ассоциированным рядом будет (30). Во всех приложениях непрерывных дробей, которые встречаются у Че- бышева, основной является Теорема. Если формальный ряд по убывающим степеням х совпадает с разложением дроби P/Q, знаменатель которой имеет степень N, до члена A2N/x2N включительно, то PIQ есть подходящая к дроби, для которой рассматриваемый ряд является ассоциированным. Особенно важным является случай, когда все знаменатели рк непрерывной дроби (29) суть линейные функции от х, отличные от констант. В этом случае, который мы назовем нормальным, примем для непрерывной дроби и ассоциированного с ней ряда следующие обозначения: &о So , si . s2 . bi ' х ■fli- Г. x — аъ— . . . где все bi Ф 0. В нормальном случае степень знаменателя Qm подходящей дроби равна т. Но легко проверить, что нахождение многочлена vra \х) == х "Т" С]Х т . . • ~т~ ст сводится к решению алгебраической системы уравнений S0Cm + Sir™_i -f- . . . 4" Sm-lCl +Sm = 0, slcm + s2cm-l + • • • + *mcl T sm f 1 = 0, sm~lcm T" Snfim-l г • • • 1~ S2m-2C1 ~\~ s2m-l == U. 34 Доказательство содержится в книге Маркова [Б13, с. 327—330]. 40
Поэтому определитель этой системы S() i^m-l отличен от 0. Если еще положить D-x = 1, то найдем, что I «о <?0 = So, Qm(x) 1 D„ ... s,. 2m-2 °2m-l (m=l,2f...). Из наших рассмотрений вытекает, что неравенства Ъ% Ф 0 (г = 0, 1, 2, . . .), характеризующие нормальный случай, эквивалентны неравенствам D\ Ф #0(» = 0, 1, 2, . . .)". 13. Теперь мы можем обратиться к мумуару Чебышева «О непрерывных дробях» [Б23, т. 2, с. 103—126]. «Началом наших изысканий,— пишет он,— будет решение следующей задачи: известны значения ¥ (х) при п -f- 1 различных величинах переменной х = х0, х1ч х2, . . ., хп; найти значение этой функции при х = X, предполагая, что она выражается такой формулой: а + Ъх + сх1 + gx™-1 + hx" где т не превосходит /г, и притом так, чтобы погрешности значений ¥ (х0), ¥ (xj), ¥ (х2), . . ., ¥ (хп) имели наименьшее влияние на искомую величину ¥(Х)». Затем идут некоторые общие 36 и, к слову сказать, для дальнейшего ненужные рассуждения со ссылкой на теорию вероятностей, после чего в конце первого параграфа дана точная постановка математической задачи, которой Чебышев и занимается в мемуаре. Мы сформулируем эту задачу со всеми подробностями, изменив лишь некоторые обозначения оригинала. Дан конечный ряд значений независимой переменной: х0, хг, . . ., хп, для которых имеются значения у\ (i = 0, 1, . . ., п) некоторой функции г/, найденные с помощью наблюдений и содержащие поэтому погрешности. Пусть есть основания считать, что функция у с достаточной точностью представима некоторым многочленом ¥ (х) степени т ^ п, и, следовательно, можно принять, что у\ = ¥ (xi) + е{ (i = 0, 1, . . ., п). При этом наблюдениям и, значит, приближенным равенствам ¥ (х\) = у\ приписаны некоторые веса |ы^ ^> 0, а искомый многочлен ¥ (х) ищется в виде ¥ (х) = \i0k0 (х) г/о + НА (х) Уг + ЦпК (X) Уп, где ki (х) — неизвестные многочлены степени <^га, они ищутся из следующих условий: 35 На доказательстве равенств bo = D0J b{ = DiD^ I D\_x (i = 1, 2, ...) мы останавливаться не будем. 36 Ср.: Марков А. А. Закон больших чисел и способ наименьших квадратов [27]. В этой статье А. А. Марков излагает свой взгляд на различные попытки теоретического обоснования способа наименьших квадратов (курсив из цитированной в нашем введении книги «Исчисление вероятностен» [30, с. 323, подстроч. примеч.]). 41
a) для любого многочлена / (х) степени <^ т должно иметь место тождество / (х) = [х Д0 (х) / (^0) -г M-i^i (х) 1 (~i) + • • • + VnK (?) f (xn)i b) сумма W (x) = fi0 [I, (x)\* -f Щ ^i Wl2 + • • • + ^n IK (x)]2 должна иметь наименьшее значение. Легко видеть, что при т = п условие Ь) отпадает. Решая задачу о минимуме функции W (х) при связях хк' = (Lio^o (х) £б + M^i (х) xi + • • • + №пК (х) хп (& = 0, 1. . . ., т), (32) мы получим п -f- 1 уравнений 2Xi (я) = 10 (х) + 1г (х) х{ -)- • • . + lm (х) х? (i = О, 1, . . ., п), (33) где /^ (я) — множители Лагранжа, которые должны быть присоединены к величинам ki (х) в качестве неизвестных. В конце § 1 своего мемуара Чебышев пишет: «Вся трудность — в решении этих уравнений; мы употребим для этого особенный прием». Чтобы изложить метод Чебышева, введем функцию т Кт(х, z) = -j-£lk (х) z* /г=0 и представим уравнения (33) в виде kt (х) = Кт (х, х^ (i = 0, 1, . . ., /г), а уравнения (32) в виде п 21 ViKm (х, х^ х\ = х]г (к = О, 1, ... , т). (34) i=0 В связи с этими уравнениями рассмотрим функции \1{Кт(х,х.) 1 Z z — х. г=0 Равенства (34) показывают, что разложение по убывающим степеням z разности этих функций начинается с члена A (x)/zm+2: ViKm (*> х0 1 А (х) У Pi*m\x'xi> 1 =Л(х) г=0 Это разложение можно переписать в виде где iV (х, z) — некоторый (неизвестный) многочлен от z степени т — 1, зависящий, разумеется, от параметра х. Неопределенное уравнение (35) для нахождения многочленов Кт (z) = = Кт (х, z), N (z) = N (х, z) и потребовало от Чебышева нового употребления непрерывных дробей, о котором он писал Брашману [Б23, т. 2, с. 412—415]. К разъяснению того, что Чебышев понимал под старым и новым употреблением непрерывных дробей, мы теперь и обратимся. 42
14. Из теории диофантовых приближений известны следующие предложения. A. Если 8 — иррациональное число, то существует бесконечно много натуральных чисел д, для которых 37 q || <fl || < 1/1/57 B. Если 6 — иррациональное число и а не может быть представлено в виде а = mQ -\- п при целых т, п, то существует бесконечно много целых q, для которых | q | || qQ - а ||< V4. А есть пример теоремы об однородном приближении, а В — о неоднородном. «Старое и новое употребление непрерывных дробей» аналогичны, как мы здесь увидим, нахождению однородных и неоднородных диофантовых приближений в теории чисел. Пусть для формального степенного ряда ^ + ^ + ^+- (36) имеет место нормальный случай, т. е. Dh =£=■ 0 (к = 0, 1, 2, . . .), и пусть дан второй (уже произвольный) ряд z ^ z2 ^ zs т '•• Чебышев рассматривает две задачи. А. Найти многочлены i|)m (z), com (z), из которых первый имеет старший член zm, так, чтобы разложение по убывающим степеням z разности ("Г + "S" + "5- + ■■■)^(z)-o>m(z) начиналось с члена возможно высокого порядка. В. Найти многочлены Хт (z), Ym (z), из которых первый имеет степень т, так, чтобы разложение по убывающим степеням z разности {К- +-3-+ -?- + ...)*«<*)-(-г + -S- +?■+ ■••)}- Y-{z) начиналось с члена возможно высокого порядка. Мы имеем здесь две задачи о наилучшем приближении: первая — об однородном, а вторая — о неоднородном. При этом член, с которого начинается разложение разности, представляет порядок погрешности приближения. Решение задачи А вытекает из сформулированной в п. 12 основной теоремы. Многочленом я|)т (z) является знаменатель подходящей дроби т?г-го порядка к непрерывной дроби, для которой (36) есть ассоциированный ряд. Числителем этой подходящей дроби является con (z). Погрешность приближения имеет порядок О (l/zm+1). В мемуаре Чебышева «О непрерывных дробях» ряд (36) есть разложение по обратным степеням z суммы z z О ^г, <37) з7 Символом || 9 || здесь обозначается расстояние числа 6 до ближайшего целого числа. 43
так что = 2|ii*i, (38) i=0 где \ii ^> О и п < со. Отсюда, между прочим, следуют неравенства Dk ^> О (к<п + I)38. Для дальнейших построений Чебышева нужны лишь числа sk (так называемые моменты) и существенно, что определители Dk положительны. Число п может быть бесконечным (бесконечное число масс jXj), в этом случае конечные суммы (37), (38) заменяются рядами. Можно также перейти от сумм (или рядов) к интегралам, т. е. к непрерывному распределению масс. Рассматривая подобные случаи, Чебышев не повторял свои выводы, так как ему, без всякого сомнения, была ясна общность полученных им фактов. Заметим, что все возможные здесь случаи объединяются при применении интеграла Стилтьеса. Если бы мы это сделали, то формулы (37), (38) пришлось бы заменить на ь ъ и { t*da{t), где о (t) — ограниченная и возрастающая (точнее, неубывающая) функция. Если i|)m (z) есть решение задачи А, так что в случае, который рассматривал Чебышев, т ^ /г, то в обозначениях Стилтьеса ъ *» (2> S ^=7 - »* (*> = ° (-^т) . (39) а откуда р lb (t) dz (t) с ф (z) —1|> (t) ) ,_/ +) *mUt_tmUda(t)-<*m(z) = 0 и, следовательно, a что является интегральным представлением числителя т-й подходящей дроби (или «полинома второго рода»), а исходная формула (39) принимает вид 38 Действительно, в силу (38) если 2 £| ^ О- Неравенства для детерминантов являются следствием позитив* ности квадратичной формы. 44
откуда m—1 £-pr $**%>(*)*> (*) = (>(-£_ A-=0 Но это значит, что l^m(t)tkaa(t) = 0 (к = 0,1,...,т-1). a В своем случае Чебышев получил п 2 И^т («*)*? = О (А = 0,1,...,т-1). i=0 Эти равенства выражают, что знаменатели г|?0 (г), г[>х (г), г|>2 (z), . . . образуют последовательность многочленов, ортогональных относительно функции распределения о (t) (соответственно системы п дискретных масс и.{, сосредоточенных в точках Х{). Теперь обратимся к задаче В. В статье «О разложении в ряды при помощи непрерывных дробей» [Б23, т. 2, с. 416—430] Чебышев показал, что здесь погрешность приближения имеет порядок О (l/zw+2), а полиномы Хт (z), Ym (z) можно выразить через ортогональные многочлены i|>j (z) и многочлены второго рода о)| (z) с помощью следующих формул: т Т m где Xm (Z) = У -^ Ь (Z), Ут (*)=Уг*Г <°* <*>■ b n Ck = j [% (f)]s da (t) (r* = S Ш №t (*t)]2) , a i=0 а причем символом {ф (z)}z обозначен коэффициент при l/z в формальном разложении функции ф (z) по убывающим степеням z. 15. Сформулированное здесь правило применим к неопределенному уравнению (35). Здесь i!L_i_A+ = 1 «г I т2 I • • • Следовательно, ^ = хг, и поэтому ^={(4- + -5- + -5- + •••)^(z)}z=m*). Пользуясь правилом решения задачи В применительно к уравнению (35), находим, что т Кт (х, z) = ^ -£- % (х) % (z), А^ '* или Km(x,i)= %%(х)Ъ(*), (40) /Г=0 45
если положить оЯ- (х) = (i/Ycl-) %• (*)• Чебышев получает вначале другое выражение для Кт (х, z), а именно- ЛГ« («,«)= с ^^ • m Отсюда, используя рекуррентные соотношения для знаменателей \|>т (х), Чебышев приходит к формуле (40). Таким образом, в статье Чебышева доказано соотношение 2_j ^ И ^ (*) = fem 7=^ ' ^ '' которое в литературе 39 часто называют формулой Кристоффеля—Дарбу. Найдя Кт (х, z), мы можем написать окончательные формулы Чебышева для интерполирования по способу наименьших квадратов. Первая формула имеет вид m ~~ .w^w-v*)*»^) i=0 Вторая формула получается с помощью представления (40) и имеет вид, тп F(x)= S4i(4 (42> k=o где п а в общем случае ь A* = ly(t)$k(t)do(t). а Чебышев подчеркивает, что правая часть (42) есть отрезок суммы (ряда)* п k=o и делает заключение о важности этого обстоятельства на практике в тех случаях, когда степень интерполяционного многочлена не задана заранее, а определяется в зависимости от точности получаемого приближения (при переходе от m к та + 1 в правой части нужно прибавить новый член,, не меняя всех ранее взятых). В связи с соотношениями ортогональности многочленов \рк (х) Чебышев вводит величины Ф* (xi) = Y¥i $к (Xi) (i, к = 0, 1, .. . , п) и рассматривает образованную им квадратную таблицу Фо (so) Фо (хг). . . Фо (хп) Фг (хо) Фх (xi)... 0i (хп) Фп(Х0) ФпЫ-..ФпЮ 39 См., например, Сеге Г. [36, с. 56]. 46
Юна имеет «такое свойство: члены каждой из строк, как горизонтальных, так и вертикальных, в сумме квадратов дают 1; перемножая же соответственные члены в двух строках, вертикальных или горизонтальных, в сумме этих произведений находим 0. Составление подобных квадратов было предметом мемуара Эйлера» [56] (см. также [Б23, т. 2, с. 123]). Отметим еще две задачи на минимум, которые решаются в мемуаре Че- бышева с помощью ортогональных многочленов i|?fc (х) и которые можно рассматривать не только в случае конечного числа масс, но и в общем случае. 1. Среди всех многочленов вида F (х) = хт + ... найти тот, для которого величина ъ \\F{x)\*do{x) а имеет наименьшее значение. 2. Среди всех многочленов S (х) степени т найти тот, для которого величина ъ l\f(x)-S(x)\*do(x) а имеет наименьшее значение, причем / (х) есть заданная функция. Решения единственны и имеют вид m b Р (*) = ^г» (*), S (х) = 2 % (х) I f (t) Ь (t) do (t). fr=0 a 16. Заканчивая настоящий подраздел, остановимся на том, как вопрос об интерполировании по способу наименьших квадратов трактуется в литографированном курсе А. А. Маркова, поскольку к рассмотрениям Чебышева это имеет непосредственное отношение. Требование о том, чтобы функция W (х) имела наименьшее значение, Чебышев мотивирует постановкой задачи, согласно которой погрешность значений г/0, уг, . . ., уп должна иметь «наименьшее влияние на искомую величину F (#)», и при этом ссылается на теорию вероятностей. А. А. Марков начинает п. 25 своего литографированного курса [Б13, с. 34] следующей задачей: «Положим, имеем некоторую функцию 40 у (t), значения которой известны для тех именно величин t, на которые распространяется суммирование 41 в 28 (t)/(x — t). Число этих значений пусть будет р. Положим далее, что с целью приближенного вычисления этой функции мы желаем представить ее в виде некоторой целой функции степени ниже р: F (t) = а0 + aj + a2t2 + . . . + атГ так, чтобы F (t) приближенно равнялась у (t). Обозначая через 8 (t) ошибку, которую при этом делаем, мы можем написать y(t) = F (t) + в (t). Коэффициенты а0, а1? . . ., ат предложим себе вычислить так, чтобы в известном смысле у (t) представлялась в виде целой функции F (t) возможно точнее. Именно предложим себе вычислить их под условием, чтобы сумма W =2Q(t) [е (OP 40 Здесь и далее мы изменяем некоторые обозначения. 41 Несколько ранее в лекциях упомянуто, что 9 (t) > 0 для всех t. 47
была наименьшей. Такого рода задача называется интерполированием по способу наименьших квадратов. В сущности мы имеем задачу об определении коэффициентов а0, ах, . . . . . ., ап так, что функция е (t) наименее уклоняется от нуля при условии,, что за меру уклонения принимается 20 (t) [е (t)]2. Задача эта относится к разряду задач на максимум и минимум и решается по общим приемам. Но мы дадим решение ее, введя в рассмотрение знаменатели подходящих дробей для 20 (t)l{x — t). Форма полученного таким образом решения будет обладать характерными преимуществами». Ни в постановке задачи параболического интерполирования по способу наименьших квадратов, ни в дальнейших рассмотрениях Маркова теория ошибок и исчисление вероятностей не упоминаются. Для него это задача о наилучшем приближении в метрике L% по терминологии современного анализа. Из функций у (t), F (t) первая произвольна, но вполне определена, а вторая содержит параметры, которыми нужно распорядиться. Ситуация та же, что и в теории функций, наименее уклоняющихся от нуля. Традиции связывать ортогональные многочлены с непрерывными дробями автор остается верным. Однако еще в 1887 г. в статье «О приближенном вычислении определенных интегралов и входящих при этом целых функциях» [37] Н. Я. Сонин 42 пишет (см. [37, предисловие, с. 4]): «В нашем труде мы старались держаться на самой общей теоретической почве... Целые функции фп (х) мы определяем их интегральным свойством 43г а о разложении в непрерывную дробь интеграла ъ С F(z)dz J x — z а упоминаем лишь вскользь, приводя не только самую дробь, но и остаток при вычислении интеграла по этой дроби». К этому нужно добавить, чта в статье «О некоторых неравенствах, относящихся к определенным интегралам» [39] Сонин в общем виде изложил процесс ортогонализации заданной системы функций. Следует отметить, что Марков в своих лекциях не пользуется интегралом Стилтьеса и, вводя «суммы» вида 20 (t)/(x — t), где суммирование распространено на определенные значения t, число которых может быть как конечным, так и бесконечным, пишет далее: «Все наши рассуждения будут также относиться и к предельному случаю, когда вместо суммы взят интеграл с конечными пределами а Мы будем предполагать, что 8 (i) )> 0 и / (t) > 0 для рассматриваемых значений t» [Б13, с. 334]. Николай Яковлевич Сонин (1849—1915) закончил Московский университет в- 1869 г., защитил докторскую диссертацию в 1874 г., с 1872 до 1891 г. работал в Варшавском университете, в 1893 г. был избран ординарным академиком и переселился в Петербург. Речь идет об ортогональности jфж(,)Фп(„*(„*={; [;;2; 48
2.1. Специальные системы ортогональных многочленов 17. В статье «Об одном новом ряде» [Б23, т. 2, с. 236—238] (см. также более подробную статью «Об интегрировании» [Б23, с. 357—374]), которая непосредственно примыкает к мемуару о непрерывных дробях, Чебышев рассматривает самый простой случай, когда интерполируемая функция задана в равноотстоящих точках h, 2h, 3h, . . ., nh, а веса одинаковы (как: пишет Чебышев, вероятные погрешности одинаковы). Полагая Д*ф (Х) = ф (х + Щ — 4" Ф (* + (к — !) Л) + + Щ^^<р(х + (к--2)к) + ..., Чебышев находит, что с точностью до постоянного множителя ортогональные многочлены i|)0 (х), ург (х), . . ., урк (х), . . . равны 1, А1 {х (х — nh)}, . . ., А* {х (х — К) . . . (х — (к — 1) К) (х — nh). . . ... (х~(п + к- 1)Л)}, . . ., и таким образом получает конечно-разностный аналог многочленов Ле- жандра. Вскоре после этой работы появляется статья «О разложении функций одной переменной» [Б23, т. 2, с. 335—341], в которой в качестве дальнейших важных случаев рассматриваются ортогональные многочлены, связанные с интегралами —1 V — оо О при этом, очевидно, предполагается, что в первом интеграле х не принадлежит интервалу [ — 1, 1], в третьем — полуоси х ^> 0, а во втором имеет невещественные значения. Так как в каждом из этих случаев легко находятся моменты, т. е. коэффициенты sm формальных разложений написанных интегралов по убывающим степеням х, и для всех интегралов мы имеем нормальный случай, то удается получить явные выражения ортогональных многочленов. Они имеют вид (em/2m) cos (т arccos х), где гт = 1 при т = 0 и ет = 2 при т — 1, 2, . . .; (—*) Лхгй е (—1) d (х € ) (2*) dx ' кт dx и в современной литературе называются соответственно чебышевскими многочленами первого рода, многочленами Чебышева—Эрмита 44 и многочленами Чебышева—Лагерра 45. Чебышев строит соответствующие непрерывные дроби. Например, в связи с многочленами Чебышева—Лагерра он пишет: «Отсюда следует 44 Эрмит ввел их в 1864 г. [62]. с» 45 Лагерр получил эти многочлены в 1879 г. в связи с интегралом \ dx [65]. 40
разложение в непрерывную дробь ■dt = е-П 7, 1 х — t I2 о кх — 1 — 22 кх — 3 — — З2 кх — 5 — кх — 7 — Здесь, как и в двух других случаях, не подчеркивается, что речь идет не о сходимости, а о некотором чисто формальном соответствии 46. Отметим еще обобщение полиномов Чебышева—Лагерра, к которому пришел Ю. Сохоцкий в работе «Об определенных интегралах и функциях, употребляемых при разложениях в ряды» [40, с. 59—68] и несколько позже Н. Я. Сонин [74] 47. В этом сообщении интеграл имеет вид о ■dt (А>0,а> —1), а ортогональные многочлены получили названия полиномов Сонина— Лагерра. Рассуждения Сонина отличаются большой оригинальностью. Рассмотренные ортогональные системы многочленов называют классическими. К их числу относятся также многочлены Лежандра и Якоби. Эти последние рассматривал и Чебышев, но называл их функциями, подобными функциям Лежандра. 18. Многочлены Чебышева—Эрмита играют существенную роль в исследованиях Чебышева и А. Маркова в области важных вопросов теории вероятностей. В частности, для этих исследований имеют значение теоремы о корнях многочленов Чебышева—Эрмита, которые были установлены А. Марковым в 1898 г. [Б13, с. 231—243]. Принимая для простоты к = 1, положим Нт(х) = е*1 d е х dx В таком случае, как доказал А. Марков, верны следующие предложения. Теорема 1. Все корни многочлена Нт (х) содержатся между -mlУ In т и ra/jAn т. Теорема 2. При достаточно большом т многочлен Нт (х) имеет корни в любом данном интервале. Позже мы укажем, где и как эти теоремы были впервые применены. 2.2. Зависимость от параметров корней многочленов, получаемых при обращении рядов в непрерывные дроби 19. Упомянутому здесь вопросу посвящено несколько работ А. Маркова «О корнях некоторых уравнений» (I и II), «О функциях, получаемых при обращении рядов в непрерывные дроби» [Б13, с. 33—43, 44—50, 76 —105J и одна работа Чебышева «О разложении в непрерывную дробь рядов, расположенных по нисходящим степеням переменной» [Б23, т. 3, с. 307-362]. ^6 Однако в действительности в рассматриваемых случаях сходимость имеет место, но это нужно доказать. 47 Статья входит в сборник [Б22, с. 68—70]. В трактате Г. Н. Ватсона «Теория бесселевых функций» (пер. 2-го изд. [10]) несколько десятков раз встречаются имя Сонина и ссылки на этот классический мемуар. 50
В первой работе Маркова рассматривается функция ь d W-№«-t№*>- «о — £Ро , «1 — %Pl | 1 ~2 ~Г ' ' ' ? «о — 5Ро «1 — £Pi . oci — ^Pi «2 — 5Рг • «n-i — ^Pn-i • • • • ■ • an-i-^Pn-i где a <C b <C с <C d, функции g (y), h (y) — положительные, a £ — действительный параметр. Пусть <D»(S) = Иначе говоря, в введенных нами ранее обозначениях Фп (£) = Dn-±1 если положить sk = ак — %fik. Таким образом, Фп (£) есть многочлен степени п от £. Ряд по убывающим степеням z, представляющий функцию F (z), имеет ассоциированную непрерывную дробь. Обозначим через *Fn (z) = *РП (z, £) знаменатель тг-й подходящей к этой непрерывной дроби. Если £ ^ 0, то функция F (z) может быть записана в виде d HV^dy, ■w = S- где 9 (г/, ^)> Ов интервале а <^ у ^ d. По свойству корней ортогональных многочленов при каждом £ <С 0 все корни многочлена Tn (z) будут простыми и будут лежать в интервале а < у <Z d, а при £ = 0 даже в интервале а <С у <С Ь. «Вопрос, которому посвящена настоящая заметка,— пишет А. А. Марков,— по существу состоит в определении числа корней уравнения *Fn (z) — 0, заключенных в интервалах (—оо, а), (а, Ъ), (Ъ, с), (с, d), (d, оо)». Сформулируем главные результаты работы. 1. Функция *Fn (z) меняет свой знак в интервалах (с, d) и (а, Ъ) по крайней мере п — 1 раз. 2. Когда £ убывает от 0 до — оо, все корни уравнения Wn (z) = 0, перескакивая последовательно через бис, переходят из интервала (а, 6} в интервал (с, d). Следовательно, все корни уравнений Тп (Ь) = 0, ^п (с) = 0 степени п относительно £ отрицательны. Если мы обозначим корни уравнения Wn (b) = 0 через их ^> г]2 > . . . ^> г)п, а уравнения Ч^ (с) = 0 через T)i > Т)2 > ... > Г)п, то 4i > 4i > Л2 > Л2 > . • . > Чп > Чп. Наконец, что касается корней уравнения Wn (z) = 0, то: а) п — i из них заключены между а и Ь, один — между Ъ и с, г — 1 — между с и d, если т)г > | > г)*; р) тг — i из них заключены между а и. b и i — между с и d, если т]^ ^> > 5 > Лг+1- 3. Когда £ возрастает от 0 до +°°,все корни уравнения Ч^ (z) = 0, перескакивая последовательно через а,—оо, +°°, d, попадают из интервала (а, ,6) в интервал (с, d). 51
Отсюда следует, что все корни уравнений Уп (а) = О, Ф„ (£) = 0, Tn (d) = О степени /г относительно £ положительны. Если расположенными в порядке возрастания корнями уравнений являются соответственно то 5i < ii < ii < £2 < £2 < £2 < • • . < In < In < gn. Что касается корней уравнения Тп (z) = 0, то: а) п — i из них заключены между а и 6, один — между а и — оо7 наконец, г — 1 — между end, если £t <С £ < £г'; Р) /г — г заключены между а л Ь, один — между +оо и d, наконец, г — 1 — между с и d, если £• < £ < £•; у) п — i заключены между а и b, i — между cud, если £i < £ < £i+i- По поводу своих доказательств Марков замечает в конце статьи, что они «во многих отношениях аналогичны рассуждениям Штурма о корнях некоторых уравнений, связанных с интегрированием линейных дифференциальных уравнений второго порядка». Далее он пишет: «Функции Ламе можно рассматривать как частные случаи функций Ч^ (z). Отсюда легко увидеть связь между нашими теоремами и теоремами Клейна, дополненными Ляпуновым» 48. Вторая работа А. Маркова, цитированная выше [Б13, с. 44—50], посвящена в некотором отношении более общему вопросу. В ней рассматривается весовая функция V (у, I) > 0 (а < у < Ь), зависящая от параметра \ (£х < \ < £2)> и ортогональные многочлены у¥п (у) = Л¥п (г/, \) относительно этой весовой функции: ъ 1тп(уЛ)у*У(уЛ)<1у = 0 (к = 0,1,...,п-1). а Пусть *1 (I) <х2{1)< ... <хп (£) — корни многочлена Wn(y). Цель статьи заключается в доказательстве нескольких предложений об изменениях х, соответствующих изменениям £. Не входя здесь в формулировку результатов этой статьи, отошлем читателя к неоднократно цитированным «Избранным трудам» А. А. Маркова, где статья прокомментирована [Б13, с. 380—382] и где также рассмотрены некоторые критические замечания Г. Gere по поводу второй теоремы, а также содержащегося в статье применения этой теоремы к выводу неравенств для корней полиномов Лежандра. Заметим также, что аналогичные методы исследования Марков применял и в других случаях (см. большую работу [21]). 20. Теперь обратимся к третьей работе Маркова «О функциях, получаемых при обращении рядов в непрерывные дроби» [Б13, с. 76—105]. •Она впервые вышла в 1894 г. в «Записках Петербургской академии наук» (т. 4, № 2) и спустя 36 лет переведена на английский язык в США [22]. 48 Уравнению Ламе посвящено письмо академика Маркова к профессору А. М. Ляпунову, напечатанное в «Сообщениях Харьковского математического общества», [25], в виде статьи «О нулях целой функции Эрмита и функций Ламе*. 52
Отправным пунктом теперь является не весовая функция, а непосредственно формальный степенной ряд _£о_ , _£i_ ■ х "^ х* "1"*" + + ... •с действительными коэффициентами st. При этом вводятся определители Д* = so Si si «2 °А-1 °h'-l a2fc-2 ДМ Si s2 «2 *3 6A'+1 (^ = 1,2,...). Иногда приходится пользоваться обозначениями, подчеркивающими зависимость от моментов, например Ак (s), ДМ (s). Предполагается, что А^- ф 0 (к = 1, 2, . . .), так что для написанного ряда реализуется нормальный случай. Строится непрерывная дробь и знаменатели подходящих дробей — многочлены Wm (х). Степень т фиксируется, и поэтому корни многочлена Wm (х) обозначаются буквой х с одним индексом (xt = xt (s)). «Вопрос наш,— пишет Марков [Б13, с. 86],— состоит в следующем: как изменяются корни xt (s) при бесконечно малых изменениях параметров S0, *!,..., S2m-1». При некоторых ограничительных условиях, которые ниже формулируются, Маркову удается составить производные dxjdsi и определить их знак. В результате получается следующее предложение: Если определители Д„ (s), ДМ (s) (к ^ 1,2,.. ., т) сохраняют положительные значения, то при возрастании s±, 53, . . ., s2m-i и убывании s0j S2* • • -j S2m-2' а) корни xt (s) возрастают, P) определители Д,. (s) убывают, а определители ДМ (s) возрастают. Получив этот результат, Марков пишет [Б13, с. 95], что, основываясь на нем, уже нетрудно доказать «две замечательные теоремы», которыми он и заканчивает статью. Вот их формулировки: Теорема об определителях. Если для двух систем st = at и st = bt (i = 0, 1, 2, . . ., 2k — 1) 1,2 m) являются числами положитель- определители Дк. и ДМ (к ными и если а0 > 60, Ьг > аъ а2 > а2т-2 ^ Ь2т-2ч #2т-1 J*5 a2m-li то определители Д^ (s), ДМ (s) (к = 1, 2, . . ., т) будут положительными при всех значениях st (i = 0, 1, . . ., 2к — 1), удовлетворяющих неравенствам «о > *о > Ь0, Ьх > sx > ах, . . ., Ъ2ъ-Х > %._! > а2К^. При тех же условиях имеют место неравенства Дк (а) > Д* (s) > Д* (6), ДМ (Ъ) > ДМ (s) > ДМ (а) (к = 1, 2, ..., /и). Теорема о корнях. Если числа at, st, bt (i = О, 1, . . ., 2m — — 1) удовлетворяют всем условиям предыдущей теоремы, то уравнения Wm (х, а) = 0, Ут (х, s) = 0, Wm (х, Ь) = О степени т относительно х имеют лишь простые положительные корни и корни второго уравнения больше соответственных корней первого и меньше соответственных корней третьего уравнения. 53
В заключение Марков замечает, что «один важный частный случай теоремы о корнях находится в недавно появившейся статье акад. П. Л. Че- бышева. По методам работа Чебышева существенно отличается от моей»49. В самом конце статьи Марков пишет: «Из своих работ упомяну две заметки: „Sur les racines des certaines equations", опубликованные в 27-м томе журнала „Mathematische Annalen" 50, и диссертацию „О некоторых приложениях алгебраических непрерывных дробей" 51. Моя диссертация, появившаяся в 1884 г., содержит между прочим вывод тех формул, которые публикованы акад. П. Л. Чебышевым в 1885 г. без доказательства в заметке „О представлении предельных величин интегралов посредством интегральных вычетов" [Б23, т. 3, с. 172—190]». 2.3. Исследования о предельных величинах интегралов 21. Первой работой этого цикла была небольшая заметка Чебышева «О предельных величинах интегралов» [85], начинающаяся следующими словами: «В мемуаре, весьма интересном во многих отношениях, который был прочитан Бьенэме в Академии наук в 1833 г. и воспроизведен в журнале Лиувилля в 1867 г. [53], знаменитый ученый предлагает метод, заслуживающий особенного внимания. Этот метод состоит в определении пре- а А дельной величины интеграла \ / (х) dx по величинам интегралов \ / (х) dx, о о А А \ xf (х) dx, \ x2f (х) dx, . . ., где А ^> a, a / (х) — неизвестная функция, о о подчиненная одному только условию: сохранять знак -f- между пределами интегрирования». Далее Чебышев упоминает, что сам Бьенэме при помощи этого метода «пришел к доказательству одного предложения о вероятностях, из которого закон Бернулли вытекает непосредственно». Можно думать, что уже в то время Чебышев предвидел серьезные приложения неравенств, к которым должно привести решение новой задачи на экстремум. Оригинальность задачи и неприменимость для ее решения известных приемов также способствовали интересу к этой задаче. «Пытаясь получить,— пишет Чебышев,— для предельных величин интеграла ь \f(x)dx все, что могут доставить величины интегралов а В В В } / (х) dx, ^ xf (х) dx, .. ., ^ xnf (х) dx, А А А где А <^ а, В ^> Ъ и где / (х) остается положительной, я пришел к заключению, что эти изыскания приводят к нового рода теоремам, касающимся разложения выражения в А dx (43> в непрерывную дробь. Вот, например, одна из этих теорем: 49 Речь идет о статье Чебышева «О разложении в непрерывную дробь рядов, расположенных по нисходящим степеням переменной» [50] (см. также [Б23, т. 3, с. 307—362]). 50 Это первые две статьи Маркова, цитированные выше [67, 68] (см. также [Б13, с. 34—43, 44-50]). 51 См. [18]. 54
Если cpm (z)/tym (z) есть одна из дробей, подходящих к интегралу (43), ш если z± < z2 < . . . < zt < . . . < zn < zn+l <... < — корни знаменателя tym (z), то всякий раз, когда между х = Л и х = В функция / (х) остается положительной, имеет место неравенство у у>> \f{x)dx<y V(Zfr)». (44) Это неравенство дает ответ на частный случай задачи. Однако и этот результат в рассматриваемой заметке Чебышева был лишь сформулирован и только через десять лет доказан в статье А. Маркова «Доказательство некоторых неравенств П. Л. Чебышева» [Б13, с. 15—24]. Эта статья Маркова заканчивается следующей фразой: «В заключение моей заметки считаю приятным долгом выразить живейшую благодарность К. А. Поссе, который обратил мое внимание на разобранный выше вопрос и показал решение его для некоторых случаев» 52. Почти одновременно с Марковым неравенства (44) доказал Стилтьес 176] 5;J. Немного времени спустя Марков нашел решение общей проблемы Чебышева и посвятил ему третью главу своей докторской диссертации 1118], а уже 1 февраля 1885 г. датирована статья К. А. Поссе «К вопросу о предельных значениях интегралов или сумм» [35] 54, в которой он дополнил и существенно упростил третью главу диссертации Маркова. Вскоре появилась докторская диссертация Поссе, посвященная этому кругу вопросов. На эту диссертацию ссылался сам Марков в своих дальнейших работах. 22. Здесь уместно привести очень простое доказательство неравенств Чебышева, найденное А. Марковым. С этой целью прежде всего заметим, что для любого многочлена R (х) степени ^ 2т — 1 имеет место равенство В т jj R (х) f (х) dx=^R (zk) -^L . (45) A k=i ^m ^Zb' Действительно, R (x) можно представить в виде R (х) = ^ (х) q (х) + г (х), где q (х) и г (х) — многочлены степени ^ т — 1. При этом в силу соотношения ортогональности и интерполяционной формулы Лагранжа В В т В , / Ч < / V Л С С VI С W™ \х) I М dx \R(x)f(x)dx=y(x)f(x)dx = 2^r(zk)\-mK A A k=l А ht i (^ - zfr) *m К-) hi *m(**) 52 Следует иметь в виду, что Маркову в то время было 27 лет, а в 1874 г., когда вышла в свет первая заметка Чебышева, Марков только закончил гимназию и поступил в университет. 53 О работах Чебышева и Маркова Стилтьес не упоминает. В ответ на заявление Маркова о своем приоритете Стилтьес опубликовал небольшую заметку, в которой указал, что о работе Маркова он знать не мог, а статья Чебышева действительно ускользнула от его внимания. 54 Эта статья Поссе включена в виде приложения в сборник «Избранных трудов...» Маркова [Б13]. 55
Из (45), в частности, находим, что Ф (*fr) a "k^i S'w^Ew (46> и в Далее, из (47) следует, что коэффициенты квадратурной формулы (45) положительны: ФтЫЛ|>«Ы>0 (А = 1, 2,...), а из (46) мы заключаем, что если доказано неравенство А 1 т v к' то тем самым доказано также неравенство В т J"*** >£■£$-• (49> и если доказано неравенство в 5'«*<2Ж-. <50> то тем самым доказано также, что Но в таком случае из (48) и (51) следует неравенство п $'<*>*<£-££-• Ч V **.(**> а из (49) и (50) — неравенство zn n-l 2, Ж * 1 мп v л' Таким образом, для доказательства неравенства (44) достаточно доказать неравенства (48), (50). Мы докажем первое из них, так как второе доказывается аналогично. Чтобы доказать (48), построим многочлен R (х) по условиям R (Zl) = R (z2) = ...=R (zn) = 1, Д (zn+1) = . . . = R (zm) = 0, R' (Zl) = R' (z2) = ...=R' (z^) = R' (zn+1) = . . . = R' (zn) = 0. 56
Степень многочлена R (х) равна 2т — 2, и легко доказать 55, что Я(*)>1 (Л<*<гя), R(x)>0 (А<х<В). .Если применить формулу (44), то мы получим zn В т п С f{x)dx<:[R(x)f(x)clx= yR(zm)-^L=y V , С помощью некоторого видоизменения этого рассуждения Марков получил предельные величины интегралов v В ^f{x)dx, \f(x)dx (52) A v при произвольном v из интервала (А, В). 23. В 1885 г., после 12-летнего перерыва, Чебышев снова опубликовал работу о предельных величинах интегралов [Б23, т. 3, с. 172—190]. В этой работе он занимается не только частным случаем задачи, но и общим, когда подлежат оценке интегралы (52). Однако, как и в первой заметке, результат приводится без доказательства. Свои окончательные формулы Чебышев записывает с помощью символа вычета, введенного Коши. Кроме того, Чебышев рассматривает примеры, а в конце статьи (§ 8) пишет: «Что касается вывода их (неравенств) на основании теории наибольших и наименьших величин, это будет предметом особенной заметки». Подчеркнутые нами слова Чебышева о необходимости вывода, а не лишь проверки «угаданных» неравенств, возможно, в какой-то степени объясняют тот факт, что о появившихся незадолго до того работах А. Маркова глава Петербургской математической школы не нашел нужным даже упомянуть б6. Своему выводу неравенств Чебышев посвятил две связанные между собой позднейшие работы [40, 52] 57. В этих работах Чебышев рассматривает дискретный аналог проблемы, а именно систему уравнений ^zTu\ = Cm (m = 0,l,2,...,Z-l;/<2p), где действительные ut и z0 < zx <С . . . <С £p-i подлежат определению из условия, чтобы величина г=0 Для этого нужно применить теорему Ролля и полезно набросать график. Через два месяца после смерти Чебышева на заседании физико-математического отделения Академии наук Марков доложил свою работу «О предельных величинах интегралов». Она носит обзорный характер и включена в качестве комментария в «Полное собрание сочинений» Чебышева (т. 3, с. 396—403). В этой статье имеется следующее место (с. 398): «После выхода в свет моей диссертации П. Л. Чебышев опубликовал свои формулы для решения того же вопроса о предельных и г* величинах интеграла \ / (х) dx. Переход от моих формул к формулам Чебыше- А ва выяснил проф. К. А. Поссе в своей прекрасной монографии [72]». Первая читана на заседании физ.-мат. отд-ния Академии наук в октябре 1890 г., .а вторая — в феврале 1894 г. 57
имела максимальное значение, причем заданы а = Zq, о = 2р_1? и = z(1, а номера р и q < р не задаются. Чебышев прежде всего находит условия: разрешимости новой проблемы. Затем благодаря конечности числа неизвестных он применяет элементарный анализ и приходит к формулам, определяющим эти maxima, а по ним, пишет Чебышев 58, «легко получаются предельные величины интеграла ^ / (х) dx в том случае, когда известны величины интегралов Ъ ь ^ / (х) dx, . .., ^ xl~1f (х) dx». а а 24. Вскоре после работы «О представлении предельных величин интегралов посредством интегральных вычетов» [Б23, т. 3, с. 172—190], цитированной выше, появилась вторая работа Чебышева — «Об интегральных вычетах...» [Б23, т. 3, с. 191—225], в которой из общих неравенств предыдущей статьи выводится следующая Общая теорема. Если для двух функций / (х), f (х), которые > 0 при а <С х <С Ь, имеют место равенства b ь 5 / (х) xkdx = ^ f (х) хк dx (Л = 0, 1, 2, ..., 2т), (53)) а а и если фЛ (х) (к = 0, 1, . . ., т) — ортогональные и нормированные многочлены степени <^ т относительно веса / (х) (а значит, и веса / (х)), то< при а < v < Ъ V V K/(s)cte—С/(*)&с|<— я * . (54), Конец статьи посвящен важному примеру а = — оо, Ъ = оо, f(x) = (?//2л) е~^2/2, где параметр q ^> 0. «Мы покажем,— пишет Чебышев,— как в этом случае может быть определен высший предел дроби (55)/ ао^ (и) + а^\ («;) + ... + аЛ (и) при v каком-нибудь, откуда получается теорема, которая может иметь- полезные применения в теории вероятностей» [Б23, т. 3, с. 214]. Вот эта Теорема. Если /\ (х) ^> 0 (— оо < х < оо), jj ***-!/(х)dx = 0, J x^f (х)dx = 1,3>5-;Jf ~3) ' (56)) (ft =1,2,.. .,/rc), 58 Эти слова взяты нами из вводного параграфа мемуара 1890 г. [49, с. 260]. Заметим, что по поводу требуемого здесь перехода от сумм к интегралам в обеих работах больше не сказано ничего. 58
то 1^2л U- i! ^V. fo - С / (*) dx I < 3/3(л1»-2л1 + 3)Уч^+1)' . (57) Как следует из (57), выполнение равенств (56) для всех натуральных т влечет тождество 59 / (х) = -JL^ e-Q2^ (— оо < х < оо). (58) у 2 л Заметим, что с помощью очень тонкого анализа Н. Я. Сонин показал справедливость лучшего, чем (57), неравенства [38, кн. 1, с. 1—30] (см. также [Б22, с. 170 — 196]): -^ \ е~^ dx - \ f (х) dx I < У ^ . (59) — оо —оо Неравенство (59) не только проще, чем (57), но и лишено недостатка этого последнего неравенства, состоящего в том, что при и = оо (57) не дает возможности сделать какое-либо заключение о его левой части, когда т -*- оо. Впрочем для вывода (58) этот недостаток неравенства (57) не имеет значения. По терминологии, введенной Стилтьесом, проблема нахождения неубывающей функции о (х), удовлетворяющей уравнениям J xkdo(x) = sk (& = 0, 1,2,...), называется определенной, если для любых двух ее решений а, а V V ^ da (х) = ^ do (х) — ос —оо при любом и £Е (— оо, оо). Теорема Чебышева устанавливает, что последовательность sav-a = 0. Sat^= 1'3,5'-2;.if ~3) (А =0,1,2,...) (60) порождает определенную проблему моментов. Это свойство последовательности (60) Чебышев использовал в мемуаре 1887 г. «О двух теоремах относительно вероятностей» [Б23, т. 3, с. 229—239] 60 для определения закона распределения вероятностей суммы большого числа независимых случайных величин. Чебышев установил, что при некоторых общих условиях этот закон неограниченно приближается к нормальному, когда число слагаемых растет до бесконечности. В статье, которую мы рассматривали в п. 18 этого очерка, ее автор А. А. Марков [Б13, с. 243] пишет: «Заканчивая, я должен заметить, что до исследований Чебышева предложение о пределе вероятности было доказано только для самых простых частных случаев». При этом в предшествующем абзаце Марков отмечает нестрогость доказательства, данного Че- бышевым. Вот дословная цитата: «Но соображения, с помощью которых 59 Конечно, при условии, что / (х) непрерывна. ви См. комментарий А. Н. Колмогорова к этому Meiviyapy на с. 404—409, а также статью С. Н. Бернштейна [9]. 59
Чебышев доказал это свойство математических ожиданий, могут быть заменены другими, более простыми и в то же время строгими, как я показал в своих письмах к Васильеву 61, проф. Казанского университета... (см. также: Poincare Н. Calcul de probabilities, p. 169 — 186)». В той же статье А. Маркова приведена точная формулировка предельной теоремы Чебышева и доказательство этой теоремы, в котором устранен пробел в доказательстве Чебышева 62. Этот пробел состоял в следующем: Чебышев опирался на тот факт, что из неравенства /1 (х) t> 0 (— оо < <С х < оо) и соотношений (56) следует равенство (58). Между тем он фактически использовал следующее утверждение: если все функции fn (х) (— оо <С х < оо) неотрицательны и если оо со lim \ x*jn (х) dx = —%=г \ Л-*"/* dx (к = 0, 1, ...), п—оо v у 2д J —оо * —оо то для любого интервала (а, (3) lim { fn (х) dx = —}L=r { е-з1А"2 dx. П—оо J у 2л J a a Это утверждение А. Марков доказал в своей статье [69] (теорема 4, см. [Б13, с. 234—241]) 63, после чего доказательство предельной теоремы сделалось безукоризненным. 25. Вопрос о критериях определенности является одним из наиболее важных и трудных вопросов, входящих в проблему моментов. Неравенство (54), установленное Чебышевым, показывает, что расходимость ряда Sli-WI2 (01) fr=0 во всех точках действительной оси влечет определенность проблемы моментов, порождаемой числами Ч = J xkf(x)dx (к = 0,1,2,...). Однако неясно, как пользоваться этим критерием, за исключением очень частных случаев, да к тому же не доказано, что расходимость ряда (61) во всех действительных точках необходима для определенности 64. В XIX столетии полное исследование рассматриваемого вопроса удалось лишь для случая, когда носителем искомых масс является полуосьг и'это есть заслуга Т. Стилтьеса 65. Исследование же общего случая, когда носителем масс является вся ось, потребовало существенно новых средств анализа и поэтому задержалось на два с лишним десятилетия. В силу этого мы можем здесь остановиться лишь на части результатов, касающихся вопросов определенности. Начнем с основных результатов Стилтьеса. 61 Изв. Казан, физ.-мат. о-ва, 1892, т. 8. 62 Читатель с общим интересом и пользой прочтет комментарий А. Н. Колмогорова, упомянутый в подстрочном примечании на с. 87 в [Б13]. 63 Здесь Марков использует свои теоремы о корнях многочленов Чебышева—Эр- мита. 64 Впрочем, это и доказать нельзя, так как такое утверждение неверно, как хорошо^ известно в наше время. 65 См. мемуар «Исследования о непрерывных дробях» [77]. 60
В случае Стилтьеса проблема моментов задается уравнениями оо sk= ^xkda(x) (к = 0, 1, 2, . ..), (62) о где о (х) ищется в классе неубывающих функций. Моменты sk для разрешимости задачи должны удовлетворять некоторым условиям, а именно д* = (Л = 1,2,. Sl S-2 Si. f'-l V-2 ДС) = Sl s2 «3 *k+i *k+i °2/-l >o •)• Примем, что во всех этих неравенствах имеет место знак ^>, затем введем степенной ряд С этим рядом Стилтьес связывает непрерывную дробь вида 1 z z- 1 (64) CqZ - С\' c2z ■ сз- которую иногда называют корреспондирующей ряду (63) или С-дробью для ряда (63). На описании формальной связи между рядом (63) и его С-дробью не будем останавливаться, а заметим лишь, что положительность всех определителей Ак., ДМ эквивалентна положительности всех параметров ct. Из вида подходящих дробей • 2к- ,й e2*-i (*) C0Z- Р2к (*) Q2k (*) CqZ- ci — b2fr-l c0< нетрудно заключить, что многочлены Q2k (z), Q2k+i (z) имеют одинаковую степень к + 1, причем Q2h. (z) содержит множитель z, a Q2\+i (z) этого множителя не содержит. Если последовательность {s^}™ порождается функцией о (х) по формулам (62), то справедливы соотношения ортогональности ^Qn(x)Q(x)do(x) = 0 (Л =1,2,3,...) при произвольном многочлене 0 (х) степени < п!29 Если z имеет действительные отрицательные значения, то у взятой со знаком минус непрерывной дроби (64) все неполные частные будут величинами положительными, а потому эта дробь будет сходиться, когда ряд Со + сг + . . . + сп + . . . расходится, и будет расходиться, когда этот ряд сходится. Однако оказывается, что и в этом втором случае при к -> оо х г *У (О стремятся к пределам, уже различным, обе подходящие дроби ——ттг »• V2A' У" 61
-~ -—- (t <^ 0). Во всех случаях сходимость подходящих дробей распро- страняется 66 на всю разрезанную вдоль положительной половины действительной оси плоскость z и является равномерной в каждой ограниченной замкнутой области этой разрезанной плоскости. Основным результатом Стилтьеса является следующая Альтернатива. Пусть последовательность {sK}^ такова, что все определители Д^ и Д(А") положительны. оо 1. Если ряд 2cfc расходится, то непрерывная дробь (64) сходится в о разрезанной плоскости z к некоторой голоморфной функции Ф (z), которая допускает интегральное представление ф(*)=5 d5 (и) (65) z — и о где о (и) — неубывающая функция, являющаяся решением проблемы моментов (62). Это решение в том смысле единственное, что для всякого другого решения Ъ (и) разность о (и) — О (и) равна константе во всех точках,, где эта разность непрерывна. Функция о (и) может быть получена во всех ее точках непрерывности с помощью явной формулы (так называемой формулы обращения Стилтьеса) по значениям интеграла (65). оо 2. Если ряд ^jCk сходится, то всюду В ПЛОСКОСТИ Z о lim Р2к (z) = р (z), lim Qn (z) = q (z), k-*oo k-*oo lim P2/f_! (z) = pi(z), lim Q.^^ (z) = q± (z), A"-*00 k-—oo где p (z), q (z), pi(z), q± (z) — целые функции нулевого рода, связанные соотношением Я (z) Pi (z) — Qi (z) P (z) = !• Все корни этих целых функций простые, действительные и неотрицательные. Пределы подходящих дробей четного и нечетного порядка допускают представления PiW_ vo , vi , v2 , _ i vn _i . (67) Qi(z) z z — Gi ' z — G2 где \iK, ^., vK., 9^ — положительные числа. В этом случае проблема моментов (62) является неопределенной, а (66), (67) определяют ее решения, отвечающие двум различным распределениям масс. Кроме этих решений, имеется бесчисленное множество других, и в том числе отвечающих непрерывному распределению масс. Проблему моментов, в которой распределение масс ищется на полуоси, называют проблемой Стилтьеса. Если массы ищутся на всей оси, то проблему называют проблемой моментов Гамбургера 67. Даже беглый обзор исследований, посвященных во- 133 В силу доказанной Стилтьесом общей теоремы, о которой мы упомянули в примеч. 3. 67 Основные работы, посвященные этой проблеме,— [60, 70, 73, 54, 61]. 62
просам определенности проблемы Гамбургера, в этом очерке невозможен. Однако некоторые результаты этих исследований сформулировать полезно. Итак, пусть ищется неубывающее решение о (и) системы уравнений sk = {j и* da (и) (& = 0,1,2,. Л). Числа Sjf, разумеется, должны удовлетворять условиям А, > 0 (к = 0, 1, 2, . . .), и мы примем, что во всех этих неравенствах имеет место знак ^>. Последовательность моментов позволяет построить ортонормированные многочлены ф^ (z) (к — 0, 1, 2, . . .) и ввести бесконечный ряд 3|Ы*)|8, (68) fr=0 который в отличие от (61) будем рассматривать при всевозможных комплексных Z. Теорема68. Если ряд (68) сходится в какой-нибудь недействительной точке (например, при z = i), то он сходится равномерно в каждой конечной части комплексной плоскости z. Расходимость ряда (68) в какой-нибудь одной точке z есть условие, достаточное для определенности проблемы моментов Гамбургера, и оно же является необходимым, если z — точка недействительная. Представляют интерес критерии, выраженные через моменты. Приведем два из них. Критерий Рисса69. Для определенности проблемы Стилтьеса, соответственно Гамбургера, достаточно, чтобы -—-1/ (2дл| <С °°, соответственно 11Щ1 / '~7ШГ<^00' Критерий Карлемана70. Для определенности проблемы Стилтьеса, соответственно Гамбургера, достаточно, чтобы оо оо \П 1 \П 1 у 2к = оо, соответственно у 2/. = оо. k=i V sk k=i У s2k В мемуаре Стилтьеса имеется ряд интересных и поучительных примеров. К их числу относятся примеры последовательностей {^}^°: оо оо sk = § w~lnuuKdu, sk = ^ е~Уии*du, о о порождающих неопределенную проблему моментов. Заметим попутно, что последовательность sk = ^ гг^ф (u)du, 68 Этот результат впервые получен Гамбургером; иные его варианты содержатся в других работах, цитированных в примеч. 67. 69 См. работы, указанные в примеч. 67. 70 См. там же. 63
где непрерывная функция ср (и) неотрицательна и\ е^и<р (u)du <^ оо, по- о рождает определенную проблему моментов. Действительно, оо оо sk = С e~VTiuk(p (и) е^й du < Тпах {е-^и*} [ J и>0 J ,У7 ф(о^=м(4-) и поэтому 1 2/Г/ — T/sfr > 2^м 2к Теперь остается применить критерий Карлемана. 26. А. А. Маркову принадлежит важное обобщение чебышевской задачи о предельных величинах интегралов. Это обобщение, получившее в дальнейшем название проблемы моментов Маркова, изложено в двух его статьях: «Новые приложения непрерывных дробей» [24] и «О предельных величинах интегралов в связи с интерполированием» [26] 71. В общей проблеме Маркова вместо степеней 1, х, х2, . . ., хп в качестве «моментных» функций выступают подчиненные некоторым ограничительным условиям произвольные функции К (я), К (я), ■ • .* ^n+i (я) (а < я < Ь), так что обобщенные моменты имеют вид ak = \'kk(x)f(x)dx. (69) При этом вместо неотрицательности / (х) требуется выполнение неравенства с < / (х) < С, (70) где с, С, а также пределы интегрирования предполагаются конечными. Упомянутые ограничительные условия, наложенные на моментные функции, состоят в следующем: при любых а <; иг < и2 < . . . < ип < ип+1 <; Ъ имеют место неравенства Мш)>0, К (Ui) li (и2) К2 (ui) К2 (и2) >о, ^1 (ui) hi (и2) ^i (и3) Х2 (ui) %2 (и2) Х2 (ив) ^3 ("i) ^з (и2) ^з (из) J-1 >о,. Нетрудно проверить, что функции Хк (х) = x'l~L этим условиям удовлетворяют. Этому частному случаю моментных функций посвящен первый мемуар 72 Маркова, а общему — второй. Марков вводит еще одну функцию 71 Обе статьи включены в сборник [Б13, с. 120—145, 146—230]. В 30-х годах проблема моментов Маркова получила дальнейшее развитие. Этому развитию, позднейшим исследованиям и приложениям посвящена большая монография М. Г. Крейна и А. А. Нудельмана [15]. 72 В нервом мемуаре а = 0, b = L. 64
Q (x) (a ^ x ^ b), для которой %г (u-i) A,i (u2) %\ (u3) Я2 (WlK^2 (И2) ^2 (U3) Q(iti) Й(и2) Q(i*s) >0,..., и ставит следующую общую задачу: найти максимум и минимум интеграла v lf(x)Q(x)dx (a<w<6), (71) а если моменты (69) известны при к = 1, 2, . . ., я, а / (х) должна удовлетворять неравенству (70). Марков не исследует условий, налагаемых на обобщенные моменты требованием, чтобы класс допустимых функций / (х) был непустым. Вместо этого, как и в ранее рассмотренных задачах на нахождение предельных величин интегралов, с самого начала принимается, что заданные обобщенные моменты порождаются какой-нибудь функцией F (х), для которой при а ^ х <^ Ъ с < F (х) < С. Особо выделяется случай, когда вместо (71) рассматривается интеграл ь \f(x)hn^(x)dx, (72) ь иначе говоря, ищутся неравенства для (п + 1)-го обобщенного момента при заданных первых п моментах. Во всех случаях каждая из функций /тах (х), /min (х), которая дает интегралу экстремальные значения, является функцией кусочно-постоянной, принимающей попеременно значения с и С в п + 1 последовательных частях интервала (а, Ь), если рассматривается интеграл (72), и в п + 2 последовательных частях, если рассматривается интеграл (71). При этом в случае интеграла (72) при всех х, достаточно близких к Ь, функция /max (х) равна С, а функция /тщ (х) равна с. В случае же интеграла (71) ДЛЯ фуНКЦИИ /min (х) ДОЛЖНО быТЬ / (у - е) = с, / (у + е) = С, а для функции /тах (х) f (v _ 8) = С, / (и + е) = с, где г означает бесконечно малое положительное число. К сказанному нужно добавить, что в первом мемуаре (где вместо обобщенных моментов рассматриваются обычные степенные моменты) Марков использует для нахождения экстремальных решений С-непрерывные дроби, в которые он разлагает функции ь «рЬ№4 4^«р{т№*}- Заметим также, что в последнем параграфе первого мемуара Марков применяет полученные им результаты для построения некоторых квадра- 3 Математика XIX века 65
турных формул, но мы на этом здесь не останавливаемся 73. Значительная часть второго мемуара посвящена приложениям и установлению связи между ними и исследованиями других авторов 74. Эти интересные вопросы мы рассмотрим в следующем пункте. 27. Возьмем, следуя Маркову, неравенство для / в виде -1 </(*)< 1 (а<*<6) и примем (см. (69)), что аг = а2 = . . . = ап = 0. При этих условиях Марков ищет максимум и минимум интеграла ь \j{z)K+i{z)dz. (73) а Нетрудно видеть, что теперь /тах = — /min и нахождение обоих экстремальных значений интеграла (73) сводится к определению одного многочлена Qn(*) = (£1-z)(C8-z). ..(£»-*) (а < d < 1г <...<£„< Ь), удовлетворяющего условиям ь \ h (z) sgn Qn (z) dz = 0 (ft = 1, 2,..., n). (74) a При этом b b max ^ / (2) ?Wi (2) dz = + $ Kn+1 (z) sgn Qn (z) dz. (75) a a Левую часть (75) Марков обозначает символом j K+i (z), n который Чебышев ввел в упомянутом мемуаре [Б23, т. 3, с. 292] 75. Пере- 73 Относительно этих формул и родственных формул П. Л. Чебышева см. статью М. Г. Крейна и автора этого очерка «О некоторых формулах квадратур П. Л. Чебышева и А. А. Маркова» в [5]. 74 Чебышев П. Л. Об интерполировании в случае большого числа данных, доставленных наблюдениями (1859) (см. [Б23, т. 3, с. 244—313]); КоркинА., Золотарёв Е. [64]' (см. [Бб, вып. 1, с. 138—153], а также мемуар Стилтьеса [75]). 75 Вообще для любой функции со (z) ъ ь ^ со (z) = ^ со (z) dz, ^ со (z) = \j со (z) sgn Qn (z) dz. 0 a n a При ЭТОМ b \ ^1 (z) = max \ / (z) A,i (z) dz, 0 a где / (z) подчиняется неравенству —1 ^ / (z) <J 1, a b $ K+i (*) = max $ / (2) Лп+1 (2) <**> n a 66
ходя к обобщению способа интерполирования, который Чебышев дал в этом мемуаре, Марков составляет новые функции ^2 (z) = ^2 (Z) + £li2A,l. W, 'Фп (^) = А.я (2) + g„-i, Дп-1 (*) + ...+ £l,A (Z), так, чтобы $!>„(*) = О, $фп(г) = 0,..., J ifc, (*) = <>. 0 1 П—2 Коэффициенты ^ffc:, как легко видеть, однозначно определяются. Заметим далее, что новые функции будут также удовлетворять условиям 1 ^п (z) = 0 (т = /г, п + 1, . . .)• 771 Лишь при т — п — 1 интеграл не равен нулю: S Ыг)>0. П—1 Если ввести нормированные функции J7M (z) = ф?1 (z) = я|)я (*)/ $ 4>я (*) (/г = 1, 2,. ..), гг—1 то можно будет написать соотношения биортогональности ь S Uk (z) Vm (z) dz = Sfrm (к, m = 0,1,...), a где 76 Теперь для любого обобщенного многочлена Ф (Z) = Pi>-i (Z) + Р2^2 (Z) + . . . + />ДЯ (Z) лолучается представление 0(z) = Uo(z)lo(z) + U1(z)lo(z) + ... + Un-1(*) I ®(z). (Щ О 1 n—1 В случае нужды можно увеличивать число членов в этой формуле, не меняя уже имеющихся членов. Важность этого свойства интерполяционной формулы неоднократно подчеркивали Чебышев и Марков. В цитированном мемуаре Чебышев построил формулу (76) для случая обычных, а не обобщенных моментов. Предположение Чебышев а, что число где / (z) должна удовлетворять условиям ь ^f(z)Xk(z)dz = 0 (Л = 1,2,..., и) а и неравенству —1 ^ / (z) ^ 1. 76 Вместо многочлена Qm(z) можно взять любую функцию, которая в каждой точке интервала (а, Ъ) имеет тот же знак, что и Qm (z). 3* 67
данных при интерполировании очень велико и даже что эти данные соответствуют равноотстоящим «бесконечно близким» значениям х (см. цитированный мемуар [Б23, т. 3, с. 275]), используется, чтобы ничем не ограничивать степень интерполирующего многочлена, а также для «довольна точного» нахождения интегралов от интерполируемой функции по любой части интервала с помощью простых сложений значений этой функции в ряде точек. Именно суммами таких интегралов являются коэффициенты формулы (76). Марков иллюстрирует свою общую формулу (76) на двух примерах обобщенных моментов. В первом примере а = О, Ъ = я, Лх (z) = 1, Х2 (z) = —cos z, Л3 (z) = cos 2z, ^4 (z) = —cos 3z, . . . Разбирая сначала простейшие случаи, он подмечает на них закон образования функций i|)fc (z), а затем приходит к окончательным формулам, которые- мы представим в виде Vo = 1, Щ = sgn cos kz, 1 1 \П (— 1)Л kz /z \ о о \ где d пробегает все нечетные делители числа к, не содержащие квадратных множителей, a h есть число простых множителей вида Am -f 1, содержащихся в d (число 1 причисляется к числу значений d, но не причисляется, ни к числу квадратных множителей, ни к простым множителям). Во втором примере снова а = О, Ъ = я, но Ях (z) = sin z, Я2 (z) = —sin 2z, A3 (2) = sin 3z, . . . Здесь биортогональная система имеет вид vk=sga8in(k + l)zt «fc = 4- 1]-^81п (*^1)Я (* = 0,1,2,...), d|fr+i где \x (d) есть функция Мёбиуса, a d пробегает все нечетные делители числа к + 1, причем d = 1 и d = i + l (если /с -)- 1 нечетно) не исключаются. С помощью замены х = cos z второй пример сводится к рассмотренному Чебышевым. Предоставляя проверку этого читателю, остановимся на ходе рассуждений самого Чебышева. Мемуар Чебышева начинается с задачи, которая в модернизированной формулировке гласит: при заданном I (0 ^ I ^ п) найти многочлен Q (х)} степени ^ п так, чтобы 1 \ (Ао + А\х + . .. + Апхп) sgn Q (х) dx = sAh -1 где коэффициент пропорциональности s должен иметь возможно большее численное значение. Чебышев сводит задачу к системе алгебраических уравнений и затем показывает, как с помощью аппарата непрерывных дробей получить корни искомого многочлена Q (х), а также алгебраическое уравнение, максимальным по модулю действительным корнем которого является s. Чебышев строит таблицу, содержащую все неизвестные величины при п = О, 1, 2Г 3, 4, 5, но его метод позволяет решать задачу при любом п. После этого 68
Чебышев отмечает неудобство получаемой интерполяционной формулы, если требуется ее строить для заданной функции при различных п. Что касается экстремальной задачи, то ее общее решение при любом п Чебышев получает лишь при I = п. «Мы покажем,— пишет он 1Б23, т. 3, с. 266],— как можно вывести из этого новую формулу интерполирования». Решению экстремальной задачи при I = п посвящены с. 270—274. Его результатом является Предложение 1. Если положить х = cos ф (0 <^ ф ^ л), то многочлен Q (х) степени ^ п, для которого 1 § х1 sgn Q (х) dx = 0 (I = 0, 1, . . ., п — 1), —1 а величина 1 | ^ хпsgn Q (х) dx -1 имеет максимум, определяется формулой Q (х) = sin (п + 1) ф / sin ф, причем упомянутый максимум равен 1/271"1. Из предложения 1, как легко проверяется, вытекает следующее Предложение 277. Среди всех многочленов Рп (х) степени п с равным 1 старшим коэффициентом многочлен Qn (х) = (1/271) sin (п + 1) ф/sin ф минимизирует интеграл 1 J \Pn(x)\dx, —1 и величина этого минимума есть я л -^ jj | sin (п + 1) Ф | dq> = -^г J sin ф йф = -^гг . о о Последовательность функций vn (х) = sgn Qn (х) = sgn sin (п + 1) ср {п = 0, 1, 2, . . .), отвечающая формуле Чебышева, таким образом, известна, Что касается функций ип (х), то, в сущности говоря, Марков их вначале «угадывает», а затем уже проверяет, что они удовлетворяют всем условиям. Тем более интересно решение Чебышева, рассуждения которого прямо приводят к найденному им теоретико-числовому описанию искомых многочленов ип (х). Хотя в этих рассуждениях и приходится применять довольно сложный аппарат, мы их приведем (в наших обозначениях), устранив попутно один содержащийся в них пробел. По существу Чебышев строит для многочленов щ (х) (к = 0, 1, 2, . . .) то, что принято называть производящей 77 Это предложение было доказано Коркпным и Золотарёвым в цитированной выше статье 1873 г. [64]. Авторы, по-видимому, не заметили связи решенной ими задачи с исследованиями Чебышева. Их анализ не опирается на какие-либо специальные работы, а его полнота и ясность изложения представляют интерес и для современного читателя. 69
функцией 78. Эта функция F (я, р) в данном случае равняется ос V г-ик(х), где параметр о > 2. В качестве отправного пункта Л—± (к + 1)р-1 v ' Чебышев берет функцию l/(ch t — х)2, где t > 0 — параметр, и находит коэффициенты a,, (t) ее разложения по полиномам щ (х): М*)= J (ch,-S)« Mfe)<% = shf.sh(jfc + i)f - —i Вводя знак ~, который в аналогичной ситуации применяется в ряде Фурье, мы можем написать соотношение ^at<(t)uk(x). cht — х Чебышев без всякого обоснования пишет знак = вместо знака ~. Затем Чебышев умножает первоначальную функцию на (1/Г (р)) £p_1 sh t и интегрирует по t от 0 до оо. Параметр р во всяком случае ^> 2. Результат имеет вид оо оо it \def 1 С Р"1 sh 1 if — V i Т(х,р)=Г{9) ^ {cht__x)2 ох-^ (Л + 1)Р-1 k def 1 С f"1 sht j+ _ V 1 sin(fe + l)<p sin ф о ft-=o где x = cos ф. Теперь напишем разложение этой функции по многочленам щ (х). Оно имеет вид оо /(*,p)~S Л(р)М*), (77) где, как легко проверить, 1 оо А * (р) = J / (5, Р) у* (I) ^ = T^pj- 5 а* (0 tv-i shtdtr= —1 О _ 2 (fc + l) ? ^p"1 d£ — Г(р) ) sh(k + l)t ' 0 Эти интегралы у Чебышева также вычислены, оо 4 \П 1 (к+lf-1 £л (2,--1)0 * Если мы положим оо 1 С (9) 1-1 (2г-1)Р ' то формулу (77) сможем переписать в виде оо 4- с (р) / (х, р) ~ 21 '^». и- (Щ ы,<*+1>Р 78 О производящих функциях для классических ортогональных многочленов см. Сеге [36, с. 67]. 70
Теперь нам остается показать, что в (78) знак ~ можно заменить на = (и тем самым устранить пробел в рассуждениях Чебышева, а также показать, как Чебышев привел формулу (78) к окончательному виду). Из изложенного выше правила для построения функций ик (z) по функциям Кг (z), Х2 (z), . . ., Хк (z) можно усмотреть, что max |м^(д:)| в рассматривая: =^i ваемом нами случае растет при к ->■ оо не быстрее некоторой фиксированной степени к. Поэтому для всех достаточно больших р ряд в (78) сходится равномерно и, значит, правая часть (78) — непрерывная функция в [—1,1]. Если мы ее обозначим G (х, р), а левую часть (78) — F (х, р), то соотношение F (х, р) ~ G (х, р) означает, что (при всех достаточно больших р) 5 [F(x,p) — G(x,p)]vk(x)dx = 0 (fc = 0,1,2, . . .)• Но в таком случае по одной теореме замкнутости (см. [3, с. 302]) имеет место равенство F (х, р) = G (х, р) (при каждом достаточном большом р). Чтобы получить окончательный результат, Чебышев пользуется следующей хорошо известной и восходящей к Эйлеру формулой L г=1 (2г-1)р 1Г(1 — /Гр) где р пробегает все простые числа, исключая число 2. «Произведение П' (1 — р~р) приводится,— пишет Чебышев [Б23, т. 3, с. 301—302],— к ряду 1 1 1 1 1 1 3р 5р 7Р Нр 13р 15р который представляется в виде \ (+—— j , если через dl9 d2, . . . обозна- r=i r чены нечетные числа без квадратного множителя и условлено, что знак перед l/dr берется верхний или нижний, смотря по тому, входят простые делители в четном или нечетном числе». Иначе говоря, оо оо r=l ч r т=0 v ' ; где jbi (а) — функция Мёбиуса. Окончательный вид производящей функции таков: оо оо 1 sin {к + 1) ф ,(,.P)=4C(p,,(,.p,=4-2;tj=ia£^ (w + l)p L-l ik+lf smcp Дальнейшие приложения обобщенных моментных функций во втором ме- муаре Маркова примыкает к задаче Коркина—Золотарёва. Прежде всего Марков упоминает, что Стилтьес в цитированном мемуаре [75] решает следующую задачу: определить коэффициенты рг, р2, . . ., рк выражения Ф (z) = PlK± (z) + р2%2 (z) + . . . + рпХп (z) так, чтобы интеграл ь ^\Q(z) — (D(z)\dz а имел наименьшую величину. 71
Это есть некоторая задача о приближенном представлении функций. Марков решает более сложную задачу этого рода, а именно: пусть функции kt (z) удовлетворяют условиям ь щ= ^Xi(z)f(z)dz = 0 (1 = 1,2, . . .,/г) а при некоторой функции / (z), для которой -1 </(*)< 1 (а<2<6); требуется найти коэффициенты рг, р2, . . ., рп так, чтобы сумма v Ь l\Q(z)-d>(z)\dz f $|<D(z)|dz, a v где v задано, имела наименьшее значение; Q (z) удовлетворяет условиям, указанным в начале п. 26. Подобного рода экстремальные задачи (часто довольно искусственные) интересовали и других математиков последней четверти прошлого века. Приведем здесь в качестве примера задачу, которой посвящена статья К. Поссе «Об одном вопросе о наименьших величинах» [34]. Вот формулировка этой задачи: Среди всех многочленов вида / (х) = хт + Аугт_1 + . . . + /ст найти тот, для которого величина 1 ь S = ^\f(x)\dx + (-l)mlf(x)dx О а имеет наименьшее значение; Ъ > а > 1 заданы. После формулировки своей задачи Поссе пишет: «Вопрос этот находится в тесной связи с разложением в непрерывную дробь корня квадратного из полинома четвертой степени, и искомый полином может быть выражен через якобиевы функции; в силу этой именно связи вопрос этот кажется нам заслуживающим некоторого внимания». На анализе задачи Поссе мы не останавливаемся. ЗАКЛЮЧЕНИЕ 1. В теории функций, наименее уклоняющихся от нуля, центральное место принадлежит проблемам, связанным с приближением произвольных функций посредством многочленов или тригонометрических сумм заданного порядка 72. Так как Чебынгев занимался только аналитическими функциями, то для него «произвольной функцией» могла быть лишь регулярная функция, отличная от многочлена (или тригонометрической суммы) порядка /г. Общим теоретико-функциональным вопросам Петербургская математическая школа в то время внимания не уделяла, и нам неизвестно, знал ли Чебышев об установленной Вейерштрассом, главою Берлинской школы, теореме 79, согласно которой для всякой непрерывной функции / (х) (— 1 <^ х <J 1) можно при любом е ^> 0 построить многочлен Рп (х) степени п — п (е) так, чтобы | / (X) - Рп (X) | < 8 (-1 < X < 1). Эта теорема Вейерштрасса опубликована в 1885 г., т. е. в последнее десятилетие жизни Чебышева. См. [Б57]. 72
С. Н. БЕРНШТЕЙН Первое время после открытия Вейерштраеса идеи Чебышева продолжали развиваться в прежнем направлении. Однако через два десятилетия в рамках новых достижений общей теории функций возникли чисто чебы- шевские проблемы. Исследование и решение этих проблем, которые привели к созданию нового раздела в теории функций, являются заслугой главным образом Сергея Натановича Бернштейна (1880—1968). Развитию основных идей в этой области в течение первых десятилетий после смерти Чебышева посвящены следующие страницы. 2, Пользуясь общепринятым обозначением Еп [/ (х)\ для погрешности наилучшего приближения функции / (х) (— 1 ^ х ^ 1) посредством многочлена степени п, можно записать теорему Вейерштраеса в виде lim Еп [/ (х)] = 0 ео. Здесь сразу возникает следующий вопрос: от каких П —00 факторов зависит скорость убывания Еп [/ (х)] при п ->- оо? В одном частном случае ответ на этот вопрос можно получить из общих результатов Чебышева. Это тот случай, когда / (х) = 1/(х — а), где а ^> 1. Если У а2 - 1 > 0, то *п[-Ч= {а-^1)П*\ (79) п \_ х — а ] а — 1 v/ 80 Вторая теорема Вейерштраеса утверждает, что lim Е'п [F (t)] = 0, где Е\ [F (t)] П—оо означает погрешность наилучшего приближения непрерывной 2я-периодической функции F (t) посредством тригонометрической суммы порядка п. fii В явном виде формула дана в 1912 г. в статье С. Н. Бернштейна «Об асимптотическом значении наилучшего приближения аналитических функций» [Б2, т. 1]. По 73
Не мешает заметить, что эллипс с фокусами —1, 1, проходящий через точку а, имеет полусумму осей R —- а + )/~а2 — 1- В упомянутой здесь статье Бернштейна рассмотрены и другие аналитические функции/ (х), регулярные в построенном эллипсе, и показано, что Еп [/ (х)] при п —>- оо всегда убывает как \IRn. Этот результат важен и интересен, но он не может дать даже намека на то, каким должен быть хотя бы первый шаг на пути к исследованию и решению общего вопроса, сформулированного в начале этого пункта. 3. Этим первым шагом явилось новое доказательство теоремы Вейер- штрасса, предложенное Лебегом в 1898 г. [66]. В доказательстве Лебега непрерывная функция прежде всего аппроксимируется кусочно-линейной функцией (на графике — ломаной), т. е. функцией вида m Ах + В -f У] Ск\х — аъ\, (80) а затем эта последняя аппроксимируется многочленом. Таким образом, на первый план выдвинулась задача о наилучшем приближении функции | х | в интервале, содержащем внутри точку х = 0. Для начала был взят интервал [ — 1, 1]. Валле-Пуссен [86] нашел, что Еп[\х |] < Kin, где К от п не зависит. Так как на нахождение точного значения величины Еп [ | х |] особых надежд не было, то возник вопрос об оценке этой величины снизу. Этот вопрос был поставлен Валле-Пуссеном в цитированной статье 1908 г. Полная формулировка задачи Валле-Пуссена такова: «Возможно или невозможно аппроксимировать ординату полигональной линии посредством многочлена степени п с погрешностью, меньшей чем 1/тг?» Эта задача оказалась трудной, и вначале появились лишь предварительные оценки: Валле-Пуссена (1910) [87] (Еп [| х \ ] > а/п (In п)г) и независимо Бернштейна (1911) [Б2] и Джексона (1911) [63] (Еп [| х |] > ajn In п). Но уже в 1912 г. в своей докторской диссертации «О наилучшем приближении непрерывных функций посредством многочленов данной степени» [Б2] Бернштейн доказал, что i^j<£*»[|s|]< М2п + 1} • (81) Этим был не только установлен порядок величины Еп [| х |], но и даны неравенства в духе тех, к которым всегда стремилась чебышевская школа. Излагая в обзорном докладе [Б2] на 5-м Математическом конгрессе некоторые из полученных к тому времени результатов о связи между дифференциальными свойствами функции/ (х) и быстротой убывания при п —>■ оо величины Еп [/ (х)], Бернштейн заметил: «Пример проблемы наилучшего приближения функции | х |, предложенной Валле-Пуссеном, лишний раз подтверждает тот факт, что хорошо поставленный частный вопрос приводит к теории более общей значимости». И действительно, занимаясь этой проблемой, Бернштейн получил большое количество важных результатов и в том числе общий метод для решения так называемых обратных задач теории приближения, состоящих в нахождении дифференциальных свойств аппроксимируемой функции по известной скорости стремления к нулю погрешности ее наилучшего приближения. поводу (79) Бернштейн пишет: «Алгебраичзская задача опрзделения Еп [1/(х — а)] немедленно разрешается при помощд нескольких дополнительных замечаний, к результату классической работы Чебышева «Вопросы о наименьших величинах, связанных с приближенным представлением функций», § 29—38» [Б2, т. 2, с. 151]. 74
В дальнейших рассмотрениях мы, как правило, будем ограничиваться 82 случаем периодических функций. 4. В своем методе решения обратных задач Бернштейн применил следующее замечательное предложение: если п $п (*) = S (ah- cos kt + bk sin kt), TO I Sn (t) I < n max | £„ (0 | (82) и знак = хотя бы в одной точке t ЕЕ [—л;, л] имеет .место в том и только в том случае, когда Sn (t) = ап cos nt -|- fr?7sin/?£. Соотношение (82) носит название неравенства Бернштейна для тригонометрических сумм. Из него следует, что при любом к \S^ (t)\<n"max\Sn(t)\. Существует ряд различных доказательств неравенства (82) и далеко идущих его обобщений. В диссертации Бернштейна [7, § 10] показано, что общее неравенство (82) эквивалентно своему частному случаю, в котором Sn (t) есть нечетная функция. В свою очередь, этот случай, если сделать замену cos t = х, сводится к неравенству \{Рп_1(х)УТ^-\ уГ=^\^п max \Рп_1(х))ГГ=&\, (83) которое в главе I диссертации и доказывается с помощью чебышевских методов 83. Более простой путь для доказательства неравенства (82) состоит в редукции его к следующему неравенству: | /Vi И |< л max | /Vi (х) YT=T* |, (84) где знак = достигается лишь при Рп-\ (х) = СТп (х) и х = +1, С = = const. Эта редукция осуществляется с помощью введения функции Sn(t + *)-Sn(t-T) = A gin cog shb^ = 2sinx Z~i sinT w где x = cos т. Неравенство же (84) просто доказывается применением интерполяционной формулы Лагранжа с корнями многочлена Тп (х) в качестве узлов (см., например, задачи 80—82 отдела 6 книги [33]). Идею применения неравенства (82) поясним на следующей теореме: Пусть для заданной периодической функции F (t) при любом п существует тригонометрическая сумма оп (t), такая, что max | F (t) — оп (t) | < A/na (A = const). 82 При этом исчезают осложнения, связанные в конечном счете с наличием границ у интервала при приближении многочленами. 83 Там же доказывается и неравенство К (*)/!-** \<п тах 1*п<*)1« (83'> о котором было упомянуто выше. Заметим, что к неравенству (83') сводится общее неравенство (82) в случае, когда Sn (t) — четная функция. 75
В таком случае для любых t', t" t= [—л, я]: 1) при 0 < а < 1 \F{t")-F{t') |<L| Г-*'!«; 2) при а = 1 | F (Г) - F (f) | < L 11" - t' | In (2л/1 Г - t' |); 3) при 84 a = 1 | F (*') - 2F ((f + i")/2) + F (f) |<M|f-C |«. Для доказательства представим F (t) в виде суммы равномерно сходящегося ряда оо оо F(t) = al(t)+ S [a2frW-^-i(0] = ^i(0 f Si £д-(')> где Sm)k(t) ~cr0fr (0 — ст./;-! (^) есть тригонометрическая сумма порядка 2\ для которой | S9fc (£) | <^ ЗЛ/2/;а. Поэтому в силу неравенства Бернштейна I s'2k (t) | < 3.2fci4/27"a - зл -г7^-»). Пусть число б удовлетворяет неравенству 1/2-Л* ^ б <С 1/2V-1. Тогда |F(H-fi)-/>40l<hi(« + e)-ai(/)| + ^|52n*-f-fi)--52nOI + 7г--=1 оо ЛГ—1 + 6^^r<^ + 6I>f I^WI + isrrr^e*. а средний член правой части в силу неравенства Бернштейна допускает оценку A-=l / ==1 если 0 < а < 1, и если а = 1. Тем самым утверждения 1) и 2) доказаны. Для доказательства утверждения 3) нужно написать неравенство \F(t + 6)-2F(t)+ F(^-6)|<|ai(^-f 6)-2ai(04-ai(I-e) |-f- Лт—1 , оо + £1 -V С +б) - 2 V (0 + sik (t - б) i + 12л ^ -L < /V-l < 2B6 + ЗЛб2 ^ 2^ + 24Л6 < 2S6 + 6Л6 -f 2446. A"=l На довольно простых примерах можно показать, что все утверждения теоремы относительно порядков оценок являются точными. 84 Предложение 3), по собственному замечанию Бернштейна, от него ускользнуло; впервые оно было доказано много лет спустя А. Зигмундом (1945) [88]. 76
5. Решение прямых задач теории приближения началось с применения интеграла Фейера —Я представляющего тригонометрическую сумму порядка п — 1. Оценивая разность —Л Бернштейн доказал следующее предложение для функций F (t), удовлетворяющих неравенству \F (П - F (Г) | < \t" - t'\* (О < а < 1), т. е. принадлежащих классу Липшица порядка a (F (t) е= Lip.a): 1) если а <^ 1, то тах|^(*)-Фп(0|<Ла/|1«; 2) если а = 1, то m*x\F(t)-<bn{t)\<Ax 1п(" + 1) • t П Сопоставляя с теоремой предыдущего пункта, получаем следующий законченный результат: для принадлежности функции F (t) классу Lip а (0 <^ а <С 1) необходимо и достаточно, чтобы Еп [F (t)] = О (1/па) при п —> оо. Критический случай а = 1 исследовал Джексон [63]. Он ввел интеграл 71 О где п J \nsm{ul2)) —я представляющий тригонометрическую сумму порядка 2п — 1, и получил оценку шах \F(t) — J2n (t) | < D/2n, t где, как можно показать, D ^ я. Это приводит к следующему, также законченному результату: для принадлежности функции F (t) классу Зигмунда 85 необходимо и достаточно, чтобы Еп [F (t)] = О (l/п). Так как класс Lip 1 входит в класс Зигмунда, то справедливо следующее утверждение: если | F (Г) - F (П |< | f - t' | (*', f e [-я, я]), (85) ?85 Это значит, что для любых tr, t" е [—я, я] | ^ (^) _ 2F ((*' + Г)/2) + /? (*") |<1|Г-П- 77
то ELi IF (t)] < Din (86> (но обратное утверждение неверно). Здесь, конечно, возникает чисто че- бышевская задача о нахождении наилучшей константы D в (86) для всего класса (85). Эта задача в настоящее время решена для многих классов. Некоторые относящиеся сюда результаты мы рассмотрим в следующем пункте. Г 6. Обозначим через 3-£г (г > 1) класс 2л-периодических функций F (£), имеющих абсолютно непрерывную производную F<r-u (t), удовлетворяющую условию Липшица 86 | F(r-i) у) _ F(r.i) (^) | ^ | f _ t> | (t>9 f e [_я? n])t Пользуясь своим методом, Джексон доказал существование константы Dr, такой, что для каждой функции F (t) €= CfCr имеет место неравенство ELi IF (t)] < Drlnr. Сформулированная в конце предыдущего, пункта чебышевская задача теперь гласит: найти наилучшее значение константы Dr. Очевидно, речь, идет о нахождении величины nr sup Et-i[F(t)] = Kr. Эта задача была решена одновременно (1937) и независимо у нас [4] и во Франции [57]. Здесь мы вынуждены ограничиться формулировкой окончательного результата К, _ _4_ VI (-1)^г+1> ^ jx_ ,o7v — я Zj (2*-МГ+1 ^ 2 • 1°'/ So <2* + 1> Неравенство Джексона с наилучшей константой, таким образом, имеет вид: если F (t) ^lCKt (г > 1), то Eti [F (t)] < Kfin\ (88) и в этом соотношении знак = достигается, а экстремальной функцией является Fo («) = Л У ***«*+*)»*7™П так что Z?(0 /А 4т V1 Sin (2& + 1) Л^ / • .ч /ПА\ ^ (о=—2j —2^+1—=sgn (sm nt^ (90) Нетрудно показать, что для каждого г функция /^ (t) принимает значение + (1/пг) Кг, изменяя знак в 2п точках tx = ея/2/г + Хл/п (X = О, 1,2,.. ., 2п — 1), где 8 = 0, если г нечетно, и е = 1 при четном г, а также что tnax\F0(l)\ = (l/nr)Kr. 86 Таким образом, Жх есть класс (85). 78
Поэтому в силу основной теоремы Чебышева (для периодического случая): Eti IF о (*)] = Кт1п\ Не мешает заметить, что и функция (89) связана с классическими построениями Чебышева и А. Маркова (см. п. 26 нашего очерка). Мы остановимся еще на одной чебышевской задаче о наилучшей по целому классу аппроксимации (на сей раз многочленами). В п. 68 своей диссертации Бернштейн [Б2, т. 1, с. 93] доказал следующую теорему: если аналитическая функция / (х) по модулю не превосходит М внутри эллипса с фокусами —1, 1 и полусуммой осей 1/д, то (обратная теорема доказана там же, с. 41) Рассмотрим класс аналитических функций Lq (О <^ q <С 1)? определяемый следующими условиями: а) внутри упомянутого только что эллипса функции этого класса регулярны и удовлетворяют неравенству —1 <^ <^ Re / (х) <^ 1 и б) на большой оси эллипса функции вещественны. Теорема. Для каждой функции / (х) ЕЕ Lq имеет место соотношение и в этом соотношении знак = достигается, а экстремальная функция /0 (х) вполне характеризуется тем, что ее вещественная часть на границе эллипса поочередно равна +1 на дугах, которые мы получим, построив некоторую систему гипербол с фокусами в точках +1. В дальнейшем чебышевские проблемы возникли также в связи с приближением непериодических функций на всей оси.
Часть вторая ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 1. ИТОГИ РАЗВИТИЯ ТЕОРИИ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ В XVIII в. Систематическое развитие теории обыкновенных дифференциальных уравнений *, которую в дальнейшем мы нередко для краткости будем именовать просто теорией уравнений, начинается с И. Ньютона и Г. Лейбница и их ближайших последователей. XVIII век — эпоха стремительного ее развития. Она становится ядром математического анализа и соответственно всего математического естествознания (о развитии теории в XVII— XVIII вв. см., например, [А2; A3, т. 2, 3; А7; А10 ; А9, т. 3, 4; 96]). Вряд ли в этот период найдется хотя бы один сколько-нибудь значительный математик, который не попробовал свои силы в интегрировании дифференциальных уравнений, возникавших при решении различных математических и прикладных задач. Большая часть так называемых элементарных методов интегрирования уравнений, с изложения которых начинается в наше время любой университетский курс их теории, была создана в XVIII в. Целые классы этих уравнений и методы их решения, которые мы находим в современной учебной литературе, связаны с именами крупнейших математиков того времени — А. Клеро, Ж. Далам- бера, Ж. Лагранжа, Г. Монжа, П. С. Лапласа и, конечно, Л. Эйлера. Значительные усилия были сосредоточены на поиске методов интегрирования уравнений «в квадратурах»: изыскивались различные замены переменных, позволяющие привести уравнения к интегрируемым формам (например, к уравнениям с разделяющимися переменными) или хотя бы понизить их порядок, велись поиски интегрирующих множителей. Большие успехи были достигнуты в интегрировании линейных дифференциальных уравнений — повышенный интерес к ним во многом объяснялся их прикладным значением. Был разработан классический метод интегрирования однородных линейных уравнений произвольного порядка с постоянными коэффициентами путем сведения их к алгебраическим «характеристическим уравнениям» для показателей г в частном экспоненциальном решении егх (Эйлер, 1743), разработаны методы интегрирования систем таких уравнений (Даламбер, 1743; Эйлер, 1747—1748 (50); Лагранж, 1762—1765 (66)). Для линейных уравнений ?г-го порядка с переменными коэффициентами было отмечено, что их общие решения складываются из их частного решения и общего решения соответствующего однородного уравнения (Даламбер), что общее решение однородного уравнения представляется в виде п У= 5 скук, к=1 Здесь и далее, кроме специально оговоренных случаев, речь идет об уравнениях в действительной области. 80
где у = у к — частные решения (Лагранж, 1762—1765 (66)). Для решения неоднородного -уравнения разрабатывался метод вариации постоянных (Эйлер, 1739; Лагранж, 1775 (77)). Были предложены способы понижения порядка линейного дифференциального уравнения, использующие знание одного частного решения У — У\ (заменой у = yxz — Даламбер, 1762—1765 (66)) или знание частного решения сопряженного уравнения (Лагранж, 1762—1765 (66)). Интегрируя линейные уравнения второго порядка, Эйлер пришел ь к мысли искать решение в виде определенного интеграла вида \extf (t)dt. а Используя эту идею для уравнения (а0х + Ъ0) уЫ + (ахх + Ъг) г/^-D + . . . + (апх + Ьп) у = О, Лаплас (1782 (85)) нашел соответствующий вид функции / (t), что явилось одним из первых примеров применения «преобразования Лапласа». Из достижений в области нелинейных уравнений отметим прежде всего результаты, относящиеся к специальному уравнению Риккати у' + ау2 = Ъхш (а, Ь, т — константы). Ряд авторов (Д. Риккати, Иоганн I, Николай I, Николай II и Даниил Бернулли) проинтегрировали это уравнение для определенных значений т. Пользуясь тем обстоятельством, что при замене вида z± = —=—~тг » * lz TV1 с коэффициентами Р, Q, P1,Q1 — функциями^ так называемое общее уравнение Риккати z' = А (х) z2 + В (х) z + С (х) переходит в уравнение того же типа, Эйлеру удалось проинтегрировать это уравнение с помощью цепных дробей. В работах Клеро, Эйлера, Даламбера и др. получил развитие метод интегрирующего множителя для уравнений первого и более высоких порядков. Изучались уравнения F (х, г/, у') = О, не разрешенные относительно у'. В частности, было проинтегрировано1 (Клеро, 1734 (36)) уравнение у = (х + 1) clylclx — (dy/dx)2, представляющее частный случай уравнения у = ху' + / (у'), известного в литературе как уравнение Клеро. Наряду с общим его решением у = = (х + 1) С — С2, представляющим семейство прямых, зависящее от параметра С, было получено и так называемое особое решение, представляющее огибающую этого семейства. Ранее с такими решениями столкнулся Б. Тейлор. С этим феноменом встретились впоследствии при интегрировании уравнения у = хР {у') + Q {у') (Даламбер, 1748 (50), 1769 (72)). Исследования Эйлера, Лапласа привели к построению теории особых решений (Лагранж, 1774 (76)). Заметим, что сами понятия «общего» и «частного» интегралов восходят к работе Эйлера 1743 г. Многочисленные задачи механики, в том числе знаменитая задача п тел, приводили, однако, к уравнениям, интегрирование которых в квадратурах не удавалось. Так, Эйлер, изучая задачу колебания мембраны, пришел (1764 (66)) к уравнению цилиндрических функций, уравнение сферических функций возникло в связи с задачами теории потенциала (80-е годы, Лаплас, Лежандр). Для интегрирования подобных уравнений приходилось прибегать к представлению решений в виде степенных и тригонометрических рядов, разложению в цепные дроби, пользоваться при- 81
ближенными методами. Обзор соответствующих результатов занял бы слишком много места, поэтому мы ограничимся лишь несколькими замечаниями принципиального характера. При поисках решения линейного дифференциального уравнения второго порядка х2 (а + Ъхп) d2y + х (с + ехп) dxdy + (/ + gxn) ydx2 = О в виде степенного ряда было замечено (см.: Эйлер. Интегральное исчисление, 1769. Т. 2), что его следует искать в виде у = хх (а0 + агх + . . .), где показатель К не является, вообще говоря, целым. Эйлер получил для определения А, квадратное уравнение и заметил, что в случаях, когда разность корней этого уравнения есть целое число, делящееся на п, одно из решений этого уравнения содержит логарифмический член. Эйлером же для решения начальной задачи для уравнения первого порядка был создан (Интегральное исчисление, 1768. Т. 1) один из самых известных приближенных методов, сыгравший впоследствии важную роль в общей теории для доказательства существования решения начальной задачи для этого уравнения, — метод ломаных. Задачи математической физики приводили к необходимости постановки и решения различных краевых задач (Даламбер, Эйлер). Так, изучая колебания струны переменной толщины, Ж. Даламбер пришел к уравнению у" = А,ф (х) у и поставил вопрос о существовании значений Я, для которых существует отличное от тождественного нуля решение, обращающееся в нуль в двух фиксированных точках оси х. Используя качественные рассуждения, хотя и не вполне строгие, но могущие быть сделанными таковыми, Даламбер доказал существование единственного Я, отвечающего условиям задачи. Этот результат предварял будущую теорию Штурма—Лиувилля. Резюмируя, можно сказать, что математики XVIII в. достигли значительных успехов в разработке методов интегрирования дифференциальных уравнений различных типов, серьезно продвинулись в изучении вопросов общей теории (теории линейных уравнений, теории особых решений и др.), приступили к исследованиям начальной и краевых задач. Их идеалом было получение решений дифференциальных уравнений в квадратурах, в форме «более простой и, — по выражению Ж. Монтюкла 1298, т. 3, с. 165], — более привычной для ума». Решения, полученные в виде бесконечных рядов, принимались лишь вынужденным образом — для «безнадежных случаев» [Там же, с. 165]. Однако сравнительная малочисленность уравнений, которые удавалось проинтегрировать в квадратурах, с одной стороны, и обнадеживающие успехи интегрирования в виде рядов, при помощи непрерывных дробей, посредством приближенных методов — с другой, неминуемо подводили к необходимости перестройки всего здания теории дифференциальных уравнений. Эту перестройку, произведенную О. Коши, следует, конечно, рассматривать в рамках всей реформы анализа, произошедшей в первой половине XIX в. и связанной с именами К. Ф. Гаусса, Б. Больцано и самого Коши. На центральное место в теории уравнений вместо общего решения выходит решение начальной задачи, изучавшейся в XVIII в. Эйлером. Существование этого решения (а затем и решений различных краевых задач) становится в известном смысле важнейшей проблемой теории дифференциальных уравнений. Постановка и разработка этой проблемы представляют собой, на наш взгляд, наиболее отличительную черту теории дифференциальных уравнений первой половины XIX в. 82
2. ПРОБЛЕМА СУЩЕСТВОВАНИЯ И ЕДИНСТВЕННОСТИ 2.1. Работы Коши Первый метод Исследования Огюста Коши (1789—1857) открывают новую эпоху в теории дифференциальных уравнений. Рассматриваемые в рамках математического анализа в целом, они составляют часть его грандиозной работы по коренной перестройке всего фундамента анализа (об этом см. одну из последующих книг). Переместив центр тяжести на иные понятия теории и переосмыслив ее задачи, Коши перестроил в соответствии с этим все здание теории, определив тем самым более чем на столетие основные направления последующего ее развития. Центральным понятием теории дифференциальных уравнений до Коши было понятие общего решения, т. е. решения, зависящего (в случае уравнения первого порядка) от произвольной константы, фиксируя которую можно получать различные частные решения. В соответствии с этим основной задачей теории была задача нахождения общего решения уравнения посредством его интегрирования в квадратурах (см. раздел 3). Коши поставил во главу угла частное решение — решение уравнения dyldx = f (х, у), (1) принимающее при данном значении х0 заданное значение у0. Знание такого решения при фиксированном х0 и произвольном у0 дает общее решение. Таким образом, рассматривая такое решение, мы не проигрываем в общности, приобретая, с точки зрения Коши, важное преимущество — для такого решения (а следовательно, и для общего решения) удается четко поставить и решить проблему существования, играющую столь важную роль в его воззрениях на анализ. Проблема существования решения начальной задачи становится у Коши центральной в теории дифференциальных уравнений. Ее значимость становится тем более очевидной, что к тому времени стало уже ясно, что интегрирование уравнений в квадратурах возможно лишь в исключительных случаях (см. раздел 3), и поэтому возросла роль приближенных методов и методов получения представления решений в виде рядов. Изложение новой теории Коши и первое доказательство теоремы существования решения уравнения (1), проходящего через заданную точку (яо> Уо) (т- е- решения начальной задачи, рассматривавшейся еще Эйлером и названной впоследствии задачей Коши), содержали его лекции по курсу анализа для студентов второго года обучения Политехнической школы в Париже, прочитанные в 1823—1824 гг. Корректурные листы первых 13 из этих лекций (текст 13-й сохранился не полностью) были обнаружены и опубликованы [133] недавно. Они являются продолжением его широко известных лекций, опубликованных под названием «Резюме лекций по инфинитезимальному исчислению, прочитанных в Политехнической школе; том 1» (1821) [129], и должны были, очевидно, составить их второй том (см. введение к [133], а также [394]). Теорема существования решения уравнения (1), принимающего при данном х0 заданное значение г/0, и ее доказательство приводятся в лекциях 7—8. Изложение проводится по той же схеме, что и в случае знамени- х того доказательства существования интеграла \ / (х) dx, содержащегося в 1-м томе лекций. *<> 83
Интервал (х0, X) произвольным образом делится на части. Пусть #0 < Х± < ^2 < • • • < *п-1 < *п = X — абсциссы точек деления. Для этого деления строится ломаная линия (в литературе ее нередко называют ломаной Эйлера): через точку (х0, у0) проводится прямая с угловым коэффициентом / (х0, у0). На этой прямой берется точка (хъ г/х): У± = Уо + / (*о, Уо) (*i — xQ). Через точку (хг, уг) проводится прямая с угловым коэффициентом/ (хх, уг), на которой берется точка (х2, у2): У2 = Уг+f (*i, Уг) (*2 — *i), п т. д. Наконец, через однозначно определенную таким образом точку (#n-i> Уп-i) проводится прямая с угловым коэффициентом / (xnLi, yn-i), на которой берется точка (X, уп) с ординатой Уп = У71-1 + / (s„_i, Уп-i) (X — xn-t). Естественно предположить, что таким образом построенная ломаная Эйлера при увеличении числа и уменьшении длин звеньев будет аппроксимировать решение уравнения (1), проходящее через точку (х01у0), если оно, конечно, существует, и значение Уп = Уо + 1 (яо, уо) {xi —- го) j-f / (*i, yi) (х2 — Х1)+... - .. + / {Хп-ъ Упг-i) (X — Хп-г) (2) будет приближать значение у (X) этого решения. На этой конструкции был основан широко известный во времена Коши метод приближенного интегрирования уравнения (1), предложенный Эйлером в первом томе его «Интегрального исчисления» (1768) (ИМ, т. 3, с. 393). Коши решил использовать этот метод для доказательства самого существования решения. Для этого нужно было исследовать сходимость последовательности уп при п —> оо и стремлении к нулю максимального отрезка разбиения интервала (х0, X). Доказательство Коши, проведенное им по аналогии с доказательст- х вом существования интеграла \ / (х) dx (при этом роль интегральных сумм Хо играют уже выражения типа (2)) и использующее теорему о конечных приращениях, доказанную им в лекции 7 первого тома, приводит его в лекции 8 к следующему классическому результату. Пусть / (х, у) и df (х, у)1ду — функции, непрерывные для х ЕЕ ■е [#<н хо + а] и у е [г/о — Аа, у0 + Аа], где А таково, что | / (х, у) | < А в указанных промежутках изменения х и у; тогда решение уравнения (1), принимающее значение у0 при х = х0, существует в интервале (x0rx0 -f- а). 1 Этот результат занимает очень важное место в курсе Коши не только по числу страниц, отведенных под его доказательство, но и по той роли, которую он играет в его структуре. В этих лекциях мы находим настоящее исследование по основаниям теории дифференциальных уравнений в действительной области (см. введение к [133]). Коши не ограничивается доказательством локальной теоремы существования, он рассматривает также вопрос о существовании решения в целом [133, с. 62], изучая проблему продолжения решения на весь интервал, в котором соблюдаются условия сформулированной выше теоремы. М
о. коши IB лекции 10 он дает доказательство локальной единственности такого решения. Важно отметить появление у Коши столь важного для последующего развития математики различения между локальными и глобальными свойствами уравнений и их решений. В лекции 13, дошедшей до нас не полностью, Коши распространяет свой метод на системы дифференциальных уравнений первого порядка. К сожалению, формулировка этой теоремы на сохранившихся листах отсутствует. Как мы уже говорили, сохранившиеся корректурные листы второго тома лекций Коши по инфинитезимальному исчислению были опубликованы лишь в наше время. Поэтому об основном содержащемся в них результате — теореме существования решения задачи Коши для уравнения (1) — математики могли узнать либо из краткого его резюме, помещенного в написанном в 1835 г. в Праге «Мемуаре об интегрировании дифференциальных уравнений» (опубл. в 1840 г. [131, т. 1, с. 327—384; Б30. Сер. 2, т. 11, с. 399]), либо из чрезвычайно краткого изложения профессора Парижской лолитехнической школы механика Г. Кориолиса (1837) [141], либо, наконец, из второго тома «Лекций по дифференциальному и интегральному исчислению» (1844) [296] ученика Коши аббата Ф. Муаньо (1804—1884). Второй метод В предисловии к пражскому мемуару 1835 г., говоря о бытовавшей до сих пор практике использования рядов для интегрирования дифференциальных уравнений, Коши писал: «Интегрирование дифференциальных уравнений с помощью рядов было таким образом иллюзорным, тем более что 85
не существовало никаких способов удостовериться в том, что полученные ряды сходятся и что их суммы представляют собой функции, удовлетворяющие предложенным уравнениям; таким образом, возникла необходимость либо найти такие способы, либо искать другой метод, с помощью которого можно было бы установить в общем виде существование функций, удовлетворяющих дифференциальным уравнениям, и вычислить значения, бесконечно приближающие эти функции» [БЗО. Сер. 2, т. 11, с. 400]. Такой метод, названный впоследствии первым методом Коши, и был им предложен в лекциях 1823—1824 гг. К середине 30-х годов благодаря усилиям самого Коши, а также Н. X. Абеля ситуация в теории рядов, в частности степенных рядов, начинает меняться (см. Кн. 2, с. 141—146). Проблема представления функций степенными рядами особенно занимает Коши в связи со все более усиливаю- щимся его интересом к теории аналитических функций. Многие из его замечательных результатов в этой области были доложены им Туринскойг академии в 1831 г. Среди них теорема существования разложения функции комплексного переменного в степенной ряд и известное неравенства !/<"> (х0) | < п\ М(р)/рп (п = 0, 1, 2, ...) (3) (мы приводим его в современных обозначениях), где М (р) — максимум, модуля функции / (х) на окружности радиуса р — радиуса сходимости ряда оо / (х) = J, ап (х — хо)п. Оценка сверху модуля функции комплексного переменного в точках произвольной окружности комплексной плоскости составляет суть так называемого исчисления пределов (Кн. 2, с. 144), также доложенного Коши Туринской академии в 1831 г. Его изложение воспроизводится в «Резюме ме- муара о небесной механике и новом исчислении, называемом исчислением пределов» (1841) [131, т. 2, с. 41—98; БЗО. Сер. 2, т. 12]. В качестве одного из предложений нового исчисления Коши указывает теорему существования решения начальной задачи системы дифференциальных уравнений. Доказательство такой теоремы, знаменующее выход общей теории дифференциальных уравнений в комплексную область, Коши дает в неоднократно упоминавшемся пражском мемуаре 1835 г. В этом мемуаре Коши рассматривает систему уравнений вида dyxldx = Д (х, уъ г/2,..., уп) (i = 1, 2,..., п). (4> Он сводит задачу ее интегрирования к нахождению частных интегралов некоторого линейного уравнения с частными производными первого порядка. Эти частные интегралы он ищет в виде саепенных рядов, относительно которых доказывает, что в случае сходимости они удовлетворяют этой системе. Для доказательства сходимости он использует оценки типа (3), получаемые с помощью «исчисления пределов». Такого рода оценки для производных по у} (у = 1, 2,..., п) функций fo(x, уг, у2,..., уп) (i = 1> 2,..., п) позволяют Коши построить для исследуемых рядов мажоранты в виде сходящихся в некоторой достаточно малой окрестности точки (xQl уг, у2, . • - . . ., уп) геометрических прогрессий, а также получать оценки их остаточных членов. Доказательство Коши (оно воспроизведено с незначительными изменениями во втором томе курса Муаньо (1844) [296]) имеет пробелы и до- 86
^вольно громоздко. Некоторые формулировки требуют уточнения. В частности, неясность остается в вопросе об ограничениях, накладываемых (если рассматривать случай уравнения (1)) на функцию / (х, у). Неясность эта связана с тогдашней убежденностью Кошивтом,что непрерывная функция всегда дифференцируема (Кн. 2, с. 125—126). Так, в мемуаре, литографированном в Турине в 1831 г., на котором во многом основывается пражский мемуар 1835 г., от этой функции требуется только конечность и непрерывность. При его воспроизведении во втором томе «Упражнений» >(Exercices, 1841) Коши добавляет аналогичное ограничение на производную функции df (х, у)1ду. Полная ясность в этом вопросе была достигнута лишь впоследствии в результате целого ряда исследований по теории функций комплексного переменного, выполненных самим Коши и его учениками. Практически современную форму рассматриваемой теоремы Коши и ее .доказательства мы находим в труде учеников Коши и Лиувилля Ш. Врио и Ж. Буке «Исследования о свойствах функций, определяющихся дифференциальными уравнениями» (1856) [117]. Наряду с уравнением (1) с функцией / (х, у), голоморфной в области | х | ^ р, | z | ^ г, они рассматривали мажорирующее уравнение dz М dx (1 — х/р) (1 — zjr) (М = sup | / (х. у) | в этой области). Утверждение теоремы следовало у них из того, что его решение, которое находится в явном виде, мажорирует решение уравнения (1). Отсюда же легко следовала оценка радиуса сходимости решения уравнения (1): R = р (1 _ e-r/iMp). (5) -Соответствующие рассуждения легко переносились на случай системы (4). Оценке (5) соответствует тогда следующая: R == р (1 _ e-r/cw-DAfp). (5') К изложению только что рассмотренного метода доказательства существования решения начальной задачи для уравнения (1) или системы (4), получившего в литературе наименование второго метода Коши (или метода мажорант), Коши обращался неоднократно (см. работы 1842 и 1846 гг.)2, внося различные модификации, уточняя исходные предпосылки, наконец, перенося его на уравнение с частными производными [179, с. 16—24]. Но что интересно, к первому методу он более не возвращался. Чем объясняется такое невнимание к методу, дающему, казалось бы, более общий результат? Одной из таких причин послужила недостаточная ясность представлений Коши о взаимосвязи функций комплексного и действительного переменного, в частности о связи производной функции комплексного и действительного переменного. Эта неясность проявилась уже в пражском мемуаре 1835 г., где результаты, полученные первым и вторым методами, рассматривались не как разные, но как один и тот же. В этой уверенности впоследствии его укрепило добавленное им при изложении второго метода требование ограниченности и непрерывности производной df (х, у)/ду (см. выше). Но наиболее важной причиной полного невнимания Коши к своему первому методу послужила общая идейная направленность творчества Коши в последние десятилетия его жизни. Построенная им теория 2 См.: С. г. Acad. sci. Paris, 1842, vol. 14, p. 1020-1028; vol. 15, p. 14-25; 1846, vol. 23, p. 485—487, 529—537, 563—569, 617-619, 702—704, 729-740, 779—787. 87
функций комплексного переменного полностью изменила его интересы. Центральным в математическом анализе стало для него понятие аналитической функции. В соответствии с этой общей направленностью и теория дифференциальных уравнений становилась теорией аналитических функций, определяемых дифференциальными уравнениями. И первый метод, и получаемый с его помощью более общий результат были оставлены без внимания не только самим Коши, но и его последователями (см. предисловие к [133]). Возобновление интереса к доказательству существования решения задачи Коши для уравнения (1) с неаналитической правой частью датируется 1868—1869 гг. — временем появления работы Р. Липшица, речь о которой еще впереди. Заканчивая рассказ о работах Коши, связанных с доказательством существования решения начальной задачи для дифференциальных уравнений, скажем, что Коши, поставив в центр теории дифференциальных уравнений начальную задачу (задачу Коши) и придав теоремам существования решений этой задачи нынешний статут, положил начало новому периоду в ее развитии. С его работ начинается столь принципиальное для дальнейшего развития теории различение локальных и глобальных свойств уравнений и их решений. 2.2. Развитие метода мажорант Несколько позднее Коши и независимо от него к этому методу пришел К. Вейерштрасс, развивая свою программу построения теории аналитических функций (см. Кн. 2, с. 207—214). Не зная о туринском мемуаре О. Коши и его воспроизведении во втором томе его «Упражнений», вышедшем в 1841 г., Вейерштрасс в работе «Определение аналитических функций одного переменного посредством алгебраических дифференциальных уравнений» (1894) [Б57, т. 1, с. 75—84], написанной в 1842 г., доказал этим методом теорему существования аналитического решения начальной задачи системы дифференциальных уравнений dj/i/dx = /i (г/ь г/2,..., уп), где /i (г/i, у2,---, Уп) — многочлены,— теорему, ранее сформулированную и доказанную для случая произвольной системы (4) Коши. Вейерштрасс доказал также несформулированный Коши явным образом, но по существу содержавшийся в его работах факт равномерной сходимости рядов, представляющих решение. Наконец, и этого результата уже нет у Коши нив какой форме, Вейерштрасс описал процесс аналитического продолжения функций, заданных степенными рядами, и применил эту идею для представления решений дифференциального уравнения вне области сходимости первоначально задававших эти решения рядов. К сожалению, ранние исследования Вейерштрасса не были своевременно опубликованы — указанная работа 1842 г. увидела свет лишь в 1894 г. в первом томе его собрания сочинений. Поэтому его идеи стали известны лишь позднее и получили развитие в значительной мере благодаря исследованиям его учеников. Идеи же Коши очень быстро получили широкое распространение. Важную роль при этом сыграли исследования Врио и Буке, в особенности упоминавшаяся выше их работа 1856 г., в которой давалось усовершенствованное изложение метода, содержавшее ряд важных уточнений, а также книга профессора Дижонского университета, создателя известной теории действительного числа, Шарля Робера Мерэ (1835—1911) «Новое краткое изложение инфинитезимального анализа» (1872) [294]. 88
В целом ряде исследований изучался вопрос об улучшении оценки (5') радиуса сходимости ряда, представляющего решение системы (4) по методу мажорант. Э. Пикар, распространяя на комплексную область первый метод Коши (метод Коши—Липшица — см. ниже), показал (1888) 1330], (1893) [333, т. 2], (1899) [335], что в качестве радиуса сходимости можно взять величину min (р, rIM). .Дальнейшие уточнения оценки радиуса сходимости были получены в 1896 г. финским математиком Э. Линделёфом [260] и в 1898 г. немецким математиком и историком математики П. Штеккелем [370]. Когда речь идет о существовании аналитического решения задачи Коши для дифференциального уравнения (1) или системы уравнений (4), то единственность такого решения очевидна. Однако остается открытым вопрос — не существует ли иного решения, не являющегося аналитическим в точке х = х0 и такого, что при стремлении х к х0 по некоторому пути С у {х)-+у (*0)? Отрицательный ответ на этот вопрос для случая уравнения (1) при условии конечности пути С был получен в упоминавшейся выше работе 1856 г. Врио и Буке. На случай системы (4) этот результат был распространен Пикаром в лекциях 1886—1887 гг. [329]. Он же во втором томе «Трактата по анализу», вышедшем в 1893 г. [333, т. 2, с. 314], дал доказательство аналогичного результата для произвольного пути С, .2.3. Метод Коши—Липшица Доминировавший в анализе 40—60-х годов интерес к аналитическим функциям распространился и на теорию дифференциальных уравнений — на первый план здесь в этот период начинает выходить аналитическая теория (см. раздел 5) уравнений. Основным аппаратом доказательства теорем существования решений становится метод мажорант. О первом методе Коши, казалось, забыли. В 1868 —1869 гг. появилась статья «О возможности полного интегрирования заданной системы дифференциальных уравнений» [280] профессора Боннского университета Рудольфа Липшица (1832—1903). Липшиц родился близ Кенигсберга, учился в Кёнигсбергском, а затем в Берлинском университетах. Ученик Дирихле. Работал в университетах Бреслау и Бонна (с 1864 г.). Основные его результаты относятся к теории чисел, математическому анализу и многомерной геометрии. В работе [280] тем же методом, что и у Коши, доказывалась теорема -существования решения начальной задачи для системы (4) в несколько более общих, чем у Коши, предположениях относительно функций /i (получивших в последующей литературе наименование условий Липшица): функции /i (х, у1ч у2 уп), однозначные и непрерывные в рассматриваемой области, удовлетворяют для всех значений (х, уг, г/2, . . ., уп), \(#> У\, и'г* • • -ч Уп) из этой области неравенству | U (х, Уи У*, • . ., Уп) — U (*, 2/i, Уг, • • -,Уп)\< < &i | Ui — Ух | + - - • + К | yn — уп |j, )где &!, k2 kn — положительные числа. О соответствующих результатах Коши Липшиц, судя по всему, тогда не знал. На них, а также на статью Кориолиса 1837 г. ему было указано © редакционном примечании к французскому переводу его статьи, опубли- 89
кованному в 1876 г. [281]. Вновь излагая результат этой статьи во втором- томе своего «Учебника по анализу» (1880), Липшиц уже ссылается [282,. с. 499] на предшествующий результат Коши. Однако, пожалуй, вплоть до работ профессора Сорбонны (с 1881 г.) и Высшей нормальной школы, члена (с 1889 г.) и впоследствии непременного секретаря Парижской академии наук Эмиля Пикара (1856— 1941) этот метод не был оценен по достоинству. Он даже не упомянут в первом издании 3-го тома известного курса анализа К. Жордана, посвященного дифференциальным уравнениям (1887). Пикар пишет в 1896 г. в предисловии к третьему тому «Трактата по анализу» [333, т. 3]: «Блестящее развитие теории функций комплексного переменного привело к тому, что было оставлено несколько в стороне исследование случая, когда все элементы, входящие в дифференциальные уравнения, действительные. Под влиянием работ Пуанкаре 3 о кривых, определяемых дифференциальными уравнениями 4, уже несколько лет, как изучение этих вопросов возобновилось». В курсе анализа Пикара, прочитанном в 1886—1887 г. на. Парижском факультете наук [329], теорема существования Коши, усовершенствованная Липшицем, отмечена как «самая общая, известная на этот счет». Доказательство теоремы Пикар тогда не привел. Пространное изложение метода мы находим уже в вышедшем в 1893 г. втором томе первого издания его «Трактата по анализу» [3331, где она сообщается наряду С теоремами, полученными методом мажорант и методом последовательных приближений. В 1899 г. Э. Пикар [335] (см. также [333, 2-е изд. т. 2, с. 333]) и П. Пенлеве, о деятельности которых речь еще впереди, показали, что найденное в окрестности начальной точки методом Коши—Липшица решение начальной задачи может быть продолжено и может подойти сколь- угодно близко к границе области, в которой удовлетворяются условия теоремы. Э. Пикар распространил метод Коши—Липшица на комплексную область (1888) [330], (1893) [333, т. 2, с. 309], (1899) [335]. Попытки ослабить ограничения, налагаемые на правые части уравнения (1) (или системы уравнений (4)), показали, что полностью отказаться от условий типа Липшица без нарушения единственности решения задачи Коши невозможно. В 1890 г. профессор Туринского университета Дж. Пеано (1858—1932) доказал существование в окрестности точки х9. по крайней мере одного решения системы (4), удовлетворяющего начальным условиям уг (хо) = z/j, в случае одной только непрерывности функций /г {я, J/i, У2i • - -1 Уп) в рассматриваемой области. Мемуар Пеано, написанный в специально развитой им символике, был изложен в 1893 г. на обычном языке ученым из Карлсруэ, впоследствии известным физиком Густавом Ми (1893) [295]. В дальнейшем доказательство Пеано упрощалось и обобщалось бельгийским математиком Ш. де ла Валле-Пуссеном (1892—1893) [386], профессором Болонского университета Ч. Арцела (1895-1896) [100], (1896-1897) [101], профессором Гарвардского университета (США) У. Ф. Осгудом (1898) [312]. Валле-Пуссен и Арцела доказали теорему существования решения' задачи Коши для уравнения (1) в предположении непрерывности функции / (х, у) по у и интегрируемости по х. Исследуя вопрос о единственности решения задачи Коши для уравнения (1), Осгуд получил [312] достаточные условия единственности, менее ограничительные, чем Липшиц: функция / (х, у), для любой пары то- Имеются в виду его мемуары 1880—1886 гг. См. раздел 6. 90
Э. ПИКАР чек (х, yj) и (х, у2) рассматриваемой области должна удовлетворять условию I / (*, Уч) — f (*, Ух) I < Ф (| У-2 — У\ I ), а где ф (w) при О <С и <^ а непрерывна и такова, что \—^-—>оо, когда е 8-^0. В качестве ф (и) можно взять, например, к и (к > 0) (условие Липшица), &w. log (1/| и |), /ш log (1/| гг |) log log (1/1 и \), . . . 2.4. Метод последовательных приближений В историко-математической литературе распространено мнение, что Коши принадлежит также третий метод доказательства существования решения дифференциальных уравнений — метод последовательных приближений '(см., например, [А10, с. 719; А8, с. 243]). Действительно, Коши употреблял этот метод уже в неоднократно упоминавшемся пражском мемуаре 1835 г., однако лишь как вспомогательное средство приближенного представления решения линейного дифференциального уравнения с частными производными первого порядка. Нет никаких данных, свидетельствующих об использовании им этого метода для доказательства существования решения дифференциальных уравнений. В мемуаре, представленном Парижской академии наук 17 июня 1842 г., он писал [БЗО, сер. 1, т. 6, с. 461]: «В действительности существование общих интегралов дифференциальных уравнений, содержащих одну-единственную независимую переменную, установлено теперь двумя различными методами, первый из которых я дал я моих лекциях в Политехнической школе, второй — в ме- 91
муаре, литографированном в 1835 г.». Двумя методами — ни о каком третьем Коши не упоминает. Поводом для разговора о наличии у него третьего метода доказательства существования решения послужил факт использования метода последовательных приближений наряду с первым и вторым во втором томе лекций по анализу Ф. Муаньо (1844). Однако (см. введение в [133, 394])г во-первых, статут этого метода у Муаньо совершенно иной, чем у двух первых: этот метод у него — еще один способ построения в виде ряда решения начальной задачи линейного дифференциального уравнения второго порядка, существование которого уже доказано двумя методами. Во-вторых, есть все основания предполагать [286], что этот метод заимствован Муаньо вовсе не из известных нам лекций Коши, а из работ профессора Политехнической школы (с 1833 г.) и Коллеж де Франс (с 1839 г.), ставшего в 1839 г. членом Парижской академии наук Ж. Лиувилля (1809—1882) (см. Кн. 1, с. 177), скорее всего, из его «Второго мемуара о разложении функций или частей функций в ряды, различные члены которых предполагаются удовлетворяющими одному и тому же дифференциальному уравнению второго порядка, содержащему переменный параметр» [266]. Метод последовательных приближений применяется Муаньо для построения решения начальной задачи для уравнения (Pyldx* = X (х) у. (6) Такое же уравнение рассматривает Лиувилль, который доказывает для него существование решения некоторой граничной задачи. Когда говорят о доказательстве существования решений граничной задачи для уравнения (6), данном Лиувиллем, то обыкновенно указывают (см., например, [28, с. 36—39]) на приведенную выше работу, а также на «Заметку об одном способе обобщения формулы Фурье» (1836) [264]' и более поздние работы (1838) [272], (1840) [275]. Однако наиболее раннее доказательство методом последовательных приближений существования решения некоторой граничной задачи (решения, удовлетворяющего условиям у (0) = Сг и у (Ь) = С2) для уравнения (6) мы находим в его «Мемуаре по аналитической теории тепла» [261], расширенный текст которого был представлен Парижской академии наук 16 августа 1830 г. Если и0 (х), иг (#), и2 (х), . . . . — решения бесконечной системы дифференциальных уравнений d2u0 п d2Ui v t ч d2u2 v i v тогда их сумма и = и0 + их + и2 — . . ., замечает Лиувилль, дает решение уравнения (6). Эту сумму он записывает в виде А {1 + J dx IX (х) dx + J dx J X (x) dx $ dx [ X (x) dx + .. .} + 0 0 0 0 0 0 xx xx xx + В [x + ^ dx ^xX (x) dx + J dx l X (x) dx J dx I xX (x)dx+...} 0 0 0 0 0 0 и доказывает сходимость обоих рядов, заключенных в фигурные скобки. Константы А и В определяются из граничных условий. Таким образом, начало разработки третьего метода доказательства, теорем существования решений в теории дифференциальных уравнений естественно связывать с именем Лиувилля, который, однако, не ставил; эту задачу в сколько-нибудь общей форме. 92
В дальнейшем метод последовательных приближений употреблялся целым рядом авторов для интегрирования линейных дифференциальных уравнений произвольного порядка (Каке (1864) [121], Фукс (1870—1871) [168] и др.). Четкую постановку проблемы существования решения начальной задачи для системы линейных уравнений и решение этой проблемы методом последовательных приближений мы находим у Дж. Пеано (1886-1887) [323], (1888) [324]. Во всей его общности метод последовательных приближений для исследования начальной задачи для дифференциальных уравнений был разработан Э. Пикаром (1890-1891) [331], (1891) [332], (1893) [333, т. 2], (1905) [333, 2-е изд., т. 2]. Пикар рассматривает систему (4), относительно которой предполагает, что функции /$ (х, у1ч у2, . . . , уп) (г = 1,2,... . . . , п) определены и непрерывны в окрестности точки (х0, уг, у2, . . . . . . , Уп): [х0 — а, х0 + a], [y°i — Ъ, у\ — Ъ] (i = 1, 2, . .., п) (а и Ь — положительные константы). По переменным у1ч у2, . . ., уп функции ^ удовлетворяют условиям Липшица. В этих предположениях Пикар строит последовательность z/i , . . ., Уп (т = 1, 2, . . .): -£- = Л (*. yt'\ ■ ■ •> Уп~г)) (i = 1, 2,..., /г; / = 1, 2, .. .)• Он доказывает, что эта последовательность равномерно сходится в интервале (х0 — б, х0 + б), где б = min (а, ЫМ) (М — наибольшее значение из максимумов модулей /^ в рассматриваемой области), и в пределе дает искомое решение (у± (х), у2 (х), . . ., уп (х)), удовлетворяющее заданным начальным данным Уг (Яо) = УУ (l = 1, 2, . . . ., П). Оценки для интервала (х0 — б, х0 ~- б) сходимости метода последовательных приближений улучшались рядом автором: в 1893 г. шведским математиком И. Бендиксоном (1861 —1936) [102] и преподавателем Казанского университета Д. М. Синцовым (1867—1946) [82], в 1894 г. Э. Лин- делёфом [258, 259], самим Пикаром (1896) [333, т. 3, с. 88], (1905) [333, 2-е изд., т. 2, с. 340]. По ходу изложения мы неоднократно упоминали результаты Пикара и ссылались на его знаменитый «Трактат по анализу» [333]. Второй том первого издания этого сочинения, появившийся в 1893 г., включает главу «Общие теоремы существования для дифференциальных уравнений». В ней три основных метода доказательства — метод Копти—Липшица, метод мажорант и метод последовательных приближений — изложены с достаточной общностью и примерно в той форме, в какой мы привыкли видеть их в современных руководствах по теории дифференциальных уравнений. Это изложение — итог активных исследований, проводимых после Коши целым рядом ученых, многие из которых упомянуты в настоящем очерке, в том числе и самого Пикара, вклад которого в этот вопрос был значительным. Оно определило также структуру замечательного обзора П. Пенлеве «Обыкновенные дифференциальные уравнения; существование решений», опубликованного в 1900 г. [318] и существенно дополненного во втором французском издании [322]. Этот обзор венчает исследования столетия 5. 5 Обзор П. Пенлеве [318, 322] содержит богатый материал и обширные библиографические данные по истории вопроса в XIX столетии. Многочисленные сведения читатель найдет также в книге [28]. 93
3. ИНТЕГРИРОВАНИЕ УРАВНЕНИЙ В КВАДРАТУРАХ 3.1. Лиувилль и уравнение Ряккатл Проинтегрировать уравнение в квадратурах — это значит представить его решение формулой, включающей элементарные функции и функции, входящие в уравнение, и использующей конечное число алгебраических операций и квадратур от этих функций. Проблема интегрирования дифференциальных уравнений в квадратурах, как уже говорилось в разделе 1, одна из центральных в XVIII в. Поиски ее решения продолжались в XIX в. На этом пути были достигнуты известные успехи, о которых мы еще будем говорить. Однако число уравнений, для которых эти поиски оказались успешными, было сравнительно невелико. Для многих уравнений, несмотря на усилия, предпринимаемые крупнейшими математиками, найти решение в квадратурах не удавалось. Одним из таких уравнений было уравнение, рассмотренное в 1723 г. итальянским математиком Дж. Риккати: dyldx + ay2 = Ъхш. (7) Для т = —4к/(2к ± 1) (к = 0, 1, 2, ... ) (8) и т = —2 («предельного случая», соответствующего к -> оо в (8)), оно было проинтегрировано еще в XVIII в. (Дж. Риккати, Иоганн I, Николай I, Николай II, Д. Бернулли (см. ИМ, т. 3, с. 370), а также [10, гл. 1, 4; 92]). Попытки проинтегрировать его для других значений т успеха не имели, и со временем родилось подозрение, что этого сделать вообще невозможно. Атмосфера 20—40-х годов XIX в. чрезвычайно благоприятствовала выдвижению гипотезы о неразрешимости задачи. В 20-е годы Н. X. Абелем была доказана неразрешимость в радикалах общего алгебраического уравнения пятой степени (см. Кн. 1, с. 56), в 30-е годы П. Ванцелем доказана невозможность решения циркулем и линейкой задач удвоения куба и трисекции угла. Абелем же было начато исследование вопроса об условиях интегрируемости в конечном виде алгебраических функций, с успехом продолженное в 30-е годы Лиувиллем и М. В. Остроградским. Естественным продолжением этих исследований стало изучение Ж. Лиувиллем проблемы интегрируемости уравнений Риккати. Центральным здесь явилось понятие явной конечной функции (une fonction finie explicite), рассмотренное им в работах 1837—1838 гг. [268, 271, 273]. Под такой функцией Лиувилль понимал алгебраическую функцию от х и функций вида In фх (х), е^х\ j %i (х) dx, где фх (х), г|>х (х), %i (х), в свою очередь, являются алгебраическими 6 функциями от х и функций вида In ф2 (х), е^х\ J %2 (х) dx и т. д. Предполагается,; что имеется такое конечное число п, что функции фд (х), г|)п (х), %п (х) будут алгебраическими функциями х. (В статьях 1837 и 1838 гг. Лиувилль, конструируя класс явных конечных функций, квадратуры не привлекал и добавил их лишь в работе 1839 г. Для таким образом определенных явных конечных функций, которые позднее стали называть элементарными трансцендентными, Лиувилль ввел в этих работах классификацию по родам, на которой мы здесь останавливаться не будем, отсылая читателя к специальной литературе [10].) 6 Лиувилль рассматривает алгебраическую функцию у аргумента х как явную функцию у = со (х) вне зависимости от того, представимо у через х в радикалах или нет. 94
Ж. ЛИУВИЛЛЬ В 1841 г. выходит в свет работа Лиувилля «Новые замечания об уравнении Риккати» [276], в которой и была показана невозможность интегрирования этого уравнения в классе явных конечных функций. Рядом простых замен Лиувилль приводит уравнение (7) к виду d2uldz2 = (А + Biz2) и, (9) где "=(-=№■ «=-(-Дт№+*). В случае т = —2 уравнение (7) интегрируется в конечном виде, в случаях т = —4, 0 в таком виде интегрируется уравнение (9), а следовательно, и (7). Поэтому можно исключить их пока из рассмотрения, считая А и В конечными, отличными от нуля. Итак, вопрос об интегрируемости в конечном виде уравнения (7) свелся к решению аналогичной задачи для уравнения (9). Лиувилль доказывает 7, что уравнение (9) не имеет алгебраических интегралов, отличных от и = 0. Если в уравнении (9) произвести замену и = e*tdz, то оно перейдет в уравнение dt/dz + t2 = А + Biz2. (10) 7 Это его доказательство содержит ошибку, на которую обратил внимание А. Дже- нокки (1866) [177] (см. также [178]). Исправленный вариант доказательства см. в [10, с. 133-134]. 95
Учитывая, что уравнение (9) не имеет алгебраических интегралов, кроме и = О, Лпувилль доказывает, что уравнение (10) должно обладать алгебраическим и даже, более того, рациональным решением. Такое решение может быть представлено в форме n=-l s,qK Q Ап, BSQ — константы, Z, т, s, q — натуральные числа, aq ф 0. Подставляя это выражение в (10), Лиувилль приводит его к виду ! + YA-±+y—L- —- r z / 1 z — а я q где (3 — корень уравнения (3((3 + 1) = В. Соответствующее решение уравнения (9) приобретает тогда форму где Y — полином от z: Y = Ц (z — aq). а q Если подставлять и в уравнение (9), то получим уравнение г^_2(|3 + 2/Л)-^ + 2|3/ЛУ = 0. Можно показать, что необходимым и достаточным условием существования полинома Y степени к, удовлетворяющего этому уравнению, будет § — к, т. е. равенство (3 натуральному числу или нулю. Следовательно, рациональные интегралы уравнения (10) существуют тогда и только тогда, когда В представимо в виде В — к (к + 1), где к — целое положительное число или нуль. Так как В = — [ —цгг} "Т" ("Т~ ~^ i' то это дает для т значения щ = —4А/(2А: 4- 1), т2 = (—4Л - 4) / (2к + 1), Положив к = к1 — 1, где к\ — натуральное число, имеем т2 = —4 kj /(2кг — 1). Учитывая, что при кх = 0 получаем т2 — 0 (а в этом случае уравнение (7) интегрируется в конечном виде), можно сформулировать окончательный вывод в следующей форме: Для интегрируемости в конечном виде уравнения (7) необходимо и достаточно, чтобы т = _4А7(2А: ± 1) (8) {к — целое положительное число или нуль) или т = —2 (соответствует А--> оо в (8)). Показав принципиальную невозможность интегрирования в квадратурах некоторых дифференциальных уравнений, Лиувилль открыл новую обширную область исследований, развившихся в дальнейшем в двух направлениях. Первое направление — изучение возможной формы интеграла, выраженного в квадратурах (множество допустимых при этом функций и операций у разных авторов варьировалось), и в случае существования интеграла данной формы отыскание метода его нахождения. Начало этому направлению положил сам Лиувилль в упоминавшейся работе [273] 96
1839 г., где он изучал вопрос о форме интегралов уравнения -^ =. (а0хп + ахх71'1 + . . . + ап.гх + ап) у, выражаемых «конечной явной функцией» от х. Отметим здесь исследования немецкого математика Л. Кёнигсбергера (1837—1921), результаты которого были собраны в его книге [222], киевского профессора, впоследствии члена-корреспондента (с 1884 г.) Петербургской академии наук В. П. Ермакова (1845 — 1922) [31] 8, воспитанника Парижской политехнической школы казанского математика В. П. Максимовича (1850—1889) [56, 291] (об ошибочности некоторых его результатов см. [61]), профессора Гейдельбергского университета А. Майера (1839—1908) [292], профессора Варшавского университета (впоследствии университета Ростова-на-Дону) Д. Д. Мордухай-Болтовского (1876—1952), книга которого [61], вышедшая в 1910 г., содержит интересный исторический обзор. Отметим также работы по построению своеобразных аналогов теории Галуа для дифференциальных уравнений Э. Пикара, Э. Вессио, Ж. Драша. К этим работам, основанным на теории групп Ли, мы вскоре вернемся. Упомянем также целую ветвь исследований по алгебраическому интегрированию линейных дифференциальных уравнений (обширную библиографию по этому вопросу см. [80]): работы Л. Фукса, Г. Шварца, Ф. Клейна. Сюда относятся также исследования ряда русских математиков. Особое место в их работах заняла задача нахождения дробно-рациональных интегралов линейных дифференциальных уравнений коэффициенты которых Р\ (i — 0, 1, 2, . . . ., п) и Q — рациональные функции от х. Еще в 30-е годы Ж. Лиувилль [262] предложил метод решения этой задачи, который для п > 2 наталкивался на серьезные трудности вычислительного характера. Член Петербургской академии наук В. Г. Имшенецкий (1832—1892) разработал (1887) [36], (1888) [37], (1891) [38] другой метод решения этой задачи при помощи некоторого интегрирующего множителя. Этот метод, не лишенный ряда недостатков, вызвал ожесточенную полемику о сравнительных достоинствах обоих методов, в которой приняли участие А. А. Марков, А. Н. Коркин, Н. В. Бугаев, Н. М. Гюнтер и др. В результате оба метода получили значительное развитие (по этому поводу см. [83], а также [А6, с. 433; 44]). Второе направление исследований в области, открытой работой Лиу- вилля [276], — изучение тех специальных методов, которыми удалось проинтегрировать отдельные типы уравнений, выявление общих принципов, на которых они основываются, наконец, создание на этих принципах общей теории интегрирования, которая позволила бы обозреть мложество уравнений, интегрируемых в квадратурах. Это направление получило развитие в 70—80-е годы в работах выдающегося норвежского математика С. Ли. Однако прежде чем переходить к изложению его результатов, остановимся на некоторых конкретных методах интегрирования дифференциальных уравнений в квадратурах, разработанных в XIX в. 8 Вопросам интегрирования дифференциальных уравнений Ермаков посвятил целый ряд работ (см. [47, 28]). Его результаты не потеряли актуальности и поныне. Так, сравнительно недавно было обращено внимание [8] на его способ интегрирования уравнения у" + а0 (х) у = ф (х) *Г3. 4 Математика XIX века 97
3.2. Новые классы интегрируемых уравнений На протяжении XIX в. интерес к поиску методов интегрирования дифференциальных уравнений в квадратурах неуклонно понижался. Основными причинами этому послужили открывшаяся принципиальная невозможность такого интегрирования даже для сравнительно простых уравнений (таких, как уравнение Риккати) и успешная разработка методов, дававших решение уравнений в более широких классах функций. Тем не менее XIX век оставил трудно обозримое множество методов интегрирования в квадратурах отдельных уравнений и их классов. Мы остановимся здесь лишь на некоторых методах интегрирования. Уравнение Якоби В работе [212], опубликованной в 1842 г., К. Г. Якоби рассмотрел уравнение (А0 + Ахх + A2y)(xdy — ydx) — (В0 + Вхх + В2у) dy + + (С0 + Схх + С2у) dx = О, названное впоследствии его именем. Он свел его интегрирование к решению кубического уравнения Д. — z Ai А2 1 Во Bx~z В2 =0. Со С\ С2 — z \ Если Я0, Ях, Я2 — действительные различные корни этого уравнения, то искомый общий интеграл представляется в форме (а0 + (V + УоУ)^1 (ai + Pi* + Yi*/)V^° К + IV -г ЪУ)К~>Л = const, где 0С| = В±С2 — В2С± — (В± + С2) ?ц + Xif $i = C1A2 — C2A1 + AiXi, Yi = AiB2 - А2Вг + A2X{ (i = 0, 1, 2). Нетрудно видеть, что соотношения оц + [V + у^у = 0 (i = 1, 2, 3) являются частными интегралами этого уравнения. Оригинальный прием исследования уравнения Якоби был предложен впоследствии Д. Ф. Егоровым (см. [89, с. 41—44]). Нахождение общего интеграла с помощью известных частных его интегралов вырастает в XIX в. в целое направление исследований. Исследования Миндинга Отправляясь от результатов Эйлера и Якоби, впоследствии почетный член Петербургской академии наук, профессор Дерптского университета Фердинанд Миндинг (1806 — 1885) в цикле работ, опубликованных в 1845— 1866 гг., изучает вопрос о нахождении интегрирующего множителя уравнения Mdx + Ndy = 0 (М, N — многочлены от х, у) по его частным решениям. В вышедших в 1862 г. «Исследованиях об интегрировании дифференциальных уравнений первого порядка с двумя переменными» [59] (немец- 98
кий, несколько расширенный вариант опубликован в 1863 г.), высоко оцененных М. В. Остроградским и удостоенных Демидовской премии Петербургской академии наук (подробнее см. [14, гл. 8]), Миндинг, в частности, доказал [59, с. 12]: «Если М и N — целые многочленыпо хи г/, не превышающие (по у) степени п, такого свойства, что уравнение Mdx + Ndy = 0 имеет п ~ I линейных решений вида ух = ахх + |3Х и т. д., если у них все а различны и если после составления произведения W = (у — Ух)(у — У2) • • • (у — Уп-i) ни один из производных многочленов %г [ = (У1 — У*) (У1 ~ Уз) . . . (У1 — Уп+l)], V'v* • • м ^Уп+1 не делится на квадрат, т. е. на выражение вида (х + б)2, то это произведение есть интегрирующий делитель 9 Mdx + Ndy = 0, т. е. мы имеем Mdx + Ndy _п d(y-yi) , ^ d(y-y2) , ^(У-Уп+1) . ТО ~gi y-yi + *2 y-y, +---+^i y-y?l+1 »' где (717 #2, . . . ., #n+i — известные постоянные. Эти исследования Миндинга получили развитие в работах русских математиков (см. [14, гл. 9]) — преподавателя (позже профессора) Московского технического училища, впоследствии члена-корреспондента Петербургской академии наук А. В. Летникова (1837—1888) (1866) [48] и др. Особое место в их ряду занимают результаты профессора Петербургского университета, старшего из учеников Чебышева, А. Н. Коркина (1896) [224, 225], (1903-1904) [43] и др. (подробнее см. [66]). Однако эти работы Миндинга прошли мимо внимания западных математиков. Не обратил на них внимания и Гастон Дарбу, опубликовавший в 1878 г. работу, в которой рассмотрел вопрос о нахождении общего интеграла уравнения с помощью известных частных интегралов. Уравнение Дарбу Гастон Дарбу (1842—1917) окончил в 1864 г. Парижскую нормальную школу. Преподавал в Коллеж де Франс, в Нормальной школе и в Сорбонне. С 1884 г.— член Парижской академии наук. Основные результаты относятся к дифференциальной геометрии, математическому анализу и аналитической механике. Широко известен его четырехтомный труд «Лекции по общей теории поверхностей» (1887 —1896). В «Мемуаре об алгебраических дифференциальных уравнениях первого порядка и первой степени» [148], опубликованном в 1878 г., Дарбу рассматривает уравнение — Ldy ~ Mdx -J- N (xdy — ydx) = 0 (где L, М, N — полиномы от х, г/), названное впоследствии его именем. Дарбу рассматривает это уравнение в однородных координатах хх, ух, zx (х = хгЫх, у = yjz^)\ L {yxdzx — zxdyx) -\- М (zxdxx — xxdzx) -j- N (xxdyx — y\dxx) — 0. Частным случаем уравнения Дарбу является уравнение Якоби. Дарбу доказывает следующие два утверждения. Первое представляет собой обобщение рассмотренного выше результата Якоби. Если известны т (т + 1)/2 + 2 = q частных решения предложенного дифференциального уравнения (т — максимальная степень многочленов 9 Т. е. НУ (у) — интегрирующий множитель. 4* 99
L, M, N) иг (x, у) = О, и2 (х, у) = 0, . . ., uq (х< у) = 0, таких, что Щ (xi У) — неприводимые полиномы от х, у, то общий его интеграл находится без квадратур в виде (а1ч а2, . . ., ocq — постоянные). Второе утверждение: Если известно т (т -\- 1)/2 — i = q — 1 частных решений предложенного уравнения их (х, у) = О, и2 (х, у) = 0, . . . • . . , г/д_1 (х, у) = О, где щ (х, у) — неприводимые полиномы от х, у, то всегда можно найти интегрирующий множитель в виде GCi а-> аа—1 jl = их *Ы2 2 . . . Wg_! (а1? а2, . . ., ад_1 — постоянные). Метод последнего множителя Гкоби Этот метод мы находим в 8—10-й лекциях Якоби по динамике [215], прочитанных в 1842/43 г. в Кёнигсбергском университете и изданных в 1866 г. А. Клебшем, а также в работе [213] 1844—1845 гг. Якоби рассматривает систему dx : dxx: . . . : dxn = X : Хг\ . . . :Хп, (ll) где X, Х\ (i = 1, 2, . . ., п) — функции от х, хх, . . ., хп. Каждый интеграл такой системы / V*^» x\i x2i • • •» хп) ~ ^ удовлетворяет уравнению V , у df J_ V 5- ~d7 +Aiur + A2y*2 « ••• ■ ^»<ц *& + Ъ& + х*1: + --- + Хп& = ь (12> п Пусть /i (.г, ^, х2, . . ., #п) = С\ (i = 1, 2, . . ., п) — п независимых интегралов системы (11); тогда функциональный определитель («якобиан», как стали говорить впоследствии) " (/» J li J 2» • • ч ]п)'и \Xi X\i ХЦ • • -1 Хп) будет обращаться в нуль для любого интеграла / (х, хг, х± . . ., хп) = С, Разлагая этот приравненный нулю определитель по элементам первой строки, Якоби получает ^ + ^^ + •■■ + ^ = 0. (13) Сравнивая (12) и (13), он выводит, что существует функция М (х, хг^ x2i • • -1 xn)i такая, что А = MX, Ai = MXi (i = 1, 2, . . ., n). Впоследствии эта функция получила название множителя Якоби. Этот множитель является обобщением интегрирующего множителя Эйлера для уравнения X (х, у) dx -\- Y (х, у) dy = 0 (см. ИМ, т. 3, с. 375—376). Для этого множителя Якоби, используя развитую им теорию функциональных определителей, установил ряд свойств. В частности, он вывел для него уравнение a (MX) д(МХг) | д(мхп) ^q (Н) дх дхг ~ ' дх v ' 100
Из этого уравнения, как легко видеть, вытекает, что отношение двух множителей дает интеграл системы (11). В 14-й лекции Якоби доказывает, что если известны п — 1 интеграл системы (11) и какой-либо интеграл уравнения (14) (т. е. множитель Якоби), то недостающий п-и интеграл определяется квадратурой. Это и дало Якоби основание назвать свой множитель «последним». Теории «последнего множителя» Якоби дал многочисленные приложения в динамике. В частности, только что сформулированное предложение оказалось особо удобным в теории интегрирования уравнений движения в форме Гамильтона (подробнее см. [А4, гл. 1; 391]) ЧГ^-1^' ^Г = -е^ (а=1,2,...,/п) (15) (Н — функция (h,..., gm, /?!,..., рт). Уравнение (14) имеет в этом случае вид £[*(-*£)+•£("£) = 0 и обладает очевидным решением М = 1. Следовательно, интегрирование системы (13) сводится к нахождению (2т — 2) интегралов, (2т — 1)-й интеграл находится квадратурой. Дальнейшее развитие метод «последнего множителя» получил в работах Ли, который дал (1874) [250, 251] ему новое истолкование в связи со своей теорией инфинитезимальных преобразований (см. подраздел 3.4). У равнение Пфаффа Рассматривая в первой главе первого раздела 3-го тома «Интегрального исчисления» уравнение (см. ИМ, т. 3, с. 430) Р (х, у, z) dx + Q (х, г/, z) dy + R (х, у, z) dz = 0, (16) Эйлер вывел условие £-ж) + <>(#-т) + л(ж-&Н- <»> Его выполнение он считал необходимым, чтобы уравнение было «реальным», т. е. существовал бы его интеграл F (х, у, z) = С: dF (х, у, z) = [I (х, г/, z) (Pdx + Qdy + Rdz). Уравнение (16), для которого условие (17) не выполняется, согласно Эйлеру, «бессмысленное и ничего не выражает, и никогда решение какой-либо задачи не может привести к такому уравнению» [95, т. 3 с. 7]. На ограниченность такой трактовки обратил внимание (см. ИМ, т. Зг с. 440) Г. Монж. Он показал (1784(87)) [297, с. 535], что и при невыполнении условий (17) это уравнение не бессмысленно, но обладает одномерными интегральными многообразиями, заданными соотношениями F1 (х, у, z) = С1ч F2 (х, у, z) = С2. Таким образом, в зависимости от выполнения или невыполнения условия (17) интегральный эквивалент уравнения (16) состоит из одного или двух уравнений Ft (х, у, z) = Сх. Вообще, как показал Монж, интегральный эквивалент уравнения в полных дифференциалах с любым числом 101
переменных n 51 Аг(хих2, . . .,xn)dx{ = 0 (18) i=l •состоит из нескольких соотношений Ft (хг, х2, . . ., хп) = Ct (i = 1, 2, . . . . . ., к), число к которых меньше п — 1. Задача определения интегральных эквивалентов Ft (хг, х2, . . ., хп) = ~ Ct (i = 1, 2, . . ., к) уравнения (18) с минимальным возможным числом к получила впоследствии наименование проблемы Пфаффа (а само уравнение (18) стали называть уравнением Пфаффа) по имени И. Ф. Пфаффа, внесшего выдающийся вклад в ее решение. Иоганн Фридрих Пфафф родился 22 декабря 1765 г. в Штуттгарте, столице герцогства Вюртемберг, в семье крупного правительственного чиновника. Учился в Гёттингене и Берлине. Среди его учителей — математик А. Г. Кестнер, физик Г. К. Лихтенберг, автор известных «Афоризмов», астроном И. Э. Боде. С 1788 г. — профессор математики в университете в Хельмштедте, где среди его учеников — К. Ф. Гаусс. С 1810 г. — профессор математики в университете в Галле, где с 1812 г. руководил также обсерваторией. Умер Пфафф 21 апреля 1825 г. в Галле. Основные результаты Пфаффа относятся к математическому анализу, к комбинаторному анализу (он примыкал к школе К. Ф. Гинденбурга (см. ИМ, т. 3, с. 99—100)), проективной теории конических сечений. Главное достижение Пфаффа, прославившее его имя,— представленный в 1815 г. Берлинской академии наук мемуар «Общий метод интегрирования дифференциальных уравнений с частными производными...» [327] (нем. пер. [328]). В этом мемуаре решалась не поддававшаяся до того усилиям математиков задача интегрирования уравнения Рт = F {хъ х2, . . ., Хт, Z, рг, р2, . . ., рт^) (19) (Pi = dzldxu i = 1, 2, . . ., т) для т > 2. Пфафф сводил ее к задаче интегрирования уравнения в полных дифференциалах 771—1 dz — S Pi dxi — F (хъ x2, . . ., xm, z, pi, p2, . . ., Pm-i) dxm = 0 1=1 с 2m переменными, а последнюю — к общей задаче интегрирования уравнения (18). Мы не будем здесь касаться той стороны исследования Пфаффа, которая относится к интегрированию уравнения (19), отсылая читателя к одной из последующих книг данного труда, к разделу, посвященному уравнениям с частными производными. Сосредоточимся на результатах для уравнения (18). Эти результаты, рассматривавшиеся Пфаффом как вспомогательные, не сформулированы им явно, хотя их и возможно вычитать из его работы. Это сделал впервые Гаусс, давший в том же 1815 г. чрезвычайно ясное их изложение [175], которому мы и будем следовать. Уравнение (18) заменой Хх = xi (хп, щ, и2, . .., H„_i), х2 = х2 (хп, щ, и2, . . ., w^i), (20) хп-\ z==z 2*71-1 \xni иЪ Ut2.t • • •» ип-\)l хп = хп 102
переводится в п—1 S #г (Хп, Ult И2, • • -, Wn-0 d^j + /?n (#n, Mi, U2, . . ., K„_x) ЙДГ,г = 0. В случае четного n возможно, как утверждает Пфафф и вслед за ним Гаусс (полное доказательство этого утверждения дал в 1827 г. К. Г. Якоби в работе [211]), найти такую замену (20), что Вп = 0 и Bt = MUi (i = 1, 2, . . ., п — 1), где М — функция хп, иг, и2, . . ., ип-г, а С/г- — функции только иъ и2, . . . . . . , гг^-i, но не хп. В результате (18) приведется тогда к уравнению п—г У, £/< (их, и2>. . ., Kn-i) dMt = 0, содержащему одной переменной меньше. Такое преобразование Гаусс обозначает цифрой I. Если п — нечетное, то такое преобразование, вообще говоря, невозможно (доказательство см. в работе Якоби 1827 г. [211], речь о которой пойдет ниже). Пфафф производит тогда преобразование I над формой п—г У) А{ (хг, Хо, . . ., хп) dxi, i=l рассматривая хп как константу. Форма приводится к виду п—2 М S Bi (иг, и2, . . ., ип_2, хп) du{, i=i где М — функция иг, и2, . . ., ггп_-, #n-i, #п> а (18) — к уравнению п—2 М 51 #* (ai, гг2,. . ., ип_2, хп) du{ + Ап (хг, )йяп = 0. (21) i=l Это преобразование Гаусс обозначил цифрой II. Его можно вновь приме- 72—2 нить к форме J, В{(иг, и2, . . ., un-2,xn)duh в результате (21) преобразуется i=l в уравнение, содержащее одним дифференциалом меньше. Этот процесс можно продолжить до тех пор, пока не получим уравнение J Didui = 0f (22) 2=1 где р = (п + i)l2,Di, vt — функции хг, х2, . . ., хп. Такое преобразование уравнения (18) для нечетного п в уравнение (22) Гаусс обозначает цифрой. III. В случае четного п к уравнению (18) применяется преобразование I, а затем III. В итоге (18) принимает вид (22) с р = nil. Такое преобразование Гаусс обозначает цифрой IV. Таким образом, уравнение (18) всегда можно привести (преобразованием III для нечетных п и преобразованием IV для четных) к уравнению (22), где р = (п + 1)/2 или п/2 соответственно. Отсюда легко заключите что интегральный эквивалент уравнения (18) всегда может быть задан системой уравнений vt (х1ч х2, . . ., хп) = Сх (Ct — константы), число которых не больше р. 103
Изложение работы Пфаффа, предложенное Гауссом в малочитаемом математиками издании, не получило широкой известности среди современных ему ученых. По-видимому, не знал о нем и Якоби, давший свое изложение метода в работе «О методе Пфаффа интегрирования обыкновенного дифференциального уравнения между 2п переменными через п уравнений» (1827) [211], в котором заполнил пробелы в рассуждениях Пфаффа. Некоторые усовершенствования в рассуждения Якоби внес А. Кэли (1860) 1134]. Дальнейшее развитие теории уравнения Пфаффа, превратившейся в важный раздел анализа и получившей многочисленные применения далеко за рамками теории дифференциальных уравнений, связано с именами Л. Натани (1861) [303], работавшего тогда профессором Политехнической школы в Карлсруэ А. Клебша (1862) [138], Г. Грассмана (второе издание знаменитого «Учения о протяжении» (1862) [182]), С. Ли (1877) [252], исследовавшего проблему с точки зрения созданной им теории контактных преобразований (см. подраздел 3.3), и Г. Фробениуса ^1877) [165], состоявшего в те годы профессором Цюрихского политехникума. (Изложение их результатов, а также очерк развития теории уравнения Пфаффа в XIX в. см. в [161, т. 1], также [391, 78, 21].) 3.3. Софус Ли и проблема интегрируемости дифференциальных уравнений в квадратурах Изучить принципы, на которых основываются известные методы интегрирования дифференциальных уравнений в квадратурах, и разработать на основе этих принципов своего рода аналог теории Галуа — общую теорию интегрирования уравнений в квадратурах — такую цель поставил перед собой в 70-е годы молодой норвежский математик Софус Ли. Ли родился в 1842 г. в деревне Эйд на берегу Нордфиорда, приблизительно в двухстах километрах к северу от Бергена в семье пастора. В 1859—1865 гг. учился в университете в Христиании (ныне Осло). Знакомство с работами Ж. Понселе и Ю. Плюккера пробудило у него интерес к геометрии. Осенью 1869 г. Ли отправился в Германию, где подружился с Ф. Клейном. Лето 1870 г. молодые друзья провели в Париже, где познакомились с рядом ведущих математиков Франции — Г. Дарбу, К. Жор- даном и др. Месяцы, проведенные в Париже, стали определяющими в творческой биографии Ли: здесь он познакомился с идеями теории групп и теорией Галуа (как раз в том году был опубликован «Трактат о подстановках и алгебраических уравнениях» К. Жордана), здесь зародились многие из основных его идей в геометрии, теории непрерывных групп (или теории групп Ли, как ее принято называть сегодня) и теории дифференциальных уравнений, обыкновенных и с частными производными. В 1872—1886 гг. С. Ли — профессор университета в Христиании. Он пишет многочисленные работы по геометрии, теории контактных преобразований, непрерывным группам и теории дифференциальных уравнений. В 1884 г. к нему приезжает из Германии молодой математик Ф. Энгель (1861—1941), в сотрудничестве с которым Ли выпускает главный труд своей жизни — трехтомную «Теорию групп преобразований» (1888—1893) [2571. С 1886 г. Ли — профессор Лейпцигского университета. В этот последний период своей жизни он разворачивает активную научную и педагогическую деятельность. Сильное творческое и физическое перенапряжение приводит его в 1889 г. к психическому заболеванию, сказавшемуся в дальнейшем на общем состоянии его здоровья. В октябре 1898 г. совершенно больной Ли вернулся в Христианию, где скончался в феврале 1899 г. от анемии мозга [75]. 104
с. ли Ли исходил из того, что если дифференциальное уравнение f(tjj dy d2y d3y d7ly)—r) m\> инвариантно относительно некоторой r-параметрической группы преобразований х' = f {х, у, аг, а2, . . ., аР), у' = ф (х, у, ах, а2, . . ., аг), (24> или, как еще говорят, допускает группу преобразований (24), т. е. пришлю- бом преобразовании из этой группы переходит в уравнение f(x' и' W- d^~ ^JL)— О то семейство интегральных кривых уравнения (23) также инвариантно относительно этой группы. «Я заметил,— писал Ли в 1888 г. в предисловии к первому тому «Теории групп преобразований» [257, т. 1, с. IV—V],— что большинство обыкновенных дифференциальных уравнений, интегрирование которых удается старыми интеграционными методами, при определенных преобразованиях... остаются инвариантными, и что эти интеграционные методы состоят в использовании этого свойства для соответствующего дифференциального уравнения... После того как я таким образом представил с общей точки зрения ряд старых методов интегрирования, я поставил перед собой естественную задачу — развить общую теорию интегрирования для всех обыкновенных дифференциальных уравнений, допускающих конечные или ин- финитезимальные преобразования». 10S
Так, однородное уравнение dyldx = F (ylx) инвариантно относительно однопараметрической группы преобразований подобия с центром в начале координат: х = ах, у' = ау. Если ввести но- вые переменные и = ylx, £ = In х, то группа преобразований примет вид и' = и, 5' — 5 + с (с = In а). Это группа переносов, параллельных оси £. Преобразованное дифференциальное уравнение (в переменных и и £) будет инвариантно относительно группы этих переносов и не будет содержать явно £. Уравнение тогда примет вид duld\ = F (и) — и — в таком уравнении разделяются переменные, следовательно, оно интегрируется в квадратурах. Рассмотрим теперь уравнение (23). Пусть оно инвариантно относительно однопараметрической группы преобразований х = / (х, у, а), у' = ф (х, у, а). (25) Можно показать, что возможна такая замена переменных и параметра и = П1 (хч у), v = П2 (х, у), t = U (а), что уравнение группы запишется в виде III (х, у') = Пх (х, у), П2 (х , у') = П2 (х, у) + t. Говорят, что группа (25) подобна группе параллельных переносов и = и, V = V + t. Пусть в новых переменных уравнение (23) запишется в виде °(-.».-£---£)-»- Это уравнение будет инвариантно относительно полученной группы параллельных переносов, т. е. будет переходить в себя при преобразовании и = и, v = v + t при любом t. А такое может случиться тогда и только тогда, когда это уравнение не содержит явно v. Если п = 1, то уравнение примет вид Ф (и, dvldu) = 0. Последнее уравнение в окрестности точки, вообще говоря, можно привести к виду dvldu = Фх (и), т. е. к уравнению с разделяющимися пер еменными, которое интегрируется в квадратурах. Если же п > 1, то можно понизить порядок уравнения на единицу, положив dvldu = z и рассматривая уравнение относительно новой переменной z. Этот результат и аналогичные рассуждения (проведенные в терминах «инфинитезимальных преобразований») можно найти в опубликованных в 1891 г. «Лекциях по теории дифференциальных уравнений с известными инфинитезимальными преобразованиями» [256], подготовленных С. Ли в сотрудничестве со своим учеником Г. Шефферсом (1866—1945) (см. [256, гл. 16, § 6, а также с. 386—387]). Различные имевшиеся к тому времени методы интегрирования уравнений в квадратурах, многообразие которых на первый взгляд казалось простым собранием аналитических приемов, оказались обозримыми с единых позиций группового подхода. С этих позиций получил свое истолкование и метод интегрирующего множителя, и метод последнего множителя К. Г. Якоби (см. подраздел 3.2). В частности, в работе «К теории интегри- 106
рующего множителя» (1875) [250] было доказано, что, для того чтобы дифференциальное уравнение X (х, у) dy — Y (х, у) dx = 0 допускало одно- параметрическую группу преобразований, инфинитезимальное преобразование которой ldf/дх + f\djldy (или, короче, чтобы это уравнение допускало инфинитезимальное преобразование \jdjldx + r\df/dy), необходимо и достаточно, чтобы l/(Xr\ — YS) было интегрирующим множителем для Xdy — Ydx (см. также [256, с. 101]). Еще в небольшой заметке «О группах преобразований» [249], представленной в 1874 г. Гёттингенскому научному обществу, давая описание всех конечных непрерывных групп преобразований на плоскости, С. Ли указал, что это описание должно послужить основой классификации и теории интегрирования обыкновенных дифференциальных уравнений, допускающих такие группы. Эскиз такой теории появился в маленькой заметке 1882 г. «Об обыкновенных дифференциальных уравнениях, которые допускают группу преобразований» [253]. Начиная со следующего года начали выходить мемуары под общим названием «Классификация и интегрирование обыкновенных дифференциальных уравнений между х, г/, которые допускают группу преобразований» (1883—1884) [254]. Ли рассматривает конечные непрерывные группы точечных преобразований на плоскости, редуцированные к некоторой определенной форме, называемой канонической. Каждый класс таких преобразований характеризуется определенным набором «инфинитезимальных преобразований» Bd = U (х, у) -g- + % (х, у) -|£- (i = 1, 2,. . ., г; г — число параметров группы). Для каждого класса С. Ли дает описание множества всех обыкновенных дифференциальных уравнений (23), допускающих такие инфинитезималь- ные преобразования, а также методов интегрирования таких уравнений. В результате получается описание всех уравнений, допускающих конечные непрерывные группы преобразований, а также методов их интегрирования. Если теперь нам задано произвольное уравнение (23), то прежде всего нужно определить группу преобразований, которую оно допускает (схему рассуждений, позволяющих это сделать, Ли приводит в § 2 части III). Затем необходимо привести эту группу к каноническому виду, что, кроме операций дифференцирования и исключения, может потребовать интегрирования дифференциального уравнения первого порядка. Только после этого определится место данного уравнения в классификации Ли, а следовательно, и метод интегрирования этого уравнения. Практических выгод приведенная схема, однако, не дает, ибо ее реализация представляет задачу, не уступающую по трудности исходной. Эти работы, содержащие данную классификацию, в которой он сам видел первый шаг к построению теории Галуа для обыкновенных дифференциальных уравнений, и послужили фундаментом для всех дальнейших изысканий в этом направлении. Многие из введенных им понятий оказались центральными в будущих исследованиях. Одно из них — понятие «разрешимой» или «интегрируемой» группы, появившееся в работе [251], опубликованной в 1875 г. Сам термин «интегрируемая группа» мы находим впервые в работе [255], опубликованной в 1888 г.: г-параметрическая непрерывная группа преобразований G называется интегрируемой, если она содержит инвариантную (г — 1)-параметрическую подгруппу Gt, которая, в свою очередь, содержит^ — 2)-параметрическуюинвариантную подгруппу G2 и т. д.: G Z) 6?i ID G2 Z) . . . Z) Gs, где Gs — однопараметрическая 107
инвариантная подгруппа G,_i. Название «интегрируемая» оправдывается теоремой, представляющей собой один из наиболее известных результатов Ли (см. [257, т. 3, с. 708—709]). Речь здесь идет об интегрировании линейного однородного уравнения с частными производными первого порядка: V=l Задача интегрирования этого уравнения, как известно, эквивалентна про- ^блeмe интегрирования системы обыкновенных уравнений dxi dxr+i «1(^1,...,^.^) "" ar+1(*i, • • ., xr+1) Теорема Ли состоит в следующем: если уравнение Af = 0 допускает г- параметрическую разрешимую группу G, инфинитезимальные преобразования которой A'x/, X2f, . . ., Xrf вместе с оператором Af образуют независимую систему, независимую в том смысле, что не существует никакого тождества вида г (p(*i, . . .,хГгЛ) Af + S <Pif(zi,...,xr+1)X1(f = 0, если только коэффициенты ср (хг, . . ., #г41), фх {хъ . . ., xr+i), . . . . . ., ф,.(^1, . . ., x,m-i) отличны от нуля — такого рода независимость часто называют «линейной несвязанностью» (см. [94, с. 90]), то интегрирование этого уравнения (и соответствующей ему системы обыкновенных уравнений) приводится к квадратурам. К сожалению, системы дифференциальных уравнений, как правило, не допускают никакой нетривиальной (т. е. отличной от тождественной) группы преобразований. Поэтому построение содержательной теории на пути, указанном С. Ли, оказалось возможным лишь для некоторых типов уравнений. К ним относятся, например, линейные уравнения, успехи в изучении которых в конце XIX в. связаны с именами Э. Пикара и воспитанника Парижской нормальной школы (впоследствии ее директора) и с 1943 г. члена Французской академии наук Эрнеста Вессио (1865— 1952). Рассматривается уравнение ^ + M0^ + -.. + W*)-£- + M*)* = Q. (26) Пусть хх, х2,. • •' хп — фундаментальная система его интегралов. Общая линейная однородная группа преобразований с тг2 параметрами п x'i^^ciijXj (;=1,...,тг) (27) 3=1 играет тогда ту же роль, какую в теории разрешимости в радикалах алгебраических уравнений тг-й степени исполняет группа подстановок /г-й степени. Исследуются рациональные функции хг, . . ., хп, их производных по t и переменной £, среди которых выделяют класс функций, инвариантных относительно преобразований (27) (далее коротко — инвариантных функций). Инвариантные функции играют в теории Пикара—-Вессио ту же роль, что симметрические функции корней в теории Га- луа. Простейшими примерами инвариантных функций служат функции Хъ Х2, . . ., Хп, которые в то же время занимают особое место среди всех ин- 108
вариантных функций: через них, их производные и t рационально выражается, согласно теореме Аппеля [98], всякая инвариантная функция. Каждому уравнению (26) ставится в соответствие некоторая конечная непрерывная группа линейных однородных преобразований, так называемая группа линейного уравнения (26), соответствующая группе подстановок алгебраического уравнения. Как гласит установленная в 1892 г. Э. Вессио теорема [387]: для того чтобы уравнение (26) было интегрируемым в квадратурах, необходимо и достаточно, чтобы группа преобразований этого уравнения была бы интегрируемой. Отсюда сразу следовало, что общее линейное уравнение (26) порядка п не интегрируется в квадратурах: его группа преобразований — общая линейная однородная группа с п2 параметрами; эта группа содержит только одну инвариантную подгруппу с (я2 — 1) параметрами, причем эта подгруппа уже не имеет инвариантных подгрупп [257, т. 1, гл. 26—27]. Изложение теории Пикара—Вессио можно найти во втором издании третьего тома известного «Трактата по анализу» Э. Пикара (1908) [333, т. 3]. Дальнейшие успехи в развитии аналога теории Галуа для дифференциальных уравнений связаны также с именем воспитанника Парижской нормальной школы, члена (с 1929 г.) Французской академии наукЖюля Драша (1871—1949). Драш исследовал в своей диссертации (1898) [153], в частности, случай линейных уравнений с частными производными первого порядка. Важную роль при этом сыграла развитая им концепция логического интегрирования уравнений. Трудное изложение, встречающиеся неточности в формулировках и лакуны в доказательствах в значительной степени снизили эффект работ Драша. Настоящую их значимость начинают понимать лишь в последнее время (см. [120]). О последующих результатах, в частности о работах американских ма- тематдков Дж. Ритта (1893—1957) и Э. Колчина, придавших теории Пикара—Вессио современную форму, см. [39]. Заметим, что интерес к уравнениям, интегрируемым в квадратурах, сильно снизившийся в первой половине XX в., в последнее время возродился вновь. Причина этого — открывшаяся важность таких уравнений для математической физики. О современных исследованиях по групповому анализу дифференциальных уравнений см. [35, 65, 227]. 3.4. Особые решения Феномен «особого решения» С «особыми решениями» впервые столкнулся в 1715 г. Б. Тейлор. Рассматривая уравнение (1 -т- х2)2 {dyidxf = 4г/3 - 4#2, он наряду с общим решением 1 + С2х У~~ {С-\-\ГТ~Гс2хУ1 получил еще одно решение у = 1, которое нельзя выделить из общего ни лри каком значении постоянной С. Столь необычное решение, причем полученное необычным способом (дифференцированием самого уравнения!), Тейлор назвал «некоторым особым (singularis) решением задачи». В XVIII в. к такого рода решениям приходили также А. Клеро, Ж. Даламбер, их изучали Эйлер, Лаплас (об этом см. ИМ, т. 3, с. 399— 404). Наконец, в опубликованном в 1776 г. мемуаре «О частных интегралах 109
дифференциальных уравнений» [233] Ж. Лагранж построил их теорию. Ее усовершенствованное и расширенное изложение мы находим в лекциях 14—17 его «Лекций об исчислении функций» [234], изданных в 1806 г. (см. ИМ, т. 3, с. 404-406). Под особым решением понималось решение дифференциального уравнения, не получающееся из общего ни при каком значении входящей в это решение произвольной постоянной. Впрочем, сама терминология в XVIII— начале XIX в. была еще неустановившейся. У разных авторов эти решения назывались по-разному: частными интегралами (integrale particuliere) у Ж. Лагранжа (1776) [233], А. М. Лежандра (1797) [243] и С. Д. Пуассона (1806) [354], особыми уравнениями (equation singuliere) у того же Лагранжа (1806) [234], особыми интегралами (integrale singuliere) у О. Кур- но (1841) [142] и Ф. Муаньо (1844) [296]. Лишь постепенно к середине века становится общеупотребительным привычный нам термин «особое решение» (об этом подробнее см. [360, с. 325—326]). Теория Лагранжа Для получения таких решений Лагранж предлагает два подхода. Первый подход предполагает знание общего интеграла уравнения / (х, у, у') = 0. (28) Здесь и далее уравнение (28) полагается алгебраическим относительно у'г при этом левая его часть / (х, у, у') = ап (х, у) у'п + . . . + ах (х, у) у + а0 (х, у) — неприводимый многочлен относительно у'. Что функции at (х, у) (i — = 0, 1, . . ., п) предполагаются непрерывными по х, у в рассматриваемой области и допускающими в ней частное дифференцирование по х и г/, Лагранж не отмечает. Пусть F (х, у, С) = 0 (29) — общий интеграл уравнения (28) и пусть ф (х, у) = 0 — соотношение, полученное исключением С из уравнения (29), и 3F (х, г/, С)1дС = 0. (30) Это соотношение, за которым впоследствии закрепилось наименование «дискриминанта» (об этом см. [360, с. 350]), дает искомое особое решение (в случае, добавим мы, если оно является решением). Разумеется, о возможности того, что полученное решение может оказаться частным, Лагранж не подозревал. Полученное таким образом решение Лагранж интерпретировал как огибающую однопараметрического семейства кривых (30), т. е. как кривую, которая в каждой своей точке касается одной из кривых семейства (29). О том, что это уравнение дает не только огибающую, но и геометрическое место так называемых кратных точек семейства (29), т. е. узловых точек, точек возврата и т. д. [89, с. 133], Лагранж не знал. Таким образом, указывает Лагранж, особые решения обладают тем свойством, что через каждую их точку проходят два различных решения: особое и частное. Следовательно, каждой точке (х, у) особого решения соответствует кратный корень уравнения (28), рассматриваемого относительно у'. Это свойство точек особого решения Лагранж использует во втором методе нахождения особых решений. НО
Второй метод не предполагает знания общего решения. Лагранж составляет уравнение df (*, у, у')1ду' = 0 (31) — условие того, что уравнение (28), рассматриваемое относительно у', имеет кратный корень. Пусть Ф (*, у) = 0 (32) — уравнение, полученное исключением у' из уравнений (28) и (31). Это уравнение определяет, опять же в позднейшей терминологии, «дискрими- нантную» кривую. Если задаваемая уравнением (32) функция у = s (х) — решение уравнения (28), то она является особым решением, если, конечно, не представляет собой частное. Исследуя возможности второго подхода, Лагранж сделал еще один важный шаг: дифференцируя (28) по х df df dy } df d2y ^0 дх ду dx ' dy' dx2 ' Лагранж получает выражение для d2y/dx2: £у_ _ df/дх -f (дЦду) dyjdx dx2 df/dyf В точках особого решения, по Лагранжу, числитель и знаменатель этого выражения должны обращаться в нуль [234, § 1891. В итоге получаются уравнения df -.о и 4- + 4~£-=о, ду' дх ' ду dx которые должны удовлетворяться вдоль особых решений. К сожалению, на этот результат математики не обратили должного внимания. Второе из написанных уравнений было переоткрыто лишь в 1873 г. Г. Дарбу. Примеры Коти и Курно Основные положения теории Лагранжа определили дальнейшее развитие предмета. Центральной задачей стало нахождение признаков, отличающих особое и частное решения дифференциального уравнения. Ее решению были посвящены исследования С. Д. Пуассона (1806) [354], С. Ф. Ла- круа (1814—1815) [229], Коши (1844) [296] и др. В ходе этих исследований неожиданно выяснилось, что возможны случаи, когда огибающая семейства решений (29) является частным решением уравнения (28) в том смысле, что ее уравнение получается из общего решения при определенном значении произвольной постоянной. Первый такой пример был дан Коши и содержится во втором томе лекций Муаньо (1844) [296]. Дифференциальное уравнение имеет общее решение у = С (х + С)2 — однопараметрическое семейство парабол. Прямая у = 0 является, с одной стороны, огибающей этого семейства, т. е. в представлениях Лагранжа особым решением, с другой — получается из общего решения при С — 0, т. е. частным решением. Возможность такого рода ситуаций указывала на недостаточность определения особого решения как не получающегося из общего ни при каком значении произвольного постоянного. Тем не менее это определение 111
широко использовалось в литературе еще в нынешнем столетии (см., например, [180, с. 314]) мало-помалу уступая пониманию особого решения как решения, которое не удовлетворяет свойству единственности во всех своих точках (см. [89, с. 131—132]). В 1842 г. известный французский математик и философ Антуан Огю- стэн Курно (1801—1877) во втором томе «Элементарного трактата по теории функций и инфинитезимальному исчислению» [142] привел пример уравнения (28), дискриминантное уравнение которого г|) (х, у) = 0 задавало не огибающую семейства (29), но геометрическое место точек возврата кривых этого семейства. Курно рассмотрел уравнение у'гх2 — 2у'х (х — а) + у2 + х2 = 0 и показал, что дискриминантная кривая этого уравнения г|) (х, у) е= а (а — 2у) — х2 = 0 задает геометрическое место точек кривых, являющихся его частными решениями. В 1851 г. лондонский профессор А. де Морган (о нем см. Кн. 1, с. 19) построил аналогичный пример [299]. Стало ясно, что в общем случае дискриминантное уравнение г|? (х, у) = 0 состоит не только, как до сих пор полагали, из особых решений, представляющих огибающие семейства (29). Дарбу и его полемика с Каталаном Г. Дарбу в статье «О поверхности центров кривизны алгебраической поверхности» [146], представленной Парижской академии наук 20 июня 1870 г., между прочим заметил, что в общем случае уравнение дискрими- нантной кривой г|э (х, у) — 0 для уравнения (28) задает геометрическое место точек возврата кривых, являющихся частными решениями, и лишь в исключительных случаях (при определенной зависимости коэффициентов уравнения (28)) — их огибающую. Это замечание Дарбу выглядело парадоксом. Естественно было полагать, что в общем случае дискриминантная кривая должна давать именно огибающую частных решений и уж в исключительных случаях — геометг рическое место точек возврата. Эти соображения, критикуя замечание Дарбу, и высказал в заметке, представленной 4 июля 1870 г. Парижской академии наук, выпускник Парижской политехнической школы профессор университета в Льеже Эжен Шарль Каталан (1814—1894), известный своими работами по геометрии, математическому анализу и механике [128]. Полемика Дарбу и Каталана привлекла внимание многих математиков. В 1872 г. посмертно публикуется статья [140] А. Клебша, в которой возникший парадокс обсуждается с использованием идей его теории коннексов. При этом Клебш высказал мысли, развитие которых позволяет найти верное объяснение парадокса. 23 ноября 1872 г. Дарбу выступает на заседании парижского общества Любителей знания (Societe philomatique) с докладом, опубликованным в 1873 г. В работе «Об особых решениях обыкновенных дифференциальных уравнений первого порядка» [147] он дает доказательство сформулированного выше утверждения 1870 г. Он показывает (по существу повторяя забытый результат Лагранжа), что особое решение дифференциального уравнения (28) должно удовлетворять трем уравнениям 112
Разрешение упомянутого «парадокса» состояло в том, что общему дифференциальному уравнению / (х, г/, у') = 0 соответствует специальный класс семейства кривых (29), который характеризуется тем, что соответствующая дискриминантная кривая дает не огибающую, но геометрическое место точек возврата, и, обратно, общему уравнению однопараметри- ческого семейства кривых (29), для которого применима теория огибающих, соответствует специальное уравнение, обладающее особым решением. Дальнейшее развитие теории особых решений В дальнейшем вопрос о геометрическом строении дискриминантной кривой был подвергнут тщательному изучению в работах А. Кэли (1872) [135], (1877) [136] и Ф. Казорати (1874) [123], (1875) [124], (1876) [125], (1879) [126], (1881) [127], известного также своими достижениями в области дифференциальной геометрии и теории функций комплексного переменного (см. о нем Кн. 2, с. 164). Результаты Дарбу пробудили также интерес к исследованию вопроса об особых решениях уравнения / (х, у, у') = Ос точки зрения аналитической теории дифференциальных уравнений (см. раздел 5). Начало положили здесь Врио и Буке (1856) [117]. Здесь следует отметить также работу Л. Фукса (1884) [172], о которой еще пойдет речь ниже (см. раздел 5), диссертацию Карла Шмидта (1860—1919) [366], защищенную в 1884 г. в Гис- сене, и. статью (1890) [158] ученика Ф. Клейна профессора Принстонского университета (впоследствии одного из основателей и первых президентов Американского математического общества) Генри Бурхарда Файна (1858— 1928), особенно опубликованное в 1893 г. исследование [192] доцента Высшей технической школы в Шарлоттенбурге Мейера Гамбургера (1838— 1903), известного специалиста в дифференциальной геометрии и теории функций комплексного переменного. Подробнее с историей теории особых решений в XIX в. можно ознакомиться по работам [322, 360]. 4. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ Линейные уравнения — один из важнейших разделов теории дифференциальных уравнений. Активность в их изучении определялась в первую очередь их практическим значением — к ним приводили многочисленные* задачи интенсивно развивавшейся математической физики: теории теплопроводности, теории потенциала, теории колебаний упругих тел, теоретической астрономии и др. Из разработки этих конкретных задач выросли такие важные разделы теории линейных уравнений, как теория краевых задач (и прежде всего теория Штурма—Лиувилля) и асимптотические методы. Разработка такого рода теорий и методов шла параллельно и в неразрывной связи с изучением вопросов общей теории (таких, как вопрос о линейной независимости решений, проблема интегрирования систем линейных, уравнений с постоянными коэффициентами), решение которых оказалось в зависимости от уровня развития целого ряда областей анализа и даже алгебры (например, теории определителей, линейной алгебры). В свою очередь, теория линейных дифференциальных уравнений стала источником важных методов и идей, получивших развитие за ее пределами: в качественной и аналитической теориях дифференциальных уравнений, в спектральной теории, в теории интегральных уравнений, в теории линейных операторов и в алгебре. Исследование свойств решений линейных дифференциальных уравнений специального вида позволило пополнить арсенал математического анализа целым рядом специальных функций. ИЗ
4.1. Общая теория Методы понижения порядка В 1766 г. вышел в свет мемуар Ж. Л. Лагранжа «Решение некоторых задач интегрального исчисления» [231]. В первых его параграфах изучается задача интегрирования уравнения Ln (у) = У™ + a, (x)y(«~V + . . . + ап (х) у = X (х). (33) Лагранж рассматривает соответствующее ему однородное уравнение Ln (у) = 0 (34) и связывает с ним уравнение L* (и) = (- l)n vW + (- 1)*-' (<ц (х) *;)(*-i> + . . . ... — (a„_i (х) v)' + anv = О, названное впоследствии Л. Фуксом (1874) [169] сопряженным (adjungiert) данному,— теория таких уравнений и их систем получила в XIX в. развитие в работах К. Г. Якоби, Г. Фробениуса и особенно Г. Дарбу (см. [149, ч. 2, кн. 4 и 5]). Лагранж показывает, как, используя р частных решений и = иг, и = = и2, . . ., v = ир последнего уравнения (если они известны, конечно), можно свести интегрирование уравнения (34) к интегрированию линейного уравнения Ln„p (у) = О порядка п — р (эти его рассуждения неоднократно воспроизводились в последующей математической литературе; см., например, [1]). Используя этот факт, а также свойство (Ln)* = Ln, он показывает, как знание п — 1 частных решений у = уг, у = г/2, ... # . ., у = уп_1 уравнения (34) дает общее решение уравнения (33). Узнав из письма Лагранжа об этом результате, Даламбер сообщил ему иной метод его получения, основывающийся на замене У = yAzdx, .ставшей широко известной впоследствии (см., например, [74, § 37]). В результате этой замены уравнение (34) приводится к уравнению J- Ln(г/! jj zdx} = L„-! (z) = z(-D + + h (X) ^П~2) + . . . + fen-2 (X) z' + fen_! (X)Z = 0 порядка, на единицу меньшего. Так как z = z1 = d (yjy-^ldx оказывается решением последнего уравнения, то при помощи замены z = z1\ udx оно сводится к уравнению Z,n_2 (и) = 0 порядка, на единицу меньшего, и т. д. Применяя этот алгоритм к уравнению (33), Даламбер вслед за Лагран- жем получает выражение общего его решения через р частных решений уравнения (34) и функцию X (х). Метод Даламбера был опубликован в 1766 г. в том же томе записок Туринской академии, что и упомянутая статья Лагранжа. Вряд ли следует сомневаться в том, что и Лагранж, и Даламбер понимали, что рассмотренные ими частные решения у = yi, . . ., у = z/n_i должны быть «существенно различными». Однако они не только не попытались выяснить смысл этого различия (линейная независимость), но даже не посчитали нужным его оговорить. Впрочем, оба они дают методы ин- 114
тегрирования уравнения (33), возможность реализации которых и будет зависеть от того, различны (линейно независимы) или нет используемые частные решения. По ходу своих рассуждений Лагранж и Даламбер доказали следующее утверждение: если известны р (линейно независимых, добавим мы) частных решений уравнения (34), то его интегрирование сводится к интегрированию линейного однородного уравнения порядка п — р. Ни Лагранж, ни Даламбер не выделили этого утверждения. Сделал это итальянский математик и историк математики, натурализовавшийся в Париже и в 1833 г. избранный членом Парижской академии наук, Г. Либри (1803—1869) в работе, опубликованной в 1833 г. [246], к которой мы еще вернемся в дальнейшем. Он назвал это утверждение теоремой Лагранжа. В 1839 г. он сформулировал [248] ее обобщение, получившее впоследствии название теоремы Либри: если известны два линейных дифференциальных однородных уравнения Ьп (у) = 0и Lm (у) = 0 порядков пит (п ^> т) соответственно, относительно которых известно, что каждое решение второго является решением первого, то возможно (до всякого интегрирования) построить линейное уравнение Ln-m (у) = 0 порядка п — ту такое, что его решениями будут недостающие (п — т) решений уравнения Ln (у) = 0. Таким образом, задача интегрирования уравнения Ьп (у) = О распадается на две: проинтегрировать уравнения Ьт (у) = 0 и Ln-m (у) = 0. Доказательство той теоремы, отсутствующее у Либри, дал Лиувилль (1839) [274] (см. [22]). В 1864 г. вышло в свет второе издание «Курса анализа» [381] Ш. Штурма. В третьем приложении ко второму тому, написанном профессором Ту- лузской артиллерийской школы Ф. Э. Брассином (1805—1894), мы находим следующее обобщение теоремы Либри (цит. по [381]): «Если дифференциальные линейные уравнения порядка т, т', тп', . . . будут иметь р общих решений, то по способу, сходному с отысканием общего алгебраического делителя, найдем уравнение Lv (у) = 0, из которого получим эти решения, и интегрирование данных уравнений приведется к интегрированию уравнения Ьр (у) = 0 и интегрированию других уравнений порядка т — р, т — р, т" — р, . . .» Для доказательства Брассин использует алгоритм, сходный с алгоритмом Евклида для нахождения наибольшего общего делителя двух многочленов. Вообще указанные выше результаты Либри и Брассина следует рассматривать в связи с разработкой аналогии между линейными дифференциальными и алгебраическими уравнениями, о которой мы еще будем говорить в дальнейшем. Линейная независимость решений. Определитель Вронского Вероятно, первым, кто посчитал нужным оговорить, что частные решения У = У и У ~ У 2i • • •» У = Ут составляющие общее решение у = С1у1 + + С2у2 + . . . + Спуп уравнения (34), должны быть «существенно различными», был О. Коши. Во втором томе «Лекций по дифференциальному и интегральному исчислению, изложенных в принципе согласно методам господина Коши...» (1844) [296] аббата Ф. Муаньо отмечается (лекция 36), что п частных решений у = уг, у = г/2, . . ., у = уп дадут общее решение в том и только в том случае, если п произвольных постоянных можно выбрать так, чтобы возможно было получить произвольные значения для начальных значений х0, г/0, г/о,. . ., уТ'^- Это означает, что Коши считал критерием' общности решения возможность получения из него решения 115
ч<задачи Коши» при произвольных начальных данных, как это и принято в современных курсах по дифференциальным уравнениям. В 1838 г. выдающийся русский математик академик Михаил Васильевич Остроградский пишет «Заметку о линейных дифференциальных уравнениях» (опубл. в 1839 г.) [313], в которой выводится выражение . — ( ax(\)dx А = ае J (а — произвольная константа), как сегодня мы сказали бы, для определителя Вронского уравнения (34). Сам Остроградский этот определитель явным образом не выписывает. А определяется им как общий знаменатель в решениях соответствующей системы п линейных уравнений. Формула эта, полученная для п = 2 еще Абелем в работе 1827 г. [97], известна в литературе как формула Лиувилля—Остроградского, так как в опубликованной в 1838 г. работе о методе вариации постоянных [270] Лиувилль по ходу рассуждений получил соотношение более сложного характера, из которого эта формула может быть получена (см. [Б17, с. 470]). Ни у Остроградского, ни у Лиувилля не говорится ни слова о линейной независимости решений. Понятие (и сам термин) линейной независимости решений линейного однородного дифференциального уравнения, а также критерий, использующий определитель, получивший впоследствии 10 имя Вронского, дал ъ 1858 г. воспитанник Берлинского университета, впоследствии профессор Цюрихского политехникума и Страсбургского университета, Эльвин Бруно Кристоффель (1829—1900) в работе «О линейной независимости функций одной переменной» [137]. Введение понятия линейной независимости решений часто связывают также с работой 1857 г. профессора Гейдельбергского университета, а впоследствии Мюнхенского политехникума Людвига Отто Гессе (1811 — 1874) 1203]. Это мнение базируется на том, что в указанной выше работе Крис- тоффеля имеется ссылка на работу Гессе 1857 г. Однако внимательное прочтение (см. [42]) показывает, что в данной работе Гессе, посвященной одной задаче вариационного исчисления, это понятие отсутствует. Ссылка Крис- тоффеля относится к одному из свойств определителя (определителя Вронского), установленному Гессе. Понятие фундаментальной системы решений линейного однородного уравнения принадлежит Л. Фуксу (1866) [167]. Символическое исчисление Весьма эффективными в теории линейных дифференциальных уравнений оказались методы так называемого символического исчисления, изучающего операторы, порожденные оператором дифференцирования. Эти методы основаны на том, что операторы отделяются от функций, над ними лроизводятся формальные операции, а затем конечный результат снова применяется к функциям. Символические методы позволяют значительно упростить решение некоторых проблем анализа, сводя их к решению алгебраических задач. Применения символического исчисления не ограничились только решением дифференциальных и разностных уравнений. В XVIII и XIX вв. с его помощью было получено большое число различных разложений в ряды, в частности интерполяционных разложений, а также множество интересных операторных тождеств. Так как в предшествующих Этот определитель, как было отмечено в 1882 г. [300], был рассмотрен еще в 1812 г. [209] польским математиком и философом Юзефом Гёне-Вронским (1778—1853) в связи с выводом коэффициентов его «универсального» ряда (см. [73]). 116
книгах «Математики XIX века» история символического исчисления не освещалась, мы остановимся на нем несколько подробнее. Истоки символического исчисления мы находим у Лейбница, у которого отчетливо проявилось понимание дифференцирования гг-го порядка как п-й степени оператора дифференцирования [Б50, т. 2, с. 301—302]. Знаменитая формула Лейбница, распространенная им и на отрицательные показатели, (uv)W = 2 CW1 W1-'} «-> S CV>-''" = (и + v)n дает одну из форм связи между показателем степени и порядком дифференцирования. Указанная Лейбницем аналогия привлекла математиков разных времен, а «установленная им,— как писал Бурбаки [А1, с. 205],— тенденция формального обращения с символами развивалась в течение всего XVIII в., выходя далеко за пределы того, что могло допустить состояние анализа того времени». В известном смысле исходной для нового исчисления оказалась формула Тейлора, устанавливающая связь оператора сдвига (или взятия разности) с оператором дифференцирования. Следуя Лейбницу, Лагранж заметил (1774) [232], что если в ряде Тейлора заменить производные на соответствующие степени, то получится ряд для экспоненты. Отсюда следует символическое представление для ряда Тейлора и (х + /г) = JP -*1 ^4 , Дли = (*" ~ ~ 1) «. где Ahu — и (х + h) — и (х). Лагранж вывел это равенство сразу для функций многих переменных и с его помощью получил многочисленные символические формулы, например 1 1 du=Au 2~ А2и -f- -J- Д3а — . . ., где 2 - А'1. Алгоритм Лагранжа приобрел широкую известность и стал объектом большого числа исследований, главным образом во Франции и Англии. У Лагранжа символы операций не отделялись от объектов, к которым они применяются, что приводило к необходимости постоянного перехода от индексов дифференцирования к показателям степеней и наоборот. Это неудобство было устранено в работах Луи Франсуа Арбогаста (1759 —1803), члена Парижской академии наук и профессора Артиллерийской школы в Страсбурге. Свой метод «отделения символов» Арбогаст изложил в обширном труде «Исчисление дериваций» [99], опубликованном в Страсбурге в 1800 г. Символические формулы Лагранжа приобрели у него форму операторных равенств, которые он понимал как равенство результатов действия этих операторов на произвольную числовую функцию. Развивая идеи Арбогаста, его соотечественник профессор Артиллерийской и инженерной школы в Метце Жак Фредерик Франсе (1775—1833) заменял (1812—1813) [162] в функциональном тождестве ф (х, у) = = cpi (х, у) переменные х и у операторами (например, D = dldx и А) и получал тождество в операторах. Применяя последнее к некоторой функции Ьпи = (еН йх —If?/, 117
F, он вновь приходил к функциональному тождеству Ф (D, A) F = ф1 (Я, A) F. На этом пути Франсе, а позднее независимо от него Д. Грегори получили множество формул, представляющих интерес и поныне (см. [50, 93]). Основным принципом образования сложных функций от некоторых «классических» операторов типа оператора сдвига, взятия разности, дифференцирования и т. п. являлось разложение этих функций в бесконечные степенные ряды. Любопытное обобщение формулы Тейлора предложил талантливый французский математик и инженер-проектировщик каналов Барнабе Бриссон (1777—1828) в опубликованном в 1808 г. «Мемуаре об интегрировании дифференциальных уравнений в частных производных» [119]. Это единственный дошедший до нас мемуар Бриссона по символическому исчислению. Остальные его работы в этой области, написанные в период с 1821 по 1823 г., судя по всему, утеряны. Однако упоминание о них имеется в статьях Коши, на которого они оказали определенное влияние. Для линейного оператора V Бриссон вывел разложение в котором я|) и я — функции от х, V0 = V, a Ffr+1\|) = Vk (xty) — xV^. Ряд Бриссона включает в себя упоминавшуюся выше формулу Лейбница и ее обобщение полученное в 1848 г. (на сорок лет позже Бриссона) английским юристом и математиком Чарльзом Харгревом (1820—1866). Введение рядов от операторов дало математикам богатый аппарат, который они с большим искусством использовали для решения конкретных задач. Однако понятие степенного ряда от оператора, так же как и другие понятия, связанные с применением предельного перехода, долго оставались в символическом исчислении практически без обоснования. Мимо этого обстоятельства не прошел Коши, заметивший в 1827 г.в работе «Об аналогии между степенями и производными» [130], что если функция от линейного оператора не многочлен, то: 1) не всегда можно установить сходимость рядов, которыми эта функция может быть представлена; 2) если же, например, разложение ведется по отрицательным степеням оператора дифференцирования, то появляется бесконечное число произвольных постоянных и непонятно, как их выбирать. Коши предложил следующее определение оператора. Если F (Z), A) (D — оператор дифференцирования, А — оператор разности с шагом к) — многочлен, то из тождества Фурье с» с» — с© —с» и соотношения F(D, ls)erx = erxF (г, erh — 1) 118
следует равенство ^(ДД)/(ж)=-^ \ Г С ea^-X)i/(^)^(aff6a»/i_i)^l da, которое в случае произвольной функции F и принимается за определение оператора F (D, А). Такое представление оператора дает возможность обосновать символическое исчисление, как это было сделано в 20-х годах нынешнего столетия на базе преобразования Лапласа (см. [46, гл. 6]). Как замечает Коши, определение оператора через интеграл Фурье было указано еще Бриссоном в неопубликованном мемуаре 1823 г. (о работах Бриссона см. [50, 68]). Вопросы законности символического исчисления в несколько ином плане обсуждал раньше Коши французский математик и артиллерийский офицер Ф. Ж. Сервуа (1767—1847). Он пытался (1814—1815) [367] ответить на вопрос, почему с классическими операторами можно действовать, как с числовыми величинами. Сервуа видел причину этого параллелизма в том, что в множестве символов (операторов) и в множестве чисел выполняются одни и те же законы: дистрибутивности, коммутативности (эти термины принадлежат ему самому) и ассоциативности (этот термин был введен позднее Гамильтоном). Таким образом, Сервуа пришел к идее об общих законах операций, действующих в различных системах объектов, будь то числа или операторы. Эта идея была развита впоследствии в трудах английской школы символической алгебры, сыгравших столь важную роль в формировании новой алгебры (см. ИМ, т. 1, с. 70—72, [69, 72]). Представители этой школы, в том числе ее лидеры — Дж. Пикок, Дункан Ф. Грегори и А. де Морган — активно разрабатывали символическое исчисление, получившее в Англии наименование исчисления операций. Особое место в изучении алгебры линейных операторов, начатом Сервуа, занимает вышедший в 1837 г. «Первый мемуар по теории аналитических операций» английского математика и физика Роберта Морфи (1806 — 1843). В этой работе он начинает исследование некоммутирующих операторов. Рассмотрение обратных операторов приводит его к определению в современной терминологии «ядра отображения». В частности, он показывает (см. [69]), что при обращении оператора дифференцирования ядром будет константа, а при обращении оператора разности — периодическая функция. Исследование некоммутирующих операторов было продолжено в работе 1844 г. Джорджа Буля «Об общем методе анализа» [112] (о Буле см. Кн. 1, с. 22). Буль рассмотрел (см. [71]) класс линейных операторов, порожденных операторами р и я и удовлетворяющих некоторым законам коммутации. В зависимости от выбранного закона он получил различные разложения оператора / (р + я) (/ — аналитическая функция) в ряды по степеням р. Результаты Буля и его последователей (Р. Кармайкла, Ч. Харгрева, Б. Бронвина, У. Рассела, В. Донкина и др.) по теории некоммутирующих операторов, развиваемой главным образом в связи с разработкой символических методов интегрирования линейных дифференциальных уравнений с переменными коэффициентами, составили важный этап в развитии символического исчисления. В 1855 г. вышла в свет отдельная книга, специально посвященная этому исчислению, «Трактат по исчислению операций» [122] Р. Кармайкла. Отметим, что достижения английских математиков по символическому исчислению быстро привлекли к себе внимание в России. Киевскрш мате- 119
матик, воспитанник Киевского университета и Сорбонны, впоследствии, профессор Киевского университета Михаил Егорович Ващенко-Захарченко (1825—1912) в 1862 г. публикует свою магистерскую диссертацию «Символическое исчисление и его приложения к интегрированию линейных дифференциальных уравнений» [11], а в 1868 г. выпускает «Лекции разностного исчисления» [12]. В этих трудах содержалось достаточно полное изложение результатов английских ученых. За последовавшим затем спадом интереса к символическому исчислению к концу века наблюдается новое его возрождение, вызванное появлением замечательных работ английского математика и инженера-электрика О. Хевйсайда. Хевисайд дал исчислению операторов физическую интерпретацию и разработал чрезвычайно удобные на практике символические методы решения задач электротехники (см. [70, 284]). Об этих методах решения задачи Коши для линейных дифференциальных уравнений с постоянными коэффициентами мы еще будем говорить впоследствии. Период формального развития теории операторов, восходящей к Лейбницу, заканчивается в 90-е годы работами профессора Болонского университета Сальваторе Пинкерле (1853—1936), изучавшего классические операторы методами теории функций комплексного переменного. Его достижения, а также результаты его предшественников были подытожены в написанной им совместно с его учеником У. Амальди (1875—1957) книге «Дистрибутивные операции и их применения в анализе» [337]. Наиболее обширный и разработанный раздел символического исчисления, в значительной мере определивший его развитие в XIX в., составляют символические методы интегрирования линейных дифференциальных уравнений, к которым мы и переходим (об истории символического исчисления см. [336, 223, 150, 40, 50, 67-70, 72, 284]). Уравнения с постоянными коэффициентами. Методы Бриссона и Коши Первые символические методы решения линейных дифференциальных уравнений были предложены Бриссоном. Как следует из замечаний Коши, они содержались в неопубликованных работах Бриссона 1821 —1823 гг. Однако в уже упоминавшемся мемуаре Бриссона 1808 г. имеются зачатки одного из методов, который можно назвать методом факторизации. Коши воспроизвел методы Бриссона в упоминавшейся выше работе 1827 г. [130]. Усовершенствовав символику Бриссона, он записал линейное дифференциальное уравнение аоУ{п) + аху№ + • • • + Яп-i*/' + ап = / (х) в символической (или операторной) форме F(D)y=f (х), (35) где D — оператор дифференцирования по х, a F (D) — многочлен относительно D. Это обозначение наряду с тем, которое дал впоследствии Хевисайд, прочно укоренилось в литературе по данному вопросу. Символ F (D) = a0Dn + aiDn-i + . . . + an-J) + ап получил название линейного дифференциального оператора порядка п. Первый метод Бриссона — метод факторизации состоит в следующем. Пусть F (Dx> Dy, ...,Д, Дя, by,...,bt)u = f(x,y,...,t) 120
— линейное дифференциально-разностное уравнение с постоянными коэффициентами от переменных х, у, . . ., t. Если рациональная функция F может быть представлена в виде произведения F = F1-F2-. . .-Fn сомножителей того же рода, то исходное уравнение равносильно следующей системе линейных уравнений: Fxiin^ = /, Fnu = иъ Этот метод одним из первых начал применять Франсе в упоминавшейся выше работе [162] 1812—1813 гг. Второй метод Бриссона можно назвать методом разложения, так как он исходит из возможности разложения обратного оператора на сумму простых дробей. Если F = Fa-F*. и -i- = -^_-i__^L + то решение уравнения Fu = ф/ (ф и F — операторы) может быть записано в виде u=Tj где выражение ик = (yk/Fk) f является решением уравнения Fkuk = = ф^/. Таким образом, исходная задача снова сводится к решению более простых уравнений. Развивая идеи Бриссона, Коши записал уравнение (35) в виде U(D-ri)*iy = f(x), S*i = ^ г=1 где Гц г2, • . .. гт — различные, вообще говоря комплексные, корни многочлена F (х), kt — кратность корня rt. Тогда его решение сводится к решению системы уравнений более низкого порядка: (D — Г2)"*У2 = У1, (D — Tmfm у = ут_1ш Для случая простых корней F (х) Коши привел для решения уравнения (35) следующую формулу, получившую впоследствии название теоремы разложения: Выражение / (x)/(D — гк) = ук он определил как решение уравнения (D — гк) ук = / (х) и нашел его символическим путем с помощью выведенной им формулы, получившей впоследствии название теоремы о смещении: F (D) erxf (х) = erx F (D + г) f (х). •Следует отметить, что Коши находил символическими методами не только общие решения уравнений, ной решения начальной задачи. Кроме того, 121
он рассмотрел случай кратных корней многочлена F (D) (см. [70]). Выражение / (x)l(D — r)v, появляющееся в разложении IIF (D) при наличии корня кратности v, он интерпретировал как решение уравнения (D — r)vy = = f (х) и получил для него, интегрируя по частям ?г-кратный интеграл, важную формулу х Пх) - = егх [ e-rt (х - О*"1 / (t) dt + егх (Со + Сгх + ...+ CW^"1). (D — г) J (v — 1)! Хо Наряду с Бриссоном Коши одним из первых начал разрабатывать символические методы решения уравнений с частными производными. Они содержатся в его работе [130] 1827 г., а также в представленном на месяц раньше, но опубликованном лишь в 1850 г. «Мемуаре об интегральном исчислении» [132]. Обозначая в уравнении с двумя неизвестными одну из производных через постоянную, он сводит исходное уравнение в частных производных к обыкновенному дифференциальному уравнению. При этом он ищет не общие решения, но решения граничных задач (подробнее см. [70]). Уравнения с постоянными коэффициентами. Методы Грегори и Буля Характерной чертой работ британских математиков является желание показать универсальность символических методов, стремление пользоваться только средствами символического исчисления. Если Коши комбинировал символические методы с другими, то для представителей английской школы это было недопустимо. Однако излишнее увлечение формальной стороной дела нередко приводило их к результатам, значимость которых трудно было оценить. Так, с точки зрения представителей английской школы, решение дифференциального уравнения достаточно было записать в символической форме, хотя не всегда было ясно, как интерпретировать полученное выражение и вообще имеет ли оно смысл. Большой вклад в развитие символических методов решения дифференциальных уравнений внес Д. Ф. Грегори. Дункан Грегори родился в Эдинбурге в 1813 г. в старинном шотландском профессорском семействе, подарившем миру ряд замечательных ученых. Одним из его предков был выдающийся математик XVII в. Джеймс Грегори (см. ИМ, т. 2, с. 148—152). В 1833—1837 гг. он учился в Кембриджском университете, с которым связана его последующая деятельность. В 1838 г. вместе с Р. Эллисом основал «Cambridge Mathematical Journal». При его деятельной поддержке в этом журнале начал печатать свои первые работы Дж. Буль. Наряду с Дж. Пикоком и А. де Морганом Д. Грегори был одним из крупнейших представителей английской школы символической алгебры (см. Кн. 1, с. 70—71). Умер Д. Грегори в Эдинбурге в 1844 г. Несколько работ Грегори по символическому исчислению были опубликованы в первом томе Кембриджского математического журнала, помеченного 1837—1839 гг.: «О решении линейных дифференциальных уравнений с постоянными коэффициентами» [187], «О решении уравнений в частных производных» [188], «Доказательство теорем в дифференциальном исчислении и исчислении конечных разностей» [189]. Грегори была известна работа Коши [130] 1827 г., но, по его словам, он предпочел другой путь, который, как он полагал, был ближе к методам несохранившегося мемуара Бриссона. Он снова начал использовать фор- 122
малыше разложения функций от операторов в ряды, вызвавшие в свое время нарекания Коши. Грегори сосредоточил внимание на исследовании •обратных операций. Решение неоднородного дифференциального уравнения (35) он записывал (мы пользуемся здесь обозначениями не Грегори, а Коши) в виде у = {F (/))}-!/ (х) + {F (Dy^-O, где первое слагаемое означает частный интеграл неоднородного уравнения, а второе — общее решение однородного уравнения (в старой терминологии — дополнительную функцию). Эти величины он находил посредством разложения функций от операторов в ряды по убывающим или возрастающим степеням оператора дифференцирования. Этот метод, применявшийся впоследствии Булем, стал основным в исчислении Хевисайда (см. ниже). Аналогичные приемы Грегори использовал и для уравнений с частными производными [188] (подробнее об этом см. [70]). В 1841 г. появилась заметка Дж. Буля «Об интегрировании линейных дифференциальных уравнений с постоянными коэффициентами» [111], в которой Буль вновь указал с учетом кратных корней способ разложения {F (D)}"1 на простые дроби. Работ Коши он, по-видимому, не знал. В дальнейшем он уделил особое внимание тем случаям, когда при нахождении {F (D)}'1 / (х) можно обойтись без квадратур. В 1859 г. вышел в свет известный «Трактат по дифференциальным уравнениям» [115] Дж. Буля. Две его главы посвящены символическому исчислению. Они содержат достаточно полное для своего времени изложение методов интегрирования линейных уравнений с постоянными коэффициентами, послужившее образцом для многих последующих монографий по этому вопросу. Однако главное внимание уделяется в них уравнениям с переменными коэффициентами (см. [71]). Именно эта проблема более всего занимала Буля и его последователей. Уравнения с переменными коэффициентами. Работы Буля В 1844 г. был опубликован уже упоминавшийся основной труд Буля по символическому исчислению «Об общем методе анализа» [112], в котором он поставил целью изучение действий с некоммутирующими линейными операторами произвольной природы и создание на этой основе общих методов интегрирования линейных дифференциальных уравнений с переменными коэффициентами. Буль рассматривает уравнение а0 (х) и<*> + аг (х) и<*-1> + . . . + ап.г (х) и + ап (х) и = Т, (37) коэффициентами которого являются функции, представимые рядами. Умножая его на хп и делая замену х = ее, а также принимая во внимание тождества x»£ = D(D-i)...(D-n + l) (D = -%■), V ' (38) / (D) етв = <r»o/ (D + m), ей приводит это уравнение к виду П (D) u+U (D) еЧ + U (D) Л + ... - U. (39) 123
Так как произвольное уравнение такого типа нельзя проинтегрировать в квадратурах, то Буль ищет решения в виде рядов где щ — числовые коэффициенты, ар удовлетворяет уравнению/0 (р) = 0. Однако, хотя Буль и пользуется операторной формой записи дифференциальных выражений, символические методы в этой части его работы по существу не работают. Более интересными являются те ее разделы, в которых он ищет классы уравнений, разрешимых в квадратурах. Деля обе части уравнения (39) на /0 (D), Буль получает уравнение и + Фх (D) е*и + ф2 (D) e2Qu + . . . = U, (40) в котором операторы ф^ (D) являются некоторыми рациональными функциями. Он рассматривает частный случай, когда <р* (D) = С,Ф (D) Ф (D - 1) . . . Ф (D - к + 1), где С к — числа. Вводя оператор р = ф (D) е® и применяя теорему о смещении в форме (38), он находит Ф (D) ф (D - 1) . . . Ф (D - к + 1) = р*ы. Тогда уравнение (40) принимает вид (1 + ClP + С2р2 + . . . + СпРп) и = U. Заметим, что сумма в левой части будет конечной, если в начальном уравнении (37) функции ак (х) — многочлены. Последнее уравнение Буль решает методом разложения i + Cjp + c^ + ... + су ^ 1 — fffcP что приводит к решению уравнений вида Щ — ?*ркЛ = Щ — qk(p (D) е*щ = U. Если ф (D) является рациональной функцией, то указанным приемом оно сводится к уравнениям низшего порядка. Далее Буль дает способы решения уравнений типа и + Ф (D) ё^и = U. Наиболее любопытной является замена U — Pr ^(D) V' U ~Pr ^(D) V' где символ pr обозначает бесконечное произведение: <p(D) _ ф(£>)ф(£>-г)ф(£-2г)... Рг -ф (jD) — ^(D)^(D — r)^(D — 2r) .. . ' По всей вероятности, Буль прекрасно понимал трудности корректного определения такого рода произведений операторов, поэтому в дальнейшем он ограничился случаем, когда функции ф (D) и г|) (D) имеют такие множители, которые взаимно сокращаются, так что в бесконечном произведении остается лишь конечное число членов (подробнее см. [71]). 124
В этой же работе Буль распространил свой метод интегрирования уравнения (40) на уравнения более общего вида: 2ф*(я)рки = £/, А" где р = ф (D) г9, я = D — шр (D) е°>. Линейным дифференциальным уравнениям с переменными коэффициентами посвящены также работы Буля 1845 г. [ИЗ] и 1847 г. [114J. Символические методы Буля решения линейных дифференциальных уравнений с переменными коэффициентами не дали результатов, подобных тем, которые были получены для уравнений с постоянными коэффициентами. Класс уравнений, решаемых этими методами в конечном виде, оказался узким, включающим в основном уравнения, проинтегрированные к тому времени другими методами. Не многое прибавили в этом отношении и работы последователей Буля Ч. Харгрева (1848), Б. Брон- вина (1850-е годы), Р. Кармайкла (1850-е годы), В. Донкина (1850-е годы), У. Рассела (1860-е годы), хотя некоторые их результаты заслуживают внимания (см., например, [72]). Эти исследования оказали воздействие на работы по символическим методам интегрирования дифференциальных уравнений в XX в. (см. [81, т. 2]). Основное же их значение состоит в том, что они представляют собой первую попытку систематического анализа линейных дифференциальных уравнений с переменными коэффициентами операторными методами. Уровень математики того времени не позволил получить на этом пути сколько-нибудь крупных результатов. Успехи здесь были достигнуты лишь в сравнительно недавнее время (1950-е годы — Р. Фейнман [157], 1960-е годы — В. П. Маслов [57]). Исчисление Хевисайда В конце XIX в. символическое исчисление получает новое яркое продолжение в работах О. Хевисайда, с успехом применившего символические методы для решения линейных дифференциальных уравнений с постоянными коэффициентами, а также некоторых видов уравнений с частными производными, связанных с задачами электротехники. Оливер Хевисайд родился в Лондоне в 1850 г. Рано увлекся опытами с электричеством, в 21 год уже опубликовал первую работу по этому вопросу. Будучи самоучкой, стал выдающимся специалистом в математической физике и сыграл важную роль в развитии электромагнитной теории Максвелла и ее приложений. Предсказал (независимо от А. Э. Кен- нелли) существование ионизированного слоя атмосферы, отражающего электромагнитные волны (слой Хевисайда—Кеннелли), первым высказал предположение, что масса заряженной частицы меняется со скоростью. За исключением короткого промежутка времени (1870—1874), нигде не работал. Материально поддерживаемый братом (а впоследствии состоятельными покровителями науки и правительством), вел уединенный образ жизни. Отсутствие формального образования и ученых степеней создавало немалые трудности в признании его работ в академических кругах. Тем не менее в 1891 г. он был избран членом Лондонского королевского- общества. Умер Хевисайд в 1925 г. В математике Хевисайд наиболее известен своей активной ролью в становлении векторного анализа (см.. Кн. 2, с. 56) и результатами в области символического (операционного)' исчисления. 125»
Исчисление Хевисайда создавалось шаг за шагом в целом ряде работ, первая из которых появилась в 1881 г. Они были объединены впоследствии в двух томах «Статей по электротехнике» (1892) [195J и трехтомной «Теории электромагнетизма» (1893—1912) [196]. Отправляясь от дифференциальных уравнений, записанных в операторной форме, Хевисайд заметил, что действиям над операторами можно дать естественную физическую интерпретацию. Он разработал ряд правил, которые позволили ему сразу составлять операторные уравнения исходя из физической модели изучаемого явления. Во всех случаях операторное решение имеет у него форму С = EIZ, (41) где Z — некоторая функция оператора дифференцирования р = d/dt, которую сам Хевисайд называл «resistance operator» и которую теперь часто называют операторным сопротивлением или импеданцом. Функции С (t) и Е (t) имеют различную физическую природу, например ток и напряжение в электрическом контуре. Отметим, что Хевисайд всегда полагает функцию Е равной нулю при t < 0. Соответственно этому он рассматривает вместо нее произведение EH (t), где (1, *>0, я<'Но, ,<0, — так называемая единичная функция, носящая теперь его имя, которую сам Хевисайд обозначал в виде жирной 1 и называл «единичным операндом» (unit operand). В дальнейшем выявилась существенная роль этой функции в операционном исчислении. Она оказалась чрезвычайно важным элементом в процессе формирования понятия 6-функции, связанной с функцией Н (t) соотношением H(t)= J 6(x)dx ■-(подробнее о роли функции Хевисайда в операционном исчислении, а также в предыстории теории обобщенных функций см. [70, 284]). Хевисайд заметил, что переход от операторного решения к обычной функции от t можно осуществить, не производя операций дифференцирования и интегрирования. Такую реализацию оператора он производит по особым правилам, которые называет «алгебраизацией» уравнения. Одним из этих правил является теорема разложения (expansion theorem). Так он назвал готовую формулу для решения уравнения (41) при начальном условии С (0) = 0: c^=i!w + ELz4^' (42) где сумма берется по всем корням уравнения Z (К) = 0, а Е — постоянная. Формула (42) имеет место в случае, когда все корни многочлена Z (X) различны и ни один из них не равен нулю. Если операторное решение имеет вид С = (Y (p)/Z {р))Е, где Y (р) и Z (р) — многочлены, то теорема разложения записывается формулой C(t\ Y{0) F \ F V У (^fr) еН* A 126
О. ХЕВИСАЙД Хевисайд придавал большое значение своей теореме разложения и проиллюстрировал ее многочисленными примерами. Он применил ее также для решения систем линейных дифференциальных уравнений с постоянными коэффициентами и уравнений с частными производными. В последнем случае это привело его к разложению мероморфной функции 1/Z (р) в ряд простейших дробей. Хевисайд привел два доказательства своей теоремы разложения, одно из которых опирается на физические рассмотрения, а другое является чисто математическим и основано на разложении правильной рациональной дроби на сумму простейших. Раньше мы говорили о подобных методах, встречавшихся у Коши, Грегори и Буля. Нетрудно убедиться, что из формулы Коши (36) следует теорема разложения Хевисайда, записанная формулой (42). Для этого нужно положить / (х) =Е, а ук взять при нулевых начальных условиях. Отметим, что в отличие от своих предшественников Хевисайд находит операторными методами не общее решение уравнения, а решение с определенными начальными или граничными условиями. Трудно сказать, знал ли Хевисайд рассмотренные выше результаты своих предшественников. С математической литературой он был знаком плохо. С уверенностью можно сказать лишь, что он читал Фурье, которым безмерно восхищался, и «Трактат по дифференциальным уравнениям» Буля [115] (в его работах мы находим ссылки на него). У последнего он мог позаимствовать и сам операционный метод. Существенным моментом в исчислении Хевисайда является метод разложения операторного решения в ряды по убывающим или возрастающим 127
степеням оператора дифференцирования р. При разложении по убывающим степеням р Хевисайд считал J-Я (*) = -£-, (43) а в разложении по возрастающим степеням р полагал РПН (t) = О, где п — натуральное. Этот метод неоднократно применялся его предшественниками, в частности, это был излюбленный прием Д. Ф. Грегори. От предшествующих работ исследования Хевисайда отличает предлагаемая им трактовка решений, которые получаются путем таких разложений. Хевисайд понимает, что разложение по убывающим степеням оператора дает представление решения в виде ряда, сходящегося в любой конечной области изменения аргумента, а разложение до возрастающим степеням оператора дает асимптотическое представление решения, когда аргумент (у Хевисайда это почти всегда время) стремится к бесконечности. В случае уравнений с частными производными у Хевисайда появились расходящиеся асимптотические разложения. Не зная теории асимптотических рядов, созданной А. Пуанкаре (1866), Хевисайд тем не менее хорошо понимал природу их поведения. Он подчеркивал их пользу, показывая, что при больших значениях аргумента расходящиеся асимптотические ряды позволяют гораздо быстрее вычислять значения функции, чем соответствующие сходящиеся ряды. Впоследствии эти разложения пробудили живой интерес математиков и послужили дополнительным стимулом для исследования расходящихся рядов (см. [93]). Методы Хевисайда оказались очень удобными на практике, так как предлагали инженеру набор готовых формул, представляющих реализацию операторов, не связывая тем самым формальное нахождение решения с математическим содержанием метода. Шумный успех этих методов у прикладников заставил математиков вновь обратиться к рассмотрению символических методов, в частности к вопросу их обоснования. Этому вопросу начиная с 20-х годов нашего столетия посвящен целый ряд работ (Б. Бром- вич, Д. Р. Карсон, Г. Дёч, П. Леви, А. И. Плеснер, Я. Микусинский), некоторые из них появились сравнительно недавно (об этом см. [27]). Аналогия с алгебраическими уравнениями Аналогия с алгебраическими уравнениями во многом определила развитие теории линейных дифференциальных уравнений в XIX в. Один из аспектов проявления этой аналогии — только что рассмотренные символические методы их интегрирования. Другой аспект — аналогия между корнями алгебраических уравнений и частными решениями линейных дифференциальных уравнений. Первым, кто со всей определенностью указал на эiy аналогию и начал ее разработку, был Г. Либри. Сам он в заметке, опубликованной в 1836 г., писал об этом, имея в виду упоминавшийся нами ранее мемуар 1833 г., так [247, с. 10]: «Я, полагаю, был первым, кто обратил внимание геометров на отношения, которые существуют между корнями алгебраических уравнений и частными интегралами линейных дифференциальных уравнений... Сходство этих двух классов уравнений распространяется очень далеко и позволяет трактовать линейные дифференциальные уравнения методами, аналогичными тем, которые использовались в теории алгебраических уравнений». 128
В мемуаре [246J 1833 г., сформулировав теорему Лагранжа (см. подраздел 4.1), Либри ставит ее в соответствие с предложением, согласно которому знание р различных корней алгебраического уравнения п-то порядка сводит задачу его решения к нахождению п — р корней уравнения порядка п — р. Используя описанный выше алгоритм Даламбера постепенного понижения порядка уравнения для случая, когда известны п (линейно независимых, добавим мы) частных решений уравнения Ln (у) = уМ + а± (х) ум +...+fl„Wy = 0, (34) Либри получает выражение для коэффициентов этого уравнения через эти частные решения. Отсюда следует конструкция единственного (это Либри специально подчеркивает) линейного однородного дифференциального уравнения по заданной системе его частных (линейно независимых, уточним мы) решений. Так как Либри не пользуется аппаратом теории определителей, то формулы для коэффициентов уравнения (34) и соответствующая конструкция уравнения по фундаментальной системе его решений выглядят чрезвычайно громоздко. Тот факт, что знание п частных решений определяет коэффициенты уравнения (34), Либри поставил в связь с выразимостью коэффициентов алгебраических уравнений через его корни. При этом Либри особо подчеркнул, что в обоих случаях коэффициенты являются симметрическими функциями: в одном случае частных решений, в другом — корней. Дальнейшие успехи в разработке аналогии принадлежат Э. Брасси- ну. Упомянутое (см. подраздел 4.1) его приложение к курсу Ш. Штурма [381] так и называется «Аналогия линейных дифференциальных уравнений с переменными коэффициентами с алгебраическими уравнениями». Здесь мы находим известные нам выражения для коэффициентов и конструкцию самого уравнения через п линейно независимых решений с помощью аппарата теории определителей. Руководствуясь аналогией с алгебраическими уравнениями, Э. Брассин получил целый ряд важных предложений теории линейных дифференциальных уравнений. Одно из них — теорему Брассина — мы уже упомянули выше. Отметим также его конструкцию по двум заданным уравнениям Ln (у) = 0 и Lm (у) = 0 порядков пит соответственно, третьего уравнения Ln+m (у) = 0 порядка п -\- т, совокупность решений которого объединяет их решения. (Изложение результатов Либри и Брассина см. [81, т. 2; 10].) Из результатов Э. Брассина как очевидное следствие, специально, правда, им самим не отмеченное, получается следующее утверждение: если известно, что уравнение (34) имеет два частных решения у = у\ и у = y2i связанных между собой соотношением уг = ху2, то существует линейное уравнение меньшего порядка, имеющее с данным общие решения. Обратил внимание на этот факт, по существу содержащийся в работе Брассина, Г. Фробениус в 1873 г. в работе «О понятии приводимости в теории линейных дифференциальных уравнений» [164]. В этой работе вводится понятие неприводимости (Irreductibilitat) линейного дифференциального уравнения. Согласно Фробениусу, уравнение (34), коэффициенты которого в рассматриваемой части плоскости являются однозначно определенными аналитическими функциями, неприводимо, если оно не имеет общих решений с дифференциальным уравнением меньшего порядка, коэффициенты которого являются однозначными аналитическими функциями в той же части плоскости. Таким образом, по терминологии Фро- бениуса, Брассин доказал приводимость уравнения (34) при условии наличия решений у = у\ и у = г/2, связанных между собой отношением 5 Математика XIX века 129
Vi = ОДг- Сам Фробениус предложил достаточно общие условия приводимости уравнения, частным случаем которых является условие, выведенное Брассином. Теория приводимости оказалась важной компонентой в теории Пикара—Вессио интегрируемости линейных дифференциальных уравнений (см. подраздел 3.3). П. Аппель так писал об этой аналогии в 1881 г. [98, с. 391—392]: «Теория наибольшего общего делителя и теория исключения навели гг. Либри, Лиувилля и Брассина на аналогичные теории для линейных дифференциальных уравнений; рассмотрение этих вопросов было недавно возобновлено и продвинуто далее гг. Л. В. Томе и Г. Фробениусом... г. Фробениус ввел понятие неприводимости линейного дифференциального уравнения п и доказал на этот счет много важных теорем, побуждаемый, без сомнения, аналогичными теоремами теории алгебраических уравнений. Разложение полиномов на множители было источником теории разложения левой части линейного дифференциального уравнения на простые символические множители 12. Фундаментальный мемуар г. Фукса, по-новому изложенный и дополненный г. Ж. Таннери, имевший объектом исследования функции, определяемые линейными дифференциальными уравнениями, содержит не одну аналогию со знаменитым мемуаром г. В. А. Пюизе „Исследования об алгебраических функциях"; эта аналогия была продолжена в направлении совершенно неожиданном в недавнем мемуаре г. Фукса «Об одном классе функций многих переменных, полученных инверсией интегралов линейных дифференциальных уравнений с рациональными коэффициентами». Наконец, в ином ряду идей находится выполненное в двух заметках г. Э. Лагерра распространение теории инвариантов алгебраических форм на линейные дифференциальные уравнения» 13. Мы напомним здесь также об обсуждавшемся выше замечательном параллелизме между проблемой разрешимости в радикалах алгебраических уравнений и задачей интегрируемости в квадратурах линейных дифференциальных уравнений (см. подраздел 3.3). Столь плодотворным оказалось влияние алгебры на развитие теории дифференциальных уравнений. Влияние это не осталось односторонним — многие идеи, сформировавшиеся в связи с задачами теории линейных дифференциальных уравнений, оказались впоследствии важными компонентами в процессе создания ряда направлений в современной алгебре — теории групп и алгебр Ли, дифференциальной алгебры и др. Изучение линейных дифференциальных уравнений, как пишет Н. Бурбаки [А1Г с. 75], «способствовало тому, что было оценено само понятие линейности и все с ним связанное». Системы линейных уравнений с постоянными коэффициентами В теории линейных систем с постоянными коэффициентами существенный успех был достигнут также на алгебраической основе. Для выяснения структуры канонической формы таких систем принципиальное значение имело данное Вейерштрассом решение задачи о совместном линейном преобразовании двух билинейных форм. Этот результат содержится в его работе «К теории билинейных и квадратичных форм» (1868) [393 ] (об этой работе см. также Кн. 1, с. 69). 11 См. [164]. 12 См. Г. Флоке [159]. 13 В цитате упоминаются работы Л. Фукса [167], Ж. Таннери [382], В. А. Пюизе [357], Л. Фукса [170, 171], Э. Лагерра [235, 236]. 130
Заданы билинейные формы п п Р= J, Аа$Хау$ И Q= J, Ва$**У* а, (3=1 а, р=1 переменных .га, г/р, рассматривается форма /?/> + д(>, где р и q — параметры. Определитель этой формы рАц+яВц • • • pAln+qBln [P,Q] PAnl + ^Bnl • • • РАпп + ^Вп — многочлен п-й степени от р и q. Вводится понятие элементарного делителя определителя [Р, Q] (об этом понятии см., например, [45, гл. 13]). Для того чтобы две заданные билинейные формы Р и Q переменных хъ, У$, (а> Р = 1, . . ., п) переходили при помощи невырожденных линейных преобразований п п xs = 2j hSyUy, ys = 2j ksyvy (5=1,..., n) Y=l Y=l в две другие заданные билинейные формы п п Р'= Ъ A'abUaL% Q'= 5l B'atUaVt а, 3=1 а, р=1 переменных ua, v$ (а, р = 1, . . ., п), необходимо и достаточно, чтобы элементарные делители определителей [Р, Q] и [Р', Q'] совпадали. В 1875 г. Вейерштрасс сообщил Берлинской академии наук свои «Замечания сб интегрировании линейных дифференциальных уравнений с постоянными коэффициентами» (опубликовано в 1895 г. [59, т. 2, с. 75— 76]), где он применил этот результат к интегрированию системы dx. zla^~dT =-" //qggq (P=1» 2> •••» n)- a=i a=l Умножая уравнения этой системы последовательно на вспомогательные переменные гд, г/2, . . ., уп и складывая полученные равенства, Вейерштрасс выводит для двух билинейных форм п п Ф= 2 аа^хау^ и г|)= 2 Ьа$хау$ a, р=1 а, 3=1 соотношение dyldt = г|э. Применяя к этим формам сформулированную выше теорему о паре билинейных форм, Вейерштрасс приводит их к каноническому виду. Исходная система при этом преобразуется к соответствующей канонической форме (в несколько модифицированной форме эти рассуждения воспроизводятся, например, в [89, с. 290—296]): dui/dt = XiUi + u2, diiz/dt = %iii2 + г/3, dui-Jdt = kiuit-i + щ1Ч duijdt = kiui^ 5* m
dun-ik+1/dt = }4-un-ikn -(- itn-i^+o, dun~ik+2/dt= Xkun-ik+2 r un-ik+s, diin^/dt = hun-! + un, dujdt = kkun. Полученная система распадается на ряд подсистем, каждая из которых соответствует элементарному делителю (А, — Хк) к определителя формы Яф — if) и интегрируется независимо, начиная со своего последнего уравнения. Применением теории элементарных делителей Вейерштрасса к теории систем линейных дифференциальных уравнений с постоянными коэффициентами занимался также воспитанник Парижской нормальной школы, профессор факультета наук в Марселе, Луи Соваж (1895) [362]. Для интегрирования таких систем применялись и другие методы, например модификация метода Лапласа [333, 1-е изд., т. 3, с. 395], метод, использующий теорию вычетов Коши, и др. (см. [388, § 32]). 4.2. Краевые задачи. Теория Штурма — Лиувилля Первые краевые задачи были поставлены для дифференциальных уравнений без параметра: так называемых уравнений Эйлера, возникавших в связи с задачами на экстремум функционала F [у (х), у' (х), х] dx xt при фиксированных хг и х2 (см., например: Эйлер Л. Метод нахождения кривых линий, обладающих свойством максимума либо минимума. . . (1744)). Примером такой задачи служит известная задача о брахистохроне, приводящая к уравнению dy = }[xl(a — х) dx, где а = const, с краевыми условиями У ixi) = Уг> У (Ъ) = Уг (см. ИМ, т. 3, с. 455-460). Однако наибольшее развитие в XIX в. получили исследования о граничных задачах для линейных дифференциальных уравнений с коэффициентами, зависящими от параметра. Такие задачи во множестве возникали при употреблении метода разделения переменных (метода Фурье) для решения линейных уравнений с частными производными математической физики. Рассмотрим, например, процесс распространения тепла в неоднородном тонком брусе (его рассматривает и Ш. Ф. Штурм в работе [380] 1836 г., речь о которой пойдет еще впереди). Он описывается уравнением / да \ ди д\к^И g(*>lr= а* ~п(х)и (44) 132
(и (х, i) — температура в точке х в момент времени t; g (х), к (х), п{х) — положительные функции от х) с > граничными [к (х) ди/дх - hu]x=0 = О, (45) [к (х) ди/дх + Hu]x=i = 0 (46) (/г, Н — константы > 0) и начальным и (х, 0) = / (х) (47) условиями. Если искать решение в виде произведения функций только отхи только от U и (х, t) = X (х) Т (£), то для определения этих функций получится пара обыкновенных дифференциальных уравнений dT (t) * m ,,ч d (к (х) dX (x)/dx) , /Л , ч / w v , , п /70ч —LL = — XT (t), dx ^ ^g (x) " n W) Л W = ° (48) с произвольным параметром к. Первое из них имеет решение Т (t) = ег^С, где С — произвольная постоянная. Решение уравнения (44) ищется в виде и = Се~иХ (х). Если подставить его в соотношения (45), (46), то граничные условия для X (х) будут к (0) X' (0) - hX (0) - 0, (49) к (I) X' (I) + НХ (/) = 0. (50) Таким образом, получается линейное дифференциальное уравнение (48), включающее параметр Я, с граничными условиями (49), (50). Значения^, при которых уравнение (48) при условиях (49), (50) имеет нетривиальное (т. е. отличное от тождественного нуля) решение, называются «собственными значениями» задачи. Эти «собственные значения» находятся из уравнения для X, которое получается в результате подстановки решения уравнения (48) при условии (49) в соотношение (50). Соответствующие «собственным значениям» Хг <^ Х2 <^ Х3 <^ . . . решения Хг (х), Х2 (х), Х3 (#),. .. задачи (48)—(50) носят название «собственных функций» задачи. Функция и ■ ЪС{Х{{х)е -г. л где С\ — произвольные постоянные, будет тогда решением уравнения (44) при краевых условиях (45), (46). Для того чтобы получить решение этой задачи, удовлетворяющее также начальному условию (47), необходимо найти коэффициенты С\ в соотношении 2 №(*) = /(*). Граничные задачи для линейных дифференциальных уравнений с параметром начал рассматривать еще Д&ламбер [143, § 133—136; 144, т. 1, с. 1—64; 145] в связи с проблемами теории колебаний. Эта же проблематика привела к ним Эйлера (1764 (66)) [156] (см. п. «Уравнение цилиндрических функций» в подразделе 4.3) и Лагранжа (1760—1761 (62)) [230]. Лаплас (1782 (85)) [238] (см. п. «Уравнение сферических функций» в подразделе 4.3) пришел к таким задачам в связи с теорией притяжения планет. 133
В первые десятилетия XIX в. их рассматривали уже многие. Особо отметим здесь знаменитую «Аналитическую теорию тепла» Фурье (1822), в которой систематическое применение восходящего к Даламберу (см. [151]) метода разделения переменных (метода Фурье!) привело к целому ряду задач такого вида, а также исследования Пуассона по теории теплопроводности (1823) [355], (1835) [356]. Задачи такого типа приводят к необходимости изучения вопросов: 1) о свойствах собственных значений задачи (их вещественности, положительности, счетности их множества и т. д.); 2) о поведении собственных функций; 3) о разложении произвольных функций в бесконечные ряды по собственным функциям (или, как часто говорят, в обобщенные ряды Фурье). Вокруг этих вопросов в работах Штурма и Лиувилля сформировались начала теории, получившей впоследствии их имя [106—110] (из недавних работ см. [286, 23—26]). Работы Штурма Выходец из Швейцарии Шарль Франсуа Штурм (1803—1855) рано добился признания работой о сжатии жидкостей, написанной вместе с Д. Кол- ладоном и удостоенной в 1827 г. премии Парижской академии наук, а также знаменитым результатом о распределении действительных корней многочлена (1829) [377], (1835) [378]. Однако, как иностранец и протестант, он долгое время занимал сравнительно скромное положение, пока в 1836 г. благодаря самоотверженной поддержке его друзей Лиувилля и Дюамеля, которые в последний момент сняли свои кандидатуры, не был избран членом Парижской академии наук. В 1839 г. он получил кафедру в Политехнической школе, которую сохранял за собой до самой смерти. Краевые задачи линейных дифференциальных уравнений Штурм начал изучать в конце 20-х годов и основные свои результаты опубликовал в 1836 г. в двух обширных мемуарах — «Мемуаре о линейных дифференциальных уравнениях второго порядка» [379] и «Мемуаре об одном классе уравнений с частными производными» [380]. В дальнейшем мы будем называть их соответственно первым и вторым мемуаром Штурма. Первый мемуар посвящен качественному исследованию поведения решения Х^ (х) уравнения ± (tf (%, х) Щ^) + G (%, х) Хх (х) = 0, х(= (а, Р), удовлетворяющего условию Г K(K,x)dXK{x)ldx -I L—xji-)—La=h^- Предполагается, что К (к, х) ^> 0 при любых к и х ЕЕ [ос, р]. Особое внимание в мемуаре уделяется изучению поведения Х% {х) при изменении параметра к, в частности ее осцилляционным свойствам. Среди многочисленных доказанных Штурмом результатов — утверждение, известное в литературе как теорема сравнения Штурма: Пусть даны два уравнения 134
(х ЕЕ (a, j3)), такие, что G2 (х) > 6^ {х), Кг^ К2^> О, тогда между двумя последовательными нулями хъ х2 функции Хг (х) — нетривиального решения первого уравнения — обязательно лежит по крайней мере один нуль функции Х2 (х) — произвольного решения второго (или Х2 (х) = = СХг (х) на отрезке [хи х2]). Рассуждения Штурма далеко не всегда отвечают теперешним критериям строгости, приводимые им формулировки не вполне корректны (не оговаривается, к примеру, гладкость фигурирующих в них функций — это начнет делать Лиувилль, см. ниже). Однако нужны лишь некоторые уточнения для того, чтобы сделать изложение Штурма приемлемым для современного читателя. Эти замечания в полной мере относятся и к его второму мемуару, в котором исследуется задача распространения тепла в неоднородном тонком брусе. Она, как мы уже отмечали выше, сводится к уравнению (44) с граничными условиями (45), (46) и начальным условием (47). Штурм сводит ее к решению уравнения (48) с граничными условиями (49), (50). Он доказывает, что: 1) существует бесконечное множество собственных значений задачи 0 "С ^i <С ^2 <С ^з <Г • • . <Скп <С • - •', все они действительны и неотрицательны; 2) если Хг (х), Х2 (х),. . ., Хп (х). . . — собственные функции, со- ответствующие этим собственным значениям, то \ g (х) Хт (х) Хп (х) dx = 0 а для т Ф п — свойство ортогональности собственных функций с весом £(*); 3) Хк (х) (к = 1, 2, . . .) конечна на [а, |3] и имеет на (а, |3) к — 1 корней, при прохождении через которые она всегда меняет знак; 4) между двумя последовательными корнями Хт (х) содержится в точности один корень Хт_! (х). В итоге распределение тепла в брусе будет задаваться рядом и (х, t) = СгХг (х) е~^ + С2Х2 (х) е~^ + ... + СпХп (х) е~Кп + ..., где Р $g(x)X.(x)f(x)dx I g (х) Х\ (х) dx а Вопросы сходимости этих рядов, а также представимости функций обобщенными рядами Фурье по системе собственных функций Х\ (х) (i = 1, 2,. . .) Штурм не изучал. Оба мемуара Штурма составили тот фундамент, на котором была построена теория Штурма—Лиувилля. Однако этим не исчерпывается их значение для истории математики. В этих мемуарах мы находим исторически первое последовательное развитие качественного подхода к исследованию обыкновенных дифференциальных уравнений14, предваряющее качественные теории А. Пуанкаре и А. М. Ляпунова (см. ниже, раздел 6). Доказанные Штурмом первые теоремы о собственных значениях и собственных функциях краевых задач составляют начало спектральной теории — один из главных источников функционального анализа (см. [152]). 14 Первый известный нам пример такого подхода мы находим в работе Ж. Даламбера 1763 г. (опубл. в 1770 г. [145], см. [286]). 135
Работы Лиувилля Дальнейшее развитие теории связано с именем Лиувилля. В 1836—1837 гг. он выпускает три мемуара «О разложении функций или частей функций в ряды, различные члены которых удовлетворяют тому же самому дифференциальному уравнению, содержащему переменный параметр» [265— 267], непосредственно примыкающие к исследованиям Штурма и развивающие идеи его собственной работы [261] 1830—1831 гг. (см. [286]). Если Штурма интересовало преимущественно качественное поведение собственных функций, то Лиувилль основное внимание уделил вопросам разложения функций в ряды Фурье по собственным функциям краевой задачи. Он рассматривает уравнение Штурма (44) с граничными условиями (45), (46) и начальным условием (47). Соответствующее решение уравнения (48) он ищет методом последовательных приближений. Центральным . для Лиувилля становится вопрос сходргмости ряда ь \g (х) Хп (х) f (х) dx JT ип (х) = JT Хп И -^ • п-1 n=i jjg(x)X2n(x)dx а Он сводит его к доказательству неравенства | ип (х) | < М/п\ где М — константа, не зависящая от п. Это доказательство, использующее приведение уравнения (48) к интегральному (о значении этих результатов для ранней теории интегральных уравнений см. [285]), опирается на асимптотическое выражение для собственных значений /у- (п - 1) я , Р0 I К ~ - h {п „ !) я , где у и Р0 — константы. Доказывая сходимость, Лиувилль во втором из указанных мемуаров предполагает относительно g (х), к (х) и / (х), что их «первые и вторые производные всегда сохраняют конечные значения», а также (это его предположение содержится в неявной форме), что / (х) удовлетворяет граничным условиям (49), (50). В третьем мемуаре Лиувилль снимает некоторые из этих ограничений: в частности, от функции / (х) не требуется более выполнения условий (49), (50), но только непрерывность. Как показывает анализ доказательства 1286, с. 58], Лиувилль неявно использует дифференцируемость функции к (х) и кусочную монотонность функции / (х). Итак, мы видим, что Лиувилль уже в 1837 г. понимал, что утверждение теоремы может быть усилено за счет смягчения предпосылок и что минимальные необходимые предпосылки могут быть получены из анализа доказательств. Такое понимание взаимодействия предпосылок теоремы и ее доказательства, которое ранее в 1829 г. проявилось в работе Дирихле о рядах Фурье, становится нормой лишь к концу XIX в. Данное Лиувиллем в первом из указанных мемуаров доказательство оо того, что ряд J; ип (х) будет иметь своей суммой/ (х), оказалось совершенно 71=1 неудовлетворительным. Ряд мемуаров Лиувилля (1837) [269], (1838) [272] и др. посвящен обобщению результатов теории на уравнения более высокого порядка. 136
Дальнейшее развитие теории Штурма—Лиувилля Активный интерес математиков к теории Штурма—Лиувилля возобновляется лишь к 80-м годам, когда наметилось общее усиление интереса к изучению дифференциальных уравнений в действительной области. Развитие вопроса шло в нескольких взаимно связанных направлениях. Прежде всего изучались различного рода обобщения задачи: на уравнения более высокого порядка.(Стрэтт (лорд Рэлей) (1877) [376], Кирхгоф- (1879) [216], Майер (1888) [293] и др.), на случаи, когда к (х) в уравнении (48) имеет нули в промежутке [а, р], — исследования начались здесь со- специальных случаев уравнений, таких, как уравнение Бесселя (Шлефли (1876) [363]), а затем были продолжены на более общие случаи крупным специалистом в теории Штурма—Лиувилля профессором Гарвардского университета (США) Максимом Бохером (1867—1918) (1899) [106] и др. Наконец, Ф. Клейн распространил результаты теории Штурма—Лиувилля на уравнение С несколькими параметрами (1881) [218]. Другое направление развития теории — ликвидация пробелов и неточностей (а иногда и прямых ошибок) в доказательствах Штурма и Лиувилля. Уточнению результатов Штурма были посвящены работы Бохе- ра 90-х годов [106]. Особую сложность для исследователей представило нахождение взамен неверного доказательства Лиувилля правильного вывода, что ряды Фурье сходятся к раскладываемым функциям. Первые строгие результаты были получены здесь выдающимся русским математиком В. А. Стекловым, Владимир Андреевич Стеклов родился в 1864 г. в Нижнем Новгороде, ныне Горький. Учился на физико-математическом факультете Харьковского университета, где его учителем был А. М. Ляпунов. Оставленный в университете для подготовки к профессорскому званию, в 1894 г. защитил магистерскую диссертацию «О движении твердого тела в жидкости», а в 1902 г. — докторскую «Общие методы решения основных задач математической физики», принесшую ему мировую известность. В 1903 г. был избран членом-корреспондентом Российской академии наук. В 1906 г. он оставляет Харьковский университет и переезжает в Петербург, где занимает кафедру математики столичного университета, на которой в полной мере развернулось его педагогическое дарование. Здесь он воспитал многих учеников, ставших впоследствии известными учеными, создал целую школу в области математической физики. В 1910 г. Стекло» был избран адъюнктом Академии наук, а в 1912 г. — ординарным академиком. Когда произошла Великая Октябрьская социалистическая революция, он оказался среди представителей интеллигенции, сразу вставших на сторону советской власти. В 1919 г. он был избран вице-президентом Академии наук. В 1921 г. под его руководством создается Физико- математический институт, впоследствии разделившийся на три, один из которых — Математический институт АН СССР — носит ныне его имя. Умер Стеклов в 1926 г. (о его творчестве см. [13, 19, 85]). Развивая метод Шварца—Пуанкаре, разработанный (1894) [352] в связи с задачей разложения по собственным функциям оператора Лапласа, и свою знаменитую теорию замкнутости (см. [13, 19, 85]), Стеклов в ряде работ, открывающемся мемуаром 1896 г. «Задача об охлаждении неоднородного твердого стержня» [87], доказал ряд теорем о представлении функции рядом по собственным функциям задачи Штурма—Лиувилля. И если в 1896 г. Стеклов предполагал наличие четырех непрерывных производных функции / (х), то в дальнейших работах (1901) [371], (1907) [372], (1910) [373, 374], (1913) [375] требования к ее гладкости существен- 137
В. А. СТЕКЛОВ но понизились. Так, в работе 1913 г. было показано, что всякая функция / (х), удовлетворяющая условию Липшица (| / (х) — / (у)\ <J т \ х ~ у |, где т — константа) и граничным условиям / (а) = / (Р) = 0, разлагается в равномерно сходящийся на (а, Р) ряд оо Hx)=2>CiXi(x) 1 = 1 по собственным значениям задачи Штурма—Лиувилля X" (х) + Ykp (х) ~q(x)]X (х) = О, X' (а) = аХ (а) + ЪХ ф), X' (Р) = сХ (а) + dX (Р) (я, Ь, с, d — константы, a -f- d = 0), где р (х) ^> 0, q (х) — непрерывные функции. Важное обобщение этого результата связано с исследованиями берлинского профессора, десять лет до того проработавшего в Дерптском— Юрьевском (ныне Тартуском) университете, впоследствии (с 1905 г.) профессора в Бреслау, многолетнего корреспондента В. А. Стеклова (см. [88]), избранного в 1924 г. по его предложению иностранным членом-корреспондентом АН СССР Адольфа Кнезера (1862—1930). В 1904 г., накладывая довольно сильные ограничения на коэффициенты р (х) и q (х), он доказал [221] аналогичную теорему для произвольной кусочно-непрерывной функции / (х) с ограниченным изменением (в точках разрыва х ее значения полагаются равными (/ (х — 0) + / (х -f- 0))/2 — результат, аналогичный теореме Дирихле в теории тригонометрических рядов). 138
4.3. Решение уравнений в виде рядов и специальные функции Когда в начале XVIII в. Б. Тейлор приступил к изучению процесса колебания струны, то он описал его системой обыкновенных дифференциальных уравнений. Стремясь найти более точное математическое выражение задачи, Даламбер в 1747 г. пришел к известному уравнению с частными производными второго порядка. Такая последовательность подходов характерна для XVIII в.: задачи интегрирования обыкновенных дифференциальных уравнений ставились как прямой ответ на проблемы механики и физики, а уравнения с частными производными возникали либо на путях уточнения моделей, либо в тех случаях, когда сама сложность явления просто не позволяла описать его обыкновенными уравнениями. В XIX в. ситуация приняла до известной степени обратный характер: многочисленные уравнения с частными производными математической физики, записанные в различных системах координат и решаемые методом разделения переменных, приводили к различным обыкновенным дифференциальным уравнениям специального вида. Их интегрирование в квадратурах, как правило, не удавалось. Решение же их с помощью рядов привело к открытию ряда трансцендентных функций, чрезвычайно обогативших арсенал анализа. Рассмотрим некоторые из таких уравнений и соответствующие им функции. Уравнение цилиндрических функций Уравнение, известное в литературе как уравнение цилиндрических функций (термин, предложенный Э. Гейне [201, с. 128]) или как уравнение функций Бесселя (термин О. Шлёмильха [365, с. 137]), или просто уравнение Бесселя, dx* + х dx + V х* )У —U рассматривалось уже в XVIII в. (об истории этого уравнения и цилиндрических (бесселевых) функций см. [389, 10, 18, 390]). К такому уравнению пришел Л. Эйлер (1764 (66)) [156], интегрируя методом разделения переменных записанное в полярных координатах уравнение колебания упругой круглой мембраны 1 дН _ \_ dz_ дЧ_ 1 дЪ ~W ~W ~7~ ~дг "■" дг2 •" г2 дф2 (см. ИМ, т. 3, с. 428—429), где I — постоянная, зависящая от плотности и упругости мембраны. Уравнение Бесселя с помощью элементарного преобразования получается из уравнения Риккати. Поэтому, как следовало из результатов Лиувилля (1841) (см. подраздел 3.1), оно в общем случае не интегрируется в квадратурах. Эйлер нашел решение этого уравнения в виде ряда, совпадающего (с точностью до множителя) с бесселевой функцией первого рода Jn (х) произвольного целочисленного п. Впрочем, ряды, определяющие отдельные функции Jп (х), встречались уже ранее: ряд для функции /i/3 (х) в 1703 г. в письме Я. Бернулли Лейбницу [Б50, т. 3, с. 75], ряд для /0 (х) в работе Д. Бернулли о малых колебаниях цепей (1732— 1733 (38)) [104]. Специальные случаи уравнения Бесселя, а также их решения в виде рядов, представляющих соответствующие функции Бесселя первого рода с целочисленным индексом, рассматривали (см. [10, с. 373—374]), 139
решая методом разделения переменных различные задачи математической физики, Ж. Л. Лагранж(1770), С. Д. Пуассон (1821), Ж. Б. Фурье (1822), М. В. Остроградский (1832). В 1824 г. вышла работа известного астронома и математика из Кенигсберга Ф. Бесселя (1784—1846) «Исследование тех планетных возмущений, Которые возникают от движения Солнца» [105], в которой начато систематическое изучение цилиндрических функций первого рода с целыми 1 (* индексами как особого рода функций. Обозначая интеграл -^— \ cos(/ie — о — ftsine)ds через /,? (трансформировавшееся впоследствии в J и (к)), Бессель называл его «определенным интегралом /;!», просто «интегралом 7». иногда «функцией II». Для функции Jп (х) (мы будем пользоваться принятым сегодня обозначением) он нашел разложение ХП (а Л2 ХХ Л ЛИ= 2"Г(л + 1) у- 2(2^ + 2, + 2.4.(2n + 2)(2ii + 4) ~ '"] и установил ряд свойств, в том числе важных рекуррентных формул. К работе были приложены таблицы J0 (х) и /х (х) с десятью десятичными знаками для х от 0 до 3,2 с шагом 0,01. В 1857 г. вышла работа профессора Дрезденского политехникума Оскара Шлёмильха (1823—1901) «О функции Бесселя» [365], в которой впервые бесселевы функции первого рода с целыми индексами рассматривались как объект специальной математической теории вне зависимости от задач прикладного характера. В 1868 г. профессор физики в университете в Эрланггне (а позднее в Мюнхене) Э. Ломмель (1837—1899) в сочинении «Исследования о бесселевых функциях» [283] построил теорию цилиндрических функций первого рода для любого вещественного индекса, а в 1869 г. профессор Тюбингенского университета, работавший до этого в Лейпциге и Эрлангене, Герман Ганкель (1839—1873) в статье -«Цилиндрические функции первого и второго рода» [195] построил ее уже для комплексных индексов, и не только для функций первого рода, о которых до сих пор шла речь, но и для функций второго рода. Цилиндрические функции второго рода как интегралы уравнения Бесселя, полученные в виде рядов, можно найти в работах Эйлера, Фурье и Пуассона. Как особый класс функций их изучение начал тюбингенский (а с 1868 г. — лейпцигский) профессор Карл Нейман (1832 —1925), ограничившись случаем целочисленных индексов, в вышедшей в 1867 г. книге «Теория бесселевых функций. Аналог теории шаровых функций» [307]. Он ввел для них специальное обозначение Yn (х). Ему же [Там же, с. 163] принадлежит термин «функции первого рода» для функций Jn(x), введенный им по аналогии с шаровыми функциями. Термин «бесселевы функции второго рода» мы находим у Ломмеля на с. III упомянутой выше работы 1283] 1868 г. Функция Неймана Yn (х) связана с принятой в настоящее время канонической функцией второго рода Уп (х) равенством Yn (х) = (я/2) Yn (х) + (In 2 - у) Jn (*), где 7 — постоянная Эйлера. Функция Yn (х) была введена Генрихом Вебером (1842—1913) (см. Кн. 1, с. 115) в статье «Об установившихся движениях электричества в цилиндрах» (1873) [392] и обозначена им Кп (х) (обозначение Yп (х) установилось после Дж. Ватсона (1886—1965) (см. [10])). 140
н. я. сонин К. Нейман изучил (1867) [308] вопрос о разложении произвольной -функции / (z), аналитической в области, содержащей начало координат, в ряд по функциям Бесселя: / (z) = a0J0 (z) + ol1J1 (z) г aj2 (z) + . . ., где оц — константы. В исследованиях по теории цилиндрических функций часто встречается комбинация функций первого и второго рода Jn (х) ± iYn{z)- Н. Нильсен (1865—1931), датский математик и историк математики, дал им специальные обозначения Нп (#) и Нп (х) и назвал функциями третьего рода (1904) [310]. Исследования Со шча по теории цилиндрических функций Николай Яковлевич Сонин родился в 1849 г. в Туле, учился в Москве в гимназии, затем в университете, где его учителем был Н. В. Бугаев. В 1871 г. защитил магистерскую диссертацию «О разложении функций в бесконечные ряды» (Мат. сб., 1870, т. 5), а в 1874 г. — докторскую «Об интегрировании уравнений с частными производными второго порядка» (Мат. сб., 1874, т. 7). Начиная с 1872 г. и в течение 20 лет работал в Варшавском университете вначале приват-доцентом, а затем (с 1877 г.) профессором. Ему принадлежат замечательные результаты по теории цилиндрических функций, по теории полиномов Бернулли, по теории ортогональных полиномов (одна из систем таких полиномов носит его имя), по теории предельных величин интегралов и по приближенному вычисле- 141
нию интегралов и сумм. В 1892 г. он был избран членом-корреспондентом Академии наук, а в 1893 г. — ординарным академиком. По переезде в Петербург он принял активное участие в работе столичного математического общества, читал лекции на Высших женских курсах и в университете, в 1899—1901 гг. был попечителем Петербургского учебного округа, а затем членом Совета Министерства народного просвещения и председателем его Учебного комитета. Совместно с А. А. Марковым он издал в 1899— 1907 гг. двухтомное собрание сочинений П. Л. Чебышева. Скончался в 1915 г. Цилиндрические функции появляются у Сонина уже в его магистерской диссертации, где вопрос о разложении аналитической функции / (z) по некоторой системе функций Zn (z) сводится им с помощью формулы Коши ' v ' zju J а — z Y к разложению -^7 = YiAn(o)Zn{z). В качестве функций Zn (z) Сонин рассматривает наряду с функциями Ле- жандра Рп (z) и функциями zn/(l — zn) цилиндрические функции Jn (z). В 1880 г. вышел основной труд Сонина по рассматриваемому вопросу «Исследования о цилиндрических функциях и о разложении функций в ряды» [368]. Сонин выводит рекуррентные формулы dcp (х) 2п 2 51— = фд_! (X) — фп+1 (ж), фп-1 (X) + фп+1 (X) = — фп (ж), которым удовлетворяют цилиндрические функции всех трех родов. Он кладет эти формулы в основание теории, принимая их за определение общих цилиндрических функций, частными случаями которых являются цилиндрические функции первого, второго и третьего родов. Он вводит в рассмотрение новый класс функций, определяемых первым из двух указанных соотношений и условием фх (х) = — dyjdx. Яти функции,, обозначенные Сониным через Sn (х), получили название полуцилиндрических. Определение общих цилиндрических функций и функций Sn (х) распространяется им на случай произвольных вещественных п. В этом мемуаре, а также в работе 1904 г. «О цилиндрических функциях» [369] Сонин выводит многие свойства общих и специальных цилиндрических, а также полуцилиндрических функций, дает для них различные интегральные представления и разложения в ряды, а также новые разложения по этим функциям. Эти его конкретные результаты, а также общие идеи получили широкую известность и дальнейшее развитие [310, 10т 18, 6]. У раб пение сферических функций Изучение уравнения носящего в литературе имя Лежандра, началось в связи с известными исследованиями Лапласа и Лежандра по теории потенциала (см. ИМ, т. 3, 142
с. 442—450). Это уравнение возникает в ней в результате применения метода разделения переменных к уравнению потенциала, записанному в сферических координатах. У Лапласа оно и даже более общее уравнение (i-*)**-2z<!L+\n(n+l)—r^-r]y = 0, dx2 dx известное впоследствии как уравнение присоединенных функций Лежан- дра (об этом см. ниже), появляются в работе «Теория притяжения сфероидов и фигуры планет», опубликованной в 1785 г. [238]. Уравнения такого рода рассматривались еще Эйлером, изучавшим задачу их интегрирования посредством рядов [95, т. 2, кн. 1, гл. 8] и определенных интегралов, зависящих от параметра (об этом см. ИМ, т. 3, с. 387—393). (У Лапласа мы находим также уравнения сферических функций двух и трех переменных; он изучает эти функции — это, впрочем, выходит за рамки нашего очерка.) Однако функции Рп (х), являющиеся решениями этого уравнения, рассмотрел ранее Лежандр в работах «Исследования о притяжении однородных сфероидов» (1785) [240] и «Исследования о фигуре планет» (1787) [241], основные результаты которых получены Лежандром до 1782 г. и были известны Лапласу (см. введение к 1-му тому 2-го издания книги [200]). Лежандр получил Рп (х) (п — неотрицательные целые числа) как коэффициенты в разложении v п=0 ля функций р /^.ч 1-3-5. . . Г2^ — 1) Г „ п(п- *wW— 1.2... п \ 2(2п , it (ii-l) (я-2)01-3) гп-4 , 2.4.(2л —1)(2и —3) ' ' -1) -1) •}• хп~2 + получивших в последующей литературе наименование полиномов Ле- жандра, он установил [241, с. 373; 242, с. 384]: i pm{X)Pn{X)dX=,[ \ ;-*»;' J [ 2/(2л + 1) (т = п) — на современном языке свойство ортогональности полиномов Рп (х). Лаплас в «Трактате по небесной механике», опубликованном в 1825 г. [239, т. 5, кн. 2, гл. 2], установил интегральное тождество Рп (х) = -L С [х + cos ф /х2 — Цп <*Ф, позволившее впоследствии распространить функцию на область комплексного переменного. Полиномам Лежандра, получившим многочисленные практические применения, в XIX в. посвящена большая литература (обширную библиографию вопроса можно найти в статье [390]; эта статья, а также книга [200] богаты историческим материалом; отдельные исторические справки можно найти в [91, 15, 7]). Отметим здесь лишь отдельные исследования. 143
Французский математик и экономист О. Родриг (1794—1851) дал представление [359] 1 dnix*—i\n Рп(х) = - d {Х 1) 2 п\ dx В 1833 г. вышла небольшая книга Р. Морфи «Элементарные принципы теорий электричества, тепла и молекулярных взаимодействий» [301], содержащая первый очерк теории полиномов Лежандра, а также ряд собственных результатов автора. В частности, мы находим в ней формальное разложение функции в ряд по полиномам Лежандра Рп (х). В дальнейшем этот вопрос исследовали К. Нейман (1862) [306] и Людвиг Томе (1841 — 1910) (1866) [383], получивший образование в университетах в Бонне, Мюнхене и Берлине, впоследствии профессор Берлинского и Грейфсвальдского (с 1874 г.) университетов. Особое место в изучении полиномов Лежандра и шире — сферических функций — занимают работы Генриха Эдуарда Гейне (1821 — 1881). Гейне учился в Берлине и Гёттингене, преподавал в университетах в Бонне и с 1848 г. в Галле. Занимался различными вопросами анализа и его оснований. Основные его результаты по теории сферических функций содержатся в диссертации 1842 г. [197], в статье «О некоторых задачах, которые приводят к дифференциальным уравнениям с частными производными» (1843) [198] и в вышедшем двумя изданиями (1861 и 1878— 1881) «Руководстве по сферическим функциям» [200]. Существенно переработанное и дополненное второе издание этой книги — лучшее и наиболее полное руководство по сферическим функциям в XIX столетии. Гейне ввел понятие полинома Лежандра второго рода п (Х) - 1-2-3..■>» ( г , (п + 1)Ш + 2) з , VnW— 1.3... (2/i-l) Г ^ 2{2п + 3) Х г (п+1)...(» + 4) ^ 2.4.(2тг + 3)(2д + 5) Х Г" — второго наряду с Рп (х) (полиномом Лежандра первого рода, в обозначениях Гейне Р^п) (х)) частного решения уравнения Лежандра. Он обозначил его QW (х) (диссертация (1842) [197], статья (1843) [198]) и назвал шаровой функцией второго рода (Kugelfunktion zweiter Art). Он определил также [197, § 7, 8] присоединенные полиномы Лежандра первого» второго #Г(*) = (*2-1)»/*(-1)- ,ri 2п\ v» ' dxnbm и второго 1-3. . . (2п + 1) <*т<?„(*) (п + т)\ dxr> родов 15, являющиеся независимыми интегралами уравнения рассмотренного, как уже указывалось выше, еще Лапласом. Он обозначил их Рт (х) и (?т (х) и назвал присоединенными (zugeordnete) шаровыми функциями [200, 1-е изд.]. (Несколько иначе определял присоединенные 15 Разумеется, отдельные функции такого вида, равно как и примеры полиномов Лежандра второго рода, встречались у различных авторов (Эйлера, Лапласа, Лежандра, Гаусса и др.) и до Гейне, но лишь в его работах они были выделены в специальные классы и было начато систематическое их изучение. 144
шаровые функции известный кёнигсбергский физик и специалист по математической физике Франц Нейман (1798—1895), см. [309, с. 22].) Гейне рассматривал введенные им функции для произвольных комплексных значений независимой переменной х. Более того, он начал рассматривать их для произвольных (действительных и комплексных) значений параметров пит (1878) [200, 2-е изд., т. 1], обобщив тем самым понятия обыкновенных и присоединенных полиномов Лежандра до понятий, соответствующих современным обыкновенным и присоединенным функциям Лежандра. Соответствующие его рассмотрения, однако, не всегда полны и корректны (см. [15, с. 174]). Систематическую разработку теории функций Лежандра Рп (х) и Qn (х) для произвольных комплексных индексов п начал профессор университета в Берне Людвиг Шлефли (1814—1895) в опубликованной в 1881 г. работе «О двух сферических функциях Гейне с любым параметром и их не имеющем исключений представлении определенными интегралами» [364]. Функции Р™ (х) для произвольных значений пит исследовал кембриджский математик Эрнст Гобсон (1896) [208], Р™ (х) и Q% (х) — Р. Олбрихт (1888) [311]. Несколько слов о терминологии. Термин «Kugelfunktion» восходит к Гауссу (1828) [176], употребившему его для соответствующих функций двух переменных. Во французской литературе широко употребляется аналогичный термин «fonctionspherique», в английской — термин «зональная гармоническая (zonal harmonic) функция». Гипергеометрическое уравнение Так называют уравнение (а, р, у — константы). О результатах Эйлера и Гаусса по его интегрированию подробно рассказывалось в разделе «Теория аналитических функций» (см. Кн. 2, с. 133—138); мы лишь напомним, что в восьмой главе второго тома «Интегрального исчисления» Эйлера (1769) рассматривается более общее уравнение, получившее впоследствии наименование уравнения Эйлера: х2 (а + Ъхп) d2y + х (с + ex11) dydx + (/ + gxn) ydx2 = 0, решение которого Эйлер разыскивал как в виде обобщенного степенного ряда, так и в форме определенного интеграла (см. также ИМ, т. 3, с. 387 — 393). Само гипергеометрическое уравнение встречается во II главе второго тома «Интегрального исчисления» Эйлера (1769), где приводится его решение в виде интеграла 1 у= § ut-1 (1 — m)v-0-i (1 — хи)-* duy о который разлагается в ряд У — В(Р,у — р)[1+-Г^Гх+ i.2.v.(V + l) +---J 1 (В (р, q)= \ х1'1 (1 — xY~xdx — эйлеров интеграл первого рода). 145
Начало систематическому изучению функции ^ i-v Х^ 1.2.Y.(v + l) ' "" известной в литературе как гипергеометрическая, положил Гаусс работой «Общие рассуждения о бесконечном ряде 1-4- Т х + + ^_LMiE_hlL^2 + >_ Часть первая» (1813) [174]. Сумму этого ряда, к которому Гаусс пришел в связи с задачами астрономических вычислений, он обозначил через F (а, Р, у, х). Термин «гипергеометрический» для обозначения этого ряда у него не встречается; впервые его употребление в этом смысле мы находим в 1797 г. в «Аналитических исследованиях...» И. Ф. Пфаффа [326] (см. Кн. 2, с. 133); в общее употребление он входит после работы Куммера [228] 1836 г., речь о которой пойдет ниже (сам термин появляется в 1655 г. у Валлиса для обозначения ряда с общим членом а [а + Ъ) {а + 2Ъ). . .(a + (п — 1) Ь); в этом смысле его употреблял Эйлер). Гаусс устанавливает сходимость гипергеометрического ряда при ]\х \ <^ <^ 1, исследует его сходимость при х = 1, устанавливает ряд свойств функции F (а, Р, у, х) при вещественных а, Р, у (уф 0, —1, —2, . . .). Сходимость ряда на окружности | х | = 1 при комплексных а, Р, у была исследована Вейерштрассом в работе «О теории аналитических факультетов», опубликованной в 1894 г. [Б57, т. 1, с. 153—221]. Во второй части рассмотренной работы Гаусса, озаглавленной «Определение нашего ряда посредством дифференциального уравнения второго порядка» и опубликованной только в 1866 г. [Б37, т. 3, с. 207—229], было показано, что F (а, р, у, х) — решение гипергеометрического уравнения. Гаусс находит также второе независимое его решение у = F (а, р, а + р + 1 - у, 1-х) и записывает общее решение в виде у = CXF (а, р, Т, х) + C2F (а, р, а + р + 1 - Т, 1 - х), где Сх и С2 — произвольные постоянные. Эта вторая часть работы Гаусса была опубликована уже после его смерти. Неизвестно, был ли с ее результатами знаком Э. Э. Куммер (о Куммере см. Кн. 1, с. 93—94), который в работе «О гипергеометрическом ряде...» (1836) [228] определил все возможные виды решений гипергеометрического уравнения, соответствующие, как бы мы сказали сегодня, трем его особым точкам: х = 0, х = 1 и х = оо. Он показал, что гипергеометрическое уравнение в предположении, что ни одно из чисел у, у — а — Р, р — а не является целым числом, допускает 24 частных решения вида хр (1 -x)qF(a\ Р', у', t), где t — одна из переменных х, 1-х, Их, 1/(1 — х), х/(х — 1), (х — 1)/х, а р, д, а', Р', у' — выражения вида аа + бр + СУ + d, где а, 6, с, d принимают одно из значений 0, 1, —1. Разумеется, всякие три из этих 24 решений, имеющие общую область существования, должны быть линейно зависимы. 146
Г. ЛАМЕ К аналогичным результатам, используя интегральное представление решения гипергеометрического уравнения, пришел Якоби в работе «Исследования о дифференциальном уравнении гипергеометрического ряда», опубликованной посмертно в 1859 г. [214]. Дальнейшие успехи в теории гипергеометрического уравнения связаны уже с его изучением в области комплексного переменного. Мы еще будем говорить о них, рассматривая историю аналитической теории дифференциальных уравнений. Исторические сведения о развитии теории гипергеометрической функции и гипергеометрического уравнения можно найти в Кн. 2, а также в [220, 181, 90, 91, о]. Другие уравнения, определяющие специальные функции Рассмотрим еще несколько типов таких уравнений. Начнем с уравнения (р2 — а2) (р2 — Ъ2) (р2 — с2) d2R 2рб — (а2 + Ь2 + с2) р4 + ^Ь2с2 dR __ р2 dp2" •" р3 dp — [n(n+l)p* + h] Д = 0, в котором а, 6, с — действительные числа, п — целое число, h — произвольная константа. Это уравнение, получающееся в результате применения метода разделения переменных к трехмерному уравнению Лапласа, записанному в эллиптических координатах, известно в литературе как уравнение Ламе. 147
Оно названо по имени французского математика Габриэля Ламе, родившегося в Туре в 1795 г. Ламе учился в Париже, где окончил Политехническую, а затем Горную школу. В 1320 г. он был приглашен в Россию на место профессора Петербургского института путей сообщения. В 1829 г. был избран членом-корреспондентом Петербургской академии наук. В конце 1831 г. Ламе вернулся в Париж, где вскоре занял кафедру физики в Политехнической школе. Позднее он работал также в Сорбонне, в 1843 г. был избран членом Парижской академии наук. Умер в 1870 г. Наиболее замечательные результаты Ламе относятся к геометрии и различным вопросам математической физики. Свое уравнение он получил в «Мемуаре об изотермических поверхностях...» (1837) [237], исследуя задачу распределения тепла в однородном эллипсоиде. В качестве решения этого уравнения он рассмотрел функции, названные впоследствии его именем. Под такими функциями понимают решения уравнения Ламе Rn (р), представимые либо в виде целого полинома от р2, либо в виде такого полинома, умноженного на одно или несколько из выражений ур2 — а2, 1/V2 - ь\ т/^^72. Функциям Ламе в XIX в. посвящена значительная литература. Первые крупные успехи в их изучении после Ламе связаны с работами Лиу- вилля (1845) [277—279] и Э. Гейне (1845) [199], которые, в частности, рассмотрев наряду с Rn (р) второе независимое решение уравнения Ламе, ввели понятие функции Ламе второго рода. Важные результаты по интегрированию уравнения Ламе были получены Ш. Эрмитом в 32-й лекции его «Курса анализа Политехнической школы» (1872 — 1873) [202], а также в ряде заметок, публиковавшихся в томах 85—94 «Докладов Парижской академии наук» в 1877 — 1882 гг. под общим названием «О некоторых применениях эллиптических функций»; эти заметки собраны в [Б42, т. 3, с. 266-418]. В работах Ф. Клейна (1881) [217], (1890) [219] и его учеников изучались обобщения функций Ламе. Наконец, А. Пуанкаре (1885) [349], (1902) [353] и А. М. Ляпунов (1905) [245] дали важные усовершенствования их теории в связи с собственными исследованиями проблем устойчивости вращающейся жидкости. Подробнее об изучении уравнения Ламе и функций Ламе в XIX в. см. [210, 390, 385, 200]. Уравнение dhjidx1 + (а — 2q cos 2х)у = 0 {a, q — действительные числа) носит название уравнения Матье. Оно названо так по имени французского математика и астронома Эмиля Матье (1835—1890), воспитанника Парижской политехнической школы, работавшего в Безансоне (с 1869 г.) и Нанси (с 1874 г.). Матье пришел к этому уравнению в 1868 г. в «Мемуаре о колебательном движении мембраны эллиптической формы» [290], решая методом разделения переменных двумерное волновое уравнение, записанное в эллиптических координатах. Периодические (с периодом 2я) решения этого уравнения называются функциями Матье. Систематическое их изучение начинается с 1878 г., когда появляется второе издание неоднократно упоминавшейся выше монографии [200] Э. Гейне о шаровых функциях. В 1877 г. американский астроном и математик Джордж Уильям Хилл (1838—1914) опубликовал мемуар «О части движения лунного перигея, которая является функцией средних движений Солнца и Луны» [206]. В этой работе, сыгравшей важную роль в истории математики (напомним, что в ней, в частности, изучались вслед за Фурье системы беско- 148
печного числа линейных уравнений с бесконечным числом неизвестных и бесконечные определители) и небесной механики, Хилл приходит к уравнению -тт + (6° + 0icos 2^ + 02 cos 4^ -f- . . .) w = О, где 0О, 01. • • . — известные параметры. За уравнением такого типа d2y/dx2 -j- А (х)у = О (А (х) — четная функция с периодом л), являющимся обобщением уравнения Матье, закрепилось название уравнения Хилла. К результатам Хилла, а также других ученых, касающимся уравнений с периодическими коэффициентами, мы еще вернемся, когда будем говорить о развитии качественных методов в теории дифференциальных уравнений. Об исследовании функций Матье, а также уравнений Матье и Хилла в XIX в. см. [210, 91]. Мы остановились здесь лишь на некоторых важнейших уравнениях, задающих специальные функции, представляющих особый интерес для самой теории дифференциальных уравнений. Многие типы специальных функций, имеющие широкие применения в математическом анализе и его приложениях (такие, например, как функции Струве, Вебера и др.)» остались за рамками изложения. Полиномы Чебышева были рассмотрены в первой части настоящей книги. «5. АНАЛИТИЧЕСКАЯ ТЕОРИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 5.1. Начало теории Коши. Работы Брио и Буке Как было показано Коши (см. подраздел 2.1), решения дифференциальных уравнений при довольно общих предположениях о характере уравнений являются аналитическими функциями комплексного переменного. Тем самым открывалась возможность применения методов теории аналитических функций к изучению решений дифференциальных уравнений, решения которых обладают теми или иными свойствами, представляющими интерес с точки зрения теории аналитических функций (однозначность, наличие особых точек того или иного вида и т. д.). Это и составило предмет аналитической теории дифференциальных уравнений, которая развивалась в неразрывной связи с теорией аналитических функций. Начало аналитической теории дифференциальных уравнений связано с именем О. Коши, опубликовавшего в 30—40-е годы ряд работ, содержащих теоремы существования аналитического решения начальной задачи для довольно широкого круга уравнений (см. об этом подраздел 2.1). Рассуждения Коши, однако, носили локальный характер — речь шла о решениях не во всей области их существования, но лишь в некоторой окрестности начальных данных. Более широкую постановку задачи мы находим у его учеников III. Брио (1817 — 1882) и Ж. Буке (1819 — 1885) (о них см. Кн. 2, с. 162). В 1856 г. в 21-м томе «Журнала Политехнической школы» появились три их совместные работы: «Исследование функций мнимой переменной», «Исследования о свойствах функций, определенных дифференциальными уравнениями» и «Мемуар об интегрировании дифференциальных уравнений посредством эллиптических функций». В первой, которую 149
Ж. БУКЕ «можно рассматривать как первый учебник по теории аналитических функций» (Кн. 2, с. 162), дается систематическое изложение известных к тому времени результатов (полученных в основном Коши). Вторая, представленная Парижской академии наук 21 августа 1854 г. и доложенная Коши на заседании в январе 1855 г.,— первое в истории исследование, посвященное собственно аналитической теории дифференциальных уравнений. Она начинается следующими словами [117, с. 133], выражающими сущность нового подхода: «Случаи, когда дифференциальное уравнение можно проинтегрировать, чрезвычайно редки и их следует рассматривать как исключения; но можно рассматривать дифференциальное уравнение, как определяющее функцию, и изучать свойства функции по самому уравнению». Именно этот подход кладется авторами в основу при изучении эллиптических функций в третьей из названных работ. Если у Коши вопрос об особых точках решений уравнения duldz = / (z, и) (51) лишь затрагивался, то Врио и Буке начали его систематическое изучение. Они рассмотрели поведение решения этого уравнения в окрестности точки z = О, и = О, в которой функция / (z, и) имеет особенность — обращается в ней в бесконечность, но функция 1// (z, и) аналитическая, затем они исследовали более сложный случай / (z, и) = ф (z, u)/ty (z, и), где ф (z, и), г|) (z, и) — функции аналитические в точке и могут обращаться в ней в нуль. Исследование последнего случая они свели к изучению аналогичного вопроса для уравнения (51) с / (z, и) = ф (z, u)/z, где ф (z, и) — 150
функция аналитическая в точке (0, 0) и обращается в ней в нуль. В третьем из названных мемуаров, представленном Парижской академии наук 31 декабря 1855 г., Врио и Буке предприняли изучение однозначных решений уравнений вида Р (du/dz, и) = 0, где Р — многочлен относительно du/dz, и. За такими уравнениями в литературе закрепилось их имя. 5.2. Б. Риман Многочисленные импульсы для развития аналитической теории дифференциальных уравнений исходили из исследований, касающихся конкретных уравнений для специальных функций (см. подраздел 4.3), в частности гипергеометрического уравнения. О посвященных ему работах Гаусса мы уже говорили ранее (см. там же). Важным этапом в его изучении и вместе с тем крупным шагом в развитии аналитической теории вообще стали исследования Б. Римана. В 1857 г. Риман опубликовал мемуар «Вклад в теорию функций, представимых рядом Гаусса F (а, (3, у, х)» [358]. «В настоящей работе,— пишет он [358, с. 159],— я изучаю гауссову трансцендентную функцию посредством метода, который в сущности остается применимым ко всякой функции, удовлетворяющей линейному дифференциальному уравнению с алгебраическими коэффициентами. С помощью этого метода можно почти непосредственно из определения вывести результаты, которые раньше получались иной раз в итоге достаточно кропотливых вычислений». Согласно этому «методу» или, лучше сказать, общему принципу Риман исходит из характеристики поведения функции в окрестности ее особых точек. И лишь потом в результате исследования приходит к дифференциальному уравнению, к аналитической формуле. Этот принцип был высказан Риманом еще в докторской диссертации «Основы общей теории функций комплексной переменной», опубликованной в 1851 г. (см. Кн. 2, с. 190—202), в следующих словах: «Теория этих функций, построенная на принципах, обоснованию которых посвящена настоящая работа, должна определять поведение функции... независимо от изображения ее той или иной формулой, а именно таким образом, чтобы к общему понятию функции комплексной переменной всякий раз прибавлялись только те свойства рассматриваемой функции, которые строго необходимы для ее определения, и уже г осле того эта теория должна переходить к вопросу об аналитических представлениях» [Б21, с. 82]. Этот принцип был положен им в основу построения теории абе- левых функций в лекциях 1855—1856 гг. С точки зрения рассматриваемого нами вопроса подход Римана противоположен подходу Брио и Буке, для которых дифференциальное уравнение служило определением изученных ими функций. Впоследствии к их подходу вернется Л. Фукс — об этом речь впереди. Риман рассматривает функцию (точнее, класс функций), удовлетворяющую требованиям: 1. Она аналитична во всех точках плоскости, кроме трех особых точек #1, а2, а3. 2. Между любыми тремя ветвями этой функции Рг, Р2, Р3 существует линейная зависимость где Ct — постоянные, хотя бы одна из которых отлична от нуля. 151
3. В окрестности точки at (i = 1, 2, 3) функция представляется в виде Са{ (z ~ aipfu (z) + C >(z- aipUi (*), гДв С a , С ' — постоянные, /1г (z) и f2i (z) — функции аналитические и i отличные от нуля в точке at. Относительно at, а[ (I = 1, 2, 3) предполагается, что ни одна из разностей at — ос- не есть целое число и, кроме того, аг + oci + ol2 4- a2 + a3 + аз = 1- Введенные таким образом функции переменной z Риман обозначает символом (ах а2 аъ \ )ai a2 «з 4 l a2 а'г Особые точки аг, а2, аъ он именует точками ветвления, а а, ах; а2, а2Г а3, а3 — первой, второй и третьей парой показателей функции. В литературе за этими функциями закрепилось название Р-функций Римана. Ряд соображений приводит его к заключению [Б21, с. 171], что «всякая Р-функция удовлетворяет некоторому линейному однородному дифференциальному уравнению второго порядка». Для функции /О оо 1 р\а Р О la' Р' Y (а к такому виду сводится рассмотрение произвольной Р-функции) Риман получает соответствующее дифференциальное уравнение. Он находит выражение гипергеометрической функции через /'-функции и выводит различные их свойства. К сожалению, большая часть результатов Римана по аналитической теории уравнений осталась неопубликованной при его жизни. Лишь в 1876 г., через десять лет после его смерти, в изданном Г. Вебером и Р. Дедекиндом собрании его сочинений увидела свет его незаконченная работа «Две теоремы общего характера, касающиеся линейных дифференциальных уравнений с алгебраическими коэффициентами», датированная 1857 г. (русский ее перевод см. [Б21, с. 176 — 186]). Риман рассматривает п функций г/1? у2, . . ., уп, относительно которых известно только, что они аналитические во всей расширенной плоскости комплексного переменного z, за исключением конечного числа точек ветвления аг, а2, . . ., as, таких, что при обходе вокруг ак (к = 1, 2, . . ., s) каждая п из функций yt переходит в ^ a^yj. Таким образом, каждой из точек 3=1 ак соответствует квадратная матрица Л(/;) (впоследствии получившая наименование матрицы монодромии). Все эти матрицы невырожденны и удовлетворяют соотношению А^-А^- . . . • А^ = Е (Е — единичная матрица). Совокупность описанных линейных преобразований функций */i> Уъ, • • •» Ут определяемая матрицами, образует, как стали говорить впоследствии, «группу монодромии» этой системы функций. (Риман этого термина не употреблял и вообще не отмечал, что эта система образует группу.) Задача, стоящая перед Риманом, по заданным особым точкам а1? а2, . . ., as и заданной совокупности матриц А^ установить свойства функции yt, в частности построить линейное дифференциальное уравнение, решениями которого являются функции этого семейства. При этом 152
Б. РИМАН Риман полагал, что такое уравнение всегда существует, притом принадлежит некоторому специальному типу, названному впоследствии фуксо- вым (об уравнениях фуксова типа см. ниже). Это утверждение, над доказательством которого, судя по всему, он немало размышлял сам, было включено под номером 21 в число знаменитых проблем, предложенных Д. Гильбертом в докладе на Международном конгрессе математиков 1900 г. Работы, связанные с ее решением, составляют замечательную главу математики XX в. (об этом см. [77, 289, 76]). Риман также показал (см. фрагмент «Интегралы линейного дифференциального уравнения второго порядка в окрестности точки ветвления» [Б21, с. 194—195] из его лекций по дифференциальным уравнениям 1856 —1857 гг.), что в окрестности точки ветвления решения линейного дифференциального уравнения второго порядка имеют вид или Ci(z—a)* У\ ат(г~а)т + Сг(г-аУ* >" bm(z-a)m (ацфаг) т——оо т-~ оо или -J сю -*-сю Ci(z-o)* Я ат (z - а)т -f Са (z - a? log (z - a) J, bm(z — a)m, т——сю m——сю где С1 и С2 — константы. Он заметил [Б21, с. 181], что если линейно независимые решения yt (i = 1, 2, . . ., п) линейного дифференциального уравнения га-го порядка «нигде не обращаются в бесконечность бесконечно большого порядка, так что эти ряды в сторону убывающих степе- Ц-сю ней оборвутся» [Б21, с. 179] (т. е. будут иметь вид 51 dm(z — a)m), то тп=—к 153
коэффициенты этого линейного дифференциального уравнения — целые рациональные функции z. Мы уже говорили, что работа «Две теоремы общего характера...», датированная 20 февраля 1857 г., была опубликована лишь в 1876 г. Многое из того, что в ней содержалось, было к этому времени независимо получено Л. Фуксом на пути, отличном от римановского. Фрагменты же лекций Римана по дифференциальным уравнениям, читанных в Гёттин- гене в 1856/57 и 1858/59 гг., были опубликованы лишь в 1902 г. Среди содержащихся в них результатов, переоткрытых к этому времени другими математиками, были и начала теории автоморфных функций, о которой мы еще скажем далее. Опубликованная же в 1857 г. работа о гипергеометрической функции, равно как и рассмотренные выше мемуары Брио и Буке 1856 г., не вызвали поначалу особого интереса к новой теории дифференциальных уравнений. Нужно было ждать еще почти десять лет, прежде чем в Германии под влиянием Вейерштрасса возобновился интерес к этим вопросам. Новый шаг вперед был сделан немецким математиком Л. Фуксом. 5.3. Л. Фукс Лазарус Иммануэль Фукс родился в Мошине близ Позена (ныне Познань, ПНР) в 1833 г. В 1854 г. в Берлинском университете под руководством Э. Куммера начал работу над диссертацией о линиях кривизны на поверхностях. Опубликовал также ряд работ по алгебраической теории чисел. Получив в 1858 г. докторскую степень, он преподавал в различных учебных заведениях Берлина. В 1865 г. стал приват-доцентом университета, в 1867—1868 гг.— профессор Артиллерийской и инженерной школы. В 1869 г. он покинул Берлин и работал вначале в Грейфс- вальдском, а затем в Гёттингенском (1874) и Гейдельбергском (с 1875 г.) университетах. В 1882 г. окончательно вернулся в Берлин, где занял место ординарного профессора университета. В 1884 г. был избран членом Берлинской академии наук. Последние десять лет жизни был главным редактором «Journal fur die reine und angewandte Mathematik». Умер Фукс в 1902 г. Дифференциальными уравнениями Фукс занялся под влиянием Вейерштрасса, в частности его лекций 1863 г. по абелевым функциям (несмотря на то что первые шаги в математике Фукс сделал под руководством Куммера, своим учителем он называл Вейерштрасса, см. письмо Фукса Ка- зорати от 13 февраля 1870 г. [305, с. 46]). Эти лекции содержали многие замечательные результаты Вейерштрасса из разрабатываемой им теории аналитических функций, в частности касающиеся поведения функций в окрестности особых точек. Уже в своей первой относящейся к этому вопросу работе 1865 г. (о ней речь впереди) Фукс высказал убеждение, что задача, стоящая перед теорией дифференциальных уравнений,— научиться определять по виду уравнения все особые точки его решений и природу этих точек. В результате такого исследования, если оно удастся, можно всегда найти решение в виде соответствующих рядов. Своими предшественниками на этом пути Фукс называет Брио и Буке (он имеет в виду их исследование 1856 г. о природе решений уравнения / (г/, duldz) = = 0, где / — многочлен от и и du/dz), Римана с его работой 1857 г. о гипергеометрической функции, а также Вейерштрасса (он указывает на его лекцию по абелевым функциям, прочитанную летом 1863 г.). В 1865, 1866 и 1868 гг. Фукс выпустил три работы под общим названием «К теории линейных дифференциальных уравнений с переменными. 154
коэффициентами» [167], о первой из которых мы только что упоминали. В этих работах и изложена широко известная теория Фукса линейных дифференциальных уравнений. Первая работа сравнительно малоизвестна, что объясняется главным образом малой распространенностью издания, в котором она напечатана. Основная из этих работ — вторая. Первые ^е три параграфа повторяют уже изложенное в первой работе, последующие параграфы содержат значительно более полный (чем в первой) анализ случая, когда между корнями характеристического уравнения (см. ниже) имеются одинаковые. Статья 1868 г. носит более специальный характер. Фукс рассматривает уравнение dllu . ч йп~ги . dn'2u I / \ п /соч -^ + Р^)-^Г + Р>(2)-^Г + --- + Рп(*)и = 0, (52) в котором Pi (z) — мероморфные функции z во всей комплексной плоскости (или в некоторой ее односвязной области), имеющие конечное число особых точек. Прежде всего Фукс методом мажорант доказывает существование решения уравнения (52), принимающего вместе с (п — 1) его производными в произвольной точке z = z0, не являющейся особой точкой коэффициентов pi (z), любые предписанные конечные значения. Это решение оо может быть выражено рядом У\ с^ (z — Zo)k, сходящимся внутри круга fr=0 с центром в точке z = z0 и радиусом, равным расстоянию от этой точки до ближайшей особой точки коэффициентов pt (z). Отсюда следует, что особыми точками решений могут быть только особые точки коэффициентов уравнения — в дальнейшем будем называть их просто особыми точками уравнения (52). Именно этим случай уравнения (52) резко отличается от случая нелинейных уравнений, где особые точки решения могут зависеть от входящих в них произвольных констант (об этом ниже). Фукс рассматривает п линейно независимых решений (линейную независимость решений Фукс определяет посредством определителя, известного впоследствии как определитель Вронского, об этом см. подраздел 4.1) их (z), и2 (z), . . ., ип (z) в окрестности неособой точки z0. Любое решение в этой окрестности записывается в виде и = С1и1 (z) + С2и2 (z) + . . + Спип (z), где Ct (i = 1, 2, . . ., п) — постоянные. Такую систему частных решений он называет фундаментальной. В теории Фукса исследуется вопрос о существовании фундаментальной системы решений в окрестности особых точек уравнения (52) и о поведении этих решений в окрестности этих точек. Пусть z0 — неособая точка уравнения (52) в окрестности его особой точки а. Проведем простой замкнутый контур у, начинающийся и заканчивающийся в точке z0 и содержащий внутри себя единственную особую точку а. Пусть их (z), и2 (z), . . ., ип (z) — фундаментальная система ре- тиений уравнения (52), соответствующая точке z0. При обходе вокруг точки а по контуру у эти решения перейдут соответственно в йг (z), й2 (z),.. . . . ., йп (z). Эти новые решения будут выражаться через старые посредством линейных соотношений ■щ = ацих + oci2u2 -f .. . + ainunj 155
где aik — достоянные. Фукс рассматривает характеристическое уравнение- [«11 — «12 «in X «21 • • а22 — ^ «2п • • «ш ап2 ' ' апп- относительно X и доказывает, что его корни не зависят от выбора фундаментальной системы их (z), и2 (z), . . ., un,{z), но зависят только от особой точки а. Он показывает, что если все корни характеристического уравнения (53) различны, то в качестве фундаментальной системы в окрестности точки а можно взять функции Ui = (z- а)\{ (z) (£=1,2 /г), (54) где kt = (In Xt)/2nl, а срг- (z) — однозначная функция z в окрестности точки а. Если же среди корней уравнения (53) имеются кратные, то в качестве фундаментальных решений, соответствующих корню Xt кратности 771г-, МОЖНО ВЗЯТЬ фуНКЦИИ Mi = (z — a)A*<pii (z), u2 = (z — af^2i (z) + (z — а)А'*ф22 (z) log (z — a), (55) иг = (z — а)АЧз1 (2) + (z — a)fr*cp32 (2) log (z — a) + + (2_a)^33(2)[iog(z-a)]2, ami= (2 — afiymil{z)+{z — а)А'*фт.2 (z) 1 og (z — a) + . . . ..- + (*- «ОЧт^ (*) [log (z - a)]mr\ где ф^- (z) — однозначные функции z в окрестности точки а. Таким образом, при наличии у характеристического уравнения кратных корней в общее решение входят члены, содержащие логарифмические множители. Этот результат для уравнений второго порядка содержался, как уже отмечалось, в неопубликованных к тому времени бумагах Римана. Наибольший интерес представляет случай, когда в разложениях фундаментальных решений по формулам (54) или (55) функции фг (z) имеют в точке а полюс, т. е. представляются в виде ^ ak(z — aY• Такую особую а-=-р точку впоследствии стали называть регулярной. Как доказал Фукс (1866, 1868) [167], для того чтобы особая точка а была регулярной точкой уравнения (52), необходимо и достаточно, чтобы выполнялись условия Pi (z) = (z - a)'1 Pi (z) (i = 1, 2, . . ., и), где Pi (z) — аналитические функции в окрестности точки #, Линейные дифференциальные уравнения, все интегралы которых обладают только регулярными особыми точками и систематическое изучение которых начал Фукс, получили наименование уравнений фуксова типа. Идеи Фукса нашли широкий отклик у его современников. О нем говорили как об открывателе новой области в царстве математики [155, с. 266], на завоевание которой двинулись вслед за ним многие, среди них Л. Томе, Г. Фробениус, наконец, один из величайших математиков- XIX — начала XX в. А. Пуанкаре. 156
5.4. А. Пуанкаре Анри Пуанкаре родился в 1854 г. в городе Нанси в семье профессора медицинского факультета местного университета. Его выдающиеся математические способности проявились очень рано. Однако поначалу он готовил себя к карьере инженера. В 1873 г. он приступил к занятиям в Политехнической школе. Проучившись в ней два года, он поступил в Горную школу, которую закончил в 1879, и получил назначение на место инженера в город Везуль. В то же самое время он усиленно занимался математикой и летом 1879 г. защитил в Сорбонне докторскую диссертацию «О свойствах функций, определяемых дифференциальными уравнениями с частными производными». В отзыве на диссертацию Г. Дарбу писал: «Что особенно поражает нас в этом дебюте, так это решимость... отвага, с которой автор обратился к решению самых возвышенных, самых трудных, и самых общих вопросов. Он берется за рассмотрение самых важных и самых существенных проблем» [Б20, т. 3, с. 668]. Инженером Пуанкаре проработал меньше года, осознав, что настоящее его призвание — наука. В декабре 1879 г. он переехал в Кан, где начал работать в университете преподавателем факультета точных наук. Ряд выдающихся результатов быстро выдвинул Пуанкаре в число ведущих французских математиков. Осенью 1881 г. он переезжает в Париж и начинает чтение лекций в Сорбонне, сначала по математическому анализу, с весны 1885 г. по математической физике, а с лета 1886 г. по теории вероятностей. В 1886 г.Пуанкаре занял кафедру математической астрономии и небесной механики, на которой оставался до самой смерти. С 1883 по 1897 г. он состоял репетитором по анализу, а в 1904—1908 гг.— профессором астрономии Политехнической школы. В 1887 г. он был избран в Академию наук Франции, а в 1908 г.— членом Французской академии. Он состоял членом многих иностранных академий и обществ, в том числе членом Российской академии наук. Не будет преувеличением сказать, что не было такой области современной ему математики, «чистой» или «прикладной», которую бы он не обогатил замечательными методами и результатами. Некоторые из них уже рассматривались в предыдущих разделах настоящего издания, многие будут описаны в последующих главах. В заключение этой краткой биографической справки приведем слова П. Пенлеве, произнесенные им в год смерти Анри Пуанкаре, последовавшей в 1912 г.: «Он все постиг, все углубил. Обладая необычайно изобретательным умом, он не знал пределов своему вдохновению, неутомимо прокладывая новые пути, и в абстрактном мире математики неоднократно открывал неизведанные области. Всюду, куда только проникал человеческий разум, сколь бы труден и тернист ни был его путь,— будь то проблемы беспроволочной телеграфии, рентгеновского излучения или происхождения Земли — Анри Пуанкаре шел рядом, чтобы оказать необходимую помощь и продолжить свои исследования, чтобы разрабатывать золотоносную жилу» [Б20, т. 3, с. 672]. И еще слова А. Вейля из доклада, посвященного 100-летию со дня его рождения: «Труды Пуанкаре, с какой бы точки зрения мы ни подходили к их оценке, принадлежат не только истории нашей науки, но и являются неотъемлемой частью ее сегодняшнего развития» [Б20, т. 3, с. 686]. Результаты Пуанкаре, о которых сейчас пойдет речь, относятся к началу его научной карьеры и составляют одно из самых замечательных его достижений. В «Анализе работ Анри Пуанкаре, сделанном им самим», мы читаем... «Желая... выразить интегралы дифференциальных уравнений посредством сходящихся всюду рядов, я естественно приступил сна- 157
чала к линейным уравнениям. Эти уравнения, которые в новое время были объектом работ Фукса, Томе, Фробениуса, Шварца, Клейна и Аль- фана, на деле были изучены лучше всего. С давних пор мы знаем разложение их интегралов в окрестности данной точки и в достаточно большом числе случаев их сумели полностью проинтегрировать с помощью давно известных функций. Поэтому у меня было больше всего шансов прийти к результату, приступив к изучению именно этих уравнений. Но необходимо было принять какое-либо условие относительно коэффициентов уравнений, которые я хотел изучать. В самом деле, если бы я принял в качестве коэффициентов произвольные функции, я и в качестве интегралов получил бы также произвольные функции и, следовательно, не мог бы сказать ничего ценного о природе этих интегралов, что было моей целью. Мне пришлось поэтому обратиться к линейным уравнениям с рациональными и алгебраическими коэффициентами» [Б20, т. 3, с. 584]. Работы Фукса 1880 г. [170, 171] навели А. Пуанкаре на путь, приведший к решению проблемы и к открытию нового класса функций — автоморфных функций. В основе подхода Пуанкаре лежит гениальная мысль, подобная той, которая в свое время пришла на ум Гауссу, Абелю и Якоби при введении ими эллиптических функций (см. Кн. 2, гл. 2): вместо того чтобы рассматривать слишком сложную функцию и (z), являющуюся решением уравнения d2u . ч du . , ч Л с рациональными (или шире — с алгебраическими) коэффициентами, обратить задачу — рассмотреть переменную z как функцию решения, при этом не одного и, но отношения иг/и2 двух линейно независимых решений их и и2. Функция эта является однозначной и, как можно показать, инвариантной относительно некоторой группы дробно-линейных преобразований. Введенные таким образом функции (1881) (см. [341 — 346] и более поздние работы) составили новый класс трансцендентностей, изучение которых было с успехом начато самим Пуанкаре и Ф. Клейном, которые и заложили основы теории так называемых автоморфных функций — функций, инвариантных относительно некоторой группы дробно- линейных подстановок. В этой теории нашли свое место и более ранние результаты Ш. Эрмита и Г. Шварца о некоторых частных типах таких функций — модулярных и полиэдрических функциях, связанных с линейными дифференциальными уравнениями второго порядка. Мы не будем останавливаться подробнее на истории открытия автоморфных функций и первых шагах в их изучении, так как об этом уже говорилось во 2-й главе Кн. 2 настоящего издания. Скажем только, что теория эта, источником которой, в частности, послужила теория линейных дифференциальных уравнений, получила многообразные применения в самых различных отделах математики, в том числе в таких далеких от дифференциальных уравнений областях, как теория групп, алгебраическая геометрия и теория чисел. 5.5. Нелинейные уравнения До сих пор мы говорили о линейных уравнениях. Что касается нелинейных, то при их изучении возникали специфические трудности. Наиболее существенной из них оказалось наличие подвижных особых точек, отсутствовавших у линейных уравнений, т. е. особых точек, положение 158
А. ПУАНКАРЕ которых зависит от начальных данных. Особые сложности вносили подвижные точки ветвления. Важных результатов в теории нелинейных уравнений первого порядка добился сам Фукс. В 1884 г. он выпустил работу «О дифференциальных уравнениях, интегралы которых имеют неподвижные точки ветвления» [172], в которой давал необходимые условия отсутствия подвижных точек ветвления у решений уравнений вида Ао (и, z) (-g-)n + Аг (и, z) (-^р + ...+An(u,z) = 0, (56) где Ai (и, z) — многочлены от и с коэффициентами — аналитическими функциями от z. Условия, данные Фуксом, оказались и достаточными — это некоторым образом следовало из доказанного в докторской диссертации П. Пенлеве (1887) отсутствия у решений уравнения (56) подвижных существенно особых точек (эти условия, кстати, как в 1885 г. отметил Пуанкаре [348], гарантируют также конечность числа особых точек). В рассматриваемой работе 1884 г. Фукс также установил, что уравнение с неподвижными точками ветвления (56) приводится к уравнению Риккати, если его род (имеется в виду род соответствующей римановой поверхности; понятие рода введено Риманом в его «Теории абелевых функций» (1857), сам термин «род» появляется у Клебша (1864), см. Кн. 2, с. 49) относительно и и duldz равен 0, и интегрируется в эллиптических функциях в случае, если род равен 1. К этому результату примыкает теорема, доказанная Эрмитом (1873) [202] относительно уравнения Врио и Буке Ао (и) (-* )" +Al(») (-^Р + ... + Ап(и) = 0. 159
где А{ (и) — многочлены от и, не содержащие явно z: если это уравнение не имеет подвижных точек ветвлендя, то его род равен 0 или 1, а интеграл — либо рациональная функция, либо рационально выражается через показательные и эллиптические функции. Результаты работы Фукса 1884 г. получили дальнейшее развитие у Пуанкаре. В том же 1884 г. вышла в свет его небольшая заметка «Об одной теореме господина Фукса» [347], а в 1885 г.— обширная статья с тем же названием [348], в которой анализируются условия Фукса и показывается, что в случае, когда род уравнения (56) с неподвижными точками ветвления больше 1, его интегрирование выполняется с помощью некоторых алгебраических рациональных операций. 5.6. Исследования русских математиков Другое направление теории нелинейных уравнений получило развитие в работах С. В. Ковалевской о движении твердого тела вокруг неподвижной точки, в первую очередь в работе «О задаче вращения твердого тела вокруг неподвижной точки» (1889) [226], удостоенной премии Парижской академии наук. Ковалевская рассмотрела независимую переменную (время t) в уравнениях движения как комплексную величину. Она заметила, что в двух известных к тому времени случаях интегрируемости этих уравнений (Эйлера — Пуансо и Лагранжа — Пуассона) решения, выражающиеся эллиптическими функциями от t,— однозначные аналитические функции, не имеющие в конечной части плоскости других особых точек, кроме полюсов. Возможны ли другие такие решения? Такой вопрос поставила перед собой Ковалевская и нашла на него ответ: ей удалось найти еще один такой случай (случай Ковалевской). Более того, она сформулировала теорему о том, что три перечисленных случая единственные, в которых решения уравнений движения являются мероморфными функциями от t. Этот вопрос исследовался в трудах профессора Московского университета П. А. Некрасова (1892) [63], его ученика Г. Г. Аппельрота (1893) [41, А. М. Ляпунова (1895) [53] (см. [20, 17], о Ляпунове см. подраздел 6.2)). В наши дни этот вопрос вновь привлек к себе внимание математиков (см. [34, 30, 41]). Упомянув Ковалевскую и некоторых русских математиков, развивавших ее идеи, естественно сказать несколько слов о развитии аналитической теории дифференциальных уравнений в России. Активным ее пропагандистом и исследователем выступил Василий Афанасьевич Ани- симов (1860—1907), выпускник Московского университета, посланный в заграничную командировку и прослушавший там курс лекций Фукса. Уравнениям фуксова типа посвящена опубликованная в 1889 г. его ма- истерская диссертация «Основания теории линейных дифференциальных уравнений» [2]. Его исследования тесно переплетались с работами другого выпускника Московского университета, а впоследствии его профессора Павла Алексеевича Некрасова (1858—1924), известного работами по алгебре, анализу, теории вероятностей и теоретической механике. Изучая теорию Фукса линейных дифференциальных уравнений, Некрасов (1883) [62] обратил внимание на ошибочность теоремы о радиусе так называемого предельного круга (или круга Фукса, как его нередко называют). Подробнее этот вопрос был разобран в упомянутой выше магистерской диссертации Анисимова. Фукс изменил соответствующие рассуждения, но Некрасов вновь обнаружил ошибку (1890) [3041. Полное исследование вопроса было проведено в докторской диссертации Анисимова «Предельный круг Фукса» (1892) [3] (см. [А6, с. 444—445]). 160
5.7. П. Пен леве Целый этап в развитии аналитической теории дифференциальных уравнений составили исследования П. Пенлеве и его учеников. Поль Пенлеве родился в Париже в 1863 г. В 1877 г. он закончил Нормальную школу, в 1887 г. защитил докторскую диссертацию «О сингулярных линиях аналитических функций» [314], с 1895 г.—профессор Нормальной школы и Сорбонны. Основные результаты относятся к теории функций, аналитической теории дифференциальных уравнений и различным прикладным вопросам — механике, астрономии и др. В 1900 г. Пенлеве был избран членом Академии наук Франции, состоял также членом многих академий и обществ, в частности был членом-корреспондентом АН СССР (1924). Будучи избранным в 1910 г. в Национальное собрание, постепенно отошел от активной научной работы, все более и более втягиваясь в общественно-политическую деятельность. Занимал различные министерские посты. Умер Пенлеве в 1933 г. О его результатах в теории нелинейных уравнений первого порядка мы уже упоминали. Глубокие исследования были предприняты им также для нелинейных уравнений второго и более высоких порядков. В работах Пенлеве 1888—1905 гг. впервые для нелинейных уравнений систематически проводилась идея изучения решений как функций комплексного переменного во всей области их определения непосредственно по самому виду дифференциальных уравнений, аналогичная идее Пуанкаре изучения качественного поведения интегральных кривых в действительной области по самому виду дифференциальных уравнений (см. раздел 6). Мы уже говорили о существенных упрощениях, вносимых в изучение решений уравнений первого порядка отсутствием у них, по теореме Пенлеве, подвижных существенно особых точек. К сожалению, эта теорема не распространяется на уравнения высших порядков. Пенлеве удалось, однако, (1893) [315], (1897) [316] исследовать возможности распространения соответствующих рассуждений на уравнения второго и высших порядков. Особенно подробно им было изучено уравнение и" = R (и\ и, z), (57) где R — рациональная функция и и и и аналитическая функция z. Ему удалось показать, что существенно особые подвижные точки могут появляться у решений уравнения (57) «достаточно редко» — лишь при соблюдении особых условий. Возможность наличия таких точек, однако, создает особые трудности в исследованиях по нахождению классов уравнений второго и высших порядков с неподвижными точками ветвления. Поначалу эту задачу пытались решать обобщением метода, развитого Фуксом в упоминавшейся работе 1884 г. для уравнений первого порядка. Однако существенных результатов удалось достичь совсем на другом пути. Путь этот, предложенный Пенлеве (1900) [319], основан на остроумном применении результатов Пуанкаре о разложении решения системы дифференциальных уравнений задачи трех тел в ряд по степеням малого параметра (1892) [351, т. 1]. Метод Пенлеве позволил находить необходимые условия отсутствия подвижных точек ветвления уравнения (57), ему же принадлежит специальный прием, с помощью которого можно доказать достаточность найденных условий. В 1902 г. Пенлеве опубликовал работу «О дифференциальных уравнениях второго и более высокого порядков, общий интеграл которых функция монодромная» [320], в которой приводилась таблица типов уравнений, к которым сводятся уравнения вида (57), имеющие лишь непо- 6 Математика XIX века 161
движные критические точки. Уточненная в представленной в 1906 г. диссертации (1909) [173] его ученика, впоследствии профессора университетов в Ренне и Лилле, Бертрана Гамбье (1879—1954) — в работе Пенлеве был обнаружен пробел в рассуждениях — эта таблица содержала 50 канонических типов уравнений. Большая часть этих уравнений принадлежала к хорошо изученным классам, таким, как линейные уравнения, уравнение Риккати и др. И лишь шесть из них приводили к новым типам транс- цендентностей (а, Ъ, с, d — постоянные комплексные числа): 1) и" = 6и2 + z; 2) и" = 2и3 + zu + a; 3) и' = ^ + еи(аи* + Ь) + е*'(си* + ±), Ьс1ф0; 4) u"=^+*/2u* + 4zu2 + 2(z*-a)u + -±r; + d и{и\1] ; 1 И— 1 ' д, ,, «'* / 1 , 1 . 1 \ . / 1 1 . 1 \ , . + UiU-1)iu-Z) la + b^ + c^^+d-^^l]. 1 z2 (z—l)2 L u (u— l)2 (u — z)2 J Первые три из них были указаны самим Пенлеве (1902) [320], последние три — Гамбье [173]. Эти уравнения, к которым в последнее время резко возрос интерес в связи с открывшейся их связью с уравнениями Кортеве- га—де Фриза и др., были названы именем Пенлеве, а их интегралы — трансцендентными функциями Пенлеве. В 1906 г. Пенлеве [321] получил также доказательство достаточности полученных условий, т. е. доказательство отсутствия критических подвижных точек в интегралах уравнений шести указанных типов. Эти и дальнейшие результаты и методы Пенлеве, а также их уточнения и обобщения, сделанные его учениками и последователями (упомянутым Гамбье, а также П. Бутру, Р. Гарнье, Ж. Шази и др.), принадлежат уже к XX в. и будут рассмотрены в соответствующих томах настоящего издания. Об истории аналитической теории дифференциальных уравнений см. также монографию [28], диссертацию [185], статьи [183, 184, 186]. Сводку основных результатов, полученных в XIX в., содержат обзоры [204, 205]. Ценные замечания исторического характера можно найти в книгах [16, 1]. 6. КАЧЕСТВЕННАЯ ТЕОРИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 6.1. Качественная теория Пуанкаре Начало качественной теории Оно было положено мемуаром А. Пуанкаре «О кривых, определяемых дифференциальными уравнениями», выходившим частями в 1881—1886 гг. [340]. Публикации отдельных глав мемуара предшествовали заметки в «Докладах Французской академии наук» (1880—1884) [339] (об исследованиях Пуанкаре по качественной теории дифференциальных уравнений см. [179]). Хотя тематика качественной теории уравнений в действительной 162
области затрагивалась и ранее (в своем месте (см. подраздел 4.2) мы уже говорили о являющейся в сущности качественной теории Штурма о колебаниях решений линейного дифференциального уравнения второго порядка (1836), можно привести и другие примеры), однако сколько-нибудь общей постановки задачи и разработки методов качественного изучения поведения решений дифференциальных уравнений во всей действительной области у предшественников Пуанкаре мы не находим. Такое положение дел объясняется в первую очередь господством аналитического подхода к теории дифференциальных уравнений, с успехом разрабатывавшегося школами О. Коши и К. Вейерштрасса, о чем уже неоднократно говорилось выше. Исследования велись преимущественно в комплексной области и носили по большей части локальный характер, т. е. поведение решений изучалось в окрестности отдельной точки. «Однако,— писал Пуанкаре в 1901 г. в составленном им самим анализе своих работ [Б20, т. 3, с. 583],— изучение интегралов дифференциальных уравнений в окрестности данной точки, какова бы ни была его польза с точки зрения числовых вычислений, может рассматриваться лишь как первый шаг. Эти разложения, которые справедливы только в очень ограниченной области, не.дают нам в отношении этих уравнений того, что в отношении алгебраических дифференциалов дает 6-функция 16: они не могут рассматриваться как истинное интегрирование. Поэтому их следует принять лишь как отправную точку в более глубоком изучении интегралов дифференциальных уравнений, где мы были бы намерены выйти из ограниченных областей, где мы были бы систематически подготовлены исследовать интегралы на всей плоскости». Таким образом, Пуанкаре ставит задачу перехода от локального изучения решений дифференциальных уравнений к глобальному их исследованию во всей плоскости. Это изучение, согласно Пуанкаре, может проводиться с двух разных точек зрения. Первую из них он характеризует так [Б20, с. 583]: «Можно задаться целью выразить интегралы посредством разложений, справедливых всегда и более не ограниченных какой-либо частной областью. При этом приходят к введению в науку новых транс- цендентностей, и это введение необходимо, так как старые известные функции позволяют интегрировать лишь небольшое число дифференциальных уравнений». Этот путь, пролегающий через аналитическую теорию дифференциальных уравнений и активно разрабатывавшийся применительно к линейным дифференциальным уравнениям самим Пуанкаре, привел его к открытию автоморфных функций (см. Кн. 2, с. 242—247). Для этого направления характерно глобальное изучение решений дифференциальных уравнений во всей комплексной области. «Однако,— продолжает Пуанкаре,— этот способ интегрирования, который дает нам знание свойств уравнения с точки зрения теории функций, один недостаточен, если мы желаем применить дифференциальные уравнения к вопросам механики или физики. Наши разложения не показали бы нам, по крайней мере без значительного труда, будет ли, например, функция постоянно возрастать, или она будет колебаться между определенными пределами, или она будет возрастать сверх всякого предела. Другими словами, если функцию рассматривать с точки зрения определения плоской кривой, мы ничего не узнаем об общей форме этой кривой. В некоторых приложениях все эти вопросы имеют такую же важность, как и вычисления, и они составляют новую проблему, которую нам приходится решать». 16 О 6-функциях см. [86], а также Кн. 2, гл. 2. 6* 163
К решению этой проблемы — к построению качественной теории дифференциальных уравнений в действительной области — Пуанкаре и приступает в названном в начале параграфа мемуаре. Одним из главных стимулов к ее разработке, как мы видим из приведенных его слов, были для него приложения, точнее (об этом уже говорит творческая его биография), небесная механика: ее проблемы составляют не скрываемый самим автором подтекст многих вопросов, обсуждаемых им уже в первой части мемуараг опубликованной в 1880 г. В вышедшей же в 1885 г. третьей части он прямо напишет [19, с. 105]: «Всякий, читавший первые две части этого ме- муара, не мог не поразиться сходством, существующим между рассмотренными в них вопросами и важнейшей астрономической проблемой об устойчивости солнечной системы». Проблема орбитальной устойчивости была одной из центральных в творчестве Пуанкаре. Кроме небесной механики, задачи подобного рода возникали и в теории малых колебаний систем с конечным числом степеней свободы, в частности в активно разрабатываемой в XIX в. теории автоматического регулирования (Дж. Эри, Дж. Максвелл, И. А. Вышнеградский, А. Стодола, А. Лео- те, об этом см. [А4, с. 116—137; 60]). Замечательный пример такой задачи содержит одна гидродинамическая работа Н. Е. Жуковского, предвосхитившего некоторые идеи качественной теории дифференциальных уравнений А. Пуанкаре. Один из основоположников современной аэро- и гидродинамики Николай Егорович Жуковский родился в 1847 г. В 1868 г. окончил Московский университет. В 1876 г. защитил магистерскую диссертацию «Кинематика жидкого тела» [32], а в 1882 г.— докторскую «О прочности движения» [33]. С 1872 г. преподавал в Московском техническом училище, а с 1885 г. также и в университете, сначала в качестве приват-доцента, а затем профессора. Некоторые его работы посвящены чисто математическим вопросам, ряд замечательных математических результатов содержат его работы по механике. Широко известны, например, его результаты, касающиеся теории конформных отображений, полученные при изучении проблем аэро- и гидродинамики. В 1894 г. он был избран членом-корреспондентом Петербургской академии наук. С 1903 г. состоял вице-президентом, а в 1905—1921 гг.— президентом Московского математического общества. Умер Жуковский в 1921 г. В упомянутой магистерской диссертации [32], опубликованной в 1876 г., исследуя вопрос о линиях тока плоского течения в окрестности точки, составляющие скорости в которой обращаются в нуль, Жуковский приходит к задаче о поведении интегральных кривых уравнения dy ах + by dx ex -j- dy [ad — ЬсфО) в окрестности начала координат. Жуковский дает классификацию особых точек (он называет их критическими) таких уравнений, аналогичную классификации Пуанкаре, речь о которой пойдет ниже, и исследует поведение интегральных кривых в их окрестности. Жуковский не дает специальных наименований каждому типу особых точек, которых у него насчитывается шесть; случай, который по терминологии Пуанкаре носит название узла, распадается у него на три, так же как, например, в [89, с. 79—84]. Исследование особых точек дифференциальных уравнений первого порядка было целиком подчинено у Жуковского изучаемым вопросами механики жидкости и не получило самостоятельного развития. Поэтому оно оставалось незамеченным вплоть до 1924 г., когда на него обратил внимание Д. М. Синцов [84] (см. также [А6, с. 448]). 164
Мемуар Пуанкаре 1881—1886 гг. В первой (главы I—IV) и второй (главы V—IX) частях мемуара Пуанкаре^ ограничивается изучением кривых, определяемых дифференциальным уравнением dyldx = Y (х, у)IX (х, у), (58> в котором X и Y — многочлены от х и у. Для удобства изучения бесконечных ветвей интегральных кривых Пуанкаре проектирует их на сферу положительного радиуса, касающуюся плоскости (#, у) в начале координат, таким образом, что каждой точке (х, у) соответствуют две точки сферы, получающиеся при пересечении этой сферы с прямой, соединяющей эту точку с центром сферы. Свой анализ Пуанкаре начинает с изучения поведения интегральных кривых в окрестности отдельной точки (а, (3). Пусть X и У представлены в виде многочленов по (х — а) и (у — Р): X = а0 + аг (х — а) + а2 (у — р) + . . ., Y = Ь0 + Ъ± (х - а) + Ъ2 (у - р) + . . . Если а0 и Ъ0 не равны одновременно нулю, то (а, Р) — обыкновенная точка уравнения (58) и через нее проходит одна и только одна интегральная кривая. Если а0 = Ь0 = О и а±, а2, b±, Ь2 не равны нулю одновременно- и точка (а, Р) — простая точка пересечения кривых X = 0 и Y = 0 («особая точка 1-го рода»), то поведение интегральных кривых в окрестности точки (а, Р) зависит от вида корней уравнения (аг - X) (Ь2 — X) — Ъха2 = 0. (59) Пуанкаре различает четыре типа особых точек. 1. Уравнение (59) имеет два действительных корня одинакового знака. В этом случае вид интегральных кривых в окрестности точки (а, Р) представлен на рис. 1. Через эту точку проходит бесконечное множество интегральных кривых. Такая особая точка называется узлом. 2. Уравнение (59) имеет два действительных корня разного знака. Вид кривых в окрестности точки (а, Р) представляется так, как это изображено на рис. 2. Через особую точку, называемую в этом случае седлом, проходят две и только две интегральные кривые. 3. Уравнение (59) имеет два комплексно-сопряженных корня с действительной правой частью, отличной от нуля. Интегральные кривые в этом случае — спирали, имеющие точку (а, Р) асимптотической точкой, вокруг которой они делают бесконечное количество оборотов. Их расположение дается на рис. 3. Такая точка называется фокусом. 4. Уравнение (59) имеет два сопряженных чисто мнимых корня. Интегральные кривые в окрестности точки (а, Р) — семейство замкнутых кривых (циклов), окружающих эту точку. Их расположение дается на рис. 4. Такая точка называется центром. Случай центра представляется редким по сравнению с предыдущими,, поэтому Пуанкаре исключает его пока (до 11-й главы) из рассмотрения,, предполагая, что дифференциальное уравнение имеет лишь простые особые точки — узлы, фокусы и седла. Исследования особых точек 2-го рода (точек гс-кратного (п > 1) пересечения кривых X = 0 , Y = 0) Пуанкаре не проводит, замечая [20, с. 31]:: «Различные особенности, которые могут представить такие особые точки, слишком многочисленны и разнообразны для того, чтобы мы стали их здесь подробно изучать». Такое изучение было проведено в 1928 г. 165
Рис. 3 Рис. 4 М. Фроммером [166]. Подробное современное изложение теории Пуанкаре см., например, в 164]. Далее Пуанкаре переходит к исследованию вопроса о распределении особых точек на сфере. Он доказывает (теорема 2), что дифференциальное уравнение (58) на сфере всегда имеет особые точки. Важную роль в его построениях играет введенное им понятие индекса цикла. Под циклом он понимает простую замкнутую кривую L на сфере, обладающую (за исключением конечного числа точек) непрерывно вращающейся касательной. Тогда индекс цикла L можно определить следующим образом (мы даем общеупотребительное сегодня определение, по форме отличающееся от приводимого Пуанкаре): предположим, что L не проходит через особые точки уравнения (58), и пусть точка движется по часовой стрелке вдоль этого цикла. Будем следить за углом, образуемым в точках пересечения кривой L с траекториями интегральных кривых уравнения (58). После полного пробега вдоль L этот угол изменится на 2ju, где i — целое число или нуль. Это число i называется индексом цикла L. Пуанкаре показывает, что цикл, не содержащий внутри особой точки, имеет индекс, равный нулю; цикл, содержащий внутри единственную осо- 166
бую точку — седло, имеет индекс (+1), а содержащий узел или фокус — индекс (—1). С помощью этого понятия он доказывает следующее важное- предложение: полное число узлов и фокусов уравнения (58) равно полному числу седел плюс 2. Это утверждение является одной из первых топологических теорем,, полученных Пуанкаре. В ситуации, рассматриваемой Пуанкаре, уравнение (58) определяет на сфере векторное поле с конечным числом особых точек. Индексом особой точки поля называется индекс достаточно малого цикла, окружающего ее. Теорема Пуанкаре (обобщенная в 1926 г. немецким топологом Гейнцем Хопфом (1894—1971) на векторные поля на многообразиях любой размерности) означает, что сумма индексов любого векторного поля равна эйлеровой характеристике многообразия (в нашем случае 2, см., например, [58, § 6]). «Изучение особых точек, которое мы только что провели, позволяет нам, наконец, приступить к рассмотрению вопроса о том, каковы возможные геометрические формы характеристик 17 на всей поверхности сферы»,— такими словами он начинает [20, с. 48] четвертую главу мемуара. Итог этого рассмотрения — устанавливаемая в VI главе под номером 18* теорема, приводящая вопрос о поведении интегральных кривых на сфере к построению соответствующей топографической системы. Топографической системой на сфере называется такая система циклов и полициклов (замкнутых самопересекающихся аналитических кривых,, не имеющих других особых точек, кроме точек самопересечения, которые являются двойными точками), что через каждую точку сферы проходит один и только один цикл или полицикл. Исключение могут составить только некоторые особые точки, через которые не проходит ни один цикл. Среди всех мыслимых циклов на сфере особый интерес для изучения глобального характера поведения интегральных кривых имеют циклы без контакта, т. е. циклы, не касающиеся ни в одной точке никакой из интегральных кривых, и предельные циклы. Под предельным циклом Пуанкаре понимает замкнутую интегральную кривую, к которой неограниченно приближаются, никогда ее не достигая, другие интегральные кривые. «Легко понять важность нахождения циклов без контакта; нетрудно, в самом деле, увидеть, что кривая, определенная уравнением (58), может пересечь такой цикл лишь один раз. Если теперь мы представим себе подвижную точку, описывающую нашу кривую, то как только она выйдет из цикла без контакта, она уже больше туда не сможет вернуться»,— пишет Пуанкаре [Б20, т. 3, с. 598] в аналитическом резюме своих работ и тут же добавляет относительно понятия предельного цикла: «Это второе понятие не менее важно, чем первое. Действительно, пусть мы провели предельный цикл. Подвижная точка, о которой мы говорили выше, конечно, никогда не сможет перейти через него, и она останется навсегда внутри этого цикла или навсегда вне его». Упомянутую выше теорему 18 Пуанкаре формулирует следующим образом [20, с. 82—83]: «Всегда существует топографическая системаг образованная циклами без контакта, полициклами без контакта и предельными циклами. Эта топографическая система покрывает всю поверхность сферы. Вершины и впадины ее являются узлами и фокусами данного уравнения. Седловины являются седлами данного уравнения». Доказательство этой теоремы у Пуанкаре далеко от полноты (не доказана она и по сию пору!), к тому же топографическая система, удовлетворяющая условиям теоремы 18, неоднозначно определяет качественную карти- 17 Так Пуанкаре называет интегральные кривые уравнения (58). 167
ну поведения интегральных кривых. Однако знание топографической системы чрезвычайно помогает в выяснении этой картины. Это демонстрируется Пуанкаре на нескольких примерах. Рассмотрим один из них. Уравнение dx х {х2 + у2 — 1) (х2 + у2 — 9) — у (х2 4- у2 — 2х — 8) = dy — У (*2 + У2 - 1) (** + У2 - 9) + х (х2 + у*-2х-Ъ) имеет три особые точки: точку 0 (х = О, у = 0) и две точки А и В пересечения окружностей х2 + у2 — 9 = 0 и х2 + у2 — 2х — 8 = 0. Как нетрудно посчитать, точка 0 — фокус, А — узел, В — седло. Рассмотрим проекцию сферы, на которой мы изучаем доведение интегральных кривых, определяемых данным дифференциальным уравнением, на плоскость х, у (рис. 5). В качестве системы циклов без контактов, образующих топографическую систему, можно взять (это также нетрудно посчитать) сам экватор и окружности с центром в начале координат, за исключением окружностей х2 + у2 — 1 = 0 и х2 + у2 — 9 = .0, являющихся интегральными кривыми уравнения. Первая из них — предельный цикл, вторая проходит через две особые точки — узел и седло. РИС< 5 «Таким образом,— пишет Пуанкаре [20, с. 89],— существует три типа характеристик (интегральных кривых.— С. Д.): одни закручиваются вокруг ^фокуса (рис. 5) и имеют предельным циклом х2 + у2 - 1 = 0; другие кончаются в узле А и имеют предельным циклом х2 + у2 - 1 = 0; третьи кончаются в А и в точке, симметричной с А; они пересекают экватор. Следующие характеристики будут исключительными: 1) окружность х2 + у2 = 1; 2) окружность х2 + у2 = 9; 3) характеристика, выходящая из седла В и пересекающая экватор; 4) характеристика, выходящая из седла В и имеющая предельным циклом х2 + у2 = 1. Если t изображает время, то подвижная точка, двигающаяся по закону dx/dt = х (х2 + у2 - 1) (х2 + у2 - 9) - у (х2 + у2 - 2х - 8), dyldt = у(х2 + у2- 1) (х2 + у2 - 9) + х (х2 + у2 - 2х - 8), не сможет выйти из окружности х2 + у2 = 1, если она находилась внутри ее». В общем случае построение топографической системы представляет собой задачу чрезвычайной сложности, ибо нахождение, скажем, уравне- 168
ния предельных циклов в конечной форме редко когда возможно. Поэтому Пуанкаре ставит задачу разделения сферы на так называемые ациклические области, не содержащие точек предельных циклов, и моноциклические области, содержащие точки одного и только одного предельного цикла. Обсуждению путей ее разрешения (не достигнутого в удовлетворительной форме и поныне) он посвящает восьмую главу. Третья часть мемуара начинается с рассмотрения проблемы орбитальной устойчивости, которая трактуется Пуанкаре следующим образом. Наряду с уравнением (58) рассматривается система dxldt = X (х, у), dy/dt = Y (х, у), (60). при этом х и у трактуются как координаты движущейся точки, a t — как время. «Мы скажем,— пишет Пуанкаре [20, с. 110],— что траектория подвижной точки устойчива, если, сколь бы мал ни был радиус г окружности (или сферы), описанной вокруг начальной точки, подвижная точка, выйдя- из этой окружности (или сферы), вновь войдет в нее бесконечное множество раз». Исследование орбитальной устойчивости в случае дифференциального уравнения первого порядка и первой степени оказывается простым, но задача существенно осложняется как только переходят к случаю* уравнений первого же порядка, но степени выше первой. К ее рассмотрению Пуанкаре приступает в XII главе. Он изучает уравнение F (х, у, dyldx) = 0, (61)* где F — полином от х, у и dyldx. Наряду с уравнением (61) Пуанкаре рассматривает уравнение алгебраической поверхности F (х, у, z) = 0. (62* Решение уравнения (61) он трактует (и это одна из наиболее замечательных идей мемуара!) как траекторию движения на этой поверхности,.задаваемого системой dt ~~ dz ' dt ~~ Z dz r dt ~~ dx ^Z dy ' где правые части — целые многочлены по х7 г/, z. Пуанкаре сводит рассмотрение к случаю, когда поверхность (62) состоит из конечного числа замкнутых конечных листов. Он берет один из этих листов S и изучает поведение траекторий в окрестности какой-либо точки М этого листа. Введя параметрическое представление координат х = х (и, и), у = у (и, v), z = z (и, v) в окрестности этой точки, он привод дит рассматриваемую систему к виду duldt = U (и, v), dvldt = V (и, v)r где U и V — голоморфные функции от и и v. Если точка М — обыкновенная точка этой системы, то через нее про- ходит одна и только одна траектория. Если же эта точка особая, то здесь могут представиться те же возможности, что и в первой части мемуара: седло, фокус, узел и центр. Далее Пуанкаре переходит к вопросу о распределении особых точек и, наконец, к проблеме глобального поведения интегральных кривых на всей поверхности (62). При этом он пытается обобщить на этот случай tea
результаты, полученные в первых двух частях мемуара. Но если локально траектории на листе S ведут себя так же, как и траектории системы (60) ща плоскости (сфере), то глобальное их поведение может оказаться совершенно отличным. «Капитальную» роль здесь начинает играть род листа S. Так, соотношение между числом узлов (iV), фокусов (F) и седел (С) на листе S рода р приобретает вид N + F-C = 2-2p. Если на сфере (поверхности рода 0) всякая система характеристик имела по крайней мере одну особую точку, то на поверхностях рода р ^> 0 особых точек может не оказаться вовсе. Если на сфере наличие системы циклов без контакта служило фактором орбитальной неустойчивости траекторий, то в случае тора (поверхности рода 1) наличие такой системы указывает как раз на обратное. Детальному изучению поведения траекторий на торе посвящена XV глава мемуара. Понятие рода поверхности, введенное Риманом (см. Кн. 2, с. 101), вносит в исследование топологический элемент, оказавшийся необходимым при переходе от локального к глобальному изучению. Таким образом, изучение глобального поведения интегральных кривых на поверхностях рода больше 0 послужило Пуанкаре стимулом для разработки топологии поверхностей. Четвертая, последняя часть мемуара посвящена уравнениям второго порядка и.первой степени, которые Пуанкаре приводит к виду dx у dy у, dz у dt — А' dt ~~Х ' dt -~L} где X, Y, Z — многочлены от х, г/, z. Однако результаты, полученные для этого случая, оказываются менее полными, чем для уравнений первого порядка, свойства особых точек — более сложными, а их влияние на глобальное поведение траекторий менее значительным. Изложение результатов, полученных в четвертой части для уравнений второго порядка, Пуанкаре систематически сопровождает замечаниями о возможности их обобщения на уравнения высших порядков. Позднее в аналитическом резюме своих работ он напишет на этот счет [Б20, т. 3, €. 603]: «Чтобы распространить предыдущие результаты на уравнения порядка больше двух, нужно отказаться от геометрических рассмотрений, которые были нам столь удобны, или во всяком случае нужно использовать язык гипергеометрии п измерений. Но этот язык еще столь мало знаком большинству геометров, что мы потеряли бы все главные преимущества, которые можно было бы ожидать от представлений такого рода. Однако результаты сохраняют свою силу...» Пуанкаре приводит ряд таких результатов и продолжает: «Это обстоятельство тем более понуждает желать заполнения пробела, отмеченного мною выше. Для того чтобы двигаться дальше, мне нужно было создать инструмент, предназначенный заменить геометрический инструмент, отказавший :мне, когда я захотел перейти к пространству более трех измерений. Это тлавная причина, которая заставила меня предпринять изучение Analysis situs...» Таким образом, занятия качественной теорией дифференциальных уравнений дали Пуанкаре импульсы для исследований по топологии, сыгравших столь существенную роль в создании современной комбинаторной топологии (см. Кн. 2, с. 96—105). 470
Последующие результаты Пуанкаре- no качественной теории дифференциальных уравнений Дальнейшие достижения Пуанкаре в этой области связаны с его исследованиями по небесной механике, в первую очередь по проблеме трех тел. В опубликованном в 1890 г. мемуаре «О проблеме трех тел и об уравнениях динамики» [350] и в вышедшей в 1892—1899 гг. трехтомной монографии «Новые методы небесной механики» [351] особое место уделено изучению периодических решений задачи. Тем самым в область качественной теории оказывались включенными целые направления, получившие к тому времени уже значительное развитие в теоретической астрономии (например, работы 1877—1878 гг. Дж. Хилла [206, 198] по теории движения Луны) и теории дифференциальных уравнений (например, исследования 1883 г. профессора математики факультета наук в Ыанси Гастона Флока (1847—1920) о линейных дифференциальных уравнениях с периодическими коэффициентами [160]). Наряду с периодическими решениями Пуанкаре выделил также класс асимптотических (т. е. бесконечно приближающихся к периодическим при t -> + оо или t ->- —©о) решений задачи трех тел, а также двоякоасимптотических (т. е. асимптотических при t-+■ -\-<ху и t -> —оо). Для специальных случаев этой задачи он исследовал вопрос об орбитальной устойчивости решений. Существенное место в этих работах Пуанкаре и в последующем развитии качественной теории (а также небесной механики) заняли исследования, связанные с методом малого параметра. Пусть в системе dx -^-=Х{ (*, XU *2, • • • , *п, Р) (*' = *т 2, -. ►, и),. (63)) Xt — аналитические функции переменных хг, х2, . .. ., хп в некоторой1 замкнутой области и периодические (с периодом 2л) непрерывные функции. t в любой точке этой области. Пусть, кроме того, функции Хг являются; аналитическими функциями малого параметра ^ ;> 0. Допустим, что при (л = 0 уравнения (63) имеют периодическое решение- xi = Ф; (t) (i = I, 2, . . ., п) с периодом 2я (срг- (t) = фг- (t + 2л)). Рассмотрим решение системы (63), удовлетворяющее начальным условиям* Фг (0) + pf Пуанкаре пытается так подобрать параметры $t как аналитические функции [х, обращающиеся в нуль при \х = 0, чтобы решение- xt (*> Фг (0) + Рг iv)i \*)(i =1,2,..., п) было периодическим с периодом* 2я. Он показывает, что при некоторых условиях (отличии от нуля некоторого определителя) такие функции могут быть однозначно определены^ при достаточно малых \х. Таким образом, при таких \х существует одно- единственное периодическое с периодом 2я решение системы (63), обра»- щающееся при \х = 0 в xt = ф^ (t) (i = 1, 2, . . ., п). Это утверждение получило в последующей литературе название теоремы Пуанкаре. Пуанкаре были получены также важные результаты для случая, когда условия теоремы (отличие от нуля упомянутого выше определителя) не выполняются. Развитие идей Пуанкаре в области качественной теории дифференциальных уравнений — дело математики XX в. Соответствующие исследования составляют значительную ее часть, важную как в теоретическом, так. и в прикладном аспекте. В XIX в. находится еще мало ученых, готовых заняться ее разработкой. В 80-е годы в ней безраздельно владычествовал1 сам Пуанкаре. В самом конце десятилетия к нему присоединился еще один исследователь — создатель математической теории устойчивости* А. М. Ляпунов. 17 if
^6.2. Теория устойчивости Ляпунова А. М. Ляпунов Александр Михайлович Ляпунов родился 6 июня (25 мая ст. ст. ) 1857 г. в Ярославле. В 1876 г. поступил в Петербургский университет, где его учителями были П. Л. Чебышев, А. Н. Коркин, Е. И. Золотарёв, К. А. Поссе, Д. К. Бобылев. Под руководством последнего были выполнены первые его исследования по гидростатике, давшие основания для оставления его в 1880 г. при университете для подготовки к профессорскому званию. Обсуждая с молодым ученым возможную тему магистерской диссертации, Чебышев предложил ему исследовать вопрос о формах равновесия вращающейся однородной жидкости, мало отличающихся от эллипсоидальной. Разрешить этот вопрос Ляпунов тогда не смог, но пришел к мысли взять в качестве темы диссертации проблему устойчивости эллипсоидальных форм равновесия. Его исследования по этой теме оказались параллельными работам А. Пуанкаре, с которым у него завязалась переписка [А6, с. 452—453J. После защиты диссертации в 1885 г. он переехал в Харьков, где занял кафедру механики в местном университете. Первые два года работы в университете он был загружен главным образом преподаванием. Вся его научная продукция этого периода сводится к двум статьям по теории потенциала, сыгравшим, впрочем, вместе с последующими его исследованиями важную роль в развитии предмета. В 1888 г. начинают публиковаться его первые работы по устойчивости движения, а в 1892 г. выходит в свет его знаменитое сочинение «Общая задача об устойчивости движения», которая в том жз году была защищена им & качестве докторской диссертации в Московском университете. Время его профессорства в Харькове (а в звании ординарного профессора он был утвержден в 1893 г.) отмечено исключительной интенсивностью его научной, преподавательской и общественной деятельности. Он с успехом продолжает свои исследования по теории устойчивости, не оставляет занятий теорией потенциала, выполняет известные работы о центральной предельной теореме теории вероятностей (см. Кн. 1, с. 226). Под его ру- ководствохМ делают свои первые шаги в науке В. А. Стеклов и Н. Н. Сал тыков. Активное участие принимает Ляпунов в деятельности Харьковского математического общества: докладывает на его заседаниях свои работы, в 1899 —1902 гг. состоит его председателем и редактором его «Сообщений». В 1900 г. он был избран членом-корреспондентом, а в 1902 г.— действительным членом Российской академии наук. В том же году он переехал в Петербург. В последний академический период своей деятельности Ляпунов вернулся к задаче о формах равновесия однородной жидкости, близких к эллипсоидальным, а также о фигурах равновесия медленно вращающейся неоднородной жидкости. В 1908 г. он участвовал в 4-м Международном конгрессе математиков в Риме. В 1909 г. был привлечен к изданию «Полного собрания сочинений» Л. Эйлера и выступил одним из редакторов двух его томов. Международное признание его научных заслуг выразилось в избрании иностранным членом Академии наук Деи Линчей в Риме и членом-корреспондентом Академии наук Франции. В конце июня 1917 г. Ляпунов с тяжело больной женой приехал в Одессу, где 3 ноября 1918 г. скончался, лишь на три дня пережив свою жену. 172
А. М. ЛЯПУНОВ Исследования по теории устойчивости систем с конечным числом степеней свободы до Пуанкаре и Ляпунова Основные направления, в связи с которыми велось начиная с XVIII в. изучение вопроса,— разработка теории малых колебаний около положения равновесия и исследования по теории возмущений небесной механики (см. [А4, 58]). И хотя само понятие устойчивости равновесия или движения оставалось ещэ неуточненным, понимание феномена и математический аппарат его исследования получили к 80-м годам XIX в. существенное развитие. Математически проблема сводилась к исследованию поведения решений системы вида dx • -s± = Xi(t,x1,x2,.. -,хп) (* = 1,2, ..., п), (64) гдеХ* — функции, обращающиеся в нуль при хх = х2 = . . . = хп = 0 и прздставимые степзнными рядами по целым неотрицательным степеням Хц х2, . . ., xni абсолютно сходящимися при достаточно малых #5, с коэффициентами — непрерывными и ограниченными функциями t при t ^> ^> t0. Разумеется, проблема не составляет никакой сложности, если мы умеем интегрировать эту систему. На практике, однако, такая возможность представляется крайне редко, и поэтому чрезвычайно важными оказываются способы ее решения, не предполагающие умения интегрировать систему (64). На принципиальную возможность такого решзния вопроса указывал пример теоремы Лагранжа об устойчивости изолированного положения 173
равновесия консервативной системы, соответствующего минимуму потенциальной энергии [Б10, т. 1, ч. 1, § 5]. Эта теорема, строгое доказательство которой провел в 1846 г. Г. Лежен-Дирихле (см. приложение в книге [Б10, т. 1]), давала возможность получать строгие выводы об устойчивости, исходя из знания одного-единственного интеграла движения. Однако совокупность проблем, которые поддавались подобному решению, оказалась очень бедной, и для исследования вопросов устойчивости приходилось прибегать к решению «по первому приближению»: в разложении функций Xt по степеням xs отбрасывались все члены, степень которых относительно xs превышала единицу, и вместо системы (64) рассматривали полученную таким образом линеаризованную систему. Разумеется, вопрос устойчивости для такой линеаризованной системы (особенно когда ее коэффициенты оказываются постоянными) чрезвычайно упрощается. Такой подход к изучению устойчивости по первому приближению характерен для работ, предшествующих исследованиям Пуанкаре и Ляпунова,— так трактуется вопрос У. Томсоном и П. Тэтом в первом томе «Трактата по натуральной философии» (1867) [384], Э. Раусом (1877) [361] и Н. Е. Жуковским (1882) [33]. Однако несовершенство такого подхода стало очевидным уже давно. Еще в 1846 г. Дирихле в работе, упомянутой выше, писал [Б10, с. 538]: «Этот,вид доказательства, применяющийся еще и в других вопросах об устойчивости и особенно в физической астрономии 18, является недостаточно строгим. В самом деле, можно с полным основанием сомневаться в том, что величины, для которых мы получаем малые пределы исходя из предположения, что эти величины всегда будут очень малы (ибо только в этом случае можно пренебрегать членами высшего порядка), действительно всегда в течение любого промежутка времени будут оставаться в этих пределах, и если даже не в этих, то вообще в каких-то малых пределах». Не снимало этих сомнений и использование второго приближения (С. Д. Пуассон, Э. Раус и др.)? так как проблема устойчивости по-прежнему изучалась для принципиально другой задачи. Математически строгое изучение вопроса начинается с упомянутых вы- шэ работ Пуанкаре по качественной теории дифференциальных уравнений. О роли этих вопросов в самом генезисе этой теории, равно как и о самих результатах Пуанкаре по теории орбитальной устойчивости, мы уже упоминали в своем месте. Для дальнейшего развития вопроса, приведшего к созданию в трудах Ляпунова математической теории устойчивости, большое значение имели не столько результаты, сколько идеи и методы качественной теории Пуанкаре. Так, сам Ляпунов писал в предисловии к своему мемуару «Общая задача об устойчивости движения» [Б12, т. 2Г с. 8]: «Хотя М. Poincare и ограничивается очень частными случаями, но методы, которыми он пользуется, допускают значительно более общие приложения и способны привести еще ко многим новым результатам. Идеями, заключающимися в названном мемуаре, я руководствовался при большей части моих изысканий». Кроме идей Пуанкаре, отправными точками при создании математической теории устойчивости послужили Ляпунову результаты предшествующих исследователей этого вопроса, рассматриваемого в рамках аналитической механики, в том числе упомянутых У. Томсона, П. Тэта,. Рауса, наконец, Дирихле, давшего строгое доказательство теоремы Лагранжа, размышления над которой сыграли важную роль в формировании так называемого второго метода. Т. е. в небесной механике. 174
«Общая задача об устойчивости движения» Ляпунова Математической теории устойчивости систем с конечным числом степеней свободы посвящен целый цикл работ Ляпунова, открывающийся «статьей 1888 г. «О постоянных винтовых движениях твердого тела в жидкости» [51] и заканчивающийся работой 1902 г. «Об одном ряде, встречающемся в теории линейных дифференциальных уравнений второго порядка с периодическими коэффициентами» [53]. Основной в этом цикле является его докторская диссертация «Общая задача об устойчивости движения», изданная в Харькове в 1892 г. [52], а в 1907 г. вышедшая во французском переводе. (О работах Ляпунова по теории устойчивости см. [А4, 60], а также очерк В. И. Смирнова в книге [55], содержащий глубокий анализ трудов Ляпунова.) В предисловии к докторской диссертации Ляпунов так характеризует ее главную задачу [Б12, т. 2, с. 8—9]: «... указать те случаи, в которых первое приближение действительно решает вопрос об устойчивости, и дать какие-либо способы, которые позволили бы решать его по крайней мере в некоторых из тех случаев, когда по первому приближению нельзя судить об устойчивости». Проблема устойчивости движения систем с конечным числом степеней свободы сводится Ляпуновым к исследованию устойчивости нулевого (невозмущенного) решения X^ — jC<2 — . • • — *^?i — ^ системы дифференциальных уравнений г), (65) где ах S dt xs = = V PsiXi 7712 + x, .....mn)xn, (S = Ъ? 1, 2,.. ■*> (т±,т21 ...,mn —целые неотрицательные числа, тг + т2 + ... + ™<п > 2); psi, Ps х' 2' ' п — действительные, непрерывные и ограниченные функции t при I > t0 и М | p(mi» тгг2,..., тп) | А г Невозмущенное движение называется, согласно Ляпунову, устойчивым, если для любого е > 0 найдется т] ^> 0, такое, что если начальные значения x°s при t = t0 решения xs (s = 1, 2, ..., п) системы (65) удовлетворяют неравенству | x°s | <^ т), то для любого t ^> t0 будет справедливо неравенство | xs | ^ е (s = 1, 2, ..., п). Для исследования устойчивости Ляпунов разработал два метода, получившие в литературе наименования первого и второго методов Ляпунова. Первый метод К этому методу Ляпунов относит [Б12, т. 2, с. 25] «совокупность всех способов исследования устойчивости... которые приводятся к непосредственному исследованию возмущенного движения и в основании которых поэтому лежит разыскание общих или частных решений дифференциальных уравнений» (65). 175
Ляпунов вводит понятие «характеристичного числа» функции х (t)r определенной и непрерывной при t ]> t0, характеризующее ее поведение при больших t. Это действительное число Я, такое, что для любого а ^> О выражение х (t) е{К~а^ —> 0 при t —.- + °°, а | х (t) £&+«)* | не ограничено при t —,> +°°- Если # (£) £*** —> 0 при любых [х, то «характеристичное число» функции х (t) полагается, по определению, равным +оо, если же | х (t) е*** | не ограничено при t —> +00 для любых |я, то «характеристичное число» функции х (t) полагается равным — оо. Характеристичным числом системы функций xt (t) (i = 1, 2, ..., п) Ляпунов называет наименьшее из характеристичных чисел этих функций. Ляпунов доказывает, что всякое отличное от нулевого решение хх (t)7 x2(t), ..., хп (t) системы первого приближения d п 4 = 2?^ (А=1,2,...,в) (66) (pki — непрерывные ограниченные при t ^> t0 функции) имеет конечное характеристичное число. Пусть XiP) (t), xfJ (t), ..., х{п] (t) (p = 1, 2, ..., n) — совокупность az линейно независимых решений системы (66), т. е. базис в пространстве решений. Сопоставим каждому решению его характеристичное число Яр, а каждому базису — число S = Кг + Х2 + ... + Яр. Ляпунов доказывает, что числа S ограничены сверху и существуют базисы (их Ляпунов называет «нормальными»), на которых достигается максимум S. Оказывается, что для любого «нормального» базиса набор характеристичных чисел (кг, Я2, ...,ЯП) будет одним и тем же. Эти числа Я1? Я2, ..., Кп называются характеристичными числами системы (66). Легко доказывается, что 5 > —|я, где \i — характеристичное число функции е 8=i Если S = — и, то система (66) называется правильной. Частный случай правильных систем составляют так называемые приводимые системы- системы, приводимые к системам с постоянными коэффициентами заменами вида п 4= У\ q^i (Л:—1,2,...,/?), где qM (t) и их производные — функции непрерывные и ограниченные при t > t0, причем величина, обратная определителю матрицы, составленной из qki (t)(k, i = 1, 2, ..., п), — ограниченная функция t. Полученная такой заменой система с постоянными коэффициентами для zk будет иметь те же характеристичные числа, что и приводимая система (66). Пусть система (66) правильная и Ях, Я2, ..., А,п — ее характеристичные числа. Возьмем I ^> 0 чисел из этой системы, причем таких, что все они положительны. Ляпунов показывает, что решения системы (65) можно представить тогда рядами i xlt = ^]Ll:m-m2'-wi)aTi ... ape~i=imiV (к= 1,2, ..., тг), 176
(т1,7П2,...,7П7) где а1? а2, ..., аг — произвольные константы, Lfc — не зависящие от at непрерывные функции t, характеристичные числа которых неотрицательны; суммирование проводится по всем неотрицательным значениям тх, т2, ..., mh таким, что т1 + т2 + ... + тг ^> 0. Ряды такого вида рассматривал еще Пуанкаре в диссертации 1879 г. «О свойствах функций, определяемых дифференциальными уравнениями с частными производными» [338]. Однако Ляпунов, как он указывает в предисловии к рассматриваемой работе, пришел к ним самостоятельно- в упомянутой выше работе 1888 г. Оказалось, что при достаточно малых по модулю величинах as эти ряды абсолютно сходятся при t ;> t0 и дают решения системы (65). Если все Xt (i = 1, 2, ..., п) положительны, то, взяв I = п, Ляпунов, получает следующую теорему: Если система (66) правильная и характеристичное число любого ее решения положительно, то для системы (65) имеет место устойчивость. Более того, если начальные значения xl (к = 1, 2, ..., п) достаточно малы, то каждое хк (t) —> 0 при t -> +оо, т. е. любое возмущенное движение при достаточно малом начальном возбуждении асимптотически приближается к невозмущенному. Для приводимых систем Ляпунов получает следующую теорему: Если система (66) приводимая и среди ее решений есть такие, характеристичные числа которых отрицательны, то для соответствующей системы (65) имеет место неустойчивость. Все рассуждения, опирающиеся на первый метод Ляпунова, связаны с интегрированием системы (65), т. е. в основе своей носят не качественный характер. Это коренным образом отличает их от исследований,, основанных на втором методе. Второй метод Этот метод применим к доказательству изложенных выше теорем, позволяющих делать выводы об устойчивости движения на основании «первого приближения». Но (и это особо важно!) он оказывается полезным и в тех случаях, когда первого приближения оказывается недостаточно. Центральное место в этом методе занимает понятие функции, получившей в последующей литературе наименование функции Ляпунова. Так называются действительные функции V действительных переменных х±, х2, ..., хп, t, определенные при t > Г, | х& | <; И {s = lr 2, ...,az; Н ^> 0) и подчиненные условиям: в рассматриваемой области они непрерывны и однозначны и обращаются в нуль при хг = х2 = ... = хп = 0. Такая функция V называется знакопостоянной (положительной или отрицательной), если выбором достаточно большого Т и достаточно малого Н можно добиться того, чтобы V в полученной таким образом области (t > Г, | xs | <^ Н) сохраняла знак (положительный или отрицательный). Если функция V не зависит от t, а выбором достаточно малого Н можно сделать так, чтобы в области | xs | <^ Н функция V обращалась в нуль только при хх = х2 = ... = хп = 0, то такую функцию V Ляпунов называет знакоопределенной (определенно-положительной или определенно-отрицательной). Эту терминологию он переносит и на функции Vr зависящие от t: такая функция называется знакоопределенной, если существует не зависящая от t определенно-положительная функция Wr ill
такая, что одна из функций (V — W) или (—V — W) является положительной. Наряду с функцией V Ляпунов рассматривает полную производную от этой функции по t, взятую в силу системы (64): v' = ^Г Xl + 1£ х* + • • • + 1Г х* + — • При этом предполагается, что функция V такова, что V однозначна и непрерывна при t > Т и | x:i \ к^Н (s = 1, 2, ..., п). «Всем известна теорема Лагранжа об устойчивости равновесия при существовании силовой функции и изящное доказательство, предложенное для нее Леженом-Дирихле... Последнее основывается на соображениях, которые могут служить для доказательства многих подобных теорем. Руководствуясь такими соображениями, мы докажем здесь следующие предположения»,— пишет Ляпунов [Б12, т. 2, с. 59] и формулирует три теоремы. Теорема 1. «Если дифференциальные уравнения возмущенного движения 19 таковы, что возможно найти знакоопределенную функцию У, производная которой V в силу этих уравнений была бы или знакопостоянной функцией противоположного знака с V, или тождественно равной нулю, то невозмущенное движение устойчиво» [Б12, т. 2, с. 59]. Более того, если к условиям этой теоремы добавить предположение, что функция V такова, что для любого е > 0 можно так выбрать Т и Я, что для t > Т и | xs | <^Н будет соблюдаться неравенство | V | <^ 8 (Ляпунов говорит в этом случае, что функция V «допускает бесконечно малый высший предел»), то «всякое возмущенное движение, достаточно близкое к невозмущенному, будет приближаться к нему асимптотически» [Б12, т. 2, с. 61]. Теорема 2. «Если дифференциальные уравнения возмущенного движения таковы, что возможно найти функцию V, которая обладала бы в силу этих уравнений знакоопределенной производной У, причем допускала бы бесконечно малый высший предел и была бы такова, чтобы при всяком t, большем некоторого предела, надлежащим выбором величин xs, численно насколько угодно малых, ее можно сделать величиной одинакового знака с ее производной, то невозмущенное движение неустойчиво» [55, с. 89]. Теорема 3. «Если дифференциальные уравнения возмущенного движения таковы, что возможно найти ограниченную функцию V, производная которой в силу этих уравнений приводилась бы к виду dV/dt = IV + W, где Я — положительная постоянная, a W или тождественно равна нулю, или представляет некоторую знакопостоянную функцию, и если в последнем случае найденная функция V такова, что при всяком t, большем некоторого предела, надлежащим выбором величин xsi насколько угодно численно малых, ее можно сделать величиной одинакового знака с W, то невозмущенное движение неустойчиво» [55, с. 94]. Таким образом, исследование вопросов устойчивости вторым методом Ляпунова сводится к построению функции V. Ляпунов строит ее, исследуя различные специальные случаи. Никакого правила для выяснения существования таких функций и их построения в общем случае Т. е. система (65). 178
он не дал. Этот вопрос исследовался уже советскими математиками, получившими в этом направлении ряд важных результатов (см. [А4]).. Итак, второй метод носит чисто качественный характер, он никак не связан с интегрированием системы (65). Он допускает простую геометрическую интерпретацию, которая делает явственной идейную его связь с методом топографических систем Пуанкаре. Интересно, однако,, что сам Ляпунов такой интерпретации своим результатам не дает и геометрического языка явно избегает. Правильные системы Изучение таких систем, в частности систем с постоянными и периодическими коэффициентами, занимает существенное место в рассматриваемой работе Ляпунова. Если коэффициенты pki в системе (66) постоянны, то, как легко показать, ее характеристичные числа Хг, Я2, ..., Яп равны действительным частям корней уравнения рц — 'к Р21 Рщ Р12 Р22 — Рп2 взятым с обратным знаком. Поэтому для таких систем применение критериев устойчивости и неустойчивости, выраженных приведенными выше теоремами, опирающимися на свойства характеристичных чиселг существенно упрощается. Изучение правильных систем приводит его к двум возможностям: «обыкновенным» случаям, когда для решения задачи можно ограничиться «первым приближением», и «особенным» случаям, когда «первого приближения» оказывается недостаточно. Основные трудности, с которыми столкнулся Ляпунов, представили ему «особенные» случаи, преодоление которых потребовало от него значительных усилий. Проведенные Ляпуновым исследования этих случаев до сих пор рассматриваются как образцы глубины проникновения в существо сложных математических проблем и мастерства их решения, сочетающего абсолютную строгость и изящество методов. В 1954 г. В. И. Смирнов обнаружил в архиве А. М. Ляпунова рукопись ранее неизвестной его работы, написанной не позднее 1893 г. и содержащей исследование одного из таких «особенных» случаев.. Оказалось, что к моменту опубликования (1963) [54] содержащиеся в ней результаты были еще совершенно новыми, никем не переоткрытыми и не перекрытыми. И это несмотря на то, что они находились » сосредоточии активно разрабатывавшейся на протяжении 60 лет области исследований. Таковы были сила Ляпунова-аналитика и сложность рассматриваемых им проблем. И если его дарование и значимость его результатов получили прижизненное признание во всем мире, то именно эта сложность трактуемых им вопросов и трудоемкость необходимого для их решения аппарата ставили его в изолированное положение — при жизни он не имел учеников и последователей, развивавших его теорию устойчивости* движения. 17»
6.3. Дальнейшее развитие качественной теории дифференциальных уравнений Почти до конца XIX в. проблемы качественной теории дифференциальных уравнений разрабатывались исключительно двумя математиками— А. Пуанкаре и А. М. Ляпуновым. Прикладникам, механикам и астрономам их исследования казались, вероятно, чрезвычайно сложными, как в идейном, так и в техническом плане. Что касается математиков, то в их отношении к новой области, по всей видимости, сказывалась еще некоторая инерция, основанная в значительной мере на приверженности к аналитическому подходу в теории дифференциальных уравнений. В конце 90-х годов ситуация начинает меняться. Одним из первых значимость новой тематики понял молодой профессор Коллеж де Франс Жак Адамар (1865 — 1963), посвятивший ей работы «О некоторых свойствах траекторий в динамике» (1897) [190] и «О поверхностях, кривизна которых может принимать различные знаки, и их геодезических» (1898) [191]. В 1901 г. в свет выходит работа преподавателя Высшей технической школы в Стокгольме Ивара Бендиксона (1861 — 1936) «О кривых, определяемых дифференциальными уравнениями» [103]. В этой работе были получены существенные обобщения содержащихся в первых двух частях одноименного мемуара Пуанкаре результатов о поведении и формах интегральных кривых уравнения первого порядка. Эти результаты, равно как и появившиеся в 20-е годы исследования американского математика Джорджа Биркгофа (1884—1944) по динамическим системам, работы 20—30-х годов советских математиков по теории нелинейных колебаний (А. А. Андронов, Н. Н. Боголюбов, Н. М. Крылов, Л. С. Понтрягин и др.) и теории устойчивости Ляпунова (Н. Г. Четаев и др.) и многие другие, в своей совокупности составившие здание современной качественной теории, принадлежат уже XX в. ЗАКЛЮЧЕНИЕ Принципиально новое развитие теории обыкновенных дифференциальных уравнений в XIX в. было определено исследованиями Коши. Производя коренную перестройку основ математического анализа, Коши подвел новый фундамент и под теорию дифференциальных уравнений. На передний план вместо задачи нахождения общего решения дифференциального уравнения вышла проблема решения начальной задачи (задачи Коши). Если ранее частное решение получалось из общего фиксацией произвольных постоянных, то теперь общее решение получалось из частного — из решения начальной задачи с нефиксированными начальными данными. При этом для решения начальной задачи Коши поставил столь характерную для анализа XIX в. проблему существования. С работ Коши начинается существенное для дальнейшего различение между локальными и глобальными свойствами уравнений и их решений. Первое доказательство теоремы существования решения начальной задачи для уравнений первого порядка было дано Коши методом ломаных в лекциях 1823 —1824 гг. Этот метод, усовершенствованный впоследствии Р. Липшицем, получил наименование метода Коши—Липшица. Второе доказательство, использующее аппарат теории аналитических функций, было предложено Коши в 1835 г. Наконец, третий из наиболее известных в XIX в. методов доказательства существования 180
решения начальной задачи, получивший развитие в работах Э. Пикара,— метод последовательных приближений. Его применение к теоремам существования в теории дифференциальных уравнений восходит к Ж. Лиувиллю (1837). К концу века теоремы существования и единственности для различных типов дифференциальных уравнений и их систем при различных предположениях относительно гладкости функций, входящих в уравнения, составили один из наиболее значительных разделов теории (Э. Пикар, Дж. Пеано и др.)» Одна из важнейших задач теории дифференциальных уравнений XVIII — первой половины XIX в.— поиск методов нахождения общих решений уравнений в квадратурах. После того как Ж. Лиувилль в 1841 г. доказал невозможность такого интегрирования для сравнительно простого случая — уравнения Риккати, выяснилась принципиальная ограниченность такого подхода. В 70-е годы С. Ли приступил к разработке теории интегрируемости дифференциальных уравнений в квадратурах, своего рода аналога теории Галуа для алгебраических уравнений. Для этой цели ему пришлось создать целую самостоятельную дисциплину — теорию непрерывных групп и инфинитезимальных преобразований, превратившуюся в один из наиболее развитых и плодотворных разделов математики XX в.— теорию групп и алгебр Ли. Данная Ли классификация конечных непрерывных групп точечных преобразований на плоскости позволила ему описать классы обыкновенных дифференциальных уравнений, допускающих соответствующие преобразования, и методы их интегрирования. Так как дифференциальные уравнения, как правило, не допускают никакой нетривиальной группы преобразований, то построение на этом пути содержательной теории оказалось возможным лишь для некоторых отдельных классов уравнений. Важные результаты в этом направлении для линейных уравнений были получены в конце века в работах Э. Пикара и Э. Вессио. Линейные дифференциальные уравнения составили, как и в XVIII в., один из наиболее интенсивно разрабатываемых в XIX столетии разделов теории. Это объясняется в первую очередь их большим значением для механики и математической физики. Решение специальных видов таких уравнений с помощью рядов привело к введению и детальному изучению целого ряда трансцендентностей — цилиндрических, сферических функций, функций Ламе, Матье и др., чрезвычайно обогативших арсенал анализа. В первой половине века существенное развитие получили вопросы общей теории линейных дифференциальных уравнений. В частности, был окончательно прояснен вопрос о линейной независимости решений (Э. Кристоффель, 1858), значительных успехов добились в изучении аналогии этих уравнений с алгебраическими. В работах прежде всего английских математиков (Д. Грегори, Дж. Буль) были созданы интересные символические методы решения таких уравнений — методы, получившие в конце века развитие в работах О. Хевисайда, породившие в нынешнем столетии значительную литературу и сыгравшие важную роль в становлении теории линейных операторов. Задачи математической физики привели к необходимости изучения краевых задач для линейных уравнений с коэффициентами, зависящими от параметра. Такие задачи стали объектом теории, созданной Штурмом и Лиувиллем в 30-е годы. Центральными здесь были вопросы качественного изучения поведения собственных функций граничной задачи и разложения функций в ряды Фурье по собственным функциям задачи. Интерес к теории Штурма—Лиувилля возродился лишь в по- 181
следние два десятилетия века, когда наметилось общее усиление интереса к изучению дифференциальных уравнений в действительной области. Эти исследования — различного рода обобщения задачи, обоснование методов теории, в частности построение строгой теория разложения функций в ряды по собственным функциям задачи Штурма—Лиувилля (В. А. Стеклов),— были с успехом продолжены в XX в. и привели к созданию обширной теории краевых задач для обыкновенных дифференциальных уравнений. Они способствовали развитию асимптотических методов теории дифференциальных уравнений, а также спектральной теории — одного из источников функционального анализа. XIX век — время становления теории аналитических функций. Ведущей фигурой здесь в первой половине века был все тот же О. Коши. Созданием второго метода доказательства существования решения начальной задачи для уравнения первого порядка он положил начало разработке аналитической теории дифференциальных уравнений. Ее продолжили его ученики Ш. Врио и Ж. Буке, впервые (1856) начавшие систематически рассматривать дифференциальные уравнения как определяющие функцию и изучать свойства функции по самому уравнению. В частности, они начали систематическое изучение особых точек решений. Ряд плодотворных результатов и идей в аналитической теории уравнений содержали работы Б. Римана 50-х годов. И хотя большинство из них увидело свет лишь после его смерти, в 70-е годы, и некоторые оказались к тому времени переоткрытыми, они оказали значительное влияние на дальнейшее развитие теории. После почти десятилетнего затишья в 60-е годы под влиянием К. Вейерштрасса начинается новый этап в развитии аналитической теории дифференциальных уравнений. Ведущей фигурой выступает Л. Фукс. В цикле работ, выполненных в эти годы, он строит аналитическую теорию важного класса линейных дифференциальных уравнений, все интегралы которых обладают только регулярными особыми точками. Такие уравнения получили впоследствии наименование уравнений фук- сова типа. Отправляясь от этих исследований Фукса, А. Пуанкаре пришел (1881) к открытию нового важного класса трансцендентностей— автоморфных функций. Что касается нелинейных уравнений, то при их изучении возникали существенные трудности в связи с появлением у них (в отличие от линейных) подвижных особых точек. Больших успехов в изучении нелинейных уравнений первого порядка, интегралы которых имеют неподвижные точки ветвления, добился сам Фукс. Его исследования были продолжены А. Пуанкаре и П. Пенлеве, получившими на рубеже XIX и XX вв. фундаментальные результаты относительно нелинейных уравнений второго и более высоких порядков. Успехи теории аналитических функций и основывающейся на ней аналитической теории дифференциальных уравнений привели в 40—60-е годы XIX в. к значительному спаду интереса к теории дифференциальных уравнений в действительной области. Так, например, почти в полном забвении оказался первый метод доказательства существования решения начальной задачи, предложенный Коши в 1823—1824 гг. Даже переоткрытие этого результата (полученного в значительно более общем виде) в 1868—1869 гг. Липшицем не обратило на него должного внимания. Нужно было дожидаться появления работ А. Пуанкаре 80-х годов по качественной теории уравнений, чтобы вновь пробудить интерес математиков к исследованию уравнений в действительной области. 182
Так же как и в случае теории Штурма—Лиувилля, появление качественной теории дифференциальных уравнений А. Пуанкаре было обусловлено в первую очередь задачами, лежащими вне области самой теории,— в данном случае задачами небесной механики. (Из задач гидродинамики исходил Н. Е. Жуковский, предвосхитивший (1876) некоторые идеи качественной теории А. Пуанкаре.) Специфика этих задач (таких, например, как задача орбитальной устойчивости) во многом определила подход Пуанкаре — рассмотрение поведения интегральных кривых на всей плоскости. В цикле исследований 80-х годов, а также в последующих работах по небесной механике Пуанкаре ввел основные понятия и наметил главные направления, в которых в дальнейшем развивалась эта область, ставшая одной из основных в теории уравнений нынешнего века. В этих исследованиях, для которых характерен геометрический подход к изучаемым вопросам, мы находим первые ростки идей Пуанкаре, приведших его к созданию комбинаторной топологии. Вскоре вслед за Пуанкаре к разработке качественной теории дифференциальных уравнений приступил А. М. Ляпунов, основавший особое большое направление этой теории, ставшее также важной частью как математики, так и теоретической механики XX столетия,— теорию устойчивости движения. В знаменитом докладе «Математические проблемы», произнесенном в 1900 г. на Втором Международном конгрессе математиков в Париже, 38-летний Давид Гильберт, предлагая вниманию математиков наиболее перспективные, с его точки зрения, проблемы, «исследование которых может значительно стимулировать дальнейшее развитие науки» [77, с. 23], назвал две задачи из области теории обыкновенных дифференциальных уравнений. Одна из них — «вопрос о максимальном числе и о расположении предельных циклов... Пуанкаре для дифференциального уравнения первого порядка и первой степени вида dyldx = YIX, где X, Y — целые рациональные функции п-Ш степени относительно х, у» (16-я проблема) [77, с. 48]. Другая — проблема, «над которой, по-видимому, размышлял еще Риман и содержание которой состоит в том, чтобы показать, что всегда существует линейное дифференциальное уравнение фуксова типа с заданными особыми точками и заданной группой моиодромии» (21-я проблема) [77, с. 55]. Первая из этих проблем относится к качественной, вторая — к аналитической теории дифференциальных уравнений. В такой перспективе на пороге нового столетия видел основные пути ее дальнейшего развития наряду с Пуанкаре величайший математик рубежа XIX и XX вв. Давид Гильберт.
Часть третья ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ ВВЕДЕНИЕ Вариационное исчисление оформилось в самостоятельную математическую дисциплину в середине XVIII в. в сочинениях Л. Эйлера. Созданный им прямой метод опубликован в 1744 г. в [39]. Этот метод приводил1 к громоздким вычислениям уже в простейших задачах, и вскоре на смену ему пришло исчисление вариаций Ж. Л. Лагранжа. Работы Эйлера [61—63, 40] основаны уже на новом методе. В [61] он ввел сам термин «вариационное исчисление». Напомним кратко важнейшие результаты, полученные в вариационном исчислении на протяжении XVIII в. (см. ИМ, т. 3, гл. 10), и выделим основные проблемы, стоящие перед учеными в начале XIX столетия. Простейшая задача вариационного исчисления состоит в отыскании экстремума интеграла (мы теперь часто говорим — функционала) J = \ f(x,y,y')dx при фиксированных краевых условиях у (х0) = у0, у (хх) = ух. Используя метод ломаных, Эйлер (1744) [39] показал, что функция, доставляющая экстремум этому интегралу, должна удовлетворять дифференциальному уравнении^ jy dx JlJ ~~ Это уравнение Лагранж назвал по имени Эйлера. Кривые, являющиеся его решениями, А. Кнезер много позднее назвал экстремалями. В [39] Эйлер нашел также аналогичное дифференциальное уравнение для задачи об экстремуме интеграла] / = $/(*, у, ^,/,---5y(n))tf*. х0 В 1759 г. в своем первом мемуаре по вариационному исчислению [Б47, т. 1] Лагранж вывел те же уравнения методом вариаций. Там же он нашел дифференциальное уравнение и для более сложной пространственной задачи об экстремуме интеграла xi J = jj f(x,y, z9 y'f z', у", z\ . ..) dx. x0 При этом Лагранж впервые рассмотрел задачу с подвижными концами и получил не только уравнение Эйлера, но и условия для концов кривой— так называемые условия трансверсальности. 1 Мы еще вернемся к методу Эйлера, получившему новое развитие в XX в. 184
Л. ЭЙЛЕР Позже, в третьем томе «Интегрального исчисления» (1770) [40]г Эйлер привел дифференциальное уравнение задачи об экстремуме двойного интеграла в случае прямоугольной области. Вопросы об экстремуме двойных интегралов в любой области интегрирования оставались нерешенными. В 1786 г. А. М. Лежандр поставил вопрос об отыскании достаточных условий экстремума функционалов. Он рассмотрел простейшую вариационную задачу и утверждал, что если вдоль экстремали у (х) выполняет- ся условие fy>y> ^> 0, то она дает минимум интегралу \ f {xry,y>')dx среди всех кривых, имеющих с у (х) общие концы А (х0, у0) и В (х\, ух). В 1797 г. Лагранж [Б47, т. 9, с. 303] показал, что рассуждения Лежандра содержат пробел, но не восполнил его, и, таким образом, вопрос о достаточных условиях экстремума в вариационных задачах к началу XIX в. также оставался открытым. 1. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ В ПЕРВОЙ ПОЛОВИНЕ XIX в. Первую половину XIX в. естественно рассматривать как отдельный период в развитии вариационного исчисления, когда основные усилия математиков были направлены на поиски необходимых условий экстремума кратных интегралов и нахождение достаточных условий слабого экстремума 2. В это время была построена теория Гамильтона—Якоби, 2 Термины «слабый» и «сильный» экстремум ввел А. Кнезер (см. ниже). 185
Ж. ЛАГРАНЖ отчасти подготовленная более ранними исследованиями X. Гюйгенса и Лагранжа по оптике и механике. Говорят, что функционал / достигает на кривой у (х) сильного относительного минимума, если неравенство J{y)<J (У) выполняется для всех кривых сравнения у (х)г удовлетворяющих условию е-близости нулевого порядка I У (*) — У П I < е на всем промежутке [х0, хх]. Предполагают, что кривые у (х), у (х) удовлетворяют заданным граничным условиям. Говорят, что на кривой у (х) функционал / достигает слабого относительного минимума, если неравенство J(y)<J (у) выполняется для всех кривых сравнения, удовлетворяющих условиям \У(*)-У(х)\<г, \У'(х)-у'(х)\<г. Здесь к условию, требующему е-близости по ординате, добавлено условие е-близости по производной. Очевидно, что всякий сильный минимум является одновременно слабым минимумом, но не наоборот. Для вариационного исчисления в XVIII и первой половине XIX в. характерна неразрывная связь исследований с приложениями: задачами механики, оптики, а также проблемами быстро развивавшейся в XIX в.. математической физики. 186
1.1. Теория экстремумов кратных интегралов В XVIII в. еще не было развитой теории двумерных и криволинейных интегралов, еще не были установлены связи между интегралами объемными, поверхностными, криволинейными. Все эти вопросы были разработаны в первой трети XIX в. в трудах К. Ф. Гаусса, М. В. Остроградского, Д. Грина, С. Д. Пуассона. Как сказано, двумерная вариационная задача была впервые рассмотрена Эйлером в 1770 г. в третьем томе «Интегрального исчисления» [40] в частном случае прямоугольной области, именно а ^ x^br с <^у <^ d. Для экстремума интеграла J = J J V ^' У'Z' Pl q}dx dy' P'' dz dz dx ' * dy g=- при фиксированных краевых условиях он нашел дифференциальное уравнение Первые результаты, касающиеся общего случая, были получены Гауссом. Работ, специально посвященных вариационному исчислению, Гаусс не оставил. Новые методы вариационного исчисления он разработал при решении конкретных геометрических и механических задач. В 1813 г., исследуя задачу о притяжении точки трехосным эллипсоидом [67], он указал, что его решение основано на шести общих теоремах, «посредством которых можно привести трехкратные интегралы, распространенные на объем тела (korperlichen Raum), к двукратным интегралам, распространенным только на поверхность тела» (цит. по [24г с. 204]'). Приемы преобразования объемных интегралов в поверхностные, разработанные в 1813 г., Гаусс использовал затем в статье 1830* г. [68]1 «Общие принципы теории фигуры жидкостей в состоянии равновесия», в которой, решая задачу из теории капиллярности, пришел к экстремуму двойного интеграла с переменной областью интегрирования. Записав уравнение свободной поверхности жидкости z = z (х, у), а уравнение внутренней поверхности сосуда g = g (х, г/), он свел задачу к отысканию* минимума интеграла со - Va JJ U2 - g*\ dxdy + (а2 - 2|32) JJ Vi+ gl + rf dxdy + + a2 JJ /1 + P2 + Q2 dxdy при условии [z — g] dxdy = S. SS" Интегрирование распространяется здесь на проекцию свободной поверхности жидкости на плоскость ху; р = dzldx, q = dz/dy; а и Р суть постоянные, зависящие от отношения удельного веса к интенсивности молекулярного притяжения частиц жидкости друг к другу и частиц сосуда к жидкости. Впервые в истории вариационного исчисления Гаусс находит для этой конкретной задачи на экстремум двойного интеграла не только дифференциальное уравнение, но и краевое условие. Задача решена им посредством приема, вполне аналогичного тому, которым он сам в работе (1813) [67] преобразовал объемный интеграл в поверхностный. Здесь же Гаусс от 187
интеграла по поверхности переходит к интегралу, взятому по ее границе, и благодаря этому находит краевое условие в вариационной задаче. Характеризуя результаты Гаусса, А. И. Маркушевич писал [24, с. 213]: «Хотя Гаусс и не дает в своих работах 1813 и 1830 гг. общих формул, преобразующих интегралы по объему в интегралы по поверхности или интеграл по поверхности в криволинейный интеграл, однако в таких деталях и с такой геометрической отчетливостью проводит для рассматриваемых им специальных задач все необходимые выкладки, что всякий математик, прочитавший внимательно его работы, мог без затруднений, следуя Гауссу,, шаг за шагом выполнять оба преобразования в любой аналогичной задаче». В феврале 1826 г. в работе «Доказательство одной теоремы интегрального исчисления», представленной Парижской академии наук, но опубликованной только недавно А. П. Юшкевичем [26] (см. также [41]),. М. В. Остроградский впервые высказал и доказал точно так, как это делают теперь, теорему о преобразовании объемного интеграла от выражения типа дивергенции в поверхностный интеграл 3. В 1828 г. в работе о приложении анализа к теории электричества и магнетизма Дж. Грин выводит формулу для оператора Лапласа . д2и д2и д2и которую можно записать в виде \ V \ (ики — vAu) dxdy dz=\\ (и —£- v -j-\ ds. В ноябре 1831 г. С. Д. Пуассон доложил Парижской академии наук решение вариационной задачи об экстремуме двойного интеграла с переменными границами [102]. Он был знаком с работой Гаусса 1830 г.г на которую сослался в своей статье 1831 г. по теории капиллярности. Знал он и теорему Остроградского, так как она была еще раз сформулирована в той части «Мемуара о распространении тепла внутри твердых тел», которую Остроградский представил Парижской академии наук 6 августа 1827 г. [27]. Мемуар был дан на отзыв Фурье и Пуассону. Итак, Пуассон уже имел в своем распоряжении теорию, позволяющую переходить от двойных интегралов к криволинейным. Это позволило ему в общем виде получить краевые условия для двойного интеграла с переменными границами. В работе 1853 г. Пуассон не указывает на статьи Гаусса, видимо, потому, что Гаусс изучал конкретную задачу и даже не формулировал вариационную проблему общим образом. Чтобы охарактеризовать метод Пуассона, рассмотрим то место в решении проблемы, на котором остановился Эйлер. Для вариации bdzldx Эйлер получил выражение « dz dbz dz д^х дх дх дх дх Затем для вариации 8o2z/dxdy он нашел два разных выражения в зависимости от того, получена она дифференцированием сначала по х, затем по у, или наоборот. Чтобы устранить противоречие, Эйлер предположил, что 8х зависит только от х, а 8у — только от у. Далее Эйлер предложил считать, что 8х = 0, Ьу = 0. 3 В печати эту теорему Остроградский привел несколько лет спустя в статье (1831) [98], 188
Он писал [40, т. 3, с. 373]: «Мы избегнем счастливейшим образом всех сомнений в этом вопросе, если будем придавать вариации только количеству z, а остальные количества х и у будем оставлять неварьированными, так что 8х = 0 и бг/ = 0, чем мы не только облегчим вычисления, но и вряд ли ограничим применение вариационного исчисления. Ибо если мы сравниваем поверхность с другой, очень близкой к ней, то ничто нам не мешает ставить в соответствие каждой точке заданной поверхности такую точку варьированной поверхности, которая имеет те же координаты х и у, так что только третья координата z претерпевает вариацию». Таким образом, Эйлер рассматривает вариационную задачу, в которой область интегрирования D не меняется. Это ограничение снял Пуассон. В мемуаре 1833 г. он рассмотрел х и у как функции вспомогательных переменных и и v. Он получил для вариации &(dz/dx) выражение более общее, чем Эйлер. Именно у Пуассона д dz < dbz dz dbx dz Г dby дх дх дх дх ду дх В частном случае, который предложил рассмотреть Эйлер, когда Ьу не зависит от х, из формулы Пуассона получается формула Эйлера. Пуассон решает задачу об экстремуме двойного интеграла J~\y(x*y>z< Р> q)dx dy> Р =' dz dz ?=■ дх ' * ду D Произведя замену переменных, он получает т С С у I дх ду дх ду \ , , J J \ ди ди dv ди ) D Затем Пуассон находит вариацию б/, приравнивает ее нулю и преобразует к следующему виду: б/ = J J Hvdxdy + Г. Отсюда выводится уже известное уравнение Эйлера Н = 0, т. е. и условие l(Vpdy-Vqdx)8z = 0. с Итак, в работе Пуассона были впервые найдены условия, относящиеся к границе области интегрирования. В конце мемуара Пуассон заметил, что его исследование можно распространить на интегралы любой кратности. При этом в случае тройного интеграла вариация б/ будет состоять из двух слагаемых, из которых первое представляет собой тройной интеграл и из него получают дифференциальное уравнение. Второе слагаемое может быть преобразовано к двойному интегралу. Этим кратким замечанием Пуассон и ограничился. Вопрос о вариации интегралов любой кратности решил Остроградский в своем знаменитом «Мемуаре об исчислении вариаций кратных интегралов» (представлен в 1834 г., опубликован в 1838 г.), в котором высоко оценил работу Пуассона [Б18, т. 3, с. 45]: «На мемуар Пуассона в вариационном исчислении всегда будут ссылаться в истории дифференциального 18»
анализа. Именно в этом труде мы впервые находим полную вариацию двойного интеграла». Основной результат своего мемуара Остроградский характеризовал как «способ нахождения вариации как угодно кратного интеграла». В рассматриваемой работе Остроградский впервые в вариационном исчислении вывел необходимое условие экстремума интеграла любой кратности «/" = J U dx dy dz..., -взятого по области, координаты которой удовлетворяют неравенству L (х, у, z,...) < 0. Пуассон не случайно ограничился изучением двойных интегралов. Для обобщения его результатов на случай п > 2 ему еще не доставало средств в арсенале интегрального исчисления. И эти средства нашел Остроградский. Он сумел исследовать на экстремум интеграл любой кратности, используя собственные результаты в теории многомерных интегралов, которые сами по себе составляют выдающийся вклад в интегральное исчисление. Так, он распространил теорему, доказанную в 1826 г., на я-мерный интеграл и соответствующий интеграл, взятый по границе п-мерной области. Эта задача была особенно трудной, так как вспомогательные представления по геометрии «-мерных пространств начали складываться позже (об этом см. Кн. 2, гл. 1, § 5). Для преобразования переменных в я-кратных интегралах Остроградский разработал общую формулу, при этом он впервые использует функциональный определитель. Он первый дает полное и точное описание приема вычисления n-кратного интеграла с цомощью п последовательных интеграции по каждой переменной в соответствующих пределах. Остроградский получил первую вариацию исследуемого интеграла в виде + \ DU dxdydz . . . Выражение под знаком первого интеграла типа дивергенции, и Остроградский представляет б/ в другом виде 6 J = С UbLds =■ + {dU dxdydz..., где первый из интегралов правой части является (п — 1)-кратным и берется по границе области интегрирования S, а второй я-кратный интеграл — по самой области. Затем второй интеграл выражается как сумма двух интегралов, взятых соответственно по области и по ее границе: J DU dx dy dz... = \ (oDU dx dy dz... + j Qds. Уравнение со = 0 — это дифференциальное уравнение Эйлера для данной задачи. Из формул и указаний Остроградского можно получить также граничные условия. Однако сам Остроградский не выписал ни уравнения Эйлера, ни граничные условия. Последние параграфы его мемуара написаны очень лаконично, как и многие работы Остроградского. 190
М.В. ОСТРОГРАДСКИЙ Мемуар Остроградского был опубликован также в 1836 г. в 16-м томе журнала Крелле, а позднее в английском переводе в книге И. Тодген- тера [106]. Однако сжатость изложения настолько затрудняла понимание работы, что в 1844 г. Парижская академия наук объявила конкурс на тему: «Найти предельные уравнения, которые должно присоединить к уравнениям неопределенным для того, чтобы вполне определить максимумы и минимумы кратных интегралов». Премия была присуждена профессору математики в Страсбурге П. Саррюсу (1798—1861), который подробнее развил необходимые вычисления, не внеся ничего принципиально нового по сравнению с Остроградским. Почетным отзывом была отмечена работа Шарля Делоне (1814—1872), впоследствии известного математика и астронома, который сам указывал, что его прием мало отличается от метода Остроградского, преодолевшего главные трудности проблемы. Ученик Остроградского профессор университета в Одессе Егор Федорович Сабинин (1831 — 1909) подробно разобрал мемуар Саррюса и указал на содержащиеся в нем неточности (1888— 1889) [33], (1902) [34] (О работах Остроградского см. [9, 31]). 1.2. Теория Гамильтона—Якоби К важнейшим результатам, полученным в вариационном исчислении в первой половине XIX в., относится введение так называемых канонических переменных (х, у, z, и, v) вместо переменных (х, у, z, у', z'). В новых переменных дифференциальные уравнения Эйлера принимают простую 191
каноническую форму. Кромз того, доказывазтся, что экстремали являются характеристиками дифференциального уравнения в частных производных первого порядка. Теория канонических уравнений развита в работах Гамильтона и Яко- би и в дальнейшем усовершенствована Остроградским. Исследования в этой области в равной мере относятся к вариационному исчислению и к механике и ее вариационным принципам. Впервые дифференциальные уравнения движения записал в каноническом виде Лагранж. В 1809 г. в исследованиях по небесной механике [85] он вывел канонические уравнения, варьируя элементы орбит планет (наклонение и долготу узла) и рассматривая пертурбационную функцию (см. [22, т. 1, с. 426], а также [19]). Гамильтон явился непосредственным продолжателем «Аналитической механики» Лагранжа, которую он в восхищении называл «научной поэмой». Работая над созданием математического аппарата в оптике, Гамильтон идет по пути, указанному Лагранжем. Он пишет [Б41, т. 1, с. 315]: «Тот, кто размышлял о красоте и полезности общего метода Лагранжа в теоретической механике, кто оценил простоту и гармонию, внесенные Лагранжем в исследование возмущений планет, должен почувствовать, что математическая оптика только тогда достигнет уровня, сопоставимого с механикой или с астрономией по красоте, мощи и гармоничности, когда она будет обладать соответствующим методом и станет воплощением одной центральной идеи». В работах по оптике Гамильтон пришел к введению характеристической функции. В 1832 г. в сообщении, сделанном на ежегодном съезде Британского общества содействия наукам, он высказался так [Б41, т. 1, •с. 295—296]: «Центральная идея, из которой следует весь мой метод, это идея основной или характеристической функции для каждой оптической •системы лучей». В своих последующих работах Гамильтон переносит в механику результаты, полученные им в оптике. Он вводит характеристическую функцию (1834) [74; Б41, т. 12, с. 103—162] и разрабатывает аппарат канонических уравнений динамики (1835) [75; Б41, т. 2, с. 162—212]. Гамильтон ограничился случаем свободной системы материальных точек при наличии силовой функции, т. е. системы, в которой действуют только консервативные силы. В 1837 г. Якоби показал [82], что результаты Гамильтона допускают обобщение. Вместо функции Гамильтона может быть рассмотрена другая, представляющая любое решение некоторого дифференциального уравнения в частных производных. Установив связь между этим уравнением в частных производных и дифференциальными уравнениями движения, Якоби нашел метод их интегрирования. Благодаря этому теория Гамильтона—Якоби получила известное завершение. В работе 1837 г. Якоби ограничился изучением системы свободных точек. Впоследствии он обобщил свои результаты на случай, когда между точками существуют связи. Эти исследования опубликованы впервые только в 1866 г. в изданных Клебшем его «Лекциях по динамике» [42]. В работе «Об интегралах общих уравнений динамики» (1848), опубликованной в 1850 г. [100; Б18, т. 2, с. 129—138], Остроградский обобщил результаты Гамильтона и Якоби на случай, когда связи и силовая функция зависят от времени. В 1848 г. он написал также «Мемуар о дифференциальных уравнениях, относящихся к изопериметрической задаче» (опубл. в 1850 г.) [101; Б18, т. 2, с. 139—233], в котором обобщил результаты, 192
У. Р. ГАМИЛЬТОН полученные для уравнений динамики, на вариационную задачу об экстремуме интеграла г С т/ / dxi d2*i dUxm \ л. ti Благодаря трудам Якоби и Остроградского теория, основы которой заложил Гамильтон, приобрела весьма общий и завершенный характер. Она не только содействовала развитию вариационного исчисления, но сыграла фундаментальную роль в его приложениях к классической механике, а позднее к квантовой теории. Эти вопросы подробно освещены в ряде сочинений по истории механики (см. [29; 5, с. 780—879]). 1.3. Достаточные условия слабого экстремума Одним из важнейших достижений вариационного исчисления первой половины XIX в. является отыскание совокупности достаточных условий существования слабого экстремума. Во введении уже упоминался «Мемуар о различии максимумов и минимумов в вариационном исчислении» Лежандра (1788) [89]. Он основан на аналогии с дифференциальным исчислением, в котором, как известно, для существования минимума функции у (х) в некоторой точке достаточно, чтобы в этой точке выполнялись условия у' = 0, у" > 0. 7 Математика XIX века 193
Лежандр исходил из следующих соображений: для того чтобы интеграл достигал минимума на некоторой кривой, достаточно, чтобы вдоль этой кривой на отрезке интегрирования выполнялись условия б/ - 0, б2 / > 0. В простейшей задаче вариационного исчисления S / (х, У, У') dx -> extr, у (х0) = у0, у (х{) = у1 х0 он привел вторую вариацию б2/ к виду &J = ] fv-v (V + Ц^ «?)' dx, Х0 где v (х) — решение дифференциального уравнения /«V (/™+-£-) = (/иг+ ")'• (1) Отсюда Лежандр сделал вывод, что условие fy>y' > 0 достаточно для существования минимума. Исследуя задачу хх ) f(x,y,y'9y")dx->extr, х0 Лежандр ввел три вспомогательные функции: v, иъ v2, которые должнъ! удовлетворять системе дифференциальных уравнений (/- + ■£) {>«■ + а* + •&) - (/», + •> + -&)*, (2) fy"y" (fyy + "£■) = ifyy" + ^i)2» 1\Г\Г [fy'y' + 2v± + "^) = (W + ^)2. Аналогичные рассуждения Лежандр провел и для более общей вариационной задачи $ -/ (я, г/, г/', ... , */(rl)) tfz -> extr. х0 Возражение против теории Лежандра выдвинул в 1797 г. Лагранж в «Теории аналитических функций» [Б47, т. 9]. Он заметил, что утверждения Лежандра справедливы только в том случае, когда функции и (х), и± (х)г и2 (х) не обращаются на отрезке интегрирования [х0, х±] в бесконечность. Никаких методов исследования уравнения (1) и системы (2) не было. Решение проблемы зашло в тупик. Итак, к началу XIX в. выяснилось, что условие Лежандра не гарантирует наличие экстремума в вариационных задачах. Необходимо было дополнить исследования Лежандра в новом направлении. Дело в том, что и уравнение Эйлера, и условие Лежандра fV'V' > 0 являются «локальными», т. е. «проверяемыми» в отдельных точках экстремали. Но, например, геодезическая на сфере в малой своей части дает минимум; если же ее длина больше, чем длина половины окружности большого круга, то минимума она не дает. Значит, необходимо было найти некоторое «глобальное» условие. Это сделал К. Г. Якоби в 1837 г. Якоби уделял проблеме отыскания достаточных условий существования экстремума много внимания. В письме от 14 сентября 1837 г. к сво- 194
А. М. ЛЕЖАНДР •ему брату Б. С. Якоби, известному физику, впоследствии члену Петербургской академии наук, он называл вариационное исчисление, аналитическую механику и теорию чисел своим «полем битвы», имея в виду то, что в этих областях науки он работает особенно упорно. В течение ряда лет Якоби читал в Кёнигсбергском университете лекции по вариационному исчислению. Чтобы заполнить пробел в теории Лежандра, нужно было решить составленную им систему дифференциальных уравнений или показать, что эта система имеет решение, конечное на отрезке интегрирования [хо, х{\. Многие годы работал Якоби над решением этой задачи. Наконец, 20 декабря 1836 г. он пишет брату [Б28, с. 49]: «Я счастливо заполнил большой пробел в вариационном исчислении, относящийся к критерию наибольшего и наименьшего, над которым я, как ты знаешь, бился ряд лет, благодаря тому что мне неожиданным образом удалось посредством нового применения прекрасного метода вариации постоянных полностью проинтегрировать систему дифференциальных уравнений, интеграция которой по всем известным методам казалась невозможной». Результаты Якоби содержатся в статье «К теории вариационного исчисления и дифференциальных уравнений» [81]. В 1842 г. И. Д. Соколов, изложив в своей работе [35] теорию Лежандра (об этой работе речь пойдет ниже) и отметив необходимость заполнить пробелы, в ней содержащиеся, так писал о мемуаре Якоби [35, с. 20]: «Долго геометры не находили никаких средств достигнуть этой цели, даже сомневались в возможности найти какие-либо для этого средства. Но в последнее время кёнигсбергский профессор Якоби объявил, что он успел сделать указанное Лежандром преобразование. Исследования Якоби касательно этого предмета еще не 7* 195
публикованы. В 17-м томе журнала Крелле находится только краткое указание на метод, по которому он дошел до искомого преобразования». Статья, о которой говорит Соколов,— это единственная работа Яко- би, посвященная достаточным условиям существования экстремумов в вариационном исчислении. Она содержит только формулировки. В начале мемуара Якоби указывает, что функция v (х), являющаяся решением уравнения Лежандра (1), выглядит так; и = ~~ v w + IT fy* ~di~^ ' где и = а ду!дах + Ъ ду/да2, а и Ъ — произвольные постоянные, у (х, аъ а2) — общее решение дифференциального уравнения Эйлера 'у dx JlJ ' у (х, ах, а2) зависит от двух произвольных постоянных: ах и а2. Таким образом, Якоби показал, что если уравнение Эйлера проинтегрировано, т. е. найдено семейство экстремадей у (х, аъ а2), то для решения вопроса о существовании максимума и минимума не надо проводить других интеграции. Искомая функция мо?кет быть составлена из производных функции у (х, а1? а2) по произвольным постоянным. В задаче + *' * "" I f(x,y,y\g")dx-+extr кривые, удовлетворяющие уравнению Эйлера dx Jy ^ dx* fy ~~ dr. fy' + dx* fy" ~~ °' зависят от четырех произвольных постоянных: у (х, ах, а2, «з, а4). Якоби записал функции v, vx, v2, являющиеся решениями системы (2), с помощью функций и и их, которые он составил из производных функций у (х, а1? а2, аз> аь) п0 произвольным постоянным: ду ду ду , ду х да\ ' да2 да3 даА ' и дУ \ -и дУ i и дУ \ -и дУ Ml = 6l^T + ь*!^ + 6з^Г + h 157» где а*, ^г (*=1» 2, 3, 4) — произвольные постоянные. Итак, для решения системы (2), составленной Лежандром, и в этой задаче не нужно проводить какого-либо дополнительного интегрирования, если найдено общее решение уравнения Эйлера, зависящее от четырех произвольных постоянных. Якоби указывает, что аналогичный результат имеет место и в общем случае, т. е. в задаче S f{x,y,y\ . -. ,y{n))dx-+extr. 196
К. Г. Я. ЯКОБИ Далее Якоби говорит об основах своего метода, и эти его слова мы приведем полностью: «Основное зерно найденного результата заключается примерно в следующих рассмотрениях. Известна для первой вариации форма \ V 8у dx, где V = 0 — уравнение, которое должно быть проинтегрировано. Вторая вариация получает, следовательно, форму \8V8ydx. Если вторая вариация не должна менять знак, то она не может и обращаться в нуль, значит, уравнение 8V = О, которое линейно относительно 8уг не может иметь решения бг/, для которого выполняются условия, требуемые для бг/ по природе проблемы. Из этого видим, что уравнение 8V = О играет в этих исследованиях значительную роль и скоро в действительности обнаружится его связь с дифференциальными уравнениями, которые должны быть проинтегрированы для получения критерия максимума или минимума. Кроме того, сейчас же видно, что значением бг/, которое* удовлетворяет дифференциальному уравнению 8V = О, является каждая из частных производных от у по произвольной постоянной, которую у содержит как интеграл уравнения V = 0. Поэтому общее выражение для бг/ получают, если из всех частных производных у образуют линейное выражение» [81, с. 91]. 197
Кратко поясним слова Якоби. Для простейшей вариационной задачи ттервая вариация имеет вид Якоби ввел обозначение V = fy j— jv> и получил для первой вариации выражение ^ Vbydx. Если функцию у (х, а1? а2), которая является решением уравнения тюдставить в это уравнение, то оно обратится в тождество. Продифференцируем полученное тождество по ах. Получим Значит, функция ду1дах является решением дифференциального уравне ния fvvh (х) + fvA' (х) - -gj" Uw'h (х) + fvvh' (*)] = °- Так Якоби пришел к уравнению, которое сейчас носит его имя. Это линейное дифференциальное уравнение второго порядка. Очевидно, что ^функция ду/да2 также является решением этого дифференциального уравнения. Якоби рассмотрел общее решение этого уравнения, имеющее вид и = аду/даг + Ъ ду/да2. Итак, основной момент в данном рассуждении Якоби состоит в дифференцировании экстремали у (х, а1? а2) по произвольным постоянным ах и а2. Он, таким образом, предложил сравнивать экстремали с различными значениями аг и а2. До Якоби искомую экстремаль у (х) сравнивали с соседними кривыми у + 8у. При этом 8у рассматривали как функцию от х. Эйлер еще в 1744 г. указывал [39] на то, что экстремаль зависит от двух произвольных постоянных, но эти постоянные использовались только для того, чтобы из всех экстремалей семейства выбрать ту, которая удовлетворяет заданным граничным условиям. Сравнение экстремалей с различными значениями ах и а2, которое применил Якоби к решению задачи о нахождении экстремума интеграла $ f{x,y,y')dx, провел Гамильтон при исследовании интеграла действия t t J 2Tdl = J 2 т (*'2 + У'г + *'2)dL о о Он рассмотрел изменение интеграла, которое происходит при переходе от искомой траектории к соседним траекториям. Гамильтон дал развернутую характеристику своего метода: «Лагранж я другие, рассматривая движение системы, показали, что вариация этого 198
определенного интеграла исчезает, когда даны крайние координаты и постоянная Н. Они, по-видимому, вывели из этого результата только хороша известный закон наименьшего действия, а именно: 1) если представить точки или тела системы движущимися от данной группы начальных к данной группе конечных положений не так, как это в действительности происходит, и даже не так, как они могли бы двигаться в соответствии с общими законами динамики или с дифференциальными уравнениями движения, но так, чтобы не нарушать какие-либо предполагаемые геометрические связи, а также ту единственную динамическую зависимость между скоростями и конфигурациями, которая составляет закон живой силы; 2) если, кроме того, это геометрически мыслимое, но динамически невозможное движение заставить отличаться бесконечно мало от действительного способа движения системы между заданными крайними положениями, то варьированное значение определенного интеграла, называемого действием или накопленной живой силой системы, находящейся в представленном таким образом движении, будет отличаться бесконечно мало от действительного значения этого интеграла. Но когда этот закон наименьшего или, как его лучше было бы назвать, стационарного действия применяется к определению фактического движения системы, он служит только для того, чтобы по правилам вариационного исчисления получить дифференциальные уравнения движения второго порядка, которые всегда можно получить другим путем. Поэтому Лагранж, Лаплас и Пуассон, по-видимому, не без основания пренебрежительно отзывались о полезности этого принципа при тогдашнем состоянии динамики. Возможно, что иной принцип, который вводится в настоящей работе под названием закона переменного действия, в котором мы переходим от действительного движения к другому, динамически возможному движению, варьируя крайние положения системы и в общем величину Н, и который служит для выражения посредством единственной функции не только дифференциальных уравнений движения, но и их промежуточных и конечных интегралов, встретит другую оценку» [5, с. 180]. Гамильтон прямо подчеркивает то новое, что лежит в основе его исследований: ранее искомую траекторию сравнивали с произвольными соседними кривыми, с «геометрически мыслимыми» движениями, а он предлагает сравнивать «динамически возможные движения, варьируя крайние положения системы», т. е. сравнивать искомую траекторию с соседними траекториями, меняя значения параметров. Работа Гамильтона опубликована в 1834 г. В том же году Якоби с ней познакомился и высоко ее оценил. Начиная с этого времени он много работал над теорией Гамильтона и впоследствии ее значительно усовершенствовал. В 1836 г. Якоби решил вариационную проблему о достаточных условиях максимума или минимума, что ему не удавалось в предыдущие годы. Он написал об этом брату Б. С. Якоби [Б28, с. 49]. Все сказанное дает основание предполагать, что дифференцирование экстремалей по произвольным постоянным, сыгравшее основную роль в решении вариационной проблемы, появилось у Якоби в связи с его работой над статьями Гамильтона. Справедливость высказанного предположения подтверждает еще одно обстоятельство: сам Якоби неоднократно указывал на то, что свое открытие он сделал благодаря применению метода вариации постоянных. В письме к брату от 20 декабря 1836 г. Якоби пишет [Б28, с. 49], что ему удалось проинтегрировать систему дифференциальных уравнений Ле- жандра «посредством нового применения прекрасного метода вариации 199
постоянных». В «Заметке об интегрировании дифференциальных уравнений динамики» Якоби о своей теории второй вариации пишет [5, с. 289]: «Здесь можно также привести подробности открытия, о котором я раньше известил Академию: полное интегрирование дифференциальных уравнений, составленных Лежандром, от которых зависит существование максимума и минимума в изопериметрической задаче. Метод, которым я пользуюсь, есть новое и замечательное приложение известного метода вариации постоянных». Метод вариации постоянных широко применялся учеными XVIII и XIX вв. в механике и астрономии. Якоби впервые применил его в вариационном исчислении. Перейдем к дальнейшему анализу его мемуара 1837 г. Как известно, уравнение Якоби можно записать в следующем виде: fyy ~ ~dV fyv) hW~~d^ У*Ук' (*М = °- Это обстоятельство без доказательства отметил Якоби в своем мемуаре. В случае общей задачи \ f(x,y.y\ . . . ,y^)dx->extr. Он утверждал, что соответствующее уравнение имеет вид d dn (А у'»>) где Л, Ах, . . ., Ап — функции от х. Далее Якоби без доказательства указал, что благодаря особым свойствам уравнения Y = 0 вторую вариацию исследуемого интеграла можно привести к виду б2/===) fy{n)y(n)(>>2dx. X о Он отметил, что функции ду ду ду даг ' да2 ' ' да2п обращают в нуль вторую вариацию б2/, и составил функции иг, щ, - . ., ип, имеющие вид ду f ду . ду дах ' "* да2 : * * ' ' "гп да2п U2=h4%г + ь*-ёг + • • • + ь*п - daY ' *" дз2 ' ' * ' "zn да2п ' и т. д. Затем Якоби обратил внимание на то, что для решения вариационной проблемы необходимо найти условия, при которых функции ик не •обращаются в нуль. После этого он сформулировал свой критерий существования экстремума в следующих выражениях: «Если вышеуказанный анализ требует весьма глубоких рассуждений из области интегрального исчисления, то выведенный из него критерий, дает ли решение вообще максимум или минимум, очень прост. Я рассмотрю случай, когда под знаком интеграла стоит функция у с производными до порядка п включительно, граничные значения у, у', . . ., j7(n_1), так же, 200
как и сами границы, заданы. Если подставить в решения с их 2/г произвольными постоянными эти граничные значения, то произвольные постоянные будут определены. Но для этих постоянных может быть получено несколько кривых, которые удовлетворяют тем же граничным условиям и тем же дифференциальным уравнениям. Если одна из таких кривых выбрана, то рассматривают одну граничную точку как закрепленную и переходят от нее к следующим точкам кривой. Если принимают одну из этих следующих точек за вторую граничную точку, то, по сказанному, может случиться, что через нее и первую точку проходят также другие кривые, для: которых г/, г/', . . ., у(п~и на обеих границах имеют те же самые значения и которые удовлетворяют дифференциальным уравнениям вариационной проблемы. Как только мы, двигаясь по кривой, достигнем точки, для которой одна из этих других кривых с ней совпадает или, как мы можем выразиться, к ней бесконечно приближается, то это — граница, до которой или за которую интегрирование не может быть распространено, если максимум или минимум должен иметь место. Но если интеграл распространен до точки, лежащей левее этой границы, то всегда имеет место максимум или минимум в предположении, что f (п)у(п) между пределами интегрирования сохраняет свой знак» [81, с. 93]. Ни доказательства этого критерия, ни намека на способ его обоснования Якоби, однако, не привел. Таким образом, и эта часть мемуара, так же как и все предыдущие, содержит только формулировки. Результаты своего мемуара Якоби применил к решению задачи о движении точки на замкнутой поверхности, при исследовании которой возник спор между Лагранжем и Пуассоном. Они рассматривали задачу mVds -> extr. Лагранж утверждал [22, т. 2, с. 207], что речь может идти только о минимуме. Пуассон считал, что «в некоторых случаях, например в случае движения материальной точки по замкнутой поверхности, минимум может быть заменен максимумом» (цит. по [5, с. 173]). Этот спор разрешил Якоби. В лекциях по динамике, прочитанных им в зимнем семестре 1842/43 г. и опубликованных в 1866 г., он говорил [42, с. 41]: «Кратчайшие линии сохраняют свое свойство давать минимум только между известными границами. Например, на шаре, где кратчайшими служат большие круги, это свойство прекращается, как только будем рассматривать длину, которая больше 180°. Чтобы это увидеть, не- надо обращаться к помощи дополнения до 360°, что ничего не доказало бы, так как минимумы должны иметь место всегда только по отношению к бесконечно близко лежащим линиям; мы убеждаемся в этом иным способом». Якоби привел следующее доказательство (рис. 1). Пусть В — полюс для А, АаВ — дуга большого круга. Бесконечно близко к ней проводим дугу большого круга А$В. Продолжим большой круг АаВ до точки С. Пусть точка Р лежит бесконечно близко к точке В. Через р и С проведем дугу большого круга. Тогда, очевидно, PC <С В$ + ВС и, следовательно,, ломаная линия Af> + рС короче, чем большой круг АаВС. Якоби изучал только слабый экстремум, хотя сам он и не указывал на это ограничение. Исследование сильного экстремума было проведено в последней трети XIX в. К. Вейерштрассом. 201
В заключение остановимся на вопросе: что вошло в вариационное исчисление с работой Якоби? Ограничимся для краткости простейшей вариационной задачей I / («£, */, У') dx —> extr, у (хо) = г/о, у (^i) = г/i- Пусть у (х) — дуга экстремали, которая при х = х0 проходит через 'фиксированную точку А с координатами (х0, у0). Якоби рассматривает пучок экстремалей,) проходящих через А. Если огибающая у этого пучка имеет с кривой у (х) общую точку В (х, у), отличную от А, то х — это та граница, о которой говорил Якоби в конце своего мемуара. В современной терминологии, идущей от лекций Вейерштрасса, В называется точкой, сопряженной с А. При этом значение х называется сопряженным со значением х0. В своем мемуаре Якоби указал, что если вдоль экстремали у (х) выполнено условие Лежандра и если интегрирование распространено до точки х1ч где хх < %, то кривая у (х) сообщает исследуемому интетралу максимальное или мршимальное значение в зависимости от знака fy'y*. Итак, Якоби нашел совокупность достаточных условий слабого экстремума. Он высказал следующую теорему: для того чтобы кривая у (х) давала слабый минимум интегралу хг 5 f(x,y>y')dx среди всех кривых, имеющих с ней общие концы А (х0, у0) и В (хг, у\)у достаточно, чтобы выполнялись три условия: 1) кривая у (х) удовлетворяет уравнению Эйлера; 2) вдоль у (х) имеет место усиленное условие Лежандра 3) интервал (х0, хг] не содержит значений, сопряженных с х0. Вопрос о необходимости найденного Якоби условия обсуждался в математике в течение нескольких десятилетий после публикации его мемуара. Мы рассмотрим эти работы в подразделе 2.1. 2. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ ВО ВТОРОЙ ПОЛОВИНЕ XIX в. Охарактеризуем кратко развитие вариационного исчисления во второй половине XIX в. В начале этого периода ученые в основном занимались доказательством критерия Якоби, его уточнением и распространением на более широкие классы задач. В 1861 г. И. Тодгентер впервые заметил различие между слабым и сильным экстремумом. Теорию сильного экстремума построил К. Вейерштрасс, результаты которого составили эпоху в развитии вариационного исчисления. Он впервые ввел ^-функцию в лекциях 1879 г, К 1900 г. А. Кнезер и Д. Гильберт создали теорию поля экстремалей (термины Кнезера; см. ниже). Она представляет собой удобный аппарат для исследования различных обобщений простейшей вариационной задачи: задачи, в которой рассматриваются интегралы, содержащие п неизвестных функций, задачи с подвижными концами, задачи с ограничениями. Во второй половине XIX в. большое число работ было посвящено решению вариационных задач с ограничениями: изопериметрической, задаче 202
Лагранжа и задаче Майера. Впервые был выделен особый случай в изо- периметрической проблеме. В 1900 г. Кнезер сформулировал «исправлен- ное правило множителей Лагранжа». Вскоре в работах Г. Эшериха и Г. Хана были выявлены нормальные и анормальные случаи в задаче Лагранжа. Для развития вариационного исчисления во второй половине XIX в.т. как и для всей истории этой математической дисциплины, характерна тесная связь с приложениями. Ее результаты применяются к большому числу конкретных геометрических и механических задач. Конкретные задачи в свою очередь побуждают к созданию новых теорий. Такова задача Ньютона, задача о геодезических на поверхности и многочисленные задачи; механики, в которых экстремум разыскивается в классе кривых, удовлетворяющих системе дифференциальных уравнений. Особенностью вариационного исчисления второй половины XIX в. по сравнению с его предшествующим развитием, как и математического анализа в целом, является повышение требований к строгости доказательств. Этому прежде всего способствовали работы Вейерштрасса. Процесс уточнения доказательств приводил к совершенствованию математической теории, в результате сами математические проблемы дают в рассматриваемый период толчок к развитию исчисления. Так, например,, как мы покажем позже, именно в процессе отыскания строгого доказательства правила множителей Лагранжа ученые пришли к выделению нормального и анормального случаев в задаче Лагранжа. На пути уточнений условий непрерывности и дифференцируемости, накладываемых на изучаемые функции, было получено условие Вейерштрасса—Эрдмана. Впрочем, здесь была и тесная связь с приложениями, так как первые попытки найти эти условия, хотя и неудачные, были сделаны Тодгентером на основе конкретных вариационных задач. Эти исследования Тодгентера продолжил Г. Эрдман. В начале XX в. в вариационном исчислении произошло возрождение- прямых методов. К ним обратился Д. Гильберт в связи с проблемой обоснования принципа Дирихле. На рубеже XIX и XX вв. вариационное исчисление стало составной частью более общей дисциплины — функционального анализа (см. далее)^ 2.1. Доказательства критерия Якоби и его уточнения. Проблема различения слабого и сильного экстремумов Вскоре после публикации мемуара Якоби появилось большое число статей, в которых его утверждения доказывались и распространялись на более общие вариационные задачи. Одним из первых математиков, развивавших теорию Якоби, был ученик Остроградского, русский ученый Иван Дмитриевич Соколов, получивший образование в Петербурге. В 1836 г. он был послан в командировку в Германию. Впоследствии он был профессором механики в Харьковском и Новороссийском (Одесском) университетах. И. Д. Соколову принадлежит труд «Динамика» (Харьков, 1860) — одно из первых руководств, по аналитической механике на русском языке. В 1842 г. в работе «Исследование некоторых предметов, относящихся, к вариационному исчислению» [35], опубликованной в Харькове, он доказал, что в задаче *i ) f(z,y, y')dx->extr * о 20&
точкой х = т, сопряженной с точкой х нуль определителя I (ду,1да1)л^Хл (ду'д71)х^т | J (ду1да2)х=:,ь (дУ1д*2)х=т I" В 1841 г. в 6-м томе журнала Лиувилля были опубликованы статьи профессора математики в Бордо Виктора Лебега (1791 — 1875) и известного астронома и математика профессора Парижской политехнической школы Шарля Делоне [87, 53]. Их авторы изучали свойства дифференциального уравнения Якоби Ау^чг (А^ + • • • -'- ~^г{Апу(п)) = °- Ряд статей был посвящен доказательству того, что вторую вариацию б2/ интеграла j / (х. г/, у', . .., у^) dx можно привести к виду ^ j ,n)i (П)ы2с1х. Л 0 ЭС0 Этот вопрос в работах 1852 г. [91, 50] рассмотрели итальянские ученые — профессор математики в Павии А. Г. Майнарди (1800—1879) и один из крупнейших математиков XIX в. Ф. Бриоски (1824—1897), известный своими результатами по дифференциальной геометрии (см. Кн. 2, с. 28-30). В 1857 г. профессор Высшей технической школы в Вене Симон Шпит- цер (1826 — 1887) в мемуаре [1041 привел вторую вариацию б2/ интеграла $ /(*, У, У', . • . , y{n))dx для л = 1, 2, 3 к виду Хг $ А/«м«> Фу(п) + My'»-" + • • • + K&y)*dx. Он выразил Kt в виде отношений функциональных определителей, еще не используя термин «определитель». Исследования Шпитцера продолжил О. Гессе в [77], где он привел вторую вариацию к виду \/„<»>„<*)(—Г <**> V, Vn — функциональные определители (см. [20]). Для простейшей вариационной задачи Гессе получил определитель (3), рассмотренный Соколовым еще в 1842 г. [35]. Гессе доказал, что равенство нулю определителя (3) означает, что экстремали, выходящие из точки х = х0, пересекаются в точке х = т. В своем мемуаре Якоби нашел условия, при которых б/ = 0 и б2/ ^> ^> 0, и утверждал, что они достаточны для существования минимума. Позже в «Лекциях по динамике» [42, с. 42] он кратко указал на то, что найденные им условия необходимы: если перейти указанную в критерии границу, то можно вторую вариацию б2/ сделать отрицательной, выбрав Ьу подходящим образом. В 1855 г. Ж. Бертран высказал сомнение в необходимости найденного Якоби условия. В примечаниях к «Аналитической механике» Лагранжа он писал, что Якоби, видимо, сделал в своем мемуаре неоправданно далеко идущий вывод. «Ясно, что условия, найденные им, достаточны, но не необходимы для существования минимума» [86, т. 2, с. 52]. Эти слова Бер- х0, является первый после х0 (3) 204
трана опущены во французском издании сочинений Лагранжа и в русском переводе «Аналитической механики» в связи с тем, что, как выяснилось позже, условие Якоби является необходимым. Доказательство необходимости условия Якоби впервые появилось в печати в 1878 г. Оно принадлежит учителю гимназии из Кенигсберга Г. Эрдману, изучавшему простейшую вариационную задачу. А. Клебш (1858) [51] нашел условие Лежандра для задачи Лагранжа (об этой задаче см. подраздел 2.6). В первой половине XIX в. все исследования в вариационном исчислении проводились методом вариаций. Для отыскания экстремума Интегралу ла J = \ / {x,y,y')dx рассматривали разность AJ = jj / (х, у + ду, у' + by') dx — \j (х, у, yf) dx х0 х0 и, используя формулу Тейлора, представляли ее в виде д/ = б/ + -\-т + -gpflv +..., (4) где х0 &J = S f/yyV + 2/„„.6уб/ + fyv.by'*\ ax. При отыскании достаточных условий существования экстремума и Ле- жандр, и Якоби без объяснений отбрасывали в (4) все члены после б2/. Уточнение внес Вейерштрасс (см. далее). Очевидно, что метод вариаций применим только к тем задачам, где величина бг/' бесконечно мала, т. е. к задачам на слабый экстремум. Ни Якоби, ни его современники не видели этого ограничения. В 1861 г. Тодгентер в своей книге [106] первый обратил внимание на то, что в вариационном исчислении встречаются задачи, в которых Ьу' не является малой величиной. Он заметил, что к ним неприменимо разложение (4), на котором основан метод вариаций. Отсюда Тодгентер справедливо сделал вывод, что вариационное исчисление не имеет средств для решения тех задач, в которых исследуемая кривая сравнивается с ломаной линией. Особое недоумение во второй половине XIX в. вызывала задача Ньютона о форме тела, которое при движении в жидкости испытывает наименьшее сопротивление. Она опубликована в 1687 г. в его знаменитом сочинении «Математические начала натуральной философии». Ньютон исследует вопрос о сопротивлении шара, цилиндра и усеченного конуса, движущихся в среде (он называл ее редкой), которая состоит из неподвижных частиц фиксированной массы, являющихся абсолютно упругими шарами. Ньютон обнаруживает, что среди всех конусов, имеющих данную ширину и высоту, наименьшее сопротивление будет иметь конус с углом в 135°, и замечает, что данный результат может быть «небесполезен при построении судов». После этого Ньютон пишет следующее [Б9, т. 7, с. 430]: «Когда же кривая DNFG будет такова, что если из любой ее точки. N опус- 205
Рис. 2 Рис. 3 Рис. 4 тить на ось АВ перпендикуляр и (из заданной точки G) провести прямую GP, параллельную к касательной к кривой в точке N, пересекающую ось в точке Рг то (имеет место пропорция) MN: GP = = GP3: (4BP-GB2), тогда тело, получающееся вращением этой кривой около оси АВ, будет испытывать наименьшее сопротивление в вышеупомянутой редкой среде среди других тел той же длины и ширины» (рис. 2, принадлежащий Ньютону). Ньютон не дал никаких объяснений f тому, как он пришел к своему решению, и поэтому его задача не сразу привлекла внимание математиков, затерявшись среди большого числа других задач «Математических начал» Ньютона. В 1699 г. И. Бернулли и Лопиталь записали пропорцию Ньютона в виде дифференциального уравнения ^'3/(1 + У'2У = а/А, где BG = a, MN = г/, и проинтегрировали его подстановкой у' — р. Было выяснено, что кривая, удовлетворяющая уравнению Эйлера, состоит из двух ветвей с общей вершиной в точке М, в которой общая касательная наклонена к оси ох под углом 60° (рис. 3). В 1744 г. Эйлер указал [39, с. 104], что в задаче Ньютона требуется разыскать кривую, дающую минимум интегралу УУ1 1 + */'2 dx. Тело вращается вокруг оси х. Напомним, что в современных учебниках (см. [3, с. 34]) задача Ньютона ставится так 4: tdt inf, *(0) = 0, х{Т) = \. Тело вращается вокруг оси х. 4 Об уточнении х > 0 будет сказано позже 206
Отсюда сразу видно, что если взять ломаную с очень большой по модулю производной (рис. 4), то рассматриваемый интеграл будет очень мал. Впервые на это обстоятельство (как указал Лежаидр в [89]) в 1760 г. обратил внимание Сен Жак де Сильвабелль (1722—1801}, директор обсерватории в Марселе, занимавшийся астрономией и математикой и посвятивший ряд работ теории колебаний маятника и вопросам гидравлики. Он утверждал, что всегда можно построить ломаную, на которой интеграл \ 1-1 '2 dx принимает значение, меньшее, чем на кривой А В, являю- щейся решением дифференциального уравнения Эйлера (см. рис. 3). После публикации мемуара Якоби (1837) [81] было выяснено, что на кривой АВ выполняются условия Эйлера, Лежандра и Якоби, однако минимум на ней не достигается. Это обстоятельство казалось парадоксальным, и задачу стали излагать очень кратко даже в самых обстоятельных курсах по вариационному исчислению, в которых другим задачам посвящались десятки страниц. Вот как писал об этом в работе «Об одной задаче вариационного исчисления», изданной в Одессе в 1885 г. [36, с. 19], одесский математик, член Новороссийского общества естествоиспытателей Алексей Петрович Старков (1850—1903): «В начале второй половины девятнадцатого столетия задача Ньютона о поверхности наименьшего сопротивления совсем изгоняется из учебников. Столь полный и обстоятельный курс вариационного исчисления Муаньо (1861) [97], заключающий много разнообразных, подробно исследованных примеров, не содержит вовсе задачи о поверхности наименьшего сопротивления, и понятно почему: эта задача была бы лрямым противоречием принятой Муаньо, изящно им изложенной теории Якоби для различения максимума и минимума интеграла, так как все условия Якоби выполняются, а интеграл на полученной кривой, согласно указанию еще Лежандра, minimum'a не представляет». Недоумения, связанные с задачей Ньютона, были разъяснены К. Вей- ерштрассом. Он показал, что в задаче Ньютона искомая кривая сравнивается с ломаной, а при этом 6г/' уже не является бесконечно малой. Поэтому выполнение условий Эйлера, Лежандра и Якоби не обеспечивает существование экстремума в этой задаче. Нужно было расширить вариационную теорию, и Вейерштрасс достиг этого в своих лекциях по вариационному исчислению. 2.2. Вариационное исчисление Вейерштрасса К. Вейерштрасс впервые в вариационном исчислении построил теорию сильного экстремума. Результаты, полученные Вейерштрассом, изложены в лекциях по вариационному исчислению, которые он регулярно читал в Берлинском университете в 1865—1890 гг. Они записывались студентами и были широко известны в Германии и за ее пределами. Много позднее лекции Вейерштрасса были опубликованы в 7-м томе собрания его сочинений 1Н57]. В основу публикации положены записи К. В. Борхардта и Г. Шварца лекций, прочитанных в 1882 г. По свидетельству О. Больца в [47], основные результаты Вейерштрасса содержались уже в его лекциях 1879 г. Но, так как эти лекции в XIX в. не были опубликованы, современники Вейерштрасса в своих статьях по вариационному исчислению, как правило, на его результаты не ссылались. Положение изменилось лишь в начале XX в., когда появился ряд превосходных учебников [83, 71, 47], -в которых полностью излагалась теория Вейерштрасса и подчеркивались 207
его заслуги в развитии вариационного исчисления. Результаты Вейер- штрасса были подробно изложены также в статье А. Кнезера в немецкой «Энциклопедии математических наук» [84]. Отметим основные достижения Вейерштрасса. 1. Построил теорию сильного экстремума и полностью исследовал простейшую вариационную задачу в параметрической форме; нашел условие, получившее в литературе наименование условия Вейерштрасса— Эрдмана; строго доказал правило Эйлера для изопериметрической проблемы, впервые выделив особый случай. 2. Изменил весь стиль работ по вариационному исчислению тем, что привлек внимание математиков к уточнению его основ. Ею лекции отличаются точностью формулировок, глубиной и ясностью в изложении предмета. В течение многих лет Вейерштрасс читал в Берлинском университете лекции по теории функций, в которых существенно уточнил изложение основ математического анализа. Математику, по словам Вейерштрасса^ разумеется, нужно заниматься конкретными проблемами, но конечная цель, к которой всегда нужно стремиться, состоит в достижении правильных суждений о теоретических основах науки. Точно так же подошел Вейерштрасс и к изложению вариационного исчисления. О. Больца в 1909 г. в своем учебнике писал [47, с. III], что «современное вариационное исчисление создано в последние 30—40 лет под влиянием критического направления в исчислении бесконечно малых и прежде всего под влиянием воздавших эпоху открытий Вейерштрасса». Вейерштрасс впервые сформулировал ограничения, накладываемые на рассматриваемые в задачах вариационного исчисления функции, требуя их непрерывности, наличия производных до определенного порядка и т. д. Он подчеркивал, что эти ограничения уменьшают общность вариационного исчисления, так как экстремум разыскивается лишь среди кривых, дифференцируемых достаточное число раз, но они необходимы для того, чтобы применять к вариационным задачам аппарат дифференциального исчисления (например, чтобы разлагать подынтегральную функцию в ряд Тейлора, применять интегрирование по частям и т. д.). Во всех работах до Вейерштрасса принималось без каких-либо доказательств, что условия б/ = 0, б2/ ^> 0 обеспечивают существование минимума. Таким образом, без всякого обоснования в разложении (4) отбрасывались все члены выше второго порядка малости относительно бг/ и бг/'. Вейерштрасс и здесь внес уточнение. Он предложил рассматривать разложение по формуле Тейлора с остаточным членом А/ = б/ + V262/ + R. Итак, первая заслуга Вейерштрасса в области вариационного исчисления — данное им строгое обоснование этой дисциплины. Лекции Вейерштрасса состоят из двух больших отделов. Первый отдел «Теория максимумов и минимумов функций одной и нескольких переменных» занимает главы 1—6. В главах 7—31 второго раздела излагается собственно вариационное исчисление. Чтобы достигнуть большей общности, Вейерштрасс ввел параметрическое задание кривых, указав, что при этом расширяется класс кривых,, среди котррых разыскивается экстремум. Вейерштрасс рассматривает только простейшую вариационную задачу; найти кривую х (t), у (t), дающую максимум или минимум интегралу и J=^F(x,y,x\y')dt 208
К. Т. В. ВЕЙЕРШТРАСС при условии х'2 + у'' Ф О, т. е. разыскивается экстремум среди плоских кривых, имеющих закрепленные концы, причем подынтегральная функция не содержит производных выше первого порядка. Он только кратко указал на более общие вариационные задачи (отыскание экстремумов среди пространственных кривых, исследование кратных интегралов и др.)- Вейерштрасс доказал, что функция F должна удовлетворять условиям однородности F {х, у, кх\ ку) = kF (х, у, х\ у'). Кривую, соседнюю с искомой кривой х (t), y(t), Вейерштрасс записывает в виде х + £, У + г), отказавшись от традиционных обозначений 8хг бг/, как он пишет, «для большей ясности» [Б57, т. 7, с. 130]. Ранее бг/ рассматривали как бесконечно малое приращение, которое получает ордината у при переходе от искомой кривой к соседней; при этом приходилось каким-либо образом доказывать возможность перестановки символов б и d, т. е. равенство Ыу = dby, на котором основывались все дальнейшие преобразования. У Вейерштрасса £ и г] — функции от t, т. е. £ (t), r\ (t). При переходе от искомой кривой х {t), у (t) к соседней кривой х + £, у + т] производные х (£), у' (t) получают приращения £' (t), ц (t), а это равносильно равенствам Ьх' = I' (t), бу' =- V (0, или Ьх' = (б*)', 6у' = (Ру)'. 209
Для решения вопроса об экстремуме сравниваются значения интеграла вдоль исследуемой экстремали и вдоль соседней кривой, т. е. рассматривается разность M=^F(x + ty ±ц,х' + Ъ'щу* + rl')dt-$F(x,y,x',y')dt. Затем выделяется совокупность членов первого порядка относительно величин £, т|, £', т|'. Эта совокупность представляет собой первую вариацию б/ рассматриваемого интеграла. Вопросы, связанные с исследованием первой вариации, составляют предмет глав 7—12. Напомним для сравнения, что первая вариация для простейшей вариационной задачи в непараметрической форме имеет вид 6J = )[fy8y+ fv>by']dx. По методу Лагранжа интегрированием по частям б/ приводят к виду 6/=S [fy - ify']8у dx+fu'8y & (5) откуда получают уравнение Эйлера d dx fy-ifw = 0 я внеинтегральные члены fV'8y |*S относящиеся к концам кривой. Вейерштрасс тоже преобразует первую вариацию интегрированием по частям. В результате получается выражение и RT f Г / dF d dF \ с. . / dF d dF \ 1 , , Г dF t . dF 1 из которого следуют два уравнения с _ _dF_ d_ dF_ _ 0 с _ dF_ _ d_ dF_ _ ~ 1 dx dt dx' ' "2 dy dt dy' Вейерштрасс доказал существование такой функции F^ что d*F „ ,2 d*F „ , , d*F дх>2 — - 1* » дх>ду> — - ±~ if » ^ и с помощью этой функции заменил два уравнения G2 = 0 и G2 = 0 одним ~ d2F d2F n I , dy' , dx'\ n дг/дх dxdy V d£ * dt J В результате он записал первую вариацию в виде 6/ = ^.(*Ч-У'Е)Л + [£Б + -^л]|". (6) Вейерштрасс предполагает, что величины £, г], £', х\ малы. Он отмечает, что этим ограничивается класс рассматриваемых задач, но такие задачи встречаются особенно часто. Исследованию этих задач посвящены 210
главы 12—18. В них полностью решен вопрос о необходимых и достаточных условиях существования слабого экстремума. При этом Вейерштрасс впервые доказывает необходимость условия Лежандра. Мы поясним это, отказавшись для простоты от параметрической формы изложения. Лежандр привел вторую вариацию интеграла б2/ к виду ]fy>y>(u2dx. х° Отсюда он заключил, что в случае когда fy'y> ^> 0 на отрезке интегрирования [х0, х^, то б2/ )>0и, следовательно, имеет место минимум. Таким образом, Лежандр говорил только о достаточности найденного им условия. ^ С*,') 4 Рис. 5 Вейерштрасс доказал необходимость условия fy'y' > 0 (впервые появляется нестрогое неравенство). Затем Вейерштрасс доказал, что одновременное выполнение условий Эйлера, Лежандра и Якоби (если два последних даны в их усиленной форме) обеспечивает существование слабого экстремума. Важнейшим достижением Вейерштрасса в области вариационного исчисления является построение теории сильного экстремума. Покажем кратко, как он это сделал. Прежде всего Вейерштрасс рассмотрел совокупность экстремалей, выходящих при t = t0 из фиксированной точки А, и доказал следующую теорему: пусть АВ — участок экстремали, не содержащий точек, сопряженных с А, тогда АВ можно заключить в такую полосу, что из А в каждую точку В' полосы можно провести экстремаль. На современном языке можно эту теорему сформулировать так: участок экстремали, не содержащий сопряженных точек, можно окружить центральным полем экстремалей. При исследовании сильного экстремума Вейерштрасс сначала нашел четвертое необходимое условие экстремума. Он сравнил исследуемую экстремаль А0А1 с соседней кривой А0А2Аг, близкой по положению в пространстве, но отличающейся по направлению касательных на конечные величины (рис. 5). В случае минимума должна быть положительна разность ^AAAi — Ja^As (7) Для ее изучения уже нельзя применить разложение (4) по формуле Тейлора. И в этом вся трудность! Вейерштрасс нашел следующий выход. Он записал разность (7) в виде (Jaca2 — Ja0a) + Ja2Ax- Выражение Ja*a2 — Ja0a, oh нашел, рассматривая кривую А0А2 как вариацию кривой А0А± с переменной правой границей. Чтобы найти интеграл Jл^Аг, Вейерштрасс на бесконечно малом отрезке АгА2 взял вреднее значение подынтегральной функции. В результате он пришел 211
к функции Е: Е (я, г/, р, q, p,q) = F (х, у, /", а) — Fx> (х, у, p,q)p — Fy> (х, у, р, q) q, где (х, у) — точка на экстремали, р, q — направляющие косинусы касательной к экстремали в этой точке, /л д — произвольные числа, и доказал, что в случае минимума должно выполняться условие Е > 0. Затем Вейерштрасс доказал, что добавление к условиям Эйлера, Ле- жандра, Якоби, обеспечивающим слабый минимум, четвертого условия (Е >0 в окрестности экстремали) дает совокупность достаточных условий сильного минимума. При этом ему нужно было установить, что где (0, 1) — любая кривая, близкая к (0, 1) по положению в пространстве, (0, 1) — исследуемая экстремаль, удовлетворяющая перечисленным выше условиям. Трудность проблемы заключалась в том, что уже нельзя было применять разложение (4) по формуле Тейлора и рассматривать кривую (0, 1) как вариацию кривой (0, 1). Вейерштрасс поступил следующим образом. Он ввел точку 2 на кривой (0, 1), положение которой определяется параметром s (рис. 6). После этого он провел экстремаль (0, 2), опираясь на приведенную выше теоре- jviy, и ввел вспомогательную функцию Ф (S) = «/"(0,2) + «/"(2,1) — Ло,1)« Затем он доказал соотношение d(f/ds = — Е. (8) Из условия Е > 0 следует, что dylds <0и, значит, функция убывает. Если значение s таково, что точка 2 совпадает с точкой 1, то ф (s) — — «/(0,1) — «/"(о, 1) = 0- Значит, при меньших значениях s функция ф (s) положительна. В частности, если значение s таково, что точка 2 совпадает с точкой 0, то ф (s) = /(-0— — «/(о, d« При этом значении s функция ф (s) положительна. Поэтому ЛоТТ) ~" J(°>1) > °' что и требовалось доказать. Итак, исследования Вейерштрасса полностью решили вопрос о необходимых и достаточных условиях существования сильного экстремума в простейшей задаче вариационного исчисления. В своих лекциях Вейерштрасс рассмотрел ряд классических задач— о брахистохроне, о кратчайших линиях на поверхности и др. Особое место занимает задача Ньютона, которой он посвятил отдельную главу. Вейерштрасс объяснил, почему найденные до него условия не обеспечивали экстремума в этой задаче. Именно для таких задач, в которых исследуемая кривая сравнивается с ломаными линиями, Вейерштрасс разработал свою теорию сильного экстремума. 2.3. Теория простейшей вариационной задачи во второй половине XIX в. В этом подразделе мы рассмотрим статьи по вариационному исчислению, появившиеся в печати во второй половине XIX в. и относящиеся к вариационным задачам без ограничений. Их авторы работали в то время, в которое Вейерштрасс читал свои лекцииг но в своих статьях они не ссыла- 212
лись на Вейерштрасса. Естественно, что мы не можем с полной определенностью сказать, был ли тот или иной ученый знаком с соответствующим разделом лекций Вейерштрасса или получил свои результаты независимо. Отметим только, что рукописи лекций Вейерштрасса были известны многим математикам. Впоследствии некоторые из них излагали его идеи в своих книгах, не ссылаясь на источник. Новые идеи были внесены в вариационное исчисление в 1900 г. Кне- зером и Гильбертом. В отличие от своих предшественников они постоянно ссылались на результаты Вейерштрасса и подчеркивали его основополагающую роль в развитии вариационного исчисления. Прежде всего рассмотрим вопрос о формировании условий Вейерштрасса—Эрдмана для угловых точек экстремали. Имеется очень много вариационных задач, в которых искомая функция непрерывна, а производная ее имеет разрывы в отдельных точках. Это так называемые угловые точки. Таковы, например, задачи на отражение и преломление света. Впервые условие, которое должно выполняться в угловых точках, нашел Вейерштрасс. При этом важную роль сыграло то обстоятельство, что он исследовал вариационную задачу в параметрической форме. Это заметно удлинило вычисления и в то же время оказалось очень удобным при решении целого ряда задач. В задаче об экстремуме интеграла и J= \ F{x,y,x',y')dt Вейерштрасс получил для первой вариации б/ выражение (6). Здесь вне- интегральные члены имеют вид [F.A + Fy-ц] |t (9) Из (9) Вейерштрасс сразу же получил условие для угловых точек экстремали. По свидетельству О. Больца [47, с. 367], он это сделал уже в в 1865 г., т. е. в первом курсе по вариационному исчислению. Вейерштрасс указывал [Б57, т. 7, с. 110]: «Важное значение имеет теорема: если кривая в одном или нескольких местах внезапно изменила направление касательной, то величины Fx> и Fy не испытывают разрыва в предположении, что таких точек в области t0 < t < tx конечное число». Пусть I — угловая точка. Тогда условие б/ = 0 Вейерштрасс, используя выражение (6), записал в форме \С (хц - y'l)di + \ G.(x'r) - y'l) dt + [FA + Fu>r\] |[-° + Вдоль экстремали G = 0 концы кривой закреплены, т. е. вариации ? и г] равны нулю в точках t0 и t\. Поэтому из последнего равенства следует, что Учитывая, что вариации £ и г] произвольны, Вейерштрасс получил искомые условия для угловой точки Fx> \т_0 = гх- 1г.0» Fy* 'г-о = FV' |^0. 213
Однако, как говорилось, найдя условие для угловых точек экстремали в 1865 г., Вейерштрасс его не опубликовал. Задачи с негладкими экстремалями появились в печати впервые в 1871 г. в книге Тодгентера [107]. Решения вариационной проблемы, содержащие угловые точки, здесь названы разрывными. Тодгентер рассмотрел большое число конкретных примеров, но не сумел доказать какое-либо общее утверждение. Впервые условия для угловых точек появились в печати в 1877 г. в статье Г. Эрдмана [57]. Он тоже использует термин «разрывные решения», идущий еще от Эйлера. Эрдман применил свою теорему к ряду задач и указал при этом на ошибки Тодгентера. На Вейерштрасса Эрдман не ссылается. Покажем, какой вид имела первая вариация 6/ в работе Эрдмана. Он рассматривал простейшую вариационную задачу об экстремуме интеграла xt J ffay,y') dx. x0 В то время был распространен следующий переход от параметрической формы к обычной. Обозначим Р = Ух = у'1х\ у' = у'и х' = х%. Если х' = 1, то F (х, уу 1, р) = f fa у, р). По условию однородности функции F имеем F fa у, х , у') = F fa г/, х Л, х'-р) = x'f (х, г/, р). Отсюда легко выводится, что Fx> = / fa у, р) — pfp fa г/, р), Fy> = fp. Используя эти формулы и учитывая, что у Вейерштрасса | = 8хг ц = 6у, из (9) получаем [(/ fa У, Р) — Pfp fa у, р)) Ьх + fp8y] |£. Итак, по аналогии с выражением Вейерштрасса (6) первую вариацию Xi интеграла ] / (х, у, yf) dx можно записать в виде xt *J = ^(fv—h fy)8у dx + W ~ y'f^8x + f*W It . (io) более общем, чем (5). Именно в форме (10) записал первую вариацию б/ Эрдман и таким путем получил условия для угловых точек. Пусть рассматриваются непрерывные экстремали, которые могут иметь излом в некоторой точке х = С (или в нескольких точках). Тогда в точке С излома должны выполняться условия fv' \с-о = fy' |с+о> (/ — y'fy') \с~о = (/ — y'fy') \с+о- Их называют сейчас условиями Вейерштрасса—Эрдмана. Обратим внимание еще на одно преимущество, которое дала параметрическая форма, используемая Вейерштрассом. Он записал внеинтег- 214
ральные члены первой вариации б/ в виде [FA + Fyn] |t -симметричном относительно | и г) (т. е. относительно 8х и 8у). До Вей- •ерштрасса первую вариацию записывали в виде (5), где х не изменяется, Ьх = 0 и, следовательно, концы кривой передвигаются лишь по вертикалям х = х0 и х = Xi. Итак, исследования Вейерштрасса и Эрдмана, записавших первую вариацию б/ в формах (6) и (10), дали основу для решения задач с подвижными границами. Теорию решения таких задач построил А. Кнезер в 1900 г. [83]. Обратимся теперь к фундаментальным леммам вариационного исчисления, первая из которых носит имя Лагранжа, а вторая — Дюбуа- Реймона. С помощью лемм осуществляется переход от равенства б/ к уравнению Эйлера. Современную формулировку леммы Лагранжа дал в своем учебнике Больца [47]. Если М — непрерывная функция от х на [х0, хг] и f Mh (х) dx = 0 для всякой функции h (х), имеющей непрерывную производную и равной нулю в точках х = х0 и х = xi, то М (х) == 0 на отрезке [х0, xi\. Лагранж считал это утверждение очевидным и без всяких объяснений переходил от выражения X, fv--hf°')8x=0 к уравнению Эйлера Если уравнение Эйлера записывается в виде (11), то при этом предпо- d . -лагается, что существует производная -j- fy>, но ~^Г fy' == fv'x Ч~ гу'уУ + зу'у'У э следовательно, необходимо предположить, что искомая кривая имеет вторую производную у". В 1879 г. Дюбуа-Реймон выразил первую вариацию б/ в другой форме 154] Хх X 6/ = J Uy> — j fy dx] h' (x) dx, (12) из нее получают X fy-lfvdx = C. (13) Это так называемая интегральная форма уравнения Эйлера. Она применима и в том случае, когда у" не существует. При переходе от (12) к (13) используется вторая фундаментальная лемма вариационного исчисления, которая носит имя Дюбуа-Реймона. 215
Если М — непрерывная функция от х на [х0, х±] и j МЫ (х) dx для любой функции h (х), имеющей непрерывную производную и равной нулю в точках х = х0 и х = х\, то М (х) постоянна на отрезке [х0, х\\. Эта лемма содержится в опубликованной в 1879 г. статье [54] бывшего тогда профессором в Тюбингене П. Дюбуа-Реймона (1831 —1889), известного многими замечательными результатами в различных областях анализа. Во второй статье [55], опубликованной в том же томе, Дюбуа-Реймон вводит в вариационное исчисление термин «экстремум», включающий два понятия — максимум и минимум. Дюбуа-Реймон пишет [55, с. 564]: «Я позволяю себе ввести новый термин. Он необходим, когда речь идет о максимуме или минимуме. Я предлагаю оба случая обозначить одним словом: экстремум». В 1886 г. была опубликована статья [103]. Ее автор Людвиг Шеффер (1859 —1885) в 1880 г. получил в Берлине степень доктора философии, в 1881—1882 гг. был учителем гимназии в Берлине, с 1884 г.— приват- доцентом Мюнхенского университета. За свою короткую жизнь Шеффер успел написать большое число работ по вариационному исчислению, математическому анализу, механике. Во введении к мемуару [103, с. 523} он так охарактеризовал цель своих исследований: «Критерии максимума и минимума в основных чертах известны после работ Якоби, и трудность состоит только в их строгом обосновании». Уже эти слова показывают, что Шеффер не знал о результатах Вейерштрасса и о том, что исследования Якоби относятся лишь к слабому экстремуму. Вейерштрасс сделал Шефферу замечание, в котором указал, что его результаты верны лишь в том случае, когда искомая кривая сравнивается с кривыми, близкими к ней по расположению в пространстве и по направлениям касательных. В ответ на это Шеффер сделал добавление к своей статье [103, с. 594—595], в котором отмечал, что Вейерштрасс «изучил максимум и минимум в более широком смысле, когда искомая кривая сравнивается со всеми близлежащими линиями независимо от положения касательной». В заключение [103, с. 595] Шеффер писал: «Как известно из устных сообщений, Вейерштрасс нашел критерий существования максимума и минимума в этом более широком (weiteren) смысле и сообщил его слушателям... Я узнал о существовании этих исследований Вейерштрасса уже после публикации моей статьи, в моем распоряжении была только тетрадь с лекциями 1877 г., в которой еще не было указаний на эти мысли». 2.4. Создание теории поля На лекциях Вейерштрасса по вариационному исчислению воспитывались многие математики. В последние десятилетия XIX в. появилось большое число статей и диссертаций, в которых развивались и обобщались идеи Вейерштрасса. Одним из важнейших результатов является формирование понятия поля экстремалей. Оно создано Кнезером и Гильбертом на рубеже XIX и XX вв. и обобщено в 1905 г. Майером. У Вейерштрасса понятие поля еще не выделено. При доказательстве достаточности найденных им условий он говорит только о такой «полосе плоскости» около экстремали АВ, что через каждую точку В' полосы можно провести экстремаль АВ'. 216
А. КНЕЗЕР Якоби и Вейерштрасс рассматривали только центральное поле — все экстремали пересекаются в начальной точке А с абсциссой х = х0. Формирование понятия поля экстремалей произошло в результате двух открытий: 1) геометрической теории Кнезера и 2) теории Гильберта, построенной на основе его «теорем независимости». Адольф Кнезер (1862 — 1930) учился в Ростокском, Гейдельбергском и Берлинском университетах. В Берлине учился у Кронекера и Вейер- штрасса и получил там в 1884 г. степень доктора философии. С 1886 г. Кнезер — приват-доцент университета в Бреслау (ныне Вроцлав). В 1889 г. он переехал в Дерпт (ныне Тарту), где работал профессором университета по кафедре прикладной математики. В 1905 г. вернулся в Бреслау, где занял кафедру в Высшей технической школе. Состоял членом-корреспондентом Берлинской академии наук. В 1924 г. был избран иностранным членом-корреспондентом АН СССР. Его работы принадлежат различным областям математики (алгебре, геометрии и т. д.), но основные его достижения относятся к анализу и его применениям, в первую очередь к теории интегральных уравнений и вариационному исчислению. В своем представлении Кнезера в члены-корреспонденты АН СССР В. А. Стеклов, П. П. Лазарев и А. А. Белопольский писали: «Особенной известностью пользуются исследования Кнезера по вариационному исчислению, где он является продолжателем того классического направления, которое дано этому отделу математики трудами Эйлера, Лагранжа, Якоби и Майера. Этот весьма важный о*дел науки обязан Кнезеру существенными усовершенствованиями. Все эти исследования опубликованы в различных пе- 217
риодических изданиях (между прочим, в «Сообщениях Харьковского математического общества» и главным образом в «Mathematischen Annalen»),. в систематической переработке изложены им затем в сочинении «Lehrbuch der Variationrechming», которое вместе с сочинением Адамара «Calcul des Variations» служит в настоящее время настольной книгой для всякого, работающего в этой области» [37, с. 453] (см. также [38, с. 21]). Геометрическая теория Кнезера построена им в учебнике 1900 г. [83]. Она основана на плодотворной мысли о распространении на общие вариационные задачи понятий и законов теории геодезических линий на поверхности, развитой главным образом в работах Гаусса и Дарбу. В своих работах по геодезии и геофизике Гаусс подошел к проблеме построения общей теории поверхностей. В 1812—1816 гг. он изучал геодезические линии эллиптического сфероида. В 1816 г., обобщая проблемы картографии, Гаусс пришел к общему вопросу о конформном отображении произвольных поверхностей друг на друга и предложил этот вопрос Копенгагенскому ученому обществу как тему на соискание премии. Эта тема была объявлена в 1822 г., и в том же году Гаусс представил работу «Общее- решение задачи: отобразить часть заданной поверхности на часть другой заданной поверхности так, чтобы отображение было подобно отображаемому в мельчайших частях», опубликованную в 1825 г. РБ37, т. 4, с. 187— 216]. Второй работой Гаусса по теории поверхностей является его знаменитый мемуар «Общие исследования о кривых поверхностях» [7], опубликованный в 1828 г. Для вариационного исчисления особенное значение имеют теоремы Гаусса о геодезических линиях. 1. Пусть R — некоторая кривая на поверхности. Через каждую точку R проведем геодезические линии, ортогональные к Д, и на этих геодезических отложим дуги равной длины. Тогда концы дуг образуют некоторую кривую на поверхности, ортогональную к геодезическим линиям. 2. Две траектории, ортогональные к семейству геодезических, отсекают на них дуги равной длины. Пусть точки кривой R определяются параметром v. Рассмотрим на R некоторую точку М (у), проведем в этой точке геодезическую, ортогональную к R, и отложим на ней дугу длины и. В результате получим некоторую точку на поверхности А (и, и). Так вводится система криволинейных координат (и, у), где v = const — семейство геодезических, и = const — семейство ортогональных траекторий. Г. Дарбу (1889) [52, т. 2], (1894) [52, т. 3] при исследовании геодезических линий на поверхности исходит из того, что каждая точка рассматриваемого куска поверхности однозначно определяется с помощью координат и и v, т. е. основывается на том, что геодезические образуют поле. Методы Дарбу Кнезер распространил на вариационную задачу об экстремуме интеграла и ^F(x,y,x',y')dt. (14) Обобщив условие ортогональности, Кнезер получил условие трансверсальности: в точке Р пересечения экстремали с кривой R должно выполняться равенство Fx> (х, у, х\ у') zi + Fy> (х, у, х\ у') Г1 = 0, где х , у' — производные к экстремали в точке Р', а х'', у' — производные к кривой R в той же точке. 218
Итак, условие трансверсальности связывает направления касательных бдоль исследуемой экстремали и вдоль некоторой кривой Л, с которой экстремаль пересекается. Трансверсаль — это линия, при пересечении которой с каждой экстремалью выполняется условие трансверсальности. При переводе на язык конкретной задачи о геодезических линиях на поверхности экстремали — это геодезические, а трансверсали — ортогональные траектории. Кнезер рассмотрел семейство экстремалей и семейство трансверсалей и построил криволинейную систему координат, основываясь на теоремах, аналогичных приведенным выше теоремам Гаусса. 1. Пусть R — некоторая кривая на поверхности. Через каждую точку, лежащую на Д, проведем экстремаль, при пересечении которой с R выполняется условие трансверсальности. Отложим на этих экстремалях дуги, на которых рассматриваемый интеграл (14) принимает постоянное значение. Тогда концы дуг образуют кривую, трансверсальную ко всем экстремалям семейства. 2. Две траектории, трансверсальные к семейству экстремалей, отсекают на экстремалях дуги, на которых рассматриваемый интеграл имеет постоянное значение. Построенные Кнезером семейства экстремалей и трансверсалей явились удобным геометрическим аппаратом для решения вариационных задач. Кнезер установил теорему об огибающих, которая сейчас носит его имя. Для случая геодезических на поверхности она обращается в следующую: длина дуги геодезической эволюты к кривой Г равна разности длин отрезков геодезических нормалей кривой Г, касающихся эволюты в концах этой дуги. Используя этот результат, Кнезер дал геометрическую интерпретацию сопряженных точек. Его анализ углубил и обогатил этот раздел вариационного исчисления, основоположником которого был Якоби. Важной заслугой Кнезера является то, что в своем учебнике он исследовал задачи с переменной конечной точкой и открыл фокальные точки. Напомним, что до Кнезера за всю двухсотлетнюю историю вариационного исчисления было решено очень мало задач с подвижными границами. И. Бернулли, рассматривая падение шарика из точки Л, ищет геометрическое место точек, достигаемых шариком за одно и то же время. Он показал, что искомая кривая «встречает под прямым углом все циклоиды, имеющие общее начало в точке А» [Б1, с. 23]. Лагранж в письме к Эйлеру от 20 ноября 1755 г. решил задачу: шарик движется из точки А в какую-нибудь точку на кривой Г. В качестве искомой кривой он получил циклоиду, пересекающую кривую Г под прямым углом. В этих задачах на границах выполняются условия ортогональности. Условие трансверсальности Кнезера включает ортогональность как частный случай. Объяснение простое: для интегрантов типа ф (х, у) \ х1 -f- у1 или ф (х, у) |/г1 + г/'2 условие трансверсальности равносильно условию ортогональности. Рассмотрим задачу с подвижными концами: пусть разыскивается экстремум интеграла, взятого вдоль кривых, лежащих на плоскости, левый конец которых закреплен, а правый скользит вдоль данной кривой Л. Рассмотрим пучок экстремалей, выходящих из фиксированной точки О (рис. 7). Кнезер показал, что для решения задачи нужно выбрать ту экстремаль пучка G0, при пересечении которой с данной кривой И выполняется условие трансверсальности. С помощью метода Кнезера впоследствии было решено большое число вариационных задач: об экстремуме интеграла на плоскости с двумя под- 219
вижными концами, об экстремуме интеграла в пространстве, взятого вдоль кривых, концы которых скользят по заданным поверхностям, и др. В 1900 г. в учебнике [83] Кнезер впервые ввел в вариационное исчисление термины: экстремаль, трансверсаль, поле экстремалей, сильный (stark) и слабый (schwach) экстремумы. Эта терминология сразу же стала общепринятой. Дальнейшим продвижением теория поля обязана Д. Гильберту. В зимнем семестре 1899/1900 г. он прочитал в Гёттингене курс вариационного исчисления, а в 1900 г. на Международном математическом конгрессе в Париже в своем знаменитом докладе «Математические проблемы» [30] в качестве одной из основных проблем, стоящих перед математикой на пороге нового столетия, сформулировал задачу дальнейшего развития методов вариационного исчисления (23-я проблема). Гильберт высоко оценил исследования Кнезера. Говоря о том, что вариационное исчисление, по его мнению, еще «не пользуется в широких кругах тем уважением, какое ему подобает», он писал: «Тем значительнее тот факт, что Кнезер в недавно появившемся сочинении представил вариацион- РНСш 7 нов исчисление с новой точки зрения и на современном уровне строгости» [30, с. 57]. Решая простейшую вариационную задачу об экстремуме интеграла J / (*» У у У')dx, У (*о) = */о, У (хх) = г/ь Гильберт предложил рассмотреть интеграл хх J* = llf + (yx-p)fp]dx, f = f(x,y,p), и выяснить, как выбрать функцию р (#, г/), чтобы значение интеграла /* не зависело от выбранного пути, т. е. от выбора функции у (х); такие интегралы называют инвариантными. Для решения вопроса Гильберт предложил рассмотреть однопарамет- рическое семейство экстремалей дифференциального уравнения Эйлера f»-4rf»' = °> (15> образующее поле. Так как при этом через каждую точку проходит одна и только одна экстремаль семейства, то однозначно определяется величина производной к экстремали в каждой точке поля. Она является функцией р (х, у) от координат точки х и у; р (х, у) называется функцией наклона поля. Гильберт показал, что при таком выборе функции р (х, у) интеграл J* не зависит от пути интегрирования. Это его «теорема независимости». На основе теоремы независимости Гильберт установил связь между уравнением Эйлера и уравнением Гамильтона—Якоби. Он представил /* в виде J*=$UPy' + (f-pfP)]dx. 220
Д. ГИЛЬБЕРТ Для того чтобы интеграл /* не зависел от пути интегрирования, должно выполняться условие £+-^-<>- («•> Следовательно, функция р (х, у) должна удовлетворять уравнению в частных производных (16). Таким образом, интегральные кривые уравнения (15) одновременно являются характеристиками уравнения (16). Гильберт отметил, что эта связь имеет для вариационного исчисления основополагающее значение. Уравнение (16) впервые в 1868 г. получил профессор университета в Болонье Бельтрами (о его работах по неевклидовой геометрии см. Кн. 2, с. 68—71), поэтому иногда говорят о теории Бельтрами—Гильберта. Гильберт показал, как, используя теорему независимости, можно легко получить условие Вейерштрасса, относящееся к функции Е. С помощью его теоремы обычно доказывают достаточность найденных Вейерштрассом условий существования сильного экстремума. Доказательство, данное Вейерштрассом в его лекциях, носило искусственный характер и в дальнейшем в учебниках не излагалось. Итак, Гильберт существенно развил теорию поля экстремалей. Он рассмотрел функцию наклона поля р (х, у), ввел инвариантные интегралы, совпадающие на экстремалях с интегралами, исследуемыми на экстремум. Благодаря этому было достигнуто значительное упрощение вариационной теории. Гильберт указал на это еще в начале своего доклада в подтверж- 221
дение своей мысли о том, что «строгие методы являются в то же время простейшими и наиболее доступными». «Особенно разительный пример,— пишет Гильберт [30, с. 17],— иллюстрирующий мою мысль, представляет вариационное исчисление. Исследование первой и второй вариаций определенного интеграла приводило к крайне сложным вычислениям, а соответствующие исследования старых математиков были лишены необходимой строгости. Вейерштрасс указал нам путь к новому и вполне надежному обоснованию вариационного исчисления. На примере простого и двойного интегралов я вкратце намечу в конце моего доклада, как следование по этому пути приводит в то же время к поразительному упрощению вариационного исчисления». Гильберт подчеркивает связь своих работ с исследованиями Вейер- штрасса. Очень вероятно, что он пришел к «теореме независимости», сама постановка которой на первый взгляд кажется совершенно неожиданной, в связи с равенством (8), которое нашел в своих лекциях Вейерштрасс при доказательстве достаточности для сильного экстремума. Это равенство dy/ds = —Е показывает, что выражение —Eds является полным дифференциалом, что приводит к мысли об интеграле, зависящем только от начальной и конечной точек интегрирования, но не от пути интегрирования. Гильберт заметил, что его теорему независимости нетрудно распространить на пространственную задачу и на случай двойного интеграла. В результате этого можно «без громоздких вычислений», по выражению Гильберта, построить систему необходимых и достаточных условий экстремума для общих вариационных задач. В докладе «Математические проблемы» Гильберт в качестве примера рассмотрел задачу об экстремуме двойного интеграла \\F (х, г/, z, zx, zy) dxdy. В 1903 r. А. Майер распространил теорию Гильберта на задачу об экстремуме интеграла [95] J /(*,#ь •• • ,Уп, Уъ •• -,y'n)dx. При этом он ввел в рассмотрение семейство экстремалей в пространстве, образующее поле. В 1906 г. Гильберт показал, как обобщить теорему независимости для задачи об экстремуме интеграла [80]. Поле экстремалей в пространстве не является простым расширением соответствующего понятия на плоскости. Для построения вариационной теории в пространстве нужно рассматривать семейства экстремалей, удовлетворяющие двум условиям: 1) через каждую точку пространства проходит одна и только одна экстремаль (это условие было в случае плоскости); 2) должна существовать поверхность, пересекающая все экстремали семейства, на которой интеграл Гильберта не зависит от пути интегрирования. Второе условие можно высказать и в другой форме, используя геометрический язык теории Кнезера: должна существовать поверхность, при пересечении которой с каждой экстремалью семейства выполняется условие трансверсальности. Итак, в конце XIX — начале XX в. была создана теория поля экстремалей, которая представляла собой удобный аппарат для перенесения результатов Эйлера, Лежандра, Гамильтона, Якоби, Вейерштрасса на общие вариационные задачи. 222
Особенно важный класс задач составляют вариационные задачи с ограничениями — изопериметрическая, задача Лагранжа, задача Майера. Историю решения этих задач мы рассмотрим в следующих подразделах. 2.5. Изопериметрическая задача В главе «Вариационное исчисление» книги «История математики» (т. 3) имеются только краткие указания на первые изопериметрические проблемы и методы их решения. Мы рассмотрим этот вопрос подробнее. В 1744 г. в сочинении «Метод нахождения кривых линий, обладающих свойствами максимума либо минимума, или решение шюпериметрической задачи, взятой в самом широком смысле» Л. Эйлер рассмотрел следующую изопериметрическую проблему: найти экстремум интеграла J = \ f (*, У, у') dx л* в классе кривых, на которых интеграл К = \ (р (х, y,y')dx имеет данное .\-0 значение. Он доказал так называемый закон взаимности — для решения задачи нужно отыскивать безусловный экстремум интеграла aJ + |Ж, где а и (3 — постоянные [39, с. 343]. Вот как сам Эйлер пишет о своем методе [39, с. 427]: «Способ решения сводится к тому, чтобы развернуть все общие свойства вместе с выражением максимума или минимума каждое в отдельности, затем умножить каждое на произвольную постоянную и произведения собрать в одну сумму». В этих словах можно усмотреть зародыш метода множителей Лагранжа. Доказательство закона взаимности Эйлер провел методом ломаных. В его основе лежит идея, впервые высказанная Я. Бернулли: чтобы решить изопериметрическую проблему, необходимо дать приращение не одной, а двум соседним ординатам. В 1842 г. Ж. Бертран дает новое доказательство закона взаимности, основанное на методе вариаций [46]. Он записывает первую вариацию 8J в виде (5). Для задачи с закрепленными концами внеинтегральные члены в (5) обращаются в нуль. Обозначив fy -т— /у = и(х), Бертран получает 8J = \ и (х) 8у dx. Аналогично он имеет Ху Цу ^ ЧУ = v (х), 6К=\^и (х) 8у dx. Далее Бертран замечает [46, с. 55]: «Нужно, чтобы выполнялось равенство 8J = 0 для всех значений 8у, для которых 8К = 0. Очевидно, этому условию можно удовлетворить, положив и = kv, где к — постоянная». Условие Бертрана и = kv можно записать в виде 223
•откуда видно, что оно является уравнением Эйлера для задачи об экстремуме интеграла \ [/ — /сер] dx. Затем Бертран добавляет [46, с. 56]: «Следует еще доказать, что условие и = kv необходимо». Предположив, что и/и = f (х), где / (х) не является постоянной, он приходит к противоречию, что полностью доказывает теорему. Особый случай, когда и = О и поэтому отношение и/и не имеет смысла, Бертран не отмечает. Мы укажем, что в данном случае на искомой кривой выполняется уравнение т. е. экстремаль интеграла J является одновременно экстремалью интеграла К. Этот особый случай впервые выделил Вейерштрасс. На доказательство Бертрана почти нет ссылок в последующей математической литературе. Напротив, метод, которым доказал закон взаимности Вейерштрасс, лег в основу всех последующих работ в этой области. Вейерштрасс исследует изопериметрическую задачу в параметрической форме. Нужно найти экстремум интеграла J = l'F (х, у, х\ yf) dt при условии, что интеграл К сохраняет постоянное значение: *. К=\ф(х,у,х\у')йг = С. Как вытекает из равенства (6) для задачи с закрепленными концами, лервая вариация 8J имеет вид *i 8 J =^G'(xfr} — y'%)dt. (17) *. Для доказательства закона взаимности в изопериметрической проблеме Вейерштрасс представил вариации £ и г\ в следующей форме: | = ки + кгиъ г] = kv + k1v1, (18) где и, иъ v, иг — дифференцируемые функции от t, не содержащие постоянных к и кг. В доказательстве Вейерштрасса мы выделим две части. В первой он доказывает, что постоянные к и кх всегда можно подобрать так, чтобы при вариациях (18) значение интеграла К не менялось. Для интеграла К запишем первую вариацию в виде (17): 6K=^T.(x'r\-y'l)dt. (19) •Заменяя £, г) по формулам (18) и объединяя члены с к и kL. Вейерштрасс получает х'ц — у'Ъ> = к (x'v — у'и) + кх (xfu1 — ц'их). .224
Применив эти формулы и используя пзопериметрическое условие в форме §К = О, из (19) получаем равенство 6Z == ft J Г • (ar'i; — у'и) dt~- ftx J Г - (ar'i'i — #'mi) Л = 0. (20) Из него следует *,= -*-£ , (21) если считать, что знаменатель этого выражения не равен нулю. Вейерштрасс предполагает противное. Пусть для каждого набора и, и, щ, иг ^r.(x'v1 — y'ui)dt = 0. U Отсюда Г (х, г/, х\ у) = 0. Это уравнение Эйлера для задачи об экстремуме интеграла К. Вейерштрасс пишет [Б57, т. 7, с. 245]: «Если на искомой кривой интеграл К достигает максимума или минимума, то, вообще говоря, невозможно кривую варьировать так, чтобы интеграл К сохранял свое значение. Это исключительный случай. Поэтому нужно непременно принять, что искомая кривая не является решением дифференциального уравнения Г = 0». Так впервые был выделен особый случай в изопериметрической проблеме. Во второй части доказательства Вейерштрасс записывает первую вариацию 6/ в виде (20). Тогда из условия б/ = 0 сразу имеем и и k^G.(Уи — у'и)dt + h^G-{х'иг — yrm)dt = 0. iQ *„ Вейерштрасс заменяет в этом выражении кг через к по формуле (21), откуда сразу же получается равенство h и \ G» (х'и — у'и) dt С G» (x'l'i — у'и{) dt i T»(x'u — y'u) dt i T'(x'vi — y'u\) dt h *. В нем, как отмечает Вейерштрасс, слева находятся только и и и, справа — только щ и i\. Значит, обе стороны равны одной и той же постоянной X. Отсюда Ь и \ G-(x'v — y'u)dt = к\ T-(x'v — yru)dt и, значит, и \ (G — КГ) • (х'и - у'и) dt = C. (22) 8 Математика XIX века 225
В заключение Вейерштрасс так формулирует доказанную теорему: если вообще имеется кривая, дающая максимум или минимум интегралу / при условии, что интеграл К сохраняет постоянное значение, то существует такая постоянная Я, что координаты произвольной точки кривой удовлетворяют уравнению (22). Вейерштрасс доказывает, что теорему нетрудно распространить на случай, когда несколько интегралов Кг, К2, . . ., Кт принимают постоянные значения. В этом случае вместо (18) для вариаций Е и г\ он записывает равенства I = Ки + Кхих + . . . + Ктит, г] = Kv + Kxvx + . . . + Kmvm. (23) По свидетельству Больца [47, с. 462], рассмотренное доказательство Вейерштрасса содержалось уже в его лекциях 1877 г. Первая публикация принадлежит П. Дюбуа-Реймону. В 1879 г. Дюбуа-Реймон рассматривает [54] изопериметрическую проблему в той же постановке, что и Эйлер, т. е. в непараметрической форме. Интересно введение к мемуару, в котором Дюбуа-Реймон писал, что начиная с Лагранжа закон взаимности обосновывается так: из равенства б/ - О, 6К = О получают J (б/ + СЬК) dt = 0, to где постоянная С подбирается так, что интеграл К равнялся данному значению. Дюбуа-Реймон пишет [54, с. 310]: «Если это и кажется верным, то остается все же чувство, что более точное обоснование правила не является излишним». Мы видим здесь стремление к строгости, характерное для вариационного исчисления последней четверти XIX в., когда лекции Вейерштрасса стали образцом для всех последующих работ в этой области. Доказательство закона взаимности, данное Дюбуа-Реймоном, как мы покажем, по существу не отличается от доказательства Вейерштрасса. Аналогично равенствам (18) Дюбуа-Реймон записывает вариацию бг/ в виде $У = &1У + &б2г/. Затем он отмечает, что постоянную к всегда можно выбрать так, чтобы значение интеграла К не менялось (ср. с первой частью доказательства Вейерштрасса). Используя для ЬК выражение (5) и подставляя в него Ьу = бхг/ + к82у, Дюбуа-Реймон имеет J (фу — -3J 4v) 81У dx + k J (фу — "S" Фу) &гУ dx = 0r С ( d \ x0 __ откуда k = 226
Это равенство аналогично равенству (21) Вейерштрасса. Особый случай, когда знаменатель равен нулю, Дюбуа-Реймон не отмечает. Затем он записывает условие 8J = О Л»1 х-1 8J = ) (>у — ~J7 -fw) 8±У dx + k)(fy — S7 fy') Ь*У dx-=0 ii подставляет в него полученное значение к (ср. со второй частью доказательства Вейерштрасса). Отсюда Дюбуа-Реймон получил равенство ) (-v ~ 1й :f,J') &lS dx = (J\ (ъ — srчу) ^у Л** (Щ где а — постоянная (ср. с соответствующим рассуждением Вейерштрасса, которое привело его к равенству (22), где X — постоянная). Из равенства (24) сразу же получается уравнение Эйлера для задачи об экстремуме интеграла xi \ U (х, У, У') — сгф (х, у, у')] dx. Закон взаимности доказан. Это доказательство почти без изменений вошло в учебники XX столетия. На Вейерштрасса Дюбуа-Реймон не ссылался/; 2.6. Задача Лагранжа. Проблемы Майера и Больца Еще Л. Эйлер, помимо изопериметрической проблемы, начал исследовать экстремальные задачи с более сложными ограничениями. Он, например, ставил такую задачу [39, с. 168]: «разыскивается кривая, сообщающая наибольшее или наименьшее значение формуле \Zdx в том случае, когда Z задается через дифференциальное уравнение, интегрирование которого не может быть выполнено». В качестве примера Эйлер рассмотрел [39, с. 393] задачу о брахистохроне в сопротивляющейся среде, в которой разыскивается экстремум интеграла при условии i/ = g -f- со (v) ]/ 1 + г/'2, где g — const. Эта задача Эйлера — частный случай задачи, которую позднее поставил Лагранж в «Аналитической механике» (1788): найти экстремум интеграла J = J / (х, уъ . • •, Уп, Уъ • • • , Уп) dx (25) х0 в классе кривых, удовлетворяющих системе дифференциальных уравнений ф|3 (х, ух, . . ., уп, г/i, . . ., уп) = О (Р = 1, 2, . . ., т; т < п). (26) В частном случае экстремум интеграла (25) разыскивается среди кривых, удовлетворяющих уравнениям фр; (я, Уи Уъ, . • .. Уп) = 0. (27) 8* 227
Эти ограничения называются сейчас фазовыми, сформулированная задача — задачей Лагранжа с закрепленными концами. Для ее решения Лаг- ранж в «Аналитической механике» предложил следующий метод. Нужно рассмотреть функцию F = / + Ь1ф1 + ^2Ф2 + • • • + ^тфт (28) с неопределенными множителями Хг (х), Х2 (х), . . ., Хт (х) и решить за- дачу на безусловный экстремум интеграла \ F (х) dx. Выписывая для этой задачи уравнения Эйлера и решая их совместно с дифференциальными уравнениями (26), всегда можно, по мысли Лагранжа, получить искомое решение. Сформулированный прием называется правилом множителей Лагранжа. Точно такое же правило для решения конечномерных задач было сформулировано Лагранжем на девять лет позже в «Теории аналитических функций» (1797). В «Лекциях об исчислении функций» в 1806 г. Лагранж делал попытку доказать правило множителей [Б47, т. 10, с. 411—419]. Однако, как было замечено в последней четверти XIX в., его рассуждения содержали пробел. Между тем опыт решения конкретных задач не подводил и сформулированный Лагранжем прием широко применялся математиками XIX в., хотя при этом и высказывалось мнение, что он не обоснован. В 1885 г. Л. Шеффер писал [103, с. 557]: «Лагранж выдвинул общее правило, так называемый метод множителей. Но данный Лагранжем вывод этого правила, исключая частные случаи, совершенно недостаточен, и до сих пор не удалось провести лучшего обоснования в полной общности». Следуя по пути, указанному Вейерштрассом для изопериметрической проблемы, Шеффер доказал правила множителей для задачи, в которой имеются ограничения двух типов: 1) т интегралов принимают заданные значения; 2) условные уравнения имеют вид (27), т. е. ограничения фазовые. Однако Шеффер в своей статье ничего не говорит об особых случаях, и, значит, его доказательство неполно. Впервые правило множителей Лагранжа для задачи Лагранжа с условиями (26) с выделением особого случая доказал в 1886 г. А. Майер [93]. А. Майер (1839—1908) родился в Лейпциге, в 1861 г. защитил докторскую диссертацию в Гейдельберге. Работал в Лейпцигском университете, с 1865 г.— приват-доцентом, с 1871 г.— ординарным профессором. Написал большое число работ, из которых почти все относятся к вариационному исчислению и его приложениям к механике. В начале своего мемуара [93] Майер указал, что метод множителей хотя и не обоснован, но ни в одной задаче не привел к ложному результату. «Поэтому метод Лагранжа частью математиков рассматривается как аксиома, в то время как другая часть предпочитает все те задачи вариационного исчисления, в которых неизвестен другой метод, просто вообще игнорировать. Примыкая к Клебшу, я сам всегда принадлежал к первой части и правило множителей положил в основу всех своих работ по вариационному исчислению» [93, с. 74]. На той же странице читаем: «Хотя я, конечно, догадывался о недостаточности всех попыток доказать теорию множителей Лагранжа, вопрос стал для меня совершенно ясным при устном обсуждении его с Шеффером». Далее Майер указывает, что его метод вывода является развитием метода Шеффера. Подчеркнем то обстоятельство, что сам Майер отметил неполноту своего доказательства [93, с. 79]: «Мой вывод молчаливо предполагает, что 228
нет системы решений v1? v2, . . ., vm дифференциальных уравнений т Lb%-hb-%)]-° <г-1* »• /.=1 *'" которая одновременно удовлетворяла бы также п — т дифференциальным, уравнениям h*z-M*%)h° «•-+• * /■=i ° s Так впервые был выделен особый случай в задаче Лагранжа. В 1896 г. Б. Турксма опубликовал [108] еще одно доказательство правила множителей. Он заявлял [108, с. 33], что не знал доказательства Майера и «пришел к цели другим путем, поэтому небесполезно опубликовать новый метод». В доказательстве Турксма также есть особый случай, в котором оно теряет силу. По мере развития вариационного исчисления ученые в своих доказательствах все чаще стали замечать тот особый случай, о котором говорил Майер. На это первым обратил внимание профессор математики в университете в Вене Густав Эшернх (1849 —1935) в ряде мемуаров, напечатанных в последние годы XIX в. В 1899 г. он назвал [59] главным тот случай, когда уравнения А = 1 1 имеют единственное решение гх (х) = 0, г2 (х) = 0, . . ., гт (х) = 0. Позже, в 1901 г., Эшерих указал [60] на то, что все исследования по вариационному исчислению ограничиваются главным случаем. Он доказывает, что отыскание экстремума интеграла 'i ^ / (х, х\ г/, у', ... , yW) dt и всегда приводит к главному случаю. Иначе обстоит дело уже при исследовании изопериметрической проблемы. Эшерих отмечает, что на это обстоятельство обратил внимание Вейерштрасс, и упрекает Шеффера, не отметившего в своей работе особый случай. Следующий этап в развитии метода множителей Лагранжа состоит в переходе к «исправленному правилу Лагранжа», когда в качестве функции F вместо (28), как было у Лагранжа, рассматривают где функция/ входит в выражение для F с множителем Я0. Этот результат получен А. Кнезером на основе работ Майера. В 1878 г. Майер сформулировал [92] вариационную проблему, которая носит его имя: требуется так выбрать п + 1 функций г/0, у1, . . ., уп, чтобы выполнялись дифференциальные уравнения Фе (*, Уо, Ун • • м Уп, У'а, • • •> Уп) = 0 (Р = 0, 1, 2, . . ., т; т < /?) 229
и функция у0 в точке х — Ъ имела максимум или минимум (причем, в точке х — а все функции принимают заданные значения, в точке х = b все функции, кроме г/0, принимают заданные значения). Майер называет свою проблему самой общей вариационной проблемой, указывая, что задача Лагранжа является ее частным случаем. Однако задача Майера ставилась уже Лагранжем. Лагранж писал [Б48, т. 10, с. 419]: «Можно требовать, чтобы функция, заданная условным уравнением, сама '•была максимальна или минимальна». В 1895 г. Майер опубликовал статью [94], посвященную правилу множителей Лагранжа. Он отмечает, что в доказательствах правила множителей (его и Турксма) для задачи Лагранжа имеются исключительные случаи. Далее он указывает, что для задачи Майера можно уже без всяких пробелов доказать теорему: существуют такие функции ^0, К1У . . ., Хт> 'ЧТО 171 Конечно, Майер считал, что не все к$ тождественные нули, на этого не оговаривал. Согласно Майеру, его уравнения симметричны относительно функций Уoi Ун • • •» Уп- Поэтому по аналогии с правилом Эйлера для изоперимет- рической проблемы он называет свою теорему законом взаимности. Свою теорему Майер к задаче Лагранжа не применил. Это сделал Кне- зер в 1900 г. в упоминавшемся учебнике вариационного исчисления [83]. Юн подошел к правилу множителей следующим образом. Рассмотрим частный случай задачи Майера, когда условное уравнение <р0 = 0 имеет форму X f/o = \f (х, уи • • • , Уп, Уъ • . . , Уп) dx\ а функция у0 должна иметь экстремум в точке х = ft, т. е. разыскивается экстремум интеграла ъ / (х, г/ь ..., уп, у[,..., Уп) dx. а Следовательно, имеем задачу Лагранжа. Применив закон взаимности Майера (29), Кнезер получает из первого уравнения dkjdx = 0, т. е. Я0 = const. Пусть Х0 ф 0. Тогда можно записать Хг/Х0 — Zl5 . . ., A,mM,0 = lm ш получить функцию F в виде (28): F = / + кЧ>1 + • • • + *тфт. Далее Кнезер пишет [83, с. 243]: «Случай ^0 = 0 следует рассматривать лкак исключение». Так в вопрос о правиле множителей Лагранжа была внесена ясность. Австрийский математик Ганс Хан (1879—1934), известный работами по теории функций и функциональному анализу, в 1902 г. писал [7?, с, 325]: 230
«Метод множителей, носящий имя Лагранжа, как известно, был долгое время лишен доказательства... Первым доказательством мы обязаны Майе- ру... Наконец, в учебнике Кнезера доказательство Майера нашло такое изложение, которое способно устоять перед всякой критикой». Кнезер не дал никаких указаний на то, как решать вариационные задачи в случае, когда Х0 =- 0. Дальнейшим продвижением теория обязана Г. Хану. В статье [73], опубликованной в 1904 г., он записал лагранжиан, в виде L = Я0/ -f Х1(р1 -]- Я2ф2 -г- . . . + Ятфт, где Х0 — постоянная, и указал, что при Х0 ^ 0 имеем обычное правило» Лагранжа. После работ Кнезера и Хана множитель Х0 в лагранжиане утвердился в математической литературе. Хан ввел понятие нормальной экстремали: если в интервале (а, 6) экстремаль удовлетворяет условиям 1>^-4(^)Н «=<■* »)• то Хан назвал ее анормальной в (а, 6), причем указал, что (30) получается из закона взаимности Майера (29) при Х0 = 0 и что это то самое условиег которое выделил Эшерих в 1899 г. как особый случай. Хан впервые установил связь между особым случаем в задаче Лагранжа и особым случаем, отмеченным Вейерштрассом в изопериметрической проблеме. Речь идет о том, всегда ли в задаче на условный экстремум можно перейти от рассматриваемой экстремали к соседней экстремали, на которой выполняются условные уравнения (как писал Вейерштрасс: всегда ли можно перейти к такой экстремали, на которой интеграл К имеет постоянное значение?). Хан рассматривает задачу, в которой интеграл К = J j/*a + y4t и должен принимать заданное значение. Он пишет [73, с. 167]: «Если заданное значение К равно расстоянию между двумя точками, то наша экстремаль должна совпадать с экстремалью интеграла К, т. е. она на (t0, t±y анормальна. Так как эта кривая вообще не может варьироваться допустимым образом, то наша изопериметрическая проблема бессмысленна»~ Далее Хан приводит пример, когда экстремаль частично анормальна. Так, на рубеже XIX и XX столетий были выделены нормальный и анормальный случаи в задаче Лагранжа. Ссылаясь на работу Хана, опубликованную в 1904 г., известный американский специалист в области вариационного исчисления Г. Блисс (1876 —1951) писал [4, с. 260]: «С тех пор различные доказательства основных теорем для задачи Лагранжа проводились в предположении, что рассматриваемая кривая Е является нормальной во всяком частичном интервале, или в несколько более сильном предположении, что кривая Е имеет продолжение, нормальное на каждом частичном интервале». Задачи Лагранжа и Майера находились в центре внимания математиков, работавших в области вариационного исчисления, не только в XIX в., но и в первой половине XX в. В 1913 г. была поставлена еще одна вариационная проблема — задача Больца. 231 (30),
Гильберт в 1906 г. доказал [-80] правило множителей для задачи Майе- pa с закрепленными концами. Развивая его методы, работавший тогда в Чикагском университете немецкий математик Оскар Больца (1857—1942) в 1907 г. рассмотрел [48} более общий случай «смешанных условий и переменных конечных точек». Больца сформулировал задачу так: ищется экстремум интеграла fi S/(0b..-,0n.0b-".ffn)<ft (31) 'о «среди кривых, удовлетворяющих р дифференциальным уравнениям Фа (уг, . . ., уп, Уъ • - ., У'п) = 0 (а = 1, 2, . . ., р) (32) ш q уравнениям вида Ъ G/i> »2. • • •> Уп) = 0 (Р - 1, 2, . . ., д), (33) в то время как координаты концов (z/10, . . ., уп0) и (z/n, . . ., уп1) удовлетворяют г уравнениям Хт (»ю. • - •. Упо, Ун, • • -, Ут) = 0 (7=1,2,..., г). (34) В 1913 г. Больца формулировал [49] задачу, носящую сейчас его имя. Юн указывает, что его внимание к анормальному случаю, возникающему при исследовании вариационных задач с ограничениями, было привлечено учебником по вариационному исчислению Ж. Адамара [71], опубликованным в 1910 г. Действительно, в этом учебнике Адамар трижды выделяет особый случай: в задаче на условный экстремум функций конечного числа переменных, в изопериметрической проблеме и в задаче Лагранжа. Таким образом, благодаря многим ученым (Майер, Кнезер, Эшерих, Хан, Адамар и др.) в первое десятилетие XX в. была выявлена ограниченность техники вариационного исчисления. Вся теория строилась в предположении, что искомая экстремаль включена в поле экстремалей, а этот факт имеет место только для нормальных кривых. И в то же время не был найден критерий, позволяющий легко различать нормальные и анормальные дуги. В статье [49] 1913 г. Больца отмечает, что противопоставление нормального и анормального случаев, сделанное Адамаром, привело его к мысли •«точнее изучить анормальный случай» [49, с. 431]: «Чтобы получить достаточно общую исходную точку зрения для сравнения проблем Лагранжа и Майера, я хочу так обобщить задачу, чтобы обе только что названные проблемы стали ее частными случаями». Вместо интеграла (31) Больца предложил рассмотреть выражение $ / (Уъ • • -, УтУи • . • . Уп) dt + G (#ю, .. . , уп0, г/и, . .. , упг)- (35) 'Задача Больца состоит в том, чтобы найти кривую, удовлетворяющую условиям (32) — (34) и дающую экстремум сумме (35). Статьи Больца и его учебник [47], изданный в Чикаго в 1904 г., оказали большое влияние на формирование Чикагской математической школы. Ее представители (Г. Блисс, М. Морс, Г. Миерс, Л. Грейвс и др.) работали над отысканием необходимых и достаточных условий экстремума в задачах Лагранжа, Майера и Больца. Итоги этого цикла работ подвел Г. Блисс в упоминавшейся выше монографии 1946 г. [4]. В ней отмечалось, что теорию удается построить только для нормальных кривых. 232
Новые идеи в теорию вариационных задач с ограничениями внес американский математик Э. Макшейн (р. 1904) в 1939 г. [96]. Он ввел игольчатые вариации и привлек теорию выпуклости к доказательству необходимости условия Вейерштрасса (без предположения о нормальности). Методы Макшейна показались его современникам очень сложными. Они получили развитие только через 20 лет в теории оптимального управления, которая была создана в 1956 г. советскими математиками Л. С. Пон- трягиным (р. 1908) и его сотрудниками В. Г. Болтянским (р. 1922)у Р. В. Гамкрелидзе (р. 1927), Е. Ф. Мищенко (р. 1922) для решения задач, важных для приложений, но не укладывающихся в рамки классического вариационного исчисления. Как мы видели, в классическом вариационном исчислении изучались задачи, ограничения в которых заданы уравнениями. Ограничения типа; неравенств в нем практически не рассматривались. Эти ограничения были: охвачены теорией оптимального управления. Интересно отметить, что задача Ньютона, поставленная им в 1687 г., если ее правильно формализовать, содержит ограничение, заданное неравенством у' ^> 0. В конце XIX в. был опубликован ряд статей, посвященных применению теории Вейерштрасса к этой задаче. Особенно интересна работа профессора Берлинского университета Фридриха Августа (1840—1900). Изучая задачу Ньютона, в которой требуется найти минимум интеграла (' u-y'3dx \ . , /2 , он первый заметил, что при такой постановке пропущено важнейшее дополнительное условие у' > 0. Оно означает монотонность искомой кривой и исключает те самые ломаные, о которых писали Сен Жак де Сильвабель и Лежандр. По-видимому, Ньютон предполагал из физических соображений, что это условие выполнено, хотя и не высказал это в явном виде. Август указал [44, с. 3], что при отсутствии условия у' ;> 0 «в поверхности тела наименьшего сопротивления возникли бы воронкообразные углубления, при которых неизбежны были бы повторяющиеся удары частиц воздуха, что увеличило бы сопротивление». В современных курсах [3, с. 35] задача Ньютона формализуется так:. т $-Пр7*-Ы' *(0) = 0, x(T) = l, iGR+. о В связи с этим авторы учебника [3, с. 28] заметили: «Задачу Ньютона следует отнести даже собственно не к вариационному исчислению, а к оптимальному управлению, теория которого начала разрабатываться в пятидесятые годы нашего века». Такова математическая сторона вопроса. Обратимся теперь к тому, насколько правомерны физические предпосылки, из которых исходил Ньютон. Вейерштрасс в своих лекциях [Б57, т. 7, с. 202] указал, что они не являются общепринятыми, и отметил, что Эйлер получил другую форму тела наименьшего сопротивления.. В XIX в. было распространено мнение, что физические гипотезы Ньютона и вытекающие из них следствия не подтверждаются экспериментами. И в наши дни [43, с. 42] Л. Янг писал: «Ньютон сформулировал вариационную задачу о теле вращения, испытывающем наименьшее сопротивление при движении в газе. Принятый им закон сопротивления физически абсурден». 233,
Дело в том, что ни вода, ни окружающий нас воздух не обладают свойствами «редкой среды», о которой писал Ньютон. Однако его физические допущения и сама его задача оказались на самом передовом крае современной науки в середине 50-х годов нашего века, когда настала эра сверхзвуковых и сверхвысотных летательных аппаратов. На большой высоте допущения Ньютона выполняются. Задача Ньютона стала в наши дни важной аэродинамической задачей, как писали В. М. Алексеев, В. М. Тихомиров и С. В. Фомин [3, с. 35]: «Физические гипотезы, выдвинутые Ньютоном, и само его решение аэродинамической задачи оказались весьма актуальными в современной сверхзвуковой аэродинамике, когда на очередь дня встало построение сверхскоростных и высотных летательных аппаратов». ЗАКЛЮЧЕНИЕ. О НЕКОТОРЫХ НАПРАВЛЕНИЯХ В РАЗВИТИИ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ НА РУБЕЖЕ XIX и XX вв. В начале XX в. в вариационном исчислении произошло возрождение прямых методов. Примененные Л. Эйлером в его монографии 1744 г. [39] при выводе уравнения, носившего имя, они были надолго забыты после публикации алгоритма Лагранжа. Во второй половине XVIII м в XIX в. все ученые, в том числе и Эйлер, использовали только метод вариаций. В 1900 г. Д. Гильберт опять обратился к прямым методам {78]. Он сделал это в связи с проблемой обоснования принципа Дирихле. Во второй половине XIX в. была обнаружена глубокая связь между некоторыми проблемами теории уравнений с частными производными ш вариационными задачами. П. Лежен-Дирихле показал [90], что решение краевой задачи для уравнения Лапласа можно свести к решению некоторой вариационной задачи, и выдвинул так называемый принцип Дирихле, позволяющий делать заключение о существовании решения краевой задачи из существования решения вариационной задачи. Уже Б. Риман отчетливо понимал необходимость доказательства существования решения вариационной задачи и наметил пути такого доказательства. Однако его рассуждения были нестрогими, и Вейерштрасс ((1895) [Б57, т. 2, с. 49—54] выступил с критикой принципа Дирихле. •Он показал на примере, что имеются вариационные задачи, решение которых в заданном классе функций не существует, и тем самым указал на необходимость в каждом конкретном случае доказывать существование решения вариационной задачи. Гильберт в 1900 г. в 20-й из своих «Математических проблем» [30] утверждает, что общий подход к доказательствам существования решения краевых задач для уравнений в частных производных заключается ъ сведении их к вариационным задачам. При этом Гильберт указывает на необходимость обобщения понятия решения — идею, сыгравшую в XX в. значительную роль как в развитии вариационного исчисления, так и в теории уравнений в частных производных. Он выдвинул проблему [30, с. 55]: «Не допускает ли решение каждая регулярная вариационная задача, если только на данные граничные условия наложены определенные допущения... и если в случае необходимости самому понятию решения придать расширенное толкование». Обоснованию принципа Дирихле Гильберт посвятил две работы (1900) 178], (1904) [79]. В них он возродил прямые методы вариационного исчисления, развитые Л. Эйлером (они подробно описаны в [32, 13]), которые состоят в том, что вариационная задача рассматривается как предельная 234
при п ->- оо для задачи об экстремуме функции конечного числа п переменных. В конце XIX в. началось формирование функционального анализа,, который строился как обобщение дифференциального и интегрального исчисления. Его создатели неоднократно подчеркивали тот факт, что вариационное исчисление является составной частью новой дисциплины. Д. Гильберт писал об этом уже в 1900 г. [30, с. 58]: «Вариационное исчисление в широком смысле — это учение об изменении функций, и в качестве такового оно оказывается естественным продолжением дифференциального и интегрального исчисления». Эту же мысль высказывал в своих работах Вито Вольтерра, который в 1896 г. ввел понятие функциональной производной по аналогии с отысканием уравнения Эйлера» в вариационном исчислении. Для первого этапа развития функционального анализа характерен конкретный подход, когда изучаются не множества произвольной природы, а множества функций А и каждой функции из А ставится в соответствие число. Функционал является главным объектом изучения, а само исчисление называлось функциональным. Первыми за разработку взялись итальянские ученые профессор Бо- лонского университета С. Пинкерле (1853—1936) и В. Вольтерра (1860-1940), преподававший в Пизе (1883-1892), Турине (1892-1900), Риме (1900—1931), прославившийся результатами в различных областях анализа, в математической физике и приложениями анализа к биологии. У Пинкерле элементы множества А — аналитические функции, Вольтерра изучал множество непрерывных функций С [а, Ъ] или множество 77? раз дифференцируемых функций Ст [а, Ъ]. Начиная с 1887 г. Вольтерра в ряде заметок вводит понятие функционала: пусть А — множество функций х (t), заданных на интервале а <С t <J b; если каждому х ЕЕ А соответствует некоторое число F = = F Ы, то F называется функцией линии (функционалом), определенным на А. Вольтерра вводит норму в пространство А т ||| х HI = У] max | х0<) (t) |, s«» = х (t), и понятие непрерывности относительно этой нормы. Он вводит также понятие вариационной производной. В качестве одного из примеров Вольтерра приводит классический функционал вариационного исчисления ъ F[y-\=\f(t,y(t),y'{t),...,y(n){t))dt. а Подсчитав вариационную производную для этого функционала и приравняв ее нулю, Вольтерра, естественно, получает уравнение Эйлера. Итак, у Вольтерра вариационное исчисление является образцом для построения новой дисциплины, обобщающей математический анализ. Однако понятие вариационной производной, введенное Вольтеррой, неудобно для обобщений, так как опирается на понятие интеграла. Вольтерра рассуждал так: пусть А = Ст[а, й], х(^А, 8х(^А, а<а<£<р<&. Составив отношение AF/o = (F(x + дх) — F (х))/о,
тдеа = \^x(t)dt (рис. 8), он переходил к пределу /7 / Рис. 8 lim (AF/o) И|б*!Н-*о при а, р->^ и получал производную F' [xi\] (вариационную производную от F по х в точке £ Е= (а, р)). Во второй половине 90-х годов XIX в. начали свои исследования представители французской математической школы теории функций действительного переменного (Э. Борель, Р. Бэр, А. Лебег, М. Фреше и др.), а в первые годы XX в. Фреше начал практически заново строить здание функционального анализа, руководствуясь аналогиями с теорией функций действительного переменного. В 1906 г. М. Фреше (1878—1973) ввел в математику метрическое пространство [64]. Он положил начало абстрактному подходу к построению функционального анализа, так как изучал множество Е. состоящее из элементов произвольной природы. Каждой паре (а, Ь) элементов из Е Фреше поставил в соответствие некоторое число, «обладающее свойствами, очень схожими со свойствами расстояния между двумя точками», которое Фреше назвал уклонением (]fecart). На основе этого понятия Фреше в 1911 г. дал [65] определение дифференциала, которое широко используется в наши дни в теории оптимального управления. К этому времени уже сложилось понятие линейного функционала. Адамар в учебнике [71, с. 288—289] в 1910 г. так формулировал свойство линейности: и 0/1 + у*) = и Ы + и ы, и (сУ1) = си ы, где г/i и г/2 — функции переменной х. Адамар выдвинул условие: вариация функционала должна быть линейной. Он писал [71, с. 288]: «Фундаментальный результат дифференциального исчисления состоит в том, что дифференциал функции является линейной функцией дифференциалов переменных», подобно этому «вариация функционала — линейный функционал относительно вариации 6у». Заметим, что сам термин «вариация» явно указывает на аналогию с вариационным исчислением, которой постоянно руководствовался Адамар в работах по функциональному анализу. Эти мысли Адамара развивал Фреше. Он вводит [65] сначала дифференциал функции многих переменных, о котором говорил так: «дифференциал в моем смысле». Функция / (.г, ущ z. t) имеет дифференциал в точке (х0, у0, zo, *о)> если существует линейная функция от приращений А Ах + ВАу - CAz + DAt, которая отличается от приращения функции А/ на величину, являющуюся бесконечно малой по отношению к уклонению A (l'ecart) точек (х0, t0 + At). Под уклонением можно понимать, • -f (At) 2, причем число переменных здесь г/0, 20, t0) и (х0 -г Ах, например, А = ]/~ (А,г)2 + • • может быть произвольным. 236
Затем Фреше определяет дифференциал функционала: функционал Uа имеет дифференциал для элемента А0, если существует функционал VAA. линейный относительно приращения АА и отличающийся от приращения функционала Uа на величину, бесконечно малую по сравнению с уклонением между элементами А0 и А0 + АА. Под уклонением между двумя функциями / (х) и ф (х) Фреше предложил понимать, например, ь max \f(x) — гр (х) | пли \ [/ (х) — ф (х)]2 dx. При определении дифференциала Фреше исходил уже не из множества элементов произвольной природы, а из множества А, элементами которого являются функции. В последующих работах Фреше неоднократно возвращался к введенному им понятию дифференциала. При этом он указывал, что в учебниках по математическому анализу обычно дается такое определение дифференциала функции многих переменных: пусть функция многих переменных имеет в некоторой точке конечные частные производные, тогда дифференциал функции в этой точке равен выражению df = jxdx + fydy + fzdz. Фреше пишет, что уже после публикации своей работы в 1911 г. он встретил в учебнике О. Штольца [105, т. 1] другое определение дифференциала функции многих переменных: функция дифференцируема в точке (х0, i/n, . . ., w0), если в этой точке существуют конечные частные производные по всем аргументам и если приращение функции может быть представлено в виде / (хо -h Ах, . . . ,и0 -р Аи) — I (хоу . . . , щ) = —— Ах J- . .. OXq ... т— Аи г t\Ax - ЕоАу ~ . . . -f епАи, OU{) тде £i. to, . . ., гп стремятся к нулю, когда Ах, Дг/, . . ., Дм стремятся к нулю. Это понятие дифференциала функции многих переменных, которое после работ Фреше стали называть дифференциалом по Штольцу, гораздо раньше давалось Вейерштрассом в его многочисленных курсах теории функций, которые он читал в Берлинском университете. Оно имеется уже в его курсе в 1861 г., прочитанном в Берлинском промышленном институте. Несколько позже Фреше к понятию производной в функциональном исчислении с иных позиций подошел ученик и сотрудник Адамара Р. Гато. Он определил вариацию 6£/ с помощью предела 6Г = ]im U\x(t)-'-Mx(t)\-U\x(t)] л-0 1 Работы Гато восходят к 1913—1914 гг., но опубликованы в 1919 г. [66] после смерти автора, погибшего на фронте в первую мировую войну. Производная по Гато, так же как и производная по Фреше, применяется в теории оптимального управления (см. [23, с. 521). В начале XX в. значительно расширилась география вариационного исчисления. Если в XIX в. основные работы в этой области принадлежали немецким ученым, то в XX в. важнейшие результаты были получены в России. Франции, Америке. Кратко охарактеризуем работы русских ученых, созданные в начале XX в. 237
Член-корреспондент Российской академии наук, профессор Киевского университета Василий Петрович Ермаков (1845—1922) в 1903 г. опубликовал статью «Вариационное исчисление по Вейерштрассу» [18]у в которой развивал основные идеи Вейерштрасса, но с меньшими ограничениями относительно исследуемых функций. Функцию Е, входящую в четвертое условие экстремума, он назвал вейерштрассовой. В настоящее время материал этой работы входит в университетские учебники, но в начале XX в., когда лекции Вейерштрасса еще не были опубликованы, изложение его идей было очень важно. Французский перевод работ Ермакова был опубликован в 1905 г. в журнале Лиувилля [18]. Один из основателей Московской школы теории функций действительного переменного, профессор Московского университета Дмитрий Федорович Егоров (1869 —1931) в 1905 г. опубликовал статью о достаточных условиях экстремума в задаче Майера [56]. В это время задача Майера была в центре внимания математиков. Ее рассматривали сам Майер, Кнезер, Гильберт и многие другие ученые. Однако в их работах шла речь только о необходимых условиях экстремума. В письме к Д. Гильберту от 30.05.1905 г. Д. Егоров писал: «Цель моей статьи состоит в том, чтобы в проблему Майера ввести .Б-функцию и таким образом вывести достаточные условия экстремума» 5. В начале статьи Егоров отмечал, что он идет по пути, указанному Гильбертом в его докладе 1900 г., в котором им установлена теорема независимости. Гильберт показал там, как с помощью этой теоремы можно легко вывести условие Вейерштрасса, относящееся к .Ё-функции. Высокую оценку рассматриваемой статьи Егорова дает П. И. Кузнецов [21, с. 187]: «Эта работа является первым исследованием в отечественной математике, посвященным теории условного экстремума, и в настоящее время имеет важное значение в теории оптимального управления». Д. Ф. Егоров неоднократно читал в Московском университете лекции по вариационному исчислению, в которых излагал полную теорию простейшей вариационной задачи и кратко знакомил слушателей с задачами, содержащими ограничения: с изопериметрической и задачей Лагран- жа. Он написал учебник «Основания вариационного исчисления» (1923) [17], где изложил основные понятия и методы вариационного исчисления, используя самые современные достижения в этой области. Лекции Егорова и его учебник внесли в преподавание математики в Московском университете новые идеи, на основе которых в нашей стране впоследствии были созданы учебники и учебные пособия по вариационному исчислению. Надежда Николаевна Гернет (1877—1943) окончила в 1898 г. Петербургские высшие женские курсы. Затем училась в Гёттингенском университете у Д. Гильберта, где в 1901 г. с успехом защитила диссертацию «О новом методе в вариационном исчислении» 6 и получила ученую степень доктора философии. В 1900 г. Д. Гильберт рассмотрел [30] простейшую вариационную задачу. Н. Н. Гернет в своей диссертации распространила теорему независимости Гильберта на случай двух неизвестных функ- ций. Вернувшись в Россию, Н. Н. Гернет написала книгу «Об основной простейшей задаче вариационного исчисления» (1913) [8], на основе которой в 1915 г. защитила магистерскую диссертацию. Гернет была профес- 6 ИМИ, 1985, вып. 28, с. 267. 6 В 3-м томе «Собрания сочинений» Д. Гильберта [Б43] имеется список диссертацийу написанных под его руководством. Там указана и работа Гернет. 238
сором Петербургских высших женских курсов, а когда в 1919 г. произошло их слияние с университетом, стала преподавать в университете; в 1930 г. она перешла в Политехнический институт. Умерла Н. Н. Гер- нет в 1943 г. во время блокады Ленинграда. В своей книге Гернет изложила важнейшие результаты, полученные в вариационном исчислении в первое десятилетие XX в. Она впервые в учебной литературе рассмотрела в ней вариационные задачи, ограничения в которых заданы неравенствами / (я, i/) > 0 и ф (х, у, yf) ^> 0. В современных работах по оптимальному управлению имеются ссылки на исследования Н. Гернет. Так, в [6, с. 143] мы читаем: «В связи с задачами на одностороннюю вариацию были подняты старые работы Н. Гернет [8] и Валентайна [109], в которых использован простой прием сведения ограничений типа неравенства у (х) <^ ф (х) к ограничениям типа равенства у (х) + v1 (#) = ф (я)». Об истории вариационного исчисления в XIX в. см. также книгу [691 и статьи [1, 2, 10—16, 28]. Исторические сведения содержат также обширные обзоры в немецкой [84, 112] и французской [88] математических энциклопедиях.
Часть четвертая ИСЧИСЛЕНИЕ КОНЕЧНЫХ РАЗНОСТЕЙ 1. ИНТЕРПОЛЯЦИЯ 1.1. Конечная интерполяция Уже И. Ньютон [17] (см. также ИМ, т. 2, с. 157) поставил и решил основную задачу интерполяции, которая формулируется теперь так: известны значения функции / (х) в п точках Уг= f (*i)> У2= f Ы,- • ., Уп = / (хп)- Требуется найти многочлен Рп (х) степени п — 1, который в этих точках совпадает с функцией / (х), т. е. РпЫ = f(xls) (к = 1, 2,. . ., п). Задача интерполяции функции многочленом имеет единственное решение и геометрически соответствует построению графика многочлена, проходящего через заданные точки. Если точки хх, х2, . . ., хп — узлы интерполяции — расположены на некотором отрезке достаточно плотно, а функция / (х) меняется «гладко», то, как подсказывает интуиция, интерполяционный многочлен Рп (х) хорошо приближает функцию на этом отрезке. Линейная (п = 2) и параболическая (п = 3) интерполяции использовались задолго до Ньютона при составлении таблиц и пользовании ими. Для равноотстоящих узлов х^ — (к — 1)/г (к = 1,2,. . ., /г) Ньютон дал выражение интерполяционного многочлена х \н д}7 (0) Pn(x) = ^^^x{x-h){x-2h)...{x-{k-i)h), (1) к= о где А/г /(*) =f(x+h) -/(*), а A$j(x) = b'h-1f(x + h)-bt1f(x) — к-я разность функции / (х) в точке х с шагом h. Ньютону было известно выражение интерполяционного многочлена и для случая произвольных узлов интерполяции х1ч х2, . . ., хп, которое мы приведем в современных обозначениях: п Рп И = 2 [*1, ...уХк](х — Х1)...(х — Х}^), (2) где [хг, х2, . . ., х}:] — разделенная разность 2, которая определяется 1 Эту формулу нашел не позднее 1600 г. Т. Гарриот, а за несколько лет до Ньютона ее открыл Джеймс Грегори (см. ИМ, т. 2, с. 157, а также [3, с. 50]). 2 Понятие разделенной разности дал Ньютон [Б9, т. 7, с. 608—610], термин же был предложен в< 1842 г. А. де Морганом (ИМ, т. 2, с. 157). 240
рекуррентно [xx] = f(x1)9 [#1, . . . , Xft] — ■ 4-1 Значительно позднее Э. Варинг (1799) и Ж. Л. Лагранж (1795) (см. ИМ, т. 3, с. 230) дали другое представление интерполяционного многочлена (2) где со (я) = (х — хг) ... (а: — #„). Представление Ньютона удобнее, так как оно имеет рекуррентный характер: при добавлении новой точки хп+1 в сумме (2) добавляется еще одно слагаемое, но старые слагаемые не меняются. В представлении Лагранжа при добавлении новой точки меняются все слагаемые. Однако формула Лагранжа имеет то преимущество, что позволяет обобщать интерполяционную задачу в двух направлениях. Если мы хотим найти функцию срп (х) из заданного класса, образующего линейное пространство, которая в точках хг, х2, . . ., хп совпадает с функцией f(x), то для решения такой задачи достаточно найти базисные функции щ(х) (к = 1, 2, . . ., п) из этого класса, обладающие свойством Vi(*j) = 8ij = [^ i==j (6i7- — символ Кронекера). Тогда функция п Фя И = S / (хк) Щ И /,=1 и будет искомой, так как для любого к Фп Ы = / (хк). Для формулы Лагранжа заданным классом является класс алгебраических многочленов степени не выше (/г — 1), а базисные функции имеют вид / v со (х) Конструкция интерполяционных многочленов допускает еще одно обобщение, которое включает в себя и многочлен Ньютона (2) и многочлен Лагранжа (3). Пусть Lk (к = 1, 2, . . ., п) — линейные функционалы. Требуется найти многочлен Рп степени п — 1, для которого LkPn = Lkf (к = 1, 2, . . ., л), / — заданная функция. Для решения этой задачи достаточно найти многочлены сок- (х) степени не выше /г — 1, такие, что ZyjCOj = Ojj. Тогда многочлен Рп И = 55 £/гМг (х) h=i 241
•будет искомым. Для конструкции Ньютона такими функционалами будут разделенные разности Lftf = [х^ х2. • • •? xkU а функции со^. (х) имеют вид со^ (х) = (х — х±) ... (х — 2'/,-i). сох (х) — 1. Для конструкции Лагранжа Lkf = / (хк), а / ч со х (Од. (Х) = —г- —■ . (х — х^ со (##) Оставаясь в рамках интерполяционной задачи, мы в качестве функционалов можем брать линейные комбинации значений функции ^ = S<W(*0 (* =1,2,...,/?). i Ясно, что при любой невырожденной матрице (aki) эта конструкция .дает один и тот же многочлен Рп (х), совпадающий с многочленами Ньютона и Лагранжа. и в этом смысле такое обобщение для конечного числа узлов неинтересно. Однако в случае счетного числа узлов указанный подход приводит к различным интерполяционным рядам, о которых мы подробно расскажем далее, анализируя работы П. С. Лапласа и Н. X. Абеля. Если в качестве функционалов Lhi взять значения производных Ьы1 = /(i) Ы (к = 1, 2, . . ., т; i = 0, 1,. . ., у, то мы получаем задачу интерполяции с кратными узлами, решенную Ш. Эрмитом (об этом см. ниже). Заметим, что в конце XVIII и в XIX в. появился целый ряд работ, в которых рассматривались различные обобщения интерполяционного многочлена. Так, в работах Л. Эйлера, А. Клеро, К. Ф. Гаусса, Ж. Л. Лагранжа, О. Коши и др. изучалась интерполяция тригонометрическими многочленами (см. [А2. с. 211]), а в исследованиях Риш де Прони и Гаусса (см. [А2, с. 210]) — показательными функциями. Коши поставил задачу об интерполяции рациональными дробями и привел конструкцию такой дроби (1821) [33]. Эрмит (1859) [41] предложил любопытное обобщение интерполяционной формулы Лагранжа: р /г\ _ V1 / (<г \ ® (*) 9 (*) rn W - 2_jJ W (*_*,)«'(^)е(^) ' где со (х) — то же. что и в (3), а 0 (х) — многочлен. Исходя из этой конструкции, он построил многочлен 0т (х) степени т, т < п, который наилучшим образом, в смысле среднеквадратичного уклонения, приближает функцию / (х). Более точно этот многочлен дает минимум сумме Е[/Ы-етЫ]292Ы- Ш. Лезан (1890) [46] предложил в качестве интерполирующей функции следующее выражение: /,,м=ф-[1>ы] „_;%. ]. 7;=1 л где (р (х) — монотонная функция. Это по существу равносильно тому, что вместо функции/ (я) интерполируется функция ср \f Or)]. 242
1.2. Интерполяционные ряды Лапласа Уже Ньютон записывал свою интерполяционную формулу в виде бесконечного ряда Kf (°) fn=Xj^^x{x-h)'"{x^{n^i)h^ соответствующего бесконечной последовательности точек 0, h, 2h, . . . . . ., nh, . . . Ньютону был известен ряд, который теперь называют обратным рядом Ньютона: f{x)=Xj~^rx{x+*)•••(*+(*- *)*). 4 71=0 где Аи=%С*Л-кЩ-1)\ этому ряду соответствует последовательность узлов 0, — h, —2/г, . . * . . ., —/г/г, . . . Ньютон получил также ряд с центральными разностями (об этом см. [3]). Большое число различных интерполяционных рядов имеется в XIX в. в работах Лапласа и Абеля. В ряде работ (см., например, мемуар 1782 г. [47]), подытоженных в знаменитой «Аналитической теории вероятностей» (1812) [49], Лаплас предложил общий метод получения интерполяционных разложений. Предварительно он вводит и развивает метод производящих функций. Каждой последовательности {ух}, х = 0, 1, 2, . . ., Лаплас ставит в соответствие производящую функцию оо u(t)= S У J*. л=0 (На самом деле, как видно из дальнейшего, он оперирует с рядами более оо общего типа ^ yxtx. Рассматривая различные операции над последо- x=~N J вательностями, Лаплас находит соответс