Text
                    В. А. Зорин
МАТЕМАТИЧЕСКИЙ
АНАЛИЗ
Часть I
Издание четвертое,
исправленное
Рекомендовано Министерством образования Российской Федерации
в качестве учебника для студентов
математических и физико-математических
факультетов и специальностей
высших учебных заведений
мцнмо
Москва, 2002


УДК 517 ББК 22.16 386 Рецензенты: Отдел теории функций комплексного переменного Математического института им. В. А. Стеклова Российской Академии Наук. Заведующий отделом академик А. А. Гончар. Академик В. И. Арнольд. Зорин В. А. 386 Математический анализ. Часть I. — Изд. 4-е, испр. — М.: МЦНМО, 2002. —XVI+ 664 с. Библ.: 52 назв. Илл.: 65. ISBN 5-94057-055-0 ISBN 5-94057-056-9 (часть I) Университетский учебник для студентов физико-математических спе- специальностей. Может быть полезен студентам факультетов и вузов с рас- расширенной математической подготовкой, а также специалистам в области математики и ее приложений. ББК 22.16 ISBN 5-94057-055-lk &&Л. Зорич, 1998, 2001, 2002. ISBN 5-94057-056-9 (часть I) © МЦНМО, 2001, 2002. «Полная строгость изложения соединена с доступностью и полнотой, а также воспита- воспитанием привычки иметь дело с реальными задачами естествознания». Из отзыва академика А. Н. Колмогорова о первом издании учебника
ОГЛАВЛЕНИЕ Предисловия к четвертому и третьему изданиям IX Предисловие ко второму изданию X Из предисловия к первому изданию XII Глава I. Некоторые общематематические понятия 1 § 1. Логическая символика 1 1. Связки и скобки A). 2. Замечания о доказательствах C). 3. Не- Некоторые специальные обозначения C). 4. Заключительные заме- замечания D). Упражнения 5 § 2. Множества и элементарные операции над множествами 5 1. Понятие множества E). 2. Отношение включения (8). 3. Про- Простейшие операции над множествами (9). Упражнения 12 § 3. Функция 13 1. Понятие функции (отображения) A3). 2. Простейшая класси- классификация отображений A8). 3. Композиция функций и взаимно обратные отображения B0). 4. Функция как отношение. График функции B2). Упражнения 26
IV ОГЛАВЛЕНИЕ § 4. Некоторые дополнения 29 1. Мощность множества (кардинальные числа) B9). 2. Об акси- аксиоматике теории множеств C2). 3. Замечания о структуре ма- математических высказываний и записи их на языке теории мно- множеств C4). Упражнения 37 Глава П. Действительные (вещественные) числа 40 § 1. Аксиоматика и некоторые общие свойства множества действи- действительных чисел 41 1. Определение множества действительных чисел D1). 2. Некото- Некоторые общие алгебраические свойства действительных чисел D5). 3. Аксиома полноты и существование верхней (нижней) грани числового множества E0). § 2. Важнейшие классы действительных чисел и вычислительные аспекты операций с действительными числами 52 1. Натуральные числа и принцип математической индукции E2). 2. Рациональные и иррациональные числа E6). 3. Принцип Ар- Архимеда F0). 4. Геометрическая интерпретация множества дей- действительных чисел и вычислительные аспекты операций с дей- действительными числами F2). Задачи и упражнения 76 § 3. Основные леммы, связанные с полнотой множества действи- действительных чисел 81 1. Лемма о вложенных отрезках (принцип Коши-Кантора) (81). 2. Лемма о конечном покрытии (принцип Бореля-Лебега) (82). 3. Лемма о предельной точке (принцип Больцано-Вейерштрас- са) (83). Задачи и упражнения 84 § 4. Счетные и несчетные множества 85 1. Счетные множества (85). 2. Мощность континуума (87). Задачи и упражнения 88 Глава III. Предел 91 § 1. Предел последовательности 92 1. Определения и примеры (92). 2. Свойства предела последова- последовательности (94). 3. Вопросы существования предела последова- последовательности (99). 4. Начальные сведения о рядах A10). Задачи и упражнения 121
ОГЛАВЛЕНИЕ V § 2. Предел функции 124 1. Определения и примеры A24). 2. Свойства предела функ- функции A30). 3. Общее определение предела функции (предел по базе) A48). 4. Вопросы существования предела функции A53). Задачи и упражнения 171 Глава IV. Непрерывные функции 175 § 1. Основные определения и примеры 175 1. Непрерывность функции в точке A75). 2. Точки разрыва A81). §2. Свойства непрерывных функций 184 1. Локальные свойства A84). 2. Глобальные свойства непрерыв- непрерывных функций A86). Задачи и упражнения 197 Глава V. Дифференциальное исчисление 202 § 1. Дифференцируемая функция 202 1. Задача и наводящие соображения B02). 2. Функция, диф- дифференцируемая в точке B08). 3. Касательная; геометрический смысл производной и дифференциала B11). 4. Роль системы ко- координат B14). 5. Некоторые примеры B16). Задачи и упражнения 222 §2. Основные правила дифференцирования 224 1. Дифференцирование и арифметические операции B24). 2. Дифференцирование композиции функций B28). 3. Диффе- Дифференцирование обратной функции B32). 4. Таблица производ- производных основных элементарных функций B38). 5. Дифференциро- Дифференцирование простейшей неявно заданной функции B38). 6. Производ- Производные высших порядков B43). Задачи и упражнения 247 § 3. Основные теоремы дифференциального исчисления 248 1. Лемма Ферма и теорема Ролля B48). 2. Теоремы Лагранжа и Коши о конечном приращении B51). 3. Формула Тейлора B55). Задачи и упражнения 270 § 4. Исследование функций методами дифференциального исчисле- исчисления 274 1. Условия монотонности функции B74). 2. Условия внутрен- внутреннего экстремума функции B76). 3. Условия выпуклости функ- функции B82). 4. Правило Лопиталя B91). 5. Построение графика функции B93). Задачи и упражнения 303
VI ОГЛАВЛЕНИЕ § 5. Комплексные числа и взаимосвязь элементарных функций . . . 307 1. Комплексные числа C07). 2. Сходимость в С и ряды с ком- комплексными членами C12). 3. Формула Эйлера и взаимосвязь эле- элементарных функций C17). 4. Представление функции степен- степенным рядом, аналитичность C21). 5. Алгебраическая замкну- замкнутость поля С комплексных чисел C26). Задачи и упражнения 334 § 6. Некоторые примеры использования дифференциального исчи- исчисления в задачах естествознания 335 1. Движение тела переменной массы C36). 2. Барометрическая формула C38). 3. Радиоактивный распад, цепная реакция и атомный котел C40). 4. Падение тел в атмосфере C43). 5. Еще раз о числе е и функции ехр х C45). 6. Колебания C48). Задачи и упражнения 352 § 7. Первообразная 356 1. Первообразная и неопределенный интеграл C57). 2. Ос- Основные общие приемы отыскания первообразной C59). 3. Пер- Первообразные рациональных функций C66). 4. Первообраз- Первообразные вида J* i?(cos х, sin x) dx C71). 5. Первообразные вида fR(x,y(x))dxC73). Задачи и упражнения 377 Глава VI. Интеграл 383 § 1. Определение интеграла и описание множества интегрируемых функций 383 1. Задача и наводящие соображения C83). 2. Определение инте- интеграла Римана C85). 3. Множество интегрируемых функций C87). Задачи и упражнения 402 § 2. Линейность, аддитивность и монотонность интеграла 404 1. Интеграл как линейная функция на пространстве Ща, Ъ] D04). 2. Интеграл как аддитивная функция отрезка интегрирова- интегрирования D05). 3. Оценка интеграла, монотонность интеграла, тео- теоремы о среднем D08). Задачи и упражнения 417 § 3. Интеграл и производная 418 1. Интеграл и первообразная D18). 2. Формула Ньютона-Лейб- Ньютона-Лейбница D21). 3. Интегрирование по частям в определенном инте- интеграле и формула Тейлора D22). 4. Замена переменной в инте- интеграле D25). 5. Некоторые примеры D27). Задачи и упражнения 432
ОГЛАВЛЕНИЕ VII § 4. Некоторые приложения интеграла 436 1. Аддитивная функция ориентированного промежутка и инте- интеграл D36). 2. Длина пути D38). 3. Площадь криволинейной тра- трапеции D46). 4. Объем тела вращения D47). 5. Работа и энер- энергия D48). Задачи и упражнения 455 §5. Несобственный интеграл 456 1. Определения, примеры и основные свойства несобственных интегралов D57). 2. Исследование сходимости несобственного интеграла D62). 3. Несобственные интегралы с несколькими осо- особенностями D69). Задачи и упражнения 473 Глава VII. Функции многих переменных, их предел и непре- непрерывность 476 § 1. Пространство Шт и важнейшие классы его подмножеств .... 477 1. Множество Шт и расстояние в нем D77). 2. Открытые и за- замкнутые множества в Шт D78). 3. Компакты в Шт D82). Задачи и упражнения 484 § 2. Предел и непрерывность функции многих переменных 484 1. Предел функции D84). 2. Непрерывность функции многих пе- переменных и свойства непрерывных функций D91). Задачи и упражнения 497 Глава VIII. Дифференциальное исчисление функций многих переменных 498 § 1. Линейная структура в Жт 498 1. Шт как векторное пространство D98). 2. Линейные отобра- отображения L: Шт -)■ Rn D99). 3. Норма в Шт E00). 4. Евклидова структура в Rm E02). § 2. Дифференциал функции многих переменных 504 1. Дифференцируемость и дифференциал функции в точке E04). 2. Дифференциал и частные производные вещественнозначной функции E05). 3. Координатное представление дифференциала отображения. Матрица Якоби E09). 4. Непрерывность, частные производные и дифференцируемость функции в точке E09).
VIII ОГЛАВЛЕНИЕ §3. Основные законы дифференцирования 511 1. Линейность операции дифференцирования E11). 2. Диффе- Дифференцирование композиции отображений E14). 3. Дифференци- Дифференцирование обратного отображения E20). Задачи и упражнения 522 § 4. Основные факты дифференциального исчисления вещественно- значных функций многих переменных 528 1. Теорема о среднем E28). 2. Достаточное условие дифференци- руемости функции многих переменных E30). 3. Частные произ- производные высшего порядка E32). 4. Формула Тейлора E35). 5. Экс- Экстремумы функций многих переменных E37). 6. Некоторые гео- геометрические образы, связанные с функциями многих перемен- переменных E46). Задачи и упражнения 550 § 5. Теорема о неявной функции 557 1. Постановка вопроса и наводящие соображения E57). 2. Про- Простейший вариант теоремы о неявной функции E60). 3. Переход к случаю зависимости F(x1,...,xm,y) = 0 E64). 4. Теорема о неявной функции E67). Задачи и упражнения 573 § 6. Некоторые следствия теоремы о неявной функции 577 1. Теорема об обратной функции E77). 2. Локальное приведение гладкого отображения к каноническому виду E82). 3. Зависи- Зависимость функций E87). 4. Локальное разложение диффеоморфиз- диффеоморфизма в композицию простейших E89). 5. Лемма Морса E92). Задачи и упражнения 596 § 7. Поверхность в!"и теория условного экстремума 597 1. Поверхность размерности к в К" E98). 2. Касательное прост- пространство F03). 3. Условный экстремум F09). Задачи и упражнения 624 Некоторые задачи коллоквиумов 630 Вопросы к экзамену 636 Литература 641 Предметный указатель 645 Указатель имен 656
ПРЕДИСЛОВИЯ К ЧЕТВЕРТОМУ И ТРЕТЬЕМУ ИЗДАНИЯМ Промежуток времени, прошедший с момента выхода третьего издания, слишком мал, чтобы можно было получить достаточно много новых замечаний читателей. Тем не менее, в четвертом издании исправлены некоторые погрешности и сделана локальная правка текста. Москва, 2002 год В. Зорин Эта часть I книги выходит вслед за выпущенной ранее тем же издатель- издательством более продвинутой частью II курса. Для единообразия и преем- преемственности оформление текста приведено в соответствие с уже приня- принятым в части П. Рисунки выполнены заново. Исправлены замеченные опечатки, добавлены некоторые задачи, расширен список дополнитель- дополнительной литературы. Более полные сведения о материале книги и некото- некоторых особенностях курса в целом даны ниже в предисловии к первому изданию. Москва, 2001 год В. Зорин
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ В этом, втором издании книги, наряду с попыткой устранить опечат- опечатки первого1), сделаны отдельные изменения изложения (в основном это касается вариантов доказательств отдельных теорем) и добавлены не- некоторые новые задачи, как правило, неформального характера. В пре- предисловии к первому изданию этого курса анализа уже дана его общая характеристика, указаны основные принципы и направленность изло- изложения. Здесь я хотел бы сделать несколько практических замечаний, связанных с использованием книги в учебном процессе. Любым учебником обычно пользуются как студент, так и препода- преподаватель— каждый для своих целей. Сначала и тот, и другой заинтере- заинтересованы иметь книгу, где, помимо формально необходимого минимума теории, имеются по возможности разнообразные содержательные при- примеры ее использования, пояснения, исторический и научный коммента- комментарии, демонстрируются взаимосвязи, указываются перспективы разви- развития. Но в момент подготовки к экзамену студент желает видеть тот материал, который выносится на экзамен. Преподаватель точно так же, завершая подготовку курса, отбирает только тот материал, кото- который может и должен быть изложен в отведенное курсу время. В этой связи следует иметь в виду, что текст данного учебника, конечно, заметно шире того конспекта лекций, на базе которого он на- написан. Что составило эту разницу? Во-первых, к конспекту добавлен, по существу, целый задачник, состоящий, не столько из упражнений, следует огорчаться: вместо исправленных опечаток не сохранившегося набо- набора первого издания заведомо появится комплект новых опечаток, так оживляющих, по мнению Эйлера, чтение математического текста.
ПРЕДИСЛОВИЕ КО ВТОРОМУ ИЗДАНИЮ XI сколько из содержательных задач естествознания или собственно мате- математики, примыкающих к соответствующим разделам теории, а иногда и существенно расширяющих их. Во-вторых, в книге, конечно, разобра- разобрано много больше примеров, демонстрирующих теорию в действии, чем это удается сделать на лекциях. Наконец, в-третьих, ряд глав, пара- параграфов или отдельных пунктов сознательно написаны как дополнение к традиционному материалу. Об этом сказано в разделах «О введении» и «О вспомогательном материале» предисловия к первому изданию. Напомню также, что в предисловии к первому изданию я желал предостеречь и студента, и начинающего преподавателя от чрезмерно долгого сквозного изучения вводных формальных глав. Это заметно откладывает собственно анализ и сильно смещает акценты. Чтобы показать, что на деле остается в реальном лекционном курсе от этих формальных вводных глав, и чтобы в концентрированном виде изложить программу такого курса в целом, а также отметить возмож- возможные ее вариации в зависимости от контингента слушателей, я в конце книги привожу некоторые задачи коллоквиумов, а также экзаменаци- экзаменационные вопросы последнего времени за первые два семестра, к которым относится эта часть I. По экзаменационным вопросам профессионал, конечно, увидит и по- порядок изложения, и степень развития в нем фундаментальных понятий и методов, и привлечение порой материала второй части учебника, ко- когда рассматриваемый в первой части вопрос уже доступен слушателям в более общем виде1). В заключение хотел бы поблагодарить знакомых и незнакомых мне коллег и студентов за отзывы и конструктивные замечания к первому изданию курса. Особенно интересно и полезно мне было прочитать ре- рецензии А. Н. Колмогорова и В. И. Арнольда. Разные по объему, форме и стилю, они в профессиональном плане имели так ободряюще много общего. Москва, 1997 год В. Зорич :'Часть записей соответствующих лекций опубликована и формально я даю ссыл- ссылку на изданные по ним брошюры, хотя понимаю, что они уже малодоступны (лек- (лекции были прочитаны и изданы ограниченным тиражом в Математическом колледже НМУ и на механико-математическом факультете МГУ).
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ Создание Ньютоном и Лейбницем три столетия тому назад основ диф- дифференциального и интегрального исчисления даже по нынешним мас- масштабам представляется крупнейшим событием в истории науки вообще и математики в особенности. Математический анализ (в широком смысле слова) и алгебра, пе- переплетаясь, образовали теперь ту корневую систему, на которой дер- держится разветвленное дерево современной математики и через которую происходит его основной живительный контакт с внематематической сферой. Именно по этой причине основы анализа включаются как необ- необходимый элемент даже самых скромных представлений о так называе- называемой высшей математике, и, вероятно, поэтому изложению основ анали- анализа посвящено большое количество книг, адресованных различным кру- кругам читателей. Эта книга в первую очередь адресована математикам, желающим (как и должно) получить полноценные в логическом отношении доказа- доказательства фундаментальных теорем, но вместе с тем интересующимся также их внематематической жизнью. Особенности настоящего курса, связанные с указанными обстоя- обстоятельствами, сводятся в основном к следующему. По характеру изложения. В пределах каждой большой темы изложение, как правило, индуктивное, идущее порой от постановки за- задачи и наводящих эвристических соображений по ее решению к основ- основным понятиям и формализмам.
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ XIII Подробное вначале, изложение становится все более сжатым по мере продвижения по курсу. Упор сделан на эффективном аппарате гладкого анализа. При изло- изложении теории я (в меру своего понимания) стремился выделить наибо- наиболее существенные методы и факты и избежать искушения незначитель- незначительного усиления теорем ценой значительного усложнения доказательств. Изложение геометрично всюду, где это представлялось ценным для раскрытия существа дела. Основной текст снабжен довольно большим количеством примеров, а почти каждый параграф заканчивается набором задач, которые, на- надеюсь, существенно дополняют даже теоретическую часть основного текста. Следуя великолепному опыту Полна и Сеге, я часто старал- старался представить красивый математический или важный прикладной ре- результат в виде серий доступных читателю задач. Расположение материала диктовалось не только архитектурой ма- математики в смысле Бурбаки, но и положением анализа как составной части единого математического или, лучше сказать, естественно-мате- естественно-математического образования. По содержанию. Курс издается в двух книгах (части I и II). Настоящая первая часть содержит дифференциальное и интеграль- интегральное исчисление функций одной переменной и дифференциальное исчи- исчисление функций многих переменных. В дифференциальном исчислении выделена роль дифференциала как линейного эталона для локального описания характера изменения переменной величины. Кроме многочисленных примеров использования дифференциального исчисления для исследования функциональных за- зависимостей (монотонность, экстремумы), показана роль языка анализа в записи простейших дифференциальных уравнений — математических моделей конкретных явлений и связанных с ними содержательных за- задач. Рассмотрен ряд таких задач (например, движение тела переменной массы, ядерный реактор, атмосферное давление, движение в сопроти- сопротивляющейся среде), решение которых приводит к важнейшим элементар- элементарным функциям. Полнее использован комплексный язык, в частности, выведена формула Эйлера и показано единство основных элементар- элементарных функций. Интегральное исчисление сознательно изложено по возможности на наглядном материале в рамках интеграла Римана. Для большинства
XIV ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ приложений этого вполне хватает1). Указаны различные приложения интеграла, в том числе приводящие к несобственному интегралу (на- (например, работа выхода из поля тяготения и вторая космическая ско- скорость) или к эллиптическим функциям (движение в поле тяжести при наличии связей, маятник). Дифференциальное исчисление функций нескольких переменных до- довольно геометрично. В нем, например, рассмотрены такие важные и по- полезные следствия теоремы о неявной функции, как криволинейные ко- координаты и локальное приведение к каноническому виду гладких ото- отображений (теорема о ранге) и функций (лемма Морса), а также теория условного экстремума. Результаты, относящиеся к теории непрерывных функций и диф- дифференциальному исчислению, подытожены и изложены в общем инва- инвариантном виде в двух главах, которые естественным образом примы- примыкают к дифференциальному исчислению вещественнозначных функций нескольких переменных. Эти две главы открывают вторую часть кур- курса. Вторая книга, в которой, кроме того, изложено интегральное ис- исчисление функций многих переменных, доведенное до общей формулы Ньютона - Лейбница - Стокса, приобретает, таким образом, определен- определенную целостность. Более полные сведения о второй книге мы поместим в предисловии к ней, а здесь добавим только, что кроме уже перечисленного матери- материала она содержит сведения о рядах функций (степенных рядах и рядах Фурье в том числе), об интегралах, зависящих от параметра (включая фундаментальное решение, свертку и преобразование Фурье), а так- также об асимптотических разложениях (они обычно мало представлены в учебной литературе). Остановимся теперь на некоторых частных вопросах. О введении. Вводного обзора предмета я не писал, поскольку большинство начинающих студентов уже имеют из школы первое пред- представление о дифференциальном и интегральном исчислении и его при- приложениях, а на большее вступительный обзор вряд ли мог бы претен- претендовать. Вместо него я в первых двух главах довожу до определенной " Более «сильные» интегралы, как известно, требуют более кропотливых и вы- выбивающихся из основного русла теоретико-множественных рассмотрений, мало что прибавляя к эффективному аппарату анализа, который и должен быть освоен в пер- первую очередь.
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ XV математической завершенности представления бывшего школьника о множестве, функции, об использовании логической символики, а также о теории действительного числа. Этот материал относится к формальным основаниям анализа и ад- адресован в первую очередь студенту-математику, который в какой-то момент захочет проследить логическую структуру базисных понятий и принципов, используемых в классическом анализе. Собственно мате- математический анализ в книге начинается с третьей главы, поэтому чита- читатель, желающий по возможности скорее получить в руки эффективный аппарат и увидеть его приложения, при первом чтении вообще может начать с главы III, возвращаясь к более ранним страницам в случае, ес- если что-то ему покажется неочевидным и вызовет вопрос, на который, надеюсь, я тоже обратил внимание и предусмотрительно дал ответ в первых главах. О рубрикации. Материал обеих книг разбит на главы, имею- имеющие сплошную нумерацию. Параграфы нумеруются в пределах каждой главы отдельно; подразделения параграфа нумеруются только в пре- пределах этого параграфа. Теоремы, утверждения, леммы, определения и примеры для большей логической четкости выделяются, а для удобства ссылок нумеруются в пределах каждого параграфа. О вспомогательном материале. Несколько глав книги на- написаны как естественное окаймление классического анализа. Это, с од- одной стороны, уже упоминавшиеся главы I, II, посвященные его фор- формально-математическим основаниям, а с другой стороны, главы IX, X, XV второй части, дающие современный взгляд на теорию непре- непрерывности, дифференциальное и интегральное исчисление, а также гла- глава XIX, посвященная некоторым эффективным асимптотическим ме- методам анализа. Вопрос о том, какая часть материала этих глав включается в лекци- лекционный курс, зависит от контингента слушателей и решается лектором, но некоторые вводимые здесь фундаментальные понятия обычно при- присутствуют в любом изложении предмета математикам. В заключение я хотел бы поблагодарить тех, чья дружеская и ква- квалифицированная профессиональная помощь была мне дорога и полезна при работе над этой книгой. Предлагаемый курс довольно тщательно и во многих аспектах со- согласовывался с последующими современными университетскими мате- математическими курсами — такими, например, как дифференциальные
XVI ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ уравнения, дифференциальная геометрия, теория функций комплексно- комплексного переменного, функциональный анализ. В этом отношении мне были весьма полезны контакты и обсуждения с В. И. Арнольдом и, особен- особенно многочисленные, с С. П. Новиковым в период совместной работы в экспериментальном потоке при отделении математики. Много советов я получил от Н. В. Ефимова, заведующего кафед- кафедрой математического анализа механико-математического факульте- факультета МГУ. Я признателен также коллегам по кафедре и факультету за замеча- замечания к ротапринтному изданию моих лекций. При работе над книгой ценными оказались предоставленные в мое распоряжение студенческие записи моих лекций последнего времени, за что я благодарен их владельцам. Я глубоко признателен официальным рецензентам издательства Л. Д. Кудрявцеву, В. П. Петренко, С. Б. Стечкину за конструктивные за- замечания, значительная часть которых учтена в предлагаемом читателю тексте. Москва, 1980 год В. Зорич
ГЛАВА I НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ И ОБОЗНАЧЕНИЯ § 1. Логическая символика 1. Связки и скобки. Язык этой книги, как и большинства мате- математических текстов, состоит из обычного языка и ряда специальных символов излагаемых теорий. Наряду с этими специальными символа- символами, которые будут вводиться по мере надобности, мы используем рас- распространенные символы математической логики -■, Л, V, =>, -о- для обо- обозначения соответственно отрицания «не» и связок «и», «или», «влечет», «равносильно»1). Возьмем, например, три представляющих и самостоятельный инте- интерес высказывания: L. «Если обозначения удобны для открытий ... , то поразительным образом сокращается работа мысли» (Г. Лейбниц2)). Р. «Математика — это искусство называть разные вещи одинаковы- одинаковыми именами» (А. Пуанкаре3)). ^В логике вместо символа Л чаще используется символ &. Символ => импликации логики чаще пишут в виде —>, а отношение равносильности — в виде <—>• или *•». Однако мы будем придерживаться указанной в тексте символики, чтобы не пере- перегружать традиционный для анализа знак —> предельного перехода. 2^ Г. В. Лейбниц A646-1716)—выдающийся немецкий ученый, философ и мате- математик, которому наряду с Ньютоном принадлежит честь открытия основ анализа бесконечно малых. 3'А. Пуанкаре A854-1912)—французский математик, блестящий ум которого преобразовал многие разделы математики и достиг ее фундаментальных приложе- приложений в математической физике.
2 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ G. «Великая книга природы написана языком математики» (Г.Галилей1)). Тогда в соответствии с указанными обозначениями: Запись L^P L^P {{L =► P) A (-.P)) ^((L ^G)V(P< =>G)) Если G P не Означает L влечет Р L равносильно Р следует из L и Р неверно, то L неверно равносильно ни L, ни Р Мы видим, что пользоваться только формальными обозначениями, избегая разговорного языка, — не всегда разумно. Мы замечаем, кроме того, что в записи сложных высказываний, со- составленных из более простых, употребляются скобки, выполняющие ту же синтаксическую функцию, что и при записи алгебраических выра- выражений. Как и в алгебре, для экономии скобок можно договориться о «порядке действий». Условимся с этой целью о следующем порядке при- приоритета символов: -., Л, V, =», &. При таком соглашении выражение -и4 Л 5 V С =^ Z) следует рас- расшифровать как (((-<А) Л В) V С) => D, а соотношение А V В => С — как (А V В) => С, но не как А V (В =>■ С). Записи А => В, означающей, что А влечет В или, что то же самое, В следует из А, мы часто будем придавать другую словесную интер- интерпретацию, говоря, что В есть необходимый признак или необходимое условие Л и, в свою очередь, А — достаточное условие или достаточ- достаточный признак В. Таким образом, соотношение А <фф В можно прочитать любым из следующих способов: А необходимо и достаточно для В; А тогда и только тогда, когда В; :'Г. Галилей A564 - 1642) —итальянский ученый, крупнейший естествоиспыта- естествоиспытатель. Его труды легли в основу всех последующих физических представлений о про- пространстве и времени. Отец современной физической науки.
§ 1. ЛОГИЧЕСКАЯ СИМВОЛИКА А, если и только если В; А равносильно В. Итак, запись А ^ В означает, что А влечет В и, одновременно, В влечет А. Употребление союза и в выражении А А В пояснений не требует. Следует, однако, обратить внимание на то, что в выражении А V В союз или неразделительный, т. е. высказывание А У В считается верным, если истинно хотя бы одно из высказываний А, В. Например, пусть х — такое действительное число, что х2 — За;+2 = 0. Тогда можно написать, что имеет место следующее соотношение: (х2 - Зх + 2 = 0) & (х = 1) V (х = 2). 2. Замечания о доказательствах. Типичное математическое утверждение имеет вид А => В, где А — посылка, а В — заключение. Доказательство такого утверждения состоит в построении цепочки А =ф- С\ =4- ... =4- Сп =4- В следствий, каждый элемент которой либо считается аксиомой, либо является уже доказанным утверждением1). В доказательствах мы будем придерживаться классического прави- правила вывода: если А истинно и А =4- В, то В тоже истинно. При доказательстве от противного мы будем использовать так- также принцип исключенного третьего, в силу которого высказывание А V ->А (А или не А) считается истинным независимо от конкрет- конкретного содержания высказывания А. Следовательно, мы одновременно принимаем, что ->(->А) <=> А, т.е. повторное отрицание равносильно исходному высказыванию. 3. Некоторые специальные обозначения. Для удобства чита- читателя и сокращения текста начало и конец доказательства условимся отмечать знаками М и ► соответственно. Условимся также, когда это будет удобно, вводить определения по- посредством специального символа := (равенство по определению), в ко- котором двоеточие ставится со стороны определяемого объекта. Например, запись о /■ ^Запись А=>В=>С будет употребляться как сокращение для (Л=>В) Л
4 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ определяет левую часть посредством правой части, смысл которой предполагается известным. Аналогично вводятся сокращенные обозначения для уже определен- определенных выражений. Например, запись вводит обозначение ст(/;Р, £) для стоящей слева суммы специального вида. 4. Заключительные замечания. Отметим, что мы здесь гово- говорили, по существу, только об обозначениях, не анализируя формализм логических выводов и не касаясь глубоких вопросов истинности, дока- доказуемости, выводимости, составляющих предмет исследования матема- математической логики. Как же строить математический анализ, если мы не имеем форма- формализации логики? Некоторое утешение тут может состоять в том, что мы всегда знаем или, лучше сказать, умеем больше, чем способны в данный момент формализовать. Пояснением смысла последней фразы может служить известная притча о том, что сороконожка даже ходить разучилась, когда ее попросили объяснить, как именно она управляется со всеми своими конечностями. Опыт всех наук убеждает нас в том, что считавшееся ясным или простым и нерасчленяемым вчера может подвергнуться пересмотру или уточнению сегодня. Так было (и, без сомнения, еще будет) и с мно- многими понятиями математического анализа, важнейшие теоремы и ап- аппарат которого были открыты еще в XVII-XVIII веках, но приобрели современный формализованный, однозначно трактуемый и, вероятно, потому общедоступный вид лишь после создания теории пределов и необходимой для нее логически полноценной теории действительных чисел (XIX век). Именно с этого уровня теории действительных чисел мы и начнем в главе II построение всего здания анализа. Как уже отмечалось в предисловии, желающие быстрее ознакомить- ознакомиться с основными понятиями и эффективным аппаратом собственно диф- дифференциального и интегрального исчисления могут начать сразу с главы III, возвращаясь к отдельным местам первых двух глав лишь по мере необходимости.
§ 2. МНОЖЕСТВА И ОПЕРАЦИИ НАД МНОЖЕСТВАМИ 5 Упражнения Будем отмечать истинные высказывания символом 1, а ложные — симво- символом 0. Тогда каждому из высказываний ->А, А А В, А V В, А =$■ В можно сопоставить так называемую таблицу истинности, которая указывает его истинность в зависимости от истинности высказываний А, В. Эти таблицы являются формальным определением логических операций -i, Л, V, =>■. Вот они: А -*А 0 1 1 0 \В А\ 0 1 0 0 0 1 0 1 АЛВ В \в 0 1 0 0 1 1 1 1 \в А\ 0 1 0 1 0 1 1 1 1. Проверьте, все ли в этих таблицах согласуется с вашим представлением о соответствующей логической операции. (Обратите, в частности, внимание на то, что если А ложно, то импликация А => В всегда истинна.) 2. Покажите, что справедливы следующие простые, но очень важные и широко используемые в математических рассуждениях соотношения: a) ->(А Л В) ФФ- ->А V -.£; b) ->(А V В) ФФ- -.А Л -.£; c) (А => В) & (-.В => -.А); d) (i^B)#nAv В; e) -,(А => В) ФФ- А Л -.В. § 2. Множества и элементарные операции над множествами 1. Понятие множества. С конца XIX-начала XX столетия наи- наиболее универсальным языком математики стал язык теории множеств. Это проявилось даже в одном из определений математики как науки, изучающей различные структуры (отношения) на множествах1). ''Бурбаки Н. Архитектура математики. В кн.: Бурбаки Н. Очерки по исто- истории математики. М.: ИЛ, 1963.
6 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ «Под множеством мы понимаем объединение в одно целое опреде- определенных, вполне различимых объектов нашей интуиции или нашей мы- мысли»— так описал понятие «множество» Георг Кантор ', основатель те- теории множеств. Описание Кантора, разумеется, нельзя назвать определением, по- поскольку оно апеллирует к понятиям, быть может, более сложным (во всяком случае, не определенным ранее), чем само понятие множества. Цель этого описания — разъяснить понятие, связав его с другими. Основные предпосылки канторовской (или, как условно говорят, «наивной») теории множеств сводятся к следующему: 1° множество может состоять из любых различимых объектов; 2° множество однозначно определяется набором составляющих его объектов; 3° любое свойство определяет множество объектов, которые этим свойством обладают. Если х — объект, Р — свойство, Р(х)— обозначение того, что х об- обладает свойством Р, то через {х \ Р{х)} обозначают весь класс объ- объектов, обладающих свойством Р. Объекты, составляющие класс или множество, называют элементами класса или множества. Множество, состоящее из элементов х\, ■ ■ ■ ,ж„, обычно обозначают как {xi,... ,хп}. Там, где это не вызывает недоразумения, для сокра- сокращения записи мы позволяем себе обозначать одноэлементное множест- множество {а} просто через а. Слова «класс», «семейство», «совокупность», «набор» в наивной тео- теории множеств употребляют как синонимы термина «множество». Следующие примеры демонстрируют применение этой терминоло- терминологии: множество букв «а» в слове «я»; множество жен Адама; набор из десяти цифр; семейство бобовых; множество песчинок на Земле; совокупность точек плоскости, равноудаленных от двух данных ее точек; ''Г. Кантор A845-1918)—немецкий математик, создатель теории бесконечных множеств и родоначальник теоретико-множественного языка в математике.
§ 2. МНОЖЕСТВА И ОПЕРАЦИИ НАД МНОЖЕСТВАМИ 7 семейство множеств; множество всех множеств. Различие в возможной степени определенности задания множества наводит на мысль, что множество — не такое уж простое и безобидное понятие. И в самом деле, например, понятие множества всех множеств просто противоречиво. •^ Действительно, пусть для множества М запись Р(М) означает, что М не содержит себя в качестве своего элемента. Рассмотрим класс К = {М \ Р(М)} множеств, обладающих свой- свойством Р. Если К — множество, то либо верно, что Р{К), либо верно, что ->Р(К). Однако эта альтернатива для К невозможна. Действительно, Р(К) невозможно, ибо из определения К тогда бы следовало, что К содержит К, т.е. что верно ->Р(К); с другой стороны, -<Р(К) тоже невозможно, поскольку это означает, что К содержит К, а это проти- противоречит определению К как класса тех множеств, которые сами себя не содержат. Следовательно, К — не множество. ► Это классический парадокс Рассела1), один из тех парадоксов, к которым приводит наивное представление о множестве. В современной математической логике понятие множества подвер- подвергается (как мы видим, не без оснований) тщательному анализу. Одна- Однако в такой анализ мы углубляться не станем. Отметим только, что в существующих аксиоматических теориях множество определяется как математический объект, обладающий определенным набором свойств. Описание этих свойств составляет аксиоматику. Ядром аксиомати- аксиоматики теории множеств является постулирование правил, по которым из множеств можно образовывать новые множества. В целом любая из су- существующих аксиоматик такова, что она, с одной стороны, избавляет от известных противоречий наивной теории, а с другой—обеспечива- другой—обеспечивает свободу оперирования с конкретными множествами, возникающими в различных отделах математики, и в первую очередь именно в мате- математическом анализе, понимаемом в широком смысле слова. ''Б. Рассел A872-1970)—английский логик, философ, социолог и общественный деятель.
8 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Ограничившись пока этими замечаниями относительно понятия множества, перейдем к описанию некоторых наиболее часто исполь- используемых в анализе свойств множеств. Желающие подробнее ознакомиться с понятием множества могут просмотреть пункт 2 из § 4 настоящей главы или обратиться к специ- специальной литературе. 2. Отношение включения. Как уже отмечалось, объекты, соста- составляющие множество, принято называть элементами этого множест- множества. Мы будем стремиться обозначать множества прописными буква- буквами латинского алфавита, а элементы множества — соответствующими строчными буквами. Высказывание «х есть элемент множества X» коротко обозначают символом х Е X (или X Э х), а его отрицание — символом х £ X (или X $ х). В записи высказываний о множествах часто используются логиче- логические операторы 3 («существует» или «найдется») и V («любой» или «для любого»), называемые кванторами существования и всеобщности со- соответственно. Например, запись Ух ((х Е А) -ФФ- (х Е В)) означает, что для любого объекта х соотношения х Е An x E В равносильны. Поскольку множе- множество вполне определяется своими элементами, указанное высказывание принято обозначать короткой записью А = В, читаемой «А равно В», обозначающей совпадение множеств Aw. В. Таким образом, два множества равны, когда они состоят из одних и тех же элементов. Отрицание равенства обычно записывают в виде Аф В. Если любой элемент множества А является элементом множества В, то пишут А С В или В Э А и говорят, что множество А является под- подмножеством множества В, или что В содержит А, или что В включает в себя А. В связи с этим отношение А С В между множествами А, В называется отношением включения (рис. 1).
§ 2. МНОЖЕСТВА И ОПЕРАЦИИ НАД МНОЖЕСТВАМИ Итак, {А с В) ~ Ух ({х (хе В)). Если А с В и А ф В, то будем говорить, что включение А С В строгое или что А — собственное подмножество В. Используя приведенные определения, теперь можно заключить, что (А = В) & (А С В) Л {В С А). Рис. 1. Если М — множество, то любое свойство Р выделяет в М подмно- подмножество {хеМ\ Р(х)} тех элементов М, которые обладают этим свойством. Например, очевидно, что М = {х G М | х G М}. С другой стороны, если в качестве Р взять свойство, которым не обла- обладает ни один элемент множества М, например Р(х) := {х ф х), то мы получим множество 0 = {х G М | х ф х}, называемое пустым подмножеством множества М. 3. Простейшие операции над множествами. Пусть А и В — подмножества множества М. Рис. 2. Рис. 3. Рис. 4. Рис. 5.
10 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ a. Объединением множеств А и В называется множество A U В := {х G М | (х G А) V (х G В)}, состоящее из тех и только тех элементов множества М, которые содер- содержатся хотя бы в одном из множеств А, В (рис. 2). b. Пересечением множеств Атх. В называется множество А П В := {х G М | (х е А) Л (ж G В)}, образованное теми и только теми элементами множества М, которые принадлежат одновременно множествам Аи В (рис.3). c. Разностью между множеством А и множеством В называется множество А \ В := {х G М | {х G А) Л (х $ В)}, состоящее из тех элементов множества А, которые не содержатся в множестве В (рис. 4). Разность между множеством М и содержащимся в нем подмноже- подмножеством А обычно называют дополнением А в М и обозначают через См А или С А, когда из контекста ясно, в каком множестве ищется до- дополнение к А (рис.5). Пример. В качестве иллюстрации взаимодействия введенных по- понятий проверим следующие соотношения (так называемые правила де Моргана1^): A) См(АПВ) = СмАиСмВ. B) ^ Докажем, например, первое из этих равенств: (х € СМ(А U В)) =*(х$(Аи В)) =* ((х <£А)Л{х(£ В)) =► =► (х G См А) А(хе См В) ^(ig (См А П СМВ)). Таким образом, установлено, что См(A U В) С (СмА П СмВ). C) С другой стороны, . де Морган A806-1871)—шотландский математик.
§ 2. МНОЖЕСТВА И ОПЕРАЦИИ НАД МНОЖЕСТВАМИ 11 {х е [СмА п См£)) => ((ж е СмА) л (ж => ((ж £ А) Л [х £ В)) =>{х<£{Аи В)) => (х <Е СМ(Л U В)), (СмАпСм5)сСм(^и5). D) Из C) и D) следует A). ► d. Прямое (декартово) произведение множеств. Для любых двух множеств А, В можно образовать новое множество — пару {А, В} = = {В, А}, элементами которого являются множества А и В и только они. Это множество состоит из двух элементов, если А ф В, и из одного элемента, если А = В. Указанное множество называют неупорядоченной парой множеств А, В, в отличие от упорядоченной пары (А, В), в которой элементы А, В наделены дополнительными признаками, выделяющими первый и второй элементы пары {А, В}. Равенство (A,B) = (C,D) упорядоченных пар по определению означает, что А — С и В = D. В частности, если А ф В, то (А, В) ф (В, А). Пусть теперь X и Y — произвольные множества. Множество XxY~{(x,y)\(x£X)A(y£Y)}, образованное всеми упорядоченными парами (х,у), первый член ко- которых есть элемент из X, а второй член—элемент из Y, называется прямым или декартовым произведением множеств X и Y (в таком порядке!). Из определения прямого произведения и сделанных выше замечаний об упорядоченной паре явствует, что, вообще говоря, X х Y ф Y х X. Равенство имеет место, лишь если X = Y. В последнем случае вместо X х X пишут коротко X2. Прямое произведение называют также декартовым произведением в честь Декарта1), который независимо от Ферма2) пришел через систему ''Р. Декарт A596-1650)—выдающийся французский философ, математик и фи- физик, внесший фундаментальный вклад в теорию научного мышления и познания. 2'П. Ферма A601 -1665) —замечательный французский математик, юрист по спе- специальности. Ферма стоял у истоков ряда областей современной математики: анализ, аналитическая геометрия, теория вероятностей, теория чисел.
12 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ координат к аналитическому языку геометрии. Известная всем система декартовых координат в плоскости превращает эту плоскость именно в прямое произведение двух числовых осей. На этом знакомом объекте наглядно проявляется зависимость декартова произведения от порядка сомножителей. Например, упорядоченным парам @,1) и A,0) отвечают различные точки плоскости. В упорядоченной паре z = (х\,Х2), являющейся элементом прямого произведения Z = Х\ х Х% множеств Х\ и Х%, элемент х\ называется первой проекцией пары z и обозначается через ргх z, а элемент х^ — второй проекцией пары z и обозначается через рг2 z. Проекции упорядоченной пары по аналогии с терминологией анали- аналитической геометрии часто называют (первой и второй) координатами пары. Упражнения В задачах 1, 2, 3 через А, В, С обозначены подмножества некоторого множества М. 1. Проверьте соотношения a) (А С С) Л (В С С) <& ((A U В) С С); b) (С С А) Л (С С В) <& (С С (АП В)); c) См(СмА) = А; d) (А С См В) «(ВС См А); e) (АСВ)# (См A D СМВ). 2. Покажите, что a) A U (В U С) = (A U В) U С =: A U В U С; b) АП(ВПС) = (АПВ)ПС=:АПВПС; c) АП (В L)С) = (АПВ) L) (АП С); d) A U (В П С) = (A U В) П (A U С). 3. Проверьте взаимосвязь (двойственность) операций объединения и пере- пересечения: a) См (A UB) = См А П СМВ; b) См (А ПВ) = См A U СМВ. 4. Проиллюстрируйте геометрически декартово произведение a) двух отрезков (прямоугольник); b) двух прямых (плоскость); c) прямой и окружности (цилиндрическая поверхность);
§ 3. ФУНКЦИЯ 13 d) прямой и круга(цилиндр); e) двух окружностей (тор); f) окружности и круга (полноторие). 5. Множество Д = {(х^хг) £ X2 | х\ = хг} назьтается диагональю декар- декартова квадрата X2 множества X. Проиллюстрируйте геометрически диагонали множеств, полученных в пунктах а), Ь), е) задачи 4. 6. Покажите, что а) (X х Y = 0) <S> (X = 0) V (Y = 0), а если X х Y ф 0, то Ъ){АхВсХ xY)&(AcX)A(B CY), c) (X х Y) U (Z х Y) = (X U Z) х Y, d) {X х Y) П (X' х Г') = AП X') х (Y п Г')- Здесь 0 — символ пустого множества, т.е. множества, не содержащего эле- элементов. 7. Сравнив соотношения задачи 3 с соотношениями а), Ь) из упражнения 2 к § 1, установите соответствие между логическими операциями ->, Л, V на высказываниях и операциями С, П, U на множествах. §3. Функция 1. Понятие функции (отображения). Перейдем теперь к опи- описанию фундаментального не только для математики понятия функци- функциональной зависимости. Пусть X и Y — какие-то множества. Говорят, что имеется функция, определенная на X со значениями в Y, если в силу некоторого закона / каждому элементу х е X соот- соответствует элемент у £ У. В этом случае множество X называется областью определения функции; символ х его общего элемента— аргументом функции или не- независимой переменной; соответствующий конкретному значению xq £ £ X аргумента х элемент уо £ Y называют значением функции на эле- элементе Xq или значением функции при значении аргумента х = xq и обозначают через f{xo). При изменении аргумента х £ X значения у = = f(x) £ Y, вообще говоря, меняются в зависимости от значений х. По этой причине величину у = f(x) часто называют зависимой пере- переменной.
14 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Множество f(X) :={yeY\3x((xeX)A(y = f(x)))} всех значений функции, которые она принимает на элементах множе- множества X, будем называть множеством значений или областью значений функции. В зависимости от природы множеств X, У термин «функция» в раз- различных отделах математики имеет ряд полезных синонимов: отобра- отображение, преобразование, морфизм, оператор, функционал. Отображе- Отображение— наиболее распространенный из них, и мы его тоже часто будем употреблять. Для функции (отображения) приняты следующие обозначения: /:Х->У, Х-А-У Когда из контекста ясно, каковы область определения и область значений функции, используют также обозначения х t-> f[x) или у = = f(x), а чаще обозначают функцию вообще одним лишь символом /. Две функции /i, /2 считаются совпадающими или равными, если они имеют одну и ту же область определения X и на любом элементе х £ X значения f\{x), /2B) этих функций совпадают. В этом случае пишут /i = /2. Если А С X, а /: X -> У— некоторая функция, то через f\A или /|д обозначают функцию (р: А —> У, совпадающую с / на множестве А. Точнее, /\а(х) := <р{х), если х £ А. Функция /Ц называется сужением или ограничением функции / на множество А, а функция /: X —> У по отношению к функции у> = /|д: А -> У называется распространением или продолжением функции ^ на множество X. Мы видим, что иногда приходится рассматривать функцию tp: А -> —> У, определенную на подмножестве А некоторого множества X, при- причем область значений <р(А) функции ip тоже может оказаться не совпа- совпадающим с У подмножеством множества У. В связи с этим для обозначе- обозначения любого множества X, содержащего область определения функции, иногда используется термин область отправления функции, а любое множество У, содержащее область значений функции, называют тогда областью ее прибытия. Итак, задание функции (отображения) предполагает указание трой- тройки (X,/, У), где
§ 3. ФУНКЦИЯ 15 X — отображаемое множество, или область определения функции; Y— множество, в которое идет отображение, или область прибытия функции; /— закон, по которому каждому элементу х G X сопоста- сопоставляется определенный элемент у G Y. Наблюдаемая здесь несимметричность между X и Y отражает то, что отображение идет именно из X в Y. Рассмотрим некоторые примеры функций. Пример 1. Формулы / = 2тгг и V — ^тгг3 устанавливают функци- ональную зависимость длины окружности / и объема шара V от радиу- радиуса г. По смыслу каждая из этих формул задает свою функцию /: К+ —> —> К+) определенную на множестве К_|_ положительных действительных чисел со значениями в том же множестве ИЦ.. Пример 2. Пусть X—множество инерциальных систем коорди- координат, а с: X —> Ш. — функция, состоящая в том, что каждой инерциаль- ной системе координат х G X сопоставляется измеренное относительно нее значение с(х) скорости света в вакууме. Функция с: X —> Ш. посто- постоянна, т.е. при любом х G X она имеет одно и то же значение с (это фундаментальный экспериментальный факт). Пример 3. Отображение G: М2 —> М2 (прямого произведения R2=MxlR = ]RtX]Rr оси времени Щ и пространственной оси l^) на себя же, задаваемое формулами t' = t, есть классическое преобразование Галилея для перехода от одной инер- циальной системы координат (x,t) к другой — (x',t'), движущейся от- относительно первой со скоростью v. Той же цели служит отображение L: М —>■ М , задаваемое соотно- соотношениями х — vt
16 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Это — известное (одномерное) преобразование ЛоренцаУ*, играющее фундаментальную роль в специальной теории относительности; с — скорость света. Пример 4. Проектирование prj: Х\ х Хг —> Х\, задаваемое соот- соответствием Х1ХХ2Э (ж1,Ж2) '—^ х\ € -X"i, очевидно, является функцией. Аналогичным образом определяется вторая проекция рг2: Х\ х Хг -> Пример 5. Пусть V(M)—множество всех подмножеств множе- множества М. Каждому множеству А € V{M) поставим в соответствие мно- множество См А € V(M), т. е. дополнение к А в М. Тогда получим отобра- отображение См '■ V{M) —> V{M) множества V(M) в себя. Пример 6. Пусть Е С М. Вещественнозначную функцию хе '■ М -> М, определенную на множестве М условиями (хе(х) = 1, если х € G Е) Л (хе{х) = 0, если х G СмЩ-, называют характеристической функцией множества Е. Пример 7. Пусть M(X;Y)—множество отображений множест- множества X в множество Y, a xq—фиксированный элемент из X. Любой функции / G M(X;Y) поставим в соответствие ее значение /(жо) € G У на элементе xq. Этим определяется функция F: M(X; Y) —> Y. В частности, если Y — К, т. е. если Y есть множество действительных чисел, то каждой функции /: X -> М функция F: М(Х;Ш) —> R ста- ставит в соответствие число F(f) = f(xo). Таким образом, F есть функ- функция, определенная на функциях. Для удобства такие функции называют функционалами. Пример 8. Пусть Г — множество кривых, лежащих на поверхно- поверхности (например, земной) и соединяющих две ее фиксированные точки. Каждой кривой -у G Г можно сопоставить ее длину. Тогда мы получим функцию F: Г —> М, которую часто приходится рассматривать с целью отыскания кратчайшей линии или, как говорят, геодезической линии между данными точками на поверхности. Пример 9. Рассмотрим множество М(Щ Ж) всех вещественно- значных функций, определенных на всей числовой оси R. Фиксировав ''Г.А.Лоренц A853-1928)—голландский физик. Указанные преобразования бы- были найдены им в 1904 г. и существенно использовались в сформулированной в 1905 г. Эйнштейном специальной теории относительности.
§3. ФУНКЦИЯ 17 число a £ Ш, каждой функции / 6 М(Щ Ш) поставим в соответствие функцию fa £ M(M;IR), связанную с ней соотношением fa(x) = (х + а). Функцию /а(х) обычно называют сдвигом на а функции /(ж). Возника- Возникающее при этом отображение А: М(Ш; Ш.) —)■ М(Щ Ш) называется опера- оператором сдвига. Итак, оператор А определен на функциях и значениями его также являются функции: fa = A(f). Рассмотренный пример мог бы показаться искусственным, если бы мы на каждом шагу не видели реальные операторы. Так, любой радио- приемник есть оператор / i—> /, преобразующий электромагнитные сигналы / в звуковые /; любой из наших органов чувств является опе- оператором (преобразователем) со своими областью определения и обла- областью значений. Пример 10. Положение частицы в пространстве определяется упорядоченной тройкой чисел (x,y,z), называемой ее координатами в пространстве. Множество всех таких упорядоченных троек можно се- себе мыслить как прямое произведение К х Е х Е = Е3 трех числовых осейМ. При движении в каждый момент времени t частица находится в не- некоторой точке пространства М3 с координатами (x(t), y(t), z{t)). Таким образом, движение частицы можно интерпретировать как отображение 7: Е -> I3, где R — ось времени, а М3 —трехмерное пространство. Если система состоит из п частиц, то ее конфигурация задается положением каждой из частиц, т.е. упорядоченным набором {x\,y\,Z\\ %2, У2, %2] ■ ■.; хп, уп, zn) из Зп чисел. Множество всех таких наборов на- называется конфигурационным пространством системы п частиц. Сле- Следовательно, конфигурационное пространство системы п частиц можно интерпретировать как прямое произведение М3 х М3 х ... х К3 = М3" п экземпляров пространства М3. Движению системы из п частиц отвечает отображение j: Ш —> М3" оси времени в конфигурационное пространство системы. Пример 11. Потенциальная энергия U механической системы связана с взаимным расположением частиц системы, т.е. определяет- определяется конфигурацией, которую имеет система. Пусть Q — множество ре- реально возможных конфигураций системы. Это некоторое подмноже- подмножество конфигурационного пространства системы. Каждому положению q 6 Q отвечает некоторое значение U(q) потенциальной энергии систе- 2-4573
18 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ мы. Таким образом, потенциальная энергия есть функция U: Q —)■ Ш, определенная на подмножестве Q конфигурационного пространства со значениями в области Ш действительных чисел. Пример 12. Кинетическая энергия К системы п материальных частиц зависит от их скоростей. Полная механическая энергия систе- системы Е = К + U, т. е. сумма кинетической и потенциальной энергий, зависит, таким образом, как от конфигурации q системы, так и от набора v скоростей ее частиц. Как и конфигурация q частиц в прост- пространстве, набор v, состоящий из п трехмерных векторов, может быть задан упорядоченным набором из Зп чисел. Упорядоченные пары (q, v), отвечающие состояниям нашей системы, образуют подмножество Ф в прямом произведении M3n x Ш3п = К6", называемом фазовым прост- пространством системы п частиц (в отличие от конфигурационного про- пространства К3"). Полная энергия системы является, таким образом, функцией Е: Ф —> Ш, определенной на подмножестве Ф фазового пространст- пространства IR6" и принимающей значения в области Ш. действительных чисел. В частности, если система замкнута, т. е. на нее не действуют внеш- внешние силы, то по закону сохранения энергии в любой точке множест- множества Ф состояний системы функция Е будет иметь одно и то же значение Ео е! 2. Простейшая классификация отображений. Когда функ- функцию /: X -> Y называют отображением, значение f(x) 6 Y, кото- которое она принимает на элементе х € X, обычно называют образом эле- элемента х. Образом множества Ас X при отображении f:X—*Y называют множество f(A) :={y€Y\3x((x(EA)A(y = /(*)))} тех элементов Y, которые являются образами элементов множества А. Множество f-1(B):={x€X\f(x)€B} тех элементов X, образы которых содержатся в В, называют прообра- прообразом (или полным прообразом) множества В C.Y (рис.6). Про отображение /: X -> Y говорят, что оно сюръективно (или есть отображение X на Y), если f{X) = Y;
§3. ФУНКЦИЯ 19 РИС. 6. инъективно (или есть вложение, инъекция), если для любых эле- элементов х\, Х2 множества X т. е. различные элементы имеют различные образы; биективно (или взаимно однозначно), если оно сюръективно и инъ- инъективно одновременно. Если отображение f:X—>Y биективно, т. е. является взаимно од- однозначным соответствием между элементами множеств X и Y, то ес- естественно возникает отображение которое определяется следующим образом: если f(x) = у, то f~1{y) = = х, т.е. элементу у G Y ставится в соответствие тот элемент i£l, образом которого при отображении / является у. В силу сюръектив- ности / такой элемент х Е X найдется, а ввиду инъективности / он единственный. Таким образом, отображение /-1 определено коррект- корректно. Это отображение называют обратным по отношению к исходному отображению /. Из построения обратного отображения видно, что f~l: Y -^ X само является биективным и что обратное к нему отображение (Z) : X -> Y совпадает с /: X -> Y. Таким образом, свойство двух отображений быть обратными явля- является взаимным: если /-1—обратное для /, то, в свою очередь, / — обратное для /-1.
20 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Заметим, что символ f~1(B) прообраза множества В (ZY ассоции- ассоциируется с символом Z" обратной функции, однако следует иметь в виду, что прообраз множества определен для любого отображения f:X—t —> Y, даже если оно не является биективным и, следовательно, не имеет обратного. 3. Композиция функций и взаимно обратные отображения. Богатым источником новых функций, с одной стороны, и способом расчленения сложных функций на более простые — с другой, является операция композиции отображений. Если отображения f:X-+Yng: Y—*Z таковы, что одно из них (в нашем случае д) определено на множестве значений другого (/), то можно построить новое отображение gof: X -^Z, значения которого на элементах множества X определяются формулой (g°f)(x):=g(f(x)). Построенное составное отображение д ° f называют композицией отображения / и отображения д (в таком порядке!). Рисунок 7 иллюстрирует конструкцию композиции отображений /и д. Рис. 7. С композицией отображений вы уже неоднократно встречались как в геометрии, рассматривая композицию движений плоскости или про- пространства, так и в алгебре при исследовании «сложных» функций, по- полученных композицией простейших элементарных функций.
§3. ФУНКЦИЯ 21 Операцию композиции иногда приходится проводить несколько раз подряд, и в этой связи полезно отметить, что она ассоциативна, т. е. h о (д о /) = {h о д) о /. < Действительно, ho (до /)(Я) = Ц(до /)(*)) = h(g(f(x))) = ) = ((hog)of)(x). ► Это обстоятельство, как и в случае сложения или умножения не- нескольких чисел, позволяет опускать скобки, предписывающие порядок спаривания. Если в композиции /п ° • • • ° /l все члены одинаковы и равны /, то ее обозначают коротко /п. Хорошо известно, например, что корень квадратный из положитель- положительного числа а можно вычислить последовательными приближениями по формуле _ 1 / а \ Хп+1 — ~ I Хп + — I , начиная с любого начального приближения xq > 0. Это не что иное, как последовательное вычисление fn{xo), где f(x) = ~ (х + §)• Такая процедура, когда вычисленное на предыдущем шаге значение функции наследующем шаге становится ее аргументом, называется итерацион- итерационным процессом. Итерационные процессы широко используются в мате- математике. Отметим также, что даже в том случае, когда обе композиции до f и / о д определены, вообще говоря, д°1Ф!°д- Действительно, возьмем, например, двухэлементное множество {а, Ь} и отображения /: {а, Ь} —»■ а, д: {а,Ь} —> Ь. Тогда, очевидно, д о /: {а, 6} —> Ь, в то время как fog: {a, b} —> а. Отображение f:X-^X, сопоставляющее каждому элементу мно- множества X его самого, т. е. х i—> х, будем обозначать через ех и назы- называть тождественным отображением множества X. Лемма. (go f = ex) =>• [д сюръективно) А (/ инъективно).
22 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Ч Действительно, если f: X —> У, д: Y —>Хидо/ = ех'Х —> X, то X = ех(Х) = (д о /)(Х) = g(f(X)) С g(Y) и, значит, д сюръективно. Далее, если Х\ € X и Х2 € X, то ф (д Ф ЯНЫ) => (f(xi) ф f(x2)), следовательно, / инъективно. ► Через операцию композиции отображений можно описать взаимно обратные отображения. Утверждение. Отображения f:X-^Y,g:Y—^X являются биективными и взаимно обратными в том и только в том случае, когда g ° f = ех и f о g = еу. < В силу леммы одновременное выполнение условий g о / = ех и / о g — еу гарантирует сюръективность и инъективность, т. е. биек- тивность каждого из отображений /, д. Эти же условия показывают, что у = f(x) в том и только в том случае, когда х = д(у). ► Выше мы исходили из явного построения обратного отображения. Из доказанного утверждения следует, что мы могли бы дать менее на- наглядное, но зато более симметричное определение взаимно обратных отображений как таких, которые удовлетворяют двум условиям: gof = = ех и / о д = еу (см. в этой связи задачу 6 в конце параграфа). 4. Функция как отношение. График функции. В заключение вернемся вновь к самому понятию функции. Отметим, что оно претер- претерпело длительную и довольно сложную эволюцию. Термин «функция» впервые появился в период 1673-1692 г. у Г. Лей- Лейбница (правда, в некотором более узком смысле). В смысле, близком к современному, этот термин установился к 1698 г. в переписке Иоганна Бернулли1) с Лейбницем. ^И. Бернулли A667-1748) —один из ранних представителей знаменитого семей- семейства швейцарских ученых Бернулли; аналитик, геометр, механик. Стоял у истоков вариационного исчисления. Дал первое систематическое изложение дифференциаль- дифференциального и интегрального исчисления.
§3. ФУНКЦИЯ 23 Описание функции, почти совпадающее с приведенным в начале параграфа, встречается уже у Эйлера (середина XVIII столетия). К на- началу XIX века оно появляется уже в учебниках математики С. Лакруа,1) переведенных на русский язык. Активным сторонником такого пони- понимания функции был Н. И. Лобачевский2^. Более того, Н. И. Лобачевский указал, что «обширный взгляд теории допускает существование зави- зависимости только в том смысле, чтобы числа одни с другими в связи понимать как бы данными вместе^. Это и есть идея точного опреде- определения понятия функции, которое мы теперь собираемся изложить. Приведенное в начале параграфа описание понятия функции пред- представляется весьма динамичным и отражающим суть дела. Однако с точки зрения современных канонов оно не может быть названо опреде- определением, ибо использует эквивалентное функции понятие соответствия. Для сведения читателя мы укажем здесь, каким образом дается опре- определение функции на языке теории множеств. (Интересно, что понятие отношения, к которому мы сейчас обратимся, и у Лейбница предше- предшествовало понятию функции.) а. Отношение. Отношением 72. называют любое множество упо- упорядоченных пар (х, у). Множество X первых элементов упорядоченных пар, составляю- составляющих К, называют областью определения отношения 72., а множество Y вторых элементов этих пар — областью значений отношения 72.. Таким образом, отношение 72 можно интерпретировать как под- подмножество 72. прямого произведения X х Y. Если X С X' и Y С У, то, разумеется, IZcXxYcX'x У, поэтому одно и то же отношение может задаваться как подмножество различных множеств. Любое множество, содержащее область определения отношения, на- называют областью отправления этого отношения. Множество, содер- содержащее область значений отношения, называют областью прибытия от- отношения. ^С. Ф. Лакруа A765 -1843) — французский математик и педагог (профессор Нор- Нормальной и Политехнической школ, член Парижской академии наук). 2'Н. И. Лобачевский A792-1856)—великий русский ученый, которому, наряду с великим немецким естествоиспытателем К.Ф.Гауссом A777-1855) и выдающимся венгерским математиком Я. Бойяи A802 -1860), принадлежит честь открытия неев- неевклидовой геометрии, носящей его имя. ^Лобачевский Н. И. Полное собр. соч. Т. 5. М.-Л.: Гостехиздат, 1951. С. 44.
24 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Вместо того чтобы писать {х,у) £ "R, часто пишут x"Ry и говорят, что х связано с у отношением 72.. Если 72 С X2, то говорят, что отношение 72. задано на X. Рассмотрим несколько примеров. Пример 13. Диагональ А = {(а,Ь)еХ2\а = Ь} есть подмножество X2, задающее отношение равенства между элемен- элементами множества X. Действительно, a A b означает, что {a,b) £ Д, т.е. а = Ь. Пример 14. Пусть X — множество прямых в плоскости. Две прямые a £ X и b £ X будем считать находящимися в отно- отношении 72. и будем писать а 72. Ь, если прямая b параллельна прямой а. Ясно, что тем самым в X2 выделяется множество 72. пар (а, Ь) таких, что а 72. Ь. Из курса геометрии известно, что отношение параллельности между прямыми обладает следующими свойствами: а 72. а (рефлексивность); а 72 b => b 72 а (симметричность); (а 72. Ь) А (Ь 72. с) => а 72. с (транзитивность). Любое отношение 72., обладающее перечисленными тремя свойства- свойствами, т.е. рефлексивное1^, симметричное и транзитивное, принято назы- называть отношением эквивалентности. Отношение эквивалентности обо- обозначается специальным символом ~, который в этом случае ставится вместо буквы 72, обозначающей отношение. Итак, в случае отношения эквивалентности будем писать а ~ b вместо а 72. b и говорить, что а эквивалентно Ь. Пример 15. Пусть М — некоторое множество, a X = V{M) — со- совокупность всех его подмножеств. Для двух произвольных элементов а и b множества X = V(M), т.е. для двух подмножеств а и b мно- множества М, всегда выполнена одна из следующих трех возможностей: а содержится в 6; b содержится в а; а не является подмножеством b и b не является подмножеством а. ''Полезно для полноты отметить, что отношение TZ называется рефлексивным, если его область определения и область значений совпадают и для любого элемента а из области определения отношения 1Z выполнено aTZa.
§3. ФУНКЦИЯ 25 Рассмотрим в качестве отношения Л в X2 отношение включения для подмножеств X, т. е. положим по определению аПЬ:= (а С Ь). Это отношение, очевидно, обладает следующими свойствами: а % а (рефлексивность); (allЬ) Л (Ы1 с) => аИс (транзитивность); (а ЦЬ) Л (Ь Л а) => а А 6, т. е. а = Ь (антисимметричность). Отношение между парами элементов некоторого множества X, об- обладающее указанными тремя свойствами, принято называть отноше- отношением частичного порядка на множестве X. Для отношения частичного порядка вместо а И Ь часто пишут а ^ b и говорят, что Ь следует за а. Если кроме отмеченных двух свойств, определяющих отношение ча- частичного порядка, выполнено условие, что Va \/Ь((аПЬ) V (ЬКа)), т. е. любые два элемента множества X сравнимы, то отношение Л на- называется отношением порядка, а множество X с определенным на нем отношением порядка называется линейно упорядоченным. Происхождение этого термина связано с наглядным образом число- числовой прямой R, на которой действует отношение а ^ Ь между любой парой вещественных чисел. Ь. Функция и график функции. Отношение Л называется функ- функциональным, если (хПУ1)Л (хПУ2)^(у1 =!&)• Функциональное отношение называют функцией. В частности, если X и Y — два не обязательно различных множест- множества, то определенное на X отношение 71 С X х Y между элементами х из X и у из Y функционально, если для любого х € X существует и при- притом единственный элемент у € Y, находящийся с а; в рассматриваемом отношении, т. е. такой, для которого xTly. Такое функциональное отношение И С X xY vi есть отображение из X в Y, или функция из X в Y.
26 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Функции мы чаще всего будем обозначать символом /. Если / — функция, то вместо х f у мы по-прежнему будем писать у = f(x) или х i—> у, называя у = f(x) значением функции / на элементе х или образом элемента х при отображении /. Сопоставление по «закону» / элементу х € X «соответствующего» элемента у € Y, о чем говорилось в исходном описании понятия функ- функции, как видим, состоит в том, что для каждого х € X указывается тот единственный элемент у &Y, что х f у, т.е. (х,у) € / С X х Y. Графиком функции f:X-*Y, понимаемой в смысле исходного опи- описания, называют подмножество Г прямого произведения X х Y, элемен- элементы которого имеют вид (x,f(x)). Итак, F:={(x,y)GXxY\y = f(x)}. В новом описании понятия функции, когда мы ее задаем как под- подмножество f С X xY, конечно, уже нет разницы между функцией и ее графиком. Мы указали на принципиальную возможность формального теоре- теоретико-множественного определения функции, сводящуюся по существу к отождествлению функции и ее графика. Однако мы не собираем- собираемся в дальнейшем ограничиваться только такой формой задания функ- функции. Функциональное отношение иногда удобно задать в аналитиче- аналитической форме, иногда таблицей значений, иногда словесным описанием процесса (алгоритма), позволяющего по данному х € X находить соот- соответствующий элемент у е Y. При каждом таком способе задания функ- функции имеет смысл вопрос о ее задании с помощью графика, что форму- формулируют так: построить график функции. Задание числовых функций хорошим графическим изображением часто бывает полезно тем, что делает наглядным основные качественные особенности функциональ- функциональной зависимости. Для расчетов графики тоже можно использовать (но- (номограммы), но, как правило, в тех случаях, когда расчет не требует вы- высокой точности. Для точных расчетов используют табличное задание функции, а чаще — алгоритмическое, реализуемое в вычислительных машинах. Упражнения 1. Композиция 7^2 °72i отношений TZ\, TZ2 определяется следующим обра- образом: ft2ofti ~{{x,z) \3y (хП1у)Л(уП2г)}.
§ 3. ФУНКЦИЯ 27 В частности, если Их С X х У и И2 С У х Z, то Я = П2 ° И\ CXxZ, причем x1lz:=3y ((yeY) A(xHly)A(y1l2z)). a) Пусть Дх — диагональ множества X2, а Ду — диагональ множества Y2. Покажите, что если отношения TZi С X х Y и 72.2 С У х X таковы, что G^2 о T^i = Дх) Л G^i о 7^2 = Ду), то оба они функциональны и задают взаимно обратные отображения множеств X, Y. b) Пусть 1Z С X2. Покажите, что условие транзитивности отношения 1Z равносильно тому, что 7£ о К С К. c) Отношение К' С У х I называется транспонированным отношением П С X х У, если (у 7г' я) <£> (а; 7г у). Покажите, что антисимметричность отношения К С X2 равносильна усло- условию П П W С Ах ■ d) Проверьте, что любые два элемента множества X связаны (в том или ином порядке) отношением TZ С X2, если и только если TZ U W = X2. 2. Пусть /: X -> У — отображение. Прообраз f~1(y) С -X" элемента у € € У называется слоеяс над у. a) Укажите слои для отображений ргг: Xi х Х2 -> Xi, pr2: Xi x I2 -> 12- b) Элемент х\ Е X будем считать связанным с элементом х2 € X отноше- отношением 11 С X2 и писать zi 7£ а;2, если /(zi) = f(x2), т. е. если £i и х2 лежат в одном слое. Проверьте, что 1Z есть отношение эквивалентности. c) Покажите, что слои отображения /: X —> У не пересекаются, а объеди- объединением слоев является все множество X. d) Проверьте, что любое отношение эквивалентности между элементами множества позволяет представить это множество в виде объединения непере- непересекающихся классов эквивалентных элементов. 3. Пусть /: X —> У — отображение из X в У. Покажите, что если А и В—подмножества X, то а) (АСВ)^ (f(A) С f(B)) ^(ic В), c)f(AnB)cf(A)nf(B), d)f(AUB) = f(A)Uf(B); если А' и В' — подмножества У, то если YD A' D В', то
28 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ i)f-l(CYA') = Cxf-1(A'); для любого множества А С X и любого множества В' С Y i)f-4f(A))DA, к) /(Г1 (В1)) С В'. 4. Покажите, что отображение f:X-*Y a) сюръективно, если и только если для любого множества В' С Y спра- справедливо /(/-1 (Б')) =5'; b) биективно, если и только если для любого множества А С X и любого множества В'СУ справедливо 5. Проверьте эквивалентность следующих утверждений относительно ото- отображения /: X —> Y: a) / инъективно; b) f~1(f(A)) = А для любого множества А С X; c) /(А ПВ) = /(А) П f(B) для любой пары А, В подмножеств X; d) /(Л) П /(Б) = 0<£>АпБ = 0; e) /(А \ Б) = /(А) \ /(Б), если X D A D Б. 6. а) Если отображения f:X—tYng:Y—tX таковы, что до/ = ех, где ех—тождественное отображение множества X, то д называется левым обратным отображением для /, а / — правы-м обратным для </• Покажите, что, в отличие от единственного обратного отображения, может существовать много односторонних обратных отображений. Рассмотрите, например, отображения f: X —> Y и g:Y —> X, где X — одноэлементное, a Y — двухэлементное множества, или отображения последо- последовательностей (xx)\^{axx) b) Пусть f: X -t Y и д: Y -t Z — биективные отображения. Покажите, что отображение д о /: X -> Z биективно и что (д о /)~* = /-1 о д~1. c) Покажите, что для любых отображений f: X —> Y, g: Y —> Z и любого множества С С Z справедливо равенство (gof)-\C)=f-1(g-1(C)). d) Проверьте, что отображение F:XxY->YxX, задаваемое соответ- соответствием (х, у) i-> (у,х), биективно. Опишите взаимосвязь графиков взаимно обратных отображений /:Х->Уи j~x: Y -> X.
§ 4. НЕКОТОРЫЕ ДОПОЛНЕНИЯ 29 7. а) Покажите, что при любом отображении /: X -> Y отображение F: X -> X xY, определяемое соответствием х i—> (x,f(x)), является инъек- тивным. Ь) Пусть частица движется равномерно по окружности Y; пусть X — ось времени и х \—> у— соответствие между моментом времени х € X и поло- положением у = f(x) G Y частицы. Изобразите график функции /: X -> У в XxY. 8. а) Для каждого из разобранных в § 3 примеров 1-12 выясните, является ли указанное в нем отображение сюръективным, инъективным, биективным или оно не принадлежит ни одному из указанных классов. b) Закон Ома / = V/R связывает силу тока / в проводнике с напряже- напряжением V на концах проводника и сопротивлением R проводника. Укажите, отображение О: X —> Y каких множеств соответствует закону Ома. Под- Подмножеством какого множества является отношение, отвечающее закону Ома? c) Найдите преобразования С?, L~1, обратные к преобразованиям Гали- Галилея и Лоренца. 9. а) Множество S С X называется устойчивым относительно отображе- отображения /: X —> X, если f(S) С 5. Опишите множества, устойчивые относительно сдвига плоскости на данный лежащий в ней вектор. b) Множество I С X называется инвариантным относительно отображе- отображения /: X —> X, если /(/) = /. Опишите множества, инвариантные относи- относительно поворота плоскости вокруг фиксированной точки. c) Точка р £ X называется неподвижной точкой отображения / : X -> X, если /(р) = р. Проверьте, что любая композиция сдвига, вращения и гомотетии плоскости имеет неподвижную точку, если коэффициент гомоте- гомотетии меньше единицы. d) Считая преобразования Галилея и преобразования Лоренца отображе- отображениями плоскости на себя, при которых точка с координатами (х, t) переходит в точку с координатами (x',t'), найдите инвариантные множества этих пре- преобразований. 10. Рассмотрим установившийся поток жидкости (т. е. скорость в каждой точке потока не меняется со временем). За время t частица, находящаяся в точке х потока, переместится в некоторую новую точку ft(x) пространст- пространства. Возникающее отображение х н-> ft(x) точек пространства, занимаемого потоком, зависит от времени t и называется преобразованием за время t. По- Покажите, что ft2 о ftl = ftl о /t2 = fh+t2 и ft о f_t = /о = ех. § 4. Некоторые дополнения 1. Мощность множества (кардинальные числа). Говорят, что множество X равномощно множеству Y, если существует биективное отображение X на У, т. е. каждому элементу х € X сопоставляется элемент у 6 Y, причем различным элементам множества X отвечают
30 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ различные элементы множества Y и каждый элемент у € Y сопоставлен некоторому элементу множества X. Описательно говоря, каждый элемент х € X сидит на своем месте у &Y, все элементы X сидят и свободных мест у € Y нет. Ясно, что введенное отношение X1ZY является отношением экви- эквивалентности, поэтому мы будем, как и договаривались, писать в этом случае X ~ Y вместо X Л Y. Отношение равномощности разбивает совокупность всех множеств на классы эквивалентных между собой множеств. Множества одного класса эквивалентности имеют одинаковое количество элементов (рав- номощны), а разных — разное. Класс, которому принадлежит множество X, называется мощно- мощностью множества X, а также кардиналом или кардинальным числом множества X и обозначается символом cardX. Если X ~ Y, то пишут cardX = card У. Смысл этой конструкции в том, что она позволяет сравнивать коли- количества элементов множеств, не прибегая к промежуточному счету, т. е. к измерению количества путем сравнения с натуральным рядом чисел N = {1,2,3,... }. Последнее, как мы вскоре увидим, иногда принципи- принципиально невозможно. Говорят, что кардинальное число множества X не больше карди- кардинального числа множества Y, и пишут cardX ^ card У, если X равно- мощно некоторому подмножеству множества Y. Итак, (cardX < card У) := CZ С Y | cardX = cardZ). Если X С Y, то ясно, что cardX ^ card У. Однако, оказывается, соотношение X С Y не мешает неравенству card У ^ cardX, даже если X есть собственное подмножество Y. Например, соответствие х \-ь yZT~Г есть биективное отображение промежутка — 1 < х < 1 числовой оси R на всю эту ось. Возможность для множества быть равномощным своей части явля- является характерным признаком бесконечных множеств, который Деде- кинд1) даже предложил считать определением бесконечного множест- 1^Р. Дедекинд A831 -1916) —немецкий математик-алгебраист, принявший актив- активное участие в развитии теории действительного числа. Впервые предложил аксио- аксиоматику множества натуральных чисел, называемую обычно аксиоматикой Пеано — по имени Дж. Пеано A858-1932), итальянского математика, сформулировавшего ее несколько позже.
§ 4. НЕКОТОРЫЕ ДОПОЛНЕНИЯ 31 ва. Таким образом, множество называется конечным (по Дедекинду), если оно не равномощно никакому своему собственному подмножеству; в противном случае оно называется бесконечным. Подобно тому, как отношение неравенства упорядочивает действи- действительные числа на числовой прямой, введенное отношение неравенства упорядочивает мощности или кардинальные числа множеств. А именно, можно доказать, что справедливы следующие свойства построенного отношения: 1° (cardX < card Г) Л (card У < cardZ) =»■ (cardX < cardZ) (оче- (очевидно); 2° (cardX < card Г) Л (card Г < cardX) =»■ (cardX = card Г) (тео- (теорема Шредера-Бернштейна1)); 3° VX VT (cardX < card Г) V (cardГ < cardX) (теорема Кантора). Таким образом, класс кардинальных чисел оказывается линейно упорядоченным. Говорят, что мощность множества X меньше мощности множест- множества У, и пишут cardX < card У, если cardX ^ card У и в то же вре- время cardX ф card У. Итак, (cardX < card У) := (cardX < card У) Л Пусть, как и прежде, 0 — знак пустого множества, a V(X) — символ множества всех подмножеств множества X. Имеет место следующая открытая Кантором Теорема, card X < card V{X). « Для пустого множества 0 утверждение очевидно, поэтому в даль- дальнейшем можно считать, что X ф 0. Поскольку V{X) содержит все одноэлементные подмножества X, cardX ^ cardP(X). Для доказательства теоремы теперь достаточно установить, что cardX ф cardP(X), если X ф 0. Пусть, вопреки утверждению, существует биективное отображение /: X ->• 'Р(Х). Рассмотрим множество А = {х € X | х £ f(x)} тех элементов х £ X, которые не содержатся в сопоставленном им множе- множестве f(x) € V(X). Поскольку А б V(X), то найдется элемент а £ X такой, что /(а) = А. Для элемента а € X невозможно ни соотноше- 1}Ф. Бернштейн A878-1956)—немецкий математик, ученик Г. Кантора; Э. Шрё- дер A841-1902)—немецкий математик.
32 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ ние а € А (по определению А), ни соотношение а £ А (опять-таки по определению А). Мы вступаем в противоречие с законом исключенного третьего. ► Эта теорема, в частности, показывает, что если бесконечные мно- множества существуют, то и «бесконечности» бывают разные. 2. Об аксиоматике теории множеств. Цель настоящего пункта — дать интересующемуся читателю представление о системе аксиом, описываю- описывающих свойства математического объекта, называемого множеством, и проде- продемонстрировать простейшие следствия этих аксиом. 1° Аксиома объемности. Множества А и В равны тогда и только тогда, когда они имеют одни и те же элементы. Это означает, что мы отвлекаемся от всех прочих свойств объекта «мно- «множество», кроме свойства иметь данные элементы. На практике это означает, что если мы желаем установить, что А = В, то мы должны проверить, что \/х ((х еА)*>(хе в)). 2° Аксиома выделения. Любому множеству А и свойству Р отве- отвечает множество В, элементы которого суть те и только те элементы множества А, которые обладают свойством Р. Короче, утверждается, что если А — множество, то и В = {х £ А Р(х)} — тоже множество. Эта аксиома очень часто используется в математических конструкциях, когда мы выделяем из множеств подмножества, состоящие из элементов, обла- обладающих тем или иным свойством. Например, из аксиомы выделения следует, что существует пустое подмно- подмножество 0х — {х € X | х ф х} в любом множестве X, а с учетом аксиомы объемности заключаем, что для любых множеств X и Y выполнено 0х = 0у, т.е. пустое множество единственно. Его обозначают символом 0. Из аксиомы выделения следует также, что если А и В — множества, то А\В = {х £ А\ х £ В} —тоже множество. В частности, если М — множество и А — его подмножество, то См А — тоже множество. 3° Аксиома объединения. Для любого множества М множеств су- существует множество [JM, называемое объединением множества М, со- состоящее из тех и только тех элементов, которые содержатся в элементах множества М. Если вместо слов «множество множеств» сказать «семейство множеств», то аксиома объединения приобретает несколько более привычное звучание: существует множество, состоящее из элементов множеств семейства. Таким образом, объединение множества есть множество, причем х £ [JM ■&■ ЗХ {{X € М) Л {х € X)).
§4. НЕКОТОРЫЕ ДОПОЛНЕНИЯ 33 Аксиома объединения с учетом аксиомы выделения позволяет определить пересечение множества М (семейства множеств) как множество f|M := {х е UМ | VX{{X е М) =► (я € X))}. 4° Аксиома пары. Для любых множеств X и Y существует множе- множество Z такое, что X и Y являются его единственными элементами. Множество Z обозначается через {X, Y} и называется неупорядоченной парой множеств X и Y. Множество Z состоит из одного элемента, если X = Y. Как мы уже отмечали, упорядоченная пара (X, Y) множеств отличается от неупорядоченной наличием какого-либо признака у одного из множеств пары. Например, (X,Y) := {{X,X},{X,Y}}. Итак, неупорядоченная пара позволяет ввести упорядоченную пару, а упо- упорядоченная пара позволяет ввести прямое произведение множеств, если вос- воспользоваться аксиомой выделения и следующей важной аксиомой. 5° Аксиома множества подмножеств. Для любого множества X существует множество V(X), состоящее из тех и только тех элементов, которые являются подмножествами множества X. Короче говоря, существует множество всех подмножеств данного множе- множества. Теперь можно проверить, что упорядоченные пары (х,у), где х € X, а у £ Y, действительно образуют множество X х Y := {р G V(V(X) U Р(У)) \р=(х,у)Л(хеХ)Л(уе Y)}. Аксиомы 1° - 5° ограничивают возможность формирования новых мно- множеств. Так, в множестве V{X) по теореме Кантора (о том, что cardX < < card'P(X)) имеется элемент, не принадлежащий X, поэтому «множества* всех множеств не существует. А ведь именно на этом «множестве» держится парадокс Рассела. Для того чтобы сформулировать следующую аксиому, введем понятие по- последователя Х+ множества X. Положим по определению Х+ = X U {X}. Короче, к X добавлено одноэлементное множество {X}. Далее, множество назовем индуктивным, если оно содержит в качестве элемента пустое множество и последователь любого своего элемента. 6° Аксиома бесконечности.Индуктивные множества существуют. Аксиома бесконечности позволяет с учетом аксиом 1° -4° создать эталон- эталонную модель множества No натуральных чисел (по фон Нейману1)), определив ^Дж. фон Нейман A903-1957)—американский математик. Работы по функци- функциональному анализу, математическим основаниям квантовой механики, топологиче- топологическим группам, теории игр, математической логике. Руководил созданием первых ЭВМ.
34 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ No как пересечение индуктивных множеств, т. е. как наименьшее индуктивное множество. Элементами No являются множества 0, 0+ = 0U{0} = {0}, {0}+ = {0}U{{0}}, .... которые и являются моделью того, что мы обозначаем символами 0,1,2,... и называем натуральными числами. 7° Аксиома подстановки. Пусть Т{х,у) —такое высказывание {точнее, формула), что при любом х0 из множества X существует и при- притом единственный объект уо такой, что J-(xo,yo) истинно. Тогда объек- объекты у, для каждого из которых существует элемент х € X такой, что Т{х,у) истинно, образуют множество. Этой аксиомой при построении анализа мы пользоваться не будем. Аксиомы 1° - 7° составляют аксиоматику теории множеств, известную как аксиоматика Цермело-Френкеля1). К ней обычно добавляется еще одна, независимая от аксиом 1° -7° и часто используемая в анализе 8° Аксиома выбора. Для любого семейства непустых множеств су- существует множество С такое, что, каково бы ни было множество X дан- данного семейства, множество X П С состоит из одного элемента. Иными словами, из каждого множества семейства можно выбрать в точ- точности по одному представителю так, что выбранные элементы составят мно- множество С. Аксиома выбора, известная в математике как аксиома Цермело, вызвала горячие дискуссии специалистов. 3. Замечания о структуре математических высказываний и записи их на языке теории множеств. В языке теории мно- множеств имеются два базисных или, как говорят, атомарных типа ма- математических высказываний: утверждение х € А о том, что объект х есть элемент множества А, и утверждение А = В о том, что мно- множества А и В совпадают. (Впрочем, с учетом аксиомы объемности второе утверждение является комбинацией утверждений первого типа: (х£А)&(х£ В).) Сложное высказывание или сложная логическая формула строятся из атомарных посредством логических операторов — связок ->, Л, V, =>■ и кванторов V, 3 с использованием скобок ( ). При этом формирование ^Э.Цермело A871-1953)—немецкий математик; А.Френкель A891-1965)—не- A891-1965)—немецкий, затем израильский математик.
§4. НЕКОТОРЫЕ ДОПОЛНЕНИЯ 35 сколь угодно сложного высказывания и его записи сводится к выпол- выполнению следующих элементарных логических операций: a) образование нового высказывания путем постановки отрицания перед некоторым высказыванием и заключение результата в скобки; b) образование нового высказывания путем постановки необходи- необходимой связки Л, V, =>■ между двумя высказываниями и заключение ре- результата в скобки; c) образование высказывания «для любого объекта х выполнено свойство Р» (что записывают в виде Vx P(x)) или высказывания «най- «найдется объект ж, обладающий свойством Р» (что записывают в виде ЗхР(х)). Например, громоздкая запись Зх(Р(х)Л(\/у((Р(у))^(у = х)))) означает, что найдется объект х, обладающий свойством Р и такой, что если у—любой объект, обладающий свойством Р, то у = х. Короче: су- существует и притом единственный объект ж, обладающий свойством Р. Обычно это высказывание обозначают в виде 3\х Р(х), и мы будем использовать такое сокращение. Для упрощения записи высказывания, как уже отмечалось, стара- стараются опустить столько скобок, сколько это возможно без потери од- однозначного толкования записи. С этой целью кроме указанного ранее приоритета операторов -i, Л, V, =>■ считают, что наиболее жестко сим- символы в формуле связываются знаками €, =, затем 3, V и потом связками -., Л, V, =►. С учетом такого соглашения теперь можно было бы написать 3\х Р(х) :=3х (Р(х) Л My (Р(у) => у = х)). Условимся также о следующих широко используемых сокращениях: (Уж е X) Р := Чх (х е X =» Р(ж)), (Зх Е X) Р := Зх (х е X Л Р(ж)), (Ух > а) Р := \/х (х G R Л х > а =Ф- Р(х)), (Зх > а) Р := Зх (х G R Л х > а Л Р(х)). Здесь R, как всегда, есть символ множества действительных чисел.
36 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ С учетом этих сокращений и правил а), Ь), с) построения сложного высказывания, например, можно будет дать однозначно трактуемую запись (hmf(x)=A\ :=Ve>0 3<S>0 Уж G M @<|ж - а|<<5 =► \f(x)-A\ < e) того, что число А является пределом функции /: М —> М в точке а G R. Быть может, наиболее важным из всего сказанного в этом пара- параграфе являются для нас следующие правила построения отрицания к высказыванию, содержащему кванторы. Отрицание к высказыванию «для некоторого ж истинно Р(ж)» озна- означает, что «для любого х неверно Р(ж)», а отрицание к высказыванию «для любого х истинно Р(ж)» означает, что «найдется ж, что невер- неверно Р(ж)». Итак, -.Зж Р{х) О Уж -iP(s), -Nx P(x) оЗж ->Р(х). Напомним также (см. упражнения к § 1), что -■(Р Л Q) О -Р V -.д, -.(Р v д) о -.р л -.<?, -.(р =► д) о р л -.д. На основании сказанного можно заключить, что, например, -i((Vs > а) Р) О (Зж > а) -.Р. Написать в правой части последнего соотношения (Зх ^ a) -iP было бы, конечно, ошибочно. В самом деле, -.((Vs > а) Р) := -n(Vx (ж£МЛж>а=^ Р(ж))) О О Зж -п(ж G М Л х > а => Р(х)) О О Зж ((ж G М Л ж > а) Л ->Р(х)) =: (Зж > а) -.Р. Если учесть указанную выше структуру произвольного высказыва- высказывания, то теперь с использованием построенных отрицаний простейших
§4. НЕКОТОРЫЕ ДОПОЛНЕНИЯ 37 высказываний можно было бы построить отрицание любого конкрет- конкретного высказывания. Например, ->(\imf(x) = A) o3e>0 V<5 > 0 Зж G \х->а / 6М @ < \х - а\ < 8 A \f(x) - А| > е). Практическая важность правильного построения отрицания связа- связана, в частности, с методом доказательства от противного, когда истин- истинность некоторого утверждения Р извлекают из того, что утверждение ->Р ложно. Упражнения 1. а) Установите равномощность отрезка {х€М|0^х^1}и интервала {а; € К | 0 < а; < 1} числовой прямой Ж как с помощью теоремы Шредера - Бернштейна, так и непосредственным предъявлением нужной биекции. Ь) Разберите следующее доказательство теоремы Шредера-Бернштейна: (cardX ^ card У) Л (card У ^ cardX) => (cardX = card У). ■4 Достаточно доказать, что если множества X, У, Z таковы, что X Э Э Y D Z и cardX = cardZ, то cardX = card У. Пусть /: X -> Z—биек- Z—биективное отображение. Тогда биекция д: X —> У может быть задана, например, следующим образом: {/(х), если х 6 fn(X) \ /"(У) для некоторого п G N, х в противном случае. Здесь /" = / о ... о / — п-я итерация отображения /, а N — множество нату- натуральных чисел. ► 2. а) Исходя из определения пары, проверьте, что данное в пункте 2 опре- определение прямого произведения X х У множеств X, Y корректно, т. е. множест- множество V(V(X)\JV(Y)) содержит все упорядоченные пары (х,у), в которых х 6 X иуег. b) Покажите, что всевозможные отображения f-.X—tY одного фиксиро- фиксированного множества X в другое фиксированное множество У сами образуют множество М(Х, У). c) Проверьте, что если И — множество упорядоченных пар (т.е. отноше- отношение), то первые элементы пар, принадлежащих множеству И (как и вторые), сами образуют множество.
38 ГЛ. I. НЕКОТОРЫЕ ОБЩЕМАТЕМАТИЧЕСКИЕ ПОНЯТИЯ 3. а) Используя аксиомы объемности, пары, выделения, объединения и бес- бесконечности, проверьте, что для элементов множества No натуральных чисел по фон Нейману справедливы следующие утверждения: 1° х = у => х+ = у+; 2° (Уж 6 No) (x+ ф0); 3° х+ = у+ => х = у; 4° (Vs 6 No) (х ф 0 => (Зу 6 No) (ж = 2/+))- b) Используя то, что No —индуктивное множество, покажите, что для любых его элементов х и у (а они в свою очередь являются множествами) справедливы следующие соотношения: 1° card a; ^ cardx+; 2° card0 < cardx+; 3° card a; < card у О cardx+ < cardj/+; 4° card a; < cardx+; 5° cardx < card у =» cardx+ ^ cardy; 6° x = у О card x = card y; 7° {x С у) V (ж D 2/). c) Покажите, что в любом подмножестве X множества No найдется та- такой (наименьший) элемент хт, что (Vx 6 X) (cardxm ^ card ж). (В случае затруднений к этой задаче можно вернуться после прочтения главы П.) 4. Мы будем иметь дело только с множествами. Поскольку множество, состоящее из различных элементов, само может быть элементом другого мно- множества, логики все множества обычно обозначают строчными буквами. В на- настоящей задаче это очень удобно. a) Проверьте, что запись Vx 3 у \/z (z 6 у О 3 w (z 6 w A w £ х)) выражает аксиому объединения, по которой существует множество у — объ- объединение множества х. b) Укажите, какие аксиомы теории множеств представлены записями Vx Vj/ V-г ((z 6 х О z 6 у) О х = у), Vx Vj/ 3 z Уг> (vGz<^(v — x\/v = у)), Vx 3 у V-г (z 6 у О Vu (u 6 z => и 6 x)), 3 x (Vj/ (-i3 z B; 6 j/) => j/ 6 x) Л Vw (ш 6 x => => Vu (Vw (w 6 и О (w = w V w £ w)) => u 6 x))).
§4. НЕКОТОРЫЕ ДОПОЛНЕНИЯ 39 с) Проверьте, что формула Vz {z G / => C xi 3 2/i (xi £x Луг £y Az= (zi,J/i)))) Л AVxi (xi € x => 3j/i 3z (yi 6 у t\z= (zi,J/i) Лг 6 /)) Л Л Vxi Vj/i Vj/2 C Zi 3 z2 (zi£ f Az2€ f Azi = (xi, J/i) Л последовательно накладывает на множество / три ограничения: / есть под- подмножество х х у; проекция / на х совпадает с х; каждому элементу xi из х отвечает ровно один элемент j/i из у такой, что (zi,j/i) £ /. Таким образом, перед нами определение отображения /: х -> у. Этот пример еще раз показывает, что формальная запись высказывания отнюдь не всегда бывает более короткой и прозрачной в сравнении с его за- записью на разговорном языке. Учитывая это обстоятельство, мы будем в даль- дальнейшем использовать логическую символику лишь в той мере, в какой она будет нам представляться полезной для достижения большей компактности или ясности изложения. 5. Пусть /: X -» Y — отображение. Запишите логическое отрицание каж- каждого из следующих высказываний: a) / сюръективно; b) / инъективно; c) / биективно. 6. Пусть X и Y — множества и / С X х Y. Запишите, что значит, что множество / не является функцией.
ГЛАВА II ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Математические теории, как правило, находят свой выход в том, что позволяют перерабатывать один набор чисел (исходные данные) в дру- другой набор чисел, составляющий промежуточную или окончательную цель вычислений. По этой причине особое место в математике и ее при- приложениях занимают числовые функции. Они (точнее, так называемые дифференцируемые числовые функции) составляют главный объект ис- исследования классического анализа. Но сколь-нибудь полное с точки зре- зрения современной математики описание свойств этих функций, как вы уже могли почувствовать в школе и в чем вскоре убедитесь, невозможно без точного определения множества вещественных чисел, на котором эти функции действуют. Число в математике, как время в физике, известно каждому, но не- непонятно лишь специалистам. Это одна из основных математических абстракций, которой, по-видимому, еще предстоит существенная эво- эволюция и рассказу о которой может быть посвящен самостоятельный насыщенный курс. Здесь же мы имеем в виду только свести воедино то, что читателю в основном известно о действительных числах из средней школы, выделив в виде аксиом фундаментальные и независимые свой- свойства чисел. При этом наша цель состоит в том, чтобы дать точное, пригодное для последующего математического использования опреде- определение вещественных чисел и обратить особое внимание на их свойство полноты, или непрерывности, являющееся зародышем предельного пе- перехода — основной неарифметической операции анализа.
§ 1. АКСИОМАТИКА И СВОЙСТВА ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 41 § 1. Аксиоматика и некоторые общие свойства множества действительных чисел 1. Определение множества действительных чисел Определение 1. Множество М называется множеством действи- действительных (вещественных) чисел, а его элементы — действительными (вещественными) числами, если выполнен следующий комплекс усло- условий, называемый аксиоматикой вещественных чисел: (I) Аксиомы сложения Определено отображение (операция сложения) + : М х М->М, сопоставляющее каждой упорядоченной паре (х,у) элементов х, у иэШ некоторый элемент х + у £ К, называемый суммой х и у. При этом выполнены следующие условия: 1+. Существует нейтральный элемент 0 (называемый в случае сложения нулем) такой, что для любого х £ М х + 0 = 0 + х = х. 2+. Для любого элемента х £ Ш имеется элемент —х Е Ш, называ- называемый противоположным к х, такой, что х + (-х) = (-х) + х = 0. 3+. Операция + ассоциативна, т. е. для любых элементов х, у, z из К выполнено х + (у + z) = (х + у) + z. 4+. Операция + коммутативна, т. е. для любых элементов х, у из К выполнено х + у = у + х. Если на каком-то множестве G определена операция, удовлетворя- удовлетворяющая аксиомам 1+, 2+, 3+, то говорят, что на G задана структура группы или что G есть группа. Если операцию называют сложением, то группу называют аддитивной. Если, кроме того, известно, что опе- операция коммутативна, т.е. выполнено условие 4+, то группу называют коммутативной или абелевой1'. j'H.Х.Абель A802-1829)—замечательный норвежский математик, доказавший неразрешимость в радикалах алгебраических уравнений, степени выше четвертой.
42 ГЛ. П. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Итак, аксиомы 1+ -4+ говорят, что Ш есть аддитивная абелева группа. (II) Аксиомы умножения Определено отображение (операция умножения) сопоставляющее каждой упорядоченной паре (х, у) элементов х, у из Ш некоторый элемент х-у ЕМ, называемый произведением х и у, причем так, что выполнены следующие условия: 1.. Существует нейтральный элемент 1 G К \ 0 (называемый в случае умножения единицей) такой, что Ух G Ш х ■ 1 = 1 • х = х. 2.. Для любого элемента х G К \ 0 имеется элемент x~l G К, называемый обратным, такой, что х • х~1 = х~1 • х = 1. 3.. Операция • ассоциативна, т. е. для любых х, у, z из М х ■ (у ■ z) = (х ■ у) ■ z. 4.. Операция • коммутативна, т. е. для любых х, у иэ Ш х-у = у-х. Заметим, что по отношению к операции умножения множество М\0, как можно проверить, является (мультипликативной) группой. (I, II) Связь сложения и умножения Умножение дистрибутивно по отношению к сложению, т. е. Vx,y,zem (х + y)z = xz + yz. Отметим, что ввиду коммутативности умножения последнее равен- равенство сохранится, если в обеих его частях поменять порядок множите- множителей. Если на каком-то множестве G действуют две операции, удовлетво- удовлетворяющие всем перечисленным аксиомам, то G называется алгебраиче- алгебраическим полем или просто полем.
§ 1. АКСИОМАТИКА И СВОЙСТВА ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 43 (III) Аксиомы порядка Между элементами М имеется отношение ^, т. е. для элементов х, у из Ш установлено, выполняется ли ж ^ у или нет. При этом должны удовлетворяться следующие условия: 0<с. Уж G М (ж ^ х). 1^. (х ^ у) Л (у ^ х) => (х = у). 2^. (ж ^у)Л(у О) =^ (ж ^ z). 3<g. Уж G R Vy G М (ж ^ у) V (у ^ ж). Отношение ^вМ называется отношением неравенства. Множество, между некоторыми элементами которого имеется отно- отношение, удовлетворяющее аксиомам 0^, 1^, 2^, как известно, называют частично упорядоченным, а если, сверх того, выполнена аксиома 3^, т.е. любые два элемента множества сравнимы, то множество называ- называется линейно упорядоченным. Таким образом, множество действительных чисел линейно упорядо- упорядочено отношением неравенства между его элементами. (I, III) Связь сложения и порядка в М Если х, у, z — элементы Ж, то (ж ^ у) => (ж + z ^ у + z). (II, III) Связь умножения и порядка в М Если х, у —элементы Ш, то (IV) Аксиома полноты (непрерывности) Если X uY —непустые подмножества М, обладающие тем свой- свойством, что для любых элементов ж G X и у G Y выполнено ж ^ у, то существует такое с G Ш, что ж ^ с ^ у для любых элементов ж G X uyeY. Этим завершается список аксиом, выполнение которых на каком бы то ни было множестве М позволяет считать это множество конкретной реализацией или, как говорят, моделью действительных чисел. Это определение формально не предполагает никакой предваритель- предварительной информации о числах, и из него, «включив математическую мысль», опять-таки формально мы должны получить уже в качестве теорем
44 ГЛ. П. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА остальные свойства действительных чисел. По поводу этого аксиома- аксиоматического формализма хотелось бы сделать несколько неформальных замечаний. Представьте себе, что вы не прошли стадию от складывания яблок, кубиков или других именованных величин к сложению абстрактных натуральных чисел; что вы не занимались измерением отрезков и не пришли к рациональным числам; что вам неизвестно великое откры- открытие древних о том, что диагональ квадрата несоизмерима с его сто- стороной и потому ее длина не может быть рациональным числом, т.е. нужны иррациональные числа; что у вас нет возникающего в процес- процессе измерений понятия «больше» («меньше»); что вы не иллюстрируете себе порядок, например, образом числовой прямой. Если бы всего это- этого предварительно не было, то перечисленный набор аксиом не только не воспринимался бы как определенный итог духовного развития, но, скорее, показался бы по меньшей мере странным и во всяком случае произвольным плодом фантазии. Относительно любой абстрактной системы аксиом сразу же возни- возникают по крайней мере два вопроса. Во-первых, совместимы ли эти аксиомы, т. е. существует ли мно- множество, удовлетворяющее всем перечисленным условиям. Это вопрос о непротиворечивости аксиоматики. Во-вторых, однозначно ли данная система аксиом определяет мате- математический объект, т. е., как сказали бы логики, категорична ли систе- система аксиом. Однозначность здесь надо понимать следующим образом. Если лица А и В, независимо, построили свои модели, к примеру, чи- числовых систем Ша и Шв , удовлетворяющие аксиоматике, то между мно- множествами Мд, Шв можно установить биективное соответствие, пусть /: Шд —> Шв, сохраняющее арифметические операции и отношение по- порядка, т.е. f(x-y) = f(x)-f(y), х^у& f(x) ^ f(y). С математической точки зрения Ша и Шв в таком случае являются всего-навсего различными (совершенно равноправными) реализациями (моделями) действительных чисел (например, Ша —бесконечные деся- десятичные дроби, а Шв —точки на числовой прямой). Такие реализации
§ 1. АКСИОМАТИКА И СВОЙСТВА ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 45 называются изоморфными, а отображение / — изоморфизмом. Резуль- Результаты математической деятельности относятся, таким образом, не к индивидуальной реализации, а к каждой модели из класса изоморфных моделей данной аксиоматики. Мы не будем здесь обсуждать поставленные выше вопросы и огра- ограничимся только информативными ответами на них. Положительный ответ на вопрос о непротиворечивости аксиомати- аксиоматики всегда носит условный характер. В отношении чисел он выглядит так: исходя из принятой нами аксиоматики теории множеств (см. гл. I, § 4, п. 2), можно построить множество натуральных, затем множест- множество рациональных и, наконец, множество Ш всех действительных чисел, удовлетворяющее всем перечисленным свойствам. Вопрос о категоричности системы аксиом действительных чисел имеет положительный ответ. Желающие получат его самостоятельно, решив задачи 23, 24, помещенные в конце следующего параграфа. 2. Некоторые общие алгебраические свойства действитель- действительных чисел. Покажем на примерах, как известные свойства чисел по- получаются из приведенных аксиом. а. Следствия аксиом сложения 1° В множестве действительных чисел имеется только один нуль. < Если Oi и О2 — нули в R, то по определению нуля Oi = Oi + 02 = 02 + Oi = 02. ► 2° В множестве действительных чисел у каждого элемента име- имеется единственный противоположный элемент. < Если х\ и Х2 — элементы, противоположные х € М, то XI = Х\ + 0 = Х\ + (х + Ж2) = {Х\ + х) + Х2 = 0 + Х2 = Х2- ► Здесь мы использовали последовательно определение нуля, опреде- определение противоположного элемента, ассопиативность сложения, снова определение противоположного элемента и, наконец, снова определение нуля. 3° Уравнение а + х — Ь в Ш имеет и притом единственное решение х = Ь+ (—а).
46 ГЛ. И. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА < Это вытекает из существования и единственности у каждого эле- элемента аб! противоположного ему элемента: (а + х = Ь) & ((х + а) + (-а) = Ь + (-а)) & ■& (х + (а + (-а)) = Ь+ (-а)) «=> (х + 0 = b + (-а)) &■ «=> (ж = Ь+(-а)). ► Выражение Ь+ (—а) записывают также в виде Ь — а. Этой более ко- короткой и привычной записи мы, как правило, и будем придерживаться. b. Следствия аксиом умножения 1° В множестве действительных чисел имеется только одна еди- единица. 2° Для каждого числа х ф 0 имеется только один обратный эле- элемент х~1. 3° Уравнение а • х = Ь при a€R\0 имеет, и притом единственное решение х = b • а. Доказательства этих утверждений, разумеется, повторяют доказа- доказательства соответствующих утверждений для сложения (с точностью до замены символа и названия операции), поэтому мы их опустим. c. Следствия аксиомы связи сложения и умножения. Привле- Привлекая дополнительно аксиому (I, II), связывающую сложение и умножение, получаем дальнейшие следствия. Г Для любого хеШ х ■ 0 = 0 • х = 0. <(х-0 = х-{0 + 0)=х-0 + х-0)=>(х-0 = х-0 + (-(х • 0)) = 0). ► Отсюда, между прочим, видно, что если х Е Ш \ 0, то x~l G Ш \ 0. 2° (х ■ у = 0) => (х = 0) V (у = 0). М Если, например, у ф 0, то из единственности решения уравнения х • у = 0 относительно х находим х = 0 • у~1 =0. ► 3° Для любого хеШ —х — (—1) • х. ■4 х+(—1)-х = A + (—1))-х = 0-ж = ж-0 = 0, и утверждение следует из единственности противоположного элемента. ►
§ 1. АКСИОМАТИКА И СВОЙСТВА ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 47 4° Для любого числа х € Ш Ч Следует из 3° и единственности элемента х, противополож- противоположного —X. ► 5° Для любого числа х € Ш (—х){—х) — х • х. < (-х)(-х) = ((-1) • х)(-х) = (х • (-1))(-ж) = х((-1)(-х)) = х ■ х. Мы последовательно воспользовались двумя предыдущими утвержде- утверждениями, а также коммутативностью и ассоциативностью умножения. ► d. Следствия аксиом порядка. Отметим сначала, что отношение х ^ у (читается «х меньше или равно у») записывают также в виде у ^ х («у больше или равно ж»); отношение х ^ у при х ф у записывают в виде х < у (читается «ж меньше у») или в виде у > х («у больше ж») и называют строгим неравенством. 1° Для любых ж, у € Ш всегда имеет место в точности одно из соотношений: х < у, х = у, х > у. ■4 Это следует из приведенного определения строгого неравенства и аксиом 1^ и 3^. ► 2° Для любых чисел х, у, z из Ш {x<y)A(y^z)^{x< z), (ж ^ у) А (у < z) => (ж < z). < Приведем для примера доказательство последнего утверждения. По аксиоме 2^ транзитивности отношения неравенства имеем (ж ^ у) А {у < z) о (ж ^ у) А (у ^ z) А (у ф z) => (ж ^ z). Осталось проверить, что х ф z. Но в противном случае {х ^ у) А (у < z) о (z ^ у) А {у < z) о (z ^ у) А (у ^ z) А (у ф z). В силу аксиомы 1^ отсюда следует (у = г)А{уф z) —противоречие. ►
48 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА е. Следствия аксиом связи порядка со сложением и умноже- умножением. Если в дополнение к аксиомам сложения, умножения и порядка использовать аксиомы (I, III), (II, III), связывающие порядок с ариф- арифметическими операциями, то можно получить, например, следующие утверждения: 1° Для любых чисел х, у, z, w из Ш. (х <y)^(x + z)< (y + z), (О < х) => (-х < 0), {х ^ у) A (z ^ w) => (х + z ^ у + w), (х ^ у) A (z < w) => (х + z < у + w). •4 Проверим первое из этих утверждений. По определению строгого неравенства и аксиоме (I, III) имеем (х < у) => (х ^ у) => (х + z) ^ (у + z). Остается проверить, что x + z^y + z.B самом деле, ((х + z) = (у + z)) => (х = (у + z) - z = у + (z - z) = у), что несовместимо с условием х < у. ► 2° Если х, у, z — числа из Ш., то (х < 0) Л (у < 0) => @ < ху), {х<0)А{0<у)^> {ху < 0), (х < у) А @ < z) => (xz < yz), (х < у) A (z < 0) => {yz < xz). < Проверим первое из этих утверждений. По определению строгого неравенства и аксиоме (II, III) @ < х) А @ < у) => @ ^ х) А @ ^ у) => @ ^ ху).
§1. АКСИОМАТИКА И СВОЙСТВА ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 49 Кроме того, 0 ф ху, поскольку, как уже было показано, Проверим еще, например, и третье утверждение: {х < 0) Л @ < у) =>■ @ < -ж) Л @ < у) =»■ =* @ < (-х) • у) => @ < ((-1) • х)у) => => @ < (-1) • (ху)) =» @ < -{ху)) =» (ху < 0). ► Читателю предоставляется возможность доказать самостоятельно остальные соотношения, а также проверить, что если в одной из ско- скобок левой части наших утверждений стоит нестрогое неравенство, то следствием его также будет нестрогое неравенство в правой части. 3° 0 < 1. < lGR\0, т.е. 0^1. Если предположить, что 1 < 0, то по только что доказанному (К 0) Л (К 0) =► @ < 1 • 1) => @ < 1). Но мы знаем, что для любой пары чисел х, у G R реализуется и притом только одна из возможностей: х < у, х = у, х > у. Поскольку 0 ф 1, а предположение 1 < 0 ведет к несовместимому с ним соотношению 0 < 1, то остается единственная возможность, указанная в утверждении. ► 4° @ < х) => @ < х-1) и @ < х) Л (х < у) => @ < у) Л (у < аТ1). < Проверим первое из этих утверждений. Прежде всего, х~1 ф 0. Предположив, что х~1 < 0, получим (х < 0) Л @ < х) => (х • х < 0) => (К 0). Это противоречие завершает доказательство. ► Напомним, что числа, которые больше нуля, называются положи- положительными, а числа меньшие нуля — отрицательными. Таким образом, мы доказали, например, что единица—положитель- единица—положительное число, что произведение положительного и отрицательного чисел есть число отрицательное, а величина, обратная положительному чи- числу, также положительна. 3-4573
50 ГЛ. И. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА 3. Аксиома полноты и существование верхней (нижней) грани числового множества Определение 2. Говорят, что множество IcK ограничено свер- сверху (снизу), если существует число с € Ш такое, что х ^ с (соответствен- (соответственно, с ^ х) для любого х € X. Число с в этом случае называют верхней (соответственно, нижней) границей множества X или также мажорантой (минорантой) множе- множества X. Определение 3. Множество, ограниченное и сверху и снизу, на- называется ограниченным. Определение 4. Элемент а Е X называется наибольшим или мак- максимальным (наименьшим или минимальным) элементом множества X С С М, если х ^ а (соответственно, а ^ х) для любого элемента х € X. Введем обозначения и заодно приведем формальную запись опреде- определения максимального и минимального элементов соответственно: (а = maxX) := (а € X А Ух € X (х ^ а)), (а = minX) := (а € X А Ух € X (а < х)). Наряду с обозначениями maxX (читается «максимум X») и minX (читается «минимум X»), в том же смысле используются соответствен- соответственно символы max z и minz. хех хех Из аксиомы 1^ порядка сразу следует, что если в числовом множе- множестве есть максимальный (минимальный) элемент, то он только один. Однако не во всяком, даже ограниченном, множестве имеется мак- максимальный (минимальный) элемент. Например, множество X = {a;GR|0^z<l} имеет минимальный элемент, но, как легко проверить, не имеет максимального элемента. Определение 5. Наименьшее из чисел, ограничивающих множе- множество X С Ш сверху, называется верхней гранью (или точной верхней границей) множества X и обозначается supX (читается «супремум X») или sup х. хех Это основное определение настоящего пункта. Итак, (а = supX) := Vx G X ((х ^ s) A (Vs' < а Эх' € X (а' < х'))).
§ 1. АКСИОМАТИКА И СВОЙСТВА ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 51 В первой скобке, стоящей справа от определяемого понятия, напи- написано, что s ограничивает X сверху; вторая скобка говорит, что s — минимальное из чисел, обладающих этим свойством. Точнее, вторая скобка утверждает, что любое число, меньшее s, уже не является верх- верхней границей X. Аналогично вводится понятие нижней грани {точной нижней гра- границы) множества X как наибольшей из нижних границ множества X. Определение 6. (i = inf X) := Ух G X ((г ^ х) A (Vi < i' Зх' G X (х' < г'))). Наряду с обозначением inf X (читается «инфимум X») для нижней гра- грани X употребляется также обозначение inf x. Таким образом, даны следующие определения: supX := min{c G R | Ух G X (x ^ c)}, inf X := max{c G R | Vx G X (с ^ x)}. Но выше мы говорили, что не всякое множество обладает мини- минимальным или максимальным элементом, поэтому принятые определения верхней и нижней граней числового множества нуждаются в аргумен- аргументации, которую доставляет следующая Лемма (принцип верхней грани). Всякое непустое ограниченное сверху подмножество множества вещественных чисел имеет и при- притом единственную верхнюю грань. Л Поскольку единственность минимального элемента числового множества нам уже известна, необходимо лишь убедиться в существо- существовании верхней грани. Пусть X С R — данное подмножество, aF = {yeR|Vi£l (х ^ У)} — множество верхних границ X. По условию, X ф 0 и Y ф 0. Тогда в силу аксиомы полноты существует число с Е Ш такое, что Ух G X Уу G Y (х ^ с ^ у). Число с, таким образом, является мажо- мажорантой X и минорантой Y. Как мажоранта X, число с является элемен- элементом Y, но как миноранта Y, число с является минимальным элементом множества Y. Итак, с = minF = supX. ► Конечно, аналогично доказывается существование и единственность нижней грани у ограниченного снизу числового множества, т. е. имеет место
52 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Лемма. (X ограничено снизу) => C! inf X). На доказательстве мы не останавливаемся. Теперь вернемся к множеству X = {i € К | 0 ^ i < 1}. В си- силу доказанной леммы оно должно иметь верхнюю грань. По самому определению множества X и определению верхней грани очевидно, что supX ^ 1. Для того чтобы доказать, что supX = 1, таким образом, необхо- необходимо проверить, что для любого числа q < 1 найдется число х £ X такое, что q < х, т.е., попросту, что между q и 1 есть еще числа. Это, конечно, легко доказать и независимо (например, показав, что q < 2~l{q + 1) < 1), но мы сейчас этого делать не станем, поскольку в следующем параграфе подобные вопросы будут обсуждаться последо- последовательно и подробно. Что же касается нижней грани, то она всегда совпадает с минималь- минимальным элементом множества, если множество таковым обладает. Так что уже из этого соображения в рассматриваемом примере имеем inf X = 0. Другие, более содержательные примеры использования введенных здесь понятий встретятся уже в следующем параграфе. § 2. Важнейшие классы действительных чисел и вычислительные аспекты операций с действительными числами 1. Натуральные числа и принцип математической индук- индукции а. Определение множества натуральных чисел. Числа вида 1, 1 + 1, A + 1) + 1 и т. д. обозначают соответственно символами 1, 2, 3 и т. д. и называют натуральными числами. Принять такое определение может только тот, кто и без него имеет полное представление о натуральных числах, включая их запись, на- например, в десятичной системе счисления. Продолжение какого-то процесса далеко не всегда бывает однознач- однозначным, поэтому вездесущее «и так далее» на самом деле требует уточне- уточнения, которое доставляет фундаментальный принцип математической индукции. Определение 1. Множество JcK называется индуктивным, ес- если вместе с каждым числом х € X ему принадлежит также число х + 1.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 53 Например, Ш является индуктивным множеством; множество поло- положительных чисел также является индуктивным множеством. Пересечение X = Q Ха любого семейства индуктивных множеств авА Ха, если оно непусто, является индуктивным множеством. Действительно, (х € X = Г) Ха ) => (Va G Л (х G XQ)) => => (Va € А {{х + 1) € Ха)) => ((ж + 1) G f| XQ = X j . Теперь примем следующее Определение 2. Множеством натуральных чисел называется наи- наименьшее индуктивное множество, содержащее 1, т.е. пересечение всех индуктивных множеств, содержащих число 1. Множество натуральных чисел обозначают символом N; его элемен- элементы называются натуральными числами. С теоретико-множественной точки зрения, быть может, разумнее натуральные числа начинать с 0, т. е. вводить множество натуральных чисел как наименьшее индуктивное множество, содержащее 0, однако нам удобнее начинать нумерацию числом 1. Следующий фундаментальный и широко используемый принцип яв- является прямым следствием определения множества натуральных чисел. Ь. Принцип математической индукции Если подмножество Е множества натуральных чисел N таково, что 1 G Е и вместе с числом х € Е множеству Е принадлежит число х + 1, то Е = N. Итак, {Е С N) Л A € Е) Л (Ух € Е(х € Е => (х + 1) € Е)) => Е = N. Проиллюстрируем этот принцип в действии, доказав с его помощью несколько полезных и постоянно в дальнейшем используемых свойств натуральных чисел. 1° Сумма и произведение натуральных чисел являются натураль- натуральными числами.
54 ГЛ. И. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА •4 Пусть m,n £ N; покажем, что (т + п) € N. Обозначим через Е множество тех натуральных чисел п, для которых (т + п) € N при любом т € N. Тогда 1 Е Е, поскольку (т G N) => ((т + 1) G N) для любого т € N. Если п € Е, т. е. (m + n) G N, то и (п + 1) G i£, так как (т + (п + 1)) = ((т + п) + 1) € N. По принципу индукции i£ = N, и мы доказали, что сложение не выводит за пределы N. Аналогично, обозначив через Е множество тех натуральных чи- чисел п, для которых (т ■ п) € N при любом т G N, находим, что 1 € Е, так как т-1 = т, и если n G i£, т. е. т-п Е N, то т- (п+1) = тп+т есть сумма натуральных чисел, которая по доказанному принадлежит N. Та- Таким образом, (п е £) 4 ((п+1) € Е) и по принципу индукции Е — N. ► 2° Покажем, что (n G N) Л (п ^ 1) => ((п - 1) G N). •4 Рассмотрим множество Е натуральных чисел вида п — 1, где п — натуральное число, отличное от 1, и покажем, что Е = N. Поскольку 1 G N, то 2 := A + 1) G N, а значит, 1 = B - 1) € Е. Если т Е Е, то т = п — 1, где n G N; тогда m + 1 = (п + 1) — 1 и, поскольку (п + 1) G N, имеем (т + 1) G J5. По принципу индукции заключаем: i£ = N. ► 3° Для любого п € N в множестве {х € N | п < х) есть минималь- минимальный элемент, причем min {х € N | п < х} = п + 1. < Покажем, что множество Е тех п G N, для которых утверждение справедливо, совпадает с N. Сначала проверим, что 1 € Е, т. е. min{zGN| 1 < х) = 2. Это утверждение тоже будем проверять по принципу индукции. Пусть М = {х € N | (х = 1) V B ^ х)}. По определению М имеем 1 € М. Далее, если х € М, то либо х = 1 и тогда ж + 1 = 2 € М, либо 2 ^ ж, тогда 2 ^ (х +1) и снова (х +1) € М. Таким образом, М = N и, значит, если (i ^ 1) Л (ж £ N), то 2 ^ ж, т. е. действительно min {х € N | 1 < х) = 2. Итак, 1 £ Е. Покажем теперь, что если п Е Е, то и (п + 1) Е Е.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 55 Заметим сначала, что, если ж G {ж G N | п + 1 < ж}, то (х - 1) = у Е {у Е N | п < у}, ибо по доказанному все натуральные числа не меньше 1, поэтому (п + 1 < х) => A < х) => (х ф 1), а тогда в силу утверждения 2° (х - 1) = у е N. Пусть теперь п £ Е, т. е. min {у G N | п < у} = п + 1. Тогда ж — 1 ^ ^у^п + 1иж^п + 2. Значит, (ж G {ж G N | п + 1 < х}) => (ж ^ п + 2) и, следовательно, min {ж G N | п + 1 < ж} = п + 2, т. е. (п + 1) G i£. По принципу индукции Е = N, и утверждение 3° доказано. ► В качестве прямых следствий доказанных утверждений 2° и 3° по- получаем следующие свойства 4°, 5°, 6° натуральных чисел: 4°(mGN)A(nGN)A(n<m)^(n + Hm). 5° Число (п+ 1) G N непосредственно следует eN за натуральным числом п, т. е. нет натуральных чисел х, удовлетворяющих условию п < х < п + 1, если п eN. 6° Если п G N и п ф 1, то число (п — 1) е N и (п — 1) непосред- непосредственно предшествует числу п в N, т. е. нет натуральных чисел х, удовлетворяющих условию п — 1 < ж < п, если п G N. 7° Покажем теперь, что в любом непустом подмножестве множе- множества натуральных чисел имеется минимальный элемент. М Пусть М С N. Если 1 G М, то minM = 1, поскольку Vn G N A < п). Пусть теперь 1 ^ М, т. е. 1 G Е = N \ М. В множестве Е должно найтись такое натуральное число п G Е, что все натуральные числа, не превосходящие п, лежат в Е, а (п + 1) G М. Если бы такого п не было, то множество Е С N, содержащее единицу, вместе с п £ Е содержа- содержало бы и (п + 1) и по принципу индукции совпадало бы с N. Последнее невозможно, поскольку N \ Е = М ф 0. Найденное число (п + 1) G М и будет минимальным в М, поскольку между п и п + 1, как мы видели, уже нет натуральных чисел. ►
56 ГЛ. П. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА 2. Рациональные и иррациональные числа а. Целые числа Определение 3. Объединение множества натуральных чисел, множества чисел, противоположных натуральным числам, и нуля на- называется множеством целых чисел и обозначается символом Z. Поскольку, как уже было доказано, сложение и умножение натураль- натуральных чисел не выводят за пределы N, то эти же операции над целыми числами не выводят за пределы множества Z. 4 Действительно, если т,п G Z, то либо одно из этих чисел равно нулю и тогда сумма т + п равна другому числу, т. е. (т + п) G Z, а про- произведение т ■ п = 0 G Z, либо оба числа отличны от нуля. В последнем случае либо т, п G N и тогда (т + п) G N С Z и (т ■ п) G N С Z, либо (—т), (—п) G N и тогда т- п = ((—l)m)((—l)n) G N, либо (—т),п G N и тогда (—m • п) G N, т. е. т ■ п G Z, либо, наконец, т, —n G N и тогда (—т ■ п) G N и снова m ■ n G Z. ► Таким образом, Z есть абелева группа по отношению к операции сложения. По отношению к операции умножения множество Z и даже Z \ 0 не является группой, поскольку числа, обратные целым, не лежат в Z (кроме числа, обратного единице и минус единице). < Действительно, если т G Z и т ф 0, 1, то, считая сначала т G N, имеем 0 < 1 < т и, поскольку т-т = 1 > 0, должно быть 0 < т~1 < 1 (см. в предыдущем параграфе следствия аксиом порядка). Таким обра- образом, т~х £ Z. Случай, когда т — отрицательное целое число, отличное от —1, непосредственно сводится к уже разобранному. ► В том случае, когда для чисел m, n G Z число к = т ■ n~l G Z, т. е. когда т = к-п, где к G Z, говорят, что целое число m делится на целое число п или кратно п, или что п есть делитель т. Делимость целых чисел путем надлежащих изменений знаков, т. е. домножением на —1, если в этом есть необходимость, немедленно при- приводится к делимости соответствующих натуральных чисел, в рамках которых она и изучается в арифметике. Напомним без доказательства так называемую основную теорему арифметики, которой при рассмотрении некоторых примеров мы будем пользоваться.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 57 Число р G N, р ф 1, называется простым, если в N у него нет дели- делителей, отличных от 1 и р. Основная теорема арифметики. Каждое натуральное число до- допускает и притом единственное (с точностью до порядка сомножи- сомножителей) представление в виде произведения где Pi,-.. ,Pk — простые числа. Числа т, п G Z называются взаимно простыми, если у них нет общих делителей, отличных от 1 и —1. Из приведенной теоремы, в частности, видно, что если произведение т • п взаимно простых чисел m, n делится на простое число р, то одно из чисел т, п также делится на р. Ь. Рациональные числа Определение 4. Числа вида т • пГ1, где т, п G Z, называются рациональными. Множество рациональных чисел обозначается знаком Q. Таким образом, упорядоченная пара (т, п) целых чисел определяет рациональное число q — m- n~1, если п^О. Число q = т- п~1 записывают также в виде отношения1) тип или так называемой рациональной дроби -£. Правила действий с рациональными числами, относящиеся к такой форме их представления дробями, изучавшиеся в школе, немедленно вы- вытекают из определения рационального числа и аксиом действительных чисел. В частности, «от умножения числителя и знаменателя дроби на одно и то же отличное от нуля целое число величина дроби не изменяет- изменяется», т. е. дроби ^г- и ^ представляют одно и то же рациональное число. В самом деле, поскольку (nfc)(fc^1n^1) = 1, т.е. (п • к)~1 = к~х • п~х, то (тпк^пк)-1 = (mfcJOfc-1!*-1) = m • n. Таким образом, различные упорядоченные пары (т,п) и (тк, пк) задают одно и то же рациональное число. Следовательно, после соот- соответствующих сокращений любое рациональное число можно задать упо- упорядоченной парой взаимно простых целых чисел. ''Обозначение Q—по начальной букве англ. quotient—отношение (от лат. quota—часть, приходящаяся на единицу чего-либо, и quot — сколько).
58 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА С другой стороны, если пары (mi,ni) и (т2,пг) задают одно и то же рациональное число, т.е. mi -n^1 = т^-п^1, то min2 = ГП2П1, и если, например, mi и щ взаимно просты, то в силу упомянутого следствия основной теоремы арифметики щ • п^1 = т^ • mj = к Е Z. Мы показали, таким образом, что две упорядоченные пары (mi, щ), (т2, пг) задают одно и то же рациональное число тогда и только тогда, когда они пропорциональны, т. е. существует число к Е Z такое, что, например, ТП2 = ктп\ и П2 = кп\. с. Иррациональные числа Определение 5. Действительные числа, не являющиеся рацио- рациональными, называются иррациональными. Классическим примером иррационального действительного числа является \/2, т.е. число s Е М. такое, что s > 0 и s2 = 2. Иррацио- Иррациональность \/2 в силу теоремы Пифагора эквивалентна утверждению о несоизмеримости диагонали и стороны квадрата. Итак, проверим, во-первых, что существует положительное дей- действительное число s ЕШ, квадрат которого равен двум, и, во-вторых, что s £ Q. ■4 Пусть X и Y — множества положительных действительных чисел такие, что Ух Е X (ж2 < 2), Уу Е Y B < у2). Поскольку 1 G X, а 2 Е Y, то X и Y — непустые множества. Далее, поскольку для положительных х и у (х < у) <£> (х2 < у2), то любой элемент х Е X меньше любого элемента у Е Y. По аксиоме полноты существует число s Е Ш такое, что х ^ s ^ у для Ух Е X и УуЕУ. Покажем, что s2 = 2. 2 _ 2 Если бы было s < 2, то, например, квадрат числа sH—^-, большего чем s, был бы меньше 2. Действительно, ведь 1 Е X, поэтому I2 ^ s2 < 2 hO<A = 2-s2<1. Значит, Д ^Д^<^ + 3.Д=<.2 + Д = 2. О Следовательно, Is + 5-) EX, что несовместимо с неравенством х ^ s для любого элемента ж G X.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 59 Если бы было 2 < s2, то, например, квадрат числа s — s ~ -, мень- меньшего чем s, был бы больше 2. Действительно, ведь 2 G Y, поэтому 2<в2<22или0<А=52-2<Зи0<ф<1. Отсюда и мы вступаем в противоречие с тем, что s ограничивает множество Y снизу. Таким образом, реализуется только одна оставшаяся возможность: S2 = 2. Покажем, наконец, что s £ Q. Предположим, что s G Q, и пусть ^ — несократимое представление s. Тогда т2 — 2 • п2, следовательно, т2, а значит, и т делится на 2. Но если т = 2к, то 2fc2 = n2 и по той же причине п должно делиться на 2, что противоречит несократимости дроби £. ► Сейчас мы трудились над тем, чтобы доказать существование ирра- иррациональных чисел. Вскоре мы увидим, что в некотором смысле почти все действительные числа иррациональны. Будет показано, что мощ- мощность множества иррациональных чисел больше мощности множества всех рациональных чисел и совпадает с мощностью множества всех дей- действительных чисел. Среди иррациональных чисел выделяют еще так называемые алге- алгебраические иррациональности и трансцендентные числа. Вещественное число называется алгебраическим, если оно является корнем некоторого алгебраического уравнения аохп + ... + ап-\х + ап = О с рациональными (или, что эквивалентно, с целыми) коэффициентами. В противном случае число называется трансцендентным. Мы увидим, что мощность множества алгебраических чисел такая же, как мощность множества рациональных чисел, а мощность мно- множества трансцендентных чисел такая же, как мощность всех действи- действительных чисел; поэтому на первый взгляд кажутся парадоксальными и неестественными трудности в предъявлении конкретного трансцен- трансцендентного числа, точнее, в доказательстве его трансцендентности.
60 ГЛ. И. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Так, например, только в 1882 г. было доказано, что классическое геометрическое число тг является трансцендентным1), а одна из знаме- знаменитых проблем Гильберта2^ состояла в том, чтобы доказать трансцен- трансцендентность числа а@, где а — алгебраическое, (а > 0) Л (а ф 1), a /?— алгебраическое иррациональное число (например, а = 2, C = \/2). 3. Принцип Архимеда. Переходим к важному как в теоретиче- теоретическом отношении, так и в плане конкретного использования чисел при измерениях и вычислениях принципу Архимеда3). Мы докажем его, опи- опираясь на аксиому полноты (точнее, на эквивалентную ей лемму о верх- верхней грани). При другой аксиоматике множества действительных чисел этот фундаментальный принцип часто включают в список аксиом. Заметим, что утверждения, которые мы до сих пор доказывали о натуральных и целых числах, совершенно не использовали аксиому пол- полноты. Как будет видно из дальнейшего, принцип Архимеда, в сущности, отражает свойства натуральных и целых чисел, связанные с аксиомой полноты. С этих свойств мы и начнем. 1° В любом непустом ограниченном сверху подмножестве множе- множества натуральных чисел имеется максимальный элемент. ■4 Если Е с N — рассматриваемое множество, то по лемме о верхней грани 3!supi£ = s G Ш. По определению верхней грани, в Е найдется натуральное число п G Е, удовлетворяющее условию s — 1 < п ^ s. Тогда п = max E, поскольку все натуральные числа, которые больше п, не меньше n + 1, a n + 1 > s. ► 1)п — число, равное в евклидовой геометрии отношению длины окружности к ее диаметру. Отсюда общепринятое с XIII века обозначение этого числа начальной буквой греческого слова itepupepia — периферия (окружность). Трансцендентность п доказана немецким математиком Ф. Линдеманом A852-1939). Из трансцендентно- трансцендентности 7Г, в частности, вытекает невозможность построения циркулем и линейкой от- отрезка длины 7Г (задача о спрямлении окружности), как и неразрешимость этими средствами древней задачи о квадратуре круга. 2'Д. Гильберт A862-1943)—выдающийся немецкий математик, сформулировав- сформулировавший в 1900 г. на Международном конгрессе математиков в Париже двадцать три относящиеся к различным областям математики проблемы, получившие впослед- впоследствии название «проблем Гильберта». Вопрос, о котором идет речь в тексте (седь- (седьмая проблема Гильберта), был положительно решен в 1934г. советским математиком А. О. Гельфондом A906 -1968) и немецким математиком Т. Шнайдером A911 -1989). 3'Архимед B87-212 гг. до н.э.)—гениальный греческий ученый, про которого один из основоположников анализа Лейбниц в свое время сказал: «Изучая труды Архимеда, перестаешь удивляться успехам современных математиков».
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 61 Следствия. 2° Множество натуральных чисел не ограничено сверху. М В противном случае существовало бы максимальное натуральное число. Но п < п + 1. ► 3° В любом непустом ограниченном сверху подмножестве множе- множества целых чисел имеется максимальный элемент. М Можно дословно повторить доказательство утверждения 1°, за- заменяя N на Z. ► 4° В любом непустом ограниченном снизу подмножестве множе- множества целых чисел имеется минимальный элемент. М Можно, например, повторить доказательство утверждения 1°, за- заменяя N на Z и используя вместо леммы о верхней грани лемму о суще- существовании нижней грани у ограниченного снизу числового множества. Можно также перейти к противоположным числам («поменять зна- знаки») и воспользоваться уже доказанным в 3°. ► 5° Множество целых чисел не ограничено ни сверху, ни снизу. 4 Вытекает из 3° и 4° или прямо из 2°. ► Теперь сформулируем 6° Принцип Архимеда. Если фиксировать произвольное поло- положительное число h, то для любого действительного числа х найдется и притом единственное целое число к такое, что (к — l)h ^ х < kh. •^ Поскольку Z не ограничено сверху, множество непустое ограниченное снизу подмножество множества целых чисел. Тогда (см. 4°) в нем есть минимальный элемент к, т.е. (к — 1) ^ x/h < < к. Поскольку h > 0, эти неравенства эквивалентны приведенным в формулировке принципа Архимеда. Единственность к G Z, удовле- удовлетворяющего двум последним неравенствам, следует из единственности минимального элемента числового множества (см. § 1, п. 3). ► Некоторые следствия: 7° Для любого положительного числа е существует натуральное число п такое, что 0 < ^ < е. < По принципу Архимеда найдется п G Z такое, что 1 < е • п. По- Поскольку 0 < 1 и 0 < е, имеем 0 < п. Таким образом, nGNnO<^<e. ►
62 ГЛ. И. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА 8° Если число х G Ш таково, что 0 ^ х и для любого п G N выпол- выполнено х < jj, то х = О. 4 Соотношение 0 < х невозможно в силу утверждения 7°. ► 9° Для любых чисел a, b ЕМ. таких, что а < Ь, найдется рациональ- рациональное число г GQ такое, что а < г < Ь. ■4 Учитывая 7°, подберем п G N так, что 0 < ^ < Ь—а. По принципу Архимеда найдем такое число т G Z, что т~1 ^ а < Щ. Тогда ^ < < 6, ибо в противном случае мы имели бы т ~ * ^ а < 6 ^ ^, откуда следовало бы, что \ >Ь-а. Таким образом, r = ^eQna<^<6. ► 10° Для любого числа х ЕШ существует и притом единственное целое число k G Z такое, что к ^ ж < к + 1. •^ Это непосредственно вытекает из принципа Архимеда. ► Указанное число fc обозначается [х] и называется целой частью чи- числа х. Величина {х} :~ х — [х] называется дробной частью числа х. Итак, х = [х] + {х}, причем {х} ^ 0. 4. Геометрическая интерпретация множества действитель- действительных чисел и вычислительные аспекты операций с действи- действительными числами а. Числовая ось. По отношению к действительным числам часто используется образный геометрический язык, связанный с тем обстоя- обстоятельством, что, как в общих чертах известно из школы, в силу аксиом геометрии между точками прямой L и множеством Ш вещественных чисел можно установить взаимно однозначное соответствие /: L —> Ш. Причем это соответствие связано с движениями прямой. А именно, ес- если Г — параллельный перенос прямой L по себе, то существует число iGl (зависящее только от Г) такое, что f(T(x)) = f(x) + t для любой точки х G L. Число /(ж), соответствующее точке х G L, называется координатой точки х. Ввиду взаимной однозначности отображения /: L —> Ш коор- координату точки часто называют просто точкой. Например, вместо фразы «отметим точку, координата которой 1», говорят «отметим точку 1». Прямую L при наличии указанного соответствия /: L —> К называют координатной осью, числовой осью или числовой прямой. Ввиду биек-
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 63 тивности / само множество Ш вещественных чисел также часто назы- называют числовой прямой, а его элементы — точками числовой прямой. Как отмечалось, биективное отображение /: L —> М, задающее на L координаты, таково, что при параллельном переносе Г координаты образов точек прямой L отличаются от координат самих точек на одну и ту же величину t G Ш. Ввиду этого / полностью определяется указа- указанием точки с координатой 0 и точки с координатой 1 или, короче, точки нуль, называемой началом координат, и точки 1. Отрезок, определя- определяемый этими точками, называется единичным отрезком. Направление, определяемое лучом с вершиной 0, содержащим точку 1, называется по- положительным, а движение в этом направлении (от 0 к 1) —движением слева направо. В соответствии с этим соглашением 1 лежит правее 0, а О—левее 1. При параллельном переносе Т, переводящем начало координат xq в точку Х\ = Т(хо) с координатой 1, координаты образов всех точек на единицу больше координат прообразов, поэтому мы находим точку Х2 = Т(х\) с координатой 2, точку хз = Т{х2) координатой 3, ..., точку жп+1 = Т(хп) с координатой п + 1, а также точку ж_1 = T~1(xq) с координатой —1, ..., точку х-п-\ = Т^1(х-п) с координатой — п — 1. Таким образом, получаем все точки с целыми координатами m G Z. Умея удваивать, утраивать, ... единичный отрезок, по теореме Фа- леса его же можно разбить на соответствующее число п конгруэнтных отрезков. Беря тот из них, одним концом которого является начало ко- координат, для координаты х другого конца имеем уравнение п • х = 1, т.е. х = ^. Отсюда находим все точки с рациональными координатами Но останутся еще точки L, ведь есть же отрезки, несоизмеримые с единичным. Каждая такая точка (как и любая другая точка прямой) разбивает прямую на два луча, на каждом из которых есть точки с целыми (рациональными) координатами (это следствие исходного гео- геометрического принципа Архимеда). Таким образам, точка производит разбиение или, как говорят, сечение Q на два непустых множества X и F, отвечающие рациональным точкам (точкам с рациональными ко- координатами) левого и правого лучей. По аксиоме полноты найдется число с, разделяющее X и Y, т.е. х ^ с ^ у для \/х € X и Vy G Y. Поскольку X U У = Q, то supX = s = i = inf Y, ибо в противном случае s < i и между виг нашлось бы рациональное число, не лежащее ни в X, ни в Y. Таким образом, s = г = с. Это однозначно определенное число
64 ГЛ. Н. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА с и ставится в соответствие указанной точке прямой. Описанное сопоставление точкам прямой их координат доставля- доставляет наглядную модель как отношению порядка в М. (отсюда и термин «линейная упорядоченность»), так и аксиоме полноты, или непрерыв- непрерывности Ш, которая на геометрическом языке означает, что в прямой L «нет дыр», разбивающих ее на два не имеющих общих точек куска (та- (такое разбиение осуществляется некоторой точкой прямой L). Мы не станем вдаваться в дальнейшие детали конструкции отобра- отображения /: L —> К, поскольку геометрическую интерпретацию множест- множества действительных чисел мы будем привлекать исключительно для на- наглядности и для возможного подключения весьма полезной геометриче- геометрической интуиции читателя. Что же касается формальных доказательств, то, как и до сих пор, они будут опираться либо на тот набор фактов, который мы уже получили из аксиоматики действительных чисел, либо непосредственно на эту аксиоматику. Геометрический же язык мы будем использовать постоянно. Введем следующие обозначения и названия для перечисленных ниже числовых множеств: ]а,Ь[:={х ЕМ. \ а < х < Ь} — интервал ab; [а, Ь] :={х € Ш \ а ^ х ^ Ь} —отрезок ab; ]а, Ь] :={х G М. | а < х 4, Ь} —полуинтервал ab, содержащий конец Ь; [a, b[ := {x G М. \ а ^ х < Ь} —полуинтервал ab, содержащий конец а. Определение 6. Интервалы, отрезки и полуинтервалы называ- называются числовыми промежутками или просто промежутками. Числа, определяющие промежуток, называются его концами. Величина Ь — а называется длиной промежутка ab. Если / — некото- некоторый промежуток, то длину его мы будем обозначать через |/| (проис- (происхождение такого обозначения вскоре станет понятным). Множества ]а, +оо[ := {х G Е | а < ж}, ]-оо, Ь[ :={х G Ш | х < Ь}, [а, +оо[ := {х € Ш | а ^ х], ]-оо, Ь] := {х € Ш \ х ^ 6}, а также ]—оо,+оо[ := R, принято называть неограниченными проме- промежутками. В соответствии с таким употреблением символов +оо (читается «плюс бесконечность») и —оо (читается «минус бесконечность») для
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 65 обозначения неограниченности числового множества X сверху (снизу), принято писать sup X — +00 (inf X = — 00). Определение 7. Интервал, содержащий точку х G К, будем на- называть окрестностью этой точки. В частности, при 6 > 0 интервал ]х — 5, х + 5[ называется 6-окрест- ностью точки х. Его длина 26. Расстояние между числами х, у G R измеряется длиной промежут- промежутка, концами которого они являются. Чтобы не разбираться при этом, «где лево, а где право», т. е. х < у или у < х, и чему равна длина, у — х или х — у, можно использовать полезную функцию {х при х > О, О при х = О, —х при х < О, называемую модулем или абсолютной величиной числа. Определение 8. Расстоянием между х, у G R называется вели- величина |ж — у\. Расстояние неотрицательно и равно нулю только при совпадении х и у; расстояние от ж до у и от у до ж одно и то же, ибо \х — у\ = \у — х\\ наконец, если z G М, то \х — у\ ^ \х — z\ + \z — у\, т.е. имеет место так называемое неравенство треугольника. Неравенство треугольника следует из свойства абсолютной величи- величины числа, которое также называется неравенством треугольника (ибо получается из предыдущего при z = 0 и замене у на —у). А именно, для любых чисел х, у справедливо неравенство причем равенство в нем имеет место в том и только в том случае, когда оба числа х, у неотрицательны или неположительны. < Если 0 ^ х и 0 ^ у, то 0 ^ х + у, \х + у\ = х + у, \х\ = х, \у\ = у и равенство установлено. Если ж ^ Оиу ^ 0, тох + у ^ 0, \х+у\ = -(х + у) = -х-у, \х\ = -х, \у\ = —у и опять равенство имеет место.
66 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Пусть теперь одно из чисел отрицательно, а другое положительно, например, х < 0 < у. Тогда либо х < х + у ^ 0, либо 0 ^ х + у < у. В первом случае |ж+у| < |ж|, во втором |ж+у| < \у\, т. е. в обоих случаях \х + у\ < \х\ + \у\. ► Используя принцип индукции, можно проверить, что ... + \хп\, причем равенство имеет место, если и только если все числа х\,...,хп одновременно неотрицательны или одновременно неположительны. Число а1" часто называется серединой или центром промежутка с концами а, Ь, поскольку оно равноудалено от концов промежутка. В частности, точка х G R является центром своей ^-окрестности ]х — S, х + 6[ и все точки ^-окрестности удалены от х меньше чем на 5. Ь. Задание числа последовательностью приближений. Изме- Измеряя реальную физическую величину, мы получаем число, которое, как правило, меняется при повторном измерении, особенно если изменить инструмент или метод измерения. Таким образом, результатом изме- измерения обычно является некоторое приближенное значение искомой ве- величины. Качество или точность измерения характеризуется, например, величиной возможного уклонения истинного значения величины от ее значения, полученного в результате измерения. При этом может слу- случиться, что точное значение величины (если оно в принципе существу- существует) мы так никогда и не предъявим. Встав, однако, на более конструк- конструктивную позицию, можно (или следует) считать, что мы вполне зна- знаем искомую величину, если в состоянии измерить ее с любой наперед заданной точностью. Такая позиция означает отождествление числа с последовательностью1) все более точных его приближений числами, по- получаемыми при измерении. Но всякое измерение есть конечная сово- совокупность сравнений с некоторым эталоном или с соизмеримой с ним его частью, поэтому результат измерения должен выражаться нату- натуральными, целыми или, более общо, рациональными числами. Значит, последовательностями рациональных чисел в принципе можно описать х'Если п — номер измерения, а хп —результат измерения, то соответствие п ■-> хп есть не что иное, как функция /: N —> R натурального аргумента, т. е., по определе- определению, последовательность (в данном случае последовательность чисел). Подробному изучению числовых последовательностей посвящен § 1 гл. III.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 67 все множество вещественных чисел, построив после должного анализа математическую копию или, лучше сказать, модель того, что делают с числами люди, не подозревающие об их аксиоматическом описании. А они вместо сложения и умножения неизвестных им измеряемых ве- величин складывают и умножают их приближенные значения (не всегда, правда, умея сказать, какое отношение имеет результат таких дей- действий к тому, что получилось бы, если бы эти действия производились с точными значениями величин; ниже мы обсудим этот вопрос). Отождествив число с последовательностью его приближенных зна- значений, мы, таким образом, желая, например, сложить два числа, долж- должны складывать последовательности их приближенных значений. Полу- Получающуюся при этом новую последовательность чисел надо считать но- новым числом, называемым суммой первых двух. Но число ли это? Дели- Деликатность вопроса состоит в том, что не каждая случайным образом по- построенная последовательность служит последовательностью сколь угодно точных приближений некоторой величины. То есть необходи- необходимо еще научиться по самой последовательности узнавать, представля- представляет она некоторое число или нет. Другой вопрос, который возникает при попытке математического копирования операций с приближенны- приближенными числами, состоит в том, что разные последовательности могут быть последовательностями приближений одной и той же величины. Соотно- Соотношение между последовательностями приближений, определяющими чи- число, и самими числами примерно такое же, как между точкой на карте и указкой, которая указывает нам эту точку. Положение указки опре- определяет точку, но точка определяет положение только конца указки, не мешая взять указку по-другому, поудобнее. Этим вопросам дал точное описание и реализовал всю намеченную здесь в общих чертах программу построения модели вещественных чи- чисел еще О. Коши1). Надо надеяться, что после изучения теории преде- пределов вы будете в состоянии самостоятельно повторить эти конструкции Коши. Сказанное до сих пор, разумеется, не претендует на математиче- математическую строгость. Цель этого неформального отступления — обратить внимание читателя на принципиальную возможность одновременного существования различных естественных моделей действительных чи- Х'О. Коши A789-1857)—французский математик, один из наиболее активных творцов современного языка и аппарата классического анализа.
68 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА сел; я пытался также дать некоторое представление об отношении чи- чисел к тому, что нас окружает, и пояснить фундаментальную роль нату- натуральных и рациональных чисел; наконец, мне хотелось показать есте- естественность и необходимость приближенных вычислений. Последующая часть настоящего пункта посвящена используемым в дальнейшем и представляющим самостоятельный интерес простым, но важным оценкам погрешностей, возникающих при арифметических операциях над приближенными величинами. Переходим к точным формулировкам. Определение 9. Если х — точное значение некоторой величины, ах — известное приближенное значение той же величины, то числа А(х) := \х — х\, называются соответственно абсолютной и относительной погрешно- погрешностью приближения х. Относительная погрешность при х = 0 не опре- определена. Поскольку значение х неизвестно, значения А(х) и 5(х) также не- неизвестны. Однако обычно бывают известны оценки сверху А (ж) < Д, S(x) < S этих величин. В этом случае говорят, что абсолютная или относительная погрешность приближения х не превосходит Д или S со- соответственно. На практике приходится иметь дело только с оценками погрешностей, поэтому сами величины Д и S часто называют абсо- абсолютной и относительной погрешностями приближения, но мы этого делать не будем. Запись х = х ± Д означает, что х — А ^ х ^. х + А. Например, гравитационная постоянная G = F,67259 ± 0,00085) • 101 Н • м2/кг2, скорость света в вакууме с = 299792458 м/с (точно), постоянная Планка h = F,6260755 ± 0,0000040) • 10~34 Дж • с, заряд электрона е = A,60217733 ± 0,00000049) ■ 109 Кл, масса покоя электрона те = (9,1093897 ± 0,0000054) • 10~31 кг. Основным показателем точности измерения является величина от- относительной погрешности приближения, обычно выражаемая в процен- процентах.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 69 Так, в приведенных примерах относительные погрешности не пре- превосходят соответственно 13 -КГ5; 0; 6 • 1(Г7; 31 • 1(Г8; 6 • 1(Г7 или, в процентах от результата измерения, 13-1(П3%; 0%; 6-1(Г5%; 31 • 1(Г6 %; 6-1(Г5%. Оценим теперь погрешности, возникающие при арифметических операциях с приближенными величинами. Утверждение. Если \х-х\ = А{х), \у-у\ = А(у), то А(х + у) := \(х + у)-(х + у)\ ^ А(х) + А(у), A) А(х -у):=\х-у-х-у\^ \х\А{у) + \у\А(х) + А{х) ■ Д(у); B) если, кроме того, уф 0, и 5{у) = \У\ то А ?1== х х У У Пусть х = х + а, у = у + 0. Тогда \х\А{у) + \у\А(х) У2 C) А(х + у) = \(х + у) - (х + у)\ = \а + fi\ ^ \а\ + Щ = А(х) + А(у), А(х ■ у) = \ху - ху\ = \(х + а)(у + /3) - ху\ = = \х/3 + уа + а/3\ ^ \х\\/3\ + \y\\a\ + \ар\ = = \х\А{у) + \у\А(х) + А{х) ■ А(у), X X У У ху-ух УУ (х + а)у - (у + р)х 1 1+P/V У2 - 6(у) \х\А(у) + \у\А(х) У2
70 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Из полученных оценок абсолютных погрешностей вытекают следу- следующие оценки относительных погрешностей: B') На практике, при работе с достаточно хорошими приближениями, А(х) • А(у) ~ 0, 5(х) ■ 6(у) и 0, 1 — 5(у) « 1, поэтому пользуются со- соответствующими упрощенными, полезными, но формально неверными вариантами формул B), C), B'), C'): А{х ■ у) ^ \х\А(у) + \у\А(х), Формулы C), C') показывают, что надо избегать деления на близ- близкие к нулю или довольно грубые приближения, когда у или 1 — 6(у) малы по абсолютной величине. Формула A') предостерегает от сложения приближенных величин, если они близки по абсолютной величине и противоположны по знаку, поскольку тогда \х + у\ близко к нулю. Во всех этих случаях погрешности могут резко возрасти. Например, пусть ваш рост дважды измерили некоторым прибором. Точность измерения ±0,5 см. Перед вторым измерением вам под ноги подложили лист бумаги. Тем не менее может случиться, что результаты измерений будут такими: Н\ = B00 ± 0,5) см и Н2 = A99,8 ± 0,5) см соответственно. Таким образом, бессмысленно искать толщину бумаги в виде разно- разности #2 — .Hi, из которой только следует, что толщина не больше 0,8см, что, конечно, очень грубо отражает (если это вообще можно назвать «отражает») истинное положение вещей.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 71 Стоит, однако, обратить внимание и на другой, более оптимистич- оптимистичный вычислительный эффект, благодаря которому грубыми приборами удается провести сравнительно тонкие измерения. Например, если на том приборе, где только что измерили ваш рост, измерили высоту пач- пачки в 1000 листов той же бумаги и получили результат B0 ± 0,5) см, то толщина одного листа @,02±0,0005) см = @,2±0,005) мм, что вытекает из формулы A). То есть с абсолютной погрешностью, не превышающей 0,005 мм, толщина одного листа равна 0,2 мм. Относительная погрешность этого измерения не превышает 0,025 или 2,5%. Эту идею можно развить и предложить, например, способ выделе- выделения слабого периодического сигнала из превышающих его случайных радиопомех, называемых обычно белым шумом. с. Позиционная система счисления. Выше говорилось о том, что каждое число можно задать последовательностью приближающих его рациональных чисел. Теперь напомним важный в вычислительном отношении метод, ко- который позволяет единообразно для каждого действительного числа строить такую последовательность рациональных приближений. Этот метод ведет к позиционной системе счисления. Лемма. Если фиксировать число q > 1, то для любого положи- положительного числа х £ Ш найдется и притом единственное целое число к £ Ъ такое, что qk~l ^ х < qk. < Проверим сначала, что множество чисел вида qk, k G N, не огра- ограничено сверху. В противном случае оно имело бы верхнюю грань s и по определению верхней грани нашлось бы натуральное число т е N та- такое, что | < qm ^ s. Но тогда s < qm+l и s — не верхняя грань нашего множества. Поскольку 1 < q, то qm < qn при т < п, т, п Е Z, поэтому мы заод- заодно показали, что для любого числа с£| найдется такое натуральное число iV G N, что при любом натуральном п > N будет с < qn. Отсюда вытекает, что для любого числа е > 0 найдется число М G N такое, что при всех натуральных т > М будет — < е. Действительно, достаточно положить с = ^, а N = М; тогда | < qm при т > М.
72 ГЛ. И. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Итак, множество целых чисел т G Z, удовлетворяющих неравен- неравенству х < qm при х > 0, ограничено снизу. Тогда в нем есть минималь- минимальный элемент к, который, очевидно, и будет искомым, так как для него дк-1 ^ х < qk Единственность такого целого числа к следует из того, что если т, п G Z и, например, т < п, то т ^ п — 1, и поэтому если q > 1, то qm ^ д". Действительно, из этого замечания видно, что неравенства qm~l ^ ^ х < qm и qn~l ^ х < qn, из которых следует qn~1 ^ х < qm, несо- несовместны при т ф п. ► Воспользуемся этой леммой в следующей конструкции. • Фиксируем q > 1 и возьмем произвольное положительное число х ем. По лемме найдем единственное число р G Z такое, что qp < х < qp+l A) Определение 10. Число р, удовлетворяющее соотношению A), называется порядком числа х по основанию q или (при фиксирован- фиксированном q) просто порядком числа х. По принципу Архимеда найдем единственное натуральное число ар G N такое, что арЧГ ^ х < ар<Г + у • B) Учитывая A), можно утверждать, что ар £ {1,... ,q — 1}. Все дальнейшие шаги нашего построения будут повторять тот шаг, который мы сейчас сделаем, исходя из соотношения B). Из соотношения B) и принципа Архимеда следует, что существует и притом единственное число ap_i е{0,1,...,<? — 1} такое, что Если уже сделано п таких шагов и получено, что ap<f + ctp-iQpl + • • • + cip-nqp~n ^ ^ х < apqp + ap-xqp~l + ... + ap-nqp~n + qp~n,
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 73 то по принципу Архимеда найдется единственное число ap_n_i G £ {0,1,..., д — 1} такое, что apqp + ... + ap_n/~" + ap-n-l(f-n-1 ^ Таким образом, указан алгоритм, по которому положительному чи- числу х однозначно ставится в соответствие последовательность чисел Op,ap-i,..., ар_„,... из множества {0,1,..., д — 1} или, менее формаль- формально, последовательность рациональных чисел гп специального вида: гп = ардр + ... + ар-пдр-п, D) причем так, что гп^х<гп + -^. E) Иными словами, мы строим всё лучшие приближения снизу и сверху для числа х посредством специальной последовательности рациональ- рациональных чисел D). Символ ар...ар-п... есть шифр всей последователь- последовательности {гп}. Чтобы по нему можно было восстановить последователь- последовательность {гга}, необходимо как-то отметить величину р—порядок числа х. Условились при р ^ 0 после ао ставить точку или запятую; при р < О слева от ар дописывать \р\ нулей и после крайнего левого ставить точку или запятую (напомним, что ар ф 0). Например, при д = 10 123,45 := 1 • 102 + 2 • 101 + 3 • 10° + 4 ■ КГ1 + 5 • КГ2, 0,00123 := 1 • 10~3 + 2 • 10~4 + 3 • 10; при q = 2 1000,001 := 1 • 23 + 1 • 2~3. Таким образом, значение цифры в символе ар ... ар-п... зависит от позиции, которую она занимает по отношению к точке или запятой. После этого соглашения символ ар ... ао,... позволяет однозначно восстановить всю последовательность приближений. Из неравенств E) видно (проверьте!), что двум различным числам х, х' отвечают различные последовательности {гп}, {г'п}, а значит, и разные символы ар... ао,..., ар ... а0,...
74 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Теперь решим вопрос, всякому ли символу вида ар... од,... отвеча- отвечает некоторое число х G R. Оказывается, нет. Заметим, что в силу описанного алгоритма последовательного по- получения чисел ар-п G {0,1,... , q — 1} не может случиться так, что все они, начиная с некоторого, будут одинаковы и равны q — 1. Действительно, если при п > к + {q- l)ef-* + ... + (<? 11 Гп = Гк + ^-—, F) то в силу E) 1 1 1 Тогда для любого п > к что, как мы знаем из доказанной выше леммы, невозможно. Полезно также отметить, что если среди чисел ap_fc_i,..., ар-п хотя бы одно меньше q — 1, то вместо F) можно написать, что 1 1 + " л пк~Р пп~Р или, что то же самое, rn + -~<rk + -^rp. G) Теперь мы в состоянии доказать, что любой символ ап ... од,..., со- составленный из чисел ак £ {0,1,..., q — 1}, в котором как угодно далеко встречаются числа, отличные от q— 1, соответствует некоторому числу В самом деле, по символу ар ... ар^п... построим последователь- последовательность {гп} вида D). В силу того, что г$ ^ г\ ^ ... ^ гп ^ ..., а также учитывая F) и G), имеем 1 1 1 Г0^Г1^...^...<...^Гп + -_^...^Г1 + -1-^Г0 + _. (8)
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 75 Знак строгого неравенства в последнем соотношении следует по- понимать так: любой элемент левой последовательности меньше любого элемента правой последовательности. Это вытекает иэ G). Если теперь взять а; = suprn (= inf (rn+q~(n~p})), то последователь- последовательность rnбудет удовлетворять условиям D), E), т. е. символ ар... ар^п... отвечает найденному числу х б М. Итак, каждому положительному числу а; € М мы взаимно однознач- однозначно сопоставили символ вида ар ... ао,..., если р ^ О, или 0,0 ... 0 ар ..., \р\ нулей если р < 0. Он называется q-ичной позиционной записью числа х; циф- цифры, входящие в символ, называют знаками; позиции знаков относитель- относительно запятой называются разрядами. Числу х < 0 условимся сопоставлять взятый со знаком минус символ положительного числа —х. Наконец, числу 0 отнесем символ 0,0... 0... Тем самым завершено построение позиционной q-ичной системы за- записи действительных чисел. Наиболее употребительными являются десятичная система (в оби- обиходе) и по техническим причинам двоичная (в электронных вычисли- вычислительных машинах). Менее распространены, но также используются в элементах вычислительной техники троичная и восьмеричная системы. Формулы D), E) показывают, что если в g-ичной записи числа х оставить только конечное число знаков (или, если угодно, заменить остальные знаки нулями), то абсолютная погрешность получающегося при этом приближения D) числа х не превысит единицы последнего сохраняемого разряда. Это наблюдение позволяет в соответствии с полученными в под- подпункте b формулами оценивать погрешности, возникающие при ариф- арифметических операциях над числами в результате замены точных зна- значений чисел соответствующими приближенными значениями вида D). Последнее замечание имеет также определенную теоретическую ценность. А именно, если в соответствии с идеей подпункта b мы ото- отождествим вещественное число х с его g-ичной записью, то, научившись выполнять арифметические действия непосредственно над д-ичными символами, мы построим новую модель действительных чисел, по-ви- по-видимому, наиболее ценную с вычислительной точки зрения. Основные задачи, которые пришлось бы решать на этом пути, та- таковы.
76 ГЛ. И. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Надо двум g-ичным символам поставить в соответствие новый сим- символ— сумму исходных. Он, естественно, строится постепенно, а имен- именно, складывая все более точные рациональные приближения исходных чисел, будем получать соответствующие рациональные приближения их суммы. Пользуясь сделанным выше замечанием, можно показать, что по мере увеличения точности приближений слагаемых мы будем получать все больше таких g-ичных знаков суммы, которые уже не ме- меняются при последующем уточнении приближений. Тот же вопрос надо решать и относительно умножения. Другой, менее конструктивный путь перехода от рациональных чи- чисел ко всем действительным числам принадлежит Дедекинду. Дедекинд отождествляет действительное число с сечением в мно- множестве Q рациональных чисел, т. е. с разбиением Q на два не имеющих общих элементов множества А, В таких, что Vo € А УЬ Е В (а < Ъ). При таком подходе к действительным числам принятая нами аксиома полноты (непрерывности) становится известной теоремой Дедекинда. По этой причине аксиому полноты в принятой нами форме часто на- называют аксиомой Дедекинда. Итак, в настоящем параграфе выделены важнейшие классы чисел. Показана фундаментальная роль натуральных и рациональных чисел. Показано, как из принятой нами аксиоматики1) вытекают основные свойства этих чисел. Дано представление о различных моделях множе- множества действительных чисел. Обсуждены вычислительные аспекты тео- теории действительных чисел: оценки погрешностей при арифметических операциях с приближенными величинами; g-ичная позиционная система счисления. Задачи и упражнения 1. Опираясь на принцип индукции, покажите, что a) сумма х\ + ... + хп вещественных чисел определена независимо от рас- расстановки скобок, предписывающих порядок сложения; b) то же для произведения х\...хп; c) \xi + ... + xn\ ^ |a;i| + ... + |a;n|; d) |a;i —аг„] = |a;i|... |ж„|; ^ Почти в приведенном выше виде она была сформулирована на рубеже XX века Гильбертом; см., например, в кн.: Гильберт Д. Основания геометрии. М.: Гостех- издат, 1948. (Добавление VI: О понятии числа.)
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 77 e) ((то, п е N) Л (то < п)) =» ((п - то) € N); f) A + ж)п ^ 1 + пх при а; > — 1 и п 6 N, причем равенство возможно либо при п = 1, либо при а; = 0 (неравенство Бернулли); g) (а + Ь)п = ап + ^а"-^ + ^^1ап-2Ь2 + ... + w(W(~1Ji)!"'2aftf>~1 + Ъп (бином Ньютона). 2. а) Проверьте, что Z и Q—индуктивные множества. Ь) Приведите примеры индуктивных множеств, отличных от N, Z, Q, Е. 3. Покажите, что любое индуктивное множество не ограничено сверху. 4. а) Любое индуктивное множество бесконечно (т. е. равномощно своему подмножеству, отличному от него самого). Ь) Множество Еп = {х € N | х ^ п) конечно (caxdEn обозначают через п). 5. а) Алгоритм Евклида. Пусть то, п € N и то > п. Наибольший общий де- делитель (НОД(то, п) = d € N) можно за конечное число шагов найти, пользуясь следующим алгоритмом Евклида последовательного деления с остатком: то = qin + г\ (г\ < п), +Г2 (Г2 <п), + ГЗ (ГЗ<Г2), Гк-1 = Чк+\Гк + О, b) Если d = НОД(то,п), то можно подобрать числа р, q € Z так, что рт + qn = d; в частности, если то, п взаимно просты, то рт + qn = 1. 6. Попробуйте самостоятельно доказать основную теорему арифметики (формулировка в тексте § 2, п. 2а). 7. Если произведение то ■ п натуральных чисел делится на простое число р, т. е. т ■ п = р ■ к, где к € N, то либо то, либо п делится на р. 8. Из основной теоремы арифметики следует, что множество простых чи- чисел бесконечно. 9. Покажите, что если натуральное число п не имеет вида кт, где к, то € N, то уравнение хт = п не имеет рациональных корней. 10. Покажите, что запись рационального числа в любой g-ичной системе счисления периодична, т.е., начиная с некоторого разряда, состоит из перио- периодически повторяющейся группы цифр. 11. Иррациональное число а € Ж назовем хорошо приближаемым рацио- рациональными числами, если для любых натуральных чисел п, N € N существует рациональное число £ такое, что а - £ < —Ц-. Я Я | Nqn а) Постройте пример хорошо приближаемого иррационального числа.
78 ГЛ. П. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Ь) Докажите, что хорошо приближаемое иррациональное число не может быть алгебраическим, т.е. оно трансцендентно (теорема Лиувилля1^). 12. Зная, что по определению дроби ^ := то ■ п~1, где то € Z, п € N, вывести «правила» сложения, умножения, деления дробей, а также условие ра- равенства двух дробей. 13. Проверьте, что рациональные числа Q удовлетворяют всем аксиомам действительных чисел, кроме аксиомы полноты. 14. Принимая геометрическую модель множества действительных чи- чисел— числовую ось, покажите, как в этой модели строить числа а + Ь, а — Ь, 15. а) Проиллюстрируйте аксиому полноты на числовой оси. Ь) Докажите, что принцип верхней грани эквивалентен аксиоме полноты. 16. а) Если АсВсК, то sup A ^ sup В, a inf A ^ inf В. b) Пусть iDl/0 и I D У / 0. Если Va; € X и Vj/ € Y выполнено х sj у, то X ограничено сверху, Y — снизу и supX sj inf У. c) Если множества X, Y из Ь) таковы, что X UY = Ш, то swpX = inf У. d) Если X, Y—множества, определенные в с), то либо ЗтахХ, либо ЗттУ (теорема Дедекинда). e) (Продолжение.) Покажите, что теорема Дедекинда эквивалентна акси- аксиоме полноты. 17. Пусть А + В — множество чисел вида а + Ь и А • В — множество чисел вида а ■ Ь, где аеАсЖиЬеВсШ. Проверьте, всегда ли a) вир(Л + В) — sup A + sup В; b) sup(A ■ В) = sup A ■ sup В. 18. Пусть —А есть множество чисел вида -а, где а € А С К. Покажите, что sup(—A) = —inf Л. 19. а) Покажите, что уравнение хп = а при п € N и а > 0 имеет положи- положительный корень (обозначаемый \/а или а1/<п). Ь) Проверьте, что при а > 0, 6 > 0 и п, то € N c) (al/n)m = (атI/п =: ат/п и а1/" • а1/ = а1/п+1/т. d) (ат'п)-х = (а)™/" =: а~т'п. e) Покажите, что для любых п, т^ € Q аГ1 ■ аГ2 = аГ1+Г2 и (аГ1)Г2 = аГ1Г2. 20. а) Покажите, что отношение включения есть отношение частичной (но не полной!) упорядоченности множеств. . Лиувилль A809-1882)—французский математик; работы по комплексному анализу, геометрии, дифференциальным уравнениям, теории чисел, механике.
§ 2. ВАЖНЕЙШИЕ КЛАССЫ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ 79 Ь) Пусть А, В, С — такие множества, что АсС,ВсС,А\Вф0 и В\А ф 0. Частичный порядок в этой тройке введем, как в а). Укажите макси- максимальный и минимальные элементы множества {А, В, С}. (Обратите внимание на неединственность!) 21. а) Покажите, что так же, как и множество Q рациональных чисел, множество <О(у/п) чисел вида а + Ьу/п, где а, Ь € Q, a n — фиксированное на- натуральное число, не являющееся квадратом целого числа, есть упорядоченное поле, удовлетворяющее принципу Архимеда, но не удовлетворяющее аксиоме полноты. b) Проверьте, какие из аксиом действительных чисел не будут удовлетво- удовлетворяться для Q(y/n), если в Q(v/ft) оставить прежние арифметические операции, а отношение порядка ввести по правилу (а + by/п $С а' + Ь'у/п) := (F ^ b')V V(F = b')Л (а sj а')))- Будет ли тогда для Q(y/n) выполнен принцип Архимеда? c) Упорядочите множество F[x] многочленов с рациональными или дей- действительными коэффициентами, считая Рт{х) = а0 + а\х + ... + атхт >■ 0, если ат > 0. d) Покажите, что множество Q(a;) всех рациональных дробей _ а0 + агх + ... + атхт m'"~ bo + hx + ... + bnxn с коэффициентами из Q или лз Е после введения в нем порядка Дт)П >- 0, если у11 > 0, и обычных арифметических операций становится упорядоченным, но не архимедовым полем. Это означает, что принцип Архимеда не может быть выведен из аксиом Е, минуя аксиому полноты. 22. Пусть п € N и п > 1. В множестве Еп = {0,1,... ,п} определим сум- сумму и произведение элементов как остаток от деления на п «обычной» суммы и произведения этих чисел в Ш. Множество Еп с так определенными в нем операциями обозначают символом Ъп. a) Покажите, что если п не простое число, то в Ъп есть такие отличные от нуля числа то, к, что то • к = 0. (Такие числа называются делителями нуля.) Это значит, что из а ■ b = с ■ b даже при b ф 0 в Ъп не следует, что а — с. b) Покажите, что при простом р в Ър отсутствуют делители нуля и Zp есть поле. c) Покажите, что ни при каком простом р поле Zp нельзя упорядочить так, чтобы этот порядок был согласован с арифметическими операциями Zp. 23. Покажите, что если 1и1' — две модели множества действительных чисел, а/: Е -> К'—такое отображение, что f(x + у) = f(x) + f(y) и f(x-y) = = f(x) ■ f(y) для любых х, у € Е, то: a) /@) = 0'; b) /A) = 1', если f(x) ^ 0', что мы дальше будем считать выполненным; c) /(то) = то', где то € Z и то' € Z', причем отображение /: Z -> Z' биективно и сохраняет порядок;
80 ГЛ. И. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА d) / (£) = *£, где то, п е Z, пфО, то', п' е Z', п' ^ 0', /(то) = то', /(п) = п'. Таким образом, /: Q -> Q* есть сохраняющая порядок биекция. e) /: К -> Ж' есть биективное, сохраняющее порядок отображение. 24. Опираясь на предыдущую задачу и аксиому полноты, покажите, что аксиоматика множества действительных чисел определяет его полностью с точностью до изоморфизма (до способа реализации), т.е. что если К и К' — два множества, удовлетворяющие аксиоматике, то существует взаимно одно- однозначное отображение /: К -> Ж, сохраняющее арифметические операции и порядок: f{x + y) = f{x) + f(y), f(x-y) = f{x)-f(y) и {x ^ у) <3> (f(x) ^ f{y)). 25. В ЭВМ число х представляется в виде q n=l Ч к где р—порядок х, а М = J2 ^ —мантисса числа х (| $С М < 1). n=i Q При этом машина оперирует только с определенным диапазоном чисел: при q = 2 обычно |р| sj 64, а к = 35. Оцените этот диапазон в десятичной системе. 26. а) Напишите таблицу умножения (размера 6x6) для шестеричной системы счисления. b) Пользуясь результатом задачи а), перемножьте «столбиком» в шесте- шестеричной системе E32N Х A45N и проверьте свои действия, повторив вычисления в десятичной системе. c) Поделите «уголком» A301)в|B5N и проверьте свои действия, повторив вычисления в десятичной системе. d) Проведите сложение «столбиком» D052N C125N 27. Запишите A00)ю в двоичной и троичной системах. 28. а) Покажите, что наряду с единственностью записи целого числа в виде (апап_! ...ао)з, где сц € {0,1,2}, возможна и также единственна его запись в виде (/?„/?„-!... А,) 3, где (Зе {-1,0,1}.
§ 3. ОСНОВНЫЕ ЛЕММЫ, СВЯЗАННЫЕ С ПОЛНОТОЙ R 81 Ь) Каково наибольшее число монет, из которых тремя взвешиваниями на чашечных весах можно выделить одну фальшивую, если известно только, что она отличается от остальных монет по весу? 29. Какое наименьшее количество вопросов с ответами «да» или «нет» надо задать, чтобы узнать любой из семизначных телефонных номеров? 30. а) Сколько различных чисел можно задать с помощью 20 десятичных знаков (например, два разряда по 10 возможных знаков в каждом)? Тот же вопрос для двоичной системы. В пользу экономичности какой из этих систем говорит сравнение результатов? b) Оцените количество различных чисел, которые можно записать, распо- располагая п знаками g-ичной системы. (Ответ: qn/q.) c) Нарисуйте график функции f(x) = xn/x над множеством натуральных значений аргумента и сравните экономичность различных систем счисления. § 3. Основные леммы, связанные с полнотой множества действительных чисел Здесь мы установим несколько простых полезных принципов, каж- каждый из которых можно было бы положить в основу построения теории вещественных чисел в качестве аксиомы полноты1'. Эти принципы мы назвали основными леммами в соответствии с их широким использованием во всевозможных доказательствах теорем анализа. 1. Лемма о вложенных отрезках (принцип Коши - Кантора) Определение 1. Функцию /: N —> X натурального аргумента называют последовательностью или, полнее, последовательностью элементов множества X. Значение f(n) функции /, соответствующее числу п € N, часто обо- обозначают через хп и называют п-м членом последовательности. Определение 2. Пусть Х\,Х2, ■ ■ ■ ,Хп,... —последовательность каких-то множеств. Если Х\ D X2 D ... D Xn D ..., т. е. Vn 6 N (Хп D Xn+i), то говорят, что имеется последовательность вложенных множеств. Лемма (Коши - Кантор). Для любой последовательности I\ D Э h Э ... D In D ■ ■ ■ вложенных отрезков найдется точка с 6 1, принадлежащая всем этим отрезкам. ''См. задачу 4 в конце параграфа. 4-4573
82 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Если, кроме того, известно, что для любого е > 0 в последова- последовательности можно найти отрезок Ik, длина которого |/д.| < е, то с — единственная общая точка всех отрезков. < Заметим прежде всего, что для любых двух отрезков 1т = [ат, Ьт], In = [ощЬп] нашей последовательности имеет место пт ^ Ьп. Действи- Действительно, в противном случае мы получили бы ап ^ Ъп < ат ^ Ьт, т.е. отрезки 1т, 1п не имели бы общих точек, в то время как один из них (имеющий больший номер) должен содержаться в другом. Таким образом, для числовых множеств А — {ат | m £ N}, В = = {Ьп | п € N} выполнены условия аксиомы полноты, в силу которой найдется число сб! такое, что Vam £ А, \/Ьп € В выполнено ат ^ с ^ ^ Ьп. В частности, ап ^ с ^ Ъп для любого п G N. Но это и означает, что точка с принадлежит всем отрезкам 1„. Пусть теперь с\ и С2 — две точки, обладающие этим свойством. Если они различны и, например, с\ < г>2, то при любом п £ N имеем ап ^ с\ < < С2 ^ Ьп, поэтому 0 < С2 — с,[ < Ьп ~ ап и длина каждого отрезка нашей последовательности не может быть меньше положительной величины С2 — с\. Значит, если в последовательности есть отрезки сколь угодно малой длины, то общая точка у них единственная. ► 2. Лемма о конечном покрытии (принцип Бореля-Лебега) Определение 3. Говорят, что система S = {X} множеств X по- покрывает множество Y, если Y С (J Х,(т.е. если любой элемент у xes множества Y содержится по крайней мере в одном из множеств X си- системы S). Подмножество множества S = {X}, являющегося системой мно- множеств, будем называть подсистемой системы S. Таким образом, под- подсистема системы множеств сама является системой множеств того же типа. Лемма (Борель- Лебег1'). В любой системе -интервалов, покры- покрывающей отрезок, имеется конечная подсистема, покрывающая этот отрезок. г'Э. Борель A871 - 1956), А. Лебег A875 - 1941) -известные французские матема- математики, специалисты в области теории функций.
§ 3 ОСНОВНЫЕ ЛЕММЫ, СВЯЗАННЫЕ С ПОЛНОТОЙ R 83 •4 Пусть S = {U}—система интервалов U, покрывающая отрезок [а,Ь] = 1\. Если бы отрезок 1\ не допускал покрытия конечным набором интервалов системы S, то, поделив 1\ пополам, мы получили бы, что по крайней мере одна из его половинок, которую мы обозначим через /2, тоже не допускает конечного покрытия. С отрезком 1ч проделаем ту же процедуру деления пополам, получим отрезок /з и т.д. Таким образом, возникает последовательность l\ D I2 ^> ■ ■ ■ D In D Э ... вложенных отрезков, не допускающих конечного покрытия интер- интервалами системы S. Поскольку длина отрезка, полученного на п-м ша- шаге, по построению равна \1п\ = |/i| ■ 2~п, то в последовательности {/„} есть отрезки сколь угодно малой длины (см. лемму из §2, п. 4с). По лемме о вложенных отрезках существует точка с, принадлежащая всем отрезкам /„, п € N. Поскольку с € 1\ = [а,Ь], то найдется интервал ]а,/3[ = U € S системы S, содержащий точку с, т. е. а < с < /3. Пусть е = min{c — а,/3 — с]. Найдем в построенной последовательности та- такой отрезок /„, что |/„| < е. Поскольку с € 1п и |Лг| < £> заключаем, что In (Z U — ]а, C[. Но это противоречит тому, что отрезок /„ нельзя покрыть конечным набором интервалов системы. ► 3. Лемма о предельной точке (принцип Больцано — Вейер- штрасса). Напомним, что окрестностью точки х € Ш мы назвали ин- интервал, содержащий эту точку; J-окрестностью точки х —интервал ]х - 5, х + 6[. Определение 4. Точка р € Ш называется предельной точкой мно- множества JcM, если любая окрестность этой точки содержит бесконеч- бесконечное подмножество множества X. Это условие, очевидно, равносильно тому, что в любой окрестности точки р есть по крайней мере одна не совпадающая с р точка множе- множества X. (Проверьте!) Приведем несколько примеров. Если X = < — €.Ш\п EN>, то предельной для X является только точка 0 € U. Для интервала ]а, Ь[ предельной является каждая точка отрезка [а, 6], и других предельных точек в этом случае нет. Для множества Q рациональных чисел предельной является каждая точка К, ибо, как мы знаем, в любом интервале вещественных чисел имеются рациональные числа.
84 ГЛ. И. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА Лемма (Больцано -Вейерштрасс1)). Всякое бесконечное ограни- ограниченное числовое множество имеет по крайней мере одну предельную точку. 4 Пусть X — данное подмножество Ш. Из определения ограничен- ограниченности множества X следует, что X содержится в некотором отрезке [а, Ь\ = I С М. Покажем, что по крайней мере одна из точек отрезка / является предельной для X. Если бы это было не так, то каждая точка х € / имела бы ок- окрестность U(x), в которой либо вообще нет точек множества X, ли- либо их там конечное число. Совокупность {U(x)} таких окрестностей, построенных для каждой точки х € /, образует покрытие отрезка / интервалами U(x), из которого по лемме о конечном покрытии можно извлечь конечную систему U(xi),..., U(xn) интервалов, покрывающую отрезок /. Но, поскольку X С /, эта же система покрывает все мно- множество X. Однако в каждом интервале U(xi) только конечное число точек множества X, значит, и в их объединении тоже конечное число точек X, т.е. X—конечное множество. Полученное противоречие за- завершает доказательство. ► Задачи и упражнения 1. Покажите, что a) если / — произвольная система вложенных отрезков, то sup{a е Ш | [а, Ъ] 6 1} = а ^ /3 = inf{Ъ е Ж \ [а, Ъ] £ 1} и [а, 0\ - f] [а, Ь]; [а,Ь]€1 b) если / — система вложенных интервалов ]а, Ь[, то пересечение f] ]а, Ь[ ]а,Ь[€1 может оказаться пустым. Указание: ]ап,Ьп[ = ]о, ~^. 2. Покажите, что a) из системы отрезков, покрывающей отрезок, не всегда можно выделить конечную подсистему, покрывающую этот отрезок; b) из системы интервалов, покрывающей интервал, не всегда можно вы- выделить конечную подсистему, покрывающую этот интервал; c) из системы отрезков, покрывающей интервал, не всегда можно выделить конечную подсистему, покрывающую этот интервал. ^Б. Больцано A781-1848)—чешский математик и философ; К. Вейерштрасс A815 -1897) —немецкий математик, уделявший большое внимание логическому обо- обоснованию математического анализа.
§ 4. СЧЕТНЫЕ И НЕСЧЕТНЫЕ МНОЖЕСТВА 85 3. Покажите, что если вместо полного множества Ш всех вещественных чисел взять только множество Q рациональных чисел, а под отрезком, интер- интервалом и окрестностью точки г € Q понимать соответствующие подмноже- подмножества Q, то ни одна из доказанных выше трех основных лемм не останется в силе. 4. Покажите, что если в качестве аксиомы полноты множества действи- действительных чисел взять a) принцип Больцано-Вейерштрасса или b) принцип Бореля- Лебега, то получится равносильная прежней система аксиом Ш. Указание. Из а) следует принцип Архимеда и аксиома полноты в преж- прежней форме. c) Замена аксиомы полноты принципом Коши-Кантора приводит к систе- системе аксиом, которая становится равносильной исходной, если кроме принципа Коши-Кантора постулировать также принцип Архимеда (см. задачу 21 пре- предыдущего параграфа). §4. Счетные и несчетные множества Сейчас мы сделаем небольшое, полезное для дальнейшего добавле- добавление к тем сведениям о множествах, которые уже были изложены в гла- главе I. 1. Счетные множества Определение 1. Множество X называется счетным, если оно равномощно множеству N натуральных чисел, т.е. cardX = cardN. Утверждение, а) Бесконечное подмножество счетного множе- множества счетно. Ь) Объединение множеств конечной или счетной системы счет- счетных множество есть множество счетное. 4 а) Достаточно проверить, что всякое бесконечное подмножест- подмножество Е множества N натуральных чисел равномощно N. Нужное биектив- биективное отображение /: N —> Е построим следующим образом. В Е\ := Е имеется минимальный элемент, который мы сопоставим числу 1 (Е N и обозначим е\ £ Е. Множество Е бесконечно, поэтому Е? := Е\е\ непу- непусто. Минимальный элемент множества Е?2 сопоставим числу 2 и назо- назовем его е2 & i?2- Затем рассмотрим Е% := Е \ {ei, ег} и т. д. Поскольку Е—бесконечное множество, то построение не может оборваться ни на
86 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА каком шаге с номером п £ N, и, как следует из принципа индукции, таким способом каждому числу п G N будет сопоставлено некоторое число еп G Е. Построенное отображение /: N —> Е, очевидно, инъек- тивно. Остается проверить его сюръективность, т.е. что /(N) = Е. Пусть е (Е Е. Множество {п € N | n ^ в} конечно, и тем более конечно его подмножество {п G Е | п ^ е}. Пусть fc —число элементов в последнем множестве. Тогда по построению е = е^. Ь) Если Xi,..., Хп,... — счетная система множеств, причем каждое множество Хт = {х^,..., х^, • • • } само счетно, то поскольку мощность множества X = (J Хп, состоящего из элементов x™t, где гп, п G N, neN не меньше мощности каждого из множеств Хт, то X бесконечное множество. Элемент х^ G Хт можно отождествить с задающей его упорядоченной парой (т, п) натуральных чисел. Тогда мощность X не больше мощности множества таких упорядоченных пар. Но отображе- отображение /: NxN -> N, задаваемое формулой (т,п) \—у (»' + п)(т + п + 1)+ТО; как легко проверить, биективно (оно имеет наглядный смысл: мы нуме- нумеруем точки плоскости с координатами (?/;,, н), последовательно переходя от точек одной диагонали, где гп + п постоянно, к точкам следующей, где эта сумма на 1 больше). Таким образом, множество упорядоченных пар (гп, п) натуральных чисел счетно. Но тогда cardX ^ cardN и, поскольку X—бесконечное множество, на основании доказанного в а) заключаем, что card X = = card N. ► Из доказанного утверждения следует, что любое подмножество счетного множества либо конечно, либо счетно. Если про множество известно, что оно либо конечно, либо счетно, то говорят, что оно не более чем счетно (равносильная запись: cardX ^ cardN). Мы можем, в частности, утверждать теперь, что объединение не более чем счетного семейства не более, чем счетных множеств само не более чем счетно. Следствия. 1) cardZ = cardN. 2) cardN2 = cardN Этот результат означает, что прямое произведение счетных мно- множеств счетно. 3) cardQ = cardN, т. е. множество рациональных чисел счетно.
§4 СЧЕТНЫЕ И НЕСЧЕТНЫЕ МНОЖЕСТВА 87 •^ Рациональное число Щ задается упорядоченной парой (т, п) це- целых чисел. Две пары (т, п), (т', п') задают одно и то же рациональное число в том и только в том случае, когда они пропорциональны. Таким обра- образом, выбирая каждый раз для записи рационального числа единствен- единственную пару (т, п) с минимальным возможным натуральным знаменате- знаменателем п £ N, мы получим, что множество Q равномощно некоторому бесконечному подмножеству множества Z x Z. Но cardZ2 = cardN и, значит, card Q = card N. ► 4) Множество алгебраических чисел счетно. ^ Заметим сначала, что из равенства card Q x Q = card N по индук- индукции получаем, что для любого k Е N выполнено card Q^ = card N. Элемент г G Q^ есть упорядоченный набор (г\,..., г&) к рациональ- рациональных чисел. Алгебраическое уравнение степени А; с рациональными коэффициен- коэффициентами можно записать в приведенном виде хк + г\хк~1 + ... + г к = 0, где коэффициент при старшей степени равен 1. Таким образом, различных алгебраических уравнений степени А; столько же, сколько различных упорядоченных наборов (г\,... ,Гк) рациональных чисел, т.е. счетное множество. Алгебраических уравнений с рациональными коэффициентами (про- (произвольных степеней) тоже счетное множество как счетное объединение (по степеням) счетных множеств. У каждого такого уравнения лишь ко- конечное число корней, значит, множество алгебраических чисел не более чем счетно. Но оно бесконечно и, значит, счетно. ► 2. Мощность континуума Определение 2. Множество К действительных чисел называют также числовым континуумом1', а его мощность — мощностью кон- континуума. Теорема (Кантор), cardN< card 1R. Теорема утверждает, что бесконечное множество Ш имеет мощность большую, чем бесконечное множество N. ''Continuum (лат ) — непрерывное, сплошное
88 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА ■^ Покажем, что уже множество точек отрезка [0,1] несчетно. Предположим, что оно счетно, т. е. может быть записано в виде последовательности Х\,Х2, ■ ■ ■ ,хп,... Возьмем точку х\ и на отрезке [0,1] = /о фиксируем отрезок ненулевой длины, не содержащий точ- точку х\. В отрезке 1\ строим отрезок fy, не содержащий Х2, и если уже построен отрезок /„, то, поскольку \1п\ > 0, в нем строим отрезок /п+1 так, что хП4-1 ^ Лг+i и l-^n+il > О- По лемме о вложенных отрезках най- найдется точка с, принадлежащая всем отрезкам /о, 1\,..., /п,... Но эта точка отрезка Iq = [0,1] по построению не может совпадать ни с одной из точек последовательности х\, Х2,..., хп,... ► Следствия. 1) Q ф М. и существуют иррациональные числа. 2) Существуют трансцендентные числа, поскольку множество алгебраических чисел счетно. (После решения задачи 3, помещенной в конце параграфа, читатель, наверное, захочет переиначить последнее утверждение и сформулиро- сформулировать его так: «В множестве действительных чисел иногда встречаются также и алгебраические числа».) Уже на заре теории множеств возник вопрос о том, существуют ли множества промежуточной мощности между счетными множествами и множествами мощности континуума, и было высказано предположение, называемое гипотезой континуума, что промежуточные мощности от- отсутствуют. Вопрос оказался глубоко затрагивающим основания математики. Он был окончательно решен в 1963 г. современным американским мате- математиком П. Коэном. Коэн доказал неразрешимость гипотезы контину- континуума, показав, что и она сама, и ее отрицание порознь не противоречат принятой в теории множеств аксиоматике, а потому гипотеза конти- континуума не может быть ни доказана, ни опровергнута в рамках этой ак- аксиоматики,— ситуация, вполне аналогичная независимости пятого по- постулата Евклида о параллельных от остальных аксиом геометрии. Задачи и упражнения 1. Покажите, что множество всех действительных чисел равномощно мно- множеству точек интервала ] —1,1[. 2. Установите непосредственно взаимно однозначное соответствие между a) точками двух интервалов; b) точками двух отрезков;
§ 4. СЧЕТНЫЕ И НЕСЧЕТНЫЕ МНОЖЕСТВА 89 c) точками отрезка и интервала; d) точками отрезка [0,1] и множеством Ш. 3. Покажите, что a) любое бесконечное множество содержит счетное подмножество; b) множество четных чисел равномощно множеству всех натуральных чисел; c) объединение бесконечного множества и не более чем счетного множе- множества имеет ту же мощность, что и исходное бесконечное множество; d) множество иррациональных чисел имеет мощность континуума; e) множество трансцендентных чисел имеет мощность континуума. 4. Покажите, что a) множество {ni < 712 < ... } возрастающих последовательностей нату- натуральных чисел равномощно множеству дробей вида 0,aiO2 • • •; b) множество всех подмножеств счетного множества имеет мощность кон- континуума. 5. Покажите, что a) множество V{X) подмножеств множества X равномощно множеству всех функций на X со значениями 0,1, т.е. множеству отображений /: X —> ^{0,1}; b) для конечного множества X из п элементов card'P(X) = 2П; c) учитывая результаты задач 4Ь) и 5а), можно писать, что card"P(X) = = 2cardX и, в частности, cardP(N) = 2cardN = card К; d) для любого множества X card X < 2card x, в частности, п < 2п при любом п б N. Указание. См. теорему Кантора в п. 1 §4, гл.I. 6. Пусть Х\,..., Хт —конечная система конечных множеств. Покажите, что card I М Хг 1 = V^ cardX4 - \t=i / ti - ]Г card(Xn ПХ,2)+ ]Г card(Xtl П Xl2 П1,3)- 1\<12 4<*2<г3 - ... + (-I)™ card(X! П ... П Хт), причем суммирование ведется по всевозможным наборам индексов в пределах 1,...,т, удовлетворяющих указанным под знаком суммы неравенствам.
90 ГЛ. II. ДЕЙСТВИТЕЛЬНЫЕ (ВЕЩЕСТВЕННЫЕ) ЧИСЛА 7. На отрезке [0,1] с Ж изобразите множество чисел х € [0,1], троичная запись которых х = О^агаз • • •> где а, е {0,1,2}, обладает свойством: а) «1 ф 1; Ъ){а1ф1)Г\{а2ф1); с) Vi 6 N {аг ф 1) (канторово множество). 8. (Продолжение задачи 7.) Покажите, что a) множество тех чисел х € [0,1], троичная запись которых не содержит 1, равномощно множеству всех чисел, двоичное представление которых имеет вид 0,/3i/32. •.; b) канторово множество равномощно множеству всех точек отрезка [0,1].
ГЛАВА III ПРЕДЕЛ Обсуждая различные стороны понятия действительного числа, мы, в частности, отметили, что при измерении реальных физических ве- величин получаются последовательности их приближенных значений, с которыми затем и приходится работать. Такое положение дел немедленно вызывает по крайней мере три сле- следующих вопроса: 1) Какое отношение имеет полученная последовательность прибли- приближений к измеряемой величине? Мы имеем в виду математическую сто- сторону дела, т.е. мы хотим получить точную запись того, что вообще означает выражение «последовательность приближенных значений» и в какой мере такая последовательность описывает значение величины; однозначно ли это описание или одна и та же последовательность мо- может отвечать разным значениям измеряемой величины. 2) Как связаны операции над приближенными значениями величин с теми же операциями над их точными значениями и чем характеризу- характеризуются те операции, при выполнении которых допустима подмена точных значений величин приближенными? 3) Как по самой последовательности чисел определить, может ли она быть последовательностью сколь угодно точных приближений значения некоторой величины? Ответом на эти и близкие к ним вопросы служит понятие предела функции— одно из основных понятий анализа. Изложение теории предела мы начнем с рассмотрения предела функ- функций натурального аргумента (последовательностей) ввиду уже выяс- выяснившейся фундаментальной роли этих функций и потому, что на самом
92 ГЛ. III. ПРЕДЕЛ деле все основные факты теории предела отчетливо видны уже в этой простейшей ситуации. § 1. Предел последовательности 1. Определения и примеры. Напомним следующее Определение 1. Функция /: N —> X, областью определения ко- которой является множество натуральных чисел, называется последова- последовательностью. Значения f(n) функции / называются членами последовательности. Их принято обозначать символом элемента того множества, в которое идет отображение, наделяя символ соответствующим индексом аргу- аргумента, хп := f{n). Саму последовательность в связи с этим обозначают символом {хп}, а также записывают в виде zi, £2, • • •, хп,... и назы- называют последовательностью в X или последовательностью элементов множества X. Элемент хп называется п-м членом последовательности. Всюду дальше в ближайших параграфах будут рассматриваться только последовательности /: N —> М. действительных чисел. Определение 2. Число i £i называется пределом числовой по- последовательности {хп}, если для любой окрестности V(A) точки А существует такой номер N (выбираемый в зависимости от У(Л)), что все члены последовательности, номера которых больше N, содержатся в указанной окрестности точки А. Ниже мы приведем формально-логическую запись этого определе- определения, но прежде укажем другую распространенную формулировку опре- определения предела числовой последовательности: Число А 6 М. называется пределом последовательности {хп}, если для любого е > 0 существует номер N такой, что при всех п > N имеем \хп -А\<е. Эквивалентность этих формулировок легко проверить (проверьте!), если заметить, что в любой окрестности ^(^4) точки А содержится некоторая е-окрестность этой же точки. Последняя формулировка определения предела означает, что, какую бы точность е > 0 мы ни задали, найдется номер 7V такой, что абсо- абсолютная погрешность приближения числа А членами последовательно- последовательности {хп} меньше чем е, как только п > N.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 93 Запишем теперь приведенные формулировки определения предела в логической символике, договорившись, что запись « lim хп = А% озна- п—>оо чает, что А — предел последовательности {хп}. Итак, ( lim хп = А) := VV{A) 3N е N Vn > N {хп <Е V(A)) \п—>оо / и соответственно ( lim xn = A) := Ve > 0 37V <E N Vn > N (\xn - A\ < e). Определение 3. Если lim xn = А, то говорят, что последова- п—>оо тельность {хп} сходится к А или стремится к А и пишут жп —)• Л при п —> оо. Последовательность, имеющая предел, называется сходящейся. По- Последовательность, не имеющая предела, называется расходящейся. Рассмотрим некоторые примеры. Пример 1. lim ^ = 0, так как - = №'■ Пример 2. lim " ^ = 1, так как >N= [I = - < е при п > N = - 1 = ^ < е при п > Пример 3. lim A + Ц^) = 1, так как I A + ^-^1 - 1 < е при п> N = Ш . _1 п Пример 4. lim ^=^ = 0, так как п—>оо " Пример 5. lim \ — 0, если |<?| > 1. sinn -0 - < е при п > п 5 Проверим это по определению предела. Как было доказано в гл. II, } 2, п. 4с, для любого е > 0 можно найти число N (z N такое, что —^ < е. '[х] — целая часть числа х\ см. следствие 10° принципа Архимеда, гл. II, § 2, п. 3.
94 ГЛ. III. ПРЕДЕЛ i-o 1 Поскольку \q\ > 1, то для любого п > N будем иметь п < —jt < e и определение предела удовлетворено. к\ Пример 6. Последовательность 1, 2, -,4, ^, 6, = ,... с n-м членом О О I хп = mS~l> , nfN, —расходящаяся. Действительно, если А — предел последовательности, то, как следу- следует из определения предела, в любой окрестности А лежат все члены последовательности, за исключением, быть может, конечного их числа. Число А ф 0 не может быть пределом данной последовательности, ибо вне е-окрестности А при е = L1 > 0 лежат все члены нашей после- 1 1 \А\ довательности вида _, 1, для которых , < L7r1. zk -\-1 zk -\-1. z Число 0 тоже не может быть пределом этой последовательности, поскольку, например, вне единичной окрестности нуля, очевидно, тоже имеется бесконечно много членов нашей последовательности. Пример 7. Аналогично можно проверить, что последователь- последовательность 1, —1, +1, —1,... , для которой хп = (—1)п, не имеет предела. 2. Свойства предела последовательности а. Общие свойства. Мы выделим в эту группу те свойства, кото- которыми обладают, как будет видно из дальнейшего, не только числовые последовательности, хотя здесь мы эти свойства будем рассматривать только для числовых последовательностей. Последовательность, принимающую только одно значение, будем на- называть постоянной. Определение 4. Если существуют число А и номер N такие, что хп — А при любом п > N, то последовательность {хп} будем называть финально постоянной. Определение 5. Последовательность {хп} называется ограничен- ограниченной, если существует число М такое, что \хп\ < М при любом n£N. Теорема 1. а) Финально постоянная последовательность схо- сходится. b) Любая окрестность предела последовательности содержит все члены последовательности, за исключением конечного их числа. c) Последовательность не может иметь двух различных пределов. d) Сходящаяся последовательность ограничена.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 95 •4 а) Если хп = А при п > N, то для любой окрестности V(A) точки А имеем хп £ V(A) при п > N, т.е. lim xn = А. 71—>ОО b) Утверждение непосредственно следует из определения предела последовательности. c) Это важнейший пункт теоремы. Пусть lim хп = А\ и lim xn = п—>оо га—>оо = А'2- Если А\ ф А'2, то фиксируем непересекающиеся окрестности VDi), V(A2) точек Ль Л2. В качестве таковых можно взять, например, ^-окрестности этих то- точек при 6 < — |v4i — A-i\- По определению предела найдем числа N\ и JV2 так, что Vn > iVi (жп € V^Ai)) и Vn > N2 (xn € F(^2)). Тогда при п > ma,x{N\,N'2} получим хп £ V{A\) П F(^2). Но это невозможно, поскольку F(^i) П V(A2) = 0. d) Пусть lim xn = А. Полагая в определении предела е = 1, найдем га—>оо номер N такой, что Vn > N (\хп — А\ < 1). Значит, при п > N имеем хп\ < \А\ + 1. Если теперь взять М > тах{|ж] |,..., \хп\, \А\ + 1}, то получим, что Vn > N (\хп\ < М). ► Ь. Предельный переход и арифметические операции Определение 6. Если {хп}, {уп}—две числовые последователь- последовательности, то их суммой, произведением и частным (в соответствии с об- общим определением суммы, произведения и частного функций) называ- называются соответственно последовательности {(хп +Уп)}, {(vv -Ун)}, Частное, разумеется, определено лишь при уп ф 0, п Е N. Теорема 2. Пусть {хп}, {уп} -числовые последовательности. Если lim хп — A, lim у„ = В, то п—>оо га—>оо a) lim (х„ + уп) = А + В; 7И-00 b) lim хп ■ yv = А • В; п—>оо c) lim ~ = —, если уп ф 0 (п = 1, 2,...) и В ф 0. •4 В качестве упражнения воспользуемся уже известными нам (см. гл. II, § 2, п. 4) оценками абсолютных погрешностей, возникающих при арифметических операциях с приближенными значениями величин.
96 ГЛ. III. ПРЕДЕЛ Положим \А — хп\ = А(хп), \В — уп\ = А(уп). Тогда для случая а) имеем \(А + В)- (хп + уп)\ ^ А{хп) + А(уп). Пусть задано число е > 0. Поскольку Km xn = А, найдется НО- га—>оо мер N' такой, что Мп > N' (А(хп) < е/2). Аналогично, поскольку lim yn = В, найдется номер N" такой, что Vn > N" (А(уп) < е/2). п—>оо Тогда при п > max{N',N"} будем иметь \(А + В)-(хп + уп)\<е, что в соответствии с определением предела доказывает утверждение а). Ь) Мы знаем, что \(А-В)- {хп ■ уп)\ ^ \хп\А{Уп) + |у„|А(а;п) + А{хп) ■ А{уп). По заданному е > 0 найдем числа N' и N" такие, что Тогда при п > N = max{N', N"} будем иметь \хп\ < \А\ + А(хп) < \А\ \уп\<\В\+А(уп)<\В\ А(хп) ■ А(уп) < min |l, |} • min |l, | Таким образом, при п > N поэтому \АВ \хп\А{уп) < (\А\ \уп\А{хп) < {\В\ А(хп) ■ -хпУп\ < е при п > А{у„) < N. е \А\ + 1] е \В\ + К е ) 3' е ) з'
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 97 с) Воспользуемся оценкой А _хп В уп \хп\А(уп) + \у„\А(хп) V2 Уп где 6(уп) = ^1. При заданном е > 0 найдем числа N' и N" так, что Vn>W ,\Y Тогда при п > maxjiV', TV"} будем иметь поэтому \ву ± 0< 1 - 6(уп) 8 4' <2 и, следовательно, Л _ Хп В уп < е при п > N. ►
98 Til III ПРЕДЕЛ Замечание. Формулировка теоремы допускает и другой, менее конструктивный путь доказательства, вероятно, известный читателю по школьному курсу начал анализа Мы напомним его, когда будем го- говорить о пределе произвольных функций. Ни здесь, рассматривая пре- предел последовательности, нам хогелосг- обратить внимание на то, как именно по ограничениям на погрешность результата арифметической операции ищутся допустимые погрешности значений величин, над ко- которыми эта операция производится. с. Предельный переход и неравенства Теорема 3. а) Пусть {хп}. {уп} две ( годящиеся последователь- последовательности, причем lim in = A, Inn yn - В. Если А < В. то найдется п-юо п->оо' номер N <Е N такой, что при люОом п "> /\ выполнено неравенство %п "^ Уп- Ь) Пусть последовательности {■/?,}. {»»}• izn} таковы, что при любом п > N <Е N имеет место соотношение ,гп <С у„ ^ zn. Если при этом последовательности {хп\, {zu} сгодятся ^ одному и тому же пределу, то последовательность \уп} также слодится и к этому же пределу. ■4 а) Возьмем число С такое, что А ^ С ' В По определению предела найдем числа N' и Л^" так. чтобы при любом и > N' иметь \хп — А\ < С — А и при любом п > N" иметь \уп — В\<В — С. Тогда при п> N = max{N',N"} получим хп < А + (С-А) = С = В-(В-С) < уп. Ь) Пусть lim хп — Нш zu = А. По с > 0 найдем числа N' и N" и->оо п—юс так, чтобы при любом п > N' иметь А — t < хп и при любом п > > N" иметь zn < А + е. Тогда при п > N = шах {N1, N"} получим А - е < хп < уп < zn < А + е или \уп - А\ < е, т. е. A— lim yn. ► 71—>ОО Следствие. Пусть lim хп --- А и lim у„ — В. га—>ос л)—> х^ * Если существует номер N такой, что при любом и ~> N a) хп > уп, то А^ В; b) хп ^ уп, mo A ^ В; c) жп > В, то А ^> В; d) xn^ В, то А^ В. •4 Рассуждая от противного, из пункта а) теоремы немедленно по- получаем первые два утверждения. Третье и четвертое утверждения суть частные случаи первых двух, получающиеся при уп = В. ►
§ 1 ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 99 Стоит заметить, что строгое неравенство в пределе может перейти в равенство. Например, ^ > 0 при любом п Е N, но lim ^ = 0. 3. Вопросы существования предела последовательности а. Критерий Коши Определение 7. Последовательность {хп} называется фундамен- фундаментальной (или последовательностью Коши1^), если для любого числа е > 0 найдется такой номер N G N, что H3n>Nnm>N следует Теорема 4 (критерий Коши сходимости последовательности). Чи- Числовая последовательность сходится тогда и только тогда, когда она фундаментальна. ■4 Пусть lim хп — А. По числу е > 0 найдем номер N так, чтобы при п > N иметь \хп — А\ < |. Если теперь m > N и п > N, то \хт - хп\ < \хт — А\ + \хп — А\ < ~ + | = е и, таким образом, проверено, что сходящаяся последовательность фундаментальна. Пусть теперь {х^} фундаментальная последовательность. По за- заданному е > 0 найдем номер iV такой, что mm^Ni/ik'^N следует \%т — хк\ < §• Фиксировав гп = N, получаем, что при любом к > N о XN ~ ~ < Хк < XN + ", A) но поскольку имеется всего конечное число членов последовательно- последовательности {хп} с номерами, не превосходящими N, то мы доказали, что фун- фундаментальная последовательность ограничена. Для п G N положим теперь ап := inf x/., bn := Из этих определений видно, что ап ^ ап+\ ^ bn+\ ^ Ьп (поскольку при переходе к меньшему множеству нижняя грань не уменьшается, а верхняя не увеличивается). Последовательность вложенных отрезков [ап,6п] имеет, по лемме о вложенных отрезках, общую точку А. ^Последовательности Коши ввел Больцано, пытавшийся, не располагая точным понятием вещественного числа, доказать сходимость фундаментальной последова- последовательности. Коши дал такое доказательство, приняв за очевидное принцип вложенных отрезков, обоснованный впоследствии Кантором.
100 ГЛ. III. ПРЕДЕЛ Поскольку при любом п & N ап ^ А ^ Ьп, а при к ^ п ап = inf то при к ^ п имеем \А - хк\ <: Ьп - ап. B) Но из A) следует, что при п > N XN ~ 77 ^ inf хк = ап ^b ^ + поэтому при п > т Ьп-ап^~ <е. C) Сравнивая B) и C), находим, что при любом к > N \А-хк\ <£, и мы показали, что lim хк = А. ► А;—>оо Пример 8. Последовательность (—1)" (п = 1,2,...) не имеет пре- предела, поскольку она не является фундаментальной. Хотя это и очевид- очевидно, но все же проведем формальную проверку. Отрицание утверждения, что последовательность {хп} фундаментальная, выглядит так: Зе > 0 V7V G N Зп > N Зт> N (\хт - хп\ ^ е), т. е. найдется е > 0 такое, что при любом N Е N найдутся числа п, т, большие N, для которых \хт — хп\ ^ е. В нашем случае достаточно положить е = 1. Тогда при любом JVgN будем иметь \xn+i - х^+2\ = |1 - (-1)| = 2 > 1 = е. Пример 9. Пусть х\ = 0, ж2 = 0,аь х3 = 0,а1а2, •••, хп = 0,а1а2 ... ап, ... — некоторая последовательность конечных двоичных дробей, причем каждая следующая дробь получается дописыванием знака 0 или 1 к
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 101 предыдущей. Покажем, что такая последовательность всегда сходится. Пусть т > п. Оценим разность хт — хп: %п\ — | |^ ''' 2Ш 1—1 2" Li Таким образом, подобрав по заданному е > 0 число N так, что -^ < < е для любых т > п > N, получаем оценку \хт — хп\ < — < -^ < е, доказывающую фундаментальность последовательности {ж„}. Пример 10. Рассмотрим последовательность {хп}, где ж„ = 1 +- + ... + -. 2 п Поскольку для любого n G N 1 111 \Х2п ~ Хп\ = — + . . . + -—-- > П • —- = -, п + 1 п + п 2п 2 то в силу критерия Коши эта последовательность не имеет предела. Ь. Критерий существования предела монотонной последо- последовательности Определение 8. Последовательность {хп} называется возраста- возрастающей, если Vn £ N (хп < хп+\); неубывающей, если Vn £ N (ж„ ^ ^ a;n+i); невозрастающей, если Vn £ N (хп ^ a;n+i); убывающей, если Vn £ N (ж„ > a;n+i)- Последовательности этих четырех типов называют монотонными последовательностями. Определение 9. Последовательность {хп} называется ограничен- ограниченной сверху, если существует число М такое, что Vn £ N (хп < М). Аналогично определяется последовательность, ограниченная снизу. Теорема 5 (Вейерштрасс). Для того чтобы неубывающая после- последовательность имела предел, необходимо и достаточно, чтобы она была ограниченной сверху.
102 ГЛ. III. ПРЕДЕЛ •4 То, что любая сходящаяся последовательность ограничена, было доказано при рассмотрении общих свойств предела последовательно- последовательности, поэтому интерес представляет только второе утверждение тео- теоремы. По условию множество значений последовательности {хп} ограни- ограничено сверху, значит, оно имеет верхнюю грань s = snpxn. neN По определению верхней грани, для любого е > 0 найдется элемент х^ £ {х-п} такой, что s — е < х,\ ^ ,s. Поскольку последовательность {хп} неубывающая, при любом и > N теперь получаем s — е < xn ^ ^ хп ^ s, т.е. |s — хп\ = s — хп < е. Таким образом, доказано, что Km xn = s. ► п—>ос Разумеется, аналогичную теорему можно сформулировать и дока- доказать для невозрастающей последовательности, ограниченной снизу. В этом случае lim xn = inf xn. п—>оо n£N Замечание. Ограниченность сверху (снизу) неубывающей (невоз- (невозрастающей) последовательности на самом деле, очевидно, равносильна ограниченности этой последовательности. Рассмотрим несколько полезных примеров. Пример 11. lim — = 0, если ц > 1. п- уоо qn •4 Действительно, если хп = ~. то хпЛ\ = п^ хп, п € N. Посколь- ку lim nil = Km (i + 1) 1 = Hm (j + 1) . Ит 1 = ] . | = 1 < 1, то найдется номер iV такой, ччч) при п > /V будет 7—щ- < 1. Таким образом, при п > N будем иметь хп+\ < хп. т.е. после члена ж/v наша последовательность монотонно убывает. Поскольку конечное число чле- членов последовательности, как видно из определения предела, не влияет на сходимость последовательности и ее предел, то достаточно теперь найти предел последовательности .r.v+i > -£лч2 > ■ ■ ■ Члены последовательности положительны, т. е. последовательность ограничена снизу. Значит, она имеет предел. Пусть х — lim xv. Из соотношения хп\.] = ~~хп теперь следует х = lim (:rn+i) = lim xn = liiu • lim xn = -x, n—>oo n—>oo V 77,G / н-^оо f(,<y п—юо q откуда находим (J — - j x ~ 0 и х — 0. ►
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 103 Следствие 1. Km д/го = 1. п—>сю •4 При фиксированном е > 0 по доказанному найдется JVGN такое, что при п > N будем иметь 1^п<A + е)". Тогда при п > N получим 1 ^ yfn < 1 + е и, значит, действительно Km sfn = 1. ► п—>оо Следствие 2. Km у/а = 1 при любом а > 0. •4 Пусть а ^ 1. Для любого е > 0 найдем iVGN так, что при п > N 1 ^ а < A + е)га, и тогда при п > N получаем 1 ^ ч/а < 1 + е, т. е. lim tfa = 1. Если 0 < а < 1, то 1 < j и Km л/а = Km —pi = г= = 1. ► п—>оо п—>оо „/1 ]■ „/1 л /А Km \ Пример 12. lim 2_^ = 0; здесь q — любое действительное число, п е N, п\ := 1 • 2 • ... • п. •4 Если q = 0, то утверждение очевидно. Далее, поскольку 21 = 12L, то достаточно доказать утверждение для g > 0. Рассуждая в этом случае, как и в предыдущем, замечаем, что хп+\ = —$—-хп. По- Поскольку множество натуральных чисел не ограничено сверху, найдется номер N такой, что при п > N будет 0 < —Ч-— < 1. Тогда при п > > N будем иметь хп+\ < хп и, учитывая положительность членов по- последовательности, можно теперь гарантировать существование предела lim xn = х. Но тогда п->оо х = Km хп+\ = Km хп = Km • lim xn = 0 • х = 0. ► п->сю п->сю п + 1 п—>оо П + 1 п—>оо с. Число е Пример 13. Докажем существование предела Km A -\— Пределом в данном случае является число, обозначаемое после Эйле- Эйлера буквой е, столь же характерное для анализа, как для арифметики 1 или для геометрии тт. К нему мы еще неоднократно будем возвращаться по очень разным поводам. Проверим сначала следующее неравенство: A + а)п ^ 1 + па при nf.N и а > -1
104 ГЛ. III. ПРЕДЕЛ (называемое иногда неравенством Я. Бернулли1)). А При п = 1 утверждение справедливо. Если оно справедливо для п £ N, то и для п + 1 тоже, поскольку тогда A + a)n+l = A + а)A + а)" ^ A + а)A + па) = = 1 + (п + 1)а + па2 ^ 1 + (п + 1)а. По принципу индукции утверждение, таким образом, справедливо для любого п & N. Из выкладки, кстати, видно, что при а ф 0 имеет место строгое неравенство. ► / 1 \ п+1 Покажем теперь, что последовательность уп = 11 + ^1 убы- убывающая. ■4 Пусть п ^ 2. Используя доказанное неравенство, находим, что Уп-i A + ^т) п2" п ( 1 у п _( п + 1 V п2-\ п п f 1\ п A J Поскольку члены последовательности положительны, существует ( l1 предел lim A + w n-юо \ "/ Но тогда г 1 \ lim 1 + - = lim 1 + - 1 + - у П) п-кю у п) \ П = lim 1 + - • lim r = lim 1 + - a—>oo V n I n—>oo 1 -f- — n->oo V n I Итак, Определение 10. е:= lim х'Якоб Бернулли A654-1705)—швейцарский математик, представитель знаме- знаменитого семейства ученых Бернулли; стоял у истоков вариационного исчисления и теории вероятностей.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 105 d. Подпоследовательность и частичный предел последова- последовательности Определение 11. Если х\, Х2, ■ ■ ■, хп,... —некоторая последова- последовательность, а, п\ < П2 < ■ ■ ■ < rij- < ... —возрастающая последователь- последовательность натуральных чисел, то последовательность хП1,хП2,... ,хПк,... называется подпоследовательностью последовательности {хп}. Например, последовательность 1,3,5,... нечетных натуральных чисел, взятых в их естественном порядке, является подпоследователь- подпоследовательностью последовательности 1,2,3,... Но последовательность 3,1,5, 7,9,... уже не является подпоследовательностью последовательности 1,2,3,... Лемма 1 (Больцано - Вейерштрасс). Каждом ограниченном после- последовательность действительных чисел содержит сходящуюся подпо- подпоследовательность. ■4 Пусть Е — множество значений ограниченной последовательно- последовательности {а;п}. Если Е конечно, то существуют по крайней мере одна точка х £ Е п последовательность п\ < П2 < ... номеров такие, что хП1 = = хП2 = ... = х. Подпоследовательность {хПк} постоянна и, значит, сходится. Если Е бесконечно, то по принципу Больцано - Вейерштрасса оно обладает по крайней мере одной предельной точкой х. Поскольку х — предельная точка Е, можно выбрать п\ б N так, что \хП1 —х\ < 1. Если щ £ N уже выбрано так, что \хПк — х\ < \, то, учитывая, что х — предельная точка Е, найдем n^+i £ N так, что п^ < щ+1 и \хПк+1 — х\ < 1 fc+1" Поскольку lim -г = 0, построенная подпоследовательность fc->oo к г2,. . . , ЖП), , . . . СХОДИТСЯ К Ж. ► Определение 12. Условимся писать хп —ъ +оо и говорить, что последовательность {хп} стремится к плюс бесконечности, если для каждого числа с найдется номер N (Е N такой, что хп > с при любом n>N. Запишем это и два аналогичных определения в логических обозна- обозначениях: (хп -> +оо) := Vc е R Ш Е N Vn > N (с < хп), (хп -> -оо) := Vc б R 3iV б N Vn > N (хп < с),
106 ГЛ. III. ПРЕДЕЛ (хп ->• оо) := Vc € R 3N е N Vn > 7V (с < жп В последних двух случаях говорят соответственно: последователь- последовательность {хп} стремится к минус бесконечности и последовательность {хп} стремится к бесконечности. Заметим, что последовательность может быть неограниченной, но не стремиться ни к плюс, ни к минус, ни просто к бесконечности. На- Например, хп = w~l> . Последовательности, стремящиеся к бесконечности, мы не причи- причисляем к сходящимся. Легко видеть, что в соответствии с этими определениями можно дополнить только что доказанную лемму, сформулировав ее несколько иначе. Лемма 2. Из каждой последовательности действительных чи- чисел можно извлечь сходящуюся подпоследовательность или подпосле- подпоследовательность, стремящуюся к бесконечности. ■4 Новым является только тот случай, когда последовательность {хп} не ограничена. Тогда по k G N будем выбирать Пк G N так, что \хПк\ > к и щ < щ+1. Получим подпоследовательность {хПк}, которая стремится к бесконечности. ► Пусть {ж*;} — произвольная последовательность действительных чи- чисел. Если она ограничена снизу, то можно рассмотреть (уже встречав- встречавшуюся нам при доказательстве критерия Коши) последовательность гп — inf Xk- Поскольку гп < гп^\ для любого п 6 N, то либо последова- тельность {in} имеет конечный предел lim гп = /, либо г„ —>■ +оо. п->оо Определение 13. Число / = lim inf Хк называется нижним пре- делом последовательности {хк} и обозначается lim Хк или li к Если %п —>■ +оо, то принято говорить, что нижний предел последо- последовательности равен плюс бесконечности, и писать lim Хк = +оо или lim inf Хк = +оо. Если исходная последовательность {хк} не ограничена fc—>оо снизу, то при любом п 6 N будем иметь in — inf Хк = — оо. В этом к^ случае говорят, что нижний предел последовательности равен минус бесконечности, и пишут lim Хк = —оо или lim inf Хк = —оо. fc->oo fc
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 107 Итак, с учетом всех перечисленных возможностей запишем теперь кратко определение нижнего предела последовательности lim хк := lim iuf xk. Аналогично, рассматривая последовательность sn = sups/t, прихо- k дим к определению верхнего предела последовательности Определение 14. lim х,к ■= li Приведем несколько примеров. Пример 14. хк = (-1)А\ keN: lim Хк = lim inf r:k = lim inf {-l)k = lim (-1) = —1, ■■ ' ~" ' ~~ - n->co k^zn n—>oo lim Xk = lim sup.77. = lim sup( — l)k = lim 1 = 1. n-*°°k>n Пример 15. xjt = A;(-1^, к G N: lim A;^1)" = lim inf k^^k = lim 0 = 0, к >оо п >oo k^n n—KX Tim A,^")* — lim supA:1 J) = lim (+00) =+00. k—>oc n—>°o k>n n-^00 Пример 16. :r/; = А;, к £ N: lim A; = lim inf A; = lim n = +00. Д_._>оо П->ОС fe^jj ll-->00 lim к = lim sup A; = lim (+00) = +00. Пример 17. xk = Ц^-, А; е N: / ,u 1 i\fe [ —-, если га = 2m + 1 lim ^—i- = lim inf ^—^- = lim I ) = 0, к n>«=^» Л "им __l e и n = 2m ' U + 1 '
108 ГЛ. III. ПРЕДЕЛ (l) (l) f п> если п = lim ^—i- = lim sup ~^- = lim < V = 0. fc* к n->oo A; n>oo 1 O 71+1' Пример 18. Sfc — —к2, к £ N: lim (-к2) = lim inf (-к2) = -оо. Пример 19. хк = (-l)fc/c, A; £ N: lim (—1) А; = lim inf (—l)fcA; = lim (—oo) = —oo, и 1Л^ ti—юо k^zn ti—юо ft. —?LXJ ^ lim (—l)fcA; = lim sup(—l)fcA; = lim (+oo) = +oo. fc->OO - .-- - . -- Чтобы разобраться в происхождении терминов «верхний» и «ниж- «нижний» пределы последовательности, введем следующее Определение 15. Число (или символ —оо или +оо) называют ча- частичным пределом последовательности, если в ней есть подпоследова- подпоследовательность, стремящаяся к этому числу. Утверждение 1. Нижний и верхний пределы ограниченной по- последовательности являются соответственно наименьшим и наиболь- наибольшим из ее частичных пределов1^. ■4 Докажем, это, например, для нижнего предела г = lim x^. Про fc—>оо последовательность гп = inf x^ нам известно, что она неубывающая и lim гп = i 6 R. Для чисел п 6 N, используя определение нижней п—>оо грани, по индукции подберем числа кп £ N так, что гп ^ Xj~n < in + ^ и кп < кп+\. Поскольку lim in = lim Mn + « ) = h TO) опираясь на п->оо п->оо V "/ свойства предела, можем утверждать, что lim x^ = i. Мы доказали, п—>оо что i — частичный предел последовательности {х^}- Это наименьший частичный предел, поскольку для каждого е > 0 найдется число п £ N такое, что г — е < in, т. е. г — е < гп = inf Xk ^ ж/t при любом к ^ п. к>п 1Щри этом считаются принятыми естественные соотношения —оо < х < +оо между символами — оо, +оо и числами ж 6 К.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 109 Неравенство г — е < Хк при к > п означает, что ни один частичный предел нашей последовательности не может быть меньше г — е. Но е > 0 произвольно, поэтому он также не может быть меньше г. Для верхнего предела доказательство, разумеется, аналогично про- проведенному. ► Заметим теперь, что если последовательность не ограничена снизу, то из нее можно выделить подпоследовательность, стремящуюся к —оо. Но в этом случае и lim Хк = —оо и можно условиться считать, что сно- fc—>оо ва нижний предел есть наименьший из частичных пределов. Верхний предел при этом может быть конечным, и тогда по доказанному он является наибольшим из частичных пределов; он может быть и бес- бесконечным. Если lim Xk = +oo, то последовательность не ограничена к —>оо также и сверху и можно выделить подпоследовательность, стремящую- стремящуюся к +оо. Если же lim Хк = —оо, что тоже возможно, то это означает, что supa;^ = sn —> — оо, т.е. и сама последовательность {х^} стремится к -оо, ибо sn ^ хп. Аналогично, если lim Хк = +оо, то Xk —ь +оо. к—>оо Учитывая сказанное, можно, таким образом, заключить, что спра- справедливо Утверждение 1'. Для любой последовательности нижний пре- предел есть наименьший из ее частичных пределов, а верхний предел по- последовательности— наибольший из ее частичных пределов. Следствие 1. Последовательность имеет предел или стремит- стремится к минус или плюс бесконечности в том и только в том случае, когда нижний и верхний пределы последовательности совпадают. < Случай, когда lim Xk = lim Xk = +oo, и случай, когда lim x^ = fc-чоо fc-»°° fc->oo = lim Xk = —оо, уже разобраны выше, поэтому можно считать, что fc-юо lim Xk = lim Xk = Л 6 R. Поскольку in = inf Xk ^ xn ^ sup Xk — sn fc->oo fc^n и по условию lim in = lim sn = А, то по свойствам предела также n—>oo n—>oo lim xn = A. ► П-КЗО Следствие 2. Последовательность сходится тогда и только то- тогда, когда сходится любая ее подпоследовательность.
110 ГЛ. III. ПРЕДЕЛ М Нижний и верхний пределы подпоследовательности заключены между нижним и верхним пределами самой последовательности. Если последовательность сходится, то ее нижний и верхний пределы совпа- совпадают. Тогда совпадают нижний и верхний пределы подпоследователь- подпоследовательности, откуда вытекает ее сходимость, причем, разумеется, к пределу всей последовательности. Обратное утверждение очевидно, поскольку в качестве подпоследо- подпоследовательности можно взять саму последовательность. ► Следствие 3. Лемма Больцано - Вейерштрасса как в узкой, так и в расширенной формулировке вытекает из утверждения 1 и утвер- утверждения V соответственно. < Действительно, если последовательность {х^} ограничена, то точ- точки i = lim Xk и s = lim x^ конечны и по доказанному являются ча- стичными пределами последовательности. Только при г = s последова- последовательность имеет лишь одну предельную точку; при г < s их уже по крайней мере две. Если последовательность не ограничена с какой-то стороны, то су- существует подпоследовательность, стремящаяся к соответствующей бес- бесконечности. ► Заключительные замечания. Мы выполнили (и даже с некото- некоторым превышением) все три пункта намеченной перед началом парагра- параграфа программы: дали точное определение предела последовательности, доказали единственность предела, выяснили связь операции предельно- предельного перехода со структурой множества действительных чисел, получили критерий сходимости последовательности. Теперь рассмотрим один специальный часто встречающийся и очень полезный вид последовательностей — ряды. 4. Начальные сведения о рядах а. Сумма ряда и критерий Коши сходимости ряда. Пусть {&п} — последовательность действительных чисел. Напомним, что сум- я МУ dp + ap+i + ... + aq (р < q) принято обозначать символом ^ ап. Мы хотим теперь придать точный смысл выражению а\ + a<i + ... + ап + + ..., подразумевающему суммирование всех членов последовательно- последовательности {ап}.
§1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 111 Определение 16. Выражение и\ + a-i + ... + ап + ... обознача- оо ют символом ^Г о-п и обычно называют рядом или бесконечным рядом 71=1 (чтобы подчеркнуть отличие его от суммы конечного числа слагае- слагаемых) . Определение 17. Элементы последовательности {яп}, рассматри- рассматриваемые как элементы ряда, называют членами ряда; элемент ап назы- называют п-м членом ряда. п Определение 18. Сумму sn = ^a^ называют частичной сум- суммой ряда или, когда желают указать ее номер, n-й частичной суммой ряда1'. Определение 19. Если последовательность {sn} частичных сумм ряда сходится, то ряд называется сходящимся. Если последователь- последовательность {sn} не имеет предела, то ряд называют расходящимся. Определение 20. Предел Jim ,s,, = ,s последовательности частич- п - > оо ных сумм, если он существует, называется суммой ряда. Именно в этом смысле мы и будем в дальнейшем понимать запись оо ~^2ап = S. 71= L Поскольку сходимость ряда равносильна сходимости последователь- последовательности его частичных сумм {%}, то применением к {sn} критерия Коши сразу получается Теорема 6 (критерий Коши сходимости ряда,). Ряд а\ + .. .+ап + ... сходится тогда и только тогда, когда для любого е > 0 найдется такое число N G N, что из т ^ п, > N следует \ап + ... + ат\ < е. Следствие 4. Если и ряде изменить только конечное число чле- членов, то полу чающийся при этом новый ряд будет сходиться, если схо- сходился исходный ряд, и будет расходиться, если исходный ряд расхо- расходился. ''Таким образом, на самом доле под рядом мы подразумеваем упорядоченную пару / п \ ({an},{sn}) последовательностей, связанных соотношением Уп € N I sn = ^ аи V k=\
112 ГЛ. III. ПРЕДЕЛ М Для доказательства достаточно в критерии Коши считать чи- число N превышающим максимальный из номеров измененных членов ряда. ► Следствие 5. Для того чтобы ряд а\ + ... + ап + ... сходился, необходимо, чтобы его члены стремились к нулю при п —> оо, т. е. необходимо lim an = 0. п—>оо -^ Достаточно положить в критерии т = п и воспользоваться опре- определением предела последовательности. ► Вот другое доказательство: ап = sn — sn-\ и, коль скоро lim sn = n->oo = s, имеем lim an = lim (sn — sn-i) = lim sn — Hm sn_i = s — s = 0. n—>oo n—>oo n—>oo n—>oo Пример 20. Ряд 1 + g + g2 + ... + qn + ... часто называют суммой бесконечной геометрической прогрессии. Исследуем его сходимость. Поскольку \qn\ = \q\n, то при |g| ^ 1 будет \qn\ Iив этом случае не выполнен необходимый признак сходимости ряда. Пусть теперь |д| < 1. Тогда и lim sn = , поскольку lim qn = 0, если \q\ < 1. оо Таким образом, ряд ^ q'" сходится тогда и только тогда, когда п=1 < 1 ив этом случае его сумма равна . Пример 21. Ряд 1 + - + ... + 7J + ... называется гармоническим, поскольку каждый член этого ряда, начиная со второго, является сред- средним гармоническим соседних с ним членов (см. задачу 6 в конце этого параграфа). Члены ряда стремятся к нулю, но последовательность его частич- частичных сумм 1 1 Sn = 1 + ;г + •■■ + -> 2 п как было показано с помощью критерия Коши в примере 10, расходится. Это означает в данном случае, что sn —> +оо при п —ъ оо. Итак, гармонический ряд расходится. Пример 22. Рассмотрим теперь следующий пример.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 113 Ряд 1 — 1 + 1 — ... + (—l)n+1 + ... расходится, что видно и по после- последовательности 1,0,1,0,... его частичных сумм, и по тому, что члены ряда не стремятся к нулю. Если расставить скобки и рассмотреть новый ряд членами которого являются суммы, заключенные в скобки, то этот но- новый ряд уже сходится, причем его сумма, очевидно, равна нулю. Если скобки расставить иначе и рассмотреть ряд 1 +(-1 + 1) +(-1 + 1) + ... , то получится сходящийся ряд с суммой, равной 1. Если в исходном ряде переставить все члены, равные —1, на две позиции вправо, то получим ряд 1 + 1-1 + 1-1 + 1-..., расставив в котором скобки, придем к ряду сумма которого равна двум. Эти наблюдения показывают, что привычные законы обращения с конечными суммами, вообще говоря, не распространяются на ряды. И все-таки есть важный тип рядов, с которыми, как это потом вы- выяснится, можно обращаться так же, как с конечными суммами. Это так называемые абсолютно сходящиеся ряды. Именно с ними мы главным образом и будем работать. Ь. Абсолютная сходимость; теорема сравнения и ее след- следствия 00 Определение 21. Ряд £} ап называется абсолютно сходящимся, ос п=1 если сходится ряд 2^ 1ап1- 71=1 Поскольку \ап + .. .+ат\ ^ |а„| + .. . + |ат|, из критерия Коши следует, что если ряд сходится абсолютно, то он сходится. То, что обратное утверждение, вообще говоря, не имеет места, т. е. что абсолютная сходимость есть требование более сильное, чем просто сходимость ряда, можно продемонстрировать на примере. 5-4573
114 ГЛ. III. ПРЕДЕЛ Пример 23. Ряд 1 — 1 + i — i + i — i + ..., частичные суммы Л Л о о которого равны либо ^, либо 0, сходится к нулю. Вместе с тем ряд из абсолютных величин его членов расходится, что, как и для гармонического ряда, следует из критерия Коши: 1 + - + ...+ Ь п+1 п+1 п + п п + п 2n = 1. + 1 n + n) n + n Для того чтобы научиться отвечать на вопрос, сходится ли ряд аб- абсолютно или нет, достаточно научиться исследовать на сходимость ря- ряды с неотрицательными членами. Имеет место Теорема 7 (критерий сходимости рядов с неотрицательными чле- членами). Ряд а\ +... + ап +..., члены которого — неотрицательные чи- числа, сходится тогда и только тогда, когда последовательность его частичных сумм ограничена сверху. •4 Это следует из определения сходимости ряда и критерия сходимо- сходимости неубывающей последовательности, каковой в данном случае являет- является последовательность si $C S2 ^ • • • ^ sn ^ ... частичных сумм нашего ряда. ► Из этого критерия вытекает следующая простая, но на практике очень полезная оо оо Теорема 8 (теорема сравнения). Пусть ^ ап, ^Ъп—два ряда 71=1 П=1 с неотрицательными членами. Если существует номер N G N та- такой, что при любом п > N имеет место неравенство ап $С Ьп, то из оо оо сходимости ряда £} Ьп вытекает сходимость ряда ^ ап, а из расхо- п=1 п=\ оо оо димости ряда £} а,п вытекает расходимость ряда ^ Ьп. п=\ п—1 ^ Поскольку конечное число членов не влияет на сходимость ря- ряда, можно без ограничения общности считать, что ап ^ Ьп для любого
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 115 п п оо п е N. Тогда Ап = 52 ак ^ 52 Ьк — Вп. Если ряд 52 Ьп сходится, Jfc=l Jfc=l n=l то последовательность {Вп}, не убывая, стремится к пределу В. То- Тогда Ап < Вп < В при любом n G N и, следовательно, последователь- оо ность {Ап} частичных сумм ряда 52 ап ограничена. В силу критерия ~ оо сходимости ряда с неотрицательными членами (теорема 7) ряд 52 ап сходится. Второе утверждение теоремы, рассуждая от противного, немедлен- немедленно получаем из уже доказанного. ► Пример 24. Поскольку . 1, . < \ < , ^^, при п ^ 2, по теореме сравнения заключаем, что ряды 52 ~2 и 52 ~~<—ттт сходятся или расходятся одновременно. Но последний ряд можно просуммировать непосредственно, заме- заметив, что ,,, \_ . = jr — ,, 1 . и поэтому 52 иtu ■ у\ = 1 тт- Значит, 00 ОО 00 ОО Л , п = 1. Следовательно, ряд V -^ также является сходящимся. n=in(n + l) п=1П оо 2 Любопытно, что 52 ~т = \-- В дальнейшем это будет доказано. п=1 " b Пример 25. Следует обратить внимание на то, что теорема срав- сравнения относится только к рядам с неотрицательными членами. Дей- Действительно, положим, например, ап = —п, а Ьп = 0, тогда ап < Ьп, ряд 00 ОО Л Ьп сходится, но ряд 52 ап расходится. п=1 п=1 Следствие 1 (мажорантный признак Веиерштрасса абсолютной оо оо сходимости ряда). Пусть 52 ап и 52 Ьп —два ряда. Пусть существу- п=1 п=1 ет номер N € N такой, что при любом п > N имеет место соотно- соотношение \ап\ ^ Ьп. При этих условиях для абсолютной сходимости ряда 00 ОО £ ап достаточно, чтобы ряд 52 Ъп сходился. п=1 п-1 оо 4 Действительно, по теореме сравнения тогда ряд 52 l°nl будет п=1 оо сходиться, что и означает абсолютную сходимость ряда 52 °п- ► п=1
116 ГЛ. III. ПРЕДЕЛ Этот важный достаточный признак абсолютной сходимости часто формулируют кратко: если члены ряда (по абсолютной величине) ма- мажорируются членами сходящегося числового ряда, то исходный ряд сходится абсолютно. оо Sinn Пример 26. Ряд 52 ~^г абсолютно сходится, так как п =1 п п 2 ^ -=■, а ряд У^ ~т> как мы выяснили в примере 24, сходится. " п=1" оо Следствие 2 (признак Коши). Пусть Y2 ап —данный ряд и а = п=1 = lim v/|an|. Тогда справедливы следующие утверждения: п->оо оо a) если а < 1, то ряд Y2 ап абсолютно сходится; п=1 оо b) если а > 1, то ряд Y2 an расходится; п=1 c) существуют как абсолютно сходящиеся, так и расходящиеся ряды, для которых а = 1. ■4 а) Если а < 1, то можно выбрать число q G R так, что a < q < 1. Фиксировав число д, в соответствии с определением верхнего предела найдем номер N G N такой, что при п > N выполнено \/\ап\ < q. Таким оо образом, при п > N будем иметь \ап\ < qn и, поскольку ряд £] <t п=1 оо при \q\ < 1 сходится, ряд £) ^п (по теореме сравнения или признаку п=1 Вейерштрасса) сходится абсолютно. b) Поскольку а является частичным пределом последовательности {ап} (см. утверждение 1), то найдется подпоследовательность {аПк} такая, что lim "Mw = а- Если а > 1, то найдется номер К G N такой, А:—юо что при любом к > К будет |ank | > 1, тем самым необходимое условие оо сходимости (ап —>■ 0) для ряда ^ an не выполнено и он расходится. п=1 оо оо c) Мы уже знаем, что ряд Y2 п расходится, а ряд ^ —^ сходится п=1 п=1п I абсолютно, так как —~ V п ГГ ГГ / 1 \2 и lim P/-V = lim ?/-j = lim -U = 1. ► n—>oo V n n—>oo V n n—>oo V Vй/ = ~2 I. Вместе с тем lim у h = Um -4= = 1 n / n—>oo V " n—>oo Vй
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 117 Пример 27. Исследуем, при каких значениях i£E ряд оо п=1 + (-1)п)пхп\ = |ж| Шп |2 + (-1)п| = пюо | п—юо сходится. Подсчитаем а = lim ^ n—too Таким образом, при \х\ < ^ РЯД сходится и даже абсолютно, а при х\ > i ряд расходится. Случай |ж| = ^ требует специального рассмо- рассмотрения. В нашем примере оно элементарно, ибо при \х\ = ^ для четных О значений п имеем B + (—1Jк) х2к = Ъ2к ( |] = 1 и ряд расходится, поскольку для него не выполнено необходимое условие сходимости. оо Следствие 3 (признак Даламбера1)). Пусть для ряда ^2 ап су- п=1 -1 = а. Тогда справедливы следующие ут- ществует предел lim n-too верждения: оо a) если а < 1, то ряд Y1 ап сходится абсолютно; п=1 оо b) если а > 1, то ряд Y^, an расходится; п=1 c) существуют как абсолютно сходящиеся, так и расходящиеся ряды, для которых а = 1. 4 а) Если а < 1, то найдется такое число q, что а < q < 1; фикси- фиксировав q и учитывая свойства предела, найдем номер N G N такой, что при любом п > N будет - Поскольку конечное число членов не влияет на характер сходимости ряда, без ограничения общности будем считать, что Поскольку «п+1 < q при любом п Оп+1 ап ■ ап вп-1 '"■■' 0.2 - мы получаем, что |an+i| < |ai| • qn. Но ряд J] l°i|9n сходится (его n=l V I I \ °° сумма, очевидно, равна г^-), поэтому ряд £} an абсолютно сходится. "' п=1 ''Ж. Л. Даламбер A717 -1783) — французский ученый, прежде всего механик, вхо- входивший в группу философов-энциклопедистов.
118 ГЛ. III. ПРЕДЕЛ b) Если а > 1, то, начиная с некоторого номера N € N, при любом п > N будем иметь «п+1 о„ > 1, т.е. \ап\ < |an+i|, и, следовательно, для оо ряда 53 ап не выполнено условие ап —>■ 0, необходимое для сходимости. п=1 с) Примерами в данном случае, как и в признаке Копта, могут слу- оо оо ЖИТЬ РЯДЫ J2 й И J2 -г . ► п=1 п=1п Пример 28. Выясним, при каких значениях х £№. сходится ряд п-1 При х = 0 он, очевидно, сходится и даже абсолютно. При х Ф 0 имеем lim an+l = 0. Таким образом, этот ряд абсолютно сходится при любом значении хеш. Рассмотрим, наконец, еще один более специальный, но часто встре- встречающийся класс рядов: ряды, члены которых образуют монотонную последовательность. Для таких рядов имеет место следующий необхо- необходимый и достаточный признак сходимости. оо Утверждение 2 (Коши). Если ai ^ а,2 ^ ... ^ 0, то ряд £} an n=l оо сходится тогда и только тогда, когда сходится ряд £) 2*а2* = ai + jfc=o + 2а2 + 4а4 ■4 Поскольку 0-2 ^ 0,2 ^ О\, 2а4 ^ аз + а4 < 2а2, 4ав ^ а5 + °б "Ь а7 + а8 ^ 4а4, 2 fl2n+' ^ а2«-(-1 + ■ ■ • + U2n+i ^ 2 < то, складывая эти неравенства, получим 2 ('S'n+i - ai) < Л2п+1 - ai ^ Sn
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 119 где Ak — а\ + .. .+a,k, Sn = ai+2a2 + - • -+2na2« — частичные суммы рас- рассматриваемых рядов. Последовательности {Ak} и {Sn} неубывающие, и потому из полученных неравенств можно заключить, что они либо одновременно ограничены, либо одновременно не ограничены сверху. Но по критерию сходимости рядов с неотрицательными членами отсю- отсюда следует, что рассматриваемые два ряда действительно сходятся или расходятся одновременно. ► Отсюда вытекает полезное оо оо Следствие. Ряд ^2 сходится при р > 1 и расходится при п=1п" •4 Если р ^ 0, то по доказанному наш ряд сходится или расходится вместе с рядом > Jfc=0 а для сходимости последнего ряда необходимо и достаточно, чтобы было q - 2г~р <1,т.е.р> 1. оо Если р < 0, то расходимость ряда £) — очевидна, поскольку в этом п=1 п случае все члены ряда больше 1. ► оо Важность этого следствия состоит в том, что ряд ^ — часто слу- п=1 пР жит основой для сравнения при исследовании сходимости рядов. с. Число е как сумма ряда. Заканчивая рассмотрение рядов, вер- вернемся еще раз к числу е и получим ряд, доставляющий уже довольно удобный способ вычисления е. Мы будем использовать формулу бинома Ньютона при разложении выражения A + ^1 . Те, кто не знаком с этой формулой из школы или не решил задачу lg) из гл. II, § 2, могут, без потери связности изложе- изложения, опустить настоящее добавление о числе е и вернуться к нему после формулы Тейлора, частным случаем которой можно считать формулу бинома Ньютона. ''Формально в нашей книге мы пока определили пр только для рациональных значений р, поэтому читатель тоже пока вправе понимать это утверждение только для тех р, для которых определено пр.
120 ГЛ. III. ПРЕДЕЛ Нам известно, что е = lim 11 + ■= ) . п-юо V "/ По формуле бинома Ньютона V nj lln 2! 7Г n(nl)...(nfc + l) 1 1 it! пк пп 2! V nj it! V nj V n п ) п\ \ п) \ п ( 1\п 1 1 Полагая A + ^1 =епи1 + 1 + ^ + ...Н—f = sn, таким образом, имеем еп < sn (п = 1,2,...). С другой стороны, при любом фиксированном к и п ^ к, как видно из того же разложения, имеем 1 + 1+A)+...+ A)... 2! \ п) к\\ п) \ п При п -л оо левая часть этого неравенства стремится к sjt, а пра- правая— к е, поэтому мы теперь можем заключить, что Sk ^ e для любого Но тогда из соотношения при п —>■ оо получаем, что lim sn = e. п—юо В соответствии с определением суммы ряда мы теперь можем запи- записать _ 1 1 1 6 1! + 2! + n! Это уже вполне пригодное для вычисления представление числа е. Оценим разность е — sn: (п + 1)! (п + 2)!
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 121 1 1 (n + 1)! L п + 2 (п + 2)(п 1 1 (п 1 п+2 1 п!(п + 1J п\п Таким образом, чтобы абсолютная погрешность приближения числа е числом sn не превосходила, например, 10~3, достаточно, чтобы было -j— < rjwwT- Этому условию удовлетворяет уже sq. Выпишем несколько первых десятичных знаков числа е: е = 2,7182818284590... .• Полученную оценку разности е—sn можно записать в виде равенства о е = sn + -j^-, где 0 < вп < 1. Из такого представления числа е немедленно следует его иррацио- иррациональность. В самом деле, если предположить, что е = ^, где p,q & N, то число q\ е должно быть целым, а вместе с тем и тогда число -^ тоже должно быть целым, что невозможно. Для сведения читателя отметим, что число е не только иррацио- иррационально, но даже трансцендентно. Задачи и упражнения 1. Покажите, что число х е Ш. рационально тогда и только тогда, когда его запись в любой g-ичной системе счисления периодична, т.е., начиная с некоторого разряда, состоит из периодически повторяющейся группы цифр. 2. Мяч, упав с высоты h, подскакивает на высоту qh, где q — постоянный коэффициент, 0 < q < 1. Найти время, за которое он окажется покоящимся на земле, и путь, который он к этому моменту пролетит. 3. На окружности отмечаются точки, получающиеся из некоторой фик- фиксированной ее точки поворотами окружности на всевозможные углы в п £ Z радиан. Укажите все предельные точки построенного множества.
122 ГЛ. III. ПРЕДЕЛ 4. Выражение Tii Н~  + - 13 + 1 1 1 ".ft—i 4 1 Пк где пг € N, называется конечной цепной или непрерывной дробью, а выражение 1 щ + n2 — бесконечной цепной дробью. Дроби, получающиеся из цепной дроби при от- отбрасывании всех ее звеньев, начиная с некоторого звена, называют подходя- подходящими дробями. Бесконечной цепной дроби в качестве значения сопоставляется предел последовательности ее подходящих дробей. Покажите, что: а) Каждое рациональное число ™, где т, п € N, может быть разложено и притом единственным способом в цепную дробь: т 1 1 qn-i + — Указание. Числа qi,.--,qn, называемые неполными частными, получа- получаются из алгоритма Евклида т = п • qi + 7*i, П = Г\ ■ <72 + 7, 7"! = 7 • <?3 + Гз, если его записать в виде т 1 1 — = qi + —г- = qi H п п/п й +.
§ 1. ПРЕДЕЛ ПОСЛЕДОВАТЕЛЬНОСТИ 123 b) Подходящие дроби Ri = qi, i?2 = <?i + ^-, ■ - ■ удовлетворяют неравен- неравенствам #1 < R3 < . . . < R2k-1 < — < #2fc < #2fc-2 < • • ■ < #2- n c) Числители Рк и знаменатели Qk подходящих дробей Rk формируются по закону Рк = Рк-\Чк + Рк-2, Рг = Ч№, Р\ = qi, Qk = Qk-iqk + Qk-2, <5г = 42, Qi = l. d) Разность соседних подходящих дробей вычисляется по формуле e) Каждая бесконечная цепная дробь имеет определенное значение. f) Значение бесконечной цепной дроби иррационально. 1-1- VS _ 1 h) Числа Фибоначчи 1,1,2,3,5,8,... (т. е. ип = un_i +un_2 и щ = и2 = 1), получающиеся как знаменатели подходящих дробей в g), задаются формулой i) Подходящие дроби Rk = Q- в g) таковы, что Сравните этот результат с утверждениями задачи 11, §2, гл. П. 5. Покажите, что а) при n ^ 2 справедливо равенство 11 1 1 „ 1 1 1 + 77 + ^ + ■ • ■ + "Г + "I- = 3 - 1 QW6' 1! 2! п! п\п 1-2-2! "" (n-l)n-n!1 с) для приближенного вычисления числа е значительно лучше формула e«l + Yj + ... + ^y + j^, а не исходная формула еи1-|-^ + ... + ^ (оцените погрешности, посчитайте и сравните результат со значением е, приведенным на с. 121). 6. Если а и Ь — положительные числа, ар — произвольное отличное от нуля вещественное число, то средним порядка р чисел аи b называется величина a,b)=\
124 ГЛ. III. ПРЕДЕЛ В частности, получаем при р = 1 среднее арифметическое, при р = 2 — среднее квадратическое, при р = -1 — среднее гармоническое чисел а, Ъ. a) Покажите, что среднее Sp(a,b) любого порядка заключено между чи- числами а и Ь. b) Найдите пределы последовательностей {Sn(a,b)}, {S-n(a,b)}. 7. Покажите, что если а > 0, то последовательность жп+1 = | (хп + ^ 1 при любом х\ > 0 сходится к арифметическому квадратному корню из а. Оцените скорость сходимости, т.е. величину абсолютной погрешности \хп — а\ = |ДП| в зависимости от п. 8. Покажите, что a) S0(n) = l0 + ... + n° = n, S1(n) = l1 + ...+n1 = ^±^ = \п2 + \п, S2(n) = I2 + ... + n2 = n(n + i)pn + i) = 1 „з + 1 „2 и вообще „ + in*+in3 + ^2, = ak+ink+1 + ... + ащ + а0 — многочлен от п степени к + 1. § 2. Предел функции 1. Определения и примеры. Пусть Е — некоторое подмножест- подмножество множества R действительных чисел и а — предельная точка множе- множества Е. Пусть /: Е —>■ R — вещественнозначная функция, определенная на Я. Мы хотим записать, что значит, что при приближении точки х G Е к а значения f(x) функции / приближаются к некоторому числу А, ко- которое естественно назвать пределом значений функции / или пределом функции / при х, стремящемся к а. Определение 1. Будем (следуя Коши) говорить, что функция f: Е -¥ Ш стремится к А при х, стремящемся к а, или что А является пределом функции f при х, стремящемся к а, если для любого числа е > 0 существует число S > 0 такое, что для любой точки х G Е такой, что 0 < \х — а\ < 6, выполнено соотношение \f(x) — А\ < е.
§ 2. ПРЕДЕЛ ФУНКЦИИ 125 В логической символике сформулированные условия запишутся в виде Ve > 0 36 > 0 Vz € Е @ < \х - а\ < 6 => \f(x) - А\ < е). Если А — предел функции f(x) при х, стремящемся по множеству Е к точке а, то пишут fix) -> А при х -> а, х € Е, или lim f(x) = Л. х^а,хеЕ Вместо символа х —> а, х Е Е, мы, как правило, будем использовать более короткое обозначение Е Э х -> а и вместо lim f(x) будем ж>аж€Е писать lim f(x) = A. ЕЭ+ Пример 1. Пусть Е = R \ 0, f(x) = a;sin |. Проверим, что lim a; sin — = 0. X Действительно, при заданном е > 0 возьмем 6 = е, тогда при 0 < < \х\ < 6 = е, учитывая, что a; sin ^ ^ \х\, будем иметь < е. Из этого примера, кстати, видно, что функция f:E—>M. может иметь предел при Е Э х —> а, даже не будучи определенной в самой точке о. Как раз эта ситуация чаще всего имеет место при вычислении пределов и, если вы обратили внимание, это обстоятельство учтено в определении предела в виде неравенства 0 < \х — а\. Напомним, что окрестностью точки а € М. мы назвали любой ин- интервал, содержащий эту точку. Определение 2. Проколотой окрестностью точки называется окрестность точки, из которой исключена сама эта точка. Если U(а) —обозначение окрестности точки а, то проколотую ок- о рестность этой точки будем обозначать символом U(а). Множества UE(a):=EnU(a), UE{a) :=ЕП U(a) будем называть соответственно окрестностью и проколотой окрест- окрестностью точки а в множестве Е. о Если о — предельная точка Е, то Ue{o) Ф ®, какова бы ни была окрестность U(а).
126 ГЛ. III. ПРЕДЕЛ Если на минуту принять громоздкие символы UЕ(а) и V^(A) для обозначения проколотой J-окрестности точки а в множестве Е и е-окре- стности точки А в К, то приведенное выше так называемое «е - J-onpe- деление» Коши предела функции можно переписать в виде f(x) = л) := ЧЩА) 3U5E{a) (/(С^(а)) С t£(A)) . Эта запись говорит, что А является пределом функции f:E—t№. при х, стремящемся к а по множеству Е, если для любой е-окрестно- сти V^(j4) точки А найдется проколотая J-окрестность UЕ{а) точки о в множестве Е, образ которой f{UE(a)) при отображении f:E—tW полностью содержится в окрестности ^ Учитывая, что в любой окрестности точки числовой оси содержится также некоторая симметричная окрестность (J-окрестность) этой же точки, мы теперь приходим к следующей форме записи определения предела, которую и будем считать основной. Определение 3. ( Шп J(x) = А) := VHi(A) 3UE(a) (f(UE(a)) С VR(A)\ Итак, число А называется пределом функции f:E—>M. при х, стре- стремящемся по множеству Е к точке а (предельной для Е), если для любой окрестности точки А найдется проколотая окрестность точки а в мно- множестве Е, образ которой при отображении f-.E—tM. содержится в заданной окрестности точки А. Мы привели несколько формулировок определения предела функ- функции. Для числовых функций, когда а, А € R, как мы видели, эти форму- формулировки эквивалентны. Вместе с тем для разных целей бывает удобна то одна, то другая из них. Например, при численных оценках удоб- удобна исходная форма, указывающая допустимую величину отклонения х от а, при которой уклонение f(x) от А не превысит заданной величины. А вот с точки зрения распространения понятия предела на более общие функции, определенные не на числовом множестве, наиболее удобной является последняя формулировка, которую мы и выделили. Из нее, кстати, видно, что мы сможем определить понятие предела отображе- отображения f:X—>Y, если нам будет сказано, что такое окрестность точки в X и в У, или, как говорят, если в X и Y будет задана топология.
§ 2. ПРЕДЕЛ ФУНКЦИИ 127 Рассмотрим еще некоторые, поясняющие основное определение при- примеры. Пример 2. Функция {1 при х > О, О при х = О, —1 при х <О (читается «сигнум я»1)) определена на всей числовой оси. Покажем, что у нее нет предела при х, стремящемся к 0. Это значит, что УЛбК 3V(A) V#@) 3xeU@) (f(x)$V(A)), т.е., какое бы А (претендующее на то, чтобы быть пределом sgna; при х -> 0) мы ни взяли, найдется такая окрестность V(A) точки А, что, о какую бы (малую) проколотую окрестность U@) точки 0 ни взять, в о ней есть по крайней мере одна точка х € С/@), значение функции в которой не лежит в V^-A). Поскольку функция sgna; принимает только значения —1, 0, 1, то ясно, что никакое число А, отличное от них, не может быть пределом функции, ибо оно имеет окрестность V^-A), не содержащую ни одно из этих трех чисел. Если же А € {—1,0,1}, то возьмем в качестве V(A) е-окрестность точки А при е = 1/2. В такую окрестность заведомо не могут попасть одновременно обе точки —1 и 1. Но, какую бы проколотую окрестность о 1/@) точки 0 ни взять, в ней есть как положительные, так и отрица- отрицательные числа, т. е. есть и точки х, где f(x) — 1, и точки, где f(x) = —1. о Значит, найдется точка х € U@) такая, что f(x) £ V(A). Условимся, если функция /: Е -> R определена во всей проколотой о о о окрестности некоторой точки а € К, т.е. когда Ue{o) = U-^{a) = U(a), вместо записи Е Э х -> а употреблять более короткую запись х —> а. (лат.)—знак.
128 ГЛ. III. ПРЕДЕЛ Пример 3. Покажем, что lim |sgna;| = 1. Действительно, при х € Ш\ 0 имеем | sgna;| = 1, т. е. функция посто- о янна и равна 1 в любой проколотой окрестности U@) точки 0. Значит, о для любой окрестности V(l) получим /([/@)) = 1 € V(l). Обратите внимание, что хотя в данном случае функция |sgna;| и определена в самой точке 0 и |sgnO| = 0, но это значение не имеет никакого влияния на величину рассматриваемого предела. Таким образом, не следует смешивать значение /(а) функции в точ- точке а с пределом lim fix) функции при х, стремящемся к а. Пусть К_ и R+ — множества отрицательных и положительных чисел соответственно. Пример 4. В примере 2 мы видели, что предел lim sgn я; не су- ществует. Замечая, однако, что ограничение sgn |R функции sgn на DL. есть постоянная функция, равная — 1, a sgn|R есть постоянная, рав- равная 1, можно, как и в примере 3, показать, что lim sena; = — 1, lim sena; = 1, R-Эя-Ю R+Эж-Ю т.е. ограничение одной и той же функции на различные множества может иметь различные пределы в одной и той же точке или даже не иметь его, как это было в примере 2. Пример 5. Развивая идею примера 2, можно аналогично пока- показать, что функция sin ^ не имеет предела при х —> 0. о Действительно, в любой проколотой окрестности U@) точки 0 все- всегда есть точки вида _ф\27ТО и ^^Хгт' Где П G N' B КОТОРЫХ функция принимает значения —1 и 1 соответственно. Но оба эти числа не могут одновременно содержаться в е-окрестности V(A) точки А € € К, если е < 1. Значит, ни одно число А € R не может быть пределом этой функции при х -> 0. Пример 6. Если Е_ = \хеш\х = —-—-—, пеЩ \ ' -тг/2 + 2тгп J
§ 2. ПРЕДЕЛ ФУНКЦИИ 129 \ = \xeR\x = , пе тг/2 + 2тгп' то, подобно рассмотренному в примере 4, получаем, что lim sin—= —1 и lim sin—= 1. Я-Эя-Ю X Е+Эх->0 X Между изученным в предыдущем параграфе понятием предела по- последовательности и введенным здесь понятием предела произвольной числовой функции имеется тесная связь, которую выражает следующее Утверждение I1). Соотношение lim fix) = А имеет место Еэх-м. тогда и только тогда, когда для любой последовательности {хп} то- точек хп ЕЕ\а, сходящейся к а, последовательность {f(xn)} сходится к А. < То, что ( lim fix) = А) => ( lim f(xn) = А), сразу следует из КЕЭх-м. / \п->оо / определений. Действительно, если lim fix) = А, то для любой окрест- ЕЭх^Уа о ности V(A) точки А найдется проколотая окрестность Uе{о) точки а о в Е такая, что для х G Ue(q) имеем f(x) € V(A). Если последователь- последовательность {хп} точек множества Е \ а сходится к а, то найдется номер N о такой, что при п > N будет хп € Ue{o) и, значит, f(xn) € V^-A)- На основании определения предела последовательности, таким образом, за- заключаем, что lim fixn) = A. п-»оо Перейдем к доказательству обратного утверждения. Если А не явля- является пределом f(x) при Е Э х —> а, то найдется окрестность V(A) та- такая, что при любом п € N в ^-окрестности точки а найдется точка хп 6 Е \ а такая, что f(xn) £ V(A)- Но это означает, что последо- последовательность {f(xn)} не сходится к А, хотя последовательность {хп} стремится к а. ► ''Его иногда называют утверждением о равносильности определений предела по Коши (через окрестности) и по Гейне (через последовательности). Э.Гейне (Хайне) A821-1881)—немецкий математик.
130 ГЛ. III. ПРЕДЕЛ 2. Свойства предела функции. Теперь установим ряд постоянно используемых свойств предела функции, многие из которых аналогич- аналогичны уже доказанным свойствам предела последовательности и потому, в сущности, нам уже знакомы. Более того, на основании только что доказанного утверждения 1 многие важные свойства предела функции, очевидно, немедленно следуют из соответствующих свойств предела по- последовательности: единственность предела, арифметические свойства предела, предельный переход в неравенствах. Тем не менее мы вновь проведем все доказательства. В этом, как выяснится, есть определен- определенный смысл. Мы хотим обратить внимание читателя на то, что для установления всех свойств предела функции требуются всего два свойства проколо- о тых окрестностей предельной точки множества: Bi) Ue{o) ф &, т.е. о о о о проколотая окрестность непуста, и В2) VU'E(a) VUE(a) 3Ue{o){Ve{o) С о о С U'E(a) П U"E(a)), т. е. в пересечении любой пары проколотых окрест- окрестностей содержится проколотая окрестность. Это наблюдение приведет нас к общему понятию предела функции и возможности в будущем ис- использовать теорию предела уже не только для функций, определенных на числовых множествах. Чтобы изложение не было простым повторе- повторением сказанного в § 1, мы используем здесь некоторые новые полезные приемы и понятия, которые не демонстрировались в § 1. а. Общие свойства предела функции. Сначала несколько опре- определений. Определение 4. Функцию /: Е —> R, принимающую только одно значение, будем, как и прежде, называть постоянной. Функция /': Е -> —> R называется финально постоянной при Е Э х —> а, если она посто- о янна в некоторой проколотой окрестности Ue{o) точки а, предельной для множества Е. Определение 5. Функция f-.E—tM. называется ограниченной, ограниченной сверху, ограниченной снизу, если найдется число С € К такое, что для любого х € Е выполнено соответственно \f(x)\ < С, f(x)<C, C<f(x). В случае, если первое, второе или третье из этих соотношений вы- о полнено лишь в некоторой проколотой окрестности Ue{o) точки о,
§ 2. ПРЕДЕЛ ФУНКЦИИ 131 функция f:E—^M. называется соответственно финально ограничен- ограниченной при Е Э х -> а, финально ограниченной сверху при Е Э х -> а, финально ограниченной снизу при Е Э х —> а. Пример 7. Функция/(ж) = (sin^ + a;cos |j, определенная этой формулой при х ф О, не является ограниченной на области определения, но она финально ограничена при х —> 0. Пример 8. То же самое относится к функции f(x) = x на К. Теорема 1. а) (/: Е -> R при Е Э х -> а есть финально посто- постоА) =3- I lim /(ж) = Л I. Ь) C lim f(x)) =r- (/: Е -> R финально ограничена при Е Э \ Еэх-+а ) янная 4о). с) (lim /(*) = лЛ Л (lim f(x) = А2) => (Л, = Л2). \ЕЭх^а / \ЕЭх-*а ) 4 Утверждение а) о наличии предела у финально постоянной функ- функции и утверждение Ь) о финальной ограниченности функции, имеющей предел, вытекают прямо из соответствующих определений. Обратимся к доказательству единственности предела. Предположим, что А\ ф А2. Возьмем тогда окрестности V(A\), V(A2) так, чтобы они не имели общих точек, т.е. VX-Ai) П V(A2) = 0. По определению предела имеем ЕШаЯх) = А1=>Зи>Е(а) (f(U'E(a))c lim f(x) = А2 => BUM (f(U'h(a))cV(A2) (f(U'h(a) Возьмем теперь проколотую окрестность Ue{o) точки а (предель- о о о ной для Е) такую, что Ue{o) С U'E{a) П UE(a) (например, можно взять о о о Ue{u) = U'E(a) П UE(a), поскольку это пересечение тоже есть проколо- проколотая окрестность). Поскольку UE(a) ф 0, берем х € UE(a). Тогда f(x) € V(Ai)r\V(A2), что невозможно, так как окрестности V(yli), V{A2) по построению не имеют общих точек. ►
132 ГЛ. III. ПРЕДЕЛ b. Предельный переход и арифметические операции Определение 6. Если две числовые функции /: Е -> К, д: Е -> —> R имеют общую область определения Е, то их суммой, произведени- произведением и частным называются соответственно функции, определенные на том же множестве следующими формулами: {f + g)(x):=f(x)+g(x), (f-9)(*)--=f(x)-9(x), /1\ f(x\ I - ) (x) -.= ~—i-, если g(x) Ф 0 при х € E. \9/ 9(x) Теорема 2. Пусть f: E —¥ Ш и g: E —>Ш — две функции с общей областью определения. Если lim fix) = A, lim q(x) = В, то a) lim (f + g)(x)=A + B; ЕЭх^уа b) lim (f-g)(x)=A-B; ЕЭх^уа c) lim (£) (х) = 4, если В ф 0 и д(х) Ф 0 при хеЕ. ЕЭх-м, \у/ -о Эта теорема, как уже отмечалось в начале пункта 2, непосредствен- непосредственно вытекает из соответствующей теоремы о пределах последователь- последовательностей, если учесть утверждение, доказанное в пункте 1. Теорему можно получить также, повторив доказательство теоремы об арифметических свойствах предела последовательности. Все изме- изменения в доказательстве, которые при этом придется провести, сведутся к тому, что всюду, где раньше мы выбирали «TV € N, начиная с кото- которого ... », нужно будет выбирать некоторую проколотую окрестность о Ue{o) точки а в множестве Е. Советуем читателю проверить это. Здесь же мы получим эту теорему из ее простейшего частного слу- случая, когда А = В = 0 (утверждение с) при этом, разумеется, не рас- рассматривается) . Функцию f-.E-ьШ. принято называть бесконечно малой при Е Э Э х -> а, если lim f(x) — 0. Еэхм Утверждение 2. а) Если а: Е -> R и /3: Е -> R—бесконечно малые функции при Е Э х -> а, то их сумма а + /3: Е -> R — также бесконечно малая функция при Е Э х —> а.
§ 2. ПРЕДЕЛ ФУНКЦИИ 133 b) Если а: Е -> R и @: Е —> R— бесконечно малые функции при Е Э х —> а, то их произведение а • /3: Е -> R —также бесконечно малая функция при Е Э х —> а. c) Если а: .Б -> R —бесконечно малая функция при Е Э х —> а, а C: Е —> R — финально ограниченная функция при Е Э х —> а, то произведение а ■ /3: .Е —> R есть бесконечно малая функция при Е Э Эх—>а. ■4 а) Проверим, что lim а(ж) = 0)л( lim /?(a;)=0)^( lim (a + [3)(x) = 0) . Пусть задано число е > 0. По определению предела имеем ^(а) (\р(х)\ < |)) . о о Тогда для проколотой окрестности Ue{o) С С^£;(о) П U"E{a) получаем V* € 17в(а) Ка + ^И! = \а{х)+р{х)\ ^ \а(х)\ + \0(х)\ < е, € т. е. проверено, что lim (а + /3) (х) = 0. Еэх-^-а b) Это утверждение есть частный случай утверждения с), поскольку всякая функция, имеющая предел, финально ограничена. c) Проверим, что ( lim^a(z) = 0^ Л (зм € R 3UE(a) Ух € UE(a) (\C(x)\ < M)\ =>• =>■ [ lim a(xH(x) = 0 ) . \E3x-Hi ) Пусть задано е > 0. По определению предела имеем
134 ГЛ. III. ПРЕДЕЛ Тогда для проколотой окрестности U"E{a) С п'Е{а) П Uе{о) получаем V* € U'M \(а ■ 0)(х)\ = \а(х)C(х)\ = \a(x)\\f3(x)\ < ^ ■ М = е. Тем самым проверено, что lim а(х)Р(х) = 0. ► ЕЭх-м. Теперь сделаем следующее полезное Замечание. ( lim /far) = A ) & (f{x) =А + а(х)) А ( lim а(х) = 0 ) . \E3x-w, ) \ЕЭх-+а ) Иными словами, функция f:E—^M. стремится к А тогда и только тогда, когда она может быть представлена в виде суммы А + а(х), где а(х) —бесконечно малая при Е Э х —> а функция (уклонение f(x) от ЛI). Это непосредственно следует из определения предела, в силу кото- которого lim fix) = A& lim (f{x) - А) = 0. Приведем теперь доказательство теоремы об арифметических свой- свойствах предела функции, основанное на этом замечании и установленных свойствах бесконечно малых функций. < а) Если lim fix) = А и lim д(х) = В, то f(x) = А + а(х) и ЕЭх-^а ЕЭх-ю, д(х) = В + /3(х), где а(х) и /3(х) —бесконечно малые при Е Э х -> а. Тогда (f + g)(x) =f(x)+g{x) = A + a(x) + B+p(x) = (А + В)+ф), где j(x) = а(х)+C(х), как сумма бесконечно малых, есть бесконечно малая функция при Е Э х -> а. Таким образом, lim (/ + д)(х) = А + В. ЕЭх-^-а Ъ) Вновь представив f(x) и д(х) в виде f(x) = А + а(х) и д(х) = В + + Р(х), имеем (/ • 9)(х) = f(x)g(x) = (A + а(х))(В + 0(х)) =А-В + 7(аг), 1' Любопытная деталь: это почти очевидное, но очень полезное в вычислительном плане и важное в идейном отношении представление особо отмечалось французским математиком и механиком Лазаром Карно A753-1823), революционным генералом и академиком, отцом родоначальника термодинамики Сади Карно A796-1832).
§ 2. ПРЕДЕЛ ФУНКЦИИ 135 где *у(х) = А@(х) + Ва{х) + а(х)C(х) по свойствам бесконечно малых есть бесконечно малая функция при Е Э х ->• о. Таким образом, lim (/ • д){х) = А- В. ЕЭх-+а с) Вновь запишем, что f(x) — А + а(ж) и д(х) = В + /3(ж), где lim а(ж) = 0, lim E{x) = 0. о Поскольку В ф 0, существует проколотая окрестность Ue{o), в лю- любой точке которой |/3(ж)| < Ц-l, и потому \д(х)\ = \В + C(х)\ ^ \В\ — - Щх)\ > LJ. Тогда в Ue{(i) будем иметь также т-7-п < гдТ' т-е- функция -к~г финально ограничена при Е Э х —> о. Теперь запишем Б По свойствам бесконечно малых (с учетом доказанной финальной огра- ограниченности -j^r) функция 'у(х) есть бесконечно малая при Е э х -»• о. 9(х) 9() Таким образом, доказано, что lim ( ^ ) (х) = -=. с. Предельный переход и неравенства Теорема 3. а) Если функции f:E—> Ы. и д: Е —>М таковы,что lim /(ж) = Л, lim д(х) = В и А < В, то найдется проколотая ЕЭх->а ЕЭх-+а о окрестность Ue{o) точки а в множестве Е, в любой точке которой выполнено неравенство f(x) < g(x). b) Если между функциями f: Е -> К, g: E -t M. и h: E -t M. на множестве Е имеет место соотношение f(x) ^ g(x) ^ h(x) и если lim f(x) = lim h(x) = С, то существует также предел д(х) при Эх^а ЕЭх+а ЕЭ х -> а. причем lim д(х) = С. ЕЭх-+а ' < а) Возьмем число С такое, что А < С < В. По определению преде- о о ла найдем проколотые окрестности U'E{a) и UE(a) точки о в множестве о о Е так, чтобы при х G U'E(a) иметь \f{x) — А\ < С — А и при х G UE(a) о иметь \д(х)—В\ <В — С. Тогда в любой проколотой окрестности
136 ГЛ. III. ПРЕДЕЛ содержащейся в U'E(a) П U'E(a), получим /(ж) < А+ (С - А) = С = В - (В - С) < д(х). Ь) Если lim f(x) = lim h(x) = С, то по любому фиксированному ЕЭх—м, ЕЭх-+а о о е > 0 найдутся такие проколотые окрестности U'E(a) и UE(a) точки а о о в множестве Е, что при х € U'E(a) имеем С — е < f(x) и при х 6 U"E{a) о имеем h(x) < С + е. Тогда в любой проколотой окрестности Ue(o), о о содержащейся в U'E(a) П UE(a), будем иметь С — е < f(x) < д{х) ^ ^ h(x) < С + е, т. е. \д(х) — С\ < е, и, следовательно, lim g(x) = С. ► ЕЭх-м. Следствие. Пусть lim f(x) = А и lim д(х) = В. Если в неко- ЕЭх-+а ЕЭх—i-a о торой проколотой окрестности Ue(o) точки а a) выполнено f(x) > д{х), то А ^ 5; b) выполнено f(x) ^ д(х), то А^ В; c) выполнено f(x) > В, то А ^ В; d) выполнено f(x) ^ В, то А^ В. < Рассуждая от противного, из утверждения а) теоремы 3 немедлен- немедленно получаем утверждения а), Ь) доказываемого следствия. Утверждения с), d) получаются из первых двух при д(х) = В. ► d. Два важных примера. Прежде чем переходить к дальнейшему изложению теории предела функции, продемонстрируем на двух важ- важных примерах использование уже доказанных теорем. Пример 9. smx lim = 1. ж-Ю X Здесь мы будем апеллировать к школьному определению sin ж как ординаты точки, в которую переходит точка A,0) при повороте (с цен- центром в начале координат) на угол х (радиан). Полнота такого опреде- определения всецело зависит от того, насколько тщательно установлена связь между поворотами и действительными числами. Поскольку сама систе- система действительных чисел в школе не была описана достаточно подроб- подробно, надо считать, что нам необходимо уточнить определение sin ж (то же самое относится и к функции cos ж).
§ 2. ПРЕДЕЛ ФУНКЦИИ 137 В свое время мы это сделаем и обоснуем те рассуждения, которые сейчас будут опираться на наглядность. а) Покажем, что ^ ■*£ = (cos ж, sin ж) 9 sin ж , . тг cos х < < 1 при 0 < \х\ < —. < Так как cos2 x и ^|-^ — четные функ- функции, то достаточно рассмотреть случай 0 < < х < 7г/2. Из рис.8 и определения cos ж и sin х, сравнивая площади сектора <OCD, ИС- ■ треугольника ДОАВ и сектора <ОАВ, имеем 11 1 1, л , ^, 1 1 • < Saoab = - 0-А " \ВС\ = - ■ 1 • sin a; = -smi < 2 2 2 < ^оав = \\ОА\ ■ \АВ\ = 1 • 1 -ж = \х. Разделив эти неравенства на ^ж, получаем то, что и утвержда- утверждалось. ► b) Из а) следует, что | sina;| ^ |ж| при любом ж G М, причем равенство имеет место только для ж = 0. < При 0 < |ж| < 7г/2, как показано в а), имеем | втж| < |ж|. Но ) sin ж| < 1, поэтому для |ж| ^ 7г/2 > 1 также выполнено последнее неравенство. И только при ж = 0 имеем sin ж = ж = 0. ► c) Из Ь) следует, что lim sin ж = 0. -* Поскольку 0 < I sina;| < \х\ и поскольку lim \x\ = 0, на основа- нии теоремы о связи предела функции с неравенствами получаем, что lim I sin ж | = 0, следовательно, lim sin ж = 0. ► d) Теперь докажем, что lim ^L^ = 1. Ж-+0
138 ГЛ. III. ПРЕДЕЛ Считая, что \х\ < тг/2, в силу полученного в а) неравенства имеем . о sinrr 1 -sura: < < 1. х Но lim(l — sin2ж) = 1 — limsina: • limsina: = 1 — 0 = 1, значит, по теореме о предельном переходе в неравенствах можем заключить, что lim =|£ = 1. ► х-ч-0 х Пример 10. Определение показательной, логарифмической и степенной функций на основе теории предела. Мы продемонстриру- продемонстрируем сейчас, чем и как можно было бы дополнить школьное определение показательной и логарифмической функций, если располагать теорией действительного числа и теорией предела. Для удобства ссылок и полноты картины проделаем всё с самого начала. а) Показательная функция. Пусть о > 1. 1° Для п G N полагаем по индукции о1 := о, on+1 := о" • о. Таким образом, на N возникает функция о", которая, как видно из определения, обладает свойством о" если т, п £ N и т > п. 2° Это свойство приводит к естественным определениям о0 := 1, а~п := — при п £ N, после которых функция о" оказывается распространенной на множест- множество Z целых чисел и для любых т,п £ Z ат-ап = ат+п. 3° В теории действительных чисел мы отметили, что для о > 0 и п £ N существует единственный арифметический корень n-й степени из о, т. е. число х > 0 такое, что хп = а. Для него принято обозначе- обозначение о1'". Оно удобно, если мы желаем сохранить закон сложения пока- показателей: а = а1= (allnY = о1/" ... о1/" = о1/»+-+1Л\
§ 2. ПРЕДЕЛ ФУНКЦИИ 139 По той же причине естественно положить amln := (a1ln)m и о/" := = (а1/") для п € N и m € Z. Если окажется, что а(ткУ№> = ат1п для fc G Z, то можно считать, что мы определили аТ для г 6 Q. 4° Для чисел 0 < х, 0 < у по индукции проверяем, что для п G N (я < у) О (а;п < уп), поэтому, в частности, (я = у) «*(*"= у"). 5° Это позволяет доказать правила действий с рациональными по- показателями, в частности, что o(mfc)/(nfc) = ат/п к z ^ Действительно, а^тк''^пк^ > 0 и om/n > 0. Далее, поскольку ^а(тк)/(пк)^ = ^ol/(nfc)j j = аг/{п к)\ = I (nll(nk)\ \ =атк от/") =((о1/п) ) =атк, то первое из проверяемых равенств в соответствии с 4° установлено. Аналогично, П1П2 а ) ) •((о'П2) поэтому второе равенство также доказано. ►
140 ГЛ. III. ПРЕДЕЛ Таким образом, мы определили ат для г G Q, причем ат > 0 и для любых г\, гг G Q а7 -о7 =оГ1+Г2. 6° Из 4° следует, что для п,Г2 G Q (п <г2) =>- (о7 <оГ2). < Поскольку A < о) Ф> (l < а1/") для га G N, что сразу следует из 4°, то (o1//n) = amln > 1 при n,m G N, что опять-таки следует из 4°. Таким образом, при 1 < о для г > 0, г G Q имеем ог > 1. Тогда при п < гг на основе 5° получаем о7 = о7 • а711 > о1 • 1 = оГ1. ► 7° Покажем, что для го G Q lim ог = ого. •^ Проверим, что аР —> 1 при Q Э р -> 0. Это следует из того, что при \р\ < ^ имеем в силу 6° о/" <ар< о1/". Мы знаем, что о1'" -> 1 (и о'" -> 1 ) при п -> оо. Тогда стандарт- стандартным рассуждением проверяем, что для е > 0 найдется £ > 0 такое, что при |р| < 6 будет 1 - е < ар < 1+ е. В качестве 8 можно взять ^, если 1 — е < оГ11п и о1/" < 1 + е. Теперь докажем основное утверждение. По е > 0 подберем 6 так, что при \р\ < 6 1-еа~Г0 <ар < 1 + еа~г°. Если теперь |?— ro| < S, то огоA - еа~го) <аг = аг° ■ аг-г° < ог°A + еа~г°), или аго - е < аг < аг° + е. ►
§ 2. ПРЕДЕЛ ФУНКЦИИ 141 Итак, на Q определена функция ог со свойствами: о1 = о > 1; ori - ori <aT2 >aT2 ■aT2 = при при ori+r2; Г\ < 1 ОЭг Продолжим ее на всю числовую ось следующим образом. 8° Пусть х G К, s = sup ог и г = inf оГ. Ясно, что s, i € К, так <ОЭ> как при ri < а; < гг имеем оГ1 < о7. Покажем, что на самом деле s = i (и тогда эту величину мы обо- обозначим через ах). ■4 По определению s и i, при ri < х < ri имеем ari ^s^i ^аГ2. Тогда 0 ^ i - s < оГ2 - оГ1 = о7 (оГ2-Г1 - 1) < s(or2-ri -г 1). Но ар -И при Q Э р ->• 0, поэтому для любого е > 0 найдется 6 > 0 такое, что при О < гг — r\ < S будет aT2~~Tl — 1 < e/s. Тогда получим, что 0 ^ i — s < e, и, поскольку е > 0 произвольно, заключаем, что г = s. ► Положим ах := s = i. 9° Покажем, что ах — lim ог. ОЭг—>ж -^ Учитывая 8°, для е > 0 найдем г' < х так, что s — е < ar> < s = = ах, и г" так, что ох = г < ог' < г + е. Поскольку г' < г < г" влечет аг < аг < ат , для всех г G Q, лежащих в интервале ]г', г"[, будем тогда иметь ах - е < ат < ах + е. ► Займемся теперь свойствами построенной функции о1 на М. 10° Для хих2 Е R при о > 1 (si < ж2) =Ф (о11 < аХ2). ^ На интервале ]ж1,Ж2[ найдутся два рациональных числа г\ < г2- Если х\ ^ г\ < Г2 ^ X2, то по определению о1, данному в 8°, и свойствам функции ах на Q имеем aXl <ori <оГ2 ^о12. ► 11° Для любых xi, х2 Е Ш верно aXl ■ аХ2 = аХ1+Х2.
142 ГЛ. III. ПРЕДЕЛ < В силу известных нам оценок абсолютной погрешности произве- произведения и свойства 9° можно утверждать, что для любого е > 0 найдется число 8' > 0 такое, что при \х\ — г\\ < 8', \х2 — г%\ < 8' будет о*1 . аХ2 - £- < аГ1 ■ аГ2 < aXl ■ аХ2 + |. Уменьшая, если нужно, 8', можно подобрать 8 < 8' так, что при \х\ - ri\ < 8, \х2 - гг| < S, т.е. при \(xi + х2) - (п + гг)| < 28, будем иметь также оП+га _ £ <- аХ1+Х2 < ОГ1+Г2 + £_ Но ari •аГ2 = аГ1+Г2 для ri,r2 G Q, значит, из полученных неравенств вытекает, что aXl ■ аХ2 - е < аХ1+Х2 < aXl ■ аХ2 + е. Поскольку е > 0 произвольно, заключаем, что 12° lim ах = ах°. (Напомним, что «ж -> жо» — принятое сокращение X—>Хо для «М Э ж -> жо».) ■< Проверим сначала, что lim о1 = 1. По е > 0 найдем п 6 N так, х-+0 ЧТО 1 - е < а~11п < о1/п < 1 + е. Тогда в силу 10° при |ж| < 1/п будем иметь 1 - £ < а~11п <ах < ах1п < 1 + е, т. е. проверено, что lim ax = 1. Если теперь взять 8 > 0, чтобы при |ж — жо| < 8 было lo10 — 1| < < еа~х°, то получим о10 - £ < ах = ахо (ах~хо - l) < ах° + е и тем самым проверено, что lim ax = ах°. ► 13° Покажем, что множеством значений построенной функции ж ь4 о1 является множество R+- всех положительных действительных чисел.
§ 2. ПРЕДЕЛ ФУНКЦИИ 143 •^ Пусть уо €Е Л&+-- Если о > 1, то, как нам известно, найдется число п € N такое, что а~п < уо < ап. В силу этого оба множества А = {хеШ\ах <уо} и Б = {х £ Ш \ уо < ах} непусты. Но поскольку (х\ < х2) ■& (aXl < а?2) (при о > 1), то для любых чисел ii, i2 G М таких, что х\ £ А и х2 £ В, имеем х\ < х2. Следовательно, к множествам А и В применима аксиома полноты, из которой следует существование числа xq такого, что х\ ^ xq ^ Х2 для любых элементов х\ £ А и Х2 G В. Покажем, что аХо = уо- Если бы было аХо < уо, то, поскольку аХо+х1п -> ах° при п -^ сю, нашлось бы число п £ N такое, что аХо+1'п < уо- Получилось бы, что (жо + л 1 € А, в то время как точка xq разделяет А и В. Значит, пред- предположение аХо < у о неверно. Аналогично проверяем, что неравенство йХо > Уо тоже невозможно. По свойствам действительных чисел отсюда заключаем, что аХо = уо- > 14° Мы пока считали, что о > 1. Но все построения можно было бы повторить и для 0 < о < 1. При этом условии 0 < аг < 1, если г > 0; поэтому в 6°, а затем окончательно в 10° теперь получим, что при 0 < о < 1 (xi < х2) =Ф (а11 > а12). Итак, при о > 0, о ф 1 на множестве Ш действительных чисел мы по- построили действительнозначную функцию х >-» ах со следующими свой- свойствами: 1) а1 - о; 2) о11-о12 =axi+X2; 3) ах ->• аХо при х -> дг0; 4) (aXl < аХ2) Ф> (xi < х2), если о > 1, (aXl > аХ2) Ф> (xi < х2), если 0 < о < 1; 5) множеством значений функции х н-> ах является множество R+. = = {у £ М | 0 < у} всех положительных чисел. Определение 7. Отображение х у-> ах называется показатель- показательной или экспоненциальной функцией при основании о. Особенно часто встречается функция х >-> ех, когда о = е, которую нередко обознача- обозначают через ехр х. В связи с этим для обозначения функции х н-> ах также иногда используется символ ехро х.
144 ГЛ. III. ПРЕДЕЛ b) Логарифмическая функция. Поскольку отображение ехро: М -4 —> ТВЦ., как видно из свойств показательной функции, биективно, оно имеет обратное отображение. Определение 8. Отображение, обратное к ехро: Ш —> ТВЦ., назы- называется логарифмической функцией при основании а @ < о, о ф 1) и обозначается символом 1оёо:1^ ->!. Определение 9. При основании а = е логарифмическая функция, или логарифм, называется натуральным логарифмом и обозначается In: R+. -> М. Причина такой терминологии прояснится при другом, во многом дат же более естественном и прозрачном подходе к логарифмам, который мы изложим после построения основ дифференциального и интеграль- интегрального исчисления. По определению логарифма как функции, обратной экспоненциаль- экспоненциальной, имеем Vz G Ш (log>*) = х), V2/GM+ (al°z«y = y). Из этого определения и свойств показательной функции, в частно- частности, получается, что в области R+- своего определения логарифм обла- обладает следующими свойствами: l')togeo = l; 20 loga(yi • г/2) = loga 2/1 + loSa 2/2! 3') loga у -4 logoгуо при R+. Э у -4 гуо G M+; 40 (l°Sa 2/1 < bgay2) «=> B/1 < 2/2), если о > 1, (logo г/1 > logo г/2) ^ B/1 < 2/г), если 0 < о < 1; 5') множество значений функции logo: R4- —> К совпадает с множе- множеством Ш всех действительных чисел. •^ Из свойства 1) показательной функции и определения логарифма получаем 1'). Из свойства 2) показательной функции получаем 2'). Действительно, пусть xi = logo2/1 их2 = logoг/2- Тогда j/i = о11, 2/2 = о12 и по 2) у\-у2 = = aXl ■ аХ2 = аХ1+Х2, откуда loga(yi • у2) = xi + х2. Аналогично, свойство 4) показательной функции влечет свойство 4') логарифмической.
§ 2. ПРЕДЕЛ ФУНКЦИИ 145 Очевидно, 5) => 5'). Осталось доказать 3'). В силу свойства 2') логарифма loga у - loga уо = loga I ^ J , поэтому неравенства -е < loga у - loga yo<e равносильны соотношению loga (a ) =-£< loga — < e = \yo/ которое по свойству 4') логарифма равносильно -ae < — <ae при а > 1, Уо ae < — < a~e при 0 < a < 1. Уо В любом случае мы получаем, что если уоа~е < У < Уоае при а > 1 или уоае < У < Уоа~е при 0 < а < 1, то -е < loga у - loga уо < е. Таким образом, проверено, что На рис. 9 изображены графики функций ех, 10х, 1пж, log10 ж =: loga;, а на рис. 10—графики функций ( ^ 1 , 0,1х, log^e x, log0]i x. Остановимся еще на одном свойстве логарифма, которым тоже час- часто приходится пользоваться. Покажем, что для любого Ь>0и любого си G R справедливо равен- равенство •4 1° Равенство справедливо при « = я 6 N, ибо из свойства 2') логарифма по индукции получаем loga(yi ■■■Уп) = logaУ\ + ■ ■ ■ + logaУп, значит, logaFn) = loga b + ... + loga b = n loga b. 6-4573
146 ГЛ. III. ПРЕДЕЛ lnx Рис. 9. 2° logaF *) = — loga b, ибо если /3 = loga 6, то b = aP, b-1 = а'13 и loga F) = -/?. 3° Из 1° и 2° теперь заключаем, что для си G Z равенство logaFa) = = си loga Ь справедливо. 4° logaF1/n) = ^ loga Ъ при n G Z. Действительно, 6 = loga (Ъ1'П)П = nloga (б1/") . 5° Теперь можно проверить, что для любого рационального числа си = Щ G Q утверждение справедливо. В самом деле, ^ loga Ъ - mloga (bl'n) = loga = loga 6° Но если равенство loga br = r loga b справедливо для любого г € G Q, то, устремляя г по Q к а, на основании свойства 3) показательной и свойства 3') логарифмической функций получаем, что если г достаточ- достаточно близко к а, то V близко к Ьа и loga br близко к loga ba. Это означает, что lim loga b = loga ^ • ОЭг—>a
§ 2. ПРЕДЕЛ ФУНКЦИИ 147 Рис. 10. Но loga Ьт — г loga Ь, поэтому loga ba = lim log. br = lim r loga b = a log. b. ► <Q9r-+a Q3r>a Из доказанного свойства логарифма можно сделать вывод, что для любых а, Р ЕШи а > 0 имеет место равенство 6) {ааУ = aaf}. < При а — \ считаем, по определению, la = 1 для a£l Таким образом, в этом случае равенство тривиально. Если же а ф 1, то по доказанному bSa((*°H) = /3bga(«Q) = /3 • «bgaa = /3 • а = loga(a^), что в силу свойства 4') логарифма доказывает справедливость указан- указанного равенства. ► с) Степенная функция. Если считать la = 1, то при любом х > 0 и а € Ш. мы определили величину ха (читается «ж в степени а»). Определение 10. Функция х \-ь ха, определенная на множест- множестве R+ положительных чисел, называется степенной функцией, а число а называется показателем степени.
148 ГЛ. III. ПРЕДЕЛ Степенная функция, очевидно, является композицией показательной и логарифмической функций, точнее, На рис. 11 изображены графики функции у = ха при различных значениях показателя степени. У Рис. 11. 3. Общее определение предела функции (предел по базе). Доказывая свойства предела функции, мы убедились, что от проколо- проколотых окрестностей, в которых были определены наши функции и кото- которые возникали в процессе доказательств, кроме свойств Bi), B2), ука- указанных во введении к предыдущему пункту 2, действительно ничего не потребовалось. Это обстоятельство служит оправданием для выделе- выделения следующего математического объекта. а. База; определение и основные примеры Определение 11. Совокупность В подмножеств В С X множе- множества X будем называть базой в множестве X, если выполнены два условия: в2) VBi ев чв2еВ звеВ (всв^пв2). Иными словами, элементы совокупности В суть непустые множества и в пересечении любых двух из них содержится некоторый элемент из той же совокупности. Укажем некоторые наиболее употребительные в анализе базы.
§ 2. ПРЕДЕЛ ФУНКЦИИ 149 Обозначение базы а; -> а X -> 00 х -> а, а; £ .Е или Евх^а или х —>• а х -4 оо, а; £ Е или #Э а; -> оо или X ► 00 Чтение обозначения а; стремится к а а; стремится к бесконечности а; стремится к а по множест- множеству Е х стремится к бесконечности по множест- множеству Е Из каких множеств (элементов) состоит база База проколотых окрестностей точ- точки а е Ж База окрестностей бесконечности База*) проколотых окрестностей точ- точки а в множестве Е База**) окрестнос- окрестностей бесконечности в множестве Е Определение и обозна- обозначение элементов базы U (а) := = {i£l a-Si < < х < a+S2Ax ф а}, где Si > 0, S2 > 0 [/(оо) := = {a; el | S< \x\}, где S eR UE(a) :=ECiU(a) UE(oo) :=ECiU(oo) ''Предполагается, что а — предельная точка множества Е. "'Предполагается, что множество Е не ограничено. Если Е = Е+ = {х G М | х > а} (Е = Е~ = {х е К | х < < а}), то вместо х -> а, х G Е пишут х —> а + 0 (х —> а — 0) и говорят, что х стремится к а справа или со стороны больших значений (соответственно, слева или со стороны меньших значений). При а = О принята краткая запись х -> +0 (х -> —0) вместо ж-»0+0 (ж -» 0 — 0). Запись Е Э х —> а + 0 (Е Э х —> а — 0) будет употребляться вместо х -4 а, ж G ЕГ\Е+ (х -> а, ж G ЕГ\Е~). Она означает, что ж стремится по множеству Е к а, оставаясь больше (меньше), чем а. Если Я = #+ = {ж G К | с < ж} (Е = Я" = {ж е К | ж < с}), то вместо ж —> оо, х € Е пишут ж —> +оо (ж -> —оо) и говорят, что
150 ГЛ. III. ПРЕДЕЛ х стремится к плюс бесконечности (соответственно, к минус беско- бесконечности). Запись Е э х —> +оо (Е Э х -+ —оо) будет употребляться вместо ж -> оо, ж G £ П £+ (ж -> оо, х е ЕП Е^). При Е = N вместо х —> оо, х G N мы (если это не ведет к недоразу- недоразумению) будем, как это принято в теории предела последовательности, писать п —> оо. Заметим, что все перечисленные базы обладают той особенностью, что пересечение любых двух элементов базы само является элементом этой базы, а не только содержит некоторый элемент базы. С другими базами мы встретимся при изучении функций, заданных не на числовой оси1). Отметим также, что используемый здесь термин «база» есть крат- краткое обозначение того, что в математике называется «базисом филь- фильтра», а введенный ниже предел по базе есть наиболее существенная для анализа часть созданного современным французским математиком А. Картаном понятия предела по фильтру2). Ь. Предел функции по базе Определение 12. Пусть /: X —> М — функция на множестве X; В— база в X. Число A G R называется пределом функции f: X —> М по базе В, если для любой окрестности V(A) точки А найдется элемент В £ В базы, образ которого f(B) содержится в окрестности V(A). Если А — предел функции /: X —> М по базе В, то пишут lim/(x) = A. Повторим определение предела по базе в логической символике: flim/(x) = А) := VF(A) ЗВ е В (f(B) С V(A)). Поскольку мы сейчас рассматриваем функции с числовыми значени- значениями, полезно иметь в виду и следующую форму этого основного опре- определения: ^Например, совокупность открытых (без граничной окружности) кругов, содер- содержащих данную точку плоскости, является базой. Пересечение двух элементов базы не всегда круг, но всегда содержит круг из нашей совокупности. ^Подробнее об этом см.: Бурбаки Н. Общая топология. М.: ИЛ, 1958.
§ 2. ПРЕДЕЛ ФУНКЦИИ 151 (lira/(ж) = А) := Ve > О ЗВ е В \/х € В (|/(х) - А| < е). В этой формулировке вместо произвольной окрестности V(A) бе- берется симметричная (относительно точки А) окрестность (е-окрест- ность). Эквивалентность этих определений для вещественнозначных функций вытекает из того, что, как уже говорилось, в любой окрест- окрестности точки содержится некоторая симметричная окрестность этой же точки (проведите доказательство полностью!). Мы дали общее определение предела функции по базе. Выше были рассмотрены примеры наиболее употребительных в анализе баз. В кон- конкретной задаче, где появляется та или иная из этих баз, необходимо уметь расшифровать общее определение и записать его для конкрет- конкретной базы. Так, ( lim f(x) = A) := Ve > 0 36 > О Ух G ]а - 6,а[ (|/(х) - А\ < е), V х—>а—0 / ( lim f(x) = A) := Ve > 0 3* € R Ух < 6 (|/(х) - А\ < е). Рассматривая примеры баз, мы, в частности, ввели понятие окрест- окрестности бесконечности. Если использовать это понятие, то в соответ- соответствии с общим определением предела разумно принять следующие со- соглашения: (lim/(ж) = оо) := VF(oo) ЗВ € В (f(B) С F(oo)) или, что то же самое, (lim/(x) = оо) := Ve > О ЗВ € В Ух е В (е < |/(х)|), (lim/(ж) = +оо) := Ve е К ЗВ е В Ух € В (е < f(x)), (lim/(ж) = -оо) := Ve G R ЗВ е В Ух € В (f(x) < e). Обычно под е подразумевают малую величину. В приведенных опре- определениях это, разумеется, не так. В соответствии с принятыми согла- соглашениями, например, можем записать ( Km /(s) = -оо) := Ve G R 36 G R Ух > 6 (f(x) < e). Советуем читателю самостоятельно написать полное определение предела для различных баз в случае конечных (числовых) и бесконеч- бесконечных пределов.
152 ГЛ. III. ПРЕДЕЛ Для того чтобы можно было считать доказанными и в общем случае предела по произвольной базе все те теоремы о пределах, которые мы доказали в пункте 2 для специальной базы Е Э х —> а, необходимо дать соответствующие определения: финально постоянной, финально ограниченной и бесконечно малой при данной базе функций. Определение 13. Функция /: X —> М называется финально по- постоянной при базе В, если существуют число Л £ Ми такой элемент В £ В базы, в любой точке х G В которого f(x) = А. Определение 14. Функция /: X —> Ш называется ограниченной при базе В или финально ограниченной при базе В, если существуют число с G К и такой элемент В £ В базы, в любой точке х £ В которого |/(х)|<с. Определение 15. Функция /: X —> К называется бесконечно ма- малой при базе В, если Нш/(ж) = 0. В После этих определений и основного наблюдения о том, что для до- доказательства теорем о пределах нужны только свойства В^) и В2) базы, можно считать, что все свойства предела, установленные в пункте 2, справедливы для пределов по любой базе. В частности, мы можем теперь говорить о пределе функции при х —> оо, или при х —> — оо, или при х —> +оо. Кроме того, мы обеспечили себе возможность применения теории пределов и в том случае, когда функции будут определены не на число- числовых множествах; в дальнейшем это окажется особенно ценным. К при- примеру, длина кривой есть числовая функция, определенная на некотором классе кривых. Если мы знаем эту функцию на ломаных, то потом пре- предельным переходом определяем ее для более сложных кривых, например для окружности. В данный же момент основная польза от сделанного наблюдения и введенного в связи с ним понятия базы состоит в том, что они изба- избавляют нас от проверок и формальных доказательств теорем о пределах для каждого конкретного вида предельных переходов или, в нашей ны- нынешней терминологии, для каждого конкретного вида баз. Для того чтобы окончательно освоиться с понятием предела по про- произвольной базе, доказательства дальнейших свойств предела функции мы проведем в общем виде.
§ 2. ПРЕДЕЛ ФУНКЦИИ 153 4. Вопросы существования предела функции а. Критерий Коши. Прежде чем формулировать критерий Коши, дадим следующее полезное Определение 16. Колебанием функции /: X -> R на множестве Е С X называется величина u(f;E):= sup т.е. верхняя грань модуля разности значений функции на всевозмож- всевозможных парах точек х\,Х2 £ Е. Примеры. () 13. w(x;]-l,2[) =3. 14.w(sgnx;[-l,2]) =2. 15.u(sgnx;[0,2]) = l. 16. w(sgnx;]0,2]) =0. Теорема 4 (критерий Коши существования предела функции). Пусть X —множество и В — база в X. Функция /: X —> R имеет предел по базе В в том и только в том случае, когда для любого числа е > 0 найдется элемент В € В базы, на котором колебание функции меньше е. Итак, •4 Необходимость. Если lim/(a;) = А, то для любого е > 0 най- в дется элемент В базы б, в любой точке х которого \f(x) — А\ < е/3. Но тогда для любых х\, Х2 из В |/(xi) - /(х2)| < |/(xi) - Л| + |/(х2) - А\ < У и, значит, ш(/; В) < е. Достаточность. Докажем теперь основную часть критерия, утверждающую, что если для любого е > 0 найдется элемент В базы В, на котором w(/; В) < е, то функция / имеет предел по базе В.
154 ГЛ. III. ПРЕДЕЛ Придавая е последовательно значения 1,=,...,^,..., получим после- последовательность Bi,B2,..., Вп,... элементов базы таких, что ш(/; Вп) < < 1/п, п € N. Поскольку Вп ф 0, в каждом Вп можно взять по точке хп. Последовательность f{xi), /(жг),..., f(xn),... фундаментальная. Дей- Действительно, Вп П Вт ф 0, и, взяв вспомогательную точку х G ВпГ\Вт, получим, что \f(xn)-f(xm)\ < \f(xn)-f(x)\ + \f(x)-f(xm)\ < 1/n+l/m. По доказанному для последовательностей критерию Коши, последова- последовательность {f(xn), n € N} имеет некоторый предел А. Из установлен- установленного выше неравенства при т —> оо следует, что \f(xn) — А\ ^ 1/п, а отсюда, учитывая, что w(f;Bn) < 1/п, заключаем теперь, что если п> N = [2/е] + 1, то в любой точке х Е Вп будет \f(x) — А\ < е. ► Замечание. Проведенное доказательство, как мы увидим позже, остается в силе для функций со значениями в любом так называемом полном пространстве Y. Если же Y — Ш, а этот случай нас сейчас в первую очередь и интересует, то при желании можно пользоваться той же идеей, что и в доказательстве достаточности критерия Коши для последовательностей. ■4 Полагая тв = inf f(x), Mb = sup/(ж) и замечая, что для любых элементов B\,B<i базы В выполнено тв1 по аксиоме полноты найдем число A G R, разделяющее числовые мно- множества {тв} и {Мв}, где В £ В. Поскольку w(f;B) = М# — тв, то теперь можно заключить, что как только w(f; В) < е, так \f(x) — А\ < е в любой точке х G В. ► Пример 17. Покажем, что в случае, когда X = N и В есть ба- база п —> оо, п G N, доказанный общий критерий Коши существования предела функции совпадает с рассмотренным ранее критерием Коши существования предела последовательности. Действительно, элементом базы п —> оо, п G N является множество В = N П U(oo) — {п G N | п > N} тех натуральных чисел п G N, которые больше некоторого числа N G Ш. Без ограничения общности можно считать, что N G N. Соотношение w(/; В) < е в нашем случае означает, что Vni,n2 > iV имеем |/(ni) — /(пг)| < е. Таким образом, условие, что для любого е > 0 найдется элемент В £ В базы, на котором колебание w(f;B) функции / меньше е, для функции /: N -> К равносильно условию фундаментальности последо- последовательности {/(«)}.
§ 2. ПРЕДЕЛ ФУНКЦИИ 155 b. Предел композиции функций Теорема 5 (о пределе композиции функций). Пусть Y—множе- Y—множество; By — база в У; д: У —> R — отображение, имеющее предел по базе By. Пусть X —множество, Вх —база в X и /: X —> У —такое ото- отображение X в Y, что для любого элемента By Е By базы By найдется элемент Вх £ Вх базы Вх, образ которого f(Bx) содержится в By. При этих условглях композицгля g о f: X —> № отображений fug определена, имеет предел по базе Вх и lim(g о f)(x) = limg(y). Вх BY 4 Композиция g о f: X —> R определена, поскольку f(X) С Y. Пусть limg(y) = А. Покажем, что lim(g о f)(x) = А. По заданной By Вх окрестности V (А) точки А найдем элемент By 6 By базы By такой, что д{Ву) С VX-A)- По условию найдется элемент Вх Е Вх базы Вх такой, что f(Bx) С By. Но тогда (д о f)(Bx) = g(f(Bx)) С g(BY) с V(A) и мы, таким образом, проверили, что А является пределом функции (д о /): X -> R по базе Вх- > Пример 18. lim i>o Если положить д(у) = ^, a f(x) = 7х, то (д о f)(x) = Щ^. В на- шем случае У = R \ О, X = №. Поскольку limg(y) = lim ^ = 1, то 2/->0 j/->0 » для применения теоремы надо проверить, что, какой бы элемент базы у -> 0 мы ни взяли, найдется элемент базы х —> 0, образ которого при отображении f(x) = 7х содержится в указанном элементе базы у —> 0. о Элементами базы у —> 0 являются проколотые окрестности Uy@) точ- точки 0 eR. Элементами базы х —> 0 также являются проколотые окрестности Ux{0) точки 0 6 №. Пусть Uy@) = {у€Ш\а<у<13, у ^ 0} (где а,/3 £ К, причем с* < 0, /3 > 0) —произвольная проколотая окрестность о _ нуля в У. Если взять Ux@) = {х € №. \ j < х < £, х ф 0}, то эта проколотая окрестность нуля в X уже обладает тем свойством, что f(Ux)(O) = #у@) С ^у(О). Условия теоремы вьшолнены, и теперь можно утверждать, что ,. sin7ar siny lim = lim = 1. 7x
156 ГЛ. III. ПРЕДЕЛ Пример 19. Функция д(у) = | sgny|, как мы уже видели (см. при- пример 3), имеет предел lim | sgny| = 1. у—>о Функция у = /(ж) = ж sin ^, определенная при ж ф О, также имеет предел lim x sin ^ = 0 (см. пример 1). Однако функция (д о f)(x) = sgn I xsin ^J при х —> 0 не имеет предела. Действительно, в любой проколотой окрестности точки х = 0 име- имеются нули функции sin ^, поэтому функция sgn (жsin j;) в любой та- такой окрестности принимает и значение 1, и значение 0 и по критерию Коши не может иметь предел при х —> 0. Не противоречит ли это доказанной теореме? Проверьте, как мы сделали это в предыдущем примере, выполнены ли здесь условия теоремы. Пример 20. Покажем, что im 1 + - = е. ->оо у х ) lim 1-ЮО ■4 Пусть Y = N, BY — база п -> оо, п 6 N; X = 1+ = {х Е М | х > 0}, Вх — база х -> +оо; /: X —> Y есть отображение х i—>■ [ж], где [ж] — целая часть числа ж (т. е. наибольшее целое число, не превос- превосходящее числа ж). Тогда для любого элемента By = {п 6 N | п > N} базы п —> оо, п 6 N, очевидно, найдется элемент i?x = {xe№.\x>N + 1} базы ж —> +оо, образ которого при отображении ж ->• [ж] содержится в By- Функции^") = (l + i)", 5i(n) = (l + ^y)" g2(n) = (l + i)" , как нам уже известно, имеют своим пределом по базе п —> оо, п 6 N число е. По теореме о пределе композиции функций можно утверждать, что тогда функции
§ 2. ПРЕДЕЛ ФУНКЦИИ 157 M+i также имеют своим пределом по базе х —> +оо число е. Теперь остается заметить, что при х ^ 1 / 1 \И / П1 / 1 \И+1 V N + 1/ V */ V И/ и так как при х —> +оо крайние члены стремятся к е, то по свойствам A \х 1 + = I = е. Используя теорему о пределе композиции функций, покажем теперь, что lim A + 4) = е. Х-+-00 \ Ж/ Запишем lim (l + -\ = lim ГЛ! ( ) x-v-oo у X) (-t)->-oo \ (-*)/ t->+oo = lim f 1 + -^—] = lim f 1 + -^~] lim f 1 + t->+oo\ t-lj t-*+oo\ t-lj t->+oo \ '1 ( i\u ( i V ( i\ = lim 1 + -—- = lim I 1 + - I = e. t-*+oo \ t — 1/ u->+c» у и) Написанные равенства с учетом произведенных замен и = t — 1 и t = -х обосновываются с конца (!) на основе теоремы о пределе компо- композиции функций. Действительно, только тогда, когда мы пришли к пре- делу lim A + п ) > существование которого уже доказано, теорема позволяет утверждать, что предыдущий предел тоже существует и ра- равен этому. Тогда и стоящий перед ним предел существует, и конечным числом таких переходов придем к исходному пределу. Это довольно ти- типичный пример процедуры использования теоремы о пределе сложной функции при вычислении пределов. Итак, мы имеем ( 1\х / 1\ lim 1 + - = е = lim 1 + - ->—оо у X J 1->+оо у х)
158 ГЛ. III. ПРЕДЕЛ Отсюда следует, что lim A + i ) = е. Действительно, пусть задано число е > 0. Поскольку lim A + i ) = е, найдется число с\ 6 Ш. такое, что при 1-> —00 \ / х <с\ будет \( 1 + !j - е < е. Поскольку lim A + ~ ) = е, найдется число С2 6 Ш. такое, что при С2 < х будет f I + |j -e <e. Тогда при \х\ > с = max{|ci|, \c2\\ будем иметь A + ^1 — е Тем самым проверено, что lim A + 7) = е. ► Пример 21. lim t->o ^ После замены х = 1/f возвращаемся к пределу, рассмотренному в предыдущем примере. ► Пример 22. х lim — = 0, если q > 1. ■^ Мы знаем (см. § 1, пример 11), что lim -Ц- = 0, если ^ > 1- п—>с» g Теперь, как и в примере 3, можно рассмотреть вспомогательное ото- отображение /: К+ —> N, осуществляемое функцией [х] (целая часть х). Воспользовавшись неравенствами I № у х у М +1 и учитывая, что по теореме о пределе сложной функции крайние члены стремятся к нулю при х —ь +оо, заключаем, что lim — = 0. ► i—>+oo q Пример 23. Inor rr lim х ■4 Пусть а > 1. Полагаем f = loga х, находим х = а*. По свойствам по- показательной и логарифмической функций (учитывая неограниченность
§ 2. ПРЕДЕЛ ФУНКЦИИ 159 а", п 6 N) имеем (х —> +оо) Ф> (t —> +оо). Используя теорему о пределе сложной функции и результат примера 4, получаем 1 Ит lim Если 0 < а < 1, то положим — t — loga x, x = а~*. Тогда (х —> +оо) (t —)• +оо), и так как I/a > 1, то снова =0. ► lim lim x t->+oo a~l t-*+oo (I/a) с. Предел монотонной функции. Рассмотрим теперь один част- частный, но весьма полезный класс числовых функций—монотонные функ- функции. Определение 17. Функция f:E—> R, определенная на числовом множестве Е СШ, называется возрастающей на Е, если Va?i,a?2 ЕЕ {хх<х2=> /(ал) < /(я?2)); неубывающей на £^, если Va?i,a?2 G ^ (я?! < ж2 =*■ f{xx) < /(я?2)); на Е, если a?2 е£ (я?1 < х2 = убывающей на £?, если Va?i,a?2 G ^ (a?i < ж2 = Функции перечисленных типов называются монотонными на мно- множестве Е. Предположим, что числа (или символы —оо, +оо) г = infE и s = - supi? являются предельными точками множества Е и /: Е ->• R — монотонная функция на £^. Имеет место следующая Теорема 6 (критерий существования предела монотонной функ- функции). Для того чтобы неубывающая на множестве Е функция f:E—> -> К имела предел при х —> s, x G Е, необходимо и достаточно, чтобы она была ограничена сверху, а для того чтобы она имела предел при
160 ГЛ. III. ПРЕДЕЛ х —>■ г, х 6 Е, необходимо и достаточно, чтобы она была ограничена снизу. < Докажем теорему для предела lim f(x). ЕЭх-ts Если этот предел существует, то, как и всякая функция, имеющая предел, функция / оказывается финально ограниченной при базе Е Э Э ar->s. Поскольку / — неубывающая на Е функция, отсюда следует, что/ ограничена сверху. На самом деле можно утверждать даже, что f(x) < ^ lim fix) для любого х 6 Е. Это будет видно из дальнейшего. Перейдем к доказательству существования предела lim fix) при ЕЭх-^s условии ограниченности / сверху. Если / ограничена сверху, то существует верхняя грань значений, которые функция принимает на множестве Е. Пусть А = sup /(ж); по кажем, что lim / (х) = А. По е > 0, на основании определения верхней ЕЭх-ts грани множества, найдем точку хо 6 Е, для которой А — е < /(a?o) ^ А. Тогда ввиду неубывания / на Е получаем, что при xq < х 6 Е будет А — е < f(x) < А. Но множество {х б Е \ х0 < х}, очевидно, есть элемент базы х —> s, х 6 Е (ибо s = supE). Таким образом, доказано, что lim fix) = A. E3X-+S Для предела lim fix) все рассуждения аналогичны. В этом случае ЕЭх-ti имеем lim fix) = inf fix). ► ЕЭ^i x€E d. Сравнение асимптотического поведения функций. Этот пункт мы начнем поясняющими тему примерами. Пусть 7г(ж) — количество простых чисел, не превосходящих данного вещественного числа ж 6 К. Имея возможность при любом фиксирован- фиксированном х найти (хотя бы перебором) значение тг(ж), мы тем не менее не в состоянии сразу ответить, например, на вопрос о том, как ведет себя функция ir(x) при х —> +оо или, что то же самое, каков асимптоти- асимптотический закон распределения простых чисел. От Евклида нам известно, что ir(x) —> +оо при х —> +оо, но доказать, что тг(х) растет примерно как j^—, удалось только в прошлом веке П. Л. Чебышёву1). in х ''П. Л. Чебышёв A821 -1894) —великий русский математик и механик, основатель большой математической школы в России.
§ 2. ПРЕДЕЛ ФУНКЦИИ 161 Когда возникает вопрос об описании поведения функции вблизи некоторой точки (или бесконечности), в которой, как правило, сама функция не определена, говорят, что интересуются асимптотикой или асимптотическим поведением функции в окрестности этой точки. Асимптотическое поведение функции обычно характеризуют с по- помощью другой, более простой или более изученной функции, которая в окрестности исследуемой точки с малой относительной погрешностью воспроизводит значения изучаемой функции. Так, 7г(ж) при х —> +оо ведет себя как =-^-; функция ^^ при х —)• -» 0 ведет себя как постоянная функция, равная 1; говоря о поведении функции х2-f-x+sin - при х —> оо, мы, ясно, скажем, что она в основном ведет себя как функция х2, а при х —> 0 — как sin ^. Дадим теперь точные определения некоторых элементарных поня- понятий, относящихся к асимптотическому поведению функций. Этими по- понятиями мы будем систематически пользоваться уже на первом этапе изучения анализа. Определение 18. Условимся говорить, что некоторое свойство функций или соотношение между функциями выполнено финально при данной базе В, если найдется элемент В Е В базы, на котором оно имеет место. Именно в этом смысле мы до сих пор понимали финальное постоян- постоянство или финальную ограниченность функции при данной базе. В этом же смысле мы дальше будем говорить, например, о том, что финально выполнено соотношение f(x) = g(x)h(x) между некоторыми функция- функциями /, g, h. Эти функции могут даже иметь разные исходные области определения, но если мы интересуемся их асимптотическим поведением при базе В, то нам важно только, чтобы все они были определены на некотором элементе базы В. Определение 19. Говорят, что функция / есть бесконечно малая по сравнению с функцией д при базе В и пишут / = о(д) или / = в = о(д) при В, если финально при базе В выполнено соотношение / (х) = = а(х) ■ д(х), где а — функция, бесконечно малая при базе В. Пример 24. х2 = о(х) при х -)• 0, так как х2 = х • х. Пример 25. х = о(х2) при х —> оо, так как финально, когда уже 1
162 ГЛ. III. ПРЕДЕЛ Из этих примеров надо сделать вывод, что указание базы, при ко- которой / = о(д), совершенно необходимо. Обозначение / = о(д) читается «/ есть о малое от д». Из определения следует, в частности, что получающаяся при д(х) = = 1 запись / = оA) означает просто, что / есть бесконечно малая при в базе В. Определение 20. Если / = о(д) и функция д сама есть бесконеч- в но малая при базе В, то говорят, что / есть бесконечно малая более высокого по сравнению с д порядка при базе В. ~2 = - высокого порядка по сравнению с бесконечно малой х~1 = ^. Пример 26. х~2 = -~ при х —> оо есть бесконечно малая более Определение 21. Функцию, стремящуюся к бесконечности при данной базе, называют бесконечно большой функцией или просто бес- бесконечно большой при данной базе. Определение 22. Если / и g — бесконечно большие при базе В и / = о(д), то говорят, что д есть бесконечно большая более высокого в порядка по сравнению с /. Пример 27. i -> оо при х -)• 0, \ —>■ оо при х -)• 0 и i = о (^~ при х —)• 0, поэтому ~2 есть бесконечно большая более высокого порядка по сравнению с i при х —у 0. Вместе с тем при х ->■ оо функция х2 есть бесконечно большая более высокого порядка, чем х. Не следует думать, что, выбрав степени хп для описания асимпто- асимптотического поведения функций, мы сможем каждую бесконечно малую или бесконечно большую характеризовать некоторым числом п — ее степенью. Пример 28. Покажем, что при а > 1 и любом п 6 Z хп lim — = 0, >+оо ах а х т. е. хп — о(ах) при х —>• +оо. ■4 Если п ^ 0, то утверждение очевидно. Если же п 6 N, то, полагая г- тп ( т\П q = уй, имеем (|>1 и —= - , поэтому
§ 2. ПРЕДЕЛ ФУНКЦИИ 163 П/ \ Т1 lim — = lim I — I = lim — •... • lim — = 0. ->+oo ax i—>+oo \q I x—>+oo nx x—>+oo nx Z->+00 n раз Мы воспользовались, по индукции, теоремой о пределе произведения и результатом примера 22. ► Таким образом, при любом п 6 Z получаем хп = о(ах) при х —> +оо, если а > 1. Пример 29. Развивая предыдущий пример, покажем, что при а > > 1 и любом а 6 Ш. lim — = 0, 1->+оо а т.е. жа = о(ах) при ж —> +оо. ^ Действительно, возьмем число п 6 N такое, что п > а. Тогда при х > 1 получим Опираясь на свойства предела и результат предыдущего примера, по- получаем, что lim — = 0. ► z->+oo ах Пример 30. Покажем, что при а > 1 и любом абМ hm = 0, К+Э1->0 Ха т.е. а~Ух = о(ха) при х -> 0, х 6 К+. ^ Полагая в этом случае х = —1/t, по теореме о пределе сложной функции, используя результат предыдущего примера, находим О~\/х л.а lim = lim —- = 0. ► к+э1->о ха t->+oo a1 Пример 31. Покажем, что при а > 0 hm Ъ**± = 0, х->+оо Ха т. е. при любом положительном показателе степени а имеем loga x = = о(ха) при х —>■ +оо.
164 ГЛ. III. ПРЕДЕЛ ■4 Если а > 1, то положим х = а'/а. Тогда по свойствам показатель- показательной функции и логарифма, опираясь на теорему о пределе композиции функций и результат примера 29, находим ,. loga ж ,• (Vе*) ! 1- t n hm ° = hm ^~ = - hm -7 = 0. i->+oo xa t->+oo a1 a t->+oo a1 Если 0<а<1, то1/а>1и после замены х = аГ11а получаем lim loga ж a ж ,. (—t/a) I ,. t 2— = lim -—'-г-1 = hm 7 = 0. а t->+oo o~* a t->+oo (I/a) lim г hm жа t->+oo o~* a t->+oo (I/a) Пример 32. Покажем еще, что при любом а > 0 ха logaж = оA) при ж -)• 0, ж 6 1+- ^ Нам нужно показать, что lim xa log_ х = 0 при с* > 0. Полагая R9x>0 ж = 1/£, применяя теорему о пределе композиции функций и результат предыдущего примера, находим lim ж«1оёож= lim 1Og° A/'} = - lim ****=<>. Определение 23. Условимся, что запись / = О(д) или / = О(д) в при базе # (читается «/ есть О большое от д при базе В») будет озна- означать, что финально при базе В выполнено соотношение /(ж) = C(х)д(х), где /3(х) — финально ограниченная при базе В функция. В частности, запись / = 0A) означает, что функция / финально в ограничена при базе В. Пример 33. ( \ + sinxj ж = О(х) при ж —> оо. Определение 24. Говорят, что функции / и д одного порядка при базе В и пишут / х g при базе В, если одновременно / = О(д) 9 Пример 34. Функции B +sinж)ж и ж одного порядка при ж—> оо, но A + втж)ж и ж не являются функциями одного порядка при ж —> оо.
§ 2. ПРЕДЕЛ ФУНКЦИИ 165 Условие, что функции / и д одного порядка при базе В, очевидно, равносильно тому, что найдутся числа с\ > О, С2 > 0 и элемент В базы В такие, что на В имеют место соотношения или, что то же самое, Определение 25. Если между функциями / и д финально при базе В выполнено соотношение f(x) = j(x)g(x), где 1ш7(ж) = 1, то в говорят, что при базе В функция f асимптотически ведет себя как функция g или, короче, что / эквивалентна g при базе В. Будем в этом случае писать / ~ g или / ~ g при базе В. в Употребление термина «эквивалентна» оправдано тем, что Действительно, соотношение / ~ / очевидно, в этом случае j(x) = в = 1. Далее, если Iim7(i) = 1, то lim—^-г = 1 и о(х) = —r^f(x)- Здесь надо только объяснить, почему можно считать, что j(x) ф 0. Если соотношение f(x) = j(x)g(x) имеет место на элементе В\ 6 В, а со- соотношение \ < \j(x)\ < |—на элементе В2 6 В, то мы можем взять элемент В С В\ П В2, на котором будет выполнено и то и другое. Всю- Всюду вне В, если угодно, можно вообще считать, что j(x) = 1. Таким образом, действительно (/ ~ д) => (д ~ /). Наконец, если f(x) = ^\{х)д{х) на Si 6 В и д(х) = j2(x)h(x) на #2 € В, то на элементе В Е В базы В таком, что В С В\ П В2, оба эти соотношения выполнены одновременно, поэтому f(x) — 71 на 5. Но lim7i BO2C0 = Iini7i(a;)-lim72(s) = 1 и тем самым проверено, в в в что / ~ h. в
166 ГЛ. III. ПРЕДЕЛ Полезно заметить, что поскольку соотношение Нт7(ж) = 1 равно- равносильно тому, что j(x) = 1 + а(х), где lima(i) = 0, то соотношение в / ~ д равносильно тому, что f(x) = д(х) +а(х)д(х) = д(х) + о(д(х)) при в базе В. Мы видим, что относительная погрешность |а(ж)| = f(x)-g(x) 9(х) приближения функции с помощью функции д(х), эквивалентной f(x при базе В, есть величина бесконечно малая при базе В. Рассмотрим некоторые примеры. Пример 35. х2 + х = A + | J ж2 ~ ж2 при х ->■ оо. Абсолютная величина разности этих функций \(х2 +х) -х2\ = \х\ стремится к бесконечности, однако относительная погрешность Щ = = Дт замены функции х2 + х на эквивалентную величину х2 стремится к нулю при х —* оо. Пример 36. В начале этого пункта мы говорили о знаменитом асимптотическом законе распределения простых чисел. Теперь мы в состоянии записать его точную формулировку: . . X ( X \ тг[х) — \-о [ -—1 при х —>■ оо. ]пх Vina;/ Пример 37. Поскольку lim ^— = 1, то sin ж ~ х при х —> 0, что можно написать также в виде равенства sin ж = х + о(х) при х —* 0. Пример 38. Покажем, что 1пA + х) ~ х при х -л 0. X х-Ю Мы воспользовались в первом равенстве тем, что logaFQ) = aloga6, а во втором тем, что lim loga t = loga Ь = loga (limtf I. ► t->6 \t->b J Итак, ln(l + x) = x + o{x) при х —> 0. Пример 39. Покажем, что ех = 1 + x + o(x) при х ->• 0. , ex-l , « ■^ lim = lim -— -r- = 1. x t->o ln(l + r)
§ 2. ПРЕДЕЛ ФУНКЦИИ 167 Мы сделали замену ж = ln(l + t), ех — 1 = t и воспользовались тем, что ех ->■ е° = 1 при ж —> О, причем е1 ^ 1 при ж ф 0. Таким образом, на основании теоремы о пределе композиции и результата предыдущего примера утверждение доказано. ► Итак, ех — 1 ~ х при х ->■ 0. Пример 40. Покажем, что A + ж)° = 1 + ах + о(ж) при ж ->■ 0. ,. A+ж)а-1 ,. •* hm = hm ж х->0 а1пA+ж) x ,. е* -1 ,. 1пA+ж) = а hm • lim = а. t->0 < х->0 Ж В этой выкладке мы, предполагая а ф 0, сделали замену a In A+ж) = = t и воспользовались результатами двух предыдущих примеров. Если же а = 0, то утверждение очевидно. ► Таким образом, A + х)а — 1 ~ ах при ж ->• 0. При вычислении пределов иногда бывает полезно следующее простое Утверждение 3. Если f ~ f, то limf(x)g(x) = limf(x)g(x), если в в в один из этих пределов существует. < Действительно, коль скоро /(ж) = j(x)f(x) и lim7(ж) = 1, то \\mf(x)g(x) = limj(x)f(x)g(x) = limnf(x)-limf(x)g(x) = hmf(x)g(x). ► В В D D О Пример 41. Ьсоэж 1, In cos2 ж 1,. ln(l — sin2 ж) lim —;—тг = ^ bm ^— = - hm —^ 5 = x->o smr 2 x->o x2 2 z->o ж"* 1 ,. -sin2 ж 1 .. ж2 1 = - hm 5— = -- lim -^ = --. 2 x->o ж2 2 x->o ж2 2 Мы воспользовались тем, что 1пA + а) ~ а при а —> 0, sin ж ~ ж при х -4 0, ^-^ ~ 4 при /3 ->• 0 и sin2 ж ~ ж2 при ж ->• 0. Мы доказали, что в одночленах при вычислении пределов можно заменять функции на им эквивалентные при данной базе. Не следует распространять это правило на суммы и разности функций. Пример 42. у/х2 + х ~ ж при ж ->• +оо, но lim ( у/х2 + ж — ж) ф lim (ж — ж) = 0. х->+оо V / х->+оо
168 В самом деле, lim ( ух2 + х - х—Ц-оо V -.) = ГЛ. - lim - 111. ПРЕДЕЛ X - lim - х—>+оо А /l 1 + 1 1 2' Отметим еще следующие широко используемые в анализе правила обращения с символами о(-), О(-). Утверждение 4. Дро данной базе а)О(/)+О(/)=О(/); Ь) о(/) есть также O(f); е) «*„ <,(*) * 0, то ^ = о (jg) tt <>U$L = О Обратите внимание на особенности действий с символами о(-), О(-), вытекающие из смысла этих символов. Например, 2о(/) = о(/), или o(f) + O(f) = O(f) (хотя, вообще говоря, о(/) ^ 0), или о(/) = О(/), но О(/) ^ о(/). Здесь знак равенства всюду имеет значение слова «есть». Сами символы о(-), О(-) обозначают не столько функцию, сколько ука- указание на характер ее асимптотического поведения, которым, кстати, обладают сразу многие функции, например, и /, и 2/, и т.п. •^ а) После сделанного уточнения утверждение а) перестает вы- выглядеть неожиданным. Первый символ о(/) в нем означает некоторую функцию вида a\{x)f{x), где limai(x) = 0. Второй символ о(/), кото- который можно (или нужно) было бы снабдить пометкой, отличающей его от первого, означает некоторую функцию вида a2(x)f(x), где Iima2(a;) = в = 0. Тогда ai(x)f(x)+a2(x)f(x) = (ai(x)+a2(x))f(x) = a3(x)f(x), где lim аз (ж) = 0. в b) Следует из того, что всякая функция, имеющая предел, является финально ограниченной. c) Следует из Ь) и d). d) Следует из того, что сумма финально ограниченных функций финально ограничена. e) °АШ = °ЩЩ = а(х)Щ = о (Щ). ' 9W д{х) у 'д{х) \g(x)J Аналогично проверяется и вторая часть утверждения е). ►
§ 2. ПРЕДЕЛ ФУНКЦИИ 169 Пользуясь этими правилами и эквивалентностями, полученными в примере 40, теперь можно следующим прямым методом искать предел из примера 42: ( , ч / / Г \ im I vi2 + х — х 1 = lim ж(\/1Н 1 ++оо \ / я->+оо \ у х I lim Ж-++О0 = lim x(l + l--+o(-)-l)= lim l\ + xo(-]] = ж-И-оо \^ 2 X \XJ J x->+oo \l \X = lim (I x—>+oo Несколько позже мы докажем следующие важные соотношения, ко- которые уже сейчас стоит запомнить как таблицу умножения: ех = 1 + ^х + -х2 + ... + -хп + ... при ж 6 1, cosx = 1 - —х2 + —х* + ...+ \ ! х2к + ... при х 6 М, 1 1 f—I)"" ln(l + ж) = ж - -х2 + -х3 + ... + -— хп + ... при \х\ < 1, 2i о ТЬ a(a-l).. (a-n + l)g ^ п! ' ' Эти соотношения, с одной стороны, уже могут служить вычислитель- вычислительными формулами, а с другой стороны, как будет видно, содержат в себе следующие асимптотические формулы, обобщающие формулы, по- полученные в примерах 37 - 40: ^ ^ ^ при х->0, x + x + ... + ^xfO(x) при
170 ГЛ. III. ПРЕДЕЛ 11 ( л\к , ч 1! 3! BЛ + 1)! V ) Р X^Ul + x)-x- -x2 + -ж3 + ... + -— xn + О (xn+1) при х -> О, ^ О 77- Эти формулы обычно являются наиболее эффективным средством при отыскании пределов элементарных функций. При этом полезно иметь в виду, что О (xm+1) = жт+1-ОA) = хт-х-О{\) = хт-о(\) = о(хт) при х —> 0. Рассмотрим в заключение несколько примеров, показывающих эти формулы в работе. Пример 43. ,. s-sinx х-(х-±х* + О{хъ)) Aп,2Л 1 hm ^ = hm ^ ; = lim ( — + О (xz) = -. х3 х^о х3 х->о \3! / 3! х2 о Имеем при х —» схэ: Пример 44. lim х2(ч7М±4 - cos±) = ? х3 + х 1 + х-2 _ ( l_\( J_\ ~ ^ ж2 Д 3/ 1 , 11 ^л/ 1 СО8ж = 1!'^ + °'~г откуда получаем г/х3 + х 1 9 1 _ / 1 \ V 1 +х3 х 14 х2 \хл J ->■ оо.
§ 2. ПРЕДЕЛ ФУНКЦИИ 171 Таким образом, искомый предел равен ,14z2 ' \хЧ) 14' Пример 45. im Г- (l + -} ] = lim exp [x (\n U + -\ - l)\ -кэо [e \ X) J ^->oo I \ \ X/ J ) = lim exp - *»oo Задачи и упражнения 1. а) Докажите, что существует и притом единственная определенная на 1R функция, удовлетворяющая требованиям /A)=о (о>0, аф\), f(x1)-f(x2) =f(x1+x2), f(x) -> f(xo) ПРИ а; -»• ж0. b) Докажите, что существует и притом единственная определенная на М+ функция, удовлетворяющая требованиям /(а) = 1 (а > 0, а ф 1), f(xi)+f(x2) = f(xi -х2), f(x) -4 f(xQ) при ж0 £ М+ и Ш+ Э х -+ х0. Указание. Просмотрите еще раз конструкцию показательной и логариф- логарифмической функций, разобранную в примере 10. 2. а) Установите взаимно однозначное соответствие ц>: Е -4 М+ так, чтобы для любых г,уб1 было 9р(ж + у) = (р(х) ■ <р(у), т. е. чтобы операции сложения в прообразе (в Ж) отвечала операция умножения в образе (в М+). Наличие такого отображения означает, что группы (Ж, +) и (К+, ■) как алгебраические объекты одинаковы, или, как говорят, изоморфны. Ъ) Докажите, что группы (Е, +) и (R \ 0+, •) не изоморфны.
172 ГЛ. III. ПРЕДЕЛ 3. Найдите пределы a) lim Xх: b) lim х1/*; х-»+оо loga(l+z) c) lim j ; d) lim ах -1 4. Покажите, что 1+ - + ... Н—=1пп + с + оA) при п-»схэ, 2 п где с — постоянная. (Число с = 0,57721... называется постоянной Эйлера.) Указание. Можно воспользоваться тем, что . п+1 . Л 1\ 1 Л / 1 \ In =ln 1 + - =-+О - при п \ п) п \п2) П -» СХЭ. 5. Покажите, что оо оо a) если два ряда Ц ап, Ц Ьп с положительными членами таковы, что п=1 71=1 ап ~ Ьп при п -> схэ, то эти ряды сходятся или расходятся одновременно; оо b) ряд Yl sin сходится только при р > 1. 71=1 П 6. Покажите, что оо a) если ап ^ «n+i > 0 при любом п £ N и ряд £) оп сходится, то о„ = 71=1 = о ( — ) при п —V схэ; b) если Ъп = о I - 1, то всегда можно построить сходящийся ряд ]Г) а„ n=1 такой, что Ьп = о(ап) при п —»схэ; оо оо c) если ряд ^ о„ с положительными членами сходится, то ряд ^2 Ап, где 71=1^ 71=1 / оо / оо Ап = \ Ц Qk — \ Ц ак, тоже сходится, причем ап = о{Ап) при п -» схэ; У *=тг у ife=n+l оо оо d) если ряд X] °п с положительными членами расходится, то ряд £) А„, 71=1 71=2 где А„ = a Y1 °к~ \ И ак, тоже расходится, причем Ап = o(an) при п -4 сю. у *=i у Из с) и d) следует, что никакой сходящийся (расходящийся) ряд не может служить универсальным эталоном для установления сходимости (расходимо- (расходимости) других рядов путем сравнения с ним.
§ 2. ПРЕДЕЛ ФУНКЦИИ 173 7. Покажите, что оо a) РЯД 1С ln°7i) где ап > О, п G N, сходится тогда и только тогда, когда 71=1 последовательность {Пп = oi... ап} имеет отличный от нуля предел; оо b) ряд £) 1пA + ап), где |an| < 1, абсолютно сходится тогда и только 71=1 оо тогда, когда сходится абсолютно ряд ^2 а„. 71=1 Указание. См. задачу 5а). оо 8. Говорят, что бесконечное произведение П ек сходится, если последо- к=1 п вательность чисел П„ = П е* имеет конечный, отличный от нуля предел П. к=1 оо Тогда полагают П = П е* ■ к=1 Покажите, что оо a) если бесконечное произведение YI еп сходится, то еп —> 1 при п —> оо; 71=1 оо b) если Vn £ N (еп > 0), то бесконечное произведение YI еп сходится 71=1 оо тогда и только тогда, когда сходится ряд Y2 ^пеп', 71=1 c) если еп = 1 + ап и все ап одного знака, то бесконечное произведение 00 ОО П A + ап) сходится тогда и только тогда, когда сходится ряд ^2 ап- п=1 п=1 9. а) Найдите f! A + я2"")- 71=1 ОО Ь) Найдите Yl cos ^ и докажите следующую формулу Виета1': 71=1 2 \' у 5 + 5V5" у \ + hyh + kyk с) Найдите функцию f(x), если /@) = 1, fBx) = cos2x-f(x), f(x) ~> /@) при х -» 0. ^Ф. Виет A540-1603)—фргшцузский математик, один из создателей современ- современной алгебраической символики.
174 ГЛ. III. ПРЕДЕЛ Указание: х = 2 ■ |. 10. Покажите, что a) если ■ " = 1 + /Зп, п = 1,2,..., и ряд £) /3„ абсолютно сходится, то "+1 n=i существует предел lim Ьп = 6 £ Щ П-ЮО оо b) если аа" = 1 + £ + а„, п = 1,2,..., причем ряд Y1 ап абсолютно "+1 n=i сходится, то о„ ~ -£- при п —> схэ; оо оо c) если ряд J^ °п таков, что аа" = 1 + £ + ап и ряд J^ ап абсолютно 1 n+1 i оо сходится, то ряд J2 ап абсолютно сходится при р > 1 и расходится при р ^ 1 71=1 (признак Гаусса абсолютной сходимости ряда). 11. Покажите, что для любой последовательности {ап} с положительными членами и эта оценка неулучшаема.
ГЛАВА IV НЕПРЕРЫВНЫЕ ФУНКЦИИ § 1. Основные определения и примеры 1. Непрерывность функции в точке. Пусть /—вещественно- значная функция, определенная в некоторой окрестности точки а Е Ш. Описательно говоря, функция / непрерывна в точке а, если ее зна- значения f(x) по мере приближения аргумента х к точке а приближаются к значению /(а) функции в самой точке а. Уточним теперь это описание понятия непрерывности функции в точке. Определение 0. Функция / называется непрерывной в точке а, если для любой окрестности V(f(a)) значения /(а) функции в точке а найдется такая окрестность U(a) точки о, образ которой при отобра- отображении / содержится в V(f(a)). Приведем формально-логическую запись этого определения вместе с двумя его вариациями, часто используемыми в анализе: (/ непрерывна в точке а) := (VV(/(a)) 3U(a) (f(U(a)) С V(/(a)))), Ve > О 3U(a) Ух е Ща) (\f{x) - f{a)\ < e), Ve > 0 36 > 0 Ух е Ш (\x - a\ < 8 =» |/(rc) - f(a)\ < e). Эквивалентность этих формулировок для вещественнозначных функций следует из того, что (как уже неоднократно отмечалось) лю- любая окрестность точки содержит некоторую симметричную окрест- окрестность этой точки.
176 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ Например, если по любой е-окрестности Vе(f (а)) точки /(а) можно подобрать окрестность U(a) точки а так, что Ух Е U(a) {\f{x) — f(a)\ < < е), т.е. f(U(a)) С Vе(f(а)), то и для любой окрестности V(f(a)) тоже можно подобрать соответствующую окрестность точки а. Дей- Действительно, достаточно сначала взять Ve(f(a)) С V(f(a)), а затем по Ve{f{a)) найти U{a). Тогда f{U{a)) С Ve(f(a)) с V(f{a)). Таким образом, если функция непрерывна в точке а в смысле вто- второго из приведенных определений, то она непрерывна в ней и в смысле исходного определения. Обратное очевидно, поэтому эквивалентность первых двух формулировок проверена. Дальнейшую проверку оставляем читателю. Чтобы не отвлекаться от основного определяемого понятия непре- непрерывности функции в точке, мы сначала для простоты предположили, что функция / определена в целой окрестности точки а. Рассмотрим теперь общий случай. Пусть /:£?—> Ш — вещественнозначная функция, определенная на некотором множестве Е С Ш, и а — точка области определения функ- функции. Определение 1. Функция /: Е -> Ш называется непрерывной в точке а Е Е, если для любой окрестности V(f(a)) значения /(а) функ- функции, принимаемого ею в точке а, найдется такая окрестность UE(a) точки а в множестве1^ Е, образ которой f(UE(а)) содержится в V(f(a)). Итак, (/: Е -> R непрерывна в а Е Е) := = (W(f(a)) 3UE(a) (f(UE(a)) С Разумеется, определение 1 тоже можно записать в е - «5-форме, рас- рассмотренной выше. Там, где нужны числовые оценки, это бывает полезно и даже необходимо. Запишем эти вариации определения 1: (/: Е -> R непрерывна в а Е Е) := = (Ve > 0 3UE(a) Ух Е UE(a) (\f(x) - f(a)\ < е)), ^Напомним, что UE(a) = Е П U(a).
§ 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 177 ЕЛИ (/:£-» R непрерывна в а Е Ё) := = (Ve > 0 36 > 0 Ух Е Е (\х - а\ < 5 =» \f(x) - f(a)\ < e)). Обсудим теперь детально понятие непрерывности функции в точке. 1° Если а — изолированная, т.е. не предельная, точка множества Е, то найдется такая окрестность U(a) точки а, в которой нет других точек множества Е, кроме самой точки а. В этом случае Ue(u) = a, и поэтому f{UE(a)) = f{a) С V(f(a)), какова бы ни была окрестность V(f(a)). Таким образом, в любой изолированной точке области опреде- определения функция, очевидно, непрерывна. Но зто вырожденный случай. 2° Содержательная часть понятия непрерывности относится, таким образом, к тому случаю, когда а Е Е и а — предельная точка множест- множества Е. Из определения 1 видно, что (/: Е —> №. непрерывна в а Е Е, где а —предельная точка Е) •£> Hm f(x) = f( А В самом деле, если а — предельная точка Е, то определена база о Е В х —> а проколотых окрестностей Uе (а) = Те (а) \ о, точки а. Если / непрерывна в точке а, то, найдя для окрестности V(f(a)) окрестность Ue{o) такую, что /(С/^;(а)) С V(f(a)), мы одновременно о будем иметь /(С/£;(а)) С V(f(a)) и в силу определения предела, таким образом, lim fix) = f(a). ЕЭх+ Обратно, если известно, что lim f(x) = f(a), то по окрестности ЕЭх—¥а V(f(a)) найдем проколотую окрестность Ue(o) так, что /(С/^(а)) С С V{f{a)). Но поскольку /(а) Е V(/(a)), то тогда и f(UE{a)) С V(/(a)). В силу определения 1 это означает, что функция / непрерывна в точке а£Е. ► 3° Поскольку соотношение lim f(x) = f(a) можно переписать в ЕЭх+ форме lim fix) = / ( lim x ЕЭх^а \ЕЭ^ 7-4573
178 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ мы теперь приходим к полезному заключению, что непрерывные в точ- точке функции (операции) и только они перестановочны с операцией пре- предельного перехода. Это означает, что то число /(а), которое получается при выполнении операции / над числом а, можно сколь угодно точно ап- аппроксимировать значениями, получаемыми при выполнении операции / над соответствующими заданной точности приближенными значения- значениями х величины а. 4° Если заметить, что при а Е Е окрестности Ue{ci) точки а обра- образуют базу Ва (независимо от того, является ли а предельной или изо- изолированной точкой множества), то мы увидим, что само определение 1 непрерывности функции в точке а совпадает с определением того, что число /(а) —значение функции в точке а—является пределом функции / по этой базе, т. е. (J: Е ->Ш непрерывна в а 6 £) « lim/(:r) = f(a) \Ва 5° Заметим, однако, что если lim/(:r) существует, то, поскольку Ва а Е Ue{o) для любой окрестности Ue{q), этот предел неизбежно ока- оказывается равным f(a). Таким образом, непрерывность функции /:£->1в точке а £ Е равносильна существованию предела этой функции по базе Ва окрест- окрестностей (но не проколотых окрестностей) Ue{o) точки а в Е. Итак, (/: Е -» М непрерывна в а Е Е) О ( 3 lim/(:r) ) . 6° В силу критерия Коши существования предела теперь можно ска- сказать, что функция непрерывна в точке а Е Е тогда и только тогда, когда для любого е > 0 найдется окрестность Ue{o) точки а в Е такая, на которой колебание co(f; Ue{o,)) функции меньше е. Определение 2. Величина Ц/;а) = lim w(f;UE(a)) (где U^(a) б—>+о есть E-окрестность точки а в множестве Е) называется колебанием функции /:Е—>Шв точке а. Формально символ u)(f;X) уже занят, он обозначает колебание функции на множестве X. Однако мы никогда не будем рассматри- рассматривать колебание функции на множестве, состоящем из одной точки (это
§ 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 179 колебание, очевидно, равно нулю); поэтому символ co(f; а), где а — точ- точка, всегда будет обозначать то понятие колебания функции в точке, которое мы только что ввели определением 2. Колебание функции на подмножестве не превышает колебания функции на множестве, поэтому величина w(/; U^(a)) есть неубываю- неубывающая функция от S. Поскольку она неотрицательна, то либо она име- имеет конечный предел при 6 -> +0, либо при любом S > 0 выполне- выполнено u;(f;Ug(a)) = +oo. В последнем случае естественно полагают 7° Используя определение 2, сказанное в 6° теперь можно резюми- резюмировать так: функция непрерывна в точке тогда и только тогда, когда ее колебание в этой точке равно нулю. Зафиксируем это: (/: Е -> Ш. непрерывна в а е Е) о (Ц/; а) = 0). Определение 3. Функция f-.E-^Ш называется непрерывной на множестве Е, если она непрерывна в каждой точке множества Е. Совокупность всех вещественнозначных функций, непрерывных на множестве Е, условимся обозначать символом С(Е; Ж) или, короче, С(Е). Мы обсудили понятие непрерывности функции. Рассмотрим теперь некоторые примеры. Пример 1. Если /: Е -> №. — постоянная функция, то / € С(Е). Это утверждение очевидно, ибо f{E) = с С V(c), какова бы ни была окрестность V(c) точки с 6 К. Пример 2. Функция f(x) = х непрерывна на Ш. Действительно, для любой точки xq € Ш имеем \f{x) — = \х — xq\ < е, как только \х — хо\ < S = е. Пример 3. Функция f(x) = sin а; непрерывна на Ш. В самом деле, для любой точки xq E К имеем sin х — sin xq\ = „ X + Xq . 2 cos —-— sin sin X X — 2 — 2 Xq Xq <2 X — 2 = \x — xq\ e, как только |a; — xq\ < S — e.
180 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ Мы воспользовались неравенством | sin:r| ^ \х\, доказанным в гл. III, § 2, п. 2d, пример 9. Пример 4. Функция f(x) = cos а; непрерывна на Ш. Действительно, как и в предыдущем примере, для любой точки xq £ Е Ш имеем cos a; — cosrro = . X + Xq . X — —2 sin —-— sin sin- 2 X — Xq I a; — a;o| < £, как только \х — хо\ < 5 = е. Пример 5. Функция f(x) = ах непрерывна на Ш. Действительно, по свойству 3) показательной функции (см. гл. III, § 2, п. 2d, пример 10а) в любой точке xq E Ш имеем lim ах = аХо, Х-+Х0 что, как мы теперь знаем, равносильно непрерывности функции ах в точке xq. Пример 6. Функция f(x) = logo x непрерывна в любой точке хо 6 Е К+ области определения R+ = {х Е Ш \ х > 0}. В самом деле, по свойству 3) логарифмической функции (см. гл. III, § 2, п. 2d, пример 10Ь) в любой точке xq Е К+ имеем lim logo х ~ 1°ёо х0: что равносильно непрерывности функции logo x в точке а;о. Попробуем, кстати, по заданному е > 0 найти окрестность С/к+ (xq) точки хо так, чтобы в любой точке х Е Ujh+(xq) иметь |log0z-logaa:o| < e. Это неравенство равносильно соотношению -е < logo — < е. Хо Пусть для определенности а > 1; тогда последнее соотношение равно- равносильно условию ~е < х < е
§ 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 181 Интервал ]хоа~£,хоае[ и есть искомая окрестность точки xq. По- Полезно обратить внимание на то, что эта окрестность зависит как от величины е, так и от самой точки хо, чего не наблюдалось в приме- примерах 1-4. Пример 7. Любая последовательность /: N -» Ш есть функция, непрерывная на множестве N натуральных чисел, поскольку каждая точка множества N является его изолированной точкой. 2. Точки разрыва. Для того чтобы лучше освоиться с понятием непрерывности, выясним, что происходит с функцией в окрестности той точки, где она не является непрерывной. Определение 4. Если функция /:£?-» Ш не является непрерыв- непрерывной в некоторой точке множества Е, то эта точка называется точкой разрыва функции /. Построив отрицание к утверждению «функция f: Е -* Ш непрерыв- непрерывна в точке а Е Е», мы получаем следующую запись определения того, что а—точка разрыва функции /: (a G Е — точка разрыва функции /) := = CV(f(a)) WE(a) Зх Е UE(a) (f(x) <£ F(/(o)))). Иными словами, а Е Е — точка разрыва функции f: Е -± К, если найдется такая окрестность V(f(a)) значения /(а) функции в точке а, что в любой окрестности Ue(o,) точки а в множестве Е найдется точка х € Ue{o), образ которой не содержится в V(f(a)). Be- <5-форме это же определение выглядит так: Зе > О V<5 > 0 Зх Е Е {\х - а\ < ё A \f{x) - f{a)\ > e). Рассмотрим примеры. Пример 8. Функция f(x) = sgnrr постоянна и, значит, непрерыв- непрерывна в окрестности любой точки а € К, отличной от нуля. В любой же окрестности нуля ее колебание равно 2. Значит, 0—точка разрыва функции sgnrr. Заметим, что функция имеет в точке 0 и предел сле- слева lim sgnrr = — 1, и предел справа lim sgnrr = 1, но, во-первых, они х-*—0 ж->+0 не совпадают между собой, а во-вторых, ни один из них не совпадает
182 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ со значением sgn 0 = 0 функции в точке 0. Это прямая проверка того, что 0 — точка разрыва функции. Пример 9. Функция f(x) = |sgn:r| имеет предел lim|sgn:r| = 1 х—>0 при х -> 0, но /@) = | sgn0j = 0, поэтому lim/(:r) ф /@) и 0 — точка х—>0 разрыва функции. Заметим, однако, что в данном случае, изменяя значение функции в точке 0 и полагая его равным 1, мы получим функцию, непрерывную в точке 0, т. е. устраним разрыв. Определение 5. Если точка разрыва а Е Е функции f: Е -> Ж такова, что существует непрерывная функция f:E-*M. такая, что /Ы\о = /Ы\о> то а называется точкой устранимого разрыва функции /: Е->Ш. Таким образом, точка устранимого разрыва характеризуется тем, что существует предел lim fix) = А, но А ф f(a), и достаточно ЕЭх^ ПОЛОЖИТЬ 11 N ( fW /и = \ . I А при х = а, как мы уже получим непрерывную в точке а функцию f:E—t Ш. Пример 10. Функция 1 0 при х = 0 разрывна в точке 0. При этом она даже не имеет предела при х -» —¥ 0, ибо, как было показано в гл. III, § 2, п. 1, пример 5, не существует предела lim sin i. График функции sin ^ изображен на рис. 12. Примеры 8, 9 и 10 поясняют следующую терминологию. Определение 6. Точка а Е Е называется точкой разрыва первого рода для функции /: Е -> М, если существуют пределы1) lim f(x)=:f(a-0), lim f(x) =: f(a + 0), ЕЭя-Ю-0 ЕЭжЮ+О 1^Если а — точка разрыва, то а—предельная точка множества Е. Однако может случиться, что все точки множества Е в некоторой окрестности точки о лежат по одну сторону от точки о. В этом случае рассматривается только один из указанных в определении пределов.
§ 1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ 183 -1 Рис. 12. но по крайней мере один из этих пределов не совпадает со значени- значением /(а) функции в точке а. Определение 7. Если а Е Е — точка разрыва функции /:£?-» -» R и в этой точке не существует по меньшей мере один из пределов, указанных в определении 6, то а называется точкой разрыва второго рода. Таким образом, имеется в виду, что всякая точка разрыва, не являю- являющаяся точкой разрыва первого рода, является точкой разрыва второго рода. Приведем еще два классических примера. Пример 11. Функция V(x) = 1, если х Е Q, О, если х Е 1 называется функцией Дирихле1'. Эта функция разрывна во всех точках, причем, очевидно, все ее точки разрыва — второго рода, так как на любом интервале есть как рациональные, так и иррациональные числа. ^П. Г. Дирихле A805 -1859) — крупный немецкий математик-аналитик, занявший пост ординарного профессора Геттингенского университета после смерти К. Гаусса A855).
184 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ Пример 12. Рассмотрим функцию Римана1^ {й, если х = ^ Е Q, где ^ — несократимая дробь, О, если i6K\Q. Заметим, что, каковы бы ни были точка а б К и ее ограниченная окрестность U(a) и каково бы ни было число iV Е N, в U(a) имеется только конечное число рациональных чисел ^, т Е Z, n б N, таких, что п < N. Уменьшая окрестность, можно, таким образом, считать, что зна- менатели всех рациональных чисел, попадающих в нее (кроме, быть может, числа а, если а Е Q), уже больше чем N. Таким образом, в о любой точке х Е U(а) \И{х)\ < 1/N. Мы показали тем самым, что в любой точке а Е I lim Щх) - 0. х—>а Значит, функция Римана непрерывна в любой иррациональной точ- точке. В остальных точках, т. е. в точках х € Q, функция разрывна, и все эти точки являются точками разрыва первого рода. § 2. Свойства непрерывных функций 1. Локальные свойства. Локальными называют такие свойства функций, которые определяются поведением функции в сколь угодно малой окрестности точки области определения. Таким образом, сами локальные свойства характеризуют поведение функции в каком-то предельном отношении, когда аргумент функции стремится к исследуемой точке. Например, непрерывность функции в некоторой точке области определения, очевидно, есть локальное свой- свойство функции. Укажем основные локальные свойства непрерывных функций. Теорема 1. Пусть f: Е —> Ш.—функция, непрерывная в точке, а Е Е. Тогда справедливы следующие утверждения: ^Б.Ф. Риман A826-1866)—выдающийся немецкий математик, фундаменталь- фундаментальные работы которого легли в основу целых областей современной геометрии и ана- анализа.
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 185 1° функция f ограничена в некоторой окрестности Ue{o) точки а; 2° если /(а) ф О, то в некоторой окрестности Ue{o) точки а все значения функции положительны или отрицательны вместе с /(а); 3° если функция д: Ue(o) —>■ Е определена в некоторой окрестно- окрестности точки а и, как и /: Е —> Ш, непрерывна в сал«ой точке а, то функции: a) (/ + 5)(z):=/(z)+5(z), с) ( q ) (х) := (~х (при условии, что д(х) ф 0) определены в некоторой окрестности точки а и непрерывны в точ- точке а; 4° если функция g: Y —> Ш непрерывна в точке b £ Y, а функция f такова, что f:E->Y, /(а) — b и f непрерывна в точке а, то композиция (д о /) определена на Е и также непрерывна в точке а. 4 Для доказательства теоремы достаточно вспомнить (см. § 1), что непрерывность функции / или g в некоторой точке а области опреде- определения равносильна тому, что предел этой функции по базе Ва окрест- окрестностей точки а существует и равен значению функции в самой точке а: Kp/fa) = Д°)> Mm0(a:) = g(a). Ва Ва Таким образом, утверждения 1°, 2°, 3° теоремы 1 непосредственно вытекают из определения непрерывности функции в точке и соответ- соответствующих свойств предела функции. В пояснении нуждается только то, что отношение ^т в самом деле определено в некоторой окрестности Ue{o) точки а. Но, по условию, д(а) /Оив силу утверждения 2° теоремы найдется окрестность Ue{o), в любой точке которой д(х) ф 0, т. е. Ц!Ц определено в Ue(o)- д\х) Утверждение 4° теоремы 1 является следствием теоремы о пределе композиции, в силу которой Um(g о f)(x) = limg(y) = д(Ь) = g(f(a)) = (g о /)(а), что равносильно непрерывности (д о /) в точке а. Однако для применения теоремы о пределе композиции нужно про- проверить, что для любого элемента Uy(b) базы Вь найдется элемент Ue{o) базы Ва такой, что f(UE(a)) С Uy(b). Но в самом деле, если Uy(b) — = Y П U(b), то по определению непрерывности функции /:£->Ув
186 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ точке а для окрестности U(b) = U(f(a)) найдется окрестность Ue(u) точки а в множестве Е такая, что /(£/я(а)) С U(f(a)). Поскольку / действует из Е в У, то f(UE(a)) С YnU(f(a)) = Uy(b) и мы проверили законность применения теоремы о пределе композиции. ► Пример 1. Алгебраический многочлен Р(х) = clqx71 + aixn~l + + ... + ап является функцией, непрерывной на TSL Действительно, из пункта 3° теоремы 1 по индукции следует, что сумма и произведение конечного числа непрерывных в некоторой точ- точке функций есть функция непрерывная в этой точке. Мы проверили в примерах 1 и 2 § 1, что постоянная функция и функции f(x) = x непре- непрерывны на TSL Тогда на Е непрерывны и функции ахт = а ■ у •... • д, а следовательно, и полином Р(х). т раз Пример 2. Рациональная функция R(х) = yrf4—отношение по- линомов — непрерывна всюду, где она определена, т.е. где Q(x) ф 0. Это следует из примера 1 и утверждения 3° теоремы 1. Пример 3. Композиция конечного числа непрерывных функций непрерывна в любой точке области своего определения. Это по ин- индукции вытекает из утверждения 4° теоремы 1. Например, функция esm (ln|cosa:|) непрерывна всюду на R, за исключением точек ^B/с + 1), к G Z, где она не определена. 2. Глобальные свойства непрерывных функций. Глобальным свойством функции, описательно говоря, называется свойство, связан- связанное со всей областью определения функции. Теорема 2 (теорема Больцано-Коши о промежуточном значе- значении). Если функция, непрерывная на отрезке, принимает на его кон- концах значения разных знаков, то на отрезке есть точка, в которой функция обращается в нуль. В логической символике эта теорема имеет следующую запись1).• (/ G С[а, Ь]) А (/(а) • f(b) < 0) =► Зс G [а, Ь] (/(с) = 0). < Делим отрезок [а, Ь] пополам. Если в точке деления функция не равна нулю, то на концах одного из двух полученных в результате ''Напомним, что символ С(Е) обозначает совокупность всех функций, непрерыв- непрерывных на множестве Е. В случае Е = [а, Ь] вместо С([а, Ь]) часто пишут сокращенно С[а,Ь].
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 187 деления отрезков функция снова принимает значения разных знаков. С этим отрезком поступаем теперь так же, как и с исходным отрезком [о,Ь], т.е. делим его пополам, и продолжаем процесс дальше. Тогда мы либо на каком-то шаге попадем в точку с G [«,&], где /(с) = 0, либо получим последовательность {/п} вложенных отрезков, длины которых стремятся к нулю и на концах которых / принима- принимает значения разных знаков. В последнем случае на основании леммы о вложенных отрезках найдется единственная точка с G [а, Ь], общая для всех этих отрезков. По построению существуют две последовательно- последовательности {х^} и {х'£} концов отрезков 1п такие, что f{x'n) < О, f(x'^) > О, lim х' = lim х" = с. По свойствам предела и определению непрерыв- п-юо п-юо ности получаем lim f(x') = /(с) ^ 0, lim fix1') = /(с) ^ 0. Таким п—><х> п—Уоо образом, /(с) = 0. ► Замечания к теореме 2. 1° Доказательство теоремы доставляет простейший алгоритм отыскания корня уравнения f(x) = 0 на отрез- отрезке, в концах которого непрерывная функция имеет значения разных знаков. 2° Теорема 2, таким образом, утверждает, что при непрерывном из- изменении нельзя перейти от положительных значений к отрицательным или наоборот, не приняв по дороге значения нуль. 3° К описательным высказываниям типа 2° следует относиться с ра- разумной осторожностью, поскольку в них обычно подразумевается боль- больше, чем высказывается. Рассмотрим, например, функцию, равную —1 на отрезке [0,1] и равную 1 на отрезке [2,3]. Ясно, что эта функция непрерывна на области своего определения, принимает там значения разных знаков, но нигде не обращается в нуль. Это замечание пока- показывает, что свойство непрерывной функции, выраженное теоремой 2, действительно проистекает от некоторого свойства ее области опреде- определения (которое, как впоследствии выяснится, состоит в том, что это множество должно быть связным). Следствие теоремы 2. Если функция ip непрерывна на интерва- интервале и в каких-то точках а иЬ интервала принимает значения ip(a) = A и ip(b) = В, то для любого числа С, лежащего между А и В, найдется точка с, лежащая между точками а иЬ, в которой <^(с) = С. А Отрезок / с концами а, Ь лежит в нашем интервале, поэтому функция f(x) = tp(x) — С определена, непрерывна на / и, поскольку
188 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ /(а) • f(b) = (А — С)(В — С) < О, по теореме 2 между а и Ь найдется точка с, в которой /(с) = </?(с) — С = 0. ► Теорема 3 (теорема Вейерштрасса о максимальном значении). Функция, непрерывная на отрезке, ограничена на нем. При этом на отрезке есть точка, где функция принимает максимальное значение, и есть точка, где она принимает минимальное значение. < Пусть /: Е —^ Ш — непрерывная функция на отрезке Е = [а,Ь]. В силу локальных свойств непрерывной функции (см. теорему 1) для любой точки х £ Е найдется окрестность U(x) такая, что на мно- множестве Ue(x) = Е П U(x) функция ограничена. Совокупность таких окрестностей U(x), построенных для всех точек х G Е, образует по- покрытие отрезка [а, Ь] интервалами, из которого по лемме о конечном покрытии можно извлечь конечную систему U(xi),..., U(xn) интерва- интервалов, покрывающих в совокупности отрезок [а, Ь]. Поскольку на множе- множестве Е П U(xk) = UE(xk) функция ограничена, т.е. Шк < f(x) < М*, где rrik, Mk £t hie UE(xk), то в любой точке х G Е = [а, Ь] имеем min{mi,... ,mn} ^ f(x) ^ max {Mi,... ,Мп}. Ограниченность функции на отрезке [а, Ь] установлена. Пусть теперь М = sup f(x). Предположим, что в любой точке х 6 Е Е (f(x) < М). Тогда непрерывная на Е функция М — f(x) нигде на Е не обращается в нуль, хотя (в силу определения М) может принимать зна- значения, сколь угодно близкие к нулю. Тогда функция 1,, ,, с одной м — j(x) стороны, в силу локальных свойств непрерывных функций, непрерывна на Е, а с другой — не ограничена на Е, что противоречит уже дока- доказанной ограниченности функции, непрерывной на отрезке. Итак, существует точка хм £ [о, Ь], в которой /{хм) — М. Аналогичным образом, рассмотрев тп = 'm£f(x) и вспомогатель- 1 х£Е ную функцию w \ _—, докажем, что существует точка xm e [а,Ь], в которой f(xm) = т. ► Заметим, что, например, функции fi(x) = х, /г(х) = - непрерыв- непрерывны на интервале Е = @,1), но f\ не имеет на Е ни максимального, ни минимального значений, а функция /г не ограничена на Е. Таким образом, выраженные теоремой 3 свойства непрерывной функции так- также связаны с некоторым свойством области определения, а именно с
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 189 тем, что из покрытия множества Е окрестностями его точек можно извлечь конечное покрытие. Такие множества мы впоследствии назо- назовем компактами. Прежде чем перейти к следующей теореме, дадим Определение 1. Функция /: i? —>■ М называется равномерно не- непрерывной на множестве Set, если для любого числа е > 0 найдется число 6 > О такое, что для любых точек xi, Х2 £ Е таких, что \xi — хъ\ < < 5, выполнено |/(a;i) — /(ссг)| < £• Короче, (/: Е —> Ж равномерно непрерывна) := = (Ve > 0 36 > О Vxi G E Vz2 G Е {\хх - х2\ < 6 =► Обсудим понятие равномерной непрерывности. 1° Если функция равномерно непрерывна на множестве, то она не- непрерывна в любой его точке. Действительно, достаточно в приведенном определении положить xi = х и х2 — а и мы видим, что определение непрерывности функции /:£->1в точке a G Е удовлетворено. 2° Непрерывность функции, вообще говоря, не влечет ее равномер- равномерную непрерывность. Пример 4. Уже неоднократно встречавшаяся нам функция f(x) = = sini на интервале ]0,1[ = Е непрерывна. Однако в любой окрестно- окрестности точки 0 в множестве Е функция принимает как значение —1, так и значение 1, поэтому при е < 2 для нее уже не выполнено условие Полезно в этой связи записать в явном виде отрицание свойства функции быть равномерно непрерывной: (/: Е —> Ш не является равномерно непрерывной) := = (Зе > О V* > 0 3xi G Е Зх2 G E (\xi - х2\ < 6 Л Рассмотренный пример делает наглядным различие между непре- непрерывностью и равномерной непрерывностью функции на множестве. Чтобы указать то место в определении равномерной непрерывности,
190 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ откуда проистекает это различие, приведем подробную запись того, что значит, что функция f:E—>M. непрерывна на множестве Е: (/: £7 —► Е непрерывна на Е) := = (Va G E Ve > 0 36 > 0 Vz e E {\x-a\<6=> \f(x) - f(a)\ < e)). Таким образом, здесь число 5 выбирается по точке a G Е и числу е и потому при фиксированном е может меняться от точки к точке, как это и происходит в случае функции sin |, рассмотренной в примере 1, или в случае функции logo x или а1, рассматриваемых на полной области их определения. В случае же равномерной непрерывности гарантируется возмож- возможность выбора 6 только по числу е > 0 так, что во всех точках а £ Е из \х — а\ < 6 при х е Е будет следовать \f(x) — f(a)\ < e. Пример 5. Если функция /: Е —> Ш не ограничена в любой окре- окрестности фиксированной точки xq G Е, то она не является равномерно непрерывной. Действительно, тогда при любом 5 > 0 в ^-окрестности xq найдут- найдутся точки х\,Х2 £ Е такие, что \f(x\) — /(^2)! > 1, хотя \х± — Х2\ < S. Так обстоит дело с функцией f(x) = -, рассматриваемой на множе- множестве Е \ 0. В данном случае xq = 0. Так обстоит дело и с функцией logo x, определенной на множестве положительных чисел и неограниченной в окрестности точки xq = 0. Пример 6. Функция f(x) = х2, непрерывная на R, не является равномерно непрерывной на R В самом деле, в точках х'п = ^/п~+T, х"п — у/п, где п G N, имеем /«) = п + 1, /(хЦ) = п, поэтому /«) - /«) = 1. Но 1 — \/n) = lim , ] = = 0, ' n->oo V« + 1 + Vn поэтому при любом 5 > 0 найдутся точки х'п, х"п такие, что \х'п—х'^\ <5, в то время как f(x'n) — f(x'^) = 1. Пример 7. Функция f(x) = sin а;2, непрерывная и ограниченная на Е, не является равномерно непрерывной на R Действительно, в точ- точках < = ^|(п + 1), < - у|^, где п G N, имеем \f(x'n) - /«)| = 1, в то время как lim \х'п — х''\ =0. п—><х>
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 191 После этого обсуждения понятия равномерной непрерывности функ- функции и сопоставления непрерывности и равномерной непрерывности мы можем теперь оценить следующую теорему. Теорема 4 (теорема Кантора - Гейне о равномерной непрерывно- непрерывности). Функция, непрерывная на отрезке, равномерно непрерывна на этом отрезке. Отметим, что в имеющейся литературе эту теорему обычно называ- называют теоремой Кантора. Чтобы избежать разночтений, мы в дальнейшем при ссылках сохраняем это распространенное наименование. ■4 Пусть f-.Е^- Ш — данная функция; Е = [а,Ь] и / G С(Е). По- Поскольку / непрерывна в любой точке х G Е, то (см. § 1, п. 1, 6°) по е > 0 можно найти такую ^-окрестность Us(x) точки х, что колебание w(/;f7g(a;)) функции / на множестве Ug(x) = Е П Us(x) точек обла- области определения функции, лежащих в Us(x), окажется меньше е. Для каждой точки х £ Е построим окрестность Us(x), обладающую этим свойством. Величина 5 при этом может меняться от точки к точке, поэтому правильнее, хотя и более громоздко, обозначить построенную окрестность символом Us(x\x), но, поскольку весь символ определяется точкой х, можно условиться в следующей сокращенной записи: U(x) = Интервалы V(x), x G Е, в совокупности образуют покрытие отрез- отрезка Е = [а,Ь], из которого по лемме о конечном покрытии можно выде- выделить конечное покрытие V(xi),..., V(xn). Пусть 6 = min I ^S(xi),..., r(S(in) У Покажем, что для любых точек х', х" G Е таких, что \х' — х"\ < < 5, выполнено \f(x') — f{x")\ < e. Действительно, поскольку систе- система интервалов V(xi),..., V(xn) покрывает Е, найдется интервал V{xi) этой системы, который содержит точку х', т.е. \х' — Х{\ < ^6(х{). Но в таком случае \х" - Xi\ ^ \х' - х"\ + \х' -Xi\<6+ - Следовательно, х',х" е Ц§х'\ц) = Епи'Ы(хг) и потому \f(x') - Приведенные выше примеры показывают, что теорема Кантора су- существенно опирается на некоторое свойство области определения функ-
192 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ ции. Из доказательства видно, что, как и в теореме 3, это свойство со- состоит в том, что из любого покрытия множества Е окрестностями его точек можно извлечь конечное покрытие. Теперь, после того как теорема 4 доказана, полезно вновь вернуться к разобранным выше примерам непрерывных, но не равномерно непре- непрерывных функций и выяснить, как, например, функция sin ж2, равномер- равномерно непрерывная по теореме Кантора на каждом отрезке вещественной прямой, оказывается не равномерно непрерывной на TSL Причина здесь вполне аналогична той, по которой вообще непрерывная функция мо- может оказаться не равномерно непрерывной. На сей раз мы предоставля- предоставляем читателю возможность самостоятельно разобраться в этом вопросе. Теперь перейдем к последней теореме параграфа — теореме об об- обратной функции. Нам предстоит выяснить условия, при которых не- непрерывная на отрезке вещественнозначная функция имеет обратную и в каких случаях эта обратная функция непрерывна. Утверждение 1. Непрерывное отображение f:E—>M. отрезка Е = [а,Ь] в Ш. инъективно в том и только в том случае, когда функ- функция f строго монотонна на отрезке [а,Ь]. •ц Если функция / возрастает или убывает на произвольном мно- множестве Е С М, то отображение f:E—>R, очевидно, инъективно: в различных точках множества Е функция принимает различные зна- значения. Таким образом, наиболее содержательная часть утверждения 1 со- состоит в том, что всякое непрерывное инъективное отображение /: [а, Ь] —> Ш отрезка осуществляется строго монотонной функцией. Предположив, что это не так, мы найдем три точки х\ < хч < х$ отрезка [а,Ь] такие, что /(хг) не лежит между f(x\) и /(^з)- В таком случае либо f{x^) лежит между f{x\) и /(^г), либо f{x\) лежит меж- между f{x2) и f{x%). Пусть для определенности имеет место последняя из двух указанных возможностей. По условию функция / непрерывна на отрезке [а;2,а;з], и потому (см. следствие теоремы 2) на нем есть точ- точка х[ такая, что /(а^) = f(xi). Таким образом, х\ < х\ и f(xi) = f(x\), что несовместимо с инъективностью отображения. Случай, когда лежит между f{x\) и /(а^), разбирается аналогично. ► Утверждение 2. Каждая строго монотонная функция f-.Хч- Ш, определенная на числовом множестве Ici, обладает обрат-
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 193 мой функцией f~l". Y —> Ш, которая определена на множестве Y = = f(X) значений функции f и имеет на Y тот же характер моно- монотонности, какой имеет функция f на множестве X. ■4 Отображение f:X—>Y = f(X) сюръективно, т.е. является ото- отображением на множество Y. Пусть для определенности /: X —> Y воз- возрастает на X. В этом случае Vxi G X Vz2 G X (xi <x2& f(xi) < f(x2)). A) Таким образом, отображение /: X —> Y в различных точках прини- принимает различные значения, т. е. оно инъективно. Следовательно, f:X—> -> У биективно, т.е. / — взаимно однозначное отображение X на Y. Значит, определено обратное отображение /~*: Y —> X, задаваемое формулой х = f~1{y)i если у = f(x). Сопоставляя определение отображения /ч:У41с соотношени- соотношением A), приходим к соотношению VyieYVy2ey (Г1(У1)<Г1Ы&У1<У2), B) означающему, что функция /~* возрастает на области своего опреде- определения. Случай, когда f:X—>Y убывает на X, очевидно, разбирается ана- аналогично. ► В соответствии с доказанным утверждением 2, если интересоваться непрерывностью функции, обратной к вещественнозначной функции, полезно исследовать условия непрерывности монотонных функций. Утверждение 3. Функция /: Е —> Ш, монотонная на множестве Е С К, может иметь на Е разрывы только первого рода. А Пусть, для определенности, / — неубывающая функция. Предпо- Предположим, что a G Е есть точка разрыва функции /. Поскольку а не может быть изолированной точкой множества Е, то а — предельная точка по крайней мере для одного из двух множеств Е~ = {х Е Е \ х < а}, Е+ = {х е Е \ х > а}. Поскольку /—неубывающая функция, для лю- любой точки х е Е~ имеем f(x) ^ /(а) и ограничение f\E- функции / на множество Е~ оказывается неубывающей ограниченной сверху функ- функцией. Тогда существует предел lim (/1^H*;)= lim f(x) = f(a-0). Л Ьа I ЕЭх^а0
194 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ Аналогично доказывается существование предела lim f(x) = = j(a + 0), если а — предельная точка множества bj. Случай, когда / — невозрастающая функция, можно либо разобрать, повторив проведенное доказательство, либо, перейдя к функции -/, свести дело к уже рассмотренному случаю. ► Следствие 1. Если а —точка разрыва монотонной функции f: Е -* Ш, то по крайней мере один из пределов lim f(x) = f(a-0), lim f(x) = f(a + O) ЕЭХ-Ю.-0 V ' V ' ЕЭХ-Ю.+0 K ' J V ; определен; по крайней мере в одном из неравенств f(a — 0) ^ f(a) ^ < /(а + 0), если f —неубывающая (или f(a — 0) > /(а) > /(а + 0), если /—невозрастающая) функция, имеет место знак строгого не- неравенства; в интервале, определяемом этим строгим неравенством, нет ни одного значения функции; указанные интервалы, отвечающие различным точкам разрыва монотонной функции, не пересекаются. < Действительно, если а — точка разрыва, то она предельная для множества Е и в силу утверждения 3 является точкой разрыва перво- первого рода. Таким образом, по крайней мере одна из баз Е Э х —> а — О, Е Э х —> а + 0 определена и по ней (а в случае определенности обе- обеих баз — по каждой из них) существует предел функции /. Пусть, для определенности, / — неубывающая функция. Поскольку а — точка раз- разрыва, то по крайней мере в одном из неравенств f(a — 0) ^ /(а) ^ ^ /(а + 0) на самом деле имеет место строгое неравенство. Поскольку f(x) ^ lim f(x) = f(a — 0), если х £ Е и х < а, и, аналогично, ЕЭх—>о—0 f(a + 0) ^ /(^)) если х G Е и а < х, то интервал, определяемый стро- строгим неравенством f(a — 0) < f(a) или f(a) < f(a + 0), действительно свободен от значений функции. Пусть а\, п2—две различные точки разрыва функции, и пусть а\ < а.2- Тогда, в силу неубывания функ- функции /, имеем /(oi - 0) < /(«О < /(«1 + 0) < /(«2 -0К /@2) < /(«2 + 0). Отсюда следует, что не содержащие значений функции интервалы, отвечающие различным точкам разрыва, не пересекаются. ► Следствие 2. Множество точек разрыва монотонной функции не более чем счетно.
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 195 М С каждой точкой разрыва монотонной функции свяжем, по след- следствию 1, интервал, определяемый значением функции в точке разрыва и одним из пределов функции при приближении аргумента справа или слева к точке разрыва. Эти интервалы не пересекаются. Но на прямой может быть не более чем счетное множество непересекающихся интер- интервалов. В самом деле, в каждом из них можно выбрать по рациональной точке, и тогда множество интервалов окажется равномощным подмно- подмножеству счетного множества Q всех рациональных чисел. Значит, оно само не более чем счетно. Вместе с ним, таким образом, не более чем счетно и равномощное ему по построению множество точек разрыва монотонной функции. ► Утверждение 4 (критерий непрерывности монотонной функции). Монотонная функция f:E—>M., заданная на отрезке Е = [а,Ь], не- непрерывна на нем тогда и только тогда, когда множество f(E) ее значений само является отрезком с концами1^ f(a) и f(b). ^ Если / — непрерывная монотонная функция, то ввиду монотон- монотонности / все значения, которые функция принимает на отрезке [а, Ь], лежат между значениями /(а) и f(b), которые она принимает в концах отрезка. Ввиду непрерывности функции она обязана принимать так- также и все промежуточные значения между /(а) и f(b). Таким образом, множество значений функции, монотонной и непрерывной на отрезке [о,Ь], действительно является отрезком с концами /(а) и f(b). Докажем теперь обратное утверждение. Пусть / — монотонная на отрезке [а, Ь] функция. Если она разрывна в некоторой точке с £ [а,Ь], то по следствию 1 утверждения 3 один из интервалов ]/(с — 0),/(с)[, ]/(с),/(с-|-0)[ заведомо определен и в нем нет значений нашей функции. Но ввиду монотонности функции этот интервал содержится в отрезке с концами /(a), f(b), поэтому если на отрезке [а, Ь] монотонная функция имеет хотя бы одну точку разрыва, то весь отрезок с концами /(a), f(b) не может лежать в области значений функции. ► Теорема 5 (теорема об обратной функции). Функция /:Х—>Ш, строго монотонная на множестве X СМ., имеет обратную функцию /-1: Y —> R, определенную на множестве Y = f(X) значений функ- функции /. Функция f~l: Y -> R монотонна и имеет на Y тот оке вид монотонности, какой имеет функция f: X —> М. на множестве X. ''При этом /(а) < /F), если / — неубывающая, и /F) ^ /(а), если / — невоэра- стающая функция.
196 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ Если, кроме того, X есть отрезок [а,Ь] и функция f непрерывна на нем, то множество Y = f(X) есть отрезок с концами f(a), f(b) и функция /-1: Y —> Ш непрерывна на нем. ■4 Утверждение теоремы о том, что в случае X = [а, Ь] и непрерывно- непрерывности / множество Y = f(X) есть отрезок с концами /(а), /(&), следует из доказанного выше утверждения 4. Остается проверить, что /-1: У-» —> R—непрерывная функция. Но f~1 монотонна на Y, Y есть отрезок и f~1(Y) = X = [а, Ь] —тоже отрезок. В силу утверждения 4 заключаем, что функция У непрерывна на отрезке Y с концами /(а), /(&). ► Пример 8. Функция у = f(x) = sin ж возрастает и непрерыв- непрерывна на отрезке ~ f > f ■ Значит, ограничение этой функции на отре- отрезок — f, f имеет обратную функцию х = f~1{y), обозначаемую х = = arcsiny, определенную на отрезке sin (— |J ,sin (|J = [—1,1], воз- возрастающую от — ^ до £ и непрерывную на этом отрезке. Пример 9. Аналогично, ограничение функции у = cos x на отре- отрезок [0,7г] есть убывающая непрерывная функция, которая в силу тео- теоремы 5 имеет обратную функцию, обозначаемую х = arccosj/, опре- определенную на отрезке [—1,1] и убывающую на нем от значения п до значения 0. Пример 10. Ограничение функции у = tga; на интервал X = = ]— 5-,^[ есть возрастающая от — оо до +оо непрерывная функция, которая в силу первой части теоремы 5 имеет обратную функцию, обозначаемую х = arctg у, определенную на всей числовой прямой у £ £1и возрастающую на ней в пределах интервала ]—?>?[ своих зна- значений. Чтобы доказать непрерывность функции х = arctg у в любой точке г/о ее области определения, возьмем точку хо = arctg y0 и отре- отрезок [хо — е, жо + е], содержащий xq внутри и содержащийся в интервале ] -|, f [• Если х0 - е = arctg (y0 -Si)axo + e = arctg (y0 + 62), то ввиду возрастания функции х = arctg у можно утверждать, что при любом у G R таком, что уо — 5\ < у < у0 + fo, будем иметь xq — е < arctg у < < хо + е. Итак, | arctg у — arctg уо\ < е при —5\ <у-|/о<^и тем более при \у — уо\ < S = min {61,62}, что и проверяет непрерывность функции х = arctg у в точке г/о G Ж. Пример 11. Рассуждениями, аналогичными проведенным в пре- предыдущем примере, устанавливаем, что поскольку ограничение функции
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 197 у = ctg х на интервале ]0,7г[ есть убывающая от +оо до —оо непрерывная функция, то она имеет обратную функцию, обозначаемую х = arcctg г/, определенную на всей числовой оси М, убывающую на ней в пределах интервала своих значений ]0,7г[ от 7г до 0 и непрерывную на Ш. Замечание. При построении графиков взаимно обратных функ- функций у = f(x) и х = f~l{y) полезно иметь в виду, что точки плоскости с координатами (x,f(x)) — (х,у) и (y,f~1(y)) = (y,x) в одной и той же координатной системе (в которой лишь указана первая и вторая оси ко- координат, а не ось х или ось у) симметричны относительно биссектрисы первого координатного угла. Таким образом, графики взаимно обратных функций, изображен- изображенные в одной системе координат, оказываются симметричными относи- относительно этой биссектрисы. Задачи и упражнения 1. Покажите, что a) если / € С (А) и В с А, то }\в € С{В); b) если функция /: Е± U Е2 ->• Ж такова, что f\E% € C(Et), i = 1,2, то не всегда/eC(Si U S2); c) функция Римана 1Z, как и ее ограничение 1Z\q на множество рациональ- рациональных чисел, разрывна в каждой точке множества Q, кроме нуля, и все точки разрыва при этом устранимые (см. § 1, пример 12). 2. Покажите, что если функция / € С[а, Ь], то функции тп{х) = min /(*), М(х) = max /(*) также непрерывны на отрезке [а, Ь]. 3. а) Докажите, что функция, обратная функции, монотонной на интер- интервале, непрерывна на области своего определения. b) Постройте монотонную функцию со счетным множеством точек раз- разрыва. c) Покажите, что если функции f: X -t Y и f~x: Y -* X взаимно обратны (здесь X, Y—подмножества К) и / непрерывна в точке xq £ X, то из этого еще не следует непрерывность функции f~x в точке уо = /(хо) € Y. 4. Покажите, что a) если / € С[а,Ь] и д € С[а,Ь], причем /(а) < д(а) и f(b) > g(b), то существует точка с € [а, Ь], в которой /(с) = д(с); b) любое непрерывное отображение /: [0,1] —> [0,1] отрезка в себя имеет неподвижную точку, т. е. точку х £ [0,1] такую, что f(x) = х; c) если два непрерывных отображения / и д отрезка в себя коммутируют, т.е. / о д = д о /, то они имеют общую неподвижную точку;
198 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ d) непрерывное отображение /: Ж —>• Ж может не иметь неподвижной точки; e) непрерывное отображение /: ]0,1[ —> ]0,1[ может не иметь неподвижной точки; f) если отображение /: [0,1] -> [0,1] непрерывно, /@) = 0, /A) = 1 и (/ о f)(x) = х на [0,1], то f(x) = х. 5. Покажите, что множеством значений любой непрерывной на отрезке функции является отрезок. 6. Покажите, что a) Если отображение /: [0,1] ->• [0,1] непрерывно, /@) = 0, /A) = 1 и при некотором п € N fn(x) := (/о... о/)(х) = х на [0,1], то f(x) = х. п раз b) Если функция /: [0,1] ->• [0,1] непрерывна и не убывает, то для любой точки х £ [0,1] реализуется по крайней мере одна из двух возможностей: либо х — неподвижная точка, либо fn(x) стремится к неподвижной точке (здесь /™(ж) = / о ... о / — п-я итерация /). 7. Пусть /: [0,1] -> Ш—непрерывная функция такая, что /@) = /A). Покажите, что a) при любом п £ N существует горизонтальный отрезок с концами на графике этой функции, длина которого равна -; b) если число / не имеет вида i, то найдется функция указанного вида, в график которой уже нельзя вписать горизонтальный отрезок длины I. 8. Модулем непрерывности функции f:E-*R называется функция и(8), определяемая при 6 > 0 следующим образом: иF)= sup \f(x1)-f(x2)\. |*1-*2|<<5 xltx2€E Таким образом, верхняя грань берется по всевозможным парам точек х\, хг множества Е, удаленным друг от друга меньше чем на S. Покажите, что a) модуль непрерывности — неубывающая неотрицательная функция, име- имеющая предел1' ш(+0) = lim u)F); b) для любого е > 0 найдется д > 0 такое, что для любых точек х%, х2 € Е соотношение \xi — х2\ < 6 влечет \f(xi) — f(x2)\ < w(+0) + е; c) если Е — отрезок, интервал или полуинтервал, то для модуля непрерыв- непрерывности функции /: Е —)• Ж имеет место соотношение uFi+62) ^ шFг) + шF2); ^Поэтому модуль непрерывности обычно рассматривают при 5^0, полагая oi@) =w(+0).
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 199 d) модулем непрерывности функций х и sinx2, рассматриваемых на всей числовой прямой, являются соответственно функция и>E) = 5 и постоянная иE) = 2 в области д > 0; e) функция / равномерно непрерывна на множестве Е тогда и только то- тогда, когда ш(+0) = 0. 9. Пусть / и g — ограниченные функции, определенные на одном и том же множестве X. Величина Д = sup \f(x) — g(x)\ называется расстоянием х€Х между функциями / и д. Она показывает, насколько хорошо одна функция аппроксимирует другую на данном множестве X. Пусть X—отрезок [а,Ь]. Покажите, что если /,д € С[а, Ь], то Зх0 € [а, Ь], где Д = \f(x0) - g(xo)\, и что для произвольных ограниченных функций это, вообще говоря, не так. 10. Пусть Рп(х) —многочлен (полином) степени п. Будем приближать ограниченную функцию /: [а,Ь] ->• Ш многочленами. Пусть Д(Р„) = sup \f(x)-Pn(x)\ и En(f)=infA(Pn), ж 6 [а,6] рп где нижняя грань берется по всевозможным многочленам степени п. Мно- Многочлен Рп называется многочленом (полиномом) наилучшего приближения функции /, если для него А(Рп) = En(f). Покажите, что a) существует многочлен Pq(x) = clq наилучшего приближения степени нуль; b) среди многочленов Q\(x) вида ХРп(х), где Рп — фиксированный много- многочлен, найдется такой многочлен Q\o, что A(QXo)=minA(Qx); c) если существует многочлен наилучшего приближения степени п, то су- существует также многочлен наилучшего приближения степени п + 1; d) для любой ограниченной на отрезке функции и любого п = 0,1,2,... найдется многочлен наилучшего приближения степени п. 11. Покажите, что a) Многочлен нечетной степени с действительными коэффициентами име- имеет по крайней мере один вещественный корень. b) Если Рп — многочлен степени п, то функция sgnPn(x) имеет не более п точек разрыва. c) Если на отрезке [а, Ь] имеется п + 2 точки хо < х\ < ... < xn+i такие, что величина sgn [(f(xt) - Рп(хг))(-1)г] постоянна при г = 0,... ,п + 1, то En(f) ^ min \f(xt) - Рп(хг)\ (теорема Балле Пуссена1^). (Определение En(f) см. в задаче 9.) . Ж. де ла Балле Пуссен A866-1962) —бельгийский математик и механик.
200 ГЛ. IV. НЕПРЕРЫВНЫЕ ФУНКЦИИ 12. а) Покажите, что при любом п € N функция Тп{х) = cos(narccosx), определенная на отрезке [—1,1], является алгебраическим многочленом степе- степени п {полиномы Чебышёва). b) Найдите явное алгебраическое выражение полиномов 1\, Г2, Т3, Т± и нарисуйте их графики. c) Найдите корни многочлена Тп(х) на отрезке [—1,1] и те точки отрезка, где величина |Г„(ж)| достигает максимума. d) Покажите, что среди многочленов Рп(х) степени п с коэффициентом 1 при хп многочлен Тп(х) является единственным многочленом, наименее укло- уклоняющимся от нуля, т. е. Еп@) = max |Г„(ж)| (определение En(f) см. в задаче 9) 13. Пусть f£C[a,b]. |XK1 a) Покажите, что если для полинома Рп (х) степени п найдутся п + 2 точки xq < ... < xn+i (называемые точками чебышёвского альтернанса) такие, что f(xt) - Pn(xt) = (-1)гД(Р„) • а, где Д(Р„) = max \f(x) - Рп(х)\, а а — посто- х6[о,6] янная, равная 1 или —1, то Рп{х) является и притом единственным полиномом наилучшего приближения функции / степени п (см. задачу 9). b) Докажите теорему Чебышёва: многочлен Рп{х) степени п тогда и толь- только тогда является многочленом наилучшего приближения функции / 6 С[а, Ь], когда на отрезке [а, Ь] найдется по крайней мере п + 2 точки чебышёвского альтернанса. c) Покажите, что для разрывных функций предыдущее утверждение, во- вообще говоря, не верно. d) Найдите многочлены наилучшего приближения нулевой и первой степе- степени для функции \х\ на отрезке [—1,2]. 14. В § 2 мы обсуждали локальные свойства непрерывных функций. На- Настоящая задача уточняет понятие локального свойства. Две функции / и д будем считать эквивалентными, если найдется такал окрестность U(a) фиксированной точки а € Ш, что Vx G U(a) имеем f(x) = = д(х). Это отношение между функциями, очевидно, рефлексивно, симме- симметрично и транзитивно, т. е. действительно является отношением эквивалент- эквивалентности. Класс эквивалентных между собой в точке а функций называется ростком функций в данной точке а. Если рассматривают только непрерывные функции, то говорят о ростке непрерывных функций в точке а. Локальные свойства функций — это свойства ростков функций. a) Определите арифметические операции над ростками числовых функ- функций, заданными в одной и той же точке. b) Покажите, что арифметические операции над ростками непрерывных функций не выводят из этого класса ростков.
§ 2. СВОЙСТВА НЕПРЕРЫВНЫХ ФУНКЦИЙ 201 c) Покажите, учитывая а) и Ь), что ростки непрерывных функций обра- образуют кольцо—кольцо ростков непрерывных функций. d) Подкольцо / некоторого кольца К называется идеалом кольца К, если произведение любого элемента кольца К и элемента подкольца / лежит в /. Найдите идеал кольца ростков функций, непрерывных в точке а. 15. Идеал кольца называется максимальным, если он не содержится ни в каком большем идеале, кроме самого кольца. Множество С[а, Ь] функций, не- непрерывных на отрезке, образует кольцо относительно обычных операций сло- сложения и умножения числовых функций. Найдите максимальные идеалы этого кольца.
ГЛАВА V ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ § 1. Дифференцируемая функция 1. Задача и наводящие соображения. Предположим, что, сле- следуя Ньютону1^, мы хотим решить кеплерову2) задачу двух тел, т.е. хотим объяснить закон движения одного небесного тела т (планета) относительно другого тела М (звезда). Выбе- Выберем в плоскости движения декартову систему ; координат с началом в М (рис. 13). Тогда по- положение т в момент времени t можно охарак- охарактеризовать численно координатами (x(t),y(t)) — точки т в этой системе координат. Мы хотим найти функции x(t), y(t). Движением т относительно М управляют два знаменитых закона Ньютона: Рис. 13. общий закон движения ma = F, A) 1'И. Ньютон A642-1727)—английский физик, механик, астроном и математик, крупнейший ученый, сформулировавший основные законы классической механики, открывший закон всемирного тяготения, разработавший (наряду с Лейбницем) осно- основы дифференциального и интегрального исчисления. Оценен был уже современни- современниками, которые на его могиле начертали: «Здесь покоится то, что было смертного у Ньютона». 2>И. Кеплер A571-1630)—знаменитый немецкий астроном, открывший законы движения планет (законы Кеплера).
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 203 связывающий вектор силы с вектором вызванного ею ускорения через коэффициент пропорциональности т — инертную массу тела1), и закон всемирного тяготения, позволяющий найти гравитационное воздействие тел т и М друг на друга по формуле $. <2> где г — вектор с началом в теле приложения силы и концом в другом теле, |г| — длина вектора г, или расстояние между т и М. Зная массы т, М, по формуле B) без труда выражаем правую часть уравнения A) через координаты x(t), y(t) тела т в момент t, чем ис- исчерпываем всю специфику данного движения. Чтобы получить теперь соотношения на x(t), y(t), заключенные в уравнении A), необходимо научиться выражать левую часть уравне- уравнения A) через функции x(t), y(t). Ускорение есть характеристика изменения скорости v(t), точнее, просто скорость изменения скорости; поэтому для решения задачи пре- прежде всего необходимо научиться вычислять скорость v(t), которую имеет в момент t тело, движение которого задается радиус-вектором Итак, мы хотим определить и научиться вычислять ту мгновенную скорость тела, которую подразумевает закон движения A). Измерить — значит сравнить с эталоном. Что же в нашем случае может служить эталоном для определения мгновенной скорости дви- движения? Наиболее простым видом движения является такое, которое совер- совершает по инерции свободное тело. Это движение, при котором за рав- равные промежутки времени происходят равные (как векторы) перемеще- перемещения тела в пространстве. Это так называемое равномерное (прямоли- (прямолинейное) движение. Если точка движется равномерно, г@) и гA) — ее радиус-векторы относительно инерциальной системы координат в мо- моменты t = 0 и t = 1 соответственно, то в любой момент времени будем иметь r(t) - г@) = vt, C) где v = гA) — г@). Таким образом, перемещение r(t) — г@) оказы- !'Мы обозначили массу символом самого тела, но это не приведет к недоразуме- недоразумениям. Заметим также, что если m < М, то выбранную систему координат можно считать инерциальной.
204 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ вается в простейшем случай линейной функцией времени, причем роль множителя пропорциональности между перемещением r(t) — г@) и вре- временем t играет в данном случае вектор г; перемещения за единицу вре- времени. Этот вектор и называется скоростью равномерного движения. То, что движение прямолинейно, видно из параметрического уравнения его траектории: r(t) = r@) + v-t, являющегося (см. курс аналитической геометрии) уравнением прямой. Мы знаем, таким образом, скорость г; равномерного прямолиней- прямолинейного движения, задаваемого формулой C). По закону инерции, если на тело не действуют внешние силы, оно двгжется равномерно и прямо- прямолинейно. Значит, если в момент t экранировать действие тела М на тело т, то последнее продолжит свое движение уже равномерно с неко- некоторой определенной скоростью. Таким образом, естественно считать, что именно она является (мгновенной) скоростью нашего тела в мо- момент t. Однако такое определение мгновенной скорости оставалось бы чи- чистой абстракцией, не дающей никаких рекомендаций для конкретного вычисления этой величины, если бы не следующее обстоятельство пер- первостепенной важности, которое мы сейчас обсудим. Оставаясь в рамках того (как сказали бы логики, «порочного») кру- круга, в который мы вошли, написав уравнение движения A), а затем при- принявшись выяснять, что такое мгновенная скорость и ускорение, мы все же заметим, что при самом общем представлении об этих понятиях из уравнения A) можно сделать следующие эвристические выводы. Если силы отсутствуют, т.е. F = 0, то ускорение тоже равно нулю. Но если скорость a(t) изменения скорости v(t) равна нулю, то, по-видимому, сама скорость г; (t) вообще не меняется со временем. И мы приходим к закону инерции, по которому свободное тело действительно движется в пространстве с постоянной во времени скоростью. Из того же уравнения A) видно, что ограниченные по величине си- силы способны создать только ограниченные по величине ускорения. Но если на отрезке времени [0,t] абсолютная величина скорости измене- изменения некоторой величины P(t) не превышала некоторой постоянной с, то, по нашим представлениям, изменение \P(t) — Р@)\ величины Р за время t не превышает с • t, т. е. в этой ситуации за малый промежу- промежуток времени величина мало меняется (во всяком случае, функция P(t) оказывается непрерывной). Значит, реальная механическая система за малый промежуток времени мало меняет свои параметры.
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 205 В частности, скорость v(t) тела т во все моменты времени t, близ- близкие к некоторому моменту t0, должна быть близка к значению v(to), которое мы желаем определить. Но в таком случае само движение в малой окрестности момента to должно мало отличаться от равно- равномерного движения со скоростью v(to), причем тем меньше отличаться, чем меньше мы уходим от to- Если бы мы сфотографировали траекторию тела т через телескоп, то в зависимости от его силы мы получили бы примерно следующее: Рис. 14. Представленный на фотографии с участок траектории соответству- соответствует столь малому интервалу времени, что на нем уже трудно отличить истинную траекторию от прямолинейной, так как она и в самом деле на этом участке похожа на прямолинейную, а движение — на равномер- равномерное прямолинейное. Из этого наблюдения, кстати, можно заключить, что, решив задачу об определении мгновенной скорости (а скорость — векторная величина), мы одновременно решим и чисто геометрический вопрос об определении и нахождении касательной к кривой (кривой в данном случае служит траектория движения). Итак, мы заметили, что в нашей задаче должно быть v(t) « v(to) при t, близких к to, т.е. v(t) —> v(to) при t —> to или, что то же самое, v(t) = v(to) + оA) при t —> to- Тогда должно быть также r(t)-r(to)mv(to)-(t-to) при t, близких к to, точнее, величина смещения r(t) — г (to) эквивалентна v(to)(t — to) при t —> to, или r{t) - r(t0) = v(to)(t - to) + o(v(t0)(t - tQ)), D) где o(v(to)(t — to)) есть поправочный вектор, величина которого при t -> to стремится к нулю быстрее, чем величина вектора v(to){t — to)-
206 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Тут следует, естественно, оговорить тот случай, когда v(to) — 0. Чтобы не исключать этот случай иэ общего рассмотрения, полезно заметить, что1) \v(to)(t - to)\ = \v(to)\\t - to\. Таким образом, если \v(to)\ Ф О, то величина \v(to)(t — to)\ того же порядка, что и \t — to\, и поэтому o(v(to)(t — to)) = o(t — to). Значит, вместо D) можно записать соотно- соотношение r(t) - г(*о) = v(to)(t - to) + o(t - to), E) которое не исключает также случая v(to) = 0. Таким образом, от самых общих и, быть может, расплывчатых пред- представлений о скорости мы пришли к соотношению E), которому ско- скорость должна удовлетворять. Но из E) величина г; (to) находится одно- однозначно: •<«•>-asгй^- <•> поэтому как само фундаментальное соотношение E), так и равносиль- равносильное ему соотношение F) можно теперь принять за определения величи- величины v(to)—мгновенной скорости тела в момент to- Мы не станем сейчас отвлекаться на подробное обсуждение вопро- вопроса о пределе векторнозначнои функции и ограничимся сведением его к уже рассмотренному во всех подробностях случаю предела веществен- нозначной функции. Поскольку вектор r(t) — г (to) имеет координаты (x(t) - x(t0), y(t) - y(t0)), то 4^ = (Щ^Ф1, Щ^1) и, зна- чит, если считать, что векторы близки, если их координаты близки, то предел в F) следует понимать так: = Шп t—>*o t — to \t-+to t — to *->*o t — to a o(t — to) в E) надо понимать как вектор, зависящий от t и такой, что вектор °^ Zt стремится (покоординатно) к нулю при t —¥ to- Наконец, заметим, что если v(to) ф 0, то уравнение r-r{to) = v(to)-(t-to) G) задает прямую, которая в силу указанных выше обстоятельств должна быть признана касательной к траектории в точке (х(to),у(to))- \t — to\ —модуль числа t — to, a, \v\ —модуль, или длина вектора V.
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 207 Итак, эталоном для определения скорости движения служит ско- скорость равномерного прямолинейного движения, задаваемого линейным соотношением G). Эталонное движение G) подгоняется к исследуе- исследуемому так, как этого требует соотношение E). То значение v(to), при котором E) выполнено, может быть найдено предельным перехо- переходом F) и называется скоростью движения в момент to. Рассматри- Рассматриваемые в классической механике движения, описываемые законом A), должны допускать сравнение с таким эталоном, т. е. должны допускать линейную аппроксимацию, указанную в E). Если r(t) = (x(t),y(t))—радиус-вектор движущейся точки т в мо- момент t, r{t) = (x(t),y(t)) — v(t)—вектор скорости изменения r(t) в момент t, a r(t) = (x(t),y(t)) = a(t)—вектор скорости изменения v(t), или ускорение в момент t, то уравнение A) можно записать в виде откуда для нашего движения в поле тяжести получаем в координатном виде Это точная математическая запись нашей исходной задачи. По- Поскольку мы знаем, как по r(t) искать r(t) и далее г(<), то уже сейчас мы в состоянии ответить на вопрос, может ли какая-то пара функций (x(t),y(t)) задавать движение тела т вокруг М. Для этого надо най- найти x(t), y(t) и проверить, выполнены ли соотношения (8). Система (8) является примером системы так называемых дифференциальных урав- уравнений. Пока что мы можем только проверять, является ли некоторый набор функций решением системы. Как искать решение или, лучше ска- сказать, как исследовать свойства решений дифференциальных уравнений, изучается в специальном и, как уже сейчас можно понять, весьма от- ответственном отделе анализа — теории дифференциальных уравнений. Операция отыскания скорости изменения векторной величины, как было показано, сводится к отысканию скорости изменения нескольких числовых функций — координат вектора. Таким образом, эту операцию следует прежде всего научиться свободно выполнять в простейшем слу- случае вещественнозначных функций вещественного аргумента, чем мы теперь и займемся.
208 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 2. Функция, дифференцируемая в точке. Начнем с двух пред- предварительных определений, которые мы чуть ниже несколько уточним. Определение Oi. Функция f:E—>R, определенная на множест- множестве Е С R, называется дифференцируемой в точке а Е Е, предельной для множества Е, если существует такая линейная относительно прираще- приращения х — а аргумента функция А • {х — а), что приращение f(x) — /(a) функции / представляется в виде f(x) - f(a) = А- (х - а) + о(х -а) при х -»■ а, х ЕЕ. (9) Иными словами, функция дифференцируема в точке а, если измене- изменение ее значений в окрестности исследуемой точки линейно с точностью до поправки, бесконечно малой по сравнению с величиной х — а смеще- смещения от точки а. Замечание. Как правило, дело приходится иметь с функциями, определенными в целой окрестности рассматриваемой точки, а не толь- только на каком-то подмножестве этой окрестности. Определение Ог- Линейная функция А • (х — а) из (9) называется дифференциалом функции / в точке а. Дифференциал функции в точке определен однозначно, ибо из (9) следует ) Еэх-hi х — а Еэх^ю, \ х — а и в силу единственности предела число А определено однозначно. Определение 1. Величина (щ называется производной функции / в точке а. Соотношение A0) можно переписать в эквивалентной форме х — а где а(х) —¥ 0 при х —¥ а, х € Е, что в свою очередь равносильно соот- соотношению f(x) - f(a) = f'(a)(x -а) + о(х - а) при х -> а, х G Е. A1)
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 209 Таким образом, дифференцируемость функции равносильна нали- наличию у нее производной в соответствующей точке. Если сопоставить эти определения с тем, что было сказано в пунк- пункте 1, то можно заключить, что производная характеризует скорость изменения функции в рассматриваемой точке, а дифференциал доста- доставляет наилучшую линейную аппроксимацию приращения функции в окрестности рассматриваемой точки. Если функция /: Е —> Е дифференцируема в различных точках множества Е, то при переходе от одной точки к другой как величи- величина А, так и функция о(х — а) в (9) могут меняться (к чему мы уже явно пришли в (И)). Указанное обстоятельство следует отметить уже в са- самом определении дифференцируемой функции, и мы приведем теперь это основное определение в его полной записи. Определение 2. Функция fiE-tWL, заданная на множестве Е с С К, называется дифференцируемой в точке х € Е, предельной для множества Е, если A2) где h ь-> A{x)h—линейная относительно h функция, a a(x;h) = o(h) при h -¥ 0, х + h € Е. Величины Ax(h) :— (x + h) - х — h и Af(x;h):=f(x + h)-f(x) называют соответственно приращением аргумента и приращением функции (соответствующим этому приращению аргумента). Их часто (правда, не вполне законно) обозначают символами Ах и Д/(ж) самих функций от h. Итак, функция дифференцируема в точке, если ее приращение в этой точке как функция приращения аргумента h является линейной с точностью до поправки, бесконечно малой при h —¥ 0 в сравнении с приращением аргумента. Определение 3. Линейная по h функция h >-> A(x)h из определе- определения 2 называется дифференциалом функции /:Е—>Шв точке х € Е и обозначается символом df{x) или Df{x). 8-4573
210 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Таким образом, df{x){h) = A{x)h. Из определений 2, 3 имеем А/(ж; h) - df(x)(h) = a(x; h), причем а(х; h) = o(h) при h —> 0, х + h € Е, т. е. разность между прира- приращением функции, вызванным приращением h ее аргумента, и значени- значением при том же h линейной по h функции df{x) оказывается бесконечно малой выше чем первого порядка по h. По этой причине говорят, что дифференциал есть (главная) линей- линейная часть приращения функции. Как следует из соотношения A2) и определения 1, поэтому дифференциал можно записать в виде df(x)(h)=f'(x)h. A3) В частности, если f(x) = x, то, очевидно, f(x) = 1 и dx(h) = 1 ■ h = h, поэтому иногда говорят, что «дифференциал независимой переменной совпадает с ее приращением». Учитывая это равенство, из A3) получаем df(x)(h)=f\x)dx(h), A4) т.е. df(x) = f'(x)dx. A5) Равенство A5) надо понимать как равенство функций от h. Из A4) получаем т.е. функция ух) (отношение функций df(x) и dx) постоянна и рав- равна f'{x). По этой причине, следуя Лейбницу, производную часто обо- обозначают символом *£*' наряду с предложенным впоследствии Лагран- жем1) символом f'(x). . Л. Лагранж A736 -1813) —знаменитый французский математик и механик.
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 211 В механике, кроме указанных символов, для обозначения производ- производной от функции ip(t) по времени t используется символ tp(t) (читается tip с точкой от U). 3. Касательная; геометрический смысл производной и диф- дифференциала. Пусть /: Е —> Ш — функция, определенная на множест- множестве Е с М, и хо—фиксированная предельная точка множества Е. Мы хотим подобрать постоянную с$ так, чтобы она лучше всех остальных констант характеризовала поведение функции в окрестности точки xq. Точнее, мы хотим, чтобы разность f(x) — cq при х -¥ xq, х € Е была бесконечно малой в сравнении уже с любой не нулевой постоянной, т. е. f(x) = со + оA) при х -¥ хо, х € Е. A7) Последнее соотношение равносильно тому, что lim /(ж) = со- ЕЭх-txo Если, в частности, функция непрерывна в точке xq, to lim /(ж) = и \ п \ ЕЭх—txo = j[xq) и, естественно, со = /(ж) Попробуем теперь подобрать функцию со + с\{х — жо) так, чтобы иметь f(x) = со + ci{x — хо) + о{х — ж0) при ж-^ ж0, х€Е. A8) Очевидно, это—обобщение предыдущей задачи, поскольку форму- формулу A7) можно переписать в виде /(ж) = со + о{(х — жо)°) при ж -^ жо, х € Е. Из A8) при ж -¥ хо, х € Е немедленно следует, что со = lim /(ж), »/ ■> ЕЭх—>хо и если функция непрерывна в точке, то со = Джо]. Если со найдено, то из A8) следует, что сх= lim /(Ж)-С° ЕЭ ЕЭх—>хо X — Жо И вообще, если бы мы искали такой полином Рп(жо;ж) = со+ +а{х - ж0) + ... + Сп(х - хо)п, что J(x) = со + а(х - х0) + ... + сп(х - жо)п + о((ж - жо)п) при ж —> жо, х € Е, A9)
212 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ то мы последовательно и вполне однозначно нашли бы со = lim f(x), ЕЭх>х Х Х° /(х) - [со + ... + с„_!(х - хо)" = lim >■ (х - хо) при условии, что все указанные пределы существуют; в противном слу- случае условие A9) невыполнимо и задача решения не имеет. Если функция / непрерывна в точке хо, то из A8), как уже отмеча- отмечалось, следует, что с$ = /(жо) и мы приходим к соотношению f(x) - f{xo) = ci(x -xo) + o(x-xq) при х -> хо, х G Е, равносильному условию дифференцируемости функции f(x) в точке xq. Отсюда находим ЕЭх-txo X — Хо Таким образом, доказано Утверждение 1. Функция f: Е—^Ш, непрерывная в точкеxq€E, предельной для множества Е С Ш, допускает линейное приближе- приближение A8) в том и только в том случае, когда она дифференцируема в этой точке. Функция ip(x) = со + ci(x - х0) B0) при со = f(xo) и ci = f'{xo) является единственной функцией вида B0), удовлетворяющей соотношению A8). Итак, функция tp(x) = f(xo)+f'{xo)(x-xo) B1) доставляет наилучшее линейное приближение функции / в окрестно- окрестности точки хо в том смысле, что для любой другой функции вида B0) f(x) — <р(х) Ф о(х — хо) при х —>■ хо, х € Е.
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 213 Графиком функции B1) является прямая y-f(x0) = f'(xQ)(x-x0), B2) проходящая через точку (жо,/(жо)) и имеющая угловой коэффици- коэффициент /'(ж0). Поскольку прямая B2) доставляет наилучшее возможное линей- линейное приближение графика функции у = f(x) в окрестности точки (xo,f(xo)), то естественно принять Определение 4. Если функция /:Е—>Ш определена на множе- множестве йсМи дифференцируема в точке хо € Е, то прямая, задаваемая уравнением B2), называется касательной к графику этой функции в точке (xo,f(xo)). Рисунок 15 иллюстрирует все основные понятия, связанные с диф- ференцируемостью функции в точке, которые мы к настоящему момен- моменту ввели: приращение аргумента и соответствующие ему приращение функции и значение дифференциала; на рисунке изображены график функции, касательная к графику в точке Ро = (хо, /(#о)) и, для сравне- сравнения, произвольная прямая (называемая обычно секущей), проходящая через Ро и некоторую точку Р ф Ро графика функции. i ч (х - хо)
214 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Развитием определения 4 является Определение 5. Если отображения f-.E-tR, д: Е —> №. непре- непрерывны в точке хо € Е, предельной для множества £сК,и f(x)—g(x) = = о{(х — ха)п) при х —>■ хо, х € Е, то говорят, что /ид имеют в точке хо касание порядка п (или, точнее, порядка не ниже п). При п = 1 говорят, что отображения /ид касаются друг друга в точке хо- В соответствии с определением 5 отображение B1) касается в точке хо € Е отображения f:E—tR, дифференцируемого в этой точке. Теперь можно также сказать, что полином Рп (хо; х) = со + + ci(x — хо) + ... + Сп(х — хо)п из соотношения A9) имеет с функци- функцией / касание не ниже чем порядка п. Число h = х — хо, т. е. приращение аргумента, можно рассматривать как вектор, приложенный к точке xq и определяющий переход из хо в х = хо + h. Обозначим совокупность таких векторов через ТЕ(жо) или ТИ&гр.1) Аналогично, обозначим через ТЕ(уо) или ТЩ,0 совокупность векторов смещения от точки у о по оси у (см. рис. 15). Тогда из опреде- определения дифференциала видно, что отображение df(x0): ТШ(х0) -)■ TR(f(x0)), B3) задаваемое дифференциалом h i-» f'(xo)h = df(xo)(h), касается отобра- отображения h)~ f(x0) = Af(x0; h), B4) задаваемого приращением дифференцируемой функции. Заметим (см. рис. 15), что если отображение B4) есть приращение ординаты графика функции у = f(x) при переходе аргумента из точ- точки хо в точку хо + h, то дифференциал B3) дает приращение ординаты касательной к графику функции при том же приращении h аргумента. 4. Роль системы координат. Аналитическое определение 4 каса- касательной может вызвать некоторую не вполне осознанную неудовлетво- неудовлетворенность. Мы постараемся сформулировать, что именно может соста- составить предмет этой неудовлетворенности. Однако прежде укажем одну х)Это — небольшое отклонение от наиболее распространенного обозначения Г1оМ пляТХ0{Ш).
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 215 более геометрическую конструкцию касательной к кривой в некоторой ее точке Pq (см. рис. 15). Возьмем произвольную точку Р кривой, отличную от Pq. Прямая, определяемая парой точек Pq, P, как уже отмечалось, называется се- секущей по отношению к кривой. Заставим теперь точку Р вдоль кривой стремиться к точке Pq . Если при этом секущая будет стремиться к неко- некоторому предельному положению, то это предельное положение секущей и есть касательная к кривой в точке Pq. Такое определение касательной при всей его наглядности в данный момент для нас неприемлемо потому, что мы не знаем, что такое кри- кривая, что значит «точка стремится к другой точке вдоль кривой» и, на- наконец, в каком смысле надо понимать «предельное положение секущей». Вместо того чтобы уточнять сейчас все эти понятия, мы отметим основную разницу между двумя рассмотренными определениями каса- касательной. Второе было чисто геометрическим, не связанным (во вся- всяком случае, до уточнений) с какой бы то ни было системой координат. В первом же случае мы определили касательную к кривой, являющейся в некоторой системе координат графиком дифференцируемой функ- функции. Естественно может возникнуть вопрос, не получится ли так, что если зту кривую записать в другой системе координат, то, например, соответствующая функция перестанет быть дифференцируемой или бу- будет дифференцируемой, но в результате новых вычислений мы получим другую прямую в качестве касательной. Этот вопрос об инвариантности, т. е. независимости от системы ко- координат, всегда возникает, когда понятие вводится с помощью некото- некоторой системы координат. В равной степени этот вопрос относится и к понятию скорости, которое мы обсуждали в пункте 1 и которое, кстати, как это уже от- отмечалось, включает в себя понятие касательной. Точка, вектор, прямая и т. д. имеют в разных системах коорди- координат разные численные характеристики (координаты точки, координа- координаты вектора, уравнение прямой). Однако, зная формулы, связывающие две системы координат, всегда можно по двум однотипным числовым представлениям выяснить, являются ли они записью в разных системах координат одного и того же геометрического объекта или нет. Интуи- Интуиция подсказывает нам, что процедура определения скорости, описанная в пункте 1, приводит к одному и тому же вектору независимо от систе- системы координат, в которой проводились вычисления. В свое время, при
216 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ изучении функций многих переменных, мы подробно обсудим подобно- подобного рода вопросы. Инвариантность определения скорости относительно различных систем координат будет проверена уже в следующем пара- параграфе. Прежде чем переходить к рассмотрению конкретных примеров, подведем некоторые итоги. Мы столкнулись с задачей математического описания мгновенной скорости движущегося тела. Эта задача привела к задаче аппроксимации заданной функции в окрестности исследуемой точки линейной функцией, что в геометри- геометрическом плане привело к понятию касательной. Функции, описывающие движение реальной механической системы, предполагаются допускаю- допускающими такую линейную аппроксимацию. Тем самым среди всех функций естественно выделился класс диф- дифференцируемых функций. Было введено понятие дифференциала функции в точке как линей- линейного отображения, определенного на смещениях от рассматриваемой точки, которое с точностью до величины бесконечно малой по сравне- сравнению с величиной смещения описывает поведение приращения диффе- дифференцируемой функции в окрестности рассматриваемой точки. Дифференциал df(xo)h = f'(xo)h вполне определяется числом f'(xo) — производной функции / в точке хо, которое может быть най- найдено предельным переходом f{xo)= iim №-П*о)т ЕЭх-+хо X — Xq Физический смысл производной—скорость изменения величины f(x) в момент хо; геометрический смысл производной—угловой коэффици- коэффициент касательной к графику функции у = f(x) в точке (xo,f(xo))- 5. Некоторые примеры Пример 1. Пусть f(x) = sin ж. Покажем, что f'(x) = cos ж. sm(x + h)-smx , 2sin (f) cos (x+ f) •4 lim — ^ = lim ч ' —- - = h /i-»o h h +
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 217 Мы воспользовались теоремой о пределе произведения, непрерывно- непрерывностью функции cos х, эквивалентностью sin t ~ t при t —> 0 и теоремой о пределе композиции. Пример 2. Покажем, что cos'ж = —sinж. ,. coe(* + fc)-cosa: ,. ~2sin (!) sin 4 lim — ^ = lim h h ( h\ si(|) = — lim sin I x + — I • lim —,\ = — sinz. ► ft->o \ 2) л-»о fh\ Пример 3. Покажем, что если f(t) = rcosujt, то f'(t) = —rwsinwt. ,. rcoscj(t + h)rcoscut ,. lim ь r1 = r lim h rr lim h Л-»О h sin (f) lim —' — = —r lim sine; I t + — ) • lim —/ ,\ — —rusmut. ► Пример 4. Если f(t)= r sin cut, то f'{t) — rio cos cut. •* Доказательство аналогично разобранным в примерах 1 и 3. ► Пример 5. Мгновенная скорость и ускорение материальной точ- точки. Пусть материальная точка движется в плоскости и в фиксированной системе координат закон ее движения описывается дифференцируемы- дифференцируемыми функциями от времени х = x(t), у = y(t) или, что то же самое, вектором Как мы выяснили в пункте 1 настоящего параграфа, скорость точки в момент t есть вектор v(t) = r{t) = (x(t),y где x(t), y(t) — производные функций x(t), y(t) no времени t.
218 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Ускорение a(t) есть скорость изменения вектора v(t), поэтому где x(t), y(t) —производные по t функций x(t), y(t), или так называемые вторые производные функций x(t), y(t). Таким образом, по смыслу физической задачи функции x(t), y(t), описывающие движение материальной точки, должны иметь и первые и вторые производные. Рассмотрим, в частности, равномерное движение точки по окруж- окружности радиуса г. Пусть со — угловая скорость точки, т. е. величина цен- центрального угла, на который перемещается точка за единицу времени. В декартовых координатах (в силу определений функций cos x, sin ж) это движение запишется в виде r(t) — (rcos(u)t + a),rsin(u>t + a)), а если г@) = (г, 0), то в виде r(t) = (rcosu)t,rsmujt). Без ограничения общности дальнейших выводов и для сокращения записи будем считать, что г@) = (г, 0). Тогда в силу результатов примеров 3 и 4 v(t) = r{t) = (—гw sin cut, rw cos cut). Из подсчета скалярного произведения (v(t), r(t)) = — г2ш sincut cos Lot + r2w cos cut sin cut = 0, как и следовало в этом случае ожидать, получаем, что вектор v (t) ско- скорости ортогонален радиус-вектору r{t) и направлен по касательной к окружности. Далее, для ускорения имеем a(t) = v{t) = r(t) = (-гш2cosujt, -гш2smut), т.е. a(t) = —и;2 ■ r{t) и ускорение, таким образом, действительно цен- центростремительное, ибо имеет направление, противоположное направле- направлению вектора r(t).
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 219 Далее, \a{t)\=u?\r{t)\=u}2r = г г где v = \v(t)\. Подсчитаем, исходя из этих формул, например, величину скорости низкого спутника Земли. В этом случае г совпадает с радиусом Земли, т.е. г к 6400км, a \a(t)\ и д, где д ~ 10м/с2—ускорение свободного падения у поверхности Земли. Таким образом, v2 = \a(t)\r « 10м/с2 х 64 ■ 105 м = 64 • 106 (м/сJ и v и 8 ■ 103 м/с. Пример 6. Оптическое свойство параболического зеркала. Рас- Рассмотрим (рис. 16) параболу у = ^-х2 (р > 0) и построим касательную , \ ( \ i\ к ней в точке {xq, уо) = I xq, ~-Xq ). Поскольку f(x) = w-x2, то /'(я?о) = J_X2 _ ±Х2 i i -^ £— = —- lim (ж + zo) = -xq. X — Xq 2p Значит, искомая касательная имеет уравнение 1 2 ! /■ ч у - — ж5 = -хо{х - х0) или -жо(ж-жо) -(у -г/о) = о, где уо = ^zo- Вектор n = f —jja;o, 1), как видно из по- последнего уравнения, ортогонален прямой B5). Покажем, что векторы еу = @,1) и еу = = (—Ж0)§ — Уо) образуют с п равные углы. Вектор еу есть единичный вектор направле- направления оси Оу, а еу — вектор, направленный из точки касания (жп,ад) = \хо,-^-Хп) в точку 10, |) — фокус параболы. Итак, 0 Рис. 16. cos B5) (xo,yo) |в»||п|
220 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 1 2 cos e/n = J 2 1 „2 2 2р"Ж0 \n\ 1 Таким образом, показано, что волновой источник, помещенный в точке @, 2 J — в фокусе параболического зеркала, даст пучок, парал- параллельный оси Оу зеркала, а приходящий параллельно оси Оу пучок зер- зеркало пропустит через фокус (см. рис. 16). Пример 7. Этим примером мы покажем, что касательная являет^ ся всего-навсего лучшим линейным приближением графика функции в окрестности точки касания и вовсе не обязана иметь с ним единствен- единственную общую точку, как это было в случае окружности и как это вообще имеет место в случае выпуклых кривых. (О выпуклых кривых будет специальный разговор.) Пусть функция f(x) задана в виде /(*) = 0, ljp, если i/O, если х = 0. График этой функции изображен жирной линией на рис. 17. , если а; ^ О, если х = О Рис. 17.
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 221 Найдем касательную к графику в точке @,0). Поскольку /'@) = lim - = lim x sin - = 0, х-»о х — 0 х->о х то касательная имеет уравнение у — 0 = 0 • (ж — 0), или просто у = 0. Таким образом, в нашем примере касательная совпадает с осью Ох, с которой график имеет бесконечное количество точек пересечения в любой окрестности точки касания. В силу определения дифференцируе- дифференцируемо сти функции /:£-}Кв точке хо € £ Е имеем f(x) - /(*о) = А(хо)(х - х0) + о(х - х0) 0 х при х -» хо, х € Е. Рис. 18. Поскольку правая часть этого равенства стремится к нулю при х -» жо, х £ Е, то lim /(ж) = f(xo), так что дифференцируемая в точке функция обязана быть непрерывной в этой точке. Покажем, что обратное, конечно, не всегда имеет место. Пример 8. Пусть f(x) = \х\ (рис. 18). Тогда в точке хо = 0 ,. /0*0-Джо) ,. \x\-0 -х lim —— —- = lim i—! = lim — = —1, z-no-0 x — Xo х->—о x — 0 х-»—о a; ,. /(ж)-/(*о) ,. k|-0 ж lim —^ —- = lim J—! = lim — = 1. x->xo+0 ж — Жо х->+0 Ж — 0 x->+0 Ж Следовательно, в этой точке функция не имеет производной, а зна- значит, и не дифференцируема в этой точке. Пример 9. Покажем, что ex+h — ех = exh + o(h) при h —> 0. Таким образом, функция ехр(ж) = ех дифференцируема, причем dexp(x)h = exp(x)h, или dex = exdx, и тем самым ехр'ж = ехрж, или dex _ рх 4 ex+h _ex = ex^eh -\) = ex(h + o(h)) = exh + o(h). Мы воспользовались полученной в примере 39, гл. III, §2, п. 4 фор- формулой eh — 1 = h + o{h) при h ->■ 0. ►
222 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 10. ax+h - ах = ах Inah + o(h) при h ->■ 0 и а > 0. Таким образом, dax = axlnadx и -^- = ах In а. ах = = ax (h In a + o(h In a)) = ax In ah + o(h) при h ->■ 0. ► Пример 11. In \x + h\ — In |ж| = \h + o{h) при h ->■ 0 и ж ^ 0. Таким образом, rfln|x| = \dx и ^1 = ^. •^ In |ж + h\ — In |ж| = In При \h\ < \x\ имеем значений h можно написать = 1 + v, поэтому для достаточно малых In \x + h\- In Ы = In A + - ) = - + о (-) =-h + o(h) \ x) x \x) x при h —> 0. Мы воспользовались здесь тем, что, как показано в приме- примере 38, гл. III, § 2, п. 4, ln(l + t) = t + o(t) при * ->■ 0. ► Пример 12. logo \x + h\ — logo |ж| = ^j^h + o(/i) при /i ->■ 0, x ф О, - ~ / — Таким образом, dloga |ж| = -^— dx и dlo|" lzi = ~-. ^ ' ьо i i xlna ax x In a «^ logo \x + h\ - logo \x\ = logo X xlna' ж x ж In a Мы воспользовались формулой перехода к другому основанию ло- логарифмов и соображениями, изложенными при рассмотрении приме- примера 10. ► Задачи и упражнения 1. Покажите, что а) касательная к эллипсу Ъ2
§ 1. ДИФФЕРЕНЦИРУЕМАЯ ФУНКЦИЯ 223 в точке (хо,уо) имеет уравнение хх0 j/j/o _ 1 а2 + Ь2 ~ ' Ь) световые лучи от источника, помещенного в одном из двух фокусов Fi = (—у/а2 — Ь2,6), F2 = (Va2 — Ь2,6) эллипса с полуосями а > b > 0, соби- собираются эллиптическим зеркалом в другом фокусе. 2. Напишите формулы для приближенного вычисления значений a) sin [ ^ + а1 при значениях а, близких к нулю; b) sinC0° + а°) при значениях а0, близких к нулю; c) cos (т + а) ПРИ значениях а, близких к нулю; d) cosD5° + а0) при значениях а°, близких к нулю. 3. Стакан с водой вращается вокруг своей оси с постоянной угловой ско- скоростью и>. Пусть у — f(x)—уравнение кривой, получающейся в сечении по- поверхности жидкости плоскостью, проходящей через ось вращения. 2 a) Покажите, что f'(x) = ^-х, где д—ускорение свободного падения (см. пример 5). b) Подберите f(x) так, чтобы функция f(x) удовлетворяла условию, ука- указанному в а) (см. пример 6). c) Изменится ли приведенное в а) условие на функцию f(x), если ось вра- вращения не будет совпадать с осью стакана? 4. Тело, которое можно считать материальной точкой, под действием силы тяжести скатывается с гладкой горки, являющейся графиком дифференциру- дифференцируемой функции у = f(x). a) Найдите горизонтальную и вертикальную компоненты вектора ускоре- ускорения, которое имеет тело в точке (хо,Уо)- b) В случае, когда f(x) = х2 и тело скатывается с большой высоты, най- найдите ту точку параболы у = х2, в которой горизонтальная составляющая ускорения максимальна. 5. Положим {х, если 0 < х < ъ, 1-х, если i ^ ж ^ 1, и продолжим эту функцию на всю числовую прямую с периодом 1. Эту про- продолженную функцию обозначим через <ро- Пусть, далее, - — 4"
224 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Функция ipn имеет период 4~" и производную, равную +1 или —1 всюду, кроме точек х = — , п € Z. Пусть п=1 Покажите, что функция / определена и непрерывна на К, но ни в одной точке не имеет производной. (Этот пример принадлежит известному современному голландскому математику Б. Л. Ван дер Вардену. Первые примеры непрерыв- непрерывных функций, не имеющих производной, были построены Больцано A830г.) и Вейерштрассом A860г.).) § 2. Основные правила дифференцирования Построение дифференциала заданной функции или, что равносиль- равносильно, отыскание ее производной называется операцией дифференцирова- дифференцирования функции1). 1. Дифференцирование и арифметические операции Теорема 1. Если функции f: X ->■ Ш, д: X ->■ Ш дифференцируе- дифференцируемы в точке х 6 X, то а) их сумма дифференцируема в х, причем b) их произведение дифференцируемо в х, причем c) их отношение дифференцируемо в х, если д(х) ф 0, причем \ . f'(x)g(x)-f(x)g'(x) М В доказательстве мы будем опираться на определение диффе- дифференцируемой функции и свойства символа о(-), установленные в гл. III, §2, п. 4. ^При математической равносильности задачи отыскания дифференциала и зада- задачи отыскания производной, все же производная и дифференциал—не одно и то же, и поэтому, например, во французском математическом языке имеются два терми- термина: derivation — «деривация», нахождение производной (скорости), и differentiation — «дифференцирование», нахождение дифференциала.
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 225 a) (/ + g)(x + h)-(f+ g){x) = (f{x + h)+ g(x + h)) - - (f(x) + д(х)) = (f(x + h)- f(x)) + (g(x + h) - g(x)) = = (f'(x)h + o(h)) + (g'(x)h + o(h)) = (f'(x) + g'(x))h + o(h) = = (f' + g')(x)h + o(h). b) (/ • g)(x + h)-(f- g)(x) = f(x + h)g(x + h) - f(x)g(x) = = (f(x) + f'(x)h + o(h))(g(x) + g'(x)h + o(h)) - f(x)g(x) = = (f'(x)g(x) + f(x)g'(x))h + o(h). c) Поскольку функция, дифференцируемая в некоторой точке i£l, непрерывна в этой точке, то, учитывая, что д(х) ф 0, на основании свойств непрерывных функций можем гарантировать, что при доста- достаточно малых значениях h также д(х + h) Ф 0. В следующих выкладках предполагается, что h мало: > + /l)-@(*) = ^ gix)gix + h) 1 -h) fjx) ■ h) gix) h)g(x) - fix)gix —-+oil))(ifix)+f'ix)h+oih))gix)-fix)igix)+g'ix)h+o(h))) = 9 \x) / = f'ix)gix)-f(x)g'ix)h + g2ix) Мы воспользовались тем, что в силу непрерывности функции д в точке х и того, что д(х) ф О, gix)g(x + h) т.е. gix)gix + h) g2ix) ' где оA) есть бесконечно малая при h —> 0, х + h £ X. ►
226 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Следствие 1. Производная от линейной комбинации дифферен- дифференцируемых функций равна линейной комбинации производных этих функ- функций. ■^ Поскольку постоянная функция, очевидно, дифференцируема и ее производная всюду равна нулю, то, считая в утверждении Ь) теоремы 1, что / = const = с, имеем (сд)'(х) = сд'{х). Используя теперь утверждение а) теоремы 1, можем записать с2д)'(х) = Ы)'(х) + (с2д)'(х) = Clf'{x) + с2д'(х). С учетом доказанного, по индукции проверяем, что (ci/i + ... + Сп/пУ(х) = Clf[{x) + ...+ cnf'n{x). ► Следствие 2. Если функции /i,...,/n дифференцируемы в точ- точке х, то (h...fn)'(x)=f[(x)f2(x)...fn(X) + h(x)... Ш + ... + h{x)... fn.x{x)f'n{x). ■4 Для n = 1 утверждение очевидно. Если оно справедливо для некоторого п £ N, то в силу утвержде- утверждения Ь) теоремы 1 оно справедливо также для (п+1) £ N. В силу принци- принципа индукции заключаем о верности приведенной формулы для любого пек ► Следствие 3. Из взаимосвязи производной и дифференциала сле- следует, что теорема 1 может быть записана также через дифферен- дифференциалы. Именно: a) d{f + g){x)=df(x) + dg{x); b) d(f ■ g)(x) = g(x)df(x) + f(x)dg(x); c) d ф {x) = g(x)df{x)-f(x)dg{x)i если g{x) ф 0 Л Проверим, например, а). Действительно, d(f + g)(x)h = (f + g)'(x)h = (/' + g')(x)h = = (f'(x)+g'(x))h = f'(x)h + g'(x)h = = df(x)h + dg{x)h = (df(x) + dg{x))h, и совпадение функций d(f + g)(x), df(x) + dg(x) проверено. ►
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 227 Пример 1. Инвариантность определения скорости. Теперь мы в состоянии проверить, что вектор мгновенной скорости материальной точки, который был определен в п. 1 § 1, не зависит от выбора системы декартовых координат. Мы проверим это даже для любой из аффинных систем координат. Пусть (ж1, ж2) и (ж1, ж2) — координаты одной и той же точки плос- плоскости в двух различных системах координат, связанных между собой соотношениями х1 = а\х1 + а\х2 + Ь1, х2 = а\хх +а|ж2 + Ь2. Поскольку любой вектор (в аффинном пространстве) определяется парой точек, а его координаты суть разности координат начала и конца вектора, то координаты одного и того же вектора в этих двух системах должны быть связаны соотношениями v1 = aju1 + alv2, B) v2 = ajv1 + a\v2. Если закон движения точки в одной системе задается функциями xl(t), x2(t), то в другой — функциями ж1(<), x2(t), связанными с первы- первыми посредством соотношений A). Дифференцируя соотношения A) по времени t, по правилам диффе- дифференцирования находим х = а^х + а2х . Таким образом, координаты (и1,?;2) = (ж1,ж2) вектора скорости в первой системе и координаты (и1, и2) = (ж , ж ) вектора скорости во второй системе оказались связанными соотношениями B), говорящими нам о том, что мы имеем дело с двумя различными записями одного и того же вектора. Пример 2. Пусть /(ж) = 1§ж. Покажем, что fix) = —^— всюду, cos а; где cos ж ф 0, т. е. в области определения функции tg ж = fj§§.
228 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В примерах 1 и 2 из § 1 было показано, что sin'ж = cos ж, cos'а; = = — sin ж, поэтому из утверждения с) теоремы 1 получаем при cos ж ф 0: sin \ „ , sin' х cos x — sin x cos' x cos2 cos x cos x + sin x sin x COS2 X COS2 X ' Пример 3. ctg'a; = — 2 при sinx ф О, т.е. в области определе- определения функции ctg х = sin x sin re Действительно, , /cos\ ctg х - — Vsin/ cos \' , cos' x sin ж — cos x sin' ж — sin ж sin ж — cos x cos ж sin2 ж sin2 x Пример 4. Если Р(х) = cq+c\x + . . .+cnxn — полином, то Р'(x) = ncnxn~l. Ф- = 1 то по следствию 2 -£- = пхп~х Действительно, поскольку Ф- = 1, то по следствию 2 -£- = пхп и теперь утверждение вытекает из следствия 1. 2. Дифференцирование композиции функций Теорема (теорема о дифференциале композиции функций). Если функция f: X —>■ У С Ш дифференцируема в точке х £ X, а функ- функция g: Y —У Ш дифференцируема в точке у = f(x) £ У, то композиция gof: X —У Ш этих функций дифференцируема в точке х, причем диффе- дифференциал d(gof)(x): ТШ(х) —> ТШ(д(/(х))) композиции равен композиции dg(y) о df(x) дифференциалов df(x): ТЩх) -»■ ТШ(у = f(x)), dg(y = f(x)): ТЩу) -+ ТШ(д(у)). ■4 Условия дифференцируемости функций fug имеют вид f(x + h) - f(x) = f'(x)h + o(h) при h->0,x + heX, o(t) при t-»0, y + t&Y. Заметим, что в последнем равенстве функцию o{t) можно считать определенной и при t = 0, а в представлении o(t) = j(t)t, где 7(£) -> —> 0 при t —> 0, у + t £ Y, можно считать 7@) = 0. Полагая f(x) = у,
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 229 f(x + К] = у +1, в силу дифференцируемости, а значит, и непрерывно- непрерывности функции / в точке х заключаем, что при h —> 0 также t —> 0, и если x + h £ X, то y + t GY. По теореме о пределе композиции теперь имеем j(f(x + h)- f{x)) = a(h) -»■ 0 при h -»■ 0, х + Л G X, и, таким образом, если t = f(x + К) — f(x), то о(<) = j(f(x + h)- f(x))(f(x + h)- /(я)) = - a(h){f'(x)h + o(h)) = a(h)f'(x)h + a(h)o{h) = = o(h) + o(h) = o(h) при h -»■ 0, a; + Л G X Далее, o(t) = ) + o(f(x + h)- f(x)) = = g'(f(x))(f'(x)h + o(h)) + o(f(x + h)- f(x)) = = g'(f(x))(f'(x)h) + g'(f(x))(o(h)) + o(f(x + h) - f(x)). Поскольку величину g'(f(x))(f'(x)h) можно интерпретировать как значение dg(f (х)) оdf (x)h композиции h 1 > g'(f(x)) ■ f'(x)h ото- отображений h 1 > f'(x)h, т 1 > д'(у)т на смещении h, то для завер- завершения доказательства теоремы остается заметить, что сумма g'(f(x))(o(h))+o(f(x + h)-f(x)) есть величина бесконечно малая в сравнении с h при h —> 0, х + h G X, ибо, как мы уже установили, o(f{x + h) -/Or)) = o(h) при /i->-0, x + heX. Итак, показано, что (gof)(x + h)-(gof)(x) = - f'(x)h + o{h) при Л-»0, x + heX. ►
230 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Следствие 4. Производная (д о f)'(x) композиции дифференциру- дифференцируемых вещественнозначных функций равна произведению g'(f{x)) ■ f'(x) производных этих функций, вычисленных в соответствующих точках. Большим искушением к короткому доказательству последнего ут- утверждения являются содержательные обозначения Лейбница для про- производной, в которых, если z = z(y), а у = у(х), имеем dz _ dz dy dx dy dx' что представляется вполне естественным, если символ -£- или -Л рас- рассматривать не как единый, а как отношение dz к dy или, соответствен- соответственно, dy к dx. Возникающая в связи с этим идея доказательства состоит в том, чтобы рассмотреть разностное отношение Az _ Az Ay Ах Ay Ax и затем перейти к пределу при Да; —> 0. Трудность, которая тут появля- появляется (и с которой нам тоже отчасти пришлось считаться!), состоит в том, что Ау может быть нулем, даже если Ах ф 0. Следствие 5. Если имеется композиция (/„ о ... о /i)(:r) диффе- дифференцируемых функций 2/1 = fi(x),..., уп = fn{yn-i), то (U о ... о Д)'(х) = U(Vn-i)fn-i(Vn-2) ■ ■ ■ Ш- < При п = 1 утверждение очевидно. Если оно справедливо для некоторого п £ N, то из теоремы 2 сле- следует, что оно справедливо также для п + 1, т. е. по принципу индукции установлено, что оно справедливо для любого п £ N. ► Пример 5. Покажем, что при а£Кв области х > 0 имеем -£- = = аха~1, т.е. dxa = axa~1dx, и {x + h)a-xa = axa~lh + o{h) при h ->• 0. < Запишем ха — ealnx и применим доказанную теорему с учетом результатов примеров 9и11из§1и пункта Ь) теоремы 1.
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 231 Пусть д(у) — еу и у = f(x) = alnx. Тогда ха — (д о f)(x) и (9 ° Я'И - 9'(У) ■ f'(x) = еУ-- = еаЫх-- = ха-- = аха~1. ► X XX Пример 6. Производная от логарифма модуля дифференцируе- дифференцируемой функции часто называется логарифмической производной. Поскольку F(x) = 1п|/(ж)| = (lno | | о f)(x), то в силу результата примера И из § 1 F'{x) = (ln|/|)'(:r) = Ш. 1\х) Таким образом, '- fix)-' f(x)' Пример 7. Абсолютная и относительная погрешности значе- значения дифференцируемой функции, вызванные погрешностями в задании аргумента. Если функция / дифференцируема в точке х, то f(x + h)- f(x) = f'{x)h + a{x; h), где a(x; h) = o(h) при h —> 0. Таким образом, если при вычислении значения f(x) функции аргу- аргумент х определен с абсолютной погрешностью h, то вызванная этой погрешностью абсолютная погрешность \f(x + h) — f(x)\ в значении функции при достаточно малых h может быть заменена модулем зна- значения дифференциала \df(x)h\ = \f'(x)h\ на смещении h. Тогда относительная погрешность может быть вычислена как от- отношение 4}f\,' = I ff\\ или как модуль произведения Лх{ Щ лога- рифмическои производной функции на величину абсолютной погреш- погрешности аргумента. Заметим, кстати, что если f(x) = \пх, то dlnx = -— и абсолютная погрешность в определении значения логарифма равна относительной погрешности в определении аргумента. Это обстоятельство прекрасно используется, например, в логарифмической линейке (и многих других приборах с неравномерным масштабом шкал). А именно, представим себе, что с каждой точкой числовой оси, лежащей правее нуля, мы свя- связали ее координату у и записали ее над точкой, а под этой точкой записали число х = еу. Тогда у = In ж. Одна и та же числовая полуось
232 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ оказалась наделенной одной равномерной шкалой у и одной неравно- неравномерной (ее называют логарифмической) шкалой х. Чтобы найти In ж, надо установить визир на числе х и прочитать наверху соответствую- соответствующее число у. Поскольку точность установки визира на какую-то точку не зависит от числа х или у, ей отвечающего, и измеряется некоторой величиной Ау (длиной отрезка возможного уклонения) в равномерной шкале, то при определении по числу х его логарифма у мы будем иметь примерно одну и ту же абсолютную погрешность, а при определении числа по его логарифму будем иметь примерно одинаковую относитель- относительную погрешность во всех частях шкалы. Пример 8. Продифференцируем функцию u(x)v(x>, где и(х) и v(x)—дифференцируемые функции и и(х) > 0. Запишем u(x)v^ = _ e«(z;)lnu(x) и воспользуемся следствием 5. Тогда оу(х)\пи(х) v'(x)\nu(x) dx ^ = u(x)vW ■ v'(x) lnu{x) + «(^«(x)^4 . „'(a;). 3. Дифференцирование обратной функции Теорема 2 (теорема о производной обратной функции). Пусть функции f:X—*Y, /-1: Y —> X взаимно обратны и непрерывны в точках xq G X и f(xo) = у0 G Y соответственно. Если функция / дифференцируема в точке хо и f'{xo) ф 0, то функция f~1 также дифференцируема в точке уо, причем (Г1)'(И>) = (/'О"*)) • ■^ Поскольку функции fiX-tY, f~l: Y —у X взаимно обратны, то величины f(x) — f(xo), f~l(y) — f~1{yo) при у = f(x) не обращаются в нуль, если х ф хо- Из непрерывности / в хо и f~l в уо можно, кроме того, заключить, что AЭх4 х0) <& (Y Э у —> уо). Используя теперь теорему о пределе композиции функций и арифметические свойства предела, находим УЭу-+уо у - Уо ХЭя-ксо /(^) - f{xo) 1 = lim (f(x) \ x -f(xo)\ )
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 233 Таким образом, показано, что в точке уо функция f~x: Y —> X имеет производную и Замечание 1. Если бы нам заранее было известно, что функ- функция /-1 дифференцируема в точке уо, то из тождества (/-1 о f)(x) = х по теореме о дифференцировании композиции функций мы сразу же нашли бы, что (f~l) (уо) • f'{xo) = !• Замечание 2. Условие f'(xo) Ф 0, очевидно, равносильно тому, что отображение h н-> f'(xo)h, осуществляемое дифференциалом df(xo): ТШ(х0) -> ТЕ(уо), имеет обратное отображение [^/(жо)]: ТК(уо) ->■ -^ТЩхо), задаваемое формулой т >-> (/'(жо))~1т. Значит, в терминах дифференциалов вторую фразу формулировки теоремы 3 можно было бы записать следующим образом: Если функция f дифференцируема в точке xq и в этой точке ее дифференциал df(xo)'-TR(xo) —> ТШ(уо) обратим, то дифференциал функции f~l, обратной к f, существует в точке уо — f(xo) и явля- является отображением df'Hyo) = [df{xo)]~l: ТЕ(уо) -»■ ТЩх0), обратным к отображению df(xo): ТШ(хо) —> ТШ(уо). Пример 9. Покажем, что arcsin'у = - х при \у\ < 1. Функции sin: [—тг/2, тг/2] —> [—1,1] и arcsin: [—1,1] —>• [—тг/2, тг/2] взаимно обрат- ны и непрерывны (см. гл. IV, §2, пример 8), причем sin'ж = cos ж ф О, если х\ < тг/2. При \х\ < тг/2 для значений у = sin x имеем \у\ < 1. Таким образом, по теореме 3 1 1 arcsin' у = -r-f sin x cos x y/i_ sin2 x Знак перед радикалом выбран с учетом того, что cos ж > 0 при \х\ < тг/2. Пример 10. Рассуждая, как и в предыдущем примере, можно по- показать (с учетом примера 9 из § 2 гл. IV), что arccos'y = . при \у\ < 1.
234 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Действительно, 111 1 arccos' у cos'ж sin ж а/1 - cos2 х */l -у2 Знак перед радикалом выбран с учетом того, что sin ж > 0, если 0 < < X < 7Г. Пример 11. arctg' у =——=•, у £ Ш. 1 + гг Действительно, ,11 2 1 1 arctg у = —т— = -, г- = cos х = ^— = к. f сг' т / 1 \ 14- f о-^ т 1-1- II*1 Щ х I - j L -f- Щ X 1Т(/ V COS2 X / Пример 12. arcctg'y = ^—j, у G M. Действительно, 1 1 arcctg'у = ctg' = — sin2 х — — a; / 1_) l + ctg2x 1+y2" V sin2 x ) Пример 13. Мы уже знаем (см. примеры 10, 12 из § 1), что функ- функции у = f(x) — ах и х = /~1(у) = logax имеют производные f'(x) = Проверим, как это согласуется с теоремой 3: /,_i\'/ ч _ 1 _ 1 _ 1 U ^ (У)- j,^ ~ а ylna' y\na Пример 14. Гиперболические, обратные гиперболические функ- функции и их производные. Функции = -(ex-e~x), = - (ех + е~х)
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 235 называются соответственно гиперболическим синусом и гиперболиче- гиперболическим косинусом1' от х. Эти в данный момент вводимые нами чисто формально функции, как выяснится, во многих вопросах появляются так же естественно, как появляются круговые функции sinx, cos x. Заметим, что sh(—х) = — ch(—x) = chx, т. е. гиперболический синус — нечетная функция, а гиперболический косинус — функция четная. Кроме того, очевидно следующее основное тождество: ch2 х — sh2a: = 1. Графики функций y = shxny = chx изображены на рис. 19. Из определения функции shx и свойств функции ех следует, что shx—непрерывная строго возрастающая функция, отображающая взаимно однозначно М на М. Обратная функция к shz, таким образом, существует, определена на R, непрерывна и строго монотонно возра- возрастает. Ее обозначают символом arshy (читается «ареа-синус2^ от у»). Эту функцию легко выразить через уже известные. Решая уравнение \ (е* - е~х) = у относительно х, найдем последовательно = sha; Рис. 19. :'От лат. sinus hyperbolici, cosinus hyperbolici. 2'Полное название — area sinus hyperbolici (лат.); почему здесь используется тер- термин «площадь» (area), а не «дуга» (arcus), как в круговых функциях, выяснится не- несколько позже.
236 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ (ех > О, поэтому ехфу— \/l + у2) и х = In (у + \/l + У2 J • Итак, arsh у = In ( у + V 1 + У2) , У € К- Аналогично, используя монотонность функции у = chx на участках М_ = {ж € М | ж < 0}, M+ = {ж € М | ж ^ 0}, можно построить функции arch_ у и arch+ у, определенные для у ^ 1 и обратные к ограничению функции ch х на К_ и М+ соответственно. Они задаются формулами arch_ у = In (у - л/у2 - 1J , arch+ у = In (у + \/у2 - l) • Из приведенных определений находим sh'a: = - (е1 + е) = chx, сЬ'ж = - (е1 - е) = shx, а на основе теоремы о производной обратной функции получаем arch'_ у = arch'+ у = 1 sh' 1 ch' 1 X X 1 chx 1 shx 1 1 Vch2x-1 1 Ф=? ch'x shx - 1 ~ 1' Последние три соотношения можно проверить, используя явные вы- выражения для обратных гиперболических функций arsh у и arch у.
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 237 Например, arsh'y = )== A + 1A + у2)72 • 2у] = У + \Л +У2 л/1 Подобно tg ж и ctg х можно рассмотреть функции shx , спя thx = —— и ctn:r:=——, сп х sh х называемые гиперболическим тангенсом и гиперболическим котанген- котангенсом соответственно, а также обратные им функции ареа-тангенс: lnj и ареа-котангенс: 2 y-V Решения элементарных уравнений, приводящие к этим формулам, мы опускаем. По правилам дифференцирования имеем , , sh' х ch x — sh x ch' x ch x ch x — sh x sh x 1 cth' ж = ch2 x ch2 ж ch2 x' ch'xshx — chxsh'x sh ж sh ж — ch ж ch ж 1 sh2 x sh2 ж sh2 x' По теореме о производной обратной функции arcth' ж = , , = -7 г- = — sh2 х = cth'f l\ Sh2x Ivl > l. cth2z-l y2-l' Две последние формулы можно проверить и непосредственным диффе- дифференцированием явных формул для функций axth у и arcth у.
238 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 4. Таблица производных основных элементарных функций. Выпишем теперь (см. табл. 1) производные основных элементарных функций, подсчитанные в § 1 и § 2. Таблица 1 Функция f(x) Производная f'(x) Ограничения на область изменения аргумента х £ I 1. С (const) 2. ха 3. 4. 5. 6. 7. sin а; cos а; 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. ctga; arcsin x arccos x arctg x arcctg x sha; chx tha: ctha; arsh x = In {x + \/l + x2) arch x = In {x ± \/x2 — 1) ln 2 x — 0 1 a; In а cos a; — sin a; 1 cos2 x . 2 sm x 1 1 + X2 cha; sha; 1 ch2x 1_ sh2x 1-х" 1 1-х2 x > 0 при а € К iel при а € N iff (а > 0, а ф 1) € К \ 0 (а > 0, а ^ 1) х ф | + тгА;, А; € х ф ттк, к € Ъ \х\ < 1 \х\ <1 |ж| > 1 \х\ < 1 5. Дифференцирование простейшей неявно заданной функ- функции. Пусть у = y(t) и х = x(i) —дифференцируемые функции, опреде- определенные в окрестности U(to) точки to G М- Предположим, что функция х = x(t) имеет обратную функцию t = t(x), определенную в окрестно-
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 239 сти V(xo) точки хо = x(to)- Тогда величину у = y(t), зависящую от t, можно рассматривать также как функцию, неявно зависящую от х, по- поскольку y(t) = y(t(x)). Найдем производную этой функции по х в точ- точке хо, предполагая, что x'(to) ф 0. Используя теорему о дифференциро- дифференцировании композиции и теорему о дифференцировании обратной функции, получаем dv(t) Ух\х=х0 dy(t(x)) dy{t) х=х0 dt t=t0 dx x=Xo t=t0 (Здесь использовано стандартное обозначение f(x)\x=x := f(xo).) Если одна и та же величина рассматривается как функция различ- различных аргументов, то во избежание недоразумений при дифференцирова- дифференцировании явно указывают переменную, по которой это дифференцирование проводится, что мы и сделали. Пример 15. Закон сложения скоростей. Движение точки вдоль прямой вполне определяется, если в каждый момент t выбранной нами системы отсчета времени мы знаем координату х точки в выбранной системе координат (числовой оси). Таким образом, пара чисел (x,t) определяет положение точки в пространстве и во времени. Закон дви- движения точки запишется в виде некоторой функции х = x(t). Предположим, что движение этой же точки мы хотим описать в тер- терминах другой системы координат (х, t). К примеру, новая числовая ось движется равномерно со скоростью — v относительно первой (вектор скорости в данном случае можно отождествить с задающим его одним числом). Будем для простоты считать, что координаты @,0) и в той и в другой системе относятся к одной и той же точке или, точнее, что в момент 1=0 точка х = 0 совпадала с точкой х = 0, в которой часы показывали t = 0. Тогда один из возможных вариантов связи координат (х, t), (x,t), описывающих движение одной и той же точки, наблюдаемое из разных систем координат, доставляют классические преобразования Галилея х = х + vt, D) Рассмотрим несколько более общую линейную связь х = ах + /3t, i = ух + dt,
240 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ разумеется, в предположении, что эта связь обратима, т.е. определи- определила 0\ тель матрицы I ^ 1 отличен от нуля. Пусть х = x(t) и х = x(i)—закон движения наблюдаемой точки, записанный в этих системах координат. Зная зависимость х — x(t), из формул E) найдем x(t) = ax(t) + Pt, i(t) = jx(t) + 5t, а в силу обратимости преобразований E), записав х = ах + Pi, t = jot + Si, зная х = x(i), можно найти x{i) = ax(i) + pi, Из соотношений F) и (8) видно, что для данной точки существуют взаимно обратные зависимости i = i(t) и t = t(i). Рассмотрим теперь вопрос о связи скоростей нашей точки, вычисленных в системах координат (х, t) и (х, i) соответ- соответственно. Используя правило дифференцирования неявной функции и форму- формулы F), имеем di или aV(t)+P где i и t — координаты одного и того же момента времени в системах (x,i) и (х,i). Это всегда имеется в виду при сокращенной записи формулы (9).
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 241 В случае преобразований D) Галилея из A0) получаем классический закон сложения скоростей V = V + v. A1) Экспериментально с достаточной степенью точности установлено (и это стало одним из постулатов специальной теории относительно- относительности), что в вакууме свет всегда распространяется с определенной ско- скоростью с, не зависящей от состояния движения излучающего тела. Это означает, что если в момент t = i = 0 в точке х — х = 0 происхо- происходит вспышка, то через время t в системе (x,t) свет достигнет точек с координатами х такими, что х2 = (ctJ, а в системе (х, I) этому собы- событию будут отвечать время t и координаты х точек такие, что опять X2 = (CtJ. Таким образом, если х2 — (?t2 = 0, то и х2 — с?Р = 0, и обратно. В силу некоторых дополнительных физических соображений следует считать, что вообще ^.2 ^.2^2 — ~2 J1TI /1 <-(\ если (х, t) и (х, i) отвечают одному и тому же событию в различных си- системах координат, связанных соотношением E). Условия A2) дают сле- следующие соотношения на коэффициенты а, C, у, S преобразования E): а2-сУ = 1, а/3 - с2у6 = 0, A3) в2-с262 = -с2. Если бы было с = 1, то вместо A3) мы имели бы 72 = 1, /3 7 О О а - 7 = 1, S - а' A4) откуда легко следует, что общее (с точностью до перемен знака в парах (а,Р), G)^)) решение системы A4) может быть дано в виде а = chip, у = ship, P = ship, 6 = chip, где <р — некоторый параметр. 9-4573
242 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Тогда общее решение системы A3) имеет вид {а /3\ _ ( chlP cehp\ О <v \ isho? chip I и преобразования E) конкретизируются: х = chtpx + cshtpt, - 1 A5) t = - sh tp x + ch tp t. с Это — преобразования Лоренца. Чтобы уяснить себе, каким образом определяется свободный пара- параметр tp, вспомним, что ось х движется со скоростью —V относительно оси х, т.е. точка х = 0 этой оси, наблюдаемая из системы (x,t), име- имеет скорость —V. Полагая в A5) х = 0, находим ее закон движения в системе (x,t): х = — cthipt. Таким образом, th<p=-. A6) Сопоставляя общий закон A0) преобразования скоростей с преобразо- преобразованиями Лоренца A5), получаем ~_ chtpV + cshtp 3 sh tp V + ch tp или, с учетом A6), с2 Формула A7) есть релятивистский закон сложения скоростей, кото- который при \vV\ <$С с2, т.е. при с —»• оо, переходит в классический, выра- выраженный формулой A1). Сами преобразования Лоренца A5) с учетом соотношения A6) мож- можно записать в следующей более естественной форме: х + vt х = t= '"? A8) - (!f)s
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 243 откуда видно, что при |г>| <С с, т.е. при с —> оо, они превращаются в классические преобразования Галилея D). 6. Производные высших порядков. Если функция f:E->~R дифференцируема в любой точке х € JE7, то на множестве Е возника- возникает новая функция /': Е —>• R, значение которой в точке х G Е равно производной f'(x) функции / в этой точке. Функция /': Е —>• Ш сама может иметь производную (/')': Е —»• М на Е, которая по отношению к исходной функции / называется второй производной от / и обозначается одним из символов f"(x) а если хотят явно указать переменную дифференцирования, то в пер- первом случае еще, например, пишут f'xX(x). Определение. По индукции, если определена производная /(п~х) (х) порядка п — 1 от /, то производная порядка п определяется формулой Для производной порядка п приняты обозначения f(x) 1 { h dxn ' Условились считать, что f^°\x) := f{x). Множество всех функций /: Е —> Ш, имеющих на Е непрерывные производные до порядка п включительно, будем обозначать символом С(п\Е, Ж), а когда это не ведет к недоразумению—более простыми символами С(п)(£) или Сп(Е,Ш) и Сп(Е) соответственно. В частности, С^°'(Е) = С(Е) в силу принятого соглашения, что /(°)(х) = f{x). Рассмотрим несколько примеров вычисления производных высших порядков. Примеры. 16. 17. 18. № ах ех sin ж Г(х) ах1па ех cos ж А*) •• ах\п2а .. ех — sin х /( ах sin(x ")(ж) In" a ех + птг/2)
244 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 19. cos х —sin ж —cos x ... cos(:r + птг/2) 20. A + х)а ail + xH1'1 а{а - 1)A + хH1'2 ... а(а - 1)... (а - п + 1)A )ап 21. ха аха~1 а(а - 1)ха~2 ... а(а - 1)... (а - п + +1)ха~п 22 loe Id d-^-x-1 d^-ж .(-l)^-!)! -n ■*■*• юЬа\х\ alnaX alnaX •" ° lna Ж 23. ln|x| x-1 (-l)x~2 ... (-l)n-1(n-l)\x-n Пример 24. Формула Лейбница. Пусть и(х) и г;(ж) —функции, имеющие на общем множестве Е производные до порядка п включи- включительно. Тогда для n-й производной от их произведения справедлива следующая формула Лейбница: 771=0 Формула Лейбница очень похожа на формулу бинома Ньютона и на самом деле с нею непосредственно связана. •* При п = 1 формула A9) совпадает с уже установленным правилом дифференцирования произведения. Если функции и, v имеют производные до порядка п+1 включитель- включительно, то, в предположении справедливости формулы A9) для порядка п, после дифференцирования ее левой и правой частей получаем п 77i=0 m=0 f^ + k-1 j u((n+l)-k)v(k) fc=l п+1 fc=0 Мы объединили слагаемые, содержащие одинаковые произведения производных от функций и, v, и воспользовались тем, что С* + С* = к Таким образом, по индукции установлена справедливость формулы Лейбница. ►
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 245 Пример 25. Еаш Рп(х) = со + cix+ ... +СпХп, то Рп@) = с0, Р'п{х) =ci + 2c2x + ...+nCnXn~l и P'n{G)=ci, 1*{х) = 2с2 + 3 • 2с3ж + ... + п{п - 1)спХп-2 и Р^'(О) - 2! с2, Р^(х) = 3 • 2с3 + ... + п(п - 1)(п - 2)спхп-3 и Рр)@) = 3! с3, P1[n)(a;)=n(n-l)(n-2)...2cn и ^@) = п!сп, Р^(ж) =0 при к >п. Тажим образом, полином Рп{х) можно записать в виде Рп(х) = р№ Пример 26. Используя формулу Лейбница и то обстоятельство, что производные от полинома, имеющие порядок выше его степени, тождественно равны нулю, можно найти n-ю производную функции f(x) = ж2 sin ж: /(п)(ж) = sinW x-x2 + Cln sin^) х ■ 2х + С2п sin(n-2) x ■ 2 = = ж2 sin (х + п—) + 2na;sin [ж+ (п — 1) —) + + (-п(п - 1) sin fa; + n-J ) — = (ж2 — n(n — 1)) sin [ж + п—) — 2пжсов (ж + ";г) • Пример 27. Пусть /(ж) = ап^ж. Найдем значения /(п)@) (п = = 1,2,...)- Поскольку /'(ж) = ^-^-, то A + ж2)/'(ж) = 1. 1 + х„ Применяя формулу Лейбница к последнему равенству, находим ре- рекуррентную формулу A + ж2)/(п+1)(ж) + 2пж/(")(ж) + п{п - ^/("-^(ж) = 0, из которой можно последовательно найти все Производные функ- функции f{x).
246 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Полагая х = О, получаем При п = 1 имеем /^2^@) = 0, поэтому вообще /^2п^@) = 0. Для производных нечетного порядка имеем = -2mBm - и, поскольку /'@) = 1, получаем Пример 28. Ускорение. Если х — x(t)—зависимость от времени координаты движущейся вдоль числовой оси материальной точки, то ^Р = x(t) есть скорость точки, а тогда -^^ = *\ ' = x(t) есть ее ускорение в момент t. Если x(t) = at + C, то x(t) = a, a x(t) = 0, т. е. ускорение в равно- равномерном движении равно нулю. Вскоре мы проверим, что если вторая производная функции равна нулю, то сама функция имеет вид at + /3. Таким образом, в равномерных движениях и только в них ускорение равно нулю. Но в том случае, если мы желаем, чтобы наблюдаемое из двух си- систем координат движущееся по инерции в пустом пространстве тело в обеих системах двигалось равномерно и прямолинейно, нужно, что- чтобы формулы перехода из одной инерциальной системы в другую были линейными. Именно по этой причине в примере 15 были выбраны ли- линейные формулы E) преобразования координат. Пример 29. Вторая производная простейшей неявно заданной функции. Пусть у = y(t) и х = x(t) —дважды дифференцируемые функции. Предположим, что функция х = x(t) имеет дифференциру- дифференцируемую обратную функцию t = t(x), тогда величину y(t) можно считать зависящей неявно от х, ибо у = y(t) = y(t(x)). Найдем вторую произ- производную уЧх в предположении, что x'(t) ф 0. По правилу дифференцирования такой функции, рассмотренному в пункте 5, имеем
§ 2. ОСНОВНЫЕ ПРАВИЛА ДИФФЕРЕНЦИРОВАНИЯ 247 поэтому » _ ( 'у _ Ухх-(Ух)х- ^ ж д (а.K Заметим, что явные выражения всех участвующих здесь функций, в том числе и у"х, зависят от t, но они дают возможность получить значение у"х в конкретной точке х после подстановки вместо t значения t = t(x), отвечающего заданному значению х. Например, если у = е*, х = 1п£, то y± t* " у" - Ухх~ у х\ l/t Ухх~ x't ~ l/t Мы специально взяли простой пример, в котором можно явно вы- выразить t через х, t = ех, и, подставив t = ех в y(t) = e*, найти явную зависимость у = ее* от х. Дифференцируя последнюю функцию, можно проверить правильность полученных выше результатов. Ясно, что так можно искать производные любого порядка, последо- последовательно применяя формулу >) = Ухп xt Задачи и упражнения 1. Пусть ао, ai,...,ап —заданные вещественные числа. Укажите много- многочлен Рп{х) степени п, который в фиксированной точке xq б Ш имеет произ- производные Pik)(x0) =ак,к = 0,1,...,п. 2. Вычислите f'(x), если a) f(x) = exp(~i) при ar?tUi О при х — О; b)/(*)=Jfsin* при*^' I О при х = О. c) Проверьте, что функция из задачи а) бесконечно дифференцируема на R, причем /(п>@) = 0. d) Покажите, что производная функции из задачи Ь) определена на К, но не является непрерывной функцией на К. e) Покажите, что функция I 0 бесконечно дифференцируема на Ш.
248 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 3. Пусть / 6 С(°°)(М). Покажите, что при х ф О ^-Ш-(-.)■£ 4. Пусть / — дифференцируемая на Ж функция. Покажите, что a) если /—четная, то /'—нечетная функция; b) если / — нечетная, то /' — четная функция; c) (/' нечетна) •£> (/ четна). 5. Покажите, что a) функция f(x) дифференцируема в точке xq в том и только в том случае, когда f(x) — f(xo) = (р(х)(х — хо), где ip(x) —функция, непрерывная в хо (и в таком случае <р(хо) = f'(x0)); b) если f(x) - f(x0) = Ф)(х - х0) и ц> € С^-^{Щх0)), где U(x0)- окрестность точки хо, то функция f(x) имеет в точке х$ производную /^(жо) порядка п. 6. Приведите пример, показывающий, что в теореме 3 условие непрерыв- непрерывности /-1 в точке у о не является излишним. 7. а) Два тела с массами яи и шг соответственно перемещаются в прост- пространстве только под действием сил взаимного притяжения. Используя законы Ньютона (формулы A) и B) из § 1), проверьте, что величина где Vi и V2 — скорости тел, а ) расстояние между ними, не меняется при таком движении. b) Дайте физическую интерпретацию величины Е = К + U и ее составля- составляющих. c) Распространите результат на случай движения п тел. § 3. Основные теоремы дифференциального исчисления 1. Лемма Ферма и теорема Ролля Определение 1. Точка xq € Е С М называется точкой локаль- локального максимума (минимума), а значение функции в ней — локальным максимумом (минимумом) функции f:E—tM, если существует ок- окрестность Ue(xq) точки xq в множестве Е такая, что в любой точке х € Ue(xq) имеем f(x) < f(xo) (соответственно, f(x) ^ f(xo))- о Определение 2. Если в любой точке х € Ue(xq) \ %о — Ue(xq) имеет место строгое неравенство f(x) < f(xo) (f(x) > f(xo)), то точ-
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 249 ка xq € Е называется точкой строгого локального максимума (мини- (минимума), а значение функции в ней — строгим локальным максимумом (минимумом) функции f-.E—^-Ш. Определение 3. Точки локального максимума и минимума назы- называются точками локального экстремума, а значения функции в них — локальными экстремумами функции. Пример 1. Пусть х , если — 1 < х < 2, 4, если 2 ^ х -10 12 Рис. 20. (рис.20). Для этой функции х — — 1 — точка строгого локального макси- максимума; х = 0 — точка строгого локального мини- минимума; х = 2 — точка локального максимума; х > 2 — точки экстремума, являющиеся одновременно точками и локального максимума, и локального минимума, поскольку здесь функ- функция локально постоянна. Пример 2. Пусть f(x) — sin |- на множестве Е = Ш \ 0. Точки х = (;г + 2&7Г 1 , к € Z, являются точками строгого ло- локального максимума, а точки х = ( — ^ + 2kir) , к € Z, — точками строгого локального минимума для f(x) (см. рис. 12). Определение 4. Точку xq € Е экстремума функции /:Е-+Ш будем называть точкой внутреннего экстремума, если xq является пре- предельной точкой как для множества Е- = {х € Е \ х < хо}, так и для множества Е+ = {х € Е \ х > В примере 2 все точки экстремума являются точками внутреннего экстремума, а в примере 1 точка х = — 1 не является точкой внутрен- внутреннего экстремума. Лемма 1 (Ферма). Если функция f:E-+M. дифференцируема в точке внутреннего экстремума xq e E, то ее производная в этой точке равна нулю: /'(xq) = 0.
250 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ < По определению дифференцируемое™ функции в точке xq f{x0 + h)~ f{x0) = f'{xQ)h + a(xQ; h)h, где a{xQ\ h) -> 0 при h -> 0, xq + h € E. Перепишем это соотношение в виде /(so + h) - f(x0) = [f'(xo) + a(x0; h)] h. A) Поскольку xq — точка экстремума, то левая часть равенства A) ли- либо неотрицательна, либо неположительна одновременно для всех доста- достаточно близких к нулю значений h таких, что xq + h € Е. Если бы было f'{xo) ф 0, то при h достаточно близких к нулю вели- величина f'(xo)+a(xo;h) имела бы тот же знак, чтои/'(а;о),ибоа(жо;/1) -> О при h ->• 0, xq + h € Е. Что же касается самого значения h, то оно может быть как поло- положительным, так и отрицательным, коль скоро х$ — точка внутреннего экстремума. Таким образом, предположив, что f'{xo) ф 0, мы получаем, что пра- правая часть A) меняет знак при изменении знака h (если h достаточно близко к нулю), в то время как левая часть A) не может менять зна- знака (если h достаточно близко к нулю). Это противоречие завершает доказательство. ► Замечания к лемме Ферма. 1° Лемма Ферма дает, таким обра- образом, необходимое условие внутреннего экстремума дифференцируемой функции. Для невнутренних экстремумов (как точка х = — 1 в приме- примере 1) утверждение о том, что /'(жо) = 0, вообще говоря, неверно. 2° Геометрически лемма вполне очевидна, ибо она утверждает, что в точке экстремума дифференцируемой функции касательная к ее гра- графику горизонтальна (ведь /'(жо) есть тангенс угла наклона касательной к оси Ох). 3° Физически лемма означает, что при движении по прямой в мо- момент начала возврата (экстремум!) скорость равна нулю. Из доказанной леммы и теоремы о максимуме (минимуме) функции, непрерывной на отрезке, вытекает следующее
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 251 Утверждение 1 (теорема Ролля1)). Если функция f:[a,b) -> Ш непрерывна на отрезке [а, Ь], дифференцируема в интервале ]а, Ь[ и f(a) — f(b), то найдется точка £ € ]а, Ь[ такая, что /'(£) = 0. < Поскольку функция / непрерывна на отрезке [а,Ь], то найдутся точки хт,хм €Е [°)Ь], в которых она принимает соответственно ми- минимальное и максимальное из своих значений на этом отрезке. Если Д^т) — /(жм), то функция постоянна на [а, Ь], и поскольку в этом слу- случае f'(x) = 0, то утверждение, очевидно, выполнено. Если же f(xm) < < Цхм), то, поскольку /(а) = /(Ь), одна из точек хт, хм обязана лежать в интервале )а, Ь[. Ее мы и обозначим через £. По лемме Ферма 2. Теоремы Лагранжа и Коши о конечном приращении. Сле- Следующее утверждение является одним из наиболее часто используемых и важных средств исследования числовых функций. Теорема 1 (теорема Лагранжа о конечном приращении). Если функция f:[a,b) —> Ш непрерывна на отрезке [а,Ь] и дифференцируе- дифференцируема в интервале ]а, Ь[, то найдется точка £ G ]а, Ь[ такая, что B) Для доказательства рассмотрим вспомогательную функцию которая, очевидно, непрерывна на отрезке [а,Ь], дифференцируема в интервале ]а,Ь[ и на его концах принимает равные значения: F(a) = = F(b) = f(a). Применяя к F(x) теорему Ролля, найдем точку £ G ]а, Ь[, в которой Замечания к теореме Лагранхса. 1° Геометрически теорема Лагранжа означает (рис.21), что в некоторой точке (£,/(£)), где £ G G ]а, Ь[, касательная к графику функции будет параллельна хорде, со- соединяющей точки (а, /(а)), (b,f(b)), ибо угловой коэффициент послед- последней равен :'М. Ролль A652-1719) —французский математик.
252 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 2° Если х интерпретировать как время, a f(b) — f(a) — как величину перемещения за время Ь — а частицы, движущейся вдоль прямой, то те- теорема Лагранжа означает, что скорость /'(ж) частицы в некоторый момент £ € )а, Ь[ такова, что если бы в течение всего промежутка време- времени [а, Ь) частица двигалась с постоян- постоянной скоростью /'(£), то она смести- сместилась бы на ту же величину f{b)—f(a). Величину /'(£) естественно считать средней скоростью движения в про- промежутке [а, Ь]. 3° Отметим, однако, что при дви- движении не по прямой средней скоро- скорости в смысле замечания 2° может не быть. Действительно, пусть, напри- например, частица движется по окружности единичного радиуса с постоян- постоянной угловой скоростью ш = 1. Закон ее движения, как мы знаем, можно записать в виде r(t) = (cosi, sini). Рис. 21. Тогда r(t) = v(t) = (— sint, cost) и |w| = v sin21 + cos21 = 1. В моменты t = 0 и t = 2тг частица находится в одной и той же точке плоскости г@) = гBтг) = A,0), и равенство гBтг)-г@) = «(£)Bтг-0) означало бы, что v(£) = 0, но это невозможно. Однако мы сознаем, что зависимость между перемещением за не- некоторый промежуток времени и скоростью движения все же имеется. Она состоит в том, что даже вся длина L пройденного пути не может превышать максимальной по величине скорости, умноженной на время в пути. Сказанное можно записать в следующей более точной форме: |г(Ь)-г(о)|< sup |f(t)||6-o|. te]a,b[ C)
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 253 Как будет в свое время показано, это естественное неравенство дей- действительно всегда справедливо. Его тоже называют теоремой Лагран- жа о конечном приращении, а формулу B), справедливую только для числовых функций, часто называют теоремой Лагранжа о среднем зна- значении (роль среднего в данном случае играет как величина /'(£) ско- скорости, так и точка £, лежащая между а и Ь). 4° Теорема Лагранжа важна тем, что она связывает приращение функции на конечном отрезке с производной функции на этом отрезке. До сих пор мы не имели такой теоремы о конечном приращении и харак- характеризовали только локальное (бесконечно малое) приращение функции через производную или дифференциал в фиксированной точке. Следствия теоремы Лагранжа Следствие 1 (признак монотонности функции). Если в любой точке некоторого интервала производная функции неотрицательна (положительна), то функция не убывает (возрастает) на этом ин- интервале. < Действительно, если х\, Х2— две точки нашего интервала и х\ < < Х2, т. е. Х2 — х\ > 0, то по формуле B) f{x2)-f(xi) = f'(Z)(x2-xi), где Ж1<£<ж2, и, таким образом, знак разности, стоящей в левой части равенства, совпадает со знаком /'(£). ► Разумеется, аналогичное утверждение можно высказать о невозра- невозрастании (убывании) функции с неположительной (отрицательной) про- производной. Замечание. На основании теоремы об обратной функции и след- следствия 1, в частности, можно заключить, что если на каком-то проме- промежутке / числовая функция f(x) имеет положительную или отрицатель- отрицательную производную, то функция / непрерывна на I, монотонна на I, имеет обратную функцию f~l, определенную на промежутке V = /(/) и дифференцируемую на нем. Следствие 2 (критерий постоянства функции). Непрерывная на отрезке [а, Ь] функция постоянна на нем тогда и только тогда, когда ее производная равна нулю в любой точке отрезка [а, Ь) (или хотя бы интервала ]а,Ь[).
254 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ < Интерес представляет только доказательство того факта, что если f'(x) = 0 на )а, Ь[, то для любых х\, х^ G [а, Ь] имеет место равенство f{x\) = /(жг). Но это вытекает из теоремы Лагранжа, по которой ибо £ лежит между х\ и Х2, т.е. ^ Е ]а,Ь[ и /'(£) = 0. ► Замечание. Отсюда, очевидно, можно сделать следующий (как мы увидим, очень важный для интегрального исчисления) вывод: ес- если производные F[(x), F^ix) двух функций Fi(x), F2(x) совпадают на некотором промежутке, т. е. F[{x) = F^x), то на этом промежутке разность F\(x) — ^г(ж) есть постоянная функция. Полезным обобщением теоремы Лагранжа, которое тоже основано на теореме Ролля, является следующее Утверждение 2 (теорема Коши о конечном приращении). Пусть х = x(t) и у — y(t) —функции, непрерывные на отрезке [а,C] и диффе- дифференцируемые в интервале ]а, /?[. Тогда найдется точка г G ]а, C[ такая, что Если к тому же x'(t) ф 0 при любом t G )а,/3[, то х(а) ф х(/3) и справедливо равенство х{13) - х(а) х'(т)' 1 ' < Функция F(t) = x(t)(y(C) — у{а)) — y(t)(x(/3) — х(а)) удовлетворя- удовлетворяет условиям теоремы Ролля на отрезке [а, /3], поэтому найдется точка т G ]а,/3[, в которой F'(t) = 0, что равносильно доказываемому равен- равенству. Чтобы получить из него соотношение D), остается заметить, что если x'(t) ф 0 на ]а,C[, то по той же теореме Ролля х(а) ф х(C). ► Замечания к теореме Коши. 1° Если пару функций x(t), y(t) рассматривать как закон движения частицы, то (x'(t),y'(t)) есть век- вектор ее скорости в момент t, а {х@) — х(а), у{0) — у(а)) есть вектор ее смещения за промежуток времени [а,/?], и теорема утверждает, что в некоторый момент т 6 [а, 0] эти векторы коллинеарны. Однако этот
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 255 факт, относящийся к движению в плоскости, является таким же при- приятным исключением, каким является теорема о средней скорости в слу- случае движения по прямой. В самом деле, представьте себе частицу, рав- равномерно поднимающуюся по винтовой линии. Ее скорость составляет постоянный ненулевой угол с вертикалью, в то время как вектор сме- смещения может быть и вертикальным (один виток). 2° Формулу Лагранжа можно получить из формулы Коши, если в последней положить х = x(t) =t, y(t) — у(х) = f(x), a = а, 0 = b. 3. Формула Тейлора. Из той части дифференциального исчисле- исчисления, которая уже изложена к настоящему моменту, могло возникнуть верное представление о том, что чем больше производных (включая производную нулевого порядка) совпадает у двух функций в некоторой точке, тем лучше эти функции аппроксимируют друг друга в окрестно- окрестности этой точки. Мы в основном интересовались и сейчас будем интере- интересоваться приближением функции в окрестности некоторой точки с по- помощью многочлена Рп (х) = Рп(хо;х) =co + ci(x — xo) + ...+cn(x — xo)n. Нам известно (см. пример 25 из §2, п. 6), что алгебраический полином можно представить в виде Рп(х) = Рп т.е. С£ = "" )х°' (к = 0,1,...,га). В этом легко убедиться непосред- непосредственно. Таким образом, если нам будет дана функция f(x), имеющая в точ- точке хо все производные до порядка га включительно, то мы можем не- немедленно выписать полином ^М 1^1(х-Хо)п, E) (хХо) + ... + производные которого до порядка га включительно в точке хо совпада- совпадают с производными соответствующего порядка функции f(x) в точке хо. Определение 5. Алгебраический полином, заданный соотноше- соотношением E), называется полиномом Тейлора1^ порядка га функции f(x) в точке xq. . Тейлор A685 -1731) — английский математик.
256 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Нас будет интересовать величина f(x) -Рп(х0;х) =гп(х0;х) F) уклонения полинома Рп(х) от функции /(ж), называемая часто остат- остатком, точнее, п-м остатком или п-м остаточным членом формулы Тей- Тейлора: G) Само по себе равенство G), конечно, не представляет интереса, если о функции гп(хо;х) не известно ничего, кроме ее определения F). Сейчас мы воспользуемся довольно искусственным приемом для по- получения информации об остаточном члене. Более естественный путь к этому даст интегральное исчисление. Теорема 2. Если на отрезке с концами xq, x функция f непрерыв- непрерывна вместе с первыми п своими производными, а во внутренних точках этого отрезка она имеет производную порядка п + 1, то при любой функции <р, непрерывной на этом отрезке и имеющей отличную от ну- нуля производную в его внутренних точках, найдется точка £, лежащая между xq и х, такая, что (8) На отрезке / с концами xq, x рассмотрим вспомогательную функ- функцию F(t) = f(x)-Pn{t;x) от аргумента t. Запишем определение F(t) подробнее: F{t) = fix) - (9) Из определения функции F(t) и условий теоремы видно, что F не- непрерывна на отрезке / и дифференцируема в его внутренних точках,
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 257 причем /(«+!)(*) 2! n! (x-t)n n\ (x - t)n. Применяя к паре функций F(t), ip(t) на отрезке / теорему Коши (см. соотношение D)), находим точку £ между хо и х, в которой F(x)-F(xQ) _F'({j) Подставляя сюда выражение для F'(£) и замечая из сопоставления формул F), (9) и A0), что F(x) - F(x0) = 0 - F(x0) = -rn(x0;x), получаем формулу (8). ► Полагая в (8) tp(t) = х — t, получаем Следствие 1 (формула Коши остаточного члена). A1) Особенно изящная формула получается, если положить в соотноше- соотношении (8) ip(t) = (x-t)n+1: Следствие 2 (формула Лагранжа остаточного члена). A2) Отметим, что формулу G) Тейлора при хо = 0 часто называют формулой Маклоренах\ Рассмотрим примеры. Пример 3. Для функции f(x) — ех при хо = 0 формула Тейлора имеет вид 1 1 _ 1 A3) ех = 1 + -х + -х2 + ... + —хп + г„@; х), . Маклорен A698-1746) — английский математик.
258 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ и на основании равенства A2) можно считать, что где |£| < |ж|. Таким образом, 1 I 1П+1 Но при любом фиксированном а; € К, если п -> оо, величина J I ,,, как нам известно (см. пример 12 из гл. III, § 1, п. ЗЬ), стремится к нулю. Значит, из оценки A4) и определения суммы ряда вытекает, что для ХЕШ e* = l + i* + i*2 + ... + !*" + ... A5) Пример 4. Аналогично получаем разложение функции ах для лю- любого а, 0 < а, аф\: In а 1п2 а о In" а Пример 5. Пусть f(x) = sin ж. Нам известно (см. пример 18 из §2, п. 6), что /(п)(ж) = sin (х + тги), n € N, поэтому из формулы A2) Лагранжа при хо = 0 и любом ieR находим rn@; х) = j^-jy sin (f + |(n + 1)) хп+\ A6) откуда следует, что для любого фиксированного значения х Е М вели- величина гп@; х) стремится к нулю при п —> оо. Таким образом, при любом х Е Ш справедливо разложение Пример 6. Аналогично, для функции f(x) = cos ж получаем rn@; х) = ^-^ cos (f + |(n + 1)) xn+1 A8)
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 259 ix2 + ix4-... + ^x2" + ... A9) Пример 7. Поскольку sh' ж — ch ж, ch' x = sh x, для функции f(x) = = shz при хо = 0 из формулы A2) получаем где </?(£) = sh£, если п четно, и <£>(£) = ch£, если п нечетно. В любом случае |v?(£)l ^ niax{|shx|, |chx|}, ибо |^| < \х\. Значит, для любого фиксированного значения х Е М выполняется гп@;х) —> 0 при п —> оо, и мы получаем разложение справедливое для любого ж € Ж. Пример 8. Аналогично получаем разложение справедливое для любого значения ж € Ж. Пример 9. Для функции /(ж) = 1пA + х) имеем } [п- 1).^ ПОЭТОМу формула Тейлора G) при xq = 0 для этой х) A+х) функции имеет вид 1пA + х) = х - \х2 + \xz - ... + (~1)П 1хп + гп@; ж). B2) На сей раз представим гп@;х) по формуле Копш A1): или гп@;х) = (-1Гх(^|)П, B3) где точка ^ лежит между 0 и ж.
260 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если |ж| < 1, то из условия, что £ лежит между 0 и ж, следует, что ■^ < Tqf-^ «1-T^W = III- <24> Таким образом, при |ж| < 1 |гп@-ж)| < ЫП+1 B5) и, следовательно, при |ж| < 1 справедливо разложение 11 ( Л\п~^ ЛР /Т.^ _(_ Гр** 1 V ' /Т." Л_ 17П1 2 6 п Заметим, что вне отрезка |ж| ^ 1 ряд, стоящий справа в B6), всюду расходится, так как его общий член не стремится к нулю, если \х\ > 1. Пример 10. Если /(ж) = A+ж)а, где а € К, то /(п)(ж) = а(а-1)х х ... х (а — п + 1)A + х)а~п, поэтому формула Тейлора G) при хо = О для этой функции имеет вид rn@-,x). B7) Используя формулу Коши A1), находим г„@;х) = а(° " Ц^ ("-"Wfl'-^fr-0"*, B8) где ^ лежит между 0 и ж. Если |а;| < 1, то, используя оценку B4), имеем |г„@;х)|< «(^-^...^-^а + еГ-ЧхГ1. B9) При увеличении п на единицу правая часть неравенства B9) умножает- умножается на A ^Чг 1 х . Но поскольку |ж| < 1, то при достаточно больших значениях п, независимо от значения а, будем иметь A ^—г ) х < < q < 1, если \х\ < q < 1.
§3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 261 Отсюда следует, что при любом а Е М и любом х из интервала |ж| < 1 выполнено гп@;х) -> 0, когда п -> оо; поэтому на интервале \х\ < 1 справедливо полученное Ньютоном разложение (бином Ньютона) ^^^x4... + a{a-1)---Ja-n + 1)x^ + ... C0) Заметим, что, как следует из признака Даламбера (см. гл. III, § 1, п. 4Ь), при |ж| > 1 ряд C0) вообще расходится, если только а ^ N. Рассмотрим теперь особо случай, когда а = п Е N. В этом случае функция f(x) = A + х)а = A + х)п является поли- полиномом степени п, и поэтому все ее производные порядка выше чем п равны нулю. Таким образом, формула Тейлора G) и, например, форму- формула Лагранжа A2) позволяют записать следующее равенство: ._ п п(п — 1) п п(п — 1) ■... ■ 1 „ . . A + х)п = 1 + -х+ у 2, V + ... + ^ ± хп, C1) представляющее собой известную из школы формулу бинома Ньютона для натурального показателя: A + х)п = 1 + Clx + Clx2 + ... + С%хп. Итак, мы определили формулу Тейлора G) и получили вид (8), A1), A2) остаточного члена формулы Тейлора. Мы получили соотношения A4), A6), A8), B5), B9), позволяющие оценивать погрешность вычи- вычисления важных элементарных функций по формуле Тейлора. Наконец, мы получили разложения этих функций в степенные ряды. Определение 6. Если функция f(x) имеет в точке xq производ- производные любого порядка п Е N, то ряд f(x0) + y/(*o)(x -хо) + ... + ^/п)(хо)(х - хо)п + ... называется рядом Тейлора функции / в точке xq. Не следует думать, что ряд Тейлора каждой бесконечно дифферен- дифференцируемой функции сходится в некоторой окрестности точки xq, ибо для любой последовательности со, с\,..., с„,... чисел можно построить (это не совсем просто) функцию f(x) такую, что f(n\xo) = Сп, п Е N.
262 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Не следует также думать, что если ряд Тейлора сходится, то он обя- обязательно сходится к породившей его функции. Сходимость ряда Тейло- Тейлора к породившей его функции имеет место только для так называемых аналитических функций. Вот пример Коши неаналитической функции: Г е/*2, если хфО, ^ 0, если х — 0. Исходя из определения производной и того, что xke~llx —> 0 при х -> 0 независимо от значения к (см. пример 30 из §2 гл. III), можно проверить, что /(п)@) = 0 для п = 0,1,2,... Таким образом, ряд Тей- Тейлора в данном случае состоит только из нулевых членов и его сумма тождественно равна нулю, в то время как f(x) ф 0 при х ф 0. В заключение остановимся на локальном варианте формулы Тей- Тейлора. Вернемся снова к задаче о локальном приближении функции /: Е -> -> R полиномом, которую мы начали обсуждать в § 1, п. 3. Мы хотим подобрать полином Рп(хо; х) = со + с\(х — xq) + ... + сп(х — хо)п так, чтобы иметь f(x) = Рп(хо;х) + о((х -хо)п) при х -> х0, х Е Е, или, подробнее, /(ж) = со + ci(x - х0) + ... + Сп(х - хо)п + о((х - zo)n) при х ->■ xq, х ЕЕ. C2) Сформулируем в явном виде по существу уже доказанное Утверждение 3. Если удовлетворяющий условию C2) полином Рп(хо; х) = со + с\(х — хо) + ... + сп{х — хо)п существует, то он един- единственный. •^ Действительно, из условия C2) последовательно и вполне одно- однозначно (в силу единственности предела) находятся коэффициенты по- полинома
§3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 263 со = lim f(x), ЕЭх-txo /(ж)-со ci = lim -^ , Еэх-txo X — Хо = hm ;г. ► {X — Хо)п Докажем теперь следующее Утверждение 4 (локальная формула Тейлора). Пусть Е — отре- отрезок с концом хо Е М. Если функция f: Е -+ Ш имеет в точке xq все производные f'(xo),..., f(n\xo) до порядка п включительно, то спра- справедливо следующее представление: (*) = /(-о) о((х-х0)п) при х -> хо, х Е Е. C3) Таким образом, задачу локального приближения дифференцируе- дифференцируемой функции решает полином Тейлора соответствующего порядка. Поскольку полином Тейлора Рп(хо;х) строится из условия совпа- совпадения всех его производных до порядка п включительно с производ- производными соответствующего порядка функции / в точке хо, то f^k'(xo) — - Рп(хо;хо) = 0 (к — 0,1,... ,п) и справедливость формулы C3) устанавливает следующая Лемма 2. Если функция ip: Е -> R, определенная на отрезке Е с концом хо, такова, что она имеет в точке хо все производные до порядка п включительно и ц>(хо) = <р'(хо) = ... = ^п\хо) = 0, то <р(х) = о((х — хо)п) при х —> хо, х Е Е. 4 При п = 1 утверждение вытекает из определения дифференциру- емости функции ip в точке хо, в силу которого <р(х) = <р(хо) + <р'(хо)(х - хо) + о(х - хо) при х -> хо, х е Е, и, поскольку <р(хо) = (р'(хо) = 0, имеем <р(х) = о(х — хо) при х -> хо, х Е Е.
264 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Предположим, что утверждение доказано для порядков п = к — 1 ^ ^ 1. Покажем, что тогда оно справедливо также для порядка п — к ^ 2. Заметим предварительно, что поскольку X — то существование <р '(хо) предполагает, что функция ip(k~^~'(x) опре- определена на Е хотя бы вблизи точки xq. Уменьшая, если нужно, отре- отрезок Е, можно заранее считать, что функции у?(ж), <р'{х),... , ^"^(s), где к ^ 2, определены на всем отрезке Е с концом xq. Поскольку к ^ 2, то функция у (ж) имеет на Е производную ip' (x) и по условию Таким образом, по предположению индукции </р'(ж) = о ((х -жо)*) при х ^ хо, х е Е. Тогда, используя теорему Лагранжа, получаем Ч?(х) = (р(х) - ч?(х0) = <р'(£){х - хо) = *1 где £ — точка, лежащая между жо и ж, т. е. |£ — Жо| < |ж — Жо|, а а(£) ->0 при £ —> £J, £ Е Е. Значит, при ж —> Xq, x G Е одновременно будем иметь £->£?, £, е Е и а(£) -> 0, и поскольку \ip{x)\ < |а(£)||ж - жо!*^ - жо|, то проверено, что (р(х) = о ((ж — жо) ) при ж —> Жо, х £ Е. Таким образом, утверждение леммы 2 проверено принципом мате- математической индукции. ► Соотношение C3) называется локальной формулой Тейлора, по- поскольку указанный в нем вид остаточного члена (так называемая форма Пвано) г„(жо;ж) = о((ж-жоГ) C4)
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 265 позволяет делать заключения только об асимптотическом характере связи полинома Тейлора и функции при х ->■ xq, х € Е. Формула C3) удобна, таким образом, при вычислении пределов и описании асимптотики функции при х —> хо, х € Е, но она не может служить для приближенного вычисления значений функции до тех пор, пока нет фактической оценки величины гп(хо; х) = о((х — хо)п). Подведем итоги. Мы определили полином Тейлора написали формулу Тейлора f(x) = f(x0) + ^-(х-х0) + ... + ^-^-(х -хоГ +гп(х0;х) и получили следующие ее важнейшие конкретизации: Если f имеет производную порядка п + 1 в интервале с концами хо,х, то f(x) = ^ ^ +Ы^A-1о) •C5) где £ — точка, лежащая между х$ и х. Если f имеет в точке х$ все производные до порядка п ^ 1 включи- включительно, то ^ ^ -x0)n). C6) Соотношение C5), называемое формулой Тейлора с остаточным членом в форме Лагранжа, очевидно, является обобщением теоремы Лагранжа, в которую оно превращается при п = 0. Соотношение C6), называемое формулой Тейлора с остаточным членом в форме Пеано, очевидно, является обобщением определения дифференцируемости функции в точке, в которое оно переходит при п=1.
266 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Заметим, что формула C5) практически всегда более содержатель- содержательна, ибо, с одной стороны, как мы видели, она позволяет оценивать абсо- абсолютную величину остаточного члена, а с другой, например, при огра- ограниченности f(n+1\x) в окрестности хо из нее вытекает также асимпто- асимптотическая формула f{x) = /Ы + 1! П\ + О {(х - xo)n+1). C7) Так что для бесконечно дифференцируемых функций, с которыми в подавляющем большинстве случаев имеет дело классический анализ, формула C5) содержит в себе локальную формулу C6). В частности, на основании формулы C7) и разобранных выше при- примеров 3-10 можно теперь выписать следующую таблицу асимптотиче- асимптотических формул при х —> 0: cos, = 1 - I*» + i*4 - ... + Ь|> + О (* -x yx + 5]x •••+B 1),^ +U[? ) 2 + x+r п + 0{xn+1). Рассмотрим теперь еще некоторые примеры использования форму- формулы Тейлора. Пример 11. Напишем полином, позволяющий вычислять значе- значения функции sin ж на отрезке — 1 ^ х ^ 1 с абсолютной погрешностью, не превышающей 10~3.
§3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 267 В качестве такого многочлена можно взять тейлоровский многочлен подходящей степени, получаемый разложением функции sin ж в окрест- окрестности точки хо = 0. Поскольку sin* = х - |ж3 + |ж5 - ... + J^y*2n+l + 0 • *2"+2 + rWO; ж), где по формуле Лагранжа Bn + 3)! то при |ж| ^ 1 1 '" "* Bп + 3)Г Но ^ sy < Ю~3 при п ^ 2. Таким образом, с нужной точностью на отрезке |ж| ^ 1 имеем sin ж и ж — ^ж3 + щХ5. Пример 12. Покажем, что tgrr = х+^х3+о(х3) при ж —>■ 0. Имеем О tg' ж = cos~2 ж, tg" ж = 2 cos~3 ж sin ж, tg'" ж = 6 cos ж sin2 ж + 2 cos ж. Таким образом, tgO = 0, tg' 0 = 1, tg" 0 = 0, tg'" 0 = 2 и написанное соотношение следует из локальной формулы Тейлора. оо Пример 13. Пусть а > 0. Исследуем сходимость ряда 22 In cos -^-. При а > 0 — —> 0, когда п —> оо. Оценим порядок члена ряда 1 , Л 1 1 f 1 \\ 11 /М In cos— = lnfl--_ + Of-^] 1= +of 1. /6 \ **1 Iv \ / Ь II £i It \ III I Таким образом, мы имеем знакопостоянный ряд, члены которого эквивалентны членам ряда Y1 ~2а- Поскольку последний ряд сходится только при а > i то в указанной области а > 0 исходный ряд сходится лишь при а > у (см. задачу 16Ь)).
268 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 14. Покажем, что In cos ж = —\х2 — j^x4 — -^ж6 + О (ж8) при х —> 0. На сей раз, вместо того чтобы вычислять подряд шесть производ- производных, мы воспользуемся уже известными разложениями cos х при х -ь О и 1пA + и) при и ->■ 0: In cos х = In A - -,х2 + -,хА - ^х6 + О(х8) ) = ln(l + и) = \ 2! 4! о! / = и - \и> + 1«3 + О(«4) = (~ix2 + У* - ix6 + О(х D2^б + °(8)) + ( °О{ 5 (W12^1 + °(l)) + 5 Пример 15. Найдем значения первых шести производных функ- функции In cos x при х = 0. Имеем (lncos)'a; = ~^£, и потому ясно, что в нуле данная функция имеет производные любого порядка, ибо cos 0 ф 0. Мы не станем ис- искать функциональные выражения этих производных, а воспользуемся единственностью полинома Тейлора и результатом предыдущего при- примера. Если f(x) — со + с\х + ... +СпХп + о(хп) при х ->■ 0, то Таким образом, в нашем случае получаем (lncos)@) = 0, (lncos)'(O) = 0, (lncos)"@) = ~ ■ 2!, (lncos)C)@) = 0, (lncos)D)@) = -~ ■ 4!, (In cos)E) @) = 0, (Incos)F> @) = -~ ■ 6!.
§3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 269 Пример 16. Пусть/(ж)—бесконечно дифференцируемая в точке xq = 0 функция, и пусть известно разложение f'(x) = с'0 + с[х + ...+ с'пхп + О (хп+1) ее производной в окрестности нуля. Тогда из единственности тейлоров- тейлоровского разложения имеем поэтому /(fe+1)@) = k\ dk. Таким образом, для самой функции f(x) име- имеем разложение fix) - /'(О') + — x + —±x2 + + n xn+l + О или, после упрощений, f(x) = f(Q) + -^x4--^r2 + I n rn+1 I О (т Пример 17. Найдем тейлоровское разложение функции f(x) = = arctg x в нуле. Поскольку/'(ж) = —i-j = A + ж2) = 1-ж2 + ж4-... + (-1)пж2п + + 0 (ж2п+2), то по соображениям, изложенным в предыдущем примере, /(*) = /@) + \х - \х3 + \х5 - ... + £^U2n+1 + О (ж2 1 о 5 zn + 1 ,2„+3) ^ т.е. ап*ёж = х - \х* + \х" - ... + f^-z2n+1 + О (ж2"+3). Пример 18. Аналогично, раскладывая по формуле Тейлора функ- функцию агсзт'ж = A — ж2)/2 в окрестности нуля, последовательно нахо- находим -3-
270 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 0{х2п+2) 1-3 . Bп-1)!! 5 + + li arcsmz = х х + Ж + ... + или, после элементарных преобразований, 1 з [З!!]2 s [Bп-1)!!]2 2п+1 _, 2п,3ч arcsinx = z + -z3 + 1-^-х5 + ...+ {2п + 1)! x2n+l + О {х2п+3). Здесь Bп - 1)!!:= 1 ■ 3 ■... • Bп - 1), Bп)!!:= 2 • 4 •... • Bп). Пример 19. Воспользуемся результатами примеров 5, 12, 17, 18 и найдем lim :— = hm o tg x - arcsin x й) = lim -f-3 ^- = -1. 6 Задачи и упражнения 1. Подберите числа о и b так, чтобы функция /(ж) = cos ж + ах9 при 1 + Ьх х ->• 0 была бесконечно малой возможно более высокого порядка. 2. Найдите lim x U- — ( Т. ) • 3. Напишите полином Тейлора функции е1 в нуле, который позволял бы вычислять значения ех на отрезке — 1 ^ х ^ 2 с точностью до 10~3. 4. Пусть /—бесконечно дифференцируемая в нуле функция. Покажите, что a) если / четная, то ее ряд Тейлора в нуле содержит только четные сте- степени X] b) если / нечетная, то ее ряд Тейлора в нуле содержит только нечетные степени х. 5. Покажите, что если / 6 <7(°°)[-1,1], /<п)@) = 0 для п = 0,1,2,... и существует число С такое, что sup |/("'(x)| ^ n\C, n G N, то / = 0 на [-1,1].
§3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 271 6. Пусть/еС(п)(]-1,1[) и sup |/(х)| <1. Пусть тк{1) = inf |/W(x)|, —1<ж<1 х^1 где / — промежуток, содержащийся в интервале ]—1,1[. Покажите, что a) если / разбит на три последовательных промежутка /1( h, h и ц — длина /г, то mk(I) ^ - (mk-i(h) + mk-i(h)); b) если / имеет длину Л, то с) существует такое число ап, зависящее только от п, что если |/'@)| ^ ап, то уравнение /("'(ж) = 0 имеет в ] —1,1[ по крайней мере п — 1 различных корней. Указание. В Ь) используйте а) и принцип индукции; в с) используйте а) и по индукции докажите, что существует такая последовательность xkl < < хк2 < ... < хкк точек интервала ]-1,1[, что /^(ж*,) - /^H^fc.+i) < ^ ПРИ 7. Покажите, что если функция / определена и дифференцируема на ин- интервале / и [а, Ь] С /, то a) функция f'{x) (даже не будучи непрерывной!) принимает на [а,Ь] все значения между /'(а) и /'F) (теорема Дарбу1)); b) если еще f"(x) существует в ]а, Ь[, то найдется точка £ G ]а, Ь[ такая, что f'(b) - f (a) = f"(O(b-а). 8. Функция /(ж) может быть дифференцируемой на всей числовой прямой, но при этом f'(x) может не быть непрерывной (см. пример 7 из § 1, п. 5). a) Покажите, что функция /'(ж) может иметь разрывы только второго рода. b) Укажите ошибку в следующем «доказательстве» непрерывности f'(x). ■4 Пусть хо — произвольная точка на! и /'(^о) — производная функции / в точке хо. По определению производной и теореме Лагранжа х-¥хо X — Xq x-¥xo £-> где £ — точка между xq и х, стремящаяся, таким образом, к xq при х —> xq. ► 9, Пусть / — дважды дифференцируемая функция на промежутке /. Пусть Мо = sup |/(ж)|, Mi = sup \f'(x)\, Mi — sup |/"(ж)|. Покажите, что i i Г. Дарбу A842-1917) — французский математик.
272 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ а) если / = [-а, а], то , Мо х2 +а2 /(ж) ^ + — М2; а 1а Г М1 ^ 2л/МоМ2, если длина / не меньше 2\/Мо/Мг, \ М1 ^ \Д^о^2, если / = К; c) в задаче Ь) числа 2 и у/2 не могут быть заменены меньшими; d) если / дифференцируема р раз в Ж и если величины Мо и Мр = = sup|/^p'(x)| конечны, то при 1 ^ А; ^ р конечны также величины М* = ж gift мк < о Указание. Используйте задачи 6b), 9b) и принцип индукции. 10. Покажите, что если функция / имеет в точке ж0 все производные до порядка п + 1 включительно и /^п+1^(жо) ф 0, то в остаточном члене формулы Тейлора, записанном в форме Лагранжа ГпЫх) = -J^(XO + в(х - ХО))(Х - Х0)П, п! где 0 < в < 1, величина в = в(х) стремится к ——- при х -> х0. 11. Пусть /—функция, п раз дифференцируемая на промежутке /. Пока- Покажите, что a) Если /в (п+1) точках промежутка / обращается в нуль, то найдется точка £ € / такая, что /("'(£) = 0. b) Если Хх,Х2,.. ■ ,хр — точки промежутка /, то существует и притом един- единственный многочлен L(x) (интерполяционный полином Лагранжа) степени не выше (п — 1) такой, что /(х*) = L(xi), i = 1,..., п. Кроме того, для х £ I най- найдется точка £ G / такая, что f{x) _ L(x) = c) Если жх < Ж2 < ... < Жр—точки промежутка /, щ A ^ i ^ р) — натуральные числа такие, что п\ + пг + • -. + пр — п и /(*' (xj) = 0 при 0 ^ к ^ ^ щ — 1, то в промежутке [xlt жр] найдется точка £, в которой /(n~^(f) = 0. d) Существует и притом единственный многочлен Н(х) (интерполяцион- (интерполяционный полином Эрмита1)) степени п — 1 такой, что fW(xi) = Н^к\х{) при Х'Ш. Эрмит A822-1901)—французский математик, занимавшийся вопросами анализа; в частности, доказал трансцендентность числа е.
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 273 О ^ к ^ пг — 1. Кроме того, внутри наименьшего промежутка, содержащего точки х и хг, г = 1,..., р, найдется точка £ такая, что = ж*) Эта формула называется интерполяционной формулой Эрмита. Точки хг, % = 1,... ,р, называются узлами интерполяции кратности пг соответственно. Частными случаями формулы Эрмита являются интерполяционная формула Лагранжа (задача Ь)) при р = пин, = 1 (г = 1,...,п), а также формула Тейлора с остаточным членом в форме Лагранжа, получающаяся при р = 1, т.е. при интерполировании с одним узлом кратности п. 12. Покажите, что a) между двумя вещественными корнями полинома Р(х) с вещественными коэффициентами имеется корень его производной Р'(х); b) если полином Р(х) имеет кратный корень, то полином Р'(х) имеет тот же корень, но на единицу меньшей кратности; c) если Q(x)—наибольший общий делитель полиномов Р(х) и Р'(х), где Р'(х) — производная полинома Р(х), то полином yJf4 имеет в качестве корней корни полинома Р{х), причем все они кратности 1. 13. Покажите, что a) любой полином Р(х) допускает представление в следующем виде: cq + + ci(x - х0) + ... + с„(ж - хо)п; b) существует единственный полином степени п, для которого f(x)—P(x) = = о((х — хо)п) при Е Э х —> xq. Здесь / — функция, определенная на множест- множестве Е, а хо — предельная точка Е. 14. С помощью индукции по fc, I ^ А;, определим конечные разности по- порядка к функции / в точке х0: i) := А/(х0; М = /(*„ + Ы - /Ы, A2f(x0;hi,h2) := AAf(xo;hi,h2) = = (f{x0 + h+ h2) - f{x0 + h2)) - (f(x0 + ht) - f(x0)) = =f(x0 + ht + h2) - f(x0 + hi) - f(x0 + h2) + f(x0), Akf(x0; hu..., hk) := Ak-Igk{xo; hu ... A_i), где gk{x) = Alf{x; hk) = f(x + hk) - f(x). а) Пусть / G C^n-1^[a, b] и существует f^n\x) по крайней мере в интервале ]а,Ь[. Если все точки ж0, xo + hi, xq + h2, x0 + hi + h2, хо + hi + ... + hn лежат в [a, b], то внутри наименьшего отрезка, их содержащего, найдется точка £ такая, что 10-4573
274 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ b) (Продолжение.) Если существует рп'(хо), то имеет место оценка Anf(x0;h1,...thn)-f^{x0)h1...ht, sup хе]а,Ь[ \hx\...\hn\. с) (Продолжение.) Положим Anf(x0;h,...,h) —: Anf(x0;hn). Покажите, что если существует /(™'(жо)> то d) Покажите на примере, что предыдущий предел может существовать даже тогда, когда /("'(ж) в точке хо не существует. Указание. Рассмотрите, например, Д2/@;Л2) для функции и покажите, что h-Ю h2 15. а) Применив теорему Лагранжа к функции ——, где а > 0, покажите, х что при п G N и а > 0 имеет место неравенство 1 1. / 1 _ ±\ n^" < а \(п-1)а па) ' оо . Ь) Воспользуйтесь результатом задачи а) и покажите, что ряд X) — сх°- дится при а > 1. n=1 n § 4. Исследование функций методами дифференциального исчисления 1. Условия монотонности функции Утверждение 1. Между характером монотонности дифферен- дифференцируемой на интервале ]а,Ь[ = Е функции f:E—>M.u знаком (поло- (положительностью) ее производной /' на этом интервале имеется следу- следующая взаимосвязь: f'(x) > 0 => / возрастает => f'(x) > О, f'(x) ^0 => f не убывает =>■ f'(x) ^ 0, f'(x) = 0 =>■ / = const =>■ /'(ж) = 0,
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 275 f'(x) ^ О =Ф- f не возрастает =Ф- f'(x) ^ 0, f'(x) < 0 => / убывает =Ф- /'(ж) ^ 0. •« Левый столбец следствий нам уже знаком по обсуждению теоремы Лагранжа, в силу которой /(жг) - f(xi) = f'(O(x2 — xi), где 2:1,2:2 G 6 ]a,b[ и £ — точка между х\ и жг- Из этой формулы видно, что при Х\ < Х2 положительность разности /(жг) — f(xi) совпадает с положи- положительностью /'(£). Правый столбец следствий получается непосредственно из опреде- определения производной. Покажем, например, что если дифференцируемая на ]а,Ь[ функция / возрастает, то f'(x) ^ 0 на ]а,Ь[. Действительно, Л„ . lim . v ' h-м h Если h > 0, то /(ж + К) - f(x) > 0, а если h< 0, то /(ж + /i) - /(ж) < 0; поэтому дробь под знаком предела положительна. Следовательно, ее предел f'(x) неотрицателен, что и утвержда- утверждалось. ► Замечание 1. На примере функции f(x) = х3 видно, что возра- возрастание дифференцируемой функции влечет только неотрицательность производной, а не ее положительность. В нашем примере /'@) = Замечание 2. В символе А =Ф- В, как мы уже в свое время отме- отмечали, А — условие, достаточное для В, а В — условие, необходимое для того, чтобы было выполнено А. Значит, из утверждения 1, в частности, можно сделать следующие выводы: функция постоянна на интервале тогда и только тогда, когда ее производная тождественно равна нулю на этом интервале; для того чтобы дифференцируемая на интервале функция убыва- убывала на нем, достаточно, чтобы ее производная была отрицательна в любой точке этого интервала; для того чтобы дифференцируемая на интервале функция убывала на нем, необходимо, чтобы ее производная была неположительна на этом интервале. Пример 1. Пусть f(x) = х3 - Зх + 2 на R Тогда f'(x) = Зх2 - - 3 = 3(х2 — 1) и, поскольку f'(x) < 0 при |ж| < 1 и f'(x) > 0 при \х\ > 1, можем сказать, что на интервале ]—сю, —1[ функция возрастает, на интервале ]—1,1[ убывает, а на интервале ]1, +оо[ вновь возрастает.
276 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 2. Условия внутреннего экстремума функции. Учитывая лем- лемму Ферма (лемма 1, §3), можно сформулировать следующее Утверждение 2 (необходимые условия внутреннего экстремума). Для того чтобы точка х$ была точкой экстремума функции f : U(xo) -» К, определенной в окрестности U{xq) этой точки, необходи- необходимо выполнение одного из двух условий: либо функция не дифференци- дифференцируема в xq, либо f'(xo) = 0. Простые примеры показывают, что эти необходимые условия экс- экстремума не являются достаточными. Пример 2. Пусть f(x) = х3 на R Тогда /'@) = 0, но в точке хо = 0 экстремума нет. Пример 3. Пусть ft \ = { х ПРИ х > °> ПХ) ~ \ 2х при х<0. Эта функция с изломом в нуле, очевидно, не имеет в нуле ни произ- производной, ни экстремума. Пример 4. Найдем максимум функции f(x) = х2 на отрезке [—2,1]. В данном случае очевидно, что он будет достигнут в конце —2 отрезка, но регулярный способ его отыскания таков. Находим f'(x) = 2x и все точки интервала ]—2,1[, где f'(x) = 0. В нашем случае это одна точка х = 0. Максимум f(x) должен быть либо среди этих точек, либо в одной из концевых точек, о которых утверждение 2 ничего не говорит. Таким образом, надо сравнить значения /(—2) = 4, /@) = 0, /A) = 1, откуда заключаем, что максимальное значение функции f(x) = х2 на отрезке [—2,1] равно 4 и принимается в точке —2, являющейся концом этого отрезка. Используя установленную в пункте 1 связь между знаком произ- производной и характером монотонности функции, приходим к следующим достаточным условиям наличия или отсутствия локального экстремума в точке. Утверждение 3 (достаточные условия экстремума в терминах первой производной). Пусть /: U{xq) -» К — функция, определенная в окрестности U(xq) точки xq, непрерывная в самой этой точке и диф-
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 277 о о ференцируемая в ее проколотой окрестности U(xq). Пусть U~(xq) = о = {х е U(x0) | х < х0} и U+(x0) = {х Е U(xo) | х > х0}- Тогда справедливы следующие заключения: a) (Ух е и~(х0) (f'(x) < 0)) Л (Ух € U+(x0) (f(x) < 0)) =* =$> (f в xq экстремума не имеет); b) (Ух е и~(х0) (f'(x) < о)) л (Ух е й+(х0) (f'(x) > о)) =* =Ф- (хо —точка строгого локального минимума /); c) (Ух е й~(хо) (f(x) > 0)) Л (Ух € й+(х0) (f(x) < 0)) =^ =Ф- (хо —точка строгого локального максимума /); d) (Ух Е й-(х0) (f(x) > 0)) Л (Ух е й+(х0) (f'(x) > 0)) =* =Ф- (/ в хо экстремума не имеет). Кратко, но менее точно, можно сказать, что если при переходе через точку производная меняет знак, то экстремум есть, а если ее знак при этом не меняется, то экстремума нет. Заметим сразу же, что эти условия, являясь достаточными, не явля- являются необходимыми для экстремума, в чем можно убедиться на следу- следующем примере. Пример 5. Пусть {2х2 + х2 sin - при х ф 0, 0 при х = 0. Поскольку х2 ^ f(x) ^ 2х2, то ясно, что функция имеет строгий локальный минимум в точке хо = 0, однако ни в какой проколотой полуокрестности этой точки ее производная f'(x) — Ах + 2arsin^ — -cos j не сохраняет знак. Этот же пример указывает на недоразумения, которые могут возникнуть в связи с приведенной выше сокращенной формулировкой утверждения 3. Теперь обратимся к доказательству утверждения 3. < а) Из утверждения 2 следует, что функция / строго убывает на о U~(xq). Поскольку она непрерывна в хо, имеем lim f(x) = f(xo) о о U~ (хо)Эх-кео и, следовательно, f(x) > f(xo) при х € U~(xq). По тем же соображениям
278 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ о f(xo) > f(x) при х Е U+(xo). Таким образом, функция строго убывает во всей окрестности U{xq) и xq не является точкой экстремума. Ь) Сначала, как ива), заключаем, что ввиду убывания /(х) на о о U~(xo) и непрерывности / в ж0 имеем f(x) > f(xo) при х € U~(xq). о Из возрастания / на U+(xo) и непрерывности / в хо заключаем, что о f(xo) < f(x) при х € U+(xo). Таким образом, функция / имеет в жо строгий локальный минимум. Утверждения с) и d) доказываются аналогично. ► Утверждение 4 (достаточные условия экстремума в терминах высших производных). Пусть функция /: U{xq) -» К, определенная в окрестности U{xq) точки х$, имеет в xq производные до порядка п включительно (п ^ 1). Если f'(xo) = ... = /^п-1^(жо) = 0 ы /^ ф 0, то при п нечетном в хо экстремума нет, а при п четном экстремум есть, причем это строгий локальный минимум, если f(n\xo) > 0, и строгий локальный максимум, если f^n\xo) < 0. < Используя локальную формулу Тейлора f(x) - /(so) = f{n)(x0)(x - хо)п + а(х)(х - хо)п, A) где а(х) -> 0 при х —> хо, будем рассуждать так же, как при доказа- доказательстве леммы Ферма. Перепишем A) в виде f{x) - /Ы = (/(П)Ы + а{х)) (х - хо)п. B) Поскольку f^(xo) ф 0, а а(х) -> 0 при х -» xq, to сумма f\) + а(х) имеет знак f^n\xo), когда х достаточно близко к xq. Если п нечетно, то при переходе через xq скобка (х — хо)п меняет знак и то- тогда изменится знак всей правой, а следовательно, и левой части равен- равенства B). Значит, при п = 2к + 1 экстремума нет. Если п четно, то (х — хо)п > 0 при х ф хо и, следовательно, в ма- малой окрестности точки хо знак разности f(x) — f(xo), как видно из равенства B), совпадает со знаком f^n\xo). ► Рассмотрим примеры.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 279 Пример 6. Закон преломления света в геометрической оптике (закон СнеллиусаУ*). Согласно принципу Ферма истинная траектория света между любыми двумя точками такова, что на ней реализуется минимум времени, которое необходимо свету, чтобы пройти из одной точки в другую по любому фиксированному пути, соединяющему эти точки. Из принципа Ферма и того, что кратчайшей линией между любыми дву- двумя точками является отрезок прямой с концами в этих точках, следует, что в однородной изотропной среде (устроен- (устроенной одинаково как в каждой точке, так и в каждом направлении) свет распро- распространяется прямолинейно. Пусть теперь имеются две такие сре- среды и свет распространяется из точки А\ к ^2, как показано на рис. 22. Если ci, C2—скорости света в этих средах, то время прохождения указанного пути таково: t(x) = — \h\ + х2 Л Jhl + (a-x). С\ v C2 v 0 х hi Аг h1 f Л- hi a _ Рис. 22. Найдем экстремум функции t(x): t'(x) = -- X 1 C2 a — x l + (a - x) 5 = 0. что в соответствии с обозначениями рисунка дает сх sin a>i = c^1 sin a2. Из физических соображений или прямо из вида функции t(x), не- неограниченно растущей при х -» сю, ясно, что точка, где t'(x) = 0, явля- является точкой абсолютного минимума непрерывной функции t(x). Таким образом, из принципа Ферма следует закон преломления s?nQl = ^. Пример 7. Покажем, что при х > 0 ха - ах + а - 1 ^ 0, когда 0 < а < 1, C) ха — ах + а — 1 ^ 0, когда а < 0 или 1 < а. D) ''В. Снеллиус (Снелл) A580 -1626) —нидерландский астроном и математик.
280 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ < Дифференцируя функцию f(x) = ха — ах + а — 1, находим f'(x) = — а(жа~1 — 1) и f'(x) = 0 при х = 1. При переходе через точку 1 производная переходит от положительных значений к отрицательным, если 0 < а < 1, и от отрицательных к положительным, если а < 0 или 1 < а. В первом случае в точке 1 строгий максимум, а во втором— строгий минимум (и не только локальный, что следует из соображений монотонности / на участках 0 < ж < 1, 1 < х). Но/A) = 0и, таким образом, оба неравенства C), D) установлены. При этом показано даже, что оба неравенства строгие, если х ф 1. ► Заметим, что если заменить х на 1 + х, то мы обнаружим, что C) и D) — это развитие уже знакомого нам при натуральном показателе а неравенства Бернулли (гл. II, § 2; см. также задачу 2 в конце настоящего параграфа). С помощью элементарных алгебраических преобразований из дока- доказанных неравенств можно получить ряд классических и важных для анализа неравенств. Приведем их вывод. a. Неравенства Юнга1). Если а > 0 и b > 0, а числа р, q таковы, что рф0,1, <? ^ 0,1 и i + ^ = 1, то ^ -а + -Ь, если р > 1, Р Ч ^la + lb, если р<1, р q причем знак равенства в E) и F) имеет место только при а = Ь. < Для доказательства достаточно в C) и D) положить х = ^ и а — р, а также ввести обозначение ^ = 1 — =. ► b. Неравенства Гель дера2). Пусть хг ^ 0, уг ^ 0 (г = 1,... ,п) и J + ! = l. Тогда при р>1 G) . Юнг (Янг) A882-1946)—английский математик. . Гёльдер A859 -1937) —немецкий математик.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 281 " / » \ 1/р / " \ 1/, 2_^ХгУ1> [2^хг I I 2_у Уг I При р < 1, р ^ 0. (8) г-1 \г=1 / \г=1 / В случае р < 0 в (8) предполагается, что жг > 0 (г = 1,...,п). Змак равенства в G) ы (8) возможен только в случае пропорциональности векторов (а^,...,ж&), (у?, ...,Уп)- п п ^ Проверим неравенство G). Пусть X = ^ а^ > 0, У = ^ уг9 > 0. г=1 г=1 Полагая в E) а = -^, о = ^, получаем •1>гУг - г . "г Суммируя эти неравенства по г от 1 до п, получаем что эквивалентно G). Аналогично, из F) получаем (8). Поскольку знак равенства в E) и F) возможен лишь при а = Ь, заключаем, что в G) и (8) он возможен лишь при пропорциональности xf = Ay' или у' = Axf. ► с. Неравенства Минковского1). Пусть хг > 0, уг > 0 (г = = 1,... ,п). Тогда \ п \ 1/Р / п \ VP / п \ VP + Уг)М < (XX) + ( Е «Г J при р>1 (9) п \ VP / п \1/Р / п \ VP ] A () A0) ''Г Минковский A864-1909)—немецкий математик, предложивший адекватную математическую модель (пространство с индефинитной метрикой) специальной те- теории относительности.
282 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ■^ Применим неравенства Гёльдера к членам правой части тожде- тождества Х>,+у*)р = Ё **(**+у*O+Ё *(**+^)р- г=1 г=1 г=1 Тогда левая часть будет оценена сверху или снизу в соответствии с неравенствами G), (8) величиной / п \УЯ После деления полученных неравенств на I Y1 (хг + Уг)р ) прихо дим к (9) и A0). Зная условия равенства в неравенствах Гёльдера, проверяем, что знак равенства в неравенствах Минковского возможен лишь в случае коллинеарности векторов (х\,...,хп), (yi,..., у„). ► При п = 3 и р = 2 неравенство Минковского (9), очевидно, является неравенством треугольника в трехмерном евклидовом пространстве. Пример 8. Рассмотрим еще простейший пример использования высших производных при отыскании локальных экстремумов. Пусть f(x) = sinar. Поскольку f'(x) = cosar и f"(x) = — sinar, то все точки, где f'(x) = cos а; = 0, являются локальными экстремумами функции sin ж, так как в них f"(x) = —sin а; ф 0. При этом f"(x) < 0, если sin а; > > 0, и f"(x) > 0, если sinar < 0. Таким образом, точки, где cos а; = 0, а sin а; > 0, являются локальными максимумами, а точки, где cos а; = 0, a sin а; < 0,—локальными минимумами функции sin а: (что, конечно, и так известно). 3. Условия выпуклости функции Определение 1. Функция /: ]а,Ь[ -» М, определенная на интер- интервале ]а,Ь[ С К, называется выпуклой на нем, если для любых точек ^1)^2 G ]а>Ь[ и любых чисел а\ ^ 0, а.ч ^ 0 таких, что а.\ + а.ч = 1, имеет место неравенство а2х2) ^ aif(xi) + a2f(x2). A1)
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 283 Xl X = Q1X1 + Q2X2 X2 Рис. 23. Если при х\ ф Х2 и а\ • ai Ф 0 это неравенство является строгим, то функция называется строго выпуклой на интервале ]а, Ь[. Геометрически условие A1) выпуклости функции /: ]а, Ь[ -» К озна- означает (рис. 23), что точки любой дуги графика функции лежат под хор- хордой, стягивающей эту дугу. В самом деле, в левой части A1) стоит значение f(x) функции в точке х — a\Xi + 0.2x2 € [#1,3:2], а справа — значение в той же точ- точке линейной функции, график которой (прямая) проходит через точки Соотношение A1) означает, что множество Е = {(х, у) Е К2 | х € 6 ]a,b[, f(x) < у} точек плоскости, лежащих над графиком функции, является выпуклым, откуда и сам термин «выпуклая» функция. Определение 2. Если для функции /: ]а, Ь[ —> К в A1) имеет ме- место обратное неравенство, то говорят, что функция вогнута на интер- интервале ]а, Ь[ или, чаще, что она выпукла вверх на этом интервале, в отли- отличие от выпуклой функции, которую тогда называют выпуклой вниз на интервале ]а,Ь[. Поскольку все дальнейшие построения проводятся одинаково для функций, выпуклых вниз или вверх, мы ограничимся рассмотрением выпуклых (вниз) функций. Сначала придадим неравенству A1) другой вид, более приспосо- приспособленный для наших целей. Из соотношений х = а\Х\ + «2^2> «i + «2 = 1 имеем Х2 — X Х2 — Х\  = X — Х\ Х2 -Xi
284 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ поэтому A1) можно переписать в виде Х2 Х Х2 Учитывая, что х\ ^ х ^ Х2 и х\ < Х2, после домножения на Х2 — Х\ получаем (х2 - x)S(xi) + (х1 - x2)S(x) + (x- x1)S(x2) > 0. Замечая, что Х2 — х\ = (х2 — х) + (х — х±), из последнего неравенства после элементарных преобразований находим, что X — Х\ Х2 — X При Х\ < X < Х2 И ЛЮбыХ Х\,Х2 € ]о, Ь[. Неравенство A2) является иной формой записи определения выпукл- выпуклости функции /(ж) на интервале ]а,Ь[. Геометрически A2) означает (см. рис.23), что угловой коэффициент хорды I, соединяющей точки (xi,S(x{)), (x,S(x)), не больше (а в случае строгой выпуклости—мень- выпуклости—меньше) углового коэффициента хорды II, соединяющей точки (х, /(х)), (x2j(x2)). Предположим теперь, что функция /: ]а,Ь[ -» К дифференцируема на ]а,Ь[. Тогда, устремляя в A2) х поочередно к х\ и Х2, получаем что устанавливает монотонность производной функции /. Учитывая это, для строго выпуклой функции, пользуясь теоремой Лагранжа, находим ш = /W- при жх < £i < х < & < Х2, т. е. строгая выпуклость влечет строгую монотонность производной. Итак, если дифференцируемая функция / выпукла на интервале ]а,Ь[, то /' не убывает на ]а,Ь[, а в случае строгой выпуклости / ее производная /' возрастает на ]а,Ь[.
§ 4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 285 Оказывается, это не только необходимые, но и достаточные условия выпуклости дифференцируемой функции. В самом деле, для а < х\ < х < х2 < b по теореме Лагранжа /0*0-/0*1) .,,,* /Ы - /0*0 ,,.,. x-Xl =f (Ы' x2-x =/F)' где xi < £i < х < £2 < %2, и если /'(£i) < /'(£2), то выполнено усло- условие A2) выпуклости (или строгой выпуклости, если /'(£i) < /'(£2))- Таким образом, мы доказали следующее Утверждение 5. Для того чтобы дифференцируемая на интер- интервале ]а,Ь[ функция /: ]а,Ь[ —> №. была выпуклой (вниз) на ]а,Ь[, необ- необходимо и достаточно, чтобы ее производная /' не убывала на ]а, Ь[. При этом строгому возрастанию /' соответствует строгая выпук- выпуклость /. Сопоставляя утверждение 5 и утверждение 3, получаем Следствие. Для того чтобы функция /: ]а,Ь[ —> Ш, имеющая на интервале ]а,Ь[ вторую производную, была выпуклой (вниз) на этом интервале, необходимо и достаточно, чтобы на ]а, Ь[ было f"(x) > 0. Если же f"(x) > 0 на ]а, Ь[, то этого достаточно, чтобы гарантиро- гарантировать строгую выпуклость функции f: ]а,Ь[ —> Ш. Теперь мы в состоянии объяснить, например, почему графики про- простейших элементарных функций рисуют с тем или иным характером выпуклости. Пример 9. Исследуем выпуклость функции f(x) = xa на множе- множестве х > 0. Поскольку f"(x) = а(а — 1)ха~2, то f"(x) > 0 при а < 0 или при а > 1, т.е. при таких значениях показателя степени а степенная функция ха строго выпукла (вниз). При 0 < а < 1 имеем }"(х) < О, поэтому для таких показателей степени она строго выпукла вверх. На- Например, параболу f(x) = х2 мы всегда рисуем выпуклой вниз. Остав- Оставшиеся случаи а = 0 и а = 1 тривиальны: х° = 1, х1 = х. И в том и в другом случае графиком функции является луч (см. рис. 30 на с. 294). Пример 10. Пусть }(х) — ах, 0 < а, а ф 1. Поскольку }"(х) = = ох In2 a > 0, показательная функция ах при любом допустимом осно- основании а строго выпукла (вниз) на №. (см. рис. 24 на с. 294).
286 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 11. Для функции Да:) = log. а; имеем f"(x) = —=—, х In a поэтому функция строго выпукла (вниз), если 0 < а < 1, и строго выпукла вверх, если 1 < а (см. рис. 25 на с. 294). Пример 12. Исследуем выпуклость функции f(x) = sin а; (см. рис.26 нас. 294). Поскольку f"(x) = — sina:, то f"(x) < 0 на интервалах тг-2к < х < < тгB/г + 1) и f"(x) > 0 на интервалах тгBк - 1) < х < ж-2к, где к G Z. Отсюда, например, следует, что дуга графика функции sin а; на отрезке О ^ х ^ - лежит над стягивающей ее хордой всюду, кроме концевых точек; поэтому sin а; > \х при 0 < х < ~. Укажем теперь еще одну характеристику выпуклой функции, гео- геометрически эквивалентную тому, что выпуклая область на плоскости лежит по одну сторону от касательной к ее границе. Утверждение 6. Дифференцируемая на интервале ]а, Ь[ функция f: ]a,b[ —> R выпукла (вниз) на ]а,Ь[ тогда и только тогда, когда ее график всеми своими точками лежит не ниже любой проведенной к нему касательной. При этом для строгой выпуклости функции не- необходимо и достаточно, чтобы все точки графика, за исключением самой точки касания, лежали строго выше этой касательной. А Необходимость. Пусть хо G ]а,Ь[. Уравнение касательной к графику в точке (а:о,/(а:о)) имеет вид У = Джо) + f'(xo)(x - хо), поэтому f(x) - у(х) = f{x) - /(а*) - ГЫ{х - хо) = {f (О - /Ы) (х - хо), где £ — точка между х и хо. Так как / выпукла, то функция /'(а;) не убывает на ]а,Ь[ и знак разности /'(£) — S'(xo) совпадает со знаком разности х — хо, поэтому Да:) — у(х) ^Ов любой точке х € ]а,Ь[. Если / строго выпукла, то /' строго возрастает на ]а, Ь[ и, значит, Да:) - — у(х) > 0 при х G ]а, Ь[ и х ф Хо- Достаточность. Если для любых точек х,хо € ]а,Ь[ S{x) - у(х) = S{x) - /Ы - S'{xo){x - хо) > 0, A3)
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 287 то ^ / (xq) при х < хо, X — Хо ^ /'(яо) при хо < х. Таким образом, для любой тройки точек х\, х, х^ € ]а, Ь[ такой, что х\ < х < Х2, получаем /(ж)-/(ая) <f(x2)-f(x) X — Xi X2 — X причем строгое неравенство в A3) влечет строгое неравенство в по- последнем соотношении, которое, как мы видим, совпадает с записью A2) определения выпуклой функции. ► Рассмотрим примеры. Пример 13. Функция f(x) = ех строго выпукла. Прямая у = х + 1 является касательной к графику этой функции в точке @,1), так как /@) = е° = 1 и /'@) = ех\х=о = 1. В силу утверждения 6 заключаем, что для любого х € М ех > 1 + х, причем если х ф 0, то неравенство строгое. Пример 14. Аналогично, пользуясь строгой выпуклостью вверх функции Ых, можно проверить, что при х > 0 справедливо неравенство In х ^ х — 1, причем это неравенство является строгим, если х Ф 1. При построении графиков функций бывает полезно выделять точки перегиба графика. Определение 3. Пусть /: U{xq) —> R — функция, определенная и дифференцируемая в окрестности U{xq) точки xq € К. Если на множе- 0 стве U~(xo) = {х € U{xq) \ х < хо} функция выпукла вниз (вверх), а о на множестве U+{xq) = {х € U(xq) | х > Хо} выпукла вверх (вниз), то точка (xo,f(xo)) графика называется его точкой перегиба. Таким образом, при переходе через точку перегиба меняется напра- направление выпуклости графика, а это, в частности, означает, что в точке
288 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ (xo,f(xo)) график функции переходит с одной стороны касательной к нему в этой точке на другую ее сторону. Аналитический признак абсциссы хо точки перегиба легко усмо- усмотреть, сопоставляя утверждение 5 и утверждение 3. А именно, можно сказать, что если / дважды дифференцируема в точке xq, то, поскольку f'(x) в точке хо имеет максимум или минимум, необходимо f"(xo) = 0. Если же вторая производная f"(x) определена в U(xq) и всюду в о о U~(xo) имеет один знак, а всюду в U+{xq)—противоположный знак, о о то этого достаточно для того, чтобы f'(x) в U~(xo) и в U+(xo) бы- была монотонна, но имела разный характер монотонности. Тогда в силу утверждения 5 в точке (xo,f(xo)) произойдет изменение направления выпуклости графика, т.е. (xo,f(xo)) будет точкой перегиба. Пример 15. В примере 12, рассматривая функцию f(x) = sinx, мы нашли участки выпуклости и вогнутости ее графика. Покажем те- теперь, что точки графика с абсциссами х = тгк, к G Z, являются точками перегиба. Действительно, f"(x) = — sina;; f"(x) = 0 при х — тгк, к € Z. Кроме того, при переходе через эти точки f"(x) меняет знак, что является достаточным признаком точки перегиба (см. рис. 26 на с. 294). Пример 16. Не следует думать, что переход кривой с одной сто- стороны касательной на другую ее сторону в некоторой точке является достаточным признаком того, что зта точка является точкой перегиба. Ведь может так случиться, что ни в левой, ни в правой ее окрестно- окрестности кривая не сохраняет определенный характер выпуклости. Пример легко построить, усовершенствовав пример 5, приведенный по схожему поводу. Пусть {2х3 + х3 sin \ при х ф О, х О при х = 0. Тогда х3 ^ f(x) ^ Зх3 при 0 < х и Зх3 ^ }{х) ^ х3 при х ^ 0, поэтому график этой функции касается оси абсцисс в точке х = 0 и переходит в этой точке из нижней полуплоскости в верхнюю. В то же
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 289 время производная функции f(x) {6х2 + Зх2 sin \ - 2cos -\ при х Ф О, х О при х =О не монотонна ни в какой полуокрестности точки х = 0. В заключение вновь вернемся к определению A1) выпуклой функции и докажем следующее Утверждение 7 (неравенство Иенсена1)). Если f:]a,b[ —> R — выпуклая функция, Х\,...,хп—точки интервала ]a,b[, cti,...,an — неотрицательные числа такие, что а\ + ... + ап = 1, то справедливо неравенство f(aixi + ...+ апхп) ^ aif(xi) + ... + anf(xn). A4) Л При п = 2 условие A4) совпадает с определением A1) выпуклой функции. Покажем, что если A4) справедливо для п = т — 1, то оно справед- справедливо и для п = т. Пусть, для определенности, в наборе а\,..., ап имеем ап ф 0. Тогда Р = <*2 + ... + ап > 0 и тг + • • • + -/f = 1- Используя выпуклость функции, находим /(оцхх + ... + апхп) = / \a\xi + /3 (-jx2 + ... + -^хп ^ aif(Xl) + /3/ (°jx2 + ... + jx поскольку ai + /3 = 1 и [jjX2 + • • • + ~fxnj e ]°> M- Далее, по предположению индукции Следовательно, ...+ anxn) ^ ^/(жО + /3f I -^x2 + ... + -^ a2f{x2) + ... + anf[xn). . Л. Иенсен A859 -1925) — датский математик.
290 ГЛ V ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В силу принципа индукции заключаем, что A4) верно для любого п € N (Для п — 1 A4) тривиально.) ► Заметим, что, как видно из доказательства, строгой выпуклости отвечает строгое неравенство Иенсена, т. е. числа ац,... , ап отличны от нуля, то знак равенства в A4) может иметь место тогда и только тогда, когда х\ = ... = хп. Для функции, выпуклой вверх, разумеется, получается обратное по отношению к неравенству A4) неравенство f{axx\ + ...+ апхп) ^ aif(xi) + ...+ anf(xn). A5) Пример 17. Функция f(x) — Ых строго выпукла вверх на мно- множестве положительных чисел, поэтому в силу A5) ах lnzi + ... + ап lnxn ^ ln(aia;i + ... + апхп) или ... + апхп A6) п при хг ^ 0, аг ^ 0 (г = 1,..., п) и Y1 аг — !• В частности, если оц = ... = ап = ^, получаем классическое нера- неравенство п/ Х\ + ...+Хп Цхх ...хп^ A7) ть между средним геометрическим и средним арифметическим п неотри- неотрицательных чисел. Знак равенства в A7) возможен, как отмечалось вы- выше, только при х\ = Х2 = ... = хп. Если же в A6) положить п = 2, сц = р, аг = д, Х\ = а, Х2 = Ь, то вновь получим уже известное нам неравенство E). Пример 18. Пусть f(x) = хр, х ^ 0, р > 1. Поскольку такая функция выпукла, имеем £ bqt, г=\
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 291 вновь получаем неравенство G) Гёльдера г=1 где \ + | = 1 и р > 1. Прир < 1 функция /(ж) = хр выпукла вверх, поэтому аналогичными рассуждениями можно получить и другое неравенство (8) Гёльдера. 4. Правило Лопиталя. Остановимся теперь на одном частном, но иногда полезном приеме отыскания предела отношения функций, известном как правило Лопиталя1). Утверждение 8 (правило Лопиталя). Пусть функции /: ]а, Ь[ —> -> R и д: ]а, Ь[ —> М дифференцируемы на интервале ]а,Ь[ (—оо ^ а < < Ь ^ +оо); причем д'(х) ф 0 на ]а, Ь[ и fix) ., . -> Л при а; ->■ а + 0 (—оо ^ А ^ +оо). Тогда в каждом из двух следующих случаев: 1° (/(ж) -» 0) Л (д(х) -» 0) гари ж -> а + 0 или 2° д(ж) —> оо при ж —> а + 0 fix) :Ц—7 -> Л при х ->• а + 0. Аналогичное утверждение справедливо и при х —*■ Ь — 0. Коротко, но не вполне точно правило Лопиталя формулируют так: предел отношения функций равен пределу отношения их производных, если последний существует. А Если д'(х) ф 0, то на основании теоремы Ролля заключаем, что д(х) строго монотонна на ]а,Ь[. Значит, уменьшив, если нужно, про- промежуток ]а, Ь[ за счет сдвига в сторону конца а, можно считать, что !'Г.Ф. де Лопиталь A661-1704)—французский математик, способный ученик Иоганна Бернулли, маркиз, для которого последний в 1691 -1692 гг. написал первый учебник анализа. Часть этого учебника, посвященная дифференциальному исчисле- исчислению, в слегка измененном виде была опубликована Лопиталем под своим именем. Таким образом, «правилом Лопиталя» мы обязаны Иоганну Бернулли.
292 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ д(х) ф 0 на ]а, Ь[. Для х, у € ]а, Ь[ по теореме Коши найдется точка £ € 1а, Ь\ такая, что }{х) - /(у) ^ /'(£) Ф) - 9{у) д'@' Перепишем это равенство в удобном для нас сейчас виде М _ f(y) , /'(£,) 9{х))' При х —> а + 0 согласованно с изменением х будем стремить у к а+0 так, чтобы при этом и щ^0 и 44^0. Ф) д(х) В любом из данных нам двух вариантов 1° и 2° это, очевидно, можно сделать. Так как £ лежит между а; и у, то вместе с х и у также £ -> —> а + 0. Значит, правая, а следовательно, и левая часть последнего равенства при этом стремятся к А. ► Пример 19. lim ЩА = lim ^ = 1. х0 х +0 1 Этот пример не следует рассматривать как новое, независимое до- доказательство того, что ^|^ -> 1 при х —> 0. Дело в том, что, например, при выводе соотношения sin' x = cos x мы уже использовали вычислен- вычисленный здесь предел. В возможности применения правила Лопиталя всегда убеждаемся только после того, как найдем предел отношения производных. При этом не следует забывать о проверке условий 1° или 2°. Важность этих условий показывает следующий Пример 20. Пусть f(x) = cos ж, д(х) — sin ж. Тогда }'(х) = — sins, д'(х) = cos а; и Ц^1 —> +оо при х —> +0, в то время как *i)xl —* 0 при х^ +0. Пример 21. Ill X — lim = lim ч ' = lim —— = 0 при а > 0. х—Ц-оо ж" i^+oo ССЖ i^+oo аХа Пример 22. .. ха ,. ах0'1 ,. а(а-1)...(а-п + 1)жа-п п lim — = hm —,— = ... = hm — —r^ rr = 0 ax при а > 1, ибо при п > а и а > 1, очевидно, — > 0, если х —> +оо.
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 293 Заметим, что вся цепочка последних равенств носила условный ха- характер до тех пор, пока мы не пришли к выражению, предел которого смогли найти. 5. Построение графика функции. Для наглядного описания функции очень часто используют ее графическое представление. Как правило, такое представление бывает полезно для обсуждения каче- качественных вопросов поведения исследуемой функции. Для точных расчетов графики используются реже. В связи с этим практически важным оказывается не столько скрупулезное воспроиз- воспроизведение функции в виде графика, сколько построение эскиза графика функции, правильно отражающего основные элементы ее поведения. Некоторые общие приемы, встречающиеся при построении эскизов гра- графиков функций, мы и рассмотрим в этом пункте. a. Графики элементарных функций. Напомним прежде всего, как выглядят графики основных элементарных функций, свободное владение которыми необходимо для дальнейшего (рис. 24-30). b. Примеры построения эскизов графиков функций (без привлечения дифференциального исчисления). Рассмотрим те- теперь некоторые примеры, в которых эскиз графика функции может быть легко построен, если нам известны графики и свойства простей- простейших элементарных функций. Пример 23. Построим эскиз графика функции у = logx2_3x+2 2. Учитывая, что У = log**-3*+2 2 = строим последовательно график квадратного трехчлена у\ = х2 —За;+2, затем у2 = bg2 У\{х) и затем у = -Л-* (рис. 31). «Угадать» такой вид графика можно было бы и иначе: выяснить область определения функции logx2_3:c+2 2 = (Iog2(a;2 — Зх + 2))", най- найти поведение функции при приближении к граничным точкам области определения и на промежутках, концы которых являются граничными точками области определения, нарисовать «плавную кривую» с учетом найденного поведения функции у концов промежутка.
294 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Рис. 25. У у — cos х 2 / у = sin х О 1 чч jrl\ x 2 V.U Рис. 26. У г -1 У 2 / i — 1 у = arccos х /\\ / V 0 1 х ^ у = arcsin х ■к 2 У = tga: = ctgz Рис. 27. Рис. 28. У 0 -я-/2 у = arcctg ж у = arctga: X Рис. 29. Рис. 30.
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 295 Пример 24. Построение эскиза графика функции у = sin ж2 видно из рис. 32. Мы построили этот график по некоторым характерным для дан- данной функции точкам — тем точкам, где sin ж2 = — 1, sin ж2 = 0 или sin ж2 = 1. Между двумя соседними точками такого типа функция мо- монотонна. Вид графика в окрестности точки ж = О, у — 0 определяется тем, что sin ж2 ~ ж2 при ж —> 0. Кроме того, полезно заметить, что данная функция четна. Поскольку мы все время будем говорить только об эскизном, а не точном построении графика функции, то условимся ради краткости в дальнейшем считать, что требование «построить график функции» для нас всегда будет равносильно требованию «построить эскиз графика функции». Пример 25. Построим график функции у = х + arctg (ж3 — 1) (рис. 33). При ж -¥ — сю график хорошо приближается прямой у = ж— |, а при ж —» +оо — прямой у = ж + ^. Введем следующее полезное Определение 4. Прямая у = cq + c\x называется асимптотой графика функции у = /(ж) при ж —» — ею (при ж —> +сю), если /(ж) — - (со + с\х) — оA) при ж -» —сю (при ж -» +сю). Таким образом, в нашем случае при ж —> — сю график имеет асим- асимптоту у — х — I, а при ж -» +сю — асимптоту у = ж + |. Если при ж -» а — 0 (или при ж -» а + 0) |/(ж)| -» сю, то ясно, что график функции в этом случае будет по мере приближения ж к а все теснее примыкать к вертикальной прямой х = а. Эту прямую называют вертикальной асимптотой графика, в отличие от введенной в определении 4 асимптоты, которая всегда наклонна. Так, график из примера 23 (см. рис. 31) имеет две вертикальные асимптоты и горизонтальную асимптоту (общую для ж —> — сю и ж —»
296 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ -1 - Рис. 32.
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 297 Из определения 4, очевидно, вытекает, что X со = lim (/(ж) -cix). X—> — 00 И вообще, если /(ж) — (со + cia: + ... + СпХп) = оA) при х -» —сю, то с„_1 = lim 1-4 —ОО /(Ж) - со= lim 14 О —ОО Эти соотношения, выписанные нами для случая х —> — сю, разуме- разумеется, справедливы также в случае х —> +сю и могут быть использова- использованы для описания асимптотического поведения графика функции f(x) с помощью графика соответствующего алгебраического полинома со + + С\Х+ ... П Пример 26. Пусть (р, <р) — полярные координаты на плоскости, и пусть точка движется по плоскости так, что в момент времени t (t > 0) ТС <р = ip(t) — 1 — е~* sin —t. Требуется нарисовать траекторию точки. Нарисуем для этого сначала графики функций p(t) и ip(t) (рис. 34, а, 34, Ь). Теперь, глядя одновременно на оба построенных графика, можем нарисовать общий вид траектории точки (рис. 34, с). с. Использование дифференциального исчисления при по- построении графика функции. Как мы видели, графики многих функ- функций можно в общих чертах нарисовать, не выходя за пределы самых простых соображений. Однако если мы желаем уточнить эскиз, то в случае, когда производная исследуемой функции не слишком сложная,
298 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 1 2 3 t а. О 1 2 3 t b. Рис. 34. можно привлечь аппарат дифференциального исчисления. Продемон- Продемонстрируем это на примерах. Пример 27. Построить график функции у — f(x) в случае Функция f(x) определена при х € М\0. Поскольку е 11Х -» 1 при х -» оо, то | (ж + 2) при х -» +оо. Далее, при х —> —0, очевидно, имеем \х + 2\е~1/х —> +оо, а при а: -> ->■ +0 |ж + г^/^ _^ +о. Наконец, видно, что f(x) > 0 и /(-2) = 0. На основании этих наблюдений уже можно сделать первый набросок графика (рис. 35, а). Выясним теперь основательно, действительно ли данная функция монотонна на промежутках ]—оо, — 2], [—2,0[, ]0, +оо[, действительно ли она имеет указанные асимптоты и правильно ли изображен характер выпуклости графика функции. Поскольку /'(*) = t если ж<_2, , есЛи - 2 < х и х ф 0,
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 299 Рис. 35. и f'(x) ф О, то можно составить следующую таблицу: Промежуток Знак f'(x) Поведение f(x) ]-оо,-2[ - +оо\0 ]-2,0[ + О/1+оо ]0,+оо[ + О/1 +оо На участках постоянства знака производной функция, как мы зна- знаем, имеет соответствующий характер монотонности. В нижней строке таблицы символ +оо \ 0 означает монотонное убывание от +оо до О, а символ О /* +оо — монотонное возрастание значений функции от О ДО +ОО. Заметим, что f'(x) -» — 4е~х/2 при х -» — 2 — 0 и f'(x) —>■ 4е~1/2 при х -> — 2 + 0, поэтому точка (—2,0) должна быть угловой точкой графи- графика (излом типа излома у графика функции |ж|), а не обычной точкой, как это у нас изображено на рис. 35, а. Далее, f'(x) —> 0 при х —> +0, поэтому график должен выходить из начала координат, касаясь оси абсцисс (вспомните геометрический смысл /'(ж)!). Уточним теперь асимптотику функции при х —> —оо их-> +оо. Поскольку е~1/х = 1 — х~1 + о (х~1) при х —> оо, то -Их ) ~Х — 1 + °A) ПРИ Х ~* —°О, \ х + 1 + оA) при х -» +оо, значит, на самом деле наклонные асимптоты графика суть у = при х —> —оо и у = х + 1 при х —> +оо. -1-1
300 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ По этим данным уже можно построить достаточно надежный эскиз графика, но мы пойдем дальше и, вычислив если _2<х и найдем участки выпуклости графика. Поскольку f"(x) = 0 лишь при ж = 2/3, то имеем следующую таб- таблицу. Промежуток Знак f"(x) Выпуклость f(x) boo,-2[ - Вверх ]-2,0[ + Вниз ]0,2/3[ + Вниз ]2/3,+оо[ - Вверх Поскольку при х = 2/3 наша функция дифференцируема, а при пе- переходе через эту точку f"(x) меняет знак, то точка B/3,/B/3)) явля- является точкой перегиба графика. Между прочим, если бы производная f'(x) обращалась в нуль, то из таблицы знаков f'(x) можно было бы судить о наличии или отсутствии экстремума в соответствующей точке. В нашем случае f'(x) нигде не обращается в нуль, но в точке х = — 2 функция имеет локальный ми- минимум: она непрерывна в этой точке и при переходе через нее f'(x) меняет знак с — на + . Впрочем, то, что при х = — 2 наша функция имеет минимум, видно уже из приведенного в таблице описания изме- изменения значений функции / (х) на соответствующих промежутках, если, конечно, учесть еще, что /(—2) = 0. Теперь можно нарисовать более точный эскиз графика данной функ- функции (см. рис. 35, Ь). В заключение рассмотрим еще один Пример 28. Пусть (ж, у) — декартовы координаты на плоскости, и пусть движущаяся точка в каждый момент t (t ^ 0) имеет коорди- координаты t t~2t3 Требуется изобразить траекторию движения точки.
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 301 Нарисуем сначала эскизы графиков каждой из данных координат- координатных функций х = x(t) и у = y(t) (рис. 36, а, 36, Ь). Второй из этих графиков несколько интереснее, поэтому поясним его построение. Поведение функции у = y(t) при t —>• +0, 4 —>■ 1 — 0, i -> 1+0и асимптотику y(t) = It+оA) при t —> +оо усматриваем непосредственно из вида аналитического выражения для y(t). Вычислив производную находим ее нули: t\ и 0,5 и Составив таблицу: = A _ *2J ' ^ 1M в области t ^ 0. Промежуток Знак y(t) Поведение y(t) + 0Sv(ti) - y(h) \ -oo ]1,*2[ - +оо \ y(t2) ]*2,+00[ + У(*2> Z1 +00 находим участки монотонности и локальные экстремумы y{h) и ^ (max) и у(£г) « 4 (min). Теперь, глядя одновременно на оба графика х = x(t) и у = y(t), строим эскиз траектории движения точки по плоскости (см. рис. 36, с). Этот эскиз можно уточнять. Например, можно выяснить асимпто- асимптотику траектории Поскольку lin = —х + 2 является асимптотой для обоих концов траектории, отвечаю- отвечающих стремлению t к 1. Ясно также, что прямая х = 0 есть вертикальная асимптота для участка траектории, отвечающего t —> +оо. Найдем далее , ш 1 - Ы2 + 2<4 = — 1 и lim (y(t) + x(t)) = 2, то прямая у = t—>\ п Функция 1 ~ f ^+ 2и ) как легко выяснить, монотонно убывает от 1 до —1 при возрастании и от 0 до 1 и возрастает от —1 до +оо при возрастании и от 1 до +оо. Из характера монотонности у'х можно сделать заключение о харак- характере выпуклости траектории на соответствующем участке. С учетом
302 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ У 4 3 2 1 1/3 0 - - А 21 / 13 t 2 ь. ---4 -3 -1,2 0 с. d. Рис. 36.
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 303 сказанного теперь можно построить следующий, более точный эскиз траектории движения точки (см. рис. 36, d). Если бы мы рассматривали траекторию также для t < 0, то, как следует из нечетности функций x(t), y(t), к уже построенным на плос- плоскости (х,у) линиям добавились бы еще центрально симметричные им кривые. Подведем некоторые итоги в виде самых общих рекомендаций от- относительно порядка построения графика заданной аналитически функ- функции. Вот эти рекомендации. 1° Указать область определения функции. 2° Отметить специфические особенности функции, если они оче- очевидны (например, четность, нечетность, периодичность, совпадение с точностью до простейших преобразований координат с графиками уже известных функций). 3° Выяснить асимптотическое поведение функции при подходе к граничным точкам области определения и, в частности, найти асим- асимптоты, если они существуют. 4° Найти промежутки монотонности функции и указать ее локаль- локальные экстремумы. 5° Уточнить характер выпуклости графика и указать точки пере- перегиба. 6° Отметить характерные точки графика, в частности точки пере- пересечения с осями координат, если таковые имеются и доступны вычи- вычислению. Задачи и упражнения 1. Пусть х = (xi,..., хп), а = (c*i,..., а„), причем хг ^ 0, аг > 0 при г = п = 1,...,п и ^аг = 1. Для любого числа t Ф 0 рассмотрим среднее порядка t чисел х\,...,хп с весами а,: Mt(x,a) = В частности, при ai = ... = ап = — я t = —1,1,2 получаем соответственно среднее гармоническое, среднее арифметическое и среднее квадратическое. Покажите, что a) limMt(x,a) = ж ...а;£", т.е. в пределе можно получить среднее гео- геометрическое;
304 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ b) lim МЛх.а) = max хг; c) Пт МЛх.а)— min хг; d) Mt (x, a) — неубывающая функция от t на Ш, причем она строго возра- возрастает, если п > 1 и все числа хг отличны от нуля. 2. Покажите, что |1+ж|р ^ 1 +рх-\-cpipp(x), где ср—постоянная, зависящая только от р, а / \х\2 при |z| ^ 1, №(a:) = {|z|» при И>1, 6СЛИ 1<Р^2' и <^р(ат) = \х\р на К, если 2 < р. 3. Проверьте, что cosx < (^^J при 0 < |ж| < ^. 4. Исследуйте функцию f(x) и постройте ее график, если a) /(х) = arctg log2 cos (nx + |J; b) /(ж) = arccos (| — sin ж J; c) f(x) = yx(x + 3J; d) постройте кривую, заданную в полярных координатах уравнением у = ^0, и укажите ее асимптоту; e) укажите, как, зная график функции у = f(x), получить графики функ- функций f(x) + В; Af(x); f(x + b); f(ax) и, в частности, -f(x) и f(-x). 5. Покажите, что если / € С(\а,Ь[) и для любых точек х\,х2 € ]а,Ь[ вы- выполнено неравенство (х1+х2\ f(Xl)+f(x2) 1 \ 2 ) Ч 2 то функция / выпуклая на ]а, Ь[. 6. Покажите, что a) если выпуклая функция /: Е -¥ Е ограничена, то она постоянна; b) если для выпуклой функции /: Е —¥ Е X—> — ОО Ж Ж—>+ОО Ж то / — постоянная; с) для любой выпуклой функции /, определенной на промежутке а < х < < +оо (или —оо < х < а), отношение iipi стремится к конечному пределу или к бесконечности при стремлении х к бесконечности по области определения функции.
§4. ИССЛЕДОВАНИЕ ФУНКЦИЙ 305 7. Покажите, что если /: ]а, Ъ[ —> Ж — выпуклая функция, то а) в любой точке х е }а, Ь[ она имеет левую f'_ и правую /' производные: f'(x)= lim n'T"J"JW л->-о h f'Ax) = lim —^—-, + л-ц-о h причем f'_(x) ^ /+(ж); b) при x\,X2 e ]а,Ь[ и xi < X2 имеет место неравенство f'+{x{) ^ J c) множество угловых точек графика f(x) (для которых f_(x) ф fL(x)) не более чем счетно. 8. Преобразованием Лежандра1' функции /: / —> Ж, определенной в про- промежутке /СМ, называется функция /*(*) = sup(ta — f(x)). Покажите, что: a) Множество /* тех значений t e Ж, для которых f*(t) e E (т. е. /*(Ь)фоо), либо пусто, либо состоит из одной точки, либо является числовым промежут- промежутком, причем в последнем случае функция /*(£) выпукла на /*. b) Если / — выпуклая функция, то /* ф 0 и при /* е С(/*) (/•)•(*) = sup(arf -/*(*)) = f(x) для любого х € I. Таким образом, преобразование Лежандра выпуклой функ- функции инволютивно (квадрат его есть тождественное преобразование). c) Имеет место неравенство xt ^ f(x) + f*(t) при же/ и t е /*. d) В случае, когда /—выпуклая дифференцируемая функция, f*(t) — = txt — f(xt), где xt определяется из уравнения t = f'(x); получите отсюда геометрическую интерпретацию преобразования Лежандра /* и его аргумен- аргумента t, показывающую, что преобразование Лежандра есть функция, определен- определенная на множестве касательных к графику функции /. e) Преобразованием Лежандра функции f(x) = ^ха при а > 1 и х ^ О является функция f*(t) = -в$, где £^0и- + 4 = 1; получите отсюда, с учетом с), уже знакомое неравенство Юнга 1 1 а /3 ^А. М. Лежандр A752 -1833) —известный французский математик. 11-4573
306 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ f) Преобразованием Лежандра функции f(x) = ex является фикция f*(t) — tin |, t > 0, и справедливо неравенство при х е Е и t > 0. 9. Кривизна, радиус и центр кривизны кривой в точке. Пусть некоторая точка движется в плоскости по закону, задаваемому парой дважды диффе- дифференцируемых координатных функций х = x(t), у = y(t) от времени. При этом она описывает некоторую кривую, про которую говорят, что кривая задана в параметрическом виде х = x(t), у — y(t). Частным случаем такого задания является случай графика функции у = f(x), где можно считать, что х = t и У = /(*)• Мы хотим указать число, характеризующее кривизну кривой в некоторой точке, подобно тому как величина, обратная радиусу окружности, может служить показателем искривленности окружности. Этим сравнением мы и воспользуемся. a) Найдите тангенциальную at и нормальную а„ составляющие вектора а = (x(t),y(t)) ускорения точки, т. е. представьте а в виде суммы at + а„, где вектор at коллинеарен вектору v(t) = (x(t),y(t)) скорости, т.е. направленно касательной к траектории, а вектор ап направлен по нормали к траектории. b) Покажите, что при движении по окружности радиуса г имеет место соотношение г_ |о(*)| _ c) При движении по любой кривой, учитывая Ь), величину r(t) = ijgjji естественно назвать радиусом кривизны кривой в точке (x(t),y(t)). Покажите, что радиус кривизны вычисляется по формуле «*>- \ху- ху\ d) Величину, обратную радиусу кривизны, называют абсолютной кривиз- кривизной плоской кривой в данной точке {x(t),y(t)). Наряду с абсолютной кривиз- кривизной рассматривается величина _ ху-ху ()-(*2+</2K/2> называемая кривизной. Покажите, что знак кривизны характеризует направление поворота кри- кривой по отношению к касательной. Выясните, какова размерность кривизны.
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 307 е) Покажите, что кривизну графика функции у — f(x) в точке (х, f(x)) можно вычислить по формуле к(х) - У"(») Сопоставьте знаки к(х) и у"(х) с направлением выпуклости графика. f) Подберите константы a, b, R так, чтобы окружность (ее — аJ + (у — ЬJ — = R2 имела с данной параметрически заданной кривой х — x{t), у = y(t) в точке Хо = x(to), у о — У (to) касание возможно более высокого порядка. Пред- Предполагается, что x(t), y(t) дважды дифференцируемы и (x(to),y(to)) ф @,0). Указанная окружность называется соприкасающейся окружностью кри- кривой в точке (хо,уо)- Ее центр называется центром кривизны кривой в точке (хо,г/о)- Проверьте, что ее радиус совпадает с определенным в Ь) радиусом кривизны кривой в этой точке. g) Частица без предварительного разгона под действием силы тяжести начинает скатываться с вершины ледяной горки параболического профиля. Уравнение профиля х + у2 = 1, где х ^ 0, у ^ 0. Рассчитайте траекторию движения частицы до ее приземления. §5. Комплексные числа и взаимосвязь элементарных функций 1. Комплексные числа. Подобно тому, как в области Q рацио- рациональных чисел алгебраическое уравнение ж2 = 2 не имело решений, уравнение ж2 = — 1 не имеет решений в области действительных чи- чисел Ш, и подобно тому, как, вводя внешний по отношению к Q символ л/2 в качестве решения уравнения х2 = 2, мы увязываем его с операциями в Q и получаем новые числа вида г\ + у/2г2, где г\, Г2 6 Q, можно ввести символ г в качестве решения уравнения х2 = — 1 и связать это внешнее по отношению к Ж число г с действительными числами и арифметиче- арифметическими операциями в К. Замечательной особенностью указанного расширения поля Е дей- действительных чисел, кроме многого другого, является то, что в получа- получающемся при этом поле С комплексных чисел уже любое алгебраическое уравнение с действительными или комплексными коэффициентами бу- будет иметь решение. Реализуем теперь намеченную программу. а. Алгебраическое расширение поля М. Итак, вводим (следуя обозначению Эйлера) новое число г—мнимую единицу, такое, что
308 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Взаимодействие i с действительными числами должно состоять в том, что можно умножать i на числа у 6 R, т.е. необходимо появля- появляются числа вида iy, и складывать такие числа с вещественными, т.е. появляются числа вида х + iy, где ж, у 6 К. Если мы хотим, чтобы на множестве объектов вида х + iy, которые мы вслед за Гауссом назовем комплексными числами, были определе- определены привычные операции коммутативного сложения и коммутативного умножения, дистрибутивного относительно сложения, то необходимо положить по определению, что (xi + iyi) + (x2 + iy2) := (^1 + х2) + i(yi + у2) A) (х2 + iy2) ■= (zi#2 ~ УШ) + i(xiy2 + х2у{). B) Два комплексных числа х\ + iyi, x2 + iy2 считаются равными в том и только в том случае, когда х\ = х2 и у\ = у2. Отождествим числа ieRc числами вида х + i • 0, аг — с числом О + i ■ 1. Роль нуля в множестве комплексных чисел, как видно из A), играет число О + г-О = ОбК, роль единицы, как видно из B), — число 1+г-0 = 1 е К. Из свойств вещественных чисел и определений A), B) следует, что множество комплексных чисел является полем, содержащим Е в каче- качестве подполя. Поле комплексных чисел будем обозначать символом С, а его эле- элементы— чаще всего буквами z и w. Единственный не очевидный момент в утверждении о том, что С— поле, который нуждается в проверке, состоит в том, что любое от- отличное от нуля комплексное число z = х + iy имеет обратное z~l по отношению к умножению, т.е. z • z~l — 1. Проверим это. Число х — iy назовем сопряженным к числу z = х + iy и обозначим символом z. Заметим, что z • z = (x2 + у2) + i ■ 0 = х2 + у2 ф 0, если z ф 0. Таким образом, в качестве -г следует взять -= ^ • z = —^—^ — г-~-^—т- х2+у2 х2 + у2 х2+у2 Ъ. Геометрическая интерпретация поля С. Заметим, что после того, как алгебраические операции A), B) над комплексными числами введены, символ г, который привел нас к этим определениям, перестает быть необходимым.
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 309 Комплексное число z = х + iy мы можем отождествить с упорядо- упорядоченной парой (х, у) действительных чисел, называемых соответственно действительной частью и мнимой частью комплексного числа z (обо- (обозначения: х = Re 2, у = lm z1)). Но тогда, считая пару (х, у) декартовыми координатами точки плос- плоскости Е2 — Ш х R, можно отождествить комплексные числа с точками этой плоскости или с двумерными векторами с координатами (х,у). В такой векторной интерпретации покоординатное сложение A) комплексных чисел соответствует правилу сложения векторов. Кроме того, такая интерпретация естественно приводит также к понятию мо- модуля \z\ комплексного числа z как модуля или длины соответствующего ему вектора (х,у), т.е. если z = x + iy, C) а также к способу измерения расстояния между комплексными числами 2i, Z2 как расстояния между соответствующими им точками плоскости, т. е. с помощью величины 1*1 - *2| = V(xl ~ Х2J + (У1 - У2J- D) Множество комплексных чисел, интерпретируемое как множество точек плоскости, называется комплексной плоскостью и также обозна- обозначается символом С, подобно тому, как множество вещественных чисел и числовая прямая обозначаются одним символом К. Поскольку точку плоскости можно задать также полярными коор- координатами (г, ip), связанными с декартовыми координатами формулами перехода x = rcos<p, E) у = г simp, комплексное число z = х + iy F) можно также представить в виде z = r(cosip + isin<f). G) Записи F) и G) называют соответственно алгебраической и триго- тригонометрической формами комплексного числа. ^От лат. realis (вещественный) и imaginarius (мнимый).
310 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В записи G) число г ^ 0 называется модулем комплексного числа z (ибо, как видно из E), г — \z\), a tp— аргументом числа z. Аргумент имеет смысл только при z ф 0. В силу периодичности функций cosy; и sin ip аргумент комплексного числа определен с точностью до вели- величины, кратной 2тг, и символом Argz обозначают множество углов вида tp + 2жк, к 6 Z, где tp— какой-то угол, удовлетворяющий соотноше- соотношению G). Если желают, чтобы комплексное число однозначно опреде- определяло некоторый угол tp 6 Arg 2, то договариваются заранее о диапа- диапазоне, в котором его выбирают. Чаще всего это бывает полуинтервал 0 ^ <р < 2тг или полуинтервал — тг < <р ^ тг. Если такой выбор сделан, то говорят, что выбрана ветвь (или главная ветвь) аргумента. Значе- Значения аргумента в пределах выбранного диапазона обычно обозначают символом arg 2. Тригонометрическая форма G) записи комплексных чисел удобна при выполнении операции умножения комплексных чисел. В самом де- деле, если z\ = ri(cos</?i + isintpi), Z2 = T2(COS <f2+i Sin </?2), TO zi-Z2 = {t\ cos tpi + ir\ sin tpi)(r2 cos tf2 + гг2 sinip-i) = COS </?l COS </?2 — 7*1 Г2 SU1</?1 SUl</?2) + sin tpi + ) или zvz2 = rir2(cos((pi + (p2) + isin((pi + (f2))- (8) Таким образом, при умножении комплексных чисел их модули пе- перемножаются, а аргументы складываются. Заметим, что мы на самом деле показали, что если tpi 6 Arg Zi и tp2€ Arg^2, то (tpi +f2) 6 Arg (zi-z2). Но, поскольку аргумент определен с точностью до 2тг/г, можно записать, что Arg (zvz2) = Arg zi + Arg z2, (9) понимая это равенство как равенство множеств, правое из которых есть совокупность чисел вида fi + f2, где tpi 6 Arg^i, a tp2 6 Arg22. Таким образом, сумму аргументов полезно понимать в смысле равенства (9).
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 311 При таком понимании равенства аргументов можно, например, утверждать, что два комплексных числа равны тогда и только тогда, когда соответственно равны их модули и аргументы. Из формулы (8) по индукции вытекает следующая формула Муавра1); если z — r(costp + isintp), то zn = rn(cosntp + is'mntp). A0) С учетом разъяснений по поводу аргумента комплексного числа формулу Муавра можно использовать, чтобы в явном виде выписать все комплексные решения уравнения zn — а. Действительно, если а = p(cos ф + i sin ip) и в силу формулы A0) zn = rn (cos nip + i sin nip), то г — ^fp и nip = ф + 2жк, к 6 Z, откуда ipk = % + Щ-к. Различные комплексные числа получаются, очевидно, только при к = 0,1,...,п — 1. Итак, мы находим п различных корней из а: «*= \[р cos (- + — к] +isin[ - + — к] (к = 0,1,... ,п - 1). \ \п п ) \п п )) В частности, если а = 1, т. е. р = 1 и ф = 0, имеем zk= ^T = cos ( — к) +isin( — к) (к = 0,1,... ,п - 1). \ п J \ п ) Эти точки находятся на единичной окружности в вершинах пра- правильного п-угольника. В связи с геометрической интерпретацией самих комплексных чисел полезно упомянуть о геометрической интерпретации арифметических действий над ними. При фиксированном Ь 6 С сумму z + Ь можно интерпретировать как отображение С в себя, задаваемой формулой z >-> z + b. Это сдвиг плоскости на вектор Ь. При фиксированном а = |a|(cos</? + isin</?) ф 0 произведение az мож- можно интерпретировать как отображение z ^ az С в себя, являющееся композицией растяжения в \а\ раз и поворота на угол ip E Arga. Это видно из формулы (8). ''А. Муавр A667-1754) —английский математик.
312 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 2. Сходимость в С и ряды с комплексными членами. Рассто- Расстояние D) между комплексными числами позволяет определить е-окрест- ность числа zq 6 С как множество {z 6 С | \z — zq\ < e}—это круг (без граничной окружности) радиуса е с центром в точке (хо,уо), если zo = хо + iyo- Будем говорить, что последовательность {zn} комплексных чисел сходится к числу -го 6 С, если lim \zn — zq\ = 0. п—юо Из неравенств тах{|жп - хо\, \уп - Уо|} ^ \zn - zq\ ^ \хп - «o| + \Уп - Уо\ (И) видно, что последовательность комплексных чисел сходится тогда и только тогда, когда сходятся последовательности действительных и мнимых частей членов этой последовательности. По аналогии с последовательностями вещественных чисел последо- последовательность комплексных чисел {zn} называют фундаментальной или последовательностью Коши, если для любого е > 0 найдется номер N 6 N такой, что при п,т > N выполнено \zn — zm\ < e. Из неравенств A1) видно, что последовательность комплексных чи- чисел фундаментальна тогда и только тогда, когда фундаментальны по- последовательности действительных и мнимых частей членов данной по- последовательности. Учитывая критерий Коши для вещественных последовательностей, мы, таким образом, на основании неравенств A1) заключаем, что спра- справедливо следующее Утверждение 1 (критерий Коши). Последовательность компле- комплексных чисел сходится тогда и только тогда, когда она фундамен- фундаментальна. Если сумму ряда комплексных чисел zi + z2 + ... + zn +... A2) понимать как предел его частичных сумм sn = z\ +... + zn при n —» оо, то получаем также критерий Коши сходимости ряда A2). Утверждение 2. Ряд A2) сходится тогда и только тогда, ко- когда для любого е > 0 найдется число N € N такое, что при любых натуральных п^т> N имеем \zm + ...+Zn\<£. A3)
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 313 Отсюда, как, впрочем, и из самого определения сходимости ря- ряда A2), видно, что для сходимости ряда необходимо, чтобы zn -)■ О при п —>■ оо. Как и в вещественном случае, ряд A2) называется абсолютно схо- сходящимся, если сходится ряд -.. A4) Из критерия Коши и неравенства \zm + ... + zn\ ^ \zm\ + ... + \zn\ следует, что если ряд A2) сходится абсолютно, то он сходится. Примеры. Ряды сходятся абсолютно при любом z 6 С, ибо ряды i')i + ll + ^M2 + как мы знаем, сходятся при любом значении \z\ Gi. Заметим, что здесь мы воспользовались равенством \zn\ = \z\n. Пример 4. Ряд 1 + z + z2 + ... сходится абсолютно при \z\ < 1, и его сумма равна s = ^ . При Ы ^ 1 он не сходится, так как в этом случае общий член ряда не стремится к нулю. Ряды вида co+ci(z-zo) + ...+Cn(z-zo)n + ... A5) называют степенными рядами.
314 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Применяя признак Коши (см. гл. III, § 1, п. 4) к ряду Ы + \ci(z - zo)\ + ... + \cn(z - zo)n\ + ..., A6) заключаем, что он сходится, если \z — zo\ < ( lim \Z\cn\ I , / \ -l и его общий член не стремится к нулю, если \z — Zq\ > I lim у\сп\ I . Отсюда получаем следующее Утверждение 3 (формула Коши - Адамара1)). Степенной ряд A5) сходится в круге \z — zo\ < R с центром в точке zq, радиус R которого определяется по формуле Коши-Адамара R= -=Д=г- A7) В любой точке, внешней по отношению к этому кругу, степенной ряд расходится. В любой точке этого круга степенной ряд сходится абсолютно. Замечание. По поводу сходимости на граничной окружности \z — zq\ = R в утверждении 3 ничего не говорится, поскольку здесь воз- возможны все логически допустимые варианты. Примеры. Ряды п=1 оо п=1 оо п=1 сходятся в единичном круге \z\ < 1, но ряд 5) расходится всюду при |г| = 1; ряд 6) расходится при z = 1 и, как можно показать, сходится при z = — 1; ряд 7) сходится абсолютно при \z\ = 1, так как J_ 2 п2' . Адамар A865-1963) —известный французский математик.
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 315 Следует иметь в виду не учтенный в формулировке утверждения 3, но возможный вырожденный случай, когда в формуле A7) R = 0. В этом случае, разумеется, весь круг сходимости вырождается в един- единственную точку zq сходимости ряда A5). Из утверждения 3, очевидно, вытекает Следствие (первая теорема Абеля о степенных рядах). Если сте- степенной ряд A5) сходится при некотором значении z*, то он сходит- сходится и даже абсолютно при любом z, удовлетворяющем неравенству \z-zo\ < \z* -zo\. Те утверждения, которые пока были получены, можно рассматри- рассматривать как простое развитие уже известных нам фактов. Теперь докажем два общих утверждения о рядах, которые мы раньше не доказывали ни в каком виде, хотя частично обсуждали затрагиваемые в них вопросы. Утверждение 4. Если ряд z\ + z<i + ... + zn + ... комплексных чисел сходится абсолютно, то ряд zni +zn2 + .. .+znk + ..., полученный перестановкой1^ его членов, также абсолютно сходится и к той же сумме. оо < Учитывая сходимость ряда 2~2 \zn\, по числу е > 0 найдем номер оо п=1 N е N так, что 2J \zn\ < £■ n=N+l Далее найдем номер if € N так, что среди слагаемых суммы sk = = zni + ... +znk при k > К содержатся все слагаемые, входящие в сумму оо sn = z\ + ... + zn- Если s = J2 zn, то мы получаем, что при к > К п-1 оо оо n=JV+l n=N+l Таким образом, показано, что sk —> s при к —> оо. Если приме- применить уже доказанное к рядам \z\\ + \z2\ + ... + \zn\ + ... и |zni| + + \zn21 + ... + \znk | + ..., получим, что последний ряд сходится. Тем са- самым утверждение 4 доказано полностью. ► ''Членом с номером к (к-ы членом) второго ряда является член гПк с номером Пк исходного ряда. Отображение N Э Ы щ 6 N предполагается биективным отобра- отображением множества натуральных чисел N.
316 ГЛ. У. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Следующее утверждение будет относиться к произведению (ai + а2 + ...+ ап + ...)• (bi + bi + ...+ Ьп + ...) рядов. Вопрос состоит в том, что если мы раскроем скобки и запишем всевозможные попарные произведения atbj, то в них нет естественного порядка суммирования, ибо есть два индекса суммирования. Множе- Множество пар (t,j), где i,j € N, как нам известно, счетно, поэтому можно написать ряд с членами агЬ3, взятыми в некотором порядке. От того, в каком порядке эти члены брать, может зависеть сумма такого ряда. Но, как мы только что видели, в абсолютно сходящихся рядах сумма не зависит от перестановки слагаемых. Таким образом, желательно выяс- выяснить, когда ряд с членами агЬ3 сходится абсолютно. Утверждение 5. Произведение абсолютно сходящихся рядов яв- является абсолютно сходящимся рядом, сумма которого равна произве- произведению сумм перемножаемых рядов. •4 Заметим сначала, что, какую бы конечную сумму ]Г} atbj членов вида агЬ3 мы ни взяли, всегда можно указать N так, что произведение сумм An — ai + ... + un и В^ = 6i + ... + 6jv будет содержать все слагаемые исходной суммы. Поэтому N N N оо оо г=1 оо откуда вытекает абсолютная сходимость ряда ^ alb3, сумма кото- М=1 рого, таким образом, однозначно определена независимо от порядка слагаемых. В таком случае ее можно получить, например, как предел произведения сумм Ап = а\ +... + an, Вп = Ь\ +... + Ьп при п —> оо. Но оо оо АпВп -> АВ при п -> оо, где А = ^ ап и В — ^ Ьп, что и завершает п=1 п=1 доказательство высказанного утверждения 5. ► Рассмотрим важный ОС 00 Пример 8. Ряды Y1 ~га") Z) —,Ьт сходятся абсолютно. В про- п=0 п го=О т- изведении этих рядов будем группировать мономы апЬт с одинаковой
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 317 суммой п + т = к показателей степени. Тогда получим ряд 00 / \ ^ \ ■'—' п\ ml к=0 \п+т=к Но 1 к к\ т+п=к поэтому мы получаем, что п\т\ к\ ^ п\ (к - п)\ к\ п=0 v ' n=0 m=0 fc=0 3. Формула Эйлера и взаимосвязь элементарных функций. В примерах 1) - 3) мы установили абсолютную сходимость в С рядов, полученных распространением в комплексную область тейлоровских разложений функций ех, sin ж, cos ж, определенных на R По этой при- причине естественны следующие определения функций ez, cosz, sinz в С: + ... , A9) B0) B1) Подставим, следуя Эйлеру1), в A9) z = iy. Группируя соответствую- соответствующим образом слагаемые частичных сумм получающегося при этом ря- ряда, найдем, что 1 + j I v.z 2\Z I з uz I 2 + 2!Z + 4!Z I 5 + 5!Z I + 3! — . ^ Л. Эйлер A707- 1783) —выдающийся математик и механик, швейцарец по проис- происхождению, большую часть жизни проживший в Петербурге. По выражению Лапласа, «Эйлер—общий учитель всех математиков второй половины XVIII века».
318 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ т.е. е%у = cos у + г sin у. B2) Это и есть знаменитая формула Эйлера. При ее выводе мы пользовались тем, что г2 = — 1, г3 = —г, г4 = 1, г5 = г и т. д. Число у в формуле B2) может быть как действительньш, так и произвольным комплексным. Из определений B0), B1) видно, что cos(—z) = cosz, sin(—z) = — sinz, т.е. cosz—четная функция, a sinz—нечетная функция. Таким об- образом, е~гу = cos у — г sin у. Сравнивая последнее равенство с формулой B2), получаем (ee). Поскольку у—любое комплексное число, то эти равенства лучше переписать в обозначениях, не вызывающих недоразумений: B3) Таким образом, если принять, что ехр z задается соотношением A9), то формулы B3) (равносильные разложениям B0), B1)), как и формулы B4) можно принять в качестве определений соответствующих круговых и гиперболических функций. Забыв все наводящие и подчас не вполне
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 319 строго обоснованные соображения, относившиеся к тригонометриче- тригонометрическим функциям (которые, однако, привели нас к формуле Эйлера), мож- можно было бы теперь проделать типичный математический трюк, приняв формулы B3), B4) за определения и получить из них уже совсем фор- формально свойства круговых и гиперболических функций. Например, основные тождества cos2 z + sin2 z = 1, ch2 z - sh2 z = 1, как и свойства четности, проверяются непосредственно. Более глубокие свойства, как, например, формулы для косинуса или синуса суммы, вытекают из характеристического свойства показатель- показательной функции exp(zi + z2) = exp(zi) • exp(z2), B5) которое, очевидно, следует из определения A9) и формулы A8). Выве- Выведем формулы для косинуса и синуса суммы. С одной стороны, по формуле Эйлера e.(*i+*2) = cos(Zl + Z2) + isin(Zl + Z2)_ B6) С другой стороны, по свойству показательной функции и формуле Эй- Эйлера = (cos z\ cos Z2 — sin z\ sin Z2) + i (sin z\ cos z2 + cos z\ sin z%). B7) Если бы z\ и Z2 были действительными числами, то, приравнивая действительные и мнимые части чисел из формул B6) и B7), мы уже получили бы искомые формулы. Поскольку мы собираемся доказать их для любых z\, Z2 G С, то, пользуясь четностью cos z и нечетностью sin z, запишем еще одно равенство: ). B8) Сравнивая B7) и B8), находим 1 / \ cos(zi +Z2) = - (el(zl+Z2> + е-гB1+22) j _ coszx C0SZ2 - sinzi sinz2,
320 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ sin(zi + Z2) — — (егB1+*2) - е~г^1+22М = sinzi C0SZ2 + coszi sinz2. Совершенно аналогично можно было бы получить соответствующие формулы для гиперболических функций chz и shz, которые, кстати, как видно из формул B3), B4), связаны с функциями cosz, sinz про- простыми соотношениями ch z = cos iz, shz = — is'miz. Однако получить такие геометрические очевидности, как sinTr = О или cos(z + 2тг) = cosz, из определений B3), B4) уже очень трудно. Значит, стремясь к точности, не следует забывать те задачи, где соот- соответствующие функции естественным образом возникают. По этой при- причине мы не станем здесь преодолевать возможные затруднения в описа- описании свойств тригонометрических функций, связанные с определениями B3), B4), а еще раз вернемся к этим функциям после теории интеграла. Наша цель сейчас состояла только в том, чтобы продемонстрировать замечательное единство, казалось бы, совершенно различных функций, которое невозможно было обнаружить без выхода в область комплекс- комплексных чисел. Если считать известным, что для жбЖ cos (ж + 2тг) = cos х, sin(a; + 2vr) = sin ж, cos 0 = 1, sinO = 0, то из формулы Эйлера B2) получаем соотношение B9) + 1 = 0, в котором представлены важнейшие постоянные различных областей математики A — арифметика, тг — геометрия, е — анализ, i— алгебра). Из B5) и B9), как и из формулы B2), видно, что exp(z + г2тг) = exp z, т. е. экспонента оказывается периодической функцией на С с чисто мнимым периодом Т = г2тг.
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 321 Учитывая формулу Эйлера, тригонометрическую запись G) ком- комплексного числа теперь можно представить в виде z = re где г — модуль числа z, a ip — его аргумент. Формула Муавра теперь становится совсем простой: C0) 4. Представление функции степенным рядом, аналитич- аналитичность. Функция w = f(z) комплексного переменного z с комплексны- комплексными значениями w, определенная на некотором множестве Е С С, есть отображение /: Е —> С. График такой функции есть подмножество в СхС = Е2хЕ2=Ж4и поэтому традиционной наглядности не имеет. Чтобы как-то компенсировать эту потерю, обычно берут два экзем- экземпляра комплексной плоскости Сив одном отмечают точки области определения, а в другом — точки области значений. В рассмотренных ниже примерах указаны область Е и ее образ при соответствующем отображении. Пример 9. iy 1 X \ z t-t z + 1 = w\ Рис. 37. 2 и Пример 10. ш iy i " ■ 1 о! X z *- * z + i '■■ = w iv 2i ■ г 0 и Рис. 38.
322 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 11. гу IV \ Z l-¥ IZ = W \ Рис. 39. Это следует из того, что г = ег%12, z = rellfi и iz — гег^+7Г/2', т.е. произошел поворот на угол ^. Пример 12. Рис. 40. Ибо если z = гег1р, то z2 = г2ег21р. Пример 13. Рис. 41. Пример 14. Рис. 42.
§5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 323 Из примеров 12, 13 понятно, что в данном случае образом единич- единичного круга снова будет единичный круг, но только накрытый в два слоя. Пример 15. Рис. 43. Если z = reiip, то в силу C0) zn = rneinip, поэтому в нашем случае образом круга радиуса г будет круг радиуса гп и каждая точка по- последнего является образом п точек исходного круга (расположенных, кстати, в вершинах правильного п-угольника). Исключение в этом смысле составляет только точка w = 0, прообраз которой есть точка z — 0. Однако при z —> 0 функция zn есть беско- бесконечно малая порядка п, поэтому говорят, что при z = 0 функция имеет нуль порядка п. С учетом такой кратности нуля можно теперь гово- говорить, что число прообразов любой точки w при отображении z *-t zn = = w равно п. В частности, уравнение zn = 0 имеет п совпадающих корней z\ = ... = zn = 0. В соответствии с общим определением непрерывности, функция f(z) комплексного переменного называется непрерывной в точке zq € С, ес- если для любой окрестности V(f(zo)) ее значения f(zo) найдется окрест- окрестность U(zq) такая, что при любом z € U(zo) будет f(z) G V(f(zo))- Короче говоря, Urn /(*) = Производной функции f(z) в точке zq, как и для вещественного слу- случая, назовем величину /W-/W /<(*„)= Шп z - z0 если этот предел существует. Равенство C1) эквивалентно равенству f(z) - f(z0) = f'(zo)(z - zq) + o(z - z0) C1) C2)
324 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ при z -» zo, соответствующему определению дифференцируемости функции в точке Zq. Поскольку определение дифференцируемости в комплексном случае совпадает с соответствующим определением для вещественных функ- функций, а арифметические свойства поля С и поля Ш. одинаковы, то можно сказать, что все общие правила дифференцирования справедливы и в комплексном случае. Пример 16. U+9)'{z)=nz)+gl{z), {f-9)l{z) = f{z)g{z)+f{z)g'{z), поэтому если f(z) = z2, то f'(z) = 1 • z + z • 1 = 2z, или если f(z) = zn, то f'(z) = nzn~l, а если Pn{z) = со + ci(z - z0) + ... + Cn(z - zo)n, TO K - z0) + ... 1 00 Теорема 1. Сумма f(z) = ^2 Cn(z — zo)n степенного ряда—бес- n=0 конечно дифференцируемая функция во всем круге сходимости ряда. При этом шЫ) А: = 0,1,..., п=0 < Выражения для коэффициентов с„ очевидным образом получают- получаются из выражений для f^(z) при к — п w. z — zo- В свою очередь, формулы для f^(z) достаточно проверить только при к = 1, ибо тогда f'(z) снова окажется суммой степенного ряда. 00 Итак, проверим, что функция (p(z) = ^2 ncn(z — zo)n~l действи- действительно является производной для f(z). n=1
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 325 Прежде всего заметим, что в силу формулы Коши-Адамара A7) ра- радиус сходимости последнего ряда совпадает с радиусом сходимости R исходного степенного ряда для f(z). В дальнейшем для упрощения записи будем считать, что zq = 0, т. е. оо оо что f(z) = Yl cnZn, <p{z) = Yl ncnzn~l и ряды сходятся при \z\ < R. 71=0 71=1 Поскольку внутри круга сходимости степенной ряд сходится абсо- абсолютно, можно заметить, и это существенно, что при \z\ ^ г < R спра- оо , а ряд J2 п\сп\г 71=1 n~l ведлива оценка \ncnzn 1| = n|cn||;z|n х ^ nlc^r™ 1 сходится. Значит, для любого е > О найдется номер N такой, что при 7i=7V+l n=N+l Таким образом, с точностью до | функция ip(z) в любой точке круга О \z\ < г совпадает с N-% частичной суммой определяющего ее ряда. Пусть теперь (иг — произвольные точки этого круга. Преобразо- Преобразование С"-*" 71=1 71=1 „n-l и оценка |с„((п 1 + ... + zn г)\ 4, \сп\пгп " позволяют, как и выше, за- заключить, что интересующее нас разностное отношение при |(| < г и z\ < г совпадает, с точностью до f, с iV-й частичной суммой опреде- ляющего его ряда. Значит, при < г и \z\ < г по-п*) с,-* -ф) N N 'I- 71=1 ^ 71=1 Если теперь, фиксировав z, устремить (кг, то, переходя к пределу в конечной сумме, видим, что при ( достаточно близких к г правая часть последнего неравенства, а с нею и левая становятся меньше е. Таким образом, для любой точки г в круге |г| < г < R, а ввиду произвольности г, и для любой точки круга |г| < R проверено, что f'(z) = Ф)- ►
326 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Эта теорема позволяет точно указать тот класс функций, для ко- которых их ряды Тейлора сходятся к ним. Говорят, что функция аналитична в точке zq € С, если в некоторой окрестности этой точки ее можно представить в следующем («анали- («аналитическом») виде: оо f(z) = ^„(z-zo)", 71=0 т. е. как сумму степенного ряда по степеням z — zq. Нетрудно проверить (см. задачу 7), что сумма степенного ряда ана- аналитична в любой внутренней точке круга сходимости этого ряда. С учетом определения аналитичности функции, из доказанной тео- теоремы получаем Следствие, а) Если функция аналитична в точке, то она беско- бесконечно дифференцируема в этой точке и ее ряд Тейлора сходится к ней в окрестности этой точки. Ь) Ряд Тейлора функции, определенной в окрестности точки и бес- бесконечно дифференцируемой в точке, сходится к функции в некоторой окрестности точки тогда и только тогда, когда функция аналитич- аналитична в этой точке. В теории функции комплексного переменного доказывается заме- замечательный факт, не имеющий аналогов для вещественных функций. А именно, оказывается, что если функция f(z) дифференцируема в окрестности точки zq € С, то она аналитична в этой точке. Это и в самом деле удивительно, поскольку в силу доказанной выше теоремы отсюда следует, что если функция f(z) имеет одну производную f(z) в окрестности точки, то в этой окрестности она имеет также произ- производные всех порядков. На первый взгляд это так же неожиданно, как то, что, присоединив к Ш корень i одного конкретного уравнения z2 = — 1, мы получаем по- поле С, в котором любой алгебраический многочлен P(z) имеет корень. Факт разрешимости в С алгебраического уравнения P(z) = О мы соби- собираемся использовать и поэтому докажем его в качестве хорошей иллю- иллюстрации к введенным в этом параграфе начальным представлениям о комплексных числах и функциях комплексного переменного. 5. Алгебраическая замкнутость поля С комплексных чисел. Если мы докажем, что любой полином P{z) = cq + ciz + . .. +cnzn, n ^ 1,
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 327 с комплексными коэффициентами имеет корень в С, то уже не возник- возникнет надобности в расширении поля С, вызванной неразрешимостью в С некоторого алгебраического уравнения. В этом смысле утверждение о наличии корня у любого многочлена P(z) устанавливает алгебраиче- алгебраическую замкнутость поля С. Чтобы получить вполне наглядное представление о том, почему в С любой полином имеет корень, в то время как в Ш его могло не быть, воспользуемся геометрической интерпретацией комплексного числа и функции комплексного переменного. Заметим, что и, следовательно, P(z) = CnZn + o(zn) при \z\ —> сю. Поскольку нас ин- интересует корень уравнения P(z) = О, то, поделив обе части уравнения на Сп, можно считать, что коэффициент с„ многочлена P(z) равен 1 и потому P(z) =zn + o{zn) при \z\ -»• сю. C3) Если вспомнить (см. пример 15), что при отображении z *-> zn окружность радиуса г переходит в окружность радиуса г" с центром в точке 0, то при достаточно больших значениях г, в силу C3), с малой относительной погрешностью образ окружности \z\ — г будет совпа- совпадать с окружностью |гу| = г" плоскости w (рис.44). Во всяком случае, важно, что образом будет кривая, охватывающая точку w = 0. Если круг \z\ ^ r рассма- рассматривать как пленку, натяну- натянутую на окружность \z\ = г, то при непрерывном отображе- отображении, осуществляемом полино- полиномом w = P(z), эта пленка пе- перейдет в пленку, натянутую на образ окружности. Но посколь- поскольку последний охватывает точ- точку w = 0, то некоторая точка этой пленки обязана совпадать с w = 0 и, значит, в круге \z\ < г най- найдется точка zq, которая при отображении w = P(z) перешла именно в w = 0, т. е. P(zQ) = 0. (п = 2) Рис. 44.
328 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Это наглядное рассуждение приводит к ряду очень важных и по- полезных понятий топологии (индекс пути относительно точки, степень отображения) и с помощью этих понятий может быть доведено до пол- полного доказательства, справедливого, как можно понять, не только для полиномов. Однако эти рассмотрения, к сожалению, отвлекли бы нас от основного предмета, которым мы сейчас занимаемся; поэтому мы про- проведем другое доказательство, лежащее в русле тех идей, с которыми мы уже достаточно освоились. Теорема 2. Каждый полином P{z) = Со + C\Z + . . . + CnZn степени n ^ 1 с комплексными коэффициентами имеет в С корень. < Без ограничения общности утверждения теоремы, очевидно, мож- можно считать, что сп = 1. Пусть ц = inf \P{z)\. Поскольку P{z) = zn A + ^ + ... + ^Ч, то y и, очевидно, |-Р(.г)| > max {1,2/х} при \z\ > R, если R достаточно велико. Следовательно, точки последовательности {zk}, в которых 0 < |Р(^)|- — ц < т-, лежат в круге \z\ ^ R. Проверим, что в С (и даже в этом круге) есть точка zo, в ко- которой |-P(zo)| = ц. Для этого заметим, что если Zk = £fc + iyk, то max{|a;fc|, \ук\} ^ \%к\ ^ R и, таким образом, последовательности дей- действительных чисел {хк}, {ук} оказываются ограниченными. Извлекая сначала сходящуюся подпоследовательность {х^} из {хк}, а затем схо- сходящуюся подпоследовательность {j/fc,m} из {ук,}, получим подпоследо- подпоследовательность Zklm = Хк1т +iyklm последовательности {zk}, которая имеет предел lim Zk, = lim %к, +i lim у к, = хо + iyo = *0, и поскольку m-юо m ra->oo m ra->oo 'm ko| при А; —> оо, то |zo| < Д- Чтобы избежать громоздких обо- обозначений и не переходить к подпоследовательностям, будем считать, что уже сама последовательность {zk} сходится. Из непрерывности P(z) в zq G С следует, что lim P{zk) = P(zq). Но тогда1) 1^Обратите внимание — мы, с одной стороны, показали, что из любой ограничен- ограниченной по модулю последовательности комплексных чисел можно извлечь сходящуюся подпоследовательность, а с другой стороны, продемонстрировали еще одно из воз-
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 329 • Теперь предположим, что \i > О, и приведем это предположение к противоречию. Если P{zq) ф О, то рассмотрим полином Q(z) = p/ s° • По построению, Q@) = 1 и \Q(z)\ = ^fcffi* > 1- Поскольку Q@) = 1, полином Q(^) имеет вид Q(z) = 1 + qkzk + qk+izk+1 + ...+ qnzn, гДе \Як\ ф 0 и 1 < к < п. Если % = рег^, то при <р — ж ^ будем иметь qk-(elip)k = ре^е1^-^ = реш = -р = -|%|. Таким образом, при z = re1* получим 1| + ... + \qnzn\) = = 1 - rk{\qk\ ~ r\qk+i\ - ... - г"-*|сь|) < 1, если г достаточно близко к нулю. Но \Q(z)\ ^ 1 при z G С. Полученное противоречие показывает, что P(zq) = 0. ► Замечание 1. Первое доказательство теоремы о разрешимости в С любого алгебраического уравнения с комплексными коэффициента- коэффициентами (которую по традиции часто называют основной теоремой алгебры) было дано Гауссом, который вообще вдохнул вполне реальную жизнь в так называемые «мнимые» числа, найдя им разнообразные и глубокие приложения. Замечание 2. Многочлен с вещественными коэффициентами P(z) = со + • • • + anzn, как мы знаем, не всегда имеет вещественные корни. Однако по отношению к произвольному многочлену с комплекс- комплексными коэффициентами он обладает той особенностью, что если P{zq) = = 0, то и P(zq) = 0. Действительно, из определения сопряженного числа и правил сложения комплексных чисел следует, что {z\ + z-i) = z\ + zi- Из тригонометрической формы записи комплексного числа и правил умножения комплексных чисел видно, что Z2) = можных доказательств теоремы о минимуме непрерывной функции на отрезке, как в данном случае это было сделано в круге \z\ ^ R.
330 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Таким образом, P(zo) -ао + ...+ anZQ = ао + • •. + anZQ =ao + ... + anz^ = P{z0), и если P(z0) = 0, то P(z0) = P(z0) = 0. Следствие 1. Любой многочлен P{z) = cq + ... + cnzn степени n ^s 1 с комплексными коэффициентами допускает, и притом един- единственное с точностью до порядка сомножителей, представление в виде P(z)=Cn(z-zi)...(z-zn), C4) где zi,...,zn E С (и, может быть, не все числа z\,...,zn различны между собой). ■< Из алгоритма деления («уголком») многочлена P(z) на много- многочлен Q(z) степени т ^ п находим, что P(z) = q(z)Q(z) + r(z), где q(z) и r(z)—некоторые многочлены, причем степень r(z) меньше сте- степени Q(z), т.е. меньше т. Таким образом, если т = 1, то r(z) = г — просто постоянная. Пусть z\ —корень многочлена P(z). Тогда P(z) = q(z)(z — z\) +r, и поскольку P{z\) = г, то г = 0. Значит, если Z\—корень многочле- многочлена P(z), то справедливо представление P{z) = (z — z\)q{z). Степень многочлена q(z) равна п — 1, и с ним можно повторить то же самое рассуждение. По индукции получаем, что P(z) — c(z — z{)... (z — zn). ПОСКОЛЬКУ ДОЛЖНО быть CZn = CnZ71, TO С = С„. ► Следствие 2. Любой многочлен P(z) = uq +... + anzn с действи- действительными коэффициентами можно разложить в произведение линей- линейных и квадратичных многочленов с действительными коэффициен- коэффициентами. ■4 Это вытекает из предыдущего следствия 1 и замечания 2, в силу которого вместе с Zk корнем P(z) является также число z^. Тогда, пе- перемножив в разложении C4) многочлена скобки (z—zic)(z—Zk), получим многочлен z2 — (zk + Zk)z + \zk\2 второго порядка с действительными коэффициентами. Число с„, в нашем случае равное ап, вещественное, и его можно внести в одну из скобок разложения, не меняя ее степени. ► Перемножив одинаковые скобки в разложении C4), это разложение можно переписать в виде P{z)=cn(z-z1)kl...(z-zp)k>. C5)
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 331 Число kj называется кратностью корня zr Поскольку P(z) = (z — z3)kiQ(z), где Q{z3) ф О, то P'(z) = kj(z- z3)k'-lQ(z) + (z- z^Q'(z) = (z- Zjp-'Riz), где R(zj) = kjQ(zj) Ф 0. Таким образом, мы приходим к следующему заключению. Следствие 3. Каждый корень z3 многочлена P(z) кратности к3 > > 1 является корнем кратности к3 — 1 многочлена P'(z) —производ- —производной P(z). Не будучи пока в состоянии найти корни многочлена P(z), мы на основании последнего утверждения и разложения C5) можем найти многочлен p(z) = (z—z\)... (z—zp), корни z\,..., zp которого совпадают с корнями P(z), но все они уже кратности 1. Действительно, по алгоритму Евклида сначала найдем многочлен q(z)—наибольший общий делитель P(z) и P'(z). В силу следствия 3, разложения C5) и теоремы 2, многочлен q(z) с точностью до постоян- постоянного множителя равен произведению (z — zi)fcl-1... (z — zp)kp~1, поэто- поэтому, поделив P{z) на q{z), с точностью до постоянного множителя (от которого можно затем избавиться дополнительным делением на коэф- коэффициент при zp) получим многочлен p(z) = (z — z\)... (z — zp). Рассмотрим теперь отношение R(x) = ^4^f двух многочленов, где Ч\х) Q(x) ф const. Если степень Р(х) больше степени Q(x), то, применив ал- алгоритм деления многочленов, представим Р(х) в виде Р(х) = p(x)Q(x)+ + г(х), где р(х) и г(х)—некоторые многочлены, причем степень г(х) уже меньше, чем степень Q(x). Таким образом, получаем представле- представление R(x) в виде R(x) = р(х) + т^гЧ, где дробь jjr\ уже правильная в том смысле, что степень г(х) меньше степени Q(x). Следствие, которое мы сейчас сформулируем, относится к предста- представлению правильной дроби в виде суммы дробей, называемых простей- простейшими. Следствие 4. а) Если Q(z) = (z — z\)kl ... (z — zp)kp и ^4 —пра- —правильная дробь, то существует и притом единственное представление дроби -ЛЦ в виде
332 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Ь) Если Р{х) и Q{x) —многочлены с действительными коэффици- коэффициентами и Q{x) = {x-Xl)kK..{x- xt)k> {x2 + Plx + qi)mi... (x2 pnx то существует и притом единственное представление правильной дроби TvFf в виде Q(x) где а]к, Ъ^к, cjk — действительные числа. Заметим, что универсальным, хотя и не всегда самым коротким способом фактического отыскания разложений C6) или C7) является метод неопределенных коэффициентов, состоящий в том, что сумма в правой части C6) или C7) приводится к общему знаменателю Q(x), после чего приравниваются коэффициенты полученного числителя и соответствующие коэффициенты многочлена Р{х). Система линейных уравнений, к которой мы при этом приходим, в силу следствия 4 всегда однозначно разрешима. Поскольку нас, как правило, будет интересовать разложение кон- конкретной дроби, которое мы получим методом неопределенных коэф- коэффициентов, то кроме уверенности, что это всегда можно сделать, нам от следствия 4 пока ничего больше не требуется. По этой причине мы не станем проводить его доказательство. Оно обычно излагается на алгебраическом языке в курсе высшей алгебры, а на аналитическом языке — в курсе теории функций комплексного переменного. Рассмотрим специально подобранный пример, на котором можно проиллюстрировать изложенное. Пример 17. Пусть Р(х) = 2х6 + Зх5 + 6я4 + 6х3 + Юя2 + Зх + 2, Q(x) = х7 + Зх6 + Ьх5 + 7х4 + 7х3 + Ьх2 + Зх + 1; требуется найти разложение C7) дроби ЛХ1. Прежде всего, задача осложнена тем, что мы не знаем разложе- разложения многочлена Q(x). Попробуем упростить ситуацию, избавившись от
§ 5. КОМПЛЕКСНЫЕ ЧИСЛА И ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ 333 кратности корней Q{x), если таковая имеет место. Находим Q'(x) = 7х6 + 18ж5 + 25я4 + 28ж3 + 21ж2 + Юж + 3. Довольно утомительным, но выполнимым счетом по алгоритму Ев- Евклида находим наибольший общий делитель d(x) = xi + 2хъ + 2х2 + 2х + 1 многочленов Q(x) и Q'(x). Мы выписали наибольший общий делитель с единичным коэффициентом при старшей степени х. Разделив Q(x) на d(x), получаем многочлен q{x) = ж3 + х2 + х + 1, имеющий те же корни, что и многочлен Q{x), но единичной кратности. Корень —1 многочлена q(x) легко угадывается. После деления q(x) на х + 1 получаем х2 + 1. Таким образом, после чего последовательным делением d(x) на х1 + 1 и х + 1 находим разложение d(:r): d(z) = (z + l)V + l), а вслед за этим и разложение Таким образом, в силу следствия 4Ь) ищем разложение дроби ттгл в виде Р(х) _ аи аи Qi3 bnx + сп { + IJ ( + IK 2 + 1 Q(jt) ~ ж + 1 {х + IJ (ж + IK х2 + 1 (ж2 + IJ ' Приводя правую часть к общему знаменателю и приравнивая ко- коэффициенты полученного в числителе многочлена и соответствующие коэффициенты многочлена Р(х), приходим к системе семи уравнений с семью неизвестными, решая которую, окончательно получаем Р(х) 1 2 1 х-1 х + 1 Q(x) х + 1 (а; + IJ ^ (ж + IK х2 + 1 (х2 + 1J'
334 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Задачи и упражнения 1. Используя геометрическую интерпретацию комплексного числа a) поясните неравенства l^i+^l ^ |^i| + |^2| и \zi + .. . + zn\ ^ |zi| + ...+|2n|, b) укажите геометрическое место точек на плоскости С, удовлетворяющих соотношению \z — 1| + \z + 1| ^ 3; c) изобразите все корни степени п из 1 и найдите их сумму; d) поясните действие преобразования плоскости С, задаваемого формулой 2. Найдите суммы: a) 1 + q + ... + qn; b) l + q + ... + qn + ... при \q\ < 1; c) l + elv + ... + etnv; d) l + rellfi + ... + rneinifi; e) 1 + rel<fi + ... + rnein<fi + ... при \r\ < 1; f) 1 + r cosip + ... + rn cosnip; g) 1 + r cosip+ ... + rn cosnip + ... при \r\ < 1; h) 1 + r sin ip + ... + rn sin mp; i) 1 + r sin.(p + ... + rn sinn(p + ... при \r\ < 1. 3. Найдите модуль и аргумент комплексного числа lim (l + £)" и убеди- тесь, что это число есть ez. 4. а) Покажите, что уравнение ew = z относительно w имеет решение w = — ln\z\ + iAigz. Естественно считать w натуральным логарифмом числа z. Таким образом, w = hnz не есть функциональное соотношение, поскольку Argz многозначен. b) Найдите Lnl и Ьпг. c) Положим za = eaLnz. Найдите 1п и г*. d) Используя представление w = sin z = ^-(elz — e~"), получите выражение для z = arcsinz. e) Есть ли в С точки, где | sin jz: j = 2? 5. а) Исследуйте, во всех ли точках плоскости С функция f(z) = ——^ непрерывна. b) Разложите функцию —^ в степенной ряд при zq = 0 и найдите его радиус сходимости. c) Решите задачи а) и Ь) для функции —Ц-^ч где ^ е ^—параметр. Не возникает ли у вас гипотезы относительно того, взаимным расположени- расположением каких точек на плоскости С определяется радиус сходимости? Можно ли было понять это, оставаясь на вещественной оси, т.е. раскладывая функцию —Ц-2, гдеАеМихб!?
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 335 6. а) Исследуйте, является ли непрерывной функция Коши в точке z = 0. b) Будет ли непрерывно ограничение /|r функции / из задачи а) на веще- вещественную ось? c) Существует ли ряд Тейлора функции / из а) в точке zq = 0? d) Бывают ли аналитические в zq £ С функции, ряд Тейлора которых сходится только в точке z<p. оо е) Придумайте степенной ряд 52 cn(z — zo)n, который сходится только в п=0 точке zq. оо 7. а) Выполнив в степенном ряде 52 An(z — а)п формально подстановку п=0 оо z-a= (z—zo) + (zo—а) и приведя подобные члены, получите ряд 52 Cn(z—z0)n п=0 и выражения его коэффициентов через величины Ак, (z0 - а)*, к — 0,1,... b) Проверьте, что если исходный ряд сходится в круге \z - а\ < R, a \zo - а\ = г < R, то ряды, определяющие Сп, п = 0,1,..., сходятся абсолютно оо и ряд ^2 Cn(z — zo)n сходится при \z - zo\ < R - г. n=0 оо c) Покажите, что если f(z) = 52 An(z-a)n в круге \z-a\ < R, & \z0 - а\ < п=0 < R, то в круге \z - zo\ < R — \zo — a\ функция / допускает представление оо /СО =52cn{z- zo)n. n=0 8. Проверьте, что a) когда точка z £ С пробегает окружность \z\ = г > 1, точка w = z + z~l пробегает эллипс с центром 0 и фокусами в точках ±2; b) при возведении комплексных чисел в квадрат, точнее, при отображении w н> w2 такой эллипс переходит в дважды пробегаемый эллипс с фокусом в нуле; c) при возведении комплексных чисел в квадрат любой эллипс с центром в нуле переходит в эллипс с фокусом в нуле. §6. Некоторые примеры использования дифференциального исчисления в задачах естествознания В этом параграфе мы разберем несколько довольно далеких друг от друга по постановке задач естествознания, которые, однако, как выяс- выяснится, имеют довольно близкие математические модели. Модель эта —
336 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ не что иное, как простейшее дифференциальное уравнение для инте- интересующей нас в задаче функции. С разбора одного такого примера- задачи двух тел — мы, кстати, вообще начинали построение дифферен- дифференциального исчисления. Исследование той системы уравнений, которую мы при этом получили, пока нам недоступно. Здесь же будут рассмо- рассмотрены вопросы, которые можно до конца решить уже на нашем ны- нынешнем уровне. Кроме удовольствия увидеть математический аппарат в конкретной работе, из ряда примеров этого параграфа мы, в част- частности, извлечем также дополнительную убежденность как в естествен- естественности возникновения показательной функции ехрж, так и в пользе ее распространения в комплексную область. 1. Движение тела переменной массы. Рассмотрим ракету, пе- перемещающуюся прямолинейно в открытом космосе далеко от притяги- притягивающих масс (рис.45). ТПк Рис. 45. Пусть M(t) —масса ракеты (с топливом) в момент t; V(t) — ее ско- скорость в момент t; ш — скорость (относительно ракеты) истечения топ- топлива из сопла ракеты при его сгорании. Мы хотим установить взаимосвязь между этими величинами. В силу сделанных предположений, ракету с топливом можно рассма- рассматривать как замкнутую систему, импульс (или количество движения) которой поэтому остается постоянным во времени. В момент t импульс системы равен M(t)V(t). В момент t + h импульс ракеты с оставшимся в ней топливом равен M(t+h)V(t+h), а импульс А/ выброшенной за это время массы \АМ\ = = \M(t + h) — M(t)\ = — (M(t + h) — M(t)) топлива заключен в пределах (V(t) - ш)\АМ\ < А/ < (V(t + h)- ш)\АМ\, т.е. А/ = (V(t) — ш)\АМ\ + a(h)\AM\, причем из непрерывности V(t) следует, что a(h) —> 0 при h —> 0. Приравнивая импульсы системы в моменты t и t + h, имеем M(t)V(t) = M(t + h)V(t + h) + (V(t) - ш)\АМ\ + a(h)\AM\,
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 337 или, после подстановки |АМ| = — (M(t + К) — M(t)) и упрощений, M(t + h){V(t + h)-V(t)) = = -uj(M(t + h)- M(t)) + a(h)(M(t + h) - M(t)). Деля последнее равенство на h и переходя к пределу при h -> О, получаем M(t)V'(t) = -u)M'{t). A) Это и есть искомое соотношение между интересующими нас функ- функциями V(t), M(t) и их производными. Теперь надо найти связь между самими функциями V(t), M(t), ис- исходя из соотношения между их производными. Вообще говоря, такого рода задачи много труднее задач нахождения соотношений между про- производными при известных соотношениях между функциями. Однако в нашем случае вопрос решается вполне элементарно. Действительно, после деления на M(t) равенство A) можно перепи- переписать в виде V'(t) = (-ш In M)'(t). B) Но если производные двух функций совпадают на некотором про- промежутке, то на этом промежутке сами функции отличаются разве что на некоторую постоянную. Итак, из B) следует, что V(t) = -colnM(t) + c. C) Если известно, например, что V@) = Vo, то это начальное условие вполне определит константу с. Действительно, из C) находим с = Vb а затем находим искомую формулу1) iffi| D) !'Эта формула иногда связывается с именем К.Э.Циолковского A857-1935) — русского ученого, основоположника теории космических полетов. Но, по-видимому, впервые она была получена русским механиком И. В. Мещерским A859-1935) в его труде 1897 г., посвященном динамике точки переменной массы. 12-4573
338 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Полезно заметить, что если тк — масса корпуса ракеты, тт — мас- масса топлива, а V — конечная скорость, которую приобретает ракета по- после полной отработки топлива, то, подставляя в D) М@) = тк + тпт и M(t) = тк, находим V = Vo+ulnf 1 + — Последняя формула особенно ясно показывает, что на конечной ско- скорости сказывается не столько отношение тт/гак, стоящее под знаком логарифма, сколько скорость истечения ш, связанная с видом топлива. Из этой формулы, в частности, следует, что если Vb = 0, то, чтобы придать скорость V ракете, собственная масса которой тк, необходи- необходимо иметь следующий начальный запас топлива: 2. Барометрическая формула. Так называется формула, указы- указывающая зависимость атмосферного давления от высоты над уровнем моря. Пусть p(h) —давление на высоте h. Поскольку p(h) есть вес столба воздуха над площадкой в 1 см2, расположенной на высоте h, то p(h + Д) отличается от p(h) весом порции газа, попавшей в параллелепипед с основаниями в виде исходной площадки в 1 см2, расположенной на вы- высоте h, и такой же площадки на высоте h + А. Пусть p(h) —плотность воздуха на высоте h. Поскольку p(h) непрерывно зависит от h, то мож- можно считать, что масса указанной порции воздуха может быть вычислена по формуле р(£) г/см3 • 1 см2 • А см = р(£) А г, где £ — некоторый уровень высоты в промежутке от h до /i+A. Значит, вес этой массы1) есть д • Таким образом, Поделив это равенство на А и перейдя к пределу при А —> 0 с учетом того, что тогда и £ —> h, получаем p'(h) = -gP(h). E) пределах наличия заметной атмосферы величину д можно считать постоянной.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 339 Таким образом, скорость изменения давления естественно оказалась пропорциональной плотности воздуха на соответствующей высоте. Чтобы получить уравнение для функции p(h), исключим из E) функ- функцию p(h). В силу закона Клапейрона1) давление р, молярный объем V и температура (по шкале Кельвина2)) Т газа связаны соотношением где R—так называемая универсальная газовая постоянная. Если М — м_ V масса одного моля воздуха, а V — его объем, то р = Щ-, поэтому из F) находим \ М R R RTT Полагая А = -тг?Т, таким образом, имеем P = AGV G) Если теперь принять, что температура описываемых нами слоев возду- воздуха постоянна, то из E) и G) окончательно находим Ah) = -9jP{h). (8) Это дифференциальное уравнение можно переписать в виде или откуда или Множитель ес определяется из известного начального условия р@) = ро, в силу которого ес = ро- PW p(h) (Ьр)'(Л) lnp(h) = p(h) = ё 1 9 A -(-!*)'• :~A +C> С.е-(<?/л)л. ''Б.П.Э.Клапейрон A799-1864)—французский физик, занимавшийся термоди- термодинамикой. 2'У. Томсон (лорд Кельвин) A824-1907)—известный английский физик.
340 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Итак, мы нашли следующую зависимость давления от высоты: (9) Для воздуха при комнатной температуре (порядка 300 К = 27°С) известно значение А«7,7-108 (см/сJ. Известно также, что <7«103см/с2. Таким образом, формула (9) приобретает вполне законченный вид по- после подстановки этих числовых значений д и А. В частности, из (9) видно, что давление упадет в е (й 3) раз на высоте h = ^ = 7,7-105 см = = 7,7 км. Оно возрастет во столько же раз, если опуститься в шахту на глубину порядка 7,7 км. 3. Радиоактивный распад, цепная реакция и атомный ко- котел. Известно, что ядра тяжелых элементов подвержены самопроиз- самопроизвольному (спонтанному) распаду. Это так называемая естественная радиоактивность. Основной статистический закон радиоактивности (справедливый, следовательно, для не слишком малых количеств и концентраций ве- вещества) состоит в том, что количество распадов за малый промежу- промежуток времени h, прошедший от момента t, пропорционально h и количе- количеству N(t) не распавшихся к моменту t атомов вещества, т.е. N(t + h)- N(t) и -\N(t)h, где А > 0 — числовой коэффициент, характерный для данного химиче- химического элемента. Таким образом, функция N(t) удовлетворяет уже знакомому диф- дифференциальному уравнению N'(t) = -XN(t), A0) из которого следует, что N(t) = Noe~xt, где No = N@) — начальное количество атомов вещества. Время Т, за которое происходит распад половины из начального количества атомов, называют периодом полураспада. Величина Т на- находится, таким образом, из уравнения е~лт = ^ т.е. Т = =v=
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 341 Например, для полония Ро210 Т и 138 суток, для радия Ra226 T и и 1600 лет, для урана U235 Т и 7,1 • 108 лет, а для его изотопа U238 Т и 4,5 • 109 лет. Ядерная реакция — это взаимодействие ядер или взаимодействие ядра с элементарными частицами, в результате которого появляют- появляются ядра нового типа. Это может быть ядерный синтез, когда слияние ядер более легких элементов приводит к образованию ядер более тяже- тяжелого элемента (например, два ядра тяжелого водорода дают, с потерей массы и выделением энергии, ядро гелия); это может быть распад ядра и образование ядра (ядер) более легких элементов. В частности, такой распад происходит примерно в половине случаев столкновения нейтро- нейтрона с ядром урана U235. При делении ядра урана образуется 2-3 новых нейтрона, которые могут участвовать в дальнейшем взаимодействии с ядрами, вызывая их деление и тем самым размножение нейтронов. Ядерная реакция такого типа называется цепной реакцией. Опишем принципиальную математическую модель цепной реакции в некотором радиоактивном веществе и получим закон изменения ко- количества N(t) нейтронов в зависимости от времени. Возьмем вещество в виде шара радиуса г. Если г не слишком мало, то за малый промежуток времени h, отсчитываемый от момента t, с одной стороны, произойдет рождение новых нейтронов в количестве, пропорциональном h и N(t), а с другой — потеря части нейтронов за счет их выхода за пределы шара. Если v — скорость нейтрона, то за время h покинуть шар могут только те из них, которые удалены от границы не более чем на рас- расстояние vh, да и то если их скорость направлена примерно по радиусу. Считая, что такие нейтроны составляют неизменную долю от попав- попавших в рассматриваемую зону и что нейтроны в шаре распределены примерно равномерно, можно сказать, что количество теряемых за вре- время h нейтронов пропорционально N(t) и отношению объема указанной приграничной области к объему шара. Сказанное приводит к равенству N(t + h)- N(t) и aN(t)h - -N(t)h A1) г (ибо объем рассматриваемой зоны равен примерно 4тгг2и/1, а объем ша- шара »тгг3). Коэффициенты а и /3 зависят только от рассматриваемого радиоактивного вещества.
342 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Из соотношения A1) после деления на h и перехода к пределу при h —> О получаем , а\ N'(t)=^a-^N(t), A2) откуда Из полученной формулы видно, что при (a — fj > 0 количество нейтронов будет экспоненциально во времени расти. Характер этого роста, независимо от начального условия No, таков, что за очень ко- короткое время происходит практически полный распад вещества с вы- выделением колоссальной энергии — это и есть взрыв. Если (а — f ) < 0, то очень скоро реакция прекращается ввиду того, что теряется больше нейтронов, чем рождается. Если же выполнено пограничное между рассмотренными случаями условие а — f = 0, то устанавливается равновесие между рождением нейтронов и их выходом из реакции, в результате чего их количество остается примерно постоянным. Величина г, при которой а — £ = 0, называется критическим ради- радиусом, а масса вещества в шаре такого объема называется критической массой вещества. Для урана U235 критический радиус равен примерно 8,5 см, а кри- критическая масса около 50 кг. В котлах, где подогрев пара происходит за счет цепной реакции в радиоактивном веществе, имеется искусственный источник нейтро- нейтронов, который доставляет в делящуюся массу определенное количество п нейтронов в единицу времени. Таким образом, для атомного реактора уравнение A2) немного видоизменяется: N'(t) = (а - - J N(t) + п. A3) Это уравнение решается тем же приемом, что и уравнение A2), ибо (а _ 3/)N(t) + п еСТЬ пРоизвоДная Функции q * , \п\(а - |j N(t)+n , если а — f Ф 0. Следовательно, решение уравнения A3) имеет вид Г NQe(^lr)t _ _ji_ Jx _ e(«-/»/r)t] при а - f # 0, No + nt при a — £ = 0.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 343 Из этого решения видно, что если а — £ > 0 (сверхкритическая мас- масса), то произойдет взрыв. Если же масса докритическая, т. е. а — £ < О, то очень скоро будем иметь «-«■ Таким образом, если поддерживать массу радиоактивного вещества в докритическом состоянии, но близком к критическому, то независимо от мощности дополнительного источника нейтронов, т. е. независимо от величины п, можно получить большие значения N(t), а значит, и большую мощность реактора. Удерживание процесса в прикритической зоне — дело деликатное и осуществляется довольно сложной системой автоматического регулирования. 4. Падение тел в атмосфере. Сейчас нас будет интересовать скорость v(t) тела, падающего на Землю под действием силы тяжести. Если бы не было сопротивления воздуха, то при падении с относи- относительно небольших высот имело бы место соотношение v(t) = g, A4) вытекающее из второго закона Ньютона та = F и закона всемирного тяготения, в силу которого при h <C R (R — радиус Земли) _ Mm „Mm Ge Движущееся в атмосфере тело испытывает сопротивление, завися- зависящее от скорости движения, в результате чего скорость свободного па- падения тяжелого тела в атмосфере не растет неограниченно, а уста- устанавливается на некотором уровне. Например, при затяжном прыжке скорость парашютиста в нижних слоях атмосферы устанавливается в пределах 50 - 60 м/с. Для диапазона скоростей от 0 до 80 м/с будем считать силу сопро- сопротивления пропорциональной скорости тела. Коэффициент пропорцио- пропорциональности, разумеется, зависит от формы тела, которую в одних слу- случаях стремятся сделать хорошо обтекаемой (бомба), а в других случа- случаях (парашют) имеют прямо противоположную цель. Приравнивая дей- действующие на тело силы, приходим к следующему уравнению, которому
344 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ должна удовлетворять скорость тела, падающего в атмосфере: mv(t) = тд — av. A5) Разделив это уравнение на т и обозначив —^ через /3, окончательно получаем v(t) = -pv + д. A3') Мы пришли к уравнению, которое только обозначениями отличает- отличается от уравнения A3). Заметим, что если положить —Cv(t) +g = f(i), то, поскольку f'(t) = —Cv'(t), из A3') можно получить равносильное уравнение которое с точностью до обозначений совпадает с уравнением (8) или уравнением A0). Таким образом, мы вновь пришли к уравнению, реше- решением которого является экспоненциальная функция Отсюда следует, что решение уравнения A3') имеет вид «(*) = ~б9 Н а решение основного уравнения A5) имеет вид "(a/m)i, A6) {) g а \ а где vo = и@)—начальная вертикальная скорость тела. Из A6) видно, что при а > 0 падающее в атмосфере тело выходит на стационарный режим движения, причем v(t) « ^g. Таким образом, в отличие от падения в безвоздушном пространстве, скорость падения в атмосфере зависит не только от формы тела, но и от его массы. При а —> 0 правая часть равенства A6) стремится к vo + gt, т. е. к решению уравнения A4), получающегося из A5) при а = 0. Используя формулу A6), можно составить представление о том, как быстро происходит выход на предельную скорость падения в атмо- атмосфере. Например, если парашют рассчитан на то, что человек средней ком- комплекции приземляется при раскрытом парашюте со скоростью поряд- порядка 10 м/с, то, раскрыв парашют после затяжного свободного падения,
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 345 когда скорость падения составляет примерно 50 м/с, он уже через 3 се- секунды будет иметь скорость около 12 м/с. Действительно, из приведенных данных и соотношения A6) находим ^д « 10, ^ и 1, vq = 50 м/с, поэтому соотношение A6) приобретает вид Поскольку е3 rs 20, то при t = 3 получим v ps 12 м/с. 5. Еще раз о числе е и функции ехр х. На примерах мы убеди- убедились (см. также задачи 3, 4 в конце параграфа), что целый ряд явлений природы описывается с математической точки зрения одним и тем же дифференциальным уравнением /'(*) = af(x), A7) решение которого f(x) однозначно определяется, если указано «началь- «начальное условие» /@). Тогда f(x) = f(O)eax. Число е и функцию ех = ехр х мы в свое время ввели довольно фор- формально, сославшись на то, что это действительно важное число и дей- действительно важная функция. Теперь нам ясно, что даже если бы мы не вводили раньше эту функцию, то ее, несомненно, пришлось бы ввести как решение важного, хотя и очень простого уравнения A7). Точнее, достаточно было бы ввести функцию, являющуюся решением уравне- уравнения A7) при некотором конкретном значении а, например при а = 1, ибо общее уравнение A7) приводится к этому случаю после перехода к новой переменной t, связанной с х соотношением х = ^ (а Ф 0). Действительно, тогда ^ 3£ (XX и вместо уравнения f'{x) — af(x) имеем теперь aF'(t) = aF(t), или F'(t) = F(t). Итак, рассмотрим уравнение f(x) = f{x) A8) и обозначим через ехр ж то его решение, для которого /@) = 1.
346 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Прикинем, согласуется ли это определение с прежним определением функции ехр х. Попробуем вычислить значение f(x), исходя из того, что /@) = 1 и / удовлетворяет уравнению A8). Поскольку / — дифференцируемая функция, то / непрерывна, но тогда в силу A8) непрерывна и функ- функция f'(x). Более того, из A8) следует, что / имеет также вторую про- производную f"(x) = f'(x), и вообще из A8) следует, что / — бесконечно дифференцируемая функция. Так как скорость f'(x) изменения функ- функции f(x) непрерывна, то на малом промежутке h изменения аргумента функция /' меняется мало, поэтому f(xo + h) = f(xo) + f'(^)h и f(xo) + +f'(xo)h. Воспользуемся этой приближенной формулой и пройдем отре- отрезок от 0 до а; с малым шагом h = |, где п € N. Если хо = 0, то мы будем иметь f(xk+1)*f(xk)+f'(xk)h. Учитывая A8) и условие /@) = 1, имеем fix) = /(*„) « /(*„_!) + /'(Х„_1)Л = = /(xn_i)(l + Л) « (/(х„_2) + /'(х„_2)Л)A + h) = = /(х„_2)A + hf «... и /(хо)A + h)n = Представляется естественным (и это можно доказать), что чем мельче шаг /г = f, тем точнее приближенная формула /(a;)pa(l + f)". Таким образом, мы приходим к тому, что /(*)= lim n->oo (л\п 1 + = 1 обозначить через е и показать, что е ф 1, то получаем, что f(x) = lim fl + -Г - lim(l + t)x/t = lim [A + *I/4Г = ех, A9) ибо мы знаем, что иа —> va, если и —> и. Метод численного решения дифференциального уравнения A8), поз- позволивший нам получить формулу A9), был предложен еще Эйлером
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 347 и называется методом ломаных Эйлера. Такое название связано с тем, что проведенные выклад- выкладки геометрически означают за- замену решения f(x), точнее, его графика, некоторой аппрокси- аппроксимирующей график ломаной, зве- звенья которой на соответству- соответствующих участках [zjb^fc+i] (А; = = 0,..., п — 1) задаются уравне- уравнениями у = f(xk) + f'(xk)(x - хк) рис. 46. (рис.46). Нам встречалось также оп- оо ределение функции ехрх как суммы степенного ряда Y1 -^хп- К не- У 1 - 0 JT\ 1 i i i i i i i i i h 2h A) i i X 71=0 n! му тоже можно прийти из уравнения A8), если воспользоваться следу- следующим часто применяемым приемом, называемым методом неопреде- неопределенных коэффициентов. Будем искать решение уравнения A8) в виде суммы степенного ряда f(x) = со + с\х B0) коэффициенты которого подлежат определению. Как мы видели (см. § 5, теорема 1), из B0) следует, что Оц = * [ '. Но в силу A8) /@) = /'@) = ... = /(п)@) = • • • и, поскольку /@) = 1, имеем Сп = —, т. е. если решение имеет вид B0) и /@) = 1, то обяза- обязательно /00 = 1 + i|S + 21х +--- + ыж +'" Можно было бы независимо проверить, что функция, определяемая этим рядом, действительно дифференцируема (и не только при х = 0) и что она удовлетворяет уравнению A8) и начальному условию /@) = 1. Однако мы не будем на этом останавливаться, ибо наша цель состояла только в том, чтобы понять, согласуется ли введение экспоненциальной функции как решения уравнения A8) при начальном условии /@) = 1 с тем, что мы раньше подразумевали под функцией ехр х. Заметим, что уравнение A8) можно было бы рассматривать в ком- комплексной области, т. е. считать х произвольным комплексным числом.
348 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ При этом все проведенные рассуждения останутся в силе, быть может, только частично потеряется геометрическая наглядность метода Эй- Эйлера. Таким образом, естественно ожидать, что функция является и притом единственным решением уравнения удовлетворяющим условию /@) = 1. 6. Колебания. Если тело, подвешенное на пружине, отклонить от положения равновесия, например, приподняв, а затем отпустив его, то оно будет совершать колебания около положения равновесия. Опишем этот процесс в общем виде. Пусть известно, что на материальную точку массы т, способную перемещаться вдоль числовой оси Ох, действует сила F = —кх, про- пропорциональная1) отклонению точки от начала координат. Пусть нам известны также начальное положение хо = х@) нашей точки и ее на- начальная скорость vq = х@). Требуется найти зависимость х = x(t) положения точки от времени. В силу закона Ньютона, эту задачу можно переписать в следующем чисто математическом виде: решить уравнение mx(t) = -kx(t) B1) при начальных условиях хо = х@), х@) = vq. Перепишем уравнение B1) в виде x(t) + -x(t) = 0 B2) т и попробуем вновь воспользоваться экспонентой, а именно попробуем подобрать число Л так, чтобы функция x(t) = еЛ* удовлетворяла урав- уравнению B2). ^В случае пружины коэффициент к > 0, характеризующий ее жесткость, назы- называют коэффициентом жесткости пружины.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 349 Подставляя x(t) = ел* в B2), получаем 2 + -) ем = О, ИЛИ А2 + - = 0, B3) т т. е. Ai = —у-щ, Аг = у~щ- Поскольку m > 0, то при к > 0 мы имеем два чисто мнимых числа: Ai = —iy^ и А2 = iy щ- На это мы не рассчитывали, но тем не менее продолжим рассмотрение. По формуле Эйлера = cos J7t + • sin J7t Поскольку при дифференцировании по действительному времени t про- происходит отдельно дифференцирование действительной и мнимой ча- частей функции eAt, то уравнению B2) должны удовлетворять порознь и функция cos у щ t, и функция sin у щ t. И это действительно так, в чем легко убедиться прямой проверкой. Итак, комплексная экспонента по- помогла нам угадать два решения уравнения B2), линейная комбинация которых x(t) = c1coBy/^t + c2any/^t, B4) очевидно, также является решением уравнения B2). Коэффициенты ci, сг в B4) подберем из условий х0 = х@) = сь VO = X(O)= \-С1у/±8Шу/±г + f—U Таким образом, функция yg ^y B5) является искомым решением.
350 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Делая стандартные преобразования, B5) можно переписать в виде *(*) = v^ + Uo2Tsin(у/Иг* + «) . B6) где а = arcsin Таким образом, при к > 0 точка будет совершать периодические колебания с периодом Т = 2тгу ^, т.е. с частотой у = j-y/щ, и ам- амплитудой Jxq + Vq^. Мы утверждаем это потому, что из физических соображений ясно, что решение B5) поставленной задачи единственно. (См. задачу 5 в конце параграфа.) Движение, описываемое функцией B6), называют простыми гармо- гармоническими колебаниями, а уравнение B2) — уравнением гармонических колебаний. Вернемся теперь к случаю, когда в уравнении B3) к < 0. Тогда две функции eAlt = ехр (-у-ш t), eAat = exp (y-^t) будут веществен- вещественными решениями уравнения B2) и функция x(t) = CleAlt + c2eA2t B7) также будет решением. Постоянные с\ и сг подберем из условий f Хо = х@) = С\ +С2, vq — х@) — ciAi + сгАг- Полученная система всегда однозначно разрешима, ибо ее опреде- определитель Аг — Ai Ф 0. Поскольку числа Ai и Аг противоположного знака, то из B7) видно, что при к < 0 сила F = — кх не только не стремится вернуть точку в положение равновесия х = 0, но со временем неограниченно уводит ее от этого положения, если хо или vq отлично от нуля. То есть в этом случае х = 0 — точка неустойчивого равновесия. В заключение рассмотрим одну вполне естественную модификацию уравнения B1), на которой еще ярче видна польза показательной функ- функции и формулы Эйлера, связывающей основные элементарные функции.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 351 Предположим, что рассматриваемая нами частица движется в сре- среде (воздухе или жидкости), сопротивлением которой пренебречь нельзя. Пусть сила сопротивления среды пропорциональна скорости точки. То- Тогда вместо уравнения B1) мы должны написать уравнение mx(t) = —ax(t) — kx(t), которое перепишем в виде x(t) + -x(t) + -x(t) = 0. B8) т т Если вновь искать решение в виде x(t) = ел', то мы придем к ква- квадратному уравнению А2 + — А + — = 0, ТП ТП корни которого Ai>2 = -^ ± Va22m Случай, когда а2 — Атк > 0, приводит к двум вещественным корням Ai, A2, и решение может быть найдено в виде B7). Мы рассмотрим подробнее более интересный для нас случай, ко- когда о? — Атк < 0. Тогда оба корня Ai, A2 комплексные (но не чисто мнимые!): _ а . 1 = ~2^~г а . у/4тк — а2 а . л/4тк — а2 + Формула Эйлера в этом случае дает eAlt = ехр ( t) (coswt — isincot), eAat = ехр (— -—t) (cos tot + i si \ 2m / где w = * "I —. Таким образом, мы находим два вещественных решения ехр (~^-ч coswt, ехр \~^-ч sinwt уравнения B8), угадать которые было бы уже довольно трудно. Затем ищем решение исходной задачи в виде их линейной комбинации (OL \ — -—t) (ci coswt + С2 sinwt), B9)
352 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ подбирая ci и С2 так, чтобы удовлетворить начальным условиям ж@) = = х0, х@) = vq. Получающаяся при этом система уравнений, как можно проверить, всегда однозначно разрешима. Таким образом, после преобразований из B9) получаем решение задачи в виде x(t) = Аехр (-~t) sm(wt + a), C0) где А и а — константы, определяемые начальными условиями. Из этой формулы видно, что благодаря множителю expf— £-tY где а > О, т > 0, в рассматриваемом случае колебания будут зату- затухающими, причем скорость затухания амплитуды зависит от отноше- отношения щ. Частота колебаний ^-ш = ^~У ш ~ {^ц) меняться во времени не будет. Величина ш тоже зависит только от отношений щ, щ, что, впрочем, можно было предвидеть на основании записи B8) исходного уравнения. При а = 0 мы вновь возвращаемся к незатухающим гармо- гармоническим колебаниям B6) и уравнению B2). Задачи и упражнения 1. Коэффициент полезного действия реактивного движения. a) Пусть Q—химическая энергия единицы массы топлива ракеты, и> — Скорость истечения топлива. Тогда iu>2 есть кинетическая энергия выбро- выброшенной единицы массы топлива. Коэффициент а в равенстве |ш2 = aQ есть коэффициент полезного действия процессов горения и истечения топлива. Для твердого топлива (бездымный порох) w = 2 км/с, Q = 1000ккал/кг, а для жид- жидкого (бензин с кислородом) и> = 3 км/с, Q = 2500 ккал/кг. Определите в этих случаях коэффициент а. b) Коэффициент полезного действия (к. п. д.) ракеты определяется как от- ношение ее конечной кинетической энергии тпк тр к химической энергии сго- сгоревшего топлива thtQ. Пользуясь формулой D), получите формулу для к. п. д. ракеты через тпц, тпт, Q и а (см. а)). c) Оцените к. п. д. автомобиля с жидкостным реактивным двигателем, если автомобиль разгоняется до установленной в городе скорости 60 км/час. d) Оцените к. п. д. ракеты на жидком топливе, выводящей спутник на низ- низкую околоземную орбиту. e) Оцените, для какой конечной скорости реактивное движение на жидком топливе имеет наибольший к. п. д.
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 353 f) Укажите, при каком отношении масс тт/тпц топлива и корпуса к. п. д. ракеты с любым видом топлива становится максимально возможным. 2. Барометрическая формула. a) Используя данные п. 2 настоящего параграфа, получите формулу по- поправочного члена для учета зависимости давления от температуры столба воздуха, если эта температура подвержена изменениям (например, сезонным) в пределах ±40 °С. b) Найдите по формуле (9) зависимость давления от высоты при темпера- температурах -40 °С, 0°С, 40 °С и сравните эти результаты с результатами, которые дает ваша приближенная формула из а). c) Пусть температура воздуха в столбе меняется с высотой по закону Т'(Н) = —аТ0, где Го—температура воздуха на поверхности Земли, а а и « 7- 10~7см. Выведите при этих условиях формулу зависимости давления от высоты. d) Найдите давление в шахте на глубинах 1км, Зкм, 9 км по формуле (9) и по формуле, которую вы получили в с). e) Воздух независимо от высоты примерно на 1/5 часть состоит из кисло- кислорода. Парциальное давление кислорода составляет также примерно 1/5 часть давления воздуха. Определенный вид рыб может жить при парциальном да- давлении кислорода не ниже 0,15 атмосфер. Можно ли ожидать, что этот вид встретится в реке на уровне моря? Может ли он встретиться в речке, впада- впадающей в озеро Титикака на высоте 3,81 км? 3. Радиоактивный распад. a) Измеряя количество радиоактивного вещества и продуктов его распада в пробах пород Земли и считая, что сначала продукта распада вообще не бы- было, можно примерно оценить возраст Земли (во всяком случае, с того момента, когда это вещество уже возникло). Пусть в породе имеется m г радиоактивно- радиоактивного вещества и г г продукта его распада. Зная период Г полураспада вещества, найдите время, прошедшее с момента начала распада, и количество радиоак- радиоактивного вещества в пробе того же объема в начальный момент. b) Атомы радия в породе составляют примерно 10~12 часть всех атомов. Каково было содержания радия 105, 106 и 5 • 109 лет тому назад? E • 109 лет ориентировочно считается возрастом Земли.) c) В диагностике заболеваний почек часто определяют способность по- почек выводить из крови различные специально вводимые в организм веще- вещества, например креатин («клиренс тест»). Примером, иллюстрирующим обрат- обратный процесс того же типа, может служить восстановление концентрации ге- гемоглобина в крови у донора или у больного, внезапно потерявшего много крови. Во всех этих случаях уменьшение количества введенного вещества (или, наоборот, восстановление недостающего количества) подчиняется за- закону N = ЛГое~(/г, где N — количество (или, иными словами, число молекул) вещества, еще оставшегося в организме по прошествии времени t после введе- введения количества No, a r—так называемая постоянная времени: это время, по
354 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ прошествии которого в организме остается 1/е часть первоначально введенно- введенного количества вещества. Постоянная времени, как легко проверить, в 1,44 раза больше времени полужизни (или времени полураспада), по истечении которо- которого в организме остается половина первоначального количества вещества. Пусть радиоактивное вещество выводится из организма со скоростью, ха- характеризуемой постоянной времени то, и в то же время спонтанно распадается с постоянной времени тр. Покажите, что в этом случае постоянная временит, характеризующая длительность сохранения вещества в организме, определя- определяется из соотношения г = т^1 + т~г. d) У донора было взято некоторое количество крови, содержащее 201мг железа; для того чтобы компенсировать потерю железа, ему было велено при- принимать трижды в день в течение недели таблетки сернокислого железа, со- содержащие каждая 67 мг железа. Количество железа в крови донора восста- восстанавливается до нормы по экспоненциальному закону с постоянной времени, равной примерно семи суткам. Полагая, что с наибольшей скоростью желе- железо из таблеток включается в кровь сразу же после взятия крови, опреде- определите, какая примерно часть железа, содержащегося в таблетках, включит- включится в кровь за все время восстановления нормального содержания железа в крови. e) Больному со злокачественной опухолью было введено с диагностиче- диагностическими целями некоторое количество радиоактивного фосфора Р32, после че- чего через равные промежутки времени измерялась радиоактивность кожи бе- бедра. Уменьшение радиоактивности подчинялось экспоненциальному закону. Так как период полураспада фосфора известен — он составляет 14,3 суток,— по полученным данным можно было определить постоянную времени процес- процесса уменьшения радиоактивности за счет биологических причин. Найдите эту постоянную, если наблюдениями установлено, что постоянная времени про- процесса уменьшения радиоактивности в целом составляет 9,4 суток (см. выше задачу с)). 4. Поглощение излучения. Прохождение излучения через среду сопровождается частичным поглоще- поглощением излучения этой средой. Во многих случаях (линейная теория) можно счи- считать, что, проходя через слой толщиной 2 единицы, излучение ослабляется так же, как при последовательном прохождении через два слоя толщиной 1 каждый. a) Покажите, что при указанном условии поглощение излучения подчиня- подчиняется закону / = Ioe~kl, где /о — интенсивность излучения, падающего на по- поглощающее вещество, / — интенсивность после прохождения слоя толщиной /, а к— коэффициент, имеющий размерность, обратную размерности длины. b) Коэффициент к в случае поглощения света водой в зависимости от дли- длины волны падающего света, например, таков: ультрафиолет, /г = 1,4-10~2см~1; синий, А; = 4,6-10~4см~1; зеленый, /г = 4,4-10~4см~; красный, /г = 2,9-10"~3см~1. Солнечный свет падает вертикально на поверхность чистого озера глуби-
§ 6. ПРИМЕРЫ ПРИЛОЖЕНИЙ В ЗАДАЧАХ ЕСТЕСТВОЗНАНИЯ 355 ной 10 м. Сравните интенсивности каждой из перечисленных выше компонент солнечного света над поверхностью озера и на дне. 5. Покажите, что если закон движения точки х = x(t) удовлетворяет урав- уравнению тх + кх = 0 гармонических колебаний, то a) величина Е = W + кх W постоянна (Е = К + U — сумма кинетиче- кинетической К = 2 W и потенциальной U = х^ ' энергий точки в момент t); b) если ж@) = 0 и ±@) = 0, то x(t) = 0; c) существует и притом единственное движение х = x(t) с начальными условиями ж@) = Жо и х@) = Vo- d) Проверьте, что если точка движется в среде с трением и х = x(t) удо- удовлетворяет уравнению тх+ах+кх — 0, а > 0, то величина Е (см. а)) убывает. Найдите скорость этого убывания и объясните физический смысл полученно- полученного результата, учитывая физический смысл величины Е. 6. Движение под действием гуковской1^ центральной силы (плоский ос- осциллятор). В развитие рассмотренного в п. 6 и задаче 5 уравнения B1) линейного ос- осциллятора рассмотрим уравнение mr(t) = —kr(t), которому удовлетворяет радиус-вектор r(t) точки массы т, движущейся в пространстве под действи- действием притягивающей центральной силы, пропорциональной (с коэффициентом пропорциональности к > 0) расстоянию \r(t)\ от центра. Такая сила возни- возникает, если точка соединена с центром гуковской упругой связью, например пружиной с коэффициентом жесткости к. a) Продифференцировав векторное произведение r(t) x r(t), покажите, что все движение будет происходить в плоскости, проходящей через центр и содержащей векторы го = r(to), Го = r(to) начального положения и начальной скорости точки (плоский осциллятор). Если векторы го = r(to), Го = r(to) коллинеарны, то движение будет происходить на прямой, содержащей центр и вектор Го (линейный осциллятор, рассмотренный в п. 6). b) Проверьте, что орбитой плоского осциллятора является эллипс и дви- движение по нему периодично. Найдите период обращения. c) Покажите, что величина Е = mr2(t) + kr2(t) сохраняется во времени. d) Покажите, что начальные данные го = T*(to), го = r(to) вполне опреде- определяют дальнейшее движение точки. 7. Эллиптичность планетных орбит. Предыдущая задача позволяет рассматривать движение точки под дей- действием центральной гуковской силы происходящим в плоскости. Пусть это !'Р. Гук A635-1703)—английский естествоиспытатель, разносторонний ученый и экспериментатор. Открыл клеточное строение тканей и ввел сам термин «клет- «клетка». Стоял у истоков математической теории упругости и волновой теории света, высказал гипотезу тяготения и закон обратных квадратов для гравитационного вза- взаимодействия.
356 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ плоскость комплексной переменной z = х + iy. Движение определяется двумя вещественными функциями х = x(t), у = y(t) или, что то же самое, одной комплекснозначной функцией z — z(t) времени t. Полагая для простоты в за- задаче 6 т = 1, к = 1, рассмотрим простейший вид уравнения такого движения z(t) = -z(t). a) Зная из задачи 6, что решение этого уравнения, отвечающее конкрет- конкретным начальным данным z<$ = z(to), zq = z(to), единственно, найдите его в виде z(t) = C\ext + c<2.e~%t и, используя формулу Эйлера, проверьте еще раз, что траекторией движения является эллипс с центром в нуле (в определенных случаях он может превратиться в окружность или выродиться в отрезок— выясните когда). b) Учитывая, что величина |i(i)|2 + |.г(£)|2 не меняется в процессе движе- движения точки z(t), подчиненного уравнению z(t) = — z(t), проверьте, что точка w(t) = z2(t) по отношению к новому параметру (времени) т, связанному с t со- соотношением т = r(t) таким, что -^ = |г(£)|2, движется при этом, подчиняясь уравнению —§■ = —с-^, где с — постоянная, a w = w(t(r)). Таким образом, движения в центральном поле гуковских сил и движения в ньютоновском гра- гравитационном поле оказались взаимосвязаны. c) Сопоставьте это с результатом задачи 8 из § 5 и докажите теперь элли- эллиптичность планетных орбит. d) Если вам доступен компьютер, то, взглянув еще раз на изложенный в п. 5 метод ломаных Эйлера, для начала подсчитайте этим методом несколь- несколько значений еж. (Заметьте, что кроме определения дифференциала, точнее, формулы f(xn) ш f(xn-i) + f'(xn-i)h, где h = xn — жп-ь метод ничего не использует.) Пусть теперь r(t) = (x(t),y(t)), r0 = r@) = A,0), r0 = r@) = @,1) и r(i) = — г^3. Опираясь на формулы r{tn) « r(tn-l) + »(*„_!)ft, v(tn) ps v(tn-i) + a(tn_i)ft, где v(t) = r(t), a(t) = v(t) = r(t), методом Эйлера рассчитайте траекторию движения точки, посмотрите, какой она формы и как она проходится точкой с течением времени. § 7. Первообразная В дифференциальном исчислении, как мы убедились на примерах предыдущего параграфа, наряду с умением дифференцировать функ- функции и записывать соотношения между их производными весьма цен- ценным является умение находить функции по соотношениям, которым
§ 7. ПЕРВООБРАЗНАЯ 357 удовлетворяют их производные. Простейшей, но, как будет видно из дальнейшего, весьма важной задачей такого типа является вопрос об отыскании функции F(x) по известной ее производной F'(x) = f(x). Начальному обсуждению этого вопроса и посвящен настоящий пара- параграф. 1. Первообразная и неопределенный интеграл Определение 1. Функция F(x) называется первообразной функ- функцией или первообразной по отношению к функции /(ж) на некотором промежутке, если на этом промежутке функция F дифференцируема и удовлетворяет уравнению F'(x) = f(x) или, что то же самое, соотно- соотношению dF(x) = f(x) dx. Пример 1. Функция F(x) = arctgx является первообразной для f(x) = 2 на всей числовой прямой, поскольку arctg'x = ——^. Пример 2. Функция F(x) = arcctg | является первообразной для функции f(x) = 2 как на промежутке всех положительных чисел, так и на полуоси отрицательных чисел, ибо при х ф О „,/ г 1 ( W 1 Как обстоит дело с существованием первообразной и каково мно- множество первообразных данной функции? В интегральном исчислении будет доказан фундаментальный факт о том, что любая непрерывная на промежутке функция имеет на этом промежутке первообразную. Мы приводим этот факт для информации читателя, а в этом пара- параграфе используется, по существу, лишь следующая, уже известная нам (см. гл. V, § 3, п. 1) характеристика множества первообразных данной функции на числовом промежутке, полученная из теоремы Лагранжа. Утверждение 1. Если F\{x) и ^(ж) —две первообразные функ- функции f(x) на одном и том же промежутке, то их разность Fi(x)—F2(x) постоянна на этом промежутке. Условие, что сравнение Fi и F^ ведется на связном промежутке, как отмечалось при доказательстве этого утверждения, весьма суще- существенно. Это можно заметить также из сопоставления примеров 1 и 2,
358 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ в которых производные функций Fi(x) = arctgrc и ^(ж) = arcctg | совпадают в области К \ 0 их совместного определения. Однако Fi(x) — F2(x) — arctgx — arcctg - = arctgrc — arctgx = 0, x если x > 0, в то время как F\ (х) — 2*2 (ж) = —7Г при х < 0, ибо при х < О имеем arcctg ^ = 7Г + arctgrc. Как и операция взятия дифференциала, имеющая свое название «дифференцирование» и свой математический символ dF(x) = F'(x)dx, операция перехода к первообразной имеет свое название «неопределен- «неопределенное интегрирование» и свой математический символ f(x)dx, A) называемый неопределенным интегралом от функции f(x) на заданном промежутке. Таким образом, символ A) мы будем понимать как обозначение лю- любой из первообразных функции / на рассматриваемом промежутке. В символе A) знак / называется знаком неопределенного интеграла, / — подынтегральная функция, a f(x)dx — подынтегральное выраже- выражение. Из утверждения 1 следует, что если F(x) — какая-то конкретная первообразная функции /(ж) на промежутке, то на этом промежутке B) т. е. любая другая первообразная может быть получена из конкрет- конкретной F(x) добавлением некоторой постоянной. Если F'(x) = f(x), т.е. F — первообразная для / на некотором про- промежутке, то из B) имеем dff(x)dx = dF(x) = F'(x)dx = f(x)dx. C) Кроме того, в соответствии с понятием неопределенного интеграла как любой из первообразных, из B) следует также, что fdF(x)= f F'(x)dx = F(x)+C. D)
§ 7. ПЕРВООБРАЗНАЯ 359 Формулы C) и D) устанавливают взаимность операций дифферен- дифференцирования и неопределенного интегрирования. Эти операции взаимно обратны с точностью до появляющейся в формуле D) неопределенной постоянной С. До сих пор мы обсуждали лишь математическую природу посто- постоянной С в формуле B). Укажем теперь ее физический смысл на про- простейшем примере. Пусть точка движется по прямой так, что ее ско- скорость v(t) известна как функция времени (например, v(t) = v). Если x(t)—координата точки в момент t, то функция x(t) удовлетворяет уравнению x(t) = v(t), т.е. является первообразной для v(t). Можно ли по скорости v(t) в каком-то интервале времени восстановить положение точки на оси? Ясно, что нет. По скорости и промежутку времени можно определить величину пройденного за это время пути s, но не положе- положение на оси. Однако это положение также будет полностью определено, если указать его хотя бы в какой-то момент, например при t = 0, т. е. задать начальное условие ж@) = хо- До задания начального условия за- закон движения x(t) мог быть любым среди законов вида x(t) = x(t) + с, где x(t)—любая конкретная первообразная функции v(t), а с — произ- произвольная постоянная. Но после задания начального условия х@) — хо вся неопределенность исчезает, ибо мы должны иметь ж@) = х@) +с = Хо, т.е. с = хо — 5@), и x(t) = Хо + [x(t) — х@)]. Последняя формула вполне физична, поскольку произвольная первообразная х участвует в форму- формуле только в виде разности, определяя пройденный путь или величину смещения от известной начальной метки х@) = Хо- 2. Основные общие приемы отыскания первообразной. В со- соответствии с определением символа A) неопределенного интеграла, он обозначает функцию, производная которой равна подынтегральной функции. Исходя из этого определения, с учетом соотношения B) и законов дифференцирования можно утверждать, что справедливы сле- следующие соотношения: a. / (аи(х) + Cv(x)) dx = a u(x) dx + /? / v(x) dx + с. E) b. / (uv)'(x) dx — u'(x)v(x) dx + u(x)v'(x) dx + с F) c. Если на некотором промежутке 1Х I f(x)dx = F(x)
360 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ а <р: It -» Ix —гладкое (т. е. непрерывно дифференцируемое) отобра- отображение промежутка It в 1Х, то /' G) Равенства E), F), G) проверяются прямым дифференцированием их левой и правой частей с использованием в E) линейности диффе- дифференцирования, в F) правила дифференцирования произведения и в G) правила дифференцирования композиции функций. Подобно правилам дифференцирования, позволяющим дифференци- дифференцировать линейные комбинации, произведения и композиции уже извест- известных функций, соотношения E), F), G), как мы увидим, позволяют в ряде случаев сводить отыскание первообразной данной функции либо к построению первообразных более простых функций, либо вообще к уже известным первообразным. Набор таких известных первообразных мо- может составить, например, следующая краткая таблица неопределенных интегралов, полученная переписыванием таблицы производных основ- основных элементарных функций (см. § 2, п. 3): ха dx = —^— xa+l + с (аф1), 1 , , . . — ах = ш \х\ + с, х та ех dx — ех + с, sin х dx = — cos x + с, cos x dx = sinrc + с, - dx = tg x + c, @ < а ф 1), —5— dx = — ctg x + c, sin ж
§ 7. ПЕРВООБРАЗНАЯ 361 arcsin ж + с, arccos ж + с, { arctg ж + с, arcctg х + с, /1 (arcsi \/1-ж2 1 -аг -ж2 <te = -ln ж 1-ж Каждая из этих формул рассматривается на тех промежутках ве- вещественной оси М, на которых определена соответствующая подынте- подынтегральная функция. Если таких промежутков несколько, то постоянная с в правой части может меняться от промежутка к промежутку. Рассмотрим теперь некоторые примеры, показывающие соотноше- соотношения E), F) и G) в работе. Сделаем предварительно следующее общее замечание. Поскольку, найдя одну какую-нибудь первообразную заданной на промежутке функции, остальные можно получить добавлением посто- постоянных, то условимся для сокращения записи всюду в дальнейшем произ- произвольную постоянную добавлять только к окончательному результату, представляющему из себя конкретную первообразную данной функции. а. Линейность неопределенного интеграла. Этот заголовок должен означать, что в силу соотношения E) первообразную от ли- линейной комбинации функций можно искать как линейную комбинацию первообразных этих функций.
362 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 3. ... + апхп) dx — / = ао / 1 dx + а\ / xdx + ... + an / xndx = Пример 4. 1 \ 2 = с + аох + -^o-ix2 + ... Ч —а„жп+1. = [x2dx + 2 ( xx'2dx + f-dx=-xs + -x3/2 + ln\x\+c. J J J x 3 3 Пример 5. / cos2 — dx = / -A 4- cos ж) dx = - / A + cos ж) dx = = - / 1 dx + - I cos x dx = -x + - sm x + с b. Интегрирование по частям. Формулу F) можно переписать в виде u(x)v(x) = / и(ж) dv(x) + / и( или, что то же самое, в виде / u(x)dv(x) = u(x)v(x) — / v(x)du(x) + с. F') Это означает, что при отыскании первообразной функции u(x)vf(x) дело можно свести к отысканию первообразной функции v(x)u'(x), пе- перебросив дифференцирование на другой сомножитель и частично про- проинтегрировав функцию, как показано в F'), выделив при этом член u(x)v(x). Формулу F') называют формулой интегрирования по частям. Пример 6. /Inxdx = х\пх — xdlnx = xlnx — x ■ — dx = J J x — / ldx = xlnx — x + с. I
§ 7. ПЕРВООБРАЗНАЯ 363 Пример 7. fx2exdx = fx2dex = x2ex- f ex dx2 = x2ex - 2 f xex dx = = x2ex - 2 f xdex = x2ex - 2 (xex - I exdx) = = x2ex - 2xex + 2ex + c= (x2 -2x + 2)ex + с с. Замена переменной в неопределенном интеграле. Фор- Формула G) показывает, что при отыскании первообразной функции {f °ip)(t) ■ ip'(t) можно поступать следующим образом: = J f(<p(t)) dcp(t) = = I f(x) dx = F(x) + с = F(v(t)) + c, т.е. сначала произвести замену tp(t) = x под знаком интеграла и перей- перейти к новой переменной х, а затем, найдя первообразную как функцию от х, вернуться к старой переменной t заменой х = ip(t). Пример 8. Пример 9. [J?L= f dx f d^ I sinx J 2sin|cos| J tg|cos2| /du f d(tg и) _ Г dv _ tg и cos2 и J tg и J v = ln\v\ + с = ln\tgu\ + с = In X c. Мы рассмотрели несколько примеров, в которых использовались по- порознь свойства а, Ь, с неопределенного интеграла. На самом деле в боль- большинстве случаев эти свойства используются совместно.
364 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пример 10. / sin2xcos3xdx = - / (sin5a; — sinx)dx = = - I / sin 5x dx — / sin x dx ) = - I - / sin bx dEx) + cos x ) = 2\У J J 2 \o J 1 /• , 1 1 1 = — / sm uou + - cos ж = — — cos ж + - cos x + с = 10 1 1 = - cos x cos bx + с Пример 11. / arcsinxdx = xarcsinx — xdarcsinx = f x д • 1 f d(l - x2) = x arcsin x — / dx = x arcsin x + — / . - = = xarcsina; + - / u~1'2du = xarcsina; + и1'2 + с = = x arcsin x + v 1 — x2 + с Пример 12. /eax cos bxdx = - / cos to de01 = aj = -eax cosbx / eaxdcosbx = -eax cosbx + - / eax sinbx dx = a a J a a J — -eax cos bx + —z I sinbx deax = -eax cos bx + —^eax sinbx — a a2 J a a2 b f ax j • l acosbx+ bsinbx ax b2 f о / e xdsmbx = ^ eax ^ / eox cosbx dx. a2 J a2 a2 J Из полученного равенства заключаем, что „_ , a cos bx + b sin bx „_ eox cos Ьж da; = ъ—т^ ea + с. aJ + Ы2 К этому результату можно было бы прийти, воспользовавшись фор- формулой Эйлера и тем обстоятельством, что первообразной функции
§ 7. ПЕРВООБРАЗНАЯ 365 е(а+гЬ)х _ еах CQg ох _|_ ^ax gjn ^ является функция (a+ib)x п — 10 (g+jb)x . -l 9 . l9е а + го ас + о* acosbx + bsinbx . a sin for — b cos for = 2 ь2 e Jrl 2 "is, e ' Это полезно иметь в виду и в будущем. При вещественном х это лег- легко проверить непосредственно, продифференцировав действительную и мнимую части функции Ja+ib)x^ В частности, отсюда получаем также, что ат . , , asinfor — bcosbx ar еах smbxdx = ^—-^ еах + с. а1 + сг Уже этот небольшой набор разобранных примеров показывает, что при отыскании первообразных даже элементарных функций часто при- приходится прибегать к дополнительным преобразованиям и ухищрениям, чего совсем не было при отыскании производных композиции тех функ- функций, производные которых нам были известны. Оказывается, это не случайная трудность. Например, в отличие от дифференцирования, пе- переход к первообразной элементарной функции может привести к функ- функции, которая уже не является композицией элементарных. Поэтому не следует отождествлять фразу «найти первообразную» с невыполнимым порой заданием «выразить первообразную данной элементарной функ- функции через элементарные функции». Вообще, класс элементарных функ- функций— вещь очень условная. Имеется еще много важных для приложений специальных функций, которые изучены и затабулированы ничуть не хуже, чем, скажем, sinrr или ех. Например, интегральный синус Si ж есть та первообразная f ^|^ dx функции ^|^, которая стремится к нулю при х —t 0. Такая первообраз- первообразная существует, но, как и любая другая первообразная функции ^^, она не является композицией элементарных функций. Аналогично, функция [ cos х kj\x = / dx, выделяемая условием Cia; —>• 0 при х —>• оо, не является элементарной. Функция Ci:r называется интегральным косинусом.
366 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Первообразная / j-^ функции j^ также неэлементарна. Одна из первообразных этой функции обозначается символом Их и называется интегральным логарифмом. Она удовлетворяет условию Их —> 0 при х —t +0. (Подробнее о специальных функциях Si ж, Cia;, Их будет ска- сказано в гл. VI, §5.) Учитывая эти трудности отыскания первообразных, составлены до- довольно обширные таблицы неопределенных интегралов. Однако, чтобы успешно ими воспользоваться или чтобы не прибегать к ним, если во- вопрос совсем прост, необходимо иметь некоторые навыки обращения с неопределенными интегралами. Дальнейшая часть этого параграфа посвящена интегрированию некоторых специальных классов, первообразные которых выражают- выражаются в виде композиции элементарных функций. 3. Первообразные рациональных функций. Рассмотрим во- вопрос об интегралах вида Г R(x) dx, где R(x) = -^±4 есть отношение полиномов. Если действовать в области вещественных чисел, то, не выходя за пределы поля вещественных чисел, любую такую дробь, как известно из алгебры (см. формулу C7) из §5, п. 4), можно разложить в сумму Q{x) где р(х) — многочлен (он появляется при делении Р(х) на Q(x), только если степень Р(х) не меньше степени Q(x)), а3к, Ь3к, с3к — однозначно определяемые действительные числа, a Q(x) = (х — x\)kl ... (х — x{)kl x X (х2 +р\х + qi)mi ... (х2 +рпх + <7n)mn- О том, как строить разложение (8), мы уже говорили в §5. После того как разложение (8) построено, интегрирование функции R(x) сво- сводится к интегрированию отдельных слагаемых. Многочлен мы уже интегрировали в примере 1, поэтому остается рассмотреть только интегрирование дробей вида 1 Ьх + с , „т и (х — а)к (х2 +рх
§ 7. ПЕРВООБРАЗНАЯ 367 Вопрос о первой из этих дробей решается сразу, ибо (9) (х - а)к \ln\x-a\ + c при к = 1. С интегралом Г J (x Ьх + С dx +px + q)k поступим следующим образом. Представим многочлен x2+px+q в виде (х + |р J + (q — ip2 J, где q — ^р2 > 0, так как многочлен х2 + рх + q не имеет вещественных корней. Полагая х + ^р = и и q — ip2 = a2, получаем /Ьх + с _ Г (x2+px + q)X J (« аи + C 2+a2)fc ' где a = Ь, /3 = с- |bp. Далее, Г и , 1 fd(u2 + a2) I —~ г du = — I — = i / 2 _i_ «2\fc О / /2 _i_ 2^fc при ^1, (ю) + a2) при /с = 1, и остается разобраться с интегралом 4= Л 21U- (и) У (u2 + a2)fc Интегрируя по частям и делая элементарные преобразования, имеем т — [ ^и _ и Г и2 du к~ J (и2 + а2)к = (и2 + а2)к+ J (u2 + a2)fc+i = = 7T^ + ^ f {f2+/l -f du = —g— + ЗД - 2ka%+1, (u2 + al)k J (ul + az)k+1 (ul + a2)k откуда следует рекуррентное соотношение 1 и 2к -1 + ( '
368 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ позволяющее понижать степень к в интеграле A1). Но 1\ легко вычи- вычислить: h = [ 2^ 2=- f ^4т =-arctg-+ c; A3) J и1 + a1 aj /u\2 a a M таким образом, используя A2) и A3), можно вычислить также перво- первообразную A1). Итак, мы доказали следующее Утверждение 2. Первообразная любой рациональной функции R(x) = тт?Ц выражается через рациональные функции, а также транс- трансцендентные функции In и arctg. Рациональная часть первообразной, будучи приведена к общему знаменателю, должна в качестве таково- такового иметь произведение всех сомножителей, на которые раскладыва- раскладывается многочлен Q{x), только с кратностями на единицу меньшими, чем кратность их вхождения в разложение Q(x). тт -.о о Г 2х2 + 5х Пример 13. Вычислим / —х — J (х2 -1)(х Поскольку подынтегральная функция является правильной дробью и разложение знаменателя в произведение (х — 1)(х + 1)(х + 2) тоже известно, то сразу ищем разложение А В С + гтт + zrrt A4) dx. (х-1)(х + 1)(х + 2) х-1 х + 1 х + 2 нашей дроби в сумму простейших дробей. Приведя правую часть равенства A4) к общему знаменателю, имеем 2х2 + Ъх + 5 _ (А + В + С)х2 + (ЗА + В)х + BА -2В-С) Приравнивая соответствующие коэффициенты числителей, получаем систему А + В + С = 2, ЗА + В = 5, 2А-2В-С = 5, из которой находим (А, В, С) = B, —1,1).
§ 7. ПЕРВООБРАЗНАЯ 369 Заметим, что в данном случае эти числа можно было бы найти и в уме. Действительно, домножая A4) на х — 1 и полагая затем в получен- полученном равенстве х = 1, справа получим А, а слева—значение при х = 1 дроби, полученной из нашей вычеркиванием в знаменателе сомножи- сомножителя х — 1, т.е. А = 2+ g 5 = 2. Аналогично можно было бы найти В и С. Итак, Г 2х2 + Ьх + Ь _ Г dx Г dx Г dx _ J (x*-l)(x + 2)dX~ J х~^Т~ J xTT + J x~+2~ = 2 In \x - 1| - In \x + 1| + In \x + 2| + с = In c. Пример 14. Вычислим первообразную функции R(x) = — Прежде всего заметим, что дробь не является правильной, поэтому, раскрыв скобки и найдя знаменатель дроби Q(x) = х6 — 2х5 + Зх4 — - 4ж3 + Зх2 — 2х + 1, делим на него числитель, после чего получаем _ , . X X ~\~ X fix ZiX Д()+ Д(')=Ж+ (х- 1)^ + 1)* ' а затем уже ищем разложение правильной дроби х5 - х4 + х3 - Зх2 - 2х _ А В Cx + D Ex + F (х-1)Цх2 + 1J ~ (х - IJ + ~x~^i + (х2 + IJ + х2 + 1 ' ( } Конечно, разложение можно найти каноническим путем, выписав систему шести уравнений с шестью неизвестными. Однако вместо это- этого мы продемонстрируем иные, иногда используемые, технические воз- возможности. Коэффициент А находим, домножив равенство A5) на (х — IJ и положив затем х = 1: А = — 1. Перенесем дробь ^ с Уже известным значением А = — 1 в левую (х- 1) часть равенства A5). Тогда получим х4 + х3 + 2х2 + х - 1 _ В Cx + D Ex + F (х-1)(х2 + 1J ~х~^Т+(х2 + 1J+ х2 + 1 ' ( ' откуда, домножая A6) на х — 1 и полагая затем х — 1, находим В = 1. 13-4573
370 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Перенося теперь дробь —i— в левую часть равенства A6), получим х2 + х + 2 _ Cx + D Ex + F (х2 + IJ ~ (х2 + IJ х2 + 1 ■ ( ?) Приводя правую часть равенства A7) к общему знаменателю, при- приравниваем числители х2 + х + 2 = Ex3 + Fx2 + (С + Е)х + (D + F), откуда следует, что Е 0 D + F = 2, или (C,D,E,F) = A,1,0,1). Теперь нам известны все коэффициенты в равенстве A5). Первые две дроби при интегрировании дают соответственно —^- и In |ат — 1|. Далее, Г Сх + Р _ Г х + 1 J (x2 + lJdX~J (x2 + lJdX~ 1 fd(x2 + l) Г dx -1 2 У (х2 + IJ У (х2 + IJ 2(х2 + 1) + 2) где , dx 1 х 1 h / что следует из A2) и A3). Наконец, —т.—— dx = —^—- dx = arctg x. X "Г 1 J X т X Собирая все интегралы, окончательно имеем _12 1 х 3 Рассмотрим теперь некоторые часто встречающиеся неопределен- неопределенные интегралы, вычисление которых может быть сведено к отысканию первообразной рациональной функции.
§ 7. ПЕРВООБРАЗНАЯ 371 4. Первообразные вида / iZ(cosaj, sin ж) da;. Пусть R(u,v) — рациональная функция от и и и, т. е. отношение QV ' ( полиномов, явля- являющихся линейными комбинациями мономов umvn, где т = О,1,..., п = = 0,1,... Для вычисления первообразной / i?(cos x, sin x) dx существует не- несколько приемов, из которых один — вполне универсальный, хотя и не всегда самый экономный. а. Сделаем замену t = tg ^. Поскольку l-tg2f 2tg| cosa; = 2х , sina; = 1-^-, dx , 2dt dt = =-=-, т.е. dx = 7Г7-, 2 cos2 | 1 + tg2 | то г f (l-t1 2t \ I R(cosx, sina;) dx = / R I ^, -^ I - J J \l + rl + i/l и дело свелось к интегрированию рациональной функции. Однако такой путь часто приводит к очень громоздкой рациональ- рациональной функции, поэтому следует иметь в виду, что в ряде случаев суще- существуют и другие возможности рационализации интеграла. Ь. В случае интегралов вида J R(cos2 x,sin2 x) dx или J r(tgx)dx, где r(u) — рациональная функция, удобна подстановка t = tgx, ибо 2 ! -2 tg2;r COS X — 7j—, Sin X = s—, 1 -1- tc т 1 -I- f о* т* dx , dt dt = —JT-i T-e- dx= л , 2 !a; l + tg2a; Выполнив указанную подстановку, получим соответственно 7*4i + *2'i+<Vi+B' / r(tga;) dx = I r(t) —
372 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ с. В случае интегралов вида / i?(cos х, sin2 x) sin x dx или / R(cos2 x, sin x) cos x dx можно внести функции sin x, cos ж под знак дифференциала и сделать замену t — cos х или t = sin x соответственно. После замены эти инте- интегралы будут иметь вид - / R(t, 1 - t2) dt или / R(l - t2, t) dt. Пример 15. Г dx Г 1 2dt J 3 + sina; J 3-|—IL^. 1 + t2 = 2 —5 = 3u 1 3< + l 1 3 tg | +1 + t + t Здесь мы воспользовались универсальной заменой t — tg |. Пример 16. Г da; _ Г dx J (sin x + cos жJ У cos2a;(tga; + IJ dtgx Г dt 1 1 — ' — +c = c — = f dtgx Г J (tgx+1J J (tgs+1J J (t + 1J t + 1 1 + tgx1 Пример 17. /dx _ f dx _ 2sin23a;-3cos23a; + l ~/ cos2 3x B tg2 3x - 3 + A + tg2 Зх)) ~ = 3J 3tg23a;-2 = 3/ 3^2 - 2 = 3^ 1 Г du _ 1 ~ 3\/бУ u2-l~ 6v^ J2 3 «-1 с =
§ 7. ПЕРВООБРАЗНАЯ 373 In t+1 In tgtx- c. Пример 18. /cos3x fcos2xdsm.x _ f(l — t2)dt sin7x J sin7x J t7 ~ J ^ ~ ' ~~6 4 4 sin x 6 sinb x 5. Первообразные вида / R(x,y(x)) dx. Пусть, как и в пунк- пункте 4, R(x, у) — рациональная функция. Рассмотрим некоторые специ- специальные первообразные вида R(x,y(x))dx, где у = у(х) — функция от х. Прежде всего, ясно, что если удастся сделать замену х = x(t) так, что обе функции х = x(t) и у = y(x(t)) окажутся рациональными функ- функциями от t, то x'(t) —тоже рациональная функция и J' = JR{x{t),y{x(t)))x'{t)dt, т. е. дело сведется к интегрированию рациональной функции. Мы рассмотрим следующие специальные случаи задания функции у = у(х). а. Если у = у %^ji где n G N, то, полагая tn = СХ ~т~ & получаем d-tn-b х = a-c-tn' y и подынтегральное выражение рационализируется. Пример 19. dt =
374 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 4- I 4- О / _ -' 1-^3 +*-27 {1_t){1+t + t2)- _ _t Г ( 1 2 + t \ , _ ~ l-tz~ J V3(!-*) ~ 3(l+t + t2)) *~ b. Рассмотрим теперь случай, когда у = у/ах2 + Ъх + с, т.е. речь идет об интегралах вида / Д (х,у/ах'1 + Ьх + с) dx. Выделяя полный квадрат в трехчлене ах2 + Ьх + с и делая соот- соответствующую линейную замену переменной, сводим общий случай к одному из следующих трех простейших: f R (t, Vt2 + l) dt, I R (t, V*2^1!) dt, f R (t, vT3^) dt. A8) Для рационализации этих интегралов теперь достаточно положить соответственно y/t2 + 1 = tu + 1, или yjt2 + 1 = tu - 1, или \/<2 + 1 = t - и; Vt2-1 = u(t - 1), или Vt2-l = u(t + l), или \/<2 - 1 = t - и; y/1-t2 = и{\ - t), или y/l-t2 = u(l + t), или у/1 - t2 = tu± 1. Эти подстановки были предложены еще Эйлером (см. задачу 3 в конце параграфа). Проверим, например, что после первой подстановки мы сведем пер- первый интеграл к интегралу от рациональной функции.
§ 7. ПЕРВООБРАЗНАЯ 375 В самом деле, если \ft2 + 1 = tu +1, то t2 +1 = t2u2 + 2tu +1, откуда 2u и, в свою очередь, * ~ 1 - и2 't2 + 1 = u2 1-u2' Таким образом, t и \/i2 + 1 выразились рационально через и, а сле- следовательно, интеграл привелся к интегралу от рациональной функции. Интегралы A8) подстановками t = ship, t — chip, t = simp (или t = cos ip) соответственно приводятся также к тригонометрической форме / R(sh ip, ch ip) ch ip dip, / R(ch ip, sh ip) sh ip dip и / i?(sin ip, cos ip) cos ip dip или — / i?(cos ip, sin ip) sin ip dip. _= /* dt T У t-l + V^TT' Полагая \/^2 + 1 = и — t, имеем 1 — и2 — 2tu, откуда t — Поэтому =— 1 1 /• 1 1 2 u-1 и — + C. 2u Теперь остается проделать обратный путь замен: и = t + Vt2 + 1 и
376 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ с. Эллиптические интегралы. Очень важными являются также первообразные вида R (х, л/Р[х)\ dx, I где Р(х)—многочлен степени п > 2. Такой интеграл, как было покат зано Абелем и Лиувиллем, вообще говоря, уже не выражается через элементарные функции. При п = 3 и п = 4 интеграл A9) называется эллиптическим, а при п > 4 — гиперэллиптическим. Можно показать, что общий эллиптический интеграл элементарны- элементарными подстановками с точностью до слагаемых, выражающихся через элементарные функции, приводится к следующим трем стандартным эллиптическим интегралам: dx у/A-Х2)A-к2Х2У x2dx I B1) B2) где h и к — параметры, причем во всех трех случаях параметр к лежит в интервале ]0,1[. Подстановкой х — cos ip эти интегралы можно свести к следующим каноническим интегралам или их комбинациям: B3) y/l - к2 sin2 ip' 1-к2 sin2 <pd<p, B4) dip A-h sin2 <p) \/l — k2 sin2 ip B5) Интегралы B3), B4), B5) называются соответственно эллиптиче- эллиптическими интегралами первого, второго и третьего рода (в форме Ле- жандра). Через F(k, ip) и E(k, ip) обозначают эллиптические интегралы
§ 7. ПЕРВООБРАЗНАЯ 377 B3) и B4) первого и второго рода соответственно, выделяемые усло- условиями F(k, 0) = 0 и Е(к, 0) = 0. Функции F(k,ip), E(k,ip) часто используются, и потому состав- составлены достаточно подробные таблицы их значений для 0 < к < 1 и 0^ Эллиптические интегралы, как показал Абель, естественно рассма- рассматривать в комплексной области, в неразрывной связи с так называе- называемыми эллиптическими функциями, которые соотносятся с эллиптиче- эллиптическими интегралами так же, как, например, функция sin^? с интегралом du. Задачи и упражнения 1. Метод Остроградского1) выделения рациональной части интеграла от правильной рациональной дроби. Пусть п}х\ — правильная рациональная дробь; q(x) — многочлен, имею- щий те же корни, что и Q(x), но кратности 1; Q\{x) = Покажите, что а) Имеет место следующая формула Остроградского: где of)' T) —правильные рациональные дроби, причем / ЩЦ dx — транс- трансцендентная функция. (В силу этого результата дробь ^Уч в B6) называется рациональной ча- стъю интеграла J o)xl dx.) Щх) Ь) В формуле Р(х) /Pi(z)Y , Р(х) ( Q(x) \Qi(x) полученной дифференцированием формулы Остроградского, дробь ( 1Г< j после надлежащих сокращений приводится к знаменателю Q(x). с) Многочлены q(x), Q\(x), а затем и многочленыр(х), Pi(x) можно найти алгебраическим путем, даже не зная корней многочлена Q(x). Таким обра- образом, рациональную часть интеграла B6) можно полностью найти, даже не вычислив всей первообразной. Х'М. В. Остроградский A801 -1861) —выдающийся русский механик и математик, один из инициаторов прикладного направления исследований в Петербургской ма- математической школе.
378 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ d) Выделите рациональную часть интеграла B6), если Р(х) Q(x) = 2х6 = Х7 + + 3х5 Зх6 + + 6х4 5х5 + + 6х3 7х4 + + 10х2 7х3 + + 3х 5х2 + + 2, Зх (см. пример 17 в § 5 этой главы). 2. Пусть ищется первообразная R(cosx, sinx)dx, B7) j —рационал Покажите, что где Щи, v) = дГ'7—рациональная функция a) если R(—u,v) = R(u,v), то R(u,v) имеет вид R\(u2,v); b) если R(—u,v) = —R(u,v), то R(u, v) = u-R2(u2,v) и подстановка t = sin ж рационализирует интеграл B7); c) если R(—u, —v) = R(u,v), то R(u,v) = Rz (%,v2) и подстановка t — tga; рационализирует интеграл B7). 3. Интегралы вида R (x, Vax2 + bx + cj dx. B8) a) Проверьте, что интеграл B8) приводится к интегралу от рациональной функции следующими подстановками Эйлера: t = Vax2 + bx + с ± у/ах, если о > О, t = <JXX ~ д1, если xi, Х2 — действительные корни трехчлена ах2 +Ьх + с. b) Пусть (хо,2/о)—точка кривой у2 = ох2 +Ьх + с, a t — угловой коэф- коэффициент прямой, проходящей через точку (хо,уо) и пересекающей кривую в некоторой точке (х, у). Выразите координаты (х, у) через (хо, Уо) и t и свяжите эти формулы с подстановками Эйлера. c) Кривая, задаваемая алгебраическим уравнением Р(х,у) = 0, называ- называется уникурсальной, если она допускает параметрическую запись х = х(£), У = y(t) при помощи рациональных функций х(£), y(t). Покажите, что инте- интеграл / R(x,y(x))dx, где R(u,v)—рациональная функция, а у(х)—алгебраи- у(х)—алгебраическая функция, удовлетворяющая уравнению Р(х, у) = 0, задающему уникур- сальную кривую, приводится к интегралу от рациональной функции. d) Покажите, что интеграл B8) всегда можно свести к вычислению инте- интегралов следующих трех типов: Р(х) f dx lax2 + bx + с J (x — xo)fc • Vax2 + bx + с (Ax + В) dx (x2 + px + q)m ■ Vax2 + bx + с
§ 7. ПЕРВООБРАЗНАЯ 379 4. а) Покажите, что интеграл {a + bxn)pdx /■ от дифференциального бинома, где т, п,р — рациональные числа, приводится к интегралу [{а + bt)pt" dt, B9) где р, q — рациональные числа. Ь) Интеграл B9) выражается через элементарные функции, если одно из трех чисел р, q, p + q — целое. (П. Л. Чебышёв показал, что других случаев, при которых бы интеграл B9) выражался в элементарных функциях, не суще- существует.) 5. Эллиптические интегралы. a) Любой многочлен третьей степени с действительными коэффициентами имеет вещественный корень х0 и заменой х — хо = t2 приводится к многочлену вида t2{at4 + bt3 +ct2 +dt + e), где а ф 0. b) Функция R (x, y/P(x) J, где R(u,v)—рациональная функция, а Р — полином степени 3 или 4, приводится к виду R\ (t, y/at* + bt3 + ... + e), где c) Многочлен четвертой степени ах4 + Ьх3 + ... + е представляется в виде / 1 \ / 9 \ " Ctt + 3 произведения а(х +pix + qi)(x +p2X + q2) и заменой х = . *: всегда может , (Mi + Nit2) (Mo + N2t2) быть приведен к виду i—*—-—j—и—|_z—£—L. {■yt + 1) d) Функция R (x, Vax4 + bx3 + ... + e) заменой х = t~^_i может быть при- приведена к виду Ri (t, e) Функция R (x,y/y) может быть представлена в виде суммы Ri(x,y) + + 2^", где R\ и Лг — рациональные функции. у/У f) Любая рациональная функция может быть представлена как сумма чет- четной и нечетной рациональных функций. g) Если рациональная функция R(x) четна, то она имеет вид г(х2), а если нечетна, то вид хг(х2), где г(х)—рациональная функция. h) Любая функция R (x, ,Jy) приводится к виду R2(x2,y) R3(x2,y) y) + + X i) Любой интеграл вида / R (х, у/Р{х)) dx, где Р(х) — многочлен четвер-
380 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ той степени, с точностью до элементарных слагаемых приводится к интегралу r{t2)dt I где r(t) — рациональная функция, А = ±1. j) Если \mi | > |тг| > 0, то одной из замен вида y/m,\t = x, y/m,\t = л/1 — я2, y/m,\t = . х , y/m,\t = . интеграл J . г' ) . приводит- приводится к виду / Г 2 а 2 ' где 0 < ^ < 1) a f — рациональная функция, к) Выведите формулы понижения показателей In, m для интегралов x2ndx f dx Г x2ndx Г 1) Любой эллиптический интеграл J В.(х,л/Р(х)) dx, где Р — полином четвертой степени, с точностью до слагаемых, представля- представляющихся в виде элементарных функций, приводится к одному из трех канони- канонических интегралов B0), B1), B2). ш) Интеграл / / з выРазите через канонические эллиптические инте- интегралы. п) Выразите через эллиптические интегралы первообразные функций Vcos 2х л/cos а — cos x 6. Используя вводимые ниже обозначения, найдите с точностью до линей- линейной функции Ах + В первообразные следующих неэлементарных специальных функций: /ех — dx (интегральная экспонента); dx (интегральный синус); х \ ГЛ-1 \ [ COSX Л t \ с) Ci(x) = / dx (интегральный косинус); /СП Пр dx (интегральный гиперболический синус); х e) Chi(x) = / dx (интегральный гиперболический косинус); J % f) S(x)= fsinx2dx 1 ^ p > (интегралы Френеля); g) C(x) = I cosx2dx\
§ 7. ПЕРВООБРАЗНАЯ 381 h) Ф(х) = I e x dx (интеграл Эйлера-Пуассона); i) li(x) = / (интегральный логарифм). У lni 7. Проверьте, что с точностью до постоянной справедливы следующие ра- равенства: a) Ei(x) = li(e*); c) Shi(x) = I[Ei(x) - Ei(-x)]; d) Ei{ix) = Ci{x) + iSi{x); e) ein/4 (xe~in/4) = C{x) + iS{x). 8. Дифференциальное уравнение вида dy ^ f(x) dx g{y) называют уравнением с разделяющимися переменными, поскольку его можно переписать в виде 9(У) dy = f{x) dx, в котором переменные х иу разделены. После этого уравнение можно решить: f f / 9\У) dy = f(x) dx + c, вычислив соответствующие первообразные. Решите уравнения a) 2х3уу' + у2 = 2; b) хуу' = \/1 + х2; c) у' = cos(y + х), положив и(х) = у(х) + х; d) x2y' — cos 2y = 1 и выделите то решение, которое удовлетворяет условию у(х) -> 0 при х -> +оо; e) У{х) = ВД; 9. Парашютист прыгнул с высоты 1,5 км, а раскрыл парашют на высо- высоте 0,5 км. Сколько времени он падал до раскрытия парашюта? Предельную скорость падения человека в воздухе нормальной плотности принять равной 50 м/с. Решите задачу в предположении, что сопротивление воздуха пропор- пропорционально a) скорости; b) квадрату скорости. Изменением давления с высотой пренебречь.
382 ГЛ. V. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 10. Известно, что скорость истечения воды из небольшого отверстия в дне сосуда достаточно точно может быть вычислена по формуле 0,6л/2дН, где д — ускорение силы тяжести, а Н — высота уровня воды над отверстием. Цилиндрический бак поставлен вертикально и имеет отверстие в дне. По- Половина воды из полного бака вытекает за 5 мин. За какое время вытечет вся вода? 11. Какую форму должен иметь сосуд, являющийся телом вращения, что- чтобы при истечении из него воды уровень воды понижался равномерно? (Исход- (Исходные данные см. в задаче 10.) 12. В рабочее помещение вместимостью 104 м3 через вентиляторы в 1 ми- минуту подается 103м3 свежего воздуха, содержащего 0,04% СОг, и одновре- одновременно такое же количество смеси выводится из помещения. В 9 часов утра в помещение входят служащие, и через полчаса содержание ССЬ в воздухе повышается до 0,12 %. Оцените содержание углекислого газа в помещении к 2 часам дня.
ГЛАВА VI ИНТЕГРАЛ § 1. Определение интеграла и описание множества интегрируемых функций 1. Задача и наводящие соображения. Пусть точка движется вдоль числовой оси, s(t)—ее координата в момент t, a v(t) = s'(t) — ее скорость в тот же момент t. Предположим, что мы знаем положе- положение s(to) точки в момент to и к нам поступают данные о ее скорости. Располагая ими, мы хотим вычислить s(t) для любого фиксированного значения t > to- Если считать скорость v(t) меняющейся непрерывно, то смещение точки за малый промежуток времени приближенно можно вычислить как произведение v(r)At скорости в произвольный момент т, относя- относящийся к этому промежутку времени, на величину At самого промежут- промежутка. Учитывая это замечание, разобьем отрезок [to,t], отметив некото- некоторые моменты ti (i = О,..., п), так, что to < t\ < ... < tn = t, и так, что промежутки [<j_i,<j] малы. Пусть Ati = U — U-i и т* € [ti-i,U], тогда имеем приближенное равенство s(t)-s(t0) & По нашим представлениям, это приближенное равенство будет уточ- уточняться, если переходить к разбиениям отрезка [to, t] на всё более мелкие промежутки. Таким образом, надо полагать, что в пределе, когда ве- величина А наибольшего из промежутков разбиения стремится к нулю,
384 ГЛ. VI. ИНТЕГРАЛ получим точное равенство hm А-Ю г=1 г = s(t) - s(t0). A) Это равенство есть не что иное, как фундаментальная для всего анализа формула Ньютона - Лейбница. Она позволяет, с одной сторо- стороны, численно находить первообразную s(t) по ее производной v(t), ас другой стороны, по найденной каким-либо способом первообразной s(t) п функции v(t) найти стоящий слева предел сумм £] и(гг)Д*г. г=1 Такие суммы, называемые интегральными суммами, встречаются в самых разнообразных случаях. Попробуем, например, следуя Архимеду, найти площадь под па- параболой у = х2 над отрезком [0,1] (рис.47). Не останавливаясь здесь на подробном обсуждении понятия площади фигуры, о котором речь будет идти несколько позже, мы, как и Архимед, будем действовать ме- методом исчерпания фигуры посредством простей- простейших фигур — прямоугольников, площади кото- которых мы вычислять умеем. Разбив отрезок [0,1] точками 0 = хо < Х\ < ... < хп = 1 на мелкие отрезки [аг,_1,ж,], мы, очевидно, можем прибли- приближенно вычислить искомую площадь а как сум- сумму площадей изображенных на рисунке прямо- прямоугольников: Рис. 47. t=l здесь Ахг = хг — xt-\. Полагая }{х) = х2 и £г = жг-ъ мы перепишем полученную формулу в виде t=i В этих обозначениях в пределе будем иметь B) г=1
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 385 где, как и выше, А—длина наибольшего из отрезков [xt-i,xt] раз- разбиения. Формула B) только обозначениями отличается от формулы A). За- Забыв на миг о геометрическом смысле /(&), Джг и считая х временем, а /(ж) скоростью, найдем первообразную F(x) функции /(ж) и тогда по формуле A) получим, что а = F(l) — .F(O). В нашем случае /(ж) = ж2, поэтому F(x) = ^ж3 + с и а = F(l) — - F@) — g. Это и есть результат Архимеда, который он получил пря- прямым вычислением предела в B). Предел интегральных сумм называется интегралом. Таким обра- образом, формула A) Ньютона - Лейбница связывает интеграл и первооб- первообразную. Перейдем теперь к точным формулировкам и проверке того, что на эвристическом уровне было получено выше из общих соображений. 2. Определение интеграла Римана а. Разбиения Определение 1. Разбиением Р отрезка [a,b], a < Ь, называется конечная система точек хо,...,хп этого отрезка такая, что а = жо < < xi < ... < хп = Ъ. Отрезки [ж,_1, ж,] (г = 1,..., п) называются отрезками разбиения Р. Максимум Х(Р) из длин отрезков разбиения называется параме- параметром разбиения Р. Определение 2. Говорят, что имеется разбиение (Р, £) с отме- отмеченными точками отрезка [а,Ь], если имеется разбиение Р отрезка [а, Ь] и в каждом из отрезков [ж,_1,ж,] разбиения Р выбрано по точке i Набор (£i,..., £п) обозначается одним символом £. Ь. База в множестве разбиений. В множестве V разбиений с отмеченными точками данного отрезка [а, Ь] рассмотрим следующую базу В = {Д*}. Элемент Д*, d > 0, базы В есть совокупность всех тех разбиений (Р, £) с отмеченными точками отрезка [а, Ь], для которых \{Р) < d. Проверим, что {Bd}, d > 0,—действительно база в V- Во-первых, Bd ф 0. В самом деле, каким бы ни было число d > О, очевидно, существует разбиение Р отрезка [а, Ь] с параметром \(Р) < d
386 ГЛ VI ИНТЕГРАЛ (например, разбиение на п конгруэнтных отрезков). Но тогда су- существует и разбиение (Р, £) с отмеченными точками, для которого \{Р) < d. Во-вторых, если d\ > 0, d<i > 0 и d = min{di,d2}> то, очевидно, Bdl П Bd2 =BdeB. Итак, В = {Bd\ — действительно база в V- с. Интегральная сумма Определение 3. Если функция / определена на отрезке [a,b], a (Р, £) — разбиение с отмеченными точками этого отрезка, то сумма где Ахг = хг — ж,_1, называется интегральной суммой функции /, соот- соответствующей разбиению (Р, £) с отмеченными точками отрезка [а, Ь]. Таким образом, при фиксированной функции / интегральная сумма a(f;P,£) оказывается функцией Ф(р) = с(/;р) на множестве V разбие- разбиений р = (Р, £) с отмеченными точками отрезка [а, Ь]. Поскольку в V имеется база В, то можно ставить вопрос о пределе функции Ф(р) по этой базе. d. Интеграл Римана. Пусть /—функция, заданная на отрез- отрезке [а, Ь]. Определение 4. Говорят, что число / является интегралом Ри- Римана от функции / на отрезке [а,Ь], если для любого е > 0 найдется число 6 > 0 такое, что для любого разбиения (Р, £) с отмеченными точками отрезка [а, Ь], параметр которого Х(Р) < 6, имеет место соот- соотношение <£. 1=1 Поскольку разбиения р = (Р, £), для которых А(Р) < 5, составляют элемент Bg введенной выше базы В в множестве V разбиений с отме- отмеченными точками, то определение 4 равносильно тому, что / = ИтФ(р), в
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 387 т.е. интеграл / есть предел по базе В значений интегральных сумм функции /, отвечающих разбиению с отмеченными точками отрез- отрезка [а,Ь]. Базу В естественно обозначить символом Х(Р) —> 0, и тогда опре- определение интеграла можно переписать в виде 1=1 Интеграл от функции /(ж) по отрезку [а,Ь] обозначается символом ь f{x)dx, I в котором числа а, Ь называются нижним и верхним пределом инте- интегрирования соответственно; / — подынтегральная функция, f{x)dx — подынтегральное выражение, х — переменная интегрирования. Итак, E) Определение 5. Функция / называется интегрируемой по Рима- Риману на отрезке [а, Ь], если для нее существует указанный в E) предел ин- интегральных сумм при А(Р) —> 0 (т. е. если для нее определен интеграл Римана). Множество всех функций, интегрируемых по Риману на отрезке [а,Ь], будет обозначаться через Ща, Ь]. Поскольку пока мы не будем рассматривать другого интеграла, кро- кроме интеграла Римана, условимся для краткости вместо терминов «ин- «интеграл Римана» и «функция, интегрируемая по Риману» говорить соот- соответственно «интеграл» и «интегрируемая функция». 3. Множество интегрируемых функций. В силу определения интеграла (определение 4) и его переформулировок в виде D) и E), ин- интеграл есть предел некоторой специальной функции Ф(р) = a(f; Р, £) — интегральной суммы, определенной на множестве V разбиений р = (Р, £) с отмеченными точками отрезка [а,Ь]. Предел этот берется по базе В в V, которую мы обозначили как А(Р) —> 0.
388 ГЛ. VI. ИНТЕГРАЛ Таким образом, интегрируемость функции / на [а, Ь] зависит от на- наличия указанного предела. В силу критерия Коши этот предел существует тогда и только то- тогда, когда для любого числа е > 0 найдется элемент Bg G В базы, в любых точках р', р" которого выполнено соотношение \Ф(р')-Ф(р")\<е. В более подробной записи сказанное означает, что для любого е > О найдется 6 > 0 такое, что для любых разбиений (Р',£'), (Р",£") с от- отмеченными точками отрезка [а,Ь], для которых А(Р') < S и Х(Р") < <5, выполнено неравенство Hf;P',t')-a(f;P",O\<e или, что то же самое, неравенство < е. F) г=1 г=1 Мы воспользуемся сформулированным критерием Коши для того, чтобы получить сначала простое необходимое, а затем и достаточное условие интегрируемости функции по Риману. а. Необходимое условие интегрируемости Утверждение 1. Для того чтобы функция f', определенная на отрезке [а,Ь], была интегрируема на нем по Риману, необходимо, что- чтобы она была ограничена на этом отрезке. Короче, (/ £ Щр>М) ^ (/ ограничена на [а, Ъ]). ■4 Если / не ограничена на [а,Ь], то при любом разбиении Р отрезка [а, Ь] функция / окажется неограниченной по крайней мере на одном из отрезков [жг_1,жг] разбиения Р. Это означает, что, выбирая различ- различным образом точку £г G [xt-\,xt], можно сделать величину |/(£г)Дж,| сколь угодно большой. Но тогда и интегральную сумму &(f;P,0 = п &xi можно сделать по модулю сколь угодно большой за счет г=1 изменений только точки £г в этом отрезке.
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 389 Ясно, что в таком случае не может быть и речи о конечном пределе интегральных сумм, что, впрочем, видно и из критерия Коши, ибо со- соотношение F) в этом случае, очевидно, не имеет места даже для сколь угодно мелких разбиений. ► Как мы увидим, полученное необходимое условие еще очень дале- далеко от необходимого и достаточного условия интегрируемости, однако оно уже позволяет нам в дальнейшем исследовать только ограниченные функции. Ь. Достаточное условие интегрируемости и важнейшие классы интегрируемых функций. Начнем с нескольких обозначе- обозначений и замечаний, которые используются в дальнейшем изложении. Условимся, когда задано разбиение Р а = хо < xi < ... < хп = b отрезка [а, Ь], наряду с символом Ахг, обозначающим разность хг — xt-i, употреблять символ Дг для обозначения отрезка [ж,_1,ж,]. Если разбиение Р отрезка [а, Ь] получено из разбиения Р только добавлением к Р некоторых новых точек, то условимся называть раз- разбиение Р продолжением разбиения Р. При построении продолжения Р разбиения Р некоторые (быть мо- может, и все) отрезки Дг = [ж,_1,ж,] разбиения Р сами подвергаются раз- разбиению xt-\ — жго < ... < жШ) = хг. В связи с этим нам будет удобно нумеровать точки разбиения Р двумя индексами. В записи xXJ первый индекс означает, что xtJ G Д„ а второй индекс есть порядковый номер точки на отрезке Аг. Теперь естественно положить AxtJ := xtJ — xtJ-i и Ду := [жу_1,Жу]. Таким образом, Ахг = Джг1 + ... + Ахтг. Примером разбиения, являющегося продолжением как разбиения Р', так и разбиения Р", может служить разбиение Р = Р'иР", полученное объединением точек разбиений Р' и Р". Напомним, наконец, что, как и прежде, символ ш(/; Е) будет обо- обозначать колебание функции / на множестве Е, т. е. ш(/;Я):= sup \f(x')~f(x")\. х',х"еЕ В частности, ш(/; Дг) есть колебание функции / на отрезке Дг. Это колебание заведомо конечно, если / — ограниченная функция.
390 ГЛ VI ИНТЕГРАЛ Теперь сформулируем и докажем следующее Утверждение 2. Для того чтобы ограниченная на отрезке [а,Ь] функция f была интегрируема на нем, достаточно, чтобы для любого числа е > 0 нашлось число S > 0 такое, что при любом разбиении Р отрезка [а, Ь] с параметром \(Р) < 6 выполнялось соотношение ■4 Пусть Р — разбиение отрезка [а, Ь] и Р — продолжение разбие- разбиения Р. Оценим разность интегральных сумм a(f;P, £) — a(f;P, £). Ис- Используя введенные выше обозначения, можем написать f;P,Z) = n n, г=1 3=1 It \ _ ft n щ г=1 3 = 1 X )Дж n г=1 . n < \ ^ / г=1 n 1=1 f(£ )Ax t=lJ=l 1=1 В этих выкладках мы использовали то, что Джг = ^ Джч, а также то, что l/fej) — /FI ^ шA',\), поскольку £„ G Дц СД, и £, G Дг. Из полученной оценки разности интегральных сумм следует, что если функция / удовлетворяет достаточному условию, сформулирован- сформулированному в утверждении 2, то по любому числу е > 0 можно найти S > О так, что для любого разбиения Р отрезка [а, Ь] с параметром \(Р) < S и его продолжения Р при любом выборе отмеченных точек £ и £ будем иметь е
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 391 Если теперь (Р',£') и (Р",£")—произвольные разбиения с отмечен- отмеченными точками отрезка [а, Ь], параметры которых удовлетворяют усло- условиям А(Р') < 6, Х(Р") < 6, то, рассмотрев разбиение Р = Р' U Р", явля- являющееся продолжением обоих разбиений Р', Р", по доказанному будем иметь a(f;P,i)-v(f;P',t') Отсюда следует, что как только А(Р') < 6, А(Р") < 6. Таким образом, в силу критерия Коши существует предел интегральных сумм, т.е. f £ ~R\a,b]. ► Следствие 1. (/ G С[а,Ь]) =Ф> (/ G ~Ща, b]), то. е. любая непрерыв- непрерывная на отрезке функция интегрируема на этом отрезке. •* Если функция непрерывна на отрезке, то она ограничена на нем, так что необходимое условие интегрируемости в этом случае, очевидно, выполнено. Однако непрерывная на отрезке функция еще и равномерно непрерывна на нем, поэтому для любого е > 0 можно найти 6 > 0 так, что на любом отрезке Д С [а, Ь] длины меньше 6 будем иметь ш(/; Д) < < jTi-j- Тогда для любого разбиения Р с параметром А(Р) < 6 будем иметь t=i ° a i=i ° a В силу утверждения 2 теперь можно заключить, что / G lZ[a, b]. ► Следствие 2. Если ограниченная на отрезке [а, Ь] функция f не- непрерывна на этом отрезке всюду, кроме, быть может, конечного мно- множества точек, то f & 1Z[a,b]. 4 Пусть u)(f;[a,b]) <С<оои/ имеет к точек разрыва на отрезке [о, Ь]. Проверим выполнимость достаточного условия интегрируемости функции /.
392 ГЛ. VI. ИНТЕГРАЛ При заданном е > 0 возьмем число 6\ = J , и построим (Si-окрест- ности каждой из к точек разрыва функции / на [а, Ь]. Дополнительное к объединению этих окрестностей множество точек отрезка [а, Ь] состоит из конечного числа отрезков, на каждом из которых / непрерывна и, значит, равномерно непрерывна. Поскольку таких отрезков конечное число, по е > 0 можно указать fo > 0 так, что на любом отрезке Д, длина которого меньше 62 и который полностью содержится в одном из указанных выше отрезков непрерывности /, будем иметь Ц/; Д) < - Возьмем теперь число S = < ;г7т^—г- 2i\O — CL) Пусть Р—произвольное разбиение отрезка [а,Ь], для которого п \(Р) < 6. Сумму J2 uj(f; Дг)Джг, отвечающую разбиению Р, разобьем на две части: ; Дг)Ахг = 53' u(f; At)Axt + £" u(f; Дг В сумму Y1' включим те слагаемые, которые отвечают отрезкам Д, разбиения Р, не имеющим общих точек с построенными $1-окрестно- стями точек разрыва. Для таких отрезков Дг имеемш(/; Дг) < ,,е_ ,, поэтому Сумма длин оставшихся отрезков разбиения Р, как легко видеть, меньше (S + 2Si + 8)к ^ 4 J; ■ к = -Л,, поэтому Таким образом, мы получаем, что при Х(Р) < S t=i т.е. выполнено достаточное условие интегрируемости и / е И[а,Ь]. ► Следствие 3. Монотонная на отрезке функция интегрируема на этом отрезке.
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 393 •* Из монотонности функции / на отрезке [а, Ь] следует, что ш(/; [а> Щ) = |/(Ь) - /(о)|. Пусть задано е > 0. Положим S = iwb\f ., ... Мы считаем, что f(b) — f(a) ф 0, поскольку в противном случае / по- постоянна и интегрируемость / не вызывает сомнений. Пусть Р — про- произвольное разбиение отрезка [а, Ь] с параметром Х(Р) < 6. Тогда для него с учетом монотонности / имеем п п п Eu)(f:At)Axt < бУ^ш(/;Аг) =sy^\f(xt) -/(a:,_i)| = 1=1 1=1 1=1 n = 6 = 6\f(b)-f(a)\=e. Таким образом, / удовлетворяет достаточному условию интегриру- интегрируемости, т.е. f & Ща,Ь]. ► Монотонная функция может иметь уже бесконечно много точек раз- разрыва на отрезке (счетное множество). Например, функция, определяе- определяемая соотношениями Г 1 - — при 1 - — ^ х < -4рг> n£N, /(ж) = ) 2" v 2" ^ 2п+1> [ 1 при х = 1 на отрезке [0,1], не убывает и в каждой точке вида i, n G N, имеет разрыв. Замечание. Отметим, что хотя мы сейчас имеем дело с веще- вещественными функциями на отрезке, однако ни в определении интегра- интеграла, ни в доказанных выше утверждениях, за исключением следствия 3, мы по существу не использовали то, что рассматриваемые функции ве- щественнозначные, а не комплексно- или, например, векторнозначные функции точки отрезка [а,Ь]. Понятия верхней и нижней интегральной суммы, к которым мы пе- переходим, напротив, специфичны только для функций с действительны- действительными значениями. Определение 6. Пусть /: [а, Ь] —>Ш — действительнозначная функ- функция, определенная и ограниченная на отрезке [a,b]; P — разбиение от- отрезка [а,Ь]; Дг (г = 1,...,п)—отрезки разбиения Р. Пусть тг = = inf /(ж), Mt = sup /(ж) (г = 1,..., п).
394 ГЛ VI ИНТЕГРАЛ Суммы 1=1 называются соответственно нижней и верхней интегральной суммой функции / на отрезке [а, Ь], соответствующей разбиению Р этого от- отрезка1). Суммы s(f;P) и S(f;P) называют также нижней и верхней суммой Дарбу, соответствующей разбиению Р отрезка [а,Ь]. Если (Р, £)—произвольное разбиение с отмеченными точками от- отрезка [а,Ь], то, очевидно, ). G) Лемма 1. s(f;P)=Ma(f;P,O, < Проверим, например, что верхняя сумма Дарбу, отвечающая раз- разбиению Р отрезка [а,Ь], является верхней гранью значений интеграль- интегральных сумм, соответствующих разбиению с отмеченными точками (Р,() отрезка [а,Ь], причем верхняя грань берется по всевозможным наборам £ = (£i,... ,£„) отмеченных точек. Ввиду G), для доказательства достаточно, чтобы при любом е > О нашелся такой набор £ отмеченных точек, что имеет место неравенство S(f;P)<a(f;P,O+e. (8) По определению чисел Мг, при каждом г G {1,..., п} найдется точка & € Д„ в которой Мг < /(&) + ^. Пусть ( = (fi,..., (п). Тогда nit) + г *' Термин «интегральная сумма» здесь формально не вполне законен, так как не всегда тг и М, являются значениями функции / в некоторой точке £, £ Ai
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 395 что и завершает доказательство второго утверждения леммы. Первое утверждение проверяется аналогично. ► Из доказанной леммы и неравенства G) с учетом определения инте- интеграла Римана заключаем, что справедливо следующее Утверждение 3. Ограниченная вещественнозначная функция / : [а, Ь] —> М. интегрируема по Риману на отрезке [а, Ь] тогда и только тогда, когда существуют и равны между собой пределы 1= lim s(f;P), 7= lim S(f;P). (9) ~ A(P)->0 V A(P)-rt) ' V ' При этом их общее значение I = I_ = I совпадает с интегралом ь f(x)dx. /■ < Действительно, если пределы (9) существуют и равны между со- собой, то по свойствам предела из G) заключаем о существовании предела интегральных сумм, причем С другой стороны, если / € 7?.[а,6], т.е. существует предел то из G) и (8) заключаем, что существует предел lim S(f; P) = I, У г А(Р)-И) причем 1=1. Аналогично проверяется, что lim s(f; P) = / = /.► А(Р)->0 В качестве следствия утверждения 3 получаем следующее уточнение утверждения 2. Утверждение 2'. Для того чтобы функция /: [а, Ь] ->■ R, задан- заданная на отрезке [а,Ь], была интегрируема по Риману, необходимо и до- достаточно выполнение соотношения lim ^2aj(f;Ai)Axi = 0. A0) A(P)->0 i=1
396 ГЛ VI ИНТЕГРАЛ ■^ Учитывая утверждение 2, нам остается лишь убедиться в необхо- необходимости соотношения A0) для интегрируемости /. Заметим, что о>(/; Дг) = Мг — тг, поэтому п п <"(/; А.)Ах, = £(М« - тг)Ахг = S(f; P) - *(/; Р), i=i и теперь A0) следует из утверждения 3, коль скоро / € Ща, Ь]. ► с. Векторное пространство И[а, Ь]. Над интегрируемыми функ- функциями можно выполнять ряд операций, не выходя за пределы множест- множества 1Z[a, b]. Утверждение 4. Если f,g €iZ[a,b], то a) и + д)£Ща,Ь}; b) (af) € 1Z[a, b], где а — числовой множитель; c) \f\en[a,b}; d) f\[c,d]€ ЩсЛ'если \СА с КЧ; е) (f-g)eTl[a,b]. Мы сейчас рассматриваем только вещественнозначные функции, но полезно отметить, что свойства а), Ь), с), d) окажутся справедливыми и для комплекснозначных и векторнозначных функций. Для векторно- значных функций, вообще говоря, не определено произведение / • д, поэтому свойство е) для них не рассматривается. Однако это свойство остается в силе для функций с комплексными значениями. Перейдем теперь к доказательству утверждения 4. ■4 а) Это утверждение очевидно, поскольку 1=1 1=1 1=1 Ъ) Это утверждение очевидно, поскольку 1=1 1=1 с) Поскольку u)(\f\\E) ^ w(f;E), то можно написать, что п ; Д,)Дх, < 5^а;(/; Аг)Ах
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 397 и на основании утверждения 2 заключить, что (/ € 1Z[a, b]) =$■ (|/| € еП[а,Ь}). d) Мы хотим проверить, что ограничение /|[C;d] интегрируемой на отрезке [а, Ь] функции на любой отрезок [с, d\ С [а, Ь] является функци- функцией, интегрируемой на [с, d\. Пусть тг — разбиение отрезка [с, d\. Добавив к тг некоторые точки, достроим тг до разбиения Р отрезка [а, Ь], но так, чтобы иметь Х(Р) ^ А(тг). Ясно, что это всегда можно сделать. Теперь можно написать, что где YItt — сумма по всем отрезкам разбиения тг, a Yip — сумма по всем отрезкам разбиения Р. При А(тг) —> 0 по построению также Х(Р) —> 0, и на основании утвер- утверждения 2' из полученного неравенства заключаем, что (/ € 1Z[a, b]) =>• => (I/I € 7г[с, d]), если [с, d] С [а, Ь]. е) Проверим сначала, что если / е 7?.[а, Ь], то /2 € 7?.[а, Ь]. Если / € 7?.[а,6], то / ограничена на [а, Ь]. Пусть |/(ж)| ^ С < оо на [а,Ь]. Тогда (/(xi) - поэтому w(/2; £^) ^ 2Cui(f; E), если # С [а, Ь]. Значит, j=i 1=1 откуда на основании утверждения 2' заключаем, что (fen[a,b])^{f2en[a,b}). Теперь перейдем к общему случаю. Запишем тождество Из этого тождества с учетом только что доказанного утверждения и проверенных пунктов а) и Ь) утверждения 4 заключаем, что (/ € П[а, Ъ]) Л{д€ П[а, Ъ]) =► (/ • д € П[а, Ъ]). ►
398 ГЛ. VI. ИНТЕГРАЛ Из курса алгебры вам уже известно понятие векторного простран- пространства. Вещественнозначные функции, определенные на некотором мно- множестве, можно поточечно складывать и умножать на действительное число, получая при этом снова функцию с вещественными значениями на том же множестве. Если функции рассматривать как векторы, то можно проверить, что при этом выполнены все аксиомы векторного пространства над полем действительных чисел и указанное множество действительных функций является векторным пространством относи- относительно операций поточечного сложения функций и умножения функций на действительные числа. В пунктах а), Ь) утверждения 4 сказано, что сложение интегри- интегрируемых функций и умножение интегрируемой функции на число не выводит за пределы множества И[а, Ь] интегрируемых функций. Та- Таким образом, TZ[a,b] само является векторным пространством — под- подпространством векторного пространства вещественнозначных функ- функций, определенных на отрезке [а,Ь]. d. Критерий Лебега интегрируемости функции по Рима- ну. В заключение приведем пока без доказательства теорему Лебега, дающую внутреннее описание интегрируемой по Риману функции. Для этого введем следующее полезное само по себе понятие. Определение 7. Говорят, что множество £cl имеет меру нуль или является множеством меры нуль (в смысле Лебега), если для лю- любого числа е > О существует такое покрытие множества Е не более 00 чем счетной системой {1^} интервалов, сумма ^ \^к\ длин которых не к=1 превышает е. 00 Поскольку ряд Y1 \1к\ сходится абсолютно, порядок суммирования к=1 длин промежутков покрытия не влияет на сумму (см. утверждение 4 из гл. V, § 5, п. 2), поэтому данное определение корректно. Лемма 2. а) Точка и конечное число точек суть множества ме- меры нуль. b) Объединение конечного или счетного числа множеств меры нуль есть множество меры нуль. c) Подмножество множества меры нуль само есть множество ме- меры нуль.
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 399 d) Отрезок [а,Ь] при а < b не является множеством меры нуль. А а) Точку можно покрыть одним интервалом длины меньшей, чем любое наперед заданное число е > 0, поэтому точка является множест- множеством меры нуль. В остальном а) вытекает из Ь). Ь) Пусть Е = U Еп — не более чем счетное объединение множеств п Еп меры нуль. По е > 0 для каждого Еп строим покрытие {/£} множе- множества Е" такое, что X) 1^*1 < ~7Г- к 2 Поскольку объединение не более чем счетного числа не более чем счетных множеств само не более чем счетно, промежутки /£, к, п € N, образуют не более чем счетное покрытие множества Е, причем 14П| + + + 71, к Порядок суммирования ^ \^к I по индексам п и к безразличен, ибо ряд п,к сходится к одной и той же сумме при любом порядке суммирования, если он сходится для какого-то порядка суммирования. Последнее в нашем случае имеет место, ибо любые частичные суммы нашего ряда ограничены сверху числом е. Итак, Е есть множество меры нуль в смысле Лебега. c) Это утверждение, очевидно, непосредственно следует из опреде- определения множества меры нуль и определения покрытия. d) Поскольку из любого покрытия отрезка интервалами можно вы- выделить конечное покрытие, сумма длин промежутков которого, очевид- очевидно, не превосходит суммы длин промежутков исходного покрытия, то нам достаточно проверить, что сумма длин интервалов, образующих конечное покрытие отрезка [а, Ь], не меньше длины Ь — а этого отрезка. Проведем индукцию по количеству интервалов покрытия. При п = 1, т. е. когда отрезок [а, Ь] содержится в одном интерва- интервале (а,/3), очевидно, имеем а < а < b < /3 и /3 — а > b — а. Пусть утверждение доказано до индекса А; € N включительно. Рас- Рассмотрим покрытие, состоящее из к + 1 интервалов. Возьмем интер- интервал (ах,аг), покрывающий точку а. Если аг ^ Ь, то аг — &i > b — а и все доказано. Если же а < а.^ < 6, то отрезок [о^, Ь] покрыт системой, состоящей уже не более чем из к интервалов, сумма длин которых по предположению индукции не меньше чем b — а.^- Но b - а = (Ь - «г) + («2 ~ а) <(Ь- «г) + («2 - ol\)
400 ГЛ VI ИНТЕГРАЛ и, таким образом, сумма длин интервалов исходного покрытия отрез- отрезка [а, Ь] больше, чем его длина b — а. ► Интересно отметить, что в силу пунктов а) и Ь) леммы 2 множест- множество Q всех рациональных точек числовой прямой М является множеством меры нуль, что на первый взгляд выглядит несколько неожиданным при сопоставлении с пунктом d) той же леммы. Определение 8. Если некоторое свойство выполнено в любой точ- точке множества X, кроме, быть может, точек множества меры нуль, то говорят, что это свойство имеет место почти всюду на множестве X или почти во всех точках множества X. Теперь сформулируем критерий Лебега. Теорема. Функция, определенная на отрезке, интегрируема по Риману на этом отрезке в том и только в том случае, когда она ограничена на этом отрезке и непрерывна почти во всех его точках. Итак, (/ € TZ[a, b]) -ФФ- (/ ограничена на [a, b]) А А (/ непрерывна почти всюду на [а,Ь]). Из критерия Лебега и свойств множеств меры нуль, изложенных в лемме 2, очевидно, легко можно получить как следствия 1, 2, 3 утвер- утверждения 2, так и утверждение 4. Мы не станем сейчас доказывать критерий Лебега, поскольку при работе с достаточно регулярными функциями, с которыми нам пред- предстоит иметь дело, он нам пока не нужен. Однако идейную сторону кри- критерия Лебега вполне можно объяснить уже сейчас. Утверждение 2' содержало критерий интегрируемости, выражен- п ный соотношением A0). Сумма ^2 ш(/;Аг)Ахг может быть мала, пре- жде всего, за счет множителей u>(f;At), которые малы в малых окрест- окрестностях точек непрерывности функции. Если же некоторые из отрез- отрезков Ахг содержат точки разрыва функции, то для них о>(/; Дг) не стре- стремится к нулю, сколь мелким бы ни было разбиение Р отрезка [а,Ь]. Однако w(f;At) ^ w(f;[a,b]) < оо в силу ограниченности / на [а,Ь], поэтому сумма тех слагаемых, которые содержат точки разрыва, то- тоже может оказаться маленькой, если только мала сумма длин отрезков
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 401 разбиения, покрывающих множество точек разрыва, или, точнее, если рост колебания функции на некоторых отрезках разбиения компенси- компенсируется малостью длин этих отрезков. Точной реализацией и формулировкой этого наблюдения и является критерий Лебега. Приведем теперь два классических примера, поясняющих свойство функции быть интегрируемой по Риману. Пример 1. Функция Дирихле Vix\ = {l при х € ^' [0 при х € М \ Q, рассматриваемая на отрезке [0,1], не интегрируема на нем, поскольку для любого разбиения Р отрезка [0,1] в каждом отрезке Дг разбиения Р можно отметить как рациональную точку £'г, так и иррациональную точку £". Тогда в то время как "Л/! '£ /— Таким образом, интегральные суммы функции Т>(х) не могут иметь предел при Х(Р) —>■ 0. С точки зрения критерия Лебега неинтегрируемость функции Ди- Дирихле тоже очевидна, поскольку функция V{x) разрывна в каждой точ- точке отрезка [0,1], который, как было показано в лемме 2, не есть множе- множество меры нуль. Пример 2. Рассмотрим функцию Римана {щ, если х € Q и х = Щ- —несократимая дробь, 0, если х € Ш. \ Q. Мы уже рассматривали эту функцию в гл. IV, § 2, п. 2, и знаем, что функция И(х) непрерывна во всех иррациональных точках и разрывна во всех рациональных точках. Таким образом, множество точек разры- разрыва функции И(х) счетно и потому имеет меру нуль. В силу критерия 14-4573
402 ГЛ. VI. ИНТЕГРАЛ Лебега можно заключить, что функция И(х) интегрируема на любом отрезке [а, Ь] С М, несмотря на то, что точки разрыва этой функции попадают в любой отрезок любого разбиения отрезка интегрирования. Пример 3. Рассмотрим теперь еще один, менее классический во- вопрос и пример. Пусть /: [а, Ь] —> М — интегрируемая на [а,Ь] функция, принимаю- принимающая значения на отрезке [с,d\, на котором непрерывна функция д: [c,d\ —>■ R. Тогда композиция д о /: [а, Ь] -> R, очевидно, определе- определена и непрерывна во всех точках отрезка [а, Ь], в которых непрерывна функция /. В силу критерия Лебега отсюда следует, что (g°f) € 7£[а,Ь]. Покажем теперь на примере, что композиция произвольных инте- интегрируемых функций—уже не всегда интегрируемая функция. Рассмотрим функцию д(х) = |sgn|(a;). Эта функция равна единице при г/Ои нулю при х = 0. Непосредственной проверкой убеждаемся, что если, например, на отрезке [1,2] рассмотреть в качестве / функцию Римана И(х), то на этом отрезке композиция {g°f)(x) есть не что иное, как функция Дирихле Т>(х). Таким образом, наличие даже одной точки разрыва у д(х) привело к неинтегрируемости композиции д о f. Задачи и упражнения 1. Теорема Дарбу. а) Пусть s(f;P) и S(f;P)—нижняя и верхняя суммы Дарбу веществен- нозначной функции /, определенной и ограниченной на отрезке [а, Ь], отвеча- отвечающие разбиению Р этого отрезка. Покажите, что для любых двух разбиений Pi, P2 отрезка [а, Ь] справедливо неравенство b) Пусть разбиение Р является продолжением разбиения Р отрезка [а, 6] и пусть Ац,..., Aik — те отрезки разбиения Р, которые содержат точки раз- разбиения Р, не входящие в разбиение Р. Покажите, что справедливы оценки 0 < S(f; Р) - S(f; Р) < w(/; [а, Ь\) ■ (Axh +... + Axik), 0 < s(f; P) - s(f; Р) ^ ш(/; [а, Ъ]) ■ (Axh +... + Axik). c) Величины / = sup s(f;P), I — inf S(f;P) называются соответственно p p нижним и верхним интегралом Дарбу функции / на отрезке [а, Ь]. Покажите, что I < I.
§ 1. ОПРЕДЕЛЕНИЕ ИНТЕГРАЛА И ИНТЕГРИРУЕМОСТЬ ФУНКЦИЙ 403 d) Докажите теорему Дарбу: /= lim s(f;P), 7= lim S(f;P). ~ A(P)->0 ' \(Р)-Ю ' e) Покажите, что (/ е Ща, Ь] )<«■(/ = 7). f) Покажите, что / е Ща, Ь] тогда и только тогда, когда для любого е > 0 найдется такое разбиение Р отрезка [а,Ь], что S(f;P) — s(f;P) < e. 2. Канторово множество лебеговой меры нуль. a) Канторово множество, описанное в задаче 7 §4 гл.II, несчетно. Про- Проверьте, что оно тем не менее есть множество меры нуль в смысле Лебега. Укажите, как следует видоизменить конструкцию канторова множества, что- чтобы получить аналогичное всюду «дырявое» множество, не являющееся множе- множеством меры нуль. (Его тоже называют канторовым.) b) Покажите, что заданная на отрезке [0,1] функция, равная нулю вне канторова множества и единице в точках канторова множества, интегрируема по Риману на этом отрезке, если и только если канторово множество имеет меру нуль. c) Постройте неубывающую, непрерывную и не постоянную на отрезке [0,1] функцию, которая имеет нулевую производную всюду, кроме, быть мо- может, точек канторова множества меры нуль. 3. Критерий Лебега. a) Проверьте непосредственно (без ссылки на критерий Лебега) интегри- интегрируемость функции Римана из примера 2 настоящего параграфа. b) Покажите, что ограниченная функция / € Ща, b] тогда и только тогда, когда для любых двух чисел е > 0 и S > 0 найдется разбиение Р отрезка [а, Ь] такое, что сумма длин тех отрезков разбиения, на которых колебание функции больше е, не превосходит 6. c) Покажите, что / G lZ[a, b] тогда и только тогда, когда / ограничена на [о, 6] и для любых чисел е > 0 и S > 0 множество точек отрезка [а, Ь], в которых / имеет колебание больше чем е, можно покрыть конечным число интервалов, сумма длин которых меньше 6 (критерий Дюбуа-РеймонаУ>). d) Используя предыдущую задачу, докажите критерий Лебега интегриру- интегрируемости функции по Риману. 4. Покажите, что если /,д £ TZ[a,b] и /, д действительны, то max{f,g} e £ Ща, Ь] и min{/, g} G Ща, Ь]. 5. Покажите, что ;, а) если f,g £ TZ[a,b] и f(x) = д(х) почти всюду на [а, Ь], то / f(x)dx = Ь а = Jg(x)dx; ''П. Дюбуа-Реймон A831-1889) — немецкий математик.
404 ГЛ. VI. ИНТЕГРАЛ b) если / € Ща, Ь] и f(x) = д(х) почти всюду на [а, Ь], то д может не быть интегрируемой по Риману на [а, Ь], даже если д определена и ограничена на [а,Ь]. 6. Интеграл от векторнозначной функции. a) Пусть r(t) — радиус-вектор точки, движущейся в пространстве; го = = г@)—начальное положение точки; v(t)—вектор скорости как функция времени. Восстановите r(t) по го и функции v(t). b) Сводится ли интегрирование векторнозначной функции к интегриро- интегрированию вещественнозначных функций? c) Верен ли для векторнозначных функций критерий интегрируемости, выраженный в утверждении 2'? d) Верен ли критерий Лебега для векторнозначных функций? e) Какие из понятий и фактов этого параграфа переносятся на функции с комплексными значениями? § 2. Линейность, аддитивность и монотонность интеграла 1. Интеграл как линейная функция на пространстве *R\a, b] Теорема 1. Если fug —интегрируемые на отрезке [а,Ь] функ- функции, то их линейная комбинация af + /Зд также является интегриру- интегрируемой на [а, Ь] функцией, причем ь ь ь f(af + Рд)(х) dx = a Г f(x)dx + /3 f g(x) dx. A) а а а А Рассмотрим интегральную сумму для интеграла, стоящего в ле- левой части соотношения A), и преобразуем ее: Д^. B) г-l г—1 i=l Поскольку правая часть последнего равенства стремится к линей- линейной комбинации интегралов, стоящих в правой части равенства A), если параметр Х(Р) разбиения стремится к нулю, то левая часть равен- равенства B) тоже имеет предел при Х(Р) ->■ 0 и этот предел совпадает с пределом правой части. Таким образом, (af +/3g) € 1Z[a, b] и выполнено равенство A). ►
§2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 405 Если множество Л[а, Ь] рассматривать как векторное пространст- ь во над полем действительных чисел, а интеграл f f(x)dx—как дей- а ствительнозначную функцию, определенную на векторах пространства Ща, Ь], то теорема 1 утверждает, что интеграл есть линейная функция на векторном пространстве TZ[a, b]. Во избежание возможной путаницы, функции, определенные на функциях, называют обычно функционалами. Таким образом, мы до- доказали, что интеграл есть линейный функционал на векторном прост- пространстве интегрируемых функций. 2. Интеграл как аддитивная функция отрезка интегриро- ь вания. Значение интеграла / f(x)dx = I(f;[a,b]) зависит как от по- а дынтегральной функции, так и от отрезка, по которому ведется инте- интегрирование. Например, если / € TZ[a,b], то, как мы уже знаем, f\[a,/3] £ /3 € Ща,/?], если [а,0\ С [а, Ь], т. е. определен интеграл J f(x) dx, который а мы можем исследовать с точки зрения его зависимости от отрезка [а, 0\ интегрирования. Лемма 1. Если а <Ь<с и f е Ща,с], то /\[а,ь] € И[а,Ь], /\[ь,с] € € Tl[b,c] и имеет место равенство1^ с b с [ f(x) dx= [ f(x) dx+ f f(x) dx. C) a a b •^ Отметим прежде всего, что интегрируемость ограничений функ- функции / на отрезки [о, Ь] и [Ь, с] гарантируется утверждением 4 из преды- предыдущего параграфа. с Далее, поскольку / € TZ[a, с], то при вычислении интеграла J f(x) dx а как предела интегральных сумм мы вправе выбирать любые удобные нам разбиения отрезка [а, с]. В качестве таковых будем сейчас рассма- рассматривать только те разбиения Р отрезка [а, с], которые содержат точ- ^Напомним, что символ /|я обозначает сужение функции / на множество Е, ле- лежащее в области определения функции /. В правой части равенства C) формально полагалось бы написать не /, а сужения / на соответствующие отрезки.
406 ГЛ. VI. ИНТЕГРАЛ ку Ь. Каждое такое разбиение с отмеченными точками (.Р,£), очевидно, порождает разбиения (Р',£') и (Р",£") отрезков [а,Ь] и [Ь,с] соответ- соответственно, причем Р = Р' U Р" и £ = £' U £". Но тогда имеет место следующее равенство между соответствую- соответствующими интегральными суммами: Поскольку Х(Р') < Х(Р) и Х(Р") < А(Р), то при достаточно ма- малом А(Р) каждая из написанных интегральных сумм близка к соответ- соответствующему интегралу из C). Таким образом, равенство C) действи- действительно имеет место. ► Чтобы несколько расширить применимость полученного результа- результата, вернемся временно вновь к определению интеграла. Мы определили интеграл как предел интегральных сумм D) отвечающих разбиениям с отмеченными точками (Р, £) отрезка инте- интегрирования [а,Ь]. Разбиение Р составляла монотонная конечная после- последовательность точек xq,x\,... ,xn, причем точка xq совпадала с ниж- нижним пределом интегрирования а, а последняя точка хп совпадала с верх- верхним пределом интегрирования Ь. Эта конструкция проводилась в пред- предположении, что а < Ь. Если теперь взять произвольно два числа а и Ь, не требуя, чтобы обязательно было а < Ь, и, считая а нижним преде- пределом интегрирования, a b верхним, провести указанную конструкцию, то мы вновь получим сумму вида D), в которой на сей раз будет Axi > О (г = 1,...,тг), если а < Ь, и Ах^ < 0 (г = 1,...,тг) при а > Ь, ибо Axi = Xi — Xi-i. Таким образом, сумма D) при а > Ъ будет отличать- отличаться от интегральной суммы соответствующего разбиения отрезка [Ь, а] (Ь < а) только знаком. По этим соображениям принимается следующее соглашение: если а > Ь, то Ь а Jf(x)dx:=-Jf(x)dx. E)
§ 2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 407 В связи с этим естественно также положить, что f(x) dx := 0. F) /■ После этих соглашений с учетом леммы 1 приходим к следующему важному свойству интеграла. Теорема 2. Пусть а,Ь,с € R и пусть f—функция, интегрируе- интегрируемая на наибольшем из отрезков с концами в указанных точках. Тогда сужение f на каокдый из двух других отрезков такоке интегрируемо на соответствующем отрезке и имеет место равенство b с а If(x)dx + f f(x)dx+ I f(x)dx = 0. G) a b с А В силу симметрии равенства G) относительно а, Ь, с, мы без огра- ограничения общности можем считать, что а = min{a,6, с}. Если тах{а, Ь, с} = с и а < b < с, то по лемме 1 с с f(x) dx+ f f(x) dx- I f(x) dx - 0, что с учетом соглашения E) дает равенство G). Если тах{а, Ь, с} = b и а < с < Ь, то по лемме 1 с ь ь If(x)dx+ If(x)dx- ff(x)dx = 0, что с учетом E) вновь дает G). Наконец, если какие-то две из точек а, Ь, с или все три совпадают, то G) следует из соглашений E) и F). ► Определение 1. Пусть каждой упорядоченной паре (а,/3) точек а, /3 отрезка [а, Ь] поставлено в соответствие число 1(а,@), причем так, что для любой тройки точек а, C, у € [а, Ь] выполнено равенство Да, 7) = Ца,Р)
408 ГЛ. VI. ИНТЕГРАЛ Тогда функция 1(а, /?) называется аддитивной функцией ориенти- ориентированного промежутка, определенной на промежутках, лежащих в от- отрезке [а,Ь]. ь Если / € ЩА,В] и а,Ь,с € [А-В], то, полагая I(a,b) = Jf(x)dx, из G) заключаем, что ° с ь с [ f(x) dx= f f(x) dx+ [ f(x) dx, (8) a a b т. е. интеграл есть аддитивная функция промежутка интегрирования. Ориентированность промежутка состоит в данном случае в том, что мы упорядочиваем пару концов отрезка интегрирования, указывая, ка- какой из них первый (являющийся нижним пределом интегрирования) и какой второй (являющийся верхним пределом интегрирования). 3. Оценка интеграла, монотонность интеграла, теоремы о среднем а. Одна общая оценка интеграла. Начнем с одной общей оценки интеграла, которая, как потом выяснится, справедлива не только для интегралов от действительнозначных функций. Теорема 3. Если а < 6 и f € Ща, Ь], то |/| € Ща, Ь] и справедливо неравенство ь ь Jf(x)dx <J\f\(x)dx. (9) а Если при этом \f\{x) < С на [а,Ь], то ь I \f\(x)dx^C(b-a). A0) ■4 При а = b утверждение тривиально, поэтому будем считать, что а < Ь. Для доказательства теоремы достаточно вспомнить теперь, что |/| € TZ[a, b] (см. утверждение 4 из §1), и написать следующую оцен-
§ 2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 409 ку интегральной суммы a(f; Р, £): Переходя к пределу при Х(Р) -> 0, получаем б б ff(x)dx^f\f\(x)dx^C(b-a). ► а а Ь. Монотонность интеграла и первая теорема о среднем. Все дальнейшее специфично для интегралов от действительнозначных функций. Теорема 4. Если а < Ь, /ь/г € 7£[а,6] и f\(x) < /2B) в любой точке х € [а, Ь], то ь ь Jf1(x)dx^Jf2(x)dx. A1) а а •^ При а = Ь утверждение тривиально. Если же а < Ь, то достаточно записать для интегральных сумм неравенство п п справедливое, поскольку Да;* > 0 (г = 1,..., п), и затем перейти в нем к пределу при Х(Р) -> 0. ► Теорему 4 можно трактовать как утверждение о монотонности за- зависимости интеграла от подынтегральной функции. Из теоремы 4 получается ряд полезных следствий. Следствие 1. Если а < Ь, / € Л[а,Ь] ит < f(x) < М нах G [а,6], то m • (b — a) < / /(ж) с?ж < М ■ (Ь — а), а и, в частности, если 0 ^ f(x) на [а,Ь], то ь 0< J f(x)dx. A2)
410 ГЛ. VI. ИНТЕГРАЛ ■4 Соотношение A2) получается, если проинтегрировать каждый член неравенств т ^ f(x) ^ M и воспользоваться теоремой 4. ► Следствие 2. Если f € Л[а, Ь], т = inf f(x), M = sup f(x), хф,Ь] хе[а,Ь] то найдется число /j, € [т, М] такое, что ь Г A3) ■4 Если а = Ь, то утверждение тривиально. Если а ф Ь, то положим ь ju = j^f— / /(ж) с?ж. Тогда из A2) следует, что т < /л < М, если а < Ь. Но а обе части A3) меняют знак при перестановке местами а и Ь, поэтому A3) справедливо и при Ь < а. ► Следствие 3. .Если / € С[а,6], то найдется точка £ € [а,Ь] та- такал, что /■ A4) ■4 По теореме о промежуточном значении для непрерывной функ- функции, на отрезке [а, Ь] найдется точка £, в которой /(£) — ц, если только т = min f(x) < /j, < max f(x) = M. xe[a,b] xe[a,b] Таким образом, A4) следует из A3). ► Равенство A4) часто называют первой теоремой о среднем для ин- интеграла. Мы же зарезервируем это название для следующего, несколько более общего утверждения. Теорема 5 (первая теорема о среднем для интеграла). Пусть f,g£ G H[a,b], m = inf f(x), M — sup f(x). Если функция g неотрица- неотрицательна (или неположительна) на отрезке [а,Ь], то ь ь (f ■ g)(x) dx =/j, g(x)dx, A5) а а где /j, G [т,М]. ь
§2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 411 Если, кроме того, известно, что f € C[a,b], то найдется точка € [а, Ь] такая, что A6) < Поскольку перестановка пределов интегрирования приводит к из- изменению знака одновременно в обеих частях равенства A5), то доста- достаточно проверить это равенство в случае а < Ь. Изменение знака функ- функции д(х) тоже одновременно меняет знак обеих частей равенства A5), поэтому можно без ограничения общности доказательства считать, что д{х) ^ 0 на [а,Ь]. Поскольку т = inf f(x) и М = sup f(x), то при д(х) ^ О тд{х) < f(x)g(x) < Мд(х). Поскольку т • д € TZ[a, b], f • д € TZ[a, b] и М ■ д € TZ[a, b], то, применяя теорему 4 и теорему 1, получаем ь ь m a a О о b f g(x)dx < J f(x)g(x)dx <M I g{x)dx. A7) ь Если J g(x)dx = 0, то, как видно из этих неравенств, соотноше- а ние A5) выполнено. ь Если же / д(х) dx ф 0, то, полагая а ц (b \ -1 b I g(x)dx\ ■ I (f-g)(x)dx, a /a из A7) находим, что т ^ ju ^ М, но это равносильно соотношению A5).
412 ГЛ. VI. ИНТЕГРАЛ Равенство A6) теперь следует из A5) и теоремы о промежуточном значении для функции f€ C7(a, 6(, с учетом того, что в случае / € С[а,Ь] т= min f(x) и М= max f(x). ► хе[о,ь] хе[в,ь] Заметим, что равенство A3) получается из A5), если д(х) = 1 на [а,Ь]. с. Вторая теорема о среднем для интеграла. Значительно бо- более специальной и деликатной в рамках теории интеграла Римана явля- является так называемая вторая теорема о среднем^. Чтобы не осложнять доказательство этой теоремы, сделаем несколь- несколько полезных заготовок, представляющих и самостоятельный интерес. Преобразование Абеля. Так называется следующее преобразова- n к ние суммы J2 агЬг. Пусть А^ = ^ аг; положим также Aq = 0. Тогда i=i i=i п п п п ^2 а^ = Х^г ~ Аг-фг = ^ АгЬг - ^ A-tbi = г=1 i=l i=l г=1 п п-1 п-1 = ^ АгЪг ~ Л АгЬг+\ = АпЬп ~ А0Ьг + ^ Аг(Ьг - Ьг+1). г=\ г=0 г=1 Итак, п п-1 ^2 а-гЪг = (АпЬп - Афх) + ]Г Аг(Ьг - Ь,+1), A8) г=1 г=1 или, поскольку Aq — 0, п п-1 ^ агЬг = АпЬп + J2 Аг(Ьг - Ьг+1). A9) г=1 »=1 На основе преобразования Абеля легко проверяется следующая к Лемма 2. Если числа Ak = J2 аг (к = 1,...,п) удовлетворяют г=1 неравенствам т ^ А^ ^ М, а числа Ьг (г = 1,... ,п) неотрицательны Щри некотором дополнительном и часто вполне приемлемом условии на функ- функции основную теорему 6 этого раздела можно легко получить из первой теоремы о среднем. См по этому поводу задачу 3 к следующему параграфу.
§ 2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 413 и bi ^ bi+i при i = 1,..., п — 1, то mb\ B0) функция •^ Используя то, что Ьп ^ 0 и 6j — bj+i ^ 0 при г — 1,..., п — 1, из A9) получаем п п—1 У, aibi ^ Л/6П + 2. М(Ь{ — bj+i) = Mbn + M(b\ — bn) = Mb\. 1=1 1=1 Аналогично проверяется и левое неравенство в соотношении B0). ► Лемма 3. Если f G Л[а, Ь], то при любом х € [а,Ь] определена X f(t)dt B1) а uF(x)£C[a,b]. 4 Существование интеграла B1) при любом х G [а, Ь] нам уже из- известно из утверждения 4 § 1, поэтому остается проверить непрерыв- непрерывность функции F(x). Поскольку / € TZ[a, b], имеем |/| ^ С < оо на [а, Ь]. Пусть х € [а, Ь] и х + h G [a,b]. Тогда в силу аддитивности интеграла и неравенств (9), A0) получаем x+h х (x + h)-F(x)\ = J f(t)dt-J f(t)dt а x+h I f(t)dt x+h I dt C\h\. Мы воспользовались неравенством A0) с учетом того, что при h < 0 x+h I \f(t)\dt = -1 \f(t)\dt = I \f(t)\dt. x+h x+h Итак, мы показали, что если х, х + h € [а, Ь], то x + h)-F(x)\^C\h\, B2)
414 ГЛ. VI. ИНТЕГРАЛ откуда, очевидно, следует непрерывность функции F в любой точке отрезка [а,Ь]. ► Теперь докажем лемму, которая уже является вариантом второй те- теоремы о среднем. Лемма 4. Если f,g€ TZ[a,b] и д — неотрицательная и невозра- стающая на отрезке [а, Ь] функция, то найдется точка £ € [а, Ь] та- такая, что ь £ J(f-g)(x)dx = g(a)Jf(x)dx. B3) а а Прежде чем переходить к доказательству, отметим, что, в отли- отличие от соотношения A6) первой теоремы о среднем, в B3) под знаком интеграла осталась функция /, а не монотонная функция д. ■4 Для доказательства формулы B3), как и в уже рассмотренных выше случаях, постараемся оценить соответствующую интегральную сумму. Пусть Р—разбиение отрезка [а,Ь]. Запишем сначала тождество п f(f-g)(x)dx = '£ f(f.g)(x)dx = I [g(x)-g(xi-l)]f(x)dx хг—i и покажем, что при А(Р) —> 0 последняя сумма стремится к нулю. Поскольку / € Ща, Ь], то \f(x)\ < С < оо на [а,Ь]. Тогда, используя уже доказанные свойства интеграла, получаем х, п х, / [g(x)-g(xi^1)]f(x)dx <2 / \9(х) ~ g(xi-i)\\f(x)\dx ^ i=l
§2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 415 при Х(Р) —> 0, ввиду того, что д 6 1Z[a,b] (см. утверждение 2 из §1). Значит, ь п Хг j(f.g)(x)dx = х\1ш^g(Xi^) j f(x)dx. B4) a i=1 x%-i Оценим теперь сумму, стоящую в правой части равенства B4). По- Положив а по лемме 3 получаем функцию, непрерывную на отрезке [а, Ь]. Пусть т = min F(x) и М — max F(x). xe[a,b] xe[a,b) хг Поскольку J f(x) dx = F(xi) — F(xj_i), то J2-l). B5) Учитывая неотрицательность и невозрастание функции д на [а, Ь] и полагая ai = F{xi)-F{xi-i), bi=g(xt-i), по лемме 2 находим, что п тд(а) < ^ (F{xi) - F{xi-i))g{xi-i) < Mg(a), B6) поскольку к Ak = Y,<4 = РЫ ~ F(xo) = F(xk) - F(a) = F(xk). i=l Мы показали, что суммы B5) удовлетворяют неравенствам B6). Вспоминая соотношение B4), теперь имеем ь тд{а) < /"(/ • д){х) dx < Mg{a). B7)
416 ГЛ. VI. ИНТЕГРАЛ Если д(а) = О, то, как показывают неравенства B7), доказываемое соотношение B3), очевидно, справедливо. Если же д(а) > О, то положим ь а Из B7) следует, что т ^ ц ^ М, а из непрерывности функции х F(x) — f f(t)dt на [a, b] следует, что найдется точка £ 6 [а, Ь], в которой а F@ = №• Но именно это и утверждает формула B3). ► Теорема 6 (вторая теорема о среднем для интеграла). Если /, д 6 6 TZ[a,b] и д —монотонная на [а,Ь] функция, то найдется точка £ 6 6 [а, Ь] такая, что ь £ ь У(/ • g)(x) dx = g(a)J f(x) dx + g(b) j f(x) dx. B8) a a £ Равенство B8) (как, впрочем, и равенство B3)) часто называют формулой Бонне1). ■4 Пусть д — неубывающая на [а,Ь] функция. Тогда G(x) = g(b) - — д(х) —неотрицательная, невозрастающая, интегрируемая на [а, Ь] функция. Применяя формулу B3), находим Ь С J(f-G)(x)dx = G(a)Jf(x)dx. B9) а а Но -G)(x)dx = g(b)jf(x)dx-J(f-g)(x)dx, а а а * е * G(a)Jf(x)dx = g(b)Jf(x)dx-g(a)Jf(x)dx. ^П. О. Бонне A819 -1892) — французский математик и астроном. Наиболее значи- значительные математические работы Бонне связаны с дифференциальной геометрией.
§2. ЛИНЕЙНОСТЬ, АДДИТИВНОСТЬ И МОНОТОННОСТЬ ИНТЕГРАЛА 417 Учитывая эти соотношения и свойство аддитивности интеграла, из B9) получаем доказываемое равенство B8). Если д — невозрастающая функция, то, полагая G(x) = д(х) — д(Ь), получим, что G(x)—неотрицательная, невозрастающая, интегрируе- интегрируемая на [а,Ь] функция. Далее вновь получаем формулу B9), а за ней и формулу B8). ► Задачи и упражнения 1. Покажите, что если / € 1Z[a, b] и f{x) ^ 0 на [а, Ь], то а) при условии, что в некоторой точке хо € [а,Ь] непрерывности функ- функция f(x) принимает положительное значение / (яо) > 0, имеет место строгое неравенство ь I f(x) dx > 0; b b) из условия J f(x)dx = О следует, что f(x) = 0 почти во всех точках а отрезка [а,Ь]. 2. Покажите, что если / € ТЦа, b], m = inf f{x), M = sup f{x), то КМ ]а,Ь[ Ь a) / f{x) dx = fi(b - а), где fi € [m, M] (см. задачу 5а) предыдущего пара- a графа); b) при условии непрерывности / на [а, Ь] найдется такая точка £ € ]а, Ь[, что ь 3. Покажите, что если / € С[а, b], f(x) ^ 0 на [а, Ь) и М = max f(x), то [а, 6] (г \1/п lim / fn(x)dx] = М. П-УОО I ./ / 4. а) Покажите, что если / € Ща, Ь], то |/|р € И[а, Ь] при р ^ 0.
418 ГЛ. VI. ИНТЕГРАЛ b) Исходя из неравенства Гёльдера для сумм, получите неравенство Гёль- 1/р / Ь ч l/q дера для интегралов1); j{fg){x)dx <lj\f\P{x)dx\ .{J\g\"{x)dx\ , а ^ а ' ^ а ' если/,деЩа,Ь}ир>1, О 1, \ + \ = 1- с) Исходя из неравенства Минковского для сумм, получите неравенство Минковского для интегралов: если /, g G lZ[a, b] ир^ 1. Покажите, что это неравенство меняется на проти- противоположное, если 0 < р < 1. d) Проверьте, что если / — непрерывная, выпуклая на Ж функция, а <р — произвольная непрерывная на Ж функция, то при с ф 0 справедливо неравен- неравенство Иенсена: § 3. Интеграл и производная 1. Интеграл и первообразная. Пусть / — интегрируемая по Ри- ману на отрезке [а, Ь] функция. Рассмотрим на этом же отрезке функ- функцию X F(x) = Jf(t)dt, (I) a часто называемую интегралом с переменным верхним пределом. Поскольку / 6 1Z[a,b], то /|гв,а;] ^ 1Z[a,x], если [а,х] С [а,Ь]\ поэтому функция х н-> F(x) корректно определена для х 6 [а,Ь]. ^ Алгебраическое неравенство Гёльдера при р = q = 2 впервые было получено в 1821 г. Коши и носит его имя. Неравенство Гёльдера для интегралов при р = q = 2 впервые нашел в 1859 г. русский математик В. Я. Буняковский A804-1889). Это важное интегральное неравенство (в случае р = q = 2) называют неравенством Буняковского или неравенством Коши -Буняковского. Встречается иногда и ме- менее точное его название «неравенство Шварца»—по имени немецкого математика Г. К. А. Шварца A843 - 1921), в работах которого оно появилось в 1884 г.
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 419 Если \f(t)\ ^ С < +оо на [а,Ь] (а /, как интегрируемая функция, ограничена на [а, Ь]), то из аддитивности интеграла и простейшей оцен- оценки интеграла следует, что \F(x + h)-F(x)\<C\h\, B) если х, х + h 6 [а, Ь]. Об этом мы, кстати, уже говорили, доказывая лемму 3 предыдущего параграфа. Из неравенства B), в частности, следует непрерывность функции F на [а,Ь]. Итак, F 6 С[а,Ь]. Теперь мы исследуем функцию F более тщательно. Имеет место следующая основная для всего дальнейшего Лемма 1. Если f 6 TZ[a,b] и функция f непрерывна в некоторой точке х 6 [а,Ь], то функция F, определяемая на [а,Ь] формулой A), дифференцируема в этой точке х, причем имеет место равенство F'(x) = f{x). ■4 Пусть x,x + h 6 [a,b]. Оценим разность F(x + h) — F(x). Из непре- непрерывности / в точке х следует, что f(t) = f(x) + A(t), где A(t) —>■ 0 при t->■ х, t 6 [a,b]. Функция A(t) = /(<) — f(x) интегрируема на [а,Ь], как разность интегрируемой функции t н-> f(t) и постоянной f(x), если х — фиксированная точка. Обозначим через M(h) величину sup |A(<)|, где tei(h) I(h)—отрезок с концами х, х + h 6 [а, Ь]. По условию, M(h) —>■ 0 при ft->0. Теперь запишем x+h х x+h F(x + h)-F(x)= f f(t)dt- f f(t)dt= f f(t)dt = x+h Г X где положено а + А(*)) а x+h dt= Г f(x) dt + X X x+h h X x+h f A(t) dt = a(h)h.
420 ГЛ. VI. ИНТЕГРАЛ Поскольку x+h x+h x+h x+h f A(t)dt < f \A(t)\dt ^ f M(h)dt = M(h)\h\, то \a(h)\ < M(h) и потому a(h) -> 0, когда h —> 0 (но так, что x + he €[a,b]). Таким образом, показано, что если функция / непрерывна в точке х 6 [а, Ь], то при смещениях h от точки х таких, что х + h 6 [а, Ь], имеет место равенство F(x + h)- F(x) = f(x)h + a(h)h, C) где a(h) —>■ 0 при /г —> 0. Но это и означает, что функция F(x) дифференцируема на [а, Ь] в точке х 6 [а,Ь] и что F'(x) = f(x). ► Важнейшим непосредственным следствием леммы 1 является следу- следующая Теорема 1. Каждая непрерывная на отрезке [а,Ь] функция f: [а, Ь] —> М. имеет на этом отрезке первообразную, причем любая первообразная функции f на [а, Ь] имеет вид D) где с — некоторая постоянная. < (/ 6 С[а,Ь]) =*►(/€ 1Z[a,b]), поэтому на основании леммы 1 функ- функция A) является первообразной для / на [а,Ь]. Но две первообразные Т(х) и F(x) одной и той же функции на отрезке могут отличаться на этом отрезке только на постоянную, поэтому Т{х) = F(x) + с. ► Для дальнейших приложений удобно несколько расширить понятие первообразной и принять Определение 1. Непрерывная на числовом промежутке функция х н-> ^(х) называется первообразной (обобщенной первообразной) функции х !-»■ f(x), определенной на том же промежутке, если во всех точках промежу а, за исключением, быть может, конечного их числа, имеет место соотношение Т'(х) — f(x).
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 421 Учитывая это определение, можно утверждать, что справедлива сле- следующая Теорема 1'. Каждая определенная и ограниченная на отрезке [а,Ь] функция f: [a,b] —>■ R с конечным множеством точек разрыва имеет на этом отрезке (обобщенную) первообразную, причем любая первообразная функции f на [а,Ь] имеет вид D). •^ Поскольку / имеет конечное множество точек разрыва, то / 6 6 И[а,Ь] и по лемме 1 функция A) является обобщенной первообразной для / на [а, Ь]. При этом мы учли, что, как уже отмечалось, в силу B) функция A) непрерывна на [а, Ь]. Если Т{х)—другая первообразная функции / на [а, Ь], то F(x) — F(x) — непрерывная функция, постоянная на каждом из конечного числа промежутков, на которые точки разрыва функции / разбивают отрезок [а, Ь]. Из непрерывности Т(х) — F(x) на [а,Ь] тогда следует, что Т{х) — F(x) = const на [a,b]. ► 2. Формула Ньютона-Лейбница Теорема 2. Если /: [а,Ь] —> R — ограниченная функция с конеч- конечным числом точек разрыва, то f 6 И[а, Ь] и E) где Т: [а, Ь] —>■ R —любая из первообразных функции f на отрезке [а, Ь]. 4 Интегрируемость ограниченной на отрезке функции с конечным числом точек разрыва нам уже известна (см. § 1, следствие 2 утвержде- утверждения 2). Наличие обобщенной первообразной Т(х) функции / на [а,Ь] гарантирует теорема 1', в силу которой Т(х) имеет вид D). Полагая в D) х = а, получим, что Т(а) = с, откуда В частности,
422 ГЛ. VI. ИНТЕГРАЛ что с точностью до обозначения переменной интегрирования совпадает с доказываемой формулой E). ► Фундаментальное для всего анализа соотношение E) называется формулой Ньютона - Лейбница. Разность Т{Ь) — Т(а) значений любой функции часто записывают символом Т(х)\ьа. В этих обозначениях формула Ньютона - Лейбница приобретает вид Поскольку обе части этой формулы одновременно меняют знак при перестановке а и Ь, то формула справедлива при любом соотношении величин а ъЬ, т. е. как при а < Ь, так и при а > Ь. На упражнениях по анализу формула Ньютона - Лейбница большей частью используется только для вычисления стоящего слева интеграла, и это может породить несколько искаженное представление об ее ис- использовании. На самом деле положение вещей таково, что конкретные интегралы редко находят через первообразную, а чаще прибегают к прямому счету на ЭВМ с помощью хорошо разработанных численных методов. Формула Ньютона - Лейбница занимает ключевую, связываю- связывающую интегрирование и дифференцирование, позицию в самой теории математического анализа, в которой она, в частности, получает далеко идущее развитие в виде так называемой общей формулы Стоксаг\ Примером того, как формула Ньютона - Лейбница используется в самом анализе, может служить уже материал следующего пункта на- настоящего параграфа. 3. Интегрирование по частям в определенном интеграле и формула Тейлора Утверждение 1. Если функции и(х) и v(x) непрерывно диффе- дифференцируемы на отрезке с концами а и Ь, то справедливо соотношение ь ь [(и ■ v')(x) dx= (и- v)(x)\ba - f(v ■ и')(х) dx. F) . Г. Стоке A819-1903) — английский физик и математик.
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 423 Эту формулу принято записывать в сокращенном виде ь ь udv — и- v\a — vdu а а и называть формулой интегрирования по частям в определенном ин- интеграле. •^ По правилу дифференцирования произведения функций имеем {и ■ v)'{x) = (и' ■ v){x) + (и ■ v'){x). По условию все функции в этом равенстве непрерывны, а значит, и интегрируемы на отрезке с концами а и Ь. Используя линейность инте- интеграла и формулу Ньютона - Лейбница, получаем ь ь (и ■ v)(x)\ba = /"(«' ■ v)(x) dx + f(u ■ v')(x) dx. ► a a В качестве следствия получим теперь формулу Тейлора с интеграль- интегральным остаточным членом. Пусть на отрезке с концами ата. х функция t н-> f(t) имеет п непре- непрерывных производных. Используя формулу Ньютона - Лейбница и фор- формулу F), проделаем следующую цепочку преобразований, в которых все дифференцирования и подстановки производятся по переменной t: X X f{x) - f(a) = Jf'(t) dt = -Jf'(t)(x - t)'dt = a a x = -f'(t)(x-t)\xa + I f"(t)(x-t)dt = a x = f>(a)(x-a)-±Jf"(t){(x-tJydt = a x = f'(a)(x - a) - \f"{t){x - tf\xa + \Jf'"(t)(x - tfdt = a x = f(a)(x -a) + \f"(a)(x - aJ - ^ j f"'(t)((x - tf)'dt = ...=
424 ГЛ. VI. ИНТЕГРАЛ 2 • 3 •... • (n - 1) • -а)"+!•„_!(«»;*), где G) Итак, доказано следующее Утверждение 2. Если функция t н-> f(t) имеет на отрезке с кон- концами а и х непрерывные производные до порядка п включительно, то справедлива формула Тейлора f(x) = f(a) + ~f\a)(x-a) + ... + j^^f(n-1Ha)(x-ar- с остатком rn^i(a;x), представленным в интегральной форме G). Отметим, что функция (х — t)n~1 не меняет знак на отрезке с конца- ми а и х, и поскольку функция t н-> /(") (t) непрерывна на этом отрезке, то по первой теореме о среднем на нем найдется такая точка £, что Мы вновь получили знакомую форму Лагранжа остаточного члена формулы Тейлора. (На основании задачи 2Ь) из предыдущего парагра- параграфа, можно считать, что £ лежит в интервале с концами а, х.) Это рассуждение можно было бы повторить, вынося из-под знака интеграла G) f(n\$)(x — £)n~k, где к 6 [1,п]. Значениям к = 1 и к = п отвечают получаемые при этом соответственно формулы Коши и Ла- Лагранжа остаточного члена.
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 425 4. Замена переменной в интеграле. Одной из основных фор- формул интегрального исчисления является формула замены переменной в определенном интеграле. Эта формула в теории интеграла столь же важна, как в дифференциальном исчислении формула дифференциро- дифференцирования композиции функций, с которой она может быть при определен- определенных условиях связана посредством формулы Ньютона-Лейбница. Утверждение 3. Если ip: [а,/3] -> [а,Ь] —непрерывно дифферен- дифференцируемое отображение отрезка a ^t ^ /3 в отрезок а ^ х ^ Ь такое, что <р(а) = а и <р(C) = Ь, то при любой непрерывной на [а, Ь] функ- функции /(ж) функция j'((p(t))<p''(t) непрерывна на отрезке [а,0\ и справед- справедливо равенство ь 13 = Jf(<p(t))<p'(t)dt. (8) 4 Пусть Т{х)—первообразная функции /(ж) на [а,Ь]. Тогда, по теореме о дифференцировании композиции функций, функция T[(p(t)) является первообразной для функции f(<p(t))(p'(t), непрерыв- непрерывной, как композиция и произведение непрерывных функций на отрез- ь ке [а, 0\. По формуле Ньютона - Лейбница J f(x)dx = Т{Ъ) — Т{а) и ff(<p(t))<p'(t)dt = Т(<р(р))-Т(<р(а)). Но, по условию, <р(а) =аи а = Ь; таким образом, равенство (8) действительно имеет место. ► Из формулы (8) видно, насколько удобно иметь под интегралом не просто знак функции, а дифференциальное выражение f(x)dx, позволя- позволяющее после подстановки х = <p(t) автоматически получать правильное подынтегральное выражение в интеграле по новой переменной. Для того чтобы не осложнять дела громоздким доказательством, мы в утверждении 3 умышленно сузили истинную область примени- применимости формулы (8) и получили (8) из формулы Ньютона - Лейбница. Теперь перейдем к основной теореме о замене переменной, условия ко- которой несколько отличаются от условий утверждения 3. Доказатель- Доказательство этой теоремы будет опираться непосредственно на определение интеграла как предела интегральных сумм. Теорема 3. Пусть <р: [а,C] —> [а,Ь]—непрерывно дифференциру- дифференцируемое, строго монотонное отображение отрезка а ^ t ^ /3 в отрезок а < х < Ъ с соответствием концов ip(a) = а, (р(C) = Ъ или (р(а) = Ъ,
426 ГЛ VI ИНТЕГРАЛ ip(/3) = а. Тогда при любой функции f{x), интегрируемой на отрез- отрезке [а,Ь], функция f(ip(t))ip'(t) интегрируема на отрезке [а,0\ и спра- справедливо равенство / f(x)dx = JfMtW(t)dt. a ■4 Поскольку ip — строго монотонное отображение отрезка [а,0\ на отрезок [а, Ь] с соответствием концов, то любое разбиение Р< (а = = to < ... < tn = 0) отрезка [а, /3] посредством образов хг = (p(tt) (г = — 0,1,... ,п) точек разбиения Р< порождает соответствующее разбие- разбиение Рх отрезка [о, Ь], которое можно условно обозначить как <p(Pt)- При этом хо = а, если <р(а) = а, и Жо = Ь, если <р(а) = Ь. Из равномерной непрерывности <р на [а,0\ следует, что если А(Р() -» 0, то величина Н^х) — HviPt)) тоже стремится к нулю. Используя теорему Лагранжа, преобразуем интегральную сумму а(/;Рз;,£) следующим образом: 1=1 г=1 г=1 г=1 Здесь хг = <p(tt), £г = (р(тг), ^ лежит на отрезке с концами жг_1, хи а точки тг, тг лежат на отрезке с концами it-ii U (г = 1,..., п). Далее, Оценим последнюю сумму. Поскольку / € Ща,Ь], функция / огра- ограничена на [а,Ь]. Пусть |/(ж)| ^ С на [а,Ь]. Тогда г=1 где Дг — отрезок с концами t,_i, tt.
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 427 Последняя сумма стремится к нулю при А(Р<) —> 0, поскольку <р' — непрерывная на отрезке [а, 0\ функция. Таким образом, мы показали, что /Мг)У (г)г + а, г-1 1=1 где а —> 0 при А(Р() —> 0. Как уже отмечалось, если А(Р<) —> 0, то и Х(РХ) —> 0. Но / G 7£[а, Ь], поэтому при А(РЖ) -> 0 сумма в левой части последнего равенства стремится к интегралу / f(x) dx. Значит, при tp(a) \{Pt) —> 0 и сумма в правой части этого равенства имеет и притом тот же предел. п Но сумму Y1 /(¥'(тг))</з'(тг)А^г можно считать совершенно произ- г=1 вольной интегральной суммой функции /(<p(t))<p'(t), соответствующей разбиению Р< с отмеченными точками г = (п,..., тп), поскольку, вви- ввиду строгой монотонности (р, любой набор точек г можно получить из некоторого соответствующего ему набора £ = (£i, • • •, £п) точек, отме- отмеченных в отрезках разбиения Рх = </?(Р<). Таким образом, предел этой суммы есть, по определению, интеграл от функции f (<p(t))<p'(t) по отрезку [а, 0\, и мы доказали одновремен- одновременно как интегрируемость функции f((p(t))(p'(t) на отрезке [a,/J], так и формулу (9). ► 5. Некоторые примеры. Рассмотрим теперь некоторые приме- примеры использования полученных формул и доказанных в последних двух параграфах теорем о свойствах интеграла. Пример 1. 1 тг/2 тг/2 / y/l — х2dx = I v 1 — sin2tcostdt = I cos2tdt = -1 -тг/2 -tt/2 т/2 _,„ 1 Г 1/1 \ = - / A + cos 2t) dt = - [ t -\— sin 2t -7Г/2
428 ГЛ. VI. ИНТЕГРАЛ Для вычисления интеграла мы сделали замену переменной х = sint, а затем, найдя первообразную получившейся после этой замены подын- подынтегральной функции, воспользовались формулой Ньютона-Лейбница. Конечно, можно было бы поступить и иначе: найти довольно гро- громоздкую первообразную ^ж\/1 — х2+^ arcsin х функции \/\ — х2 и затем воспользоваться формулой Ньютона - Лейбница. Пример показывает, что при вычислении определенного интеграла, к счастью, иногда уда- удается избежать отыскания первообразной подынтегральной функции. Пример 2. Покажем, что 7Г 7Г 7Г a) f sinmxcosnxdx = 0, b) J sin2mxdx = 7г, с) J cos2nxdx = t — 7Г — 7Г — 7Г при m, n £ N. 7Г — 7Г 7Г 7Г ) / sinmxcosnxdx = - / (sin(n + m)x — sin(n — m)x) dx = 1/1 cos(n + m)x Ч cos(n — 2\n+m n—m = 0, если n — m ^ 0. Случай, когда n — m = 0, можно рассмотреть отдельно, и в этом случае, очевидно, вновь приходим к тому же результату. 7Г 7Г Ь) / sin2 mx dx = i / A — cos 2mx) dx = ^ (x — -i- sin2mx j = тт. — 7Г —7Г 7Г 7Г :) / cos2 nx dx = I / A + cos 2nx) dx = ~ (x + ^ sin 2nx J = 7r. с) —7Г —7Г Пример 3. Пусть / Е 7£[—а, а]. Покажем, что I а ( а .. ч , I 2ff(x)dx, если/ — четная функция, f[x)dx = < 0 _а v 0, если / — нечетная функция. Если /(—х) = /(х), то а 0 а 0 а J f(x)dx = J f(x)dx + J f(x)dx = J f(-t)(-l)dt + J f(x)dx =
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 429 а а а а = J f(-t)dt + J f(x)dx = f (f(-x) + f(x)) dx = 2 f f(x)dx. 0 0 0 0 Если же f(—x) = —f(x), то, как видно из тех же выкладок, получим а а а I f(x)dx= f(f(-x) + f(x))dx= fodx = O. Пример 4. Пусть /—определенная на всей числовой прямой R периодическая функция с периодом Т, т.е. /(ж + Т) = f(x) при х € М. Если / — интегрируемая на каждом конечном отрезке функция, то при любом а (Е Ш имеет место равенство а+Т Т J f(x)dx = Jf(x)dx, т. е. интеграл от периодической функции по отрезку длины периода Т этой функции не зависит от положения отрезка интегрирования на чи- числовой прямой: а+Т 0 Т а+Т I f(x)dx= I f(x)dx+ I f{x)dx+ I f(x)dx = a 0 T T 0 a = f f(x)dx+ f f(x)dx+ I f(t + T)-ldt = 0 a 0 T 0 a T = f f{x)dx+ f f(x)dx+ I f(t)dt= I f(x)dx. Мы сделали замену х — t + T и воспользовались периодичностью функции f(x). i Пример 5. Пусть нам нужно вычислить интеграл /sinx2dx, на- о пример, с точностью до 10~2.
430 ГЛ. VI. ИНТЕГРАЛ Мы знаем, что первообразная / sinx2dx (интеграл Френеля) не вы- выражается в элементарных функциях, поэтому использовать формулу Ньютона-Лейбница здесь в традиционном смысле нельзя. Поступим иначе. Исследуя в дифференциальном исчислении форму- формулу Тейлора, мы в качестве примера (см. гл. V, §3, пример 11) нашли, что на отрезке [—1,1] с точностью до 10~3 имеет место равенство sinx si- —ж3 + —ж5 =: Р(х). о! о\ Но если | sinx — Р(х)\ < 10~3 на отрезке [—1,1], то верно также, что |sinz2 - Р (ж2) | < Ю-3 при 0 < х < 1. Следовательно, ill 1 f sin ж2 dx- fP (х2) dx < I \srnx2 - Р (ж2) \ dx < Г 1(П3 dx < 1(Г3. 1 Таким образом, для вычисления интеграла / smx2dx с нужной точ- о 1 ностью достаточно вычислить интеграл J P(x2) dx. Но о JP (ж2) dx = J[x2 - 1ж6 + ^*10) dx = о о ~ ." 3!7 +5!11 поэтому 1 втж^ж = 0,310 ± 2 • 10 = 0,31 ± 10~2. о Пример 6. Величина ц = j-^ f f(x)dx называется интегралъ- a ным средним значений функции на отрезке [а,Ь]. Пусть / — определенная на R и интегрируемая на любом отрезке функция.
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 431 Построим по / новую функцию x+S Fs(x) = ^ I f(t)dt, x-S значение которой в точке х есть интегральное среднее значений / в ^-окрестности точки х. Покажем, что функция Fs(x) (называемая усреднением /) более ре- регулярна по сравнению с /. Точнее, если / интегрируема на любом отрез- отрезке [а,Ь], то Fs(x) непрерывна на М, а если / G С(Ш), то Fs(x) G Проверим сначала непрерывность функции Fs(x): x+S+h x-S J f(t)dt+ J f(t)dt x+S x—S+h />)-ЗД1 = ^ если \f(t)\ < С, например, в 2^-окрестности точки х и \h\ < 6. Из этой оценки, очевидно, следует непрерывность функции F$(x). Если же / € С(М), то по правилу дифференцирования сложной функции ip(x) if dx а а поэтому из записи x+S x—S Fs(x) = ^ [ f(t) dt-^- [ f(t) dt 20 J 16 J a a получаем, что = f(x + 6)-f(x-6) s{X) 26 Функцию F$(x) после замены t = x + u переменной интегрирования можно записать в виде s -S
432 ГЛ. VI. ИНТЕГРАЛ Если / € С'(М), то, применяя первую теорему о среднем, находим, что где \т\ < S. Отсюда следует, что что вполне естественно. Задачи и упражнения 1. Используя интеграл, найдите [ ] Ь) Ит 1а + 2"++Г + п", если а > 0. n-юо п + 2. а) Покажите, что любая непрерывная на интервале функция имеет на нем первообразную. Ь) Покажите, что если / е С^[а, Ь], то / может быть представлена как разность двух неубывающих на отрезке [а, Ь] функций (см. задачу 4 из § 1). 3. Покажите, что в предположении гладкости функции д вторая теоре- теорема о среднем (теорема 6 из § 2) интегрированием по частям непосредственно сводится к первой теореме о среднем. 4. Покажите, что если / Е С (Ж), то для любого фиксированного отрез- отрезка [а, Ь] по заданному е > 0 можно так подобрать S > 0, что на [а, Ь] будет выполнено неравенство \Fs(x) — f(x)\ < е, где Fg — осреднение функции, рас- рассмотренное в примере 6. 5. Покажите, что [ 2 е* ,. 1 — dt ~ -re1 при x ->• +oo. х+1 6. а) Проверьте, что функция f(x) = f sint2dt при х —>• оо имеет следу- х ющее представление: Ь) Найдите lim xf (x) и lim xf(x).
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 433 7. Покажите, что если /: К -» К—периодическая, интегрируемая на ка- каждом отрезке [а, Ь] С М. функция, то функция х (x) = Jf(t)dt может быть представлена в виде суммы линейной и периодической функций. 8. а) Проверьте, что при х > 1 и п £ N функция Рп(х) = - f 2 - есть полином степени п (п-й полином Лежандра). Ъ) Покажите, что Рп{х) = I / ** 7Г J (х — у/х2 — 1 COS ф) " 9. Пусть / — вещественнозначная функция, определенная на отрезке [а, Ь] С С R, a £i,..., £m — различные точки этого отрезка. Значения интерполяцион- интерполяционного полинома Лагранжа степени т — 1 совпадают в точках £i > • ■ • > £т (узлах интерполяции) со значениями функции /, причем если / € С^[а, Ь], то /(z)-Lm_i(z) = — ТТЫ где шт(ж) = П (х - £,), а <(ж) е ]а,6[ (см. задачу 11 в §3 гл. V). г=1 Пусть & = *±« + Ь^б„ тогда б, £ [-1,1], i = 1,... ,m. а) Покажите, что J г=1 где 15-4573
434 ГЛ. VI. ИНТЕГРАЛ В частности, ь ai) / L0(x) dx = (b- a)f ( ^—— j, если т = 1,01 = О; a Ь a2) fb^dx = ^[f(a) + f(b)], если т = 2,в1 = -1, в2 = 1; b a3) JL2(x)dx = Ь-=^ If (a) +4/ (^\ +/FI, если m = 3, вг = -1, 02 = 0, 0з = 1. b) Считая, что / € С^тЦа,Ь] и полагая Мт — max |/^mH^)l) оцените х£[а,Ь} величину Rm абсолютной погрешности в формуле б б / f(x)dx= Lm-i(x)dx + Rm а а Ь А/Г и покажите, что |i?m| ^ —•" с) В случаях ai), a2), аз) формула (*) называется соответственно форму- формулой прямоугольников, трапеций и парабол. В последнем случае ее называют также формулой Симпсона1). Покажите, что в случаях ai), аг), аз) имеют место следующие формулы: Ri = ^-(b-aJ, R2 = ~(b-aK, R3 =-—JL{b - а)\ где ^1,^2)Сз € [o>,b], а функция / принадлежит соответствующему классу d) Пусть / есть полином Р. Какова наивысшая степень полиномов Р, для которых точны формулы прямоугольников, трапеций и парабол соответст- соответственно? Пусть h - Ц^; xk=a + hk, k = 0,l,---,n; yk = f(xk). e) Покажите, что в следующей формуле прямоугольников ь / f(x)dx = h(y0 + У1 + -.. + yn-i) + Ri a остаток имеет вид i?i = =Ц^F — a)h, где ^ £ [a, b]. . Симпсон A710-1761) —английский математик.
§ 3. ИНТЕГРАЛ И ПРОИЗВОДНАЯ 435 f) Покажите, что в следующей формуле трапеций ь f(x) dx = - [(г/о + уп) + 2(yi + у2 остаток имеет вид Д2 = — 1у' (Ь — a)h2, где £ € [а, Ь]. g) Покажите, что в следующей формуле Симпсона (формуле парабол) ь I f(x) dx=- [(уо + уп) + %1 +УЗ + --- + Уп-i) + + 2(у2 + У4 + ■ ■ ■ + Уп-2)] + Яз, которая пишется при четных значениях п, остаток Дз имеет вид где ^6 [а,Ь]. h) Исходя из соотношения 1 dx вычислите 7г с точностью до 10 3, пользуясь формулами прямоугольников, трапеций и парабол. Обратите внимание на эффективность формулы Сим- Симпсона, которая по этой причине является наиболее распространенной квадра- квадратурной формулой (так называют формулы численного интегрирования в од- одномерном случае, отождествляя интеграл с площадью соответствующей кри- криволинейной трапеции). 10. Преобразуя формулу G), получите следующие виды записи остаточ- остаточного члена формулы Тейлора, где положено h — x — a: о 11. Покажите, что важная формула (9) замены переменной в интеграле остается в силе и без предположения монотонности функции замены.
436 ГЛ. VI. ИНТЕГРАЛ § 4. Некоторые приложения интеграла Использование интеграла в приложениях часто происходит по одной и той же схеме, которую по этой причине полезно изложить один раз в чистом виде. Этому посвящен первый пункт настоящего параграфа. 1. Аддитивная функция ориентированного промежутка и интеграл. Обсуждая в § 2 свойство аддитивности интеграла, мы вве- ввели понятие аддитивной функции ориентированного промежутка. На- Напомним, что это функция (а, 0) »-)■ 1(а, 0), которая каждой упорядочен- упорядоченной паре (а, 0) точек а,0 6 [а,Ь] фиксированного отрезка [о, Ь] ставит в соответствие число 1(а,/3), причем так, что для любой тройки точек а, 0,7 € [о, Ь] выполнено равенство ). A) Из A) при а = 0 = 7 следует, что 1(а, а) = 0, а при а = 7 получаем, что 1(а,0) + 1@,а) = 0, т.е. 1(а,C) = —1@,а). В этом сказывается влияние порядка точек а, 0. Полагая Т{х) = 1{а,х), в силу аддитивности функции / имеем 1(а, 0) = 1(а, 0) - 1(а, а) = F@) - Т{а). Таким образом, каждая аддитивная функция ориентированного промежутка имеет вид 1(а,0)=НР)-Н<х), B) где х н* Т(х) —функция точки отрезка [о, Ь]. Легко проверить, что верно и обратное, т.е. что любая функция х н* Т(х), определенная на отрезке [о, Ь], порождает по формуле B) ад- аддитивную функцию ориентированного промежутка. Приведем два типичных примера. X Пример 1. Если / 6 1l[a, b], то функция F(x) = J f(t) dt порожда- порождает, в силу формулы B), аддитивную функцию а
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 437 Заметим, что в данном случае функция ^{х) непрерывна на отрез- отрезке [а,Ь]. Пример 2. Пусть отрезок [0,1] есть невесомая струна с бусинкой единичной массы, прикрепленной к струне в точке х = 1/2. Пусть F{x) есть масса, находящаяся на отрезке [0, х] струны. Тогда по условию { К ' | 1 при 1/2 < ж < 1. Физический смысл аддитивной функции при /3 > а — масса, попавшая в полуинтервал ]а, 0\. Поскольку функция Т разрывна, аддитивная функция I(a, P) в рас- рассматриваемом случае не может быть представлена как интеграл Ри- мана от некоторой функции—плотности массы. (Эта плотность, т.е. предел отношения массы промежутка к его длине, должна была бы рав- равняться нулю в любой точке отрезка [а, Ь], кроме точки х = 1/2, где она должна была бы быть бесконечной.) Теперь докажем полезное для дальнейшего достаточное условие то- того, что аддитивная функция порождается интегралом. Утверждение 1. Пусть аддитивная функция I (a, P), определен- определенная для точек а, Р отрезка [а,Ь], такова, что существует функ- функция f 6 TZ[a,b], связанная с I следующим образом: для любого от- отрезка [а,Р] такого, что а ^. а < Р ^ Ь, выполняется соотношение inf f(x)(P — a)^.I(a,P)^. sup f(x)(P — a). xe[a,P] x£[a,f3] Тогда b (a,b) = jf(x)dx. a ^ Пусть P — произвольное разбиение о = xq < ... < xn = b отрез- отрезка [а,Ь];тг= inf f(x),Mt= sup f(x). xe[xt-i,x,\ xe[x,-i,x,] Для каждого отрезка [жг_1,жг] разбиения Р имеем по условию тпгАхг ^ 1(хг-1,хг) ^ МгАхг.
438 ГЛ VI ИНТЕГРАЛ Суммируя эти неравенства и пользуясь аддитивностью функции 1(а,C), получаем Крайние члены в последнем соотношении суть знакомые нам ниж- нижняя и верхняя суммы Дарбу функции /, соответствующие разбиению Р отрезка [а,Ь]. При А(Р) -> 0 обе они имеют своим пределом интеграл от / по отрезку [а, Ь]. Таким образом, переходя к пределу при Х(Р) -> О, получаем, что ь I(a,b) = Jf(x)dx. ► а Продемонстрируем теперь утверждение 1 в работе. 2. Длина пути. Пусть частица движется в пространстве I3, и пусть известен закон ее движения r(t) = (x(t),y(t),z(t)), где x(t), y(t), z(t) —прямоугольные декартовы координаты точки в момент вре- времени t. Мы хотим определить длину 1[а, Ь] пути, пройденного точкой за про- промежуток времени о < t < b. Уточним некоторые понятия. Определение 1. Путем в пространстве М3 называется отображе- отображение t н* (x(t), y(i),z(t)) числового промежутка в пространство М3, зада- задаваемое непрерывными на этом промежутке функциями x(t), y(t), z(t). Определение 2. Если t »-)■ (x(t), y(t),z(t)) есть путь, для которого областью изменения параметра t является отрезок [о, Ь], то точки А = (x(a),y(a),z(a)), В = (x(b),y(b),z(b)) пространства М3 называются соответственно началом и концом пути. Определение 3. Путь называется замкнутым, если он имеет и начало, и конец и эти точки совпадают. Определение 4. Если Г: / —> М3 —путь, то образ Г(/) промежут- промежутка/в пространстве М3 называется носителем пути.
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 439 Носитель абстрактного пути может оказаться вовсе не тем, что мы хотели бы назвать линией. Существуют примеры путей, носители ко- которых, например, содержат целый трехмерный куб (так называемые «кривые» Пеано). Однако если функции x(t), y(t), z(t) достаточно ре- регулярны (как, например, в случае механического движения, когда они дифференцируемы), то ничего противоречащего нашей интуиции, как можно строго проверить, заведомо не произойдет. Определение 5. Путь Г:/ —> М3, для которого отображение / —> -> Г(/) взаимно однозначно, называется простым путем или параме- параметризованной кривой, а его носитель — кривой в М3. Определение 6. Замкнутый путь Г: [о, Ь] -> М3 называется про- простым замкнутым путем или простой замкнутой кривой, если путь Г: [а,Ь] —> М3 является простым. Значит, простой путь отличается от произвольного пути тем, что при движении по его носителю мы не возвращаемся в прежние точ- точки, т. е. не пересекаем свою траекторию нигде, кроме, быть может, ее конца, если простой путь замкнут. Определение 7. Путь Г: / —> М3 называется путем данного клас- класса гладкости, если задающие его функции x(t), y(t), z(t) принадлежат указанному классу. (Например, классу С[а,Ь], С^[а,Ь] или С^[а,Ь].) Определение 8. Путь Г: [а,Ь] -> Ш3 называется кусочно гладким, если отрезок [а, Ь] можно разбить на конечное число отрезков, на ка- каждом из которых соответствующее ограничение отображения Г зада- задается непрерывно дифференцируемыми функциями. Именно гладкие пути, т. е. пути класса С^\ и кусочно гладкие пути мы и будем сейчас рассматривать. Вернемся к исходной задаче, которую теперь можно сформулиро- сформулировать как задачу определения длины гладкого пути Г: [а, Ь] —> R3. Наши исходные представления о длине Z[ck, /3] пути, пройденного в промежуток времени a ^.t ^ /3, таковы: во-первых, если а < /3 < 7, то l[a,i\=l[a,0\+l\P,i\,
440 ГЛ. VI. ИНТЕГРАЛ и, во-вторых, если v(t) = (x(t),y(t),z(t)) есть скорость точки в мо- момент t, то inf |f>(t)|(/?-a) </[<*,$< sup \v(t)\(p-a). [ Таким образом, если функции x(t), y(t), z(t) непрерывно дифферен- дифференцируемы на [о, Ь], то в силу утверждения 1 мы однозначно приходим к формуле б 6 1[а,Ь] = J\v(t)\dt = J y/x2(t)+y2(t)+z2(t)dt, C) а а которую и принимаем теперь как определение длины гладкого пути Г: [а,Ь]->М3. Если z(t) — 0, то носитель пути лежит в плоскости и формула C) приобретает вид ь D) Пример 3. Опробуем формулу D) на знакомом объекте. Пусть точка движется в плоскости по закону х = R cos 2vri, у = R sin 2-Kt. За промежуток времени [0,1] точка один раз пробежит окружность радиуса R, т. е. пройдет путь длины 2nR, если длина окружности вы- вычисляется по этой формуле. Проведем расчет по формуле D): 1 1[0,1] = f y/(-2nR sin27riJ + BтгЯ cos 2тг*J dt = 2nR. о Несмотря на ободряющее совпадение результатов, проведенное рас- рассуждение содержит некоторые логические пробелы, на которые стоит обратить внимание.
§4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 441 Функции cos а и sin а, если принять их школьное определение, суть декартовы координаты образа р точки ро = AH) при повороте на угол а. Величина а с точностью до знака измеряется длиной дуги окруж- окружности х2 + у2 = 1, заключенной между ро и р. Таким образом, при этом подходе к тригонометрическим функциям их определение опирается на понятие длины дуги окружности и, значит, вычисляя выше длину окружности, мы совершили в известном смысле логический круг, за- задав параметризацию окружности в виде E). Однако эта трудность, как мы сейчас увидим, не принципиальная, ибо параметризацию окружности можно задать, вовсе не прибегая к тригонометрическим функциям. Рассмотрим задачу о вычислении длины графика функции у = f(x), определенной на некотором отрезке [о, Ь] С К. Имеется в виду вычисле- вычисление длины пути Г: [а,Ь] -> М2, имеющего специальный вид параметри- параметризации гн (x,f(x)), из которого можно заключить, что отображение Г: [о, Ь] —» М2 взаим- взаимно однозначно. Значит, по определению 5 график функции есть кри- кривая в М2. Формула D) в данном случае упрощается, поскольку, полагая в ней x = t, y = /(£), получаем F) В частности, если рассмотреть полуокружность У = V 1 — х2, — 1 ^ х ^ 1, окружности х2 + у2 = 1, то для нее получим 1 dx G, Но под знаком последнего интеграла стоит неограниченная функция и, значит, он не существует в традиционном, изученном нами смысле.
442 ГЛ. VI. ИНТЕГРАЛ Означает ли это, что полуокружность не имеет длины? Пока это толь- только означает, что указанная параметризация полуокружности не удо- удовлетворяет условиям непрерывности функций х, у, при которых была выписана формула D), а значит, и формула F). Поэтому нам следует либо подумать о расширении понятия интеграла, с тем чтобы интеграл в G) получил определенный смысл, либо перейти к параметризации, удовлетворяющей условиям применимости формулы F). Заметим, что если взятую параметризацию рассматривать на лю- любом отрезке вида [—1 + 6,1 — 8], где — 1 < — 1 + 8 < 1 — 8 < 1, то на нем формула F) применима и по ней находим длину is [-1+8,1-8]= dx -1+6 дуги окружности, лежащей над отрезком [— 1 + 8,1 — 8]. Естественно поэтому считать, что длина I полуокружности есть предел lim l[—1 + 8,1 —8]. В таком же смысле можно понимать и инте- интеграл в соотношении G). Этим естественно возникающим расширением понятия интеграла Римана мы подробнее займемся в следующем пара- параграфе. Что же касается рассматриваемого конкретного вопроса, то, даже не меняя параметризацию, можно найти, например, длину l\ — |, | дуги единичной окружности, опирающейся на хорду, конгруэнтную радиусу окружности. Тогда (уже из геометрических соображений) должно быть [] Заметим также, что Г dx f{l-x2 + x2)dx Г г - / —==== I -j==J- = / v 1 — х dx— J v 1 — х2 J v 1 — x2 J 1 fxd(l-x2) f г r — - I —, = 2 / у 1 — xl dx — xyl — x2, 2J sfl^x2 J поэтому 1-S 1+6
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 443 Таким образом, 1 I = lim Ц-1+6,1-E] = 2 f Vl- -1 Длина полуокружности единичного радиуса обозначается симво- символом 7г, и мы приходим к следующей формуле: 1 тг = 2 [л/l-x2 dx. -1 Последний интеграл есть обычный (а не обобщенный) интеграл Ри- мана, и его можно вычислить с любой точностью. Если для х 6 [—1,1] величину 1[х, 1] назвать arccos ж, то в силу про- проведенных выше выкладок 1 arccos х - Г dt или arccos x = х Если считать длину дуги первичным понятием, то первичными на- надо считать функцию х н->- arccos x, введенную только что, и функцию х \-л arcsina;, которую можно ввести аналогично, а функции х (->■ cos ж И14 sin ж тогда можно получить как им обратные на соответству- соответствующих отрезках. В сущности, именно это и делается в элементарной геометрии. Пример с длиной полуокружности поучителен не только тем, что, разбирая его, мы сделали, быть может, небесполезное для кого-то заме- замечание об определении тригонометрических функций, но еще и тем, что он естественно порождает вопрос о том, не зависит ли вообще опре- определенное формулой C) число от выбора системы координат х, у, z и параметризации кривой, когда речь идет о длине кривой. Оставляя читателю анализ роли пространственных декартовых ко- координат, рассмотрим здесь роль параметризации. Уточним, что под параметризацией некоторой кривой в М3 мы под- подразумеваем задание простого пути Г: / —> М3, носителем которого
444 ГЛ. VI. ИНТЕГРАЛ является данная кривая. Точку или число t € I называют параметром, а промежуток /—областью изменения параметра. Если Г: / -> С и Г: / -> С — два взаимно однозначных отображе- отображения с одним и тем же множеством значений С, то естественно возни- возникают взаимно однозначные отображения Г о Г: I —ь I, Г о Г: / -> / между областями определения I и I этих отображений. В частности, если имеются две параметризации одной кривой, то между самими параметрами t € I, т € I устанавливается естественное соответствие t = i(r) или г = r(i), позволяющее по параметру точки в одной параметризации определять ее же параметр в другой параме- параметризации. Пусть Г: [о, Ь] —> С и Г: [а, 0\ —> С — две параметризации одной кривой с соответствием Г(а) = Г(а), Г(Ь) — Г(/3) начала и конца. Тогда функции t = i(r), r = r(i) перехода от одного параметра к другому будут непрерывными, строго монотонными отображениями отрезков а < i < Ь, a < r < Р друг на друга с соответствием начал а ■<->• а и концов b <-> /3. Если кривые Г и Г при этом задавались такими тройками (x(t), y(t), z(t)), (x(t),y(t),z(t)) гладких функций, что \v(t)\2 = ±2(t) + y2(t) + +z2(t) ф Она [a, Ь] и |w(r)|2 = ж (r)+j/ {r)+z (г) ^ Она [a, /3], то можно проверить, что в этом случае функции перехода t = t(r) и г = r(t) будут гладкими функциями, имеющими положительную производную на отрезке своего определения. Мы не станем сейчас заниматься проверкой этого утверждения, оно будет в свое время получено как одно из следствий важной теоремы о неявной функции. В данный же момент высказанное утверждение служит скорее мотивировкой следующего определения. Определение 9. Говорят, что путь Г: [а, 0\ -> М3 получен из пу- пути Г: [о,Ь] —* М3 допустимым изменением параметризации, если су- существует такое гладкое отображение Г: [а,0] -> [а,Ь], что Т(а) = а, Т(Р) - 6, Т(т) > 0 на [а,0\ и Г = ГоТ. Проверим теперь следующее общее Утверждение 2. Если гладкий путь Г: [а,0\ —» М3 получен из гладкого пути Г: [а,Ь] —» М3 допустимым изменением параметриза- параметризации, то длины этих путей совпадают.
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 445 ■4 Пусть Г: [а,/3] -»■ R3 и Г: [а,Ь] -»■ М3 задаются соответственно тройками т н-* (ж(т),у(т),г(т)) и £ н-> (x(t),y(t),z(t)) гладких функций, a t = t(r) — допустимое изменение параметризации, при котором х(т) = x(t(r)), у(т) = y(t(r)), z(r) = z(t(r)). Используя определение C) длины пути, правило дифференцирова- дифференцирования композиции функций и правило замены переменной в интеграле, имеем о I y/x2{t)+y2{t)+z2{t)dt = = I y/x2(t(r))+y2(t(r))+z2(t(r))t'(r) dr = [x(t(r))t'(r)}2 + [y(t(r))t'(r)}2 + [z(t(r))t'(r)fdr = -№ Итак, в частности, показано, что длина кривой не зависит от ее гладкой параметризации. Длину кусочно гладкого пути определяют как сумму длин гладких путей, на которые он подразделяется; поэтому легко проверить, что и длина кусочно гладкого пути не меняется при допустимом изменении его параметризации. Заканчивая обсуждение понятия длины пути и длины кривой (о ко- которой мы после утверждения 2 теперь вправе говорить), рассмотрим еще один Пример 4. Найдем длину эллипса, задаваемого каноническим уравнением Взяв параметризацию х = a sin ф, у = b cos ф, О ^ ф ^ 2тг, получаем 2тг 2тг / О = /V/(«^osV^TI::bsin^JdV'= /V/o^r(«^-
446 ГЛ. VI. ИНТЕГРАЛ тг/2 7г/^ л/1 г— sin2 ipdip = 4а I y/l — fc2sin2^>4ф, \ a2 J где А;2 = 1 — ^ — квадрат эксцентриситета эллипса. а Интеграл E(k,ip) = f y/l-k2si не выражается в элементарных функциях и ввиду указанной связи с эллипсом называется эллиптическим. Точнее, Е(к, <р) — эллиптический интеграл второго рода в форме Лежандра. Значение, которое он при- принимает при tp = 7г/2, зависит только от к, обозначается через Е(к) и называется полным эллиптическим интегралом второго рода. Итак, E(k) = E(k,ir/2), поэтому длина эллипса в этих обозначениях имеет вид/ = АаЕ{к). 3. Площадь криволинейной трапеции. Рассмотрим фигуру аАВЬ (рис.48), называемую криволинейной трапецией. Фигура огра- ограничена вертикальными отрезками аА, ЬВ, отрезком [а, Ь] оси абсцисс и кривой АВ, являющейся графиком некоторой интегрируемой на [а, 6] функции y = f(x). Пусть [а, 0] —отрезок, содержащийся в [а,Ь]. Обозначим через S(a,/3) площадь со- соответствующей ему криволинейной трале- ции af(a)f(№ Наши представления о площади таковы: если а<а<)8<7^Ь, то В а а /3 Рис. 48. Ъ х 5@,7) (аддитивность площади) и inf f(x)(/3 -a) 4. S(a, хе[а,/3] sup f(x)(J3 - а) хе[а,0] (площадь объемлющей фигуры не меньше площади объемлемой).
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 447 Значит, в силу утверждения 1, площадь указанной фигуры надо вы- вычислять по формуле б S(a,b) = Jf(x)dx. (9) а Пример 5. Используем формулу (9) для подсчета площади элли- эллипса, заданного каноническим уравнением (8). В силу симметрии фигуры и предполагаемой аддитивности площа- площади, достаточно найти площадь только той части эллипса, которая рас- расположена в первом квадранте, и затем учетверить полученный резуль- результат. Проведем вычисления: 5 = 4 f Jb2 A -^~\dx = Ab f y/l-smHacostdt = тг/2 тг/2 = Aab I cos2 tdt = 2ab / A - cos2i) dt = nab. По дороге мы сделали замену х = asint, 0 ^ t ^ тг/2. Итак, S = nab. В частности, при а = b = R получаем формулу nR2 площади круга радиуса R. Замечание. Необходимо отметить, что формула (9) дает площадь криволинейной трапеции при условии, что f(x) ^ 0 на [а,Ь]. Если же /—произвольная интегрируемая функция, то интеграл (9), очевид- очевидно, даст алгебраическую сумму площадей соответствующих криволи- криволинейных трапеций, лежащих над и под осью абсцисс. Причем площади трапеций, лежащих над осью абсцисс, будут суммироваться со знаком плюс, а площади трапеций, лежащих под осью, — со знаком минус. 4. Объем тела вращения. Пусть теперь изображенная на рис. 48 криволинейная трапеция вращается вокруг отрезка [а,Ь]. Определим объем получающегося при этом тела. Обозначим через V(ct, /3) объем тела, полученного вращением криво- криволинейной трапеции af(a)f(/3)l3 (см. рис.48), отвечающей отрезку [а,0\с[а,Ь]-
448 ГЛ. VI. ИНТЕГРАЛ По нашим представлениям об объеме, должны быть справедливы следующие соотношения: если а^.аК/ЗК'у^Ь, то V(a,-y) = У(а,Р) + У(р,-у) тг( inf f(x)) {&-<*) ^V{a,P)^n( sup f(x)) @-a). \x€[a,/3] J \xe[a,/3] J В последнем соотношении мы оценили объем V(a, /3) через объемы вписанного и описанного цилиндров и воспользовались формулой объ- объема цилиндра (которую нетрудно получить, если уже найдена площадь круга). Тогда в силу утверждения 1 ь V(a,b) = n f f2(x)dx. A0) а Пример 6. Вращением вокруг оси абсцисс полукруга, ограничен- ограниченного отрезком [-R, R] этой оси и дугой окружности у = VR2 — х2, —R ^ х ^ R, можно получить трехмерный шар радиуса R, объем кото- которого легко вычислить по формуле (Ю): я -R Подробнее об измерении длин, площадей и объемов будет сказано в части II курса. Тогда же мы решим и вопрос об инвариантности данных определений. 5. Работа и энергия. Энергетические затраты, связанные с пере- перемещением тела под действием постоянной силы в направлении действия силы, измеряют произведением F • 5 величины силы на величину пере- перемещения. Эта величина называется работой силы на данном перемеще- перемещении. В общем случае направление данной силы и перемещение могут быть неколлинеарны (например, везем за веревочку санки), и тогда ра- работа определяется как скалярное произведение (F, S) вектора силы и вектора перемещения. Рассмотрим некоторые примеры вычисления работы и использова- использования связанного с ней понятия энергии.
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 449 Пример 7. Работа, которую нужно совершить против силы тяже- тяжести, чтобы поднять вертикально вверх тело массы т с уровня h\ над поверхностью Земли на уровень /i2, в силу данного определения равна ™?(/i2 — hi). Предполагается, что вся операция происходит у поверх- поверхности Земли, когда изменением силы тяжести гад можно пренебречь. Общий случай разобран в примере 10. Пример 8. Пусть имеется идеально упругая пружина, один ко- конец которой закреплен в точке 0 числовой оси, а другой находится в точке х. Известно, что сила, с которой при этом приходится удержи- удерживать этот конец пружины, равна кх, где к — коэффициент жесткости пружины. Вычислим работу, которую надо совершить, чтобы переместить по- подвижный конец пружины из положения х = а в положение х = Ь. Считая работу А(а,/3) аддитивной функцией промежутка [а,/?] и принимая, что верны оценки inf (kx)(P-a)^A(a,P)^ sup (kx)(C-a), [] получаем в силу утверждения 1, что /кх1 кх dx = ——- Это работа против силы. Работа же самой силы пружины на том же перемещении отличается только знаком. Функция U(x) = Щ-, которую мы нашли, позволяет вычислять ра- боту, которую мы совершаем, меняя состояние пружины, а значит, и ту работу, которую пружина может совершить при возвращении в исход- исходное состояние. Такая функция U(x), зависящая только от конфигурации системы, называется потенциальной энергией системы. Из построения видно, что производная от нее дает силу пружины с обратным знаком. Если точка массы т движется вдоль оси под действием указанной упругой силы, то ее координата x(t) как функция времени удовлетво- удовлетворяет уравнению тх = —кх. A1) Мы уже однажды проверяли (см. гл. V, § 6, п. 6), что величина
450 ГЛ. VI. ИНТЕГРАЛ представляющая из себя сумму кинетической и (как мы теперь пони- понимаем) потенциальной энергий системы, остается во время движения постоянной. Пример 9. Теперь рассмотрим еще один пример. В нем встретит- встретится сразу целый ряд понятий, которые мы ввели и освоили в дифферен- дифференциальном и интегральном исчислении. Заметим сначала, что по аналогии с функцией A2), записанной для конкретной механической системы, удовлетворяющей уравнению (И), для произвольного уравнения вида s(t) = f(s(t)), A3) где f(s)—заданная функция, можно проверить, что сумма у + Щв) = Е A4) не меняется со временем, если U'(s) = —f(s). Действительно, dE Ids2 dU(s) ... dU ds .... „ .. Таким образом, из A4), считая Е постоянной величиной, последо- последовательно находим а = ±у/2{Е-Ща)) (где знак корня должен соответствовать знаку производной -4), затем ± Х ds у/2(Е - U{s)) и, наконец, ds / y/2{E-U(a))' Следовательно, используя закон сохранения «энергии» A4) уравне- уравнения A3), нам удалось в принципе решить это уравнение, но найдя не функцию s(t), а обратную к ней функцию t(s).
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 451 Уравнение A3) возникает, например, при описании движения точки вдоль заданной кривой. Пусть частица перемещается под действием силы тяжести по узкому идеально гладкому желобу (рис.49). Пусть s(t)—расстояние вдоль желоба (т.е. длина пути) от неко- некоторой фиксированной точки О — начала отсчета — до точки, в кото- которой находится частица в момент t. Ясно, что тогда s(t) есть величи- величина скорости частицы, a s(t) — величина тангенциальной составляющей ее ускорения, которая должна равняться величине тангенциальной со- составляющей силы тяжести в данной точке желоба. Ясно также, что тангенциальная составляющая силы тяжести зависит только от точки желоба, т. е. зависит только от s, ибо s можно считать параметром, па- параметризующим кривую1^, с которой мы отождествляем желоб. Если зту составляющую силы тяжести обозначить через f(s), то мы полу- получим, что ms = f(s). Для данного уравнения сохраняться будет величина ^ms2 + U (а) = Е, где U1 (а) = -f(a). Поскольку слагаемое ^rns2 есть кинетическая энергия точки, а дви- движение вдоль желоба происходит без трения, то можно, минуя вычисле- вычисления, догадаться, что функция U(s) с точностью до постоянного слага- слагаемого должна иметь вид mgh(s), где mgh(s)—потенциальная энергия точки, находящейся на высоте h(s) в поле тяжести. Если в начальный момент t = О было s@) = 0, s@) = so и h(so) = ho, то из соотношения птр — = i2 + 2gh{s) = С m г2 _ находим, что С = 2gh(so), поэтому s2 = 2g(ho — h(s)), A5) = f J so y/2g(ho - h(a))' ^Параметризация кривой посредством ее же длины называется натуральной, a s в этом случае называют натуральным параметром.
452 ГЛ. VI. ИНТЕГРАЛ В частности, если, как в случае маятника, точка движется вдоль окружности радиуса R, отсчет длины s ведется от нижней точки О окружности, а начальные условия состоят в том, что при t = О s@) = О и дан начальный угол — щ отклонения (рис.50), то, как легко прове- проверить, выражая s и h(s) через угол отклонения ср, получим s -I ds ч> y/2g(h0 - h(s)) J ^2gR(cos ф - cos щ)' so -¥>o или A6) Таким образом, для полупериода ^Т качания маятника получаем /— ¥>0 1 1 / D f ■й 2\i g J откуда после подстановки ходим тг/2 =, A7) 9 J \/1-кЧт2в = sin# на- A8) so где к2 = sin2 ^. Напомним, что функция называется эллиптическим интегралом первого рода в форме Лежан- дра. При <р = тг/2 она зависит только от к2, обозначается К (к) и назы- называется полным эллиптическим интегралом первого рода. Таким обра- образом, период колебаний маятника равен A9)
§ 4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 453 Если угол щ начального отклонения мал, то можно положить к — О и тогда получим приближенную формулу B0) Теперь, когда формула A8) получена, все же следует проанализиро- проанализировать весь ход рассуждений, и тогда мы заметим, что под знаками ин- интегралов A5) - A7) стоят неограниченные на отрезке интегрирования функции. Подобная трудность нам уже встречалась при рассмотрении длины кривой, и мы примерно представляем себе, как и какой смысл можно придать интегралам A5)-A7). Но раз этот вопрос возник вторично, то его следует разобрать в точной математической постановке, что и будет сделано в следующем параграфе. Пример 10. Тело массы т совершает подъем над поверхностью Земли по траектории t ь* (x(t), y(t), z(t)), где t — время, о ^ t ^ 6, a i, у, z — декартовы координаты точки в пространстве. Необходимо вычи- вычислить работу тела против силы тяжести на промежутке времени [а, Ь]. Работа А{а,[5) есть аддитивная функция промежутка [а, 0\ С [а, Ь]. Постоянная сила F при действии на тело, движущееся с постоянной скоростью v, за время h совершает работу (F, vh) = (F, v)h, поэтому представляется естественной оценка inf (F(p(t)), v(t))(C — a) ^ A(a, /3) ^ sup (F(p(t)), v(t))(/3 — a), где v(t) — скорость тела в момент t, p(t)— точка пространства, в ко- которой находится тело в момент t, a F(p(t))—сила, которая в точке р — p(t) действует на тело. Если функция (F(p(t)),«(<)) окажется интегрируемой, то в силу утверждения 1 мы должны считать, что б A(a,b) = J(F{p(t)),v(t))dt. а В нашем случае v(t) = (x(t),y(t),z(t)), и если r(t) — (x(t),y(t),z(t)), то по закону всемирного тяготения находим „. . „, . „тМ GmM , F(p) = F(x,y,z) = Gj-z-r = — -—(x,y,z),
454 ГЛ. VI. ИНТЕГРАЛ где М — масса Земли, а ее центр предполагается совпадающим с нача- началом системы координат. Тогда = поэтому GmM at = b GmM Итак, „, . GmM GmM A(a, b) = - Мы обнаружили, что искомая работа зависит только от величин |г(а)|, |г(Ь)| удаления тела т от центра Земли в начальный и конечный моменты времени рассматриваемого промежутка [а, Ь]. Полагая тт< ^ GM U(r) = г ' получаем, что работа против силы тяжести по перемещению тела массы m из любой точки сферы радиуса го в любую точку сферы радиуса г\ вычисляется по формуле Aon = m(U(r0) - U(ri)). Функция U(г) называется потенциалом Ньютона. Если через R обозначить радиус Земли, то, поскольку —j- = g, функцию U[r) можно переписать в виде Учитывая это, можно получить следующее выражение для работы, необходимой для выхода из поля тяготения Земли, точнее, для увода массы т с поверхности Земли на бесконечное расстояние от центра Земли. Под этой величиной естественно понимать предел lim Art. 1—^+ОО
§4. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ ИНТЕГРАЛА 455 Итак, работа выхода: А = r-Ц-оо = lim m I —- ) = г->+оо \ R Г = mgR. Задачи и упражнения 1. На рисунке 51 изображен график зависимости F = F(x) силы, действу- действующей вдоль оси абсцисс на пробную частицу, находящуюся в точке х этой оси. a) Нарисуйте в той же системе координат эскиз потенциала этой силы. b) Изобразите потенциал силы — F(x). c) Исследуйте, в каком из разобранных случаев положение ж0 является устойчивым положением равновесия и с каким свойством потенциала это связано. 2. На основе результата примера 10 вы- вычислите скорость, которую должно иметь те- тело, чтобы оно вышло из поля тяготения Земли (вторая космическая скорость для Земли). 3. На основе примера 9 а) выведите уравнение Яф = gsintp коле- колебаний математического маятника; 0 Рис. 51. b) считая колебания малыми, получите его приближенное решение; c) определите по приближенному решению период колебаний маятника и сравните результат с формулой B0). 4. По горизонтальной плоскости равномерно со скоростью v катится без проскальзывания колесо радиуса г. Пусть в момент t — 0 верхняя точка А колеса имеет координаты @,2г) в системе декартовых координат, ось абсцисс которой лежит в указанной плоскости и направлена по вектору скорости. a) Запишите закон движения t i-t (x(t),y(t)) точки А. b) Найдите скорость точки А как функцию времени. c) Изобразите графически траекторию точки А (эта кривая называется циклоидой). d) Найдите длину одной арки циклоиды (длину одного периода этой пери- периодической кривой). e) Циклоида обладает рядом интересных свойств, одно из которых, от- открытое Гюйгенсом1), состоит в том, что период колебаний циклоидального маятника (шарика, катающегося в циклоидальной ямке) не зависит от высо- высоты его подъема над нижней точкой ямки. Попробуйте доказать это, опираясь Х'Х. Гюйгенс A629-1695)—нидерландский механик, физик, математик и аст- астроном.
456 ГЛ. VI. ИНТЕГРАЛ на пример 9. (См. также задачу 6 следующего параграфа, посвященного не- несобственным интегралам.) 5. а) Исходя из рис. 52, объясните, почему если у = f(x) и х = д(у) — взаимно обратные непрерывные неотрицательные функции, равные нулю при х — 0 и у = 0 соответственно, то должно быть выполнено неравенство о о b) Получите из а) неравенства Юнга ху ^ -хр Н—уя р q при х, у ^0, p,q>0, 1 + 1 = 1. c) Какой геометрический смысл имеет знак равенства в неравенствах за- задач а) и Ь)? 6. Задача Бюффона1^. Число 7Г можно вычислять сле- следующим весьма неожиданным способом. -j Берем большой лист бумаги, разлинованный парал- / лельными прямыми с шагом ft, и бросаем на него, никак специально не целясь, иголку длины I < ft. Пусть мы бро- бросили иголку N раз и пусть п раз из них иголка после падения пересекала какую-нибудь из прямых линий на листе. Если число N достаточно велико, то п ss 2L, где р = jj можно трактовать как приближенное значение ве- вероятности того, что при бросании иголка пересечет одну рта„ со о irm.. ol. из ЛИНИИ. Исходя из геометрических соображений, связанных с вычислением площа- площадей, попробуйте дать удовлетворительное объяснение этому методу вычисле- вычисления 7Г. § 5. Несобственный интеграл В предыдущем параграфе мы уже столкнулись с необходимостью несколько расширить понятие интеграла Римана. Там же на разборе конкретной задачи мы составили себе представление о том, в каком направлении и как это следует сделать. Настоящий параграф посвящен реализации этих представлений. . Л. Л. Бюффон A707 -1788) — французский естествоиспытатель.
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 457 1. Определения, примеры и основные свойства несобствен- несобственных интегралов Определение 1. Пусть функция х и- f(x) определена на проме- промежутке [а, +оо[ и интегрируема на любом отрезке [а, Ь], содержащемся в этом промежутке. Величина +ОО [ f(x)dx:= lim ff(x)dx, J 6->+oo J a a если указанный предел существует, называется несобственным инте- интегралом Римана или просто несобственным интегралом от функции / по промежутку [а, +оо[. +ОО Сам символ / f(x) dx также называют несобственным интегралом а и тогда говорят, что несобственный интеграл сходится, если указан- указанный предел существует, и расходится в противном случае. Таким обра- образом, вопрос о сходимости несобственного интеграла равносилен вопро- вопросу о том, определен ли вообще этот несобственный интеграл или нет. Пример 1. Исследуем, при каких значениях параметра а сходит- сходится или, что то же самое, определен несобственный интеграл +ОО 1 Поскольку /I- dx . — а ь при lna;^ при а = 1, то предел lim 1 существует только при а > 1. Итак, f <te _ 1 J ха ~ а - 1 оо dx 1 - = —, если «>1,
458 ГЛ. VI. ИНТЕГРАЛ а при других значениях параметра а интеграл A) расходится, т.е. не определен. Определение 2. Пусть функция х i-> f(x) определена на проме- промежутке [а,В[ и интегрируема на любом отрезке [а, Ь] С [а, В[. Величина в ь Jf(x)dx:=b\im_Jf(x)dx, если указанный предел существует, называется несобственным инте- интегралом от функции f no промежутку [а,В[. Суть этого определения состоит в том, что в любой окрестности конечной точки В функция / может оказаться неограниченной. Аналогично, если функция х н-> f(x) определена на промежутке]А,Ц и интегрируема на любом отрезке [а,Ь] С ]А, Ь], то по определению полагают А и также по определению полагают б [f(x)dx:= lim ff(x)dx J a-^-A+0 J /f(x)dx:= lim I f(x)dx. a-^-ooJ —oo a Пример 2. Исследуем, при каких значениях параметра а сходит- сходится интеграл о Поскольку при а € ]0,1] 1 , если /£■ B) 1 Г 1 1-Q Гcte _ I l-a^ У ^а ] ii а если а = 1, то предел у [dx 1 hm / — = а->+о J ха 1 - а а существует только при а < 1.
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 459 Итак, интеграл B) определен только при а < 1. Пример 3. о о [ exdx= lim fexdx= lim (e*|°) = lim A - e°) = 1. J a-»-oo J a->-oo\ "/ a-»-oo —oo a Поскольку вопрос о сходимости несобственного интеграла решает- решается одинаково как для несобственного интеграла по неограниченному промежутку, так и для несобственного интеграла от функции, неогра- неограниченной около одного из концов промежутка интегрирования, то в дальнейшем мы будем рассматривать оба эти случая вместе, введя сле- следующее основное Определение 3. Пусть [а,ш[ — конечный или бесконечный про- промежуток, аги f(x)— функция, определенная на нем и интегрируемая на каждом отрезке [а,Ь] С [а,ш[. Тогда по определению w Ь ff(x)dx:= lim f f(x)dx, C) J b^ui J если указанный предел при b —> ш, b € [а, ш[, существует. В дальнейшем, если не оговорено противное, рассматривая несоб- несобственный интеграл C), мы будем предполагать, что подынтегральная функция удовлетворяет условиям определения 3. Кроме того, для определенности мы будем пока считать, что не- несобственность интеграла связана только с верхним пределом интегри- интегрирования. Рассмотрение случая, когда особенность интеграла связана с нижним пределом, проводится дословно так же. Из определения 3, свойств интеграла и свойств предела можно сде- сделать следующее заключение о свойствах несобственного интеграла. Утверждение 1. Пусть х к-> f(x) и х к-> д(х) —функции, опре- определенные на промежутке [а,ш[ и интегрируемые на любом отрезке [а,Ь] С [а,ш[. Пусть для них определены несобственные интегралы I а ш I f(x)dx, D) g(x) dx. E)
460 ГЛ. VI. ИНТЕГРАЛ Тогда a) если wgRii/б И\а, ш], то значения интеграла D), понимае- мого как в несобственном, так и в собственном смысле, совпадают; b) при любых АьАг б Ж функция (Ai/ + \2g)(x) интегрируема в несобственном смысле на [а,ш[ и справедливо равенство c) если с € [а,ш[, то ш с ш ff(x)dx= ( f(x)dx+ f f(x)dx; а а с d) если ip: [a,7[ —> [а,ш[—гладкое, строго монотонное отображе- отображение, причем <р(а) = а и <р@) —> ш при /3 —> -у, /3 € [а, -у[, то несобствен- несобственный интеграл от функции <»->(/ о (p)(t)(p'(t) на [а,-у[ существует и справедливо равенство и 7 Jf(x)dx = J(fo(p)(t)<p'(t)dt. а а ■4 а) Следует из непрерывности функции 6 НЬ) = Jf(x)dx а на отрезке [а,ш], на котором / € Ща,ш]. b) Следует из того, что при Ь € [а,ш[ ь ь ь f(Mf + \29)(x) dx = Ai I f(x) dx + A2 f g(x) dx. a a a c) Следует из равенства б с 6 f f(x)dx= [ f(x)dx+ [ f{x)dx, а а с справедливого при любых Ь,сЕ [a,u>[.
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 461 d) Следует из формулы J f(x)dx = J(fo<p)(t)<p'(t)dt а=<р(а) замены переменной в определенном интеграле. ► Замечание 1. К свойствам несобственного интеграла, выражен- выраженным в утверждении 1, следует еще добавить весьма полезное прави- правило интегрирования по частям в несобственном интеграле, которое мы приведем в следующей формулировке: Если f,g € С^[а,ш[ и существует предел lim (f-g)(x), то X—>Ш x<=[a,ui[ функции f ■ g' и f ■ g одновременно интегрируемы или не интегри- интегрируемы в несобственном смысле на [а,ш[ и в случае интегрируемости справедливо равенство ш ш ■ 9')(х) dx = (f- g)(x)\"a - J(f ■ g)(x) dx, a a где (f.g)(x)\wa= lim (f ■ g)(x) - (f ■ g)(a). ■4 Это следует из формулы б б J(f ■ g')(x) dx = (f- g)(x)\ba - J(f ■ g)(x) dx a a интегрирования по частям в собственном интеграле. ► Замечание 2. Из пункта с) утверждения 1 видно, что несобствен- несобственные интегралы Jf(x)dx, Jf(x)dx а с сходятся или расходятся одновременно. Таким образом, в несобствен- несобственных интегралах, как и в рядах, сходимость не зависит от начального куска ряда или интеграла.
462 ГЛ. VI. ИНТЕГРАЛ По этой причине иногда, ставя вопрос о сходимости несобственного интеграла, вообще опускают тот предел интегрирования, около кото- которого интеграл не имеет особенности. При таком соглашении полученные в примерах 1, 2 результаты мож- можно записать так: интеграл f Щ сходится только при а > 1; •С интеграл f -~ сходится только при а < 1. +о х Знак +0 в последнем интеграле показывает, что рассматривается область х > 0. Заменой переменной из последнего интеграла сразу получаем, что интеграл Г ——— сходится только при а < 1. ДО (х - хо)а 2. Исследование сходимости несобственного интеграла а. Критерий Коши. В силу определения 3, сходимость несобствен- несобственного интеграла C) равносильна существованию предела функции = Jf(x)dx F) а при Ъ —)■ w, b E [а,ш[. Поэтому справедливо следующее Утверждение 2 (критерий Коши сходимости несобственного ин- интеграла). Если функция х *-> f(x) определена на промежутке [а,ш[ и ш интегрируема на любом отрезке [а, 6] С [а, ш[, то интеграл f f(x)dx а сходится тогда и только тогда, когда для любого е > 0 можно ука- указать В € [а, ш[ так, что при любых 61,62 € [а,ш[ таких, что В < Ь\, В < &2, имеет место соотношение Jf(x)dx bi < е.
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 463 Действительно, ведь Ьг &2 Ь\ J f(x)dx = Jf(x)dx -Jf(x)dx = поэтому выписанное условие есть просто критерий Коши существова- существования предела функции Т{Ъ) при Ъ —)■ ш, Ь Е[а, ш[. ► Ь. Абсолютная сходимость несобственного интеграла Определение 4. Про несобственный интеграл f f(x) dx говорят, а ш что он сходится абсолютно, если сходится интеграл / \f\(x) dx. а В силу неравенства ь2 f(x)dx ь2 J\f\(x) bi dx и утверждения 2 можем заключить, что если интеграл сходится абсо- абсолютно, то он сходится. Исследование абсолютной сходимости сводится к исследованию схо- сходимости интеграла от неотрицательной функции. Но в этом случае име- имеем Утверждение 3. Если функция f удовлетворяет условиям опре- определения 3 и f(x) ^ 0 на [а,ш[, то несобственный интеграл C) суще- существует в том и только в том случае, когда функция F) ограничена на [а,ш[. 4 Действительно, если f(x)^0 на [а,ш[, то функция F) неубыва- неубывающая на [а,ш[ и потому она имеет предел при 6-4w, 6 € [a>w[> если и только если она ограничена. ► В качестве примера использования этого утверждения рассмотрим такое его Следствие (интегральный признак сходимости ряда). Если х *-ь н» f(x) — определенная на промежутке [1, +оо[ неотрицательная, не- возрастающая, интегрируемая на каждом отрезке [1,6] С [1,+оо[
464 ГЛ. VI. ИНТЕГРАЛ функция, то ряд оо +ОО J f{x) 71=1 и интеграл +ОО J f{)dx 1 сходятся или расходятся одновременно. ■4 Из приведенных условий вытекает, что при любом п € N выпол- выполнены неравенства п+1 f f(x) После суммирования этих неравенств получаем k kf к 71=1 •[ 71=1 ИЛИ Sk+i - /A) ^ F(k + !) < sk, к ь где Sf. = Yl /(n)> а ^(Ь) = / f(x)dx. Поскольку Sk и Т{Ъ)—неубываю- 71=1 1 щие функции своих аргументов, то полученные неравенства и доказы- доказывают высказанное утверждение. ► В частности, теперь можно сказать, что результат примера 1 экви- эквивалентен тому, что ряд оо 1 71=1 сходится только при а > 1. Наиболее часто используемым следствием утверждения 3 является следующая Теорема (теорема сравнения). Пусть функции х к-» f(x), x *-> д(х) определены на промежутке [а,ш[ и интегрируемы на любом отрезке [а,Ъ] С [а,ш[.
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 465 Если на [а,ш[ О < f(x) < д(х), то из сходимости интеграла E) следует сходимость интеграла D) и справедливо неравенство / f(x) dx^. g(x) dx, а из расходимости интеграла D) следует расходимость интеграла E). ^ Из условий теоремы и неравенств для собственного интеграла Римана при любом b € [а,ш[ имеем = Jf(x)dx < Jg(x)dx = Q(b). Поскольку обе функции F, Q неубывающие на [а, ш[, то теорема следует из написанного неравенства и утверждения 3. ► Замечание 3. Если про функции /, д, участвующие в теореме, вместо неравенств 0 < f(x) ^ д(х) известно, что они неотрицательны на [а, ш[ и одного порядка при х —> ш, х € [а, ш[, т. е. что найдутся такие положительные константы ci, сг, что то с учетом линейности несобственного интеграла из доказанной тео- теоремы в этом случае можно заключить, что интегралы D), E) сходятся или расходятся одновременно. Пример 4. Интеграл сходится, так как л/xdx при х —> +оо. 16-4573
466 ГЛ. VI. ИНТЕГРАЛ Пример 5. Интеграл + ОО /CO COS X dx сходится абсолютно, ибо при х ^ 1. Следовательно, COS Ж X2 + ОО / COS Ж dx + ОО COS Ж X* + ОО UX ^ / —т; dX = 1. Пример 6. Интеграл +ОО е х dx сходится, так как е х < е х при х > 1 и / е~х2dx < e e~x dx = -. Пример 7. Интеграл расходится, ибо / dx \пх 1 1 In а; х при достаточно больших значениях х. Пример 8. Интеграл Эйлера к/2 / In sin ж dx о сходится, так как |lnsinz| r при х —У +0.
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 467 Пример 9. Эллиптический интеграл 1 dx y/{l-x2){l-k2x2) и при 0 ^ к2 < 1 сходится, поскольку ^A-х2)A-к2х2) ~ ^2A - к2) A - хI/2 при х —> 1 — 0. Пример 10. Интеграл 1 — cos ip о сходится, так как — cos<р = л/2sin sin —-— ~ ij&mip(<p — вI'2 при в -> <р — 0. Пример 11. Интеграл 9 J „ /^„г £о Ч:П2 ± О VSn 2 Sln 2 (Г) при 0 < щ < ж сходится, поскольку при ф —> <ро — 0 o - ФI/2- (8) Соотношение G) выражает зависимость периода колебаний матема- математического маятника от его длины L и начального угла его отклонения, отсчитываемого от радиуса, идущего в нижнюю точку траектории ка- качания. Формула G) является элементарной вариацией формулы A7) предыдущего параграфа. Маятник можно себе представлять, например, как невесомый стер- стержень, один конец которого шарнирно закреплен, а другой, с присоеди- присоединенной к нему точечной массой, свободен.
468 ГЛ. VI. ИНТЕГРАЛ В таком случае можно говорить о любых начальных углах щ £ [0, тг]. При (ро = О и (ро = тг маятник качаться вообще не будет, находясь в пер- первом случае в состоянии устойчивого, а во втором случае в состоянии неустойчивого равновесия. Интересно отметить, что из G) и (8) нетрудно получить, чтоТ -4 см при <ро —> тг — 0, т. е. период колебаний маятника неограниченно растет по мере приближения его начального положения щ к верхнему положе- положению (неустойчивого) равновесия. с. Условная сходимость несобственного интеграла Определение 5. Если несобственный интеграл сходится, но не абсолютно, то говорят, что он сходится условно. Пример 12. Используя замечание 1, по формуле интегрирования по частям в несобственном интеграле находим, что f cos ж , f + + /sin x , cos ж +°° Г cos ж , f dx = / —5~~ ах = — I 5 ' X X тг/2 J Хг J Хг тг/2 Я-/2 тг/2 коль скоро последний интеграл сходится. Но, как мы видели в приме- примере 5, этот интеграл сходится, поэтому сходится также интеграл ^^x. (9) Вместе с тем интеграл (9) не является абсолютно сходящимся. Дей- Действительно, при b E [тг/2, +оо[ имеем b b b b /gitit1 Г ein т 1 Г Ит 1 Г ■к/2 ж/2 ж/2 тг/2 Интеграл cos 2x , — dx, 1 как можно проверить интегрированием по частям, является сходящим- сходящимся, поэтому при b —у +оо разность в правой части соотношения A0)
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 469 стремится к +оо и в силу оценки A0) интеграл (9) не является абсо- абсолютно сходящимся. Приведем теперь один специальный признак сходимости несоб- несобственных интегралов, опирающийся на вторую теорему о среднем и, значит, в сущности на ту же формулу интегрирования по частям. Утверждение 4 (признак Абеля - Дирихле сходимости интегра- интеграла). Пусть х i-> f(x), х i-> g(x) —функции, определенные на проме- промежутке [а,и>[ и интегрируемые на любом отрезке [а,Ь] С [а, ш[. Пусть g — монотонная функция. Тогда для сходимости несобственного интеграла ш J(f-g)(x)dx A1) а достаточно, чтобы выполнялась либо пара условий а{) интеграл J f(x)dx сходится, а /3i) функция g ограничена на [а,ш[, либо пара условий ь функция ^(b) = f f(x)dx ограничена на [а,ш[, а г) функция д(х) стремится к нулю при х ->• ш, х € [а,ш[. Для любых bi,l>2 € [а,ш[по второй теореме о среднем имеем ь2 £ ь2 J J где £ — точка, лежащая между bi и Ьг- Отсюда в силу критерия Коши (утверждение 2) заключаем, что интеграл A1) действительно сходится, если выполнена любая из двух указанных выше пар условий. ► 3. Несобственные интегралы с несколькими особенностя- особенностями. До сих пор мы говорили о несобственных интегралах с одной осо- особенностью, связанной с неограниченностью функции у одного из пре- пределов интегрирования или с неограниченностью самого этого предела.
470 ГЛ. VI. ИНТЕГРАЛ Здесь мы укажем, в каком смысле понимаются другие возможные ва- варианты несобственного интеграла. Если оба предела интегрирования являются особенностями того или другого из указанных выше типов, то полагают по определению 0J С W2 f f(x)dx:= ff(x)dx+ff(x)dx, A2) 0I где с — произвольная точка промежутка ]u>i,u>2[- При этом предполагается, что каждый из несобственных интегра- интегралов в правой части соотношения A2) сходится. В противном случае говорят, что интеграл, стоящий в левой части A2), расходится. В силу замечания 2 и свойства аддитивности несобственного инте- интеграла, определение A2) корректно в том смысле, что оно на самом деле не зависит от выбора точки с € ]a>i,a>2[- Пример 13. 1 U 1 /dx _ Г dx Г dx _ \/l — х2 J л/1 — х2 J Vl — x2 -l -l |0 . il il l^ + arcsinxL = arcsinxl^ = я\ Пример 14. Интеграл /•- —оо называется интегралом Эйлера - Пуассона, а иногда еще и интегралом Гаусса. Он, очевидно, сходится в указанном выше смысле. Позже будет показано, что он равен у/ж. Пример 15. Интеграл +ОО / О dx ха
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 471 расходится, поскольку при любом а разойдется по крайней мере один из двух интегралов о Пример 16. Интеграл /dx f dx ха' J х°' /sinх , dx а х а о сходится, если сходится каждый из интегралов 1 +ОО /sin х , Г sin ж , dx, / —— dx. ха J ха О 1 Первый из этих интегралов сходится, если а < 2, ибо sin а; 1 при х —> +0. Второй интеграл сходится при а > 0, что можно прове- проверить непосредственно интегрированием по частям, аналогичным про- проделанному в примере 12, или сославшись на признак Абеля - Дирихле. Таким образом, исходный интеграл имеет смысл при 0 < а < 2. В том случае, когда подынтегральная функция не ограничена в окрестности одной из внутренних точек ш отрезка интегрирования [а,Ь], полагают b w b Г f{x) dx := f fix) dx+ f fix) dx, A3) a aw требуя, чтобы оба стоящих справа интеграла существовали. Пример 17. В смысле соглашения A3) 1 dx — 4.
472 ГЛ. VI. ИНТЕГРАЛ 1 Пример 18. Интеграл J ^ не определен. -1 Существует и отличное от A3) соглашение о вычислении интеграла от функции, неограниченной в окрестности внутренней точки w отрез- отрезка интегрирования. А именно, полагают ь /ш-8 ь \ V. P. f f(x) dx := Дт I f f(x) dx + f f(x) dx j , A4) a \a w+6 I если стоящий справа предел существует. Этот предел называют, следуя Коши, интегралом в смысле главного значения и, чтобы отличить опре- определения A3) и A4), во втором случае перед знаком интеграла ставят начальные буквы V. Р. французских слов valeur principal (главное зна- значение). В англоязычном варианте используется обозначение Р. V. (от principal value). В соответствии с этим соглашением имеем Пример 19. 1 V.P -1 Принимается также следующее определение: +оо R V. Р. / f(x) dx := lim f f(x) dx. A5) J Д->+оо J -R Пример 20. +ОО V.P. I xdx = 0. Наконец, если на промежутке интегрирования имеется несколько (конечное число) тех или иных особенностей, лежащих внутри проме- промежутка или совпадающих с его концами, то неособыми точками проме- промежуток разбивают на конечное число таких промежутков, в каждом из которых имеется только одна особенность, а интеграл вычисляют как сумму интегралов по отрезкам разбиения.
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 473 Можно проверить, что результат такого расчета не зависит от про- произвола в выборе разбиения. Пример 21. Точное определение интегрального логарифма те- теперь можно записать в виде X /j^, если 0 < х < 1, liz = { /^ если 1<х. В последнем случае символ V. Р. относится к единственной внутрен- внутренней для промежутка ]0, х] особенности, расположенной в точке 1. Заме- Заметим, что в смысле определения A3) этот интеграл не является сходя- сходящимся. Задачи и упражнения 1. Покажите, что функция a) Six = / ^j^- dt (интегральный синус) определена на К, нечетна и имеет о предел при х —>■ +оо; b) si х = — / ^j^- dt определена на К и отличается от функции Si x только на постоянную; оо c) Cix = - / ^^ dt (интегральный косинус) при достаточно больших зна- х чениях х может вычисляться по приближенной формуле Cix « ?^; оцените область тех значений, где абсолютная погрешность этого приближения мень- меньше 1(Г4. 2. Покажите, что +оо . +оо a) интегралы J ^^- dx, J ^^ dx сходятся только при а > 0, причем Iх Iх сходятся абсолютно только при а > 1; b) интегралы Френеля л/х л/х С(х) = —р I cost2dt, S(x) = -r= f sint2dt V 2 J v 2 J о о являются бесконечно дифференцируемыми функциями в промежутке ]0, +оо[, причем обе они имеют предел при х —> +оо. 3. Покажите, что
474 ГЛ. VI. ИНТЕГРАЛ а) эллиптический интеграл первого рода sin ip F(k,tp)= f . dt J л/A - t2)(l - A;2*2) о определен при 0 < A; < 1, 0 < <£> < ^ и приводится к виду о Ь) полный эллиптический интеграл первого рода тг/2 К(к) = неограниченно возрастает при к -> 1 - 0. 4. Покажите, что а) интегральная показательная функция (интегральная экспонента) х t Ei(x) = / \dt определена и бесконечно дифференцируема при х < 0; c) ряд 2J (~l)""^j не сходится ни при каком значении х € М; п=0 х d) lix ~ j^ при х —> +0. (Определение интегрального логарифма И ж см. в примере 21.) 5. Покажите, что a) функция Fi(x) = -j= f e~l dt, называемая интегралом вероятности » —X ошибок и часто обозначаемая символом erf(x) (от англ. error function—функ- function—функция ошибок), определена, нечетна, бесконечно дифференцируема на К и имеет предел при х —> +оо; b) если упомянутый в а) предел равен единице (а это так), то 1 1 * о 1 • о О при х —> +оо. 6. Покажите, что: а) Если тяжелая частица под действием силы тяжести скользит вдоль кри- кривой, заданной в параметрическом виде х = х(в), у = у (в), причем в момент
§ 5. НЕСОБСТВЕННЫЙ ИНТЕГРАЛ 475 t = 0 частица имела нулевую скорость и находилась в точке х0 — х(во), у = — у(@о), то между параметром в, определяющим точку на кривой, и момен- моментом t прохождения частицей этой точки имеется связь (см. формулу A5) из § 4) в которой несобственный интеграл заведомо сходится, если у'(во) ф 0 (знак выбирается в зависимости от того, имеют ли t и в одинаковый или противо- противоположный характер монотонности, причем если росту t отвечает рост в, то, разумеется, следует брать знак плюс). Ь) Период колебания частицы в ямке, имеющей профиль циклоиды х = не зависит от уровня г/о = —-R(l +cos^o), с которого она начинает скольжение, и равен Атхл/Щд (см. задачу 4 из § 4).
ГЛАВА VII ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ, ИХ ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ До сих пор мы рассматривали почти исключительно числовые функции х •->■ f(x), в которых число f(x) определялось заданием одного числах из области определения функции. Однако многие величины, представляющие интерес, зависят не от одного, а от очень многих факторов, и если сама величина и каждый иэ определяющих ее факторов могут быть охарактеризованы некото- некоторым числом, то указанная зависимость сводится к тому, что упорядо- упорядоченному набору (ж1,... ,хп) чисел, каждое из которых описывает со- состояние соответствующего фактора, ставится в соответствие значение у = /(ж1,..., хп) исследуемой величины, которое она приобретает при этом состоянии определяющих величину факторов. Например, площадь прямоугольника есть произведение длин его сторон; объем данного количества газа вычисляется по формуле где R — постоянная, т — масса, Г — абсолютная температура и р — давление газа. Таким образом, значение V зависит от переменной упо- упорядоченной тройки чисел (т,Т,р) или, как говорят, V есть функция трех переменных m, T и р. Мы ставим себе целью научиться исследовать функции многих пе- переменных так же, как мы научились исследовать функции одного пе- переменного.
§ 1. ПРОСТРАНСТВО Rm И КЛАССЫ ЕГО ПОДМНОЖЕСТВ 477 Как и в случае функций одного переменного, изучение функций многих числовых переменных начинается с описания их области опре- определения. § 1. Пространство Жт и важнейшие классы его подмножеств 1. Множество Rm и расстояние в нем. Условимся через W1 обозначать множество всех упорядоченных наборов (ж1,... ,хт), состо- состоящих из т действительных чисел i!eK (г = 1,..., т). Каждый такой набор будем обозначать одной буквой х = (ж1,..., хт) и в соответствии с удобной геометрической терминологией называть точкой множества W1. Число xi в наборе (ж1,..., хт) называют г'-й ко- координатой точки х = (ж1,..., хт). Геометрические аналогии можно продолжить и ввести на множест- множестве W1 расстояние между точками х\ = (х\,...,х™), Х2 = (х^,...,х™) по формуле \ Ё И - 4J- A) г=1 Функция d: Г х Кш -> К, определяемая формулой A), очевидно, обладает следующими свойства- свойствами: a) сг(ж1,ж2) >0; b) (d(x1,x2) =0L* (xi = х2); c) сг(ж1,ж2) =«г(ж2,Ж1); d) d(xi,x3) < d(xi,x2) + d(x2,x3). Последнее неравенство (называемое опять-таки по геометрической ана- аналогии неравенством треугольника) есть частный случай неравенства Минковского (см. гл. V, §4, п. 2). Функцию, определенную на парах (xi,x2) точек некоторого множе- множества X и обладающую свойствами а), Ь), с), d), называют метрикой или расстоянием в X. Множество X вместе с фиксированной в нем метрикой называют метрическим пространством.
478 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Таким образом, мы превратили Rm в метрическое пространство, наделив множество Rm метрикой, заданной соотношением A). Сведения о произвольных метрических пространствах читатель сможет получить в главе IX (часть II). Здесь же мы не хотим отвле- отвлекаться от необходимого нам сейчас конкретного метрического прост- пространства W1. Поскольку в этой главе множество Rm с метрикой A) будет для нас единственным метрическим пространством, составляющим объект изучения, то общее определение метрического пространства нам по су- существу пока не нужно. Оно приведено только для пояснения употре- употребляемого по отношению к множеству Rm термина «пространство» и по отношению к функции A) термина «метрика». Из соотношения A) следует, что при г G {1,... , т} \frn max \x\ — хг2\, B) т.е. расстояние между точками Х\,Х2 S R™ мало в том и только в том случае, когда мало отличаются соответствующие координаты этих точек. Из B), как и из A), видно, что при т = 1 множество R1 совпадает с множеством действительных чисел, расстояние между точками кото- которого измеряется стандартным образом посредством модуля разности чисел. 2. Открытые и замкнутые множества в Шт Определение 1. При 6 > 0 множество В(а;6) = {хЕШт \d(a,x)<6} называется шаром с центром a G R радиуса 6 или также 6-окрестно- 6-окрестностью точки а € Rm. Определение 2. Множество GcRm называется открытым в R™, если для любой точки xEG найдется шар В(х; 6) такой, что В(х; 6) СG. Пример 1. Rm —открытое множество в W1. Пример 2. Пустое множество 0 вообще не содержит точек и по- потому может считаться удовлетворяющим определению 2, т.е. 0 — от- открытое множество в Rm.
§ 1. ПРОСТРАНСТВО Rm И КЛАССЫ ЕГО ПОДМНОЖЕСТВ 479 Пример 3. Шар В(а;г) — открытое множество в Rm. Действительно, если х € В(а;г), т.е. d(a,x) < г, то при 0 < 6 < < г — d(a, x) будет В(х; 6) С В(а; г), поскольку => (d(a,£) < d(a,x) + d(x,£) < d(a,x)+r- d(a,x) - r). Пример 4. Множество G = {x € Rm | d(a, x) > г}, т. е. совокуп- совокупность точек, удаленных от фиксированной точки а € Шт на расстояние, большее чем г, является открытым, что, как и в примере 3, легко про- проверить, используя неравенство треугольника для метрики. Определение 3. Множество F С Мт называется замкнутым в W1, если его дополнение G = Rm \^в8™ является множеством, от- открытым в Rm. Пример 5. Множество В(а;г) = {х G W" \ d(a,x) < г}, г > О, т.е. совокупность точек, удаленных от фиксированной точки а € Мта не больше чем на г, является замкнутым, что следует из определения 3 и примера 4. Множество В(а;г) называют замкнутым шаром с центром а радиуса г. Утверждение 1. а) Объединение (J Ga множеств любой систе- мы {Ga, a € А} множеств, открытых в W1, является множеством, открытым в Rm. п Ь) Пересечение f) Gi конечного числа множеств, открытых в Шш, г=1 является множеством, открытым в К"*. а') Пересечение f) Fa множеств любой системы {Fa, a € А} мно- А жесте Fa, замкнутых в Rm, является множеством, замкнутым в Rm. п Ь') Объединение (J F{ конечного числа множеств Fi, замкнутых г=1 в R, является множеством, замкнутым в Rm. ■4 а) Если х G |J Ga, то найдется такое с*о € А, что х G Gao, a£A и, следовательно, найдется такая ^-окрестность В(х; 6) точки х, что В(х;6) С Gao. Значит, В(х;6) С (J &<*■ авА п Ъ) Пусть х € f\Gi. Тогда х £ Gi (i = 1,..., п). Пусть Si,..., Sn —
480 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ такие положительные числа, что В(х;6{) С Gj (i = l,...,n). Полагая п 8 = min{Si,...,Sn}, очевидно, получим, что S > 0 и В(х;S) С f| Gj. а') Покажем, что множество С I f) Fa ), дополнительное к f] Fa \q£A / Q6A * , является открытым подмножеством 1к Действительно, С ( П Fa) = U (CFa) = Wa / где Ga = CFa открыты в Rm. Теперь а') следует из а). Ь') Аналогично, из Ь) получаем п п = f] (CFi) = П Gi. ► г=1 / i=l i=l Пример 6. Множество S(a;r) = {г 6 Г | d(a,x) = г}, г ^ О, называется сферой с центром а € М радиуса г. Дополнение к S(a;r) в Rm в силу примеров 3 и 4 является объединением открытых множеств. Значит, в силу доказанного утверждения оно открыто, а сфера S(a; r) есть замкнутое подмножество Rm. Определение 4. Открытое в Rm множество, содержащее данную точку, называется окрестностью этой точки в Rm. В частности, как следует из примера 3, ^-окрестность точки явля- является ее окрестностью. Определение 5. Точка х € К™ по отношению к множеству Е С С Rm называется внутренней точкой Е, если она содержится в Е вместе с некоторой своей окрестностью; внешней точкой Е, если она является внутренней точкой дополне- дополнения к ЕвШт; граничной точкой Е, если она не является ни внешней, ни внутрен- внутренней точкой множества Е. Из этого определения следует, что характеристическое свойство граничной точки множества состоит в том, что в любой ее окрестности имеются как точки этого множества, так и точки, ему не принадлежа- принадлежащие.
§ 1. ПРОСТРАНСТВО Rm И КЛАССЫ ЕГО ПОДМНОЖЕСТВ 481 Пример 7. Сфера S(a; г), г > 0, является множеством граничных точек как открытого шара В(а;г), так и замкнутого шара В(а;г). Пример 8. Точка а € Ет является граничной точкой множества I \ а, которое не имеет внешних точек. Пример 9. Все точки сферы S(a; r) являются ее граничными точ- точками; внутренних точек множество S(a; r) как подмножество W1 не имеет. Определение 6. Точка а € Rm называется предельной точкой множества Е С Rm, если для любой окрестности О(а) точки а пере- пересечение Е П 0{а) есть бесконечное множество. Определение 7. Объединение множества Е и всех его предель- предельных точек из Rm называется замыканием множества Е в Шт. Замыкание множества Е обычно обозначают символом Е. Пример 10. Множество B(a;r) = B(a;r) U S(a;r) есть множест- множество предельных точек для открытого шара В(а;г), поэтому В(а;г), в отличие от В(а;г), и назвали замкнутым шаром. Пример 11. lS(a;r) = S(a;r). Вместо того чтобы обосновывать последнее равенство, докажем следующее полезное Утверждение 2. (F замкнуто в W1) <& {F = F в Шт). Иными словами, F — замкнутое в W1 множество тогда и только тогда, когда оно содержит все свои предельные точки. ■4 Пусть F замкнуто в W", x G М™ и х £ F. Тогда открытое множе- множество G = Шт \F является окрестностью точки х, вообще не содержащей точек множества F. Таким образом, показано, что если х £ F, то х — не предельная точка F. Пусть F = F. Проверим, что множество G — W1 \ F открыто в Шш. Если х € G, то х £ F и потому х не является предельной точкой мно- множества F. Значит, найдется окрестность точки х, в которой имеется только конечное число точек Xi,...,xn множества F. Поскольку х £ F, то можно построить, например, шаровые окрестности О\{х),..., Оп{х) п точки х так, что Xi £ Oi(x). Тогда О(х) = f) Ot{x) будет откры-
482 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ той окрестностью точки х, которая вообще не содержит точек F, т.е. О(х) С W1 \ F и, следовательно, множество Rm \ F = W" \ F открыто, т. е. F замкнуто в Шт. ► 3. Компакты в Шт Определение 8. Множество К С М.т называется компактом, ес- если из любого покрытия К множествами, открытыми в Шт, можно вы- выделить конечное покрытие. Пример 12. Отрезок [а, Ь] С М1 является компактом в Е1 в силу леммы о конечном покрытии. Пример 13. Обобщением отрезка в W1 является множество / = {х е Rm | аг < хх ^ Ь\ % = 1,... ,т}, которое называется т-мерным промежутком, тп-мерным брусом или m-мерным параллелепипедом. Покажем, что / — компакт в Мта. ■* Предположим, что из некоторого открытого покрытия / нельзя выделить конечное покрытие. Разделив каждый из координатных от- отрезков Р = {хг Е М. | аг ^ хг ^ Ьг} (г = 1,... ,т) пополам, мы разо- разобьем промежуток / на 2та промежутков, из которых по крайней мере один не допускает конечного покрытия множествами нашей системы. С ним поступим так же, как и с исходным промежутком. Продолжая этот процесс деления, получим последовательность вложенных проме- промежутков / = I\ D /2 D . •. D 1п Э ..., ни один из которых не до- допускает конечного покрытия. Если 1п = {х € Мт | агп < хг ^ Ъгп, г = 1,...,т}, то при каждом г € {!,...,т} координатные отрезки агп ^ хг ^ Ьгп (п = 1, 2,...) образуют, по построению, систему вложен- вложенных отрезков, длины которых стремятся к нулю. Найдя при каждом г (Е {1,...,т} точку £г G [а^,Ь^], общую для всех этих отрезков, по- получим точку £ = (£*■,... ,£т), принадлежащую всем промежуткам / = = Ii,l2,-..,Ini-- Поскольку ^ (Е /, то найдется такое открытое мно- множество G нашей системы покрывающих множеств, что £ (Е G. Тогда при некотором 5 > 0 также В(£; 5) С G. Но по построению в силу соот- соотношения B) найдется номер N такой, что /„ С В(£; 6) С G при п > N, и мы вступаем в противоречие с тем, что промежутки 1п не допускают конечного покрытия множествами данной системы. ►
§ 1. ПРОСТРАНСТВО Rm И КЛАССЫ ЕГО ПОДМНОЖЕСТВ 483 Утверждение 3. Если К — компакт в Ш", то a) К—замкнутое множество в Rm; b) любое замкнутое в Rm множество, содержащееся в К, само является компактом. •^ а) Покажем, что любая точка а € Rm, предельная для К, при- принадлежит К. Пусть а £ К. Для каждой точки х £ К построим такую окрестность G(x), что точка а обладает окрестностью, не имеющей с G(x) общих точек. Совокупность {G(x)}, x G К, всех таких окрестно- окрестностей образует открытое покрытие компакта К, из которого выделяется конечное покрытие G{x\),..., G(xn). Если теперь Ог(а) — такая окрест- п ность точки а, что G{x%) П Ог{а) = 0, то множество О(а) = (~) Ог(а) t=i также является окрестностью точки а, причем, очевидно, КГ\О(а) = 0. Таким образом, а не может быть предельной точкой для К. Ъ) Пусть F — замкнутое в Шт множество и F С К. Пусть {Ga}, а (Е А, — покрытие F множествами, открытыми в Rm. Присоединив к нему еще одно открытое множество G = W71 \ F, получим откры- открытое покрытие Rm и, в частности, К, из которого извлекаем конечное покрытие К. Это конечное покрытие К будет покрывать также мно- множество F. Замечая, что G П F = 0, можно сказать, что если G входит в зто конечное покрытие, то, даже удалив G, мы получим конечное покрытие F множествами исходной системы {Ga}, a (E А. ► Определение 9. Диаметром множества Е С К называется ве- величина d(E) := sup Определение 10. Множество Е С ШГ1 называется ограниченным, если его диаметр конечен. Утверждение 4. Если К — компакт в ШГ1, то К — ограничен- ограниченное подмножество Rm. •^ Возьмем произвольную точку а € Rm и рассмотрим последова- последовательность шаров {В(а; п)} (п = 1,2,...). Они образуют открытое по- покрытие К, а следовательно, и К. Если бы К не было ограниченным множеством, то из этого покрытия нельзя было бы извлечь конечное покрытие К. ►
484 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Утверждение 5. Множество К С Мт является компактом в том и только в том случае, если К замкнуто и ограничено в К. < Необходимость этих условий нами уже показана в утверждениях 3 и 4. Проверим достаточность этих условий. Поскольку К — ограничен- ограниченное множество, то найдется m-мерный промежуток J, содержащий К. Как было показано в примере 13, / является компактом в Ет. Но если К — замкнутое множество, содержащееся в компакте J, то по утвер- утверждению ЗЬ) оно само является компактом. ► Задачи и упражнения 1. Расстоянием d(E\,E2) между множествами Е\,Е^ С Жт называется величина d(E!,E2):= inf d{xux2). хеЕ1х2еЕ2 Приведите пример замкнутых в Жт множеств Е\, Е% беэ общих точек, для которых d(E1,E2) = 0. 2. Покажите, что a) замыкание Е в Жш любого множества Е с Ж™ является множеством, замкнутым в Жш; b) множество дЕ граничных точек любого множества Е С Жш является замкнутым множеством; c) если G — открытое множество в Жш, a F замкнуто в Жш, то G \ F— открытое подмножество Жт. 3. Покажите, что если К\ D Къ Э • • • Э Кп D ... —последовательность оо вложенных компактов, то f| K{ ф 0. i=i 4. а) В пространстве Ж* двумерная сфера S2 и окружность S1 расположи- расположились так, что расстояние от любой точки сферы до любой точки окружности одно и то же. Может ли такое быть? Ь) Рассмотрите задачу а) для произвольных по размерности сфер Sm, Sn в Ж*. При каком соотношении между т, п и к описанная ситуация возможна? § 2. Предел и непрерывность функции многих переменных 1. Предел функции. В главе III мы подробно изучили операцию предельного перехода для вещественнозначных функций /: X —> Ж, определенных на множестве X, в котором фиксирована база В. В ближайших параграфах нам предстоит рассматривать функции /: X ->• R", определенные на подмножествах пространства Rm, со зна-
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 485 чениями в К = R1 или вообще в К™, п G N. Мы сделаем сейчас ряд добавлений к теории предела, связанных со спецификой этого класса функций. Начнем, однако, с общего основного определения. Определение 1. Точка A G М" называется пределом отображе- отображения /: X —> R" по базе В в X, если для любой окрестности V(A) этой точки найдется элемент В £ В базы В, образ которого f(B) содержится в V(A). Короче, Umf(x) = А\ := (\/V(A) БВ G В (f(B) С V(A))). Мы видим, что определение предела функции /: X —> R" полностью совпадает с определением предела функции /: X —> К, если мы пред- представляем себе, что такое окрестность V(A) точки А € W1 для любого пек Определение 2. Отображение /: X —> К" называется ограничен- ограниченным, если множество f(X) С W1 ограничено в К". Определение 3. Пусть В — база в множестве X. Отображение /: X —> W1 называется финально ограниченным при базе В, если най- найдется элемент В базы В, на котором / ограничено. Учитывая эти определения, нетрудно проверить теми же рассужде- рассуждениями, которые мы провели в главе III, что функция /: X —> М" может иметь не более одного предела по дан- данной базе В в X; функция f:X—> W1, имеющая предел по базе В, финально ограни- ограничена при этой базе В. Определение 1 можно переписать также в иной форме, явно исполь- использующей наличие в Ш1 метрики. А именно, Определение 1'. Umf(x) = А е шЛ := (Ve > О ЗВ е В Уж G В (d(f(x), A) < е)) или
486 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Определение 1". = А € М") := (lim d(/(a:), A) = о). Специфическая особенность отображения /: X —> Шп состоит в том, что поскольку точка |/6ln есть упорядоченный набор (у1,..., уп) из п вещественных чисел, то задание функции f-.X-^W1 равносильно заданию п вещественнозначных функций fl: X —> Ш. (г = 1,... , п), где Пх) = У1 (* = 1,...,п). Если А = (А1,..., Ап) и у = (у1,..., у"), то справедливы неравен- неравенства \уг - Аг\ ^ d(y, A)^VE max \уг - Al\, A) из которых видно, что limf(x) = A^Yimf{x) = Аг (г = 1,...,п), B) т. е. сходимость в Шп покоординатная. Пусть теперь X = N — множество натуральных чисел, а В—база к —> оо, к € N в нем. Функция /: N —>• Rn в данном случае есть после- последовательность {ук}, к € N, точек пространства Мп. Определение 4. Последовательность {yk}, к G N, точек у^ G Кп называется фундаментальной, если для любого е > 0 найдется такое число iV G N, что при любых &i, А;г > iV выполнено dtyfa, Ук2) < £• Из неравенств A) можно заключить, что последовательность то- точек ук = (j/jfc) • • • J/Jt) £ К" фундаментальна тогда и только тогда, ко- когда фундаментальна каждая из последовательностей {yk}, к G N, i = = 1,..., п, их одноименных координат. Учитывая соотношение B) и критерий Коши для числовых последо- последовательностей, можно теперь утверждать, что последовательность то- точек в Шп сходится тогда и только тогда, когда она фундаментальна. Иными словами, критерий Коши справедлив и в пространстве К". Впоследствии метрические пространства, в которых каждая фун- фундаментальная последовательность имеет предел, мы назовем полными метрическими пространствами. Таким образом, мы сейчас установили, что Шп при любом п € N является полным метрическим пространством.
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 487 Определение 5. Колебанием функции /: X —> Шп на множестве Е С X называется величина u,(f;E):=d(f(E)), где d(f(E)) —диаметр множества f(E). Как видно, это есть прямое обобщение определения колебания ве- щественнозначной функции, в которое определение 5 и переходит при п=1. С полнотой Шп связано то, что для функций /: X —> Шп со зна- значениями в R" справедлив следующий критерий Коши существования предела. Теорема 1. Пусть X —множество, В— база в X. Функция f : X ->• Шп имеет предел по базе В в том и только в том случае, когда для любого числа е > 0 найдется элемент В G В базы, на котором колебание функции меньше е. Итак, 31imf{x)<*Ve>0 ЗВ G В (w(/;S)<e). в Доказательство теоремы 1 дословно повторяет доказательство кри- критерия Коши для числовых функций (гл. III, § 2, теорема 4) с единствен- единственным изменением, сводящимся к тому, что теперь вместо |/(a;i) — /(жг)| следует всюду писать d(f(xi), f(x2)). В справедливости теоремы 1 можно убедиться и иначе, если счи- считать известным критерий Коши для вещественнозначных функций и воспользоваться соотношениями B) и A). Для функций со значениями в Шп остается в силе также важная теорема о пределе композиции. Теорема 2. Пусть Y —множество, By — база в Y, g: Y —> К" — отображение, имеющее предел по базе By- Пусть X — множество, Вх — база в X, f:X—>Y — такое ото- отображение X в Y, что для любого элемента By e By базы By найдется элемент Вх € Вх базы Вх, образ которого f(Bx) содержится в By. При этих условиях композиция g о f: X —>• Шп отображений fug определена, имеет предел по базе Вх и lim(gof)(x) = \img(y). Вх BY
488 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Доказательство теоремы 2 можно провести, либо повторив доказа- доказательство теоремы 5 из § 2 гл. III, с заменой там Ш на Ш1, либо сослаться на указанную теорему и воспользоваться соотношением B). До сих пор мы рассматривали функции /: X —> R" со значениями в К™, никак не конкретизируя область их определения X. В дальнейшем нас прежде всего будет интересовать случай, когда X есть подмноже- подмножество пространства Мто. Условимся, что, как и прежде, U(а) —окрестность точки a G Ш71; о о U(a) — проколотая окрестность точки a G Mm, т.е. U(a) := U(a)\a; Ue(o)—окрестность точки а в множестве Е С К7", т.е. Ue(o) := ЕПЩа); о Ue{o) —проколотая окрестность точки а в множестве Е, т.е. UE(a):=EnU(a); х —> а — база проколотых окрестностей точки а в Ш71; х —> оо — база окрестностей бесконечности, т. е. база, состоящая из множеств W71 \ В (а; г); х —> а, х G Е, или (Е Э х —> а)—база проколотых окрестностей точки а в множестве Е, если а — предельная точка для Е; х —> оо, х G Е, или (Е Э х —> оо) —база окрестностей бесконеч- бесконечности в множестве Е, состоящая из множеств Е \ В(а;г), если Е — неограниченное множество. В соответствии с этими обозначениями можно, например, дать сле- следующие конкретизации определения 1 предела функции, если речь идет о функции /: Е —> Шп, отображающей множество Е С Мт в Ш1: lim f(x) = A J := (Ve > 0 3UE(a) VxeUE(a) (d(f(x),A)<e)). Это же можно записать и иначе: ( lim fix) = A] := \ЕЭх-+а V ) = (Ve > 0 36 > 0 УхеЕ @ < d(x,a) <6^ d(f(x),A) < e)). Здесь подразумевается, что расстояния d(x,a) и d(f(x),A) измеряются в тех пространствах (К7" и К"), в которых лежат указанные точки.
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 489 Наконец, (lim f{x) = A) := (Ve > 0 ЗВ(а;г) Ух е Шт\В(а;г) (d(f(x),A) < e)). Условимся также, что запись «/(ж) —> оо при базе В» в случае ото- отображения /: X —> Ш1 всегда будет означать, что для любого шара В(А;г) С М" найдется элемент В £ В базы В такой, что f(B) С СШ1\В(А;г). Пример 1. Пусть х *-> 7г*(ж)—отображение 7г*: W1 —>• К, состо- состоящее в том, что каждой точке х = (ж1,... ,хт) пространства W1 ста- ставится в соответствие ее г-я координата xi. Итак, 7Г*(ЯГ) = Х\ Если а = (а1,..., ат), то, очевидно, пг(х) —> аг при х —> а. Функция х н> тт1(х) не стремится ни к конечной величине, ни к бесконечности при х —> оо, если m > 1. Вместе с тем 771 f(x) = У~] {п*(х)) ~* °° ПРИ х ~* °°- Не следует думать, что предел функции нескольких переменных можно найти, вычисляя последовательно пределы по каждой из коор- координат. В этом можно убедиться на следующих примерах. Пример 2. Пусть функция /: М2 —> R в точке (х, у) G М2 опреде- определена так: ( 2^2 > У¥, f(x,y) = { х +у [ 0, если х2 + у2 = 0. Тогда /@,1/) = /(ж,0) = 0, а /(ж, ж) = | при ж ф 0. Таким образом, эта функция не имеет предела при (х, у) ->• @,0). Вместе с тем lim (timffay)) = lim@) = 0, lim ( lim/(i,y) J = lim(O) = 0.
490 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Пример 3. Для функции f 4^. если х2+у2фО, f(x,y) = l *2 + У2 [ 0, если х2 + у2 = О, имеем Х lim I limf(x,y) I = lim I —=■ 1=1, lim (lim f(x,y)) = lim (-~) = -1. Пример 4. Для функции Г ж + /(ж,2/) = { I 0, если ж = О, ysini, если х ф О, имеем (,j/)() lim (limf(x,у)) = О, и в то же время повторный предел lim (lim /(ж, у)) вообще не существует. Пример 5. Функция 2 {2 4Ж У „, если 0, если ж2 + у2 = О, имеет нулевой предел при стремлении к началу координат по любому лучу х — at, у = Ct. Вместе с тем функция равна ^ в любой точке вида (а, а2), где а ф 0, поэтому функция не имеет предела при (х, у) —> @,0).
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 491 2. Непрерывность функции многих переменных и свойства непрерывных функций. Пусть Е — множество в пространстве Шт и /: Е —> Шп — определенная на нем функция со значениями в прост- пространстве Ш1. Определение 6. Функция /: Е —> W1 называется непрерывной в точке а Е Е, если для любой окрестности V(f(a)) значения /(а) этой функции, принимаемого ею в точке а, найдется такая окрест- окрестность Ue{o) точки а в множестве Е, образ которой /(С/£;(а)) содер- содержится в V(f(a)). Итак, (f-.E-tW1 непрерывна в a G Е) := = (VF(/(a)) 3UE(a) (f(UE(a))cV(f(a)))). Мы видим, что по форме определение 6 совпадает со знакомым нам определением 1 непрерывности вещественнозначной функции, приве- приведенным в § 1 гл. IV. Как и там, мы можем дать следующие вариации записи этого определения: (/: Е ->• Rn непрерывна в a G Е) := = (Ve > 0 36 > 0 Ухе Е (d{x,a) <д=^ d(f{x),f(a)) < e)), или, если a — предельная точка множества Е, (/: Е -»■ Шп непрерывна в a G Е) := ( lim fix) = f(a) ) . Как уже отмечалось в главе IV, понятие непрерывности предста- представляет интерес именно в том случае, когда речь идет о точке а £ Е, предельной для множества Е, на котором определена функция /. Из определения 6 и соотношения B) следует, что отображение f-.E-^W1, задаваемое соотношением непрерывно в некоторой точке в том и только в том случае, когда каждая из функций уг = Г{х1,..., хт) непрерывна в этой точке.
492 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ В частности, вспомним, что путем в W1 мы назвали отображение /: / —> К" промежутка I С Ш, задаваемое непрерывными функциями /Чж),...,/"^) в виде Таким образом, мы теперь можем сказать, что путь в К" есть не- непрерывное отображение промежутка I СШ. вещественной оси в прост- пространство К11. По аналогии с определением колебания вещественнозначной функ- функции в точке, вводится понятие колебания в точке функции со значени- значениями в W1. Пусть Е — множество вМ™, a G Е и Ве{п; г) = Е П В (а; г). Определение 7. Колебанием функции /: Е —>■ R" в точке а е Е называется величина Из определения 6 непрерывности функции, с учетом свойств предела и критерия Коши, получаем совокупность часто используемых локаль- локальных свойств непрерывных функций. Перечислим эти Локальные свойства непрерывных функций a) Отображение f:E —> W1 множества Е С W1 непрерывно в точке а £ Е тогда и только тогда, когда w(/; a) = 0. b) Отображение /:Е—>Шп, непрерывное в точке a G Е, ограни- ограничено в некоторой окрестности Ue(o) этой точки. c) Если отображение g: Y —> M.k множества Y с М" непрерывно в точке уо € Y, а отображение /: X —> Y множества X С К™ непре- непрерывно в точке хо G X, причем f(xo) — уо, то определено отображение g о /: X —> Mfc и оно непрерывно в точке хо G X. Вещественнозначные функции, кроме того, обладают еще следую- следующими свойствами. d) Если функция /: Е —> R непрерывна в точке a G Е и /(а) > О (или/(а) < 0), то найдется такая окрестность Ue{o) точки а в Е, что для х G Ue{o) справедливо f(x) > 0 (соответственно, f(x) < 0).
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 493 е) Если функции f:E—>M.ug:E—>M. непрерывны в точке a £ Е, то их линейная комбинация (а/ + /Зд): Е —> М, где а, C еШ., произве- произведение (/ • д): Е —> К, а если д(х) ф 0 на Е, то и частное (£ ] : Е ->• Ш, определены на Е и непрерывны в точке a £ Е. Условимся говорить, что функция f-.E—tW1 непрерывна на мно- множестве Е, если она непрерывна в каждой точке этого множества. Множество функций /: Е —> Шп, непрерывных на Е, будем обо- обозначать символом С(£^;М") или символом С(Е), если область значений функций однозначно определяется по контексту; как правило, это со- сокращение будет использоваться в случае, когда W1 = Ш. Пример 6. Функции (ж1,..., хт) у—ь хг (г = 1,..., т), отобража- отображающие Шт на Ш (проекции), очевидно, непрерывны в любой точке а = = (а1, ...,аго)еГ, ибо lim тт*(аг) = а? = тг'(о). х-+а Пример 7. Любую функцию х ь-> /(ж), определенную на Ж, на- пример х ь-> sin ж, можно рассматривать и как функцию (ж, у) i—> f(x), определенную, положим, на М2. В таком случае, если / была непрерывна как функция на М, новая функция (х, у) \—> f(x) будет непрерывна как функция на М2. Это можно проверить либо непосредственно по опреде- определению непрерывности, либо заметить, что функция F есть композиция (/ о 7г1)(ж, у) непрерывных функций. В частности, отсюда с учетом с) и е) следует, что, например, функ- функции f(x, у) = sinrr + exy, f{x, у) = arctg (In (|rr| + \у\ + 1)) непрерывны на М2. Заметим, что проведенные рассуждения по существу своему локаль- локальны, а то, что в примере 7 функции / и F рассматривались соответ- соответственно на всей оси Ш. или плоскости М2, является обстоятельством случайным. Пример 8. Функция f(x,y) из примера 2 непрерывна в любой точке пространства Ш2, кроме точки @,0). Заметим, что, несмотря на разрывность функции f(x, у) в точке @,0), эта функция непрерывна по любой из двух своих переменных при каждом фиксированном значении другой переменной.
494 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Пример 9. Если функция /: Е —>• W1 непрерывна на множест- множестве Е, а Е — подмножество Е, то ограничение /|^ функции / на это подмножество есть функция, непрерывная на Е, что непосредственно следует из определения непрерывности функции в точке. Перейдем теперь к глобальным свойствам непрерывных функций. Чтобы сформулировать их для функций /: Е —>■ R", дадим сначала два определения. Определение 8. Отображение f-.E^W1 множества ЕсГв пространство Шп называется равномерно непрерывным на Е, если для любого числа е > 0 найдется такое число 6 > О, что для любых точек х\,х2 £ Е таких, что d(xi,x2) < 6, выполнено d(f (xi), /(х2)) < £- Как и прежде, подразумевается, что расстояния й(х1,х2), d(f(x\), измеряются соответственно в Ш71 и К71. При т = п = 1 мы возвращаемся к уже знакомому нам определению равномерной непрерывности числовых функций. Определение 9. Множество Е С К7" называется линейно связ- связным, если для любой пары хо, х\ его точек существует путь Г: / ->• Е с носителем вЕис концами в этих точках. Иными словами, из любой точки Хо G Е можно пройти к любой точке х\ G Е, не выходя за пределы множества Е. Поскольку мы пока не будем рассматривать иного понятия связно- связности множества, кроме понятия линейной связности, то для краткости условимся пока линейно связные множества назвать просто связными. Определение 10. Областью в пространстве Мт называется от- открытое связное множество. Пример 10. Шар В(а;г), г > 0, в Мт является областью. Откры- Открытость В(а; г) в Rm нам уже известна. Проверим, что шар связен. Пусть хо = (xq, ..., х™) и х\ — (х\,..., Ж]") —две точки шара. Путь, задава- задаваемый функциями xl(t) = tx\ + A — t)xlQ (г = 1,... ,m), определенными на отрезке 0 ^ t ^ 1, имеет своими концами точки xq и х\. Кроме то- того, его носитель лежит в шаре В(а;г), поскольку, в силу неравенства
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 495 Минковского, при любом t £ [0,1] d(x(t),a) = — t \ \ D - <tr - t)r = г. 1=1 Пример 11. Окружность (одномерная сфера) радиуса г > 0 есть подмножество в R2, задаваемое уравнением (ж1J + (ж2J = г2. Полагая я1 = г cost, х2 = rsint, видим, что любые точки окружности можно соединить путем, идущим по этой окружности. Значит, окружность — связное множество. Однако это множество не является областью в К2, поскольку оно не открыто в К2. Сформулируем теперь основные Глобальные свойства непрерывных функций a) Если отображение /: К —> Шп непрерывно на компакте К С Шт, то оно равномерно непрерывно на К. b) Если отображение /: К —> Шп непрерывно на компакте К С Шт, то оно ограничено на К. c) Если функция /: К —>■ Ш непрерывна на компакте К С Шт, то она принимает в некоторых точках К минимальное и максимальное из своих значений на К. d) Если функция /: Е —>■ Ш непрерывна на связном множестве Е, принимает в точках a,b G Е значения f(a) = A, f(b) = В, то для любого числа С, лежащего между А и В, найдется точка с Е Е, в которой /(с) = С. Изучая в свое время (гл. IV, § 2) локальные и глобальные свойства числовых функций одной переменной, мы дали такие их доказатель- доказательства, которые переносятся и на рассматриваемый здесь более общий случай. Единственное изменение, которое при этом следует сделать в
496 ГЛ. VII. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ прежних доказательствах, состоит в том, что выражения типа \х± - или |/(xi) - f{x2)\ надо заменить K&d(xi,X2) и d(f(xi),f(x2}), гдей— метрика в том пространстве, где лежат рассматриваемые точки. Это замечание относится в полной мере ко всему, кроме последнего утвер- утверждения d), доказательство которого мы сейчас проведем. Ч d) Пусть Г: / —» Е — путь, являющийся таким непрерывным ото- отображением отрезка [а, 0\ = I С Ш, что Г(а) = а, Г(/?) = Ь. В силу связности Е такой путь существует. Функция / о Г: / —» R, как ком- композиция непрерывных функций, непрерывна, поэтому на отрезке [а, /J] найдется точка j Е [а,/3], в которой / о ГG) = С Положим с = ГG). Тогда сеЕъ /(с) = С. ► Пример 12. Сфера 5@; г), задаваемая в Кто уравнением является компактом. Действительно, из непрерывности функции следует замкнутость сферы, а из того, что на сфере \хг\ ^ г (г = = 1,..., ш), следует ее ограниченность. Функция {х\ ..., хт) н-> (я1J + ... + {xkf - {хк+1J - ... - {х тJ непрерывна на всем пространстве Шт, поэтому ее ограничение на сфе- сферу есть также непрерывная функция, которая в силу глобального свой- свойства с) непрерывных функций имеет на сфере минимальное и мак- максимальное значения. В точках сферы A,0, ...,0), @, ...,0,1) рассма- рассматриваемая функция принимает значения 1 и — 1 соответственно. Ввиду связности сферы (см. задачу 3 в конце параграфа) на основании гло- глобального свойства d) непрерывных функций можно утверждать, что на сфере есть точка, в которой рассматриваемая функция обращается в нуль. Пример 13. Открытое множество Шт \ 5@; г) при г > 0 не явля- является областью, так как оно несвязно.
§ 2. ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 497 Действительно, если Г: / —> Кт есть путь, один конец которого совпадает с точкой xq — @,..., 0), а другой — с некоторой точкой х\ = = (х{,..., ж™) такой, что (х\J +... + (х™J > г2, то композиция непре- непрерывных отображений Г: / -»• Шт и /: Кт -> К, где есть непрерывная на отрезке / функция, принимающая на его концах значения, меньшее и большее чем г2. Значит, на этом отрезке найдется точка 7, в которой (/ о Г) G) = г2. Тогда точка х1 — Т(-у) носителя нашего пути оказывается лежащей на сфере 5@; г). Мы показали, что нельзя выйти из шара 5@; г) С Кто, не пересекая его граничной сфе- ры5@;г). Задачи и упражнения 1. Пусть / € С(Ет;Е). Покажите, что a) множество Е\ = {х € Ет | f(x) < с} открыто в Ет; b) множество Е2 = {х е Km | f(x) ^ с} замкнуто в Ет; c) множество Е3 = {х € Em | f(x) = с} замкнуто в Rm; d) если f(x) -> +00 при х -¥ оо, то Е2 и Е3 компактны в Ет; e) для любой функции /: Ет —» Е множество Е± = {х £ Ет | ш(/; х) ^ е} замкнуто в Ет. 2. Покажите, что отображение /: Ет -> Е" непрерывно тогда и только тогда, когда прообраз любого открытого в Е" множества является открытым в Rm множеством. 3. Покажите, что a) образ f(E) связного множества Е С Ет при непрерывном отображении /: Е -4- Е" является множеством связным; b) объединение связных множеств, имеющих общую точку, является связ- связным множеством; c) полусфера (х1J + .. . + (xmJ = I, xm ^ 0, является связным множеством; d) сфера (х1J + ... + (хтJ = 1 является связным множеством; e) если Е С Е и Е связно, то Е есть промежуток на Е (т.е. отрезок, полуинтервал, интервал, луч или вся числовая ось); f) если хо —внутренняя, а Х\ —внешняя точка множества М С Ет, то носитель любого пути с концами xq, #i пересекает границу множества М. 17-4573
ГЛАВА VIII ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ § 1. Линейная структура в Rm 1. Шт как векторное пространство. Из курса алгебры вам уже хорошо известно понятие векторного пространства. Если в Кто ввести операцию сложения элементов х\ = (х\,... ,х™), Х2 = {х\, • • • >х™) п0 формуле Х1+Х2 = {Х\+Х\,...,Х?+Х%), A) а умножение элемента х = (ж1,..., хт) на число A G К — соотношением Хх = (Хх1,...,Ххт), B) то Шт становится линейным пространством над полем действительных чисел. Его точки теперь можно называть векторами. Векторы е* = @,... ,0,1,0,. ..,0) (г = 1,...,ш) C) (где единица стоит лишь на г-м месте) образуют максимальную линей- линейно независимую систему векторов этого пространства, ввиду чего оно оказывается m-мерным векторным пространством. Любой вектор х G W1 может быть разложен по базису C), т.е. представлен в виде x = x1ei + ... + xmem. D)
§ 1. ЛИНЕЙНАЯ СТРУКТУРА В Rra 499 Индекс при векторе мы условимся писать внизу, а координаты, как и до сих пор, будем отмечать верхним индексом. Это удобно по мно- многим причинам, одна из которых, в частности, состоит в том, что, сле- следуя Эйнштейну1), можно условиться выражения типа D) записывать коротко в виде х = хгег, E) считая, что появление одинакового индекса сверху и снизу означает суммирование по этому индексу в пределах диапазона его изменения. 2. Линейные отображения L: Шт -»• Кп. Напомним, что ото- отображение L: X —> Y векторного пространства X в векторное прост- пространство Y называется линейным, если для любых х\, Х2 £ X и Ai, A2 £ М выполнено Нас будут интересовать линейные отображения L: Кто -»• К". Если {ei,...,eTO} и {ё\,... ,ёп}—фиксированные базисы прост- пространств Кто и К" соответственно, то, зная разложения Ь{ег) = а\ё\ + ... + а"ё„ = a\ej (г = 1,...,тп) F) образов векторов базиса при линейном отображении L: Rm —t Rn, мы в силу линейности преобразования L можем найти разложение по базису {ei,... ,ёп} образа L(h) любого вектора h — h}e\ + ... + hmem — hlet. А именно: L(h) = L{hlet) = /ilL(e,) = hla\e3 = a\h%. G) Значит, в координатной записи: L{h) = {a\h\...,anthl). (8) Отображение L: Кто —> Шп при фиксированном в Шп базисе можно, таким образом, рассматривать как набор L = (L\...,Ln) (9) из п (координатных) отображении LJ: Em —>■ R. ''А Эйнштейн A879-1955)—крупнейший физик XX столетия, работы которого по квантовой теории и особенно по теории относительности оказали революциони- революционизирующее влияние на всю современную физику.
500 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ С учетом (8) легко заключаем, что отображение L: Ш" ->■ Е" ли- линейно тогда и только тогда, когда каждое отображение LP набора (9) линейно. Если записать набор (9) в виде столбца, то с учетом соотношения (8) имеем (L\h)\ (a\...al\ (h}\ A0) Итак, фиксация базисов в RTO и R™ позволяет установить взаимно однозначное соответствие между линейными отображениями L: Шт -> —> W1 и т х п-матрицами (а\ 1 (i = 1,..., т, j = 1,..., п). При этом столбец с номером i матрицы (ajh отвечающей отображению L, со- состоит из координат образа Ь(ег) вектора ег G {ei,... ,ето}. Координаты образа L(h) произвольного вектора h = И.гег G Km могут быть получе- получены из соотношения A0) умножением матрицы линейного отображения на столбец координат вектора h. При наличии в R" структуры векторного пространства можно го- говорить о линейной комбинации Ai/i + A2/2 отображений f\: X ->• К", /2: X -^ W, полагая (Ai/i + А2/2)(х) := ХгМх) + А2/2(х). A1) В частности, линейная комбинация линейных отображений L\: Km —> W1, Li: Шт ->• К" есть, в соответствии с определением A1), отображение которое, очевидно, линейно. Матрица этого отображения есть соответ- соответствующая линейная комбинация матриц отображений L\ и L2. Композиция С = Во А линейных отображений А: Шт -»• R", В: R" -»• —> КЛ, очевидно, также является линейным отображением, матрица ко- которого, как следует из A0), есть произведение матрицы отображения А и матрицы отображения В (на которую умножаем слева). Кстати, за- закон умножения матриц определен известным вам образом именно для того, чтобы композиции отображений отвечало произведение матриц. 3. Норма в Rm. Величину назовем нормой вектора х = (ж1,..., хт) G Rm.
§ 1. ЛИНЕЙНАЯ СТРУКТУРА В Rm 501 Из этого определения с учетом неравенства Минковского следу- следует, что 1° Ы > 0, 2°(\\х\\=0)&(х = 0), 3° ||Агг|| = |А| • \\x\\, где А е К, Вообще, любую функцию || ||: X -»• К на векторном пространст- пространстве X, удовлетворяющую условиям 1° -4°, называют нормой в векторном пространстве. Иногда, чтобы уточнить, о какой норме идет речь, знак нормы вектора наделяют символом того пространства, в котором эту норму рассматривают. Например, можно написать ||а;||кт или ||у||мп, од- однако мы, как правило, не станем этого делать, ибо из контекста всегда будет ясно, о каком пространстве и какой норме идет речь. Заметим, что в силу A2) \\X2-X1\\=d(x1,X2), A3) где d(xi,X2)—расстояние в Шт между векторами х\ и Х2, рассматри- рассматриваемыми как точки метрического пространства Шт. Из соотношения A3) видно, что следующие условия равносильны: x^-xq, d(x,xo)^O, \\х-хо\\->О. Ввиду A3), в частности, имеем \\x\\=d@,x). Свойство 4° нормы называют неравенством треугольника, и теперь ясно почему. Неравенство треугольника по индукции распространяется на сумму любого конечного числа слагаемых. А именно, справедливо неравенство \\xi+... + xk\\ <|Ы + ... + ||а*||. Наличие нормы вектора позволяет сравнивать по величине значения функций /: X ->• Шт, д: X -> К". Условимся писать, что f(x) = о(д(х)) или / = о(д) при базе В в X, если ||/(a;)||Rm = о(||^(а;)||кп) при этой базе В-
502 ГЛ VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если f(x) — {fl{x),..., fm{x)) —координатное представление ото- отображения /: X —> Шт, то ввиду неравенств г=1 можно сделать следующее полезное для дальнейшего наблюдение: (/ = °Ы ПРИ базе В) <=> (/* = о(#) при базе В; г = 1,... , т). A5) Условимся также, что запись / = О(д) при базе ВвХ будет озна- означать, что ||/(а;)||кт = О(||^(ж)||кп) при этой базе В. Тогда из A4) получаем, что (/ = 0{д) при базе В) <& (f = О(д) при базе В; i = 1,... ,m). A6) Пример. Рассмотрим линейное отображение L: Шт ->• К". Пусть h = hle\ + .. .+hmem — произвольный вектор пространствам7". Оценим \\L{h)\\ = t=i г=1 Таким образом, можно утверждать, что L(h) = 0{h) при Л -»• 0. A8) В частности, из этого следует, что L(x — жо) = L(x) — L(xq) —> 0 при х —> xq, т. е. линейное отображение L: Шт —> К" непрерывно в любой точке хо 6 Кто. Из оценки A7) видна даже равномерная непрерывность линейного отображения. 4. Евклидова структура в Шш. Из алгебры известно понятие скалярного произведения в вещественном векторном пространстве как числовой функции (х, у), определенной на парах векторов пространства и обладающей свойствами (х,х)^0, {х, х) - 0 Ф> х = 0, (х1,х2) = (х2,хг), (Хх1,х2) = Х{х1,х2), где АеМ, (xi + х2, х3) = (xi,x3) + (х2, хз).
§ 1. ЛИНЕЙНАЯ СТРУКТУРА В Rra 503 Из этих свойств, в частности, следует, что если в пространстве фик- фиксирован базис {ei,..., ето}, то через координаты (ж1,..., жт), (у1,..., уто) векторов ж и у их скалярное произведение (ж, у) запишется в виде би- билинейной формы 3 A9) (подразумевается суммирование по г и по j), в которой gtJ = (ег,е3). Векторы называются ортогональными, если их скалярное произве- произведение равно нулю. Базис {ei,...,eTO} называется ортонормированным, если gl3 = StJ, где Г 0, если г ф j, I 1, если г = j. В ортонормированном базисе скалярное произведение A9) имеет са- самый простой вид (ж, у) = £ужУ, или {х,у) = х1-у1 + ...+хт-ут. B0) Координаты, в которых скалярное произведение имеет такой вид, называют декартовыми координатами. Напомним, что пространство Кто с определенным в нем скалярным произведением называется евклидовым пространством. Между скалярным произведением B0) и нормой вектора A2) име- имеется очевидная связь /г г\ _ ||т||2 Из алгебры известно следующее неравенство: (ж,уJ ^ (ж,ж)(у,у), которое, в частности, показывает, что для любой пары векторов най- найдется угол ip e [0,7г] такой, что (ж, у) = ЦхЦЦуЦсову. Этот угол называют углом между векторами х и у. Именно по этой причине естественно считать ортогональными векторы, скалярное про- произведение которых равно нулю.
504 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Полезным для нас будет также следующий известный из алгебры простой, но очень важный факт: любая линейная функция L: Кто ->1 8 евклидовом пространстве имеет вид где £ Е Кт —фиксированный и однозначно соответствующий функ- функции L вектор. § 2. Дифференциал функции многих переменных 1. Дифференцируемость и дифференциал функции в точке Определение 1. Функция /: Е —> Шп, определенная на множест- множестве Е С W71, называется дифференцируемой в точке х Е Е, предельной для множества Е, если f(x + h)- f{x) = L(x)h + a{x; h), A) где L(x): Шт -»• Шп—линейная относительно h функция1), a a(x;h) = = o(h) при h ->■ 0, x + h e E. Векторы Ax(h) := (x + h) - x = h, Af(x;h):=f(x + h)-f(x) называются соответственно приращением аргумента и приращением функции (отвечающим этому приращению аргумента). Эти векторы по традиции обозначают символами Ах и А/(ж) самих функций от h. Линейная функция L(x): Шт ->• К" в соотношении A) называется дифференциалом, касательным отображением или производным ото- отображением функции f: Е -> М" в точке х Е Е. Дифференциал функции /: Е ->• К" в точке х Е Е обозначается символами df(x), Df(x) или f'{x). аналогии с одномерным случаем, мы позволим себе писать L(x)h вместо L(x)(h). Отметим также, что в определении мы подразумеваем, что Rm и R" на- наделены указанной в § 1 нормой.
§ 2. ДИФФЕРЕНЦИАЛ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 505 В соответствии с введенными обозначениями, соотношение A) мож- можно переписать в виде f(x + h) - f{x) = f'(x)h + a(x; h) или Af{x;h) =df{x)h + a{x;h). Заметим, что дифференциал, в сущности, определен на смещениях h от рассматриваемой точки х € Rm. Чтобы это подчеркнуть, с точкой х € R связывают свой экземпляр векторного пространства W1 и обозначают его через T^R, TWn(x) или TRJ1; ТЩ}} можно трактовать как совокупность векторов, прило- приложенных к точке х € Rm. Векторное пространство ТЩ? называют каса- касательным пространством к R в точке х € R. Происхождение этой терминологии прояснится позже. Значение дифференциала на векторе h € TRJ1 есть вектор f'(x)h € € ТЩ,-., приложенный к точке f(x) и аппроксимирующий приращение f(x + h) — f(x) функции, вызванное приращением h аргумента х. Итак, df(x) или f'(x) есть линейное отображение f'(x): Щ{у Мы видим, что, в полном соответствии с уже изученным нами од- одномерным случаем, функция многих переменных с векторными значе- значениями дифференцируема в точке, если ее приращение А/(ж; К) в этой точке как функция приращения аргумента h линейно по h с точностью до поправки a(x;h), бесконечно малой при h -> 0 в сравнении с прира- приращением аргумента. 2. Дифференциал и частные производные вещественно- значной функции. Если векторы f(x + h), f(x), L(x)h, a(x; h) из W записать в координатах, то равенство A) окажется равносильным п равенствам Р{х + К)-Р{х) = 1}{х)Н + аг{х;Ь) (t = l,...,n) B) между вещественнозначными функциями, в которых, как следует из соотношений (9) и A5) §1, Ьг(х): R —> R суть линейные функции, а аг(х; h) = o(h) при /i—>■(), х + h € Е для любого г = 1,..., п.
506 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Таким образом, справедливо Утверждение 1. Отображение f: Е —> М" множества Е С Кт дифференцируемо в точке х 6 Е, предельной для множества Е, то- тогда и только тогда, когда в этой точке дифференцируемы функции fl: Е —* М. (i = 1,... , п), задающие координатное представление дан- данного отображения. Поскольку соотношения A) и B) равносильны, то для отыскания дифференциала Ь(х) отображения f'.E—tW1 достаточно научиться находить дифференциалы U (х) его координатных функций /г: Е -*Ш. Итак, рассмотрим вещественнозначную функцию /: J5 -> К, опре- определенную на множестве Е с Ш71 и дифференцируемую во внутренней точке х Е Е этого множества. Заметим, что в дальнейшем нам боль- большей частью придется иметь дело с тем случаем, когда Е будет обла- областью в Rm. Если х есть внутренняя точка множества Е, то при любом достаточно малом смещении h от точки х точка х + h также будет при- принадлежать Е и, следовательно, будет находиться в области определения функции f-.E-tR. Если перейти к координатной записи точки х = (ж1,..., хт), векто- вектора h = (hl,... ,hm) и линейной функции L (x) h = ai(x)hl + .. .+am(x)hm, то условие f(x + h)-f(x) = L(x)h + o{h) при h -> 0 C) перепишется в виде fix1 + h1,..., хт + hm) - /(ж1,..., хт) = = ai{x)h} + ... + am(x)hm + o{h) при h -> 0, D) где a\ (x),..., am (x) — связанные с точкой х вещественные числа. Мы хотим найти эти числа. Для этого вместо произвольного сме- смещения h рассмотрим специальное смещение К = Нгег = 0 • ei + ... + 0 • et-i + hlet + 0 • ег+1 + ... + 0 • ет на вектор ht, коллинеарный вектору ег базиса {ei,..., ето} в Шп. При h = ht, очевидно, \\h\\ = \hl\, поэтому из D) при h = Нг получаем = at{x)hl + o{hl) при hl -> 0. E)
§ 2. ДИФФЕРЕНЦИАЛ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 507 Это означает, что если фиксировать в функции /(ж1,... ,хт) все переменные, кроме г-й, то получаемая при этом функция г-й переменной оказывается дифференцируемой в точке ж1. Из равенства E), таким образом, находим, что * f(x\...,x*-\x* + h\x*+\...,xm)-f(x1,...,x*,...,xm)^ hl Определение 2. Предел F) называется частной производной функции f(x) в точке х = (ж1,..., хт) по переменной хг. Его обознача- обозначают одним из следующих символов: !£(*), а/(а), DJ(x), f'xt(x). Пример 1. Если f{u,v) = и3 + v2 sin u, то dif(u,v) = —(«,«) = Зи2 + v2 cos и, d^f(и, v) = -^-(u,v) = 2usinu. ov Пример 2. Если f(x, у, z) = arctg {xy2) + ez, то df Ixy = —(x,y,z) = dy 1+ x2y4 дз/(х,у,г) = —{x,y,z) = ez. Итак, мы доказали Утверждение 2. Если функция f: Е -> Ш, определенная на мно- множестве Е С Rm, дифференцируема во внутренней точке х 6 Е этого множества, то в этой точке функция имеет частные производные по каждой переменной и дифференциал функции однозначно определяется этими частными производными в виде
508 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Формулу G), используя соглашение о суммировании по повторяю- повторяющемуся снизу и сверху индексу, можно записать компактно: df{x)h = дгЛх)к\ (8) Пример 3. Если бы мы знали (а скоро мы это узнаем), что рас- рассмотренная в примере 2 функция f(x,y,z) дифференцируема в точке @,1,0), то можно было бы сразу записать, что d/@,1,0)Л = 1 • h1 + 0 • h2 + 1 • h3 = hl + h3 и, в соответствии с этим, / (Л1,1 + h2, h3) - ДО,1,0) = d/@,1,0)Л + o{h) или arctg (h1 A + h2J) + eh3 = 1 + h1 + h3 + o(h) при h -> 0. Пример 4. Для функции х — (ж1,... ,xm) i—> хг, которая точке х 6 RTO ставит в соответствие ее г-ю координату, имеем Дтгг(а;; К) = (хг + hl) -xl = h\ т. е. приращение этой функции само есть линейная по h функция h i—У н^-> К1. Таким образом, Атгг(ж;/1) = dirl{x)h, причем отображение ёпг(х) = dir1 на самом деле оказывается не зависящим от ж € Rm в том смысле, что dirl(x)h = hl в любой точке х € Мт. Если вместо ттг(х) писать хг(х), то получаем, что dxl{x)h = dxxh = К1. Учитывая это обстоятельство и формулу (8), мы теперь можем пред- представить дифференциал любой функции в виде линейной комбинации дифференциалов координат ее аргумента х € Ш!71. А именно: df(x) = dtf{x)dxl = ~(x)dxl + ... + -^(x)dxm, (9) поскольку для любого вектора h € ТЩ}} имеем df{x)h = dj{x)hl = 3lf{x)dxlh.
§ 2. ДИФФЕРЕНЦИАЛ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 509 3. Координатное представление дифференциала отображе- отображения. Матрица Якоби. Итак, мы нашли формулу G) для дифферен- дифференциала вещественнозначной функции f:E—>M~ Но тогда, в силу уста- установленной эквивалентности соотношений A) и B), уже для любого ото- отображения f-.E^-W1 множества Е С Мто, дифференцируемого во вну- внутренней точке х € Е этого множества, можно выписать координатное представление дифференциала df(x) в виде /df(x)h ( (£ df(x)h = [ = = .... A0) W{x)h) \ )\J Определение 3. Матрица (дг/Цх)) (г = 1,..., m, j = 1,..., п) из частных производных координатных функций данного отображения в точке х 6 Е называется матрицей Якоби1^ или якобианом2^ отображе- отображения в этой точке. В случае, когда п = 1, мы возвращаемся к формуле G), а когда п = 1 и т = 1, мы приходим к дифференциалу вещественнозначной функции одного вещественного переменного. Из эквивалентности соотношений A) и B) и единственности диф- дифференциала G) вещественнозначной функции следует Утверждение 3. Если отображение f-.E—^W1 множества Е С С W1 дифференцируемо во внутренней точке х € Е этого множества, то оно имеет в этой точке единственный дифференциал df(x), при- причем координатное представление отображения df(x): Т№%} —* ТШ1,х^ задается соотношением A0). 4. Непрерывность, частные производные и дифференциру- емость функции в точке. Мы закончим обсуждение понятия диф- ференцируемости функции в точке указанием на взаимоотношения между непрерывностью функции в точке, наличием у нее частных про- производных в точке и дифференцируемостью ее в этой точке. В §1 (соотношения A7) и A8)) мы установили, что если L: RTO —> -4 М" —линейное отображение, то Lh -> 0 при h -> 0. Таким образом, Х'К. Г. Я. Якоби A804-1851) —известный немецкий математик. 2'Якобианом чаще называют определитель этой матрицы (когда она квадратная).
510 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ из соотношения A) можно заключить, что функция, дифференцируемая в точке, непрерывна в этой точке, поскольку f{x + h) - f{x) = L{x)h + o(h) при h ->• 0, x + heE. Обратное, конечно, не верно потому, что, как нам известно, это не верно уже в одномерном случае. Таким образом, взаимоотношение непрерывности и дифференциру- емости функции в точке в многомерном случае такое же, как и в одно- одномерном. Совсем иначе обстоит дело во взаимоотношениях частных произ- производных и дифференциала. В одномерном случае, т.е. в случае веще- ственнозначной функции одного вещественного переменного, наличие дифференциала и наличие производной у функции в точке были усло- условиями равносильными. Для функций многих переменных мы показа- показали (утверждение 2), что дифференцируемость функции во внутренней точке области определения обеспечивает существование у нее частных производных по каждой переменной в этой точке. Однако обратное утверждение уже не имеет места. Пример 5. Функция Г 0, если хгх2 = 0, f{xl,x2) = \ у 1, если агат ф 0, равна нулю на осях координат и потому имеет в точке @,0) обе частные производные: #i/@,0) = hm —— ' = hm -тг- = 0, Вместе с тем эта функция не дифференцируема в точке @,0), по- поскольку она, очевидно, разрывна в этой точке. Приведенная в примере 5 функция не имеет одной из частных про- производных в точках осей координат, отличных от точки @,0). Однако функция если х2+у2фО, 0, если х + у = 0
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 511 (которая нам встречалась в примере 2 из § 2 гл. VII), уже во всех точках плоскости (х, у) имеет частные производные, однако она тоже разрывна в начале координат и потому не дифференцируема в точке @,0). Таким образом, возможность написать правую часть равенств G), (8) еще не гарантирует того, что это будет дифференциал нашей функ- функции, поскольку функция может оказаться не дифференцируемой. Это обстоятельство могло бы стать серьезной помехой всему диф- дифференциальному исчислению функций многих переменных, если бы не выяснилось (это будет доказано позже), что непрерывности частных производных в точке достаточно для дифференцируемости функции в этой точке. § 3. Основные законы дифференцирования 1. Линейность операции дифференцирования Теорема 1. Если отображения f\: Е -> К", /2: E -> W, опреде- определенные на множестве Е С W1, дифференцируемы в точке х € Е, то их линейная комбинация (Xifi + А2/2): Е —* М" также является диф- дифференцируемым в этой точке отображением, причем имеет место равенство (Ai/i + A2/2)'(s) = (А1Л + Аг/гНя)- A) Равенство A) показывает, что операция дифференцирования, т.е. сопоставление отображению его дифференциала в точке, является ли- линейной операцией на векторном пространстве отображений /: Е -> R", дифференцируемых в фиксированной точке множества Е. Слева в A) стоит, по определению, линейное отображение {\\f\ + Аг/г)'^), а спра- справа стоит линейная комбинация (Ai/{ + А2/2ХЯ;) линейных отображений f[(x): Rm -> Rn, /2C;): Mm -> Ш1, которая, как нам известно из §1, также является линейным отображением. Теорема 1 утверждает, что эти отображения совпадают. < (Ai/i + А2/2)(я + h) - (Ax/i + A2/2)(a0 = = (Ai/i(s + h) + A2/2(z + h)) - (\Ji(x) + А2/2И) = = AxCMs + h)- h(x)) + X2(f2(x + h)- h{x)) = = Xi(f[(x)h + o(h)) + А2(/2»Л + o(h)) =
512 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если рассматриваемые функции вещественнозначны, то над ними выполнимы также операции умножения и (при необращении знамена- знаменателя в нуль) деления. Имеет место Теорема 2. Если функции /:Е-^Ш, д: Е -> R, определенные на множестве Е С Rm, дифференцируемы в точке х € Е, то a) их произведение дифференцируемо в х, причем (f-9)'(x)=g(x)f'(x)+f(x)g'(x); B) b) их отношение дифференцируемо в х, если д(х) ф 0, причем £) И = -2^Т (9Ш'(х) - f(x)g'(x)). C) У/ У (х) Доказательство этой теоремы совпадает с доказательством соот- соответствующих пунктов теоремы 1 из § 2 гл. V, поэтому мы на нем не останавливаемся. Соотношения A), B), C) можно переписать также и в иных обозна- обозначениях дифференциала. А именно: A2d/2)(a0, d(f-g)(x)=g(x)df(x) + f d (n) W = n^M МФПх) - f(x)dg(x)). \9/ 9 (x) Посмотрим, что означают эти равенства в координатном предста- представлении отображений. Нам известно, что если отображение ip: E —tW, дифференцируемое во внутренней точке х множества Е С Rm, запи- записать в координатном виде <рп{х\...,хт) то его дифференциалу dip(x): RTO —> Ш1 в этой точке будет соответ- соответствовать матрица Якоби
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 513 При фиксированных базисах в Rm и R" соответствие между ли- линейными отображениями L: RTO —> R" и т х п-матрицами — взаимно однозначное, поэтому линейное отображение L можно отождествить с задающей его матрицей. Для обозначения матрицы Якоби мы все же, как правило, будем использовать символ f'(x), а не символ df(x), ибо это больше соответ- соответствует тому традиционному разделению понятий производной и диф- дифференциала, которое проводится в одномерном случае. Таким образом, в силу единственности дифференциала, во внутрен- внутренней точке х множества Е получаем следующие координатные формы записи соотношений A), B), C), означающие равенства соответствую- соответствующих матриц Якоби: ,m, j = l,...,n), A') (i = l,...,m), B') (дг @) (х) = ~у ШдгПх) - f(x)dl9(x)) (г = 1,..., ш). C') Из поэлементного равенства указанных матриц, например, следу- следует, что частную производную по переменной хг от произведения веще- ственнозначных функций /(ж1,..., хт) и д(хг,..., хт) надо брать так: Отметим, что как это равенство, так и матричные равенства A'), B'), C') являются очевидными следствиями определения частной про- производной и обычных правил дифференцирования вещественнозначных функций одного вещественного переменного. Однако нам известно, что наличия частных производных еще может оказаться недостаточно для дифференцируемости функции многих переменных. Поэтому наряду с важными и вполне очевидными равенствами A'), B'), C') особую роль в теоремах 1 и 2 приобретают утверждения о существовании диффе- дифференциала соответствующего отображения.
514 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Заметим, наконец, что по индукции из равенства B) можно полу- получить соотношение для дифференциала произведения {fi ■ ■ ■ fk) дифференцируемых веще- ственнозначных функций. 2. Дифференцирование композиции отображений а. Основная теорема Теорема 3. Если отображение f: X —> Y множества X с. W11 в множество Fcl" дифференцируемо в точке х 6 X, а отображение g: Y ->• Mfc дифференцируемо в точке у = f(x) € Y, то композиция g о f: X —> M.k этих отображений дифференцируема в точке х, причем дифференциал d(gof): TIR^1 —> ТШ!*,*,х-,, композиции равен композиции dg{y) ° df(x) дифференциалов df(x): ТШ£ -> Щ{х)=у, dg(y): Доказательство этой теоремы почти полностью повторяет доказа- доказательство теоремы 2 из § 2 гл. V. Чтобы обратить внимание на одну новую, появляющуюся теперь деталь, мы все же проведем еще раз зто доказательство, не вдаваясь, однако, в уже разобранные технические подробности. ■^ Используя дифференцируемость отображений / и g в точках х и у = f{x), а также линейность дифференциала д'(х), можно написать, что (д of)(x + h)-(go f)(x) = g(f(x + h)) - g(f(x)) = = g'(f(x))(f(x + h)- f(x)) + o(f(x + h)- f(x)) = = д'Ш\Ф + o(h)) + o(f(x + h)- f(x)) = = 9'(y)(f'(x)h) + g'(y)(o(h)) + o(f(x + h)- f(x)) = = (g'(y)of'(x))h + a(x;h), где д'(у) о f'(x) есть линейное отображение (как композиция линейных отображений), а а(х; h) = g'(y)(o(h)) + o(f(x + h) - f(x)).
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 515 Но, как показывают соотношения A7), A8) из § 1, g'(y)(o{h))=o(h) при /г->0, f(x + h) - f(x) = f'(x)h + o(h) = O(h) + o(h) = O(h) при h -> 0 и o(f(x + h)- f{x)) = o{O{h)) = o(h) при h -> 0. Следовательно, a(x; h) = o(h) + o(h) = o(h) при h ->■ 0, и теорема доказана. ► Будучи переписана в координатной форме, теорема 3 означает, что если х — внутренняя точка множества X и х) ...dmf\x) }={дгр)(х), а У = f(x) — внутренняя точка множества Y и (dl9l{y) ...дп9^у)\ 9'{У)=\ ]=Ш)(У), \di9k(y) ■■■дп9к(у)) то di(g1of)(x)...am(g1of){x)\ =(дг(91°Л)(х) = di(gk°f)(x) ...dm(gkof)(x)J (digl{y) ... dngl{y)\ (д^{х) ... дт/Цх)\ ]=(д]91(у)-дгР(х)). Кд19к(у) ... dngk(y)J {дгПх) ... дтГ{х)) J В равенстве (дг(91 о /)) (х) = (dj9l(f(x)) ■ дгР{х)) D) справа имеется в виду суммирование по индексу j в пределах его изме- изменения, т. е. от 1 до п.
516 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В отличие от равенств A'), B'), C'), соотношение D) нетривиально даже в смысле поэлементного равенства участвующих в нем матриц. Рассмотрим некоторые важные частные случаи доказанной тео- теоремы. Ь. Дифференциал и частные производные сложной веще- ственнозначной функции. Пусть z = д{у1, ■ ■., уп) —вещественно- значная функция вещественных переменных у1,...,у", каждое из ко- которых в свою очередь есть функция у3 = /■'(ж1,... ,хт) (j = 1,...,п) переменных ж1,... ,хт. В предположении дифференцируемости функ- функций д и Р (j = 1,... , п) найдем частную производную ^°/' (х) ком- дх позиции отображений /:Х->Уид:У->М. По формуле D), в которой при наших условиях 1 = 1, находим d>(gof)(x)=d,g(f(x))-dtf>(x) E) или, в более подробной записи, дг _ д(д о /) ! хт,дд_ д^ +дд_.ду^_ дх*[) дхг [ '•"' } ду1 дхг+-" + дуп дхг~ = dl9{f{x)) ■ dtf\x) + ...+ dng(f(x)) ■ дгГ(х). с. Производная по вектору и градиент функции в точке. Рассмотрим установившийся поток жидкости или газа в некоторой области G пространства К3. Термин «установившийся» означает, что скорость потока в каждой точке области G не меняется со временем, хо- хотя в различных точках области G она, разумеется, может быть различ- различной. Пусть, например, f(x) = /(ж1,х2,ж3) — давление в потоке в точке ж = (ж1, ж2, ж3) 6 G. Если мы будем перемещаться в потоке по закону х = x(t), где t — время, то в момент t мы будем регистрировать давле- давление (fox)(t) = f(x(t)). Скорость изменения давления со временем вдоль нашей траектории, очевидно, есть производная л* (О п0 времени от функции (/ ож)(£). Найдем ее в предположении, что /(ж1, ж2, ж3) — диф- дифференцируемая в области G функция. По закону дифференцирования композиции функций находим ^ |^ F) (г = 1,2,3).
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 517 Поскольку (ir1, ir2, x3)(t) = v(t) есть вектор скорости нашего переме- перемещения в момент t, a (dif, #2/, с?з/)(ж) есть координатная запись диффе- дифференциала df(x) функции / в точке ж, то равенство F) можно переписать также в виде *tLjL*ltI G) т.е. искомая величина есть значение дифференциала df(x(t)) функции /(ж) в точке x{t) на векторе v{t) скорости нашего движения. В частности, если при t = 0 мы были в точке жо = ж@), то (8) где v = v@) — вектор скорости в момент £ = 0. Правая часть соотношения (8) зависит только от точки жо 6 G и вектора v скорости, которую мы имеем в этой точке, и не зависит от конкретного вида траектории ж = x(t), лишь бы было выполнено условие ж@) = v. Это означает, что на любой траектории вида x(t) = xo + vt + a(t), (9) где a(t) = o(t) при t —> 0, значение левой части равенства (8) будет одинаково, поскольку оно вполне определяется заданием точки жо и вектора v 6 ТМ^0, приложенного к этой точке. В частности, если бы мы хотели непосредственно вычислить значение левой (а значит, и правой) части равенства (8), то можно было бы в качестве закона движения выбрать функцию x(t) - жо + vt, A0) отвечающую равномерному движению со скоростью v, при котором в момент t = 0 мы находимся в точке ж@) = жо- Дадим теперь следующее Определение 1. Если функция /(ж) определена в окрестности точки жо 6 Шт, a v 6 ТШ^0 —вектор, приложенный к точке жо, то величина Dvf(xQ) := lim t->o t (И) (если указанный предел существует) называется производной функ- функции f в точке жо по вектору v.
518 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Из проведенных рассмотрений следует, что если функция / диф- дифференцируема в точке хо, то при любой функции x(t) вида (9) и, в частности, вида A0) имеет место равенство Dvf(x0) = ^^@) = df(xo)v, A2) что в координатном представлении означает Dvf(x0) = ЦгЫ»1 +... + ~^(xo)vm. A3) В частности, для базисных векторов е\ = A,0, ...,0), ... , ет = = @,..., 0,1) из этой формулы получаем DJ(x) = {x) (г = 1ш) На основании равенства A2) в силу линейности дифференциала df(xo) заключаем, что если /—дифференцируемая в точке xq функ- функция, то для любых векторов v\,V2 6 TW£0 и любых Ai, A2 ЕШ функция имеет в точке xq производную по вектору (Ai^i + A2V2) 6 TW£0 и при этом = \iDvJ(x0) + ^DvJ{xq). A4) Если пространство Шт рассматривать как евклидово пространст- пространство, т. е. как векторное пространство со скалярным произведением, то (см. § 1) любую линейную функцию L(v) можно будет записать в ви- виде скалярного произведения (£, v) фиксированного вектора £ = £(Ь) и переменного вектора v. В частности, найдется вектор £ такой, что df(xo)v = (Z,v). A5) Определение 2. Вектор £ 6 ТТК^, отвечающий в смысле равен- равенства A5) дифференциалу df(xo) функции / в точке хо, называется гра- градиентом функции в этой точке и обозначается символом grad/(a;o). Итак, по определению df(xo)v = {gradf(xo),v). A6)
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 519 Если в Мт выбрана декартова система координат, то, сопоставляя соотношения A2), A3) и A6), заключаем, что в такой системе коорди- координат градиент имеет следующее координатное представление: Выясним теперь геометрический смысл вектора grad/(a;o). Пусть е 6 ТШ^о —единичный вектор. Тогда в силу A6) Def(x0) = \gradf(x0)\cos(p, A8) где if — угол между векторами е и grad/(a;o). Таким образом, если grad/(a;o) Ф 0 и е = ||grad/(a;o)||~1 grad/(xo), то производная Def(xo) принимает наибольшее значение. То есть ско- скорость роста функции / (выраженная в единицах величины /, отнесен- отнесенных к единице длины в Шт) при движении из точки Xq максимальна и равна ||grad/(a;o)||, когда мы смещаемся именно в направлении век- вектора grad/(xo). При смещении в противоположном направлении значе- значения функции наиболее резко уменьшаются, а при смещении в направле- направлении, перпендикулярном вектору grad/(a;o), скорость изменения значе- значений функции равна нулю. Производную по единичному вектору данного направления обычно называют производной по данному направлению. Поскольку единичный вектор в евклидовом пространстве задается направляющими косинусами: е = (cosai,... ,cosam), где аг — угол, который вектор е образует с базисным вектором ег де- декартовой системы координат, то Def(x0) = (grad/(sro),e) = Вектор grad/(xo) встречается очень часто и имеет многочисленные применения. Например, на отмеченном выше геометрическом свойстве градиента основаны так называемые градиентные методы численного (на ЭВМ) поиска экстремумов функций многих переменных. (См. в этой связи задачу 2 в конце параграфа.)
520 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Многие важные векторные поля, как, например, ньютоновское поле сил тяготения или кулоновское поле заряда, являются градиентами не- некоторых скалярных функций—потенциалов этих полей (см. задачу 3). Многие физические законы в самой своей формулировке использу- используют вектор grad/. Например, в механике сплошной среды эквивалентом основного закона Ньютона та = F динамики точки является соотно- соотношение ра = -gradp, связывающее ускорение а = а(х, t) в потоке свободной от внешних сил идеальной жидкости или газа в точке х в момент t с плотностью среды р = p(x,t) и градиентом давления р = р(х, t), отнесенными к этой же точке и к этому же моменту времени (см. задачу 4). О векторе grad / мы еще будем говорить позже, при изучении век- векторного анализа и элементов теории поля. 3. Дифференцирование обратного отображения Теорема 4. Пусть /: U(x) -> V(y) —отображение окрестности U(x) С Ш71 точки х на окрестность V(y) С К точки у = f(x). Пусть f непрерывно в точке х и имеет обратное отображение f~l: V(y) -> ->• U(x), непрерывное в точке у. Если при этом отображение f дифференцируемо в точке х и каса- касательное к f в точке х отображение f'(x): ТШ^ —>• ТК^1 имеет обрат- обратное отображение [/'(ж)]~1: ТШ!^^уТЩ?, то отображение f~l: F(y)-> —>• U(x) дифференцируемо в точке у = f(x) и справедливо равенство Таким образом, взаимно обратные дифференцируемые отображе- отображения имеют в соответствующих точках взаимно обратные касательные отображения. ■4 Положим f(x) = y, f(x + h)=y + t, t = f{x + h)~f(x); тогда Г1 (у) = *, ГЧу + t) = x + h, h = r\y + t)- Г\у)- Будем предполагать, что h столь мало, что х + h 6 U(x), а значит, y + teV(y).
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 521 Из непрерывности /вжи/~1ву следует, что t = f(x + h)- f(x) -> О при Л -Ю A) и h = f~1(y + t)-f-1(y)-^O при t->0. B) Из дифференцируемости / в точке х следует, что t = f'(x)h + o(h) при h -»■ 0, C) т.е. можно утверждать даже, что £ = О(/г) при /г —> 0 (см. соотношения A7), A8) из §1). Покажем, что если f'(x)—обратимое линейное отображение, то и h = O(t) при t -> 0. В самом деле, из C) последовательно получаем [f'{x)Ylt = h+[f'{x)Ylo{h) при Л->0, D) [f'{x)Ylt = h + o{h) при Л->0, - ||о(Л)|| при h^O, при ||Л||<«, где число S > 0 выбрано так, что ||о(Л)|| < |||Л|| при \\h\\ < S. Тогда с учетом соотношения B) находим \\h\\^2\\[f'(x)]-1t\\ = 0(\\t\\) при t->0, что равносильно соотношению h = O(t) при t -> 0. Отсюда, в частности, следует, что o(h) = o(t) при £ -> 0. Учитывая это, из B) и D) получаем /г= [f'(x)Ylt + o(t) при <^-0 или Г1A/ + «)-Г1Ы=[/'(^)]« + о(«) при *-Ю. ►
522 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Из алгебры известно, что если линейному преобразованию L: Rm -» -> Шт отвечает матрица А, то обратному к L линейному преобразова- преобразованию L~l: Шт —>• Шт соответствует матрица А~1, обратная к матрицей. Построение элементов обратной матрицы также известно из алгебры, следовательно, доказанная теорема дает прямой рецепт для построения отображения (/-1) (у)- Отметим, что при т = 1, т. е. при Rm = Ш, якобиан отображения /: U(x) —>• V(y) в точке х сводится к одному числу f'(x)—производ- f'(x)—производной функции / в точке х, а линейное преобразование f'(x): ТМ^ —> ТЦ, сводится к умножению на это число: h (->■ f'(x)h. Это линейное преобра- преобразование обратимо тогда и только тогда, когда f'(x) ф 0, причем ма- матрица обратного преобразования [f'(x)]~ : ТШу —>• ТШх также состоит из одного числа, равного [f'(x)]~~ , т.е. обратного к f'(x). Значит, те- теорема 4 содержит в себе также доказанное ранее правило отыскания производной обратной функции. Задачи и упражнения 1. а) Два пути 11-+ Xi(t), tt-¥ Xi(t) в Km будем считать эквивалентными в точке хо € Кт, если a;i@) = Хг@) = Хо и d(xi(t),x2(t)) — o(t) при t -> 0. Проверьте, что указанное отношение действительно является отношением эквивалентности, т. е. оно рефлексивно, симметрично и транзитивно. b) Проверьте, что между векторами v € ТШ^о и классами эквивалентных в точке х0 гладких путей имеется взаимно однозначное соответствие. c) Отождествляя касательное пространство ТТЩ^ с множеством классов эквивалентных в точке х0 € Кт гладких путей, введите операции сложения классов путей и умножения их на число. d) Проверьте, зависят ли введенные вами операции от системы координат В 1К . 2. а) Изобразите график функции z = х2 + 4у2, где (я, y,z)—декартовы координаты в К3. b) Пусть /: С -> Ж — числовая функция, определенная в области GcMm. Уровнем (с-уровнем) функции называется множество Е с G, на котором функция принимает одно значение (f(E) = с). Точнее, Е = /~1(с). Изобразите в К2 уровни функции, указанной в а). c) Найдите градиент функции f(x, у) ~ х2 + 4у2 и проверьте, что в любой точке (х,у) вектор grad/ ортогонален линии уровня функции /, проходящей через эту точку. d) Используя результаты задач а), Ь), с), проложите на поверхности z = = х2 + Ay2 самый короткий, на ваш взгляд, маршрут спуска из точки B,1,8) поверхности в низшую ее точку @,0,0).
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 523 е) Какой алгоритм, пригодный для ЭВМ, вы могли бы предложить для отыскания минимума функции f(x,y) = х2 + 4у2? 3. Говорят, что в области G пространства Кт задано векторное поле, если каждой точке igG сопоставлен некоторый вектор v(x) € ТЩ?. Вектор- Векторное поле v(x) в G называется потенциальным, если в области G есть число- числовая функция U: G -> К такая, что v(x) — gradJ7(x). Функцию U(x) называ- называют потенциалом поля v(x). (В физике потенциалом обычно называют функ- функцию —U(x), а функцию U{x) называют силовой функцией, если речь идет о поле сил.) a) Изобразите на плоскости с декартовыми координатами (х, у) поле gradf(x,y) для каждой из функций fi(x,y) = х2 + у2; /2(х,у) = -{х2 +у2); f3(x,y) = axctg(x/y) в области у > 0; U(x,y) = ху. b) Согласно закону Ньютона частица массы т, находящаяся в точке 0 € К3, притягивает частицу массы 1, находящуюся в точке х £ Ш3 (х ф 0), с силой F = — т\г\~3г, где г — вектор Ох (размерную постоянную G мы опустили). Покажите, что векторное поле F(x) в К3 \ 0 потенциально. c) Проверьте, что массы тг, (г = 1,..., п), помещенные в точках (£„ г)г, &) (г = 1,... ,п) соответственно, создают вне этих точек ньютоновское поле сил, потенциалом которого служит функция d) Укажите потенциал кулоновского электростатического поля напряжен- напряженности, создаваемого точечными зарядами д, (г = 1,...,п), помещенными в точках (£,, г?», О (г = 1,..., п) соответственно. 4. Рассмотрим движение идеальной несжимаемой жидкости в простран- пространстве, свободном от внешних (в том числе и гравитационных) сил. Пусть v = v(x,y,z,t), а = a(x,y,z,t), p = p(x,y,z,t), p=p(x,y,z,t) суть соответственно скорость, ускорение, плотность и давление в точке (х, у, z) среды в момент времени t. Идеальность жидкости означает, что давление в любой ее точке не зависит от направления. a) Выделите из жидкости объем в виде небольшого параллелепипеда, одно из ребер которого параллельно вектору gradp(x, у, z, t) (где gradp берется по пространственным координатам). Оцените действующую на объем за счет перепада давления силу и дайте приближенную формулу для ускорения этого объема, считая жидкость несжимаемой. b) Проверьте, согласуется ли полученный вами в а) результат с уравнением Эйлера ра = — gradp. c) Линия, в любой точке которой касательная имеет направление вектора скорости в этой точке, называется линией тока. Движение называется уста-
524 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ повившимся, если функции v, a, р, р не зависят от t. Используя Ь), покажите, что вдоль линий тока в установившемся потоке несжимаемой жидкости вели- величина i||w||2 + р/р постоянна (закон Бернулли1'). d) Как изменятся формулы в а) и Ь), если движение будет происходить в поле тяжести вблизи поверхности Земли? Покажите, что в этом случае ра = - grad (gz + р) и потому вдоль каждой линии тока установившегося движения несжимаемой жидкости на сей раз постоянна величина i||w||2 + gz +р/р, где д — ускорение силы тяжести, a z — высота точки линии тока, отсчитываемая от некоторого нулевого уровня. e) Объясните на основании предыдущих результатов, почему несущее кры- крыло имеет характерный выпуклый вверх профиль. f) В цилиндрический стакан с круглым дном радиуса R налита до уров- уровня h несжимаемая идеальная жидкость плотности р. После этого стакан ста- стали вращать вокруг его оси с угловой скоростью и>. Используя несжимаемость жидкости, найдите уравнение z = f(x,y) ее поверхности в установившемся режиме (см. также задачу 3 из гл. V, § 1). g) По найденному в f) уравнению z = f(x,y) поверхности напишите фор- формулу р = p(x,y,z) для давления в любой точке (х, y,z) объема, заполненного вращающейся жидкостью. Проверьте, выполнено ли для найденной вами фор- формулы полученное в d) уравнение ра = — gr&d (gz +p). h) He могли бы вы теперь объяснить, почему чаинки тонут (хотя и не слишком быстро!), а при вращении чая собираются не у стенок стакана, а в центре дна? 5. Оценка погрешностей вычисления значений функции. a) Используя определение дифференцируемой функции и приближенное равенство Af(x;h) яй df(x)h, покажите, что относительная погрешность S = = S(f(x);h) в значении произведения f(x) = х1 ...хт т отличных от нуля сомножителей, вызванная погрешностями в задании самих сомножителей, мо- т жет быть найдена в виде S m J2 ^«> гДе ^« —относительная погрешность зада- ния г-го сомножителя. b) Используя то, что din f(x) = jv-^rdf(x), еще раз получите результат пре- предыдущей задачи и покажите, что вообще относительную погрешность дроби A,,т) 9i • ■ ■ 9к можно найти как сумму относительных погрешностей значений функций /b- -ч/п, 91, ■ -,9k- ^Д. Бернулли A700-1782) —швейцарский ученый, один из наиболее выдающихся физиков и математиков своего времени.
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 525 6. Однородные функции и тождество Эйлера. Функция /: G -»■ К, опреде- определенная в некоторой области G С Ет, называется однородной (положительно однородной) степени п, если для любых х € Ет и А € Е таких, что х € G и Ах € G, имеет место равенство /(Ах) = А"/(х) (/(Ах) = |А|»/(*)). Функция называется локально однородной степени п в области G, если она является однородной функцией указанной степени в некоторой окрестности любой точки области G. a) Докажите, что в выпуклой области всякая локально однородная функ- функция является однородной. b) Пусть область G есть плоскость Е2 без луча L = {(х, у) € IR2 | х = 2 Л /\у ^ 0}. Проверьте, что функция ,. ч Г уА/х, еслих>2Ли>0, f(x.y) = < % У у в остальных точках области локально однородна в G, но не является однородной функцией в этой области. c) Укажите степень однородности или положительной однородности сле- следующих функций, рассматриваемых в их естественной области определения: /^х1,... ,хт) = ххх2 + х2х3 + ... + х™-1!™; /2(х\х2,х3,х4) = х х —гтт; XJX2X3 + Х2Х3Х4 d) Продифференцировав равенство f(tx) = tnf(x) no t, покажите, что если дифференцируемая функция /: G —»■ Е локально однородна степени п в области G С Ет, то она удовлетворяет в G следующему тождеству Эйлера для однородных функций: е) Покажите, что если для дифференцируемой в области G функции /: G -»■ Ж выполнено тождество Эйлера, то эта функция локально однородна степени п в области G. Указание. Проверьте, что функция tp(t) = t~nf(tx) при любом х € G определена и постоянна в некоторой окрестности единицы. 7. Однородные функции и метод размерности. 1° Размерность физической величины и особенности функциональных свя- связей между физическими величинами.
526 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Физические законы устанавливают взаимосвязи физических величин, по- поэтому если для некоторых из этих величин принять какие-то единицы изме- измерения, то единицы измерения связанных с ними других величин будут опреде- определенным образом выражаться через единицы измерения фиксированных вели- величин. Так возникают основные и производные единицы той или иной системы единиц измерения. В системе СИ (Systeme International) за основные механические единицы измерения приняты единицы длины—метр (м), массы—килограмм (кг) и времени—секунда (с). Выражение производной единицы измерения через основные называется ее размерностью. Это определение ниже будет уточнено. Размерность любой механической величины записывают символически в виде формулы, выражающей ее через предложенные Максвеллом1) символы L, М, Т размерностей указанных выше основных единиц. Например, размерно- размерности скорости, ускорения и силы имеют соответственно вид [v] = LT-\ [а] = ЬТ~2, [F] = MLT~2. Если физические законы не зависят от выбора единиц измерения, то отра- отражением этой инвариантности должны быть определенные особенности функ- функциональной зависимости между числовыми характеристиками физических величин. Рассмотрим, например, зависимость с = /(о, Ь) = у/а2 + Ь2 между длинами катетов и длиной гипотенузы прямоугольного треугольника. Изменение мас- масштаба длин должно одинаково сказаться на всех длинах, поэтому для любых допустимых значений а и Ь должно быть выполнено соотношение f(aa, ab) — — ip(a)f(a,b), причем в нашем случае <р(а) = а. Основная (на первый взгляд очевидная) предпосылка теории размерно- размерности состоит в том, что претендующая на физическую значимость зависи- зависимость (*) должна быть такой, чтобы при изменении масштабов основных единиц измерения численные значения всех одноименных величин, участвую- участвующих в формуле, менялись в одно и то же число раз. В частности, если х\, Х2, Хз—основные независимые физические величи- величины и (х1,Х2,хз) i-> f(xi,%2,Хз)—зависимость от них некоторой четвертой физической величины, то, в силу сформулированного принципа, при любых допустимых значениях х\, х^, х3 должно быть выполнено равенство /@1X1,02X2,032:3) = ip(ai,a2,a3)f(xi,X2,x3), (**) с некоторой конкретной функцией (р. *' Дж. К. Максвелл A831 -1879) —выдающийся английский физик; создал матема- математическую теорию электромагнитного поля, известен также исследованиями по ки- кинетической теории газов, оптике и механике.
§ 3. ОСНОВНЫЕ ЗАКОНЫ ДИФФЕРЕНЦИРОВАНИЯ 527 Функция tp в равенстве (**) полностью характеризует зависимость чи- численного значения рассматриваемой физической величины от изменения мас- масштабов основных фиксированных физических величин. Таким образом, эту функцию и следует считать размерностью данной физической величины по отношению к фиксированным основным единицам измерения. Уточним теперь вид функции размерности. a) Пусть х i-> f(x) — функция одного переменного, удовлетворяющая усло- условию f(ax) = (p(a)f(x), где / и (р— дифференцируемые функции. Покажите, что (р(а) = ad. b) Покажите, что функция размерности ip в равенстве (**) всегда име- имеет вид Qj1 • а22 • а33, где показатели степени di, di, d3 суть некоторые дей- действительные числа. Таким образом, если, например, фиксированы основные единицы L, М, Г, то набор (di,d,2,d3) показателей в степенном выражении LdlMd2Td3 также можно считать размерностью данной физической величи- величины. c) В Ь) было получено, что функция размерности всегда имеет вид степен- степенной зависимости, т. е. является однородной функцией определенной степени по каждой из основных единиц измерения. Что означает, что степень однород- однородности функции размерности некоторой физической величины по отношению к одной из основных единиц измерения равна нулю? 2° И-теорема и метод размерности. Пусть [х,] = X, (г = 0,1,..., п) —размерности физических величин, участ- участвующих в законе (*). Предположим, что размерности величин х0, xk+i, ■.. ,хп могут быть вы- выражены через размерности величин xi,...,Xk, т.е. [хк+1] = Хк+1 = Х$ ...х£\ (г = 1,..., п - к). d) Покажите, что тогда наряду с (*) должно быть справедливо соотноше- соотношение af ...а£ожо = / (atiX!,... ^kXk,^1.. .al1 хк+1,... ,аР1п~к ...аРкп~кхп). (***) e) Если х\,...,Хк независимы, то в (***) положим а! = х^1,...,ак = х^1. Проверьте, что при этом из (***) получается равенство f I 1 i ■"K-t-i Xn Хг ...Хк Xl ■■■Хк являющееся соотношением П = /A,...I,П1,...)ПП_4) (****) между безразмерными величинами П, Щ,...,Ип_к.
528 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Таким образом, получается следующая П-теорема теории размерности. Если в соотношении (*) величины х\,...,Хк независимы, то это соотношение сводится к функции (****) от п — к безразмерных параметров. {) Проверьте, что если к = п, то на основании П-теоремы функция / из соотношения (*) может быть найдена с точностью до числового множителя. Найдите таким путем выражение c(<po)\/l/g для периода колебаний маятника (т. е. подвешенной на нити длины I массы т, качающейся у поверхности Земли; ifo — начальный угол отклонения). g) Найдите формулу Р = c\Jmr/F для периода обращения тела массы т, удерживаемого на круговой орбите центральной силой величины F. h) Из закона Кеплера (Pi/P2J = (ri/ггK, устанавливающего в применении к круговым орбитам связь между отношением периодов обращения планет (спутников) и отношением радиусов их орбит, найдите, вслед за Ньютоном, показатель степени а в законе F = gm1^2 всемирного тяготения. § 4. Основные факты дифференциального исчисления вещественнозначных функций многих переменных 1. Теорема о среднем Теорема 1. Пусть f:G—> Ш—вещественнозначная функция, определенная в области G С Шт. Пусть отрезок [x,x + h] с концами х, х + h содержится в G. Если при этих условиях функция / непрерывна в точках отрезка [х, х + h] и дифференцируема в точках интервала ]х,х + h[, то найдется такая точка £ £ ]х,х + h[, что имеет место равенство ' ' A) ■4 Рассмотрим вспомогательную функцию определенную на отрезке 0 ^ t ^ 1. Функция F удовлетворяет всем условиям теоремы Лагранжа: она непрерывна на [0,1], как композиция непрерывных отображений, и дифференцируема в интервале ]0,1[, как композиция дифференцируемых отображений. Следовательно, найдет- найдется точка в е ]0,1[ такая, что
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 529 Но F(l) = f(x + Л), F@) = /(ж), F'@) = /'(ж + вЛ)Л и, значит, выделенное равенство совпадает с утверждением теоремы 1. ► Приведем теперь координатную форму записи соотношения A). Если х = (х\...,хт), h = (Л1,...,/»™) и £ = (ж1 + 6h\...,xm + + 6hm), то равенство A) означает, что = J2 dtf{xl + 6h\...,xm + ehm)hl. г=1 Используя соглашение о суммировании по повторяющемуся сверху и снизу индексу, окончательно можно записать = dlf(x1+eh\...,xm + ehm)h\ (V) где 0 < в < 1, причем в зависит и от ж, и от h. Замечание. Теорема 1 называется теоремой о среднем в связи с тем, что существует некоторая «средняя» точка £ £ ]х, x + h[, в которой выполняется равенство A). Мы уже отмечали при обсуждении теоре- теоремы Лагранжа (см. гл. V, §3, п. 1), что теорема о среднем специфична именно для вещественнозначных функций. Общая теорема о конечном приращении для отображений будет доказана в главе X (часть II). Из теоремы 1 вытекает полезное Следствие. Если функция /: G —> R дифференцируема в области G С К™ и в любой точке х € G ее дифференциал равен нулю, то / постоянна в области G. Ч Равенство нулю линейного отображения равносильно обращению в нуль всех элементов отвечающей ему матрицы. В нашем случае h = (d1f,...,dmf)(x)h, поэтому d\f(x) = ... = dmf(x) = 0 в любой точке х Е G. 18-4573
530 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ По определению, область есть открытое связное множество. Вос- Воспользуемся этим. Покажем сначала, что если х £ G, то в шаре В(х;г) С G функ- функция / постоянна. Действительно, если (x + h) £ B(x;r), то и [x,x + h] С С В(х;г) С G. Применяя соотношение A) или A'), получаем т. е. f(x + h) = f(x) и значения / в шаре В(х; г) совпадают со значени- значением/в центре этого шара. Пусть теперь хо,х\ £ G — произвольные точки области G. В силу связности G найдется путь t н-> x(t) £ G такой, что х@) = жо, жA) = ц. Мы предполагаем, что непрерывное отображение t \-± x(t) определено на отрезке 0 ^ t ^ 1. Пусть В(хо;г)—шар с центром в хо, содержа- содержащийся в G. Поскольку х@) — xq и отображение t i-> x(t) непрерывно, найдется положительное число S такое, что x{t) £ B(xo;r) С G при 0 ^ t ^ S. Тогда по доказанному (/ о x)(t) = f(xo) на промежутке [0,5]. Пусть I = sup S, где верхняя грань берется по всем числам S £ [0,1] таким, что (fox)(t) = f(xo) на промежутке [0, S]. В силу непрерывности функции f(x(t)) имеем f(x(l)) — f(xo). Но тогда I = 1. Действительно, в противном случае можно было бы взять некоторый шар В(хA);г) С G, в котором f(x) = f(x(l)) = f(xo), затем в силу непрерывности отобра- отображения t н-> x(t) найти Д > 0 так, что x(t) G B(x(l);r) при I ^ t ^ I + Д. Тогда (/ о x){t) = f{x(l)) = f(x0) при 0 ^ t < / + А и l^supS. Итак, показано, что (/ о x)(t) = f(xo) при любом t G [0,1]. В част- частности, (/ о х){1) = f(x\) = /(xq) и мы проверили, что в любых двух точках жо,Ж1 G G значения функции /: G —> Ш совпадают. ► 2. Достаточное условие дифференцируемости функции многих переменных Теорема 2. Пусть /: U(x) —> Ш — функция, определенная в ок- окрестности U(x) С Шт точки х = (ж1,... ,хт). Если функция / имеет в каждой точке окрестности U{x) все частные производные -Л^,...,-Щ^, то из их непрерывности в точ- ОХ СУХ ке х следует дифференцируемость функции f в этой точке. < Без ограничения общности будем считать, что U(x) является шаром В(х;г). Тогда вместе с точками х = (ж1,... ,хт), x + h = = (х1 + h1,... ,хт + hm) области U(x) должны принадлежать также
§4. ОСНОВНЫЕ ТЕОРЕМЫ 531 точки (x1,x2+h2,.. .,xm+hm),..., (ж1, х2,... ,xm-1,xm+hm) и соединя- соединяющие их отрезки. Воспользуемся этим, применяя в следующей выкладке теорему Лагранжа для функций одной переменной: = /(х1 + h1,...,xm + hm)- f(x\x2 + h2,...,xm + hm) + f(x\ x2 + h2,..., xm + hm) - f(x\ x2, x3 + h3,..., xm + hm) + ... + + f(x\ x2,..., xm~\xm + hm) - f(x\ ...,xm) = l + exh\ x2 + h2,...,xm + hm)hl + + 62h2,x3 + h3,...,xm + hm)h2 + ...+ + dmf(x\x2,..., xm~\xm + emhm)hm. Пока мы воспользовались лишь наличием у функции / в области U(x) частных производных по каждой из переменных. Теперь воспользуемся их непрерывностью в точке х. Продолжая предыдущую выкладку, получаем, что f(x + h)- f(x) = dxf{x\ ..., xm)hl + a1 hl + + d2f(x\... ,xm)h2 + a2h2 + ... + + dmf(x\...,xm)hm + amhm, где величины а\,..., am в силу непрерывности частных производных в точке х стремятся к нулю при h —> 0. Но это означает, что f(x + К) - f(x) = L(x)h + o(h) при h ->■ 0, где L{x)h = dif{x\ .. .,xm)hl + ... + dmf(x\ .. .,xm)hm. ► Из теоремы 2 следует, что если частные производные функции /: G —> Ш непрерывны в области G С Мт, то функция дифференци- дифференцируема в любой точке этой области. Условимся в дальнейшем через C^(G;M.) или, проще, через C^(G) обозначать множество функций, имеющих в области G непрерывные частные производные.
532 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 3. Частные производные высшего порядка. Если функция /: G —> Ш, определенная в некоторой области G С Шт, имеет частную производную —L(x) по одной из переменных х1,..., хт, то эта частная производная вновь является некоторой функцией дг/: G —> К, которая в свою очередь может иметь частную производную dJ(dlf)(x) по неко- некоторой переменной х3. Функция d^dtf): G —> Ш называется второй производной от функ- функции f no переменным хг, х3 и обозначается одним из символов Порядок индексов указывает, в каком порядке производится диф- дифференцирование по соответствующим переменным. Мы определили частные производные второго порядка. Если определена частная производная порядка А;, то по индукции определяем частную производную порядка к + 1 соотношением Здесь возникает специфический для случая функций многих пере- переменных вопрос о том, влияет ли порядок дифференцирований на вычи- вычисляемую частную производную. Теорема 3. Если функция f:G—>R имеет в области G частные производные d2f то в любой точке х Е G, в которой обе эти производные непрерывны, их значения совпадают. ■4 Пусть х Е G—точка, в которой обе функции dtJf: G —> 1, djtf: G —> Ш непрерывны. Дальнейшие рассмотрения будем проводить в некотором шаре В(х;г) С G, г > 0, являющемся выпуклой окрестно- окрестностью точки х. Мы хотим проверить, что
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 533 Поскольку во всех дальнейших выкладках меняться будут только переменные хг иг', то мы для сокращения записи предположим, что / есть функция двух переменных fix1, x2), и нам надо проверить, что если в точке (ж1,ж2) Е М2 обе указанные функции непрерывны. Рассмотрим вспомогательную функцию F(h1,h2) = f(x1 + h1,x2 + h2)-f(x1 + h\x2)-f(x1,x2 + h2) + f(x\x2), где смещение h = (Л1, h2) предполагается достаточно малым, а именно таким, что х + h E В (ж; г). Если Fih1,^) рассмотреть как разность где (fit) = fix1 + th1,x2 + h2) — fix1 +th1,x2), то по теореме Лагранжа найдем, что Fih\h2) = tffijSi) = idifix1 + вфг,х2 + h2) - difix1 + вф^х2)) h1. Применяя к последней разности вновь теорему Лагранжа, найдем, что Fih1,h2) = d21fix1+e1h\x2 + e2h2)h2h1. B) Если теперь Fih1, h2) представить в виде разности где (pit) = fix1 + h1, x2 + th2) — fix1, x2 + th2), то аналогично найдем, что Fih1,h2)=d12fix1+e1h1,x2+e2h2)h1h2. C) Сравнивая равенства B) и C), заключаем, что + exh\x2 + 62h2) = dufix1 + e1h1,x2+§2h2), D) где #i, в2, #i, в2 G ]0,1[. Воспользовавшись непрерывностью рассматри- рассматриваемых частных производных в точке (ж1, ж2) при h —> 0, иэ D) полу- получаем нужное равенство
534 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Заметим, что без каких-либо дополнительных предположений, во- вообще говоря, нельзя утверждать, что справедливо равенство dl:)f(x) = = djif(x), если обе указанные частные производные определены в точ- точке х (см. задачу 2 в конце параграфа). Договоримся в дальнейшем через C^k\G;R) или C^(G) обозначать множество функций /: G —> Ш, все частные производные которых до порядка к включительно определены и непрерывны в области G СШт. В качестве следствия теоремы 3 получаем Утверждение 1. Если f E C^(G;R), то значение dtl...tkf(x) частной производной не зависит от порядка i\,--.,ik дифференци- дифференцирования, т. е. остается тем же при любой перестановке индексов i1,...,ik. ■4 В случае к = 2 это утверждение содержится в теореме 3. Предположим, что утверждение справедливо до порядка п включи- включительно. Покажем, что тогда оно справедливо и для порядка п + 1. Но dlll2...in+J{x) = дг1(дг2..Лп+1/)(х). Индексы г2, ..., in+i по предпо- предположению индукции можно переставлять, не меняя функции di2...ln+1f(x), а следовательно, и функции дг1,_Лп+1/(х). Поэтому достаточно прове- проверить, что можно переставлять также, например, индексы й и г'г, не меняя значения производной dlll2...ln+1f(x). Поскольку dni2...in+j(x) = dtlt2(dt3...tn+1f)(x), то возможность этой перестановки непосредственно вытекает из тео- теоремы 3. В силу принципа индукции утверждение 1 доказано. ► Пример 1. Пусть f(x) = /(ж1,х2) — функция класса C^k\G; К). Пусть h = (Л1, /г2) таково, что отрезок [х, х + h] содержится в обла- области G. Покажем, что функция ip(t)=f(x + th), определенная на отрезке [0,1], принадлежит классу С^[0,1], и найдем ее производную по t порядка к. Имеем xx + th\x2 + th2)hx + d2f(x1 + th\ x2 + th2)h2,
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 535 >"{t) = dnf(x + th^h1 + d2if(x + th)h2hl + + d12f(x + th)h}h2 + d22f(x + i/i)/i2/i2 = = dnf(x + th){h1J + 2d12f(x + th)hlh2 + d22f(x + th)(h2J. Эти соотношения можно записать в форме действия на функцию опе- оператора {hld\ ip'(t) = {^дг + h2d2)f(x + th) = hldtf(x + th), ip"{t) = {h}dx + h2d2Jf(x + th) = hllhl2dlll2f(x + th). По индукции получаем ¥>(*)(*) = {hldx + h2d2)kf(x + th) = №... hl»dn...lkf(x + th) (имеется в виду суммирование по всевозможным наборам ii,..., ik из к индексов, каждый из которых принимает значения 1 или 2). Пример 2. Если/ (х) = f(x\... ,xm) nfeC^(G; Ж), то, в пред- предположении, что [x,x + h] С G, для функции ip(t) = f(x + th), определен- определенной на отрезке [0,1], получаем = Л"... h^dtl...lkf(x + th), E) где справа имеется в виду суммирование по всевозможным наборам ин- индексов ii,..., ik, каждый из которых может принимать любое значение от 1 до т включительно. Формулу E) можно записать также в виде + ... + hmdm)kf(x + th). F) 4. Формула Тейлора Теорема 4. Если функция /: U(x) —)■ Ш определена и принадле- принадлежит классу C(n\U(x);R) в окрестности U(x) С Шт точки х € Шт, а отрезок [х,х + h] полностью содержится в U(x), то имеет место равенство
536 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ J \X ~r rt , . . . j Ж -f~ П J J yX ? ... j X j V^l 1 m к k-1 ' где i rn^(x; h) = Л1"^" (/t1^ + ... + hmdm)nf(x + th) dt. J (n-1)! о G) (8) Равенство G) совместно с соотношением (8) называется формулой Тейлора с интегральной формой остаточного члена. < Формула Тейлора G) немедленно следует из соответствующей формулы Тейлора для функции одной переменной. В самом деле, рас- рассмотрим вспомогательную функцию которая в силу условий теоремы 4 определена на отрезке 0 ^ t ^ 1 и (как мы проверили выше) принадлежит классу С^п'[0,1]. Тогда при т € [0,1] в силу формулы Тейлора для функций одной переменной можно записать, что ¥>(т) = <р@) + ztt<p'{0)t + ... + ГгТУ(п) (О)т"-1 + 1! (п — 1 ! Полагая здесь т = 1, получаем о Подставляя в полученное равенство, в соответствии с формулой F), значения = (h1 Эх +... + hmdm)kf(x) (k = 0,...,n-l), = (h'd! + ... + hmdm)nf(x + th), получаем то, что и утверждает теорема 4. ►
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 537 Замечание. Если вместо интегральной формы остаточного члена в соотношении (9) написать остаточный член в форме Лагранжа, то из равенства где 0 < 9 < 1, получается формула Тейлора G) с остаточным членом rn_i(a;; h) = ^(h1^ +... + hmdm)nf(x + Oh). A0) Эту форму остаточного члена, так же как и в случае функций одной переменной, называют формой Лагранжа остаточного члена формулы Тейлора. Коль скоро / € С(п\и(х);Щ, то из A0) следует, что rn-1(x;h) = -(h1d1 + ... + hmdm)nf(x) + o{\\h\\n) при Л-Ю, ДА. поэтому имеет место равенство fix1 +h\...,xm + hm)- f{xl, ...,хт) = ) при Л-Ю, (И) fc=i называемое формулой Тейлора с остаточным членом в форме Пеано. 5. Экстремумы функций многих переменных. Одним из важ- важнейших применений дифференциального исчисления является его ис- использование для отыскания и исследования экстремумов функций. Определение 1. Говорят, что функция f:E->R, определенная на множестве Е с Кто, имеет локальный максимум фокальный мини- минимум) во внутренней точке хо множества Е, если существует окрест- окрестность U(x()) С Е точки хо такая, что f(x) ^ /(^о) (соответственно, f(x) ^ f(x0)) при х е U(x0). Если при х G U(xq)\xq имеет место строгое неравенство f(x) <f(xo) (или, соответственно, f(x) > f(xo)), то говорят, что функция имеет в точке хо строгий локальный максимум (строгий локальный минимум).
538 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Определение 2. Локальные минимумы и локальные максимумы функции называют ее локальными экстремумами. Теорема 5. Пусть функция /: U(xo) —> К, определенная в окрест- окрестности U(xq) С Шт точки хо = (х^,... ,х™), имеет в точке х$ частные производные по каждой из переменных х1,... ,хт. Тогда для того, чтобы функция имела в хо локальный экстремум, необходимо, чтобы в этой точке были выполнены равенства < Рассмотрим функцию (fix1) = fix1, x%,... ,х™) одной переменной, определенную, в силу условий теоремы, в некоторой окрестности точ- точки х\ вещественной оси. В точке х\ функция ^(х1) имеет локальный экстремум, и поскольку Ох Аналогично доказываются и остальные равенства системы A2). ► Обратим внимание на то, что равенства A2) дают лишь необхо- необходимые, но не достаточные условия экстремума функции многих пере- переменных. Примером, подтверждающим это, может стать любой пример, построенный по этому же поводу для функции одной переменной. Так, если раньше мы говорили о функции х н-> х3, имеющей в нуле нуле- нулевую производную, но не имеющей там экстремума, то теперь можно рассмотреть функцию все частные производные которой в точке хо = @,..., 0) равны нулю, но экстремума в этой точке функция, очевидно, не имеет. Теорема 5 показывает, что если функция /: G —> Ш определена на открытом множестве G С Кто, то ее локальные экстремумы находятся либо среди точек, в которых / не дифференцируема, либо в тех точках, в которых дифференциал df(xo) или, что то же самое, касательное отображение f'(xo) обращается в нуль. Нам известно, что если отображение /: U(xo) -» Кп, определенное в окрестности U(xq) с К171 точки хо 6 Кто, дифференцируемо в xq, to
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 539 матрица касательного отображения /'(xq) : Шт —> Шп имеет вид ... dmf1(x0)\ A3) Ц ...dmfn(x0)J Определение 3. Точка хо называется критической точкой ото- отображения /: U(xq) —> W1, если ранг матрицы Якоби A3) отображения в этой точке меньше, чем min{m,n}, т.е. меньше, чем максимально возможный. В частности, при п = 1 точка хо критическая, если выполнены усло- условия A2), т.е. все частные производные функции /: U(xq) -» М обраща- обращаются в нуль. Критические точки вещественнозначных функций называют также стационарными точками таких функций. После того как в результате решения системы уравнений A2) най- найдены критические точки функции, их дальнейший анализ в отноше- отношении того, являются они точками экстремума или нет, часто удается провести, используя формулу Тейлора и доставляемые ею следующие достаточные условия наличия или отсутствия экстремума. Теорема 6. Пусть /: U(xo) -» К — функция класса C^2\U(xq)\ Ж), определенная в окрестности U(xo) С Кто точки xq = (xq,. .. ,х™) € € 1RTO, и пусть xq —критическая точка этой функции /. Если в тейлоровском разложении функции в точке х$ квадратичная форма J = г) f(rn\hlh3 (ЛК\ а) знакоопределена, то в точке xq функция имеет локальный экс- экстремум, который является строгим локальным минимумом, если ква- квадратичная форма A5) положительно определена, и строгим локаль- локальным максимумом, если она отрицательно определена;
540 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Ь) может принимать значения разных знаков, то в точке хо функ- функция экстремума не имеет. -4 Пусть h ф 0 и хо + h G U(xo). Представим соотношение A4) в виде f(x0 + h) - f(x0) = 1,3=1 \ш\ +0[ > A6) где оA) есть величина, бесконечно малая при h —> 0. Из A6) видно, что знак разности f(xo + К) — f(xo) полностью опре- определяется знаком величины, стоящей в квадратных скобках. Этой вели- величиной мы теперь и займемся. Вектор е = (/г^Ц/гЦ,... ,hm/\\h\\), очевидно, имеет единичную нор- норму. Квадратичная форма A5) непрерывна как функция h в W1, поэтому ее ограничение на единичную сферу 5@; 1) = {х е Шт | ||ж|| = 1} так- также непрерывно на 5@; 1). Но сфера 5 есть замкнутое ограниченное подмножество в Шт, т.е. компакт. Следовательно, форма A5) имеет на 5 как точку минимума, так и точку максимума, в которых она при- принимает соответственно значения т и М. Если форма A5) положительно определена, то 0 < га ^ М и потому найдется число S > 0 такое, что при \\h\\ < S будет |оA)| < т. Тогда при \\h\\ < S квадратная скобка в правой части равенства A6) окажется положительной и, следовательно, f(xo + h) — f(xo) > 0 при 0 < \\h\\ < S. Таким образом, в этом случае точка xq оказывается точкой строгого локального минимума рассматриваемой функции. Аналогично проверяется, что в случае отрицательной определенно- определенности формы A5) функция имеет в xq строгий локальный максимум. Тем самым пункт а) теоремы 6 исчерпан. Докажем утверждение Ь). Пусть ет и ем — те точки единичной сферы, в которых форма A5) принимает соответственно значения ш, М, и пусть т < 0 < М. Полагая h = tem, где t — достаточно малое положительное число (настолько малое, что xq + tem G U(xo)), из A6) находим f(x0 + tem) - f{x0) = -^2{т + o(l)), где оA) —> 0 при t -» 0. Начиная с некоторого момента (т.е. при всех достаточно малых значениях t), величина ш + оA) в правой части этого
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 541 равенства будет иметь знак т, т. е. будет отрицательна. Следовательно, отрицательной будет и левая часть. Аналогично, полагая h = гем, получим f(x0 + teM) ~ !Ы = ^t2(M + оA)), и, следовательно, при всех достаточно малых t разность /(xq + Ьем) — — f(xo) положительна. Таким образом, если квадратичная форма A5) на единичной сфе- сфере или, что, очевидно, равносильно, в Шт принимает значения разных знаков, то в любой окрестности точки xq найдутся как точки, в ко- которых значение функции больше f(xo), так и точки, в которых оно меньше f(xo)- Следовательно, в этом случае хо не является точкой ло- локального экстремума рассматриваемой функции. ► Сделаем теперь несколько замечаний в связи с доказанной теоремой. Замечание 1. Теорема 6 ничего не говорит о случае, когда фор- форма A5) полуопределена, т. е. неположительна или неотрицательна. Ока- Оказывается, в этом случае точка хо может быть точкой экстремума, а может и не быть таковой. Это видно, в частности, из следующего при- примера. Пример 3. Найдем экстремумы определенной в К.2 функции В соответствии с необходимыми условиями A2) напишем систему уравнений из которой находим три критические точки: (—1,0), @,0), A,0). Поскольку d2f )s0 м то квадратичная форма A5) в указанных трех критических точках имеет соответственно вид
542 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ т. е. во всех случаях она полуопределена (положительно или отрицатель- отрицательно). Теорема 6 тут не применима, но поскольку f(x, у) = {х2 — 1J+у4-1, то очевидно, что в точках (—1,0), A,0) функция f(x,y) имеет строгий минимум —1 (и даже нелокальный), а в точке @,0) у нее нет экстре- экстремума, поскольку при х = 0 и у ф 0 /@, у) = у4 > 0, а при у — О и достаточно малых х Ф 0 f(x, 0) = хА — 2х2 < 0. Замечание 2. После того как квадратичная форма A5) получе- получена, исследование ее определенности может быть проведено с помощью известного из курса алгебры критерия Сильвестра1). Напомним, что та в силу критерия Сильвестра квадратичная форма ^ о-г^х3 с симме- симметрической матрицей lJ=1 положительно определена тогда и только тогда, когда положительны все главные миноры этой матрицы; форма отрицательно определена тогда и только тогда, когда ац < 0 и при переходе от любого главного минора матрицы к главному минору следующего порядка знак значения минора меняется. Пример 4. Найдем экстремумы функции f(x, у) = xyln (х2 + у2), определенной в плоскости М2 всюду, кроме начала координат. Решая систему дf 2xv2 -Чя, У) - X In (X2 + у2) + -2-^- ду v ' xz + y находим все критические точки функции ; (±1,0); ' ■ 1 ■ г 2'Дж.Дж. Сильвестр A814-1897)—английский математик; наиболее известные его работы относятся к алгебре.
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 543 Поскольку функция нечетна относительно каждого из двух своих аргументов в отдельности, то точки @, ±1) и (±1,0), очевидно, не явля- являются точками экстремума нашей функции. Видно также, что данная функция не меняет своего значения при одновременном изменении знака обеих переменных х и у. Таким обра- образом, если мы исследуем только одну из оставшихся критических точек, например точку (-к=, -у=), то мы сможем сделать заключение и о ха- характере остальных. Поскольку d2f t . _ бху 4х3у ' У) 9 i 9 / 9 i 9"\9 ' у2)+2- -£-%-(х,у)=\п {х + у)+2 2 2,2, дхду v ' (xz + yz)z d2f, 6xy {xy) = то в точке (-у—, -Х- 1 квадратичная форма dl.)f(xo)hlh:) имеет матрицу 2 0 \ 0 2 )> т. е. она положительно определена, и, следовательно, в этой точке функ- функция имеет локальный минимум = 2e' В силу сделанных выше наблюдений относительно особенностей рас- рассматриваемой функции можно сразу же заключить, что у/Те у/Те) 2е — также локальный минимум, а f(J =/(_1 = >/2i' VTe) J\ у/Те у/Те) 2е —локальные максимумы функции. Впрочем, это можно проверить и непосредственно, убедившись в определенности соответствующей ква-
544 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ дратичной формы. Например, в точке ( — -^==,-у=) матрица квадра- квадратичной формы A5) имеет вид -2 О О -2 откуда видно, что форма отрицательно определена. Замечание 3. Следует обратить внимание на то, что мы указали необходимые (теорема 5) и достаточные (теорема 6) условия экстре- экстремума функции лишь во внутренней точке области определения. Таким образом, при отыскании абсолютного максимума или минимума функ- функции необходимо наряду с внутренними критическими точками функ- функции исследовать также точки границы области определения, поскольку максимальное или минимальное значение функция может принять в од- одной из таких граничных точек. Подробнее общие принципы исследования невнутренних экстрему- экстремумов будут разбираться позже (см. раздел, посвященный условному экс- экстремуму) . Полезно иметь в виду, что при отыскании минимумов и мак- максимумов часто наряду с формальной техникой, а иногда и вместо нее, можно использовать некоторые простые соображения, связанные с при- природой задачи. Например, если рассматриваемая в 1RTO дифференциру- дифференцируемая функция по смыслу задачи должна иметь минимум и вместе с тем она не ограничена сверху, то, при условии, что функция имеет единственную критическую точку, можно без дальнейшего исследова- исследования утверждать, что в этой точке она и принимает свое минимальное значение. Пример 5. Задача Гюйгенса. На основе законов сохранения энер- энергии и импульса замкнутой механической системы несложным расчетом можно показать, что при соударении двух абсолютно упругих шаров, имеющих массы mi и т2 и начальные скорости v\ и v2, их скорости по- после центрального удара (когда скорости направлены по линии центров) определяются соотношениями _ (mi — mi + т2 (т2 - mi)v2 + v2 = ■ mi + m2
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 545 В частности, если шар массы М, движущийся со скоростью V, уда- ударяется о неподвижный шар массы т, то приобретаемая последним ско- скорость v может быть найдена по формуле т + М из которой видно, что если 0 ^ т ^ М, то V ^ v ^ 2F. Каким же образом телу малой массы можно передать значитель- значительную часть кинетической энергии большой массы? Для этого, например, между шарами малой и большой масс можно вставить шары с проме- промежуточными массами т < т\ < m-i < ... < тп < М. Вычислим (вслед за Гюйгенсом), как надо выбрать массы т\,т2,...,тп, чтобы в ре- результате последовательных центральных соударений тело т приобрело наибольшую скорость. В соответствии с формулой A7) получаем следующее выражение для искомой скорости как функции от переменных т\, тч-,..., тп: ^!*» ^^A8) v... т + mi mi + mi mn_i + mn mn + M Таким образом, задача Гюйгенса сводится к отысканию максимума функции mi mn M /(mi,... ,mn) = • ... • • . m + mi mn_i + mn mn + M Система уравнений A2), представляющих необходимые условия вну- внутреннего экстремума, в данном случае сводится к системе т ■ ГП2 — т\ = О, mi • тз — т| = О, mn_i • М - ml = О, из которой следует, что числа m, mi,..., mn, M образуют геометриче- геометрическую прогрессию со знаменателем q, равным п+у/М/т. Получаемое при таком наборе масс значение скорости A8) опреде- определяется равенством /о -Ш которое при п = 0 совпадает с равенством A7).
546 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Из физических соображений ясно, что формула A9) указывает мак- максимальное значение функции A8), однако это можно проверить и фор- формально (не привлекая громоздких вторых производных; см. задачу 9 в конце параграфа). Заметим, что из формулы A9) видно, что если т —> 0, то v -> —> 2n+lV. Таким образом, промежуточные массы действительно за- заметно увеличивают передаваемую малой массе т часть кинетической энергии массы М. 6. Некоторые геометрические образы, связанные с функ- функциями многих переменных а. График функции и криволинейные координаты. Пусть х, у, z—декартовы координаты точки пространства R3, и пусть z = = /(ж, у) —непрерывная функция, определенная в некоторой области G плоскости М2 переменных (х,у). В силу общего определения графика функции, график функции /: G -> К в нашем случае есть множество S = {(ж, у, z) € М3 | (ж, у) € G, z = f(x,y)} в пространстве М3. Очевидно, что отображение G —> S, определяемое соотношением (х,у) н» (x,y,f(x,y)), есть непрерывное взаимно однозначное отобра- отображение G на S, в силу которого любую точку множества S можно задать, указывая соответствующую ей точку области G или, что то же самое, задавая координаты (ж, у) этой точки G. Таким образом, пары чисел (ж, у) € G можно рассматривать как некоторые координаты точек множества S — графика функции z — = f(x, у). Поскольку точки S задаются парами чисел, то S будем услов- условно называть двумерной поверхностью в М3 (общее определение поверх- поверхности будет дано позже). Если задать путь Г: / —> G в G, то автоматически возникает путь F о Г : / —> S на поверхности S. Если х — x(t), у = y(t) —параметри- —параметрическое задание пути Г, то путь F о Г на S задается тремя функция- функциями: х = x(t), у = y(t), z = f{x{t),y(t)). В частности, если положить х = хо + t, у = уо, то мы получим кривую х = хо + t, у = уо, z = = /(^о + t,yo) на поверхности S, вдоль которой координата у = уо то- точек S не меняется. Аналогично можно указать кривую х — х$, у = yo+t, z = /(жо, уо +1) на S, вдоль которой не меняется первая координата жо точек S. Эти линии на S по аналогии с плоским случаем естественно
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 547 называть координатными линиями на поверхности S. Однако, в отли- отличие от координатных линий в G С К2, являющихся кусками прямых, координатные линии на S, вообще говоря, являются кривыми в М3. По этой причине введенные координаты (х, у) точек поверхности S часто называют криволинейными координатами на S. Итак, график непрерывной функции z = f(x,y), определенной в области G С R2, есть двумерная поверхность S в Ш?, точки которой можно задавать криволинейными координатами (ж, у) G G. Мы пока не останавливаемся на общем определении поверхности, поскольку сейчас нас интересует только частный случай поверхности— график функции, однако мы предполагаем, что из курса аналитической геометрии читателю хорошо знакомы некоторые важные конкретные поверхности в М3 (плоскость, эллипсоид, параболоиды, гиперболоиды). Ь. Касательная плоскость к графику функции. Если функция z = f(x, у) дифференцируема в точке (хо, уо) G G, то это означает, что f(x, у) = Джо, Уо) + А(х - ж0) + В (у - уо) + + о [у(х - х0J + (у - yoJJ при (х,у) -> (жо,уо), B0) где А и В — некоторые постоянные. Рассмотрим в М3 плоскость yo), B1) где Zq = f(xo,yo). Сравнивая равенства B0) и B1), видим, что график нашей функции в окрестности точки {хо,Уо,%о) хорошо аппроксими- аппроксимируется плоскостью B1). Точнее, точка (х,у, f(x,y)) графика функции уклоняется от точки (х, у, z(x, у)) плоскости B1) на величину, бесконеч- бесконечно малую в сравнении с величиной у/(х — ХцJ + (у — уоJ смещения ее криволинейных координат (х, у) от координат (хо, Уо) точки (жо, уо, zq). В силу единственности дифференциала функции, плоскость B1), обладающая указанным свойством, единственна и имеет вид г = /(жо,Уо) + -£-(хо,Уо)(х - х0) + -х-(хо,уо)(у - Уо)- B2) ох оу Она называется касательной плоскостью к графику функции z = f(x, у) вточке (жо,Уо,
548 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ с. Рис. 53. Итак, дифференцируемость функции z = f(x,y) в точке (хо,уо) и наличие у графика этой функции касательной плоскости в точке суть равносильные условия. с. Нормальный вектор. Записывая уравнение B2) касательной плоскости в каноническом виде О р х - х0) + -^-{ -Уо) - (z-f(xQ,yo)) =0, заключаем, что вектор B3) является нормальным вектором касательной плоскости. Его напра- направление считается направлением, нормальным или ортогональным к по- поверхности S (графику функции) в точке (жо>2/о>/(ж(Ь2/о))- В частности, если (xq, уо) —критическая точка функции /(ж, у), то в точке (хо, 2/0) /(#0) Уо)) графика нормальный вектор имеет вид @,0, —1) и, следовательно, касательная плоскость к графику функции в такой точке горизонтальна (параллельна плоскости (х,у)). Следующие три рисунка иллюстрируют сказанное. На рис. 53, а, с изображено расположение графика функции по отно- отношению к касательной плоскости в окрестности точки локального экс- экстремума (соответственно, минимума и максимума), а на рис. 53, b — в окрестности так называемой седловои критической точки. d. Касательная плоскость и касательный вектор. Мы знаем, что если путь Г: / —>■ К3 в!3 задается дифференцируемыми функци- функциями х = x(t), у = y(t), z = z(t), то вектор (i@),y@),i@)) есть вектор
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 549 скорости в момент t = 0. Это направляющий вектор касательной в точ- точке Xq = х@), уо — у@), Zq = z@) к кривой в М3, являющейся носителем пути Г. Рассмотрим теперь путь Г: / -> S на графике функции z = f(x,y), задаваемый в виде х = x(t), у = y(t), z = f(x(t),y(t)). В этом конкрет- конкретном случае находим, что откуда видно, что найденный вектор ортогонален вектору B3), нормальному к графику S функции в точке (хо,уо, /(хо,Уо))- Таким образом, мы показали, что если вектор (£, г), Q касателен в точке (#0) Уо, /(^O) Уо)) к некоторой кривой на поверхности S, то он ортогона- ортогонален вектору B3) и (в этом смысле) лежит в плоскости B2), касательной к поверхности S в указанной точке. Точнее можно было бы сказать, что вся прямая х = xo+£t, у = yo+T)t, z = f(xo, yo)+(t лежит в касательной плоскости B2). Покажем теперь, что верно и обратное утверждение, т. е. если пря- прямая х = хо + ££, у = Уо + f]t-, z = f{xo,yo) + С^ или) чт0 т0 же самое, вектор (£, г], () лежит в плоскости B2), касательной к графику S функ- функции z = f(x, у) в точке (хо, уо, 1(%о,Уо)), то на S есть путь, для которого вектор (£,г),() является вектором скорости в точке (хо,Уо, f(%o,yo))- В качестве такового можно взять, например, путь х = х0 + &, y = yo + r)t, z = f{x0 + &, уо + rjt). В самом деле, для него (xy)ri Ввиду того, что 7f-{xo,yo)x{O) + -J-{ ox ay и по условию также й f й f (ж У)С + ^ ^ - С = 0, заключаем, что
550 ГЛ VIII ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Итак, касательная плоскость к поверхности S в точке (жо>2/о>2о) образована векторами, касательными в точке (жо, уо, -^о) к кривым, про- проходящим на поверхности S через указанную точку (рис. 54). Это уже более геометричное описание касательной плоскости. Во всяком случае, из него видно, что если инвариантно (относительно вы- выбора системы координат) определена касательная к кривой, то каса- касательная плоскость также определена инвариантно. Для наглядности мы рассматривали функции двух переменных, однако все сказанное, очевид- очевидно, переносится и на общий случай функции г? Рис. 54. = Пх\...,хт) B4) т переменных, где т G N. Плоскость, касательная к графику такой функции в точке (жд,..., ж™, /(жд,..., ж™)), запи- запишется в виде B5) вектор есть нормальный вектор плоскости B5). Сама эта плоскость, как и график функции B4), имеет размерность т, т. е. любая точка задается теперь набором (ж1,... ,жт) из т координат. Таким образом, уравнение B5) задает гиперплоскость в Mm+1. Дословно повторяя проведенные выше рассуждения, можно прове- проверить, что касательная плоскость B5) состоит из векторов, касательных в точке (жд,..., Жд1, /(ж0,..., ж™)) к кривым, проходящим через эту точ- точку и лежащим на m-мерной поверхности S — графике функции B4). Задачи и упражнения 1. Пусть z = f(x,y)—функция класса C^(G;R). a) Если -тЛ(х,у) = 0 в G, то можно ли утверждать, что функция / не зависит от у в области G1 b) При каком условии на область G ответ на предыдущий вопрос положи- положителен?
§4. ОСНОВНЫЕ ТЕОРЕМЫ 551 2. а) Проверьте, что для функции {2 _ 2 хух*~У1, если х2 + у2 ф О, х +у О, если х1 + у2 = О, имеют место следующие соотношения: b) Докажите, что если функция f(x,y) имеет частные производные -J- и J- в некоторой окрестности U точки (хо,уо) и если смешанная производная ■j-i- (или д I ) существует в U и непрерывна в (хо,уо), то смешанная произ- производная я / (соответственно, я / ) также существует в этой точке и имеет оуох охоу место равенство дхду дудх 3. Пусть хх,...,хт—декартовы координаты в ffim. Дифференциальный оператор т гJ л Д = ^ дхг действующий на функции / € С^ (G; Ж) по правилу ,2 называется оператором Лапласа. Уравнение Д/ = 0 относительно функции / в области G С ffim назы- называется уравнением Лапласа, а его решения — гармоническими функциями в области G. а) Покажите, что если х = (ж1,... ,хт) и а; = 8=1 то при т > 2 функция 2-т /(ar) = INI ~ является гармонической в области Ет \ 0, где 0 = @,..., 0).
552 ГЛ. VIII ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Ь) Проверьте, что функция определенная при t > 0 и х = (ж1,... ,хт) € Жт, удовлетворяет уравнению теплопроводности т.е. что Щг = a2 Y1 —т в любой точке области определения функции. 4. Формула Тейлора в мультииндексных обозначениях. Символ а := (ац,..., ат), состоящий из неотрицательных целых чисел а,, г = 1,... ,т, называется мулътииндексом а. Условились в следующих обозначениях: \а\ := \ati\ + ... + \ат\, а! := а±\.. .ат\; наконец, если a— (ai,..., ат), то а° :=а?1...а°т. a) Проверьте, что если k € N, то \-^ ^ |а|=* ' ' ' ' т' ИЛИ , . fc _ ^-л к! а \а\=ка- где суммирование ведется по всем наборам а = («i,..., am) неотрицательных т целых чисел, таким, что J] |<*г| = А. г=1 b) Пусть Покажите, что если / € С^(G;Ж), то в любой точке х £ G имеет место равенство im=k \a\=k
§ 4. ОСНОВНЫЕ ТЕОРЕМЫ 553 c) Проверьте, что в мультииндексных обозначениях формулу Тейлора, на- например, с остаточным членом в форме Лагранжа можно записать в виде f(x + h)= ]Г ±Daf(x)ha+ J2 ^Daf(x + eh)ha. a\=0 ' \a\=n d) Запишите в мультииндексных обозначениях формулу Тейлора с инте- интегральным остаточным членом (теорема 4). 5. а) Пусть 1т = {х = (х\...,хт) € Шт | И ^ с\ i = l,...,m} — m-мерный промежуток, а I — отрезок [а,Ь] С К. Покажите, что если функция f(x,y) = f{x1,...,xm,y) определена и непрерывна на множестве J™ х I, то для любого положительного числа е > 0 найдется число S > 0 такое, что если ге 1т, 2/1,2/2 € 1и |yi — 2/21 <6, то |/(z,2/i) - f(x,2/2)! < е. b) Покажите, что функция ь F(x)= Jf(x,y)dy а определена и непрерывна на промежутке 1т. c) Покажите, что если / € СAт;Ж), то функция определена и непрерывна на 1т х I1, где I1 = {t € Ж | \t\ ^ 1}. d) Докажите следующую лемму Адамара. Если / € C^(Im;R) и /@) = 0, то существуют функции gi,...,g eC(Jm;ffi) такие, что г-1 в 1т, причем 5,@) = ^@), i = l,...,т. 6. Докажите следующее обобщение теоремы Ролля для функций многих переменных. Если функция / непрерывна в замкнутом шаре 5@;г), равна нулю на его границе и дифференцируема во внутренних точках шара 5@;г), то по крайней мере одна из внутренних точек этого шара является критической точкой функции. 7. Проверьте, что функция = (y-x2)(y-3x2) не имеет экстремума в начале координат, хотя ее ограничение на любую пря- прямую, проходящую через начало координат, имеет строгий локальный минимум в этой точке.
554 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 8. Метод наименьших квадратов. Это один из наиболее распространенных методов обработки результатов наблюдений. Он состоит в следующем. Пусть известно, что физические вели- величины х и у связаны линейным соотношением у = ах + Ь, B6) или пусть на основе экспериментальных данных строится эмпирическая фор- формула указанного вида. Допустим, было сделано п наблюдений, в каждом из которых одновремен- одновременно измерялись значения х и у, и в результате были получены пары значе- значений х\, у\;...; хп,уп. Поскольку измерения имеют погрешности, то, даже если между величинами х и у имеется точная связь B6), равенства ук =ахк+Ь могут не выполняться для некоторых значений к € {1,... ,п}, каковы бы ни были коэффициенты а и Ь. Задача состоит в том, чтобы по указанным результатам наблюдений опре- определить разумным образом неизвестные коэффициенты а и Ь. Гаусс, исходя из анализа распределения вероятности величины ошибки на- наблюдения, установил, что наиболее вероятные значения коэффициентов а и Ь при данной совокупности результатов наблюдений следует искать, исходя из следующего принципа наименьших квадратов: если 8k = (ахк + b) — yk —невязка А;-го наблюдения, то а и Ь надо выбирать так, чтобы величина к=1 т. е. сумма квадратов невязок, была минимальной. а) Покажите, что принцип наименьших квадратов в случае соотноше- соотношения B6) приводит к системе линейных уравнений {]b =[хк,Ук], [1,хк]а+ [1,1]Ъ= [1I№] для определения коэффициентов а и Ь; здесь, следуя Гауссу, положено [эд, эд] := -xxXx + ...+ХпХп; [хк,1] :=Xi-l + ... + xn-l; [хк,Ук] '■= х1у1 + .. .+хпуп и т. д. Ь) Напишите систему уравнений для чисел ai,...,am,b, к которой приво- приводит принцип наименьших квадратов в том случае, когда вместо равенства B6) имеется соотношение т У = ^2 ulX% + Ь t=l (или, короче, у = агхг + Ь) между величинами х1,... ,хт,у.
§4. ОСНОВНЫЕ ТЕОРЕМЫ 555 с) Как, используя метод наименьших квадратов, искать эмпирические формулы вида у = сх .хг связывающие физические величины х\,..., хт с величиной у? d) (M. Джермен.) У нескольких десятков особей кольчатого червя Neries di versicolor была измерена частота R сокращений сердца при различных тем- температурах Т. Частота выражалась в процентах относительно частоты сокра- сокращений при 15 °С. Полученные данные приведены в следующей таблице: Температура, 0 5 10 15 °С Частота, % 39 54 74 100 Температура, 20 25 30 °С Частота, % 136 182 254 Зависимость R от Т похожа на экспоненциальную. Считая R = Аеьт, най- найдите значения констант А и Ь, которые бы наилучшим образом соответство- соответствовали результатам эксперимента. 9. а) Покажите, что в рассмотренной в примере 5 задаче Гюйгенса функ- функция A8) стремится к нулю, если хотя бы одна из переменных гп\,..., тпп стре- стремится к бесконечности. b) Покажите, что функция A8) имеет в Ж" точку максимума и потому единственная критическая точка этой функции в Ж" должна быть ее точкой максимума. c) Покажите, что величина v, определяемая формулой A9), монотонно воз- возрастает с ростом п, и найдите ее предел при п —> сю. 10. а) Во время так называемого круглого наружного шлифования инстру- инструмент — быстро вращающийся шлифовальный круг (с шероховатой перифе- периферией) , играющий роль напильника, — приводится в соприкосновение с мед- медленно (в сравнении с ним) поворачи- поворачивающейся поверхностью круглой де- детали (рис.55). Круг К постепенно подается на деталь Див результате происходит j^ съем заданного слоя Н металла, до- доведение детали до нужного размера и образование гладкой рабочей по- поверхности изделия. Эта поверхность в будущем механизме обычно явля- является трущейся, и, чтобы увеличить срок ее службы, металл детали про- Рис. 55. ходит предварительную закалку, повышающую твердость стали. Однако из-
556 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ за высокой температуры в зоне контакта шлифовального круга с деталью могут произойти (и часто происходят) структурные изменения в некотором слое Д металла и падение в этом слое твердости стали. Величина Д монотон- монотонно зависит от скорости s подачи круга на деталь, т. е. Д = (p{s). Известно, что существует некоторая критическая скорость sq > 0, при которой еще Д = = 0, а при s > So уже Д > 0. Для дальнейшего удобно ввести в рассмотрение обратную к указанной зависимость определенную при Д > 0. Здесь ф — известная из эксперимента монотонно возрастающая функция, определенная при Д ^ 0, причем ^>@) = sq > 0. Режим шлифования должен быть таким, чтобы на окончательно получае- получаемой поверхности изделия не было структурных изменений металла. Оптимальным по быстродействию при указанных условиях, очевидно, бу- будет такой режим изменения скорости s подачи шлифовального круга, когда в = фF), где S = S(t) —величина еще не снятого к моменту t слоя металла или, что то же самое, расстояние от периферии круга в момент t до окончательной поверхности будущего изделия. Объясните это. b) Найдите время, необходимое для снятия слоя Н в оптимальном режиме изменения скорости s подачи круга. c) Найдите зависимость s = s(t) скорости подачи круга от времени в оптимальном режиме при условии, что функция Д i—> s линейна: s = so + АД. В силу конструктивных особенностей некоторых видов шлифовальных станков изменение скорости s может происходить только дискретно. Тут и возникает задача оптимизации производительности процесса при дополни- дополнительном условии, что допускается только фиксированное число п переключе- переключений скорости s. Ответы на следующие вопросы дают представление о харак- характере оптимального режима. d) Какова геометрическая интерпретация найденного вами в Ь) времени ff t(H) = f -щу шлифования в оптимальном непрерывном режиме изменения скорости s? e) Какова геометрическая интерпретация потери во времени при перехо- переходе от оптимального непрерывного режима изменения s к оптимальному по быстродействию ступенчатому режиму изменения s? f) Покажите, что точки 0 = sn+i < хп < ... < х\ < х0 = Н проме- промежутка [0, Н], в которых следует производить переключение скорости, должны
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 557 удовлетворять условиям и, следовательно, на участке от х\ до скорость подачи круга имеет вид g) Покажите, что в линейном случае, когда ^>(Д) = So + АД, точки ж, (из задачи f)) на промежутке [О, Н] располагаются так, что числа «о so So So J<J+Xn<...<J+Xl<J + H образуют геометрическую прогрессию. 11. а) Проверьте, что касательная к кривой Г: I —> Жт определена инва- инвариантно относительно выбора системы координат в Шт. b) Проверьте, что касательная плоскость к графику S функции у = = f(xl,...,xm) определена инвариантно относительно выбора системы ко- координат в Жт. c) Пусть множество S С Жт x Ж1 является графиком функции у = = /(ж1,... ,хт) в координатах (х1,... ,хт,у) в Жт х Ж1 и графиком функ- функции у = /(ж1,... ,жт) в координатах (ж1,... ,хт,у) в Жт х Ж1. Проверьте, что касательная к S плоскость инвариантна относительно линейного преобразо- преобразования координат в Жт х Ж1. т 2 d) Проверьте, что оператор Лапласа Д/ = ]Г^ -^-4(ж) определен инвари- г=\ дхг антно относительно ортогональных преобразований координат в Жт. § 5. Теорема о неявной функции 1. Постановка вопроса и наводящие соображения. В этом параграфе будет доказана важная как сама по себе, так и благодаря ее многочисленным следствиям теорема о неявной функции. Поясним сначала, в чем состоит вопрос. у Пусть, например, мы имеем соотношение 1 х2 + у2 - 1 = О A) между координатами х, у точек плоскости К2. Совокупность точек плоскости М2, удо- удовлетворяющих этому соотношению, есть единичная окружность (рис. 56). Наличие связи A) показывает, что, фиксировав одну из координат, например х, мы не вправе брать вторую координату Рис. 56.
558 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ произвольно. Таким образом, соотношение A) предопределяет зависи- зависимость у от х. Нас интересует вопрос об условиях, при которых неявная связь A) может быть разрешена в виде явной функциональной зависи- зависимости у — у(х). Решая уравнение A) относительно у, найдем, что B) т.е. каждому значению х такому, что \х\ < 1, на самом деле отвеча- отвечают два допустимых значения у. При формировании функциональной зависимости у = у(х), удовлетворяющей соотношению A), нельзя без привлечения дополнительных требований отдать предпочтение какому- нибудь одному из значений B). Например, функция у(х), которая в ра- рациональных точках отрезка [—1,1] принимает значение +у/\ — х2, а в иррациональных — значение —у/\ — х2, очевидно, удовлетворяет соот- соотношению A). Ясно, что вариацией этого примера можно предъявить бесконеч- бесконечно много функциональных зависимостей, удовлетворяющих соотноше- соотношению A). Вопрос о том, является ли множество, задаваемое в М2 соотноше- соотношением A), графиком некоторой функциональной зависимости у = у(х), очевидно, решается отрицательно, ибо с геометрической точки зрения он равносилен вопросу о возможности взаимно однозначного прямого проектирования окружности на некоторую прямую. Но наблюдение (см. рис. 56) подсказывает, что все-таки в окрест- окрестности отдельной точки (хо,уо) дуга окружности взаимно однозначно проектируется на ось а; и ее единственным образом можно предста- представить в виде у = у(х), где х н-> у[х) —непрерывная функция, определен- определенная в окрестности точки жо и принимающая в xq значение уо- В этом отношении плохими являются только точки (—1,0), A,0), ибо никакая содержащая их внутри себя дуга окружности не проектируется взаим- взаимно однозначно на ось х. Зато окрестности этих точек на окружности хорошо расположены относительно оси у и могут быть представлены в виде графика функции х = х(у), непрерывной в окрестности точки О и принимающей в этой точке значение —1 или 1 в соответствии с тем, идет ли речь о дуге, содержащей точку (—1,0) или A,0). Как же аналитически узнавать, когда наше геометрическое место точек, определяемое соотношением типа A), в окрестности некоторой
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 559 точки (жо,Уо), принадлежащей ему, может быть представлено в виде явной зависимости у = у(х) или х = х(у)? Будем рассуждать следующим, уже привычным способом. У нас есть функция F(x,y) = х1 + у2 — 1. Локальное поведение функции в окрестности точки (жо>Уо) хорошо описывается ее дифференциалом (х ~ х0) + F^(x поскольку F(x, у) = F(xQ, уо) + F'x{xQ, уо)(х - х0) + F'y(xQ, уо)(у - у0) + о(|ж-а;о| + при (х, у) -> (жо,уо)- Если F(xo,yo) = 0 и нас интересует поведение линии уровня F(x,y)=0 нашей функции в окрестности точки (хо,уо), то о нем можно судить по расположению прямой (касательной) F^xQ,y0)(x - х0) + F^xQ,yQ){y - уо) = 0. C) Если эта прямая расположена так, что ее уравнение можно разре- разрешить относительно у, то, коль скоро в окрестности точки (хо, уо) линия F(x, у) = 0 мало уклоняется от этой прямой, можно надеяться, что ее в некоторой окрестности точки (хо,уо) тоже можно будет записать в виде у = у(х). То же самое, конечно, можно сказать о локальной разрешимости уравнения F(x, у) = 0 относительно х. Записав уравнение C) для рассматриваемого конкретного соотно- соотношения A), получим следующее уравнение касательной: хо(х-хо) +уо(у-уо) = 0. Это уравнение разрешимо относительно у всегда, когда уо Ф 0, т. е. во всех точках (жсУо) окружности A), кроме точек (—1,0) и A,0). Оно разрешимо относительно х во всех точках окружности, кроме точек @,-1) и @,1).
560 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 2. Простейший вариант теоремы о неявной функции. В этом параграфе теорема о неявной функции будет получена очень нагляд- наглядным, но не очень эффективным методом, приспособленным только к случаю вещественнозначных функций вещественных переменных. С другим, во многих отношениях более предпочтительным способом получения этой теоремы, как и с более детальным анализом ее струк- структуры, читатель сможет познакомится в главе X (часть II), а также в задаче 4, помещенной в конце параграфа. Следующее утверждение является простейшим вариантом теоремы о неявной функции. Утверждение 1. Если функция F: U(xo,yo) -> К, определенная в окрестности U(xo,yo) точки (хо,уо) €Е ^?, такова, что 1° F &C^(U;R), гдер^ 1, 2° F(xo,yo)=O, 3° Fy(xQ,y0) ф 0, то существуют двумерный промежуток I = Ix х 1у, где Ix = {x&R\\x-x0\< а}, 1У = {у G R | \у - уо\ < /3}, являющийся содержащейся в U(xo,yo) окрестностью точки (хо,уо), и такая функция f G C^(Ix;Iy), что для любой точки (х,у) £ Ix x 1у F(x,y)=0^y = f(x), D) причем производная функции у = }{х) в точках х Е 1Х может быть вычислена по формуле f{x) = -[F'y(xJ(x))]-l[F'x{xJ{x))\. E) Прежде чем приступить к доказательству, дадим несколько воз- возможных переформулировок заключительного соотношения D), кото- которые должны заодно прояснить смысл самого этого соотношения. Утверждение 1 говорит о том, что при условиях 1°, 2°, 3° порция множества, определяемого соотношением F(x,y) = 0, попавшая в ок- окрестность I = 1Х х 1у точки (хо,уо), является графиком некоторой функции f:Ix->Iy класса C^(Ix;Iy). Иначе можно сказать, что в пределах окрестности / точки (жо,уо) уравнение F(x, у) = 0 однозначно разрешимо относительно у, а функ- функция у = f(x) является этим решением, т. е. F(x, f(x)) = 0 на Ix.
§5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 561 Отсюда в свою очередь следует, что если у = f(x) —функция, опре- определенная на 1Х, про которую известно, что она удовлетворяет соотно- соотношению F(x, f(x)) = О на 1Х и что f(xo) = Уо, то при условии непрерыв- непрерывности этой функции в точке Xq G Ix можно утверждать, что найдется окрестность А С 1Х точки xq такая, что /(А) С 1у и тогда f(x) = f(x) при х е А. Без предположения непрерывности функции / в точке Xq и условия f(xo) = уо последнее заключение могло бы оказаться неправильным, что видно на уже разобранном выше примере с окружностью. Теперь докажем утверждение 1. < Пусть для определенности Fy(xo,yo) >0. Поскольку F G C^(U; Ш), то Fy(x, у) > О также в некоторой окрестности точки (жо, Уо)- Чтобы не вводить новых обозначений, без ограничения общности можно считать, что F'(x,y) > 0 в любой точке исходной окрестности U(xo,yo). Более того, уменьшая, если нужно, окрестность U(xo,yo), можно считать ее кругом некоторого радиуса г = 2C > 0 с центром в точке Поскольку Fy(x,y) > 0 в U, то функция F(xo,y) от у определена и монотонно возрастает на отрезке Уо — C ^ у ^ уо + C, следовательно, F{xo,yo-C) <F(xo,yo) = 0<F(x0,y0 + l3). В силу непрерывности функции F в U, найдется положительное чи- число а < C такое, что при |гг — гЕо | ^ о. будут выполнены соотношения F(x,yo-/3) <0<F(x,y0+/3). Покажем теперь, что прямоугольник I = Ix x 1у, где 1Х = {х £ Ж | \х - хо\ < а}, 1У = {у £ Ж | \у - уо\ < /3}, является искомым двумерным промежутком, в котором выполняется соотношение D). При каждом х G 1Х фиксируем вертикальный отрезок с концами {х,уо — /3), (х,уо + C). Рассматривая на нем F(x,y) как функцию от у, мы получаем строго возрастающую непрерывную функцию, принима- принимающую значения разных знаков на концах отрезка. Следовательно, при х € 1Х найдется единственная точка у(х) G 1у такая, что F(x, у(х)) = 0. Полагая у(х) = f(x), мы приходим к соотношению D). 19-4573
562 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Теперь установим, что / € C^p\lx; Iy)■ Покажем сначала, что функция / непрерывна в точке Xq и что f(xo) = уо- Последнее равенство, очевидно, вытекает из того, что при х = хо имеется единственная точка у(хо) G 1у такая, что F(xo,y(xo)) = = 0. Вместе с тем по условию F(xo,yo) = 0, поэтому /(^о) — Уо- Фиксировав число е, 0 < е < /3, мы можем повторить доказатель- доказательство существования функции f(x) и найти число 8, 0 < 8 < а, так, что в двумерном промежутке I — Ix x Iy, где 1Х = {х £ Ж | \х - хо\ < 8}, Iy = {yeR\\y-yo\< e}, будет выполнено соотношение (F(x, у)=0в~1)^(у = f(x), х е 4) F) с некоторой вновь найденной функцией f:Ix—¥ly. Но 1Х С Ix, Iy С 1У и / С /, поэтому из D) и F) следует, что f(x) = f(x) при х Е 1Х С 1Х. Тем самым проверено, что \f(x) — f(xo)\ = = \f(x) ~Уо\<£ при \х - хо\ < 8. Мы установили непрерывность функции / в точке xq. Но любая точка (х, у) £ I, в которой F(x, у) — 0, также может быть принята в качестве исходной точки построения, ибо в ней выполнены условия 2°, 3°. Выполнив это построение в пределах промежутка /, мы бы в силу D) вновь пришли к соответствующей части функции /, рассма- рассматриваемой в окрестности точки х. Значит, функция / непрерывна в точке х. Таким образом, установлено, что / е СAХ;1У). Покажем теперь, что / G С^AХ;1У), и установим формулу E). Пусть число Ах таково, что х + Ах G 1Х. Пусть у = f(x) и у + Ау = = f(x + Ах). Применяя в пределах промежутка / к функции F(x,y) теорему о среднем, находим, что 0 = F(x + Ax,f(x + Ax)) - F(x,f(x)) = = F(x + Ax,y + Ay) - F(x,у) = = Fx(x + в Ах, у + в Ay) Ax + Fy(x + в Ах, у + вАу)Ау @ < в < 1), откуда, учитывая, что F'(x,y) ^Ов/, получаем Ay Ах G)
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 563 Поскольку / € СAХ; 1У), то при Ах -» 0 также Ау -» 0 и, учитывая, что F G C^(U;R), из G) в пределе при Аж -» 0 получаем = Fx(x,y) [ ' F>(x,y)' где у = f(x). Тем самым формула E) установлена. В силу теоремы о непрерывности композиции функций, из форму- формулы E) вытекает, что / G C^l\lx\Iy). Если F G С^A7;Ш), то правая часть формулы E) допускает диф- дифференцирование по я; и мы находим, что / (х) = JZ-72 . E ) где Fx, Fy, F"x, Fx'y, Fy'y вычисляются в точке (х, f(x)). Таким образом, / G C^(Ix;Iy), если F G C^(U;R). Поскольку по- порядок производных от /, входящих в правую часть соотношений E), E') и т. д., на единицу ниже, чем порядок производной от /, стоящей в левой части равенства, то по индукции получаем, что / е С^Aх;1у), ). ► Пример 1. Вернемся к рассмотренному выше соотношению A), задающему окружность в Ш2, и проверим на этом примере утвержде- утверждение 1. В данном случае F(x,y)=x2+y2~l и очевидно, что F G С(оо)(М2; Ш). Далее, Fx(x,y) = 2x, Fy(x,y)=2y, поэтому F'(x,y) ф 0, если у ф 0. Таким образом, в силу утверждения 1, для любой точки (жо, уо) данной окружности, отличной от точек (—1,0), A,0), найдется такая окрестность, что попадающая в нее дуга окруж- окружности может быть записана в виде у = f(x). Непосредственное вычи- вычисление подтверждает это, причем f(x) = л/1 — х2 или }(х) = —у/1 — х2. Далее, в силу утверждения 1,
564 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Непосредственное вычисление дает х /'(я) = что можно записать одним выражением , если f(x) = v 1 — ж2, вычисление по которому приводит к тому же результату что и вычисление по формуле (8), полученной из утверждения 1. Важно заметить, что формула E) или (8) позволяет вычислять f'(x), даже не располагая явным выражением зависимости у = f(x), если нам только известно, что f(xo) = уо- Задание же условия уо = /(#о) необ- необходимо для выделения той порции линии уровня F(x, у) = 0, которую мы намереваемся представить в виде у = f(x). На примере окружности видно, что задание только координаты xq еще не определяет дугу окружности и, только фиксировав уо, мы вы- выделяем одну из двух возможных в данном случае дуг. 3. Переход к случаю зависимости JP(as1,..., жт, у) = 0. Прос- Простым обобщением утверждения 1 на случай зависимости F(p\ ..., хт, у) = = 0 является следующее утверждение. Утверждение 2. Если функция F: U—ьЖ, определенная в окрест- окрестности U С Mm+1 точки (хо,уо) = (xq,...,х™,у0) е Mm+1, такова, что Г 2° то существуют (т + 1)-мерный промежуток 1 = 1™ х 1у, где I™ = {x = (x\...,xm) eMm | \хг-хг0\ <а\ » = 1,...,т}, I] = {у е к | \у - Уо\ < /3},
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 565 являющийся лежащей в U окрестностью точки (хо,уо), и такая функ- функция / 6 С(рЦ1™;1у), что для любой точки (х,у) 6 I™ x 1у F(xl,...,xm,y) = O^y = f(x\...,xm), (9) причем частные производные функции у — /(ж1,... ,хт) в точках 1Х могут быть вычислены по формуле J£(z) = - [FyixJix))]-1 [F%(x,f(x))] . A0) •^ Доказательство существования промежутка Im+l = I™xly, функ- функции у = /(ж) = /(ж1,..., хт) и ее непрерывности в I™ дословно повто- повторяет соответствующие части доказательства утверждения 1, с един- единственным изменением, которое сводится к тому, что теперь под сим- символом х надо понимать набор (ж1,... ,хт), а под символом а — набор (а1,..., ате). Если теперь в функциях ^(ж1,..., хт, у) и /(ж1,..., хт) фиксиро- фиксировать все переменные, кроме хг и у, то мы окажемся в условиях утвер- утверждения 1, где на сей раз роль х выполняет переменная хг. Отсюда следует справедливость формулы A0). Из этой формулы видно, что J£ 6 C(I^-Jl) (i = l,...,m), т.е. / 6 CWff;/i). Рассуждая, как и при доказательстве утверждения 1, по индукции устанавливаем, что / 6 Ф\1™ ;/*), коль скоро F 6 С(р)(С/;М). ► Пример 2. Предположим, что функция F: G —> R определена в области G С К.ш и принадлежит классу C^(G;R); xq = (жд,...,Жд1) 6 £ Си ^(жо) = F(xq, ..., Жд1) = 0. Если жо не является критической точкой функции F, то хотя бы одна из частных производных функции F в точке xq отлична от нуля. Пусть, например, -^-^-(жо) ф 0. (Ух Тогда, в силу утверждения 2, в некоторой окрестности точки xq под- подмножество Шт, задаваемое уравнением ^(ж1,... ,хт) — 0, может быть задано как график некоторой функции хт = /(ж1,... ,хт~1), опреде- определенной в окрестности точки (жд,..., х™~1) 6 К.771, непрерывно диффе- ренцируемои в этой окрестности и такой, что /(Жд,..., ж0 ) = ж0 . Таким образом, в окрестности некритической точки жд функции F уравнение F(x\...,xm) = 0 задает (т — 1)-мерную поверхность.
566 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В частности, в случае К3 уравнение F(x,y,z)=0 в окрестности некритической точки (xo,yo,zo), удовлетворяющей ему, задает двумерную поверхность, которая при выполнении условия o,zo) Ф 0 локально может быть записана в виде Как мы знаем, уравнение плоскости, касательной к графику этой функции в точке (xq, yo,zo), имеет вид z-zo = — (хо,уо)(х-хо) + -Q-(xo,yo)(y-yo). Но по формуле A0) Ё1(Хп vn) - _ПЫ1Уо1Ъ± df_ v _ ЦЫ,Уо,го) дх[Х°'У0)- F>(xo,yo,zoy ду[Х°'У0) F>(xoyO поэтому уравнение касательной плоскости можно переписать в виде F'x{xQ,yQ, zo)(x - хо) + Fy(x0, уо, zo)(y - у0) + F'z{xQ, y0, zo)(z - z0) = 0, симметричном относительно переменных х, у, z. Аналогично и в общем случае получаем уравнение гиперплоскости в К7", касательной в точке Xq = (х$,...,Жд1) к поверх- поверхности, задаваемой уравнением ^(ж1,..., хт) = 0 (разумеется, при усло- условии, что F(xo) — 0 и что хо—некритическая точка F). Из полученных уравнений видно, что при наличии евклидовой структуры в Шт можно утверждать, что вектор ортогонален поверхности r-уровня ^(ж) = г функции F в соответству- соответствующей точке xq 6 Шт.
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 567 Например, для функции 9 9 9 ЗГ 1Г 2Г определенной в R3, r-уровнем являются: пустое множество при г < 0; точка при г = 0; эллипсоид х2 у2 z2 а2^ Ь2 с2 при г > 0. Если (xo,yo,zo) — точка на этом эллипсоиде, то по доказан- доказанному вектор , ,-,, ч /2ж0 2у0 2z0 giadF(xo,yo,zo)= I -^-, -^-, ~^- ортогонален этому эллипсоиду в точке (жсьУсь^о)* а касательная к нему в этой точке плоскость имеет уравнение жо(ж-жр) уо(у-уо) zq(z-zq) а2 + б2 + с2 которое с учетом того, что точка (xq, yo,zo) лежит на эллипсоиде, мож- можно переписать в виде УоУ , zoz а? + Ъ2 4. Теорема о неявной функции. Теперь перейдем к общему слу- случаю системы уравнений F1(x\...,xm,y1,...,yn) = 0, (И) Fn(x\...,xm,y\...,yn)=0, которую мы будем решать относительно у1,..., у", т. е. искать локаль- локально эквивалентную системе A1) систему функциональных связей A2) уп = Г(х\...,хт). Для краткости, удобства письма и ясности формулировок условим- условимся, что х = (ж1,... ,хт), у = (у1,... ,уп); левую часть системы A1)
568 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ будем записывать как F(x,y), систему A1) как F(x,y) = 0, а отобра- отображение A2) как у = f(x). Если а=(а\...,ат), /3=(/3\...,/П то запись \х — xq\ < а или \у — уо\<C будет означать, что \х% — хг0\ < аг (i = 1,..., т) и, соответственно, \yJ — уЦ < f$ (j = 1,..., n). Далее положим /'(*) = / df1 дх1 df1 \ дхт dfn \дх1 / dF1 дх1 A3) dfn дхт dF1 \ дхт dFn dFn дх1 '" дхт I A4) F'(x,y) = / dF1 W dFn \ ду1 dF1 \ дуп dFn дуп A5) Заметим, что матрица Fy(x,y) квадратная и, следовательно, она обратима тогда и только тогда, когда ее определитель отличен от нуля. В случае п = 1 она сводится к единственному элементу и в этом случае обратимость матрицы F'y(x,y) равносильна тому, что этот единствен- единственный ее элемент отличен от нуля. Матрицу, обратную к Fy(x,y), будем, как обычно, обозначать символом [i^(x,y)] Теперь сформулируем основной результат параграфа. Теорема (о неявной функции). Если отображение F: U —> Шп, определенное в окрестности U точки (жо,уо) £ Шт+п, таково, что 1° FeC^(U;Rn), p^l, 2° F(xo,yo)=O, 3° Fy(xo,yo) —обратимая матрица,
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 569 то существуют (т + п)-мерный промежуток I = I™ х /" С U, где I™ = {x£Rm\\x-x0\<a}, q = {yewr\\y-yo\<0}, и такое отображение / б С^р'(I™; /™), что для любой точки (х,у) £ F{x,y)=0 4>y = f(x), A6) причем f'(x) = - [Fy(x,f(x))]-1 [Fi(x,f(x))] . A7) •^ Доказательство теоремы будет опираться на утверждение 2 и простейшие свойства определителей. Разобьем его на отдельные этапы. Будем рассуждать методом индукции. При п = 1 теорема совпадает с утверждением 2 и потому верна. Пусть теорема справедлива для размерности п — 1. Покажем, что она тогда справедлива и для размерности п. a) В силу условия 3°, определитель матрицы A5) отличен от нуля в точке (жо)Уо) € Шт+п, а значит, и в некоторой окрестности точ- точки (жо,г/о)- Следовательно, по крайней мере один элемент последней строки этой матрицы отличен от нуля. С точностью до перемены обо- BFn значении можно считать, что таким является элемент -—. дуп b) Применяя тогда к соотношению Fn(x\...,xm,y\...,yn)=0 утверждение 2, найдем промежуток 1т+п — [I™ x Iy~l) x L1 С [/ и такую функцию / € С^ (/™ X Т^; /1), что (Fn(x\...,xm,y\...,yn)=0 в &(yn = j(x1,...,xm,y1,...,yn-1), (x\...,xm)ei?, (y\...,yn-1)e^-1). A6) с) Подставляя найденное выражение уп — f(x, у1,..., уп~1) перемен- переменной уп в первые п — 1 уравнений системы A1), получим п — 1 соотно-
570 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ шении = F\x\...,xm,y\...,yn-\f(x\...,xm,y\...,yn-l)) = 0, Фп-1(х1,...,хт,у1,...,уп-1):^ = Fn-\x\ ...,хт,у\..., уп~\ }{х\ ...,хт,у\..., у")) = 0. Видно, что Фг € CW (/™ х Ц~\ Ж) (i = 1,..., п - 1), причем Фг(х10,...,х%,у10,...,у%-1)=0 (г = 1,...,п-1), /(xS,...,xJl,y5,...,yJ-1) = yJ и ^г(:со,г/о)=О (t = l,...,n). В силу определения функций Ф* (к = 1,..., п — 1), A9) B0) Положив еще = Fn(x\...,xm,y\...,yn-l,f(x\...,xm,y1,...,yn-1)), в силу A8) получаем, что в области своего определения Ф" = 0, поэтому дФп dFn 8Fn df n ,. л = + ^-ееО (г = 1,...,п-1). B1 ду% ду% дуп ду% ' К ' Учитывая соотношения B0), B1) и свойства определителей, можно заметить, что определитель матрицы A5) равен определителю матри- матрицы dF1 , dF1 df dF1 dF1 df dF1 \ ду1 ' дуп ду1 '" дуп~х дуп дуп-1 дуп dFn dFn df gFn \ ду1 дуп ду1 '" ду11-1 дуп дуп~х дуп I ( дФ1 дФ1 dF1 \ ду1 '" дуп~х ду11 дФп~х дФп~х dFn~x ду1 '" дуп~ О ... О дуп dFn дуп
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 571 Я7Рп По предположению, —— Ф О, а определитель матрицы A5) по усло- условию отличен от нуля. Следовательно, в некоторой окрестности точки (xq, ..., х™,уд, • • •, Уо~1) отличен от нуля и определитель матрицы ду1 ЭФ"'1 ду' ду-1 дфП-1 ду п-1 Тогда по предположению индукции найдутся промежуток /ш+" * — = 1?х 1£~1 С I? х §"! —окрестность точки (xi,..., xtf, yl..., у%~1) в мш+"-1 —и такое отображение / 6 С^/™;/™), что в пределах промежутка /ш+"~1 = /^ х Т^1 система A9) равносильна соотноше- соотношениям B2) из B2) »ъ 1 л», 1/ 1 771Л d) Так как /™-1 С 1у~1, а I™ С /™, то, подставляя /*,..., вместо соответствующих переменных в функцию yn = f(x\...,xm,y\...,yn-1) из соотношения A8), получаем зависимость переменной у" от (ж1,..., жш). е) Покажем теперь, что система равенств B3) = fn(x\...,xm), тт 1Х 1 B4) задающая отображение / 6 C(p\l™\ Iy), где I™ = Ц lxljj, равносильна в пределах окрестности Im+n = I™ x I™ системе уравнений A1). В самом деле, сначала мы в пределах /ш+" = (j™ x Iy~l) x I1 заме- заменили последнее уравнение исходной системы A1) эквивалентным ему, в силу A8), равенством у" = f(x, у1,..., У4'1)- От так полученной второй
572 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ системы мы перешли к равносильной ей третьей системе, заменив в пер- первых п — 1 уравнениях переменную уп на /(ж,?/1,... ,уп~1)- Первые п-1 уравнений A9) третьей системы мы в пределах I™ х 1у~1 С Ц} х 7" заменили равносильными им соотношениями B2). Тем самым получили четвертую систему, после чего перешли к равносильной ей в пределах /™ xly'1 xly = Im+n окончательной системе B4), заменив в последнем уравнении у11 = /(ж1,..., хт, у1,..., уп~1) четвертой системы перемен- переменные у ,... ,уп~1 их выражениями B2) и получив в качестве последнего уравнения соотношение B3). f) Для завершения доказательства теоремы остается проверить фор- формулу A7). Поскольку в окрестности I™ х /™ точки (хо,Уо) системы A1) и A2) равносильны, то F(x,f(x))=0, если х el™. В координатах это означает, что в области I™ (к = 1,...,п). B5) Поскольку/ 6 CW(I™;I£)hFe C^(U;Rn), гдер ^ 1, то F(-J(-))e € C(p^(/^;Rn) и, дифференцируя тождества B5), получаем & ^^Г = » <* = l....,»i« = l....,m). B6) Соотношения B6), очевидно, равносильны одному матричному ра- равенству F'x{x,y)+F'y{x,y)-f'{x)=O, в котором у = f(x). Учитывая обратимость матрицы Fy(x,y) в окрестности точки (хо,уо), из этого равенства получаем, что и теорема полностью доказана. ►
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 573 Задачи и упражнения 1. На плоскости М2 с координатами х, у соотношением F(x, у) = О, где F € 6 СB)(М2,М), задана кривая. Пусть (хо,уо)—некритическая точка функции F(x, у), лежащая на кривой. a) Напишите уравнение касательной к этой кривой в точке (хо,уо)- b) Покажите, что если (жо>2/о)—точка перегиба кривой, то в этой точке выполняется равенство - 2Fx'yFxFy + F'y'yF'x2) (х0, у0) = 0. с) Найдите формулу для кривизны кривой в точке (хо,уо)- 2. Преобразование Лежандра для т переменных. Преобразование Лежандра от переменных х1,... ,хт и функции /(ж1,..., хт) есть переход к новым переменным £i,...,£m и функции /*(£i,.. -,£m), зада- задаваемый соотношениями B7) 1=1 a) Дайте геометрическую интерпретацию преобразования B7) Лежандра как перехода от координат (xl,...,xm,f(x1,..., xm)) точки на графике функ- функции f(x) к параметрам (£i, • • •, £m, /*(£i, • • •, Cm)), задающим уравнение плос- плоскости, касательной к графику в этой точке. b) Покажите, что преобразование Лежандра локально заведомо возможно, если / е CW и det (^) ф 0. c) Используя для функции f{x) = /(ж1,... ,хт) то же определение вы- выпуклости, что и в одномерном случае (подразумевая теперь под х вектор (ж1,... ,хт) е Шт), покажите, что преобразованием Лежандра выпуклой функции является выпуклая функция. d) Покажите, что г=1 i-l i=l и выведите отсюда инволютивность преобразования Лежандра, т. е. проверь- проверьте, что (/*)•(*)=/(*)■ е) Учитывая d), запишите преобразование B7) в симметричном относи- относительно переменных виде B8)
574 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ или, короче, в виде Г (О где (О, 8=1 f) Матрицу, составленную из частных производных второго порядка функции (а иногда и определитель этой матрицы), называют гессианом функ- функции в данной точке. б 21гес- Пусть dt] и d* — алгебраические дополнения элементов —у—*, -21 ■' ах1 ах-1 d£t сианов d2f дх1дх1 а2/ дх1дхт \дхтдх1 '" дхтдхт d2f* d2f* d2f* \dUdti 2f* d2f функций f(x) и /*(£)> a d и d* —определители этих матриц. Считая, что d ф О, покажите, что d ■ d* = 1 и что d2f d* d2f* dt g) Мыльная пленка, натянутая на проволочный контур, образует так на- называемую минимальную поверхность, имеющую наименьшую площадь среди всех поверхностей, натянутых на этот контур. Если локально задать эту поверхность как график функции z = f(x,y), то, оказывается, функция / должна удовлетворять следующему уравнению минимальных поверхностей: Покажите, что после преобразования Лежандра это уравнение приводится к виду A 2)С + A + П/«" = о- 3. Канонические переменные и система уравнений Гамильтона1\ а) В вариационном исчислении и фундаментальных принципах классиче- классической механики важную роль играет следующая система уравнений Эйлера- х'У. Р. Гамильтон A805-1865)—знаменитый ирландский математик и механик. Сформулировал вариационный принцип (принцип Гамильтона), построил феноме- феноменологическую теорию оптических явлений; создатель теории кватернионов и родо- родоначальник векторного анализа (кстати, ему принадлежит сам термин «вектор»).
§ 5. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 575 Лагранжа: Г /0L d_dL\ и х V\_Q B9) где L(t, x, v) —заданная функция переменных t, x, v, среди которых t обычно является временем, х — координатой, a v — скоростью. Систему B9) составляют два соотношения на три переменные. Из систе- системы B9) обычно желают найти зависимости х = x(t) и v = v(t), что по суще- существу сводится к отысканию зависимости х = x(t), ибо v = ^. Запишите подробно первое уравнение системы B9), раскрыв производ- производную ^7 с учетом того, что х — x(t) и v = v(t). b) Покажите, что если от переменных t, x, v, L перейти к так называемым каноническим переменным t, х, р, Н, сделав преобразование Лежандра (см. задачу 2) dL =^ = pu-L по переменным v, L, заменяя их на переменные р, Н, то система Эйлера- Лагранжа B9) приобретает симметричный вид дН . дН Р=-дх-' X=W C0) в котором она называется системой уравнений Гамильтона. c) В многомерном случае, когда L = L(t,х1,... ,xm,v1,... ,vm), система уравнений Эйлера-Лагранжа имеет вид C1) где для краткости положено х = (х1,... ,хт), v — (v1,... ,vm). Сделав преобразование Лежандра по переменным и1,... ,vm,L, перейди- перейдите от переменных t,x1,.. .,xm,vl,. ..,vm,L к каноническим переменным t,х1,..., хт,р\,... ,рт,Н и покажите, что в них система C1) перейдет в сле- следующую систему уравнений Гамильтона: ВН ВН
576 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 4. Теорема о неявной функции. Решение этой задачи дает другое, быть может, менее наглядное и эффек- эффективное, но более короткое в сравнении с изложенным выше доказательство основной теоремы настоящего параграфа. а) Пусть выполнены условия теоремы о неявной функции, и пусть „, ч (dFl dF* — г-я строка матрицы Fy(x,y). Покажите, что определитель матрицы, составленной из векторов Fy(xu yl), отличен от нуля, если все точки (хг, уг) (г = 1,..., п) лежат в некоторой до- достаточно малой окрестности U = I™ x I™ точки (хо,Уо)- b) Покажите, что если при х € I™ найдутся точки г/i, у2 € Ц такие, что F(x, j/i) = 0 и F(x,г/2) = 0, то для каждого i е {1,..., п} найдется такая точка (x,yt), лежащая на отрезке с концами (х, ух), (х,у2), что Ргу(х,уг)(у2~У1) = 0 (i = l,...,n). Покажите, что отсюда следует, что j/i = г/2, т. е. если неявная функция /: I™ -> —> 1у существует, то она единственна. c) Покажите, что если шар В(уо; г) лежит в 1£, то F(xo,y) ф 0 при llv " tfo||Rn = r > 0. d) Функция ||F(a;o,2/)||Hn непрерывна и имеет положительный минимум ц на сфере \\у - yo\\Rn = г. e) Существует 8 > 0 такое, что при ||ж - £o||Rm < ^ 2 1 \\F(X, y)\\Rn > 2^' если № ~ Уо"к" = г' 2 1 ||2?т(а:,у)||к„ < -/л, если у = у0. 2 f) При любом фиксированном х таком, что \\х—xq\\ < S, функция ||^(а;, j/)||Rn достигает минимума в некоторой внутренней точке у = f(x) шара \\у—yo\\Rn ^ ^ г, и поскольку матрица F'y(x,f(x)) обратима, то F(x,f(x)) = 0. Этим уста- устанавливается существование неявной функции /: В(хо;6) -> В(уо;г). g) Если Дг/ = f(x + Ах) - f(x), то -1 где Fy — матрица, строками которой являются векторы Р*(хг, уг) (г = 1,..., п), где (ж,, уг) — точка на отрезке с концами (х,у), (х + Ах,у+Ау). Аналогичный смысл имеет символ F'
§ 6. НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 577 Покажите, что из этого соотношения следует непрерывность функции №• h) Покажите, что 5. «Если f(x,y,z) = 0, то | • §| • % = -1». a) Придайте точный смысл этому высказыванию. b) Проверьте его справедливость на примере формулы Клапейрона P-V ——— = const и в общем случае функции трех переменных. c) Запишите аналогичное высказывание для соотношения /(а;1,... ,хт) = = 0 между m переменными. Проверьте его справедливость. 6. Покажите, что корни уравнения zn + cxz"-1 + ... + с„ = О гладко зависят от его коэффициентов, во всяком случае, пока все корни раз- различны. § 6. Некоторые следствия теоремы о неявной функции 1. Теорема об обратной функции Определение 1. Отображение /: U —>• V, где U и V — открытые подмножества в Шт, называется С^р'-диффеоморфизмом или диффео- диффеоморфизмом гладкости р (р = 0,1,...), если 2) / — биекция; 3) /-1 GC^(V;U). С(°)-диффеоморфизмы называют гомеоморфизмами. Здесь мы, как правило, будем рассматривать только гладкий слу- случай, т. е. случай р € N или р = оо. Следующая часто используемая теорема в идейном плане утвержда- утверждает, что если дифференциал отображения обратим в точке, то само ото- отображение обратимо в некоторой окрестности этой точки.
578 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Теорема 1 (теорема об обратной функции). Если отображение f: G —» Шт области G С Шт таково, что Г /еС^(С;Мто), р>\, 2° г/о = Джо) при ж0 е G, 3° f'(xo) обратимо, то существуют окрестность U(xo) С G точки xq и окрестность V(yo) точки уо такие, что /: U(xq) —> V(yo) есть С(р>-диффеомор- С(р>-диффеоморфизм. При этом если х G U(xq) и у = /(ж) 6 ■^ Соотношение у = /(ж) перепишем в виде F(x,y) = f(x)-y = 0. A) Функция F(x,y) = f(x) — у определена при х 6 G и у 6 Мт, т.е. определена в окрестности G х Шт точки (хо,уо) £ Шт х Кт. Мы хотим разрешить уравнение A) относительно х в некоторой окрестности точки (хо,Уо)- В силу условий 1°, 2°, 3° теоремы отобра- отображение F(x, у) таково, что FGC(p)(Gxlm;Mra), р ^ 1, КЫ,Уо) = /'(жо) обратимо. По теореме о неявной функции найдутся окрестность Ix x 1у точ- точки (жо,2/о) и отображение g £ C^p'(Iy;Ix) такие, что для любой точки (х, у)£1хх 1У f(x) -y = 0^x = g(y) B) В нашем случае F^x,y) = f'(x), Fly{x,y) = -E, где Е — единичная матрица; поэтому 9'{у) = {Г{х))-\ C)
§ 6. НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 579 Если положить V = 1у и U = g(V), то соотношение B) показывает, что отображения f:U-+Vvig: V^U взаимно обратны, т.е. д = f~1 HaF. Поскольку V = Iy, то V — окрестность точки уо- Это означает, что при условиях 1°, 2°, 3° образ уо = /(жо) точки Xq G G, внутрен- внутренней для G, является точкой, внутренней для образа f(G) множества G. В силу формулы C) матрица д'(уо) обратима. Значит, отображение д: V —> U обладает свойствами 1°, 2°, 3° относительно области V и точки уо £ V. Тогда по уже доказанному хо = д(уо)—внутренняя точ- точка множества U = g(V). Поскольку условия 1°, 2°, 3° в силу формулы C), очевидно, выполне- выполнены в любой точке у £ V, то любая точка х = д(у) является внутренней точкой множества U. Таким образом, U — открытая (и, очевидно, даже связная) окрестность точки хо в Шт. Теперь проверено, что отображение f:U—tV удовлетворяет всем условиям определения 1 и утверждению теоремы 1. ► Приведем несколько примеров, иллюстрирующих теорему 1. Очень часто теорема об обратной функции используется при переходе от од- одной системы координат к другой системе координат. Простейший вари- вариант такого преобразования координат рассматривался в аналитической геометрии и линейной алгебре и имел вид а\.. или, в компактной записи, yi = a\xl. Это линейное преобразование А: Щ? -» М£ имеет обратное А~1: М£ ->■ 1£\ определенное во всем пространстве К^1, тогда и только тогда, когда матрица \о?А обратима, т. е. при условии, что det f a\ I ф 0. Теорема об обратной функции является локальным вариантом этого утверждения, опирающимся на то обстоятельство, что гладкое отобра- отображение в малой окрестности точки ведет себя примерно так же, как его дифференциал в этой точке. Пример 1. Полярные координаты. Отображение /: Ш^_ —> М2 по- полуплоскости 1^_ = {(р, <р) £R2 | р ^ 0} на плоскость М2, задаваемое
580 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ формулами х = pcoscp, у = psimp, D) проиллюстрировано на рис. 57. Якобиан этого отображения, как нетрудно подсчитать, равен р, т.е. отличен от нуля в окрестности любой точки (р,(р), где р > 0. Таким образом, формулы D) локально обратимы и, значит, локально числа р, <р могут быть приняты в качестве новых координат точки, которую раньше задавали декартовы координаты х, у. Координаты (р, <р) являются хорошо известной системой криволи- криволинейных координат на плоскости — это полярные координаты. Их гео- геометрический смысл виден из рис. 57. Отметим, что в силу периодич- периодичности функций cos<£>, simp отображение D) при р > 0 только локально диффеоморфно, а во всей этой области оно не является биективным. Именно поэтому переход от декартовых координат к полярным всегда сопровождается выбором ветви (т. е. указанием диапазона изменения) аргумента ср. Полярные координаты (р,ф,(р) в трех- трехмерном пространстве М3 называют сфе- сферическими координатами. Они связаны с декартовыми координатами формулами z = р cos ip, у = р sin ip sin tp, х = р sin ip cos if. E) Рис. 58. Геометрический смысл параметров р, гр, <р показан на рис. 58.
§ 6. НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 581 Якобиан отображения E) равен р sin ф и в силу теоремы 1 преобра- преобразование E) обратимо в окрестности любой точки (р,ф,(р), в которой р > 0 и sin ф ф 0. Множествам, где р — const, (р = const или ф — const, в пространстве (х, у, z), очевидно, отвечают соответственно сферическая поверхность (на сфере радиуса р), полуплоскость, проходящая через ось z, и поверх- поверхность конуса с осью z. Таким образом, при переходе от координат (х, у, z) к координатам (р,ф,<р), например, сферическая поверхность и поверхность конуса ло- локально распрямляются: им соответствуют куски плоскостей р = const и ф = const соответственно. Аналогичное явление мы наблюдали и в двумерном случае, когда дуге окружности на плоскости (х, у) отвечал отрезок прямой на плоскости с координатами (р, ср) (см. рис. 57). Обра- Обратите внимание на то, что это именно локальное выпрямление. В m-мерном случае полярные координаты вводятся соотношениями х1 = pcostpi, х2 = psimpi cos<,c>2, E') xm~l = psiny?! sinip2 ... sin(рт-2 cos (pm-i, xm = p sin ipi sin <f2 ■ ■ ■ sin <pm-2 sin ipm_i. Якобиан этого преобразования равен pm-l ginm-2 ¥>i sinm-3 ^ gin ^^ ^ и в силу теоремы 1 оно тоже локально обратимо всюду, где этот яко- якобиан отличен от нуля. Пример 2. Общая идея локального выпрямления кривых. Новые координаты обычно вводят с целью упростить аналитическую запись объектов, участвующих в задаче, и сделать их более обозримыми в этой новой записи. Пусть, например, на плоскости М некоторая кривая задана уравне- уравнением F{x,y)=0. Пусть F — гладкая функция, а точка (хо,уо) такова, что она лежит на кривой, т.е. F(xo,yo) = 0, и не является критической точкой функ- функции F, например, пусть F'(xo,yo) ф 0.
582 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Попробуем подобрать координаты £, г] так, чтобы в них дуге нашей кривой, содержащей (хо,уо), отвечал отрезок одной из координатных линий, например линии г] = 0. Положим £ = х-х0, r] = F(x,y). Матрица Якоби 1 0 р' F' (х,у) этого преобразования имеет своим детерминантом величину Fy(x,y), которая по предположению отлична от нуля в точке (хо,уо)- Тогда по теореме 1 это отображение является диффеоморфизмом окрестности точки (хо,уо) на окрестность точки (£,??) = @,0). Значит, в пределах указанной окрестности числа £, rj можно принять за новые координаты точек, лежащих в окрестности точки (хо,уо). В новых координатах наша кривая, очевидно, имеет уравнение г] = 0, и в этом смысле мы действительно добились ее локального выпрямления (рис.59). Рис. 59. 2. Локальное приведение гладкого отображения к канони- каноническому виду. Мы рассмотрим здесь только один вопрос этого ти- типа, а именно укажем канонический вид, к которому удачным выбором координат можно локально привести любое гладкое отображение, име- имеющее постоянный ранг. Напомним, что рангом гладкого отображения f-.U—tW1 области U С Шт в точке х £ U называется ранг касательного к нему в этой точке линейного отображения, т.е. ранг матрицы f'(x). Ранг отобра- отображения / в точке х обозначают обычно символом rang/(ж).
§ 6. НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 583 Теорема 2 (теорема о ранге). Пусть f'U —> Шп —отображе- —отображение, определенное в окрестности U С W1 точки Хо £ W1. Если / £ £ С^(и;Шп), р ^ 1, и в любой точке х £ U отображение f имеет один и тот оке ранг к, то существуют окрестности O(xq), О(уо) точек xq, уо = /(xq) и такие их диффеоморфизмы и = (р(х), v — ip(y) класса С^р\ что в окрестности О(щ) = <р@(хо)) точки щ = <p(xq) отображение v = ip о f о ip~l(u) имеет следующее координатное пред- представление: (u\...,uk,...,um) = u^v = (v\...,vn) = (ul,...,uk,0,...,0). G) Иными словами, теорема утверждает (рис. 60), что вместо коорди- координат (ж1,..., хт) можно выбрать координаты (it1,..., itm), а вместо ко- координат (у1,... ,уп) —координаты (г»1,... ,vra) так, что локально наше отображение в этих новых координатах будет иметь вид G), т. е. кано- канонический вид линейного отображения ранга к. •4 Запишем координатное представление = fk(x\...,xm), , . yn = fn(x\...,xm) нашего отображения /: U —> Щ, определенного в окрестности точки xq £ К]?. Чтобы не менять нумерацию координат и окрестность U, будем считать, что в любой точке х £ U главный минор порядка А;, стоящий в левом верхнем углу якобиевои матрицы отображения /, от- отличен от нуля. Рассмотрим отображение, определяемое в окрестности U точки xq равенствами = ipk(x\...,xm) =fk(x\...,x™), = <pm{xl,...,xm) =xm.
584 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Его матрица Якоби имеет вид /д£_ дх1 д£ дх1 \ 0 дхк д£_ дхк df1 дхк+1 dfk дх^1 1 0 df1 \ '" дхт dfk '" дхт 0 1 ) и в силу сделанного предположения ее определитель отличен от нуля в ЕЛ По теореме об обратной функции, отображение и = (р(х) являет- является диффеоморфизмом гладкости р некоторой окрестности O(xq) С U точки xq на окрестность О(щ) = <р (O(xq)) точки щ = <р(хо). Сравнивая соотношения (8) и (9), видим, что композиция g = /о о ip~l: 0{щ) —> К^ имеет следующее координатное представление: fc+l _ IS p-1(u1,...,um) =uk, оср-\и\...,ит)=дк+\и1,...,ит), A0) O(x0) O(y0) Q(u0) O(v0). ■ф о f о ip 1 Рис. 60. ) =дп(и\...,ит). Поскольку отображение <fi~l: О(щ) —>■ O(xq) в любой точ- точке и £ О(щ) имеет макси- максимальный ранг т, а отображение /: O(xq) —> Щ в любой точке х 6 О(жо) имеет ранг к, то, как известно из линейной алгебры, матрица д'(и) = f {ip~l{u)) x х (^ J (ы) имеет ранг к в лю- любой точке и £ O(uq).
§ 6. НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 585 Прямой подсчет матрицы Якоби отображения A0) дает \ ( 1 0 ди1 ^ ди1 0 1 dgk+1 " дик дз! " дик dgk+l duk+l dgn дик+1 0 dgk+1 дит дит Значит, в любой точке и G О(щ) получаем -^(и) = 0 при i = к + + 1, • • •, т; j = к + 1,..., п. Считая окрестность О(щ) выпуклой (чего можно добиться, уменьшив О(щ), например, до шара с центром гхо), отсюда можно заключить, что функции gJ при j = к +1,..., п на самом деле не зависят от переменных ик+1,..., ит. После этого решающего наблюдения отображение A0) можно пере- переписать в виде Ук = (И) У = уп=дп(и\...,ик). Теперь уже можно указать отображение гр. Положим v = у =: ф' (у), v ' = A2) vn = yn-gn{y\...,yk)=:xl>n{y). Из построения функций д3 (j = к + 1, • • ■ ,п) видно, что отображе- отображение ф определено в некоторой окрестности точки уо и принадлежит классу С(р) в этой окрестности.
586 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Матрица Якоби отображения A2) имеет вид f 1 0 dgk+1 ду1 0 l dgk+1 ' дук ■ ~дук 1 0 0 о 1 / Ее определитель равен 1, и, значит, по теореме 1 отображение ф является диффеоморфизмом гладкости р некоторой окрестности О(уо) точки |/о G 1^ на окрестность 0{vq) — ф Ш(уо)) точки vo G Ш%. Сравнивая соотношения A1) и A2), видим, что в достаточно ма- малой окрестности О(щ) С О(щ) точки гхо такой, что д(О(щ)) С О(уо), отображение ф о f о ip~l: О(щ) —> М% является отображением гладко- гладкости р этой окрестности О(щ) на некоторую окрестность 0{vq) С O(vq) точки vq G К^ и при этом имеет канонический вид = и vk = „fc+1 - = о, vn = 0. Полагая ip ^О^о)) = О(хо), ф ные в теореме окрестности точек х ство. ► A3) о)) = О(у0), получаем указан- указанчем и завершается доказатель- доказательТеорема 2, как и теорема 1, очевидно, является локальным вариан- вариантом соответствующей теоремы линейной алгебры. В связи с проведенным доказательством теоремы 2 сделаем следу- следующие полезные для дальнейшего замечания. Замечание 1. Если в любой точке исходной окрестности U С Шт ранг отображения /: U -> К" равен п, то точка г/о = f(xo), где xq G U, является внутренней точкой множества f(U), т.е. содержится в f(U) вместе с некоторой своей окрестностью.
§ 6 НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 587 •^ Действительно, по доказанному отображение фо/оср: О(щ) —> 0{vq) в этом случае имеет вид (гх1,..., гх",..., ит) = и .-> v = (v1,..., vn) = (гх1,..., гх"), поэтому образ окрестности точки гхо — <^(жо) содержит некоторую ок- окрестность точки vo = ф о f о tp~1(uo). Но отображения ip: O(xq) -> О(щ), "ф: О(уо) -> O(vq)—диффео- O(vq)—диффеоморфизмы, поэтому они переводят внутренние точки во внутренние. Записав исходное отображение / в виде / = ф~1 о (^ о / о ip~l) о <^, заключаем, что точка у о = f(xo) является внутренней точкой образа окрестности точки xq. ► Замечание 2. Если ранг отображения /: U —> К" в любой точке окрестности U равен к и к < п, то, в силу равенств (8), A2) и A3), в некоторой окрестности точки Xq 6 U С Кш имеют место п — к соотно- соотношений (г = к + 1,...,п). A4) Указанные соотношения выписаны в принятом нами предположении о том, что главный минор порядка к матрицы f'(xo) отличен от нуля, т.е. что ранг к реализуется уже на наборе функций f1,... ,fk. В про- противном случае можно изменить нумерацию функций f1,...,/" и снова иметь указанную ситуацию. 3. Зависимость функций Определение 2. Говорят, что система непрерывных функций Р{х) = /'(ж1, • • • ,хт) (г = 1,... ,п) является функционально независи- независимой в окрестности точки xq = (xq, ..., х™), если для любой непрерыв- непрерывной функции F(y) = F(y1,... ,уп), определенной в окрестности точки 2/о = (у1,• • •,2/о) = {/Чхо),■■■, fn{xo)) = f(x0), соотношение F(f1(x\...,xm),...,r(x1,...,xm))=0 в окрестности точки xq возможно только в случае, когда F{yx,... ,уп) = = 0 в окрестности точки у0.
588 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Линейная независимость, рассматривавшаяся в алгебре, есть неза- независимость по отношению к линейным соотношениям Если система не является функционально независимой, то ее назы- называют функционально зависимой. В случае линейной зависимости векторов один из них, очевидно, является линейной комбинацией остальных. Аналогичная ситуация име- имеет место и в отношении функционально зависимой системы гладких функций. Утверждение 1. Если система /г(хг,... ,хт) (г = 1,... ,п) глад- гладких функций, определенных в окрестности U{xq) точки Хо G Шт, та- такова, что ранг матрицы дх1 '" дхт (х) dfn dfn дх1 '" дхт ' в любой точке х G U один и тот же и равен к, то a) при к = п система функционально независима в окрестности xq; b) при к < п найдутся окрестность точки xq и такие к функций системы, пусть J1,..., fk, что остальные п — к функций системы в этой окрестности представляются в виде где дг(у\ ■ ■ ■, у ) — гладкие функции, определенные в окрестности точ- точки уо = (/1(жо), • ■ ■ ,/п(жо)) и зависящие только от к координат те- текущей точки у — (у1,... ,уп). 4 В самом деле, если к = п, то в силу замечания 1 к теореме о ранге при отображении y^/V,--.,*), A5) образ окрестности рассматриваемой точки xq содержит целую окрест- окрестность точки уо = f(xo). Но тогда соотношение F(f1(xl,...,xm),...Jn(x\...,xm)) = 0
§ 6. НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 589 з окрестности Xq возможно только при условии, что F(y\...,yn) = 0 в окрестности точки г/о- Этим утверждение а) доказано. Если же к < п и ранг к отображения A5) реализуется уже на функ- функциях f1,..., fk, то в силу замечания 2 к теореме о ранге найдется та- такая окрестность точки г/о = /(^о) и п — к определенных в ней функций дг(у) = дг(у1, ■ ■ ■, ук) {г = к + 1,..., п) того же порядка гладкости, как и функции системы, что в некоторой окрестности точки xq будут вы- выполнены соотношения A4). Этим доказано утверждение Ь). ► Мы показали, что если к < п, то найдутся п — к специальных функ- функций Fl(y) = г/ — <7г(г/,..., ук) (г = к + 1,... ,п), устанавливающих со- соотношения F(f\x),..., fk(x), f(x)) =0 (i = k+l,...,n) между функциями системы f1,..., /fe,...,/" в окрестности точки Xq. 4. Локальное разложение диффеоморфизма в композицию простейших. Здесь мы покажем, как, используя теорему об обратной функции, можно локально представить диффеоморфное отображение в виде композиции таких диффеоморфизмов, каждый из которых меняет только одну из координат. Определение 3. Диффеоморфизм д: U -> Ш71 открытого множе- множества U С Кш будем называть простейшим, если его координатное пред- представление имеет вид \у>=д>(х\...,хт), т. е. при диффеоморфизме д: U —> Шт меняется только одна из коорди- координат отображаемой точки. Утверждение 2. Если f: G —> Шт — диффеоморфизм открыто- открытого множества G С Шт, то для любой точки Xq 6 G найдется такая ее окрестность, в которой справедливо представление f — g\o.. .ogn, где gi,... ,gn —простейшие диффеоморфизмы.
590 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 4 Проверим это по индукции. Если исходное отображение / само является простейшим, то для него утверждение тривиально справедливо. Предположим, что утверждение справедливо для диффеоморфиз- диффеоморфизмов, меняющих не более чем (к — 1) координату, где к — 1 < п. Рассмотрим теперь диффеоморфизм f:G—> Шт, меняющий к коор- координат: yk = fk(x\...,xm), A6) ут = хт. Мы приняли, что меняются именно первые к координат, чего можно достичь линейными преобразованиями. Значит, это не умаляет общно- общности рассуждений. Поскольку / — диффеоморфизм, то его матрица Якоби f'(x) в лю- любой точке х G G невырожденная, ибо Фиксируем хо G G и вычислим определитель матрицы /'(жо): df1 дх1 dfk дх1 0 df1 дхк дхк df1 dxk+l dfk dxk+1 1 0 df1 dxm dfk dxm 0 1 df1 df1 дх1 '" дхк dfk dfk дх1 '" дхк ф 0. Таким образом, один из миноров порядка к — 1 последнего определи- определителя должен быть отличен от нуля. Опять для упрощения записи будем считать, что таким является главный минор порядка к — 1. Рассмо- Рассмотрим тогда вспомогательное отображение g: G —> Кш, определяемое
§ 6. НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 591 равенствами ик ит = **, = хт. A7) Поскольку якобиан дх1 дх* дх1 '" дхк~1 0 дх к дхт 1 0 0 1 „fc-i отображения g: G —> Шт в точке Жо £ G отличен от нуля, отображение д является диффеоморфизмом в некоторой окрестности точки xq. Тогда в некоторой окрестности точки ito = д(хо) определено обрат- обратное к д отображение ж = д~1(и), которое позволяет ввести в окрестно- окрестности жо новые координаты (it1,..., itm). Пусть h = f og~l. Иными словами, отображение у = h(u) есть наше отображение A6) у = f(x), записанное в координатах it. Отображе- Отображение h, как композиция диффеоморфизмов, является диффеоморфизмом некоторой окрестности точки щ. Его координатная запись, очевидно, имеет вид У = =u к~1 = f k~l = и к~\ Ук = =и" т.е. h — простейший диффеоморфизм.
592 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Но / = h о д, а по предположению индукции отображение д, опре- определенное формулами A7), раскладывается в композицию простейших диффеоморфизмов. Таким образом, диффеоморфизм /, меняющий к координат, в некоторой окрестности точки хо тоже раскладывается в композицию простейших диффеоморфизмов, что и завершает индук- индукцию. ► 5. Лемма Морса. К рассматриваемому кругу идей принадлежит также красивая сама по себе и важная в приложениях лемма Морса1) о локальном приведении гладкой вещественнозначной функции к кано- каноническому виду в окрестности невырожденной критической точки. Определение 4. Пусть xq —критическая точка функции / G G С^A1;Ш), определенной в окрестности U этой точки. Критическая точка Xq называется невырожденной критической точкой функции /, если гессиан функции в этой точке (т. е. матри- ца *— (xq), составленная из частных производных второго порядка) дх дх3 имеет отличный от нуля определитель. Если хо — критическая точка функции, т.е. f'(xo) = 0, то по фор- формуле Тейлора Лемма Морса утверждает, что локально можно сделать такую замену х = д(у) координат, что в координатах у функция / будет иметь вид (/ о д)(у) - f(xQ) - -(у1J - ... - (у*J + (yfc+1J + ... + (утJ- Если бы в правой части равенства A8) отсутствовал остаточный член о (||ж — Жо||2), т.е. разность f(x) — f(xo) была бы просто квадра- квадратичной формой, то, как известно из алгебры, линейным преобразова- преобразованием ее можно было бы привести к указанному каноническому виду. Таким образом, утверждение, которое мы собираемся доказать, есть локальный вариант теоремы о приведении квадратичной формы к ка- каноническому виду. Доказательство его будет использовать идею дока- 1JX. К. М. Морс A892-1977)—американский математик; основные труды посвя- посвящены применению топологических методов к различным разделам анализа.
§ 6. НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 593 зательства этой алгебраической теоремы. Мы будем опираться также на теорему об обратной функции и следующее предложение. Лемма Адамара. Пусть f: U->Ш — функция класса C^(U;M), ^ 1, определенная в выпуклой окрестности U точки 0= @,..., 0) G и такая, что /@) = 0. Тогда существуют функции дг G С& (г = 1,... ,т) такие, что в U имеет место равенство гф\...,хт), A9) г=1 причем <ь@) = 4 Равенство A9)—это, в сущности, иная полезная запись уже из- известной нам формулы Тейлора с интегральным видом остаточного чле- члена. Оно вытекает из равенств о г=1 о если положить 1 х\...,хт) = J ^(tx\..., дг( То, что дг@) = -^4@) (ъ = 1, ...,т), очевидно, а то, что дг G дх G C^p~l\U; M), тоже нетрудно проверить. Но мы не будем сейчас зани- заниматься этой проверкой, поскольку в свое время будет доказано общее правило дифференцирования интеграла, зависящего от параметра, из которого нужное нам свойство функций дг будет непосредственно вы- вытекать. Таким образом, с точностью до указанной проверки, формула Ада- Адамара A9) установлена. ► Лемма Морса. Если f:G—> Ш — функция класса C^(G;M), оп- определенная на открытом множестве G С Мш, а хо G G —невыро- —невырожденная критическая точка этой функции, то найдется такой диф- диффеоморфизм д: V —> U некоторой окрестности начала координат 0 20-4573
594 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ пространства Мш на окрестность U точки хо, что для всех точек yev (/ ° 9){У) = /(хо) - [(У1J + ..- + (УкJ] + [(Ук+1J + ... + (УтJ] ■ ■4 Линейными заменами вопрос сводится к случаю, когда хо = 0 и f(xo) = 0, что мы в дальнейшем и будем считать выполненным. Поскольку хо = 0—критическая точка функции /, то в форму- формуле A9) дг@) = О (г = 1,... ,т). Тогда по той же лемме Адамара 3=1 где htJ — гладкие функции в окрестности точки 0, и, следовательно, f(x\...,xm)= ^xV/k,^1,...,^). B0) Подставляя здесь, если нужно, вместо h%3 функции hl3 = ^(h можем считать, что hl3 = hJt. Заметим также, что, в силу единственно- единственности тейлоровского разложения, из непрерывности функций htJ следует, 2 „2 что 1гг1@) = * @) и, значит, матрица (ht1@)) невырожденная. дх дх} Теперь функция / записана подобно квадратичной форме и мы хо- хотим, так сказать, привести ее к диагональному виду. Как и в классическом случае, будем действовать по индукции. Предположим, что существуют координаты и1,..., ит в окрестно- окрестности U\ точки 0 G К, т.е. диффеоморфизм х = ip(u) такой, что в координатах и1,..., ит т (/°Р)(«) = ±{и1J ±...± (иг~1J+ ^ и1и>Нч(и},...,ит), B1) г,3=г где г ^ 1, а Нгз = Нзг. Заметим, что при г = 1 соотношение B1) имеет место, что видно из формулы B0), где HtJ = hl3. т По условию леммы, квадратичная форма Y2 xlx3hl3 @) невырожден- невырожденная, т.е. det(/i,j(O)) ф 0. Замена переменных х = ip(u) осуществля- осуществляется диффеоморфизмом, поэтому det</?'@) Ф 0. Но тогда и матрица
§ 6. НЕКОТОРЫЕ СЛЕДСТВИЯ ТЕОРЕМЫ О НЕЯВНОЙ ФУНКЦИИ 595 т формы i^1J ± ... ± (ur~1J + Y1 иги3Нц@), получаемая из матри- г,з=г цы {htJ@)) домножением справа на матрицу <£>'@) и слева на транс- транспонированную по отношению к у?'@) матрицу, тоже невырожденная. Следовательно, по крайней мере одно из чисел HtJ@) (i,j = r,... ,т) т отлично от нуля. Линейной заменой переменных форму £) и1и3Нг]@) 1,]=Г можно привести к диагональному виду, поэтому можно считать, что в равенстве B1) Ягг@) ф 0. Ввиду непрерывности функций HtJ(u) нера- неравенство Нгг(и) ф 0 будет выполнено также в некоторой окрестности точки и = 0. Положим ф(и1,...,ит) = ^\Нгг(и)\. Тогда функция ф принадлежит классу C^(U2\R) в некоторой окрестности Иг С U\ точки и = 0. Сде- Сделаем теперь переход к координатам (v1,... ,vm) по формулам B2) Якобиан преобразования B2) в точке и = 0, очевидно, равен ф@), т. е. отличен от нуля. Тогда в силу теоремы об обратной функции мож- можно утверждать, что в некоторой окрестности Щ С [/г точки и = 0 отображение v = ф{и), заданное соотношениями B2), является диф- диффеоморфизмом класса С^С^К) и потому переменные (v1,... ,vm) действительно могут служить координатами точек Щ- Выделим в правой части равенства B1) все члены ururHrr{u\...,um) + 2 Y, иги'Яг,(и1,...|ит), B3) содержащие иг. В записи B3) суммы этих членов мы использовали то, что HtJ = HJt. Сравнивая B2) и B3), видим, что выражение B3) можно переписать в виде Знак ± перед vrvr появляется в связи с тем, что Нгг = ±(фJ, причем берется знак плюс, если Нгг > 0, и знак минус, если Нгг < 0.
596 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Таким образом, после замены v — ф{и) выражение B1) преобразу- преобразуется в равенство г=1 г,]>г где HtJ — некоторые новые гладкие функции, симметричные по индек- индексам г, j. Отображение роф~1 является диффеоморфизмом. Таким обра- образом, завершен индуктивный переход от г — 1 к г и лемма Морса дока- доказана. ► Задачи и упражнения 1. Вычислите якобиан перехода F) от полярных координат к декартовым координатам в М™. 2. а) Пусть хо—некритическая точка гладкой функции F: U -> Ш, опре- определенной в окрестности U точки х0 = (#о>- • • >xcT) e ^m- Покажите, что в некоторой окрестности U С U точки хо можно так ввести криволинейные координаты (С1. • • • ,£т), что множество точек, выделяемое условием F(x) = = F(xo), в этих новых координатах будет задаваться уравнением £т — 0. Ь) Пусть ip, ф € С(к) (D; Ж) и пусть в области D (ip(x) = 0) =^ (ф(х) = 0). Покажите, что если grad tp ф 0, то в D справедливо разложение «/> = в ■ <р, где в е Cik-l^(D;R). 3. Пусть /: R2 -> R2 —гладкое отображение, удовлетворяющее системе уравнений Коши-Римана д£_ = д£ df1 df2 дх1 ~ дх2 ' дх2 ~ dx*' a) Покажите, что якобиан такого отображения равен нулю в некоторой точке тогда и только тогда, когда матрица f'(x) в этой точке нулевая. b) Покажите, что если f'{x) ф 0, то в окрестности точки х определено обратное к / отображение /""*, которое также удовлетворяет системе урав- уравнений Коши-Римана. 4. Зависимость функций (прямое доказательство). a) Покажите, что функции ж1(х) = хг (г = 1,... ,т) как функции точки х = (х1,..., хт) € Rm образуют независимую систему функций в окрестности любой точки пространства Кт. b) Покажите, что, какова бы ни была функция / € С(КП;Е), система тг1,..., ттт, / функционально зависима. c) Если система гладких функций Z1,...,/*, k < m, такова, что ранг отображения / = (/*,..., /*) в точке Хо = (xj,...,х™) £ Жт равен к, то в не- некоторой окрестности этой точки ее можно дополнить до независимой системы f1,..., /m, состоящей из т гладких функций.
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 597 d) Если система ё = Г(х\...,Хт) (i = l,...,fl») гладких функций такова, что осуществляемое ею отображение / = (f\ ..., /m) имеет в точке хо = (х\,...,х™) ранг т, то переменные (£*, •••>£"*) могут служить криволинейными координатами в некоторой окрестности U(xo) точ- точки х0 и любая функция ip: U(x0) -> R может быть записана в виде tp(x) = е) Ранг отображения, осуществляемого системой гладких функций, назы- называют также рангом этой системы. Покажите, что если ранг системы гладких функций /г(х1,... ,хт) (г = l,...,fc) равен к и ранг системы f1,. ..,/m,¥> тоже равен к в некоторой точке хо € Шт, то в окрестности этой точки ip(x) = Указание. Используйте с), d) и покажите, что 5. Покажите, что ранг гладкого отображения /: ffim -> ffi" является функ- функцией, полунепрерывной снизу, т. е. rang f(x) ^ rang f(xo) в окрестности точки 6. а) Дайте прямое доказательство леммы Морса для функций /: R -> К. b) Выясните, применима ли лемма Морса в начале координат к функциям f(x) = х3; f(x) = xsin -; f(x) = e'1^ sin2 -; X X f(x,y)=x3-3xy2; f(x,y)=x2. c) Покажите, что невырожденные критические точки функции • / £ € СC) (Rm; R) являются изолированными: каждая из них имеет такую окрест- окрестность, в которой нет других критических точек функции /, кроме самой этой точки. d) Покажите, что число к отрицательных квадратов в каноническом пред- представлении функции в окрестности невырожденной критической точки не за- зависит от способа приведения, т. е. от системы координат, в которой функция имеет канонический вид. Это число называется индексом критической точки. § 7. Поверхность в Rn и теория условного экстремума Для неформального понимания важной в приложениях теории услов- условного экстремума весьма полезно иметь некоторые начальные сведения о поверхностях (многообразиях) в пространстве К".
598 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 1. Поверхность размерности к в К". Обобщая понятие закона движения х = x(t) материальной точки, мы в свое время ввели поня- понятие пути в Кп как непрерывного отображения Г: I —> Ш1 промежутка / С I Степень гладкости пути определялась как степень гладкости этого отображения. Носитель ГG) С Кп пути мог быть довольно при- причудливым множеством в Кп, которое иногда только с очень большой натяжкой можно было бы назвать линией. Например, носитель пути мог оказаться просто точкой. Аналогично, непрерывное или гладкое отображение /: /* ->■ W /г-мерного промежутка 1к С Жк, называемое к-путем в Шп, может иметь в качестве образа /(/*) совсем не то, что хотелось бы назвать fc-мерной поверхностью в К". Например, это снова может быть точка. Чтобы гладкое отображение /: G ->■ Кп об- области G СШк определяло в К" fc-мерную геоме- геометрическую фигуру, точки которой описывают- описываются к независимыми параметрами (t1,...,^) 6 € G, достаточно, как мы знаем из предыдущего параграфа, потребовать, чтобы в каждой точке t G G ранг отображения /: G ->■ Ш1 был равен к (разумеется, к ^ п). В этом случае отображе- отображение /: G —> f(G) локально (т.е. в окрестности любой точки t G G) является взаимно однозначным. Действительно, пусть rang/(<o) = к и он реализуется, например, на первых к из п функций A) xn = fn(t\...,tk), задающих координатную запись отображения /: G —> W1. Тогда по теореме об обратной функции переменные t1,... ,tk в не- некоторой окрестности U(to) точки to можно выразить через переменные ж1,... ,хк. Значит, множество f{U(to)) может быть записано в виде X ~ (т. е. оно взаимно однозначно проектируется на координатную плос- плоскость х1,... ,хк), и потому отображение /: U(to) ->■ f{U(to)) действи- действительно взаимно однозначное.
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 599 Однако уже на примере одномерного гладкого пути (рис.61) ясно, что подобная локальная взаимная однозначность отображения /: G —> —>• W1 из области G параметров в пространство Кп вовсе не обяза- обязана быть взаимной однозначностью в целом. Траектория может иметь многократные самопересечения, поэтому если мы желаем определить гладкую /г-мерную поверхность в К" и видеть ее как множество, кото- которое около каждой своей точки устроено как несколько деформирован- деформированный кусок /г-мерной плоскости (fc-мерного подпространства простран- пространства К"), то нам не достаточно регулярно отображать канонический кусок G сШк fc-мерной поверхности в пространство Кп, но необходимо также следить за тем, как он в целом оказывается вложенным в это пространство. Определение 1. Множество S С Ш1 будем называть к-мерной гладкой поверхностью в пространстве Кп (или k-мерным подмного- подмногообразием Кп), если для любой точки хо £ S найдутся окрестность U(xq) в Кп и диффеоморфизм ip: U(xq) —> In этой окрестности на стан- стандартный n-мерный промежуток 1п = {t G К" | |**| < 1, i = 1,...,п} пространства М", при котором образ множества S П U(xq) совпадает с лежащей в / частью /г-мерной плоскости пространства Кп, задаваемой соотношениями tk+1 = 0, ... , tn = 0 (рис. 62). Щх0) -1 tn 1 -1 Г У 0 1 t1 Рис. 62. Степень гладкости поверхности S будем измерять степенью глад- гладкости диффеоморфизма ip.
600 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если смотреть на переменные t1,..., tn как на новые координаты в окрестности U(xo), то определение 1 в сокращенном варианте можно переформулировать следующим образом: множество S С Кп называ- называется /г-мерной поверхностью (А;-мерным подмногообразием) в Кп, если для любой точки xq £ S можно указать окрестность U{xq) и такие ко- координаты t1,..., tn в ней, что множество Sn U{xq) в этих координатах задается соотношениями tk+1 = ...=tn = 0. Роль стандартного промежутка в определении 1 чисто условная и примерно такая же, как роль стандартного размера или формы страни- страницы в географическом атласе. Каноническое расположение промежутка в системе координат t1,..., tn также относится к области стандартиза- стандартизации и не более того, поскольку любой куб в Ш1 дополнительным линей- линейным диффеоморфизмом всегда можно преобразовать в стандартный n-мерный промежуток. Этим замечанием мы часто будем пользоваться, сокращая проверку того, что некоторое множество S С М" является поверхностью в W1. Рассмотрим примеры. Пример 1. Само пространство Кп является n-мерной поверхно- поверхностью класса С^°°'. В качестве отображения ip: Kn —» 1п здесь можно взять, например, отображение 2 С — — arctg хг (г = 1,..., п). Пример 2. Построенное в примере 1 отображение заодно уста- устанавливает, что подпространство векторного пространства К", задава- задаваемое условиями хк+1 = ... = хп = 0, является /г-мерной поверхностью в Кп (или к-мерным подмногообразием К"). Пример 3. Множество в К", задаваемое системой соотношений а\х1 + ... + а\хк + al+lxk+1 + ... + alnxn = 0, апк~кхк + al~kxk+1 + ... + а^кхп = 0 при условии, что ранг этой системы равен п — к, является /г-мерным подмногообразием Кп.
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 601 Действительно, пусть, например, определитель а k+l •■■ ап отличен от нуля. Тогда линейное преобразование tk = х\ очевидно, является невырожденным. В координатах t1,..., tn наше мно- множество задается условиями tk+1 = ... = tn = 0, уже рассмотренными в примере 2. Пример 4. График определенной в некоторой области G С Kn-1 гладкой функции хп = /(ж1,..., хп~1) является гладкой (п — 1)-мерной поверхностью в W. Действительно, полагая мы получаем систему координат, в которой график нашей функции имеет уравнение tn = 0. Пример 5. Окружность х2 + у2 — 1 в R2 является одномерным подмногообразием в К2, что устанавливается разобранным в предыду- предыдущем параграфе локально обратимым переходом к полярным координа- координатам (р, <р), в которых окружность имеет уравнение р = 1. Пример 6. Этот пример является обобщением примера 3 и вместе с тем, как видно из определения 1, дает общую форму координатной записи подмногообразий пространства Кп.
602 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Пусть Ft(x1,..., хп) (г = 1,..., п — к) —система гладких функций ранга п — к. Покажем, что соотношения F\x\...,xk,xk+\...,xn) = 0, B) Fn-k(x1,...,xk,xk+\...,xn)=0 задают в Кп подмногообразие S размерности к. Пусть в точке xq € S выполнено условие dF1 dF1 Ф о- C) ax*+1 dFn~k dxk+1 '" дхп gpn-k дхп Тогда преобразование Г«* = а* (х = 1,..., А), в силу теоремы об обратной функции является диффеоморфизмом не- некоторой окрестности рассматриваемой точки. В новых координатах t1,..., tn исходная система будет иметь вид tk+1 = ... = tn = 0; таким образом, S является /г-мерной гладкой по- поверхностью в Кп. Пример 7. Множество Е точек плоскости К2, удовлетворяющих уравнению х2 — у2 = 0, состоит из двух прямых, пересекающихся в начале координат. Это множество не является одномерным подмного- подмногообразием К2 (проверьте!) именно из-за указанной точки пересечения. Если удалить из Е начало координат 0 6 К2, то множество Е\0 уже, очевидно, будет удовлетворять определению 1. Заметим, что множество Е\0 несвязно. Оно состоит из четырех не имеющих общих точек лучей. Таким образом, удовлетворяющая определению 1 /г-мерная поверх- поверхность в К" может оказаться несвязным подмножеством, состоящим из некоторого числа связных компонент (и уже эти компоненты являют- являются связными fc-мерными поверхностями). Часто под поверхностью в Кп понимают именно связную /г-мерную поверхность. Сейчас нас будут ин- интересовать проблемы отыскания экстремумов функций, заданных на
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 603 поверхностях. Это локальные проблемы, поэтому в них условие связно- связности поверхности не проявляется. Пример 8. Если гладкое отображение /: G —> W1 области G С С Кп, задаваемое в координатном виде соотношениями A), имеет в точке to £ G ранг к, то найдется такая окрестность U(to) С G этой точ- точки, образ f{U(to)) С К" которой является гладкой поверхностью в Кп. Действительно, как уже отмечалось выше, в этом случае соотно- соотношения A) могут быть в некоторой окрестности Е/(<о) точки to £ G заменены эквивалентной им системой соотношений D) xn =ipn(x1,...,xk) (для упрощения записи мы считаем, что уже система функций f1,..., fk имеет ранг к). Полагая pit I „п\ _ k+i _ k+i( \ к\ (i — Л п — k\ записываем систему D) в виде B). Поскольку соотношение C) выпол- выполнено, то в силу примера 6 множество f(U(to)) действительно является /г-мерной гладкой поверхностью в Кп. 2. Касательное пространство. При рассмотрении закона дви- движения х = x(t) материальной частицы в К3, исходя из соотношения x(t) = х@) + x'@)t + o(t) при * -)■ 0 E) и считая, что точка t = 0 не является критической для отображения Ш. Э t >->■ x(t) £ К3, т. е. х'@) ф 0, мы определили прямую, касательную к траектории в точке ж@), как линейное подмножество в К3, задаваемое в параметрическом виде уравнением х - хо = x'@)t F) или уравнением х - хо = С ■ t, G) где хо = х@), а £ = х'@) —направляющий вектор прямой.
604 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В сущности, аналогичную вещь мы делали, определяя плоскость, ка- касательную к графику функции z = f(x,y) bR3. Действительно, допол- дополнив соотношение z = f{x,y) тривиальными равенствами х — х, у = у, мы получаем отображение К2 Э {х,у) •->■ (x,y,f(x,y)) € К3, касатель- касательным к которому в точке (хо,уо) является линейное отображение где z0 = f(xo,yo). Полагая здесь t = (х—хо,у—уо), х = (x—xo,y—yo,z—zo) и обозначая через х'@) указанную в (8) матрицу Якоби рассматриваемого отобра- отображения, замечаем, что ее ранг равен двум и что в этих обозначениях соотношение (8) имеет вид F). Особенность соотношения (8) состоит в том, что из трех равенств: X — Xq = X — Хо, У - Уо = У - Уо, (9) z- zo = fx(xo,yo){x - хо) + fy(xo,yo){y - уо), совокупности которых оно равносильно, только последнее нетривиаль- нетривиально. Поэтому именно оно осталось у нас как уравнение, задающее плос- плоскость, касательную к графику функции z — f(x,y) в точке (xo,yo,zo). Сделанное наблюдение можно использовать, чтобы теперь дать оп- определение fc-мерной плоскости, касательной к fc-мерной гладкой поверх- поверхности S CW1. Из определения 1 поверхности видно, что в окрестности любой своей точки хо £ S fc-мерная поверхность S может быть задана параметри- параметрически, т.е. с помощью отображения /* Э (t1,...,^) >-> (ж1,... ,хп) 6 G S. В качестве такового может выступать ограничение отображения ip'1: In -> U(xo) на /г-мерную плоскость tk+1 = ... — tn = 0 (см. рис. 62). Поскольку ip~l —диффеоморфизм, то якобиан отображения (р~1 : 1п —> U(xo) в любой точке куба 1п отличен от нуля. Но тогда ранг отображения /* э (t1, ...,tk) ■-»■ (ж1,..., хп) G S, полученного ограниче- ограничением tp~l на указанную плоскость, должен быть равен к в любой точке куба /*. Полагая теперь (t1,... ,tk) = tGIk и обозначая отображение /* Эt н> 4i£ S через х = x(t), получаем локальное параметрическое пред-
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 605 ставление поверхности S, обладающее свойством, выраженным равен- равенством E), на основании которого уравнение F) принимаем в качестве уравнения касательного пространства или касательной плоскости к по- поверхности 5cln в точке хо G S. Итак, мы принимаем следующее Определение 2. Если fe-мерная поверхность 5 С М™, l^fe^n, в окрестности точки хо G S задана параметрически с помощью гладкого отображения (i1,...,**) = t н-> х = (ж1,...,ж") такого, что х$ = ж@) и матрица ж'@) имеет ранг к, то fe-мерная плоскость в R", задавае- задаваемая параметрически матричным равенством F), называется касатель- касательной плоскостью или касательным пространством к поверхности S в точке хо G S. В координатной записи равенству F) соответствует система урав- уравнений (Ю) Пространство, касательное к поверхности S в точке х G S, будем, как и прежде, обозначать1) символом TSX. Важным и полезным упражнением, которое читатель может проде- проделать самостоятельно, является доказательство инвариантности опреде- определения касательного пространства и проверка того, что линейное ото- отображение t н-» x'@)t, касательное к отображению t н-» x(t), задающе- задающему локально поверхность S, осуществляет отображение пространства ]R* = TKq на плоскость TS^o) (см. задачу 3 в конце параграфа). Выясним теперь, как выглядит уравнение касательной плоскости к fe-мерной поверхности S, заданной в R" системой B). Будем для опре- определенности считать, что в окрестности рассматриваемой точки хо G S выполнено условие C). Полагая (х\...,хк) = и, (хк+\ .. .,хп) = v, (F1,..., Fn~k) = F, запишем систему B) в виде F(u,v)=0, (И) х'Это — небольшое отклонение от наиболее распространенного обозначения TXS илиТ1E).
606 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ а условие C) — в виде detF>,t,)#0. A2) В окрестности точки (щ, vq) = (х\,..., ж*, ж0+ ,...,Жд) по теореме о неявной функции перейдем от соотношения A1) к эквивалентному ему соотношению v = /(и), A3) дополняя которое тождеством и — и, получаем параметрическое пред- представление поверхности S в окрестности точки xq 6 S: На основании определения 2, из A4) получаем параметрическое уравнение Г и — щ = Е • t, \v-vo = f'(uo) ■ t касательной плоскости; здесь Е — единичная матрица, a t = и — uq. Подобно тому, как это было в случае системы (9), в системе A5) оставляем только нетривиальное уравнение v-vQ = f'(u0)(u-uQ), A6) которое и содержит в себе связи переменных ж1,..., хк с переменными хк+1,... ,хп, выделяющие касательное пространство. Пользуясь тем, что по теореме о неявной функции перепишем A6) в виде i^(«0, vQ)(u - щ) + F'v{u0, «о)(и - и0) = 0, откуда после возвращения к переменным (ж1,..., ж") = ж получаем ис- искомое уравнение ^(жо)(ж-жо) = О A7) касательного пространства TSXo С М".
§ 7 ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 607 В координатном представлении уравнение A7) равносильно системе уравнений дХ--п--- A8) (ггп — <rn\ — П \Jj — JUr\ I — U. Ранг этой системы по условию равен п — к, поэтому она задает fe-мерную плоскость в Rn. Аффинное уравнение A7) эквивалентно (если указана точка жо) век- векторному уравнению = O, A9) в котором £ = х — xq. Значит, вектор £ лежит в плоскости TSXQ, касательной в точке xq £ € S к поверхности S С R", заданной уравнением F(x) = 0, в том и толь- только в том случае, когда он удовлетворяет условию A9). Таким образом, TSXo можно рассматривать как векторное пространство векторов £, удовлетворяющих уравнению A9). Именно с этим обстоятельством и связан сам термин касательное пространство. Докажем теперь следующее, уже встречавшееся нам в его частном случае (см. § 4, п. 6) Утверждение. Пространство TSXo, касательное к гладкой по- поверхности S С Ж" в точке xq £ S, состоит из векторов, касательных в точке xq к гладким кривым, лежащим на поверхности S и проходя- проходящим через точку xq. < Пусть поверхность S в окрестности точки xq £ S задана в виде системы уравнений B), которую мы коротко запишем как F(x) = 0, B0) где F = {F1,.. .,Fn~k), х = (ж1,... ,хп). Пусть Г: / -* S — произволь- произвольный гладкий путь с носителем на S. Взяв J = {teM||t|<l}, будем считать, что ж@) = xq. Поскольку x(t) G S при t £ I, то после подста- подстановки x(t) в уравнение B0) получаем F(x(t)) = 0 B1)
608 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ при t G /. Дифференцируя это тождество по t, находим, что В частности, при t = 0, полагая £ = ж'@), получаем т. е. вектор £, касательный к траектории в точке хо (в момент t — 0), удовлетворяет уравнению A9) касательного пространства TSX0. Покажем теперь, что для любого вектора £, удовлетворяющего урав- уравнению A9), найдется гладкий путь Г: / —» S, который задает кривую на поверхности S, проходит при t = 0 через точку xq и имеет вектор ( своим вектором скорости в момент t = 0. Этим заодно будет установлено само существование гладких кри- кривых, проходящих на S через точку xq, которое мы неявно предполагали в уже проведенной первой части доказательства утверждения. Пусть для определенности выполнено условие C). Тогда, зная пер- первые к координат £х,... ,£к вектора £ = (£\... ,£fc,£fc+1,. • ■ ,£"), мы из уравнения A9) (равносильного системе A8)) однозначно определим ос- остальные его координаты £fc+1,. ..,£"• Таким образом, если для неко- некоторого вектора £ = (f1,... ,£fc,£fc+1, ■ ■ ■ ,£п) будет установлено, что он удовлетворяет уравнению A9), то можно заключить, что £ = £. Вос- Воспользуемся этим. Вновь, как это было сделано выше, введем для удобства обозначения u = (x\...,xk), v = (хк+\...,хп), х = (х\...,хп) = («,«), F(x) = = F(u,v). Тогда уравнение B0) будет иметь вид A1), а условие C) — вид A2). В подпространстве Жк С К" переменных хг,...,хк возьмем параметрически заданную прямую хк-хк = te с направляющим вектором (£х,..., £к), который мы обозначим через £и. В более коротких обозначениях эта прямая может быть записана в виде и = щ + Cut. B2)
§ 7. ПОВЕРХНОСТЬ В R" И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 609 Решая уравнение A1) относительно v, в силу теоремы о неявной функции получим гладкую функцию A3), подставляя в аргумент ко- которой правую часть равенства B2), с учетом самого равенства B2), получим гладкую кривую в Шп, заданную в следующем виде: te 17@) с К. B3) Поскольку F(u,f(u)) = 0, то, очевидно, эта кривая лежит на по- поверхности S. Кроме того, из равенств B3) видно, что при t = 0 кривая проходит через точку (щ, v0) = (ajj, • • •, ж§, %q+1, ..., Xq ) = xq G S. Дифференцируя по t тождество F(«(i), v(t)) = F(u0 + £ut, /(«o + ^u<)) = 0, при f = 0 получаем K K£v = 0, где £„ = u'@) = (^fc+15 • ■ ■ )£")• Это равенство показывает, что вектор I = (^u, L) = (С1, • • •,^, (fc+15 ■■-,(") удовлетворяет уравнению A9). Та- Таким образом, в силу сделанного выше замечания заключаем, что £ = £• Но вектор £ является вектором скорости при t = 0 для траектории B3). Тем самым высказанное утверждение доказано полностью. ► 3. Условный экстремум а. Постановка вопроса. Одним из наиболее ярких и популярных достижений дифференциального исчисления являются предлагаемые им рецепты отыскания экстремумов функций. Необходимые условия и достаточные дифференциальные признаки экстремума, которые мы получили из формулы Тейлора, относятся, как уже отмечалось, к вну- внутренним экстремумам. Иными словами, эти результаты применимы только к исследованию поведения функции Шп Э х н-> f(x) £ Ш в окрестности точки хо G Шп то- тогда, когда аргумент х может принимать любое значение из некоторой окрестности в Шп точки xq. Часто возникает более сложная и с практической точки зрения даже более интересная ситуация, когда ищется экстремум функции при не- некоторых условиях, ограничивающих область изменения аргумента. Ти- Типичным примером может служить изопериметрическая задача, когда 21-4573
610 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ищется тело, имеющее максимальный объем при условии, что ограни- ограничивающая его поверхность имеет заданную площадь. Чтобы получить доступную нам математическую запись такой задачи, упростим по- постановку и будем считать, что задача состоит в том, чтобы среди пря- прямоугольников, имеющих заданный периметр 2jo, найти тот, который имеет наибольшую площадь а. Обозначив через а; и у длины сторон прямоугольника, запишем, что а(х,у) =х-у, х + у=р. Итак, надо найти экстремум функции а(х,у) при условии, что пе- переменные х, у связаны соотношением х + у = р. Таким образом, экс- экстремум функции ищется только на множестве тех точек плоскости М2, которые удовлетворяют указанному соотношению. Эта конкретная за- задача, конечно, решается без труда: достаточно, записав, что у = р — х, подставить это выражение в формулу для а(х,у) и найти обычными методами максимум функции х(р — х). Она нам была нужна лишь для пояснения самой постановки вопроса. В общем случае задача на условный экстремум обычно состоит в том, чтобы найти экстремум вещественнозначной функции y = f(x\...,xn) B4) от п переменных при условии, что эти переменные удовлетворяют си- системе уравнений B5) Fm(xl,...,xn) =0. Поскольку мы собираемся получать дифференциальные условия экс- экстремума, мы будем предполагать, что все рассматриваемые функции дифференцируемы и даже непрерывно дифференцируемы. Если ранг системы функций jP1, ..., Fm равен п — к, то условия B5) задают в Шп некоторую А;-мерную гладкую поверхность 5ис геометрической точки зрения задача на условный экстремум состоит в отыскании экстремума функции / на поверхности S. Более точно, рассматривается ограниче- ограничение f\s функции / на поверхность S и ищется экстремум функции f\$-
§ 7. ПОВЕРХНОСТЬ В R" И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 611 Смысл самого понятия точки локального экстремума при этом, ко- конечно, остается прежним, т. е. точка хо G S считается точкой локаль- локального экстремума функции / на S или, короче, функции f\g, если най- найдется такая окрестность Us(xo) точки хо в множестве1) S С ШР1, что для любой точки х G {7,5(жо) выполнено неравенство f(x) ^ f(xo) (тогда хо — точка локального минимума) или f(x) ^ f(xo) (тогда xq — точка локального максимума). Если при х G Us{xq) \ xq указанные неравен- неравенства являются строгими, то экстремум, как и прежде, будем называть строгим. Ь. Необходимый признак условного экстремума Теорема 1. Пусть f: D —¥ №. — функция, определенная на откры- открытом множестве D с М" в принадлежащая классу C^(D;№). Пусть S — гладкая поверхность в D. Для того чтобы точка xq G S, некритическая для функции f, была точкой локального экстремума функции f\s, необходимо выполнение условия TSX0CTNX0, B6) где TSXo —пространство, касательное к поверхности S в точке xq, a TNX0 — пространство, касательное к поверхности N = {х G D | f(x) = f(xo)} уровня функции f, которому принадлежит xq. Заметим прежде всего, что требование, чтобы точка хо была некри- некритической для функции /, в контексте обсуждаемой задачи отыскания условного экстремума не является существенным ограничением. Дей- Действительно, если уж точка хо G D является критической точкой функ- функции /: D —>• М или точкой экстремума этой функции, то ясно, что она будет подозрительной точкой или соответственно точкой экстремума и для функции /|s. Таким образом, новый элемент в рассматриваемой за- задаче состоит именно в том, что функция /|s может иметь критические точки и экстремумы, отличные от критических точек и экстремумов функции /. •^ Возьмем произвольный вектор £ G TSXo и такой гладкий путь х = = x(t) на S, который проходит через точку xq при t = 0 и для которого ^Напомним, что Us(xo) = S П С/(жо), где U(xo) — окрестность точки хо в '.
612 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ вектор £ является вектором скорости при t = О, т. е. |<°> = *- <27> Если жо —точка экстремума функции f\s, то гладкая функция f(x(t)) должна при t = 0 иметь экстремум. По необходимому условию экстремума ее производная при t = 0 должна обращаться в нуль, т. е. должно выполняться условие f'(x0) ■ £ = 0, B8) где (й^) « = «'•■ ••■«"'• Поскольку жо — некритическая точка функции /, условие B8) рав- равносильно тому, что £ G TNXo, ибо именно соотношение B8) является уравнением касательного пространства TNX0. Таким образом, доказано, что TSXo С TNXo. ► Если поверхность S в окрестности точки xq задана системой урав- уравнений B5), то пространство TSXo, как нам известно, задается системой линейных уравнений §£<*.*'+-+£<*.>«•=с B9) Пространство TNXo задается уравнением и, поскольку всякое решение системы B9) является решением уравне- уравнения C0), последнее уравнение является следствием системы B9). Из этих соображений вытекает, что соотношение TSX0 С TNXo в аналитической записи равносильно тому, что вектор grad/(a;o) являет- является линейной комбинацией векторов gra,dFt(xo) (г = 1,..., т), т. е. C1) grad/(a;o) = ]Г A,grad.F'(a:o).
§ 7. ПОВЕРХНОСТЬ В Rn И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 613 Учитывая эту форму записи необходимого признака экстремума функции B4), переменные которой связаны соотношениями B5), Ла- гранж предложил при отыскании условного экстремума использовать следующую вспомогательную функцию: т L(z,A)=/(z)-J>F*(z) C2) i=i от п + т переменных (ж, А) = (ж1,... , ж™, Ai,..., Am). Эту функцию называют функцией Лагранжа, а метод ее использо- использования— методом множителей Лагранжа. Функция C2) удобна тем, что необходимые условия ее экстремума как функции переменных (ж, А) — (ж1,... , ж™, Ai,..., Am) в точности совпадают с условиями C1) и B5). Действительно, 1=1 C3) Таким образом, при отыскании экстремума функции B4), перемен- переменные которой подчинены связям B5), можно написать с неопределенны- неопределенными множителями функцию Лагранжа C2) и искать уже ее критические точки. Если есть возможность из системы C3) найти жо = (жр,..., Жц), не находя А = (Ai,..., Am), то с точки зрения исходной задачи именно это и следует делать. Как видно из соотношения C1), множители Аг (г = 1,... , т) опре- определяются однозначно, если только векторы gradF^o) (г = 1,...,т) линейно независимы. Независимость этих векторов равносильна тому, что ранг системы B9) равен т, т.е. что все уравнения этой системы существенны (ни одно из них не является следствием остальных). Это обычно выполнено, ибо считается, что все соотношения B5) независимы и ранг системы функций F1,..., Fm в любой точке ж G S равен т. Функцию Лагранжа часто записывают в виде г=1
614 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ который отличается от прежнего только несущественной заменой Хг на -Л,.1) Пример 9. Найдем экстремумы симметрической квадратичной формы f(x) = (ап = азг) г,3=1 на сфере C4) C5) Запишем функцию Лагранжа данной задачи: п / п \ Их, \)=Y, Ъз^х* -A J] {xf - 1 и, с учетом того, что агз = азг, необходимые условия экстремума функ- функции L(x, A): ^(z,A)=2 -ЛхЧ =0 C6) u=l Домножая первое уравнение на хг и суммируя затем все первые соот- соотношения, с учетом второго уравнения получим, что в точке экстремума должно быть выполнено равенство агйхгх3 — Л = 0. C7) Систему C6) без последнего уравнения можно переписать в виде C8) поводу необходимого признака условного экстремума см. также задачу б к § 7 гл. X (часть II)
§ 7. ПОВЕРХНОСТЬ ВГИ ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 615 откуда следует, что А — собственное значение линейного преобразова- преобразования А, задаваемого матрицей (агз), а х = (ж1,... ,хп)—собственный вектор этого преобразования, отвечающий этому собственному значе- значению. Поскольку непрерывная на компакте S = п 2 1 п|^] (хг) = 1 > функция C4) обязана принимать в некоторой его точке максимальное значение, система C6), а значит и система C8), должна иметь решение. Таким образом, мы попутно установили, что любая вещественная сим- симметрическая матрица (агз) имеет по крайней мере одно вещественное собственное значение. Это хорошо известный вам из линейной алге- алгебры результат, являющийся основным в доказательстве существования базиса из собственных векторов симметрического оператора. Чтобы указать геометрический смысл собственного значения А, за- заметим, что если А > 0, то, переходя к координатам tl = хг/\/\, вме- вместо C7) получим ] jftf = 1, C9) а вместо C5) — Е (О2 = \. D0) п п Но ^ (£гJ есть квадрат расстояния от точки t = (t1,..., tn) квадри- t=i ки C9) до начала координат. Таким образом, если, например, соотно- соотношение C9) задает эллипсоид, то величина 1/А, обратная к собственному значению А, является квадратом величины одной из его полуосей. Это полезное наблюдение. Оно, в частности, показывает, что соот- соотношения C6), необходимые для условного экстремума, еще не являют- являются достаточными: ведь, например, в М3 эллипсоид кроме наибольшей и наименьшей полуосей может иметь промежуточную по величине по- полуось, в любой окрестности конца которой есть как точки более близ- близкие к началу координат, так и более далекие от него в сравнении с расстоянием от конца полуоси до начала координат. Последнее стано- становится совсем очевидным, если рассмотреть эллипсы, получающиеся в сечении исходного эллипсоида двумя плоскостями, проходящими через промежуточную полуось и меньшую или большую полуоси эллипсоида
616 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ соответственно. В одном из этих случаев промежуточная полуось бу- будет большей из двух полуосей эллипса сечения, а в другом случае — меньшей полуосью. К сказанному следует добавить, что если 1/\/А есть величина этой промежуточной полуоси, то, как видно из канонического уравнения эл- эллипсоида, величина А, очевидно, будет собственным значением преобра- преобразования А, поэтому система C6), выражающая необходимые условия экстремума функции f\s, действительно будет иметь решение, не даю- дающее экстремума этой функции. Полученный в теореме 1 результат (необходимый признак условно- условного экстремума) проиллюстрирован на рис. 63, а, Ь. Ъ. Рис. 63. Первый из этих рисунков поясняет, почему точка xq поверхности S не может быть точкой экстремума функции f\s, если S не касается поверхности N = {х € W1 \ f(x) = f(xo) = со} в точке хо. При этом предполагается, что grad/(a;o) ф 0. Последнее условие гарантирует то, что в окрестности точки хо имеются точки как более высокого С2-уров- ня функции /, так и точки более низкого Ci-уровня этой функции. Поскольку гладкая поверхность S пересекает поверхность N, т.е. со-уровень гладкой функции /, то S будет пересекать как более высо- высокие, так и более низкие уровни функции / в окрестности точки х$. Но это и означает, что xq не может быть точкой экстремума функции f\s- Второй рисунок показывает, почему при касании N и S в точке xq эта точка может оказаться точкой экстремума. На рисунке хо — точка локального максимума функции f\s- Эти же соображения позволяют нарисовать картинку, аналитиче- аналитическая запись которой может показать, что необходимый признак услов- условного экстремума не является достаточным.
§ 7. ПОВЕРХНОСТЬ ВГИ ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 617 Действительно, в соответствии с рис. 64 положим, например, f(x,y)=y, F(x,y) = x3-y = 0. Тогда очевидно, что на кривой 5CR2, заданной уравнением у — х3, величина у не имеет экстремума в точ- g I ке @,0), хотя эта кривая касается линии у уровня f(x, у) = 0 функции / в этой точ- Со —-^ N ке. Заметим, что grad/@,0) = @,1) ф 0. ci /г^ — Очевидно, это по существу тот же при- / мер, который нам в свое время служил для иллюстрации различия между необходи- Рис- 64. мым и достаточным условиями классического внутреннего экстремума функции. с. Достаточный признак условного экстремума. Докажем те- теперь следующий достаточный признак наличия или отсутствия услов- условного экстремума. Теорема 2. Пусть f: D —> Ш. — функция, определенная на откры- открытом множестве D СШп и принадлежащая классу С^(£);М); S — по- поверхность в D, заданная системой уравнений B5), где Fl G C^(D;R) (i = l,...,m) и ранг системы функций {F1,... ,Fm} в любой точке области D равен т. Пусть в функции Лагранжа L(x) = L(x;\) = f(x\...,xn) -£А^(х\... ,хп) г=1 параметры Ai,...,Am выбраны в соответствии с необходимым при- признаком C1) условного экстремума функции f\s в точке Хо G S.1^ Для того чтобы при этом точка хо была точкой экстремума функции f\s, достаточно, чтобы квадратичная форма о2 г ^Ч> D1) была знакоопределенной для векторов £ G TSXo. ^Фиксировав А, мы получаем из L(x; А) функцию, зависящую только от х; мы позволили себе обозначать ее через L{x).
618 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Если форма D1) положительно определена на TSXo, то хо —точ- —точка строгого локального минимума функции f\s; если форма D1) от- отрицательно определена на TSXo, то хо —точка строгого локального максимума функции f\s- Для того чтобы точка хо не была точкой экстремума функции f\§, достаточно, чтобы форма D1) принимала на TSXo значения разных знаков. ■4 Отметим прежде всего, что L(x) = f(x) для х € S, поэтому, показав, что точка хо € S является точкой экстремума функции L\s, мы одновременно покажем, что она является точкой экстремума функ- функции f\s. По условию необходимый признак C1) экстремума функции f\s в точке хо € S выполнен, поэтому в этой точке gradL(a;o) = 0. Зна- Значит, тейлоровское разложение функции L(x) в окрестности точки хо = = (жд,..., Xq ) имеет вид L(x) - L(x0) = ^-^^Ы (xf - х\) (а> - xi) + о {\\х - xof) D2) При X —> Х(). Напомним теперь, что, мотивируя определение 2, мы отметили воз- возможность локального (например, в окрестности точки хо G S) параме- параметрического задания гладкой fc-мерной поверхности S (в нашем случае к = п — т). Иными словами, существует гладкое отображение МЭ {t\...,tk) = t^yx = (х\...,хп) 6Г (мы будем его, как и прежде, записывать в виде х = x(t)), при кото- котором окрестность точки 0 = @,..., 0) 6 1* биективно преобразуется в некоторую окрестность точки хо на поверхности S, причем хо = х@). Заметим, что соотношение x{t)-x@) = x'@)t + {\\t\\) при г->0, выражающее дифференцируемость отображения t ь* x(t) в точке t = 0, равносильно п координатным равенствам дтг *•(*) - Л0) = g^(O)ta + о (\\t\\) (г = 1,..., п), D3)
§ 7. ПОВЕРХНОСТЬ ВК"И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 619 в которых индекс а пробегает целые значения от 1 до к и по нему происходит суммирование. Из этих числовых равенств следует, что \xl(t)-xl@)\=O(\\t\\) при i^O и, значит, 1И*) - ФЖп = О (\\t\\Rk) при * -> 0. D4) Используя соотношения D3), D4), из равенства D2) получаем, что при t —> 0 L(x(t)) - L(x@)) = ±дг3Ь(хо)дахЧО)д0Х>(О)П(> + о {\\t\\2). D2') Отсюда при условии знакоопределенности формы fi D5) следует, что функция L(x(t)) имеет при t = 0 экстремум. Если же фор- форма D5) принимает значения разных знаков, то L(x(t)) при t = 0 экс- экстремума не имеет. Но, поскольку при отображении t »-»■ x(t) некоторая окрестность точки 0 G Rk преобразуется в окрестность точки х@) = = хо G S на поверхности S, можно заключить, что тогда и функция L\s в точке хо либо будет иметь экстремум, причем того же характера, что и функция L(x(t)), либо, как и L(x(t)), не будет иметь экстремума. Итак, остается проверить, что для векторов £ G TSX0 выражения D1) и D5) просто являются разными записями одного и того же объ- объекта. Действительно, полагая мы получаем вектор £, касательный к S в точке хо, и если £ = ), *=(<1,...,t*))TO откуда и следует совпадение величин D1), D5). ► Отметим, что практическое использование теоремы 2 затруднено тем, что среди координат вектора £ = (£х,... ,£") G TSX0 только к = = п — тп независимых, поскольку координаты вектора £ должны удовле- удовлетворять системе B9), определяющей пространство TSX0. Таким обра- образом, непосредственное применение к форме D1) критерия Сильвестра
620 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ в нашем случае, вообще говоря, ничего не дает: форма D1) может не быть определенной на ТМ£0, но оказаться определенной на TSXo. Если же из соотношений B9) выразить тп координат вектора £ через осталь- остальные к координат и полученные линейные формы подставить в D1), то мы придем к квадратичной форме относительно к переменных, опре- определенность которой уже можно исследовать с помощью критерия Силь- Сильвестра. Поясним сказанное простейшими примерами. Пример 10. Пусть в пространстве К3 с координатами х, у, z за- задана функция f(x,y,z) = x2-y2 + z2. Ищется экстремум этой функции на плоскости S, заданной уравне- уравнением F(x,y,z) = 2х-у-3 = 0. Записав функцию Лагранжа L(x, у, z) = (х2 -у2 + z2) - \{2х - у - 3) и необходимые условия экстремума — = 2х - 2А = 0, дх находим подозрительную точку р = B,1,0). Далее находим форму D1): D6) Отметим, что в данном случае параметр А не вошел в эту квадра- квадратичную форму, поэтому мы его и не вычисляли. Записываем теперь условие £ G TSp: - £2 = 0. D7)
§ 7. ПОВЕРХНОСТЬ ВГИ ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 621 Из этого равенства находим £2 = 2£х и подставляем в форму D6), после чего она приобретает вид -Ч?J+ (?)*> где на сей раз £1 и £3 — независимые переменные. Последняя форма, очевидно, может принимать значения разных зна- знаков, поэтому в точке р € S функция f\s экстремума не имеет. Пример 11. В условиях примера 10 заменим Ш3 на М2 и функ- функцию / на f{x, у) = х2-у2, сохранив условие 2х - у - 3 = 0, которое теперь задает прямую S в плоскости М2. В качестве подозрительной найдем точку р = B,1). Вместо формы D6) получим форму (ef - (ef D8) с прежним соотношением D7) между £х и £2. Таким образом, на TSP форма D8) теперь имеет вид -не?. т. е. является отрицательно определенной. Отсюда заключаем, что точ- точка р = B,1) является точкой локального максимума функции f\s- Весьма поучительны во многих аспектах следующие простые при- примеры, на которых можно отчетливо рассмотреть механизм работы как необходимых, так и достаточных условий экстремума, в том числе роль параметра и неформальную роль самой функции Лагранжа. Пример 12. На плоскости М2 с декартовыми координатами (ж, у) дана функция f(x,y) = x2 + y2. Найдем экстремумы этой функции на эллипсе, заданном канониче- каноническим соотношением где 0 < а < Ь.
622 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Из геометрических соображений очевидно, что min/|s = а2, max/|s = Ъ2. Получим это, опираясь на рекомендации теорем 1 и 2. Записав функцию Лагранжа и решая уравнение dL = 0, т. е. систему —^ = ~- = —^ = 0, находим ее решения: (х,у,А)-(±а,0,а2), @,±Ь,Ь2). Теперь в соответствии с теоремой 2 выпишем и исследуем квадра- квадратичную форму -сРЬ£* — второй член тейлоровского разложения функ- функции Лагранжа в окрестности соответствующих точек: В точках (±а, 0) эллипса S касательный вектор £ = (£1>£2) имеет вид @,£2), а квадратичная форма при А = а2 принимает вид О-£)«■>'■ Учитывая условие 0 < а < Ь, заключаем, что эта форма положи- положительно определена и, значит, в точках (±а, 0) G S имеется строгий локальный (а здесь, очевидно, и глобальный) минимум функции f\s, т.е. min/ls = a2. Аналогично находим форму отвечающую точкам @,±6) G S, и получаем max/Is = б2. Замечание. Обратите здесь внимание на роль функции Лагранжа в сравнении с ролью функции /. В соответствующих точках на ука- указанных касательных векторах дифференциал функции / (как и диф- дифференциал L) обращается в нуль, а квадратичная форма id2/^2 = 0 0 = (£Х) + (£2) положительно определена, в какой бы из этих точек ее ни вычислять. Тем не менее функция f\s в точках (±а,0) имеет строгий минимум, а в точках (О, ±Ь) — строгий максимум.
§ 7. ПОВЕРХНОСТЬ ВГИ ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 623 Чтобы понять, в чем тут дело, просмотрите еще раз доказательство теоремы 2 и попробуйте, заменив в D2) L на /, получить соотноше- соотношение D2'). Заметьте, что при этом у вас появится дополнительный член, содержащий х"@). Он не исчезнет в связи с тем, что в отличие от dL дифференциал df функции / в соответствующих точках не есть тожде- тождественный нуль, хотя на касательных векторах (вида х'@)) его значения действительно равны нулю. Пример 13. Найдем экстремумы функции f(x,y,z) = x2 + y2 + z2 на эллипсоиде S, заданном соотношением 9 9 9 Fix v z) = ~ + — + - 1-0 где 0 < а < Ь < с. Записав функцию Лагранжа в соответствии с необходимым признаком экстремума находим реше- решения уравнения dL = 0, т. е. системы |^ = |^ = || = || = 0: (x,y,z,X) = (±a,0,0,a2), @,±Ь,0,Ь2), @,0,±с,с2). Квадратичная форма в каждом из этих случаев на соответствующей касательной плоскости имеет вид £3J, (а)
624 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Поскольку 0 < а < Ъ < с, то на основании теоремы 2, дающей доста- достаточный признак наличия или отсутствия условного экстремума, можно заключить, что в случаях (а) и (с) мы нашли соответственно min/|,s = = а2 и max/|s = с2, а в точках (О, ±Ь, 0) G S, отвечающих случаю (Ь), функция f\s экстремума не имеет. Это вполне согласуется с очевидны- очевидными геометрическими соображениями, высказанными по этому поводу при обсуждении необходимого признака условного экстремума. Некоторые дальнейшие, порой весьма полезные стороны встретив- встретившихся в этом параграфе понятий анализа и геометрии, в том числе фи- физическая интерпретация самой задачи об условном экстремуме, а также его необходимого признака C1) как разложения сил в точке равновесия и интерпретация множителей Лагранжа как величин реакций идеаль- идеальных связей, представлены в приведенных ниже задачах и упражнениях. Задачи и упражнения 1. Путь и поверхность. a) Пусть /: / -> I2 —отображение класса С^)(/;Е2) интервала / С Е. Рассматривая это отображение как путь в Е2, покажите на примере, что его носитель /(/) может не быть подмногообразием в!2,а вот график этого ото- отображения в Е3 = Е1 х Е2 всегда является одномерным подмногообразием Е3, проекцией которого в Е2 является носитель /(/) указанного пути. b) Решите задачу а) в случае, когда / — промежуток в Е*, а / € С^ (J; Е"). Покажите, что в этом случае график отображения /: / -> Е" является гладкой fc-мерной поверхностью в R* х Еп, проекция которой на подпространство Е" совпадает с /(/). c) Проверьте, что если fi'.Ii —t 5 и /2: /2 —> S — две гладкие параме- параметризации одной и той же fc-мерной поверхности Set", причем ни Д в Д, ни /2 в /г не имеют критических точек, то определенные при этих условиях отображения /Г1 о /а: h -> h, Л о /l = h -> h являются гладкими. 2. Сфера в Еп. a) На сфере S2 = {х е Ш3 \ \\x\\ = 1} укажите какую-нибудь максимальную область действия криволинейных координат ((р,ф), полученных из полярных координат в Е3 (см. формулу E) предыдущего параграфа) при /9=1. b) Ответьте на вопрос а) в случае (т — 1)-мерной сферы 5™-1 = {х е Ет | ||х|| = 1} в Шт и координат (<pi,..., <pm-i) на ней, получаемых из полярных координат в Жп (см. формулы F) предыдущего параграфа) при /9=1.
§ 7. ПОВЕРХНОСТЬ ВК"И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 625 c) Можно ли сферу Sk С Шк+1 задать одной системой координат (t1,. ..,tk), т. е. одним диффеоморфизмом /: G -> Шк+1 области G СШк? d) Какое наименьшее количество карт должно быть в атласе поверхности Земли? e) Расстояние между точками сфе- сферы S2 С Ш3 будем измерять длиной кратчайшей кривой, лежащей на сфе- сфере S2 и соединяющей эти точки. Такой кривой является дуга соответствую- соответствующего большого круга. Может ли суще- существовать такая локальная плоская кар- карта сферы, что все расстояния между точками сферы были бы пропорцио- _ / j.j. Рис. 65. нальны (с одним и тем же коэффици- коэффициентом пропорциональности) расстояниям между их изображениями на карте? f) Углом между кривыми (лежащими или не лежащими на сфере) в точке их пересечения называется угол между касательными к этим кривым в этой точке. Покажите, что существуют локальные плоские карты сферы, в которых углы между кривыми на сфере и соответствующими кривыми на карте оди- одинаковы (см. рис.65, изображающий так называемую стереографическую про- проекцию). 3. Касательное пространство. a) Проверьте прямым расчетом, что касательное к гладкой /г-мерной по- поверхности S С Шп в точке хо £ S многообразие TSX0 не зависит от выбора системы координат в К". b) Покажите, что если при диффеоморфизме /:£)->£)' области D сШп на область D' С Шп гладкая поверхность S С D отображается на гладкую поверхность S' С D', а точка xq £ S переходит в х'о £ S', то при линейном отображении f'(xo): Шп —> К™, касательном к / в точке xq £ D, векторное пространство TSX0 изоморфно преобразуется в векторное пространство TS'x,. c) Если в условиях предыдущей задачи отображение /: D —> D' явля- является любым отображением класса C^(D;D'), при котором f(S) С S', то f'(TSxo)cTS'x,o. d) Покажите, что ортогональная проекция гладкой /г-мерной поверхности S С К" на касательную к ней в точке xq £ S fc-мерную плоскость TSXQ явля- является отображением, взаимно однозначным в некоторой окрестности точки касания xq. e) Пусть в условиях предыдущей задачи £ £ TSXQ и ||£|| = 1. Уравнение х — хо = £t прямой в К™, лежащей в TSXo, можно использо- использовать, чтобы каждую точку х £ TSXo \ хо характеризовать парой (t, £). Это по существу полярные координаты в TSX0.
626 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Покажите, что прямым х — хо = £t на поверхности S в окрестности точ- точки хо отвечают гладкие кривые, пересекающиеся только в точке хо ■ Проверь- Проверьте, что, сохраняя в качестве параметра на этих кривых величину t, мы полу- получаем пути, скорость вдоль которых при t = 0 совпадает с вектором £ £ TSX0, определяющим прямую х — хо = £t, из которой получена данная кривая на 5. Таким образом, пары (£,£), где £ £ TSXQ, ||£|| = 1, a t—вещественные числа из некоторой окрестности С/@) нуля в М, могут служить аналогом по- полярных координат в некоторой окрестности точки хо £ S на поверхности S. 4. Пусть функция F £ С^1 (М™; М), не имеющая критических точек, такова, что уравнение F{x1,... ,хп) = 0 задает в Шп компактную поверхность S (т.е. S как подмножество Шп является компактом). Для любой точки х G S находим вектор 7](х) = gradF(x), нормальный к S в точке х. Если каждую точку х £ S заставить двигаться равномерно со своей скоростью т)(х), то возникает зависящее от времени t отображение S Э х >-^ х + rj(x)t £ Шп. a) Покажите, что при достаточно близких к нулю значениях t это ото- отображение биективно и при каждом таком значении t из S получается гладкая поверхность St- b) Пусть Е — множество в М"; ^-окрестностью множества Е назовем со- совокупность тех точек М", расстояние которых до Е меньше 6. Покажите, что при значениях t, близких к нулю, уравнение F(x\...,xn)=t задает компактную поверхность St С М™, и покажите, что поверхность St лежит в £(£)-окрестности поверхности St, где 6(t) = o(t) при t -> 0. c) С каждой точкой х поверхности S = So свяжем единичный вектор нор- нормали П(Х) - и рассмотрим новое отображение S Э х н-> х + n(x)t £ К™. Покажите, что при всех достаточно близких к нулю значениях t это ото- отображение биективно, получающаяся из S при конкретном значении t поверх- поверхность St гладкая и если ti фг2, то Stl П St2 = 0. d) Опираясь на результат предыдущей задачи, покажите, что найдется число 6 > 0 такое, что между точками J-окрестности поверхности S и пара- парами (t,x), где t £ ]—<$,<$[ С К, х £ S, имеется взаимно однозначное соответ- соответствие; если (t1,..., tk) —локальные координаты на поверхности S в окрестно- окрестности Us{xo) точки хо, то величины (t, t1,..., tk) могут служить локальными ко- координатами в некоторой пространственной окрестности U(xo) точки хо € К". e) Покажите, что при \t\ < 6 точка х £ S является ближайшей к (x+n(x)t) € £ М" точкой поверхности S. Таким образом, поверхность St при \t\ < 6 есть геометрическое место точек пространства Шп, удаленных от поверхности S на расстояние \t\.
§ 7. ПОВЕРХНОСТЬ В»"И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 627 5. а) Пусть dp: S -> Ж — функция на fc-мерной гладкой поверхности S С С К", определенная равенством dp(x) = \\р — х\\2, где р—фиксированная точ- точка К", х — точка S, а \\р — х\\ — расстояние в Шп между этими точками. Покажите, что в точках экстремума функции dp(x) вектор р — х ортого- ортогонален поверхности S. b) Покажите, что на любой прямой, ортогонально пересекающей поверх- поверхность S в точке q G S, имеется не более к таких точек р, что функция dp(x) имеет q своей вырожденной критической точкой (т. е. точкой, в которой гес- гессиан функции обращается в нуль). c) Покажите, что в случае кривой S (к = 1) на плоскости Ж2 (п = 2) точка р, для которой точка q € S является вырожденной критической точкой функции dp(x), совпадает с центром кривизны кривой S в точке q € S. 6. Постройте в плоскости Ш2 с декартовыми координатами х, у линии уровня функции /(ж, у) = ху и кривую S = {(x,y)£R2 \x2+y2 = l}. Используя полученную картинку, проведите полное исследование задачи об экстремуме функции /|s- 7. На плоскости 1R2 с декартовыми координатами х, у определены следу- следующие функции класса C() ,, . 2 cv \ J х - У +е / Sln т> если х Ф 0> f(x,y)=xz -у; F(x,y)=i " ж' [ х — у, если х = 0. a) Нарисуйте линии уровня функции /(ж, у) и линию S, заданную соотно- соотношением F(x, у) = 0. b) Исследуйте на экстремум функцию f\s- c) Покажите, что условие определенности формы дц/(хо)С€3 на TSXQ, в отличие от условия определенности формы dtJL(xo)C£J на ^^о, приведенного в теореме 2, еще не является достаточным для того, чтобы подозрительная точка хо € S была точкой экстремума функции /|5- d) Проверьте, является ли точка хо = @,0) критической для функции / и можно ли исследовать поведение / в окрестности этой точки только с помо- помощью второго (квадратичного) члена формулы Тейлора, как это подразумева- подразумевалось в с). 8. В дифференциальной геометрии при определении главных кривизн и главных направлений бывает полезно уметь искать экстремум одной квадра- квадратичной формы hl}u%u3 при условии постоянства другой (положительно опре- определенной) формы g^vfu0. Решите эту задачу по аналогии с разобранным выше примером 9.
628 ГЛ. VIII. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 9. Пусть А = [а*] —квадратная матрица порядка п такая, что где Hi,... ,Нп—фиксированный набор из п неотрицательных действитель- действительных чисел. a) Покажите, что det2 А при указанных условиях на матрицу А может иметь экстремум, только если строки матрицы А являются попарно ортого- ортогональными векторами в Шп. b) Исходя из равенства det2 Л = det Л-det Л*, где А* — транспонированная по отношению к А матрица, покажите, что при указанных выше условиях max det2 Л = #!...#„. А c) Докажите, что для любой матрицы [о*] имеет место неравенство Ада- мара d) Дайте наглядно-геометрическое истолкование неравенства Адамара. 10. а) Нарисуйте поверхности уровня функции / и плоскость S в приме- примере 10. Объясните на рисунке результат, полученный в этом примере. Ь) Нарисуйте линии уровня функции / и прямую S в примере 11. Объяс- Объясните на рисунке результат, полученный в этом примере. 11. В примере 6 из §4 главы V, исходя из принципа Ферма, был получен закон Снеллиуса преломления света на поверхности раздела двух сред в слу- случае, когда эта поверхность — плоскость. Остается ли этот закон в силе для произвольной гладкой поверхности раздела? 12. а) Материальная точка в потенциальном поле сил может находиться в положении равновесия (называемом также состоянием покоя или стационар- стационарным состоянием) только в критических (стационарных) точках потенциала. При этом строгому локальному минимуму потенциала отвечает положение устойчивого равновесия, а локальному максимуму — неустойчивого. Проверь- Проверьте это. Ь) К какой задаче на условный экстремум (которую и решал Лагранж) сводится вопрос о положении равновесия материальной точки, находящейся в потенциальном поле сил (например, тяжести) и стесненной идеальными связя- связями (например, точка не может покидать некоторой гладкой поверхности, или
§ 7. ПОВЕРХНОСТЬ ВГИ ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 629 бусинка—гладкой нити, или шарик — желоба)? Связь идеальна (нет трения); это значит, что ее воздействие на точку (реакция связи) происходит только в нормальном к связи направлении. c) Какой физический (механический) смысл имеют в этом случае разло- разложение C1)—необходимый признак условного экстремума и множители Лаг- ранжа? Кстати, каждую из функций системы B5) можно поделить на модуль ее градиента, что, очевидно, приводит к равносильной системе (если ее ранг всю- всюду равен т). Значит, все векторы gradF*(a;o) в правой части соотношения C1) можно считать единичными нормалями к соответствующей поверхности. d) He становится ли после приведенной физической интерпретации само- самоочевидным и естественным сам метод Лагранжа отыскания условного экстре- экстремума?
НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ Введение в анализ (число, функция, предел) 1. Длину стягивающего земной шар по экватору обруча увеличили на 1 метр. Образовался зазор. Достаточен ли он для прохода муравья? Како- Каковы величины абсолютного и относительного увеличения радиуса Земли при таком увеличении длины экватора? (Радиус Земли « 6400 км.) 2. Как связаны полнота (непрерывность) действительных чисел, неогра- неограниченность натурального ряда и принцип Архимеда? Почему любое действи- действительное число можно сколь угодно точно приблизить рациональным? Объяс- Объясните на модели рациональных дробей (рациональных функций), что принцип Архимеда может быть нарушен, и в таких числовых системах натуральный ряд ограничен и имеются бесконечно малые числа. 3. Четыре букашки, сидевшие в вершинах единичного квадрата, стали двигаться друг за другом с единичной скоростью, держа курс на преследуе- преследуемого. Нарисуйте траектории их движения. Какова длина каждой траектории? Каков закон движения (в декартовых и полярных координатах)? 4. Нарисуйте диаграмму вычисления у/а (а > 0) итерационным процессом 1 Как связано решение уравнений с отысканием неподвижных точек? Как находить yfat 5. Пусть д{х) = f(x) + o(f(x)) при х —> оо. Верно ли, что тогда и f(x) — = д(х) + о(д(х)) при х -> оо ? 6. Методом неопределенных коэффициентов (или иначе) найдите несколь- несколько первых коэффициентов (или все) степенного ряда для A + х)а при а = = —1,—i,0, i,l,|. (Интерполируя коэффициенты при одинаковых степенях х в таких разложениях, Ньютон выписал закон образования коэффициентов при любом а 6 М — бином Ньютона.)
НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ 631 7. Зная степенное разложение функции ех, найдите методом неопределен- неопределенных коэффициентов (или иначе) несколько первых членов (или все) степенного разложения функции 1пA + х). 8. Вычислите ехр А, когда А — одна из матриц 0 0\ /0 1 0 0J' \0 0 9. Сколько членов ряда для ех надо взять, чтобы получить многочлен, позволяющий вычислять ех на отрезке [—3, 5] с точностью до 10~2? 10. Нарисуйте эскизы графиков следующих функций: a) logcos x sin x; b) arctg 0 0 0 1—1 0 0 °\ 1 ' 0/ /1 0 lo 0 2 0 0 0 3 _ яA + яJ • Дифференциальное исчисление функций одной переменной 1. Покажите, что если вектор ускорения a(t) в любой момент t ортогона- ортогонален вектору v(t) скорости движения, то величина \v(t)\ остается постоянной. 2. Пусть (x,t) и (x,i)—соответственно координата и время движущейся точки в двух системах отсчета. Считая известными формулы х = ах + /3t, i = -ух + 5t перехода из одной системы отсчета в другую, найдите формулу преобразования скоростей, т.е. связь между v = -£- и v = -S. 3. Функция f(x) = х1 sin | при х/0и /@) = 0 дифференцируема на Ш, но /' разрывна при х = 0 (проверьте). «Докажем», однако, что если /: R —> Ш дифференцируема на М, то /' непрерывна в любой точке о € Ш. По теореме Лагранжа где £ — точка между о и х. Тогда если х —> о, то £ —> о. По определению, ton ПХ) ~ /(Q) = /'(а), х—Уа X — Q и поскольку этот предел существует, то существует и равен ему предел правой части формулы Лагранжа, т.е. /'(£) —> /'(а) при £ —> о. Непрерывность /' в точке о «доказана». Где ошибка? 4. Пусть функция / имеет п + 1 производную в точке жо, и пусть £ = = xq + вх(х — xq) —средняя точка в формуле Лагранжа остаточного члена Л/^(£)(ж ~ хо)п, так что 0 < вх < 1. Покажите, что вх -> ~rj ПРИ х ~^ жо; если/(п+1)(жо) т^О.
632 НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ 5. Докажите неравенство ™ ^ ... + апап, где числа Oi,..., о„, а\,..., ап неотрицательны и Qi + ... + а„ = 1. 6. Покажите, что \Л—I = ех (cos у + i sin у) (z = x + iy), п/ поэтому естественно считать, что eiy = cos у + г sin у (формула Эйлера) и ег = ехегу = ех (cos у + г sin у). 7. Найдите форму поверхности жидкости, равномерно вращающейся в ста- стакане. 2 2 8. Покажите, что касательная к эллипсу ^+ ^- = 1в точке (xq, yo) имеет уравнение ^Щ1- + Щ^- = 1 и что световые лучи от источника, помещенного в одном из фокусов F\ = (—у/а2 — б2,0), Fi = (л/а2 — б2,0) эллипса с полуосями а > Ъ > 0, собираются эллиптическим зеркалом в другом фокусе. 9. Частица без предварительного разгона под действием силы тяжести на- начинает скатываться с вершины ледяной горки эллиптического профиля. Урав- Уравнение профиля: х2 + Ъу1 = 1, у ^ 0. Рассчитайте траекторию движения час- частицы до ее приземления. Интеграл и введение в многомерный анализ 1. Зная неравенства Гёльдера, Минковского и Иенсена для сумм, получите соответствующие неравенства для интегралов. 2. Вычислите интеграл J e~x dx с относительной погрешностью в преде- пределах 10%. ° 3. Функция erf(a;) = -у= J e~* dt, называемая интегралом вероятности * —х ошибок, имеет пределом 1 при х —> +оо. Изобразите график этой функции и найдите ее производную. Покажите, что при х —> +оо 2 -х2 ( 1 1 1-3 1-3-5 eii(x) = ! _ _е- ^____ + _____+ Как продолжить эту асимптотическую формулу до ряда? Сходится ли этот ряд хотя бы при каком-то значении х£|? 4. Зависит ли длина пути от закона движения (от параметризации)? 5. Вы держите один конец резинового шнура длиной 1 км. От второго его конца, который закреплен, к вам со скоростью 1 см/с ползет жук. Каждый раз,
НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ 633 как только он проползает 1 см, вы удлиняете резинку на 1 км. Доползет ли жук до вашей руки? Если да, то приблизительно сколько ему на это потребуется времени? (Задача Л. Б. Окуня, предложенная им А. Д. Сахарову.) 6. Подсчитайте работу по перемещению массы в гравитационном поле Земли и покажите, что эта работа зависит только от уровней высот исходно- исходного и конечного положений. Найдите для Земли работу выхода из ее гравита- гравитационного поля и соответствующую (вторую) космическую скорость. 7. На примере маятника и двойного маятника поясните, как на множе- множестве соответствующих конфигураций можно ввести локальные координаты и окрестности и как при этом возникает естественная топология, превращаю- превращающая его в конфигурационное пространство механической системы. Можно ли метризовать это пространство в рассмотренных случаях? 8. Является ли компактом единичная сфера вР?Ав С[а, &]? 9. Подмножество данного множества называется его е-сетью, если любая точка множества находится на расстоянии меньшем чем £ от какой-либо точ- точки этого подмножества. Обозначим через N(e) наименьшее возможное число точек в £-сети данного множества. Оцените е-энтропию log2 N(e) отрезка, квадрата, куба и ограниченной области в пространстве Шп. Дает ли величина 1ое2A/е) ПРИ £ ~* ® представление о размерности рассматриваемого множест- множества? Может ли такая размерность быть равной, например, 0,5? 10. На поверхности единичной сферы S в Ш3 температура Г как функция точки меняется непрерывно. Обязаны ли на сфере быть точки минимума и максимума температуры? При наличии точек с двумя фиксированными зна- значениями температуры, должны ли быть точки и с промежуточными ее зна- значениями? Что из этого верно в случае, когда единичная сфера S берется в пространстве С[а, Ь], а температура в точке / € S выражается в виде T(f) = 11. а) Вэяв 1,5 в качестве исходного приближения для л/2, проведите две итерации по методу Ньютона и посмотрите, сколько верных знаков получи- получилось на каждом из двух шагов. Ь) Найдите итерационным процессом функцию /, удовлетворяющую урав- уравнению х f(x)=x + Jf(t)dt. 22-4573
634 НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ Дифференциальное исчисление функций многих переменных 1. а) Какова относительная погрешность 6 = K-jr ПРИ вычислении значе- значения функции f(x,y,z) в точке (ж, у, z), координаты которой даны с абсолют- абсолютными погрешностями Да;, Ду, Az соответственно? b) Какова относительная ошибка в вычислении объема комнаты, размеры которой таковы: длина х = 5 ± 0,05 м, ширина у = 4 ± 0,04 м, высота z = = 3 ± 0,03 м? c) Верно ли, что относительная погрешность значения линейной функции совпадает с относительной погрешностью значения ее аргумента? d) Верно ли, что дифференциал линейной функции совпадает с ней самой? e) Верно ли, что для линейной функции / справедливо соотношение /' = /? 2. а) Одна из частных производных функции двух переменных, заданной в круге, равна нулю во всех точках круга. Значит ли это, что функция не зависит от соответствующей переменной в этом круге? b) Изменится ли ответ, если вместо круга взять произвольную выпуклую область? c) А если взять вообще произвольную область? d) Пусть х = x(t) —закон движения точки в плоскости (или в R") в промежутке времени t € [о, Ь]\ v(t)—ее скорость как функция времени, а С = conv{v(t) | t £ [a, b]} — наименьшее выпуклое множество, содержащее все векторы v{t) (называемое обычно выпуклой оболочкой того множества, на ко- которое оболочка натягивается). Покажите, что в С найдется такой вектор v, что х{Ъ) - х(а) = v ■ (Ь — а). 3. а) Пусть F(x,y,z) = 0. Верно ли, что р- ■ |^ • |^ = -1? Проверьте это на зависимости ^-1 = 0 (соответствующей уравнению Клапейрона ~- = R состояния идеального газа). b) Пусть теперь F(x, у) = 0. Верно ли, что |^ • ~ = 1? ох оу c) Что можно утверждать в общем случае зависимости F{x\,... ,хп) = 0? d) Как, зная первые несколько членов тейлоровского разложения функ- функции F(x, у) в окрестности точки (хо,уо), где F(x0, уо) = 0, a Fy(x0, y0) обрати- обратима, найти первые несколько членов тейлоровского разложения неявной функ- функции у = f(x), определяемой в окрестности (хо,уо) уравнением F(x,y) = 0? 2 2 2 4. а) Проверьте, что плоскость, касательная к эллипсоиду ~ + 2L + ^ — 1 а Ь с в точке (a;o,yo,zo)> может быть задана уравнением ?ЩО- + ^ + ^2& = i, b) Точка P(t) = (-y=,-j=,-j=) ■ t в момент времени t — 1 стартовала с 2 2 2 эллипсоида ^ + 2l + *L = 1. Пусть p(t) —точка того же эллипсоида, ближай- ближайшая к P(t) в момент времени t. Найдите предельное положение точки p(t) при t -> +оо.
НЕКОТОРЫЕ ЗАДАЧИ КОЛЛОКВИУМОВ 635 5. а) В плоскости К2 с декартовыми координатами (х, у) постройте линии уровня функции f(x,y) = ху и кривую S = {(х,у) е Е2 | х2 + У2 = 1}. Используя полученную картинку, проведите полное исследование задачи об экстремуме функции f\s — ограничения / на окружность S. Ь) Какой физический смысл имеют множители Лагранжа в методе Лагран- Лагранжа отыскания условного экстремума, когда ищется положение равновесия ма- материальной точки в поле тяжести, если движение точки стеснено идеальными связями (например, вида Fi (x, у, z) = О, F2 (x, у, z) = 0)?
ВОПРОСЫ К ЭКЗАМЕНУ I семестр Введение в анализ (число, функция, предел) Дифференциальное исчисление функций одной переменной 1. Действительные числа. Ограниченные (сверху, снизу) числовые множе- множества. Аксиома полноты и существование верхней (нижней) грани множества. Неограниченность множества натуральных чисел. 2. Основные леммы, связанные с полнотой множества действительных чи- чисел М (вложенные отрезки, конечное покрытие, предельная точка). 3. Предел последовательности и критерий Коши его существования. Кри- Критерий существования предела монотонной последовательности. 4. Ряд и его сумма. Геометрическая прогрессия. Критерий Коши и необхо- необходимое условие сходимости ряда. Гармонический ряд. Абсолютная сходимость. 5. Критерий сходимости ряда с неотрицательными членами. Теорема срав- оо нения. Ряд С(«) = Yl n~". п=1 6. Идея логарифма и число е. Функция ехр(х) и представляющий ее сте- степенной ряд. 7. Предел функции. Основные базы предельного перехода. Определение предела функции при произвольной базе и его расшифровка в конкретных случаях. Бесконечно малые функции и их свойства. Сравнение финального поведения функций, асимптотические формулы и основные операции с симво- символами о(-), О(-). 8. Взаимосвязь предельного перехода с алгебраическими операциями и отношением порядка в К. Предел Щ^ при х -> 0.
ВОПРОСЫ К ЭКЗАМЕНУ 637 9. Предел композиции функций и монотонной функции. Предел A + - J при х —> оо. 10. Критерий Коши существования предела функции. 11. Непрерывность функции в точке. Локальные свойства непрерывных функций (локальная ограниченность, сохранение знака, арифметические опе- операции, непрерывность композиции). Непрерывность многочлена, рациональ- рациональной функции и тригонометрических функций. 12. Глобальные свойства непрерывных функций (промежуточные значе- значения, максимумы, равномерная непрерывность). 13. Разрывы монотонной функции. Теорема об обратной функции. Непре- Непрерывность обратных тригонометрических функций. 14. Закон движения, перемещение за малое время, вектор мгновенной ско- скорости, траектория и касательная к ней. Определение дифференцируемости функции в точке. Дифференциал, его область определения и область значений. Единственность дифференциала. Производная вещественнозначной функции вещественного переменного и ее геометрический смысл. Дифференцируе- мость функций sinx, cosx, ех, 1п|х|, ха. 15. Дифференцируемость и арифметические операции. Дифференцирова- Дифференцирование многочлена, рациональной функции, тангенса и котангенса. 16. Дифференциал композиции функций и обратной функции. Производ- Производные обратных тригонометрических функций. 17. Локальный экстремум функции. Необходимое условие внутреннего экстремума дифференцируемой функции (лемма Ферма). 18. Теорема Ролля. Теоремы Лагранжа и Коши о конечном приращении (о среднем). 19. Формула Тейлора с остаточными членами в формах Коши и Лагранжа. 20. Ряд Тейлора. Тейлоровские разложения функций ех, cos x, sin х, ln(l +x), A + х)а (бином Ньютона). 21. Локальная формула Тейлора (с остаточным членом в форме Пеано). 22. Взаимосвязь характера монотонности дифференцируемой функции и положительности ее производной. Достаточные условия наличия или отсут- отсутствия локального экстремума в терминах первой, второй и высших производ- производных. 23. Выпуклая функция. Дифференциальные условия выпуклости. Распо- Расположение графика выпуклой функции по отношению к касательной. 24. Общее неравенство Иенсена для выпуклой функции. Выпуклость (во- (вогнутость) логарифма. Классические неравенства Коши, Юнга, Гёльдера и Минковского. 25. Комплексное число в алгебраической и тригонометрической записи. Сходимость последовательности комплексных чисел и ряда с комплексными членами. Критерий Коши. Абсолютная сходимость и достаточные признаки абсолютной сходимости ряда с комплексными членами. Предел lim (l + ^) .
638 ВОПРОСЫ К ЭКЗАМЕНУ 26. Круг сходимости и радиус сходимости степенного ряда. Определение функций ez, cos z, sin 2 (z £ С). Формула Эйлера и взаимосвязь элементарных функций. 27. Дифференциальные уравнения как математическая модель явления, примеры. Метод неопределенных коэффициентов и метод ломаных Эйлера. 28. Первообразная, основные общие приемы ее отыскания (почленное ин- интегрирование слагаемых, интегрирование по частям, замена переменной). Первообразные основных элементарных функций. II семестр Интеграл (функции одной переменной) Дифференциальное исчисление функций многих переменных 1. Интеграл Римана на отрезке. Необходимое условие интегрируемости. Множества меры нуль, их общие свойства, примеры. Критерий Лебега инте- интегрируемости функции по Риману (формулировка). Пространство интегриру- интегрируемых функций и допустимые операции над интегрируемыми функциями. 2. Линейность, аддитивность и общая оценка интеграла. 3. Оценки интеграла от вещественнозначной функции. Теорема о среднем (первая). 4. Интеграл с переменным верхним пределом, его свойства. Существова- Существование первообразной у непрерывной функции. Обобщенная первообразная и ее общий вид. 5. Формула Ньютона-Лейбница. Замена переменной в интеграле. 6. Интегрирование по частям в определенном интеграле. Формула Тейлора с интегральным остатком. Вторая теорема о среднем. 7. Аддитивная функция ориентированного промежутка и интеграл. Об- Общая схема появления интеграла в приложениях, примеры: длина пути (и ее независимость от параметризации), площадь криволинейной трапеции, объем тела вращения, работа, энергия. 8. Интеграл Римана - Стилтьеса. Условия сведения к интегралу Римана. Сингулярности и дельта-функция Дирака. Понятие обобщенной функции. 9. Понятие несобственного интеграла. Канонические интегралы. Крите- Критерий Коши и теорема сравнения для исследования сходимости несобственного интеграла. Интегральный признак сходимости ряда. 10. Локальная линеаризация, примеры: мгновенная скорость и перемеще- перемещение; упрощение уравнения движения при малых колебаниях маятника; вычи- вычисление линейных поправок к значениям величин ехр(Л), А~1, det(-E), (a, 6) при малом изменении аргументов (здесь А — обратимая, Е — единичная матрицы; а, Ь — векторы; (•, ■) — скалярное произведение).
ВОПРОСЫ К ЭКЗАМЕНУ 639 11. Норма (длина, модуль) вектора в векторном пространстве; важнейшие примеры. Пространство L(X, Y) линейных непрерывных операторов и норма в нем. Непрерывность линейного оператора и конечность его нормы. 12. Дифференцируемость функции в точке. Дифференциал, его область определения и область значений. Координатная запись дифференциала ото- отображения /: Шт -> К™. Соотношения между дифференцируемостью, непре- непрерывностью и наличием частных производных. 13. Дифференцирование композиции функций и обратной функции. Ко- Координатная запись полученных законов применительно к различным случаям отображений /: Жт -> Шп. 14. Производная по вектору и градиент. Геометрические и физические примеры использования градиента (уровни функций, градиентный спуск, ка- касательная плоскость; потенциальные поля; уравнение Эйлера динамики иде- идеальной жидкости, закон Бернулли, работа крыла). 15. Однородные функции и соотношение Эйлера. Метод размерностей. 16. Теорема о конечном приращении. Ее геометрический и физический смысл. Примеры приложений (достаточное условие дифференцируемости в терминах частных производных; условие постоянства функции в области). 17. Высшие производные и их симметричность. 18. Формула Тейлора. 19. Экстремумы функций (необходимые и достаточные условия внутрен- внутреннего экстремума). 20. Сжимающие отображения. Принцип Пикара - Банаха неподвижной точки. 21. Теорема о неявной функции. 22. Теорема об обратной функции. Криволинейные координаты и выпрям- выпрямления. Гладкая поверхность размерности к в Шп и касательная плоскость к ней. Способы задания поверхности и соответствующие им уравнения касательного пространства. 23. Теорема о ранге и зависимость функций. 24. Условный экстремум (необходимый признак). Геометрическая, алге- алгебраическая и физическая интерпретации метода Лагранжа. 25. Достаточный признак условного экстремума. 26. Метрическое пространство, примеры. Открытые и замкнутые подмно- подмножества. Окрестность точки. Индуцированная метрика, подпространство. То- Топологическое пространство. Окрестность точки, отделимость (аксиома Хаус- дорфа). Топология, индуцируемая на подмножествах. Замыкание множества и описание относительно замкнутых подмножеств. 27. Компакт, его абсолютность. Замкнутость компакта и компактность замкнутого подмножества компакта. Вложенные компакты. Метрические компакты, е-сеть. Критерий метрического компакта и его конкретизация в пространстве Шп.
640 ВОПРОСЫ К ЭКЗАМЕНУ 28. Полное метрическое пространство. Полнота Е, С, Кп, С" и простран- пространства С[а, Ь] непрерывных функций относительно равномерной сходимости. 29. Критерий непрерывности отображения топологических пространств. Сохранение компактности и связности при непрерывном отображении. Клас- Классические теоремы об ограниченности, максимуме и промежуточном значении для непрерывных функций. Равномерная непрерывность на метрическом ком- компакте.
ЛИТЕРАТУРА I. Классика 1. Первоисточники Ньютон И. a. Математические начала натуральной философии. Пер. с лат. В кн.: Крылов А. Н. Собрание трудов. Т. 7. — Л.-М.: Изд-во АН СССР, 1936, с. 57-662. b. Математические работы. — М.-Л.: ОНТИ, 1937. Лейбниц Г. В. Избранные отрывки из математических сочинений. Успе- Успехи матем. наук, 1948. 3 A), 165-205. 2. Важнейшие систематические изложения предмета Эйлер Л. a. Введение в анализ бесконечных. В 2-х т. — М.: Физматгиз, 1961. b. Дифференциальное исчисление. — М.-Л.: Гостехиздат, 1949. c. Интегральное исчисление. В 3-х т. — М.: Гостехиздат, 1956 -1958. Коши О. Л. a. Алгебраический анализ. — Лейпциг: Бэр и Хэрманн, 1864. b. Краткое изложение уроков о дифференциальном и интегральном исчислении. — СПб.: Имп. Акад. наук, 1831.
642 ЛИТЕРАТУРА II. Учебники1) Архипов Г. И., Садовничий В. А., Чубариков В. Н. Лекциипо математическому анализу. —М.: Высшая школа, 2000. Ильин В. А., Садовничий В. А., Сендов Б. X. Математический анализ. В 2-х ч. Изд. 2-е, перераб. — М.: Изд-во Моск. ун-та, 1985, 1987. Камынин Л. И. Курс математического анализа. В 2-х ч. — М.: Изд-во Моск. ун-та, 1993, 1995. Кудрявцев Л. Д. Курс математического анализа. В 3-х т. — М.: Высшая школа, 1988, 1989. Никольский С. М. Курс математического анализа. В 2-х т. — М.: Нау- Наука, 1990. III. Учебные пособия Виноградова И. А., Олехник С. Н., Садовничий В. А. Задачи и упражнения по математическому анализу. — М.: Изд-во Моск. ун-та, 1988. Демидович Б. П. Сборник задач и упражнений по математическому анализу. — М.: Наука, 1990. Макаров Б. М., Голузина М. Г., Лодкин А. А., Подкоры- тов А. Н. Избранные задачи по вещественному анализу. — М.: Нау- Наука, 1992. Решетняк Ю. Г. Курс математического анализа. —Новосибирск: Изд- во Инс-та матем. Ч. I, книги 1 и 2, 1999. Ч. II, книги 1 и 2, 2000, 2001. Рудин У. Основы математического анализа. Изд. 2-е. — М.: Мир, 1976. Шилов Г. Е. a. Математический анализ. Функции одного переменного. Ч. 1-2. — М.: Наука, 1969. b. Математический анализ. Функции нескольких вещественных пере- переменных. В 3-х ч. — М.: Наука, 1972. Фихтенгольц Г. М. Курс дифференциального и интегрального исчи- исчисления. В 3-х т. Изд. 7-е, стереотип. — М.: Наука, 1969. ^Приведенные в этом разделе книги допущены Минвузом СССР, рекомендованы Комитетом по высшей школе Миннауки России или Министерством образования Российской Федерации в качестве учебников для студентов, обучающихся по специ- специальностям «Математика», «Прикладная математика», «Механика», «Прикладная ма- математика и информатика».
ЛИТЕРАТУРА 643 IV. Дополнительная литература Александров П. С, Колмогоров А. Н. Введение в теорию функ- функций действительного переменного. — М.: ГТТИ, 1938. Альберт Эйнштейн и теория гравитации: Сб. статей. К 100-летию со дня рождения. — М.: Мир, 1979. Арнольд В. И. a. Гюйгенс и Барроу, Ньютон и Гук — первые шаги математического анализа и теории катастроф, от эвольвент до квазикристаллов. — М.: Наука, 1989. b. Математические методы классической механики. —М.: Наука, 1989. Бурбаки Н. Очерки по истории математики. — М.: Изд-во иностранной литературы, 1963. (В частности, статья «Архитектура математики».) Валле-Пуссен Ш. Ж. Курс анализа бесконечно малых. В 2-х т. Л.-М.: ГТТИ, 1933. Вейль Г. Математическое мышление. — М.: Наука, 1989. Гелбаум Б., Олмстед Дж. Контрпримеры в анализе. — М.: Мир, 1967. Гельфанд И. М. Лекции по линейной алгебре. —М.: Добросвет, МЦНМО, 1998. Дубровин Б. А., Новиков С. П., Фоменко А. Т. Современная геометрия: Методы и приложения. — М.: Наука, 1986. Дьедонне Ж. Основы современного анализа. — М.: Мир, 1964. Зельдович Я. Б., Мышкис А. Д. Элементы прикладной математи- математики.—М.: Наука, 1967. Зорич В. А. Анализ. [Записки лекций для студентов Математического колледжа НМУ и механико-математического ф-та МГУ.] В 3-х вып. Вып. I. Лекции 5-7: Дифференциал. Вып. П. Лекция 8: Теорема о не- неявной функции. Вып. III. Лекции 9-11: Приложения теоремы о неявной функции.—М.: Изд-во механико-математич. ф-та МГУ, 1995. К ар тан А. Дифференциальное исчисление. Дифференциальные формы. — М.: Мир, 1971. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функ- функционального анализа. Изд. 4-е, перераб. — М.: Наука, 1976. Кострикин А. И., Манин Ю. И. Линейная алгебра и геометрия.— М.: Наука, 1986.
644 ЛИТЕРАТУРА Кириллов А. А. Что такое число? — М.: Наука, 1993. Курант Р. Курс дифференциального и интегрального исчисления. В 2-х т. —М.: Наука, 1970. Ландау Э. Основы анализа. — М.: Изд-во иностранной литературы, 1947. М ан ин Ю. И. Математика и физика. — М.: Знание, 1979. — (Новое в жиз- жизни, науке, технике. Серия: Математика, кибернетика; № 12.) Милнор Дж. Теория Морса.—М.: Мир, 1965. — (Библиотека сборника «Математика».) Нарасимхан Р. Анализ на действительных и комплексных многообра- многообразиях.— М.: Мир, 1971. Полна Г., Сеге Г. Задачи и теоремы из анализа. В 2-х ч. Изд. 3-е.— М.: Наука, 1978. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. — М.: Наука, 1974. Пуанкаре А. О науке. — М.: Наука, 1990. Спивак М. Математический анализ на многообразиях. — М.: Мир, 1971. Уиттекер Э. Т., Ватсон Дж. Н. Курс современного анализа. В 2-х ч. Изд. 2-е. —М.: Физматгиз, 1962-1963. Успенский В. А. Что такое нестандартный анализ? — М.: Наука, 1987. Фейнман Р., Лейтон Р., Сэндс М. Фейнмановские лекции по фи- физике. Т. Г. Современная наука о природе. Законы механики. — М.: Мир, 1965. Халмош П. Конечномерные векторные пространства. — М.: Наука, 1963. Шварц Л. Анализ. В 2-х т. —М.: Мир, 1972. Эйнштейн А. Собрание научных трудов. Том IV.—М.: Наука, 1967. (В том числе статьи «Мотивы научного исследования» (с. 39-41) и «Фи- «Физика и реальность» (с. 200-227).)
предметный указатель Абсолютная величина числа. См. также Модуль действитель- действительного числа 65 Аддитивность интеграла 407 Аксиома Архимеда. См. также Прин- Принцип Архимеда 60, 61 — бесконечности 33 — выбора 34 — выделения 32 — Дедекинда 76 — множества подмножеств 33 — непрерывности 43, 76 — объединения 32 — объемности 32 — пары 33 — подстановки 34 — полноты (непрерывности) 43, 49, 60, 64, 76, 78, 79, 81, 85 — Цермело 34 Аксиоматика действительных (веще- (вещественных) чисел 41, 60, 80 — категоричная 44 — непротиворечивая 44 — теории множеств 7, 32, 34 — Цермело - Френкеля 34 Алгоритм Евклида 77, 122 Альтернанс 200 Аргумент комплексного числа 310 — функции 13 Асимптота 295 — вертикальная 295 Асимптота горизонтальная 295 Асимптота наклонная 295 Асимптотика функции 160, 161, 265 Атомный котел 340, 342, 343 База (базис фильтра) 148, 150 — в множестве разбиений 385 Базис 498 — ортонормированный 503 Биекция 19 Бином дифференциальный 379 — Ньютона 77, 244, 261 Вектор касательный 549, 550, 608 — нормальный 548, 550 Векторы ортогональные 503 Ветвь аргумента комплексного числа 310 Взрыв 342, 343 Вложение 18 Выпрямление 581, 582 Гессиан 574, 592, 627 Градиент 516, 518-520 Граница числового множества верхняя (мажоранта) 50 нижняя (миноранта) 50 точная верхняя 50, 51 Грань числового множества верхняя 50, 51 нижняя 51
646 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ График функции 26, 197, 293, 297, 303 многих переменных 546, 547 Группа 41 — абелева 41, 42, 56 — аддитивная 41, 42 — коммутативная 41 — мультипликативная 42 Делитель 56 — наибольший 77 — нуля 79 Диаметр множества 483, 487 Диффеоморфизм 577, 589 — простейший 589 Дифференциал отображения 504, 509 — функции 208-210, 216, 224 многих переменных 504, 505, 507, 509 Дифференцирование и арифметиче- арифметические операции 224, 226, 324, 511, 512 — композиции функций 228, 230, 514 — неявной функции 238, 246 — обратной функции 232, 233, 520, 522 — степенного ряда 324 Длина кривой 17, 441, 443, 445 — пути 438-441, 444 — числового промежутка 64 — эллипса 445, 446 Дополнение множества 10 Дробь непрерывная 122 — подходящая 122, 123 — простейшая 331, 366 — цепная 122, 123 Евклидова структура 502 Единица в множестве действитель- действительных чисел 42, 46, 49 Единица в мультипликативной группе 42 — мнимая 307 Жесткости коэффициент 348, 355, 449 Зависимость функций 587, 596 Задача Бюффона 456 — Гюйгенса 544, 545, 5*55 — Кеплера (двух тел) 202 — Окуня 632-633 Закон Бернулли 524 — Кеплера 538 — Клапейрона 339, 577 — Ньютона 202, 248, 343, 523, 528 — Ома 29 — преломления 279, 628 — сложения скоростей 239, 241, 242 — Снеллиуса 279, 628 Замена параметризации пути 444 допустимая 444 — переменной в интеграле неопределенном 363 определенном 425 Замкнутость алгебраическая поля комплексных чисел 326 - 329 Замыкание множества 481, 484 Значение главное несобственного интеграла 472 — функции 13, 26 среднее 430 Идеал кольца 201 непрерывных функций 201 максимальный 201 Изоморфизм 45, 171 Индекс критической точки 597 Интеграл вероятности ошибок 474 — Гаусса 470 — гиперзллиптический 376 — Дарбу верхний (нижний) 402 — неопределенный 358, 360, 361, 363 — несобственный 456-458 расходящийся 457 с несколькими особенностями 459 сходящийся 457 абсолютно 463 условно 468 — определенный 383, 385, 386 — от векторнозначной функции 404 — Римана 385, 386
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 647 Интеграл с переменным верхним пределом 418 — Френеля 380, 430, 473 — Эйлера 466 — Эйлера - Пуассона 381, 470 — эллиптический 376, 377, 379, 380, 446, 467 второго рода 376, 446 полный 446 первого рода 376, 452, 474 полный 452, 474 третьего рода 376 Интегрирование 356, 358, 383 — заменой переменной 363, 425 — по частям 362, 422 Интервал действительных чисел 64 Инъекция 18 Итерации 21, 37, 198 Канторово множество 90, 403 Кардинальное число (кардинал) 30, 31 Касательная 206, 213-216, 251, 286, 557, 603 — плоскость 547, 548, 550, 557, 566, 604 — прямая, см. Касательная 206 Касательное отображение 504, 582, 605 — пространство 505, 603, 605 - 607, 625 Квантор всеобщности 8, 36 — существования 8, 36 Колебание функции в точке 178, 179, 492 на множестве 153, 178, 389, 487 Колебания 348 — гармонические 350, 355 — затухающие 352 — маятника 451-453, 455, 467, 468, 475, 528 Кольцо непрерывных функций 201 — ростков непрерывных функций 201 Компакт 189, 482 -вГ 482-484, 495 Композиция отношений 26 Композиция отображений 20, 155, 185, 228, 230, 402, 487, 500, 514 Континуум 87, 88 Координаты декартовы 503 — криволинейные 546, 547 вМ™ 581 — полярные 579, 580 — сферические 580 Координаты точки 62, 477 Корень многочлена 199, 327, 328, 330 кратный 273, 331 — п-й степени арифметический 78, 138 из комплексного числа 311 Косинус гиперболический 235 — интегральный 365 Котангенс гиперболический 237 Коэффициент жесткости 348, 355, 449 — полезного действия 352 Кратность корня многочлена 331 Кривая 439 — параметризованная 439 — простая замкнутая 439 — уникурсальная 378 Кривизна кривой 306 Критерий Дарбу интегрируемости функции 402, 403 — Дюбуа-Реймона интегрируемости функции 403 — Коши существования предела по- последовательности 99, 312, 486 — функции 153, 487 сходимости несобственного ин- интеграла 462 — ряда 111, 312 — Лебега интегрируемости функции 398, 400, 403 — непрерывности монотонной функции 195 — Сильвестра 542 — существования предела монотон- монотонной последовательности 101 функции 159
648 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Критерий сходимости ряда с неотри- неотрицательными членами 114 Круг сходимости степенного ряда 314, 315 Лемма Адамара 553, 593 — Больцано - Вейерштрасса 105, 110 — Морса 592, 593 — о верхней грани 51, 60 вложенных компактах 484 отрезках 81, 83 конечном покрытии 82, 84 предельной точке 83 — Ферма 249, 250 Линейность интеграла 404 Линия геодезическая 16 — тока 523 — уровня 522, 559 Логарифм 144, 145, 222, 231, 334 — интегральный 366, 381, 473 — натуральный 144, 334 Логарифмическая шкала 232 Максимум 50, 79, 188, 495, 544 — локальный 248, 249, 277, 278, 537, 539, 628 Максимум условный 611, 618 Мантисса 80 Масса критическая 342 Матрица Якоби 509, 513, 539 Маятник 451-453, 455, 467, 468, 528 — циклоидальный 455, 475 Метод градиентный 519 — исчерпания 384 — ломаных Эйлера 347 — множителей Лагранжа 613, 629 — наименьших квадратов 553 — неопределенных коэффициентов 332, 347 — Остроградского 377 — размерности 525, 527 Метрика 477-479, 496 -вГ 478, 485 Минимум 50, 79, 188, 495, 544 — локальный 248, 249, 277, 278, 537, 539, 628 — условный 611, 618 Многочлен Лагранжа 272, 433 — Лежандра 433 — наилучшего приближения 199, 200 — Тейлора 255, 262, 263, 265 — Чебышёва 200 — Эрмита 272 Множество 5, 6, 32 — бесконечное 31 — замкнутое 479, 481, 483, 484 — инвариантное 29 — индуктивное 33, 52, 77 — интегрируемых функций 387, 398 — канторово 90, 403 — конечное 31 — меры нуль 398, 400, 403 — неограниченное 65, 488 — несчетное 87, 88 — ограниченное 50, 483, 484 сверху (снизу) 50 — открытое 478-480, 482, 494, 497 — пустое 13, 32 — равномощное другому множеству 29, 30 — связное 494, 497 линейно 494 — счетное 85, 86 — устойчивое 29 Модель действительных чисел 43, 44, 67, 75, 79 Модуль действительного числа 65 — (длина) вектора. См. также Норма вектора 203, 309 — комплексного числа 309, 310 — непрерывности функции 198 Монотонность интеграла 409 Морфизм 14 Мощность континуума 87-89 — множества 30, 31, 88 Мультииндекс 552 Неравенство Адамара 628 — Бернулли 77, 104, 280 — Гёльдера 280, 291, 418 — Иенсена 289, 290, 418 — Коши-Буняковского 418 — Минковского 281, 282, 418, 477 — треугольника 65, 282, 477, 479, 501
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 649 Неравенство треугольника числовое 65 — Шварца 418 — Юнга 280, 305, 456 Норма вектора 500, 501, 503 Носитель пути 438, 439, 443 Область в Rm 497 — значений отношения 23 функции 14 — определения отношения 23 функции 13 Образ 18, 26 Объединение множеств 10, 12 Объем тела вращения 447 Ограничение функции, см. Сужение функции 14 Окрестность точки 65, 83, 125, 480, 488 проколотая 125, 488 Окружность соприкасающаяся 307 Оператор 14 — Лапласа 551, 557 — сдвига 17 Операция ассоциативная 21, 41, 42 — дистрибутивная 42 — дифференцирования 224 — коммутативная 41, 42 — логическая 5, 13, 35 — над множествами 9, 13 — сложения 41, 42 — умножения 42 Орбиты планет 355 Основание логарифма 144 — системы счисления 72 Осреднение функции, см. Усреднение функции 431, 432 Остаточный член формулы Тейлора 256, 261, 266, 435 в интегральной форме 423, 424, 536, 537, 553, 593 в форме Коши 257, 424 Лагранжа 257, 265, 272, 273, 424, 537, 553 Пеано 264, 265, 537 Осциллятор линейный 348, 355 — плоский 355 Ось координатная 62 — числовая 62 Отношение 5, 23, 24 — антисимметричное 25, 27 — включения 8, 25, 78 — неравенства 25, 43, 47 — порядка 25, 43, 64 линейного 25, 43, 64 частичного 25, 43, 78 — равенства 8, 9, 24 — равномощности 30 — рефлексивное 24 — симметричное 24 — транзитивное 24, 27 — транспонированное 27 — функциональное 25, 26 — эквивалентности 24, 27, 30 Отображение. См. также Функция 13, 14, 484 — биективное 19, 28 — взаимно однозначное 19 — инъективное 18, 28 — касательное 504, 582, 605 — линейное 208, 216, 499, 500, 502, 513, 522, 579 — непрерывное 175, 176, 178, 491-493, 495 — обратное 19, 22, 233, 520, 577, 579 левое (правое) 28 — ограниченное 130, 485, 495 — постоянное 130 — равномерно непрерывное 189, 494, 495 — сюръективное 18, 28 — тождественное 21 -— финально ограниченное 131, 485 Падение тел 343 Пара неупорядоченная 11, 33 — упорядоченная 11, 33 Параметр разбиения 385 Параметризация кривой 443, 451 натуральная 451 Первообразная 357, 358, 361, 363, 418, 420 — обобщенная 420, 421 — рациональной функции 368, 370
650 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Переменные канонические 575 Пересечение множеств 10, 12 Перестановка членов ряда 113, 315 Период колебаний маятника 452, 455, 467, 468, 475 — обращения 355 — полураспада 340, 353 — функции 223, 320, 429 Плоскость касательная 547, 548, 550, 557, 566, 604 к поверхности 550, 566, 604, 605, 607 — комплексная 309 Площадь криволинейной трапеции 446, 447 — эллипса 447 Поверхность 546, 547, 565, 597, 599, 604, 610 — минимальная 574 Поглощение излучения 354 Погрешность абсолютная 68 - 70, 92, 231 — относительная 68-70, 231, 524 Подмножество 8, 33 — пустое 9, 32 — собственное 9 Подпоследовательность 105 Подстановка Эйлера 374, 378 Поле алгебраическое 42 — архимедово 79 — векторное 523 — потенциальное 523, 628 — упорядоченное 79 Полуинтервал 64 Порядок касания 214 — числа 72, 80 Последователь 33 Последовательность 66, 81, 92 — вложенных компактов 484 множеств 81, 84 отрезков 81, 84, 99 — возрастающая 101 — Коши 99, 312, 486 — монотонная 101 — невозрастающая 101 — неубывающая 101 Последовательность ограниченная 94 сверху (снизу) 101 — постоянная 94 — расходящаяся 93 — сходящаяся 93 — убывающая 101 — финально постоянная 94 — фундаментальная 99, 312, 486 — числовая 66 — элементов множества 81 Постоянная времени 353 — гравитационная 68 — Планка 68 — Эйлера 172 Потенциал векторного поля 520, 523, 628 — Ньютона 454, 523 — силы 449, 451, 454, 455, 523 Почти всюду 400, 403, 404, 417 Правило Лопиталя 291, 292 Предел интегрирования верхний (нижний) 387, 408, 418 — композиции функций 155, 487 — отображения 485 — по базе 148, 150, 152 — последовательности 92 - 94, 99, 129 верхний (нижний) 106 -109 частичный 109 частичный 108 — функции 124 - 126, 129, 130, 134, 135, 150, 152, 153 Преобразование 14 — Абеля 412 — Галилея 15, 29, 239, 241, 243 — за время 29 — инволютивное 305, 573 — Лежандра 305, 573-575 — линейное 499, 500 — Лоренца 16, 29, 242 Признак Абеля - Дирихле сходимости интеграла 469 — Вейерштрасса сходимости ряда 115, 116 — Гаусса сходимости ряда 174 — Даламбера сходимости ряда 117, 261
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 651 Признак достаточный условного экс- экстремума 617, 618 экстремума 276-278, 539 — интегральный сходимости ряда 463 — Коши сходимости ряда 116, 118 — монотонности функции 253, 274, 275 — необходимый (достаточный) 2 сходимости ряда 112 условного экстремума 611, 614, 615, 629 экстремума 249, 250, 276, 538 — постоянства функции 253, 274, 275 Принцип Архимеда 60, 61, 79, 85 — Больцано - Вейерштрасса 83, 85 — Бореля-Лебега 82, 85 — верхней грани 51, 78 — Коши-Кантора 81, 85 — математической индукции 52, 53 — Ферма 279, 628 Приращение аргумента 208, 209, 504 — функции 208-210, 504 Прогрессия геометрическая 112 Продолжение разбиения 389 — функции 14 Проектирование 16 Проекция 12, 493 — стереографическая 625 Произведение бесконечное 173 — множеств декартово 11, 33, 37 прямое И, 33, 37 — рядов 316 — скалярное 502, 503 Производная 208, 210, 211, 323, 504 — высшего порядка 243 — логарифмическая 231 — односторонняя 305 — по вектору 517 направлению 519 — функции комплексного переменно- переменного 323 — частная 507 высшего порядка 532, 534 Промежуток многомерный 482 — числовой 64 Промежуток числовой неограничен- неограниченный 64 Прообраз 18, 20, 27 — Ща,Ь] 387, 396, 398,404 — Rm 477, 486, 498 Пространство векторное 398, 405, 498 — евклидово 503, 504 — касательное 505, 603, 605-607, 625 — конфигурационное системы п час- частиц 17 — метрическое 477 полное 154, 486 — фазовое системы п частиц 18 Процесс итерационный 21 Путь 438, 491, 492, 522, 548, 598, 624 — гладкий 439 — замкнутый 438 — кусочно гладкий 439 — простой 439 замкнутый 439 Работа 448 — выхода 454 Равенство множеств 8 — функций 14 Радиус кривизны 306, 307 — критический 342 — сходимости степенного ряда 314 Разбиение промежутка 385 с отмеченными точками 385 Разложение диффеоморфизма в ком- композицию простейших 589 — многочлена на множители 330 по формуле Тейлора 245, 255, 261 — рациональной дроби на сумму простейших дробей 331, 332, 366 — функции в ряд Тейлора 258 - 261, 270, 326 по формуле Тейлора, см. Формула Тейлора 245 Размерность поверхности 598-600 — физической величины 525 - 527 Разность конечная 273 — множеств 10
652 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Ранг отображения 582, 583, 597 — системы функций 597 Распад радиоактивный 340, 353 Распространение функции, см. Про- Продолжение функции 14 Расстояние (метрика) 477 -вГ 478 — между множествами 484 точками числовой оси 65 Росток функции 200 Ряд 111 — гармонический 112 — расходящийся 111 — степенной 261, 313-315, 324, 326 — сходящийся 111, 312 абсолютно 113, 313, 315, 316 — Тейлора 261, 326 — числовой 111 Свойства непрерывных функций гло- глобальные 186, 495 локальные 184, 200, 492 Свойство, выполненное финально (при данной базе) 152, 161, 164, 165 — параболического зеркала 219, 220 Секущая 213, 215 Символ логический 1, 5, 8 — О большое 164, 168 — о малое 161, 162, 168 Синус гиперболический 235, 318 — интегральный 365 — круговой 136, 318 Система счисления 71, 75, 81 позиционная 71, 75 — уравнений Гамильтона 575 Коши-Римана 596 Эйлера-Лагранжа 574, 575 — функций зависимая 588, 596 независимая 587, 596 Скорость вторая космическая 455 — мгновенная 203, 204, 206, 216, 217, 227 — света 15, 16, 68, 241, 279 Слой 27 Среднее арифметическое 124, 290, 303 Среднее гармоническое 112, 124, 303 — геометрическое 290, 303 — интегральное 430 — квадратическое 124, 303 — порядка р 123, 124, 303 Структура евклидова 502 — логическая математических высказываний 34 Сужение функции 14 Сумма Дарбу верхняя (нижняя) 394, 402 — интегральная 384, 386 верхняя (нижняя) 394 — ряда 111 частичная 111 Сфера 480, 481, 496, 497, 625 Сходимость несобственного интеграла 457 абсолютная 463 условная 468 — последовательности 93 — ряда 111 абсолютная 113, 115, 313 Сюръекция 18 Таблица истинности 5 — первообразных (неопределенных интегралов) 360 — производных 238 Тангенс гиперболический 237 Теорема Абеля 315 — алгебры основная 328, 329 — арифметики основная 57 — Больцано - Коши о промежуточ- промежуточном значении 186 — Балле Пуссена 199 — Вейерштрасса 101 о максимальном значении 188 — Дарбу 271, 402 — Дедекинда 76, 78 — Кантора 31, 87 о равномерной непрерывности 191 — Кантора-Гейне 191 — Коши 254 — Лагранжа 251, 253, 265 — Лиувилля 78
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 653 Теорема о конечном приращении 251, 253, 529 неявной функции 557, 560, 568, 576, 577 ранге 582, 583 среднем 253, 528, 529 для интеграла вторая 412, 416, 432, 469 первая 410, 432 — Ролля 251, 553 — сравнения (для несобственных интегралов) 464 (для рядов) 114, 115 — теории размерности (П-теорема) 527, 528 — Чебышёва 200 — Шредера - Бернштейна 31, 37 Тождество Эйлера для однородных функций 525 Топология 126 Точка в Rm 477 — внешняя 480 — внутренняя 480 — граничная 480 — критическая 539, 628 вырожденная 627 невырожденная 592, 597 — критическая седловая 548 — локального максимума 248, 249, 276-278, 537, 538, 541 минимума 248, 249, 276 - 278, 537, 538, 541 — неподвижная 29, 197, 198 — перегиба 287, 288, 573 — предельная 83, 481 — разрыва 181 второго рода 183 монотонной функции 193, 194 первого рода 182 устранимого 182 — стационарная 539, 628 — чебышёвского альтернанса 200 Трапеция криволинейная 446, 447 Угол между векторами 503 кривыми 625 Узел интерполяции 273, 433 Упорядоченность линейная 43, 64 — частичная 43, 78 Уравнение дифференциальное 207, 336, 339, 340, 342-345, 348, 350, 381 гармонических колебаний 348, 350, 355 с разделяющимися переменны- переменными 381 — Лапласа 551 — теплопроводности 552 — Эйлера (гидродинамическое) 520, 523 Уровень функции 522, 566, 611, 616 Ускорение мгновенное 203, 204, 217, 223, 246, 306 Условие необходимое (достаточное) 2 Условия выпуклости функции 282-286 — дифференцируемости функции многих переменных 506, 507, 530 — интегрируемости достаточные 390, 391, 393 необходимые 388 и достаточные 395, 400, 403 — монотонности функции 253, 274, 275 — экстремума функции 276 - 278 многих переменных 538, 539 Усреднение функции 431, 432 Форма записи комплексного числа алгебраическая 309 тригонометрическая 309, 310 Формула барометрическая 338, 340, 353 — Бонне 416 — Виета 173 — замены переменной в интеграле неопределенном 363 определенном 425, 426 — интегрирования по частям в инте- интеграле неопределенном 362 несобственном 461
654 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Формула интегрирования по частям в интеграле определенном 422, 423 — интерполяционная Лагранжа 272, 273 Эрмита 273 — квадратурная 434, 435 парабол 434, 435 прямоугольников 434 Симпсона 434, 435 трапеций 434, 435 — Коши-Адамара 314 — Лейбница 244 — Маклорена 257 — Мещерского 337 — Муавра 311, 321 — Ньютона-Лейбница 384, 421, 422 — Остроградского 377 — Тейлора 256, 265, 535, 536, 539, 552 для функции многих перемен- переменных 535, 536, 539, 593 в мультииндексных обозначениях 552, 553 локальная 263, 264, 537 с остаточным членом в инте- интегральной форме 423, 424, 536, 553, 593 в форме Коши 257, 424 Лагранжа 257, 265, 273, 424, 537, 553 Пеано 264, 265, 537 — Циолковского 337 — Эйлера 318 Функционал 14, 16, 405 Функция 13, 14, 22, 25 — аддитивная ориентированного промежутка 408, 436, 437 — аналитическая в точке 262, 326 — асимптотически одного порядка с другой функцией 164 эквивалентная другой функции 165 — бесконечно большая 162 более высокого порядка 162 Функция бесконечно малая 132, 134, 152, 162 более высокого порядка 162 по сравнению с другой функцией 161 — вогнутая 283 — возрастающая 159 — выпуклая 282, 283 — выпуклая вверх (вниз) 283 — гармоническая 551 — гиперболическая 235, 237 — Дирихле 183, 401, 402 — дифференцируемая в точке 208, 209 — интегрируемая 387 — комплексного переменного 321 дифференцируемая 324 непрерывная 323 — Лагранжа 613, 617, 622 — логарифмическая 138, 144, 145, 148 — локально однородная 525 — многих переменных 476 дифференцируемая 504 непрерывная 491 — монотонная 159 — невозрастающая 159 — непрерывная в точке 175-177, 491 на множестве 179, 493 — неубывающая 159 — неявная 239, 246, 558, 560, 567, 568, 576 — обратная 19, 22, 192, 195, 197, 232, 520, 577 — ограниченная 130, 485 сверху (снизу) 130 — однородная 525 — периодическая 223, 320, 429, 433 — показательная 138, 143, 148 — постоянная 130 — равномерно непрерывная 189, 191, 494, 495 — Римала 184, 197, 401, 402 — силовая 523 — степенная 138, 147 — строго выпуклая 283
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 655 Функция тригонометрическая 440, 441, 443 — убывающая 159 — финально ограниченная 131, 152, 164, 485 — финально постоянная 130, 152 — характеристическая множества 16 — экспоненциальная 143, 221, 317, 344, 345, 347 — sgn (знак) 127 Центр кривизны 307, 627 Циклоида 455, 475 Часть действительная комплексного числа 309 — дробная числа 62 — мнимая комплексного числа 309 — рациональная интеграла 377 — целая числа 62 Числа Фибоначчи 123 — тг 60, 173, 320, 435, 440, 443 — е 103, 104, 119-121, 156-158, 320, 345, 346 Число алгебраическое 59, 78, 87, 88 — вещественное 41 — действительное 41 — иррациональное 58, 77, 88, 89 — кардинальное 30, 31 — комплексное 308 — натуральное 33, 52, 53 по фон Нейману 33, 38 — отрицательное 49 — положительное 49 — простое 57 — рациональное 57, 77, 86 Число сопряженное 308 — трансцендентное 59, 78, 88 — целое 56 Числовая прямая 62 Шар 478 — замкнутый 479 — открытый 478, 479 Эквивалентность асимптотическая функций 165 Экспонента 143, 221, 344-347 Экспонента интегральная 380, 474 — комплексная 317, 318, 320, 348, 349 Экстремум внутренний 249, 276, 278 — условный 597, 609-611, 617, 618 — функции многих переменных 537-539, 541 Элемент единичный 42, 46 — максимальный (минимальный) 50 — множества 6, 8 — наибольший (наименьший) 50 — нейтральный 41, 42 — нулевой 41, 45 — обратный 42, 46 — противоположный 41, 45 Энергия кинетическая 18, 355, 450, 451 — полная 18, 355, 450 — потенциальная 17, 18, 355, 449-451 Якобиан 509 — перехода к полярным координа- координатам в Шт 580, 581
УКАЗАТЕЛЬ ИМЕН Абель (Abel N. Н.) 41, 315, 376, 377, 412, 469 Адамар (Hadamard J.) 314, 553, 593, 628 Архимед ('Арх1цУ)Вт)<;) 60, 61, 384, 385 Вернулли Д. (Bernoulli D.) 524 Бернулли И. (Bernoulli J.) 22, 291 Бернулли Я. (Bernoulli J.) 77, 104 Бернштейн (Bernstein F.) 31, 37 Бойяи (Bolyai J.) 23 Больцано (Bolzano В.) 83, 99, 105, 186, 224 Бонне (Bonnet О.) 416 Борель (Borel E.) 82 Буняковский В. Я. 418 Бурбаки (Bourbaki N.) 5, 150 Бюффон (Buffon G. L. L.) 456 Валле Пуссен (de la Vallee Poussin Ch. J.) 199 Ван дер Варден (van der Waerden B. L.) 224 Вейерштрасс (Weierstrass K.) 83, 101, 105, 115, 188, 224 Виет (Viete F.) 173 Галилей (Galilei G.) 2, 15 Гамильтон (Hamilton W. R.) 574, 575 Гаусс (Gauss C.F.) 23, 174, 183, 308, 329, 470, 554 Гейне (Heine E.) 129, 191 Гёльдер (Holder O.) 280, 418 Гельфонд А. О. 60 Гильберт (Hilbert D.) 60, 76 Гук (Hooke R.) 355 Гюйгенс (Huygens C.) 455, 544, 545 Даламбер (D'Alembert J.) 117 Дарбу (Darboux G.) 271, 394, 402 Дедекинд (Dedekind R.) 30, 31, 76, 78 Декарт (Descartes R.) 11 Дирихле (Dirichlet P. G.) 183, 469 Дюбуа-Реймон (Du Bois Reymond P.) 403 Евклид (EuxXeiSr)?) 77, 88, 160 Иенсен (Jensen J. L.) 289, 418 Кантор (Cantor G.) 6, 31, 87, 99, 191 Карно Л. (Carnot L. N.) 134 Карно С. (Carnot N. L. S) 134 Картан (Cartan H.) 150 Кельвин, лорд (Kelvin), см. Том- сон У. 339 Кеплер (Kepler J.) 202, 528 Клапейрон (Clapeyron В. P. E.) 339 Коши (Cauchy A.L.) 67, 81, 99, 111, 116, 118, 124, 126, 153, 186, 254, 257, 262, 314, 335, 418, 472, 596 Коэн (Cohen P.) 88
УКАЗАТЕЛЬ ИМЕН 657 Лагранж (Lagrange J. L.) 210, 251, 257, 265, 272, 273, 574, 613, 628 Лакруа (Lacroix S. F.) 23 Лаплас (Laplace P. S.) 317, 551 Лебег (Lebesgue H.) 82, 398, 400 Лежандр (Legendre A. M.) 305, 376, 433, 446, 452, 573 Лейбниц (Leibniz G. М.) 1, 22, 60, 202, 210, 230, 244, 384, 421, 422 Линдеман (Lindemann F.) 60 Лиувилль (Liouville J.) 78, 376 Лобачевский Н. И. 23 Лопиталь (L'Hospital G. F. А) 291 Лоренц (Lorentz H. А.) 16, 242 Маклорен (Maclaurin С.) 257 Максвелл Maxwell J. С.) 526 Мещерский И. В. 337 Минковский (Minkowski H.) 281, 418 Морган (de Morgan A.) 10 Морс (Morse M.) 592, 593 Муавр (de Moivre A.) 311 Нейман, фон (von Neumann J.) 33, 38 Ньютон (Newton I.) 1, 77, 202, 203, 261, 384, 421, 422, 454, 528 Окунь Л. В. 633 Ом (Ohm G. S.) 29 Остроградский М. В. 377 Пеано (Peano G.) 30, 264, 265, 439 Пуанкаре (Poincare H.) 1 Пуассон (Poisson S.D.) 381, 470 Рассел (Russel В.) 7, 33 Риман (Riemann В.) 184, 385, 386, 596 Ролль (Rolle M.) 251, 553 Сахаров А. Д. 633 Сильвестр (Sylvester J. J.) 542 Симпсон (Simpson T.) 434, 435 Снеллиус (латиниэир. Snellius, Snell van Royen W.) 279 Стоке (Stokes G. G.) 422 Тейлор (Taylor B.) 255, 256, 261, 263, 264, 423, 424, 536, 552 Томсон У. (Thomson W.), лорд Кель- Кельвин (Kelvin) 339 Ферма (Fermat P.) 11, 249, 279 Фибоначчи (Леонардо Пизанский) (Fibonacci L.) 123 Френель (Fresnel A. J.) 380, 473 Френкель (Fraenkel A.) 34 Цермело (Zermelo E.) 34 Циолковский К. Э. 337 Чебышёв П. Л. 160, 200, 379 Шварц (Schwarz H. А.) 418 Шнайдер (Schneider Th.) 60 Шредер (Schroder E.) 31, 37 Эйлер (Euler L.) 103, 172, 307, 317, 318, 346, 374, 378, 381, 466, 470, 523, 525, 574 Эйнштейн (Einstein A.) 16, 499 Эрмит (Hermite Ch.) 272, 273 Юнг (Young W.) 280 Якоби (Jacobi С. G. J.) 509
Владимир Антонович Зорич МАТЕМАТИЧЕСКИЙ АНАЛИЗ Часть I Директор издательского проекта И. Ященко Технический редактор В.Кондратьев Верстка А. Зарубина Рисунки (с использованием системы MetaPost) E. Бунина, А. Зарубина Издательство Московского Центра непрерывного математического образования Лицензия ИД № 01335 от 24.03.2000 Подписано в печать 30.09.2002. Формат 70 х 100/16 Бумага офсетная № 1. Печать офсетная. Печ. л. 42,5 Тираж 3000. Заказ JY* 4573 МЦНМО 119002, Москва, Б. Власьевский пер., 11 Отпечатано с готовых диапозитивов в ОАО «Типография „Новости"» 107005, Москва, ул. Фридриха Энгельса, 46